Oha, das geht hier ja gut weiter! Und so vieles ist ganz richtig und auch gut erklärt. Daher kann ich's mir jetzt einfach machen, auch wenn ich einiges wiederhole.
Um mal auf das 5kHz-Rechteck, das bei 16kHz Samplerate einen realen (nicht psychoakustischen!) 1kHz-Ton verursachte, zurückzukommen:
Fakt ist:
Rechtecksignale haben als Obertöne immer nur die ungradzahligen Vielfachen des Grundtons (wem erzähle ich das, aber das ist numal der Ausgangspunkt). Für ein 5kHz-Rechteck bedeutet das, bei 5kHz liegt ein Sinuston, bei 15kHz ebenso, dann bei 25kHz, bei 35kHz u.s.w.
Das menschliche Gehör nimmt aber bereits den Sinuston bei 25kHz nicht mehr wahr, egal wieviel Watt die PA leistet, über die er abgespielt wird (es kann aber durchaus Jugendliche geben, die den extrem verstärkten Ton noch als "Druck auf dem Ohr" empfinden können).
Man braucht also den Ton bei 25kHz gar nicht zu digitalisieren oder zu rekonstruieren (die heutige Studiotechnik tut es bei Sampleraten von 96kHz oder mehr aber trotzdem). Hier kommt nämlich das Shannon-Theorem ins Spiel: Um einen Sinuston verlustfrei digitalisieren und perfekt rekonstruieren zu können, muß die Samplerate mehr als doppelt so hoch sein, wie dessen Frequenz. Das Gehör endet bei ca. 20kHz (je nach Kondition irgendwo zwischen 15 und 22kHz), also muß man mindestens mit 40kHz samplen. Man hatte sich für die CD auf 44.1kHz geeinigt und das war eine sehr gute Entscheidung (48kHz hätten die anfänglichen Schwierigkeiten bei A/D- und D/A-Wandlern und analogen Filtern entschärft, sind aber beim heutigen Stand der Technik nicht besser, auch 96kHz nicht).
Der gesamte Klangeindruck des 5kHz-Rechtecks wird nur durch den einen Oberton bei 15kHz transportiert!
Es wäre eine Samplerate von mehr als 30kHz nötig, um das Rechteck hören zu können, es wurden aber nur 16kHz verwendet. Richtigerweise hätte nun nach dem Shannon-Theorem alles ab der halben Abtastrate (8kHz) zu 100% weggefiltert werden müssen. Dann wäre nur noch der Sinuston bei 5kHz übrig geblieben, der natürlich auch nur wie ein Sinus und nicht wie ein Recheck klingt.
Unterbleibt das zwingend erforderliche Filtern, so wird der 15kHz-Ton natürlich auch digitalisiert, aber falsch! Das führt zu Spiegelfrequenzen: Frequenzen höher als die halbe Abtastrate werden an ihr gespiegelt: Ein 8.1kHz-Ton wird zu 7.9kHz, ein 9kHz-Ton zu 7kHz, ein 10kHz-Ton zu 6kHz, ... und ein 15kHz-Ton zu 1kHz. Voila!
Ein 16kHz-Ton wird zu ... na? ... genau 0Hz, also unhörbar, und ein 17kHz-Ton wird zusätzlich an der 0Hz-Linie gespiegelt und wieder zu einem 1kHz-Ton. Die Sinustöne werden quasi zwischen der 0Hz- und der Halbe-Abtastrate-Line hin- und hergespiegelt.
All diese gespiegelten Töne klingen in der Regel fürchterlich, da sie keine ganzzahligen Vielfachen des ursprünglichen Grundtons sind, und man will sie einfach nicht!
Das ist nämlich Aliasing!
Richtig schlimm wird das Aliasing vor allem dadurch, daß gerade bei hohen Grundtönen eine ganze Batterie an lauten Tönen unterhalb des Grundtons entstehen. Abschreckendes Beispiel hierfür sind die Kurzweil-Synthesizer vom K2000 bis K2600, wenn sie synthetisch Sägezahnwellen erzeugen (nicht aus dem Samplespeicher, sondern per DSP-Modul "SAW" oder "SAW+"). Kurzweil hat schicht und einfach Maßnahmen gegen Aliasing weggelassen, da viel zu rechenaufwendig für die schwachbrüstigen K, und so Aliasing in seiner fürchterlichsten Form zugelassen.