44,1 kHz / 48 kHz / 96 kHz – aus heutiger Sicht...

Je mehr ich hier lese, umso mehr bin ich davon überzeugt, dass ich mich mit dem Thema nicht beschäftigen und an meiner Arbeitsweise nichts ändern soll.. :guckstdu:
 
In der Praxis ist es aber so, dass bei einer Verarbeitung in der DAW mit 32 Bit floating Point das Audiomaterial, solange es unter 0 dB liegt
mit ca. 16,7 Mio Stufen, also 24 Bit aufgelöst ist.
Wenn das Signal per 24 Bit-Wandler aufgenommen und noch nicht weiter verarbeitet wurde. Man könnte Signale aber auch im Rechner in 32 float berechnen oder mit 32 float bearbeiten. Dann kann man das auch im 32 float-Format speichern ohne nach 24 Bit runter zu rechnen.
 
Entscheidung ist gefallen: Seit gestern auf 96 Hz und Cubase interner 64 bit Audioverarbeitung... marginal erhöhte Systemlast, ansonsten läuft alles rund. Mein rme UCX arbeitet dabei mit einer Roundtrip Latenz von rund 3,6 ms (96 Samples)... für die Aufnahme von "Realtime Audio" reicht das allemal. Bessere Werte erreiche ich wahrscheinlich nur mit PCI Karten - das dann aber auf Kosten von Anschluss- bzw. Routingmöglichkeiten.
 
bist du dir sicher, dass du es nicht die ganze zeit verwechelst? :)

4-byte formate verwendet kein mensch mehr, das gibt es nur noch in soundhack oder so. der rest der welt benutzt float.
Ich kann es nur wiederholen.
DAWs arbeiten mit 32 bit floating point. Die Programmierer 2er dieser DAWs haben es so erklärt, dass die 8 Bit für den Headroom sind.
Da verwechsel ich nix. Und von denen wurde dann abgeschrieben.
Das ist so die Sichtweise von Geisterfahrern, da bin ich jetzt raus.
 
Bevor man andere Sachen als Schwachsinn abkanzelt, wäre es ja vielleicht hilfreich, diesbezüglich nochmal nachzulesen.
Natürlich ist das Schwachsinn. 24 Liter Milch + 8 Liter Benzin = 32 Liter Steine.
Wo die Rechnung mit 24 Bit + 8 Bit = 32 Bit stimmt, ist der Speicherbedarf, oder eben wenn man von fixed redet.
Aber 8 Bit mehr Headroom bei 32 bit floating im Vergleich zu 24 bit fixed ist absoluter Schwachsinn. :cool:
 
Ich kann es nur wiederholen.
DAWs arbeiten mit 32 bit floating point. Die Programmierer 2er dieser DAWs haben es so erklärt, dass die 8 Bit für den Headroom sind.
Da verwechsel ich nix. Und von denen wurde dann abgeschrieben.
Das ist so die Sichtweise von Geisterfahrern, da bin ich jetzt raus.

so lange du presseartikel benutzt um wikipedia und wolfram alpha zu widerlegen macht das keinen sinn so.

lass uns mal einen praxistest versuchen:

was denkst du, wieviel dezibel dir 8 bit mehr headroom geben? und wenn du dich festlegt hast, dann probierst du das mal in deiner DAW aus, ob es dann wirklich schon clippt. ;-)
 
Nein, es clippt ja eben nicht, weil der Headroom so groß ist, die Zahlen hast duch doch selbst genannt vorhin.
Wikipedia macht da nur sehr allgemeine Aussagen und bezieht sich nicht konkret darauf, wie DAWs, die in 32 bit float arbeiten, mit 24 Bit Audiomaterial umgehen.
 
Nein, es clippt ja eben nicht, weil der Headroom so groß ist, die Zahlen hast duch doch selbst genannt vorhin.
Wikipedia macht da nur sehr allgemeine Aussagen und bezieht sich nicht konkret darauf, wie DAWs, die in 32 bit float arbeiten, mit 24 Bit Audiomaterial umgehen.

klar hab ich die zahlen genannt. aber du hast offenbar den größenunterscheid zwischen zahlen übersehen.

also, wieviel mehr DNR in dezibel hat ein stream, wenn er 8 bit mehr hat als ein anderer?
 
Man könnte es auch so ausdrücken, dass für alle Werte unter 0 db nur 24 bit der zur Verfügung stehenden 32 Bit verwendet werden.
Da will ich mich jetzt aber nicht zu weit rauslehnen, ich habe hier nur die Aussagen der DAW Entwickler wiedergegeben.
Es gibg hier um Praxisorientierung, nicht darum, es komplizierter zu machen als es ist.
Es ergibt sich jedenfalls nicht die Notwendigkeit, Dateien in 32 Bit zu speichern, nu weil die DAW in 32 bit float arbeitet.
Das ist die Kernaussage. Dateiformat 24 Bit, interne Verarbeitung 32 bit float.

edit: Nein ich hab den nicht übersehen, es ist sehr viel, ändert aber nix dran. Wieviel in DNR das ist weiß ich nicht.

Ich weiß dass man einen 24 Bit Wertebereich 8 mal verdoppeln muss um auf den 32 Bit Wertebereich zu kommen.
Ich will hier keinen Mathewettbewerb eingehen, den verliere ich eh, aber das ist auch nicht relevant.
 
Man könnte es auch so ausdrücken, dass für alle Werte unter 0 db nur 24 bit der zur Verfügung stehenden 32 Bit verwendet werden.
Da will ich mich jetzt aber nicht zu weit rauslehnen, ich habe hier nur die Aussagen der DAW Entwickler wiedergegeben.
Es gibg hier um Praxisorientierung, nicht darum, es komplizierter zu machen als es ist.
Es ergibt sich jedenfalls nicht die Notwendigkeit, Dateien in 32 Bit zu speichern, nu weil die DAW in 32 bit float arbeitet.
Das ist die Kernaussage. Dateiformat 24 Bit, interne Verarbeitung 32 bit float.
Alles wirres Zeug. Und das können niemals "Aussagen der DAW Entwickler" sein.

Ich will hier keinen Mathewettbewerb eingehen, den verliere ich eh, aber das ist auch nicht relevant.
Doch, es ist relevant, weil du wirres Zeug schreibst. Ohne Mathe-Kenntnisse sollte man sich hier lieber raushalten.
 
Ist ok, ihr wisst es besser als die DAW Entwickler, dann ist es eben so.
Zu den Praxisfragen hier habt ihr allerdings nichts beigetragen, aber ihr habt euch mitgeteilt, ist auch ok.
Ich halte mich nun raus, finde deinen abschließenden Satz allerdings etwas bedenklich also bzgl. raushalten.
 
Ich halte mich nun raus, finde deinen abschließenden Satz allerdings etwas bedenklich also bzgl. raushalten.
Es tut halt weh, immer wieder Sachen zu lesen, die du hier so schreibst. Klar ist "wirres Zeug" ein unschöner Ausdruck. Aber so wirkt das auf mich.
Wenn sich auf "DAW Entwickler" beziehen – dann bitte mit konkreten Zitaten mit Verlinkungen. Denn einfach so frei nacherzählt, wo irgendwie alles verdreht zu sein scheint – das erscheint mir nicht zielführend.
 
Zuletzt bearbeitet:
es soll ja kein wettbewerb werden, sondern nur zum verständnis beitragen. ob es zum musikmachen überhaupt relevant ist oder nicht, darüber sind wir uns sicher sofort einig. :)

Nein, es clippt ja eben nicht, weil der Headroom so groß ist, die Zahlen hast duch doch selbst genannt vorhin.

nein, die habe ich nicht genannt. ich habe nur die wertebereiche aufgelistet.

aber ich schreibe mal zu meinen (bislang hoffentlich richtigen) zahlen noch den rauschabstand und den dynamikumfang dieser formate dazu, damit noch klarer wird, wo der unterschied zwischen float und integer ist und dass da einer ist (ja, wir sind ja keine mathematiker - aber das wesen von float formaten ist halt sehr interessant, denn es hat auswirkungen, wenn man das verwechselt oder glaubt es sei das gleiche.)


16 bit

wertebereich: 0 - 65535

~96 db SNR /peak /umfang

24 bit

wertebereich: 0 - 16777215

~144 db SNR /peak /umfang

24.8 audio

wertebereich: 0 - 16777215 && 0 - 255

~218 db SNR /peak /umfang

32 bit

wertebereich: 0 - 4294967295

~218 db SNR /peak /umfang

32 bit float

wertebereich: (2-1/83886089)*2170141183460469231731687303715884105728

~758 db SNR, maximaler peak ~770 db, gesamtdynamikumfang: ~1582 db (!)
 
Zuletzt bearbeitet:
Hatten wir schon den Link?

"...
Während in Festkommaarithmetik der maximale Pegel 0 dBFS beträgt und eine weitere Erhöhung des Pegels zu einem Beschnitt der Amplitude und damit zu einem Clipping führt, ermöglicht die Gleitkommadarstellung einen Headroom. Der Dynamikbereich eines in Gleitkommazahlen dargestellten Audiosignals teilt sich also in zwei Bereiche {\displaystyle \leq }
\leq
0 dBFS und {\displaystyle >}
>
0 dBFS. Die maximale Auflösung hingegen ist durch die Mantisse der Gleitzahl beschränkt. Eine 32 bit Gleitkommaarithmetik nach IEEE 754 hat daher maximal 23 bit Auflösungsvermögen pro Halbwelle, mit Vorzeichenbit also 24 bit für den gesamten positiven und negativen Aussteuerungsbereich.
..."

Grüße
Omega Minus
 
Es tut halt weh, immer wieder Sachen zu lesen, die du hier so schreibst. Klar ist "wirres Zeug" ein unschöner Ausdruck. Aber so wirkt das auf mich.

das hast du einmal recht und weisst mal tatsächlich etwas besser - und dann muss man das natürlich gleich benutzen um den gegenüber zu beleidigen und ihm den mund zu verbieten.

ob das zu seiner aufklärung beiträgt?
 
Die Ausgangsfrage (von 2017) hab ich so verstanden:
Ist es sinnvoll mit einer höheren Abtastfrequenz als 48 kHz zu produzieren, wenn das Ausgabeformat 48 oder 44,1 kHz ist.
Wenn man also heute produziert, zumal einige Hardware-Teile (digital) auch mit 48 kHz oder sogar 96 kHz laufen können, macht es vielleicht eher Sinn in 96 kHz zu produzieren, und am Schluss den Master z.B. für Youtube* auf 48 kHz runterzurechnen, und wo 44,1 kHz gefragt sind, dort halt auf 44,1 kHz?
Bitte korrigiert mich.

Jetzt wird hier über softwareinterne Wortbreiten ge...

Für mich erscheint eine höhere Abtastrate nur zur Verringerung der Latenz sinnvoll.
Höhere Abtastrate bedeutet einen erweiterten Frequenzbereich.
Der Frequenzbereich den Menschen hören können wird mit 44,1 kHz Abtastfrequenz ausreichend erfasst.
Eine höhere Abtastfrequenz erhöht nicht die Auflösung.

Wie die DAW und die verschiedenen plugins intern arbeiten davon habe ich zuwenig Ahnung um mich darüber zu streiten.
 
Bob Katz hat sinngemäss die Auflösung "als Anzahl entsprechender Bits"beschrieben.
Von Abtastfrequenz steht da im Zusammenhang mit Auflösung nichts.

Die Abtastfrequenz ist ja auch völlig irrelevant für die Auflösung eines einzelnen Samples.

Viele Bilder hintereinander ergeben ein Video. Egal ob 120 Bilder pro Sekunde oder 24 Bilder pro Sekunde: Diese Information gibt überhaupt nichts über die Auflösung einzelner Frames an sich preis. Das kann von 320x240x8 bis 8Kx32 alles sein.
 
Danke für die Auflistung. Das ist in der Tat interessant.
Mein Verständnis reicht dafür allerdings auch nicht ganz aus.
Es schließt sich ja auch gar nicht zwingend aus mit meinen Aussagen.
Letztlich geht es ja darum, welcher Wertebereich davon für Zustände unter 0 db verwendet werden.
Mein Verständnis war bisher: für den Bereich unter 0 nach wie vor 16,7 Mio, und dann eben nahezu unendlicher Headroom für den Bereich über 0.

Um das nochmal klarzustellen: da ich mit diesen Dingen auch umgehe, ist für mich der Blickwinkel der praktischen Anwendung der primäre.
Für mich ist immer wichtig, z.B. bei welchen Umwandlungen Verluste entstehen.
Zum Beispiel vermeide ich möglichst Änderungen der Rate, und da ich auch noch Audio CDs als Endmedium benutze, ist 44,1 für mich immer erste Wahl.
Deswegen hatte ich mich da sehr genau informiert, als 32 bit float als Verarbeitungsformat in den DAWs Standard wurde.
Infomiert im Sinne von was muss man beachten. Also nicht theoretisch bis ins Detail beleuchtet.
Deswegen weiß ich auch noch, dass ich dazu die Aussagen der Entwickler beachtet habe.
Das Fazit war dabei immer: mit 24 Bit Audio Daten erfolgt "im Prinzip" keine Umwandlung, sondern es wird mehr Headroom zur Verfügung gestellt.
Mag sein, dass das vereinfacht ist, aber so wurde das immer kommuniziert.

Sicher kann man das technisch auch exakter beschreiben, aber diese Beschreibung hat ja offenbar einen Praxiswert, sonst wäre sie nicht so dargestellt worden. Das hat daher nix mit wirrem Zeug zu tun.

Theorie und Praxis sind doch beides interessante Aspekte, es gibt sicher viele audio engineers, deren Mathekenntnisse sich im Rahmen halten,
die aber durchaus kompetent sind und bei denen es nicht angemessen ist, Ihnen mitzuteilen Sie sollten sich raushalten.

Eigentlich mag ich das von meiner Seite auch nicht weiter vertiefen :)
Ist auch alles ok, kein Problem, fand die Ansage nur etwas harsch.
 
Viele Bilder hintereinander ergeben ein Video.
Viele Seiten hintereinander ergeben ein Buch.
Viele Perlen hintereinander ergeben eine Kette.
Viele Autos hintereinander ergeben einen Stau.
Viele Waggons hintereinander ergeben einen Zug.
Viele Worte hintereinander ergeben einen Text.;-)

Achso.. Audio ist das Thema.
Die Abtastfrequenz ist ja auch völlig irrelevant für die Auflösung eines einzelnen Samples.
Es wurde aber (nicht von Dir) behauptet:
da irrst du dich aber ... 96 kHz erhöht nicht nur die maximale abbildbare Frequenz , es erhöht auch die Auflösung , wodurch komplexes Audio (FM, Verzerrungen, schnelle Transienten) besser dargestellt wird

das kann man auch ohne Goldohren hören
 
Das mit Gleitkomma und Headroom würde mich jetzt tiefer interessieren.
Was ist, wenn ich 0 dB nicht überschreite? Habe ich dann Vorteile bei 32 bit float gegenüber 24 bit fix oder 32 bit fix, und wenn ja, welche? :agent:
 
Das mit Gleitkomma und Headroom würde mich jetzt tiefer interessieren.
Was ist, wenn ich 0 dB nicht überschreite? Habe ich dann Vorteile bei 32 bit float gegenüber 24 bit fix oder 32 bit fix, und wenn ja, welche? :agent:
Hier habe ich den Text so verstanden, dass gerade bei kleineren Werten die Auflösung (die bei floating point nicht die gleichen Raster-Stufen hat) höher wird:

https://en.wikipedia.org/wiki/Audio_bit_depth#Floating_point

"Floating point

The resolution of floating point samples is less straightforward than integer samples because floating point values are not evenly spaced. In floating point representation, the space between any two adjacent values is in proportion to the value. This greatly increases the SNR compared to an integer system because the accuracy of a high-level signal will be the same as the accuracy of an identical signal at a lower level.[19]

The trade-off between floating point and integers is that the space between large floating point values is greater than the space between large integer values of the same bit depth. Rounding a large floating point number results in a greater error than rounding a small floating point number whereas rounding an integer number will always result in the same level of error. In other words, integers have round-off that is uniform, always rounding the LSB to 0 or 1, and floating point has SNR that is uniform, the quantization noise level is always of a certain proportion to the signal level.[19] A floating point noise floor will rise as the signal rises and fall as the signal falls, resulting in audible variance if the bit depth is low enough.[20]"
 
"Die maximale Auflösung hingegen ist durch die Mantisse der Gleitzahl beschränkt. Eine 32 bit Gleitkommaarithmetik nach IEEE 754 hat daher maximal 23 bit Auflösungsvermögen pro Halbwelle, mit Vorzeichenbit also 24 bit für den gesamten positiven und negativen Aussteuerungsbereich."
"23 Bit Auflösungsvermögen pro Halbwelle, mit Vorzeichenbit also 24 bit für den gesamten positiven und negativen Aussteuerungsbereich" beschreibt doch 24 Bit Integer. Was hat das mit Gleitkomma zu tun?
Und warum wird hier nur von der Mantisse gesprochen. Die Zahlen werden doch nicht allein durch die Mantisse, sondern durch Mantisse und Exponent dargestellt. Man hat 32 Bit zur Verfügung mit Mantisse und Exponent, um die Werte möglichst fein aufzulösen.
Mein Eindruck ist, dass der Text kompletter Blödsinn ist. :agent:
 


Neueste Beiträge

News

Zurück
Oben