Früher war alles besser" - sagen "alte Leute" oft mit verklärtem Blick. Bezogen auf das Musik-"Geschäft" ist was Wahres dran: früher dauerte der Aufstieg und Fall einer Top-Gruppe 10 Jahre, heute geht das in 6 Monaten. Um eine Gruppe oder einen Künstler möglichst schnell möglichst hoch zu puschen werden alle möglichen "Tricks" angewendet - Hauptsache das Produkt verkauft sich. Die Musik muss im Radio rauf und runter gespielt werden, damit sie sich ins Hirn brennt, im Fernsehen und im Kino wird Werbung gemacht - damit die Musik schließlich gekauft wird.

Da muss man sich gegen viele andere Titel durchsetzen, nicht nur qualitativ (= schön) sondern auch quantitativ (= laut). Da wird die Musik durch Kompressoren gejagt bis die Durchschnittslautstärke möglichst hoch ist und sich das Stück dadurch lautstärkemäßig in den Vordergrund spielt.

Die Verwendung von Kompressoren ist an sich nichts Neues, das wurde schon immer gemacht - und wenn es die sanft einsetzende begrenzende Wirkung der magnetischen Sättigung des Tonbandes war. Dynamikkompression verleiht z.B. einer Stimme mehr "Druck" und erlaubt es, dass z.B. einzelne, zu laute Schläge des Schlagzeugs auf die Höhe der anderen Schläge gebracht werden. Diese Art der Kompression ist durchaus sinnvoll, da auch das Medium CD keine unbegrenzte Dynamikfähigkeit hat. Früher wurden dazu analoge Geräte benutzt (z.T. in Röhrentechnik, da man hier ebenfalls eine sanft abknickende Kennlinie erzeugen kann).

Aber heute ist alles anders. Da liegen die Daten digital vor und die Kompressionsalgorithmen arbeiten ebenfalls digital (analoge Kompressoren werden nur noch in seltenen Fällen eingesetzt). Z.T. werden mehrere Kompressionsalgorithmen nacheinander angewendet. Zur Not kann man die bösen, bösen, Spitzen im Zeitsignal manuell bearbeiten und so lange am Zeitverlauf feilen, bis es kaum noch "Ausreißer" nach oben gibt.

Wie so oft kann man das im Grunde sinnvolle Mittel der Kompression auch übertreiben. Und dann klingt solche Musik über eine hochwertige Anlage abgespielt im besseren Falle so, als wenn man ein Auto mit "angezogener Handbremse" fahren würde. Im schlimmsten Fall klingt es nur noch grausam. Überhaupt wird populäre Musik heute nicht für den High-Ender optimiert sondern für das Küchenradio, den Fernseher und das Autoradio. Vor einigen Jahren bin ich auf "Christina Aguilera / Ain't no other man" reingefallen. Das klang im Fernsehen auf MTV/Viva einfach nur genial fetzig - auf der guten Anlage zuhause nur noch quäkig und völlig ungenießbar.


Die Initiative Dynamic Range

Die Initiative Dynamic Range setzt sich für einen "dynamischeren Klang" ein. Sie kommt aus der "produzierenden" Ecke und bietet Mastering-Leuten ein Werkzeug an (das TT-DR-Meter, welches hier noch kostenfrei downgeloaded werden kann), das mit einem Einzahlenwert angibt, wie "dynamisch" eine Aufnahme klingt. Dabei konzentrieren sich die Macher auf die "Mikro-Dynamik" der lautesten Stellen, also da, wo die Kompressionsalgorithmen am meisten eingreifen. Die "Makro-Dynamik", die sich durch die Komposition ergibt, wird dabei nicht berücksichtigt. Ein von der Konzeption her sehr dynamisch angelegtes Stück (z.B. Klassik), welches subjektiv daher auch sehr dynamisch empfunden wird, kann trotzdem in den lautesten Passagen zu stark komprimiert worden sein und könnte daher beim DR-Wert "durchfallen". In der "Gebrauchsanweisung" (Teil des o.g. Downloads) für die Version 1.3 des TT-DR-Meters steht:

"Das klar definierte Ziel ist die Aufdeckung und Kategorisierung von Überkompression und die Verhinderung von Overs durch gutes True Peak Metering."

Was macht das DR-Meter?

Dazu die Gebrauchsanweisung auf Seite 3:

Zur Ermittlung des offiziellen DR-Wertes wird der Titel bzw. das Image des Tonträgers (Wave, 16bit, 44,1 kHz) gescannt und im Hintergrund ein Histogramm (Lautheitsverteilungs-Diagramm) mit einer Auflösung in 0,01 dB-Schritten erzeugt.
Die nach etablierten Standards für die RMS-Berechnung in einem Zeitfenster von 3 Sekunden ermittelten Lautheitswerte (dB/RMS) werden quasi in 10.000 unterschiedliche Schubladen aufgeteilt (der 0,01dB-Auflösung entsprechend). Von dem Ergebnis werden nun die lautesten 20% als Berechnungsgrundlage für die durchschnittliche Lautheit der lauten Passagen errechnet.

Gleichzeitig wird der höchste Peakwert ermittelt.

Der DR-Wert ist die Differenz zwischen Peak und Top-20 des durchschnittlichen RMS.

Der Top-20-RMS-Wert wird nicht separat angezeigt. Er lässt sich jedoch im Kopf errechnen, indem Sie vom Stereo-mit-Kommastelle dargestellten DYNAMIC RANGE-Wert den Peak-Headroom addieren."

Hinweis (Gebrauchsanleitung S. 14):
"Der RMS-Wert ist um + 3 dB korrigiert, sodass Sinuswellen den gleichen Peak- und RMS-Wert anzeigen. Das ist bei den meisten Meters so üblich."

Leute die in der Schule gelernt haben, dass der energetische Mittelwert beim Sinussignal 70.71% des Spitzenwertes ist (bzw. 3 dB unter dem Spitzenwert liegt) müssen da leider umdenken, damit die Herren Toningenieure sich über den Unterschied Peak und RMS nicht den Kopf zerbrechen müssen :-(

Für den Endkonsumenten ist die Angabe des DR-Wertes nur dann eine sinnvolle Zusatzinformation, wenn dieser die "empfundene" Kompression widerspiegelt, wenn also Stücke, die als zu stark komprimiert empfunden werden, deutlich von solchen Stücken unterschieden werden können, die in dieser Disziplin nicht unangenehm auffallen bzw. als besonders unkomprimiert empfunden werden. Dabei spielen zahlreiche Faktoren eine Rolle, unter anderem auch die Art der Musik. Kompositionen mit starken perkussiven Elementen reagieren anders auf Kompression als solche mit konstanten Elementen (wie z.B. Gesang oder "flächige Klänge" wie Streicher). Wir haben daher versucht einige Musikbeispiele die uns besonders komprimiert bzw. besonders unkomprimiert vorkommen daraufhin zu untersuchen, ob durch den DR-Wert hier eine deutliche Unterscheidung gelingt.

Neben der Dynamikkompression hat der Endkonsument bei der Zusammenstellung von verschiedenen Titeln noch das Problem, die subjektiv empfundene Lautstärke so anzugleichen, dass man nicht nach jedem Stück versucht ist die Lautstärke zu ändern. Mittlerweile sollte allen Leuten klar sein, dass der Peak-Wert allein kein geeignetes Maß dafür ist. Sofern die spektrale Zusammensetzung ähnlich ist entspricht der energetische Mittelwert bzw. RMS-Wert (= Root Mean Square = Wurzel des Mittelwerts aus den quadrierten Amplitudenwerten) deutlich besser der empfundenen Lautstärke. Daher ist in der folgenden Tabelle neben dem DR-Wert auch der RMS-Wert angegeben. In der Spalte JustTimeStat wird die Differenz zwischen Peak- und RMS-Wert ausgegeben, wie er vom Programm JustTimeStat ermittelt wird.

Wenn die spektrale Zusammensetzung nicht ähnlich ist muss die unterschiedliche Empfindlichkeit für tiefe, mittlere und hohe Frequenzen berücksichtigt werden.

Das Programm WaveAnalyzer, welches sich auf unserer Test-CD befindet, führt eine spektrale Analyse von WAV-Dateien durch (s. Musik vergleichen mit dem WaveAnalyzer) und gibt auch den A-bewerteten energetischen Mittelwert aus. Auch dieser Wert wird daher als mögliches Maß für die subjektiv empfundene Lautstärke in der Tabelle angeführt. Schließlich gibt es noch eine subjektive Beurteilung (Spalte "Subj. (Hören)"):

  • ++ klingt zu stark komprimiert, macht keinen Spaß, nervt total sobald man es etwas lauter macht

  • + klingt hörbar komprimiert, macht keinen Spaß lauter zu hören

  • o klingt nicht komprimiert, kann man auch laut hören

  • - klingt sehr dynamisch, macht Spaß laut zu hören

  • -- klingt völlig unkomprimiert, macht extrem viel Spaß laut zu hören

Ähnlich wurde eine subjektive Bewertung des Zeitsignals gemacht (Spalte "Subj. (Sehen)"):

  • ++ sieht sehr stark komprimiert aus, fast das gesamte Stück hat kontinuierlich vollen Pegel

  • + sieht stark komprimiert aus, weite Bereiche des Stücks haben kontinuierlich vollen Pegel

  • o sieht nicht komprimiert, nur kleinere Bereiche des Stücks haben zeitweise vollen Pegel

  • - sieht nicht komprimiert aus, Pegelspitzen sind unterschiedlich hoch

  • -- klingt sieht überhaupt nicht komprimiert aus, der Pegelverlauf erscheint zufällig

Die folgenden Ergebnisse sind nach dem DR-Wert geordnet:

Musikgenre

Datei

Subj. (Hören)

Subj. (Sehen)

DR-Wert

Peak-Wert

RMS-Wert

JustTimeStat

Waveanalyzer

Testsignal

Sinus, 1 kHz, 100% Vollaussteuerung

 

 

-0.0 dB

-0.00 dB

-0.0 dB

3.0 dB

-0.15 dB(A)

Testsignal

Sinus, 1 kHz, 50% Vollaussteuerung

 

 

-0.0 dB

-6.02 dB

-6.0 dB

3.0 dB

-6.17 dB(A)

Testsignal

Weisses Rauschen, 100% Vollaussteuerung

 

 

1.7 dB

-0.00 dB

-1.8 dB

4.8 dB

-4.32 dB(A)

Pop (Gesang, Bigband)

Christina Aguilera / Ain't No Other Man

++

++

5.9 / 5.8 dB

over / over

-6.9 / -6.9 dB

9.9 dB

-12.60 dB(A)

Hiphop (Gesang, bassintensiv)

Culcha Candela / Ey DJ

++

++

6.1 / 6.0 dB

-0.10 / -0.10 dB

-8.1 / -7.9 dB

10.9 dB

-15.80 dB(A)

Jazz (Gesang, Bigband)

Roger Cicero / Zieh' die Schuhe aus

+

+

6.9 / 7.1 dB

-0.19 / -0.19 dB

-9.3 / -9.4 dB

12.2 dB

-12.75 dB(A)

Weltmusik (Perkussion)

Yim Hok Man / Poems of Chinese Drums

-

+

7.2 / 6.9 dB

-0.01 / -0.03 dB

-11.2 / -11.0 dB

14.1 dB

-24.83 dB(A)

Pop

Craig David / Last Night

o

++

7.2 / 7.0 dB

over / over

-8.9 / -8.7 dB

11.8 dB

-14.88 dB(A)

Jazz (Bigband)

The Quincy Jones - Sammy Nestico Orchestra /
The Joy of Cookin

+

++

7.1 / 7.4 dB

-0.10 / -0.10 dB

-9.8 / -9.9 dB

12.7 dB

-12.40 dB(A)

Soul (Bass, Perkussion)

Cunnie Williams / Love or Drug

-

++

7.4 / 7.5 dB

over / over

-8.8 / -9.1 dB

11.9 dB

-15.88 dB(A)

Folk (Gesang)

Norah Jones / Don't know why

o

o

8.8 / 9.5 dB

-0.11 / -0.11 dB

-12.6 / -13.4 dB

15.9 dB

-15.75 dB(A)

Pop (AAD = analog abgemischt)

Quincy Jones / Back on the block

o

o

9.9 / 9.7 dB

-0.80 / -0.51 dB

-11.8 / -11.5 dB

14.1 dB

-15.61 dB(A)

Klassik (Extremdynamik)

Joseph Haydn / Symphonie mit dem Paukenschlag

--

--

13.9 / 14.3 dB

-6.25 / -2.98 dB

-25.2 / -23.0 dB

24.0 dB

-27.91 dB(A)

Ethno-Jazz (Live-Aufnahme)

Hugh Masekela / Stimela

--

--

16.2 / 15.8 dB

-2.30 / -2.30 dB

-24.3 / -23.8 dB

25.7 dB

-27.59 dB(A)

Jazz (Drum Solo)

Sheffield Lab / Ron Tutt

--

--

23.9 / 22.8 dB

-0.00 / -0.00 dB

-26.9 / -26.6 dB

29.7 dB

-32.31 dB(A)

Am Ende des Artikels folgen noch die Bildschirmausdrucke vom TT-DR-Meter und von JustTimeStat mit dem Zeitsignal der WAV-Datei (dahin führen auch jeweils die Links der Titel).

Generell ist erkennbar, dass die subjektive Einstufung und der DR-Wert einigermaßen gut zusammen passen - zumindest bei unserer Auswahl von Musikstücken. Gerade beim DR-Wert von 7 differiert die subjektive Einschätzung jedoch stark, obwohl der DR-Wert um weniger als 1/2 Punkt schwankt. Der Wunsch nach einer deutlichen Unterscheidung ist in diesem Bereich also nicht gut gelungen:

  • bei Yim Hok Mans "Poems of Chinese Drums" ist zwar bereits im Zeitverlauf eine deutliche Komprimierung der Spitzen erkennbar (alle Schläge sind absolut gleich laut), diese wird jedoch wegen der extremen Grobdynamik des Stückes (immer wieder gibt es deutlich erkennbare Pausen) und der Tatsache, dass die Komprimierung vor allem auf sehr tieffrequente Signale angewendet wird (Schläge auf riesige Trommeln) deutlich weniger schlimm empfunden
  • bei Cunnie Williams' "Love or Drug" ergibt sich auch bei hoher Wiedergabelautstärke nicht der Eindruck, das Stück sei komprimiert. Zum einen ist das Stück sehr perkussiv (keine lang anhaltenden Töne), zum anderen recht basslastig. Bei beiden Eigenschaften scheint eine objektiv vorhandene Komprimierung subjektiv weniger negativ aufzufallen

Insgesamt ist bereits am Zeitsignal sehr gut zu erkennen, ob ein Stück objektiv stark komprimiert wurde. Auch die bei JustTimeStat ablesbare Differenz zwischen Peak- und RMS-Wet ist ein sehr guter Indikator für eine dynamisch wirkende Aufnahme. Um diese "gefühlsmäßige" Einschätzung zu untermauern wurde eine entsprechende statistische Analyse durchgeführt.


Zusammenhang subjektiv/objektiv:

Dazu muss man zunächst mal die subjektiven Beurteilungen von ++ bis -- in Zahlen umsetzen, z.B. trägt man überall da, wo man die Note "++" vergeben hat eine 1 ein, für alle "+" eine 2, für alle "o" eine 3, für alle "-" eine 4 und für alle "--" eine 5.
Für jedes Stück gibt es nun ein Wertepaar bestehend z.B. aus einem objektiven Wert A (z.B. DR-Wert) und einem subjektiven Wert B (z.B. die empfundene Komprimierung beim Hören des Stückes). Um zu sehen ob es einem Zusammenhang zwischen A und B gibt (was wir ja hoffen) trägt man alle Wertepaare in ein Koordinatensystem ein, z.B. den subjektiven Wert auf der X-Achse und den zugehörigen objektiven Wert auf der Y-Achse. Wenn A und B nichts miteinander zu tun hätten würde die Wertepaare wahllos verstreut liegen, als hätte man die Werte gewürfelt (s. linkes Bild). Wenn es einen linearen Zusammenhang zwischen A und B geben würde könnte man eine gerade Linie durch alle Punkte malen (s. rechts Bild):

In der Realität liegen natürlich nicht alle Punkte genau auf einer Geraden, sondern viele liegen in der Nähe der Geraden und einige daneben. Man legt die Gerade so, dass die Summe der quadrierten Abweichungen möglichst klein ist. Wieso quadriert? Starke Abweichungen sollen so stärker "bestraft" werde, außerdem sind dann Abweichungen zwischen dem Wertepaar und der Ausgleichsgeraden nach oben (> 0) und nach unten (< 0) gleich schlimm ("minus mal minus gibt plus). wie gut die Gerade den vermuteten Zusammenhang zwischen A und B annähert beschreibt der Korrelationskoeffizient R². R2 liegt immer zwischen 0 (völliger Zufall) und 1 (starrer Zusammenhang), ab R2 = 0.64 (also R = 0.8 oder -0.8) kann man davon sprechen, dass die Beobachtungen durch die Ausgleichsgerade gut beschrieben werden.

Um zu sehen welches objektive Kriterium

  • mittlerer DR-Wert (linearer Mittelwert links/rechts)

  • Differenz zwischen Peak- und RMS-Wert von JustTimeStat oder

  • dB(A)-Wert von WaveAnalyzer (linearer Mittelwert links/rechts)


    am besten zur subjektiven Beurteilung passt

  • empfundene Komprimierung beim Hören des Stückes

  • empfundene Komprimierung beim Ansehen des Zeitsignals

    wurden kurzerhand alle möglichen Kombinationen ausprobiert:

     

    Obwohl bereits die "genaueren" DR-Werte genommen wurden ist sowohl bei der akustischen als auch der optischen subjektiven Bewertung der Zusammenhang zum DR-Wert am geringsten, während sich der Zusammenhang bei JustTimeStat und Waveanalyzer mit den subjektiven Werten z.T. deutlich besser durch eine Gerade beschreiben lässt.


    Fazit:

    Der DR-Wert ist mit dem Tool TT-DR-Meter sehr schnell zu berechnen und besteht nur aus einer Zahl, ist also einfach zu kommunizieren. Er mag technisch sehr gut funktionieren und sollte im "Musik produzierenden Gewerbe" sicher als zusätzliches Kontrolltool genutzt werden, korreliert aber nicht besonders gut mit der subjektiven Beurteilung. Das heißt im Klartext: bei einem gemeinsamen DR-Wert von 7 kann die dynamische Qualität eines Musiktitels von scheußlich bis gut beurteilt werden. Man kann zwar vermuten, dass Stücke mit einem DR-Wert von 6 und weniger höchstwahrscheinlich auf hochwertigen Musikanlagen zunehmend ungenießbar sind, ein Stück mit einem DR-Wert von 8 kann aber trotzdem weniger dynamisch klingen als eines mit einem DR-Wert von 7. Das hat auch etwas mit der spektralen Verteilung und der Komposition des Stückes zu tun. Einfacher wird das Finden von dynamisch klingenden Aufnahmen durch das DR-Meter als nicht wirklich.

    Wie die statistische Analyse zeigt funktionieren einfachere Tools wie JustTimeStat oder der WaveAnalyzer zumindest mit den hier beispielhaft ausgewerteten Musikstücken etwas besser. Die Analyse mit JustTimeStat dauert kaum länger als mit dem DR-Meter, zusätzlich wird das Zeitsignal angezeigt, welches bereits durch bloßes Hinsehen eine gute Korrelation zur Dynamikkomprimierung gibt. Der WaveAnalyzer führt eine komplette spektrale Analyse der WAV-Datei durch, so dass die Berechnung selbst bei einem schnellen Rechner etwa 25-50% der Spielzeit des Titels in Anspruch nimmt. Dafür gibt es dann aber rauch eine gehörrichtigere Beurteilung der empfundenen Lautstärke, was beim Zusammenstellen von Titeln von verschiedenen CDs hilfreich sein kann.

    Beide Tools haben aber den "Nachteil", dass das Ergebnis nicht so ein schöner Einzahlwert ist (DR 7) sondern dass man noch Kopfrechnen muss (JustTimeStat: Differenz zwischen maximaler und "empfundener" Lautstärke; WaveAnalyzer gibt die Werte kanalweise aus und schreibt zusätzlich eine Ergebnisdatei). Wir wollen JustTimeStat nach den hier gewonnenen Erkenntnissen noch etwas "aufbohren", damit auch eine gehörrichtigere Auswertung möglich ist und das Ergebnis nur aus einem Einzahlwert besteht.

    Das schöne ist aber: oftmals reicht schon ein bloßer Blick auf das Zeitsignal um die Frage nach zu hoher Komprimierung zu beantworten. Fragt sich nur, warum so viel Wirbel um das DR-Meter gemacht wird . . .


     

     

    Christina Aguilera / Ain't No Other Man (Pop / Gesang, Bigband)

     

    Culcha Candela / Ey DJ (Hiphop / Gesang, bassintensiv)

     

    Roger Cicero / Zieh' die Schuhe aus (Jazz / Gesang, Bigband)

     

    Yim Hok Man / Poems of Chinese Drums (Weltmusik / Perkussion)

     

    Craig David / Last Night (Pop)

     

    The Quincy Jones - Sammy Nestico Orchestra / The Joy of Cookin (Jazz / Bigband)

     

    Cunnie Williams / Love or Drug (Soul / Bass, Perkussion)

     

    Norah Jones / Don't know why (Folk / Gesang)

     

    Quincy Jones / Back on the block (Pop)

     

    Joseph Haydn / Symphonie mit dem Paukenschlag (Klassik / Extremdynamik)

     

    Hugh Masekela / Stimela (Ethno-Jazz / Live-Aufnahme)

     

    Sheffield Lab / Ron Tutt (Jazz / Drum Solo)