Nachhallzeit

Ringversuch Nachhallzeit

Teil 4 - Softwaretest

Im vierten Teil des Ringversuchs zum Thema Nachhallzeit werden die Auswertungs-Algorithmen von 13 verschiedenen Softwares untersucht, welche T-20 und T-30-Zeiten anhand von Impulsantworten auswerten können. Dabei geht es um die Fragestellung, ob identische Eingaben zu unterschiedlichen Ausgaben führen und wenn ja, worauf diese zurückzuführen sind.

Das obige Titelbild zeigt zwei Giganten der Raumakustikforschung: Professor Wallace C. Sabine hat um 1900 herum über mehrere Jahre hinweg Aspekte der Nachhallzeit systematisch untersucht und die Grösse wissenschaftlich definiert. Er gilt als Begründer der modernen, wissenschaftlichen Raumakustik. Professor Manfred Schroeder hat neben vielen anderen bahnbrechenden Beiträgen zur Akustik (z.B. QR-/Schroeder-Diffusoren, Bestimmung der Modulationstransferindizes aus der Impulsantwort) in den 1960er-Jahren die Methode der Rückwärtsintegration der quadrierten Impulsantwort entwickelt, die bis heute zur Bestimmung der Nachhallzeit verwendet wird.

Der Bericht ist in vier Teile gegliedert:

  • Teil 1 stellt den Versuchsaufbau vor und untersucht, wie gross die Differenzen ausfallen, wenn mehrere Akustiker unabhängig voneinander die Nachhallzeit eines Saals bestimmen.
  • Teil 2 legt dar, welche Normen (ISO 3382) einzuhalten sind und wie gut diese von den Teilnehmern umgesetzt wurden.
  • Teil 3 untersucht systematisch, welche Abweichungen bedingt durch unterschiedliche Messmethoden und unterschiedliche Ausrüstung zu erwarten sind.
  • Teil 4 (diese Seite) beinhaltet einen isolierten Test von von 13 verschiedenen Mess- und Akustik-Softwares.

Zusammenfassung wichtigster Erkenntnisse

  1. 13 Akustik-Softwares wurden mit identischen Impulsantworten getestet. Es treten teilweise deutliche Differenzen in den Ergebnissen hervor, die irritierend sind.
  2. Wesentliche Unterschiede bestehen in der Implementierung der Rauschunterdrückungs-Algorithmen und der Filterbänke. Beides beeinflusst potentiell die Resultate. Es bestehen Zweifel, ob alle Algorithmen fehlerfrei und/oder normenkonform arbeiten.
  3. Viele Fehler können durch eine konsequente Überprüfung der Rückwärtsintegration der Impulsantwort und der daraus resultierenden linearen Regressionsgeraden vermieden werden. Voraussetzung hierfür ist aber, dass die Software eine solche Möglichkeit bietet und beim Akustiker Problembewusstsein, entsprechendes Hintergrundwissen und Erfahrung vorhanden sind. (Beides wurde im Rahmen dieses Tests nicht geprüft)
  4. Bei der Messung von sehr kurzen Nachhallzeiten besteht die Gefahr, dass die Ergebnisse durch die softwareinternen Abklingzeiten der Filter verfälscht werden.
  5. Es sollte ein ausführliches Audit durchgeführt werden, um die Qualität von Akustik-Softwares systematisch zu untersuchen und zu überprüfen, inwieweit die Vorgaben einschlägiger Normen (z.B. ISO 3382, IEC 61260-1) eingehalten werden. Dies ist die Voraussetzung für eine Verbesserung der Algorithmen mit dem Ziel die Qualität von akustischen Messungen zu steigern und damit vergleichbarere und reproduzierbarere Ergebnisse zu erreichen. Dies gilt sinngemäss auch für die Auswertungsalgorithmen von Handgeräten, welche im Rahmen dieses Versuchs nicht getestet wurden.

Motivation und These

In den vorhergehenden Teilen dieses Berichts wurden Unterschiede bei der Messung in einem realen Raum untersucht. Dabei wurde bereits verschiedentlich erwähnt, dass einige der Differenzen in den Resultaten auch auf die Messgeräte und deren Auswertungsalgorithmen zurückzuführen sind. Dieser Aspekt sollte nun näher untersucht werden, um zu sehen, ob es bei der Auswertung völlig identischer Messdaten durch verschiedene Softwares grundsätzlich signifikante Unterschiede in deren Nachhallzeit-Berechnung gibt.

Der Test hat allerdings nur am Rande einen Zusammenhang mit den anderen Teilen des Berichts. So wurden bewusst keine Impulsantworten aus dem Raum des Hauptversuchs verwendet. Auch die Softwares waren nicht durchgängig identisch, zumal im Haupttest nur verhältnismässig wenige Akustiker überhaupt mit rein softwarebasierten Messystemen arbeiteten. Handgeräte, die in der Regel nach der Methode des abgeschalteten Rauschens messen, wurden im folgenden Test nicht berücksichtigt, obschon auch deren Auswertung auf Software-Implementierungen beruht und grundsätzlich den gleichen potentiellen Unsicherheitsquellen unterliegt. Insofern stellen die folgend präsentierten Ergebnisse eine in sich geschlossene, allgemeine Untersuchung ohne direkten Bezug zu den Ergebnissen insbesondere aus Teil 1 des Ringversuchs dar.

Aufgrund vergangener interner Untersuchungen zum Thema, vermuteten die Versuchsleiter, dass sich Unterschiede in den Ergebnissen präsentieren würden. Dies ist auch aus der einschlägigen Fachliteratur bekannt. So scheibt etwa Katz [1]: "The results of this study indicate that there is a substantial degree of variation between current impulse response analysis software, even when isolated from the measurement system." Freie Übersetzung: Die Ergebnisse dieser Studie zeigen, dass es einen erheblichen Unterschied zwischen aktuellen Impulsantwort-Analyse-Softwares gibt, auch wenn sie vom Messsystem isoliert werden. Und Cabrera [2] formulierte es nach einem Test von 9 verbreiteten Softwares so: "There is evidently some room for improvement, arguably in all of the software implementations tested." Freie Übersetzung: "Es gibt offensichtlich noch Verbesserungspotenzial in allen getesteten Software-Implementierungen." (Beide genannte Studien untersuchten nicht nur die Nachhallzeit, sondern auch andere akustische Grössen, welche in der ISO 3382-1 definiert sind).

Getestete Softwares

Insgesamt wurden 13 Softwares getestet (alphabetisch, gegebenenfalls in Anführungszeichen Kurzbezeichnung, welche in den Abbildungen verwendet wird):

  • ARTA
  • DIRAC (Brüel&Kjaer)
  • EASERA (AFMG)
  • Monkey Forest DOS, "MF DOS" (Four Audio)
  • Monkey Forest Win(dows), "MF Win" (Four Audio)
  • Odeon
  • ReflPhinder, "Refl" (CATT)
  • Room Capture, "RoomC" (Wave Capture)
  • Room EQ Wizard, "REW"
  • SATlive
  • Smaart (Rational Acoustics)
  • Sonotrazer, "Sono" (Sonotronex, Eigenentwicklung eines Teilnehmers der Ringversuchs)
  • Systune (AFMG)

Softwarespezifische Einschränkungen, Besonderheiten und Optionen

  • 63-Hz-Band
    "EASERA", "Systune" und "ReflPhinder" bieten keine Möglichkeit, das 63-Hz-Band auszuwerten. Bei den ersten beiden genannten ist dies insofern bedauerlich, als dass es sich um Produkte handelt die bereits seit rund 10 bzw. 15 Jahren auf dem Markt verfügbar sind und der Umstand, dass keine 63-Filter implementiert sind, bereits seit Jahren verschiedentlich - allerdings offensichtlich erfolglos - bemängelt wurde.
  • T20/T30
    Für den Test wurden grundsätzlich die T20-Ergebnisse ausgewertet, da diese von allen Softwares berechnet werden konnte. Bei "Smaart" ist die Nachhallzeitauswertung allerdings lediglich mit der Bezeichnung "RT60" versehen. Weder aus der Dokumentation noch aus der technischen Spezifikation ist ersichtlich, über welchen Pegelbereich hinweg der Abfall ermittelt wird. Anhand der Rohdaten konnte mindestens für Einzelfälle nachgewiesen werden, dass die Ermittlung eines T30-Abfalls wahrscheinlich erscheint. Dies verfälscht die Ergebnisse möglicherweise, da die Streuungen der T30-Zeiten generell (d.h. beim Vergleich der Softwares, welche beide Zeiten erheben können) etwas grösser ausfiel.
  • Rauschunterdrückung
    Bei "Sonotrazer" wurde die Rauschkompensation aus spezifischen Gründen deaktiviert. Ausgaben mit ungenügendem Signal-Rauschabstand werden bei der Ausgabe unterdrückt. Da in allen anderen Softwares die Rauschunterdrückung aktiviert war, ist es denkbar, dass "Sonotrazer" in einigen Fällen etwas im Nachteil ist.
  • Rauschunterdrückung
    In den meisten Softwares ist eine Methode zur Rauschunterdrückung implementiert. Welche das ist, ist in den allermeisten Fällen unbekannt, da nicht dokumentiert. "ARTA" ermöglicht jedoch alle drei derzeit in ISO 3382 zugelassenen Methoden. Gewählt wurde "Truncation".
  • Startzeitpunkt Impulsantwort
    Vorausgesetzt, dass die Impulsantwort lang genug ist, sollte es im Prinzip keine Rolle spielen ob das Sample mit dem grössten Wert zum Zeitpunkt Null beginnt oder zeitlich nach hinten versetzt ist (etwa weil in der Messung selbst die Flugzeit nicht kompensiert wurde). Fakt ist aber, dass in einigen Programmen nachweislich Unterschiede in der ermittelten Nachhallzeit auftreten. Die Test-Impulsantworten wurden bewusst nicht zeitlich kompensiert. Es gibt jedoch Softwares, die eine solche Korrektur automatisch vornehmen oder bei denen beim Import der Dateien abgefragt wird, ob eine zyklische Verschiebung vorgenommen werden soll. Soweit dies überblickbar ist, betraf dies innerhalb des Testlaufs "ARTA" und "REW". Es lässt sich jedoch derzeit nicht mit Sicherheit sagen, inwiefern dies einen Einfluss auf die Ergebnisse hatte.
  • Filterbank-Optionen
    Bei der Zerlegung der Breitband-Impulsantwort in einzelne Oktavbänder, ist in der Regel eine Filterbank implementiert. Üblicherweise ist nicht genauer spezifiziert wie diese Filterbank ausgelegt ist. In einigen Fällen waren die Hersteller nicht einmal auf Nachfrage in der Lage, hierzu Angaben zu machen! Einzelne Softwares bieten aber auch mehrere Optionen an. Innerhalb des Tests waren dies bekanntermassen und ohne Anspruch auf Vollständigkeit "ReflPhinder" (minimal oder linearphasige Filterbank, verwendet wurde die linearphasige), "EASERA" (IIR und minimalphasige Filter, Unterschied unbekannt, da auch IIR-Filter minimalphasig sind, verwendet wurde "minimalphasig"), "REW" (minimalphasige Vorwärts-Filterung, zeitlich inverse Filterung, "Null-Phasen-Filterung", verwendet wurde die minimalphasige Vorwärts-Variante).
  • Plausibilitätskontrolle
    Einige Softwares verfügen über mehr oder weniger ausgefeilte Algorithmen, um die Plausibilität der Nachhallzeitermittlung zu überprüfen. Dies kann beispielsweise durch eine Kontrolle des Signal-Rauschabstands oder einer Analyse der Determinationskoeffizienten der linearen Regression des Abklingvorgangs erfolgen. Wenn eine softwarespezifische Schwelle überschritten ist, wird die Ausgabe der Daten in den betroffenen Frequenzbändern unterdrückt. In anderen Softwares werden die Daten zwar ausgegeben, aber mit einem Warnhinweis versehen. Bezüglich der folgenden Auswertungen wurden prinzipiell auch alle mit Warnungen ausgegebene Daten verwendet, um dennoch Rückschlüsse auf die unterschiedlichen Algorithmen der Softwares zu ermöglichen.

Methodik und Aufgabestellung

Um die Algorithmen der Softwares möglichst isoliert von anderen Effekten zu untersuchen, wurden den Test-Teilnehmern fünf Impulsantworten zur Verfügung gestellt. Diese stammen nicht aus dem Testraum, der in den vorhergehenden Teilen Thema war, sondern aus drei verschiedenen Projekten der Versuchsleiter und zwei synthetischen Varianten:

  • IR a: Veranstaltungshalle
  • IR b: Wohnzimmer
  • IR d: Kühlturm
  • IR e: Synthetisierte Impulsantwort (Filtertest)
  • IR c: Einzelnes Sample

Die ersten drei Impulsantworten aus realen Räumen, waren bewusst so angelegt, dass sie einen "Stresstest" für die Softwares darstellten, indem sie einige Anomalien aufwiesen, die aber - mindestens was die beiden ersten Impulsantworten betrifft - durchaus des Öfteren in der Praxis anzutreffen sind.

Die Impulsantworten wurden in Form von 16-Bit-Wavefiles mit einer Abtastrate von 44,1 kHz an mehrere Akustiker verschickt; an dieser Stelle herzlichen Dank fürs Mitmachen. Wenn möglich wurde jede Software von mehreren Personen geprüft, um sicherzustellen, dass sich nicht anwenderspezifische Besonderheiten, z.B. in Form von speziellen Einstellungen, in die Ergebnisse einschleichen und diese ungewollt beeinflussen.

Auszuwerten waren die T20- und T30- Nachhallzeiten zwischen 63 Hz und 8 kHz. Im Folgenden werden allerdings nur die T20-Ergebnisse präsentiert und auf den "üblichen" raumakustischen Frequenzbereich von 125 Hz bis 4 kHz beschränkt.

Bei der Auswertung der Daten waren keinerlei manuelle Eingriffe erlaubt, wie beispielsweise eine Manipulation der Impulsantworten oder eine manuelle Auswertung anhand von Abklingkurven. Stattdessen musste zwingend die Automatik der Software bei aktiviertem Rauschunterdrückungs-Algorithmus verwendet werden.

Letztlich wurden also weder der Akustiker getestet, noch die Mess-Software als Ganzes inklusive Datenerfassung. Stattdessen wurde lediglich geprüft, ob sich alleine durch den automatischen Auswertungsalgorithmus nachweisbare Differenzen ergeben.

Impulsantwort a: Halle mit Störgeräuschen

Die erste getestete Impulsantwort war speziell darauf ausgelegt, zu überprüfen, wie gut die Rauschunterdrückungs-Algorithmen arbeiten und ob sich Unterschiede in den Resultaten festmachen liessen. Es handelt sich um eine Messung in einer Veranstaltungshalle mit einer Kapazität von rund 2000 Personen. Während der Messung trat eine Störung auf, die in Abbildung 4-1 anhand der Energie-Zeitkurve (ETC) der 1-kHz-Oktave um 1,5 Sekunden deutlich zu erkennen ist. Natürlich sollte im Idealfall eine solcherart verunreinigte Impulsantwort bestenfalls gar nicht erst verwendet werden. Mindestens bedingt sie eine Überprüfung der Rauschunterdrückung und nötigenfalls ein manuelles Post-Prozessing.

Störung 1 kHz
Abb. 4-1: Impulsantwort a, ETC 1-kHz-Oktave

Die T20-Ergebnisse der 13 getesteten Softwares von 125 Hz bis 4 kHz in Abbildung 4-2 zeigen tatsächlich auch deutliche Differenzen. Viele Resultate liegen zwar sehr dicht beisammen, es gibt aber einige Ausreisser und generell eine recht grosse Streuung im 125-Hz-Band.

Ergebnis Impulsantwort 1
Abb. 4-2: T20-Ergebnisse Impulsantwort a

Für jede Software und jedes Oktavband wurde die prozentuale Abweichung vom Median aller Ergebnisse berechnet und in Abbildung 4-3 in Form eines gestapelten Säulendiagramms dargestellt. Die Farben stellen die Abweichungen in den einzelnen Oktavbändern dar (s. Legende in der Datentabelle). Die vertikale Achse ist auf eine Abweichung von +/- 100% begrenzt. Softwares welche diesen Bereich überschreiten, werden mit einer angepassten vertikalen Skalierung in Abbildung 4-4 dargestellt.

Ergebnis IR a
Abb. 4-3: Prozentuale Abweichung vom Median

Ergebnis IR a
Abb. 4-4: Prozentuale Abweichung vom Median grösser 100%

Alles spricht dafür, dass die Differenzen, vor allem was die starken Abweichler betrifft, in erster Linie auf Unterschiede in den Rauschkompensationsalgorithmen zurückzuführen sind. Die Abweichungen haben letztlich doch ein wenig überrascht, denn trotz der Störung ist der Signalrauschabstand mindestens für die Berechnung eines 20-dB-Abfalls ausreichend und liegt auch innerhalb der durch die ISO 3382 spezifizierten Grenzwerte. Dies ist auch an den Ergebnissen "Sonotrazer" (ohne Rauschunterdrückung) ersichtlich, deren Ergebnisse sehr viel weniger vom Median abweichen, als dies bei den starken Ausreissern der Fall ist.

Deshalb liegt die Vermutung nahe, dass einige Softwares durch den Umstand "überfordert" waren, dass der Rauschteppich nicht einen durchgängig identischen Pegel aufwies, sondern eine zeitlich begrenzte Störung enthielten. Offensichtlich bestehen also Unterschiede in der Art und Weise, wie in diesem Falle der Rauschteppich detektiert und/oder eliminiert wird.

Rauschunterdrückungs-Algorithmen

Praktisch alle Software-Ringversuche der Vergangenheit verweisen darauf, dass die unterschiedliche Implementierung der Rauschunterdrückungs-Algorithmen zu signifikanten Differenzen in den Ergebnissen führen (u.a. bei [1] und [2]). Eine verhältnismässig neue Untersuchung von Alvarez-Morales [4] schreibt hierzu: "Unfortunately, limitations in handling the background noise [...] remain present in a number of the software tools used today." Freie Übersetzung: "Leider sind Einschränkungen im Umgang mit dem Hintergrundgeräusch [...] in einer Reihe der heute verwendeten Softwaretools weiterhin vorhanden."

In ISO 3382 sind zwar die Methoden definiert, welche zulässig sind, um den Rauschteppich aus der Messung zu entfernen, jedoch ist nicht genauer spezifiziert, wie dessen Detektion zu erfolgen hat (eine gute Zusammenstellung der Methoden und der daraus resultierenden Unterschiede findet sich in [3]). Ausserdem werden ausgerechnet die beiden Methoden, welche den geringsten Fehler produzieren, in der derzeitigen Fassung der ISO 3382 nicht erwähnt. Es bestehen deshalb Vorschläge bei der nächsten Revision die entsprechenden Bestimmungen zu ändern [12].

Jede Impulsantwort ist grundsätzlich durch Stör- und Grundgeräusche mehr oder weniger stark verunreinigt. Ist der Signal-Rauschabstand der Messung (genauer eigentlich die Differenz zwischen dem Sample mit dem höchsten Wert und dem Durchschnittswert des detektierten Störpegels) zu niedrig, führt dies zu einer falschen, flacheren Regressionsgeraden, die ihrerseits zu einer Überschätzung der Nachhallzeit führt.

Abbildung 4-5 zeigt den Sachverhalt exemplarisch anhand einer Energie-Zeitkurve (quadrierte Impulsantwort) des 4-kHz-Bandes einer mittelgrossen Halle (schwarz).

Schröder Rückwärtsintegration
Abb. 4-5: Schröder-Rückwärtsintegration mit/ohne Rauschkompensation

Die rote Linie stellt die Rückwärtsintegration mit aktivierter Rauschunterdrückung dar. Die Berechnung beginnt erst bei ca. 0,9 Sekunden und läuft dann nach links, gegen den Zeitpunkt Null zu. Der Algorithmus hat also die Signale ab ca. 0,9 s korrekt als Grundrauschen identifiziert und deshalb entfernt. Die türkisfarbene Kurve, zeigt den Verlauf, wenn die Rauschunterdrückung ausgeschaltet ist und die Integration deshalb bereits ganz rechts, am Ende der Impulsantwort beginnt. In diesem konkreten Fall ist es aufgrund des hohen Signal-Rauschabstandes von rund 60 dB irrelevant, welche Variante man verwendet: Im Anfangszeit- und Pegelbereich (ca. erste 35 dB), der letztlich für die Bestimmung der Nachhallzeit verwendet wird, verlaufen die beiden Integrationskurven völlig deckungsgleich. Das kann sich aber rasch ändern, wenn der Grundgeräuschteppich etwas höher wird oder wenn er vom Algorithmus fehlerhaft detektiert wird.

Es kommt gelegentlich aber auch vor, dass die Rauschunterdrückung relevante Daten eliminiert, welche anschliessend zu einem Fehler führen. Unter Umständen kann es deshalb auch sinnvoll sein, die Rauschunterdrückung zu deaktivieren, wenn der Signal-Rauschabstand der Messung genügend gross ist oder mindestens kurz zu prüfen welche Unterschiede sich beim Ein-/Ausschalten der Funktion ergeben.

Generell empfiehlt es sich - nein: eigentlich ist es unabdingbar - das Abklingverhalten, die Integrationskurven und auch die daraus entstehende Regressionsgeraden bandpassgefiltert immer zu kontrollieren, um allfällige Fehler der Rauschunterdrückung, aber auch Schallfeld-Anomalien identifizieren und die Daten nötigenfalls manuell korrigieren oder fehlerhafte Werte aussortieren zu können. In diesem Zusammenhang ist es unter Umständen auch entscheidend, welche Gesamtlänge die Impulsantwort hat und über welchen zeitlichen Bereich hinweg sich der Rauschteppich bildet. Je nach Situation empfiehlt es sich, die Impulsantwort vor der Auswertung manuell zu kürzen, im besten Falle mit einer geeigneten Funktion wegzufenstern. Besonders entscheidend kann dies im Falle von Sinus-Sweep-Messungen sein, wenn sich am Ende der Impulsantwort (genaugenommen eigentlich vor dem zyklisch verschobenen Direktschall-Peak) starke Effekte nichtlinearer Verzerrungen finden. Unter bestimmten Umständen führen die Verzerrungsprodukte andernfalls nachweislich zu einer fehlerhaften Rauschunterdrückung und damit fehlerhaften Nachhallzeiten.

Schröder Rückwärtsintegration
Abb. 4-6: Quadrierte Impulsantwort mit nichtlinearen Verzerrungen

IR b: Wohnzimmer

Diese Impulsantwort stammt aus einem normalen Wohnraum und wurde mit einer darin befindlichen Hifi-Anlage gemessen. Die Besonderheit des Raums liegt darin, dass drei Volumina aneinander angekoppelt sind: An den eigentlichen Wohnraum grenzt eine Wohnküche und an diese wiederum ein offenes Treppenhaus.

Abbildung 4-7 zeigt die Rückwärtsintegration für das 125-Hz-Band in Form der schwarzen Kurve. Deutlich erkennbar ist der Absatz bei ca. 80 ms (blauer Pfeil), der durch das erste angekoppelte Volumen entsteht. Tatsächlich wirkt sich dieses Volumen schon wesentlich früher auf die rote Regressionslinie aus, die andernfalls deutlich steiler verlaufen würde; dies ist aber aufgrund des geringeren Pegels des angekoppelten Volumens nicht ganz einfach bzw. nur mit genügend Erfahrung erkennbar.

Schröder Rückwärtsintegration
Abb. 4-7: Impulsantwort b: Rückwärtsintegration (schwarz) und Regressionsgerade (rot) 125-Hz-Band

Eine korrekte Einschätzung einer solchen Situation - und damit die Vermeidung von falschen Rückschlüssen, die zu einer fehlerhaften akustischen Behandlung führen - ist nur bei einer manuellen Auswertung und hinreichender Erfahrung des Akustikers überhaupt möglich. Keine Automatik ist in der Lage diese Situation korrekt zu erfassen. Da die Voraussetzungen aber für alle Softwares identisch waren, konnte eigentlich davon ausgegangen werden, dass auch alle in etwa ähnliche Zeiten ausweisen würden. Dies war aber bei weitem nicht der Fall: Besonders im oben dargestellten 125-Hz-Band, welches am stärksten von den angekoppelten Volumina beeinflusst wird, entstanden teils erhebliche Differenzen. Interessant ist dabei auch, dass einige Softwares dieses Band stark unter- andere stark überschätzten. In vier Fällen überstieg die gesamte Abweichung +/-100%. Völlig daneben schlug "Systune" im 125-Hz-Band mit einer Abweichung von 974%! Um die Grafiken nicht völlig zu verzerren, wurden die vertikalen Achsen ohne Berücksichtigung dieses Extrem-Wertes skaliert.

Ergebnis Nachhallzeit IR b
Abb. 4-8: T20-Ergebnisse Impulsantwort b

Ergebnis Nachhallzeit IR b
Abb. 4-9: Prozentuale Abweichung vom Median

Ergebnis Nachhallzeit IR b
Abb. 4-10: Prozentuale Abweichung vom Median grösser 100%

"Room Capture" und "Sonotrazer" weigerten sich, für die Oktavbänder 125 und 250 Hz überhaupt ein Ergebnis auszugeben (s. Leerstellen in der Datentabelle von Abb. 4-8), was sie bei der Darstellung der gesamten prozentualen Abweichung natürlich enorm begünstigte. Bei beiden zeigte sich ansonsten eine deutliche Abweichung in der 4 kHz-Oktave (dunkelblau), die bei allen anderen Softwares so nicht auftritt. Die auffälligen Gemeinsamkeiten der beiden Softwares deutet darauf hin, dass hier ein identischer oder mindestens sehr ähnlicher Algorithmus angewandt wird, der sich von allen anderen unterscheidet.

Mehrere Teilnehmer bzw. deren Softwares bemängelten einen unzureichenden Signal-Rauschabstand der Messung, besonders im 125-Hz-Band. Dies trifft allerdings nicht zu: Der Grund liegt vielmehr darin, dass einerseits Raumresonanzen auftreten, welche in diesem kleinen Raum zwangsläufig entstehen und bis weit in den unteren Mittenbereich hineinreichen. Andererseits sorgt das zweite angekoppelte Volumen für eine deutliche Abflachung der Abklingkurven. Das eigentliche Problem dieser Impulsantwort ist, dass deren Länge zwar bezogen auf die Nachhallzeit des Wohnraums in dem gemessen wurde ausreichend ist, allerdings (besonders im 125-Hz-Band), nicht lang genug, um die beiden angekoppelten Volumina vollständig zu erfassen, weshalb ein eigentlicher Rauschteppich in der Messung fehlt. Da diese Grundvoraussetzung aber ja für alle Auswertungsalgorithmen gleichermassen gilt, ist es dennoch interessant, wie unterschiedlich die Softwares mit diesem Umstand, welcher in der Praxis durchaus immer wieder mal vorkommt, umgehen.

IR d: Extrem lange Nachhallzeit

Das nächste Beispiel stammt aus einer Test-Sammlung von "Brüel&Kjaer". Es handelt sich um eine Messung in einem Reaktor-Kühlturm, die im Bassbereich eine Nachhallzeit von über 40 Sekunden(!) aufweist und von ausgeprägten Flatterechos gekennzeichnet ist, wie die Breitband-ETC in Abbildung 4-11 zeigt.

Flatterecho
Abb. 4-11: Impulsantwort d: Breitband ETC

Erfahrungsgemäss haben einige Algorithmen erhebliche Mühe mit der Beurteilung von Flatterechos. Das Wave-File ist rund 23 Sekunden lang und "Systune" konnte dieses als einzige Software gar nicht erst laden. Andere Softwares kürzten die Impulsantwort vermutlich automatisch, da sie ansonsten die Kapazitäten der internen Speicher überschritten hätten. Ein Teil der Abweichungen zwischen den Resultaten dürfte dadurch erklärbar sein. Das Beispiel ist natürlich etwas gesucht, da die wenigsten Akustiker jemals in ihrem Leben in die Verlegenheit kommen werden, die Nachhallzeit eines Kühlturms zu bestimmen. Interessant sind die Unterschiede dennoch.

Ergebnis Nachhallzeit IR d
Abb. 4-12: T20-Ergebnisse Impulsantwort d

Ergebnis Nachhallzeit IR d
Abb. 4-13: Prozentuale Abweichung vom Median

Ergebnis Nachhallzeit IR d
Abb. 4-14: Prozentuale Abweichung vom Median grösser 100%

Filterimplementierung und indirekte Filtertests

Wie in vielen anderen Fällen in der Akustik und Technik allgemein, genügt es in der Regel nicht ein Breitbandergebnis zu messen, stattdessen müssen Werte in feinerer Auflösung, üblicherweise Oktavbändern oder 1/3-Oktaven (Terzbändern) zur Verfügung stehen. Prinzipiell liesse sich dies durch eine entsprechende Bandbegrenzung des Anregungssignals und mehrere aufeinanderfolgende Messungen realisieren. Vornehmlich aus praktischen Gründen ist es aber abgesehen von Spezialaufgaben heutzutage so, dass die Messung selbst mit einem Signal durchgeführt wird, das die komplette gewünschte Bandbreite aufweist. Im Post-Prozessing wird dieses Breitbandsignal dann mit einer Filterbank in die gewünschten bandpassbegrenzten Bereiche zerlegt.

Wie diese Filterung sachgerecht vorzunehmen ist, legt IEC 61260-1 [5] fest. Viele Normen verweisen deshalb darauf unter anderem auch die Reihe ISO 3382. Die Definition der Filter in IEC 61260-1 ist nun allerdings nicht etwa, wie man sich das womöglich gewohnt ist und erwarten würde, anhand deren üblicher Parameter (Mittenfrequenz, Filtertyp, Ordnung/Flankensteilheit) definiert. Stattdessen müssen nach einem recht umständlichen Verfahren zuerst Koeffizienten errechnet werden. Deren Lagen auf der Frequenzachse sind nun für jede gewünschte Mittenfrequenz der Filterbank zu bestimmen. Daraus ergeben sich dann die Knickpunkte einer unteren und oberen Toleranzgrenze für die Dämpfungseigenschaften, welche das implementierte Filter einhalten muss.

Exemplarisch ist dies in Abbildung 4-15 dargestellt, welche das zulässige Toleranzfeld für ein Oktavbandfilter der Klasse 1 mit einer Mittenfrequenz von 1 kHz zeigt (grau-gestrichelte Linien).

Oktavbandfilter IEC
Abb. 4-15: Toleranzbereiche IEC Klasse 1 Oktavband-Filter (grau) und konkretes Beispiel (gelb)

Ebenfalls in die Grafik eingezeichnet, ist das konkrete Beispiel einer Filterimplementierung in einer Akustik-Mess-Software (orange Kurve). Man kann erkennen, dass das getestete Filter die Anforderungen erfüllt. Ebenso wird aber deutlich, dass es eine Vielzahl von davon abweichenden Filtercharakteristika geben kann, welche die Normenvorgabe ebenfalls einhalten.

Es ist nun davon auszugehen, dass es Fälle gibt, in denen unterschiedliche Implementierungen der Filterbänke zu Differenzen in den Ergebnissen führen. Dies kann beispielsweise dann der Fall sein, wenn zwischen den einzelnen Bändern Sprünge der Nachhallzeiten auftreten. Tendenziell überspricht dann das Band mit dem längeren Abklingverhalten in den Bereich seines Nachbarn. Manchmal ist dies auch anhand einer Analyse der Bandpass-gefilterten und rückwärts integrierten Impulsantwort ersichtlich, die dann einen kleinen "Knick" enthält, wie er in vergleichbarer Weise auch durch die Messung zweier akustisch aneinander angekoppelten Volumina entsteht.

IR e: Test Filterselektivität (synthetisiert)

Zur Untersuchung der Filterselektivität wurde eine Impulsantwort verwendet, die wie folgt synthetisiert wurde: Zunächst wurde ein im Rahmen des technisch möglichen angenäherter Deltaimpuls, welcher definitionsgemäss eine Nachhallzeit von Null Sekunden aufweist, mit einem phasenlinearen Filter in einzelne Oktavbänder zerlegt. Dabei wurden extrem steilflankige Filter 36. Ordnung (216 dB pro Oktave) verwendet. Anschliessend wurden die einzelnen Oktavbänder in unterschiedlicher Weise mit künstlichem Nachhall versehen, wobei die Bänder 250 Hz und 2 kHz allerdings unverändert belassen wurden. Um die durch die Nachhall-Algorithmen erzeugten Seitenbänder ausserhalb der Oktavbereiche zu eliminieren, wurden die einzelnen Oktavbänder dann noch einmal mit einem Bandpass 36. Ordnung gefiltert. Zum Schluss wurden die einzelnen Oktaven wieder zu einer einzigen Impulsantwort zusammengesetzt.

Durch die Synthetisierung entstanden zwischen den Bändern starke Abrisskanten in der komplexen Übertragungsfunktion. Es war absehbar, dass dieses völlig unnatürliche Verhalten Fehler verursachen würde. Die spannende Frage war allerdings, ob sich diese Fehler in allen Softwares ähnlich äussern würde, was der Fall sein müsste, wenn die Filterbänke identisch implementiert wären.

Als Referenzbasis wurde zunächst die "tatsächliche Nachhallzeit" ermittelt, indem eine entsprechende Auswertung der Einzeloktaven während der Synthetisierung vorgenommen wurde. Sie ist in Abbildung 4-17 in Form von roten Kreisen und einer verbindenden, gestrichelten Linie ersichtlich. Die anderen Symbole stellen die Ergebnisse der einzelnen Softwares dar.

Synthetisierte Impulsantwort
Abb. 4-17: Tatsächliche Nachhallzeit (rote Kreise/gestrichelte Linie) und Ergebnisse T20 Impulsantwort e

Augenfällig ist, wie sehr sich die Ergebnisse voneinander unterscheiden. Eine grosse Übereinstimmung mit der tatsächlichen Nachhallzeit ergibt sich erwartungsgemäss in den Bändern, die stark verhallt wurden, also 125 Hz, 1 kHz und 4 kHz. Umgekehrt weichen im Allgemeinen die Ergebnisse in denjenigen Bändern stark ab, die gar nicht verhallt wurden: 250 Hz, 2 kHz. Da für die Nachhallzeit der relative Pegelabfall massgebend ist, wird jedes Übersprechen zwischen den Bandpassen und sei es auch noch so klein zwangsläufig zu einem Fehler führen. Besonders gut sichtbar ist dies anhand der 2-kHz-Oktave die von einem stark verhallten 1-kHz-Band (5,04 s) und einem etwas geringer verhallten 4-kHz-Band (3.22 s) flankiert wird. Die Beeinflussung des stärker verhallten Nachbarn hat offensichtlich einen grösseren Einfluss auf den Fehler.

Sehr interessant ist das 500 Hz-Band, welches eine recht kurze Nachhallzeit von 0,48 Sekunden aufweist und vom stark verhallten 1-kHz-Band benachbart wird. Die grosse Streuung der Ergebnisse ist ein deutlicher Hinweis darauf, dass ganz unterschiedliche Filterbänke implementiert sind: Je grösser die Abweichung ausfällt, desto grösser ist das Übersprechen, desto weniger steilflankig arbeitet das Filter an der unteren Grenze des 1-kHz-Bandes.

Ausgesprochen bemerkenswert verhält sich "ARTA" (blaue Dreiecke): Als einzige erkennt sie im 2 kHz-Band korrekt eine Nachhallzeit von Null Sekunden. Grundsätzlich ist dies nur möglich, wenn unendlich steile Filter verwendet werden oder - wahrscheinlicher - ein Korrekturalgorithmus arbeitet, eventuell in der Form, dass Bänder mit einem zu geringen relativen Pegel unterdrückt werden. Diese Korrektur führt aber offensichtlich auch dazu, dass - ebenfalls im Gegensatz zu allen anderen - auch gleich das 1-kHz-Band mit Null Sekunden ausgewiesen wird. Erstaunlich ist allerdings, dass diese Korrektur im 250-Hz-Band nicht zum Tragen kommt, obschon die Verhältnisse an sich vergleichbar sind. Der Effekt, dass sich die Ergebnisse über die Frequenz nicht nachvollziehbar-konsistent verhalten, findet man teilweise auch bei anderen Softwares, was den Schluss nahelegt, dass die Filterbank nicht in jedem Oktavband identisch arbeitet oder, dass je nach Bandbereich unterschiedliche Korrektur-Algorithmen angesprochen werden.

Anders als alle anderen verhält sich auch "Monkey Forest DOS" (schwarze Quadrate): Sie liegt in allen Bändern sehr nahe an den tatsächlichen Werten, verweigert allerdings für das 2-kHz-Band ein Resultat. Offensichtlich wird hier also ein gänzlich anderer Algorithmus oder eine gänzlich andere Filterbank verwendet. Obschon in diesem konkreten und sehr künstlichen Beispiel eine gute Annäherung an die wahren Verhältnisse resultiert, stellt sich die Frage, ob es eine gute Sache ist, wenn eine Software so stark von anderen abweicht. Denn dies impliziert, dass womöglich auch bei der Beurteilung realer Impulsantworten Differenzen resultieren. Anhand der Ergebnisse der zuvor analysierten Beispiele a, b und d ist ersichtlich, dass "MF DOS" zwar nicht zu den massiven Ausreissern gehört, aber tendenziell doch stärker abweicht, als die Softwares, die am nächsten am Median liegen.

Anhand der Leerstellen in der Datentabelle ist ersichtlich, dass einzelne Softwares in einzelnen Bändern die Arbeit verweigerten.

Die Idee zu diesem Test stammt aus einem Aufsatz von 2016 von Cabrera [2] in welchem u.a. der selbe Sachverhalt, allerdings mit einem anderen Testverfahren, untersucht wurde. Mit Verweis auf Venturi 2013 [6] wurde angemerkt, dass um Messfehler zu vermeiden, hochselektive Filterbänke 24. Ordnung (144 dB/Oktave) verwendet werden sollten. Aktuell wird dies vermutlich von keiner kommerziell verfügbaren Software unterstützt. Eine kurze und nur punktuelle Kontrolle ergab, dass meistens Filter 6. oder 8. Ordnung für die Oktavband-Zerlegung angewandt werden.

Generell stellt sich die Frage, ob nicht eine deutliche Verschärfung der Normen angezeigt wäre. Da heutzutage flächendeckend mit digital implementierten Filterbänken gearbeitet wird, die sich praktisch beliebig parametrisieren lassen, gibt es eigentlich keinen Grund für Reminiszenzen an analoge Filterbänke, die zwangsläufig sehr viel laxere Auslegungen in Form von grösseren Toleranzbereichen bedürfen, damit sie überhaupt mit vertretbarem Aufwand realisierbar sind. Die Forderung nach engeren Toleranzbereichen drängt sich umsomehr auf, als dass vermutet werden darf, dass die Einflüsse unterschiedlicher Filterbänke in anderen Messauswertung wie z.B. dem Sprachverständlichkeitsindex oder den diversen Energieverhältnismassen noch gravierendere Auswirkungen auf die Resultate haben können, als dies bei der Ermittlung der Nachhallzeit der Fall ist.

IR c: Einzelnes Sample (synthetisiert)

Ein einzelnes Sample stellt, im Rahmen des in der Digitaltechnik möglichen, einen angenäherten Delta-Impuls dar, dessen Nachhallzeit in allen Bändern Null beträgt. Allerdings ist jedes analoge Filter und auch dessen digitaler Repräsentant in Form einer rekursiven Architektur (IIR-Filter) von Phasenverschiebungen und damit einhergehenden Gruppenlaufzeitverzerrungen begleitet. Ursache sind die Ein- und Ausschwingvorgänge der verwendeten kapazitiven und induktiven Bauteile bzw. deren mathematischer Nachbildung. Dies wird oft als "Fehler" oder "Nachteil" verstanden, während es sich aber tatsächlich genau umgekehrt verhält: In einer minimalphasigen Kausalkette ist die Phasenverschiebung nicht ein unerwünschter Nebeneffekt, sondern die Ursache und zwingende Voraussetzung für den angestrebten Amplitudenfrequenzgang.

Die Ein- und Ausschwingvorgänge der Filter führen zu einem "Nachklingen". In der Praxis bedeutet dies, dass selbst bei vollständiger Abwesenheit eines Nachhalls oder einer Raumakustik, das Messgerät dennoch eine kurze Nachhallzeit anzeigt. Bei der Bestimmung von sehr kurzen Nachhallzeiten in Räumen führt dies zu einem - unter Umständen erheblichen - Messfehler. Neben internen Versuchen der Organisatoren des Ringversuchs, ist dies allgemein seit langem bekannt und in verschiedenen wissenschaftlichen Untersuchungen nachgewiesen worden, z.B. in [7, 8]. Ebenso verweisen verschiedene technische Empfehlungen, wie etwa die Technical Note 3276 der EBU [9] ausdrücklich auf diese Gefahr hin. Zulässige Grenzbereiche finden sich auch in der ISO 3382-1 [10] im Abschnitt 7.3 unter dem Titel "Untere Grenzwerte für zuverlässige Ergebnisse, bedingt durch das Filter und den Detektor".

Die zeitliche Länge der Filterabklingzeit wird massgeblich durch die Grenzfrequenzen (je tiefer, desto länger) und der Flankensteilheit (je steiler, desto länger) bestimmt. Deshalb ist zunächst anzunehmen, dass identisch implementierte Filterbänke auch zu identischen Filterabklingzeiten führen. Es gibt nun aber verschiedene Methoden, diese eigentlich zeitlich unerwünschte Signalausdehnung mittels Korrekturalgorithmen zu reduzieren. Eine der einfachsten und dabei dennoch effektivsten Methoden besteht darin, die Impulsantwort zeitlich rückwärts in die Filterbank einzuspeisen. Durch die Asymmetrie der Impulsantwort des minimalphasigen Filters selbst, reduziert sich die Abklingzeit dadurch erheblich [7].

"REW" ist in der Lage, sowohl nach einer klassischen Vorwärts-Analyse, als auch einer zeitlich inversen Variante zu filtern. Die deutlich unterschiedlichen Ergebnisse sind in Abbildung 4-18 zu finden, wobei die angegebenen "Nachhallzeiten" nun die reinen Filterabklingzeiten darstellen. Man beachte, dass die vertikale Skalierung, als auch die Angaben in den Datentabellen hier und auch in den folgenden Grafiken dieses Abschnitts in Millisekunden statt den üblichen Sekunden angegeben sind!

Filter Vorwärts- vs. Rückwärts-Analyse
Abb. 4-18: Filterabklingzeiten *REW" mittels zeitlicher Vorwärts- und Rückwärts-Analyse

Wie erwartet, ist zunächst zu sehen, dass die Filterabklingzeit zu tiefen Frequenzen hin generell ansteigt. In der Rückwärts-Variante ist dieser Effekt allerdings erheblich kleiner. Dies hört sich also nach einer guten Sache an und man möchte meinen, dass dies deshalb von allen Anbietern so gehandhabt wird. Dem ist aber nicht so; In den meisten Fällen wird die klassische Vorwärts-Analyse angewandt. Ein Grund dürfte sein, dass eine Rückwärtsanalyse zwar Vorteile bei der Filterlaufzeit bringt, der Preis den man dafür bezahlt allerdings in Artefakten besteht, auf die viele Auswertungsprozeduren überaus empfindlich reagieren und die Messergebnisse erheblich verfälschen können (z.B. EDT und STI). Es ist deshalb nicht sinnvoll, diese Funktion generell und dauerhaft zu implementieren. Wird sie in sehr seltenen Fällen, wie hier bei "REW", an- und abschaltbar gestaltet, liegt es in der Verantwortung des Anwenders eine Entscheidung zu treffen, wann er welches Verfahren anwendet.

Eine andere Variante, um die Filterabklingzeiten zu minimieren, besteht in der Verwendung einer Filterbank, die über eine kontinuierliche Wavelet-Transformation generiert wird [11]. Vermutlich gibt es derzeit allerdings keine kommerziell erhältliche Software, welche diese Methode nützt.

(Nachtrag April 2020) Verschiedene Autoren haben bereits Überlegungen dazu angestellt, ob man die Nachhallzeit statt über eine Schröder-Rückwärts-Integration nicht auch direkt aus den Abklingkurven bestimmen könnte, welche wiederum aus den Fouriertransformationen zeitlich schrittweiser verschobener Fensterfunktionen resultieren. Abgesehen davon, dass dies keine triviale Angelegenheit ist, wäre dieses Verfahren allerdings auch nicht mit ISO 3382 konform. Der grosse Vorteil liegt aber darin, dass man dann gänzlich auf Filter und die damit verbundenen Probleme verzichten könnte. Aufgrund des vorliegenden Artikels und in Abstimmung mit dessen Autoren, hat John Mulcahy, der Entwickler von "REW" nicht nur die bereits bestehenden Nachhallzeit-Algorithmen optimiert, sondern auch noch eine neue Methode entwickelt, welche die oben skizzierte Lösung verwendet und deshalb eine "filterfreie" Nachhallzeit in einer sehr hohen Frequenzauflösung ermitteln kann. Erste Versuche der Autoren mit dieser Methode stellen sich als sehr vielversprechend dar und legen nahe, dass sie in einigen Anwendungsfällen eine willkommene Ergänzung zu klassischen Verfahren bieten.

Die selbe Impulsantwort eines einzelnen Samples wurde auch mit allen anderen Softwares getestet. Einige weigerten sich allerdings eine Auswertung vorzunehmen, andere versagten ihren Dienst mindestens in einigen Bändern (ersichtlich anhand der Leerstellen in der folgenden Datentabelle, Abb. 4-19). Zu beachten ist ausserdem, dass die Ergebnisse teilweise Rundungsfehler enthalten: Dies liegt daran, dass die Softwares die Nachhallzeit in Sekunden ausgeben. Abhängig von den darstellbaren Nachkommastellen liessen sich die kurzen Angaben in Millisekunden nun mehr oder weniger genau abbilden. Da es hier aber mehr um das grundsätzliche Verhalten als um exakte Werte geht, spielt dies vorerst keine Rolle.

Auffällig verhielt sich "ARTA", wurde hier doch für die untersten 6 Oktaven (63 Hz bis 2 kHz) durchgängig die Zeit "Null" ausgewiesen. Dies hängt aber vermutlich mit einer spezifischen Einstellung zusammen (manuelle Eingabe des "Noise Tails"), die vom Akustiker vorgenommen wurde. Die Daten wurden bei der Auswertung deshalb nicht weiter berücksichtigt.

Ergebnis Nachhallzeit IR c Dirac
Abb. 4-19: T20 Ergebnisse Impulsantwort c

Mit Ausnahme von "MF Win" (blau-gepunktet), ist bei allen Softwares zu beobachten, dass die Filterlaufzeiten zu tiefen Frequenzen hin ansteigen. Dies legt nahe, dass es sich in den meisten Fällen um minimalphasige, rekursive IIR-Filter handelt. Die unterschiedlichen Werte sind dann primär darauf zurückzuführen, dass sich die Flankensteilheiten bzw. die Verläufe in den Sperrbereichen der Filter unterscheiden.

Dies gilt allerdings nicht für "ReflPhinder"" (dunkelgelb), bei der die Möglichkeit besteht mit einer minimalphasigen oder einer linearphasigen Variante zu filtern, wobei hier und auch bei der Auswertung der übrigen Impulsantworten die linearphasige Filterbank eingesetzt wurde. Offensichtlich sind die Bandpasse aber zeitlich nicht kompensiert, weshalb die Filterabklingzeiten sogar deutlich am längsten ausfallen!

Gänzlich anders als die Mitbewerber verhält sich wie bereits erwähnt "MF Win" (blau-gepunktet), welche durchgängige Zeiten von 10 oder 20 ms angibt. Es ist ziemlich offensichtlich, dass hier ein Korrekturalgorithmus eingesetzt wird.

Man mag sich nun vielleicht fragen, wie solche, generell doch sehr kurze Filterabklingzeiten überhaupt zu einem Messfehler führen können. In extrem gut kontrollierten Umgebungen, wie beispielsweise Tonstudioregien oder (Heim-)Kino-Applikationen kann ein professionell umgesetztes Akustikkonzept aber durchaus Bass-Nachhallzeiten aufweisen, die in die Nähe der Filterlauflängen kommen. Zudem ist damit zu rechnen, dass die Filter das Ergebnis bereits beeinflussen, wenn sie einen deutlich grösseren zeitlichen Abstand zu den zu messenden Nachhallzeiten haben.

Bedacht werden muss auch, dass sich die dargestellten Ergebnisse auf Oktavbänder beziehen. Bei Terzband-Zerlegungen entstehen aufgrund der erheblich steilflankigeren Filter auch deutlich grössere Filterabklingzeiten, die sich gegenüber den gezeigten Daten ohne weiteres verdoppeln, verdreifachen oder noch stärker zunehmen können.

Es sei an dieser Stelle noch auf einen gänzlich anderen, damit aber zusammenhängenden Aspekt verwiesen: Es ist womöglich so (und durch Feldstudien der Versuchsleiter auch intern dokumentiert), dass bei sehr kurzen Nachhallzeiten nicht mehr die Filterbänke das limitierende Element sind, sondern die zeitlichen Ein- und Ausschwingvorgänge von Lautsprechern und Mikrofonen. Diese Einflüsse können zwar prinzipiell mittels einer inversen Faltung aus der Messung entfernt werden. Aufgrund des doch recht hohen Aufwands, dürfte dies allerdings in der Praxis und ausserhalb einer Laborumgebung nur äusserst selten gemacht werden. Dennoch werden die Ergebnisse sicher nicht besser, wenn sich zu diesen nur schwer zu kontrollierenden zeitlichen Verzerrungen der Schallwandler zusätzlich noch die Filterabklingzeiten hinzuaddieren.

Fehlerhafte Ermittlung der Oktavband-Werte

Im Zusammenhang mit den Filterbänken muss im Hinblick auf die Genauigkeit und Vergleichbarkeit der Nachhallzeit-Ergebnisse noch auf einen anderen Punkt verwiesen werden: Bei der stichprobenweisen Durchsicht der Rohdaten mehrerer Teilnehmer des Hauptversuchs in einer Halle (Teil 1 dieses Berichts) wurde festgestellt, dass die eingereichten Resultate in Oktaven teilweise auf der Messung und Auswertung von Terzbändern beruhten. Dies ist aber "unzulässig" und beinhaltet einen potenziellen Messfehler: Im Wesentlichen sind zwei Wege denkbar, um von Terzband auf Oktavbandwerte zu kommen (aber beide sind fehlerbehaftet): Im einfachen Fall werden nur die Terzbandergebnisse der mit den Oktavmittenfrequenzen korrespondierenden Bänder verwendet. Dies scheint generell wenig sinnvoll und potentiell stark fehleranfällig. Naheliegender scheint es deshalb zunächst, die Werte der drei zu einer Oktave gehörenden Terzen zu mitteln. Auch dies ist aber äusserst kritisch zu sehen: Denn die Abklingvorgänge von drei einzelnen Bändern und deren Mittelung ist nicht zwangsläufig gleichbedeutend mit einem Abklingvorgang über die gesamte Bandbreite.

Hinzu kommt auch noch, dass die Bandbegrenzung zu den Frequenz-Rändern hin bei Terzen erheblich schärfer ausfällt als in Oktavbändern und alleine schon dadurch nicht zwangsläufig identische Ergebnisse erwartet werden können (also z.B. auch dann nicht, wenn die drei zu einer Oktave gehörenden Terzen alle identische T20/30-Zeiten beinhalten würden). Exemplarisch wird dies anhand von Abbildung 4-20 dargestellt: Die rote Kurve zeigt das 1 kHz-Oktavband der Filterbank, welches eine sehr viel geringere Flankensteilheit aufweist, als die drei korrespondierenden Terzen. Der Durchlassbereich ist zwar sehr ähnlich, der Sperrbereich unterscheidet sich aber deutlich. Wenn zwischen den einzelnen Terzen/Oktaven nun grosse Differenzen in der Nachhallzeit auftreten, werden dadurch bei einer Generierung der Oktavwerte aus den drei Terzen womöglich andere Nachhallzeiten resultieren, als bei Verwendung einer Oktav-Filterbank, da das Übersprechen zwischen den einzelnen Bändern und damit die gegenseitige Beeinflussung unterschiedlich ausfällt. Noch verstärkt wird dieser Effekt, wenn zwischen den einzelnen Bändern Pegelunterschiede auftreten.

Filtervergleich Oktaven und Terzen
Abb. 4-20: Filtervergleich 1 Oktave vs. 3 Terzen

Mit anderen Worten also, ist es zwingend notwendig, dass für die Oktav- und die Terzband-Zerlegung zwei separate Filterbänke verwendet werden. Es ist nicht ganz sicher bzw. wurde im Rahmen dieses Versuchs nicht näher begutachtet, ob dies wirklich von allen Algorithmen entsprechend gehandhabt wird.

Fazit und Forderungen

In diesem Bericht wurde dargelegt, welche softwarebedingten Einflussfaktoren potentiell die Ergebnisse der Nachhallzeit beeinflussen, wenn alle anderen Variablen ausgeschaltet werden. Anhand von fünf Impulsantworten wurden 13 Softwares unterschiedlicher Hersteller geprüft. Die Ergebnisse dieser Prüfungen und die theoretischen Darlegungen zeigen, dass die verwendeten Algorithmen einen erheblichen Einfluss auf das Resultat haben können, besonders wenn die gemessenen Impulsantworten nicht "perfekt" sind. Offensichtlich ist es somit nicht in allen Fällen ohne weiteres möglich, die Nachhallzeiten verschiedener Softwares - und damit auch die Messungen verschiedener Akustiker - miteinander zu vergleichen.

Ein erfahrener Akustiker wird vermutlich eine grosse Zahl der hier dokumentierten Abweichungen minimieren können, wenn er statt einer automatischen Auswertung zu vertrauen, die Abklingkurven überprüft und die Regressionsgeraden nötigenfalls manuell anpasst (was im Rahmen dieses Tests aber nicht gefragt war). Dies setzt allerdings entsprechendes Hintergrundwissen und Erfahrung voraus und die Softwares müssen überhaupt die Möglichkeit einer solchen Analyse und Bearbeitung bieten, was längst nicht immer der Fall ist. Immerhin sind in einigen Softwares Detektoren integriert, welche auf potentiell fehleranfällige Daten hinweisen oder deren Ausgabe gar grundsätzlich unterdrücken.

Letztlich liegt es am Akustiker, zu wissen, welche Einschränkungen die von ihm verwendeten Algorithmen haben können und wann die Grenzen der Genauigkeit und der Zuverlässigkeit verlassen werden. Erfahrungsgemäss vertrauen jedoch die meisten Anwender den automatisch generierten Werten und überprüfen deren Validität viel zu selten.

Umsomehr sind aber auch die Hersteller in der Pflicht, die sicherstellen müssen, dass ihre Produkte ordnungsgemäss und normenkonform arbeiten. Es bestehen - nicht erst durch die Resultate dieses Ringversuchs gestützt - berechtigte Zweifel, ob dies immer der Fall ist. Mindestens aber konnte belegt werden, dass die Algorithmen (zu!) unterschiedlich arbeiten.

Nach einer sorgfältigen Abwägung aller Argumente, wurde von den Autoren entschieden, auf die in solchen Untersuchungen übliche Anonymisierung zu verzichten. Die Hauptbegründung liegt darin, dass die Differenzen in einem professionellen Kontext inakzeptabel sind und diese Problematik inzwischen seit mehreren Jahrzehnten(!) ein Thema in Fachkreisen ist. Die teilweise überraschend grossen Differenzen sind Diskussionsgegenstand jedes den Autoren bekannten Ringversuchs aus der Vergangenheit (einige Studien sind in den Referenzen erwähnt), wobei auch mehrfach Softwares getestet wurden, die auch in diesem Test wieder vorkamen. Aufgrund der Anonymisierung der Ergebnisse scheinen sich die Hersteller bisher aber nicht zuständig gefühlt zu haben, für eine Angleichung zu sorgen, zumal der Druck Seitens der Anwender fehlt, da diese gar nicht wissen, wie "ihre" Software jeweils abschnitt.

Der hier vorgestellte Test erhebt nicht den Anspruch, sich generalisieren zu lassen. Daraufhin waren weder das Testprozedere noch die ausgewählten Impulsantworten ausgelegt. Die Ergebnisse legen aber nahe, dass der Bedarf an einem ausführlichen Audit besteht, um am Ende die Differenzen verringern zu können oder damit mindestens eine klare Aussage gemacht werden kann, welche Softwares - unter der Anlegung welcher Kriterien auch immer - für professionelle Messungen empfehlenswert sind und welche nicht.

Der Vollständigkeit halber sei auch erwähnt, dass in dieser Berichtsserie verschiedentlich darauf verwiesen wurde, dass sich auch Differenzen zwischen den Ergebnissen von Handgeräten ergeben. Man kann deshalb mit sehr hoher Wahrscheinlichkeit davon ausgehen, dass auch ein umfassender Vergleich von Hardware-Mess-Systemen inakzeptable Differenzen ergeben würde.

Wie in dieser Berichtsserie aufgezeigt wurde, gibt es eine Vielzahl von Einflüssen, welche zu Messunsicherheiten führen können. Einige liegen in der grundlegenden Physik begründet und lassen sich deshalb oft nicht ohne weiteres wesentlich reduzieren. Hingegen ist heutzutage nicht mehr nachvollziehbar begründbar, weshalb im digitalen Zeitalter, keine soliden und eng gefassten Qualitätskriterien an die Algorithmen angelegt werden sollen.

Das Naheliegendste wäre natürlich, dass man das bestehende Normenkonstrukt der ISO 3382 verwendet, um die Hersteller in die Pflicht zu nehmen. Normenprozesse sind allerdings schwerfällig und auch von "politischen" und kommerziellen Interessen beeinflusst, so dass sie nicht immer den aktuellen Stand der Technik abbilden oder mit Blick auf die Praxis ausgearbeitet werden. Durch die intransparenten Strukturen (unter dem Deckmantel des Datenschutzes ist es alleine schon ein streng gehütetes Geheimnis, wer überhaupt an den Normen mitarbeitet und darauf Einfluss nimmt), wird dies noch zusätzlich begünstigt. Es ist indessen fragwürdig, in einer Norm auf der einen Seite teilweise weitgehend unbedeutende Details zu regeln, wenn auf der anderen Seite bezüglich den Auswertungsalgorithmen derart viel Spielraum besteht.

Es stellt sich deshalb die Frage, ob nicht Anwender, Fachverbände und Hersteller aktiv werden müssten, um die Messunsicherheiten zu reduzieren. Andernfalls unterminiert man mit vollem Wissen die Qualität akustischer Messungen und führt sie teilweise ad absurdum.

(Nachtrag April 2020) Der vorliegende Artikel hat inzwischen einige Hersteller dazu bewogen, die Auswertungsalgorithmen zu verifizieren und anzupassen. In mindestens zwei Fällen (REW und SATlive) hat dies bereits zu Änderungen geführt, die in den aktuellen Programmversionen berücksichtigt wurden. Beide Entwickler sind dafür bekannt, Verbesserungsvorschläge von Nutzern Ernst zu nehmen und ihre Produkte in erstaunlich hoher Kadenz mit neuen Funktionen und Verbesserungen zu versehen.

Referenzen

  • [1] Katz, International Round Robin on Room Acoustical, Impulse Response Analysis Software 2004, Acoustics Research Letters Online
  • [2] Cabrera et al., Calculating Reverberation Time from Impulse Responses: A Comparison of Software Implementations, Australian Acoustical Society 2016
  • [3] Guski et al., Measurement Uncertainties of Reverberation Time caused by Noise, AIA-DAGA 2013 Merano
  • [4] Alvarez-Morales, Acoustic Characterisation by Using Different Room Acoustics Software Tools: A Comparative Study, Acta Acustica, Vol. 102, 2016
  • [5] IEC 61260-1:2014, Elektroakustik - Bandfilter für Oktaven und Bruchteile von Oktaven - Teil 1: Anforderungen
  • [6] Venturi et al., On the effects of preprocessing of impulse responses in the evaluation of acoustic parameters on room acoustics, Journal of the Acoustical Society of America 133, 2013
  • [7] Rasmussen et al., Design and Measurement of Short Reverberation Times at Low Frequencies in Talk Studios, AES New York, 1989
  • [8] Nelson, Impulse Response of Very Small Rooms, AES San Francisco, 1992
  • [9] EBU Tech. 3276 - 2nd edition, Listening conditions for the assessment of sound programme material: monophonic and two-channel stereophonic, 1998
  • [10] DIN EN ISO 3382-1:2009-10, Akustik - Messung von Parametern der Raumakustik - Teil 1: Aufführungsräume
  • [11] Sobreira Seoane et al., Do wavelet filters provide more accurate estimates of reverberation times at low frequencies, Inter-Noise Hamburg, 2016
  • [12] Vorländer et al., Suggestions for Revision of ISO 3382, DAGA 2016

Fragen, Kommentare, Newsletter-Anmeldung

Hat Ihnen dieser Artikel gefallen? Möchten Sie mehr davon? Haben Sie Anmerkungen oder Fragen? Schreiben Sie mir eine E-Mail: info@zehner.ch oder füllen Sie untenstehendes Formular aus. Gerne informiere ich Sie mit meinem Newsletter auch über Überarbeitungen und neue Artikel auf diesen Seiten.

Warten Sie nach dem Absenden des Formulars, bis die Bestätigungsseite erscheint!