DA Myung.pdf - Erich-Thienhaus-Institut - Hochschule für Musik ...
DA Myung.pdf - Erich-Thienhaus-Institut - Hochschule für Musik ...
DA Myung.pdf - Erich-Thienhaus-Institut - Hochschule für Musik ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Diplomarbeit<br />
Untersuchungen zum Klang digitaler Mikrofone:<br />
Zum Einfluss der AES42-Betriebsmodi<br />
Je-Young <strong>Myung</strong>, HfM Detmold, <strong>Erich</strong>–<strong>Thienhaus</strong>–<strong>Institut</strong><br />
Studiengang: <strong>Musik</strong>übertragung<br />
Abgabetermin: 27. März 2007<br />
Erstgutachter: Prof. Thomas Görne, HfM Detmold<br />
Zweitgutachter: Stephan Peus, Entwicklung der Georg Neumann GmbH
Inhaltsverzeichnis<br />
1 Einleitung 2<br />
2 Technischer Hintergrund 4<br />
2.1 Digitale Übertragung und Taktsynchronisierung . . . . . . . . . . . . . 4<br />
2.2 Grundlagen der Abtastratenwandlung . . . . . . . . . . . . . . . . . . . 5<br />
2.3 Erläuterungen zur verwendeten Technik . . . . . . . . . . . . . . . . . . 8<br />
2.3.1 Digitale Mikrofone . . . . . . . . . . . . . . . . . . . . . . . . . 8<br />
2.3.2 Die verwendeten Geräte mit Abtastratenwandler . . . . . . . . . 10<br />
2.4 Messungen mit Testsignalen . . . . . . . . . . . . . . . . . . . . . . . . 12<br />
3 Vorüberlegungen und Gedanken zum Hörtest 14<br />
3.1 Forced-Choice und Signalentdeckungstheorie . . . . . . . . . . . . . . . 15<br />
3.2 Aufnahmen <strong>für</strong> den Hörtest . . . . . . . . . . . . . . . . . . . . . . . . 18<br />
3.3 Kriterien zur Bewertung . . . . . . . . . . . . . . . . . . . . . . . . . . 19<br />
4 Versuchsaufbau und -durchführung 20<br />
4.1 Versuchsaufbau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20<br />
4.2 Versuchsdurchführung . . . . . . . . . . . . . . . . . . . . . . . . . . . 24<br />
4.3 Vortests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25<br />
5 Auswertung 25<br />
5.1 Allgemeines zur Auswertung des Hörtests . . . . . . . . . . . . . . . . . 25<br />
5.2 Deskriptive Auswertung . . . . . . . . . . . . . . . . . . . . . . . . . . 26<br />
5.3 Interpretative Auswertung . . . . . . . . . . . . . . . . . . . . . . . . . 39<br />
6 Fazit 44<br />
Abbildungsverzeichnis 46<br />
Tabellenverzeichnis 46<br />
Literatur 47<br />
1
1 Einleitung<br />
In den Aufnahmestudios setzt sich die digitale Audiotechnik immer mehr durch. Der<br />
Vorteil von miteinander vernetzten digitalen Geräten ist, dass zwischen diesen die feh-<br />
lerbehaftete Wandlung von analogen zu digitalen Signalen und umgekehrt entfällt.<br />
Jedoch muss bei der Vernetzung von digitalen Geräten eine saubere Lösung der Syn-<br />
chronisation jedes einzelnen Gerätes realisiert werden, um Synchronisationsprobleme<br />
und den dadurch verursachten Qualitätsverlust zu vermeiden.<br />
Relativ neu in der digitalen Audiobearbeitungskette ist das digitale Mikrofon. Das<br />
analoge Signal wird im Mikrofon selbst in ein digitales Signal gewandelt, so dass am<br />
Ausgang des Mikrofons ein digitales Signal im AES42-Standard (s.u.) anliegt. Dadurch<br />
können Daten- und Qualitätsverluste in der weiteren Audiosignalverarbeitung mini-<br />
miert werden:<br />
• Durch das Wegfallen von zusätzlichem Mikrofon-Vorverstärker und AD-Wandler,<br />
die <strong>für</strong> die Qualität des noch zu verarbeitenden Audiosignals entscheidend sind,<br />
kann der Datenverlust verringert werden.<br />
• Durch die vollständig digitale Kette in der Audiosignalverarbeitung kann auch<br />
bei Verwendung weniger hochwertigen Equipments mit geringem Qualitätsverlust<br />
des Audiosignals gearbeitet werden, da die AD-Wandlung entfällt.<br />
Die digitalen Mikrofone müssen wie alle digitalen Geräte mit dem Empfangsgerät<br />
synchronisiert werden. Zur Lösung des Synchronisationsproblems der digitalen Mikro-<br />
fone wurde im Jahr 2001 von der Audio Engineering Society das Format AES42 1 stan-<br />
dardisiert. Der AES42-Standard erlaubt zwei technische Wege <strong>für</strong> die Synchronisation<br />
der digitalen Mikrofone:<br />
• Mode 1: der interne Taktgenerator arbeitet asynchron oder<br />
• Mode 2: der interne Taktgenerator arbeitet synchron, indem er durch die Über-<br />
tragung der extern zugeführten Word Clock stabilisiert wird (siehe Kapitel 2.3.1).<br />
Bei der ersten Möglichkeit Mode 1 ist ein zusätzlicher Abtastratenwandler (eng-<br />
lisch: Sample Rate Converter, SRC) am Eingang des Anschlussgerätes des digitalen<br />
Mikrofons notwendig. Ohne diesen käme es zu Taktsynchronisationsfehlern, die durch<br />
beispielsweise Knistern im Audiosignal oder Dropouts 2 zu hören sein würden. Ein Sam-<br />
ple Rate Converter (SRC) führt eine zusätzliche Datenwandlung durch (siehe Kapitel<br />
2.2).<br />
Die Abtastratenwandlung ist in jedem Fall eine zusätzliche Fehlerquelle, insbesondere<br />
1 Der AES42-Standard wird im Kapitel 2.3.1 genauer erläutert.<br />
2 fehlende Samples<br />
2
wenn mehrere Mikrofone (bereits bei einem Stereopaar) gleichzeitig in Betrieb ge-<br />
nommen werden. Zwischen den beiden Mikrofonen, die in Mode 1 betrieben werden,<br />
kommt es durch den intern freilaufenden Taktgenerator zum Auseinanderdriften des<br />
Takts, d.h. die Anzahl der pro Sekunde generierten Samples am Mikrofon 1 und 2 ist<br />
nicht identisch. Ein exaktes Generieren der Abtastrate ist <strong>für</strong> freilaufende Taktgenera-<br />
toren nicht möglich. Die Abtastrate verändert sich ständig, da sie nicht stabil ist. Dies<br />
kann zu Jitter, also Zeitfehlern in Abfolge der Samples führen. Das Jitter kann eine<br />
instabile Taktgeneration verursachen, wodurch das Ausgangssignal verzerrt sein kann<br />
[3]. Um diese Fehler zu vermeiden, ist es die beste Lösung, die digitalen Mikrofone vom<br />
Anschlussgerät per externer Word Clock Leitung synchronisieren zu lassen (Mode 2),<br />
so dass die Signale beider Mikrofone (1 und 2) digital phasenstarr gekoppelt sind.<br />
Die Qualität des Audiosignals in Mode 1 ist zudem abhängig von der Qualität des<br />
jeweiligen Abtastratenwandlers. Sind die heutzutage in professionellen Studios verwen-<br />
deten SRC qualitativ so gut, dass man den technisch bedingten Qualitätsverlust des<br />
Audiomaterials bei Verwendung dieser SRC auditiv nicht wahrnehmen kann?<br />
Die zentrale Fragestellung in dieser Arbeit lautet:<br />
Ist ein Unterschied zwischen den Aufnahmen mit digitalen Mikrofonen in verschiedenen<br />
AES42-Modi auditiv eindeutig festzustellen? Inwieweit beeinflussen die angeschlosse-<br />
nen digitalen Geräte, insbesondere SRC die Klangqualität der digitalen Mikrofone?<br />
Wird die Verwendung von digitalen Mikrofonen die Qualität des zu verarbeitenden<br />
Audiomaterials unabhängig von weiteren angeschlossenen digitalen Geräten im Studio<br />
gemacht? Ist dies ein entscheidender Vorteil des digitalen Mikrofons im Vergleich zum<br />
analogen Mikrofon?<br />
Im folgenden soll am Beispiel der Neumann-Mikrofone durch Hörtests mit Hilfe<br />
von Testpersonen, die im kritischen Hören geübt sind, festgestellt werden, ob man den<br />
Unterschied zwischen den Aufnahmen in Mode 1 und 2 tatsächlich hören kann; ob also<br />
ein SRC in der Audiosignalverarbeitungskette zusätzlich verwendet wurde oder nicht.<br />
Um diesen klanglichen Unterschied, der durch die Abtastratenwandlung in Echtzeit<br />
(die nicht fehlerfrei funktionieren kann; siehe Kapitel 2.2) am Empfangsgerät verur-<br />
sacht wird, im Hörtest richtig darstellen zu können, müssen die Beispiele in beiden<br />
Modi parallel und gleichzeitig aufgezeichnet werden. Zur Darstellung des Synchroni-<br />
sationsproblems ist die mehrkanalige Aufzeichnung des Signals ausschlaggebend. Bei<br />
der Verwendung mehrerer Mikrofone in Mode 1 ergibt sich, wie bereits oben erwähnt,<br />
das Problem des Auseineinanderdriftens des instabilen, freilaufenden Taktgenerators<br />
zwischen den Mikrofonen. Die Anzahl der pro Sekunde generierten Samples stimmt in<br />
diesem Fall zwischen den Mikrofonen nicht überein. Das Mikrofon 1 könnte z.B. mit<br />
44.002 Samples pro Sekunde getaktet sein und das Mikrofon 2 mit 43.997 Samples pro<br />
Sekunde. Die dann benötigte neue Abtastung der Signale mit dieser unterschiedlichen<br />
Anzahl der Samples durch die SRC am Empfangsgerät verursacht eine technisch nach-<br />
3
weisbare Veränderung des Signals.<br />
Wird die mehrkanalige Aufnahme in Mode 2 betrieben, sind die Signale der Kanäle<br />
digital phasenstarr gekoppelt, so dass es zu keinem Taktproblem führen kann.<br />
Dieser technisch wesentliche Unterschied kann nur durch eine gleichzeitige, parallele<br />
und mehrkanalige Aufzeichnung (mindestens stereophon) einer Quelle (z.B. Instru-<br />
mente oder Sprache) realisiert werden. Dies wird hier mit zwei verschiedenen Mikro-<br />
fonpaaren umgesetzt, d.h. es werden zwei verschiedene Stereopaare (insgesamt vier<br />
Mikrofone) aufgestellt.<br />
Die verlangte Situation kann also nur durch die parallele Signalaufzeichnung in Mode<br />
1 und 2 in Echtzeit erreicht werden. Die Idee, die Aufnahme mit einem Mikrofon-<br />
paar in Mode 2 durchzuführen und anschließend das in Mode 2 aufgezeichnete Signal<br />
über einen SRC zu schicken, würde das Synchronisationsproblem des Mode 1 in ei-<br />
ner Live-Aufnahme Situation nicht nachstellen können, da das bereits in Mode 2 auf-<br />
gezeichnete, verwendete Signal kein Taktproblem enthält. Das Signal kann ebenfalls<br />
nicht von einem Mikrofonpaar aufgezeichnet und dann gesplittet werden, da die Infor-<br />
mation des gewählten Synchronisationsmodes über die AES42 Leitung zum Mikrofon<br />
übertragen wird. Über diese Leitung können selbstverständlich nicht beide Modi auf<br />
einmal übertragen werden.<br />
2 Technischer Hintergrund<br />
2.1 Digitale Übertragung und Taktsynchronisierung<br />
Bei der digitalen Übertragung von Daten in der Audiotechnik ist die Synchronisierung<br />
der miteinander verbundenen digitalen Geräte unumgänglich. Um verschiedene digitale<br />
Studiogeräte in ihrer Übertragungskette fehlerfrei bedienen zu können, müssen diese<br />
in einem gleichen synchronen Takt betrieben werden. Geschieht dies nicht und läuft<br />
jedes digitale Gerät mit der eigenen intern generierten Taktfrequenz, kommt es zu Da-<br />
tenübertragungsfehlern wie z. B. Dropouts oder Glitches 3 [3], die man in Form von<br />
Knacksern oder Amplitudenschwankungen hören kann.<br />
Die Taktsynchronisierung in der digitalen Übertragungskette kann folgendermaßen rea-<br />
lisiert werden:<br />
• durch einen Wordclock-Master in Form des ersten Gerätes in der Übertragungskette,<br />
der allen weiteren Anschlussgeräten den Takt über selbsttaktende Schnittstellen,<br />
wie z.B. AES3, vorgibt<br />
• durch einen zentralen Wordclock-Generator, der allen Geräten den Takt vorgibt.<br />
Bei dieser Lösung sind alle Geräte ” sternförmig“ mit dem Wordclock-Generator<br />
verbunden. Da<strong>für</strong> muss jedoch gewährleistet sein, dass jedes Gerät einen externen<br />
3 Diskontinuitäten im Ampiltudenverlauf<br />
4
Wordclock-Eingang besitzt (z.B. BNC Leitung), was in der Realität oft nicht<br />
zutrifft.<br />
Sind beide Möglichkeiten ausgeschlossen, müssen die Geräte trotzdem mit der sel-<br />
ben synchronen Taktfrequenz laufen. Dies kann durch eine zusätzliche Abtastraten-<br />
wandlung am Eingang des jeweiligen Anschlussgerätes erfolgen. Einige digitale Misch-<br />
pulte bieten daher einen SRC an den digitalen Eingangsanschlüssen in Form einer<br />
zusätzlichen ” digitalen I/O Karte“ an. Eine Abtastratenwandlung ist jedoch eine hin-<br />
zukommende Fehlerquelle, denn die Daten werden hierbei ein weiteres, zusätzliches<br />
Mal be- und verarbeitet. Bei schlechter Qualität des SRC (hierauf wird im nächsten<br />
Unterkapitel näher eingegangen) kann es zu Audioqualitätsverlusten kommen.<br />
2.2 Grundlagen der Abtastratenwandlung<br />
In der heutigen Studiotechnik gibt es in verschiedenen Bereichen der Medienwelt histo-<br />
risch und entwicklungstechnisch bedingt zahlreiche und verschiedene Abtastraten: 44.1<br />
kHz bei CD’s, 48 kHz in den Rundfunkanstalten im Zusammenhang mit der Bildtech-<br />
nik, 32 kHz in Broadcast etc. Es kann bei dieser Vielzahl von gängigen Abtastraten<br />
erforderlich sein, mehrfache Abtastratenwandlungen in der Audioverarbeitungskette<br />
durchzuführen.<br />
Es gibt drei verschiedene Fälle der Abtastratenwandlung. Die Abtastratenwandlung<br />
um einen<br />
1. ganzzahligen Faktor: z. B. von 48 kHz auf 96 kHz (a)<br />
2. rationalen Faktor: z. B. von 48 kHz auf 32 kHz (b)<br />
3. reellwertigen Faktor: z. B. von 44.1 kHz auf 48 kHz (c)<br />
In den beiden ersten Fällen kann die Wandlung durch Oversampling und anschlie-<br />
ßend ganzzahlige Dezimation fehlerfrei ausgeführt werden. Im dritten Fall jedoch ist die<br />
Wandlung komplexer. Dieser Fall ermöglicht aber die Abtastratenwandlung <strong>für</strong> jedes<br />
Verhältnis zwischen der Eingangs- und Ausgangsabtastrate. Daher ist diese Art der<br />
Wandlung in der Praxis weit verbreitet.<br />
In Prinzip funktioniert der SRC gemäß der dritten Art, die auch als ” asynchrone Ab-<br />
tastratenwandlung“ bezeichnet wird, folgendermaßen:<br />
Das Eingangssignal mit seiner Abtastrate wird durch im Idealfall unendlich hohe In-<br />
terpolation überabgetastet (Oversampling), so dass daraus durch die darauf folgende<br />
Dezimation jede beliebige Abtastrate am Ausgang realisiert werden kann. Zum Schluss<br />
wird das Ausgangssignal mit der neuen Abtastrate durch einen linearphasigen FIR-<br />
Filter (Tiefpassfilter) geschickt, damit die Aliasingfehler herausgefiltert werden.<br />
Die Qualität des Abtastratenwandlers hängt von der Höhe der Interpolation ab: Je<br />
höher desto besser die Qualität. Im Idealfall wäre die Interpolation unendlich hoch,<br />
5
Abbildung 1: Veranschaulichung der oben genannten drei Fälle der Abtastratenwand-<br />
lung (aus [1] S. 138)<br />
was einer Analogwandlung gleich käme. Die asynchrone Abtastratenwandlung kann al-<br />
so auch mit D/A- und A/D-Wandlung ausgeführt werden. Da dies aber sehr aufwendig<br />
ist, bleibt man in der digitalen Ebene und gibt sich mit einer begrenzten Höhe der<br />
Interpolation zufrieden. Die notwendigen Werte lägen zwischen 16 Bit und 24 Bit. Da<br />
es jedoch zu einer riesigen Datenmenge führen würde, pro Sample 2 24 Abtastwerte zu<br />
produzieren, hat man ein Verfahren entwickelt, das ” Segment-Interpolation“ genannt<br />
wird. Wenn das umzurechnende Abtastraten-Verhältnis vorher bekannt ist und das<br />
Verhältnis konstant bleibt, kann man die Zeitpunkte der zur Wandlung benötigten<br />
Werte errechnen und damit nur diese Werte berechnen lassen. Somit werden nur die<br />
ausschlaggebenden Werte berechnet und die Datenmenge vergrößert sich nicht unnötig.<br />
In der Realität jedoch bleibt das Verhältnis zwischen der Eingangs- und Ausgangsab-<br />
tastrate nicht korrekt konstant, da es sich um eine Wandlung im reellwertigen Faktor<br />
handelt. Um den Jitterfehler zu verringern, der durch neues Abtasten zum falschen<br />
Zeitpunkt zustande kommt, wird ein Durchschnittswert des Verhältnisses aus einer<br />
bestimmten Zeiteinheit (mehrere Perioden) stetig berechnet, mit dem der Wandler ar-<br />
beitet. Die Qualität der Wandlung ist abhängig von der Stärke der Mittelung: Je stärker<br />
die Mittelung desto Jitter-unempfindlicher der Wandler. Die zunehmende Stärke der<br />
Mittelung bringt jedoch eine größere Latenz mit sich. Zur Berechnung des Mittelungs-<br />
wertes wird ein Speicher namens FIFO (First In First Out) benötigt, in dem der Mit-<br />
telungswert zwischengespeichert wird. Wenn die Zeiteinheit der Mittelung groß ist,<br />
6
wodurch der Jitterfehler verringert wird, benötigt man einen größeren FIFO-Speicher.<br />
Hierbei muss man dann allerdings die wachsende Latenz in Kauf nehmen. Umgekehrt<br />
reicht ein kleiner FIFO-Speicher aus, wenn die Zeiteinheit kleiner ist. Dann nimmt zwar<br />
die Latenz ab, aber der Wandler reagiert empfindlicher auf Jitterfehler [4].<br />
An dieser Stelle soll der Begriff Jitter im allgemeinen erklärt werden, denn dies ist<br />
der ausschlaggebende Fehler, der sich bei der qualitativ schlechten Abtastratenwand-<br />
lung hörbar bemerkbar machen kann.<br />
Der Begriff Jitter stammt aus der englischen Sprache und bedeutet Fluktuation oder<br />
Schwankung. Jitter ist ein Zeitfehler, der durch ” falsches“ Abtasten (Fluktuation oder<br />
Schwankung in der zeitlichen Komponente der Abtastung von Audiosignalen) entsteht.<br />
Hierbei handelt es sich sowohl um die Abtastung von analogen als auch digitalen Signa-<br />
len: Es kommt sowohl in der A/D- und D/A-Wandlung, als auch in der Abtastraten-<br />
wandlung vor. Jitter kann bei jeder neuen Abtastung vorkommen. Mit der ” falschen“<br />
Abtastung ist die Ungenauigkeit in der zeitlichen Abfolge der Abtastung gemeint, d.h.<br />
die Abtastung geschieht an falschen Stellen des abzutastenden Signals (aufgrund von<br />
Schwankungen in der Zeit des Abtastens) und es kommt so zur Verfälschung des ur-<br />
sprünglichen Signals. Dieser Fehler bildet sich sowohl in der Amplitude als auch in der<br />
Phasenlage und kann zu hörbaren Artefakten führen.<br />
Abtastung mit Jitter korrekte Übertragung verzerrtes Ausgangssignal<br />
korrekt abgetastetes Signal<br />
t t t<br />
t<br />
Jitter bei der Übertragung verzerrtes Ausgangssignal<br />
t t<br />
Abbildung 2: Veranschaulichung von verzerrtem Signal durch Jitter (nach [3] S. 223)<br />
Hier wollen wir das Augenmerk auf den Fall der Abtastratenwandlung richten. Die<br />
Jitterempfindlichkeit wird mit zunehmender Höhe der Überabtastung reduziert, da sich<br />
mit sehr hoher Überabtastung so gut wie jede neue Abtastrate mit weniger Ungenauig-<br />
keiten bzw. weniger Abweichung von neuen gewünschten Abtaststellen erstellen lässt.<br />
Die Methode der Mittelung des Eingangs- und Ausgangsabtastraten-Verhältnisses, die<br />
zur Stabilisierung des idealerweise nicht schwankenden Takts benötigt wird, wurde im<br />
Kapitel 2.2 näher erläutert.<br />
7
2.3 Erläuterungen zur verwendeten Technik<br />
2.3.1 Digitale Mikrofone<br />
Die ” Georg Neumann GmbH“ stellte zwei Stereo-Paare des Typs digitaler Mikrofone<br />
KMD aus der Serie ” Blue Diamonds“ mit Nieren-Charakteristik <strong>für</strong> die Aufnahmen<br />
des Audiomaterials <strong>für</strong> den Hörtest zur Verfügung. Diese Mikrofone haben die identi-<br />
sche Mikrofonkapsel wie die Nierenmikrofone der analogen Serie KM 140.<br />
Zu je zwei Mikrofonen gehört ein ” Digital Microphone Interface DMI-2“ , an das die<br />
Mikrofone direkt mit einem XLR3 Kabel angeschlossen werden. Das Interface bietet<br />
je zwei einzelne XLR Eingangs- und Ausgangssteckfelder an. Jedes Mikrofon sendet<br />
ein digitales Signal im AES42 Datenformat an das Interface und das Interface wieder-<br />
um sendet Informationen wie z.B. die digitale Phantomspeisung und den Synchroni-<br />
sationsmode zum Mikrofon über den AES42-2001 Standard. Das Interface dient zur<br />
Umwandlung des AES42 Datenformats in ein AES3 Signal, auch AES/EBU genannt.<br />
Das AES3 ist ein professionelles digitales Datenformat <strong>für</strong> die Übertragung von<br />
zwei digitalen Audiosignalen in einer Leitung. Die Leitung ist mit Biphase Mark 4 ko-<br />
diert. Der Anschluss ist symmetrisch und erfolgt über XLR. Die Pinbelegung sieht wie<br />
folgt aus: 1 = Abschirmung, 2 = Signal (+), 3 = Signal (-). Ein ” Block“ in der AES3-<br />
Übertragung enthält einen AES3-Frame, der wiederum zwei AES3-Subframes enthält.<br />
Ein AES3-Subframe besteht aus 32 Bit, wobei 24 Bit Audiodaten enthalten und 8 Bit<br />
weitere Zusatzdaten. Ein Frame besteht also aus 64 Bit. 192 Frames bilden einen Block<br />
bei der Übertragung [3]. Jedes Subframe enthält abwechselnd entweder die Audiodaten<br />
des ersten oder des zweiten Kanals. Zur Kennzeichnung von neuen Anfängen des jewei-<br />
ligen Subframes wird eine Präambel gesetzt, deren Länge 4 Bit beträgt. Die digitalen<br />
Mikrofone könnten beispielsweise natürlich auch direkt an den Eingang eines digitalen<br />
Mischpultes angeschlossen werden, wenn dieser den AES42-2001 Standard unterstützt.<br />
Da dies aber heute noch nicht der Fall ist (es sind bis heute noch keine digitalen Misch-<br />
pulte auf dem Markt, die den AES42-2001 Standard unterstützen), wird das Interface<br />
benötigt.<br />
Der AES24-2001 Standard ist ein digitales Datenformat. Dieses Format ist eine<br />
Weiterentwicklung des AES3 Standards <strong>für</strong> digitale Mikrofone. Es wurde im Jahr 2001<br />
von der Audio Engineering Society standardisiert. Dieses Format unterstützt den An-<br />
schluss von monophonen und stereophonen digitalen Audiosignalen. Bei einem mono-<br />
phonen Signal wird das Signal zweimal hintereinander in beiden Subframes übertragen<br />
[7].<br />
4 Der Biphase Mark-Code ist einer der Manchester-Codes, welche halfbauded sind (d.h. die Pulsbreite<br />
entspricht einer halben Bitdauer) und deren Clockgehalt maximal ist. Biphase Mark ist selbsttaktend<br />
und phasentolerant. Er wird in mehreren Übertragungsstandards in der digitalen Audiotechnik<br />
eingesetzt [3].<br />
8
Abbildung 3: Veranschaulichung vom Aufbau des Frames mit seinen Subframes (aus<br />
[1] S.451)<br />
Über AES24 lässt sich die Übertragung von digitaler Phantomspeisung (DPP), digita-<br />
len Audiosignalen (AES3 kompatibler Datenstrom) und die Fernsteuerung der digitalen<br />
Mikrofone realisieren. Es gibt einen spezifischen Anschluss <strong>für</strong> digitale Mikrofone: den<br />
XLD Anschluss. Dieser Kabelanschluss hat wie ein XLR Anschluss drei Kontakte, de-<br />
ren Pinbelegung identisch ist mit der des XLR (s.o.). Dieser XLD Anschluss ist optional<br />
mit einem so genannten ” Zebra coding ring“ am Stecker gekennzeichnet, welcher dar-<br />
auf hinweist, dass dieses Kabel zur Übertragung von digitalen Audiosignalen gedacht<br />
ist [6].<br />
Das Interface DMI-2 wird mit der von ” Neumann“ entwickelten ” RCS “ (Neu-<br />
mann Remote Control Software) bedient, die auf einem Computer installiert wird.<br />
Die Verbindung vom Interface zum Computer erfolgt durch eine Konvertierung von<br />
USB-Schnittstelle auf RS 485 (Netzwerkstecker). Bei mehr als zwei Mikrofonen können<br />
mehrere Interfaces miteinander kaskadiert werden. Dabei ist jedes einzelne Mikrofon<br />
individuell per Fernsteuerung einstellbar. Die einstellbaren Parameter sind: Gain, Fil-<br />
ter (Low Cut), Vordämpfung, Limiter, Phase, Abtastrate (44.1, 48, 88.2, 96, 176.4, 192<br />
kHz), Synchronisationsmode, Testsignale und Signallicht.<br />
Wie bereits in der Einleitung erwähnt, müssen die digitalen Mikrofone mit allen an-<br />
deren digitalen Geräten in der Übertragungskette synchronisiert werden. In der Fern-<br />
steuerung der digitalen Mikrofone ist ein Wahlfeld eingerichtet, das die Auswahl zwi-<br />
schen 2 Modi zur Sychronisation der Mikrofone ermöglicht.<br />
Für den Mode 2, in welchem ein externes Word Clock-Signal empfangen wird, gibt es<br />
einen BNC Anschluss am DMI-2 Interface. Es wird dem AES42-2001 Standard entspre-<br />
chend gearbeitet; d.h. auf der Empfängerseite des Mikrofonsignals wird ein Frequenzen-<br />
Phasenvergleich mit einer Masterclock durchgeführt. Hierbei entsteht ein träges Regel-<br />
signal (engl.: control voltage) zum Steuern eines VCXOs (Voltage controlled crystal<br />
9
oscillator), das im Mikrofon verwendet wird. Es kommt zu einem so genannten PLL<br />
(Phase Locked Loop), eine geschlossene phasenlineare Schleife. Das durch PLL erzeug-<br />
te Regelsignal wird über den Remote-Control-Datenstrom zum Mikrofon übertragen.<br />
Wird eine Word Clock von außen angeschlossen, schaltet sich der Synchronisations-<br />
modus automatisch darauf ein.<br />
Im Mode 1 werden die digitalen Mikrofone vom intern generierten Takt asynchron ge-<br />
taktet (siehe Einleitung). In diesem Fall benötigt man jedoch wie bereits erwähnt einen<br />
zusätzlichen SRC am Eingang des Anschlussgeräts [6].<br />
2.3.2 Die verwendeten Geräte mit Abtastratenwandler<br />
Als Anschlussgeräte, die den digitalen Mikrofonen entweder die externe Word Clock lie-<br />
fern oder den Sample Rate Converter an ihren Eingängen ” anbieten“ , wurden folgende<br />
Geräte verwendet:<br />
• die digitale Kreuzschiene ” Nexus“ (im <strong>Erich</strong>-<strong>Thienhaus</strong>-<strong>Institut</strong> installiert) von<br />
der ” Stage Tec Entwicklungsgesellschaft <strong>für</strong> professionelle Audiotechnik mbH“<br />
mit der AES/EBU Karte mit SRC,<br />
• das digitale Mischpult ” DM 1000“ von der ” Yamaha Corporation“ mit der digi-<br />
talen Schnittstellenkarte (engl.: Digital I/O Card) ” MY8-AE96S“ (Es sind keine<br />
Herstellerangaben über die technischen Daten der SRC zu finden),<br />
• der Format- und Abtastratenwandler (engl.: Triple Universal Format and Sample<br />
Rate Converter) ” ADI-192DD“ von ” RME-Intelligence Audio Solutions“ . Die<br />
technischen Daten über die SRC des Format- und Abtastratenwandlers ADI-<br />
192DD sind der Bedienungsanleitung zu entnehmen (siehe Abbildung 4).<br />
Abbildung 4: technische Daten über SRC des ADI-192DD<br />
Diese drei Geräte verfügen über AES3 Schnittstellen (sowohl Ein- als auch Ausgänge)<br />
mit optional einschaltbaren Abtastratenwandlern am Eingang, so dass das Signal vom<br />
digitalen Mikrofon, das im Interface DMI-2 von AES42 auf AES3 umgewandelt wird,<br />
10
ohne jegliche zusätzliche Formatwandlung direkt an den Eingang des Virtual-Studio-<br />
Systems ” Pyramix“ angeschlossen werden kann. Es wurde darauf geachtet, dass es zu<br />
so wenig Bearbeitung des Audiosignals wie möglich kommt, um eventuelle Fehlerquel-<br />
len und damit jegliche Qualitätsverluste zu vermeiden.<br />
Bei allen drei genannten Geräten ist es möglich, die Aufnahme mit den KMD Mikro-<br />
fonen entweder in Mode 1 oder 2 durchzuführen.<br />
Leider ist es nicht möglich, über den Format- und Abtastratenwandler ” ADI-192DD“<br />
die beiden oben genannten Synchronisationsmöglichkeiten (Mode 1 und 2) in verschie-<br />
denen Kanälen gleichzeitig durchzuführen, was mit den beiden anderen Geräten möglich<br />
ist. Bei diesem Gerät kann man die SRC <strong>für</strong> die verwendete Schnittstelle (in diesem<br />
Fall AES3) komplett ein- oder einschalten, aber nicht <strong>für</strong> jeden einzelnen Kanal sepa-<br />
rat. Das ist bei den beiden anderen Geräten möglich.<br />
Alle drei Geräte verfügen über je 4 AES3 Ein- und Ausgangssteckfelder. Für die Auf-<br />
nahmen <strong>für</strong> den Hörtest wurden genau je 4 Eingänge und Ausgänge mit jeweiligem<br />
Steckfeld benötigt 5 .<br />
Bei der gleichzeitigen Aufzeichnung des identischen Audiomaterials mit den verschie-<br />
denen Synchronisationsmöglichkeiten musste man im Falle des Converters ADI-192DD<br />
also auf eine Ausnahme eingehen: das Audiomaterial des einen Mikrofonpaares wurde<br />
über den Converter ADI-192DD mit eingeschalteten SRC am Eingang aufgezeichnet<br />
und das Audiomaterial des anderen Mikrofonpaares musste über ein anderes Gerät (in<br />
diesem Fall DM 1000) mit Word Clock Eingang aufzeichnet werden. Dies beeinträchtigt<br />
jedoch nicht die Qualität der Aufzeichnungen, denn es ist im Grunde genommen <strong>für</strong><br />
die Qualität der Audiodaten gleichgültig, über welches Gerät man ein digitales Signal<br />
aufzeichnet, wenn es über die Taktsynchronisierung mit externem Word Clock Eingang<br />
arbeitet. Die Gültigkeit des Testaufbau ist demnach nicht gefährdet.<br />
Es war also möglich, das identische Audiomaterial gleichzeitig durch die beiden KMD<br />
Stereo Pärchen sowohl im Mode 1 als auch mit externem Word Clock Eingang vom<br />
jeweiligen (oben genannten) Gerät aufzuzeichnen.<br />
Die Aufzeichnung geschah auf dem Virtual-Studio-System ” Pyramix“ der Firma ” Mer-<br />
ging Technologies“ , das im <strong>Erich</strong>-<strong>Thienhaus</strong>-<strong>Institut</strong> vorhanden ist. Dabei wurden die<br />
Audiodaten mit 24 Bit und 44.1 kHz aufgezeichnet.<br />
Die oben genannten drei Geräte spielen in dem in der Arbeit vorgesehenen Hörtest<br />
die zentrale Rolle. Die eventuell hörbaren klanglichen Unterschiede, nach welchen hier<br />
gesucht wird, sind in erster Linie abhängig von der Qualität dieser Geräte, präziser<br />
ausgedrückt, von der Qualität der SRC, die in diesen Geräten eingebaut sind. Das<br />
Ziel des Hörtests ist ja gerade, herauszufinden, ob verschiedene Geräte durch die un-<br />
terschiedliche Qualität der eingebauten SRC die resultierende Qualität der mit den<br />
digitalen Mikrofonen aufgezeichneten Audiodaten derart beeinflussen, dass das geübte<br />
5 Zwei Stereopaare mit je einzelnen Ausgängen<br />
11
Gehör diesen Unterschied tatsächlich und nachweislich wahrnehmen kann.<br />
Es ist leider nicht möglich, Information über die genauen technischen Daten und<br />
Arbeitsweise der einzelnen SRC des jeweiligen Gerätes zu erhalten (außer die Daten von<br />
ADI-192DD, siehe Abbildung 4). Es wird in dieser Arbeit die Hypothese aufgestellt,<br />
dass es einen hörbaren Unterschied zwischen den Aufnahmen im Mode 1 und 2 geben<br />
kann. Es ist anhand der optischen Darstellung der Wellenformen und der Überprüfung<br />
der technischen Daten erkennbar, dass das Signal verändert wird, wenn es zusätzlich<br />
über einen SRC läuft. Es sei zunächst dahingestellt, ob die Veränderung durch den<br />
SRC sich positiv oder negativ auswirkt. Hier steht die Frage im Mittelpunkt, ob dieser<br />
technisch nachweisbare Unterschied <strong>für</strong> Personen, die im kritischen Hören geübt sind,<br />
auditiv wahrnehmbar ist.<br />
2.4 Messungen mit Testsignalen<br />
Die Signale der Aufnahmen sind zur Überprüfung in ihrer Wellenform optisch um ein<br />
Vielfaches vergrößert worden. Die Wellenform der beiden Signale, 1. Aufnahme mit<br />
WCLK und 2. Aufnahme mit SRC, sind optisch nicht identisch.<br />
Hier stellt sich die Frage nach der Reproduzierbarkeit des Signals. Die drei Geräte<br />
weisen jeweils unterschiedlich lange Verzögerungszeit bzw. Latenz bei eingeschaltetem<br />
Abtastratenwandler auf. Diese scheinen aber bei allen drei konstant zu sein.<br />
Zur Überprüfung der Reproduzierbarkeit wurden Proben mit ausgeglichener Verzögerungszeit<br />
(richtige Delay Einstellung) und Phasendrehung durchgeführt: wenn die Signale iden-<br />
tisch, d. h. genau reproduzierbar wären, müsste ein digitales Null-Signal resultieren.<br />
Das war bei den Aufnahmen <strong>für</strong> den Hörtest im Modus 1 und 2 nicht der Fall. Die<br />
Gegenprobe erfolgte mit zwei identischen Signalen, also beide Signale mit entweder<br />
WCLK oder SRC aufgenommen, woraus eine digitale Null resultierte. Beim Versuch,<br />
WCKL gegen SRC phasengedreht gegeneinander auszulöschen, blieb dagegen immer<br />
ein Restsignal überig, das zwar im Pegel deutlich verringert ist, sich aber nie völlig<br />
auslöscht. Dies bedeutet, dass es bei einer Verwendung des SRCs zur Veränderung des<br />
Audiosignals kommt.<br />
Zur weiteren Absicherung wurden Testsignale aufgezeichnet: Sinus bei 1 kHz, weis-<br />
ses und rosa Rauschen. Die Aufnahmen <strong>für</strong> den Hörtest können eventuell aus gegebenen<br />
Umständen nicht wirklich identisch sein, da die Mikrofone nicht exakt an der selben<br />
Stelle positioniert waren. Diese Testsignale wurden über die Geräte DM 1000 und ADI-<br />
192DD geschickt, liefen über die jeweiligen SRC und wurden wieder auf der Festplatte<br />
des Pyramix Rechners aufgezeichnet. Bei dem Sinus Signal ist optisch kein Unterschied<br />
zu erkennen. Es bleibt jedoch trotz Ausgleichung der Latenz ein Restsignal bei der Ad-<br />
dition beider Signale mit einer Phasendrehung übrig. Das Signal, das über den SRC<br />
des DM 1000 geschickt wurde, ergibt, addiert mit dem Originalsignal bei Phasendre-<br />
12
hung und Latenzausgleich (111 Samples) -31,9 dB. Dabei klingt das Restsignal nicht<br />
verzerrt, sondern lediglich leiser.<br />
ADI-192DD weist bei einer Latenz von 150 Samples noch -26,2 dB Restsignal auf. Da-<br />
bei ist auffällig, dass es beim Restsignal zu regelmäßigem, hörbaren Ausschlagen bis<br />
zu -14,9 dB kommt. Man kann vermuten, dass der Ausschlag einer Zeiteinheit <strong>für</strong> eine<br />
bestimmte Komponente entspricht, mit der der Converter arbeitet, was bei normaler<br />
Wiedergabe von Signalen nicht hörbar ist.<br />
Bei der Probe mit Rauschen ist der Sachverhalt komplizierter. Es fällt auf, dass die Si-<br />
gnale, die durch einen SRC geschickt wurden, optisch nicht identisch sind und vor allem<br />
einen höheren Pegelunterschied aufweisen. Dabei kommt es zu Pegelveränderungen von<br />
bis zu +2 dB. Es ist zu beobachten, dass ADI-192DD die Pegelveränderung im linken<br />
und rechten Kanal parallel durchführt, DM 1000 dagegen zwischen dem linken und<br />
rechten Kanal unterschiedliche Pegelveränderungen aufzeigt.<br />
Das weisse Rauschen wurde ursprünglich mit -6,4 dB aufgezeichnet, DM 1000 zeichnet<br />
jedoch mit L -4,6 dB und R -5,9 dB auf; ADI-192DD mit L und R je -4,4 dB. Für das<br />
rosa Rauschen gilt im Prinzip das gleiche: ursprüngliche Aufzeichnung -4,5 dB, DM<br />
1000 L -4,1 und R -4,4 dB; ADI-192DD L und R -4,1 dB. Der Sinus wurde wie gesagt<br />
in seinem Pegel nicht verändert.<br />
Ein Versuch, die Pegelveränderung (hier Pegelverstärkung) zu erklären, wäre die Tatsa-<br />
che, dass der Abtastratenwandler mit Oversampling durch Prädiktion arbeitet, indem<br />
er vorausschauend interpoliert. Bei der Interpolation wird eine ” Vorhersage“ durch<br />
einen Algorithmus berechnet, d.h. es werden Zwischenwerte durch ” Vorausschauen“<br />
zwischen den vorhandenen Samples (vor und hinter dem zu berechnenden Sample)<br />
berechnet. Bei deterministischen Signalen 6 wie <strong>Musik</strong> funktioniert die Prädiktion mit<br />
der heutigen Technik sehr gut. Bei stochastischen Signalen wie Rauschen kann der<br />
Algorithmus nicht wirklich ” vorhersehen“ , welcher Zwischenwert der richtige wäre.<br />
Dadurch lässt sich vielleicht die verfälschte Pegelwiedergabe bei der Abtastratenwand-<br />
lung erklären.<br />
Manche Testpersonen fragten nach Durchführung des Test, ob es vielleicht möglich<br />
sei, dass sich der Pegel zwischen den Beispielen innerhalb mancher Paare unterscheide.<br />
Aufnahmetechnisch kann dies nicht verursacht worden sein, denn die Entfernung der<br />
Mikrofonpaare von der Quelle und die digitale Vorverstärkung waren stets genau gleich.<br />
Eine Erklärung <strong>für</strong> den geäußerten Eindruck, die Beispiele seien unterschiedlich laut,<br />
kann in diesem Zusammenhang gegeben werden: Das vom Mikrofon aufgezeichnete<br />
akustische Raumrauschen kommt dem weissen Rauschen sehr nah. Das im Hintergrund<br />
stetig hörbare Raumrauschen erklingt lauter auf den Aufnahmen im Modus 1, daher<br />
erscheint die gesamte Aufnahme etwas lauter.<br />
6 sich periodisch wiederholende Signale<br />
13
3 Vorüberlegungen und Gedanken zum Hörtest<br />
Das Ziel dieses Hörtests ist es, herauszufinden, ob man tatsächlich klangliche Unter-<br />
schiede zwischen den beiden Varianten der Einstellungen (Mode 1: Synchronisation<br />
mit Hilfe von Sample Rate Converter am Anschlussgerät und Mode 2: Synchronisa-<br />
tion der Mikrofone mit externer Word Clock) wahrnehmen kann. Da es hier um sehr<br />
feine und aufnahmetechnisch spezielle Unterschiede geht, wurden die Testpersonen im<br />
Voraus ausgewählt: im genauen und kritischen Hören geübte Tonmeister, insbesondere<br />
Tonmeister Studenten des <strong>Erich</strong>-<strong>Thienhaus</strong>-Institus.<br />
Um ein vernünftiges Ergebnis erhalten zu können, muss der Hörtest vernünftig kon-<br />
struiert werden. Daher ist es notwendig, sich im Voraus differenzierte Gedanken über<br />
das Design des Tests zu machen.<br />
Es bieten sich in diesem Fall zwei geeignete Möglichkeiten des Versuchsaufbaus, die<br />
sinnvoll erscheinen: ABX Test oder Paarvergleich in Form von Forced Choice [8].<br />
Beim ABX Test werden der Versuchsperson zunächst zwei unterschiedliche Referenz-<br />
signale A und B vorgestellt. Die Versuchsperson kann sich in einer so genannten Lern-<br />
phase die zwei Referenzsignale einprägen. Anschließend werden der Versuchsperson die<br />
beiden unterschiedlichen Signale in einer beliebigen Reihenfolge immer wieder vorge-<br />
spielt und sie hat die Aufgabe, das jeweilige Signal (X) dem entsprechenden Referenzsi-<br />
gnal (A oder B) zuzuordnen. Dabei trifft sie mit jeder Entscheidung eine richtige oder<br />
falsche Antwort, d.h. sie ordnet das Signal X entweder dem richtigen oder falschen<br />
Referenzsignal A oder B zu. Damit stellt sich heraus, ob die jeweilige Versuchperson<br />
in der Lage ist, die Beispiele mit dem richtigen Referenzsignal zu identifizieren. Diese<br />
Tatsache versetzt die Versuchsperson in eine Stresssituation.<br />
Speziell im tonmeisterlichen Bereich ist bei der Befragung nach einer Wahrnehmung<br />
klanglich feiner Unterschiede das Verhalten der Versuchsperson unvermeidlich mit dem<br />
Druck, dem man sich selbst unterzieht, verbunden, als Tonmeister, der im kritischen<br />
Hören geübt ist, diesen spezifischen Fehler heraushören zu müssen und zu wollen. Die-<br />
ses Verhalten kann das Ergebnis des Hörtests verzerren.<br />
Um diese Gefahr zu minimieren, fiel die Entscheidung <strong>für</strong> den vorgesehenen Hörtest<br />
auf den Paarvergleich nach dem Forced-Choice Verfahren. Es gibt mehrere Gründe <strong>für</strong><br />
diese Wahl. Das wichtigste Argument <strong>für</strong> den Paarvergleich ist wie bereits erläutert<br />
der geringere Stressfaktor <strong>für</strong> die Testperson. Dieser Stress wird beim Paarvergleich<br />
eliminiert, da es keine ” richtige“ oder ” falsche“ Entscheidung gibt. Es werden stets<br />
zwei Signale angeboten; das eine mit und das andere ohne einen zusätzlichen Reiz. Die<br />
Entscheidung fällt dabei lediglich auf ein Beispiel jeden Beispielpaares, ohne den Druck<br />
zu spüren, sich genau <strong>für</strong> das richtige Beispiel entscheiden zu müssen.<br />
Ein weiterer Grund <strong>für</strong> den Paarvergleich ist der Aspekt, dass man bei diesem eine viel<br />
höhere Anzahl von Audiobeispielen je Testperson pro Test durchführen kann, denn der<br />
14
ABX Test erfordert allein von seiner Struktur her sehr viel mehr Zeitaufwand.<br />
Es ist von großer Wichtigkeit, sich vor dem Zusammenstellen des Hörtests mit<br />
der Messtheorie vertraut zu machen. Besonders wichtig ist dies, wenn man versucht<br />
herauszufinden, ” ob eine bestimmte Eigenschaft überhaupt messbar ist“ [8] (S. 215).<br />
3.1 Forced-Choice und Signalentdeckungstheorie<br />
Die ” Forced-Choice“ Methode ist eine Möglichkeit, die Verzerrung der Ergebnisse durch<br />
das Antwortkriterium 7 zu minimieren.<br />
Im klassischen Messverfahren der Empfindung kann das Ergebnis durch bewusstes Ver-<br />
halten der Testperson verzerrt werden. Jede Testperson muss eine innere Schwelle <strong>für</strong><br />
sich selbst setzen, ab welcher Intensität des Reizes, die im Test angeboten wird, sie eine<br />
bejahende Antwort gibt, wie z.B. bei einem Audiogramm, in dem nach der Hörbarkeit<br />
eines Tons bezüglich des Pegels gefragt wird 8 . Um sich ” besser“ zu präsentieren, kann<br />
es dazu kommen, dass eine Testperson ein ” Ja“ zur Antwort gibt, obwohl sie den Ton<br />
noch gar nicht gehört hat. Diese Verfälschung kann durch das ” Forced-Choice“ Verfah-<br />
ren ausgeschaltet werden.<br />
Im Forced-Choice Verfahren werden zwei Beobachtungsintervalle definiert. Diese bei-<br />
den Beobachtungsintervalle enthalten zwei Signale; das eine Signal enthält einen zu-<br />
sätzlichen Reiz und das andere Signal nicht. In diesem speziellen Hörtest sind die<br />
beiden Beobachtungsintervalle wie folgt definiert: 1. Aufnahmen mit zwischengeschal-<br />
tetem SRC und 2. Aufnahmen ohne zwischengeschaltetem SRC. Diese zwei Aufnahmen<br />
desselben Audiobeispiels werden stets paarweise angeboten und die Aufgabe der Ver-<br />
suchsperson ist es, anhand der vorgegebenen Kriterien eine Entscheidung zwischen den<br />
Beispielen innerhalb eines Paares zu treffen. Der zwischengeschaltete SRC ist das ein-<br />
zige Merkmal, das sich zwischen den Audiobeispielen stets unterscheidet. Damit ist<br />
also die Bedingung <strong>für</strong> die ” Forced-Choice“ Methode gegeben: feste Reizintensitäten.<br />
Für diese festen Reizintensitäten, die in jedem Entscheidungsprozess (in jedem Paar-<br />
vergleich) enthalten sind, wird der Prozentsatz ” richtiger“ Antworten bestimmt. Im<br />
vorliegenden Hörtest gibt es keine ” richtigen“ oder ” falschen“ Antworten. Hier wird<br />
der Prozentsatz der Tendenz zu einer der beiden Aufnahme-Modi berechnet, um her-<br />
auszufinden, ob diese klanglich unterschieden werden können.<br />
In diesem Fall, speziell in diesem Hörtest, ist die Reizintensität bereits vorgegeben:<br />
der Unterschied, den ein SRC bei einer Aufnahme verursacht. Anhand dieser vorge-<br />
gebenen Reizintensität soll nun herausgefunden werden, ob die Testpersonen eine ein-<br />
deutige Unterscheidungsleistung hervorbringen können oder ob sie auf ein Rateniveau<br />
zurückfallen.<br />
Mit dem ” Forced-Choice“ Verfahren wird allein die ” sensorische Empfindlichkeit“ ge-<br />
7 Das Problem, <strong>für</strong> sich die Schwelle <strong>für</strong> eine Entscheidung zu bestimmen.<br />
8 Dieses Problem wird in der Fachsprache ” Kriterienproblem“ genannt, was nicht mit dem im fol-<br />
genden verwendeten Begriff ” Kriterium“ zu verwechseln ist.<br />
15
messen und dabei wird das ” Problem des Antwortkriteriums“ minimiert [8] (S. 230).<br />
Die sogenannte ” Signalentdeckungstheorie“ ist eine erweiterte Form des ” Forced-<br />
Choice“ Verfahrens. Der wesentliche Unterschied zwischen dem ” Forced-Choice“ Ver-<br />
fahren und der ” Signalentdeckungstheorie“ ist, dass letzteres nicht nur das sensorische<br />
Empfinden zu messen versucht, sondern auch die ” nicht-sensorischen Anteile einer psy-<br />
chophysischen Messung“ [8] (S.230). In diesem Hörtest ist jedoch zunächst nur die sen-<br />
sorische Empfindlichkeit interessant. Das <strong>für</strong> diesen Hörtest gedachte Design kommt<br />
von seinem Aufbau her der Signalentdeckungstheorie näher.<br />
Es gibt vier Fälle bei der Signalentdeckungstheorie: Treffer, Verpasser, falschen<br />
Alarm und korrekte Zurückweisung. Wird ein Reiz angeboten und ist es die Aufgabe der<br />
Versuchsperson, diesen Reiz herauszuerkennen, gilt folgendes: Als Treffer werden die<br />
Antworten gewertet, mit denen die Aufgabe mit einem ” Ja“ korrekt (bei vorhandenem<br />
Reiz = Aufnahme mit SRC) beantwortet wurden. Ein ” Nein“ trotz dargebotenem<br />
Reiz wird als Verpasser gewertet. Falscher Alarm tritt auf, wenn die Versuchsperson<br />
bei fehlendem Reiz die Aufgabe mit ” Ja“ beantwortet. Bei korrekter Zurückweisung<br />
verneint die Versuchsperson die Aufgabe bei fehlendem Reizangebot.<br />
Die vier möglichen Ausgänge des Signalentdeckungsexperiments im vorliegenden<br />
Hörtest sind in der Tabelle 1 aufgelistet.<br />
Aufnahmen im Modus 1 Aufnahmen im Modus 2<br />
dargebotene Reize Antwort der Vpn: mit SRC Antwort der Vpn: ohne SRC<br />
Aufnahme im Modus 1 Treffer Verpasser<br />
mit SRC (engl.: hit) (engl.: miss)<br />
Aufnahme im Modus 2 Falscher Alarm Korrekte Zurückweisung<br />
ohne SRC (engl.: false alarm) (engl.: corr.reject.)<br />
Tabelle 1: Vier mögliche Ausgänge des Signalentdeckungsexperiments im vorliegenden<br />
Hörtest (nach [8] S.231)<br />
Den vorliegenden Hörtest kann man nicht mit ” Ja“oder ” Nein“ beantworten. Den-<br />
noch kann er als eine Art des so genannten ” Ja/Nein“-Experiments geltend gemacht<br />
werden. Treffer und korrekte Zurückweisung stellen die richtige Zuweisung von Auf-<br />
nahme-Mode 1 oder 2 dar. Hier ist es jedoch nicht wichtig, dass die Versuchsperson<br />
die angebotenen Reize ” richtig“ zuweist. Vielmehr ist in erster Linie interessant, ob<br />
sich eine signifikante Tendenz zeigt. Dabei spielt es keine Rolle, ob der Treffer und<br />
die korrekte Zurückweisung (richtige Zuordnung) überwiegen, oder der Verpasser und<br />
der falsche Alarm (falsche Zuordnung). Es ist lediglich interessant, ob sich durch den<br />
Hörtest ein hörbares Merkmal finden lässt (dies wäre der Fall, wenn sich eine signifi-<br />
16
kante Tendenz zeigt).<br />
Es werden immer zwei verschiedene Arten von Aufnahmen, also zwei Beobachtung-<br />
intervalle vorgespielt (zwei Beispiele des gleichen Audiobeispiels in Modus 1 oder 2).<br />
Dies wird in der Signalentdeckungstheorie als ” zwei Reizsituaitionen“ ([8] S.231) be-<br />
zeichnet, die es grundsätzlich gibt. Hier sind es 1. ” Audiobeispiel in Mode 1“ und 2.<br />
” Audiobeispiel in Mode 2“ .<br />
Es werden feste Reizintensitäten angeboten9 , wobei nicht geklärt ist, wie groß diese<br />
Reize sind. Die verschiedenen Reizintensitäten werden durch die drei verschiedenen<br />
Geräte bestimmt. Es wird angenommen, dass es sich hier um drei verschiedene Inten-<br />
sitäten des Reizes handelt. Es soll nun auch herausgefunden werden, ob es Reizinten-<br />
sitätsunterschiede gibt und wenn ja, wie groß der Unterschied ist.<br />
Im in dieser Arbeit vorgesehenen Hörtest sind sowohl Aspekte des ” Forced-Choice“<br />
Verfahrens als auch der ” Signalentdeckungstheorie“ wie oben beschrieben, enthalten.<br />
Entgegen gewöhnlicher Testverfahren, bei denen das Merkmal bekannt ist und<br />
durch kontrolliertes Variieren von Reizintensitäten und deren Auswirkung (Merkmal)<br />
nach der Unterschiedsschwelle gesucht wird, kennt man weder die Größe noch die<br />
Verhältnisse der angebotenen Reizintensitäten. Da diese vermutlich, wenn sie sich<br />
überhaupt voneinander unterschieden, in einem sehr kleinen Bereich variieren, bewegt<br />
man sich von vornherein im Unterschiedsschwellenbereich. Es wird also nicht nach der<br />
Unterschiedsschwelle selbst gesucht, sondern es wird untersucht, ob diese angenomme-<br />
ne Schwelle bei Verwendung qualitativ weniger guter Geräte überschritten wird und es<br />
dadurch zur Unterscheidbarkeit der Aufnahme-Modi kommt.<br />
Es ist vor der Durchführung des Hörtests nicht bekannt, ob es überhaupt ein Merkmal<br />
zur auditiv wahrnehmbaren Unterscheidung zwischen den verschiedenen Aufnahme-<br />
Modi bei digitalen Mikrofonen gibt. Aufgrund der technischen Vorkenntnisse und tech-<br />
nischen Messungen wird angenommen, dass es bei nicht optimaler Abtastratenwand-<br />
lung zur Veränderung und Beeinträchtigung des ursprünglichen Signals kommen kann.<br />
Dabei lassen sich die Stufen der Reizintensitäten im Vergleich zum klassischen Test-<br />
verfahren nicht kontrolliert verstellen. Diese sind in erster Linie durch die Verwendung<br />
von verschiedenen Geräten mit ihren verschiedenen SRC vorgegeben, aber auch durch<br />
die verschiedenen Audiobeispiele gegeben. Da man annimmt, dass die sich klanglich<br />
bemerkbaren Unterschiede, die durch die unterschiedlichen Qualitäten der SRC zu-<br />
stande kommen, in einem sehr engen Bereich bewegen, werden sich die Versuchsperso-<br />
nen vermutlich im Bereich der Unterschiedsschwelle bewegen. Mit Hilfe dieses Hörtests<br />
soll nach dem Merkmal gesucht werden, das möglicherweise in Abhängigkeit von den<br />
gegebenen Reizintensitäten (verschiedene SRC und Quellen) mehr oder weniger gut<br />
9 Dies entspricht dem Forced-Chioce Verfahren.<br />
17
wahrzunehmen sein wird.<br />
Auf die Möglichkeit, eine Rückmeldung zur Antwort bezüglich der Richtigkeit der<br />
jeweiligen Angabe zu geben, wurde bewusst verzichtet, da es sich in diesem Hörtest<br />
um minimale klangliche Unterschiede handelt und die hier zu erwartende Unsicherheit<br />
durch ein Feedback eher vergrößert würde. Darüberhinaus unterbricht ein Feedback die<br />
Konzentration und das Gefühl der Ungestörtheit.<br />
3.2 Aufnahmen <strong>für</strong> den Hörtest<br />
Alle Aufnahmen <strong>für</strong> den Hörtest wurden aus technischen Gründen in der Neuen Aula<br />
der <strong>Hochschule</strong> <strong>für</strong> <strong>Musik</strong> Detmold durchgeführt. Dabei wurden zwei Stereo-Mikrofon-<br />
paare aufgestellt. Die beiden Mikrofonpaare konnten selbsverständlich nicht gleichzeitig<br />
exakt an der gleichen Stelle positioniert werden. Der Abstand zwischen den jeweiligen<br />
Mikrofonkapseln (zwischen den beiden Mikrofonpaaren), betrug ca. 2,5 cm. Mit Aus-<br />
nahme der Aufnahmen des Streichorchesters, des Gesangs, und zum Teil der Sprache<br />
(Test B: Track 7/8 und 29/30) waren die Mikrofonpaare übereinander aufgestellt (bei<br />
den genannten Ausnahmen waren die Mikrofonpaare nebeneinander befestigt).<br />
Bei der Aufnahme wurde darauf geachtet, dass die Mikrofone weit genug von der Schall-<br />
quelle entfernt standen, damit die Abstrahlcharakteristik der Schallquelle im Raum<br />
nicht mehr ausschlaggebend <strong>für</strong> den unterschiedlichen Klang an unterschiedlichen Po-<br />
sitionen sein konnte.<br />
Abbildung 5: Skizze des Signalflusses<br />
Um die Möglichkeit zu haben, die Testpersonen an mehreren verschiedenen Schall-<br />
quellen (Instrumente oder Sprache) zu testen, wurden sieben verschiedene Besetzungen<br />
aufgezeichnet:<br />
Die Daten der Aufnahmen:<br />
Basisbreite des jeweiligen Mikrofonpaares: 0,36 m bzw. 0,26 m<br />
18
——Liste über Aufnahmen zum Hörtest——<br />
Klavier Solo Julia Habiger/<br />
(in Test B) F. Chopin, Ballade g-Moll Nexus<br />
Gitarre Solo Tim Büchsenschütz/<br />
(in Test A und B) Jazz Improvisation und Nexus,<br />
J.S. Bach, Gavotte aus Partita in E-Dur DM1000, ADI-192DD<br />
Sprache Emma Laín/ Nexus,<br />
(in Test A und B) aus Werken von P. Coelho und A.S. Pinol DM1000, ADI-192DD<br />
Gesang Bineta Diouf/<br />
(in Test A und B) F. Schubert, Der Tod und das Mädchen DM1000<br />
Oboe Solo Jung-Kyeom Kim/ Nexus,<br />
(in Test A und B) A. Pascolli, La Favorita Konzert DM1000, ADI-192DD<br />
Violoncello Solo Min-A Kim/<br />
(in Test A und B) D. Popper, Etüde op.73, Nr.1 DM1000, ADI-192DD<br />
Streichorchester Detmolder Kammerorchester/<br />
(in Test B) D. Schostakowitsch, Bearbeitung vom<br />
Tabelle 2: Liste über Aufnahmen zum Hörtest<br />
Höhe: 3,6 m<br />
Winkel zur Seite: ca. 5 ◦<br />
Neigung nach unten: ca. 10 ◦<br />
Streichquartett op. Nexus<br />
Abstand zur Schallquelle: ca. 4,5 m bei <strong>Musik</strong><br />
ca. 3,4 m bei Sprache.<br />
Da jeder Mensch unterschiedlich auf verschiedene Reize reagiert, war es wichtig, den<br />
Testpersonen verschiedene Reize anzubieten. Darüberhinaus bringt jeder eine andere<br />
Voraussetzung an Hörerfahrung und Hörerwartung mit sich. Hinzu kommt, dass die<br />
Testperson vor dem Hörtest noch nicht weiss, bei welcher Art der Schallquelle der feine<br />
Unterschied zwischen den Aufnahmen in Mode 1 oder 2 am besten zu hören sein wird.<br />
3.3 Kriterien zur Bewertung<br />
Um die Testperson nach einer Bewertung befragen zu können, müssen <strong>für</strong> den Hörtest<br />
geeignete Kriterien gefunden werden, denn nur so kann die Auswertung erfolgreich wer-<br />
den. Die Kriterien müssen <strong>für</strong> die Testperson eindeutig zu verstehen sein. Die Suche<br />
nach ” richtigen“ Kriterien entspricht in diesem Fall der Suche nach den vermutlichen<br />
Merkmalen <strong>für</strong> die eventuelle Unterscheidungmöglichkeit.<br />
Da es bei diesem Hörtest darum geht, herauszufinden, ob professionell ausgebildete, in<br />
19
kritischem Hören geübte Personen überhaupt in der Lage sind, den feinen Unterschied<br />
zwischen den Aufnahmen mit oder ohne Abtastratenwandler herauszuhören, gilt es<br />
zunächst zu klären, in welcher Weise sich der Unterschied hörbar äußern kann.<br />
Daher wird die Frage gestellt, welche Fehler sich durch ein zusätzliches Abtasten von<br />
digitalen Signalen überhaupt ergeben könnten. Im Grunde genommen sucht man nach<br />
einer ” black box“ [8], denn man sucht nach Kriterien, anhand deren Reizen man ei-<br />
ne bestimmte Reaktion hervorrufen kann. ” Die zwischen Reiz und Reaktion liegenden<br />
Vorgänge werden, da sie methodisch prinzipiell oder vorläufig nicht erschließbar sind,<br />
als black box behandelt“ [8] (S. 213).<br />
Der größte Fehler, der bei einer Abtastratenwandlung auftreten kann, ist wie oben<br />
bereits erläutert, der Jitterfehler. Jitter kann sowohl die Amplitude als auch die Pha-<br />
senlage des Signals beeinträchtigen. Der Fehler äußert sich in Form eines zusätzlich<br />
entstandenen sogenannten Jitterrauschens. Es kann aber auch zu Knacksern oder Fluk-<br />
tuatuion in der Amplitude kommen (Vergleiche Kapitel 2.2.1).<br />
Da der Abtastratenwandler mit ähnlichen Methoden wie denen der A/D- und D/A-<br />
Wandler arbeitet, kann man zunächst nach bekannten Fehlern bei den A/D- und D/A-<br />
Wandlern suchen, um Anhaltspunkte zu finden. Bei ihnen sind bestimmte Abbildungs-<br />
fehler bekannt, u.a. Verschlechterung der Lokalisationsschärfe, Tiefenabbildung und<br />
Räumlichkeit. Eine Verzerrung des Frequenzgangs ist dagegen eher unwahrscheinlich.<br />
Bezüglich dieser speziellen Suche nach Fehlern der Abtastratenwandlung lässt sich die<br />
Vermutung aufstellen, dass es eventuell durch die Verzerrung des abgetasteten Signals<br />
zur verstärkten Wiedergabe von Obertönen kommen kann.<br />
Hier wurden folgende Kriterien als geeignet bewertet:<br />
• die Nähe (bzw. Entfernung) zur Quelle,<br />
• die Luftigkeit bzw. Offenheit<br />
• die Klarheit und<br />
• die Natürlichkeit.<br />
Der natürliche Klang des Raumrauschens wurde nach den Vortests auf Anregung<br />
der Testpersonen als vierte Kategorie <strong>für</strong> die Beispielpaare hinzugenommen, die mit<br />
wenig Signalpegel aufgenommen wurden und bei denen daher wegen der hohen Vor-<br />
verstärkung das Raumrauschen gut zu hören ist.<br />
4 Versuchsaufbau und -durchführung<br />
4.1 Versuchsaufbau<br />
Es wurden 20 Audiobeispielpaare <strong>für</strong> den Hörtest verwendet. Jedes wurde, wie unten<br />
näher erläutert wird, jeweils zweimal innerhalb eines Tests eingesetzt. Die Beispiele<br />
20
wurden durch Mastering in ihrem Pegel aneinander angeglichen, damit es nicht zu<br />
großen Pegelunterschiede innerhalb eines Hörtests kam. Abgesehen von der Pegelan-<br />
gleichung wurden die Audiodaten bewusst nicht bearbeitet (kein nachträglicher Hall,<br />
kein Schnitt), damit die Daten so wenig wie möglich von weiteren technischen Kompo-<br />
nenten beeinflusst wurden.<br />
Die Anordnung der Reihenfolge der Beispiele wurde willkürlich zusammengestellt, wo-<br />
bei auf eine abwechslungsreiche Abfolge der Klangbeispiele geachtet wurde.<br />
Um die Länge des Tests zu begrenzen und damit die Konzentrationsfähigkeit der<br />
Testpersonen nicht zu überstrapazieren, wurden zwei verschiedene Hörtests, Hörtest A<br />
und B, mit je 20 Audiobeispielpaaren (10 verschiedene je zweimal) zusammengestellt.<br />
Außerdem wurden die Beispiele mit einer Länge zwischen 12 und 22 Sekunden kurz<br />
gehalten. Dies entspricht in etwa der EBU 2000 Assessment-listening Norm von 10 bis<br />
20 Sekunden <strong>für</strong> die Länge von Audiobeispielen. Den Empfehlungen von ” Recommen-<br />
dation ITU-R BS. 1284-1*, general methods for the subjective assessment of sound<br />
quality“ entsprechend, sind die Beispielen der jeweiligen Paare 0,5 bis 1 Sekunde und<br />
die jeweiligen Paaren ca. 1,5 Sekunden voneinander getrennt [5].<br />
Da es in diesem Test darum geht, ob Unterschiede wahrnehmbar oder lediglich<br />
Einbildungen sind, war es wichtig, dass die Testperson unbedingt eine eindeutige Ent-<br />
scheidung pro Beispielpaar trifft. Dies ist auch im Sinne der ” Forced-Choice“ Methode.<br />
Daher wurde bewusst darauf verzichtet, der Testperson auch die Auswahlmöglichkeit<br />
zu geben, keinerlei Unterschiede wahrnehmen zu können. Somit wird ” die Tendenz zur<br />
Mitte “ vermieden, was ” nicht förderlich <strong>für</strong> die angestrebte Differenzierung“ wäre [10]<br />
(S. 49).<br />
Um der Gefahr vorzubeugen, dass eine Testperson das Testergebnis dadurch verzerrt<br />
anfängt, dass sie willkürlich rät, da sie keinen Unterschied feststellen zu können glaubt,<br />
wurde jedes Audiobeispielpaar im Hörtest zweimal verwendet: in der ersten Hälfte des<br />
Tests einmal in einer bestimmten Reihenfolge (1. Beispiel: Aufnahme mit Word Clock<br />
Synchronisation, 2. Beispiel: Aufnahme mit Sample Rate Converter) und in der zweiten<br />
Hälfte des Testaufbaus in inverser Reihenfolge der Paarung (1.Beispiel: Aufnahme mit<br />
Sample Rate Converter, 2. Beispiel: Aufnahme mit Word Clock Synchronisation). Somit<br />
müsste sich eine 50 zu 50 Verteilung ergeben, falls sich jemand entschiede, einfach bei<br />
jedem Paar das erste Beispiel anzukreuzen.<br />
Jedes Beispiel wurde mit einem Track versehen, damit die Testperson die Möglichkeit<br />
bekam, zum Vergleichen beliebig hin- und herzuschalten. Den Testpersonen wurde je-<br />
doch empfohlen, sich auf den ersten Eindruck zu verlassen, da es sich um sehr klei-<br />
ne Unterschiede handelt, falls diese denn überhaupt wahrnehmbar sind. Durch diese<br />
persönliche Einweisung vor dem Beginn der Testdurchführung wurde versucht, der Test-<br />
person den Druck und Illusion zu nehmen, unbedingt Unterschiede hören zu müssen.<br />
21
Als weiteren Vorsichtsmaßnahme wurde der Test unter der so genannten ” Blindbedin-<br />
gung “ durchgeführt, d. h. die Versuchspersonen wurden so wenig wie möglich über<br />
das Thema und Ziel des Tests informiert [10]. Dadurch wurde beabsichtigt, das Verhal-<br />
ten der Versuchspersonen unbeeinflusst zu lassen und ihnen den zusätzlichen Stress zu<br />
nehmen, eine so spezielle und Tonmeister-spezifische Streitfrage ” richtig “ beantworten<br />
zu müssen.<br />
22
Hörtest A<br />
Diplomarbeit: Je-Young <strong>Myung</strong><br />
Thema: Untersuchungen zum Klang digitaler Mikrofone<br />
Die folgenden Hörbeispiel-Paare sollen anhand der darunter angegebenen Kriterien miteinander<br />
verglichen werden. Dabei gibt es keine „richtigen“ oder „falschen“ Antworten.<br />
Bitte kreuzen Sie im Folgenden das zutreffende Feld an und verlassen Sie sich dabei auf Ihren<br />
ersten Eindruck!<br />
1. Track 01 Track 02<br />
Die Quelle scheint näher zu sein ٱ ٱ<br />
Es klingt luftiger/ offener ٱ ٱ<br />
Es klingt klarer ٱ ٱ<br />
2. Track 03 Track 04<br />
Die Quelle scheint näher zu sein ٱ ٱ<br />
Es klingt luftiger/ offener ٱ ٱ<br />
Es klingt klarer ٱ ٱ<br />
3. Track 05 Track 06<br />
Die Quelle scheint näher zu sein ٱ ٱ<br />
Es klingt luftiger/ offener ٱ ٱ<br />
Es klingt klarer ٱ ٱ<br />
Es klingt natürlicher (auf das Rauschen achten) ٱ ٱ<br />
4. Track 07 Track 08<br />
Die Quelle scheint näher zu sein ٱ ٱ<br />
Es klingt luftiger/ offener ٱ ٱ<br />
Es klingt klarer ٱ ٱ<br />
Es klingt natürlicher (auf das Rauschen achten) ٱ ٱ<br />
5. Track 09 Track 10<br />
Die Quelle scheint näher zu sein ٱ ٱ<br />
Es klingt luftiger/ offener ٱ ٱ<br />
Es klingt klarer ٱ ٱ<br />
Es klingt natürlicher (auf das Rauschen achten) ٱ ٱ<br />
6. Track 11 Track 12<br />
Die Quelle scheint näher zu sein ٱ ٱ<br />
Es klingt luftiger/ offener ٱ ٱ<br />
Es klingt klarer ٱ ٱ<br />
Abbildung 6: Auszug aus dem Hörtest A zur Ansicht<br />
23
Abbildung 7: Zusatzinformation <strong>für</strong> den verschickten Hörtest<br />
4.2 Versuchsdurchführung<br />
Der größte Teil des Hörtest wurde im <strong>Erich</strong>-<strong>Thienhaus</strong>-<strong>Institut</strong> der <strong>Hochschule</strong> <strong>für</strong><br />
<strong>Musik</strong> Detmold in 7 Tagen durchgeführt. Damit die Standardsituation [10] (S.53)<br />
gewährleistet wurde, fanden 40 von 50 Hörtests im Seminarraum 1 statt, der im Insti-<br />
tut als Referenz-Mehrkanalabhörraum genutzt wird (siehe Abbildung 8). Somit waren<br />
alle 40 Testteilnehmer gleichen Bedingungen ausgesetzt. Die übrigen 10 Tests wur-<br />
den per Post an verschiedene Personen verschickt. Diese 10 Tests wurden zu Hause<br />
an Kopfhörern (8 Tests) oder am eigenen Lautsprecher (2 Tests) durchgeführt. Da in<br />
diesen Fällen die persönliche Einweisung entfällt, wurde eine Zusatzinformation am<br />
Anfang des Hörtestbogens hinzugefügt (siehe Abbildung 7).<br />
Der Seminarraum 1 ist 2005/ 2006 neu erbaut und professionell eingemessen worden. Es<br />
stehen in diesem Raum Lautsprecher der ” musikelectronic geithain gmbh“ : ” RL901K“<br />
und alle 40 Testpersonen führten den Hörtest an diesen Lautsprechern durch.<br />
Dieser Raum ist schallisoliert, so dass die Testpersonen keiner akustischen Störung<br />
von außen ausgesetzt waren. Zudem wurde darauf geachtet, dass sie während der<br />
Durchführung des Hörtests nicht unterbrochen oder in ihrer Konzentration gestört<br />
wurden.<br />
Raumdaten:<br />
Raumgröße: Länge = 8,00 m; Breite = 8,00 m; Höhe = 2,96 m<br />
Raumvolumen: 189 m3<br />
rel. Luftfeuchtigkeit: 59<br />
Temperatur: 22 ◦ C<br />
Nachhallzeit (200Hz - 4 kHz) 10 : 0,277 s Vorhang geschlossen<br />
empf. Nachhallzeit nach ITU: 0,31 s<br />
0,337 s Vorhang offen<br />
Der Hörtest wurde bei halb geschlossenem Vorhang durchgeführt.<br />
24
Abbildung 8: Der Seminarraum 1 des <strong>Erich</strong>-<strong>Thienhaus</strong>-<strong>Institut</strong>s der <strong>Hochschule</strong> <strong>für</strong><br />
<strong>Musik</strong> Detmold.<br />
Wie oben bereits erwähnt, wurden die Testpersonen zunächst kurz eingewiesen. Die<br />
Testpersonen wurden darauf aufmerksam gemacht, dass es ihre Aufgabe sei, sich bei<br />
jedem Beispielpaar <strong>für</strong> eines zu entscheiden. Während der Durchführung des Hörtests<br />
wurden die Testpersonen allein gelassen, damit sie sich nicht beobachtet und sich nicht<br />
in ihrer Verhaltensweise beeinträchtigt fühlen.<br />
In der Regel betrug die Testzeit nicht mehr als 25 Minuten, in einzelnen Fällen jedoch<br />
bis zu 45 Minuten. Jeder Testperson wurde jedoch so viel Zeit gewährt wie benötigt. Die<br />
Abhörlautstärke (in der Regel im Bereich von 70 dB) wurde der jeweiligen Testperson<br />
überlassen.<br />
4.3 Vortests<br />
Den endgültigen Hörtests gingen mehrere Vortests voraus, um zum einen die Kriterien<br />
zu optimieren, anhand welcher die Testperson die Entscheidung zwischen den angebo-<br />
tenen Beispielen treffen sollte und zum anderen um sicher zu stellen, dass die Länge<br />
der vorgegebenen Audiobeispiele <strong>für</strong> den Entscheidungsprozess der Testperson passend<br />
gewählt sind.<br />
Diese Vortests wurden sowohl an den Referenz-Regielautsprechern RL901K im Semi-<br />
narraum 1 als auch an Kopfhörern (AKG501) durchgeführt und es wurde dabei fest-<br />
gestellt, dass diese beiden Abhörbedingungen keine wesentlichen Unterschiede in den<br />
Ergebnissen verursachen. Dies ist ein wichtiger Punkt, denn die Tests wurden zum Teil<br />
per Post verschickt, so dass diese auf verschiedene Art und Weise abgehört wurden.<br />
5 Auswertung<br />
5.1 Allgemeines zur Auswertung des Hörtests<br />
Das Ziel des vorliegenden Hörvergleichs ist es, herauszufinden, ob es einen klanglichen<br />
Unterschied zwischen Mode 1 und 2 der AES42-Betriebsmodi in der Aufnahme mit di-<br />
25
gitalen Mikrofonen gibt. Wird ein klanglicher Unterschied wahrgenommen, stellt sich<br />
die Frage, ob diese Beobachtung reproduzierbar ist, um ein Ergebnis des Zufalls aus-<br />
schließen zu können.<br />
Der Hörtest wurde nach dem Prinzip der ” Signalentdeckungstheorie“ (siehe Kapitel<br />
3.1) speziell <strong>für</strong> die Zwecke der oben genannten Untersuchung zusammengestellt. Wie<br />
bereits oben genannt bezeichnet der ” Reiz“ , der hier dargeboten wird, den anzuneh-<br />
menden klanglichen Unterschied der Aufnahme, der durch zusätzliches Verwenden von<br />
SRC am Eingang des Anschlussgerätes verursacht wird. Die Hypothese, die aufgestellt<br />
wird, lautet daher: ” Es gibt hörbar klangliche Unterschiede zwischen der Aufnahme im<br />
Mode 1 und der Aufnahme in Mode 2“ .<br />
Ob diese Hypothese sich anhand der Hörtest-Auswertung bestätigen lässt, hängt zum<br />
einem von den Reizintensitäten und zum anderen von der Hörempfindlichkeit der Ver-<br />
suchspersonen ab.<br />
Die Auswertungen werden im Folgenden in Prozentsätzen angegeben.<br />
Ab welchem Prozentwert die Auswertung des vorliegenden Hörtests als signifikant, also<br />
eindeutig als Unterschiedserkennung zu bewerten ist, muss <strong>für</strong> diesen speziellen Hörtest<br />
angepasst beurteilt werden. Das allgemein geltende ” Signifikanzniveau“ des klassischen<br />
Verfahrens, die ” 5%-Hürde <strong>für</strong> die Irrwahrscheinlichkeit“ ([9] S.30), kann hier nicht an-<br />
gewandt werden, da sich der vorliegende Test im Unterschiedsschwellenbereich bewegt<br />
(siehe Kapitel 3.1).<br />
5.2 Deskriptive Auswertung<br />
Es wurden insgesamt 50 Hörtests durchgeführt. Davon wurden 40 im Seminarraum 1<br />
des <strong>Erich</strong>-<strong>Thienhaus</strong>-<strong>Institut</strong>s an den oben genannten Lautsprechern ” RL901K“ durch-<br />
geführt und 10 außerhalb, davon 8 Tests am Kopfhörer und 2 Tests am eigenen Laut-<br />
sprecher. Die 50 Tests setzen sich zusammen aus 26 Hörtests vom Typ A und 24<br />
Hörtests vom Typ B. Betrachtet man jedes einzelne Beispielpaar als eigene Wertung,<br />
so erhält man aus den 50 Tests 1000 Wertungen (50 Tests x 20 Beispielpaare).<br />
In der Auswertung werden die Kategorien folgendermaßen bezeichnet:<br />
a: Die Quelle scheint näher zu sein;<br />
b: Es klingt luftiger/ offener;<br />
c: Es klingt klarer<br />
d: Es klingt natürlicher (auf das Rauschen achten)<br />
Aufgrund von technischen Fehlern konnten die Beispiele mit den Klavier-Aufnahmen<br />
(96 Wertungen) nicht in die Auswertung einbezogen werden.<br />
Insgesamt wurden in der Kategorie a 834, b 884, c 886 und d 256 Wertungen abge-<br />
geben 11 . Die Differenz zu 904, der gesamten Anzahl der Wertungen (1000 Wertungen<br />
11 Klavier-Beispiele bereits herausgenommen<br />
26
- 96 Wertungen der Klavier-Beispiele), sind die fehlenden Werte; entweder von der<br />
Testperson nicht bewertet oder im Test nicht zur Bewertung angeboten (die Kategorie<br />
” Rauschen“ wurde nur bei Bespielen mit wenig Signal und gut hörbarem Raumrauschen<br />
angeboten).<br />
Nach der deskriptiven Auswertung der Hörtests zeigt sich zunächst in keiner Kate-<br />
gorie eine eindeutige bzw. ausschlaggebende Tendenz zu einer der beiden Aufnahme-<br />
Modi. In der Gesamtauswertung (siehe Tabelle 3), in der alle Ergebnisse 12 enthalten<br />
sind, sowohl die des Hörtests A als auch des Hörtests B, ergibt sich folgendes 13 :<br />
——Auswertung der Ergebnisse, Hörtest A und B——<br />
näher luftiger klarer natürlicher<br />
Gesamtauswertung W 46,5% (388) W 49,1% (434) W 49,4% (438) W 51,6% (132)<br />
Hörtest A und B S 53,5% (535) S 50,9% (450) S 50,6% (448) S 48,4% (124)<br />
Auswertung W 46,0% (219) W 49,6% (256) W 49,5% (255) W 50,0% (80)<br />
Hörtest A S 54,0% (257) S 50,4% (260) S 50,5% (260) S 50,0% (80)<br />
Auswertung W 47,2% (169) W 48,4% (178) W 49,3% (183) W 54,2% (52)<br />
Hörtest B S 52,8% (189) S 51,6% (190) S 50,7% (188) S 45,8% (44)<br />
Tabelle 3: Auswertung der Ergebnisse, Hörtest A und B. Die Anzahl der Wertungen<br />
sind in Klammern angegeben; W: WCLK, S: SRC<br />
Obwohl viele der Testpersonen nach den Tests mitteilten, dass sie am Klang des<br />
Rauschens Unterschiede hätten deutlich festmachen können, zeigt die Auswertung in<br />
dieser Kategorie kein eindeutiges Bevorzugen eines der Aufnahme-Modi. Es ist inter-<br />
essant zu beobachten, dass es einen deutlichen Unterschied zwischen den Ergebnissen<br />
von Test A und B in der Kategorie d: ” Es klingt natürlicher (auf das Rauschen achten)“<br />
gibt. Während sich bei Test A eine Verteilung von 50% zu 50% zeigt, zeigt sich bei Test<br />
B eine Tendenz von 54,2% zu Aufnahmen in Mode 2. Möglicherweise sind im Hörtest<br />
B mehr Beispiele enthalten, bei denen die Unterschiedschwelle wegen größerer Rei-<br />
zintensität stärker überschritten werden. Diese beiden Prozentsätze bilden zusammen<br />
in ihrem arithmetischen Mittelwert eine relativiertes Ergebnis von 51,6% <strong>für</strong> WCLK.<br />
Auch wenn diese Tendenz sehr gering ist, ist es interessant zu sehen, dass bei der Ge-<br />
samtauswertung der Antworten aller Testpersonen der Klang in Aufnahme-Mode 2 als<br />
natürlicher empfunden wird.<br />
12 bis auf die Klavier-Beispiele, da diese ja aus der Wertung herausgenommen wurden<br />
13 Es ist zu beachten, dass alle einzelnen Beispielpaare als eine Wertung gezählt werden, d.h. es<br />
ergeben sich 1000 Wertungen bei 50 Tests je 20 Beispielpaare<br />
27
In der Kategorie a: ” Es klingt näher“ ist eine gewisse Tendenz von 53,5% zu Auf-<br />
nahmen in Mode 1 zu erkennen. Sie ist zwar ebenfalls gering, dennoch ist die Tendenz<br />
auffällig (im Vergleich zu anderen Kategorien). Vor allem ist diese Tendenz hier sowohl<br />
in Test A als auch in Test B zu erkennen.<br />
Diese Beobachtung in der Kategorie a ist in Untersuchungen von Untergruppen immer<br />
wieder zu bestätigen. In dieser Kategorie zeigt sich die deutlichste Tendenz in der Ge-<br />
samtauswertung über alle Tests aller Testpersonen.<br />
Im Folgenden werden die Auswertungen in verschiedenen Untergruppen nacheinan-<br />
der im Überblick wiedergegeben.<br />
Zunächst werden die einzelnen Geräte mit ihren SRC betrachtet:<br />
——Auswertung der Ergebnisse einzelner Geräte——<br />
näher luftiger klarer natürlicher<br />
Beispiele W 46,2% (108) W 49,0% (121) W 50,2% (125) W 56,4% (53)<br />
Nexus S 53,8% (126) S 51,0% (126) S 49,8% (126) S 43,6% (41)<br />
Beispiele W 46,9% (152) W 47,1% (161) W 49,0% (169) W 48,4% (31)<br />
DM 1000 S 53,1% (172) S 52,9% (181) S 51,0% (176) S 51,6% (33)<br />
Beispiele W 46,4% (128) W 51,5% (152) W 49,3% (144) W 49,0% (48)<br />
ADI-192DD S 53,6% (148) S 48,5% (143) S 50,7% (148) S 51,0% (50)<br />
Tabelle 4: Auswertung der Ergebnisse einzelner Geräte<br />
Hier fällt wieder die Tendenz in der Kategorie a zu den Aufnahmen in Mode 1<br />
(SRC) bei allen drei Geräten auf. Außerdem ist die Tendenz bei Kategorie d von 56,4%<br />
<strong>für</strong> Mode 2 (WCLK) bei den Beispielen, die mit Nexus aufgezeichnet sind, eindeutig<br />
größer als bei den anderen beiden Geräten. Bei DM 1000 und ADI-192DD zeigt sich<br />
in der Kategorie d sogar eine kleine Tendenz zu SRC-Aufnahmen, die Aufnahme mit<br />
WCLK wird also nicht bevorzugt.<br />
DM 1000 zeigt in allen vier Kategorien leichte Tendenzen zu SRC-Aufnahmen. In der<br />
Kategorie ” luftiger“ gibt es hier die größte Tendenz von 52,9% zu SRC-Aufnahmen.<br />
In den Abbildungen 9 bis 12 werden die Auswertungen der jeweiligen Kategorie einzel-<br />
ner Geräte grafisch veranschaulicht.<br />
In Tabelle 5 sind die sechs verschiedenen Quellen ausgewertet und gegenübergestellt.<br />
Die Ergebnisse der einzelnen Quellenarten unterscheiden sich in manchen Punkten. So<br />
ist hier auffällig, dass die Auswertung der Kategorie c bei dem Beispiel Violoncello die<br />
größte Tendenz überhaupt zeigt (63,9%). Dies ist bemerkenswert, zumal in der Ge-<br />
28
Abbildung 9: Grafik zur Veranschaulichung von Ergebnissen der verschiedenen Geräte:<br />
Kategorie a<br />
Abbildung 10: Grafik zur Veranschaulichung von Ergebnissen der verschiedenen Geräte:<br />
Kategorie b<br />
29
Abbildung 11: Grafik zur Veranschaulichung von Ergebnissen der verschiedenen Geräte:<br />
Kategorie c<br />
Abbildung 12: Grafik zur Veranschaulichung von Ergebnissen der verschiedenen Geräte:<br />
Kategorie d<br />
30
——Auswertung der Ergebnisse einzelner Schallquellen——<br />
näher luftiger klarer natürlicher<br />
Gitarre W 47,2% (67) W 51,7% (78) W 49,3% (74) W 49,5% (47)<br />
S 52,8% (75) S 48,3% (73) S 50,7% (76) S 50,5% (48)<br />
Violoncello W 39,1% (36) W 51,0% (50) W 36,1% (35) no offer<br />
S 60,1% (56) S 49,0% (48) S 63,9% (62) no offer<br />
Sprache W 48,1% (111) W 49,2% (121) W 54,3% (134) W 51,9% (67)<br />
S 51,9% (120) S 50,8% (125) S 45,7% (113) S 48,1% (62)<br />
Oboe W 43,1% (81) W 52,2% (106) W 50,7% (102) no offer<br />
S 56,9% (107) S 47,8% (97) S 49,3% (99) no offer<br />
Gesang W 50,5% (46) W 44,2% (42) W 49,0% (48) no offer<br />
S 49,5% (43) S 55,8% (53) S 51,0% (50) no offer<br />
Streichorchester W 52,2% (47) W 40,7% (37) W 48,4% (45) W 60,0% (60)<br />
S 47,8% (43) S 59,3% (54) S 51,6% (48) S 40,0% (40)<br />
Tabelle 5: Auswertung der Ergebnisse einzelner Schallquellen<br />
samtauswertung in dieser Kategorie ein Ergebnis von nahezu 50% resultiert. Auch die<br />
Kategorie a zeigt bei der Quelle Vc die deutlichste Tendenz (60,1%). Beide Kategorien<br />
deuten auf eine Wertung zu Gunsten von Aufnahmen in Mode 1. In diesem Zusam-<br />
menhang sei erwähnt, dass es generell eine positive Korrelation zwischen der Kategorie<br />
a und c, näher und klarer, zu geben scheint. Dies ist hörpsychologisch bedingt, da das<br />
Beispiel, das näher zu sein scheint, als klarer empfunden wird.<br />
Weitere auffällige Tendenzen zeigen sich bei der Oboe in der Kategorie a: die Aufnah-<br />
men in Mode 1 werden zu 56,9% als näher empfunden. Weiterhin wurde der Klang der<br />
Aufnahmen mit WCLK beim Streichorchester-Beispiel zu 60% als natürlicher bewertet.<br />
In den Abbildungen 13 bis 16 werden die Auswertungen der jeweiligen Kategorie<br />
einzelner Quellen grafisch veranschaulicht.<br />
Da sich in der Auswertung einzelner Versuchspersonen eine gewisse Diskrepanz<br />
von Tendenzen zeigt, wurde eine zusätzliche gruppierte Auswertung vorgenommen,<br />
mit dem Ziel, herauszufinden, wie groß die jeweilige Tendenz in beide Richtungen ist.<br />
Die Ergebnisse, die eine 50 zu 50 Verteilung ergaben, wurden aus der Auswertung<br />
herausgenommen und die Wertungen wurden <strong>für</strong> jede Kategorie in zwei verschiedene<br />
Gruppen aufgeteilt: 1. Tendenzen < 50% und 2. Tendenzen > 50%. Die Werte der<br />
Ergebnisse sind in Tabelle 6 wiedergegeben<br />
Aus der Anzahl (in Klammern angegeben) der abgegebenen Wertungen in den bei-<br />
31
Abbildung 13: Grafik zur Veranschaulichung von Ergebnissen der verschiedenen Quelle:<br />
Kategorie a<br />
Abbildung 14: Grafik zur Veranschaulichung von Ergebnissen der verschiedenen Quelle:<br />
Kategorie b<br />
32
Abbildung 15: Grafik zur Veranschaulichung von Ergebnissen der verschiedenen Quelle:<br />
Kategorie c<br />
Abbildung 16: Grafik zur Veranschaulichung von Ergebnissen der verschiedenen Quelle:<br />
Kategorie d<br />
33
——Auswertung der Ergebnisse, Tendenz-Diskrepanz——<br />
näher luftiger klarer natürlicher<br />
Ergebnisse W 40,4% (186) W 39,3% (148) W 40,5% (191) W 31,9% (15)<br />
< 50% S 59,2% (274) S 60,7% (229) S 59,5% (281) S 68,1% (32)<br />
Ergebnisse W 57,7% (142) W 60,4% (200) W 62,0% (202) W 63,2% (60)<br />
> 50% S 42,3% (104) S 39,6% (131) S 38,0% (124) S 36,8% (35)<br />
Tabelle 6: Auswertung der Ergebnisse, Tendenz-Diskrepanz<br />
den Tendenz-Gruppen erkennt man, dass in der Kategorie a, b und c die Gruppe der<br />
Tendenz < 50% größer ist; in der Kategorie d überwiegt die Gruppe der Tendenz ><br />
50%. Die Unterschiede der Wertungsanzahl der Kategorien b und c sind relativ gering,<br />
so dass man sie als nicht signifikant ansehen kann. Die Unterschiede der Wertungs-<br />
anzahl der Kategorien a und d allerdings lassen sich interpretieren. Die Tendenz der<br />
Empfindung der Nähe der Quelle geht zu 65,15% zu Gunsten der Aufnahmen in Mode<br />
1, mit SRC (Tendenzgruppe < 50%). Für den natürlichen Klang mit besonderer Auf-<br />
merksamkeit auf das Raumrauschen werden die Aufnahmen in Mode 2, mit WCLK<br />
(Tendenzgruppe > 50%), von der Mehrzahl der Versuchspersonen bevorzugt.<br />
Zur Vollständigkeit sei die Anzahl der =50% Wertungen aufgelistet: a N = 120; b N =<br />
200; c N = 100; d N = 280.<br />
Es gibt zwei von der allgemeinen Gesamtauswertung abweichende Sonderfälle. Ein<br />
Test ist durch seine überdurchschnittlich eindeutigen Tendenzen im Ergebnis aufgefal-<br />
len: Vp 18 (Test B).<br />
Die Ergebnisse des Tests B lauten:<br />
Kategorie a: W: 20%, S: 80%<br />
Kategorie b: W: 80%, S: 20%<br />
Kategorie c: W: 20%, S: 80%<br />
Da diese Vp sowohl am Test B als auch am Test A teilgenommen hatte, wurden<br />
die Ergebnisse des Tests A 14 ebenfalls genauer betrachtet.<br />
Die Ergebnisse des Tests A lauten:<br />
Kategorie a: W: 35%, S: 65%<br />
Kategorie b: W: 65%, S: 35%<br />
Kategorie c: W: 35%, S: 65%<br />
Im Ergebnis des Tests A zeigt sich keine so eindeutige Tendenz mehr, gleichwohl<br />
ist sie vorhanden.<br />
14 <strong>für</strong> Test A wird die Person unter der Vp Nummer 33 geführt<br />
34
Um beurteilen zu können, ob dieses Einzelergebnis signifikant ist oder ob es sich ledig-<br />
lich um einen ” Zufall“ handelt, wurde diese Person nochmals dem Hörtest unterzogen<br />
(ebenfalls <strong>für</strong> den Test B). Zwischen dem ersten und zweiten Test B liegt ein Zeitraum<br />
von über einem Monat, so dass nicht zu be<strong>für</strong>chten ist, dass die Person den ersten Test<br />
dubliziert. Beim zweiten Test relativierte sich das Ergebnis, jedoch zeigt sich da auch<br />
eine eindeutige Tendenz:<br />
Kategorie a: W: 35%, S: 65%<br />
Kategorie b: W: 65%, S: 35%<br />
Kategorie c: W: 40%, S: 60%<br />
Kategorie d: W: 54,54%, S: 45,46%<br />
Alle drei Ergebnisse zeigen die Tendenz in gleicher Richtung auf. Daher ist anzu-<br />
nehmen, dass die Versuchsperson die Aufnahme-Modi zu unterscheiden weiss. Welchen<br />
Modus die Vp 18 bzw. 33 ” bevorzugt“ , sei hier nicht ausschlaggebend. Es geht in<br />
diesem Test in erster Linie um die Frage, ob und wenn ja, wie signifikant, im kritischen<br />
Hören geübte Personen im Stande sind, den Unterschied festzustellen.<br />
Es gibt auch weitere vereinzelte Ergebnisse bei anderen Versuchspersonen, die ebenfalls<br />
eine deutliche Tendenz < oder > 50% aufzeigen, jedoch geschieht dies nur in einzelnen<br />
Kategorien.<br />
Überdurchschnittlich große Tendenzen, die sich vereinzelt in verschiedenen Kategorien<br />
bei verschiedenen Versuchspersonen zeigen:<br />
Kategorie a: Es klingt näher<br />
Vpn 18: W: 20%, S: 80%<br />
Vpn 22: W: 25%, S: 75%<br />
Vpn 25: W: 25%, S: 75%<br />
Vpn 28: W: 30%, S: 70%<br />
Kategorie b: Es klingt luftiger/ offener<br />
Vpn 1: W: 20%, S: 80%<br />
Vpn 9: W: 75%, S: 25%<br />
Vpn 18: W: 80%, S: 20%<br />
Vpn 19: W: 22,2%, S: 77,8%<br />
Vpn 32: W: 30%, S: 70%<br />
Kategorie c: Es klingt klarer<br />
Vpn 3: W: 70%, S: 30%<br />
Vpn 15: W: 70%, S: 30%<br />
Vpn 18: W: 20%, S: 80%<br />
Vpn 21: W: 30%, S: 70%<br />
Vpn 26: W: 70%, S: 30%<br />
Vpn 36: W: 75%, S: 25%<br />
Kategorie d: Es klingt natürlicher/ Rauschen<br />
35
Vpn 31: W: 70%, S: 30%<br />
Vpn 42: W: 30%, S: 70%<br />
Vpn 44: W: 30%, S: 70%<br />
Vpn 49: W: 30%, S: 70%<br />
Im Vergleich der Ergebnisse fällt es auf, dass die Tendenzen innerhalb der selben<br />
Kategorien zum Teil gegensätzlich sind. Es ist anzunehmen, dass das Verständnis der<br />
Kategorien bei den verschiedenen Versuchsperson differiert, da jede andere Vorausset-<br />
zungen, Erwartungen und Hörerfahrungen zum Test mitbringt.<br />
Es ist aber auch möglich, diese Gegebenheit anders zu interpretieren. Es ist ebenso<br />
denkbar, dass die ausgewählten Kategorien, die im Test zur Beurteilung vorgegeben<br />
wurden, nicht ideal geeignet sind. Möglicherweise sind sie nicht eindeutig zu verstehen;<br />
es gibt zu viel Spielraum <strong>für</strong> die Auslegung der Kategorien.<br />
Die Kategorie a (näher) zeigt in allen vier oben genannten Fällen die Tendenz zu Auf-<br />
nahmen mit SRC. Diese Kategorie ist also wohl eindeutig zu verstehen.<br />
In den Kategorien b und c gibt es sowohl Tendenz zu Aufnahmen mit WCLK als auch<br />
zu Aufnahmen mit SRC.<br />
Die Tendenz bei der Kategorie d scheint bei den überdurchschnittlich großen Tenden-<br />
zen eher zu Gunsten der Aufnahmen mit SRC zu gehen.<br />
Es kann außerdem sogar zum Variieren bzw. zur Verschiebung des Verständnisses kom-<br />
men, da es sich um sensorische Empfindungs-Fragen handelt.<br />
Der zweite Sonderfall ist nicht durch ein überdurchschnittliches Ergebnis in der all-<br />
gemeinen Gesamtauswertung aufgefallen, sondern durch differenzierte Anmerkungen<br />
zu den einzelnen Beispielpaaren. Versuchsperson 17 bzw. 42 (diese beiden Vp Num-<br />
mern entsprechen der gleichen Person, da sie an beiden Tests, A und B, teilgenommen<br />
hat) notierte am Rand des Hörtestbogens, bei welchen Paaren sie meint, Unterschiede<br />
tatsächlich hören zu können. Sie führte sowohl Test A als auch Test B durch und von<br />
den insgesamt 40 Paaren griff sie 5 Paare heraus, bei denen sie meinte, tatsächlich<br />
Unterschiede feststellen zu können. Hier zeigte sich ihre Tendenz eindeutig zu den Auf-<br />
nahmen mit WCLK. Das Ergebnis lautet 4:1 <strong>für</strong> WCLK. Diese Beispiele sind folgende:<br />
aus Test A Track 5/6: Gitarre aufgenommen mit Nexus<br />
Track 35/36: Gitarre aufgenommen mit ADI-192DD<br />
aus Test B Track 7/8: Sprache aufgenommen mit DM 1000<br />
(hier entschied sich die Vpn <strong>für</strong> die Aufnahme mit SRC)<br />
Track13/14: Streichorchester aufgenommen mit Nexus<br />
Track 29/30: Sprache aufgenommen mit DM 1000<br />
(das inverse Beispiel zu Track 7/8)<br />
36
Für diese Person wurde ein neuer Hörtest erstellt, in dem nur die besagten 5 Paare<br />
zur Bewertung angeboten wurden. Jedes dieser Beispiele wurde je viermal in verschie-<br />
denen Paarungen angeboten.<br />
Die Auswertung dieses Tests ergibt:<br />
Kategorie a: W: 85%, S: 15%<br />
Kategorie b: W: 45%, S: 55% 15<br />
Kategorie c: W: 100%, S: 0%<br />
Kategorie d: W: 65%, S: 35%<br />
Die Versuchsperson kommentierte wieder die einzelnen Beispiele und zählte je Au-<br />
diobeispiel die von ihr favorisierte Version auf. Bis auf ein Beispiel (Gitarre Aufnahme<br />
mit ADI-192DD) entschied sie sich zu 100% <strong>für</strong> Aufnahmen mit WCLK. Beim Bei-<br />
spiel der Gitarren-Aufnahme mit ADI-192DD entschied sich die Person jedes mal <strong>für</strong><br />
die Aufnahme mit SRC, so dass man mit Sicherheit behaupten kann, dass diese Person<br />
in der Lage ist, zwischen den Aufnahme-Modi mit großer Sicherheit zu unterscheiden<br />
und diese Unterscheidung sogar sicher zu reproduzieren.<br />
Die Versuchsperson traf ihre Entscheidungen anhand von Unterschieden, die sie wahr-<br />
genommen hat, diese sind die Präsenzanhebung bei den Aufnahmen mit SRC (Audio-<br />
beispiele: Sprache und Gitarre) und die bessere Tiefenabbildung bei Aufnahmen mit<br />
WCLK (Audiobeispiel: Streichorchester).<br />
Es ist noch zu erwähnen, dass die Person den Test nicht am <strong>Erich</strong>-<strong>Thienhaus</strong>-<strong>Institut</strong><br />
durchgeführt hat, sondern am eigenen Lautsprecher, der mit großer Wahrscheinlichkeit<br />
nicht der Qualität des ” RL901K“ Lautsprechers entsprechen wird.<br />
Da die Möglichkeit bestand, die anderen Versuchspersonen könnten genau bei den<br />
von der Vp 17 bzw. 42 herausgesuchten Beispielen ebenfalls deutlichere Unterschiede<br />
der Aufnahme-Modi gehört haben, wurden diese Beispiele einzeln ausgewertet. Die<br />
erwähnenswerten Ergebnisse sind in der Tabelle 7 eingetragen.<br />
In diesem Zusammenhang wurden auch alle anderen Gerät-Quelle-Kombinationen<br />
einzeln ausgewertet und es ergaben sich tatsächlich eine bessere Übersicht. Nun gelingt<br />
eine Aussage über die einzelnen Geräte. Zur Veranschaulichung sind Grafiken der Aus-<br />
wertungen des jeweiligen Geräts unten in den Abbildungen 17 bis 19 angegeben.<br />
Bei Nexus sieht man bei Oboe (64,6% <strong>für</strong> SRC) und Gitarre (56,3% <strong>für</strong> SRC) eine<br />
Tendenz in der Kategorie a. In der Kategorie b sind sich bei Aufnahmen von Sprache<br />
(59,6% <strong>für</strong> WCLK) und Streichorchester (59,3% <strong>für</strong> SRC) verschiedene Tendenzen<br />
bemerkbar. Bei der Frage nach dem klareren Klang zeigt sich so gut wie keine Tendenz,<br />
in keiner Quellen-Art. Sowohl bei der Sprache (62,5% <strong>für</strong> WCLK) als auch bei dem<br />
15 luftiger/ offener wurde nicht unbedingt als positiv bewertet, eher als eine Art Sirren und negativ<br />
auffällige Verstärkung von Zischlauten bei Sprach-Beispielen<br />
37
——Auswertung der Ergebnisse, 4 bestimmte Kombinationen——<br />
näher luftiger klarer natürlicher<br />
DM 1000 W 45,4% (44) W 60,2% (59) W 45,5% (15)<br />
Sprache S 54,6% (53) S 39,8% (39) S 54,5% (18)<br />
Nexus W 40,7% (37) W 60,0% (18)<br />
Streichorchester S 59,3% (54) S 40,0% (12)<br />
Nexus W 43,8% (21)<br />
Gitarre S 56,3% (27)<br />
ADI-192DD W 57,7% (30)<br />
Gitarre S 42,3% (20)<br />
Tabelle 7: Auswertung der Ergebnisse, 4 bestimmte Kombinationen<br />
Streichorchester (60% <strong>für</strong> WCLK) wird <strong>für</strong> den natürlichen Klang (mit besonderer<br />
Aufmerksamkeit auf das Rauschen) mit einer sehr deutlichen Tendenz die Aufnahme<br />
mit WCLK bevorzugt.<br />
Bei DM 1000 fällt das Violoncello in der Kategorie a mit der Tendenz von 68,1%<br />
<strong>für</strong> SRC sehr deutlich auf. In der Kategorie b, in der es um den luftigen bzw. offenen<br />
Klang geht, fallen mehrere Instrumente auf: Oboe mit 55,8% <strong>für</strong> SRC, Sprache mit<br />
54,6% <strong>für</strong> SRC, Gesang mit 55,8%<strong>für</strong> SRC und Violoncello entgegengesetzt mit 56,9%<br />
<strong>für</strong> WCLK. Es fallen in der dritten Grafik ” klarer“ die Oboe mit 53,8% <strong>für</strong> SRC und<br />
die Sprache mit 60,2% <strong>für</strong> WCLK auf. Für den natürlichen Klang wird bei der Sprache<br />
zu 54,5% <strong>für</strong> Aufnahmen mit SRC gestimmt.<br />
ADI-192DD zeigt in der Kategorie a nur <strong>für</strong> die Oboe mit 55,6% <strong>für</strong> SRC eine<br />
erwähnenswerte Tendenz. Bei der Frage nach dem luftigen Klang fällt das Violoncello<br />
mit 55,3% <strong>für</strong> SRC auf sowie die Oboe mit 55,6% <strong>für</strong> WCLK und die Gitarre mit 57,7%<br />
<strong>für</strong> WCLK. Für den klareren Klang zeigt das Violoncello-Beispiel eine Tendenz zu SRC<br />
mit 58,7%. Der Klang wird bei beiden Aufnahme-Modi als natürlich empfunden.<br />
38
5.3 Interpretative Auswertung<br />
Aufgrund der Gesamtauswertung der Hörtests kann die Hypothese nicht <strong>für</strong> allgemein<br />
gültig erklärt werden. Die Mehrheit der Versuchspersonen ist nicht in der Lage, bei ei-<br />
ner Gegenüberstellung der beiden Aufnahme-Modi einen Unterschied festzustellen. Die<br />
Hypothese kann aber auch nicht gänzlich <strong>für</strong> allgemein ungültig erklärt werden, denn<br />
bestimmte Personen sind in der Lage, klangliche Unterschiede der Aufnahme-Modi zu<br />
erkennen und diese Erkennung zu reproduzieren.<br />
Die Berechnung des arithmetischen Mittelwerts von allen Hörtests ergibt keine Tenden-<br />
zen, die aussagekräftig wären. Die Mittelwerte weichen maximal 3,5% von der Mitte,<br />
also 50%, ab.<br />
Bei näherer Betrachtung der Untergruppen der Hörtests, also Untersuchungen einzel-<br />
ner Geräte und Quellen, zeigen sich vereinzelte Tendenzen, die zwar nicht sehr groß<br />
sind aber sich durchaus aus der Menge des mittleren Durchschnitts (50%) hervorheben.<br />
Bei der genaueren Betrachtung der drei verwendeten Geräte fällt in der Gesamt-<br />
auswertung keine wirklich ausschlaggebende Tendenz auf. Doch geht man weiter in die<br />
Details hinein, zeigen sich bestimmte Merkmale (Vergleiche Abbildungen 17 - 19).<br />
Besonders bei der Frage nach dem natürlichen Klang zeigt sich bei Nexus der Firma<br />
Stage Tec die Bevorzugung von Aufnahmen im Modus 2, mit WCLK. Die Tendenzen<br />
betragen beim Streichorchester 60% und bei der Sprache sogar 62,5%. Das ist ein nicht<br />
zu vernachlässigendes Ergebnis.<br />
Bei Aufnahmen mit dem digitalen Pult DM 1000 von Yamaha zeigen viele Instrumente<br />
zu erwähnende Tendenzen auf (siehe Kapitel 5.2, 18). Die Kombination Violoncello und<br />
DM 1000 scheint den klanglichen Unterschied der Aufnahmen im Modus 1 und 2 gut<br />
erkennbar zu machen. Die Sprache zeigt ebenfalls in den Kategorien b und c eindeutige<br />
Unterschiede auf. An der Gesangstimme erkennt man auch eine Tendenz in der Frage<br />
nach dem luftigen Klang.<br />
Der Formatwandler ADI-192DD der Firma RME lässt keinen Unterschied im natürlichen<br />
Klang erkennen. Da<strong>für</strong> zeigen sich in den Kategorien b und c bei den verschiedenen<br />
Instrumenten deutbare Tendenzen.<br />
Das Instrument Violoncello fällt bei den beiden letzteren Geräten in verschiedenen<br />
Kategorien mit relativ großen Tendenzen auf. Dabei stimmen aber die Tendenzrichtun-<br />
gen nicht immer überein. Bei der Frage nach dem luftigeren Klang gehen die Tendenzen<br />
auseinander. Möglicherweise sind bei dem obertonreichen Instrument die möglichen Un-<br />
terschiede im Frequenzgang und in der Klangfarbe gut zu erkennen ([12] S.83).<br />
Wie bereits oben erwähnt, zeigen sich bei der Kategorie a die größten Tendenzen,<br />
stets <strong>für</strong> Aufnahmen im Modus 1. Die Kategorie a: ” Es klingt näher“ ist eigentlich<br />
nicht wertend aufzufassen. Es ist lediglich eine Kategorie zur Feststellung, ob man<br />
39
Percent<br />
Percent<br />
70<br />
60<br />
50<br />
40<br />
30<br />
20<br />
10<br />
0<br />
60<br />
50<br />
40<br />
30<br />
20<br />
10<br />
0<br />
WC LK<br />
naeher<br />
klarer<br />
WCLK<br />
SRC<br />
SRC<br />
Instrumente<br />
Gitarre<br />
Sprache<br />
Oboe<br />
Streichorchester<br />
Instrumente<br />
Gitarre<br />
Sprache<br />
Oboe<br />
Streichorchester<br />
Percent<br />
Percent<br />
70<br />
60<br />
50<br />
40<br />
30<br />
20<br />
10<br />
0<br />
70<br />
60<br />
50<br />
40<br />
30<br />
20<br />
10<br />
0<br />
luftiger<br />
WCLK<br />
WCLK<br />
natürlicher/ Rauschen<br />
SRC<br />
SRC<br />
Instrumente<br />
Gitarre<br />
Sprache<br />
Oboe<br />
Streichorchester<br />
Instrumente<br />
Gitarre<br />
Sprache<br />
Streichorchester<br />
Abbildung 17: Grafiken: Auswertungen von bestimmten Kombinationen von Nexus und<br />
verschiedenen Quellen<br />
40
Percent<br />
Percent<br />
80<br />
70<br />
60<br />
50<br />
40<br />
30<br />
20<br />
10<br />
0<br />
80<br />
60<br />
40<br />
20<br />
0<br />
WC LK<br />
naeher<br />
klarer<br />
WCLK<br />
SRC<br />
SRC<br />
Instrumente<br />
Gitarre<br />
Vc<br />
Sprache<br />
Oboe<br />
Gesang&Klav ier<br />
Instrumente<br />
Gitarre<br />
Vc<br />
Sprache<br />
Oboe<br />
Gesang&Klav ier<br />
Percent<br />
Percent<br />
60<br />
50<br />
40<br />
30<br />
20<br />
10<br />
0<br />
60<br />
50<br />
40<br />
30<br />
20<br />
10<br />
0<br />
luftiger<br />
WC LK<br />
WCLK<br />
natürlicher/ Rauschen<br />
SRC<br />
SRC<br />
Instrumente<br />
Gitarre<br />
Vc<br />
Sprache<br />
Oboe<br />
Gesang&Klav ier<br />
Instrumente<br />
Abbildung 18: Grafiken: Auswertungen von bestimmten Kombinationen von DM 1000<br />
und verschiedenen Quellen<br />
41<br />
Gitarre<br />
Sprache
Percent<br />
Percent<br />
60<br />
50<br />
40<br />
30<br />
20<br />
10<br />
0<br />
60<br />
50<br />
40<br />
30<br />
20<br />
10<br />
0<br />
naeher<br />
klarer<br />
WCLK<br />
WCLK<br />
SRC<br />
SRC<br />
Instrumente<br />
Gitarre<br />
Vc<br />
Sprache<br />
Oboe<br />
Instrumente<br />
Gitarre<br />
Vc<br />
Sprache<br />
Oboe<br />
Percent<br />
Percent<br />
60<br />
50<br />
40<br />
30<br />
20<br />
10<br />
0<br />
60<br />
50<br />
40<br />
30<br />
20<br />
10<br />
0<br />
luftiger<br />
WCLK<br />
WCLK<br />
natürlicher/ Rauschen<br />
SRC<br />
SRC<br />
Instrumente<br />
Gitarre<br />
Vc<br />
Sprache<br />
Oboe<br />
Instrumente<br />
Abbildung 19: Grafiken: Auswertungen von bestimmten Kombinationen von ADI-<br />
192DD und verschiedenen Quellen<br />
42<br />
Gitarre<br />
Sprache
einen Unterschied in der klanglichen Abbildung wahrnehmen kann, ohne im Voraus zu<br />
wissen, ob der SRC die Abbildung positiv oder negativ beeinflusst. Die Aufnahmen im<br />
Modus 1 (mit SRC) scheinen also in ihrer Tiefenabbildung der Quelle zu beeinflusst<br />
zu werden. Sie klingen näher, was mit ” flacher“ , weniger Tiefenabbildung ” übersetzt“<br />
werden kann.<br />
In der Kategorie b: ” Es klingt luftiger“ zeigt sich nur in zwei bestimmten Untergrup-<br />
pen eine erwähnenswerte Tendenz: bei den Gesang-Aufnahmen (55,8% <strong>für</strong> SRC) und<br />
den Streichorchster-Aufnahmen (59,3% <strong>für</strong> SRC). Es ist fraglich, ob diese zwei Tenden-<br />
zen aussagekräftig genug sind, um eine Aussage treffen zu können. Da es sich jedoch um<br />
eine Auswertung von allen Tests handelt, kann dieser Mittelwert über alle Tests nicht<br />
unbeachtet bleiben. Die Tendenz geht hier ebenfalls zu Gunsten der Aufnahmen im<br />
Modus 1. Man könnte vermuten, dass es durch den zusätzlichen Einsatz von SRC zur<br />
verzerrten Wiedergabe von hohen Frequenzen kommt, da die Obertöne verstärkt wer-<br />
den. Es sind Spektralanalysen (FFT) von Aufnahmen in beiden Modi gemacht worden,<br />
woraus man aber keine auffälligen Spektralunterschiede erkennen konnte. Also bleibt<br />
die Verzerrung von hohen Frequenzen eher eine Vermutung, ein Versuch, diese Tendenz<br />
zu erklären.<br />
Diese Vermutungen über die Ergebnisse in den Kategorien a und b würden der Be-<br />
obachtung der Versuchperson 17 bzw. 42 entsprechen. Sie nannte genau diese beiden<br />
Merkmale, an denen sie sich orientiert habe: die Präsenzanhebung und die Tie-<br />
fenabbildung.<br />
Bei der Kategorie c: ” Es klingt klarer“ zeigen sich folgende Tendenzen in zwei ver-<br />
schiedenen Untergruppen: bei den Violoncello-Aufnahmen (63,9% <strong>für</strong> SRC) und bei<br />
den Sprache-Aufnahmen (54,3% <strong>für</strong> WCLK). Hier gehen die Tendenzen in entgegen-<br />
gesetzte Richtungen. Diese Kategorie scheint entweder nicht eindeutig aufzufassen zu<br />
sein oder sie äußert sich je nach Art der Quelle/Instrumente verschieden.<br />
Die Kategorie d: ” Es klingt natürlicher (auf das Rauschen achten)“ zeigt in der<br />
Gesamtauswertung keine wirkliche Tendenz (51,6% <strong>für</strong> WCLK). Bei Fallunterschei-<br />
dungen sieht man bei der Auswertung von Test B (54,2% <strong>für</strong> WCLK), der gesonderte<br />
Auswertung von Aufnahmen mit Nexus (56,4% <strong>für</strong> WCLK) und der Auswertung von<br />
Streichorchester-Aufnahmen (60% <strong>für</strong> WCLK) eine Tendenz, die etwas größer ist als<br />
die in den restlichen Fällen. Hier gehen die Tendenzen alle in Richtung des Aufnahme-<br />
Modus 2, mit WCLK. Es stellt sich die Frage, ob der SRC eine Verschlechterung des<br />
Raumrauschens verursacht (Vgl. Kapitel 2.4).<br />
Es scheint <strong>für</strong> ein geübtes Gehör sehr wohl möglich zu sein, gewisse Unterschiede<br />
43
zwischen den Aufnahmen in den verschiedenen Modi festmachen zu können, wenn auch<br />
nicht mit bestimmter, größter Sicherheit in der Mehrheit. Bei Aufnahmen (im Modus<br />
1) mit bestimmen Geräten in Kombination mit bestimmten Instrumenten wird der<br />
Unterschied möglicherweise hörbar. Ob man den klanglichen Unterschied wahrnimmt<br />
oder nicht, hängt im wesentlichen von der Qualität des verwendeten Geräts und seinem<br />
SRC ab, aber auch die Art von Schallquelle scheint eine Rolle zu spielen.<br />
Man kann auf kleine Qualitätsunterschiede der Geräte und deren SRC schließen. Wenn<br />
es um die Frage nach dem natürlichen Klang geht, scheint der SRC des Nexus den<br />
eindeutigsten klanglichen Unterschied zu verursachen. In der Frage nach dem lufti-<br />
gen Klang zeigt sich bei DM 1000 die größte Tendenz, besonders in Kombination mit<br />
Violoncello. In der Kategorie a, wo es um die Frage der Tiefenabbildung geht, zeigen<br />
alle drei Geräte die gleiche Tendenz auf, so dass man sogar eine allgemeine Aussa-<br />
ge treffen kann: Die Benutzung von SRC verursacht eine kleine aber immerhin bei<br />
allen drei Geräten gleichartig wahrnehmbare verzerrte Wiedergabe der Tiefenabbil-<br />
dung (die Tiefe des Raumes verringert sich). Die in den Vorüberlegungen zum Hörtest<br />
eher ausgeschlossenen vage Vermutung über die Verzerrung von hohen Frequenzen ist<br />
möglicherweise doch in bestimmen Fällen (Nexus: Streichorchester; DM 1000: Sprache,<br />
Oboe, Gesangstimme; ADI-192DD: Violoncello, Sprache) anzunehmen.<br />
Man kann keine allgemeine Aussage über die Qualität der jeweiligen Abtastratenwand-<br />
ler der drei Geräte treffen. Sie scheinen auf verschiedene Weise unterschiedlich auf ver-<br />
schiedene Signale zu reagieren. Eine allgemeine Aussage ist schwer zu treffen. Es ist<br />
jedenfalls ersichtlich, dass alle drei Abtastratenwandler eine gewisse Veränderung des<br />
Originalsignals zu verursachen, die bei bestimmten Gegebenheiten sogar auditiv wahr-<br />
zunehmen sind.<br />
Der klangliche Unterschied, der durch den SRC verursacht wird, ist nicht auffällig,<br />
insbesondere nicht negativ. Manche Personen empfinden die Präsenzanhebung sogar<br />
angenehm. Gerade in der Frage nach dem natürlichen Klang ist keine negative Tendenz<br />
<strong>für</strong> die Aufnahmen im Modus 1 erkennbar.<br />
6 Fazit<br />
Die Testpersonen erkennen im Allgemeinen keinen eindeutigen Unterschied zwischen<br />
den Aufnahmen mit und ohne Abtastratenwandler. Bei Untersuchungen verschiedener<br />
differenzierter Zusammenhänge werden die klanglichen Unterschiede zwischen den Auf-<br />
nahmen im Modus 1 und 2 deutlicher ersichtlich. Da diese Unterschiede, die durch SRC<br />
entstehen, nicht von jedem als negativ empfunden werden und diese Unterschiede sehr<br />
gering sind, so dass nicht mal die Mehrheit der im kritischen Hören geübte Tonmeister-<br />
Studenten signifikante Unterschiede feststellen können, kann man die Aussage treffen,<br />
44
dass die SRC in den getesteten Geräten von hoher Qualität sind. Es gibt jedoch hörbare<br />
klangliche Unterschiede, die von SRC verursacht werden (siehe Kapitel 5.3). Eine Ab-<br />
tastratenwandlung ist daher eine zusätzliche potentielle Fehlerquelle. Es existieren auf<br />
dem Markt noch weitere digitale Mikrofone, wobei nicht alle beide Aufnahme-Modi<br />
im AES42-Standard anbieten, sondern nur den Modus 1. In diesen Fällen wird dann<br />
unbedingt ein SRC am Anschlussgerät benötigt. und zweitens vertraut man bereits auf<br />
die mittlerweile weit entwickelte, qualitativ hochwertige SRC.<br />
Die in dieser Arbeit untersuchten Geräte sind von hoher Qualität. Selbst bei diesen<br />
hochwertigen SRC werden bestimmte Signale verändert, auch wenn diese Änderungen<br />
nicht immer eindeutig hörbar sind.<br />
Aus den Ergebnissen des Hörtests ist ersichtlich, dass es nicht zu signifikanten Pro-<br />
blemen führt, wenn SRCs verwendet werden, vorausgesetzt, sie sind hochwertig.<br />
Grundsätzlich sollte das Signal aber in seiner Audiobearbeitungskette so wenig wie<br />
möglich bearbeitet werden. Eine zusätzliche Abtastratenwandlung ist nun mal eine<br />
zusätzliche Fehlerquelle, die im Zweifel besser vermieden werden sollte. Im Aufnahme-<br />
Modus 1 ist man stets von der jeweiligen Qualität des Abtastratenwandlers abhängig.<br />
45
Abbildungsverzeichnis<br />
1 Veranschaulichung der oben genannten drei Fälle der Abtastratenwand-<br />
lung (aus [1] S. 138) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6<br />
2 Veranschaulichung von verzerrtem Signal durch Jitter (nach [3] S. 223) 7<br />
3 Veranschaulichung vom Aufbau des Frames mit seinen Subframes (aus<br />
[1] S.451) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9<br />
4 technische Daten über SRC des ADI-192DD . . . . . . . . . . . . . . . 10<br />
5 Skizze des Signalflusses . . . . . . . . . . . . . . . . . . . . . . . . . . . 18<br />
6 Auszug aus dem Hörtest A zur Ansicht . . . . . . . . . . . . . . . . . . 23<br />
7 Zusatzinformation <strong>für</strong> den verschickten Hörtest . . . . . . . . . . . . . 24<br />
8 Der Seminarraum 1 des <strong>Erich</strong>-<strong>Thienhaus</strong>-<strong>Institut</strong>s der <strong>Hochschule</strong> <strong>für</strong><br />
<strong>Musik</strong> Detmold. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25<br />
9 Grafik zur Veranschaulichung von Ergebnissen der verschiedenen Geräte:<br />
Kategorie a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29<br />
10 Grafik zur Veranschaulichung von Ergebnissen der verschiedenen Geräte:<br />
Kategorie b . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29<br />
11 Grafik zur Veranschaulichung von Ergebnissen der verschiedenen Geräte:<br />
Kategorie c . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30<br />
12 Grafik zur Veranschaulichung von Ergebnissen der verschiedenen Geräte:<br />
Kategorie d . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30<br />
13 Grafik zur Veranschaulichung von Ergebnissen der verschiedenen Quelle:<br />
Kategorie a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32<br />
14 Grafik zur Veranschaulichung von Ergebnissen der verschiedenen Quelle:<br />
Kategorie b . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32<br />
15 Grafik zur Veranschaulichung von Ergebnissen der verschiedenen Quelle:<br />
Kategorie c . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33<br />
16 Grafik zur Veranschaulichung von Ergebnissen der verschiedenen Quelle:<br />
Kategorie d . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33<br />
17 Grafiken: Auswertungen von bestimmten Kombinationen von Nexus und<br />
verschiedenen Quellen . . . . . . . . . . . . . . . . . . . . . . . . . . . 40<br />
18 Grafiken: Auswertungen von bestimmten Kombinationen von DM 1000<br />
und verschiedenen Quellen . . . . . . . . . . . . . . . . . . . . . . . . . 41<br />
19 Grafiken: Auswertungen von bestimmten Kombinationen von ADI-192DD<br />
und verschiedenen Quellen . . . . . . . . . . . . . . . . . . . . . . . . . 42<br />
Tabellenverzeichnis<br />
1 Vier mögliche Ausgänge des Signalentdeckungsexperiments im vorlie-<br />
genden Hörtest (nach [8] S.231) . . . . . . . . . . . . . . . . . . . . . . 16<br />
46
2 Liste über Aufnahmen zum Hörtest . . . . . . . . . . . . . . . . . . . . 19<br />
3 Auswertung der Ergebnisse, Hörtest A und B. Die Anzahl der Wertungen<br />
sind in Klammern angegeben; W: WCLK, S: SRC . . . . . . . . . . . . 27<br />
4 Auswertung der Ergebnisse einzelner Geräte . . . . . . . . . . . . . . . 28<br />
5 Auswertung der Ergebnisse einzelner Schallquellen . . . . . . . . . . . . 31<br />
6 Auswertung der Ergebnisse, Tendenz-Diskrepanz . . . . . . . . . . . . . 34<br />
7 Auswertung der Ergebnisse, 4 bestimmte Kombinationen . . . . . . . . 38<br />
Literatur<br />
[1] Watkinson, J.: The art of digital audio. Focal Press, Third Version, 2001.<br />
[2] Pohlmann, K.C.: Principles of digital audio. Mc Graw Hill, 2004.<br />
[3] Görne, T.: Tontechnik. Fachbuchverlag Leipzig, 2006.<br />
[4] Werwein, M.: ” Kapitel 17.1 und 17.2: Wandler.“ Digitale Audiotechnik: Wandler,<br />
Prozessoren, Systemarchitektur, 2007.<br />
[5] Recommendation ITU-R BS.1284-1*: General methods for the subjective as-<br />
sessment of sound quality. Rec. ITU-R BS.1284-1, 1997-2003.<br />
[6] Audio Engineering Society: AES Standard for Acoustics - Digital interface for<br />
microphones. AES, INC., New York, USA, 30.09.2003.<br />
[7] Audio Engineering Society: ” AES3-2003“ AES Recommanded Practice for Digital<br />
Audio Engineering - Serial transmission format for two-channel linearly represen-<br />
ted digital audio data. AES, INC., New York, USA, 09.09.2003.<br />
[8] Hellbrück, J.; Ellermeyer, W.: Physiologie, Psychologie und Pathologie. Hogrefe,<br />
2004.<br />
[9] Bortz, J.; Döring, N.: Forschungsmethoden und Evaluation <strong>für</strong> Human- und Sozi-<br />
alwissenschaftler. Springer, 2001.<br />
[10] Maiello, C.: Verhaltenswissenschaftliche Forschung <strong>für</strong> Einsteiger. VEP, 2006.<br />
[11] Kiesler; August, O. : ” Detmold Seminarraum 1 Referenz-Mehrkanalabhörraum:<br />
Akustischer Prüfbericht Nr. 1/2006. Geithain, 10.01.2006.<br />
[12] Meyer, J.: Akustik und musikalische Aufführungspraxis. Erwin Bochinsky, 1999.<br />
47