03.03.2013 Aufrufe

DA Myung.pdf - Erich-Thienhaus-Institut - Hochschule für Musik ...

DA Myung.pdf - Erich-Thienhaus-Institut - Hochschule für Musik ...

DA Myung.pdf - Erich-Thienhaus-Institut - Hochschule für Musik ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Diplomarbeit<br />

Untersuchungen zum Klang digitaler Mikrofone:<br />

Zum Einfluss der AES42-Betriebsmodi<br />

Je-Young <strong>Myung</strong>, HfM Detmold, <strong>Erich</strong>–<strong>Thienhaus</strong>–<strong>Institut</strong><br />

Studiengang: <strong>Musik</strong>übertragung<br />

Abgabetermin: 27. März 2007<br />

Erstgutachter: Prof. Thomas Görne, HfM Detmold<br />

Zweitgutachter: Stephan Peus, Entwicklung der Georg Neumann GmbH


Inhaltsverzeichnis<br />

1 Einleitung 2<br />

2 Technischer Hintergrund 4<br />

2.1 Digitale Übertragung und Taktsynchronisierung . . . . . . . . . . . . . 4<br />

2.2 Grundlagen der Abtastratenwandlung . . . . . . . . . . . . . . . . . . . 5<br />

2.3 Erläuterungen zur verwendeten Technik . . . . . . . . . . . . . . . . . . 8<br />

2.3.1 Digitale Mikrofone . . . . . . . . . . . . . . . . . . . . . . . . . 8<br />

2.3.2 Die verwendeten Geräte mit Abtastratenwandler . . . . . . . . . 10<br />

2.4 Messungen mit Testsignalen . . . . . . . . . . . . . . . . . . . . . . . . 12<br />

3 Vorüberlegungen und Gedanken zum Hörtest 14<br />

3.1 Forced-Choice und Signalentdeckungstheorie . . . . . . . . . . . . . . . 15<br />

3.2 Aufnahmen <strong>für</strong> den Hörtest . . . . . . . . . . . . . . . . . . . . . . . . 18<br />

3.3 Kriterien zur Bewertung . . . . . . . . . . . . . . . . . . . . . . . . . . 19<br />

4 Versuchsaufbau und -durchführung 20<br />

4.1 Versuchsaufbau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20<br />

4.2 Versuchsdurchführung . . . . . . . . . . . . . . . . . . . . . . . . . . . 24<br />

4.3 Vortests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25<br />

5 Auswertung 25<br />

5.1 Allgemeines zur Auswertung des Hörtests . . . . . . . . . . . . . . . . . 25<br />

5.2 Deskriptive Auswertung . . . . . . . . . . . . . . . . . . . . . . . . . . 26<br />

5.3 Interpretative Auswertung . . . . . . . . . . . . . . . . . . . . . . . . . 39<br />

6 Fazit 44<br />

Abbildungsverzeichnis 46<br />

Tabellenverzeichnis 46<br />

Literatur 47<br />

1


1 Einleitung<br />

In den Aufnahmestudios setzt sich die digitale Audiotechnik immer mehr durch. Der<br />

Vorteil von miteinander vernetzten digitalen Geräten ist, dass zwischen diesen die feh-<br />

lerbehaftete Wandlung von analogen zu digitalen Signalen und umgekehrt entfällt.<br />

Jedoch muss bei der Vernetzung von digitalen Geräten eine saubere Lösung der Syn-<br />

chronisation jedes einzelnen Gerätes realisiert werden, um Synchronisationsprobleme<br />

und den dadurch verursachten Qualitätsverlust zu vermeiden.<br />

Relativ neu in der digitalen Audiobearbeitungskette ist das digitale Mikrofon. Das<br />

analoge Signal wird im Mikrofon selbst in ein digitales Signal gewandelt, so dass am<br />

Ausgang des Mikrofons ein digitales Signal im AES42-Standard (s.u.) anliegt. Dadurch<br />

können Daten- und Qualitätsverluste in der weiteren Audiosignalverarbeitung mini-<br />

miert werden:<br />

• Durch das Wegfallen von zusätzlichem Mikrofon-Vorverstärker und AD-Wandler,<br />

die <strong>für</strong> die Qualität des noch zu verarbeitenden Audiosignals entscheidend sind,<br />

kann der Datenverlust verringert werden.<br />

• Durch die vollständig digitale Kette in der Audiosignalverarbeitung kann auch<br />

bei Verwendung weniger hochwertigen Equipments mit geringem Qualitätsverlust<br />

des Audiosignals gearbeitet werden, da die AD-Wandlung entfällt.<br />

Die digitalen Mikrofone müssen wie alle digitalen Geräte mit dem Empfangsgerät<br />

synchronisiert werden. Zur Lösung des Synchronisationsproblems der digitalen Mikro-<br />

fone wurde im Jahr 2001 von der Audio Engineering Society das Format AES42 1 stan-<br />

dardisiert. Der AES42-Standard erlaubt zwei technische Wege <strong>für</strong> die Synchronisation<br />

der digitalen Mikrofone:<br />

• Mode 1: der interne Taktgenerator arbeitet asynchron oder<br />

• Mode 2: der interne Taktgenerator arbeitet synchron, indem er durch die Über-<br />

tragung der extern zugeführten Word Clock stabilisiert wird (siehe Kapitel 2.3.1).<br />

Bei der ersten Möglichkeit Mode 1 ist ein zusätzlicher Abtastratenwandler (eng-<br />

lisch: Sample Rate Converter, SRC) am Eingang des Anschlussgerätes des digitalen<br />

Mikrofons notwendig. Ohne diesen käme es zu Taktsynchronisationsfehlern, die durch<br />

beispielsweise Knistern im Audiosignal oder Dropouts 2 zu hören sein würden. Ein Sam-<br />

ple Rate Converter (SRC) führt eine zusätzliche Datenwandlung durch (siehe Kapitel<br />

2.2).<br />

Die Abtastratenwandlung ist in jedem Fall eine zusätzliche Fehlerquelle, insbesondere<br />

1 Der AES42-Standard wird im Kapitel 2.3.1 genauer erläutert.<br />

2 fehlende Samples<br />

2


wenn mehrere Mikrofone (bereits bei einem Stereopaar) gleichzeitig in Betrieb ge-<br />

nommen werden. Zwischen den beiden Mikrofonen, die in Mode 1 betrieben werden,<br />

kommt es durch den intern freilaufenden Taktgenerator zum Auseinanderdriften des<br />

Takts, d.h. die Anzahl der pro Sekunde generierten Samples am Mikrofon 1 und 2 ist<br />

nicht identisch. Ein exaktes Generieren der Abtastrate ist <strong>für</strong> freilaufende Taktgenera-<br />

toren nicht möglich. Die Abtastrate verändert sich ständig, da sie nicht stabil ist. Dies<br />

kann zu Jitter, also Zeitfehlern in Abfolge der Samples führen. Das Jitter kann eine<br />

instabile Taktgeneration verursachen, wodurch das Ausgangssignal verzerrt sein kann<br />

[3]. Um diese Fehler zu vermeiden, ist es die beste Lösung, die digitalen Mikrofone vom<br />

Anschlussgerät per externer Word Clock Leitung synchronisieren zu lassen (Mode 2),<br />

so dass die Signale beider Mikrofone (1 und 2) digital phasenstarr gekoppelt sind.<br />

Die Qualität des Audiosignals in Mode 1 ist zudem abhängig von der Qualität des<br />

jeweiligen Abtastratenwandlers. Sind die heutzutage in professionellen Studios verwen-<br />

deten SRC qualitativ so gut, dass man den technisch bedingten Qualitätsverlust des<br />

Audiomaterials bei Verwendung dieser SRC auditiv nicht wahrnehmen kann?<br />

Die zentrale Fragestellung in dieser Arbeit lautet:<br />

Ist ein Unterschied zwischen den Aufnahmen mit digitalen Mikrofonen in verschiedenen<br />

AES42-Modi auditiv eindeutig festzustellen? Inwieweit beeinflussen die angeschlosse-<br />

nen digitalen Geräte, insbesondere SRC die Klangqualität der digitalen Mikrofone?<br />

Wird die Verwendung von digitalen Mikrofonen die Qualität des zu verarbeitenden<br />

Audiomaterials unabhängig von weiteren angeschlossenen digitalen Geräten im Studio<br />

gemacht? Ist dies ein entscheidender Vorteil des digitalen Mikrofons im Vergleich zum<br />

analogen Mikrofon?<br />

Im folgenden soll am Beispiel der Neumann-Mikrofone durch Hörtests mit Hilfe<br />

von Testpersonen, die im kritischen Hören geübt sind, festgestellt werden, ob man den<br />

Unterschied zwischen den Aufnahmen in Mode 1 und 2 tatsächlich hören kann; ob also<br />

ein SRC in der Audiosignalverarbeitungskette zusätzlich verwendet wurde oder nicht.<br />

Um diesen klanglichen Unterschied, der durch die Abtastratenwandlung in Echtzeit<br />

(die nicht fehlerfrei funktionieren kann; siehe Kapitel 2.2) am Empfangsgerät verur-<br />

sacht wird, im Hörtest richtig darstellen zu können, müssen die Beispiele in beiden<br />

Modi parallel und gleichzeitig aufgezeichnet werden. Zur Darstellung des Synchroni-<br />

sationsproblems ist die mehrkanalige Aufzeichnung des Signals ausschlaggebend. Bei<br />

der Verwendung mehrerer Mikrofone in Mode 1 ergibt sich, wie bereits oben erwähnt,<br />

das Problem des Auseineinanderdriftens des instabilen, freilaufenden Taktgenerators<br />

zwischen den Mikrofonen. Die Anzahl der pro Sekunde generierten Samples stimmt in<br />

diesem Fall zwischen den Mikrofonen nicht überein. Das Mikrofon 1 könnte z.B. mit<br />

44.002 Samples pro Sekunde getaktet sein und das Mikrofon 2 mit 43.997 Samples pro<br />

Sekunde. Die dann benötigte neue Abtastung der Signale mit dieser unterschiedlichen<br />

Anzahl der Samples durch die SRC am Empfangsgerät verursacht eine technisch nach-<br />

3


weisbare Veränderung des Signals.<br />

Wird die mehrkanalige Aufnahme in Mode 2 betrieben, sind die Signale der Kanäle<br />

digital phasenstarr gekoppelt, so dass es zu keinem Taktproblem führen kann.<br />

Dieser technisch wesentliche Unterschied kann nur durch eine gleichzeitige, parallele<br />

und mehrkanalige Aufzeichnung (mindestens stereophon) einer Quelle (z.B. Instru-<br />

mente oder Sprache) realisiert werden. Dies wird hier mit zwei verschiedenen Mikro-<br />

fonpaaren umgesetzt, d.h. es werden zwei verschiedene Stereopaare (insgesamt vier<br />

Mikrofone) aufgestellt.<br />

Die verlangte Situation kann also nur durch die parallele Signalaufzeichnung in Mode<br />

1 und 2 in Echtzeit erreicht werden. Die Idee, die Aufnahme mit einem Mikrofon-<br />

paar in Mode 2 durchzuführen und anschließend das in Mode 2 aufgezeichnete Signal<br />

über einen SRC zu schicken, würde das Synchronisationsproblem des Mode 1 in ei-<br />

ner Live-Aufnahme Situation nicht nachstellen können, da das bereits in Mode 2 auf-<br />

gezeichnete, verwendete Signal kein Taktproblem enthält. Das Signal kann ebenfalls<br />

nicht von einem Mikrofonpaar aufgezeichnet und dann gesplittet werden, da die Infor-<br />

mation des gewählten Synchronisationsmodes über die AES42 Leitung zum Mikrofon<br />

übertragen wird. Über diese Leitung können selbstverständlich nicht beide Modi auf<br />

einmal übertragen werden.<br />

2 Technischer Hintergrund<br />

2.1 Digitale Übertragung und Taktsynchronisierung<br />

Bei der digitalen Übertragung von Daten in der Audiotechnik ist die Synchronisierung<br />

der miteinander verbundenen digitalen Geräte unumgänglich. Um verschiedene digitale<br />

Studiogeräte in ihrer Übertragungskette fehlerfrei bedienen zu können, müssen diese<br />

in einem gleichen synchronen Takt betrieben werden. Geschieht dies nicht und läuft<br />

jedes digitale Gerät mit der eigenen intern generierten Taktfrequenz, kommt es zu Da-<br />

tenübertragungsfehlern wie z. B. Dropouts oder Glitches 3 [3], die man in Form von<br />

Knacksern oder Amplitudenschwankungen hören kann.<br />

Die Taktsynchronisierung in der digitalen Übertragungskette kann folgendermaßen rea-<br />

lisiert werden:<br />

• durch einen Wordclock-Master in Form des ersten Gerätes in der Übertragungskette,<br />

der allen weiteren Anschlussgeräten den Takt über selbsttaktende Schnittstellen,<br />

wie z.B. AES3, vorgibt<br />

• durch einen zentralen Wordclock-Generator, der allen Geräten den Takt vorgibt.<br />

Bei dieser Lösung sind alle Geräte ” sternförmig“ mit dem Wordclock-Generator<br />

verbunden. Da<strong>für</strong> muss jedoch gewährleistet sein, dass jedes Gerät einen externen<br />

3 Diskontinuitäten im Ampiltudenverlauf<br />

4


Wordclock-Eingang besitzt (z.B. BNC Leitung), was in der Realität oft nicht<br />

zutrifft.<br />

Sind beide Möglichkeiten ausgeschlossen, müssen die Geräte trotzdem mit der sel-<br />

ben synchronen Taktfrequenz laufen. Dies kann durch eine zusätzliche Abtastraten-<br />

wandlung am Eingang des jeweiligen Anschlussgerätes erfolgen. Einige digitale Misch-<br />

pulte bieten daher einen SRC an den digitalen Eingangsanschlüssen in Form einer<br />

zusätzlichen ” digitalen I/O Karte“ an. Eine Abtastratenwandlung ist jedoch eine hin-<br />

zukommende Fehlerquelle, denn die Daten werden hierbei ein weiteres, zusätzliches<br />

Mal be- und verarbeitet. Bei schlechter Qualität des SRC (hierauf wird im nächsten<br />

Unterkapitel näher eingegangen) kann es zu Audioqualitätsverlusten kommen.<br />

2.2 Grundlagen der Abtastratenwandlung<br />

In der heutigen Studiotechnik gibt es in verschiedenen Bereichen der Medienwelt histo-<br />

risch und entwicklungstechnisch bedingt zahlreiche und verschiedene Abtastraten: 44.1<br />

kHz bei CD’s, 48 kHz in den Rundfunkanstalten im Zusammenhang mit der Bildtech-<br />

nik, 32 kHz in Broadcast etc. Es kann bei dieser Vielzahl von gängigen Abtastraten<br />

erforderlich sein, mehrfache Abtastratenwandlungen in der Audioverarbeitungskette<br />

durchzuführen.<br />

Es gibt drei verschiedene Fälle der Abtastratenwandlung. Die Abtastratenwandlung<br />

um einen<br />

1. ganzzahligen Faktor: z. B. von 48 kHz auf 96 kHz (a)<br />

2. rationalen Faktor: z. B. von 48 kHz auf 32 kHz (b)<br />

3. reellwertigen Faktor: z. B. von 44.1 kHz auf 48 kHz (c)<br />

In den beiden ersten Fällen kann die Wandlung durch Oversampling und anschlie-<br />

ßend ganzzahlige Dezimation fehlerfrei ausgeführt werden. Im dritten Fall jedoch ist die<br />

Wandlung komplexer. Dieser Fall ermöglicht aber die Abtastratenwandlung <strong>für</strong> jedes<br />

Verhältnis zwischen der Eingangs- und Ausgangsabtastrate. Daher ist diese Art der<br />

Wandlung in der Praxis weit verbreitet.<br />

In Prinzip funktioniert der SRC gemäß der dritten Art, die auch als ” asynchrone Ab-<br />

tastratenwandlung“ bezeichnet wird, folgendermaßen:<br />

Das Eingangssignal mit seiner Abtastrate wird durch im Idealfall unendlich hohe In-<br />

terpolation überabgetastet (Oversampling), so dass daraus durch die darauf folgende<br />

Dezimation jede beliebige Abtastrate am Ausgang realisiert werden kann. Zum Schluss<br />

wird das Ausgangssignal mit der neuen Abtastrate durch einen linearphasigen FIR-<br />

Filter (Tiefpassfilter) geschickt, damit die Aliasingfehler herausgefiltert werden.<br />

Die Qualität des Abtastratenwandlers hängt von der Höhe der Interpolation ab: Je<br />

höher desto besser die Qualität. Im Idealfall wäre die Interpolation unendlich hoch,<br />

5


Abbildung 1: Veranschaulichung der oben genannten drei Fälle der Abtastratenwand-<br />

lung (aus [1] S. 138)<br />

was einer Analogwandlung gleich käme. Die asynchrone Abtastratenwandlung kann al-<br />

so auch mit D/A- und A/D-Wandlung ausgeführt werden. Da dies aber sehr aufwendig<br />

ist, bleibt man in der digitalen Ebene und gibt sich mit einer begrenzten Höhe der<br />

Interpolation zufrieden. Die notwendigen Werte lägen zwischen 16 Bit und 24 Bit. Da<br />

es jedoch zu einer riesigen Datenmenge führen würde, pro Sample 2 24 Abtastwerte zu<br />

produzieren, hat man ein Verfahren entwickelt, das ” Segment-Interpolation“ genannt<br />

wird. Wenn das umzurechnende Abtastraten-Verhältnis vorher bekannt ist und das<br />

Verhältnis konstant bleibt, kann man die Zeitpunkte der zur Wandlung benötigten<br />

Werte errechnen und damit nur diese Werte berechnen lassen. Somit werden nur die<br />

ausschlaggebenden Werte berechnet und die Datenmenge vergrößert sich nicht unnötig.<br />

In der Realität jedoch bleibt das Verhältnis zwischen der Eingangs- und Ausgangsab-<br />

tastrate nicht korrekt konstant, da es sich um eine Wandlung im reellwertigen Faktor<br />

handelt. Um den Jitterfehler zu verringern, der durch neues Abtasten zum falschen<br />

Zeitpunkt zustande kommt, wird ein Durchschnittswert des Verhältnisses aus einer<br />

bestimmten Zeiteinheit (mehrere Perioden) stetig berechnet, mit dem der Wandler ar-<br />

beitet. Die Qualität der Wandlung ist abhängig von der Stärke der Mittelung: Je stärker<br />

die Mittelung desto Jitter-unempfindlicher der Wandler. Die zunehmende Stärke der<br />

Mittelung bringt jedoch eine größere Latenz mit sich. Zur Berechnung des Mittelungs-<br />

wertes wird ein Speicher namens FIFO (First In First Out) benötigt, in dem der Mit-<br />

telungswert zwischengespeichert wird. Wenn die Zeiteinheit der Mittelung groß ist,<br />

6


wodurch der Jitterfehler verringert wird, benötigt man einen größeren FIFO-Speicher.<br />

Hierbei muss man dann allerdings die wachsende Latenz in Kauf nehmen. Umgekehrt<br />

reicht ein kleiner FIFO-Speicher aus, wenn die Zeiteinheit kleiner ist. Dann nimmt zwar<br />

die Latenz ab, aber der Wandler reagiert empfindlicher auf Jitterfehler [4].<br />

An dieser Stelle soll der Begriff Jitter im allgemeinen erklärt werden, denn dies ist<br />

der ausschlaggebende Fehler, der sich bei der qualitativ schlechten Abtastratenwand-<br />

lung hörbar bemerkbar machen kann.<br />

Der Begriff Jitter stammt aus der englischen Sprache und bedeutet Fluktuation oder<br />

Schwankung. Jitter ist ein Zeitfehler, der durch ” falsches“ Abtasten (Fluktuation oder<br />

Schwankung in der zeitlichen Komponente der Abtastung von Audiosignalen) entsteht.<br />

Hierbei handelt es sich sowohl um die Abtastung von analogen als auch digitalen Signa-<br />

len: Es kommt sowohl in der A/D- und D/A-Wandlung, als auch in der Abtastraten-<br />

wandlung vor. Jitter kann bei jeder neuen Abtastung vorkommen. Mit der ” falschen“<br />

Abtastung ist die Ungenauigkeit in der zeitlichen Abfolge der Abtastung gemeint, d.h.<br />

die Abtastung geschieht an falschen Stellen des abzutastenden Signals (aufgrund von<br />

Schwankungen in der Zeit des Abtastens) und es kommt so zur Verfälschung des ur-<br />

sprünglichen Signals. Dieser Fehler bildet sich sowohl in der Amplitude als auch in der<br />

Phasenlage und kann zu hörbaren Artefakten führen.<br />

Abtastung mit Jitter korrekte Übertragung verzerrtes Ausgangssignal<br />

korrekt abgetastetes Signal<br />

t t t<br />

t<br />

Jitter bei der Übertragung verzerrtes Ausgangssignal<br />

t t<br />

Abbildung 2: Veranschaulichung von verzerrtem Signal durch Jitter (nach [3] S. 223)<br />

Hier wollen wir das Augenmerk auf den Fall der Abtastratenwandlung richten. Die<br />

Jitterempfindlichkeit wird mit zunehmender Höhe der Überabtastung reduziert, da sich<br />

mit sehr hoher Überabtastung so gut wie jede neue Abtastrate mit weniger Ungenauig-<br />

keiten bzw. weniger Abweichung von neuen gewünschten Abtaststellen erstellen lässt.<br />

Die Methode der Mittelung des Eingangs- und Ausgangsabtastraten-Verhältnisses, die<br />

zur Stabilisierung des idealerweise nicht schwankenden Takts benötigt wird, wurde im<br />

Kapitel 2.2 näher erläutert.<br />

7


2.3 Erläuterungen zur verwendeten Technik<br />

2.3.1 Digitale Mikrofone<br />

Die ” Georg Neumann GmbH“ stellte zwei Stereo-Paare des Typs digitaler Mikrofone<br />

KMD aus der Serie ” Blue Diamonds“ mit Nieren-Charakteristik <strong>für</strong> die Aufnahmen<br />

des Audiomaterials <strong>für</strong> den Hörtest zur Verfügung. Diese Mikrofone haben die identi-<br />

sche Mikrofonkapsel wie die Nierenmikrofone der analogen Serie KM 140.<br />

Zu je zwei Mikrofonen gehört ein ” Digital Microphone Interface DMI-2“ , an das die<br />

Mikrofone direkt mit einem XLR3 Kabel angeschlossen werden. Das Interface bietet<br />

je zwei einzelne XLR Eingangs- und Ausgangssteckfelder an. Jedes Mikrofon sendet<br />

ein digitales Signal im AES42 Datenformat an das Interface und das Interface wieder-<br />

um sendet Informationen wie z.B. die digitale Phantomspeisung und den Synchroni-<br />

sationsmode zum Mikrofon über den AES42-2001 Standard. Das Interface dient zur<br />

Umwandlung des AES42 Datenformats in ein AES3 Signal, auch AES/EBU genannt.<br />

Das AES3 ist ein professionelles digitales Datenformat <strong>für</strong> die Übertragung von<br />

zwei digitalen Audiosignalen in einer Leitung. Die Leitung ist mit Biphase Mark 4 ko-<br />

diert. Der Anschluss ist symmetrisch und erfolgt über XLR. Die Pinbelegung sieht wie<br />

folgt aus: 1 = Abschirmung, 2 = Signal (+), 3 = Signal (-). Ein ” Block“ in der AES3-<br />

Übertragung enthält einen AES3-Frame, der wiederum zwei AES3-Subframes enthält.<br />

Ein AES3-Subframe besteht aus 32 Bit, wobei 24 Bit Audiodaten enthalten und 8 Bit<br />

weitere Zusatzdaten. Ein Frame besteht also aus 64 Bit. 192 Frames bilden einen Block<br />

bei der Übertragung [3]. Jedes Subframe enthält abwechselnd entweder die Audiodaten<br />

des ersten oder des zweiten Kanals. Zur Kennzeichnung von neuen Anfängen des jewei-<br />

ligen Subframes wird eine Präambel gesetzt, deren Länge 4 Bit beträgt. Die digitalen<br />

Mikrofone könnten beispielsweise natürlich auch direkt an den Eingang eines digitalen<br />

Mischpultes angeschlossen werden, wenn dieser den AES42-2001 Standard unterstützt.<br />

Da dies aber heute noch nicht der Fall ist (es sind bis heute noch keine digitalen Misch-<br />

pulte auf dem Markt, die den AES42-2001 Standard unterstützen), wird das Interface<br />

benötigt.<br />

Der AES24-2001 Standard ist ein digitales Datenformat. Dieses Format ist eine<br />

Weiterentwicklung des AES3 Standards <strong>für</strong> digitale Mikrofone. Es wurde im Jahr 2001<br />

von der Audio Engineering Society standardisiert. Dieses Format unterstützt den An-<br />

schluss von monophonen und stereophonen digitalen Audiosignalen. Bei einem mono-<br />

phonen Signal wird das Signal zweimal hintereinander in beiden Subframes übertragen<br />

[7].<br />

4 Der Biphase Mark-Code ist einer der Manchester-Codes, welche halfbauded sind (d.h. die Pulsbreite<br />

entspricht einer halben Bitdauer) und deren Clockgehalt maximal ist. Biphase Mark ist selbsttaktend<br />

und phasentolerant. Er wird in mehreren Übertragungsstandards in der digitalen Audiotechnik<br />

eingesetzt [3].<br />

8


Abbildung 3: Veranschaulichung vom Aufbau des Frames mit seinen Subframes (aus<br />

[1] S.451)<br />

Über AES24 lässt sich die Übertragung von digitaler Phantomspeisung (DPP), digita-<br />

len Audiosignalen (AES3 kompatibler Datenstrom) und die Fernsteuerung der digitalen<br />

Mikrofone realisieren. Es gibt einen spezifischen Anschluss <strong>für</strong> digitale Mikrofone: den<br />

XLD Anschluss. Dieser Kabelanschluss hat wie ein XLR Anschluss drei Kontakte, de-<br />

ren Pinbelegung identisch ist mit der des XLR (s.o.). Dieser XLD Anschluss ist optional<br />

mit einem so genannten ” Zebra coding ring“ am Stecker gekennzeichnet, welcher dar-<br />

auf hinweist, dass dieses Kabel zur Übertragung von digitalen Audiosignalen gedacht<br />

ist [6].<br />

Das Interface DMI-2 wird mit der von ” Neumann“ entwickelten ” RCS “ (Neu-<br />

mann Remote Control Software) bedient, die auf einem Computer installiert wird.<br />

Die Verbindung vom Interface zum Computer erfolgt durch eine Konvertierung von<br />

USB-Schnittstelle auf RS 485 (Netzwerkstecker). Bei mehr als zwei Mikrofonen können<br />

mehrere Interfaces miteinander kaskadiert werden. Dabei ist jedes einzelne Mikrofon<br />

individuell per Fernsteuerung einstellbar. Die einstellbaren Parameter sind: Gain, Fil-<br />

ter (Low Cut), Vordämpfung, Limiter, Phase, Abtastrate (44.1, 48, 88.2, 96, 176.4, 192<br />

kHz), Synchronisationsmode, Testsignale und Signallicht.<br />

Wie bereits in der Einleitung erwähnt, müssen die digitalen Mikrofone mit allen an-<br />

deren digitalen Geräten in der Übertragungskette synchronisiert werden. In der Fern-<br />

steuerung der digitalen Mikrofone ist ein Wahlfeld eingerichtet, das die Auswahl zwi-<br />

schen 2 Modi zur Sychronisation der Mikrofone ermöglicht.<br />

Für den Mode 2, in welchem ein externes Word Clock-Signal empfangen wird, gibt es<br />

einen BNC Anschluss am DMI-2 Interface. Es wird dem AES42-2001 Standard entspre-<br />

chend gearbeitet; d.h. auf der Empfängerseite des Mikrofonsignals wird ein Frequenzen-<br />

Phasenvergleich mit einer Masterclock durchgeführt. Hierbei entsteht ein träges Regel-<br />

signal (engl.: control voltage) zum Steuern eines VCXOs (Voltage controlled crystal<br />

9


oscillator), das im Mikrofon verwendet wird. Es kommt zu einem so genannten PLL<br />

(Phase Locked Loop), eine geschlossene phasenlineare Schleife. Das durch PLL erzeug-<br />

te Regelsignal wird über den Remote-Control-Datenstrom zum Mikrofon übertragen.<br />

Wird eine Word Clock von außen angeschlossen, schaltet sich der Synchronisations-<br />

modus automatisch darauf ein.<br />

Im Mode 1 werden die digitalen Mikrofone vom intern generierten Takt asynchron ge-<br />

taktet (siehe Einleitung). In diesem Fall benötigt man jedoch wie bereits erwähnt einen<br />

zusätzlichen SRC am Eingang des Anschlussgeräts [6].<br />

2.3.2 Die verwendeten Geräte mit Abtastratenwandler<br />

Als Anschlussgeräte, die den digitalen Mikrofonen entweder die externe Word Clock lie-<br />

fern oder den Sample Rate Converter an ihren Eingängen ” anbieten“ , wurden folgende<br />

Geräte verwendet:<br />

• die digitale Kreuzschiene ” Nexus“ (im <strong>Erich</strong>-<strong>Thienhaus</strong>-<strong>Institut</strong> installiert) von<br />

der ” Stage Tec Entwicklungsgesellschaft <strong>für</strong> professionelle Audiotechnik mbH“<br />

mit der AES/EBU Karte mit SRC,<br />

• das digitale Mischpult ” DM 1000“ von der ” Yamaha Corporation“ mit der digi-<br />

talen Schnittstellenkarte (engl.: Digital I/O Card) ” MY8-AE96S“ (Es sind keine<br />

Herstellerangaben über die technischen Daten der SRC zu finden),<br />

• der Format- und Abtastratenwandler (engl.: Triple Universal Format and Sample<br />

Rate Converter) ” ADI-192DD“ von ” RME-Intelligence Audio Solutions“ . Die<br />

technischen Daten über die SRC des Format- und Abtastratenwandlers ADI-<br />

192DD sind der Bedienungsanleitung zu entnehmen (siehe Abbildung 4).<br />

Abbildung 4: technische Daten über SRC des ADI-192DD<br />

Diese drei Geräte verfügen über AES3 Schnittstellen (sowohl Ein- als auch Ausgänge)<br />

mit optional einschaltbaren Abtastratenwandlern am Eingang, so dass das Signal vom<br />

digitalen Mikrofon, das im Interface DMI-2 von AES42 auf AES3 umgewandelt wird,<br />

10


ohne jegliche zusätzliche Formatwandlung direkt an den Eingang des Virtual-Studio-<br />

Systems ” Pyramix“ angeschlossen werden kann. Es wurde darauf geachtet, dass es zu<br />

so wenig Bearbeitung des Audiosignals wie möglich kommt, um eventuelle Fehlerquel-<br />

len und damit jegliche Qualitätsverluste zu vermeiden.<br />

Bei allen drei genannten Geräten ist es möglich, die Aufnahme mit den KMD Mikro-<br />

fonen entweder in Mode 1 oder 2 durchzuführen.<br />

Leider ist es nicht möglich, über den Format- und Abtastratenwandler ” ADI-192DD“<br />

die beiden oben genannten Synchronisationsmöglichkeiten (Mode 1 und 2) in verschie-<br />

denen Kanälen gleichzeitig durchzuführen, was mit den beiden anderen Geräten möglich<br />

ist. Bei diesem Gerät kann man die SRC <strong>für</strong> die verwendete Schnittstelle (in diesem<br />

Fall AES3) komplett ein- oder einschalten, aber nicht <strong>für</strong> jeden einzelnen Kanal sepa-<br />

rat. Das ist bei den beiden anderen Geräten möglich.<br />

Alle drei Geräte verfügen über je 4 AES3 Ein- und Ausgangssteckfelder. Für die Auf-<br />

nahmen <strong>für</strong> den Hörtest wurden genau je 4 Eingänge und Ausgänge mit jeweiligem<br />

Steckfeld benötigt 5 .<br />

Bei der gleichzeitigen Aufzeichnung des identischen Audiomaterials mit den verschie-<br />

denen Synchronisationsmöglichkeiten musste man im Falle des Converters ADI-192DD<br />

also auf eine Ausnahme eingehen: das Audiomaterial des einen Mikrofonpaares wurde<br />

über den Converter ADI-192DD mit eingeschalteten SRC am Eingang aufgezeichnet<br />

und das Audiomaterial des anderen Mikrofonpaares musste über ein anderes Gerät (in<br />

diesem Fall DM 1000) mit Word Clock Eingang aufzeichnet werden. Dies beeinträchtigt<br />

jedoch nicht die Qualität der Aufzeichnungen, denn es ist im Grunde genommen <strong>für</strong><br />

die Qualität der Audiodaten gleichgültig, über welches Gerät man ein digitales Signal<br />

aufzeichnet, wenn es über die Taktsynchronisierung mit externem Word Clock Eingang<br />

arbeitet. Die Gültigkeit des Testaufbau ist demnach nicht gefährdet.<br />

Es war also möglich, das identische Audiomaterial gleichzeitig durch die beiden KMD<br />

Stereo Pärchen sowohl im Mode 1 als auch mit externem Word Clock Eingang vom<br />

jeweiligen (oben genannten) Gerät aufzuzeichnen.<br />

Die Aufzeichnung geschah auf dem Virtual-Studio-System ” Pyramix“ der Firma ” Mer-<br />

ging Technologies“ , das im <strong>Erich</strong>-<strong>Thienhaus</strong>-<strong>Institut</strong> vorhanden ist. Dabei wurden die<br />

Audiodaten mit 24 Bit und 44.1 kHz aufgezeichnet.<br />

Die oben genannten drei Geräte spielen in dem in der Arbeit vorgesehenen Hörtest<br />

die zentrale Rolle. Die eventuell hörbaren klanglichen Unterschiede, nach welchen hier<br />

gesucht wird, sind in erster Linie abhängig von der Qualität dieser Geräte, präziser<br />

ausgedrückt, von der Qualität der SRC, die in diesen Geräten eingebaut sind. Das<br />

Ziel des Hörtests ist ja gerade, herauszufinden, ob verschiedene Geräte durch die un-<br />

terschiedliche Qualität der eingebauten SRC die resultierende Qualität der mit den<br />

digitalen Mikrofonen aufgezeichneten Audiodaten derart beeinflussen, dass das geübte<br />

5 Zwei Stereopaare mit je einzelnen Ausgängen<br />

11


Gehör diesen Unterschied tatsächlich und nachweislich wahrnehmen kann.<br />

Es ist leider nicht möglich, Information über die genauen technischen Daten und<br />

Arbeitsweise der einzelnen SRC des jeweiligen Gerätes zu erhalten (außer die Daten von<br />

ADI-192DD, siehe Abbildung 4). Es wird in dieser Arbeit die Hypothese aufgestellt,<br />

dass es einen hörbaren Unterschied zwischen den Aufnahmen im Mode 1 und 2 geben<br />

kann. Es ist anhand der optischen Darstellung der Wellenformen und der Überprüfung<br />

der technischen Daten erkennbar, dass das Signal verändert wird, wenn es zusätzlich<br />

über einen SRC läuft. Es sei zunächst dahingestellt, ob die Veränderung durch den<br />

SRC sich positiv oder negativ auswirkt. Hier steht die Frage im Mittelpunkt, ob dieser<br />

technisch nachweisbare Unterschied <strong>für</strong> Personen, die im kritischen Hören geübt sind,<br />

auditiv wahrnehmbar ist.<br />

2.4 Messungen mit Testsignalen<br />

Die Signale der Aufnahmen sind zur Überprüfung in ihrer Wellenform optisch um ein<br />

Vielfaches vergrößert worden. Die Wellenform der beiden Signale, 1. Aufnahme mit<br />

WCLK und 2. Aufnahme mit SRC, sind optisch nicht identisch.<br />

Hier stellt sich die Frage nach der Reproduzierbarkeit des Signals. Die drei Geräte<br />

weisen jeweils unterschiedlich lange Verzögerungszeit bzw. Latenz bei eingeschaltetem<br />

Abtastratenwandler auf. Diese scheinen aber bei allen drei konstant zu sein.<br />

Zur Überprüfung der Reproduzierbarkeit wurden Proben mit ausgeglichener Verzögerungszeit<br />

(richtige Delay Einstellung) und Phasendrehung durchgeführt: wenn die Signale iden-<br />

tisch, d. h. genau reproduzierbar wären, müsste ein digitales Null-Signal resultieren.<br />

Das war bei den Aufnahmen <strong>für</strong> den Hörtest im Modus 1 und 2 nicht der Fall. Die<br />

Gegenprobe erfolgte mit zwei identischen Signalen, also beide Signale mit entweder<br />

WCLK oder SRC aufgenommen, woraus eine digitale Null resultierte. Beim Versuch,<br />

WCKL gegen SRC phasengedreht gegeneinander auszulöschen, blieb dagegen immer<br />

ein Restsignal überig, das zwar im Pegel deutlich verringert ist, sich aber nie völlig<br />

auslöscht. Dies bedeutet, dass es bei einer Verwendung des SRCs zur Veränderung des<br />

Audiosignals kommt.<br />

Zur weiteren Absicherung wurden Testsignale aufgezeichnet: Sinus bei 1 kHz, weis-<br />

ses und rosa Rauschen. Die Aufnahmen <strong>für</strong> den Hörtest können eventuell aus gegebenen<br />

Umständen nicht wirklich identisch sein, da die Mikrofone nicht exakt an der selben<br />

Stelle positioniert waren. Diese Testsignale wurden über die Geräte DM 1000 und ADI-<br />

192DD geschickt, liefen über die jeweiligen SRC und wurden wieder auf der Festplatte<br />

des Pyramix Rechners aufgezeichnet. Bei dem Sinus Signal ist optisch kein Unterschied<br />

zu erkennen. Es bleibt jedoch trotz Ausgleichung der Latenz ein Restsignal bei der Ad-<br />

dition beider Signale mit einer Phasendrehung übrig. Das Signal, das über den SRC<br />

des DM 1000 geschickt wurde, ergibt, addiert mit dem Originalsignal bei Phasendre-<br />

12


hung und Latenzausgleich (111 Samples) -31,9 dB. Dabei klingt das Restsignal nicht<br />

verzerrt, sondern lediglich leiser.<br />

ADI-192DD weist bei einer Latenz von 150 Samples noch -26,2 dB Restsignal auf. Da-<br />

bei ist auffällig, dass es beim Restsignal zu regelmäßigem, hörbaren Ausschlagen bis<br />

zu -14,9 dB kommt. Man kann vermuten, dass der Ausschlag einer Zeiteinheit <strong>für</strong> eine<br />

bestimmte Komponente entspricht, mit der der Converter arbeitet, was bei normaler<br />

Wiedergabe von Signalen nicht hörbar ist.<br />

Bei der Probe mit Rauschen ist der Sachverhalt komplizierter. Es fällt auf, dass die Si-<br />

gnale, die durch einen SRC geschickt wurden, optisch nicht identisch sind und vor allem<br />

einen höheren Pegelunterschied aufweisen. Dabei kommt es zu Pegelveränderungen von<br />

bis zu +2 dB. Es ist zu beobachten, dass ADI-192DD die Pegelveränderung im linken<br />

und rechten Kanal parallel durchführt, DM 1000 dagegen zwischen dem linken und<br />

rechten Kanal unterschiedliche Pegelveränderungen aufzeigt.<br />

Das weisse Rauschen wurde ursprünglich mit -6,4 dB aufgezeichnet, DM 1000 zeichnet<br />

jedoch mit L -4,6 dB und R -5,9 dB auf; ADI-192DD mit L und R je -4,4 dB. Für das<br />

rosa Rauschen gilt im Prinzip das gleiche: ursprüngliche Aufzeichnung -4,5 dB, DM<br />

1000 L -4,1 und R -4,4 dB; ADI-192DD L und R -4,1 dB. Der Sinus wurde wie gesagt<br />

in seinem Pegel nicht verändert.<br />

Ein Versuch, die Pegelveränderung (hier Pegelverstärkung) zu erklären, wäre die Tatsa-<br />

che, dass der Abtastratenwandler mit Oversampling durch Prädiktion arbeitet, indem<br />

er vorausschauend interpoliert. Bei der Interpolation wird eine ” Vorhersage“ durch<br />

einen Algorithmus berechnet, d.h. es werden Zwischenwerte durch ” Vorausschauen“<br />

zwischen den vorhandenen Samples (vor und hinter dem zu berechnenden Sample)<br />

berechnet. Bei deterministischen Signalen 6 wie <strong>Musik</strong> funktioniert die Prädiktion mit<br />

der heutigen Technik sehr gut. Bei stochastischen Signalen wie Rauschen kann der<br />

Algorithmus nicht wirklich ” vorhersehen“ , welcher Zwischenwert der richtige wäre.<br />

Dadurch lässt sich vielleicht die verfälschte Pegelwiedergabe bei der Abtastratenwand-<br />

lung erklären.<br />

Manche Testpersonen fragten nach Durchführung des Test, ob es vielleicht möglich<br />

sei, dass sich der Pegel zwischen den Beispielen innerhalb mancher Paare unterscheide.<br />

Aufnahmetechnisch kann dies nicht verursacht worden sein, denn die Entfernung der<br />

Mikrofonpaare von der Quelle und die digitale Vorverstärkung waren stets genau gleich.<br />

Eine Erklärung <strong>für</strong> den geäußerten Eindruck, die Beispiele seien unterschiedlich laut,<br />

kann in diesem Zusammenhang gegeben werden: Das vom Mikrofon aufgezeichnete<br />

akustische Raumrauschen kommt dem weissen Rauschen sehr nah. Das im Hintergrund<br />

stetig hörbare Raumrauschen erklingt lauter auf den Aufnahmen im Modus 1, daher<br />

erscheint die gesamte Aufnahme etwas lauter.<br />

6 sich periodisch wiederholende Signale<br />

13


3 Vorüberlegungen und Gedanken zum Hörtest<br />

Das Ziel dieses Hörtests ist es, herauszufinden, ob man tatsächlich klangliche Unter-<br />

schiede zwischen den beiden Varianten der Einstellungen (Mode 1: Synchronisation<br />

mit Hilfe von Sample Rate Converter am Anschlussgerät und Mode 2: Synchronisa-<br />

tion der Mikrofone mit externer Word Clock) wahrnehmen kann. Da es hier um sehr<br />

feine und aufnahmetechnisch spezielle Unterschiede geht, wurden die Testpersonen im<br />

Voraus ausgewählt: im genauen und kritischen Hören geübte Tonmeister, insbesondere<br />

Tonmeister Studenten des <strong>Erich</strong>-<strong>Thienhaus</strong>-Institus.<br />

Um ein vernünftiges Ergebnis erhalten zu können, muss der Hörtest vernünftig kon-<br />

struiert werden. Daher ist es notwendig, sich im Voraus differenzierte Gedanken über<br />

das Design des Tests zu machen.<br />

Es bieten sich in diesem Fall zwei geeignete Möglichkeiten des Versuchsaufbaus, die<br />

sinnvoll erscheinen: ABX Test oder Paarvergleich in Form von Forced Choice [8].<br />

Beim ABX Test werden der Versuchsperson zunächst zwei unterschiedliche Referenz-<br />

signale A und B vorgestellt. Die Versuchsperson kann sich in einer so genannten Lern-<br />

phase die zwei Referenzsignale einprägen. Anschließend werden der Versuchsperson die<br />

beiden unterschiedlichen Signale in einer beliebigen Reihenfolge immer wieder vorge-<br />

spielt und sie hat die Aufgabe, das jeweilige Signal (X) dem entsprechenden Referenzsi-<br />

gnal (A oder B) zuzuordnen. Dabei trifft sie mit jeder Entscheidung eine richtige oder<br />

falsche Antwort, d.h. sie ordnet das Signal X entweder dem richtigen oder falschen<br />

Referenzsignal A oder B zu. Damit stellt sich heraus, ob die jeweilige Versuchperson<br />

in der Lage ist, die Beispiele mit dem richtigen Referenzsignal zu identifizieren. Diese<br />

Tatsache versetzt die Versuchsperson in eine Stresssituation.<br />

Speziell im tonmeisterlichen Bereich ist bei der Befragung nach einer Wahrnehmung<br />

klanglich feiner Unterschiede das Verhalten der Versuchsperson unvermeidlich mit dem<br />

Druck, dem man sich selbst unterzieht, verbunden, als Tonmeister, der im kritischen<br />

Hören geübt ist, diesen spezifischen Fehler heraushören zu müssen und zu wollen. Die-<br />

ses Verhalten kann das Ergebnis des Hörtests verzerren.<br />

Um diese Gefahr zu minimieren, fiel die Entscheidung <strong>für</strong> den vorgesehenen Hörtest<br />

auf den Paarvergleich nach dem Forced-Choice Verfahren. Es gibt mehrere Gründe <strong>für</strong><br />

diese Wahl. Das wichtigste Argument <strong>für</strong> den Paarvergleich ist wie bereits erläutert<br />

der geringere Stressfaktor <strong>für</strong> die Testperson. Dieser Stress wird beim Paarvergleich<br />

eliminiert, da es keine ” richtige“ oder ” falsche“ Entscheidung gibt. Es werden stets<br />

zwei Signale angeboten; das eine mit und das andere ohne einen zusätzlichen Reiz. Die<br />

Entscheidung fällt dabei lediglich auf ein Beispiel jeden Beispielpaares, ohne den Druck<br />

zu spüren, sich genau <strong>für</strong> das richtige Beispiel entscheiden zu müssen.<br />

Ein weiterer Grund <strong>für</strong> den Paarvergleich ist der Aspekt, dass man bei diesem eine viel<br />

höhere Anzahl von Audiobeispielen je Testperson pro Test durchführen kann, denn der<br />

14


ABX Test erfordert allein von seiner Struktur her sehr viel mehr Zeitaufwand.<br />

Es ist von großer Wichtigkeit, sich vor dem Zusammenstellen des Hörtests mit<br />

der Messtheorie vertraut zu machen. Besonders wichtig ist dies, wenn man versucht<br />

herauszufinden, ” ob eine bestimmte Eigenschaft überhaupt messbar ist“ [8] (S. 215).<br />

3.1 Forced-Choice und Signalentdeckungstheorie<br />

Die ” Forced-Choice“ Methode ist eine Möglichkeit, die Verzerrung der Ergebnisse durch<br />

das Antwortkriterium 7 zu minimieren.<br />

Im klassischen Messverfahren der Empfindung kann das Ergebnis durch bewusstes Ver-<br />

halten der Testperson verzerrt werden. Jede Testperson muss eine innere Schwelle <strong>für</strong><br />

sich selbst setzen, ab welcher Intensität des Reizes, die im Test angeboten wird, sie eine<br />

bejahende Antwort gibt, wie z.B. bei einem Audiogramm, in dem nach der Hörbarkeit<br />

eines Tons bezüglich des Pegels gefragt wird 8 . Um sich ” besser“ zu präsentieren, kann<br />

es dazu kommen, dass eine Testperson ein ” Ja“ zur Antwort gibt, obwohl sie den Ton<br />

noch gar nicht gehört hat. Diese Verfälschung kann durch das ” Forced-Choice“ Verfah-<br />

ren ausgeschaltet werden.<br />

Im Forced-Choice Verfahren werden zwei Beobachtungsintervalle definiert. Diese bei-<br />

den Beobachtungsintervalle enthalten zwei Signale; das eine Signal enthält einen zu-<br />

sätzlichen Reiz und das andere Signal nicht. In diesem speziellen Hörtest sind die<br />

beiden Beobachtungsintervalle wie folgt definiert: 1. Aufnahmen mit zwischengeschal-<br />

tetem SRC und 2. Aufnahmen ohne zwischengeschaltetem SRC. Diese zwei Aufnahmen<br />

desselben Audiobeispiels werden stets paarweise angeboten und die Aufgabe der Ver-<br />

suchsperson ist es, anhand der vorgegebenen Kriterien eine Entscheidung zwischen den<br />

Beispielen innerhalb eines Paares zu treffen. Der zwischengeschaltete SRC ist das ein-<br />

zige Merkmal, das sich zwischen den Audiobeispielen stets unterscheidet. Damit ist<br />

also die Bedingung <strong>für</strong> die ” Forced-Choice“ Methode gegeben: feste Reizintensitäten.<br />

Für diese festen Reizintensitäten, die in jedem Entscheidungsprozess (in jedem Paar-<br />

vergleich) enthalten sind, wird der Prozentsatz ” richtiger“ Antworten bestimmt. Im<br />

vorliegenden Hörtest gibt es keine ” richtigen“ oder ” falschen“ Antworten. Hier wird<br />

der Prozentsatz der Tendenz zu einer der beiden Aufnahme-Modi berechnet, um her-<br />

auszufinden, ob diese klanglich unterschieden werden können.<br />

In diesem Fall, speziell in diesem Hörtest, ist die Reizintensität bereits vorgegeben:<br />

der Unterschied, den ein SRC bei einer Aufnahme verursacht. Anhand dieser vorge-<br />

gebenen Reizintensität soll nun herausgefunden werden, ob die Testpersonen eine ein-<br />

deutige Unterscheidungsleistung hervorbringen können oder ob sie auf ein Rateniveau<br />

zurückfallen.<br />

Mit dem ” Forced-Choice“ Verfahren wird allein die ” sensorische Empfindlichkeit“ ge-<br />

7 Das Problem, <strong>für</strong> sich die Schwelle <strong>für</strong> eine Entscheidung zu bestimmen.<br />

8 Dieses Problem wird in der Fachsprache ” Kriterienproblem“ genannt, was nicht mit dem im fol-<br />

genden verwendeten Begriff ” Kriterium“ zu verwechseln ist.<br />

15


messen und dabei wird das ” Problem des Antwortkriteriums“ minimiert [8] (S. 230).<br />

Die sogenannte ” Signalentdeckungstheorie“ ist eine erweiterte Form des ” Forced-<br />

Choice“ Verfahrens. Der wesentliche Unterschied zwischen dem ” Forced-Choice“ Ver-<br />

fahren und der ” Signalentdeckungstheorie“ ist, dass letzteres nicht nur das sensorische<br />

Empfinden zu messen versucht, sondern auch die ” nicht-sensorischen Anteile einer psy-<br />

chophysischen Messung“ [8] (S.230). In diesem Hörtest ist jedoch zunächst nur die sen-<br />

sorische Empfindlichkeit interessant. Das <strong>für</strong> diesen Hörtest gedachte Design kommt<br />

von seinem Aufbau her der Signalentdeckungstheorie näher.<br />

Es gibt vier Fälle bei der Signalentdeckungstheorie: Treffer, Verpasser, falschen<br />

Alarm und korrekte Zurückweisung. Wird ein Reiz angeboten und ist es die Aufgabe der<br />

Versuchsperson, diesen Reiz herauszuerkennen, gilt folgendes: Als Treffer werden die<br />

Antworten gewertet, mit denen die Aufgabe mit einem ” Ja“ korrekt (bei vorhandenem<br />

Reiz = Aufnahme mit SRC) beantwortet wurden. Ein ” Nein“ trotz dargebotenem<br />

Reiz wird als Verpasser gewertet. Falscher Alarm tritt auf, wenn die Versuchsperson<br />

bei fehlendem Reiz die Aufgabe mit ” Ja“ beantwortet. Bei korrekter Zurückweisung<br />

verneint die Versuchsperson die Aufgabe bei fehlendem Reizangebot.<br />

Die vier möglichen Ausgänge des Signalentdeckungsexperiments im vorliegenden<br />

Hörtest sind in der Tabelle 1 aufgelistet.<br />

Aufnahmen im Modus 1 Aufnahmen im Modus 2<br />

dargebotene Reize Antwort der Vpn: mit SRC Antwort der Vpn: ohne SRC<br />

Aufnahme im Modus 1 Treffer Verpasser<br />

mit SRC (engl.: hit) (engl.: miss)<br />

Aufnahme im Modus 2 Falscher Alarm Korrekte Zurückweisung<br />

ohne SRC (engl.: false alarm) (engl.: corr.reject.)<br />

Tabelle 1: Vier mögliche Ausgänge des Signalentdeckungsexperiments im vorliegenden<br />

Hörtest (nach [8] S.231)<br />

Den vorliegenden Hörtest kann man nicht mit ” Ja“oder ” Nein“ beantworten. Den-<br />

noch kann er als eine Art des so genannten ” Ja/Nein“-Experiments geltend gemacht<br />

werden. Treffer und korrekte Zurückweisung stellen die richtige Zuweisung von Auf-<br />

nahme-Mode 1 oder 2 dar. Hier ist es jedoch nicht wichtig, dass die Versuchsperson<br />

die angebotenen Reize ” richtig“ zuweist. Vielmehr ist in erster Linie interessant, ob<br />

sich eine signifikante Tendenz zeigt. Dabei spielt es keine Rolle, ob der Treffer und<br />

die korrekte Zurückweisung (richtige Zuordnung) überwiegen, oder der Verpasser und<br />

der falsche Alarm (falsche Zuordnung). Es ist lediglich interessant, ob sich durch den<br />

Hörtest ein hörbares Merkmal finden lässt (dies wäre der Fall, wenn sich eine signifi-<br />

16


kante Tendenz zeigt).<br />

Es werden immer zwei verschiedene Arten von Aufnahmen, also zwei Beobachtung-<br />

intervalle vorgespielt (zwei Beispiele des gleichen Audiobeispiels in Modus 1 oder 2).<br />

Dies wird in der Signalentdeckungstheorie als ” zwei Reizsituaitionen“ ([8] S.231) be-<br />

zeichnet, die es grundsätzlich gibt. Hier sind es 1. ” Audiobeispiel in Mode 1“ und 2.<br />

” Audiobeispiel in Mode 2“ .<br />

Es werden feste Reizintensitäten angeboten9 , wobei nicht geklärt ist, wie groß diese<br />

Reize sind. Die verschiedenen Reizintensitäten werden durch die drei verschiedenen<br />

Geräte bestimmt. Es wird angenommen, dass es sich hier um drei verschiedene Inten-<br />

sitäten des Reizes handelt. Es soll nun auch herausgefunden werden, ob es Reizinten-<br />

sitätsunterschiede gibt und wenn ja, wie groß der Unterschied ist.<br />

Im in dieser Arbeit vorgesehenen Hörtest sind sowohl Aspekte des ” Forced-Choice“<br />

Verfahrens als auch der ” Signalentdeckungstheorie“ wie oben beschrieben, enthalten.<br />

Entgegen gewöhnlicher Testverfahren, bei denen das Merkmal bekannt ist und<br />

durch kontrolliertes Variieren von Reizintensitäten und deren Auswirkung (Merkmal)<br />

nach der Unterschiedsschwelle gesucht wird, kennt man weder die Größe noch die<br />

Verhältnisse der angebotenen Reizintensitäten. Da diese vermutlich, wenn sie sich<br />

überhaupt voneinander unterschieden, in einem sehr kleinen Bereich variieren, bewegt<br />

man sich von vornherein im Unterschiedsschwellenbereich. Es wird also nicht nach der<br />

Unterschiedsschwelle selbst gesucht, sondern es wird untersucht, ob diese angenomme-<br />

ne Schwelle bei Verwendung qualitativ weniger guter Geräte überschritten wird und es<br />

dadurch zur Unterscheidbarkeit der Aufnahme-Modi kommt.<br />

Es ist vor der Durchführung des Hörtests nicht bekannt, ob es überhaupt ein Merkmal<br />

zur auditiv wahrnehmbaren Unterscheidung zwischen den verschiedenen Aufnahme-<br />

Modi bei digitalen Mikrofonen gibt. Aufgrund der technischen Vorkenntnisse und tech-<br />

nischen Messungen wird angenommen, dass es bei nicht optimaler Abtastratenwand-<br />

lung zur Veränderung und Beeinträchtigung des ursprünglichen Signals kommen kann.<br />

Dabei lassen sich die Stufen der Reizintensitäten im Vergleich zum klassischen Test-<br />

verfahren nicht kontrolliert verstellen. Diese sind in erster Linie durch die Verwendung<br />

von verschiedenen Geräten mit ihren verschiedenen SRC vorgegeben, aber auch durch<br />

die verschiedenen Audiobeispiele gegeben. Da man annimmt, dass die sich klanglich<br />

bemerkbaren Unterschiede, die durch die unterschiedlichen Qualitäten der SRC zu-<br />

stande kommen, in einem sehr engen Bereich bewegen, werden sich die Versuchsperso-<br />

nen vermutlich im Bereich der Unterschiedsschwelle bewegen. Mit Hilfe dieses Hörtests<br />

soll nach dem Merkmal gesucht werden, das möglicherweise in Abhängigkeit von den<br />

gegebenen Reizintensitäten (verschiedene SRC und Quellen) mehr oder weniger gut<br />

9 Dies entspricht dem Forced-Chioce Verfahren.<br />

17


wahrzunehmen sein wird.<br />

Auf die Möglichkeit, eine Rückmeldung zur Antwort bezüglich der Richtigkeit der<br />

jeweiligen Angabe zu geben, wurde bewusst verzichtet, da es sich in diesem Hörtest<br />

um minimale klangliche Unterschiede handelt und die hier zu erwartende Unsicherheit<br />

durch ein Feedback eher vergrößert würde. Darüberhinaus unterbricht ein Feedback die<br />

Konzentration und das Gefühl der Ungestörtheit.<br />

3.2 Aufnahmen <strong>für</strong> den Hörtest<br />

Alle Aufnahmen <strong>für</strong> den Hörtest wurden aus technischen Gründen in der Neuen Aula<br />

der <strong>Hochschule</strong> <strong>für</strong> <strong>Musik</strong> Detmold durchgeführt. Dabei wurden zwei Stereo-Mikrofon-<br />

paare aufgestellt. Die beiden Mikrofonpaare konnten selbsverständlich nicht gleichzeitig<br />

exakt an der gleichen Stelle positioniert werden. Der Abstand zwischen den jeweiligen<br />

Mikrofonkapseln (zwischen den beiden Mikrofonpaaren), betrug ca. 2,5 cm. Mit Aus-<br />

nahme der Aufnahmen des Streichorchesters, des Gesangs, und zum Teil der Sprache<br />

(Test B: Track 7/8 und 29/30) waren die Mikrofonpaare übereinander aufgestellt (bei<br />

den genannten Ausnahmen waren die Mikrofonpaare nebeneinander befestigt).<br />

Bei der Aufnahme wurde darauf geachtet, dass die Mikrofone weit genug von der Schall-<br />

quelle entfernt standen, damit die Abstrahlcharakteristik der Schallquelle im Raum<br />

nicht mehr ausschlaggebend <strong>für</strong> den unterschiedlichen Klang an unterschiedlichen Po-<br />

sitionen sein konnte.<br />

Abbildung 5: Skizze des Signalflusses<br />

Um die Möglichkeit zu haben, die Testpersonen an mehreren verschiedenen Schall-<br />

quellen (Instrumente oder Sprache) zu testen, wurden sieben verschiedene Besetzungen<br />

aufgezeichnet:<br />

Die Daten der Aufnahmen:<br />

Basisbreite des jeweiligen Mikrofonpaares: 0,36 m bzw. 0,26 m<br />

18


——Liste über Aufnahmen zum Hörtest——<br />

Klavier Solo Julia Habiger/<br />

(in Test B) F. Chopin, Ballade g-Moll Nexus<br />

Gitarre Solo Tim Büchsenschütz/<br />

(in Test A und B) Jazz Improvisation und Nexus,<br />

J.S. Bach, Gavotte aus Partita in E-Dur DM1000, ADI-192DD<br />

Sprache Emma Laín/ Nexus,<br />

(in Test A und B) aus Werken von P. Coelho und A.S. Pinol DM1000, ADI-192DD<br />

Gesang Bineta Diouf/<br />

(in Test A und B) F. Schubert, Der Tod und das Mädchen DM1000<br />

Oboe Solo Jung-Kyeom Kim/ Nexus,<br />

(in Test A und B) A. Pascolli, La Favorita Konzert DM1000, ADI-192DD<br />

Violoncello Solo Min-A Kim/<br />

(in Test A und B) D. Popper, Etüde op.73, Nr.1 DM1000, ADI-192DD<br />

Streichorchester Detmolder Kammerorchester/<br />

(in Test B) D. Schostakowitsch, Bearbeitung vom<br />

Tabelle 2: Liste über Aufnahmen zum Hörtest<br />

Höhe: 3,6 m<br />

Winkel zur Seite: ca. 5 ◦<br />

Neigung nach unten: ca. 10 ◦<br />

Streichquartett op. Nexus<br />

Abstand zur Schallquelle: ca. 4,5 m bei <strong>Musik</strong><br />

ca. 3,4 m bei Sprache.<br />

Da jeder Mensch unterschiedlich auf verschiedene Reize reagiert, war es wichtig, den<br />

Testpersonen verschiedene Reize anzubieten. Darüberhinaus bringt jeder eine andere<br />

Voraussetzung an Hörerfahrung und Hörerwartung mit sich. Hinzu kommt, dass die<br />

Testperson vor dem Hörtest noch nicht weiss, bei welcher Art der Schallquelle der feine<br />

Unterschied zwischen den Aufnahmen in Mode 1 oder 2 am besten zu hören sein wird.<br />

3.3 Kriterien zur Bewertung<br />

Um die Testperson nach einer Bewertung befragen zu können, müssen <strong>für</strong> den Hörtest<br />

geeignete Kriterien gefunden werden, denn nur so kann die Auswertung erfolgreich wer-<br />

den. Die Kriterien müssen <strong>für</strong> die Testperson eindeutig zu verstehen sein. Die Suche<br />

nach ” richtigen“ Kriterien entspricht in diesem Fall der Suche nach den vermutlichen<br />

Merkmalen <strong>für</strong> die eventuelle Unterscheidungmöglichkeit.<br />

Da es bei diesem Hörtest darum geht, herauszufinden, ob professionell ausgebildete, in<br />

19


kritischem Hören geübte Personen überhaupt in der Lage sind, den feinen Unterschied<br />

zwischen den Aufnahmen mit oder ohne Abtastratenwandler herauszuhören, gilt es<br />

zunächst zu klären, in welcher Weise sich der Unterschied hörbar äußern kann.<br />

Daher wird die Frage gestellt, welche Fehler sich durch ein zusätzliches Abtasten von<br />

digitalen Signalen überhaupt ergeben könnten. Im Grunde genommen sucht man nach<br />

einer ” black box“ [8], denn man sucht nach Kriterien, anhand deren Reizen man ei-<br />

ne bestimmte Reaktion hervorrufen kann. ” Die zwischen Reiz und Reaktion liegenden<br />

Vorgänge werden, da sie methodisch prinzipiell oder vorläufig nicht erschließbar sind,<br />

als black box behandelt“ [8] (S. 213).<br />

Der größte Fehler, der bei einer Abtastratenwandlung auftreten kann, ist wie oben<br />

bereits erläutert, der Jitterfehler. Jitter kann sowohl die Amplitude als auch die Pha-<br />

senlage des Signals beeinträchtigen. Der Fehler äußert sich in Form eines zusätzlich<br />

entstandenen sogenannten Jitterrauschens. Es kann aber auch zu Knacksern oder Fluk-<br />

tuatuion in der Amplitude kommen (Vergleiche Kapitel 2.2.1).<br />

Da der Abtastratenwandler mit ähnlichen Methoden wie denen der A/D- und D/A-<br />

Wandler arbeitet, kann man zunächst nach bekannten Fehlern bei den A/D- und D/A-<br />

Wandlern suchen, um Anhaltspunkte zu finden. Bei ihnen sind bestimmte Abbildungs-<br />

fehler bekannt, u.a. Verschlechterung der Lokalisationsschärfe, Tiefenabbildung und<br />

Räumlichkeit. Eine Verzerrung des Frequenzgangs ist dagegen eher unwahrscheinlich.<br />

Bezüglich dieser speziellen Suche nach Fehlern der Abtastratenwandlung lässt sich die<br />

Vermutung aufstellen, dass es eventuell durch die Verzerrung des abgetasteten Signals<br />

zur verstärkten Wiedergabe von Obertönen kommen kann.<br />

Hier wurden folgende Kriterien als geeignet bewertet:<br />

• die Nähe (bzw. Entfernung) zur Quelle,<br />

• die Luftigkeit bzw. Offenheit<br />

• die Klarheit und<br />

• die Natürlichkeit.<br />

Der natürliche Klang des Raumrauschens wurde nach den Vortests auf Anregung<br />

der Testpersonen als vierte Kategorie <strong>für</strong> die Beispielpaare hinzugenommen, die mit<br />

wenig Signalpegel aufgenommen wurden und bei denen daher wegen der hohen Vor-<br />

verstärkung das Raumrauschen gut zu hören ist.<br />

4 Versuchsaufbau und -durchführung<br />

4.1 Versuchsaufbau<br />

Es wurden 20 Audiobeispielpaare <strong>für</strong> den Hörtest verwendet. Jedes wurde, wie unten<br />

näher erläutert wird, jeweils zweimal innerhalb eines Tests eingesetzt. Die Beispiele<br />

20


wurden durch Mastering in ihrem Pegel aneinander angeglichen, damit es nicht zu<br />

großen Pegelunterschiede innerhalb eines Hörtests kam. Abgesehen von der Pegelan-<br />

gleichung wurden die Audiodaten bewusst nicht bearbeitet (kein nachträglicher Hall,<br />

kein Schnitt), damit die Daten so wenig wie möglich von weiteren technischen Kompo-<br />

nenten beeinflusst wurden.<br />

Die Anordnung der Reihenfolge der Beispiele wurde willkürlich zusammengestellt, wo-<br />

bei auf eine abwechslungsreiche Abfolge der Klangbeispiele geachtet wurde.<br />

Um die Länge des Tests zu begrenzen und damit die Konzentrationsfähigkeit der<br />

Testpersonen nicht zu überstrapazieren, wurden zwei verschiedene Hörtests, Hörtest A<br />

und B, mit je 20 Audiobeispielpaaren (10 verschiedene je zweimal) zusammengestellt.<br />

Außerdem wurden die Beispiele mit einer Länge zwischen 12 und 22 Sekunden kurz<br />

gehalten. Dies entspricht in etwa der EBU 2000 Assessment-listening Norm von 10 bis<br />

20 Sekunden <strong>für</strong> die Länge von Audiobeispielen. Den Empfehlungen von ” Recommen-<br />

dation ITU-R BS. 1284-1*, general methods for the subjective assessment of sound<br />

quality“ entsprechend, sind die Beispielen der jeweiligen Paare 0,5 bis 1 Sekunde und<br />

die jeweiligen Paaren ca. 1,5 Sekunden voneinander getrennt [5].<br />

Da es in diesem Test darum geht, ob Unterschiede wahrnehmbar oder lediglich<br />

Einbildungen sind, war es wichtig, dass die Testperson unbedingt eine eindeutige Ent-<br />

scheidung pro Beispielpaar trifft. Dies ist auch im Sinne der ” Forced-Choice“ Methode.<br />

Daher wurde bewusst darauf verzichtet, der Testperson auch die Auswahlmöglichkeit<br />

zu geben, keinerlei Unterschiede wahrnehmen zu können. Somit wird ” die Tendenz zur<br />

Mitte “ vermieden, was ” nicht förderlich <strong>für</strong> die angestrebte Differenzierung“ wäre [10]<br />

(S. 49).<br />

Um der Gefahr vorzubeugen, dass eine Testperson das Testergebnis dadurch verzerrt<br />

anfängt, dass sie willkürlich rät, da sie keinen Unterschied feststellen zu können glaubt,<br />

wurde jedes Audiobeispielpaar im Hörtest zweimal verwendet: in der ersten Hälfte des<br />

Tests einmal in einer bestimmten Reihenfolge (1. Beispiel: Aufnahme mit Word Clock<br />

Synchronisation, 2. Beispiel: Aufnahme mit Sample Rate Converter) und in der zweiten<br />

Hälfte des Testaufbaus in inverser Reihenfolge der Paarung (1.Beispiel: Aufnahme mit<br />

Sample Rate Converter, 2. Beispiel: Aufnahme mit Word Clock Synchronisation). Somit<br />

müsste sich eine 50 zu 50 Verteilung ergeben, falls sich jemand entschiede, einfach bei<br />

jedem Paar das erste Beispiel anzukreuzen.<br />

Jedes Beispiel wurde mit einem Track versehen, damit die Testperson die Möglichkeit<br />

bekam, zum Vergleichen beliebig hin- und herzuschalten. Den Testpersonen wurde je-<br />

doch empfohlen, sich auf den ersten Eindruck zu verlassen, da es sich um sehr klei-<br />

ne Unterschiede handelt, falls diese denn überhaupt wahrnehmbar sind. Durch diese<br />

persönliche Einweisung vor dem Beginn der Testdurchführung wurde versucht, der Test-<br />

person den Druck und Illusion zu nehmen, unbedingt Unterschiede hören zu müssen.<br />

21


Als weiteren Vorsichtsmaßnahme wurde der Test unter der so genannten ” Blindbedin-<br />

gung “ durchgeführt, d. h. die Versuchspersonen wurden so wenig wie möglich über<br />

das Thema und Ziel des Tests informiert [10]. Dadurch wurde beabsichtigt, das Verhal-<br />

ten der Versuchspersonen unbeeinflusst zu lassen und ihnen den zusätzlichen Stress zu<br />

nehmen, eine so spezielle und Tonmeister-spezifische Streitfrage ” richtig “ beantworten<br />

zu müssen.<br />

22


Hörtest A<br />

Diplomarbeit: Je-Young <strong>Myung</strong><br />

Thema: Untersuchungen zum Klang digitaler Mikrofone<br />

Die folgenden Hörbeispiel-Paare sollen anhand der darunter angegebenen Kriterien miteinander<br />

verglichen werden. Dabei gibt es keine „richtigen“ oder „falschen“ Antworten.<br />

Bitte kreuzen Sie im Folgenden das zutreffende Feld an und verlassen Sie sich dabei auf Ihren<br />

ersten Eindruck!<br />

1. Track 01 Track 02<br />

Die Quelle scheint näher zu sein ٱ ٱ<br />

Es klingt luftiger/ offener ٱ ٱ<br />

Es klingt klarer ٱ ٱ<br />

2. Track 03 Track 04<br />

Die Quelle scheint näher zu sein ٱ ٱ<br />

Es klingt luftiger/ offener ٱ ٱ<br />

Es klingt klarer ٱ ٱ<br />

3. Track 05 Track 06<br />

Die Quelle scheint näher zu sein ٱ ٱ<br />

Es klingt luftiger/ offener ٱ ٱ<br />

Es klingt klarer ٱ ٱ<br />

Es klingt natürlicher (auf das Rauschen achten) ٱ ٱ<br />

4. Track 07 Track 08<br />

Die Quelle scheint näher zu sein ٱ ٱ<br />

Es klingt luftiger/ offener ٱ ٱ<br />

Es klingt klarer ٱ ٱ<br />

Es klingt natürlicher (auf das Rauschen achten) ٱ ٱ<br />

5. Track 09 Track 10<br />

Die Quelle scheint näher zu sein ٱ ٱ<br />

Es klingt luftiger/ offener ٱ ٱ<br />

Es klingt klarer ٱ ٱ<br />

Es klingt natürlicher (auf das Rauschen achten) ٱ ٱ<br />

6. Track 11 Track 12<br />

Die Quelle scheint näher zu sein ٱ ٱ<br />

Es klingt luftiger/ offener ٱ ٱ<br />

Es klingt klarer ٱ ٱ<br />

Abbildung 6: Auszug aus dem Hörtest A zur Ansicht<br />

23


Abbildung 7: Zusatzinformation <strong>für</strong> den verschickten Hörtest<br />

4.2 Versuchsdurchführung<br />

Der größte Teil des Hörtest wurde im <strong>Erich</strong>-<strong>Thienhaus</strong>-<strong>Institut</strong> der <strong>Hochschule</strong> <strong>für</strong><br />

<strong>Musik</strong> Detmold in 7 Tagen durchgeführt. Damit die Standardsituation [10] (S.53)<br />

gewährleistet wurde, fanden 40 von 50 Hörtests im Seminarraum 1 statt, der im Insti-<br />

tut als Referenz-Mehrkanalabhörraum genutzt wird (siehe Abbildung 8). Somit waren<br />

alle 40 Testteilnehmer gleichen Bedingungen ausgesetzt. Die übrigen 10 Tests wur-<br />

den per Post an verschiedene Personen verschickt. Diese 10 Tests wurden zu Hause<br />

an Kopfhörern (8 Tests) oder am eigenen Lautsprecher (2 Tests) durchgeführt. Da in<br />

diesen Fällen die persönliche Einweisung entfällt, wurde eine Zusatzinformation am<br />

Anfang des Hörtestbogens hinzugefügt (siehe Abbildung 7).<br />

Der Seminarraum 1 ist 2005/ 2006 neu erbaut und professionell eingemessen worden. Es<br />

stehen in diesem Raum Lautsprecher der ” musikelectronic geithain gmbh“ : ” RL901K“<br />

und alle 40 Testpersonen führten den Hörtest an diesen Lautsprechern durch.<br />

Dieser Raum ist schallisoliert, so dass die Testpersonen keiner akustischen Störung<br />

von außen ausgesetzt waren. Zudem wurde darauf geachtet, dass sie während der<br />

Durchführung des Hörtests nicht unterbrochen oder in ihrer Konzentration gestört<br />

wurden.<br />

Raumdaten:<br />

Raumgröße: Länge = 8,00 m; Breite = 8,00 m; Höhe = 2,96 m<br />

Raumvolumen: 189 m3<br />

rel. Luftfeuchtigkeit: 59<br />

Temperatur: 22 ◦ C<br />

Nachhallzeit (200Hz - 4 kHz) 10 : 0,277 s Vorhang geschlossen<br />

empf. Nachhallzeit nach ITU: 0,31 s<br />

0,337 s Vorhang offen<br />

Der Hörtest wurde bei halb geschlossenem Vorhang durchgeführt.<br />

24


Abbildung 8: Der Seminarraum 1 des <strong>Erich</strong>-<strong>Thienhaus</strong>-<strong>Institut</strong>s der <strong>Hochschule</strong> <strong>für</strong><br />

<strong>Musik</strong> Detmold.<br />

Wie oben bereits erwähnt, wurden die Testpersonen zunächst kurz eingewiesen. Die<br />

Testpersonen wurden darauf aufmerksam gemacht, dass es ihre Aufgabe sei, sich bei<br />

jedem Beispielpaar <strong>für</strong> eines zu entscheiden. Während der Durchführung des Hörtests<br />

wurden die Testpersonen allein gelassen, damit sie sich nicht beobachtet und sich nicht<br />

in ihrer Verhaltensweise beeinträchtigt fühlen.<br />

In der Regel betrug die Testzeit nicht mehr als 25 Minuten, in einzelnen Fällen jedoch<br />

bis zu 45 Minuten. Jeder Testperson wurde jedoch so viel Zeit gewährt wie benötigt. Die<br />

Abhörlautstärke (in der Regel im Bereich von 70 dB) wurde der jeweiligen Testperson<br />

überlassen.<br />

4.3 Vortests<br />

Den endgültigen Hörtests gingen mehrere Vortests voraus, um zum einen die Kriterien<br />

zu optimieren, anhand welcher die Testperson die Entscheidung zwischen den angebo-<br />

tenen Beispielen treffen sollte und zum anderen um sicher zu stellen, dass die Länge<br />

der vorgegebenen Audiobeispiele <strong>für</strong> den Entscheidungsprozess der Testperson passend<br />

gewählt sind.<br />

Diese Vortests wurden sowohl an den Referenz-Regielautsprechern RL901K im Semi-<br />

narraum 1 als auch an Kopfhörern (AKG501) durchgeführt und es wurde dabei fest-<br />

gestellt, dass diese beiden Abhörbedingungen keine wesentlichen Unterschiede in den<br />

Ergebnissen verursachen. Dies ist ein wichtiger Punkt, denn die Tests wurden zum Teil<br />

per Post verschickt, so dass diese auf verschiedene Art und Weise abgehört wurden.<br />

5 Auswertung<br />

5.1 Allgemeines zur Auswertung des Hörtests<br />

Das Ziel des vorliegenden Hörvergleichs ist es, herauszufinden, ob es einen klanglichen<br />

Unterschied zwischen Mode 1 und 2 der AES42-Betriebsmodi in der Aufnahme mit di-<br />

25


gitalen Mikrofonen gibt. Wird ein klanglicher Unterschied wahrgenommen, stellt sich<br />

die Frage, ob diese Beobachtung reproduzierbar ist, um ein Ergebnis des Zufalls aus-<br />

schließen zu können.<br />

Der Hörtest wurde nach dem Prinzip der ” Signalentdeckungstheorie“ (siehe Kapitel<br />

3.1) speziell <strong>für</strong> die Zwecke der oben genannten Untersuchung zusammengestellt. Wie<br />

bereits oben genannt bezeichnet der ” Reiz“ , der hier dargeboten wird, den anzuneh-<br />

menden klanglichen Unterschied der Aufnahme, der durch zusätzliches Verwenden von<br />

SRC am Eingang des Anschlussgerätes verursacht wird. Die Hypothese, die aufgestellt<br />

wird, lautet daher: ” Es gibt hörbar klangliche Unterschiede zwischen der Aufnahme im<br />

Mode 1 und der Aufnahme in Mode 2“ .<br />

Ob diese Hypothese sich anhand der Hörtest-Auswertung bestätigen lässt, hängt zum<br />

einem von den Reizintensitäten und zum anderen von der Hörempfindlichkeit der Ver-<br />

suchspersonen ab.<br />

Die Auswertungen werden im Folgenden in Prozentsätzen angegeben.<br />

Ab welchem Prozentwert die Auswertung des vorliegenden Hörtests als signifikant, also<br />

eindeutig als Unterschiedserkennung zu bewerten ist, muss <strong>für</strong> diesen speziellen Hörtest<br />

angepasst beurteilt werden. Das allgemein geltende ” Signifikanzniveau“ des klassischen<br />

Verfahrens, die ” 5%-Hürde <strong>für</strong> die Irrwahrscheinlichkeit“ ([9] S.30), kann hier nicht an-<br />

gewandt werden, da sich der vorliegende Test im Unterschiedsschwellenbereich bewegt<br />

(siehe Kapitel 3.1).<br />

5.2 Deskriptive Auswertung<br />

Es wurden insgesamt 50 Hörtests durchgeführt. Davon wurden 40 im Seminarraum 1<br />

des <strong>Erich</strong>-<strong>Thienhaus</strong>-<strong>Institut</strong>s an den oben genannten Lautsprechern ” RL901K“ durch-<br />

geführt und 10 außerhalb, davon 8 Tests am Kopfhörer und 2 Tests am eigenen Laut-<br />

sprecher. Die 50 Tests setzen sich zusammen aus 26 Hörtests vom Typ A und 24<br />

Hörtests vom Typ B. Betrachtet man jedes einzelne Beispielpaar als eigene Wertung,<br />

so erhält man aus den 50 Tests 1000 Wertungen (50 Tests x 20 Beispielpaare).<br />

In der Auswertung werden die Kategorien folgendermaßen bezeichnet:<br />

a: Die Quelle scheint näher zu sein;<br />

b: Es klingt luftiger/ offener;<br />

c: Es klingt klarer<br />

d: Es klingt natürlicher (auf das Rauschen achten)<br />

Aufgrund von technischen Fehlern konnten die Beispiele mit den Klavier-Aufnahmen<br />

(96 Wertungen) nicht in die Auswertung einbezogen werden.<br />

Insgesamt wurden in der Kategorie a 834, b 884, c 886 und d 256 Wertungen abge-<br />

geben 11 . Die Differenz zu 904, der gesamten Anzahl der Wertungen (1000 Wertungen<br />

11 Klavier-Beispiele bereits herausgenommen<br />

26


- 96 Wertungen der Klavier-Beispiele), sind die fehlenden Werte; entweder von der<br />

Testperson nicht bewertet oder im Test nicht zur Bewertung angeboten (die Kategorie<br />

” Rauschen“ wurde nur bei Bespielen mit wenig Signal und gut hörbarem Raumrauschen<br />

angeboten).<br />

Nach der deskriptiven Auswertung der Hörtests zeigt sich zunächst in keiner Kate-<br />

gorie eine eindeutige bzw. ausschlaggebende Tendenz zu einer der beiden Aufnahme-<br />

Modi. In der Gesamtauswertung (siehe Tabelle 3), in der alle Ergebnisse 12 enthalten<br />

sind, sowohl die des Hörtests A als auch des Hörtests B, ergibt sich folgendes 13 :<br />

——Auswertung der Ergebnisse, Hörtest A und B——<br />

näher luftiger klarer natürlicher<br />

Gesamtauswertung W 46,5% (388) W 49,1% (434) W 49,4% (438) W 51,6% (132)<br />

Hörtest A und B S 53,5% (535) S 50,9% (450) S 50,6% (448) S 48,4% (124)<br />

Auswertung W 46,0% (219) W 49,6% (256) W 49,5% (255) W 50,0% (80)<br />

Hörtest A S 54,0% (257) S 50,4% (260) S 50,5% (260) S 50,0% (80)<br />

Auswertung W 47,2% (169) W 48,4% (178) W 49,3% (183) W 54,2% (52)<br />

Hörtest B S 52,8% (189) S 51,6% (190) S 50,7% (188) S 45,8% (44)<br />

Tabelle 3: Auswertung der Ergebnisse, Hörtest A und B. Die Anzahl der Wertungen<br />

sind in Klammern angegeben; W: WCLK, S: SRC<br />

Obwohl viele der Testpersonen nach den Tests mitteilten, dass sie am Klang des<br />

Rauschens Unterschiede hätten deutlich festmachen können, zeigt die Auswertung in<br />

dieser Kategorie kein eindeutiges Bevorzugen eines der Aufnahme-Modi. Es ist inter-<br />

essant zu beobachten, dass es einen deutlichen Unterschied zwischen den Ergebnissen<br />

von Test A und B in der Kategorie d: ” Es klingt natürlicher (auf das Rauschen achten)“<br />

gibt. Während sich bei Test A eine Verteilung von 50% zu 50% zeigt, zeigt sich bei Test<br />

B eine Tendenz von 54,2% zu Aufnahmen in Mode 2. Möglicherweise sind im Hörtest<br />

B mehr Beispiele enthalten, bei denen die Unterschiedschwelle wegen größerer Rei-<br />

zintensität stärker überschritten werden. Diese beiden Prozentsätze bilden zusammen<br />

in ihrem arithmetischen Mittelwert eine relativiertes Ergebnis von 51,6% <strong>für</strong> WCLK.<br />

Auch wenn diese Tendenz sehr gering ist, ist es interessant zu sehen, dass bei der Ge-<br />

samtauswertung der Antworten aller Testpersonen der Klang in Aufnahme-Mode 2 als<br />

natürlicher empfunden wird.<br />

12 bis auf die Klavier-Beispiele, da diese ja aus der Wertung herausgenommen wurden<br />

13 Es ist zu beachten, dass alle einzelnen Beispielpaare als eine Wertung gezählt werden, d.h. es<br />

ergeben sich 1000 Wertungen bei 50 Tests je 20 Beispielpaare<br />

27


In der Kategorie a: ” Es klingt näher“ ist eine gewisse Tendenz von 53,5% zu Auf-<br />

nahmen in Mode 1 zu erkennen. Sie ist zwar ebenfalls gering, dennoch ist die Tendenz<br />

auffällig (im Vergleich zu anderen Kategorien). Vor allem ist diese Tendenz hier sowohl<br />

in Test A als auch in Test B zu erkennen.<br />

Diese Beobachtung in der Kategorie a ist in Untersuchungen von Untergruppen immer<br />

wieder zu bestätigen. In dieser Kategorie zeigt sich die deutlichste Tendenz in der Ge-<br />

samtauswertung über alle Tests aller Testpersonen.<br />

Im Folgenden werden die Auswertungen in verschiedenen Untergruppen nacheinan-<br />

der im Überblick wiedergegeben.<br />

Zunächst werden die einzelnen Geräte mit ihren SRC betrachtet:<br />

——Auswertung der Ergebnisse einzelner Geräte——<br />

näher luftiger klarer natürlicher<br />

Beispiele W 46,2% (108) W 49,0% (121) W 50,2% (125) W 56,4% (53)<br />

Nexus S 53,8% (126) S 51,0% (126) S 49,8% (126) S 43,6% (41)<br />

Beispiele W 46,9% (152) W 47,1% (161) W 49,0% (169) W 48,4% (31)<br />

DM 1000 S 53,1% (172) S 52,9% (181) S 51,0% (176) S 51,6% (33)<br />

Beispiele W 46,4% (128) W 51,5% (152) W 49,3% (144) W 49,0% (48)<br />

ADI-192DD S 53,6% (148) S 48,5% (143) S 50,7% (148) S 51,0% (50)<br />

Tabelle 4: Auswertung der Ergebnisse einzelner Geräte<br />

Hier fällt wieder die Tendenz in der Kategorie a zu den Aufnahmen in Mode 1<br />

(SRC) bei allen drei Geräten auf. Außerdem ist die Tendenz bei Kategorie d von 56,4%<br />

<strong>für</strong> Mode 2 (WCLK) bei den Beispielen, die mit Nexus aufgezeichnet sind, eindeutig<br />

größer als bei den anderen beiden Geräten. Bei DM 1000 und ADI-192DD zeigt sich<br />

in der Kategorie d sogar eine kleine Tendenz zu SRC-Aufnahmen, die Aufnahme mit<br />

WCLK wird also nicht bevorzugt.<br />

DM 1000 zeigt in allen vier Kategorien leichte Tendenzen zu SRC-Aufnahmen. In der<br />

Kategorie ” luftiger“ gibt es hier die größte Tendenz von 52,9% zu SRC-Aufnahmen.<br />

In den Abbildungen 9 bis 12 werden die Auswertungen der jeweiligen Kategorie einzel-<br />

ner Geräte grafisch veranschaulicht.<br />

In Tabelle 5 sind die sechs verschiedenen Quellen ausgewertet und gegenübergestellt.<br />

Die Ergebnisse der einzelnen Quellenarten unterscheiden sich in manchen Punkten. So<br />

ist hier auffällig, dass die Auswertung der Kategorie c bei dem Beispiel Violoncello die<br />

größte Tendenz überhaupt zeigt (63,9%). Dies ist bemerkenswert, zumal in der Ge-<br />

28


Abbildung 9: Grafik zur Veranschaulichung von Ergebnissen der verschiedenen Geräte:<br />

Kategorie a<br />

Abbildung 10: Grafik zur Veranschaulichung von Ergebnissen der verschiedenen Geräte:<br />

Kategorie b<br />

29


Abbildung 11: Grafik zur Veranschaulichung von Ergebnissen der verschiedenen Geräte:<br />

Kategorie c<br />

Abbildung 12: Grafik zur Veranschaulichung von Ergebnissen der verschiedenen Geräte:<br />

Kategorie d<br />

30


——Auswertung der Ergebnisse einzelner Schallquellen——<br />

näher luftiger klarer natürlicher<br />

Gitarre W 47,2% (67) W 51,7% (78) W 49,3% (74) W 49,5% (47)<br />

S 52,8% (75) S 48,3% (73) S 50,7% (76) S 50,5% (48)<br />

Violoncello W 39,1% (36) W 51,0% (50) W 36,1% (35) no offer<br />

S 60,1% (56) S 49,0% (48) S 63,9% (62) no offer<br />

Sprache W 48,1% (111) W 49,2% (121) W 54,3% (134) W 51,9% (67)<br />

S 51,9% (120) S 50,8% (125) S 45,7% (113) S 48,1% (62)<br />

Oboe W 43,1% (81) W 52,2% (106) W 50,7% (102) no offer<br />

S 56,9% (107) S 47,8% (97) S 49,3% (99) no offer<br />

Gesang W 50,5% (46) W 44,2% (42) W 49,0% (48) no offer<br />

S 49,5% (43) S 55,8% (53) S 51,0% (50) no offer<br />

Streichorchester W 52,2% (47) W 40,7% (37) W 48,4% (45) W 60,0% (60)<br />

S 47,8% (43) S 59,3% (54) S 51,6% (48) S 40,0% (40)<br />

Tabelle 5: Auswertung der Ergebnisse einzelner Schallquellen<br />

samtauswertung in dieser Kategorie ein Ergebnis von nahezu 50% resultiert. Auch die<br />

Kategorie a zeigt bei der Quelle Vc die deutlichste Tendenz (60,1%). Beide Kategorien<br />

deuten auf eine Wertung zu Gunsten von Aufnahmen in Mode 1. In diesem Zusam-<br />

menhang sei erwähnt, dass es generell eine positive Korrelation zwischen der Kategorie<br />

a und c, näher und klarer, zu geben scheint. Dies ist hörpsychologisch bedingt, da das<br />

Beispiel, das näher zu sein scheint, als klarer empfunden wird.<br />

Weitere auffällige Tendenzen zeigen sich bei der Oboe in der Kategorie a: die Aufnah-<br />

men in Mode 1 werden zu 56,9% als näher empfunden. Weiterhin wurde der Klang der<br />

Aufnahmen mit WCLK beim Streichorchester-Beispiel zu 60% als natürlicher bewertet.<br />

In den Abbildungen 13 bis 16 werden die Auswertungen der jeweiligen Kategorie<br />

einzelner Quellen grafisch veranschaulicht.<br />

Da sich in der Auswertung einzelner Versuchspersonen eine gewisse Diskrepanz<br />

von Tendenzen zeigt, wurde eine zusätzliche gruppierte Auswertung vorgenommen,<br />

mit dem Ziel, herauszufinden, wie groß die jeweilige Tendenz in beide Richtungen ist.<br />

Die Ergebnisse, die eine 50 zu 50 Verteilung ergaben, wurden aus der Auswertung<br />

herausgenommen und die Wertungen wurden <strong>für</strong> jede Kategorie in zwei verschiedene<br />

Gruppen aufgeteilt: 1. Tendenzen < 50% und 2. Tendenzen > 50%. Die Werte der<br />

Ergebnisse sind in Tabelle 6 wiedergegeben<br />

Aus der Anzahl (in Klammern angegeben) der abgegebenen Wertungen in den bei-<br />

31


Abbildung 13: Grafik zur Veranschaulichung von Ergebnissen der verschiedenen Quelle:<br />

Kategorie a<br />

Abbildung 14: Grafik zur Veranschaulichung von Ergebnissen der verschiedenen Quelle:<br />

Kategorie b<br />

32


Abbildung 15: Grafik zur Veranschaulichung von Ergebnissen der verschiedenen Quelle:<br />

Kategorie c<br />

Abbildung 16: Grafik zur Veranschaulichung von Ergebnissen der verschiedenen Quelle:<br />

Kategorie d<br />

33


——Auswertung der Ergebnisse, Tendenz-Diskrepanz——<br />

näher luftiger klarer natürlicher<br />

Ergebnisse W 40,4% (186) W 39,3% (148) W 40,5% (191) W 31,9% (15)<br />

< 50% S 59,2% (274) S 60,7% (229) S 59,5% (281) S 68,1% (32)<br />

Ergebnisse W 57,7% (142) W 60,4% (200) W 62,0% (202) W 63,2% (60)<br />

> 50% S 42,3% (104) S 39,6% (131) S 38,0% (124) S 36,8% (35)<br />

Tabelle 6: Auswertung der Ergebnisse, Tendenz-Diskrepanz<br />

den Tendenz-Gruppen erkennt man, dass in der Kategorie a, b und c die Gruppe der<br />

Tendenz < 50% größer ist; in der Kategorie d überwiegt die Gruppe der Tendenz ><br />

50%. Die Unterschiede der Wertungsanzahl der Kategorien b und c sind relativ gering,<br />

so dass man sie als nicht signifikant ansehen kann. Die Unterschiede der Wertungs-<br />

anzahl der Kategorien a und d allerdings lassen sich interpretieren. Die Tendenz der<br />

Empfindung der Nähe der Quelle geht zu 65,15% zu Gunsten der Aufnahmen in Mode<br />

1, mit SRC (Tendenzgruppe < 50%). Für den natürlichen Klang mit besonderer Auf-<br />

merksamkeit auf das Raumrauschen werden die Aufnahmen in Mode 2, mit WCLK<br />

(Tendenzgruppe > 50%), von der Mehrzahl der Versuchspersonen bevorzugt.<br />

Zur Vollständigkeit sei die Anzahl der =50% Wertungen aufgelistet: a N = 120; b N =<br />

200; c N = 100; d N = 280.<br />

Es gibt zwei von der allgemeinen Gesamtauswertung abweichende Sonderfälle. Ein<br />

Test ist durch seine überdurchschnittlich eindeutigen Tendenzen im Ergebnis aufgefal-<br />

len: Vp 18 (Test B).<br />

Die Ergebnisse des Tests B lauten:<br />

Kategorie a: W: 20%, S: 80%<br />

Kategorie b: W: 80%, S: 20%<br />

Kategorie c: W: 20%, S: 80%<br />

Da diese Vp sowohl am Test B als auch am Test A teilgenommen hatte, wurden<br />

die Ergebnisse des Tests A 14 ebenfalls genauer betrachtet.<br />

Die Ergebnisse des Tests A lauten:<br />

Kategorie a: W: 35%, S: 65%<br />

Kategorie b: W: 65%, S: 35%<br />

Kategorie c: W: 35%, S: 65%<br />

Im Ergebnis des Tests A zeigt sich keine so eindeutige Tendenz mehr, gleichwohl<br />

ist sie vorhanden.<br />

14 <strong>für</strong> Test A wird die Person unter der Vp Nummer 33 geführt<br />

34


Um beurteilen zu können, ob dieses Einzelergebnis signifikant ist oder ob es sich ledig-<br />

lich um einen ” Zufall“ handelt, wurde diese Person nochmals dem Hörtest unterzogen<br />

(ebenfalls <strong>für</strong> den Test B). Zwischen dem ersten und zweiten Test B liegt ein Zeitraum<br />

von über einem Monat, so dass nicht zu be<strong>für</strong>chten ist, dass die Person den ersten Test<br />

dubliziert. Beim zweiten Test relativierte sich das Ergebnis, jedoch zeigt sich da auch<br />

eine eindeutige Tendenz:<br />

Kategorie a: W: 35%, S: 65%<br />

Kategorie b: W: 65%, S: 35%<br />

Kategorie c: W: 40%, S: 60%<br />

Kategorie d: W: 54,54%, S: 45,46%<br />

Alle drei Ergebnisse zeigen die Tendenz in gleicher Richtung auf. Daher ist anzu-<br />

nehmen, dass die Versuchsperson die Aufnahme-Modi zu unterscheiden weiss. Welchen<br />

Modus die Vp 18 bzw. 33 ” bevorzugt“ , sei hier nicht ausschlaggebend. Es geht in<br />

diesem Test in erster Linie um die Frage, ob und wenn ja, wie signifikant, im kritischen<br />

Hören geübte Personen im Stande sind, den Unterschied festzustellen.<br />

Es gibt auch weitere vereinzelte Ergebnisse bei anderen Versuchspersonen, die ebenfalls<br />

eine deutliche Tendenz < oder > 50% aufzeigen, jedoch geschieht dies nur in einzelnen<br />

Kategorien.<br />

Überdurchschnittlich große Tendenzen, die sich vereinzelt in verschiedenen Kategorien<br />

bei verschiedenen Versuchspersonen zeigen:<br />

Kategorie a: Es klingt näher<br />

Vpn 18: W: 20%, S: 80%<br />

Vpn 22: W: 25%, S: 75%<br />

Vpn 25: W: 25%, S: 75%<br />

Vpn 28: W: 30%, S: 70%<br />

Kategorie b: Es klingt luftiger/ offener<br />

Vpn 1: W: 20%, S: 80%<br />

Vpn 9: W: 75%, S: 25%<br />

Vpn 18: W: 80%, S: 20%<br />

Vpn 19: W: 22,2%, S: 77,8%<br />

Vpn 32: W: 30%, S: 70%<br />

Kategorie c: Es klingt klarer<br />

Vpn 3: W: 70%, S: 30%<br />

Vpn 15: W: 70%, S: 30%<br />

Vpn 18: W: 20%, S: 80%<br />

Vpn 21: W: 30%, S: 70%<br />

Vpn 26: W: 70%, S: 30%<br />

Vpn 36: W: 75%, S: 25%<br />

Kategorie d: Es klingt natürlicher/ Rauschen<br />

35


Vpn 31: W: 70%, S: 30%<br />

Vpn 42: W: 30%, S: 70%<br />

Vpn 44: W: 30%, S: 70%<br />

Vpn 49: W: 30%, S: 70%<br />

Im Vergleich der Ergebnisse fällt es auf, dass die Tendenzen innerhalb der selben<br />

Kategorien zum Teil gegensätzlich sind. Es ist anzunehmen, dass das Verständnis der<br />

Kategorien bei den verschiedenen Versuchsperson differiert, da jede andere Vorausset-<br />

zungen, Erwartungen und Hörerfahrungen zum Test mitbringt.<br />

Es ist aber auch möglich, diese Gegebenheit anders zu interpretieren. Es ist ebenso<br />

denkbar, dass die ausgewählten Kategorien, die im Test zur Beurteilung vorgegeben<br />

wurden, nicht ideal geeignet sind. Möglicherweise sind sie nicht eindeutig zu verstehen;<br />

es gibt zu viel Spielraum <strong>für</strong> die Auslegung der Kategorien.<br />

Die Kategorie a (näher) zeigt in allen vier oben genannten Fällen die Tendenz zu Auf-<br />

nahmen mit SRC. Diese Kategorie ist also wohl eindeutig zu verstehen.<br />

In den Kategorien b und c gibt es sowohl Tendenz zu Aufnahmen mit WCLK als auch<br />

zu Aufnahmen mit SRC.<br />

Die Tendenz bei der Kategorie d scheint bei den überdurchschnittlich großen Tenden-<br />

zen eher zu Gunsten der Aufnahmen mit SRC zu gehen.<br />

Es kann außerdem sogar zum Variieren bzw. zur Verschiebung des Verständnisses kom-<br />

men, da es sich um sensorische Empfindungs-Fragen handelt.<br />

Der zweite Sonderfall ist nicht durch ein überdurchschnittliches Ergebnis in der all-<br />

gemeinen Gesamtauswertung aufgefallen, sondern durch differenzierte Anmerkungen<br />

zu den einzelnen Beispielpaaren. Versuchsperson 17 bzw. 42 (diese beiden Vp Num-<br />

mern entsprechen der gleichen Person, da sie an beiden Tests, A und B, teilgenommen<br />

hat) notierte am Rand des Hörtestbogens, bei welchen Paaren sie meint, Unterschiede<br />

tatsächlich hören zu können. Sie führte sowohl Test A als auch Test B durch und von<br />

den insgesamt 40 Paaren griff sie 5 Paare heraus, bei denen sie meinte, tatsächlich<br />

Unterschiede feststellen zu können. Hier zeigte sich ihre Tendenz eindeutig zu den Auf-<br />

nahmen mit WCLK. Das Ergebnis lautet 4:1 <strong>für</strong> WCLK. Diese Beispiele sind folgende:<br />

aus Test A Track 5/6: Gitarre aufgenommen mit Nexus<br />

Track 35/36: Gitarre aufgenommen mit ADI-192DD<br />

aus Test B Track 7/8: Sprache aufgenommen mit DM 1000<br />

(hier entschied sich die Vpn <strong>für</strong> die Aufnahme mit SRC)<br />

Track13/14: Streichorchester aufgenommen mit Nexus<br />

Track 29/30: Sprache aufgenommen mit DM 1000<br />

(das inverse Beispiel zu Track 7/8)<br />

36


Für diese Person wurde ein neuer Hörtest erstellt, in dem nur die besagten 5 Paare<br />

zur Bewertung angeboten wurden. Jedes dieser Beispiele wurde je viermal in verschie-<br />

denen Paarungen angeboten.<br />

Die Auswertung dieses Tests ergibt:<br />

Kategorie a: W: 85%, S: 15%<br />

Kategorie b: W: 45%, S: 55% 15<br />

Kategorie c: W: 100%, S: 0%<br />

Kategorie d: W: 65%, S: 35%<br />

Die Versuchsperson kommentierte wieder die einzelnen Beispiele und zählte je Au-<br />

diobeispiel die von ihr favorisierte Version auf. Bis auf ein Beispiel (Gitarre Aufnahme<br />

mit ADI-192DD) entschied sie sich zu 100% <strong>für</strong> Aufnahmen mit WCLK. Beim Bei-<br />

spiel der Gitarren-Aufnahme mit ADI-192DD entschied sich die Person jedes mal <strong>für</strong><br />

die Aufnahme mit SRC, so dass man mit Sicherheit behaupten kann, dass diese Person<br />

in der Lage ist, zwischen den Aufnahme-Modi mit großer Sicherheit zu unterscheiden<br />

und diese Unterscheidung sogar sicher zu reproduzieren.<br />

Die Versuchsperson traf ihre Entscheidungen anhand von Unterschieden, die sie wahr-<br />

genommen hat, diese sind die Präsenzanhebung bei den Aufnahmen mit SRC (Audio-<br />

beispiele: Sprache und Gitarre) und die bessere Tiefenabbildung bei Aufnahmen mit<br />

WCLK (Audiobeispiel: Streichorchester).<br />

Es ist noch zu erwähnen, dass die Person den Test nicht am <strong>Erich</strong>-<strong>Thienhaus</strong>-<strong>Institut</strong><br />

durchgeführt hat, sondern am eigenen Lautsprecher, der mit großer Wahrscheinlichkeit<br />

nicht der Qualität des ” RL901K“ Lautsprechers entsprechen wird.<br />

Da die Möglichkeit bestand, die anderen Versuchspersonen könnten genau bei den<br />

von der Vp 17 bzw. 42 herausgesuchten Beispielen ebenfalls deutlichere Unterschiede<br />

der Aufnahme-Modi gehört haben, wurden diese Beispiele einzeln ausgewertet. Die<br />

erwähnenswerten Ergebnisse sind in der Tabelle 7 eingetragen.<br />

In diesem Zusammenhang wurden auch alle anderen Gerät-Quelle-Kombinationen<br />

einzeln ausgewertet und es ergaben sich tatsächlich eine bessere Übersicht. Nun gelingt<br />

eine Aussage über die einzelnen Geräte. Zur Veranschaulichung sind Grafiken der Aus-<br />

wertungen des jeweiligen Geräts unten in den Abbildungen 17 bis 19 angegeben.<br />

Bei Nexus sieht man bei Oboe (64,6% <strong>für</strong> SRC) und Gitarre (56,3% <strong>für</strong> SRC) eine<br />

Tendenz in der Kategorie a. In der Kategorie b sind sich bei Aufnahmen von Sprache<br />

(59,6% <strong>für</strong> WCLK) und Streichorchester (59,3% <strong>für</strong> SRC) verschiedene Tendenzen<br />

bemerkbar. Bei der Frage nach dem klareren Klang zeigt sich so gut wie keine Tendenz,<br />

in keiner Quellen-Art. Sowohl bei der Sprache (62,5% <strong>für</strong> WCLK) als auch bei dem<br />

15 luftiger/ offener wurde nicht unbedingt als positiv bewertet, eher als eine Art Sirren und negativ<br />

auffällige Verstärkung von Zischlauten bei Sprach-Beispielen<br />

37


——Auswertung der Ergebnisse, 4 bestimmte Kombinationen——<br />

näher luftiger klarer natürlicher<br />

DM 1000 W 45,4% (44) W 60,2% (59) W 45,5% (15)<br />

Sprache S 54,6% (53) S 39,8% (39) S 54,5% (18)<br />

Nexus W 40,7% (37) W 60,0% (18)<br />

Streichorchester S 59,3% (54) S 40,0% (12)<br />

Nexus W 43,8% (21)<br />

Gitarre S 56,3% (27)<br />

ADI-192DD W 57,7% (30)<br />

Gitarre S 42,3% (20)<br />

Tabelle 7: Auswertung der Ergebnisse, 4 bestimmte Kombinationen<br />

Streichorchester (60% <strong>für</strong> WCLK) wird <strong>für</strong> den natürlichen Klang (mit besonderer<br />

Aufmerksamkeit auf das Rauschen) mit einer sehr deutlichen Tendenz die Aufnahme<br />

mit WCLK bevorzugt.<br />

Bei DM 1000 fällt das Violoncello in der Kategorie a mit der Tendenz von 68,1%<br />

<strong>für</strong> SRC sehr deutlich auf. In der Kategorie b, in der es um den luftigen bzw. offenen<br />

Klang geht, fallen mehrere Instrumente auf: Oboe mit 55,8% <strong>für</strong> SRC, Sprache mit<br />

54,6% <strong>für</strong> SRC, Gesang mit 55,8%<strong>für</strong> SRC und Violoncello entgegengesetzt mit 56,9%<br />

<strong>für</strong> WCLK. Es fallen in der dritten Grafik ” klarer“ die Oboe mit 53,8% <strong>für</strong> SRC und<br />

die Sprache mit 60,2% <strong>für</strong> WCLK auf. Für den natürlichen Klang wird bei der Sprache<br />

zu 54,5% <strong>für</strong> Aufnahmen mit SRC gestimmt.<br />

ADI-192DD zeigt in der Kategorie a nur <strong>für</strong> die Oboe mit 55,6% <strong>für</strong> SRC eine<br />

erwähnenswerte Tendenz. Bei der Frage nach dem luftigen Klang fällt das Violoncello<br />

mit 55,3% <strong>für</strong> SRC auf sowie die Oboe mit 55,6% <strong>für</strong> WCLK und die Gitarre mit 57,7%<br />

<strong>für</strong> WCLK. Für den klareren Klang zeigt das Violoncello-Beispiel eine Tendenz zu SRC<br />

mit 58,7%. Der Klang wird bei beiden Aufnahme-Modi als natürlich empfunden.<br />

38


5.3 Interpretative Auswertung<br />

Aufgrund der Gesamtauswertung der Hörtests kann die Hypothese nicht <strong>für</strong> allgemein<br />

gültig erklärt werden. Die Mehrheit der Versuchspersonen ist nicht in der Lage, bei ei-<br />

ner Gegenüberstellung der beiden Aufnahme-Modi einen Unterschied festzustellen. Die<br />

Hypothese kann aber auch nicht gänzlich <strong>für</strong> allgemein ungültig erklärt werden, denn<br />

bestimmte Personen sind in der Lage, klangliche Unterschiede der Aufnahme-Modi zu<br />

erkennen und diese Erkennung zu reproduzieren.<br />

Die Berechnung des arithmetischen Mittelwerts von allen Hörtests ergibt keine Tenden-<br />

zen, die aussagekräftig wären. Die Mittelwerte weichen maximal 3,5% von der Mitte,<br />

also 50%, ab.<br />

Bei näherer Betrachtung der Untergruppen der Hörtests, also Untersuchungen einzel-<br />

ner Geräte und Quellen, zeigen sich vereinzelte Tendenzen, die zwar nicht sehr groß<br />

sind aber sich durchaus aus der Menge des mittleren Durchschnitts (50%) hervorheben.<br />

Bei der genaueren Betrachtung der drei verwendeten Geräte fällt in der Gesamt-<br />

auswertung keine wirklich ausschlaggebende Tendenz auf. Doch geht man weiter in die<br />

Details hinein, zeigen sich bestimmte Merkmale (Vergleiche Abbildungen 17 - 19).<br />

Besonders bei der Frage nach dem natürlichen Klang zeigt sich bei Nexus der Firma<br />

Stage Tec die Bevorzugung von Aufnahmen im Modus 2, mit WCLK. Die Tendenzen<br />

betragen beim Streichorchester 60% und bei der Sprache sogar 62,5%. Das ist ein nicht<br />

zu vernachlässigendes Ergebnis.<br />

Bei Aufnahmen mit dem digitalen Pult DM 1000 von Yamaha zeigen viele Instrumente<br />

zu erwähnende Tendenzen auf (siehe Kapitel 5.2, 18). Die Kombination Violoncello und<br />

DM 1000 scheint den klanglichen Unterschied der Aufnahmen im Modus 1 und 2 gut<br />

erkennbar zu machen. Die Sprache zeigt ebenfalls in den Kategorien b und c eindeutige<br />

Unterschiede auf. An der Gesangstimme erkennt man auch eine Tendenz in der Frage<br />

nach dem luftigen Klang.<br />

Der Formatwandler ADI-192DD der Firma RME lässt keinen Unterschied im natürlichen<br />

Klang erkennen. Da<strong>für</strong> zeigen sich in den Kategorien b und c bei den verschiedenen<br />

Instrumenten deutbare Tendenzen.<br />

Das Instrument Violoncello fällt bei den beiden letzteren Geräten in verschiedenen<br />

Kategorien mit relativ großen Tendenzen auf. Dabei stimmen aber die Tendenzrichtun-<br />

gen nicht immer überein. Bei der Frage nach dem luftigeren Klang gehen die Tendenzen<br />

auseinander. Möglicherweise sind bei dem obertonreichen Instrument die möglichen Un-<br />

terschiede im Frequenzgang und in der Klangfarbe gut zu erkennen ([12] S.83).<br />

Wie bereits oben erwähnt, zeigen sich bei der Kategorie a die größten Tendenzen,<br />

stets <strong>für</strong> Aufnahmen im Modus 1. Die Kategorie a: ” Es klingt näher“ ist eigentlich<br />

nicht wertend aufzufassen. Es ist lediglich eine Kategorie zur Feststellung, ob man<br />

39


Percent<br />

Percent<br />

70<br />

60<br />

50<br />

40<br />

30<br />

20<br />

10<br />

0<br />

60<br />

50<br />

40<br />

30<br />

20<br />

10<br />

0<br />

WC LK<br />

naeher<br />

klarer<br />

WCLK<br />

SRC<br />

SRC<br />

Instrumente<br />

Gitarre<br />

Sprache<br />

Oboe<br />

Streichorchester<br />

Instrumente<br />

Gitarre<br />

Sprache<br />

Oboe<br />

Streichorchester<br />

Percent<br />

Percent<br />

70<br />

60<br />

50<br />

40<br />

30<br />

20<br />

10<br />

0<br />

70<br />

60<br />

50<br />

40<br />

30<br />

20<br />

10<br />

0<br />

luftiger<br />

WCLK<br />

WCLK<br />

natürlicher/ Rauschen<br />

SRC<br />

SRC<br />

Instrumente<br />

Gitarre<br />

Sprache<br />

Oboe<br />

Streichorchester<br />

Instrumente<br />

Gitarre<br />

Sprache<br />

Streichorchester<br />

Abbildung 17: Grafiken: Auswertungen von bestimmten Kombinationen von Nexus und<br />

verschiedenen Quellen<br />

40


Percent<br />

Percent<br />

80<br />

70<br />

60<br />

50<br />

40<br />

30<br />

20<br />

10<br />

0<br />

80<br />

60<br />

40<br />

20<br />

0<br />

WC LK<br />

naeher<br />

klarer<br />

WCLK<br />

SRC<br />

SRC<br />

Instrumente<br />

Gitarre<br />

Vc<br />

Sprache<br />

Oboe<br />

Gesang&Klav ier<br />

Instrumente<br />

Gitarre<br />

Vc<br />

Sprache<br />

Oboe<br />

Gesang&Klav ier<br />

Percent<br />

Percent<br />

60<br />

50<br />

40<br />

30<br />

20<br />

10<br />

0<br />

60<br />

50<br />

40<br />

30<br />

20<br />

10<br />

0<br />

luftiger<br />

WC LK<br />

WCLK<br />

natürlicher/ Rauschen<br />

SRC<br />

SRC<br />

Instrumente<br />

Gitarre<br />

Vc<br />

Sprache<br />

Oboe<br />

Gesang&Klav ier<br />

Instrumente<br />

Abbildung 18: Grafiken: Auswertungen von bestimmten Kombinationen von DM 1000<br />

und verschiedenen Quellen<br />

41<br />

Gitarre<br />

Sprache


Percent<br />

Percent<br />

60<br />

50<br />

40<br />

30<br />

20<br />

10<br />

0<br />

60<br />

50<br />

40<br />

30<br />

20<br />

10<br />

0<br />

naeher<br />

klarer<br />

WCLK<br />

WCLK<br />

SRC<br />

SRC<br />

Instrumente<br />

Gitarre<br />

Vc<br />

Sprache<br />

Oboe<br />

Instrumente<br />

Gitarre<br />

Vc<br />

Sprache<br />

Oboe<br />

Percent<br />

Percent<br />

60<br />

50<br />

40<br />

30<br />

20<br />

10<br />

0<br />

60<br />

50<br />

40<br />

30<br />

20<br />

10<br />

0<br />

luftiger<br />

WCLK<br />

WCLK<br />

natürlicher/ Rauschen<br />

SRC<br />

SRC<br />

Instrumente<br />

Gitarre<br />

Vc<br />

Sprache<br />

Oboe<br />

Instrumente<br />

Abbildung 19: Grafiken: Auswertungen von bestimmten Kombinationen von ADI-<br />

192DD und verschiedenen Quellen<br />

42<br />

Gitarre<br />

Sprache


einen Unterschied in der klanglichen Abbildung wahrnehmen kann, ohne im Voraus zu<br />

wissen, ob der SRC die Abbildung positiv oder negativ beeinflusst. Die Aufnahmen im<br />

Modus 1 (mit SRC) scheinen also in ihrer Tiefenabbildung der Quelle zu beeinflusst<br />

zu werden. Sie klingen näher, was mit ” flacher“ , weniger Tiefenabbildung ” übersetzt“<br />

werden kann.<br />

In der Kategorie b: ” Es klingt luftiger“ zeigt sich nur in zwei bestimmten Untergrup-<br />

pen eine erwähnenswerte Tendenz: bei den Gesang-Aufnahmen (55,8% <strong>für</strong> SRC) und<br />

den Streichorchster-Aufnahmen (59,3% <strong>für</strong> SRC). Es ist fraglich, ob diese zwei Tenden-<br />

zen aussagekräftig genug sind, um eine Aussage treffen zu können. Da es sich jedoch um<br />

eine Auswertung von allen Tests handelt, kann dieser Mittelwert über alle Tests nicht<br />

unbeachtet bleiben. Die Tendenz geht hier ebenfalls zu Gunsten der Aufnahmen im<br />

Modus 1. Man könnte vermuten, dass es durch den zusätzlichen Einsatz von SRC zur<br />

verzerrten Wiedergabe von hohen Frequenzen kommt, da die Obertöne verstärkt wer-<br />

den. Es sind Spektralanalysen (FFT) von Aufnahmen in beiden Modi gemacht worden,<br />

woraus man aber keine auffälligen Spektralunterschiede erkennen konnte. Also bleibt<br />

die Verzerrung von hohen Frequenzen eher eine Vermutung, ein Versuch, diese Tendenz<br />

zu erklären.<br />

Diese Vermutungen über die Ergebnisse in den Kategorien a und b würden der Be-<br />

obachtung der Versuchperson 17 bzw. 42 entsprechen. Sie nannte genau diese beiden<br />

Merkmale, an denen sie sich orientiert habe: die Präsenzanhebung und die Tie-<br />

fenabbildung.<br />

Bei der Kategorie c: ” Es klingt klarer“ zeigen sich folgende Tendenzen in zwei ver-<br />

schiedenen Untergruppen: bei den Violoncello-Aufnahmen (63,9% <strong>für</strong> SRC) und bei<br />

den Sprache-Aufnahmen (54,3% <strong>für</strong> WCLK). Hier gehen die Tendenzen in entgegen-<br />

gesetzte Richtungen. Diese Kategorie scheint entweder nicht eindeutig aufzufassen zu<br />

sein oder sie äußert sich je nach Art der Quelle/Instrumente verschieden.<br />

Die Kategorie d: ” Es klingt natürlicher (auf das Rauschen achten)“ zeigt in der<br />

Gesamtauswertung keine wirkliche Tendenz (51,6% <strong>für</strong> WCLK). Bei Fallunterschei-<br />

dungen sieht man bei der Auswertung von Test B (54,2% <strong>für</strong> WCLK), der gesonderte<br />

Auswertung von Aufnahmen mit Nexus (56,4% <strong>für</strong> WCLK) und der Auswertung von<br />

Streichorchester-Aufnahmen (60% <strong>für</strong> WCLK) eine Tendenz, die etwas größer ist als<br />

die in den restlichen Fällen. Hier gehen die Tendenzen alle in Richtung des Aufnahme-<br />

Modus 2, mit WCLK. Es stellt sich die Frage, ob der SRC eine Verschlechterung des<br />

Raumrauschens verursacht (Vgl. Kapitel 2.4).<br />

Es scheint <strong>für</strong> ein geübtes Gehör sehr wohl möglich zu sein, gewisse Unterschiede<br />

43


zwischen den Aufnahmen in den verschiedenen Modi festmachen zu können, wenn auch<br />

nicht mit bestimmter, größter Sicherheit in der Mehrheit. Bei Aufnahmen (im Modus<br />

1) mit bestimmen Geräten in Kombination mit bestimmten Instrumenten wird der<br />

Unterschied möglicherweise hörbar. Ob man den klanglichen Unterschied wahrnimmt<br />

oder nicht, hängt im wesentlichen von der Qualität des verwendeten Geräts und seinem<br />

SRC ab, aber auch die Art von Schallquelle scheint eine Rolle zu spielen.<br />

Man kann auf kleine Qualitätsunterschiede der Geräte und deren SRC schließen. Wenn<br />

es um die Frage nach dem natürlichen Klang geht, scheint der SRC des Nexus den<br />

eindeutigsten klanglichen Unterschied zu verursachen. In der Frage nach dem lufti-<br />

gen Klang zeigt sich bei DM 1000 die größte Tendenz, besonders in Kombination mit<br />

Violoncello. In der Kategorie a, wo es um die Frage der Tiefenabbildung geht, zeigen<br />

alle drei Geräte die gleiche Tendenz auf, so dass man sogar eine allgemeine Aussa-<br />

ge treffen kann: Die Benutzung von SRC verursacht eine kleine aber immerhin bei<br />

allen drei Geräten gleichartig wahrnehmbare verzerrte Wiedergabe der Tiefenabbil-<br />

dung (die Tiefe des Raumes verringert sich). Die in den Vorüberlegungen zum Hörtest<br />

eher ausgeschlossenen vage Vermutung über die Verzerrung von hohen Frequenzen ist<br />

möglicherweise doch in bestimmen Fällen (Nexus: Streichorchester; DM 1000: Sprache,<br />

Oboe, Gesangstimme; ADI-192DD: Violoncello, Sprache) anzunehmen.<br />

Man kann keine allgemeine Aussage über die Qualität der jeweiligen Abtastratenwand-<br />

ler der drei Geräte treffen. Sie scheinen auf verschiedene Weise unterschiedlich auf ver-<br />

schiedene Signale zu reagieren. Eine allgemeine Aussage ist schwer zu treffen. Es ist<br />

jedenfalls ersichtlich, dass alle drei Abtastratenwandler eine gewisse Veränderung des<br />

Originalsignals zu verursachen, die bei bestimmten Gegebenheiten sogar auditiv wahr-<br />

zunehmen sind.<br />

Der klangliche Unterschied, der durch den SRC verursacht wird, ist nicht auffällig,<br />

insbesondere nicht negativ. Manche Personen empfinden die Präsenzanhebung sogar<br />

angenehm. Gerade in der Frage nach dem natürlichen Klang ist keine negative Tendenz<br />

<strong>für</strong> die Aufnahmen im Modus 1 erkennbar.<br />

6 Fazit<br />

Die Testpersonen erkennen im Allgemeinen keinen eindeutigen Unterschied zwischen<br />

den Aufnahmen mit und ohne Abtastratenwandler. Bei Untersuchungen verschiedener<br />

differenzierter Zusammenhänge werden die klanglichen Unterschiede zwischen den Auf-<br />

nahmen im Modus 1 und 2 deutlicher ersichtlich. Da diese Unterschiede, die durch SRC<br />

entstehen, nicht von jedem als negativ empfunden werden und diese Unterschiede sehr<br />

gering sind, so dass nicht mal die Mehrheit der im kritischen Hören geübte Tonmeister-<br />

Studenten signifikante Unterschiede feststellen können, kann man die Aussage treffen,<br />

44


dass die SRC in den getesteten Geräten von hoher Qualität sind. Es gibt jedoch hörbare<br />

klangliche Unterschiede, die von SRC verursacht werden (siehe Kapitel 5.3). Eine Ab-<br />

tastratenwandlung ist daher eine zusätzliche potentielle Fehlerquelle. Es existieren auf<br />

dem Markt noch weitere digitale Mikrofone, wobei nicht alle beide Aufnahme-Modi<br />

im AES42-Standard anbieten, sondern nur den Modus 1. In diesen Fällen wird dann<br />

unbedingt ein SRC am Anschlussgerät benötigt. und zweitens vertraut man bereits auf<br />

die mittlerweile weit entwickelte, qualitativ hochwertige SRC.<br />

Die in dieser Arbeit untersuchten Geräte sind von hoher Qualität. Selbst bei diesen<br />

hochwertigen SRC werden bestimmte Signale verändert, auch wenn diese Änderungen<br />

nicht immer eindeutig hörbar sind.<br />

Aus den Ergebnissen des Hörtests ist ersichtlich, dass es nicht zu signifikanten Pro-<br />

blemen führt, wenn SRCs verwendet werden, vorausgesetzt, sie sind hochwertig.<br />

Grundsätzlich sollte das Signal aber in seiner Audiobearbeitungskette so wenig wie<br />

möglich bearbeitet werden. Eine zusätzliche Abtastratenwandlung ist nun mal eine<br />

zusätzliche Fehlerquelle, die im Zweifel besser vermieden werden sollte. Im Aufnahme-<br />

Modus 1 ist man stets von der jeweiligen Qualität des Abtastratenwandlers abhängig.<br />

45


Abbildungsverzeichnis<br />

1 Veranschaulichung der oben genannten drei Fälle der Abtastratenwand-<br />

lung (aus [1] S. 138) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6<br />

2 Veranschaulichung von verzerrtem Signal durch Jitter (nach [3] S. 223) 7<br />

3 Veranschaulichung vom Aufbau des Frames mit seinen Subframes (aus<br />

[1] S.451) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9<br />

4 technische Daten über SRC des ADI-192DD . . . . . . . . . . . . . . . 10<br />

5 Skizze des Signalflusses . . . . . . . . . . . . . . . . . . . . . . . . . . . 18<br />

6 Auszug aus dem Hörtest A zur Ansicht . . . . . . . . . . . . . . . . . . 23<br />

7 Zusatzinformation <strong>für</strong> den verschickten Hörtest . . . . . . . . . . . . . 24<br />

8 Der Seminarraum 1 des <strong>Erich</strong>-<strong>Thienhaus</strong>-<strong>Institut</strong>s der <strong>Hochschule</strong> <strong>für</strong><br />

<strong>Musik</strong> Detmold. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25<br />

9 Grafik zur Veranschaulichung von Ergebnissen der verschiedenen Geräte:<br />

Kategorie a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29<br />

10 Grafik zur Veranschaulichung von Ergebnissen der verschiedenen Geräte:<br />

Kategorie b . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29<br />

11 Grafik zur Veranschaulichung von Ergebnissen der verschiedenen Geräte:<br />

Kategorie c . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30<br />

12 Grafik zur Veranschaulichung von Ergebnissen der verschiedenen Geräte:<br />

Kategorie d . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30<br />

13 Grafik zur Veranschaulichung von Ergebnissen der verschiedenen Quelle:<br />

Kategorie a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32<br />

14 Grafik zur Veranschaulichung von Ergebnissen der verschiedenen Quelle:<br />

Kategorie b . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32<br />

15 Grafik zur Veranschaulichung von Ergebnissen der verschiedenen Quelle:<br />

Kategorie c . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33<br />

16 Grafik zur Veranschaulichung von Ergebnissen der verschiedenen Quelle:<br />

Kategorie d . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33<br />

17 Grafiken: Auswertungen von bestimmten Kombinationen von Nexus und<br />

verschiedenen Quellen . . . . . . . . . . . . . . . . . . . . . . . . . . . 40<br />

18 Grafiken: Auswertungen von bestimmten Kombinationen von DM 1000<br />

und verschiedenen Quellen . . . . . . . . . . . . . . . . . . . . . . . . . 41<br />

19 Grafiken: Auswertungen von bestimmten Kombinationen von ADI-192DD<br />

und verschiedenen Quellen . . . . . . . . . . . . . . . . . . . . . . . . . 42<br />

Tabellenverzeichnis<br />

1 Vier mögliche Ausgänge des Signalentdeckungsexperiments im vorlie-<br />

genden Hörtest (nach [8] S.231) . . . . . . . . . . . . . . . . . . . . . . 16<br />

46


2 Liste über Aufnahmen zum Hörtest . . . . . . . . . . . . . . . . . . . . 19<br />

3 Auswertung der Ergebnisse, Hörtest A und B. Die Anzahl der Wertungen<br />

sind in Klammern angegeben; W: WCLK, S: SRC . . . . . . . . . . . . 27<br />

4 Auswertung der Ergebnisse einzelner Geräte . . . . . . . . . . . . . . . 28<br />

5 Auswertung der Ergebnisse einzelner Schallquellen . . . . . . . . . . . . 31<br />

6 Auswertung der Ergebnisse, Tendenz-Diskrepanz . . . . . . . . . . . . . 34<br />

7 Auswertung der Ergebnisse, 4 bestimmte Kombinationen . . . . . . . . 38<br />

Literatur<br />

[1] Watkinson, J.: The art of digital audio. Focal Press, Third Version, 2001.<br />

[2] Pohlmann, K.C.: Principles of digital audio. Mc Graw Hill, 2004.<br />

[3] Görne, T.: Tontechnik. Fachbuchverlag Leipzig, 2006.<br />

[4] Werwein, M.: ” Kapitel 17.1 und 17.2: Wandler.“ Digitale Audiotechnik: Wandler,<br />

Prozessoren, Systemarchitektur, 2007.<br />

[5] Recommendation ITU-R BS.1284-1*: General methods for the subjective as-<br />

sessment of sound quality. Rec. ITU-R BS.1284-1, 1997-2003.<br />

[6] Audio Engineering Society: AES Standard for Acoustics - Digital interface for<br />

microphones. AES, INC., New York, USA, 30.09.2003.<br />

[7] Audio Engineering Society: ” AES3-2003“ AES Recommanded Practice for Digital<br />

Audio Engineering - Serial transmission format for two-channel linearly represen-<br />

ted digital audio data. AES, INC., New York, USA, 09.09.2003.<br />

[8] Hellbrück, J.; Ellermeyer, W.: Physiologie, Psychologie und Pathologie. Hogrefe,<br />

2004.<br />

[9] Bortz, J.; Döring, N.: Forschungsmethoden und Evaluation <strong>für</strong> Human- und Sozi-<br />

alwissenschaftler. Springer, 2001.<br />

[10] Maiello, C.: Verhaltenswissenschaftliche Forschung <strong>für</strong> Einsteiger. VEP, 2006.<br />

[11] Kiesler; August, O. : ” Detmold Seminarraum 1 Referenz-Mehrkanalabhörraum:<br />

Akustischer Prüfbericht Nr. 1/2006. Geithain, 10.01.2006.<br />

[12] Meyer, J.: Akustik und musikalische Aufführungspraxis. Erwin Bochinsky, 1999.<br />

47

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!