07.01.2014 Aufrufe

Auswirkung der Diffusfeldkorrelation auf die räumliche Wahrnehmung

Auswirkung der Diffusfeldkorrelation auf die räumliche Wahrnehmung

Auswirkung der Diffusfeldkorrelation auf die räumliche Wahrnehmung

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

<strong>Auswirkung</strong>en <strong>der</strong> <strong>Diffusfeldkorrelation</strong> <strong>auf</strong> <strong>die</strong><br />

<strong>räumliche</strong> <strong>Wahrnehmung</strong><br />

Bachelorarbeit<br />

von<br />

Hans Riekehof-Böhmer<br />

Matrikel-Nr: 1873216<br />

3. Februar 2011<br />

Betreuer:<br />

Erstgutachter: Prof. Dr. Robert Mores<br />

Zweitgutachter: Dr. Helmut Wittek<br />

Hoschule für Angewandte Wissenschaften Hamburg<br />

Fachbereich Design, Me<strong>die</strong>n und Information<br />

Institut für Me<strong>die</strong>ntechnik


Erklärung<br />

Hiermit versichere ich, dass ich <strong>die</strong> vorliegende Bachelor-Thesis mit dem Titel ”<br />

<strong>Auswirkung</strong>en<br />

<strong>der</strong> <strong>Diffusfeldkorrelation</strong> <strong>auf</strong> <strong>die</strong> <strong>räumliche</strong> <strong>Wahrnehmung</strong>“ selbstständig und nur<br />

mit den angegebenen Hilfsmitteln verfasst habe.<br />

Alle Passagen, <strong>die</strong> ich wörtlich aus <strong>der</strong> Literatur o<strong>der</strong> aus an<strong>der</strong>en Quellen wie z.B. Internetseiten<br />

übernommen habe, habe ich deutlich als Zitat mit Angabe <strong>der</strong> Quelle kenntlich<br />

gemacht.<br />

Hamburg, den 3. Februar 2011<br />

Hans Riekehof-Böhmer


Vorwort<br />

Diese Arbeit entstand im Anschluss an mein Praktikum bei <strong>der</strong> Firma Schoeps. Ich<br />

möchte mich herzlich bei allen Mitarbeitern <strong>der</strong> Firma Schoeps für <strong>die</strong> gute Arbeitsatmosphäre<br />

und <strong>die</strong> großartige Unterstützung bedanken.<br />

Beson<strong>der</strong>er Dank gilt meinen Betreuern Herrn Professor Dr. Robert Mores und Herrn<br />

Dr. Helmut Wittek. Herrn Mores danke ich für das entgegen gebrachte Vertrauen und<br />

<strong>die</strong> wertvollen Ratschläge für meine Arbeit.<br />

Herrn Wittek danke ich vor allem für <strong>die</strong> Idee zu <strong>die</strong>ser Arbeit und <strong>die</strong> hervorragende<br />

Betreuung.<br />

Weiterhin danke ich Christof Faller für viele nützliche Hinweise in Bezug <strong>auf</strong> Korrelations<br />

- und Kohärenzfunktionen.


Zusammenfassung<br />

Die Weiterentwicklung von Aufnahmetechniken ist nach wie vor Gegenstand aktueller<br />

Forschung. Es werden weiterhin <strong>die</strong> Vor - und Nachteile unterschiedlicher Aufnahmetechniken<br />

und Mikrofonanordnungen diskutiert. Der Schwerpunkt <strong>der</strong> Diskussion wird<br />

mittlerweile im Bereich <strong>der</strong> <strong>räumliche</strong>n Abbildung unterschiedlicher Mikrofonanordnungen<br />

geführt, da <strong>die</strong> Lokalisation weitgehend verstanden ist.<br />

Als Messgröße für <strong>die</strong> <strong>räumliche</strong> Abbildung hat sich unter an<strong>der</strong>em <strong>die</strong> Kanalkorrelation<br />

etabliert. Zahlreiche Untersuchungen zeigen, dass <strong>die</strong> Kanalkorrelation erheblichen<br />

Einfluss <strong>auf</strong> <strong>die</strong> <strong>räumliche</strong> <strong>Wahrnehmung</strong> hat. Bei Surroundwie<strong>der</strong>gabesystemen wird<br />

<strong>die</strong> Kanalkorrelation mit <strong>der</strong> wahrgenommenen Umhüllung in Verbindung gebracht.<br />

Bei Stereowie<strong>der</strong>gabesystemen beeinflusst <strong>die</strong> Kanalkorrelation <strong>die</strong> <strong>Wahrnehmung</strong> <strong>der</strong><br />

Breite des Klangbildes. Für beide Attribute ist vor allem <strong>die</strong> Korrelation des Diffusschalls<br />

ausschlaggebend.<br />

In <strong>die</strong>ser Arbeit geht es im speziellen um <strong>die</strong> Korrelation zweikanaliger Mikrofonanordnungen<br />

im Diffusfeld. Es existieren unterschiedliche Messverfahren, um <strong>die</strong> Kanalkorrelation<br />

bestimmen zu können. Dabei sind nicht alle Verfahren universell einsetzbar<br />

und <strong>die</strong> Interpretation <strong>der</strong> Messergebnisse führt oft zu Missverständnissen. Ein Aspekt,<br />

den viele Messverfahren nicht berücksichtigen ist, dass <strong>die</strong> Kanalkorrelation von zwei<br />

räumlich getrennten Mikrofonen frequenzabhängig ist.<br />

Aus <strong>die</strong>sem Grund wird in <strong>die</strong>ser Arbeit ein rechnerisch ermittelter Wert vorgestellt,<br />

<strong>der</strong> <strong>die</strong> frequenzabhängige Kanalkorrelation von zwei räumlich getrennten Mikrofonen<br />

berücksichtigt. Dieser Wert soll eine Voraussage über <strong>die</strong> abgebildete <strong>räumliche</strong> Breite<br />

eines beliebigen Stereomikrofons geben. In einem Hörversuch zeigt sich, dass <strong>die</strong>ser<br />

Wert bereits gut in Verbindung mit <strong>der</strong> wahrgenommenen Breite steht.


Inhaltsverzeichnis<br />

Inhaltsverzeichnis<br />

1 Einleitung 1<br />

2 Räumliches Hören 4<br />

2.1 Interaurale Zeit - und Pegeldifferenzen . . . . . . . . . . . . . . . . . . 4<br />

2.2 Räumliche Tiefe und Apparent Source Width . . . . . . . . . . . . . . 5<br />

2.3 Umhüllung und Breite . . . . . . . . . . . . . . . . . . . . . . . . . . . 6<br />

2.4 Mikrofonanordnungen <strong>auf</strong> Basis des <strong>räumliche</strong>n Hörens . . . . . . . . . 10<br />

2.4.1 L<strong>auf</strong>zeitverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . 10<br />

2.4.2 Koinzidente Verfahren . . . . . . . . . . . . . . . . . . . . . . . 11<br />

2.4.3 Äquivalente Verfahren . . . . . . . . . . . . . . . . . . . . . . . 12<br />

3 Elemente <strong>der</strong> Signalverarbeitung 13<br />

3.1 Korrelationsfunktion stochastischer und determinierter Signale . . . . . 13<br />

3.2 Kreuz - und Autoleistungsspektren . . . . . . . . . . . . . . . . . . . . 16<br />

3.3 Der Kohärenzgrad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17<br />

3.4 Die <strong>räumliche</strong> Kohärenzfunktion . . . . . . . . . . . . . . . . . . . . . . 18<br />

4 Erstellung <strong>der</strong> Stimuli in Matlab 24<br />

4.1 Einführung des DFI-Prädiktor“ . . . . . . . . . . . . . . . . . . . . . . ”<br />

29<br />

5 Vorversuche 33<br />

5.1 Untersuchung <strong>der</strong> koinzidenten Stimuli . . . . . . . . . . . . . . . . . . 34<br />

5.2 Untersuchung <strong>der</strong> L<strong>auf</strong>zeitstimuli . . . . . . . . . . . . . . . . . . . . . 37<br />

5.3 Untersuchung <strong>der</strong> äquivalenten Stimuli . . . . . . . . . . . . . . . . . . 39<br />

5.4 Untersuchung <strong>der</strong> gemischten Stimuli . . . . . . . . . . . . . . . . . . . 40<br />

6 Hörversuch 44<br />

7 Fazit 48<br />

Literatur 50<br />

Anhang 54<br />

Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer<br />

I


1 Einleitung<br />

Die Qualität von Ton<strong>auf</strong>nahmen ist in großem Maße von <strong>der</strong> Erfahrung des Tonmeisters<br />

abhängig. Der Grund dafür ist, dass bestimmte Aspekte <strong>der</strong> Aufnahmetechnik noch<br />

nicht ganz verstanden sind. Die Lokalisation von Schallquellen ist bereits gut erforscht<br />

und bei vielen Autoren besteht ein Konsens über <strong>die</strong>ses Thema [1], [2], [3]. Das Thema<br />

<strong>der</strong> <strong>räumliche</strong>n Abbildung und Umhüllung ist hingegen noch nicht komplett verstanden<br />

und es existieren verschiedene Meinungen über <strong>die</strong> Ursachen.<br />

In <strong>die</strong>ser Arbeit wird daher versucht, <strong>die</strong> bestehenden Aufnahmetechniken wie AB, XY<br />

o<strong>der</strong> ORTF in Bezug <strong>auf</strong> <strong>die</strong> <strong>räumliche</strong> Abbildung genauer zu verstehen.<br />

Ein wichtiges Qualitätsmerkmal mehrkanaliger Aufnahmen ist <strong>die</strong> bei <strong>der</strong> Wie<strong>der</strong>gabe<br />

wahrgenommene Räumlichkeit und Umhüllung. Die Umhüllung ist dabei das am meist<br />

diskutierte Thema.<br />

Erst mit <strong>der</strong> Einführung von Mehrkanalton wurde es möglich Räumlichkeit darzustellen.<br />

Seitdem kann <strong>der</strong> Toningenieur mit geschickter Mikrofonierung zu einem gewissen<br />

Grad den Raumklang eines Aufnahmeraumes in den Wie<strong>der</strong>gaberaum transportieren.<br />

Je nachdem, wie gut <strong>die</strong>s gelingt, ist <strong>der</strong> <strong>räumliche</strong> Eindruck o<strong>der</strong> <strong>die</strong> Umhüllung ausgeprägter.<br />

Generell wird ein ausgeprägter <strong>räumliche</strong>r Eindruck als positiv empfunden<br />

[4]. Deshalb ist <strong>die</strong> Räumlichkeit ein Qualitätsmerkmal von Ton<strong>auf</strong>nahmen. Neben <strong>der</strong><br />

Räumlichkeit existieren noch viele weitere Aspekte, nach denen Mehrkanalton<strong>auf</strong>nahmen<br />

beurteilt werden. Die am häufigsten genannten Aspekte sind:<br />

• Wie gut lassen sich <strong>die</strong> einzelnen Schallquellen lokalisieren? (Lokalisation)<br />

• Wie ausgeprägt ist <strong>der</strong> <strong>räumliche</strong> Eindruck? (Tiefe)<br />

• Wie stark fühle ich mich in einen Raum hineinversetzt? (Umhüllung)<br />

In <strong>der</strong> meist englischen Literatur werden <strong>die</strong>se drei Aspekte localization, depth und<br />

envelopment genannt. Die deutschen Begriffe lassen sich direkt aus dem Englischen<br />

übersetzen zu: Lokalisation, Tiefe und Umhüllung.<br />

Eine kurze Übersicht darüber, was <strong>die</strong>se drei Aspekte bedeuten und welche Parameter<br />

<strong>die</strong>se drei Aspekte beeinflussen gibt es in Kapitel 2. Es geht im speziellen um <strong>die</strong> Parameter,<br />

<strong>die</strong> <strong>auf</strong>nahmeseitig den Aspekt <strong>der</strong> Umhüllung beeinflussen. Eine entscheidende<br />

Frage für jeden Toningenieur ist:<br />

Wie muss ich meine Mikrofone bei einer Aufnahme positionieren, um zu den gewünschten<br />

Ergebnissen zu<br />

”<br />

kommen?“<br />

Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer 1


1 Einleitung<br />

Diese Frage betrifft <strong>die</strong> drei Aspekte Lokalisation, Tiefe und Umhüllung. Auf welche<br />

Art und Weise in den einzelnen Aspekten gute Ergebnisse zu erzielen sind wurde<br />

bereits in Arbeiten wie [4], [2] und [1] dargestellt. Beispielsweise kann mit Hilfe des<br />

Image-Assistent“ [5] für eine beliebige zwei - o<strong>der</strong> dreikanalige Mikrofonanordnung<br />

”<br />

<strong>der</strong> Aufnahmewinkel berechnet werden. Anhand <strong>der</strong> resultierenden Lokalisationskurve<br />

kann eine gute Voraussage darüber getroffen werden, wo <strong>die</strong> einzelnen Schallquellen<br />

zwischen den Lautsprechern abgebildet werden.<br />

Eine exakte Voraussage darüber, wie umhüllend o<strong>der</strong> wie breit eine Mikrofonanordnung<br />

klingen wird, beruht momentan eher <strong>auf</strong> Erfahrungswerten. Es ist bekannt, dass<br />

<strong>die</strong> Korrelation des Diffusschalls entscheidend ist für <strong>die</strong> Umhüllungsempfindung. Bei<br />

zweikanaliger Wie<strong>der</strong>gabe lässt sich <strong>die</strong> Korrelation des Diffusschalls als Breite o<strong>der</strong><br />

Ausdehnung beschreiben [6]. Daher wird im Folgenden von <strong>der</strong> Breite o<strong>der</strong> <strong>der</strong> Ausdehnung<br />

einer Aufnahme gesprochen, da sich <strong>die</strong>se Arbeit <strong>auf</strong> <strong>die</strong> Untersuchung von<br />

Stereomikrofonen beschränkt.<br />

Die Frage <strong>der</strong> Umhüllung spielt eher bei <strong>der</strong> Surroundwie<strong>der</strong>gabe eine Rolle. Dennoch<br />

ist es bei zweikanaliger Wie<strong>der</strong>gabe möglich, einen umhüllten Eindruck zu erzielen,<br />

wenn <strong>die</strong> Schwankungen im IID und ITD genügend groß sind (s. Kapitel 2). Wie in<br />

[4] o<strong>der</strong> [7] wird in <strong>die</strong>ser Arbeit davon ausgegangen, dass <strong>die</strong> Dekorrelation des Diffusschalls<br />

zwischen Mikrofonsignalen zu einer ausgeprägteren Umhüllung o<strong>der</strong> Breite<br />

des Klangbildes führt. Deshalb werden Mikrofonanordnungen mit räumlich getrennten<br />

Mikrofonen meist den Koinzidenten vorgezogen, da aus einem größeren Abstand eine<br />

größere Dekorrelation <strong>der</strong> Mikrofonsignale folgt (s. Kapitel 3.4). Die Dekorrelation des<br />

Diffusschalls in den Mikrofonsignalen hat außerdem <strong>Auswirkung</strong>en <strong>auf</strong> <strong>die</strong> Klangfarbe<br />

und ist somit noch wichtiger für eine gute Aufnahme [8].<br />

Vor allem <strong>die</strong> Zusammenhänge zwischen Koinzidenten, L<strong>auf</strong>zeit - und Äquivalenzverfahren<br />

sind von Bedeutung und sollen in <strong>die</strong>ser Arbeit untersucht werden. Ziel ist es,<br />

einen Wert zu definieren, <strong>der</strong> eine Aussage über <strong>die</strong> <strong>Diffusfeldkorrelation</strong> einer Mikrofonanordnung<br />

geben kann. Dieser Wert soll es ermöglichen, <strong>die</strong> Ausdehnung o<strong>der</strong> Breite<br />

einer Aufnahme, <strong>die</strong> mit einer bestimmten Mikrofonanordnung durchgeführt wird, abschätzen<br />

zu können.<br />

2 Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer


Die konkrete Frage <strong>die</strong> in <strong>die</strong>se Arbeit verfolgt wird lautet:<br />

Lässt sich durch <strong>die</strong> Kohärenzfunktion einer zweikanaligen<br />

Mikrofonanordnung ein Wert definieren, <strong>der</strong> es ermöglicht eine<br />

Voraussage über <strong>die</strong> abgebildete Raumbreite <strong>die</strong>ser Mikrofonanordnung<br />

bei stereofoner Wie<strong>der</strong>gabe zu geben?<br />

Dieser Wert wird im Folgenden DFI-Prädiktor genannt [8]. DFI steht für Diffusfield<br />

Image und <strong>der</strong> Zusatz Prädiktor“ soll verdeutlichen, dass es sich nur um eine perzeptive<br />

”<br />

Voraussage handelt. Als Grundlage für den DFI-Prädiktor wird <strong>die</strong> Kohärenzfunktion<br />

für zwei Mikrofone beliebiger Richtcharakteristik im Diffusfeld verwendet [9]. Eine<br />

genaue Beschreibung räumlich getrennter Mikrofone und <strong>der</strong>en <strong>Diffusfeldkorrelation</strong><br />

folgt in Kapitel 3. Einzelheiten zum DFI-Prädiktor gibt es in Kapitel 4.1. In vielen<br />

Untersuchungen, <strong>die</strong> sich ebenfalls mit <strong>der</strong> Korrelation des Diffusschalls beschäftigen,<br />

wurde als Messverfahren <strong>der</strong> Korrelationskoeffizient o<strong>der</strong> <strong>der</strong> Kohärenzgrad (s. Kapitel<br />

3) benutzt. Der Korrelationskoeffizient sowie <strong>der</strong> Kohärenzgrad liefern allerdings<br />

keine genaue Aussage darüber, wie korreliert zwei Mikrofonsignale in einem diffusen<br />

Schallfeld wirklich sind.<br />

Um geeignete Stimuli für einen Hörversuch zu erzeugen, <strong>die</strong> möglichst frei von unerwünschten<br />

Einflüssen sind, werden alle Mikrofonanordnungen virtuell in Matlab Simuliert.<br />

Das Matlabprogramm, das <strong>die</strong> Simulation ermöglicht, wurde von Wittek entwickelt<br />

[8]. Innerhalb <strong>die</strong>ses Matlabprogramms wird ein Rauschpaar erstellt, das <strong>auf</strong> <strong>der</strong><br />

Basis <strong>der</strong> theoretischen <strong>Diffusfeldkorrelation</strong> nach [9] dekorreliert ist. Dieses Rauschpaar<br />

wird zur Dekorrelation einer Raumimpulsantwort verwendet. Mit <strong>der</strong> dekorrelierten<br />

Impulsantwort wird eine trockene Aufnahme gefaltet. Eine genaue Beschreibung<br />

des Matlabprogramms und <strong>der</strong> Stimulierstellung gibt es in Kapitel 4.<br />

In <strong>die</strong>ser Arbeit wird davon ausgegangen, dass vor allem <strong>die</strong> <strong>Diffusfeldkorrelation</strong> unterhalb<br />

von 1,5kHz maßgeblichen Einfluss <strong>auf</strong> <strong>die</strong> wahrgenommene Breite o<strong>der</strong> Umhüllung<br />

hat. Oberhalb <strong>die</strong>ser Frequenz findet durch den Abstand <strong>der</strong> Ohren eine natürliche Dekorrelation<br />

statt. Deshalb wird <strong>der</strong> DFI-Prädiktor aus <strong>der</strong> Kohärenzfunktion unterhalb<br />

von 1,5kHz berechnet (s. Kapitel 4.1).<br />

Ein weiteres Anliegen ist es zu zeigen, dass <strong>der</strong> Korrelationskoeffizient und <strong>der</strong> Kohärenzgrad<br />

für Anordnungen mit räumlich getrennten Mikrofonen keine exakten Aussagen<br />

geben. Eine Übersicht über <strong>die</strong> wichtigen Elemente <strong>der</strong> Signalverarbeitung gibt es in<br />

Kapitel 3.<br />

Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer 3


2 Räumliches Hören<br />

2 Räumliches Hören<br />

Obwohl <strong>die</strong>se Arbeit eine sehr konkrete Frage verfolgt, soll an <strong>die</strong>ser Stelle ein kurzer<br />

Überblick über <strong>die</strong> Mechanismen des <strong>räumliche</strong>n Hörens gegeben werden. Es geht dabei<br />

vor allem darum, wie <strong>die</strong> drei Aspekte Lokalitsation, Tiefe und Umhüllung überhaupt<br />

zustande kommen. Der Fokus liegt hierbei <strong>auf</strong> dem Aspekt <strong>der</strong> Umhüllung, da <strong>die</strong>ser<br />

stark von <strong>der</strong> Korrelation des Diffusschalls abhängt.<br />

Die Umhüllung ist wie kaum ein an<strong>der</strong>er Aspekt viel diskutiert und es existieren unterschiedliche<br />

Auffassungen über <strong>die</strong> Ursachen <strong>der</strong> Umhüllung.<br />

2.1 Interaurale Zeit - und Pegeldifferenzen<br />

Die Parameter, <strong>die</strong> zur Lokalisierung von Schallquellen beitragen, sind bereits gut erforscht<br />

und bei vielen Autoren besteht über <strong>die</strong>ses Thema ein Konsens. Eine Übersicht<br />

über <strong>die</strong> grundlegenden Elemente des Richtungshörens findet man in [10], [11] o<strong>der</strong> [1].<br />

Die entscheidenden Parameter für <strong>die</strong> Lokalisation sind:<br />

1. ITD: Interaural Time Delay<br />

2. IID: Interaural Intensity Difference<br />

Das menschliche Ohr ist in <strong>der</strong> Lage, sehr feine L<strong>auf</strong>zeitunterschiede zwischen den beiden<br />

Ohrsignalen auszuwerten. Anhand <strong>die</strong>ser L<strong>auf</strong>zeitunterschiede kann einem Schallereignis<br />

eine Richtung zugeordnet werden. Das Gesetz <strong>der</strong> ersten Wellenfront (Präzedenzeffekt)<br />

fällt ebenfalls in <strong>die</strong>se Kategorie. Ein Schallereigniss wird aus <strong>der</strong> Richtung<br />

wahrgenommen, aus <strong>der</strong> <strong>die</strong> erste Wellenfront an den Kopf gelangt. Der Präzedenseffekt<br />

ist vor allem bei <strong>der</strong> Lokalisation überlagerter Schallquellen entscheidend.<br />

IID und ITD sind vor allem für das Richtungshören in <strong>der</strong> Horizontalebene wichtig.<br />

Für <strong>die</strong> Lokalisation in <strong>der</strong> Medianebene sind neben ITD und IID vor allem spektrale<br />

Bewertungen <strong>der</strong> Ohrmuscheln von entscheiden<strong>der</strong> Bedeutung. Man kann <strong>die</strong> Ohrmuscheln<br />

als ein lineares System <strong>auf</strong>fassen, das den eintreffenden Schall <strong>auf</strong> dem Weg<br />

zum Trommelfell spektral beeinflusst. Ein lineares System ist durch seine Übertragunsfunktion<br />

eindeutig definiert. Die Übertragungsfunktion <strong>der</strong> Ohrmuscheln wird als<br />

Head-Related-Transfer-Function“ (HRTF) bezeichnet.<br />

”<br />

4 Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer


2.2 Räumliche Tiefe und Apparent Source Width<br />

Abbildung 2.1.1: Kopfbezogenes Koordinatensystem nach Blauert [11]<br />

Mit einem Kunstkopf kann für jede beliebige Schalleinfallsrichtung für beide Ohren<br />

eine HRTF gemessen werden. Die HRTFs können dazu verwendet werden, um Richtungshören<br />

bei Kopfhörerwie<strong>der</strong>gabe zu ermöglichen. Dazu wird das entsprechende<br />

Kopfhörersignal mit <strong>der</strong> jeweiligen HRTF gefaltet.<br />

2.2 Räumliche Tiefe und Apparent Source Width<br />

Neben einer guten Lokalisation ist <strong>die</strong> Darstellung von Räumlichkeit ein wichtiger<br />

Aspekt von Mehrkanalton. Die Räumlichkeit und <strong>die</strong> Distanzen zu Schallquellen werden<br />

von den ersten Reflexionen geprägt. Diese frühen Reflexionen erreichen den Hörer in<br />

15-50ms nach dem Direktsignal. Je nach Reflexionsmuster und Energieverteilung kann<br />

<strong>der</strong> Hörer <strong>auf</strong> <strong>die</strong> Art des Raumes schließen und <strong>die</strong> Entfernung und Ausdehnung einer<br />

Schallquelle abschätzen.<br />

Die Ausdehnung von Schallquellen wird in <strong>der</strong> englischen Literatur mit dem Begriff<br />

Apparent Source Width“ (ASW) bezeichnet. Die Energieverteilung <strong>der</strong> ersten Reflexionen<br />

ist entscheidend dafür, wie gut <strong>räumliche</strong> Tiefe abgebildet wird. In [4]<br />

”<br />

wird<br />

gezeigt, wie ein ideales Hallprofil eines Raumes aussehen könnte. Die Energie <strong>der</strong> ersten<br />

Reflexionen in dem Zeitfenster 20-50ms sollte 1 bis 1 geringer sein als <strong>die</strong> Energie<br />

2 4<br />

des Direktsignals. Reflexionen, <strong>die</strong> innerhalb <strong>die</strong>ses Zeitfensters aus <strong>der</strong>selben Richtung<br />

kommen wie das Direktsignal, werden nicht wahrgenommen [4]. Deshalb beeinflussen<br />

vor allem seitliche Reflexionen ( ”<br />

lateral Reflections“ ) <strong>räumliche</strong> Tiefe und ASW.<br />

Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer 5


2 Räumliches Hören<br />

Abbildung 2.2.1: Schematischer Abl<strong>auf</strong> einer Schallfeldwahrnemung im Raum nach [2].<br />

Die Lokalisation entsteht durch <strong>die</strong> erste Wellenfront. Die Distanz und<br />

<strong>die</strong> Ausdehnung <strong>der</strong> Schallquelle werden von den ersten Reflexionen<br />

bestimmt. Der Nachhall ist letztlich für <strong>die</strong> Umhüllung verantwortlich.<br />

Die Energie in dem Zeitfenster von 50-150ms sollte wesentlich geringer sein als in dem<br />

20-50ms Zeitfenster. Dies hängt vor allem damit zusammen, dass das Gehör eine gewisse<br />

Trägheit <strong>auf</strong>weist. Es ist wesentlich einfacher den Anfang eines Schallereignisses<br />

zu hören als das Ende. Beson<strong>der</strong>s wenn mehrere Schallquellen in einem Raum einen<br />

diffusen und kontinuierlichen Hall erzeugen. Aus <strong>die</strong>sem Grund muss zwischen vor<strong>der</strong>gründigen<br />

Schallereignissen ( foreground stream“ ) und hintergründigen Schallereignissen<br />

( background stream“ ) unterschieden werden. Auf einer Cocktailparty wäre ein<br />

”<br />

”<br />

vor<strong>der</strong>gründiges Schallereignis ein Gesprächspartner und ein hintergründiges Schallereignis<br />

<strong>die</strong> diffusen Gespräche <strong>der</strong> an<strong>der</strong>en Gäste.<br />

Die ersten Reflexionen in dem 20-50ms Zeitfenster werden immer dem vor<strong>der</strong>gründigen<br />

Schallereigniss zugeordnet und sind somit viel wichtiger für <strong>die</strong> Distanzwahrnehmung<br />

und ASW als Reflexionen in dem 50-150ms Zeitfenster. Zu viel Energie in dem 50-150ms<br />

Zeitfenster führt zu schlechter Sprachverständlichkeit o<strong>der</strong> sogar Echos [4].<br />

2.3 Umhüllung und Breite<br />

Wie bereits erwähnt, wird das Thema Umhüllung in <strong>der</strong> Literatur immer noch kontrovers<br />

diskutiert. Es existieren momentan einige Parameter, an denen <strong>die</strong> Umhüllung<br />

gemessen werden kann. Diese Parameter stammen allerdings meistens aus <strong>der</strong> Raumakustik<br />

und werden als Bewertungskriterien herangezogen, um <strong>die</strong> Umhüllung in einem<br />

6 Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer


2.3 Umhüllung und Breite<br />

Raum abschätzen zu können.<br />

Sehr etabliert ist <strong>die</strong> Messung des interauralen Kreuzkorrelationskoeffizienten IACC“. ”<br />

Mit einem Kunstkopf wird zunächst eine binaurale Impulsantwort an <strong>der</strong> Hörposition<br />

erstellt. Der IACC wird anhand <strong>der</strong> interauralen Kreuzkorrelationsfunktion IACF“ ”<br />

bestimmt.<br />

IACF t1 ,t 2<br />

=<br />

∫ t2<br />

t 1<br />

√ ∫ t2<br />

p L (t) · p R (t − τ) dt<br />

t 1<br />

p L (t) dt ·<br />

∫ t2<br />

t 1<br />

p R (t) dt<br />

IACF nach [10]<br />

Der IACC folgt aus <strong>der</strong> IACF.<br />

IACC t1 ,t 2<br />

= max |IACF t1 ,t 2<br />

(τ)| IACC nach [10]<br />

für −1 < τ < 1 (τ in ms)<br />

Der IACC kann außerdem für verschiedene Frequenzbän<strong>der</strong> und Zeitbereiche bestimmt<br />

werden (s. Abbildung 2.2.1). Je nach Korrelationsgrad in dem jeweiligen Bereich, wird<br />

<strong>der</strong> IACC für verschiedene Beurteilungen herangezogen. Der IACC im Zeitfenster 80-<br />

500ms wird als Bewertungskriterium für <strong>die</strong> Umhüllung in einem Raum benutzt.<br />

In [12] wird davon ausgegangen, dass Fluktuationen im ITD und IID für <strong>die</strong> Umhüllung<br />

entscheidend sind. Es wird dabei in Umhüllung bei tiefen und hohen Frequenzen unterschieden.<br />

Bei Frequenzen unter 400Hz entsteht Umhüllung, wenn das ITD mit einer<br />

Geschwindigkeit von 4-20Hz schwankt. Oberhalb von 400Hz sind Schwankungen im IID<br />

und ITD von Bedeutung. Langsamere Schwankungen als 3Hz werden als Bewegung <strong>der</strong><br />

Schallquelle wahrgenommen.<br />

Eine Messmethode, um <strong>die</strong> Fluktuationen im ITD und IID bestimmen zu können ist,<br />

<strong>die</strong> DFT ( Diffusfield Transferfunction“ ). Eine exakte Beschreibung <strong>der</strong> DFT findet<br />

”<br />

man in [12]. Die Messung <strong>der</strong> <strong>Diffusfeldkorrelation</strong>, <strong>die</strong> in <strong>die</strong>ser Arbeit verwendet wird,<br />

ist ein an<strong>der</strong>er Ansatz. Bei <strong>der</strong> DFT wird zwischen sehr schmalen Bän<strong>der</strong>n (1-2Hz) aus<br />

einer binauralen Impulsantwort <strong>die</strong> ITD und <strong>der</strong> Schalldruck extrahiert und gemittelt.<br />

Die <strong>Diffusfeldkorrelation</strong> wie sie in <strong>die</strong>ser Arbeit definiert wird, berechnet sich aus <strong>der</strong><br />

Kohärenzfunktion für zwei räumlich getrennte Mikrofone in einem idealen Diffusfeld<br />

nach [9].<br />

Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer 7


2 Räumliches Hören<br />

Es existieren verschiedene Meinungen darüber, inwiefern <strong>die</strong> Korrelation des Diffusschalls<br />

von Mikrofonsignalen für <strong>die</strong> Umhüllung verantwortlich ist. In [13] wird gezeigt,<br />

dass es einen optimalen Kohärenzgrad k gibt (s. Kapitel 3.3).<br />

Hier wurde in einem schalltoten Raum über vier Lautsprecher bandbegrenztes Rauschen<br />

mit verschiedenen Kohärenzgraden abgespielt (0,25-2kHz). Ab einem Kohärenzgrad<br />

k < 0.2 zwischen den Rauschsignalen bilden sich <strong>die</strong> einzelnen Lautsprecher zu<br />

diskreten Schallquellen aus. Bei einem Kohärenzgrad von k = 0.35 ergibt sich eine gute<br />

Umhüllungsempfindung. Bei größeren Kohärenzgraden wird <strong>die</strong> Umhüllung immer<br />

geringer, bis letztendlich eine Im-Kopf-Lokalisation eintritt.<br />

Dieser Ansicht wird sich in [2] angeschlossen. Für eine gute Umhüllung ist demnach<br />

eine gewisse Korrelation des Diffusschalls erfor<strong>der</strong>lich. Zu geringe Korrelation führt<br />

zu einem Zerfall des gesamten Klangbildes. In [14] wurden verschiedene Raummikrofonanordnungen<br />

untersucht. In einem Hörversuch wurde gezeigt, dass Raummikrofonanordungen<br />

mit einem kleineren Abstand (d.h größerer Korrelation) als umhüllen<strong>der</strong><br />

empfunden werden. Dies unterstützt <strong>die</strong> Theorie, dass <strong>die</strong> Kanäle eine gewisse Korrelation<br />

<strong>auf</strong>weisen sollten.<br />

In [4] wird genau das Gegenteil <strong>die</strong>ser Ansicht als wichtig für eine gute Umhüllungsempfindung<br />

angegeben. Der Diffusschallanteil (Nachhall) in einem Raummikrofon sollte in<br />

allen vier bzw. zwei Mikrofonen komplett dekorreliert sein. Diese These beruht vor<br />

allem <strong>auf</strong> <strong>der</strong> langjährigen Erfahrung, dass Ton<strong>auf</strong>nahmen mit einer Mikrofonanordnung<br />

größeren Abstands oft als umhüllen<strong>der</strong> empfunden werden. Bestätigt wurde <strong>die</strong>se<br />

Theorie in Forschungsarbeiten zur Akustik in kleinen Räumen [7].<br />

Die Trägheit des Ohres ist auch bei <strong>der</strong> Umhüllung von entscheiden<strong>der</strong> Bedeutung<br />

[7]. Um <strong>die</strong>s zu beschreiben wird zwischen drei Fällen unterschieden, <strong>die</strong> sich <strong>auf</strong> <strong>die</strong><br />

Umhüllungsempfindung auswirken.<br />

1. CSI: Continuous spatial impression<br />

2. ESI: Early spatial impression<br />

3. BSI: Background spatial impression<br />

Wenn eine kontinuierliche Schallquelle in einen Raum strahlt, kann zwischen vor<strong>der</strong>gründigem<br />

und hintergründigem Schall nicht unterschieden werden. In <strong>die</strong>sem Fall<br />

spricht man von CSI. Bei diskontinuierlichen Schallquellen kommt es zu kleinen Pausen<br />

zwischen verschiedenen Schallereignissen. Dadurch wird <strong>der</strong> Anteil <strong>der</strong> ersten Reflexionen<br />

wichtig für <strong>die</strong> <strong>Wahrnehmung</strong>. Reflexionen <strong>die</strong> 50ms nach dem Direktschall<br />

8 Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer


2.3 Umhüllung und Breite<br />

eintreffen werden <strong>die</strong>sem zugeordnet. Dieser Fall wird mit ESI bezeichnet.<br />

Erst wenn <strong>der</strong> Raum groß genug ist o<strong>der</strong> einen ausreichend langen Nachhall hat, so dass<br />

genügend energiereiche Reflexionen nach 50ms zum Hörer gelangen, spricht man von<br />

BSI. Die BSI ist nach [7] <strong>die</strong> wichtigste Phase für eine gute Umhüllungsempfindung.<br />

Zusammenfassend lässt sich sagen, dass <strong>die</strong> Umhüllung gesteigert werden kann, wenn<br />

Fluktuationen im IID und ITD möglichst hoch sind. Möglichst viele Fluktuationen werden<br />

begünstigt, wenn <strong>der</strong> Diffusschall maximal dekorreliert ist. Bei sehr dekorreliertem<br />

Diffusschall ist eine Umhüllungsempfindung bei zweikanaliger Wie<strong>der</strong>gabe möglich [7],<br />

[15]. Ansonsten ist <strong>die</strong> Korrelation des Diffusschalls für <strong>die</strong> Ausdehnung des Klangbildes<br />

verantwortlich [6].<br />

In an<strong>der</strong>en Arbeiten ([2], [14], [13]) wird davon ausgegangen, dass eine gewisse Korrelation<br />

im diffusen Anteil <strong>der</strong> Kanäle bestehen muss, um ein ausgewogenes Verhältnis<br />

zwischen Lokalisation, Tiefe und Umhüllung zu bekommen. Eine zu hohe Dekorrelation<br />

<strong>der</strong> Kanäle führt zu schlechter Ortung und einem Zerfall des Klangbildes.<br />

In <strong>die</strong>ser Arbeit wird davon ausgegangen, dass für eine gute Umhüllung o<strong>der</strong> Breite<br />

des Klangbildes, eine Dekorrelation des Diffusschalls erfor<strong>der</strong>lich ist. Der Direktschall<br />

und <strong>die</strong> ersten Reflexionen erzeugen genügend korrelierte Signale in zwei Mikrofonen,<br />

um <strong>die</strong> Lokalisation und <strong>die</strong> <strong>räumliche</strong> Tiefe stabil zu halten.<br />

Der Direktschall einer einzigen Schallquelle (erste Wellenfront) hat in zwei räumlich<br />

getrennten Mikrofonen generell eine Kohärenz von 1, wenn <strong>die</strong> quadrierte Kohärenzfunktion<br />

(s. Gleichung (8)) betrachtet wird. Der Kohärenzgrad (s. Gleichung (7)) wird<br />

in <strong>die</strong>sem Fall ebenfalls zu 1. Der normierte Kreuzkorrelationskoeffizient kann in <strong>die</strong>sem<br />

Fall allerdings Werte zwischen -1 und 1 annehmen [16]. Dies liegt daran, dass<br />

zu <strong>die</strong>sem Zeitpunkt noch keine Reflexionen o<strong>der</strong> diffusen Anteile stochastische Phasenverschiebungen<br />

hervorrufen. Der Direktschall hat eine feste Phasenbeziehung und<br />

daraus resultiert eine Kohärenz von 1 für alle Frequenzen. In einem freien Schallfeld<br />

liegt <strong>die</strong>ser Zustand dauerhaft vor. In einem freien Schallfeld unterscheiden sich <strong>die</strong><br />

Signale von zwei räumlich getrennten Mikrofonen nur im Pegel und in <strong>der</strong> L<strong>auf</strong>zeit und<br />

haben eine feste Phasenbeziehung.<br />

Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer 9


2 Räumliches Hören<br />

2.4 Mikrofonanordnungen <strong>auf</strong> Basis des <strong>räumliche</strong>n Hörens<br />

Alle Mikrofonanordungen basieren <strong>auf</strong> den Grundlagen des <strong>räumliche</strong>n Hörens. Wie<br />

in Kapitel 2.1 bereits beschrieben wurde, basiert <strong>die</strong> Lokalisation von Schallquellen<br />

<strong>auf</strong> interauralen Zeit - und Pegeldifferenzen. Aus <strong>die</strong>sem Sachverhalt lassen sich drei<br />

Grundformen für mehrkanalige Mikrofonanordnungen ableiten.<br />

1. L<strong>auf</strong>zeitbasierte Verfahren (L<strong>auf</strong>zeitstereofonie)<br />

2. Pegelbasierte Verfahren (Intensitätsstereofonie)<br />

3. Verfahren, <strong>die</strong> beide Aspekte berücksichtigen (Äquivalenzstereofonie)<br />

Pegelbasierte Verfahren werden auch als Koinzident bezeichnet. Im Folgenden werden<br />

hier <strong>die</strong> wichtigsten Stereoanordnungen zu den jeweiligen Verfahren vorgestellt, da sich<br />

<strong>die</strong>se Arbeit ausschließlich <strong>auf</strong> <strong>die</strong>se bezieht. Eine detailliertere Übersicht über <strong>die</strong> gängigen<br />

Mikrofonverfahren gibt es in [17], [2].<br />

Die Vor - und Nachteile <strong>der</strong> unterschiedlichen Anordnungen werden viel diskutiert.<br />

Über <strong>die</strong> Jahre haben sich bestimmte Meinungen zu gewissen Vor - und Nachteilen von<br />

Mikrofonanorndungen etabliert. Ein wichtiger Gedanke <strong>die</strong>ser Arbeit ist es zu zeigen,<br />

dass mit jedem Mikrofonverfahren in Bezug <strong>auf</strong> Breite des Klangbildes vergleichbare<br />

Ergebnisse zu erzielen sind.<br />

2.4.1 L<strong>auf</strong>zeitverfahren<br />

In <strong>die</strong>se Kategorie fallen alle Mikrofonanordnungen, <strong>die</strong> ausschließlich aus Druckempfängern<br />

bestehen. Für Stereo sind <strong>die</strong>s alle AB-Anordnugen in einem beliebigem Abstand.<br />

Die Lokalisation von Schallquellen findet bei AB-Verfahren über L<strong>auf</strong>zeiten und<br />

den Präzedenseffekt statt. Der Aufnahmewinkel wird über den Abstand <strong>der</strong> Druckempfänger<br />

kontrolliert.<br />

Für eine gute Lokalisation bei <strong>der</strong> Wie<strong>der</strong>gabe über Lautsprecher ist nur <strong>der</strong> Sweetspot“<br />

ideal [4]. Dies gilt allerdings nur für AB-Anordnungen mit kleinen Abständen.<br />

”<br />

Wenn <strong>die</strong> L<strong>auf</strong>zeitdifferenzen groß genug werden ist <strong>die</strong> Lokalisation über einen größeren<br />

Bereich stabil [5], [1].<br />

Ein Grund weswegen AB-Anordnungen mit einem großen Abstand sehr beliebt sind, ist<br />

<strong>die</strong> geringe <strong>Diffusfeldkorrelation</strong>. In Abbildung 3.4.2 ist <strong>die</strong> theoretische <strong>Diffusfeldkorrelation</strong><br />

von zwei Druckempfängern in verschiedenen Abständen als Kohärenzfunktion<br />

<strong>auf</strong>getragen. Man erkennt, dass sich mit steigendem Abstand <strong>die</strong> erste Nullstelle zu<br />

10 Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer


2.4 Mikrofonanordnungen <strong>auf</strong> Basis des <strong>räumliche</strong>n Hörens<br />

tiefen Frequenzen hin verschiebt. In Kapitel 3.4 wird <strong>die</strong> <strong>räumliche</strong> Kohärenzfunktion<br />

von Mikrofonanordnungen genauer beschrieben. Die Hypothese <strong>die</strong>ser Arbeit ist, dass<br />

vor allem <strong>die</strong> Korrelation im tieffrequenten Bereich von Bedeutung ist [8]. Je geringer<br />

<strong>die</strong> tieffrequente Korrelation, desto breiter wird <strong>die</strong> Abbildung wahrgenommen.<br />

2.4.2 Koinzidente Verfahren<br />

In <strong>die</strong>se Kategorie fallen alle Mikrofonanordnungen, <strong>die</strong> nur an einem Punkt im Raum<br />

<strong>auf</strong>zeichnen. Deshalb ist eine koinzidente Mikrofonanordnung nur mit gerichteten Mikrofonen<br />

zu realisieren. Erst dadurch können <strong>die</strong> notwendigen Pegelunterschiede für <strong>die</strong><br />

Lokalisation erzeugt werden. Typische Anordnungen sind XY, MS o<strong>der</strong> Blumlein. Die<br />

MS-Anordnung wird häufig im Filmton <strong>auf</strong>grund ihrer Flexibilität und Kompaktheit<br />

eingesetzt.<br />

Den koinzidenten Verfahren wird, im Gegensatz zu den L<strong>auf</strong>zeit - o<strong>der</strong> Äquivalenzverfahren,<br />

oft eine schlechtere <strong>räumliche</strong> Abbildung nachgesagt. Nach <strong>der</strong> Hypothese<br />

<strong>die</strong>ser Arbeit ist <strong>die</strong>s mit <strong>der</strong> größeren <strong>Diffusfeldkorrelation</strong> koinzidenter Mikrofonanordnungen<br />

zu erklären. Die Korrelation einer koinzidenten Anordnung hängt stark von<br />

<strong>der</strong> Richtcharakteristik und dem Öffnungswinkel ab. In Abbildung 4.2 ist <strong>die</strong> theoretische<br />

<strong>Diffusfeldkorrelation</strong> einer XY-Anordnung mit Nieren und einem Öffungswinkel<br />

von 45 ◦ zu sehen. Zu beachten ist hierbei, dass <strong>die</strong> <strong>Diffusfeldkorrelation</strong> für alle Frequenzen<br />

gleich ist. Um eine geringere <strong>Diffusfeldkorrelation</strong> bei einer XY-Anordnung zu<br />

erreichen müsste man Supernieren verwenden und den Öffungswinkel vergrößern. Dies<br />

kann man von <strong>der</strong> Kohärenzfunktion von zwei räumlich getrennten Mikrofonen ableiten<br />

(s. Kapitel 3.4).<br />

Eine Beson<strong>der</strong>heit bei den koinzidenten Verfahren ist <strong>die</strong> Blumleinanordnung. Die<br />

Blumleinanordnung besteht aus zwei um 45 ◦ gegeneinan<strong>der</strong> gekreutzte Achten und<br />

hat eine theoretische <strong>Diffusfeldkorrelation</strong> von 0. Die Blumleinanordnung liefert demnach<br />

zwei komplett dekorrelierte Ausgangssignale. Deshalb ist <strong>die</strong> Blumleinanordnung<br />

als Raummikrofon nicht zu unterschätzen und man erkennt, dass auch mit koinzidenten<br />

Mikrofonanordnungen eine geringe <strong>Diffusfeldkorrelation</strong>s zu erzielen ist.<br />

Innerhalb einer Untersuchung zum Doppel-Ms Verfahren wird gezeigt, wie eine optimale<br />

Dekorrelation bei <strong>der</strong> Matrizierung <strong>der</strong> einzelnen Kanäle zu erzielen ist [18].<br />

Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer 11


2 Räumliches Hören<br />

2.4.3 Äquivalente Verfahren<br />

In <strong>die</strong>se Kategorie fallen alle Mikrofonanordnungen, <strong>die</strong> mit Pegel - und L<strong>auf</strong>zeitunterschieden<br />

arbeiten. Dadurch ist jedes Verfahren, das mit räumlich getrennten gerichteten<br />

Mikrofonen arbeitet Äquivalenzstereofonie. Für Stereo<strong>auf</strong>nahmen ist <strong>die</strong>s fast<br />

ausschließlich <strong>die</strong> ORTF-Anordnung.<br />

Die ORTF-Anordnung ist sehr beliebt, weil sie ein guter Kompromiss aus Stabilität <strong>der</strong><br />

Phantomschallquellen und Räumlichkeit ist. Die <strong>räumliche</strong> Trennung <strong>der</strong> Mikrofone<br />

bewirkt eine erhöhte Dekorrelation des diffusen Anteils und <strong>die</strong> zusätzlichen Pegelunterschiede<br />

wirken sich positiv <strong>auf</strong> <strong>die</strong> Lokalisation aus.<br />

12 Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer


3 Elemente <strong>der</strong> Signalverarbeitung<br />

In <strong>der</strong> Audiowelt werden <strong>die</strong> Begriffe Korrelation und Kohärenz in verschiedenen Zusammenhängen<br />

benutzt. Die Korrelation zweier Signale ist mathematisch exakt definiert<br />

und findet in den unterschiedlichsten Wissenschaften Anwendung. Die breite Anwendung<br />

hat zur Folge, dass <strong>die</strong> Begriffe Korrelation und Kohärenz in sehr unterschiedlichen<br />

Zusammenhängen benutzt werden. Deshalb kommt es oft zu Missverständnissen<br />

<strong>der</strong> Begrifflichkeiten. Die Korrelationsfunktionen und <strong>die</strong> Kohärenzfunktionen von Signalen<br />

sind eine wichtige Grundlage <strong>die</strong>ser Arbeit.<br />

Mittels <strong>der</strong> Kohärenzfunktion von zwei räumlich getrennten Mikrofonen werden <strong>die</strong><br />

Stimuli in Matlab erstellt [9], [16]. Genauere Informationen dazu gibt es in Kapitel 4.<br />

Im eigentlichen Sinne ist <strong>die</strong> Korrelation ein Maß <strong>der</strong> Statistik. Sie gibt dabei an,<br />

inwieweit gewisse Datensätze linear abhängig voneinan<strong>der</strong> sind.<br />

3.1 Korrelationsfunktion stochastischer und determinierter<br />

Signale<br />

Dieser Abschnitt wurde zur Übersicht aus [19] und [20] zusammengestellt. Das hochgestellte<br />

E kennzeichnet <strong>die</strong> Korrelationsfunktion für Energiesignale und das hochgestellte<br />

L <strong>die</strong> für Leistungssignale. Die Korrelationsfunktionen für Leistungssignale sind denen<br />

<strong>der</strong> Energiesignale sehr ähnlich. Bei Leistungssignalen wird anstatt von −∞ bis +∞<br />

über eine Periode T integriert. Die Leistung wird dann ebenfalls nur innerhalb <strong>die</strong>ser<br />

Periode T bestimmt. Der Vollständigkeit halber sind noch <strong>die</strong> Gleichungen für <strong>die</strong><br />

zeitdiskrete Korrelationsfunktion mit angegeben. Heutzutage findet eigentlich jede Berechnung<br />

im Computer statt und ist somit diskret. Grundsätzlich muss zwischen <strong>der</strong><br />

Korrelation von determinierten und stochastischen Signalen unterschieden werden.<br />

Determinierte Signale:<br />

Für <strong>die</strong> kontinuierliche Kreuzkorrelation von zwei Signalen s(t) und g(t) gilt:<br />

ϕ E sg(τ) =<br />

∫ ∞<br />

−∞<br />

s ∗ (t) · g(t + τ)dt<br />

Für <strong>die</strong> Energie eines kontinuierlichen Signals s(t) gilt:<br />

Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer 13


3 Elemente <strong>der</strong> Signalverarbeitung<br />

E s (t) =<br />

∫ ∞<br />

−∞<br />

s(t) 2<br />

Wenn man <strong>die</strong> Korrelationsfunktion ϕ E sg <strong>auf</strong> <strong>die</strong> Gesamtenergie <strong>der</strong> beiden Signale s(t)<br />

und g(t) normiert, erhält man <strong>die</strong> normierte Kreuzkorrelationsfunktion. Folglich gilt<br />

für <strong>die</strong> normierte Kreuzkorrelationsfunktion für kontinuierliche Energiesignale:<br />

p E sg(τ) =<br />

∫ ∞<br />

−∞<br />

s ∗ (t) · g(t + τ)dt<br />

√<br />

Es · E g<br />

Die normierte Kreuzkorrelationsfunktion nimmt durch <strong>die</strong> Normierung nur Werte zwischen<br />

-1 und 1 an. Der Kreuzkorrelationskoeffizient, <strong>der</strong> oft als Ähnlichkeitsmaß von<br />

Signalen angegeben wird, ist <strong>der</strong> Wert <strong>der</strong> normierten Kreuzkorrelationsfunktion an<br />

<strong>der</strong> Stelle τ = 0. Der Kreuzkorrelationskoeffizient ist <strong>der</strong> Wert, <strong>der</strong> von einem typischen<br />

Korrelationsgradmesser angezeigt wird. Deshalb wird <strong>der</strong> Kreuzkorrelationskoeffizient<br />

oft als Korrelationsgrad bezeichnet. Für <strong>die</strong> zeitdiskrete Kreuzkorrelationsfunktion<br />

gilt:<br />

ϕ E sg(m) =<br />

n=∞<br />

∑<br />

n=−∞<br />

Für <strong>die</strong> Engergie eines zeitdiskreten Signals gilt:<br />

s ∗ (n) · g(n + m)<br />

E s (n) =<br />

∞∑<br />

∣ ∣ s(n)<br />

2 −∞<br />

Folglich gilt für <strong>die</strong> normierte Kreuzkorrelationsfunktion für zeitdiskrete Signale:<br />

p E sg(m) =<br />

∑<br />

n=+∞<br />

n=−∞<br />

s ∗ (n) · g(n + m)<br />

√<br />

Es · E g<br />

Die normierte Kreuzkorrelationsfunktion für zeitdiskrete und kontinuierliche Energiesignale<br />

wird an <strong>der</strong> Stelle τ = 0 zu 0, wenn <strong>die</strong> beiden Signale s(t) und g(t) orthogonal zueinan<strong>der</strong><br />

sind. Orthogonale Signale (z.B s(t) = sin(x) und g(t) = cos(x)) sind demnach<br />

14 Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer


3.1 Korrelationsfunktion stochastischer und determinierter Signale<br />

auch vollkommen linear unabhängig. Eine sehr anschauliche Erklärung kann anhand<br />

<strong>der</strong> Kreuzkorrleationsfunktion von zwei periodischen Signalen gegeben werden. Wenn<br />

zwei sinusförmige Wechselspannungen V 1 (t) und V 2 (t) mit gleicher Amplitude vorliegen<br />

und V 2 (t) gegenüber V 1 (t) um 90 ◦ phasenverschoben ist, wird <strong>die</strong> Potentialdifferenz bei<br />

τ = 0 zu 0V. In Abbildung 3.1.1 ist <strong>die</strong>ser Fall dargestellt.<br />

1<br />

Sinus - und Kosinusfunktion von 400Hz<br />

Amplitude<br />

0.5<br />

0<br />

-0.5<br />

-1<br />

0 0.001 0.002 0.003 0.004 0.005 0.006 0.007 0.008 0.009 0.01<br />

Zein in [s]<br />

1<br />

Normierte Kreuzkorrelationsfunktion des Sinus - und Kosinussignals<br />

Korrelation<br />

0.5<br />

0<br />

-0.5<br />

-1<br />

0 0.002 0.004 0.006 0.008 0.01 0.012 0.014 0.016 0.018 0.02<br />

Zeit in [s]<br />

Abbildung 3.1.1: Die Kreuzkorrelationsfunktion ist doppelt so lang wie <strong>die</strong> Inputsignale.<br />

Zum Zeitpunkt τ = 0 hat <strong>die</strong> Kreuzkorrelationsfunktion den Wert<br />

0.001, da Sinus und Kosinus orthogonale Signale sind.<br />

Man beachte, dass <strong>die</strong> Kreuzkorrelationsfunktion von zwei orthogonalen Signalen nicht<br />

für jedes τ gleich 0 ist. In Abbildung 3.1.1 ist <strong>die</strong>s gut erkennbar.<br />

Stochastische Signale:<br />

Für <strong>die</strong> kontinuierliche Autokorrelationsfunktion eines stationären Prozesses s(t) gilt:<br />

ϕ ss (τ) = ε {s(t) · s(t + τ)} (1)<br />

Die zeitdiskrete Autokorrelationsfunktion eines stationären Prozesses ist definiert als:<br />

ϕ ss (n) = ε {s(k) · s(k + n)} (2)<br />

Wobei ε den Erwartungswert eines Zufallsprozesses darstellt. Für <strong>die</strong> kontinuierliche<br />

Kreuzkorrelationsfunktion zweier verbundstationärer stochastischer Prozesse gilt:<br />

Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer 15


3 Elemente <strong>der</strong> Signalverarbeitung<br />

ϕ sg (τ) = ε {s(t) · g(t + τ)} (3)<br />

Für <strong>die</strong> zeitdiskrete Variante gilt entsprechend:<br />

ϕ sg (n) = ε {s(k) · g(k + n)} (4)<br />

Die stochastischen Prozesse und ihre Korrelations - und Kohärenzfunktionen spielen in<br />

<strong>die</strong>ser Arbeit eine wichtige Rolle. In Kapitel 4 wird gezeigt, wie mit Hilfe von Rauschsignalen<br />

<strong>die</strong> Dekorrelation eines Stimulus vollzogen wird. Um <strong>die</strong>s optimal durchführen<br />

zu können, wären komplett inkohärente Rauschsignale am besten geeignet. Es wurde<br />

versucht zwei Rauschsignale zu erzeugen, <strong>die</strong> vollständig inkohärent zueinan<strong>der</strong> sind,<br />

indem <strong>die</strong>se orthogonalisiert wurden. Dies ist z.B mit <strong>der</strong> Gram-Schmidt-Methode möglich.<br />

Das Matlabskript, das dazu benutzt wurde, befindet sich im Anhang. Die Orthogonalisierung<br />

von zwei verbundstationären stochastischen Prozessen bewirkt, dass zu<br />

dem Zeitpunkt τ = 0 <strong>die</strong> Kreuzkorrelationsfunktion von <strong>die</strong>sen beiden Prozessen annährend<br />

0 wird. Innerhalb <strong>der</strong> Kohärenzfunktion, <strong>die</strong> eine lineare Abhängigkeit für jede<br />

Frequenz angibt, wird <strong>die</strong> Kohärenzfunktion nicht für alle Frequenzen null, obwohl ein<br />

orthogonales Rauschpaar vorliegt. Für <strong>die</strong>sen Sachverhalt gibt es in Kapitel 3.4 ein<br />

Beispiel.<br />

3.2 Kreuz - und Autoleistungsspektren<br />

Die quadrierte Kohärenfunkzion C xy (f) und <strong>die</strong> nicht quadrierte Kohärenzfunktion<br />

γ xy (f) werden anhand ihrer Leistungsdichtespektren berechnet [21] (s. Kapitel 3.4).<br />

Das Autoleistungsdichtespektrum ist definiert als <strong>die</strong> Fourier-Transformation <strong>der</strong> Autokorrelationsfunktion.<br />

Das Kreuzleistungsdichtespektrum ist definiert als <strong>die</strong> Fourier-<br />

Transformation <strong>der</strong> Kreuzkorrelationsfunktion [20]. Damit folgt aus Gleichung (2) für<br />

das Autoleistungsdichtespektrum eines stationären Prozesses:<br />

Φ ss (e jΩ ) =<br />

n=+∞<br />

∑<br />

n=−∞<br />

ϕ ss (n) · e −jnΩ (5)<br />

Aus Gleichung (4) folgt demnach für das Kreuzleistungsdichtespektrum von zwei verbundstationären<br />

stochastischen Prozessen:<br />

16 Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer


3.3 Der Kohärenzgrad<br />

Φ sg (e jΩ ) =<br />

n=+∞<br />

∑<br />

n=−∞<br />

ϕ sg (n) · e −jnΩ (6)<br />

In <strong>der</strong> digitalen Signalverarbeitung kann ein Leistungsdichtespektrum <strong>auf</strong> viele unterschiedliche<br />

Arten berechnet werden. Eine häufig verwendete Methode ist <strong>die</strong> Welch-<br />

Methode [22]. Mit <strong>der</strong> Methode nach Welch wurden in <strong>die</strong>ser Arbeit <strong>die</strong> Leistungsdichtespektren<br />

berechnet. Aus den Leistungsdichtespektren lässt sich <strong>die</strong> Kohärenzfunktion<br />

für <strong>die</strong> Rauschsignale bestimmen. Eine detaillierte Darstellung <strong>der</strong> gängigen Verfahren<br />

zur Bestimmung von Leistungsdichtespektren findet man z.B in [23].<br />

3.3 Der Kohärenzgrad<br />

Der Kohärenzgrad ist eine Messung <strong>die</strong> z.B in [10], [11] und [24] benutzt wird, um <strong>die</strong><br />

Ähnlichkeit von zwei Signalen zu bestimmen. Der Kohärenzgrad k ist definiert als das<br />

Maximum des Betrages <strong>der</strong> normierten Kreuzkorrelationsfunktion. Der Kohärenzgrad<br />

wird über <strong>die</strong> normierte Kreuzkorrelationsfunktion für Leistungssignale berechnet.<br />

k = max ∣ ∣ ϕ<br />

L<br />

sg (τ) ∣ ∣ =<br />

lim<br />

T →∞<br />

∫ +T<br />

1<br />

lim g(t) · s(t + τ)dt<br />

T →∞ 2T −T<br />

√ ∫<br />

1 +T ∫ + T<br />

s<br />

2T<br />

2 (t)dt · g 2 (t)dt<br />

−T<br />

−T<br />

(7)<br />

Der Kohärenzgrad ist für eine genaue Beschreibung <strong>der</strong> Korrelation von zwei räumlich<br />

getrennten Mikrofonen im diffusen Schallfeld nicht aussagekräftig. Dasselbe gilt für den<br />

Korrelationskoeffizienten.<br />

Die Korrelation von zwei räumlich getrennten Mikrofonen ist frequenzabhängig und<br />

lässt sich z.B mit <strong>der</strong> Kohärenzfunktion beschreiben (s. Kapitel 3.4). Der Kohärenzgrad<br />

liefert keine Aussage über <strong>die</strong> lineare Abhängigkeit von zwei Signalen bei einer<br />

bestimmten Frequenz, da er genau wie <strong>der</strong> Korrelationskoeffizient im Zeitbereich bestimmt<br />

wird. Der Kohärenzgrad und <strong>der</strong> Korrelationskoeffizient können allerdings bei<br />

koinzidenten Mikrofonanordnungen verwendet werden. Eine koinzidente Mikrofonanordnung<br />

zeichnet das Schallfeld an einem Punkt <strong>auf</strong> und hat somit eine frequenzunabhängige<br />

Kohärenzfunktion. Die Kohärenzfunktion einer koinzidenten Mikrofonanordnung<br />

ist für alle Frequenzen gleich (s. Abbildung 4.2). Aus <strong>die</strong>sem Grund kann<br />

Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer 17


3 Elemente <strong>der</strong> Signalverarbeitung<br />

<strong>der</strong> Korrelationskoeffizient o<strong>der</strong> Kohärenzgrad eine Abschätzung <strong>der</strong> Ähnlichkeit koinzidenter<br />

Mikrofonsignale geben. Für räumlich getrennte Mikrofonanordnungen liefert<br />

<strong>die</strong> Kohärenzfunktion eine präzisere Aussage.<br />

Die normierte Kreuzkorrelationsfunktion an <strong>der</strong> Stelle τ = 0 wird zu 0, wenn zwei<br />

Signale x(t) und y(t) orthogonal zueinan<strong>der</strong> sind. Dies ist <strong>der</strong> bereits erwähnte Kreuzkorrelationskoeffizient.<br />

Der Kohärenzgrad könnte unter an<strong>der</strong>em einen wesentlich größeren<br />

Wert annehmen, da <strong>die</strong> normierte Kreuzkorrelationsfunktion für alle τ’s einen<br />

Wert angibt und <strong>der</strong> Kohärenzgrad das Maximum des Betrages <strong>der</strong> normierten Kreuzkorrelationsfunktion<br />

ist. In Abbildung 3.1.1 sind <strong>die</strong> Signale x(t) und y(t) nur zu dem<br />

Zeitpunkt τ = 0 orthogonal zueinan<strong>der</strong>. Der Kohärenzgrad für <strong>die</strong> beiden Signale x(t)<br />

und y(t) ist 1, wie aus <strong>der</strong> Grafik leicht zu erkennen ist. Der Kohärenzgrad vernachlässigt<br />

somit Informationen über <strong>die</strong> Phasenlage zweier Signale.<br />

Bei einer idealen koinzidenten Mikrofonanordnung ist <strong>die</strong> Phasenlage aller Frequenzen<br />

konstant zueinan<strong>der</strong>. In <strong>die</strong>sem Fall bildet sich das Maximum <strong>der</strong> Kreuzkorrelationsfunktion<br />

bei τ = 0. Deshalb ist bei einer idealen koinzidenten Mikrofonanordnung <strong>der</strong><br />

Kohärenzgrad gleich dem Korrelationskoeffizienten. Die feste Phasenlage aller Frequenzen<br />

zueinan<strong>der</strong> ist auch <strong>der</strong> Grund, weshalb <strong>die</strong> Kohärenzfunktion einer koinzidenten<br />

Mikrofonanordnung für alle Frequenzen gleich ist (s. Abbildung 4.2).<br />

Der Kohärenzgrad hat wegen seines Betrages eine Ähnlichkeit zu <strong>der</strong> quadrierten Kohärenzfunktion<br />

(s. Kapitel 3.4). In Abbildung 3.1.1 ist zu sehen ist, dass <strong>der</strong> Kohärenzgrad<br />

einer Sinus - und Kosinusschwingung 1 ist. Vereinfacht kann man sagen: Wenn in zwei<br />

Signalen <strong>die</strong>selbe Frequenz gleicher o<strong>der</strong> unterschiedlicher Phasenlage <strong>auf</strong>tritt, nimmt<br />

<strong>der</strong> Kohärenzgrad einen größeren Wert an.<br />

3.4 Die <strong>räumliche</strong> Kohärenzfunktion<br />

Wie bereits erwähnt ist <strong>die</strong> Korrelation von zwei Mikrofonen in einem diffusen Schallfeld<br />

von entscheiden<strong>der</strong> Bedeutung. Die Korrelation von zwei Mikrofonen in einem<br />

diffusen Schallfeld wird als <strong>Diffusfeldkorrelation</strong> bezeichnet und ist über <strong>die</strong> <strong>räumliche</strong><br />

Kohärenzfunktion definiert.<br />

Es existieren verschiedene mathematische Modelle, mit denen ein optimales diffuses<br />

Schallfeld beschrieben werden kann. Die Gleichungen (9) und (11) stimmen nur für<br />

den Fall, dass das Diffusfeld von unendlich vielen unkorrelierten Schallquellen in einem<br />

18 Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer


3.4 Die <strong>räumliche</strong> Kohärenzfunktion<br />

Raum beliebiger Nachhallzeit generiert wird. Ein an<strong>der</strong>es mathematisches Modell ist<br />

eine Punktschallquelle in einem Raum mit unendlich langer Nachhallzeit [16].<br />

Die <strong>räumliche</strong> Kohärenz von Mikrofonarrays wurde bereits in zahlreichen Arbeiten untersucht<br />

und spielt vor allem in <strong>der</strong> Störsignalunterdrückung eine Rolle. Echokompensation<br />

und <strong>die</strong> Steigerung <strong>der</strong> Sprachverständlichkeit durch Diffusschallunterdrückung<br />

sind weitere Anwendungen, in denen <strong>die</strong> Kohärenz von mehreren Mikrofonen eine Rolle<br />

spielt. Das neue I-Phone4 besitzt z.B zwei integrierte Mikrofone, um Störsignale und<br />

diffuse Anteile in dem Nutzsignal zu unterdrücken. Ähnliche Verfahren werden auch in<br />

Freisprechanlagen für Autos eingesetzt.<br />

In vielen Arbeiten zu <strong>die</strong>sem Thema wird <strong>die</strong> Kohärenz zwischen mehreren Mikrofonen<br />

mit <strong>der</strong> <strong>räumliche</strong>n Kohärenzfunktion beschrieben. Der grundlegende mathematische<br />

Mechanismus zur Bestimmung <strong>der</strong> Kohärenzfunktion ist <strong>die</strong> Korrelationsfunktion. Die<br />

komplexe Kohärenzfunktion ist für zwei stationäre stochastische Prozesse definiert als<br />

das Kreuzleistungsdichtespektrum, das <strong>auf</strong> <strong>die</strong> Wurzel aus dem Produkt <strong>der</strong> Autoleistungsdichtespektren<br />

normiert ist [21], [16], [9].<br />

C xy (f) =<br />

|P xy (f)| 2<br />

P xx (f) · P yy (f) =<br />

|P xy (f)|<br />

√<br />

Pxx (f) · P yy (f)<br />

(8)<br />

Gleichung (8) wird als MSC“ (Magnitude-squared-Coherence) bezeichnet und kann<br />

”<br />

nur Werte zwischen 0 und 1 annehmen. Die MSC ist reell, da das Betragsquadrat des<br />

Kreuzleistungsdichtespektrums gebildet wird. Die MSC von zwei Kugelmikrofonen in<br />

einem diffusen Schallfeld ergibt sich nach [16] zu:<br />

C xy (f) =<br />

sin(2 π f<br />

dxy<br />

c )<br />

2 π f dxy<br />

c<br />

Mit c = 343m/s als Schallgeschwindigkeit.<br />

= si 2 (2 π f d xy<br />

c ) (9)<br />

In Abbildung 3.4.1 ist <strong>die</strong> MSC für zwei Kugelmikrofone in einem diffusen Schallfeld<br />

angegeben.<br />

In [9] wird zusätzlich zu <strong>der</strong> MSC <strong>die</strong> nicht quadrierte Kohärenzfunktion eingeführt.<br />

γ xy (f) =<br />

P xy (f)<br />

P xx (f) 1/2 · P yy (f) 1/2 =<br />

P xy (f)<br />

√<br />

Pxx (f) · P yy (f)<br />

(10)<br />

Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer 19


3 Elemente <strong>der</strong> Signalverarbeitung<br />

1<br />

0.8<br />

Kohärenz zweier Kugelmikrofone im Diffusfeld bei verschiedenen Abständen<br />

d=0.1m<br />

d=0.2m<br />

d=0.4m<br />

MSC = C xy<br />

(f)<br />

0.6<br />

0.4<br />

0.2<br />

0<br />

0 500 1000 1500 2000 2500 3000 3500 4000<br />

Frequenz in [Hz]<br />

Abbildung 3.4.1: Quadrierte Kohärenzfunktion (MSC) von zwei Kugelmikrofonen im<br />

diffusen Schallfeld<br />

Die nicht quadrierte Kohärenzfunktion ist komplex und ihr Realanteil kann Werte<br />

zwischen -1 und 1 annehmen. Der Grund dafür ist, dass in Gleichung (10) nicht das<br />

Betragsquadrat des Kreuzleistungsdichtespektrums gebildet wird wie in Gleichung (8).<br />

In Abbildung 3.4.2 wird für <strong>die</strong>selben Abstände von zwei Kugelmikrofonen im diffusen<br />

Schallfeld <strong>die</strong> nicht quadrierte Kohärenzfunktion angegeben.<br />

γ xy (f) =<br />

sin(2 π f d xy<br />

c )<br />

2 π f d xy<br />

c<br />

(11)<br />

Vereinfacht kann man sagen, dass <strong>der</strong> Realanteil <strong>der</strong> nicht quadrierten Kohärenzfunktion<br />

γ xy (f) einen normierten Kreuzkorrelationskoeffizienten für jede Frequenz angibt<br />

und zwischen -1 und 1 schwankt. Die Vorteile <strong>der</strong> nicht quadrierten Kohärenzfunktion<br />

gegenüber dem Kohärenzgrad sind:<br />

1. Der Kohärenzgrad gibt nur einen Wert für <strong>die</strong> Ähnlichkeit von zwei Signalen<br />

an. Dieser Wert beinhaltet keine Information über <strong>die</strong> Frequenzabhängigkeit <strong>der</strong><br />

Kreuzkorrelationsfunktion. Aus <strong>der</strong> nicht quadrierten Kohärenzfunktion lässt sich<br />

<strong>die</strong> Ähnlichkeit von zwei Signalen bei je<strong>der</strong> Frequenz bestimmen.<br />

2. Der Kohärenzgrad berücksichtigt nicht <strong>die</strong> Phasenlage. In <strong>der</strong> nicht quadrierten<br />

Kohärenzfunktion ist <strong>die</strong> Phasenlage je<strong>der</strong> Frequenz zu erkennen.<br />

20 Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer


3.4 Die <strong>räumliche</strong> Kohärenzfunktion<br />

Die Kohärenzfunktion ist daher besser geeignet, um <strong>die</strong> <strong>Diffusfeldkorrelation</strong> von zwei<br />

räumlich getrennten Mikrofonen zu beschreiben. Das Rauschen das zur Dekorrelation<br />

verwendet wird, wird anhand <strong>der</strong> nicht quadrierten Kohärenzfunktion γ xy (f) erstellt.<br />

Weitere Informationen zum Matlabprogramm gibt es in Kapitel 4.<br />

1<br />

0.8<br />

0.6<br />

Kohärenzfunktion zweier Kugelmikrofone im diffusen Schallfeld<br />

(nicht quadrierte Kohärenzfunktion)<br />

d = 0.1m<br />

d = 0.2m<br />

d = 0.4m<br />

γ xy<br />

(f)<br />

0.4<br />

0.2<br />

0<br />

-0.2<br />

-0.4<br />

0 500 1000 1500 2000 2500 3000 3500 4000<br />

Frequenz in [Hz]<br />

Abbildung 3.4.2: Die nicht quadrierte Kohärenzfunktion ist komplex und ihr Realteil<br />

kann Werte zwischen -1 und 1 annehmen und damit eine Aussage<br />

über <strong>die</strong> Phasenlage zweier Signale treffen<br />

Wie in Kapitel 3.1 bereits erwähnt wurde, ist in <strong>die</strong>ser Arbeit versucht worden ein<br />

Rauschpaar zu erzeugen, das eine definierte Kohärenzfunktion <strong>auf</strong>weist. Es wurde zunächst<br />

versucht zwei komplett inkohärente Rauschsignale durch Orthogonalisierung zu<br />

erstellen. Dies funktioniert allerdings nicht ohne weiteres. In [16] wird ein anschauliches<br />

Beispiel angegeben, wann <strong>die</strong> Kohärenzfunktion von zwei verbundstationären stochastischen<br />

Prozessen 0 o<strong>der</strong> 1 wird.<br />

In Abbildung 3.4.3 erkennt man, dass <strong>der</strong> Prozess y(k) mit dem zu x(k) unkorrelierten<br />

Prozess n(k) aus x(k) hervorgeht. Die Beziehung lässt sich über das Faltungsprodukt<br />

ausdrücken:<br />

y(k) = h(k) ∗ x(k) + n(k) (12)<br />

Der stochastische Prozess y(k) ist über Gleichung (12) über zwei additive Anteile modelliert.<br />

Jeweils durch einen korrelierten Anteil h(k)∗x(k) und den unkorrelierten Anteil<br />

n(k). Die MSC <strong>der</strong> beiden Rauschprozesse x(k) und y(k) ergibt sich nach [16] zu:<br />

Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer 21


3 Elemente <strong>der</strong> Signalverarbeitung<br />

x(k)<br />

x(k)<br />

h(k)<br />

y(k)<br />

n(k)<br />

Abbildung 3.4.3: Der zweite Prozess y(t) wird über ein System h(t) abgeleitet<br />

C xy (f) =<br />

1<br />

1 + 1<br />

H 2 (f) · Pnn(f)<br />

P xx (f)<br />

(13)<br />

Die Kohärenzfunktion kann nur für <strong>die</strong> Frequenzen 1 werden, für <strong>die</strong> das Autoleistungsdichtespektrum<br />

P nn (f) 0 ist und <strong>die</strong> Übertragungsfunktion H 2 (f) Werte ungleich<br />

0 annimmt. Die lineare Abhängigkeit <strong>der</strong> beiden stochastischen Prozesse wird vollständig<br />

durch das lineare System h(k) definiert. Die Kohärenz wird deshalb für <strong>die</strong><br />

Frequenzen zu 0, für <strong>die</strong> <strong>die</strong> Übertragunsfunktion H(f) zu 0 wird. In <strong>die</strong>sem Sinne beschreibt<br />

<strong>die</strong> Kohärenzfunktion <strong>die</strong> lineare Abhängigkeit zweier stochastischer Prozesse<br />

für jede Frequenz.<br />

Wie <strong>der</strong> völlig inkohärente Prozess n(k) erstellt werden könnte, konnte innerhalb <strong>die</strong>ser<br />

Arbeit nicht geklärt werden. Die Orthogonalisierung von zwei Rauschsignalen im<br />

Zeitbereich reicht nicht aus, um zwei inkohärente stochastischen Prozesse zu erzeugen.<br />

In [9] wird ein ähnliches Beispiel zur linearen Abhängigkeit <strong>der</strong> Kohärenzfunktion<br />

zwischen stochastischen Prozessen angegeben.<br />

In Abbildung 3.4.4 ist beispielhaft <strong>die</strong> quadrierte und <strong>die</strong> nicht quadrierte Kohärenzfunktion<br />

von zwei stochastischen Prozessen zu sehen. Beiden Prozessen ist jeweils orthogonal<br />

zueinan<strong>der</strong> eine Frequenz von 1kHz überlagert.<br />

Man erkennt, dass <strong>der</strong> Realanteil <strong>der</strong> komplexen Kohärenzfunktion bei 1kHz zu 0<br />

wird, da beide Prozesse bei <strong>der</strong> Frequenz 1kHz orthogonal zueinan<strong>der</strong> sind. Die Phasenverschiebung<br />

zwischen Real - und Imaginäranteil muss demnach 90 ◦ betragen. In<br />

<strong>der</strong> quadrierten Kohärenzfunktion sind dagegen <strong>die</strong> beiden Prozesse bei <strong>der</strong> Frequenz<br />

1kHz vollkommen linear abhängig. Der Kohärenzgrad hat in <strong>die</strong>sem Beispiel den Wert<br />

22 Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer


3.4 Die <strong>räumliche</strong> Kohärenzfunktion<br />

Kohärenz<br />

Kohärenz<br />

Kohärenz<br />

1<br />

0.5<br />

Betrag <strong>der</strong> quadrierten Kohärenzfunktion<br />

X: 1002<br />

Y: 0.9977<br />

0<br />

10 0 10 1 10 2 10 3 10 4 10 5<br />

Realteil <strong>der</strong> nicht quadrierten Kohärenzfunktion<br />

1<br />

0<br />

X: 1002<br />

Y: -0.02602<br />

-1<br />

10 0 10 1 10 2 10 3 10 4 10 5<br />

Imaginärteil <strong>der</strong> nicht quadrierten Kohärenzfunktion<br />

1<br />

0<br />

X: 1002<br />

Y: -0.9985<br />

-1<br />

10 0 10 1 10 2 10 3 10 4 10 5<br />

Phasenlage <strong>der</strong> komplexen Kreuzleistung<br />

200<br />

Winkel in [°]<br />

0<br />

X: 1002<br />

Y: -91.49<br />

-200<br />

10 0 10 1 10 2 10 3 10 4 10 5<br />

Abbildung 3.4.4: Die normierte Kohärenzfunktion in ihren Einzelteilen. Die x-Achse<br />

ist immer <strong>die</strong> Frequenz in Hz. Der Kohärenzgrad für <strong>die</strong>ses Beispiel<br />

beträgt: k = 0, 49<br />

k = 0, 49. Daraus lässt sich ableiten, dass ein korrelierter Anteil in den beiden Signalen<br />

vorhanden sein muss. Eine viel präzisere Aussage liefert allerdings <strong>die</strong> nicht quadrierte<br />

Kohärenzfunktion.<br />

Ein weiterer Vorteil <strong>der</strong> Kohärenzfunktion ist, dass je<strong>der</strong> spektrale Anteil <strong>auf</strong> seine<br />

eigene Leistung aus beiden Signalen normiert wird. Man erkennt <strong>die</strong>s ebenfalls in Abbildung<br />

3.4.4. Obwohl zwei Rauschsignalen ein starker kohärenter Anteil überlagert<br />

ist, ist <strong>die</strong>s nicht eindeutig im Kohärenzgrad zu erkennen. Dies hat den Grund, dass<br />

<strong>der</strong> Kohärenzgrad im Zeitbereich aus <strong>der</strong> normierten Kreuzkorrelationsfunktion bestimmt<br />

wird. Der kohärente Anteil <strong>der</strong> 1kHz Schwingung hat eine geringe Leistung im<br />

Vergleich zu dem inkohärenten Rest des Signals. Wenn jetzt im Zeitbereich <strong>auf</strong> <strong>die</strong><br />

Gesamtleistung <strong>der</strong> beiden Signale normiert wird, resultiert ein kleinerer Wert als 1 für<br />

den Kohärenzgrad, da <strong>der</strong> inkohärente Rest wesentlich mehr Leistung hat.<br />

Die Kohärenzfunktion wird im Spektrum normiert. Dadurch wird <strong>die</strong> 1kHz Schwingung<br />

nur <strong>auf</strong> <strong>die</strong> Leistung bei<strong>der</strong> Signale bei 1kHz normiert. Weil <strong>die</strong> Leistung bei 1kHz in<br />

beiden Signalen gleich ist, wird <strong>die</strong> Kohärenzfunktion bei 1kHz zu 1.<br />

Aus <strong>die</strong>sem Grund ist <strong>der</strong> Kohärenzgrad o<strong>der</strong> <strong>der</strong> Korrelationskoeffizient nicht geeignet,<br />

um <strong>die</strong> tatsächliche Korrelation von räumlich getrennten Mikrofonen zu beurteilen.<br />

Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer 23


4 Erstellung <strong>der</strong> Stimuli in Matlab<br />

4 Erstellung <strong>der</strong> Stimuli in Matlab<br />

Das Matlabprogramm erstellt aus trockenen Aufnahmen aus einem schalltoten Raum<br />

<strong>die</strong> entsprechend dekorrelierten Stimuli für den Hörversuch. Dabei wird <strong>die</strong> Korrelation<br />

des Diffusfeldes mit weißen Rauschsignalen simuliert. Das Matlabprogramm wurde von<br />

Wittek entwickelt und innerhalb <strong>die</strong>ser Arbeit nur leicht modifiziert [8]. Abbildung 4.1<br />

zeigt den schematischen Abl<strong>auf</strong> <strong>der</strong> Erstellung eines Stimulus.<br />

Als erstes wird ein Rauschpaar anhand <strong>der</strong> theoretischen Kohärenzfunktion einer Mikrofonanordnung<br />

im Diffusfeld erstellt. Die eigentliche Rauminformation wird über eine<br />

Mono-Impulsantwort aus <strong>der</strong> Laeiszhalle in Hamburg bereitgestellt. Da in <strong>die</strong>ser Arbeit<br />

<strong>die</strong> Korrelation des diffusen Anteils untersucht werden soll, werden <strong>der</strong> Direktanteil<br />

und <strong>die</strong> ersten Reflexionen <strong>der</strong> Impulsantwort abgeschnitten. Dazu werden lediglich <strong>die</strong><br />

ersten 100ms <strong>der</strong> Impulsantwort entfernt. Die Mono-Impulsantwort wird anschließend<br />

mit den beiden Rauschsignalen gefaltet (dekorreliert). In einem letzten Schritt wird<br />

<strong>die</strong> nun erzeugte dekorrelierte Stereo-Impulsantwort mit einem trockenen Mono-Signal<br />

gefaltet. Als Ergebnis erhält man ein verhalltes Stereosignal ohne Direktanteil, das<br />

anhand <strong>der</strong> theoretischen Kohärenzfunktion einer Mikrofonanordnung im Diffusfeld<br />

dekorreliert ist.<br />

trockene Aufnahme<br />

Kohärenzfunktion einer<br />

Mikrofonanordnung<br />

(Elkoformel)<br />

Erstellung eines Rauschpaares<br />

anhand <strong>der</strong> theoretischen<br />

Kohärenzfunktion<br />

Dekorrelation <strong>der</strong><br />

Raumimpulsantwort h(k)<br />

mit dem Rauschpaar<br />

Raumimpulsantwort h(k)<br />

Mono<br />

(nur diffuser Anteil)<br />

Faltung <strong>der</strong> trockenen Aufnahme<br />

mit <strong>der</strong> entsprechend<br />

dekorrelierten Impulsantwort h(k)<br />

Stimulus<br />

Abbildung 4.1: Erstellung eines Stimulus in Matlab<br />

24 Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer


0.8<br />

Kohärenzfunktion einer XY-Nieren Anordnung<br />

a=0.5, r=0, φ=45°<br />

0.7<br />

Kohärenz<br />

0.6<br />

0.5<br />

0.4<br />

in [Hz]<br />

10 0 10 1 10 2<br />

Frequenz<br />

10 3 10 4<br />

C xy<br />

(f)<br />

γ xy<br />

(f)<br />

1<br />

Wichtungen <strong>der</strong> kumulierten Rauschen<br />

0.8<br />

Kohärenz<br />

0.6<br />

0.4<br />

0.2<br />

positive Anteile<br />

negative Anteile<br />

Summe positiv+negativ<br />

unkorrelierter Anteil<br />

0<br />

in [Hz]<br />

10 0 10 1 10 2<br />

Frequenz<br />

10 3 10 4<br />

Abbildung 4.2: Der obere Plot zeigt <strong>die</strong> theoretische <strong>Diffusfeldkorrelation</strong> einer XY-<br />

Mikrofonanordnung mit Nieren und einem Öffnungswinkel von 90 ◦ . Der<br />

untere Plot zeigt <strong>die</strong> Wichtungsfunktionen für <strong>die</strong> Rauschsignale.<br />

Zur Dekorrelation wird wie bereits erwähnt ein Rauschpaar benutzt, das unter Vorlage<br />

<strong>der</strong> theoretischen <strong>Diffusfeldkorrelation</strong> erstellt wird. Dazu werden aus <strong>der</strong> nicht quadrierten<br />

Kohärenzfunktion γ xy (f) verschiedene Wichtungsfunktionen abgeleitet. Die<br />

Wichtungsfunktionen bestimmen zu welchen Anteilen drei möglichst inkohärente Rauschsignale<br />

zusammengemischt werden. Diese drei inkohärenten Rauschsignale sind.<br />

• Noise1: Dieses Rauschen stellt den korrelierten Anteil dar und ist in beiden Kanälen<br />

vorhanden.<br />

• Noise2: Dieses Rauschen ist dekorreliert zu Noise1 und Noise3 und wird zur Erstellung<br />

des linken Kanals benutzt.<br />

• Noise3: Dieses Rauschen ist dekorreliert zu Noise1 und Noise2 und wird zur Erstellung<br />

des rechten Kanals benutzt.<br />

Für <strong>die</strong>se drei Rauschsignale werden aus <strong>der</strong> nicht quadrierten Kohärenzfunktion eine<br />

Wichtungsfunktion für <strong>die</strong> positiv korrelierten Anteile und eine für <strong>die</strong> negativ korrelierten<br />

Anteile abgeleitet. Mit <strong>die</strong>sen Wichtungsfunktionen werden dann <strong>die</strong> Rauschsig-<br />

Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer 25


4 Erstellung <strong>der</strong> Stimuli in Matlab<br />

1<br />

Kohärenz zwischen Noise1,Noise2 und Noise1,Noise3<br />

0.5<br />

Kohärenz<br />

0<br />

-0.5 γ noise1,noise2<br />

(f)<br />

γ (f)<br />

noise1,noise3<br />

-1<br />

in [Hz]<br />

10 0 10 1 10 2<br />

Frequenz<br />

10 3 10 4<br />

1<br />

Kohärenzfunktion <strong>der</strong> beiden erstellten Rauschen noise-left, noise-right und <strong>die</strong><br />

theoretische Korrelation bei tiefen Frequenzen<br />

0.5<br />

Kohärenz<br />

0<br />

-0.5<br />

γ noiseL,noiseR<br />

(f)<br />

γ (f) xy<br />

-1<br />

in [Hz]<br />

10 0 10 1 10 2<br />

Frequenz<br />

10 3 10 4<br />

Abbildung 4.3: Der obere Plot zeigt <strong>die</strong> Kohärenzfunktion <strong>der</strong> drei Rauschsignale, aus<br />

denen das Rauschpaar für <strong>die</strong> Dekorrelation berechnet wird. Der untere<br />

Plot zeigt <strong>die</strong> Kohärenzfunktion <strong>der</strong> beiden erstellten Rauschsignale für<br />

den linken und rechten Kanal. Die grüne Kurve zeigt <strong>die</strong> Kohärenzfunktion<br />

für eine XY-Mikrofonanordnung bis 1,5kHz. DF I P redictor = 0, 5625<br />

nale gewichtet und zusammengemischt. Da es nicht möglich ist zwei völlig inkohärente<br />

Rauschsignale durch eine Orthogonalisierung zu erhalten, wurden <strong>die</strong> drei Rauschsignale<br />

”<br />

Noise1“, ”<br />

Noise2“ und ”<br />

Noise3“ iterativ bestimmt.<br />

Kurz gesagt: Es wurde so lange in verschiedenen Frequenzbän<strong>der</strong>n weißes Rauschen<br />

generiert, bis eine ausreichende Inkohärenz erreicht wurde. Beson<strong>der</strong>s wichtig ist <strong>die</strong><br />

Inkohärenz bei den tiefen Frequenzen unterhalb 1,5kHz. Die Inkohärenz bei Frequenzen<br />

oberhalb von 1,5kHz ist nicht allzu entscheidend, da hier bereits eine natürliche<br />

Dekorrelation durch <strong>die</strong> Abschattung des Kopfes stattfindet.<br />

Dennoch wären komplett inkohärente Rauschsignale wünschenswert, weil dadurch Effekte<br />

ausgeschlossen werden könnten, <strong>die</strong> eventuell <strong>auf</strong>grund <strong>der</strong> Teilkohärenz entstehen.<br />

Die Berechnung des Rauschpaares zur Dekorrelation wird im Spektrum durchgeführt.<br />

Noise1“ wird jeweils mit <strong>der</strong> positiven und <strong>der</strong> negativen Wichtungsfunktion multipliziert<br />

(s. Abbildung 4.4). Das positiv gewichtete Rauschen und das negativ<br />

”<br />

gewichtete<br />

26 Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer


1<br />

0.5<br />

Kohärenzfunktion einer AB-Anordnung<br />

r=0.2m, a=1, φ = 0°<br />

C xy<br />

(f)<br />

γ xy<br />

(f)<br />

Kohärenz<br />

0<br />

-0.5<br />

-1<br />

in [Hz]<br />

10 0 10 1 10 2<br />

Frequenz<br />

10 3 10 4<br />

1<br />

Wichtungen <strong>der</strong> kumulierten Rauschen<br />

0.5<br />

Kohärenz<br />

0<br />

-0.5<br />

positive Anteile<br />

negative Anteile<br />

Summe positiv+negativ<br />

unkorrelierter Anteil<br />

-1<br />

in [Hz]<br />

10 0 10 1 10 2<br />

Frequenz<br />

10 3 10 4<br />

Abbildung 4.4: Theoretische <strong>Diffusfeldkorrelation</strong> und <strong>die</strong> dazugehörigen Wichtungsfunktionen<br />

für eine AB-Anordnung mit Kugeln. Abstand = 0.2m<br />

Rauschen werden zu gleichen Teilen in zwei Vektoren geschrieben, wobei <strong>der</strong> negativ<br />

gewichtete Anteil in einem Vektor in <strong>der</strong> Phase gedreht wird (negative Korrelation).<br />

Die beiden Vektoren stehen für den linken und rechten Kanal und beinhalten nun den<br />

positiv und negativ korrelierten Anteil, <strong>der</strong> in beiden Kanälen vorhanden ist. Da sich<br />

korrelierte Rauschsignale um 6dB im Pegel erhöhen wenn sie zusammengemischt werden,<br />

muss <strong>der</strong> dekorrelierte Rest stärker gewichtet werden.<br />

Dafür gibt es erneut eine Wichtungsfunktion, <strong>die</strong> <strong>die</strong> Gesamtenergie konstant hält.<br />

” Noise2“ und Noise3“ werden jeweils mit <strong>die</strong>ser Wichtungsfunktion multipliziert. Anschließend<br />

wird Noise2“ dem linken Kanal und Noise3“ dem rechten Kanal hinzu-<br />

”<br />

”<br />

”<br />

gefügt. In einem letzten Schritt werden <strong>die</strong> im Spektrum vorliegenden Rauschsignale<br />

mittels inverser Fourier-Transformation in den Zeitbereich zurück transformiert.<br />

Das Ergebnis sind zwei Rauschsignale, <strong>die</strong> anhand <strong>der</strong> nicht quadrierten Kohärenzfunktion<br />

γ xy (f) dekorreliert wurden. Mit <strong>die</strong>sen beiden Rauschsignalen wird dann <strong>die</strong><br />

Impulsantwort gefaltet.<br />

In Abbildung 4.2 ist <strong>die</strong> theoretische <strong>Diffusfeldkorrelation</strong> einer XY-Mikrofonanordnung<br />

mit zwei Nieren und einem Öffnungswinkel von 90 ◦ zu sehen. Man beachte, dass <strong>die</strong> Ko-<br />

Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer 27


4 Erstellung <strong>der</strong> Stimuli in Matlab<br />

1<br />

Kohärenz zwischen Noise1,Noise2 und Noise1,Noise3<br />

0.5<br />

Kohärenz<br />

0<br />

-0.5 γ (f)<br />

noise1,noise2<br />

γ (f)<br />

noise1,noise3<br />

-1<br />

in [Hz]<br />

10 0 10 1 10 2<br />

Frequenz<br />

10 3 10 4<br />

1<br />

Kohärenzfunktion <strong>der</strong> beiden erstellten Rauschen noise-left, noise-right und <strong>die</strong><br />

theoretische Korrelation bei tiefen Frequenzen<br />

0.5<br />

Kohärenz<br />

0<br />

-0.5<br />

γ noiseL,noiseR<br />

(f)<br />

γ (f) xy<br />

-1<br />

in [Hz]<br />

10 0 10 1 10 2<br />

Frequenz<br />

10 3 10 4<br />

Abbildung 4.5: Das ursprüngliche Rauschen (oberer Plot) ist für jede Mikrofonanordnung<br />

gleich. Mit den Wichtungsfunktionen wird das gewünschte<br />

Rauschpaar im Spektrum ”<br />

geformt“. Das Ergbnis für<br />

<strong>die</strong> AB-Anordnung mit 0.2m Abstand sieht man im unteren Plot.<br />

DF I P redictor = 0.58<br />

härenzfunktion für eine koinzidente Mikrofonanordnung für alle Frequenzen gleich ist.<br />

Die Kohärenz einer koinzidenten Mikrofonanordnung kann somit durch den Kohärenzgrad<br />

o<strong>der</strong> den Korrelationkoeffizienten ausgedrückt werden. Die Wichtungsfunktionen<br />

für <strong>die</strong> einzelnen Rauschsignale ”<br />

Noise1“, ”<br />

Noise2“, ”<br />

Noise3“ für <strong>die</strong>se XY-Anordnung<br />

sind in dem unteren Plot von Abbildung 4.2 zu sehen.<br />

Noise1“ wird mit <strong>der</strong> Wichtungsfunktion für <strong>die</strong> positiv und negativ korrelierten Anteile<br />

gewichtet. Aus <strong>der</strong> Summe <strong>der</strong> positiven und negativen Wichtungsfunktionen<br />

”<br />

wird<br />

<strong>die</strong> Wichtungsfunktion für den unkorrelierten Anteil berechnet. Der unkorrelierte Anteil<br />

für den linken Kanal wird mit <strong>der</strong> Wichtungsfunktion und ”<br />

Noise2“ berechnet. Der unkorrelierte<br />

Anteil für den rechten Kanal wird aus <strong>der</strong> Wichtungsfunktion und ”<br />

Noise3“<br />

berechnet. Die Kohärenzfunktion des resultierenden Rauschpaares ist in Abbildung 4.3<br />

zu sehen.<br />

In Abbildung 4.4 und 4.5 ist <strong>die</strong>selbe Vorgehensweise für eine AB-Anordnung <strong>auf</strong>gezeigt.<br />

Bei räumlich getrennten Mikrofonen folgt <strong>die</strong> Kohärenzfunktion stets einem sin x<br />

x<br />

28 Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer


4.1 Einführung des ”<br />

DFI-Prädiktor“<br />

Verl<strong>auf</strong>. In <strong>die</strong>sem Fall ergeben sich positive und negative Wichtungsfunktionen für<br />

” Noise1“.<br />

4.1 Einführung des ”<br />

DFI-Prädiktor“<br />

Um <strong>auf</strong> <strong>die</strong> Fragestellung <strong>die</strong>ser Arbeit zurückzukommen, wird nun <strong>der</strong> in <strong>der</strong> Einleitung<br />

erwähnte Wert DFI-Prädiktor eingeführt. Der DFI-Prädiktor kann für jede beliebige<br />

zweikanalige Mikrofonanordnung berechnet werden und soll eine Aussage darüber<br />

treffen können, wie ausgedehnt das Klangbild bei Wie<strong>der</strong>gabe abgebildet wird. Die Hypothese<br />

ist nach wie vor, dass <strong>die</strong> Dekorrelation unterhalb von 1,5kHz entscheidend ist,<br />

da höhere Frequenzen eine immer stärkere natürliche Dekorrelation durch den Ohrabstand<br />

erfahren.<br />

In Kapitel 3.4 wurde gezeigt, dass <strong>die</strong> Korrelation von zwei räumlich getrennten Mikrofonen<br />

frequenzabhängig ist. Aus <strong>die</strong>sem Grund wird <strong>die</strong> Kohärenzfunktion γ xy (f)<br />

von zwei räumlich getrennten Mikrofonen als Beschreibung <strong>der</strong> <strong>Diffusfeldkorrelation</strong><br />

verwendet [16], [9]. Der DFI-Prädiktor wird ebenfalls aus <strong>der</strong> Kohärenzfunktion γ xy (f)<br />

berechnet. Die grüne Kurve im unteren Plot in Abbildung 4.4 zeigt den tieffrequenten<br />

Anteil <strong>der</strong> Kohärenzfunktion. Dieser Anteil wird für <strong>die</strong> Berechnung des DFI-Prädiktor<br />

verwendet. Er ist definiert als:<br />

DF I P redictor = 1 n<br />

f=1500Hz<br />

∑<br />

f=40Hz<br />

[γ xy (f) · χ(f)] 2 (14)<br />

n ist <strong>die</strong> Anzahl <strong>der</strong> Stützstellen, <strong>die</strong> sich aus <strong>der</strong> verwendeten FFT-Länge ergeben.<br />

χ(f) ist erneut eine Wichtungsfunktion. Ihr Verl<strong>auf</strong> ist in Abbildung 4.1.1 zu sehen.<br />

Die Wichtungsfunktion χ(f) wird verwendet, um <strong>die</strong> tiefen Frequenzen stärker in den<br />

DFI-Prädiktor einfließen zu lassen. Dies ist erneut durch <strong>die</strong> Hypothese begründet, dass<br />

<strong>die</strong> Korrelation bei tiefen Frequenzen einen größeren Einfluss <strong>auf</strong> <strong>die</strong> <strong>Wahrnehmung</strong> hat<br />

als <strong>die</strong> Korrelation bei hohen Frequenzen.<br />

Die Definition des DFI-Prädiktor ist zunächst völlig willkürlich und ist keinesfalls endgültig.<br />

Der DFI-Prädiktor <strong>die</strong>nt als erste Idee zur Beschreibung <strong>der</strong> tieffrequenten Korrelation<br />

einer Mikrofonanordnung. Da er eine Korrelation beschreiben soll, nimmt er<br />

nur Werte zwischen 0 und 1 an.<br />

In <strong>die</strong>ser Arbeit wird <strong>die</strong> eben genannte Definition vorerst für <strong>die</strong> Hörversuche benutzt<br />

und wird sicherlich in zukünftigen Arbeiten weiterentwickelt werden. In Abbildung<br />

Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer 29


4 Erstellung <strong>der</strong> Stimuli in Matlab<br />

12<br />

Wichtungsfunktion χ(f)<br />

9<br />

6<br />

Amplitude in [dB]<br />

3<br />

0<br />

-3<br />

-6<br />

-9<br />

-12<br />

10 2 10 3<br />

Frequenz in [Hz]<br />

Abbildung 4.1.1: Mit <strong>die</strong>ser Wichtungsfunktion wird <strong>die</strong> Korrelation <strong>der</strong> tiefen Frequenzen<br />

stärker gewichtet. Die tiefen Frequenzen haben somit einen<br />

größeren Einfluss <strong>auf</strong> den Wert des DFI-Prädiktor<br />

4.3 und 4.5 ist <strong>der</strong> Wert des DFI-Prädiktor für <strong>die</strong> jeweilige Mikrofonanordnung mit<br />

angegeben.<br />

Die Hypothese ist: Je größer <strong>der</strong> DFI-Prädiktor desto enger wird das Klangbild wahrgenommen.<br />

Umgekehrt gilt: Je kleiner <strong>der</strong> DFI-Prädiktor desto breiter wird das Klangbild<br />

wahrgenommen.<br />

Mit dem DFI-Prädiktor soll außerdem gezeigt werden, dass we<strong>der</strong> <strong>der</strong> übliche Korrelationskoeffizient<br />

noch <strong>der</strong> Kohärenzgrad geeignet sind <strong>die</strong> Korrelation <strong>der</strong> Signale von<br />

zwei räumlich getrennten Mikrofonen zu beurteilen. Auch für koinzidente Mikrofonanordnungen<br />

entspricht <strong>der</strong> DFI-Prädiktor nicht dem Kohärenzgrad o<strong>der</strong> dem Korrelationskoeffizienten,<br />

da er eine frequenzabhängige Bewertung enthält.<br />

Die Korrelation des Diffusfeldes wird in <strong>die</strong>ser Arbeit über das Zusammenmischen<br />

unterschiedlicher weißer Rauschsignale simuliert. Die daraus resultierende Kohärenz<br />

wird dann über eine Faltung in eine Impulsantwort übertragen. Der Kohärenzgrad<br />

kann innerhalb des Matlabskripts für <strong>die</strong> beiden Rauschsignale berechnet werden, <strong>die</strong><br />

zur Dekorrelation <strong>der</strong> Impulsantwort benutzt werden. Das Leistungsdichtespektrum<br />

des Rauschens lässt sich demnach mit dem Leistungsdichtespektrum des simulierten<br />

Diffusfeldes gleichsetzen.<br />

30 Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer


4.1 Einführung des ”<br />

DFI-Prädiktor“<br />

Wie bereits erwähnt, ist <strong>die</strong> Art <strong>der</strong> Anregung eines Raumes entscheidend für <strong>die</strong> spektrale<br />

Leistungsverteilung des Diffusfeldes. In [13] und [24] wurde <strong>der</strong> Kohärenzgrad<br />

für Kugelmikrofone in einem Diffusfeld bei unterschiedlichen Abständen messtechnisch<br />

bestimmt. In [13] wurde ein Hallraum mit bandbegrenzten δ-Impulsen angeregt (0.2<br />

- 2,5kHz). Dabei wurden für verschiedene Abstände <strong>der</strong> Kohärenzgrad gemessen. Dadurch,<br />

dass das Ergebnis <strong>der</strong> normierten Keuzkorrelationsfunktion von <strong>der</strong> spektralen<br />

Leistungsverteilung <strong>der</strong> Eingangssignale abhängt (s. Kapitel 3.4), würde für eine an<strong>der</strong>e<br />

Art <strong>der</strong> Anregung auch ein an<strong>der</strong>er Kohärenzgrad gemessen werden. Der Kohärenzgrad<br />

und <strong>der</strong> Korrelationskoeffizient sind damit von <strong>der</strong> Anregung des Raumes abhängig.<br />

Deshalb müsste, um eine möglichst exakte Aussage über <strong>die</strong> Korrelation zu erhalten,<br />

<strong>der</strong> Raum im gesamten interessierenden Frequenzband gleichmäßig angeregt werden<br />

(weißes Rauschen). Bei einer Anregung mit weißem Rauschen hat jede Frequenz <strong>die</strong><br />

gleiche Leistung. Dadurch hat jede Frequenz einen gleichwertigen Einfluss <strong>auf</strong> das Ergebnis<br />

<strong>der</strong> normierten Kreuzkorrelationsfunktion.<br />

Die Kohärenzfunktion ist nicht von <strong>der</strong> spektralen Leistungsverteilung abhängig. Dies<br />

wurde bereits in Kapitel 3.4 gezeigt. Bei <strong>der</strong> Kohärenzfunktion wird <strong>die</strong> Leistung je<strong>der</strong><br />

Frequenz nur <strong>auf</strong> <strong>die</strong> Gesamtleistung bei <strong>der</strong>selben Frequenz normiert. Somit ist das<br />

Ergebnis <strong>der</strong> Kohärenzfunktion unabhängig von <strong>der</strong> spektralen Leistungsverteilung <strong>der</strong><br />

Eingangssignale. Dies ist <strong>der</strong> Hauptgrund dafür, dass <strong>die</strong> Kohärenzfunktion eine präzisere<br />

Aussage über <strong>die</strong> Korrelation von räumlich getrennten Mikrofonen geben kann.<br />

Diffusfeld mit weißem Rauschen simuliert<br />

Diffusfeld mit rosa Rauschen simuliert<br />

Druckempfänger<br />

Druckempfänger<br />

1<br />

1<br />

0,9<br />

0,9<br />

0,8<br />

0,8<br />

Kohärenzgrad k<br />

0,7<br />

0,6<br />

0,5<br />

0,4<br />

0,3<br />

Kohärenzgrad k<br />

0,7<br />

0,6<br />

0,5<br />

0,4<br />

0,3<br />

0,2<br />

0,2<br />

0,1<br />

0,1<br />

0<br />

0<br />

0 0,2 0,4 0,6 0,8 1 1,2 1,4 1,6 1,8 2 2,2<br />

0 0,2 0,4 0,6 0,8 1 1,2 1,4 1,6 1,8 2 2,2<br />

Abstand r <strong>der</strong> Mikrofone in [m]<br />

Abstand r <strong>der</strong> Mikrofone in [m]<br />

Abbildung 4.1.2: Der Kohärenzgrad im linken Plot entsteht, wenn das Diffusfeld mit<br />

weißem Rauschen simuliert wird. Der Kohärenzgrad im rechten Plot<br />

entsteht, wenn das Diffusfeld mit rosa Rauschen simuliert wird.<br />

In [13] wurde <strong>der</strong> Kohärenzgrad von zwei räumlich getrennten Druckempfängern im<br />

Hallraum bei verschiedenen Abständen gemessen. Zur Anregung des Raumes wurden<br />

bandbegrenzte δ-Impulse verwendet (0,25 - 2kHz). Die Ähnlichkeit <strong>der</strong> Kurven in Ab-<br />

Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer 31


4 Erstellung <strong>der</strong> Stimuli in Matlab<br />

bildung 4.1.3 und Abbildung 4.1.2 rechts sind deutlich. Da <strong>der</strong> Raum mit den bandbegrenzten<br />

δ-Impulsen vornehmlich im tieffrequenten Bereich angeregt wird, tritt ein<br />

kleiner Kohärenzgrad erst bei großen Abständen <strong>auf</strong>. Der Grund dafür ist <strong>die</strong> größere<br />

Wellenlänge tiefer Frequenzen (s. Abbildung 3.4.2).<br />

Abbildung 4.1.3: Kohärenzgrad k für verschiedene Abstände von Druckempfängern im<br />

Hallraum nach [13]<br />

In [24] wurden ähnliche Werte wie in [13] für den Kohärenzgrad von räumlich getrennten<br />

Mikrofonen gemessen. In [24] wurde zur Anregung des Raumes rosa Rauschen<br />

verwendet. Dies führt erneut <strong>auf</strong>grund <strong>der</strong> frequenzabhängigen Leistungsunterschiede<br />

zu einem größeren Kohärenzgrad bei kleineren Abständen <strong>der</strong> Mikrofone (s. Abbildung<br />

4.1.2).<br />

32 Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer


5 Vorversuche<br />

Um einen guten Ausgangspunkt für einen Hörversuch zu legen, wurden eine Reihe<br />

von Vorversuchen durchgeführt. Ziel <strong>der</strong> Vorversuche war es geeignete Stimuli aus den<br />

verschiedenen Mikrofonierungsarten (s. Kapitel 2.4) für einen Hörversuch auszuwählen.<br />

In den Stimuli des Hörversuchs sollten alle Mikrofonierungsarten enthalten sein.<br />

Die Vorversuche wurden alle vom Autor durchgeführt. Dabei wurden als erstes <strong>die</strong> verschiedenen<br />

Mikrofonierungsarten separat untersucht. Am Ende ging es darum, in einem<br />

ersten kombinierten Versuch <strong>die</strong> verschiedenen Mikrofonierungsarten zu vereinen, um<br />

<strong>die</strong> Aussagekraft des DFI-Prädiktor festzustellen.<br />

In den Vorversuchen hat sich gezeigt, dass <strong>der</strong> DFI-Prädiktor bereits eine gute Voraussage<br />

über <strong>die</strong> wahrgenommene Breite bei allen drei Mikrofonierungsarten geben<br />

kann.<br />

Abbildung 5.1: ”<br />

Audio-Comparison-Tool“ [25]. Je<strong>der</strong> Stimulus wurde gegen <strong>die</strong> Referenz<br />

und gegen alle an<strong>der</strong>en Stimuli gehört. Die Referenz ist jeweils<br />

versteckt in jedem Stimulus <strong>auf</strong> dem linken o<strong>der</strong> rechten Playbutton.<br />

Die Vorversuche und auch <strong>der</strong> spätere Hörversuch wurden alle mit nicht entzerrten<br />

Kopfhörern durchgeführt. Ein ähnlicher Versuchs<strong>auf</strong>bau ist in [6] beschrieben. Innerhalb<br />

<strong>die</strong>ser Untersuchung wurden zwei Rauschsignale mit unterschiedlichem Kohärenzgrad<br />

k (s. Kapitel 3.3) über nicht entzerrte Kopfhörer wie<strong>der</strong>gegeben. Dabei wurde nach<br />

Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer 33


5 Vorversuche<br />

<strong>der</strong> Hörereignislage und Ausdehnung innerhalb des Kopfes gefragt. Die Probanden sollten<br />

dann in eine Skizze des Kopfes <strong>die</strong> Ausdehnung und Hörereignislage einzeichnen.<br />

Innerhalb <strong>der</strong> Vorversuche und im Hörversuch wird nach <strong>der</strong> Breite gefragt, da es<br />

nicht um <strong>die</strong> Lokalisation geht. Die Breite ist mit <strong>der</strong> Ausdehnung zu vergleichen. Die<br />

zugrunde liegende trockene Aufnahme für <strong>die</strong> Stimuli <strong>der</strong> Vorversuche war eine Sprach<strong>auf</strong>nahme.<br />

Als Testsoftware wurde das Programm ABC/Hidden Reference Audio Comparison<br />

”<br />

Tool“ verwendet [25] (s. Abbildung 5.1). Die Software ermöglicht es bis zu acht verschiedene<br />

Stimuli gegen eine Referenz zu hören und ähnelt somit einer Software für<br />

Mushratests. Es fehlt lei<strong>der</strong> <strong>der</strong> wichtige Aspekte <strong>der</strong> Hidden-Reference“. Für <strong>die</strong> Vorversuche<br />

war <strong>die</strong>se Software allerdings vollkommen ausreichend. Entscheidend ist <strong>die</strong><br />

”<br />

eingebaute Shuffle-Funktion. Die Inputfiles werden gemischt und in zufälliger Reihenfolge<br />

angeordnet, so dass Selbsttests überhaupt erst möglich sind.<br />

Die Bewertungsskala wurde für <strong>die</strong> Vorversuche an<strong>der</strong>s ausgelegt. Der Wert 3 bedeutet,<br />

dass kein Unterschied zwischen <strong>der</strong> Referenz und dem Stimulus gehört wird. Der<br />

Stimulus wirkt demnach genauso breit wie <strong>die</strong> Referenz. Eine Bewertung größer als 3<br />

bedeutet, dass <strong>der</strong> Stimulus breiter wahrgenommen wird als <strong>die</strong> Referenz. Ein kleinerer<br />

Wert als 3 bedeutet, dass <strong>der</strong> Stimulus enger wahrgenommen wird als <strong>die</strong> Referenz.<br />

Zusätzlich zur Referenz wurden <strong>die</strong> Stimuli auch untereinan<strong>der</strong> bewertet. Somit wird<br />

im besten Fall ein gradueller Verl<strong>auf</strong> von eng bis breit erreicht. Für <strong>die</strong> Darstellung<br />

wurden für alle Bewertungen <strong>die</strong> Differenz zu 3 gebildet. Somit verschiebt sich <strong>die</strong><br />

Skala <strong>auf</strong> einen Bereich von 2 bis -2. In den folgenden Plots bedeutet demnach 0, dass<br />

kein Unterschied zur Referenz gehört wird. Werte größer 0 bedeuten, dass <strong>der</strong> Stimulus<br />

breiter wahrgenommen wird und Werte kleiner 0 bedeuten, dass <strong>der</strong> Stimulus enger<br />

wahrgenommen wird.<br />

Für jede <strong>der</strong> drei Grundarten von Mikrofonanordnungen wurden 16 Stimuli untersucht.<br />

Um eine robustere Aussage zu erhalten wurde je<strong>der</strong> Versuch vier mal wie<strong>der</strong>holt und<br />

<strong>die</strong> Bewertungen gemittelt. Die Ergebnisse <strong>der</strong> Vorversuche werden in den folgenden<br />

Kapiteln vorgestellt.<br />

5.1 Untersuchung <strong>der</strong> koinzidenten Stimuli<br />

Als Grundlage für <strong>die</strong> Untersuchung <strong>der</strong> koinzidenten Stimuli wurde das XY-Verfahren<br />

mit 45 ◦ Öffnungswinkel gewählt. Da <strong>die</strong> Testsoftware nur <strong>die</strong> gleichzeitige Untersuchung<br />

34 Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer


5.1 Untersuchung <strong>der</strong> koinzidenten Stimuli<br />

von acht Stimuli zulässt, wurden <strong>die</strong> Stimuli in zwei Achtergruppen unterteilt und<br />

separat untersucht. Jede Achtergruppe wurde gegen eine eigene Referenz gehört, um<br />

möglichst feine Unterschiede zwischen den Stimuli herauszufinden. Der Versuch wurde<br />

mit je<strong>der</strong> Achtergruppe vier mal durchgeführt und <strong>die</strong> Bewertungen gemittelt.<br />

Die koinzidenten Mikrofonanordnungen, <strong>die</strong> simuliert wurden, sind in Abbildung 5.1.1<br />

zu sehen.<br />

A r φ DFI-Prädiktor<br />

0 0m 45 ◦ 0<br />

0.05 0m 45 ◦ 0.0001<br />

0.1 0m 45 ◦ 0.0013<br />

0.15 0m 45 ◦ 0.007<br />

0.2 0m 45 ◦ 0.0249<br />

0.25 Ref 0m 45 ◦ 0.0625<br />

0.3 0m 45 ◦ 0.1262<br />

0.35 0m 45 ◦ 0.2167<br />

0.45 0m 45 ◦ 0.4457<br />

A r φ DFI-Prädiktor<br />

0.5 0m 45 ◦ 0.5625<br />

0.55 0m 45 ◦ 0.6684<br />

0.6 0m 45 ◦ 0.7586<br />

0.65 0m 45 ◦ 0.8315<br />

0.7 Ref 0m 45 ◦ 0.8879<br />

0.8 0m 45 ◦ 0.9596<br />

0.85 0m 45 ◦ 0.9796<br />

0.9 0m 45 ◦ 0.9918<br />

1 0m 45 ◦ 1<br />

Abbildung 5.1.1: A ist <strong>der</strong> Mikrofonparameter (1 = Kugel, 0 = Acht) und φ <strong>der</strong> halbe<br />

Öffnungswinkel <strong>der</strong> Mikrofonanordnung. Mit ”<br />

Ref“ ist <strong>die</strong> Referenz<br />

gekennzeichnet, <strong>die</strong> in <strong>der</strong> jeweiligen Stimulusgruppe benutzt wurde.<br />

Die Tabellen zeigen <strong>die</strong> beiden Achtergruppen von Stimuli für <strong>die</strong><br />

Untersuchung <strong>der</strong> koninzidenten Mikrofonanordnungen<br />

Die Werte, <strong>die</strong> <strong>der</strong> DFI-Prädiktor bei den koinzidenten Anordnungen annimmt, sind<br />

relativ gleichmäßig verteilt. Dies liegt daran, dass mit zwei Achten vollständig dekorrelierte<br />

Signale im Diffusfeld <strong>auf</strong>gezeichnet werden und mit zwei Kugeln vollständig<br />

korrelierte Signale. Somit lässt sich <strong>der</strong> gesamte Wertebereich des DFI-Prädiktor darstellen.<br />

Bei reinen L<strong>auf</strong>zeitverfahren ist eine vollständige Dekorrelation praktisch kaum zu erreichen,<br />

da <strong>der</strong> Abstand <strong>der</strong> Mikrofone groß gegen <strong>die</strong> Wellenlänge sein muss (s. Abbildung<br />

3.4.2 und 3.4.1). Die Ergebnisse <strong>die</strong>ser Untersuchung sind in Abbildung 5.1.2 und 5.1.3<br />

zu sehen.<br />

In Abbildung 5.1.2 ist eine eindeutige Tendenz zu erkennen. Die Tendenz deckt sich<br />

ebenfalls gut mit <strong>der</strong> Hypothese <strong>die</strong>ser Arbeit. Im linken Plot erkennt man, dass <strong>die</strong><br />

Mikrofonanordnungen, <strong>die</strong> mehr zur Acht (dekorrelierter) ten<strong>die</strong>ren, breiter wahrgenommen<br />

werden als <strong>die</strong> Referenz. Die Anordnungen <strong>die</strong> mehr zur Kugel (korrelierter)<br />

ten<strong>die</strong>ren werden enger wahrgenommen.<br />

Einzig bei A = 0.6 gibt es eine kleine Abweichung. Der DFI-Prädiktor spiegelt <strong>die</strong><br />

Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer 35


5 Vorversuche<br />

Koinzidenzversuch mit A=0,5 - A=1<br />

Koinzidenzversuch mit A=0,5 - A=1<br />

2,5<br />

Mittelwert mit 95% Konfidenzintervallen<br />

2,5<br />

Mittelwert mit 95% Konfidenzintervallen<br />

2<br />

2<br />

1,5<br />

1,5<br />

1<br />

1<br />

Bewertung<br />

0,5<br />

0<br />

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1<br />

-0,5<br />

Bewertung<br />

0,5<br />

0<br />

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1<br />

-0,5<br />

-1<br />

-1<br />

-1,5<br />

-1,5<br />

-2<br />

-2<br />

-2,5<br />

Mikrofonparameter A<br />

-2,5<br />

DFI-Prädiktor<br />

Abbildung 5.1.2: Ergebnisse des Hörversuchs mit den Stimuli aus <strong>der</strong> rechten Tabelle<br />

in Abbildung 5.1.1. Die Referenz für <strong>die</strong>se Untersuchung war: A =<br />

0.7, DFI-Prädiktor=0.8879<br />

gleiche Tendenz wie<strong>der</strong>. Die Mikrofonanordnungen mit einem größeren DFI-Prädiktor<br />

werden enger wahrgenommen als <strong>die</strong> Mikrofonanordnungen mit einem kleineren DFI-<br />

Prädiktor.<br />

Koinzidensversuch mit A=0 - A=0,45<br />

Koinzidensversuch mit A=0 - A=0,45<br />

2,5<br />

Mittelwert mit 95% Konfidenzintervallen<br />

2,5<br />

Mittelwert mit 95% Konfidenzintervallen<br />

2<br />

2<br />

1,5<br />

1,5<br />

1<br />

1<br />

Bewertung<br />

0,5<br />

0<br />

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1<br />

-0,5<br />

Bewertung<br />

0,5<br />

0<br />

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1<br />

-0,5<br />

-1<br />

-1<br />

-1,5<br />

-1,5<br />

-2<br />

-2<br />

-2,5<br />

Mikrofonparameter A<br />

-2,5<br />

DFI-Prädiktor<br />

Abbildung 5.1.3: Ergebnisse des Hörversuchs mit den Stimuli aus <strong>der</strong> linken Tabelle in<br />

Abbildung 5.1.1. Die Referenz für <strong>die</strong>se Untersuchung war: A = 0.25,<br />

DFI-Prädiktor=0.0625<br />

In <strong>der</strong> zweiten Achtergruppe <strong>die</strong>ses Versuchs ist <strong>die</strong> Tendenz nicht so eindeutig wie in<br />

Abbildung 5.1.2. Im linken Plot von Abbildung 5.1.3 ist zu erkennen, dass <strong>der</strong> Stimulus<br />

bei A = 0.05 breiter wahrgenommen wird als <strong>der</strong> Stimulus mit A = 0. Dies entspricht<br />

nicht den Erwartungen, da <strong>die</strong>ser Stimulus eigentlich enger wahrgenommen werden<br />

sollte.<br />

Die Stimuli mit dem Mikrofonparameter A


5.2 Untersuchung <strong>der</strong> L<strong>auf</strong>zeitstimuli<br />

DFI-Prädiktor nichts zu erkennen. Wenn man <strong>die</strong> x-Achse strecken würde, würde ein<br />

ähnliches Bild wie im rechten Plot in Abbildung 5.1.3 entstehen. Die x-Achse wird<br />

bewusst für alle Plots mit <strong>der</strong> festen Skalierung 0 bis 1 angegeben, um <strong>die</strong> Plots vergleichbarer<br />

zu machen. Die Unterschiede zwischen den jeweiligen Mikrofonanordnungen<br />

sind damit schneller ersichtlich.<br />

Trotz <strong>der</strong> geringen Unterschiede im DFI-Prädiktor haben kleinste Än<strong>der</strong>ungen <strong>der</strong><br />

Richtchrakteristik einen hörbaren Einfluss <strong>auf</strong> <strong>die</strong> Korrelation des Diffusschalls. Die<br />

Unterschiede sind allerdings bei einem DFI-Prädiktor von 0 bis 0.02 sehr gering. Erst<br />

ab einem Wert von 0.12 ist eine deutlich Tendenz erkennbar.<br />

5.2 Untersuchung <strong>der</strong> L<strong>auf</strong>zeitstimuli<br />

Als Grundlage für <strong>die</strong> Untersuchung <strong>der</strong> L<strong>auf</strong>zeitstimuli wird das AB-Verfahren verwendet.<br />

Die Untersuchung wurde nach dem gleichen Schema durchgeführt wie <strong>die</strong> Untersuchung<br />

<strong>der</strong> koinzidenten Stimuli. Die simulierten Mikrofonanordnungen sind in Abbildung<br />

5.2.1 zu sehen.<br />

A r φ DFI-Prädiktor<br />

1 0.1m 0 ◦ 0.7753<br />

1 0.08m 0 ◦ 0.8308<br />

1 0.06m 0 ◦ 0.8919<br />

1 0.05m Ref 0 ◦ 0.9209<br />

1 0.04m 0 ◦ 0.9471<br />

1 0.03m 0 ◦ 0.9691<br />

1 0.02m 0 ◦ 0.9859<br />

1 0.01m 0 ◦ 0.9964<br />

1 0m 0 ◦ 1<br />

A r φ DFI-Prädiktor<br />

1 0.2m 0 ◦ 0.58452<br />

1 0.18m 0 ◦ 0.6128<br />

1 0.16m 0 ◦ 0.6439<br />

1 0.15m Ref 0 ◦ 0.6611<br />

1 0.14m 0 ◦ 0.6795<br />

1 0.13m 0 ◦ 0.6997<br />

1 0.12m 0 ◦ 0.7218<br />

1 0.11m 0 ◦ 0.7461<br />

1 0.1m 0 ◦ 0.7725<br />

Abbildung 5.2.1: Die Tabellen zeigen <strong>die</strong> verwendeten Stimuli für <strong>die</strong> Untersuchung <strong>der</strong><br />

l<strong>auf</strong>zeitbasierten Mikrofonanordnungen.<br />

Der Wertebereich des DFI-Prädiktor ist bei den L<strong>auf</strong>zeitverfahren nicht so umfangreich<br />

wie <strong>der</strong> <strong>der</strong> koinzidenten Stimuli. Die <strong>Diffusfeldkorrelation</strong> von reinen L<strong>auf</strong>zeitverfahren<br />

hängt nur vom Abstand <strong>der</strong> Mikrofone ab (s. Abbildung 3.4.1 und 3.4.2). Da <strong>der</strong> DFI-<br />

Prädiktor im Frequenzband von 40-1500Hz berechnet wird, sind Werte, <strong>die</strong> gegen 0<br />

gehen, erst bei Abständen über 2m möglich. Später wird sich zeigen, dass bei so stark<br />

dekorrelierten Signalen keine Unterschiede in <strong>der</strong> Breite gehört werden. In Abbildung<br />

5.2.2 und 5.2.3 sind <strong>die</strong> Ergebnisse <strong>der</strong> L<strong>auf</strong>zeituntersuchung zu sehen.<br />

Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer 37


5 Vorversuche<br />

2,5<br />

L<strong>auf</strong>zeitversuch mit r=0,1m - r=0,2m<br />

Mittelwert mit 95% Konfidenzintervallen<br />

2,5<br />

L<strong>auf</strong>zeitversuch mit r=0,1m - r=0,2m<br />

Mittelwert mit 95% Konfidenzintervallen<br />

2<br />

2<br />

1,5<br />

1,5<br />

1<br />

1<br />

Bewertung<br />

0,5<br />

0<br />

0 0,05 0,1 0,15 0,2 0,25<br />

-0,5<br />

Bewertung<br />

0,5<br />

0<br />

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1<br />

-0,5<br />

-1<br />

-1<br />

-1,5<br />

-1,5<br />

-2<br />

-2<br />

-2,5<br />

Mikrofonabstand r in [m]<br />

-2,5<br />

DFI-Prädiktor<br />

Abbildung 5.2.2: Ergebnisse des Hörversuchs mit den Stimuli aus <strong>der</strong> rechten Tabelle<br />

in Abbildung 5.2.1. Die Referenz für <strong>die</strong>se Untersuchung war: r=0.15,<br />

DFI-Prädiktor=0.6611<br />

Die Tendenz in Abbildung 5.2.2 ist nicht so eindeutig wie in <strong>der</strong> koinzidenten Untersuchung.<br />

Zwischen den Stimuli mit den Abständen r = 0.1m und r = 0.11m wird<br />

noch ein Unterschied wahrgenommen. Die folgenden Abstände bis r = 0.16m zeigen<br />

allerdings kaum Verän<strong>der</strong>ung. Erst ab r = 0.18m gibt es wie<strong>der</strong> Unterschiede. Dieser<br />

Verl<strong>auf</strong> spiegelt sich auch im DFI-Prädiktor wie<strong>der</strong>.<br />

Die Tendenz in Abbildung 5.2.3 könnte allerdings kaum eindeutiger sein. Der Zusammenhang<br />

zwischen Mikrofonabstand und wahrgenommener Breite ist in <strong>die</strong>sem Versuch<br />

fast linear. Auch hier haben kleine Än<strong>der</strong>ungen in <strong>der</strong> Korrelation des Diffusschalls<br />

deutlich hörbare <strong>Auswirkung</strong>en <strong>auf</strong> <strong>die</strong> wahrgenommene Breite des Klangbildes.<br />

L<strong>auf</strong>zeitversuch mit r=0m - r=0,1m<br />

L<strong>auf</strong>zeitversuch mit r=0m - r=0,1m<br />

2,5<br />

Mittelwert mit 95% Konfidenzintervallen<br />

2,5<br />

Mittelwert mit 95% Konfidenzintervallen<br />

2<br />

2<br />

1,5<br />

1,5<br />

1<br />

1<br />

Bewertung<br />

0,5<br />

0<br />

0 0,02 0,04 0,06 0,08 0,1 0,12<br />

-0,5<br />

Bewertung<br />

0,5<br />

0<br />

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1<br />

-0,5<br />

-1<br />

-1<br />

-1,5<br />

-1,5<br />

-2<br />

-2<br />

-2,5<br />

Mikrofonabstand r in [m]<br />

-2,5<br />

DFI-Prädiktor<br />

Abbildung 5.2.3: Ergebnisse des Hörversuchs mit den Stimuli aus <strong>der</strong> linken Tabelle in<br />

Abbildung 5.2.1. Die Referenz für <strong>die</strong>se Untersuchung war: r= 0.05,<br />

DFI-Prädiktor=0.9209<br />

Der DFI-Prädiktor in Abbildung 5.2.3 zeigt ebenfalls eine klare Tendenz. Alle Stimuli<br />

38 Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer


5.3 Untersuchung <strong>der</strong> äquivalenten Stimuli<br />

wurden demnach den Erwartungen entsprechend beurteilt.<br />

5.3 Untersuchung <strong>der</strong> äquivalenten Stimuli<br />

Als Grundlage für <strong>die</strong> Untersuchung <strong>der</strong> Äquivalenzverfahren wurde <strong>die</strong> ORTF-Anordnung<br />

verwendet. Diese wurde mit an<strong>der</strong>en Parametern simuliert, <strong>die</strong> üblicherweise verwendet<br />

werden. Der Öffnungswinkel beträgt nur 90 ◦ anstatt <strong>der</strong> bekannten 110 ◦ , weil nur<br />

dadurch ausreichend korrelierte Stimuli erzeugt werden können. Zwei koinzidente Supernieren<br />

haben bei einem Öffungswinkel von 100 ◦ bereits einen DFI-Prädiktor von<br />

0.09.<br />

Die simulierten Mikrofonanordnungen für <strong>die</strong>se Untersuchung sind in Abbildung 5.3.1<br />

zu sehen.<br />

A r φ DFI-Prädiktor<br />

0.5 0.1m 45 ◦ 0.4525<br />

0.5 0.07m 45 ◦ 0.4977<br />

0.5 0.06m 45 ◦ 0.5124<br />

0.5 0.05m Ref 45 ◦ 0.5262<br />

0.5 0.04m 45 ◦ 0.5384<br />

0.5 0.03m 45 ◦ 0.5485<br />

0.5 0.02m 45 ◦ 0.5562<br />

0.5 0.01m 45 ◦ 0.5609<br />

0.5 0m 45 ◦ 0.5609<br />

A r φ DFI-Prädiktor<br />

0.5 0.18m 45 ◦ 0.3618<br />

0.5 0.17m 45 ◦ 0.3706<br />

0.5 0.16m 45 ◦ 0.3799<br />

0.5 0.15m Ref 45 ◦ 0.3899<br />

0.5 0.14m 45 ◦ 0.4008<br />

0.5 0.13m 45 ◦ 0.4124<br />

0.5 0.12m 45 ◦ 0.4249<br />

0.5 0.11m 45 ◦ 0.4383<br />

0.5 0.1m 45 ◦ 0.4525<br />

Abbildung 5.3.1: Die Tabellen zeigen <strong>die</strong> verwendeten Stimuli für <strong>die</strong> Untersuchung <strong>der</strong><br />

Äquivalenzverfahren.<br />

Der Wertebereich des DFI-Prädiktor ist bei den Äquivalenzverfahren noch kleiner als<br />

bei den L<strong>auf</strong>zeitverfahren. Die Ergebnisse des Hörversuchs in Abbildung 5.3.2 und 5.3.3<br />

spiegeln <strong>die</strong>s wie<strong>der</strong>.<br />

Im rechten Plot in Abbildung 5.3.2 sieht man, dass <strong>die</strong> Stimuli sehr konzentriert in<br />

einem Bereich liegen. Der Grund dafür ist <strong>der</strong> bereits erwähnte kleine Wertebereich<br />

des DFI-Prädiktor. Die richtige Tendenz ist zwar zu erkennen, <strong>die</strong> Unterschiede sind<br />

aber lange nicht so deutlich wie in <strong>der</strong> Untersuchung zu den l<strong>auf</strong>zeitbasierten Verfahren.<br />

Der linke Plot in Abbildung 5.3.2 zeigt ebenfalls nur eine schwache Tendenz.<br />

In den Ergebnissen <strong>der</strong> an<strong>der</strong>en Achtergruppe von Stimuli in Abbildung 5.3.3 ist ebenfalls<br />

nur eine schwache Tendenz erkennbar. Die Äquivalenzverfahren scheinen nicht so<br />

Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer 39


5 Vorversuche<br />

Äquivalenzversuch mit r=0,1m - r=0,18m<br />

Äquivalenzversuch mit r=0,1m - r=0,18m<br />

1,5<br />

Mittelwert mit 95% Konfidenzintervallen<br />

1,5<br />

Mittelwert mit 95% Konfidenzintervallen<br />

1<br />

1<br />

0,5<br />

0,5<br />

Bewertung<br />

0<br />

0 0,02 0,04 0,06 0,08 0,1 0,12 0,14 0,16 0,18 0,2<br />

-0,5<br />

-1<br />

-1,5<br />

-2<br />

-2,5<br />

Bewertung<br />

0<br />

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1<br />

-0,5<br />

-1<br />

-1,5<br />

-2<br />

-2,5<br />

-3<br />

Mikrofonabstand r in [m]<br />

-3<br />

DFI-Prädiktor<br />

Abbildung 5.3.2: Ergebnisse des Hörversuchs mit den Stimuli aus <strong>der</strong> rechten Tabelle<br />

in Abbildung 5.3.1. Die Referenz für <strong>die</strong>se Untersuchung war: A=0.5,<br />

r=0.15, DFI-Prädiktor=0.3899<br />

Äquivalenzversuch mit r=0m - r=0,1m<br />

Äquivalenzversuch mit r=0m - r=0,1m<br />

2,5<br />

Mittelwert mit 95% Konfidenzintervallen<br />

2,5<br />

Mittelwert mit 95% Konfidenzintervallen<br />

2<br />

2<br />

1,5<br />

1,5<br />

1<br />

1<br />

Bewertung<br />

0,5<br />

0<br />

0 0,02 0,04 0,06 0,08 0,1 0,12<br />

-0,5<br />

Bewertung<br />

0,5<br />

0<br />

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1<br />

-0,5<br />

-1<br />

-1<br />

-1,5<br />

-1,5<br />

-2<br />

-2<br />

-2,5<br />

Mikrofonabstand r in [m]<br />

-2,5<br />

DFI-Prädiktor<br />

Abbildung 5.3.3: Ergebnisse des Hörversuchs mit den Stimuli aus <strong>der</strong> rechten Tabelle<br />

in Abbildung 5.3.1. Die Referenz für <strong>die</strong>se Untersuchung war: A=0.5,<br />

r=0.05, DFI-Prädiktor=0.5262<br />

unterschiedlich in ihrer <strong>Diffusfeldkorrelation</strong> zu sein, wenn <strong>der</strong> Abstand nur leicht verän<strong>der</strong>t<br />

wird. Die Unterschiede in <strong>der</strong> wahrgenommenen Breite sind nicht so deutlich<br />

zu erkennen wie bei den an<strong>der</strong>en Versuchen.<br />

5.4 Untersuchung <strong>der</strong> gemischten Stimuli<br />

Es wurden erneut zwei Achtergruppen an Stimuli untersucht. Diese wurden aus den<br />

Ergebnissen <strong>der</strong> drei bisherigen Vorversuche ausgewählt. Dadurch wurden in <strong>die</strong>sem<br />

Versuch erstmals alle drei Mikrofonierungsarten vereint.<br />

Anhand <strong>die</strong>ses kombinierten Versuches wurden <strong>die</strong> Stimuli für den eigentlichen Hörver-<br />

40 Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer


5.4 Untersuchung <strong>der</strong> gemischten Stimuli<br />

such ausgewählt (s. Kapitel 6). Da sich in den Versuchen zu den äquivalenten Stimuli<br />

gezeigt hat, dass <strong>der</strong> Wertebereich für den DFI-Prädiktor zu klein ist, wurde <strong>der</strong> Öffnungswinkel<br />

<strong>der</strong> Stimuli in <strong>die</strong>sem Versuch <strong>auf</strong> 60 ◦ verkleinert.<br />

Außerdem wurde für <strong>die</strong> beiden Achtergruppen <strong>die</strong>selbe Referenz verwendet. Die Stimuli,<br />

<strong>die</strong> in <strong>die</strong>sem Versuch verwendet wurden, sind in <strong>der</strong> Tabelle in Abbildung 5.4.1<br />

zu sehen.<br />

A r φ DFI-Prädiktor<br />

0.15 0m 45 ◦ 0.073<br />

0.4 0m 45 ◦ 0.3265<br />

0.5 Ref 0 45 ◦ 0.5625<br />

0.6 0m 45 ◦ 0.7586<br />

0.7 0m 45 ◦ 0.8879<br />

1 0m 45 ◦ 1<br />

1 2m 0 ◦ 0.0449<br />

1 1m 0 ◦ 0.1701<br />

1 0.5m 0 ◦ 0.3392<br />

...Fortsetzung <strong>der</strong> Tabelle<br />

1 0.2m 0 ◦ 0.5845<br />

1 0.1m 0 ◦ 0.7725<br />

1 0.02m 0 ◦ 0.9859<br />

0.5 1m 30 ◦ 0.1421<br />

0.5 0.5m 30 ◦ 0.2738<br />

0.5 0.2m 30 ◦ 0.4631<br />

0.5 0.1m 30 ◦ 0.6086<br />

0.5 0.02m 30 ◦ 0.7564<br />

Abbildung 5.4.1: Die Tabelle zeigt <strong>die</strong> verwendeten Stimuli für den kombinierten<br />

Hörversuch.<br />

Als Referenz wurde eine Mikrofonanordnung mit einem DFI-Prädiktor von 0.56 gewählt.<br />

Dieser Wert liegt fast genau in <strong>der</strong> Mitte und alle an<strong>der</strong>en Stimuli sollten sich<br />

im besten Fall um <strong>die</strong>se Referenz verteilen. Bei <strong>der</strong> Auswahl <strong>der</strong> Stimuli wurde versucht<br />

eine möglichst gleiche Verteilung des DFI-Prädiktor zu bekommen. Außerdem wurden<br />

Stimuli unterschiedlicher Mikrofonanordnungen aber mit ähnlichem DFI-Prädiktor ausgewählt.<br />

Dadurch konnte überprüft werden, ob <strong>der</strong> DFI-Prädiktor unabhängig von <strong>der</strong><br />

Mikrofonanordnung eine Aussage über <strong>die</strong> wahrgenommene Breite treffen kann.<br />

Die Ergebnisse in Abbildung 5.4.2 zeigen, dass <strong>der</strong> DFI-Prädiktor bereits eine relativ<br />

gute Aussage darüber treffen kann, wie breit <strong>der</strong> Diffusanteil einer Mikrofonanordnung<br />

wahrgenommen wird.<br />

Die Kurve für <strong>die</strong> koinzidenten Verfahren verläuft ziemlich linear. Die Referenz wurde<br />

in allen vier Durchgängen sicher erkannt. Bei den L<strong>auf</strong>zeitstimuli erkennt man einen<br />

Sättigungsbereich. Zwischen den Stimuli mit dem DFI-Prädiktor 0.0449, 0.1701 und<br />

0.3392 wurden keine Unterschiede gehört. Ein AB mit 2m Abstand wirkt nach <strong>die</strong>sen<br />

Ergebnissen genauso breit wie ein AB mit 1m Abstand.<br />

Interessant ist, dass <strong>der</strong> L<strong>auf</strong>zeitstimulus mit dem DFI-Prädiktor 0,5845 genauso breit<br />

wie <strong>die</strong> Referenz wahrgenommen wird. Die restlichen L<strong>auf</strong>zeitstimuli, <strong>die</strong> einen ähnli-<br />

Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer 41


5 Vorversuche<br />

Kombinierter Versuch<br />

L<strong>auf</strong>zeit mit 95% Konfint Koinzidenz mit 95% Konfint Äquivalenz mit 95% Konfint<br />

2,5<br />

2<br />

Bewertung (Mittelwert)<br />

1,5<br />

1<br />

0,5<br />

0<br />

-0,5<br />

-1<br />

-1,5<br />

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1<br />

-2<br />

-2,5<br />

DFI-Prädiktor<br />

Abbildung 5.4.2: Ergebnise des Hörversuchs mit den Stimuli aus <strong>der</strong> Tabelle in Abbildung<br />

5.4.1. Die Referenz für den kombinierten Hörversuch war eine<br />

XY-Anordnung: A=0.5, r=0, φ=45 ◦ , DFI-Prädiktor=0.5625<br />

chen DFI-Prädiktor haben wie <strong>die</strong> koinzidenten und <strong>die</strong> äquivalenten Stimuli, liegen<br />

alle relativ nah beieinan<strong>der</strong>. Dies zeigt erneut, dass <strong>der</strong> DFI-Prädiktor bereits jetzt eine<br />

Aussage über <strong>die</strong> wahrgenommene Breite verschiedener Mikrofonanordnungen treffen<br />

kann.<br />

Der Stimuli aus <strong>der</strong> Äquivalenzreihe mit dem DFI-Prädiktor 0.6086 wird breiter wahrgenommen<br />

als <strong>die</strong> Referenz. Dies zeigt, dass <strong>der</strong> DFI-Prädiktor noch nicht ganz ausgereift<br />

ist. Der besagte Stimulus sollte eigentlich enger wahrgenommen werden als <strong>die</strong><br />

Referenz, da er einen größeren DFI-Prädiktor hat.<br />

Ein Nachteil <strong>die</strong>ser Untersuchung ist <strong>die</strong> grobe Auflösung. Eine robustere Kurve ergäbe<br />

sich mit feiner abgestuften Werten für den DFI-Prädiktor. Dadurch würde man<br />

allerdings <strong>die</strong> Anzahl <strong>der</strong> Stimuli zu stark erhöhen und das Bewerten <strong>der</strong> Stimuli untereinan<strong>der</strong><br />

wäre zu umfangreich und zu kompliziert.<br />

Als Vergleich zum DFI-Prädiktor sind in Abbildung 5.4.3 <strong>die</strong> gleichen Bewertungen<br />

42 Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer


5.4 Untersuchung <strong>der</strong> gemischten Stimuli<br />

2,5<br />

Kombinierter Versuch<br />

L<strong>auf</strong>zeitstimuli Äquivalenzstimuli Koinzidenzstimuli<br />

2,5<br />

Kombinierter Versuch<br />

L<strong>auf</strong>zeitstimuli Koinzidenzstimuli Äquivalenzstimuli<br />

2<br />

2<br />

Bewertung (Mittelwert)<br />

1,5<br />

1<br />

0,5<br />

0<br />

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1<br />

-0,5<br />

-1<br />

-1,5<br />

-2<br />

Bewertung (Mittelwert)<br />

1,5<br />

1<br />

0,5<br />

0<br />

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1<br />

-0,5<br />

-1<br />

-1,5<br />

-2<br />

-2,5<br />

Kohärenzgrad k (mit weißem Rauschen bestimmt)<br />

-2,5<br />

Kohärenzgrad k (mit rosa Rauschen bestimmt)<br />

Abbildung 5.4.3: Der Kohärenzgrad nimmt, je nachdem wie <strong>die</strong> Leistungsverteilung des<br />

Rauschens ist, unterschiedliche Werte an. Man beachte den gleichen<br />

Verl<strong>auf</strong> bei den koinzidenten Stimuli.<br />

<strong>der</strong> Stimuli über den Kohärenzgrad k geplottet. Der Kohärenzgrad k wurde dabei aus<br />

den beiden Rauschsignalen bestimmt, <strong>die</strong> zur Dekorrelation <strong>der</strong> Impulsantwort benutzt<br />

wurden. Dazu wurde als Ausgangsrauschen einmal rosa Rauschen und einmal<br />

weißes Rauschen verwendet. Die Unterschiede im Kohärenzgrad sind ziemlich groß und<br />

beschränken sich <strong>auf</strong> <strong>die</strong> Stimuli, <strong>die</strong> <strong>auf</strong> räumlich getrennten Mikrofonen beruhen.<br />

Die Unterschiede im Kohärenzgrad bei den koinzidenten Stimuli sind gering, da <strong>die</strong><br />

Korrelation koinzidenter Anordnungen für alle Frequenzen gleich ist. Bei koinzidenten<br />

Verfahren ist es daher nicht entscheidend wie ein Raum angeregt wird. Daraus folgt<br />

weiterhin, dass <strong>die</strong> spektrale Leistungsverteilung des Diffusfeldes bei koninzidenten Mikrofonanordnungen<br />

keine <strong>Auswirkung</strong> <strong>auf</strong> den Kohärenzgrad hat. Aus Abbildung 5.4.3<br />

kann man zwei bereits erwähnte Schlussfolgerungen bestätigen.<br />

1. Der Kohärenzgrad ist für <strong>die</strong> Beschreibung <strong>der</strong> Korrelation von räumlich getrennten<br />

Mikrofonen nicht geeignet. Ein neuer Wert ist durchaus sinnvoll und<br />

<strong>der</strong> DFI-Prädiktor ist ein erster Schritt in <strong>die</strong>se Richtung.<br />

2. Für koinzidente Mikrofonanordnungen kann <strong>der</strong> Kohärenzgrad zur Beurteilung<br />

<strong>der</strong> Kanalkorrelation verwendet werden.<br />

Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer 43


6 Hörversuch<br />

6 Hörversuch<br />

Der Hörversuch soll im besten Fall <strong>die</strong> Ergebnisse aus dem kombinierten Vorversuch<br />

bestätigen. Mit <strong>der</strong> Software, <strong>die</strong> in den Vorversuchen benutzt wurde, konnten nur<br />

acht Stimuli gleichzeitig bewertet werden. Um eine verbesserte Vergleichbarkeit <strong>der</strong><br />

verschiedenen Mikrofonanordnungen zu erhalten, müssten alle Stimuli in einem einzigen<br />

Hörversuch bewertet werden. Vor allem <strong>die</strong> Bewertung <strong>der</strong> Stimuli untereinan<strong>der</strong><br />

würde dadurch vereinfacht werden und außerdem robustere Ergebnisse liefern. Deshalb<br />

wurde vom Autor eine eigene Versuchssoftware in Matlab programmiert (s. Abbildung<br />

6.1). Die Software ist an einen Mushratest angelehnt und ermöglicht <strong>die</strong> gleichzeitige<br />

Bewertung von 17 Stimuli.<br />

Abbildung 6.1: Die Mushra-Software für den Hörtest wurde extra in Matlab<br />

programmiert.<br />

Die Bewertungsskala wurde direkt für <strong>die</strong>se Untersuchung angepasst. Der Wertebereich<br />

<strong>der</strong> Skala wurde <strong>auf</strong> 4 bis -4 erweitert, um <strong>die</strong> Bewertung <strong>der</strong> Stimuli untereinan<strong>der</strong><br />

zu vereinfachen. Außerdem ist das zu beurteilende Attribut direkt an <strong>der</strong> Skala <strong>auf</strong>getragen.<br />

Es wurde eine Shuffle-Funktion integriert, <strong>die</strong> <strong>die</strong> Stimuli in einer unbekannten<br />

Reihenfolge anordnet.<br />

Somit ist <strong>die</strong> Software auch für Selbstversuche geeignet. Die Testpersonen können ihre<br />

Ergebnisse selbst unter ihrem Namen abspeichern. Vor dem Speichern <strong>der</strong> Ergebnisse<br />

wird überprüft, ob alle Stimuli bewertet wurden. Die Software erzeugt dann eine Excel-<br />

44 Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer


Tabelle, in <strong>der</strong> alle Stimuli mit <strong>der</strong> zugehörigen Bewertung enthalten sind. Dadurch ist<br />

jede Testperson in <strong>der</strong> Lage den Hörversuch eigenständig durchzuführen.<br />

Das trockene Signal, das den Stimuli in <strong>die</strong>sem Hörversuch zugrunde liegt, war wie in<br />

den Vorversuchen <strong>die</strong> trockene Sprach<strong>auf</strong>nahme. Da <strong>der</strong> Hörversuch zur Verifizierung<br />

<strong>der</strong> Ergebnisse des kombinierten Hörversuchs <strong>die</strong>nen soll, werden fast <strong>die</strong>selben Stimuli<br />

verwendet. Einzig bei den L<strong>auf</strong>zeitstimuli wird ein Stimulus ausgetauscht. In dem<br />

kombinierten Vorversuch hat sich gezeigt, dass <strong>die</strong> drei Stimuli mit r = 2m, r = 1m<br />

und r = 0.5m alle gleich breit wahrgenommen werden. Deshalb wurde <strong>der</strong> Stimulus<br />

mit r=2m durch einen Stimulus mit r = 0.35m ersetzt. Die verwendeten Stimuli des<br />

Hörversuchs sind in Abbildung 6.2 zu sehen.<br />

A r in [m] φ DFI-Prädiktor<br />

0.15 0 45 ◦ 0.073<br />

0.4 0 45 ◦ 0.3265<br />

0.5 Ref 0 45 ◦ 0.5625<br />

0.6 0 45 ◦ 0.7586<br />

0.7 0 45 ◦ 0.8879<br />

1 0 45 ◦ 1<br />

1 1 0 ◦ 0.0449<br />

1 0.5 0 ◦ 0.1701<br />

1 0.35 0 ◦ 0.4331<br />

...Fortsetzung <strong>der</strong> Tabelle<br />

1 0.2 0 ◦ 0.5845<br />

1 0.1 0 ◦ 0.7725<br />

1 0.02 0 ◦ 0.9859<br />

0.5 1 30 ◦ 0.1421<br />

0.5 0.5 30 ◦ 0.2738<br />

0.5 0.2 30 ◦ 0.4631<br />

0.5 0.1 30 ◦ 0.6086<br />

0.5 0.02 30 ◦ 0.7564<br />

Abbildung 6.2: Die Tabelle zeigt <strong>die</strong> verwendeten Stimuli für den Hörversuch.<br />

Insgesamt haben 6 Probanden am Hörversuch teilgenommen. Die Ergebnisse des Hörversuchs<br />

sind in Abbildung 6.3 zu sehen und entsprechen denen aus dem kombinierten<br />

Vorversuch (s. Kapitel 5.4). Die Referenz wurde von allen Probanden sicher erkannt und<br />

<strong>die</strong> Tendenzen zeigen, dass <strong>der</strong> DFI-Prädiktor <strong>die</strong> Ergebnisse aus den Vorversuchen bestätigt.<br />

Die wahrgenommene Breite eines Stimulus lässt sich mit dem DFI-Prädiktor beschreiben.<br />

Es bleibt allerdings <strong>die</strong> Diskrepanz zwischen koinzidenten und l<strong>auf</strong>zeitbasierten<br />

Mikrofonanordnungen bestehen. Die l<strong>auf</strong>zeitbasierten Stimuli, <strong>die</strong> einen ähnlichen<br />

DIF P redictor haben wie <strong>die</strong> koinzidenten, werden generell breiter wahrgenommen. Dieser<br />

Sachverhalt bedarf weiterer Untersuchungen, da <strong>die</strong> Definition des DFI-Prädiktor<br />

noch nicht ausgereift ist.<br />

Nach den Aussagen mancher Probanden war <strong>die</strong> Bewertung <strong>der</strong> Stimuli untereinan<strong>der</strong><br />

schwierig. Das Hören gegen <strong>die</strong> Referenz fiel fast allen Probanden deutlich leichter. Um<br />

eine präzisere Aussage über den DFI-Prädiktor zu erhalten, müssten eigentlich noch<br />

Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer 45


6 Hörversuch<br />

Breit<br />

4<br />

Ergebnisse des Hörversuchs<br />

Koinzidenz L<strong>auf</strong>zeit Äquivalenz MW mit Konfint<br />

3<br />

0cm/45°<br />

100cm/30°<br />

100cm<br />

50cm<br />

35cm<br />

2<br />

50cm/30°<br />

20cm/30°<br />

20cm<br />

Bewertung<br />

1<br />

0<br />

-1<br />

-2<br />

0cm/45°<br />

10cm/30°<br />

0cm/45°<br />

10cm<br />

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7<br />

2cm/30°<br />

0,8 0,9 1<br />

0cm/45°<br />

0cm/45°<br />

-3<br />

2cm<br />

Eng<br />

-4<br />

DFI-Prädiktor<br />

0cm/45°<br />

Abbildung 6.3: Die Ergebnisse des Hörversuchs decken sich ziemlich genau mit den <strong>der</strong><br />

Vorversuche<br />

mehr Stimuli untereinan<strong>der</strong> bewertet werden. Bei den koinzidenten Stimuli fehlen beispielsweise<br />

Werte für den DFI-Prädiktor im Bereich 0 - 0.3. Der genaue Kurvenverl<strong>auf</strong><br />

ist in <strong>die</strong>sem Bereich momentan noch nicht bekannt.<br />

Da <strong>die</strong> Bewertung vieler Stimuli untereinan<strong>der</strong> schwierig erscheint, ist <strong>die</strong> Wie<strong>der</strong>holung<br />

mehrerer Tests mit unterschiedlichen Stimuli wahrscheinlich nicht zu vermeiden.<br />

Die Präzisierung des DFI-Prädiktor ist allerdings nicht Bestandteil <strong>die</strong>ser Arbeit. Diese<br />

erste Untersuchung zeigt, dass <strong>der</strong> DFI-Prädiktor bereits jetzt eine relativ konkrete<br />

Aussage über <strong>die</strong> Gemeinsamkeiten <strong>der</strong> <strong>Diffusfeldkorrelation</strong> beliebiger stereofoner Mikrofonanordnungen<br />

geben kann. Es scheint dadurch möglich zu sein, <strong>die</strong> Breite des<br />

Klangbildes einer beliebigen stereofonen Mikrofonanordnungen vorauszusagen. Für eine<br />

präzise Aussage ist <strong>der</strong> DFI-Prädiktor allerdings noch zu ungenau. Es müssten<br />

außerdem noch weitere Hörversuche in Bezug <strong>auf</strong> Klangfarbe und an<strong>der</strong>e Attribute<br />

durchgeführt werden.<br />

Zur Veranschaulichung sind in Abblidung 6.4 <strong>die</strong> Ergebnisse des Hörversuchs noch<br />

einmal über den Kohärenzgrad k geplottet.<br />

46 Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer


Ergebnisse des Hörversuchs<br />

Ergebnisse des Hörversuchs<br />

4<br />

Koinzidenz L<strong>auf</strong>zeit Äquivalenz<br />

4<br />

Koinzidenz L<strong>auf</strong>zeit Äquivalenz<br />

3<br />

3<br />

Bewertung (Mittelwert)<br />

2<br />

1<br />

0<br />

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1<br />

-1<br />

-2<br />

Bewertung (Mittelwert)<br />

2<br />

1<br />

0<br />

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1<br />

-1<br />

-2<br />

-3<br />

-3<br />

-4<br />

Kohärenzgrad k (mit weißem Rauschen bestimmt)<br />

-4<br />

Kohärenzgrad k (mit rosa Rauschen bestimmt)<br />

Abbildung 6.4: Die Ergebnisse des Hörversuchs sind hier noch einmal über den Kohärenzgrad<br />

k <strong>auf</strong>getragen.<br />

Abbildung 6.4 verdeutlicht, wie unterschiedlich <strong>die</strong> Aussagen des Kohärenzgrads k sein<br />

können. Deshalb ist es notwendig <strong>die</strong> Diffusfelskorrelation einer Mikrofonanordnung<br />

mit einem an<strong>der</strong>en Wert zu beschreiben. In <strong>die</strong>sem Hörversuch hat sich gezeigt, dass<br />

<strong>der</strong> DFI-Prädiktor prinzipiell in <strong>der</strong> Lage ist <strong>die</strong>s zu tun. Darüber hinaus ist es vielleicht<br />

sogar möglich eine Voraussage über <strong>die</strong> wahrgenommene Breite einer Aufnahme mit<br />

einer beliebigen stereofonen Mikrofonanordnung zu geben.<br />

Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer 47


7 Fazit<br />

7 Fazit<br />

Im L<strong>auf</strong>e <strong>der</strong> Untersuchung hat sich gezeigt, dass we<strong>der</strong> <strong>der</strong> Korrelationsgrad noch <strong>der</strong><br />

Kohärenzgrad geeignet ist, um <strong>die</strong> Korrelation von räumlich getrennten Mikrofonen<br />

zu beurteilen. Der Grund dafür ist, dass <strong>der</strong> Korrelationsgrad sowie <strong>der</strong> Kohärenzgrad<br />

keine Aussage über <strong>die</strong> Frequenzabhängigkeit <strong>der</strong> Korrelationsfunktion beinhaltet. Deshalb<br />

sind <strong>die</strong> Ergebnisse aus Untersuchungen, <strong>die</strong> den Korrelationsgrad o<strong>der</strong> den Kohärenzgrad<br />

zur Beurteilung <strong>der</strong> Korrelation räumlich getrennter Mikrofone benutzen,<br />

kritisch zu betrachten.<br />

Fakt ist, dass ein neuer Wert zur Beschreibung <strong>der</strong> Korrelation räumlich getrennter Mikrofone<br />

sinnvoll ist. Der DFI-Prädiktor ist ein erster Schritt in <strong>die</strong>se Richtung. In den<br />

Untersuchungen hat sich gezeigt, dass <strong>der</strong> DFI-Prädiktor bereits einen guten Zusammenhang<br />

zwischen einer rechnerischen Zahl und einem perzeptiven Attribut herstellen<br />

kann. Die Definition des DFI-Prädiktor ist selbstverständlich noch nicht ausgereift und<br />

bedarf weiterer Untersuchungen. Fest steht <strong>auf</strong> jeden Fall, dass <strong>die</strong> Kohärenzfunktion<br />

als Grundlage für <strong>die</strong> Beurteilung <strong>der</strong> tatsächlichen Korrelation von zwei räumlich<br />

getrennten Mikrofonen herangezogen werden sollte.<br />

In <strong>die</strong>ser Arbeit ist <strong>auf</strong>gezeigt worden, dass <strong>der</strong> DFI-Prädiktor <strong>die</strong> wahrgenommene<br />

Breite eines simulierten Diffusanteils einer stereofonen Mikrofonanordnung gut voraussagen<br />

kann. In <strong>der</strong> persönlichen Kommunikation mit den Probanden des Hörversuches<br />

erwähnten alle, dass sie <strong>die</strong> breiteren Stimuli als angenehmer empfinden. Daraus folgt,<br />

dass <strong>der</strong> DFI-Prädiktor durchaus als qualitative Größe angesehen werden kann. Die<br />

genauen <strong>Auswirkung</strong>en des DFI-Prädiktor <strong>auf</strong> <strong>die</strong> Klangfarbe o<strong>der</strong> an<strong>der</strong>e Qualitätsmerkmale<br />

müssen allerdings noch genauer untersucht werden. Es scheint sich zu bestätigen,<br />

dass eine Dekorrelation des Diffusschalls für eine breite Abbildung notwendig<br />

ist.<br />

Um <strong>die</strong> Bedeutung des DFI-Prädiktor zu bestätigen, sollte auch <strong>der</strong> Direktanteil in<br />

zukünftige Hörversuche mit einbezogen werden. Somit könnte geklärt werden, ob ein<br />

kleiner DFI-Prädiktor immer noch zu einer breiten Abbildung führt, wenn ein korrelierter<br />

Direktanteil vorhanden ist. Aus den Ergebnisen des Hörversuchs erkennt man,<br />

dass <strong>der</strong> Kurvenverl<strong>auf</strong> des DFI-Prädiktor für <strong>die</strong> l<strong>auf</strong>zeitbasierten Verfahren von den<br />

koinzidenten Verfahren abweicht.<br />

Die Definition des DFI-Prädiktor sollte im Optimalfall für jedes Verfahren einen ähnlichen<br />

Kurvenverl<strong>auf</strong> angeben. Mit den Ergebnissen des Höversuchs kann <strong>der</strong> DFI-<br />

Prädiktor entsprechend angepasst werden. Somit wird eine bessere Voraussage über<br />

48 Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer


<strong>die</strong> wahrgenommene Breite einer beliebigen Mikrofonanordnung möglich.<br />

Die Simulation eines Diffusfeldes über unterschiedlich gemischte Rauschsignale in Matlab<br />

liefert brauchbare Ergebnisse. Dies lässt sich vor allem dadurch begründen, dass<br />

innerhalb <strong>der</strong> Simulation ähnliche Kohärenzgrade gemessen werden wie in an<strong>der</strong>en<br />

Untersuchungen im realen Schallfeld. Trotzdem könnte <strong>die</strong> Simulation noch verbessert<br />

werden, wenn drei komplett inkohärente Rauschsignale vorhanden wären. Dadurch<br />

könnten Effekte ausgeschlossen werden, <strong>die</strong> eventuell durch <strong>die</strong> Teilkohärenz entstehen<br />

und momentan noch nicht berücksichtigt werden. Die Präzision <strong>der</strong> gewünschten Kohärenzfunktion<br />

des Rauschens zur Dekorrelation würde dadurch ebenfalls gesteigert.<br />

Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer 49


Literatur<br />

Literatur<br />

[1] Wittek, H.: Untersuchungen zur Richtungsabbildung mit LCR Hauptmikrofonen.<br />

In: Diplomarbeit, Fachhochschule Düsseldorf (2000)<br />

[2] Theile, G.: Multichannel natural music recording based on psychoacoustic principles.<br />

In: AES 19 th International Conference, 2001<br />

[3] Griesinger, D.: The psychoacoustics of apparent source width, spaciousness and<br />

envelopment in performance spaces. In: Acustica 83 (1997), Nr. 4, S. 721–731<br />

[4] Griesinger, D.: The psychoacoustics of listening area, depth, and envelopment<br />

in surround recordings, and their relationship to microphone technique. In: AES<br />

19th Intern. Conference, 2001, S. 182–200<br />

[5] Wittek, H.: The Image Assistant 2.1“ is an interactive JAVA Applet that calculates<br />

the localization curves of arbitrary 2- and 3-channel stereo microphone<br />

”<br />

configurations. www.hauptmikrofon.de, 2008<br />

[6] Chernyak, RI ; Dubrovsky, NA: Pattern of the noise images and the binaural<br />

summation of loudness for the different interaural correlation of noise. In: Proc.<br />

6th Int. Congr. on Acoustics Tokyo 1 (1968), S. 3–12<br />

[7] Griesinger, D.: Spatial impression and envelopment in small rooms. In:<br />

PREPRINTS-AUDIO ENGINEERING SOCIETY (1997)<br />

[8] Wittek, H.: Personal Communication. 2010<br />

[9] Elko, G.W.: 4 Spatial Coherence Functions for Differential Microphones in Isotropic<br />

Noise Fields. In: Microphone arrays: signal processing techniques and applications<br />

(2001), S. 61<br />

[10] Weinzierl, S.: Handbuch <strong>der</strong> Audiotechnik. Springer Verlag, 2008<br />

[11] Blauert, J.: Spatial hearing. MIT press Cambridge, Mass., 1997<br />

[12] Griesinger, D.: General overview of spatial impression, envelopment, localization,<br />

and externalization. In: Proceedings of the 15th International Audio Engineering<br />

Society Conference, Copenhagen, Denmark Citeseer, 1998, S. 136–149<br />

[13] Damaske, P.: Subjektive untersuchung von schallfel<strong>der</strong>n. In: Acustica 19 (1967),<br />

Nr. 199, S. 68<br />

50 Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer


Literatur<br />

[14] Neumann, O. ; Schäffler, M.: Optimierung <strong>der</strong> Raummikrofonanordnung bei<br />

Mehrkanal-Musik<strong>auf</strong>nahmen im 3/2-Stereo Format, Diplomarbeit, FH Stuttgart,<br />

März 2001. Auch veröffentlicht unter: http://www. raummikrofon. de, Diss.<br />

[15] Griesinger, D.: Speaker placement, externalization, and envelopment in home<br />

listening rooms. In: PREPRINTS-AUDIO ENGINEERING SOCIETY (1998)<br />

[16] Drews, M.: Mikrofonarrays und mehrkanalige Signalverarbeitung zur Verbesserung<br />

gestörter Sprache. In: Technische Universität Berlin, Germany, Diss (1999)<br />

[17] Görne, T.: Tontechnik. Hanser Verlag, 2008<br />

[18] Wittek, H. ; Haut, C. ; Keinath, D.: Doppel-MS eine Surround-<br />

Aufnahmetechnik unter <strong>der</strong> Lupe.<br />

[19] Ohm, J.R. ; Lüke, H.D.: Signalübertragung. Springer, 2005<br />

[20] Schüssler, H.W.: Digitale Signalverarbeitung:[Bd.] 1. Analyse diskreter Signale<br />

und Systeme. Springer, 1994<br />

[21] Bendat, JS ; Piersol, AG: Engineering applications of correlation and spectral<br />

analysis. (1980)<br />

[22] Welch, P.: The use of fast Fourier transform for the estimation of power spectra:<br />

a method based on time averaging over short, modified periodograms. In: IEEE<br />

Transactions on Audio and Electroacoustics 15 (1967), Nr. 2, S. 70–73<br />

[23] Kammeyer, K.D. ; Kroschel, K.: Digitale Signalverarbeitung. Teubner, 2006<br />

[24] Endress, C. ; Paul, P.: Die Umhüllungsempfindung bei ITU-Surround in Abhängigkeit<br />

von <strong>der</strong> Signalkorrelation. In: Diplomarbeit, Hochschule für angewandte<br />

Wissenschaften Hamburg (2009)<br />

[25] ABC/Hidden Reference Audio Comparison Tool“.<br />

”<br />

http://ff123.net/abchr/abchr.html, 6 May 2004<br />

Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer 51


Abbildungsverzeichnis<br />

Abbildungsverzeichnis<br />

2.1.1 Kopfbezogenes Koordinatensystem nach Blauert [11] . . . . . . . . . . 5<br />

2.2.1 Schematische Darstellung <strong>der</strong> Spatial Impression . . . . . . . . . . . . . 6<br />

3.1.1 Normierte Kreuzkorrelationsfunktion eines Sinus - und Kosinussignals . 15<br />

3.4.1 Quadrierte Kohärenzfunktion (MSC) von zwei Kugelmikrofonen im diffusen<br />

Schallfeld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20<br />

3.4.2 Nicht quadrierte Kohärenzfunktion von zwei Kugelmikrofonen im diffusen<br />

Schallfeld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21<br />

3.4.3 Signalflussplan des Models zur Kohärenzfunktion von Rauchssignalen . 22<br />

3.4.4 Die Einzelteile <strong>der</strong> Kohärenzfunktion eines Rauschsignals . . . . . . . . 23<br />

4.1 Erstellung eines Stimulus in Matlab . . . . . . . . . . . . . . . . . . . . 24<br />

4.2 Wichtungsfuntionen und Kohärenzfunktion einer XY-Anordnung . . . . 25<br />

4.3 Kohärenzfunktion des Dekorrelationsrauschens für eine XY-Anordnung 26<br />

4.4 Wichtungsfuntionen und Kohärenzfunktion einer AB-Anordnung . . . . 27<br />

4.5 Kohärenzfunktion des Dekorrelationsrauschens für eine AB-Anordnung 28<br />

4.1.1 Wichtungsfunktion für den DFI-Prädiktor . . . . . . . . . . . . . . . . 30<br />

4.1.2 Der Kohärenzgrad k für rosa - und weißes Rauschen . . . . . . . . . . . 31<br />

4.1.3 Kohärenzgrad k für verschiedene Abstände von Druckempfängern im<br />

Hallraum nach [13] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32<br />

5.1 ABC/Hidden Reference, Audio Comparison Tool . . . . . . . . . . . . 33<br />

5.1.1 Verwendete Stimuli im Koinzidensversuch . . . . . . . . . . . . . . . . 35<br />

5.1.2 Ergebnisse des Koinzidensversuchs I . . . . . . . . . . . . . . . . . . . . 36<br />

5.1.3 Ergebnisse des Koinzidensversuchs II . . . . . . . . . . . . . . . . . . . 36<br />

5.2.1 Verwendete Stimuli im L<strong>auf</strong>zeitversuch . . . . . . . . . . . . . . . . . . 37<br />

5.2.2 Ergebnisse des L<strong>auf</strong>zeitversuchs I . . . . . . . . . . . . . . . . . . . . . 38<br />

5.2.3 Ergebnisse des L<strong>auf</strong>zeitversuchs II . . . . . . . . . . . . . . . . . . . . . 38<br />

5.3.1 Verwendete Stimuli im Äquivalenzversuch . . . . . . . . . . . . . . . . 39<br />

5.3.2 Ergebnisse des Äquivalenzversuchs I . . . . . . . . . . . . . . . . . . . . 40<br />

5.3.3 Ergebnisse des Äquivalenzversuchs II . . . . . . . . . . . . . . . . . . . 40<br />

5.4.1 Verwendete Stimuli im kombinierten Versuch . . . . . . . . . . . . . . . 41<br />

5.4.2 Ergebnisse des kombinierten Versuchs . . . . . . . . . . . . . . . . . . . 42<br />

5.4.3 Ergebnisse des kombinierten Versuchs mit dem Kohärenzgrad k . . . . 43<br />

6.1 Mushra-Software in Matlab . . . . . . . . . . . . . . . . . . . . . . . . 44<br />

6.2 Verwendete Stimuli im Hörversuch . . . . . . . . . . . . . . . . . . . . 45<br />

6.3 Ergebnisse des Hörversuchs . . . . . . . . . . . . . . . . . . . . . . . . 46<br />

52 Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer


Abbildungsverzeichnis<br />

6.4 Ergebnisse des Hörversuchs mit dem Kohärenzgrad k . . . . . . . . . . 47<br />

Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer 53


Anhang<br />

Anhang<br />

A1 Matlabskript zur Orthogonalisierung von zwei Vektoren . 55<br />

54 Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer


A1 Matlabskript zur Orthogonalisierung von zwei Vektoren<br />

A1<br />

Matlabskript zur Orthogonalisierung von zwei Vektoren<br />

Dieses Matlabskript wurde freundlicherweise von Christof Faller zur Verfügung gestellt.<br />

Es orthogonalisiert zwei Vektoren nach <strong>der</strong> Gram-Schmidt-Methode. Da Rauschsignale<br />

in Matlab ebenfalls als Vektoren dargestellt werden, konnten mit Hilfe <strong>die</strong>ses Skripts<br />

zwei orthogonale Rauschsignale erzeugt werden.<br />

Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer 55


Anhang<br />

05.07.10 14:03 C:\Users\H.Riekehof\Documents\My Dropbox\B...\decor_filters.m 1 of 2<br />

%% ************************************************************************<br />

%%<br />

%%<br />

%% Make mult-channel de-correlation filters<br />

%%<br />

%% Version: $Id: decor_filters.m 326 2010-01-08 17:41:38Z cfaller $<br />

%%<br />

%% Copyright Illusonic LLC, 2009, Switzerland. All rights reserved.<br />

%% Illusonic proprietary and confidential.<br />

%% ************************************************************************<br />

function [n] = decor_filters(fs, Nseg, seg, nch)<br />

% parameters<br />

%<br />

% fs = sampling frequency [Hz]<br />

% Nseg = number of de-correlated segments<br />

% seg = segment length within which orthogonalization is applied [ms]<br />

% nch = number of channels<br />

% generate segmented noise<br />

nn = [];<br />

for ii = 1:Nseg,<br />

% generate noise<br />

%%%% Hans R.: Segementlänge wird jetzt in Samples und nicht in ms<br />

%%%% angegeben -------------------------------------------<br />

N = round(seg);<br />

%%%% -----------------------------------------------------<br />

%n = randn(N,nch);<br />

n = real(ifft(exp(1j*2*pi*rand(N,nch))));<br />

% make the channels orthogonal (Gram-Schmidt)<br />

for i = 1:nch,<br />

n(:,i) = n(:,i) ./ sqrt(sum(n(:,i).^2)); % make unit length<br />

for j = 1:(i-1),<br />

n(:,i) = n(:,i) - sum(n(:,i) .* n(:,j)).*n(:,j);<br />

n(:,i) = n(:,i) ./ sqrt(sum(n(:,i).^2)); % make unit length<br />

end<br />

end<br />

% concatenate segments<br />

nn = [nn; n];<br />

end<br />

n = nn;<br />

% apply window<br />

% w = 0:(N*Nseg-1);<br />

% w = w' ./ (N*Nseg-1) .* pi;<br />

% w = sin(w).^2;<br />

%<br />

56 Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer


A1 Matlabskript zur Orthogonalisierung von zwei Vektoren<br />

05.07.10 14:03 C:\Users\H.Riekehof\Documents\My Dropbox\B...\decor_filters.m 2 of 2<br />

% for i = 1:nch,<br />

% n(:,i) = n(:,i).*w;<br />

% end<br />

% make unit norm<br />

for i = 1:nch,<br />

n(:,i) = n(:,i) ./ sqrt(sum(n(:,i).^2));<br />

end<br />

return<br />

% test<br />

disp('L2 norms:');<br />

disp(sqrt(sum(n.^2)));<br />

disp('Cross-correlation indices:');<br />

k = 1;<br />

for i = 1:nch,<br />

for j = 1:(i-1),<br />

cc(1,k) = sum(n(:,i) .* n(:,j)) ./ sqrt(sum(n(:,i).^2)*sum(n(:,j).^2));<br />

k = k + 1;<br />

end<br />

end<br />

disp(cc);<br />

figure(10);<br />

plot(n)<br />

grid<br />

axis tight<br />

Haw-Hamburg Department Me<strong>die</strong>ntechnik | Hans Riekehof-Böhmer 57

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!