Doppel-MS – eine Surround- Aufnahmetechnik ... - Hauptmikrofon.de
Doppel-MS – eine Surround- Aufnahmetechnik ... - Hauptmikrofon.de
Doppel-MS – eine Surround- Aufnahmetechnik ... - Hauptmikrofon.de
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
<strong>Doppel</strong>-<strong>MS</strong> <strong>–</strong> <strong>eine</strong> <strong>Surround</strong>-<br />
<strong>Aufnahmetechnik</strong> unter <strong>de</strong>r Lupe<br />
Double M/S <strong>–</strong> a <strong>Surround</strong> recording<br />
technique put to test<br />
Helmut Wittek*,<br />
Christopher Haut **, Daniel Keinath ***<br />
* Schoeps Mikrofone GmbH, wittek@schoeps.<strong>de</strong><br />
** IHA, Fachhochschule Ol<strong>de</strong>nburg, christopher.haut@fh-ol<strong>de</strong>nburg.<strong>de</strong><br />
*** ETI, Musikhochschule Detmold, d_keinath@onlinehome.<strong>de</strong><br />
Abstract<br />
<strong>Doppel</strong>-<strong>MS</strong> ist <strong>eine</strong> <strong>Aufnahmetechnik</strong> für Zweikanal- als auch Mehrkanalstereofonie, die sich nicht<br />
zuletzt aufgrund ihrer rein praktischen Vorteile großer Beliebtheit erfreut.<br />
Aber was steckt tatsächlich hinter <strong>Doppel</strong>-<strong>MS</strong>?<br />
Nähere Betrachtungen in theoretischer und praktischer Richtung zeigen: <strong>Doppel</strong>-<strong>MS</strong> kann gute<br />
Ergebnisse in verschie<strong>de</strong>nen Anwendungen liefern, wenn gewisse Parameter bei <strong>de</strong>r Dematrizierung/Dekodierung<br />
beachtet wer<strong>de</strong>n. Vergleichsaufnahmen mit <strong>de</strong>n Referenzsystemen IRT-Kreuz<br />
und OCT <strong>Surround</strong> belegen, dass in verschie<strong>de</strong>nen Aufnahmesituationen <strong>eine</strong> optimale Dekodierung<br />
<strong>de</strong>r <strong>Doppel</strong>-<strong>MS</strong> Signale ähnlich bzw. genauso gute Ergebnisse liefert. Zu <strong>de</strong>n entschei<strong>de</strong>n<strong>de</strong>n<br />
Parametern zählen unter an<strong>de</strong>rem Crosstalkpegel und Lokalisation sowie die Korrelation <strong>de</strong>r<br />
Lautsprechersignale. Die Dekodierung lässt sich nur dann optimieren, wenn bei<strong>de</strong> Kanal-Paare<br />
L/R und LS/RS aus allen drei Mikrofonsignalen gewonnen wer<strong>de</strong>n - dies entspricht quasi <strong>eine</strong>m<br />
Mitten-Signal mit variabler Richtcharakteristik. Diese Möglichkeit macht die <strong>Doppel</strong>-<strong>MS</strong> <strong>Aufnahmetechnik</strong><br />
auch für Zweikanal-Aufnahme zu <strong>eine</strong>r interessanten Option.<br />
In Hörversuchen wur<strong>de</strong> <strong>de</strong>r maximale Crosstalkpegel ermittelt, ab <strong>de</strong>m negative Konsequenzen<br />
für Klang und Abbildung entstehen.<br />
Das <strong>Doppel</strong>-<strong>MS</strong> System stellt sich als System heraus, das jenseits s<strong>eine</strong>r traditionellen Anwendung<br />
für Dokumentation und Hörspiel s<strong>eine</strong> Berechtigung und s<strong>eine</strong> Anhänger hat.<br />
Abstract<br />
Double-M/S is a recording technique for two-channel as well as multichannel stereo. It has consi<strong>de</strong>rable<br />
practical advantages which justify its growing popularity.<br />
What is really behind Double M/S?<br />
Closer examination shows that it can provi<strong>de</strong> high-quality pickup not only of ambient sound but<br />
also of music, provi<strong>de</strong>d that certain criteria are consi<strong>de</strong>red in the <strong>de</strong>matrixing/<strong>de</strong>coding of the<br />
three microphone signals. Recordings ma<strong>de</strong> simultaneously with the "IRT Cross" and "OCT <strong>Surround</strong>"<br />
reference systems reveal that Double M/S can achieve comparable overall quality, given<br />
optimal <strong>de</strong>coding.<br />
The <strong>de</strong>cisive parameters for the quality of <strong>de</strong>coding are crosstalk level, localization, and the<br />
<strong>de</strong>gree of correlation among the loudspeaker signals. These characteristics can be optimized only<br />
if the L/R and LS/RS channel pairs are both obtained from all three of the microphone signals. In<br />
other words, the optimal <strong>de</strong>coding needs a variable M pattern generated through a mix of front-<br />
and rear-facing cardioids. This capability also makes Double M/S an interesting option for twochannel<br />
recording, similar to Ambisonics.<br />
Experiments have revealed the maximum allowable crosstalk level above which the sound color<br />
and sound image begin to be adversely affected.<br />
The Double M/S system turns out to be a system that is suitable for more than just the usual<br />
applications in documentary sound and radio drama.<br />
An English version of a paper on this topic will be available on www.schoeps.<strong>de</strong>.<br />
1
Glie<strong>de</strong>rung<br />
Glie<strong>de</strong>rung.......................................................................................................... 2<br />
Einleitung ........................................................................................................... 2<br />
1. Das <strong>MS</strong>-Prinzip.......................................................................................... 3<br />
2. Beschreibung <strong>de</strong>r <strong>Doppel</strong>-<strong>MS</strong> Anordnung ...................................................... 4<br />
2.1. Mikrofonanordnung................................................................................. 4<br />
2.2. Generierung von 2/0-Stereo und 3/2-Stereo-Signalen ................................ 5<br />
2.3. Verwandtschaft <strong>de</strong>s <strong>Doppel</strong>-<strong>MS</strong> Systems mit <strong>de</strong>r Ambisonics-<strong>Aufnahmetechnik</strong><br />
6<br />
3. Parameter zur theoretischen Analyse <strong>de</strong>r <strong>Doppel</strong>-<strong>MS</strong> Technik .......................... 8<br />
3.1. Richtungsabbildung (Lokalisation) ............................................................ 9<br />
3.2. Kohärenz / Korrelation ...........................................................................13<br />
3.3. Crosstalk..............................................................................................17<br />
4. Praktische Untersuchung anhand von verschie<strong>de</strong>nen Testaufnahmen ..............20<br />
4.1. Verschie<strong>de</strong>ne Varianten <strong>de</strong>r Dekodierung von <strong>Doppel</strong>-<strong>MS</strong> ...........................21<br />
4.2. Subjektive Erfahrungen mit <strong>Doppel</strong>-<strong>MS</strong> Aufnahmen ...................................24<br />
5. Werkzeuge zur Dekodierung von <strong>Doppel</strong>-<strong>MS</strong> ................................................25<br />
6. Danksagung.............................................................................................27<br />
7. Literatur ..................................................................................................27<br />
Anhang .............................................................................................................29<br />
Einleitung<br />
Die <strong>Doppel</strong>-<strong>MS</strong> <strong>Aufnahmetechnik</strong> erfreut sich einiger Beliebtheit und zählt zu <strong>de</strong>n etablierten<br />
<strong>Aufnahmetechnik</strong>en für bestimmte Anwendungen. Trotz<strong>de</strong>m ist über ihre Eigenschaften<br />
relativ wenig bekannt. Es besteht offensichtlich Nachholbedarf sowohl an <strong>eine</strong>r<br />
Beschreibung <strong>de</strong>r objektiven Eigenschaften als auch an Erfahrungsberichten mit dieser<br />
Mikrofonanordnung. Auch die verschie<strong>de</strong>nen Arten <strong>de</strong>r Dekodierung (De-Matrizierung)<br />
<strong>de</strong>r <strong>MS</strong>-Signale sind nicht allgemein bekannt, und erst seit kurzem existieren neue<br />
Werkzeuge zur optimalen Dekodierung.<br />
Der Autor dieses Aufsatzes ist in <strong>de</strong>n vergangenen Jahren selbst manchmal <strong>de</strong>m Vorurteil<br />
zum Opfer gefallen, dass <strong>MS</strong>-Technik per se <strong>eine</strong> <strong>de</strong>n an<strong>de</strong>ren <strong>Aufnahmetechnik</strong>en<br />
unterlegene <strong>Aufnahmetechnik</strong> sei. Dies ist nicht <strong>de</strong>r Fall. Eine <strong>MS</strong>-Aufnahme ist mitnichten<br />
ein Kompromiss (vgl. [9]) und auch die Verwendung <strong>de</strong>r <strong>MS</strong>-Technik für Mehrkanalaufnahme<br />
ist kein Problem, wenn man die Eigenschaften <strong>de</strong>r <strong>MS</strong>-Technik kennt. Es gilt<br />
auch allgmein: Nur wer die Eigenschaften <strong>eine</strong>r Anordnung kennt, kann mit <strong>de</strong>ren Vorzügen<br />
und Schwächen gut umgehen, k<strong>eine</strong> <strong>Aufnahmetechnik</strong> bietet von vorn herein<br />
gute Ergebnisse. Zum Glück gibt es kein „Idioten-sicheres“ Aufnahmeverfahren. Wenn<br />
Werbung solches suggeriert, ist Vorsicht geboten, <strong>de</strong>nn oft kann man mit <strong>de</strong>m beworbenen<br />
Produkt nicht nur nichts falsch, son<strong>de</strong>rn auch nichts richtig machen.<br />
So kann auch die <strong>Doppel</strong>-<strong>MS</strong> Anordnung, genau wie die <strong>MS</strong>-Technik überhaupt, durch<br />
schlechte Dekodierung unbrauchbare o<strong>de</strong>r zumin<strong>de</strong>st schlechtere Ergebnisse liefern.<br />
Genau wie bei <strong>de</strong>r behutsamen Einstellung <strong>de</strong>s Öffnungswinkels zweier Mikrofone im<br />
XY-Verfahren verlangt auch die <strong>MS</strong>-Technik <strong>eine</strong> vom Tonmeister bewusst kontrollierte<br />
Dekodierung. Diese scheinbar selbstverständliche For<strong>de</strong>rung wird anhand <strong>de</strong>r Ergebnisse<br />
<strong>de</strong>r Untersuchungen in diesem Aufsatz <strong>de</strong>monstriert.<br />
Die Untersuchungen dieses Aufsatzes teilen sich in theoretische und praktische Analyse.<br />
Die theoretische Analyse wird anhand wichtiger Parameter <strong>de</strong>r Mikrofonanordnung wie<br />
Korrelation <strong>de</strong>r Kanäle im Diffusfeld, Abbildungseigenschaften und Crosstalkverhalten<br />
durchgeführt. Durch <strong>eine</strong> Analyse anhand dieser Parameter können wesentliche Eigenschaften<br />
<strong>de</strong>r Anordnung vorausgesagt wer<strong>de</strong>n. Diese objektive Analyse vereinfacht die<br />
Bewertung <strong>eine</strong>r bestehen<strong>de</strong>n Anordnung wesentlich.<br />
2
Lei<strong>de</strong>r ist die Aussagekraft <strong>de</strong>r objektiven Analyse in <strong>de</strong>n meisten Fällen trotz<strong>de</strong>m beschränkt.<br />
Nicht alles lässt sich erklären und voraussagen. Zum <strong>eine</strong>n liegt das daran,<br />
dass die stereofone Wahrnehmung und die Wahrnehmung räumlicher Attribute komplizierten<br />
Prozessen unterliegen, die auch heute noch nicht ausreichend geklärt sind. Zum<br />
an<strong>de</strong>ren beeinflussen auch ganz individuelle Parameter die Qualität <strong>eine</strong>r Aufnahme<br />
wesentlich, sodass k<strong>eine</strong> <strong>de</strong>finitive allgem<strong>eine</strong> Aussage getroffen wer<strong>de</strong>n kann. Diese<br />
individuellen Parameter umfassen z.B. die Art <strong>de</strong>s Aufnahmeraums, Art <strong>de</strong>r Schallquelle(n),<br />
musikalischen Inhalt und nicht zuletzt <strong>de</strong>n persönlichen Geschmack <strong>de</strong>s Tonmeisters/Hörers.<br />
Deshalb ist es gefährlich, rein theoretische Analysen durchzuführen und unabhängig von<br />
praktischer Überprüfung und Erfahrung Regeln für optimale Aufnahmen zu erstellen.<br />
Dies gilt insbeson<strong>de</strong>re für die koinzi<strong>de</strong>nte <strong>Aufnahmetechnik</strong>, zu <strong>de</strong>r (auch in Zusammenhang<br />
mit <strong>de</strong>m Ambisonics-Wie<strong>de</strong>rgabeverfahren) reichlich theoretische Abhandlungen<br />
existieren, die <strong>de</strong>ren Überlegenheit postulieren (z.B. [7], [15]). In solchen Untersuchungen<br />
wird allerdings teilweise von Annahmen ausgegangen, die <strong>eine</strong>r kritischen<br />
Überprüfung bedürfen. Folglich sind auch die Schlussfolgerungen meist nur vom Thema<br />
Richtungsdarstellung bestimmt und vernachlässigen an<strong>de</strong>re, wichtige Parameter.<br />
In diesem Aufsatz wird versucht, die koinzi<strong>de</strong>nte <strong>Aufnahmetechnik</strong> speziell für die Anwendung<br />
<strong>Surround</strong> Sound <strong>eine</strong>r kritischen und wertfreien objektiven sowie subjektiven<br />
Analyse zuzuführen.<br />
1. Das <strong>MS</strong>-Prinzip<br />
Die Signale <strong>eine</strong>r koinzi<strong>de</strong>nten Mikrofonanordnung lassen sich nach <strong>de</strong>m <strong>MS</strong>-Prinzip<br />
(Mid/Si<strong>de</strong>) matrizieren, in <strong>de</strong>m <strong>de</strong>ren Summe und Differenz gebil<strong>de</strong>t wer<strong>de</strong>n. Das Mitten-Signal<br />
entspricht <strong>de</strong>r Mono-Summe, das Seiten-Signal <strong>de</strong>r Differenz.<br />
Die De-Matrizierung (o<strong>de</strong>r Dekodierung) wird erreicht, in <strong>de</strong>m aus Summe und Differenz<br />
die ursprünglichen Signale wie<strong>de</strong>r gewonnen wer<strong>de</strong>n.<br />
M = L + R<br />
S = L<br />
- R<br />
3<br />
1<br />
L = * ( M + S )<br />
2<br />
1<br />
R = * ( M - S )<br />
2<br />
Ein Vorteil <strong>de</strong>r <strong>MS</strong>-Kodierung liegt darin, dass Aufnahmewinkel bzw. Stereobreite direkt<br />
durch einfache Pegelung <strong>de</strong>r <strong>MS</strong>-Signale zu variieren sind.<br />
Abbildung 1:<br />
Beispiel für <strong>eine</strong> typische Anwendung <strong>de</strong>r<br />
<strong>MS</strong>-Stereofonie:<br />
Rohrrichtmikrofon mit aufgesetztem<br />
Acht-Mikrofon für Montage im Windkorb.<br />
aus [20]<br />
Bei <strong>de</strong>r <strong>MS</strong>-Aufnahme wird direkt in matrizierter Form aufgenommen, das heißt es wird<br />
ein Mikrofon für <strong>de</strong>n M-Kanal und ein Mikrofon für <strong>de</strong>n S-Kanal verwen<strong>de</strong>t. Das M-<br />
Mikrofon ist nach vorne ausgerichtet, das S-Mikrofon ist <strong>eine</strong> quer liegen<strong>de</strong> Acht.
Je<strong>de</strong> <strong>MS</strong>-Anordnung lässt sich in <strong>eine</strong> äquivalente XY-Anordnung umrechnen. Abbildung<br />
3 zeigt verschie<strong>de</strong>ne Kombinationen von <strong>MS</strong>-Signalen (M=Niere) in <strong>de</strong>r oberen Reihe,<br />
mit <strong>de</strong>r dazu gehören<strong>de</strong>n XY-Anordnung in <strong>de</strong>r unteren Reihe.<br />
Abbildung 2: Illustration <strong>de</strong>s <strong>MS</strong>-Prinzips:<br />
Reihe oben: M-Signal (Schwarz) und S-Signal (grün)<br />
Reihe unten: sich daraus ergeben<strong>de</strong> Signale L (blau) und R (rot)<br />
2. Beschreibung <strong>de</strong>r <strong>Doppel</strong>-<strong>MS</strong> Anordnung<br />
2.1. Mikrofonanordnung<br />
Das <strong>Doppel</strong>-<strong>MS</strong> Verfahren ist <strong>eine</strong> <strong>Aufnahmetechnik</strong> für Zwei- und Mehrkanalstereofonie,<br />
die ausschließlich auf Pegeldifferenzen beruht.<br />
Die I<strong>de</strong>e hinter <strong>de</strong>r <strong>Doppel</strong>-<strong>MS</strong> Anordnung ist die Bün<strong>de</strong>lung zweier <strong>MS</strong>-Mikrofonpaare.<br />
Dadurch kann ein Mikrofon eingespart wer<strong>de</strong>n, da die Acht für bei<strong>de</strong> Paare verwen<strong>de</strong>t<br />
wird. Das <strong>Doppel</strong>-<strong>MS</strong> System besteht somit aus drei Mikrofonen.<br />
Abbildung 3 illustriert dieses Prinzip:<br />
Abbildung 3: Prinzip <strong>de</strong>r <strong>Doppel</strong>-<strong>MS</strong> Anordnung: Bün<strong>de</strong>lung zweier <strong>MS</strong>-Paare, aus [20]<br />
Die drei Mikrofone/Kanäle wer<strong>de</strong>n folgen<strong>de</strong>rmaßen benannt:<br />
- Mfront<br />
- S<br />
- Mrear<br />
Durch die Verwendung von nur drei (Kleinmembran-)Mikrofonen kann erreicht wer<strong>de</strong>n,<br />
die Mikrofonmembrane quasi koinzi<strong>de</strong>nt, also an <strong>eine</strong>m Punkt anzubringen.<br />
4
Abbildung 4:<br />
<strong>Doppel</strong>-<strong>MS</strong> Anordnung<br />
Die Verwendung von Kompaktmikrofone<br />
(SCHOEPS CCM4V und CCM8)<br />
bewirkt <strong>eine</strong>n optimal kl<strong>eine</strong>n Abstand<br />
<strong>de</strong>r drei Membranen.<br />
aus [20]<br />
2.2. Generierung von 2/0-Stereo und 3/2-Stereo-Signalen<br />
Aus diesen drei Mikrofonsignalen können nun die Signale sowohl für Zweikanal- als<br />
auch Mehrkanal-Stereofonie generiert wer<strong>de</strong>n.<br />
Dies kann prinzipiell durch <strong>eine</strong> konventionelle <strong>MS</strong>-Matrix geschehen, wobei <strong>eine</strong> Matrix<br />
zur Generierung <strong>de</strong>r Signale L/R aus Mfront/S verwen<strong>de</strong>t wird, und <strong>eine</strong> weitere Matrix<br />
zur Generierung <strong>de</strong>r Signale LS/RS aus Mrear/S. Außer<strong>de</strong>m wird <strong>de</strong>r Center optional mit<br />
<strong>de</strong>m Signal <strong>de</strong>s Mfront-Mikrofons gespeist (vgl. Abschnitt 5).<br />
Die <strong>Doppel</strong>-<strong>MS</strong> Anordnung macht jedoch <strong>eine</strong> weitaus bessere Dekodierung möglich:<br />
Der Nachteil <strong>eine</strong>r <strong>MS</strong>-Anordnung liegt schließlich darin, dass die Richtcharakteristik <strong>de</strong>r<br />
<strong>de</strong>matrizierten virtuellen Mikrofone vom Mischungsverhältnis zwischen M und S abhängt.<br />
Dies ist in Abbildung 5 (oben) veranschaulicht. Mit zunehmen<strong>de</strong>m Pegel <strong>de</strong>s S-<br />
Signals verschiebt sich die resultieren<strong>de</strong> Richtcharakteristik von <strong>de</strong>r Niere zur Acht.<br />
Dadurch, dass sich in <strong>eine</strong>r <strong>Doppel</strong>-<strong>MS</strong> Anordnung aus <strong>eine</strong>r Mischung <strong>de</strong>r nach vorne<br />
und <strong>de</strong>r nach hinten gerichteten Nieren je<strong>de</strong> beliebige Richtcharakteristik 1.Ordnung<br />
erstellen lässt, kann die Richtcharakteristik <strong>de</strong>s <strong>de</strong>kodierten virtuellen Mikrofons nun frei<br />
bestimmt wer<strong>de</strong>n (Abbildung 5 unten).<br />
Abbildung 5:<br />
Veranschaulichung <strong>de</strong>s Unterschieds zwischen <strong>eine</strong>r Dekodierung mit/ohne variable<br />
Richtcharakteristik <strong>de</strong>s M front-Signals. Abgebil<strong>de</strong>t sind die resultieren<strong>de</strong>n Polardiagramme<br />
5
<strong>de</strong>r <strong>de</strong>kodierten Kanäle L,R<br />
Reihe oben: mit fester Richtcharakteristik M front=Niere<br />
Reihe unten: mit variabler Richtcharakteristik M front, Vorgabe: L,R=Superniere.<br />
Dieser Vorteil ist von wesentlicher Be<strong>de</strong>utung für <strong>eine</strong> optimale koinzi<strong>de</strong>nte Aufnahme.<br />
Nur so ist <strong>eine</strong> Steuerung <strong>de</strong>s Aufnahmewinkels möglich, ohne gleichzeitig Richtwirkung<br />
und Korrelation <strong>de</strong>s resultieren<strong>de</strong>n virtuellen Mikrofonpaars zu beeinflussen. Außer<strong>de</strong>m<br />
kann nur auf diese Weise die Unabhängigkeit (Dekorrelation) <strong>de</strong>r Signale maximal<br />
wer<strong>de</strong>n <strong>–</strong> <strong>eine</strong> For<strong>de</strong>rung, die beim <strong>Doppel</strong>-<strong>MS</strong> System wichtig ist. Die Be<strong>de</strong>utung dieser<br />
Parameter wird im Folgen<strong>de</strong>n noch diskutiert.<br />
Praktische Werkzeuge zur Dekodierung von <strong>Doppel</strong>-<strong>MS</strong> wer<strong>de</strong>n in Abschnitt 5 beschrieben.<br />
2.3. Verwandtschaft <strong>de</strong>s <strong>Doppel</strong>-<strong>MS</strong> Systems mit <strong>de</strong>r Ambisonics-<br />
<strong>Aufnahmetechnik</strong><br />
Ambisonics ist <strong>eine</strong> Aufnahme- und Wie<strong>de</strong>rgabetechnik, die auf <strong>eine</strong>r Erfindung von<br />
Michael Gerzon [7] beruht. Sie geht von <strong>eine</strong>r koinzi<strong>de</strong>nten Aufnahme aus. Grundlage<br />
<strong>de</strong>r Ambisonics-Theorie ist die Zerlegung <strong>de</strong>s Schallfelds in so genannte „spherical<br />
harmonics“ (Kugelflächenfunktionen), das sind Funktionen, die die Richtung <strong>de</strong>s eintreffen<strong>de</strong>n<br />
Schalls beschreiben. Die Kugelflächenfunktionen beschreiben das Schallfeld<br />
umso genauer, je höher ihre Ordnung wird.<br />
Abbildung 6: Visualisierung <strong>de</strong>r Kugelflächenfunktionen bis zur dritten Ordnung ;<br />
l entspricht <strong>de</strong>r Ordnung, ml <strong>de</strong>r Dimension. aus [35]<br />
In Abbildung 6 sind die Kugelflächenfunktionen bis zur dritten Ordnung abgebil<strong>de</strong>t.<br />
Bisher ist mit konventionellen Mitteln nur die Mikrofonaufnahme <strong>de</strong>r Kugelflächenfunktionen<br />
erster Ordnung möglich. Diese Aufnahme nach „Ambisonics erster Ordnung“ liefert<br />
folgen<strong>de</strong> Signale, die auch „B-Format erster Ordnung“ genannt wer<strong>de</strong>n:<br />
B-Format erster Ordnung:<br />
0-te Ordnung:<br />
W = 1;<br />
1-te Ordnung:<br />
X = cos(Θ) * cos(φ);<br />
Y = sin(Θ) * cos(φ);<br />
Z = sin(φ);<br />
6
Θ beschreibt <strong>de</strong>n Winkel in <strong>de</strong>r x/y-Ebene (Horizontalebene z=0), φ beschreibt <strong>de</strong>n<br />
Winkel in <strong>de</strong>r z-Ebene.<br />
Diese 4 Signale können auf unterschiedliche Weise durch <strong>eine</strong> Mikrofonaufnahme gewonnen<br />
wer<strong>de</strong>n:<br />
Nach Gerzon lassen sich mit 4 Mikrofonen, die in <strong>eine</strong>m gleichseitigen Tetrae<strong>de</strong>r angebracht<br />
sind, die 4 Signale <strong>de</strong>s B-Formats ermitteln. Solche Mikrofone existieren auch auf<br />
<strong>de</strong>m Markt, z.B. das „Soundfield“-Mikrofon <strong>de</strong>r englischen Firma Soundfield (siehe<br />
[24]). Vorteil dieser Metho<strong>de</strong> ist die gleichmäßige Anordnung im Tetrae<strong>de</strong>r und die gute<br />
Koinzi<strong>de</strong>nz <strong>de</strong>r Anordnung in allen Raumrichtungen. Ein Nachteil ist die Notwendigkeit,<br />
zunächst die Tetrae<strong>de</strong>rsignale („A-Format“) ins B-Format umwan<strong>de</strong>ln zu müssen.<br />
Eine an<strong>de</strong>re Metho<strong>de</strong> ist <strong>eine</strong> Mikrofonaufnahme, die direkt das B-Format liefert. Dazu<br />
wer<strong>de</strong>n <strong>eine</strong> Kugel (W) und drei Acht-Mikrofone (X, Y, Z) verwen<strong>de</strong>t. Dies wird oft mit<br />
„native B-format Recording“ bezeichnet (<strong>eine</strong> solche Anordnung ist z.B. in [3] abgebil<strong>de</strong>t).<br />
Lässt man nun das dritte Acht-Mikrofon weg, weil man nicht an <strong>eine</strong>r dreidimensionalen<br />
Wie<strong>de</strong>rgabe interessiert ist, ergibt sich <strong>eine</strong> Anordnung, die geometrisch relativ<br />
einfach zu realisieren ist. Benjamin [1] bezeichnet das sich ergeben<strong>de</strong> Format als „Horizontal<br />
B-Format“. Mit hinreichend kl<strong>eine</strong>n Mikrofonen lässt sich <strong>eine</strong> gute Koinzi<strong>de</strong>nz, in<br />
Bezug auf die Horizontalebene perfekte Koinzi<strong>de</strong>nz erreichen.<br />
Die <strong>Doppel</strong>-<strong>MS</strong> Anordnung liefert nun prinzipiell dieselben Signale, da sich die Mikrofonsignale<br />
ins „Horizontal B-Format“ durch einfache Summierung und Differenzbildung<br />
überführen lassen:<br />
W = Mfront+ Mrear;<br />
X = Mfront- Mrear;<br />
Y = S;<br />
Es zeigt sich also, dass die <strong>Doppel</strong>-<strong>MS</strong> Signale mit <strong>eine</strong>r Aufnahme nach Ambisonics<br />
erster Ordnung bis auf die fehlen<strong>de</strong> Höheninformation (Z) i<strong>de</strong>ntisch sind. Dieser Punkt<br />
spielt dann k<strong>eine</strong> Rolle, wenn <strong>eine</strong> Wie<strong>de</strong>rgabe auf <strong>eine</strong>m konventionellen Lautsprechersystem<br />
ohne Höheninformation (2.0, 5.1, etc.) beabsichtigt ist.<br />
Bei Benjamin [1] wird ein Vergleich zwischen <strong>de</strong>n bei<strong>de</strong>n Aufnahme-Metho<strong>de</strong>n angestellt.<br />
Der Vergleich <strong>de</strong>r sich ergeben<strong>de</strong>n Polardiagramme <strong>de</strong>s B-Formats ergibt, dass<br />
ein natives Array aus einzelnen Kapseln (in <strong>de</strong>r Untersuchung Benjamins waren es<br />
Schoeps MK 2 und MK 8) die besseren Polardiagramme im B-Format bietet, wohl aber<br />
für Schalleinfall aus <strong>eine</strong>r an<strong>de</strong>ren Richtung als <strong>de</strong>r Horizontalebene nicht die optimalen<br />
Polardiagramme behalten kann. Das Tetrae<strong>de</strong>r-Mikrofonsystem zeigt gute, konsistente<br />
Polardiagramme, die unabhängig von <strong>de</strong>r Schalleinfallsebene sind, jedoch unregelmäßigen<br />
Abweichungen ab ca. 6 kHz haben. Details liefert z.B. Flock [6].<br />
Abbildung 7: Polardiagramme aus <strong>eine</strong>m “Horizontal B-Format”-Array aus Benjamin [1]:<br />
links: SCHOEPS MK 2 (=W-Signal, bei <strong>eine</strong>r 90°-Stellung <strong>de</strong>r Kugel wäre das Polardiagramm<br />
in <strong>de</strong>r horizontalen Ebene sogar perfekt frequenzunabhängig)<br />
rechts: SCHOEPS MK 8 (=X-Signal)<br />
7
Abbildung 8: Polardiagramme aus <strong>eine</strong>m Tetrae<strong>de</strong>r-Array (Soundfield-Mikrofon MkV Mikrofonsystem)<br />
aus Benjamin [1]:<br />
links: W-Signal<br />
rechts: X-Signal<br />
Achtung: Es sind an<strong>de</strong>re Frequenzen als in Abbildung 7 verwen<strong>de</strong>t wor<strong>de</strong>n, die Graphen<br />
sind nicht direkt vergleichbar.<br />
Wie oben erwähnt, ist die Grundlage <strong>de</strong>r Ambisonics-Theorie die Zerlegung <strong>de</strong>s Schallfelds<br />
in mehrere Richtungskomponenten. Bei <strong>de</strong>r Wie<strong>de</strong>rgabe wird das Schallfeld also<br />
durch Überlagerung aller Lautsprechersignale wie<strong>de</strong>r zusammengesetzt. Dabei können<br />
durchaus mehr als zwei Lautsprecher korrelierte Signale haben. Die Zerlegung <strong>de</strong>s<br />
Schallfelds folgt nicht <strong>de</strong>m Gesetz, dass <strong>eine</strong> Phantomschallquelle aus Pegel- und Zeitdifferenzen<br />
zwischen zwei benachbarten Lautsprechern gebil<strong>de</strong>t wird, son<strong>de</strong>rn visiert<br />
<strong>eine</strong> physikalische Zusammensetzung <strong>de</strong>s Signals im Sweet Spot an. Dadurch ergeben<br />
sich auch an<strong>de</strong>re Gesetzmäßigkeiten bezüglich <strong>de</strong>r in diesem Aufsatz besprochenen<br />
Parameter. Da <strong>de</strong>r Ansatz <strong>de</strong>r Ambisonics-Theorie zur Wie<strong>de</strong>rgabe <strong>eine</strong>s <strong>Surround</strong>-<br />
Signals so verschie<strong>de</strong>n von <strong>de</strong>r Phantomschallquellentheorie ist, kann er auch nicht<br />
direkt theoretisch verglichen wer<strong>de</strong>n. Wür<strong>de</strong> man mit <strong>de</strong>n in diesem Aufsatz genannten<br />
Parametern ein Ambisonics-Signal erster Ordnung beurteilen, käme man oft auf ein<br />
negatives Resultat. Tatsächlich gibt es viele Tonmeister, die auf diese Weise entstan<strong>de</strong>ne<br />
Mischungen ablehnen. Es sei jedoch ausdrücklich darauf hingewiesen, dass dies dann<br />
nicht an <strong>de</strong>r Koinzi<strong>de</strong>nz <strong>de</strong>r Aufnahme liegen muss (wie es oft behauptet wird). Es gibt<br />
sehr verschie<strong>de</strong>ne koinzi<strong>de</strong>nte <strong>Aufnahmetechnik</strong>en und es gibt auch verschie<strong>de</strong>ne Arten,<br />
die Qualität zu beurteilen und entsprechend zu optimieren.<br />
3. Parameter zur theoretischen Analyse <strong>de</strong>r <strong>Doppel</strong>-<br />
<strong>MS</strong> Technik<br />
In diesem Kapitel wer<strong>de</strong>n verschie<strong>de</strong>ne Parameter beschrieben, die bei <strong>de</strong>r objektiven<br />
Bewertung <strong>de</strong>r <strong>Doppel</strong>-<strong>MS</strong> Technik, sei es für Zweikanal-Stereo o<strong>de</strong>r <strong>Surround</strong>, von<br />
Be<strong>de</strong>utung sind. Sie sind speziell für die Diskussion <strong>de</strong>s <strong>Doppel</strong>-<strong>MS</strong> Setups zusammengestellt,<br />
haben aber auch zur Diskussion an<strong>de</strong>rer Anordnungen Geltung.<br />
Die Parameter sind:<br />
- Pegel- und Laufzeitdifferenzen zur Richtungsabbildung<br />
- Korrelation<br />
- Crosstalk (Übersprechverhalten)<br />
Diese Parameter haben Einfluss auf verschie<strong>de</strong>ne Attribute <strong>de</strong>r Wahrnehmung wie Lokalisation,<br />
Klangfarbe und räumliche Wahrnehmung.<br />
Die Relevanz <strong>de</strong>r verschie<strong>de</strong>nen Parameter hängt von <strong>de</strong>r jeweiligen Anwendung ab. Es<br />
sei darauf hingewiesen, dass nie ein Parameter allein beachtet wer<strong>de</strong>n sollte, auch wenn<br />
dieser noch so wichtig ist.<br />
8
3.1. Richtungsabbildung (Lokalisation)<br />
3.1.1. Allgem<strong>eine</strong> Beschreibung<br />
Dieser Parameter beschreibt die Fähigkeit <strong>eine</strong>r Mikrofonanordnung, das aufgenommene<br />
Schallfeld im Sinne <strong>de</strong>r Absicht <strong>de</strong>s Tonmeisters zwischen <strong>de</strong>n Lautsprechern zu verteilen.<br />
Oft ist es gewünscht, dass das klangliche Geschehen im Aufnahmeraum proportional<br />
im Wie<strong>de</strong>rgaberaum abgebil<strong>de</strong>t wird. In diesem Fall ist <strong>de</strong>r so genannte Aufnahmewinkel<br />
von Be<strong>de</strong>utung. Der Aufnahmewinkel beschreibt <strong>de</strong>njenigen Winkel im Aufnahmeraum,<br />
<strong>de</strong>r zwischen <strong>de</strong>n vor<strong>de</strong>ren Lautsprechern (L/C/R) abgebil<strong>de</strong>t wird. Für <strong>eine</strong><br />
<strong>de</strong>taillierte Beschreibung von Richtungsabbildung und Aufnahmewinkel sei auf [30],<br />
[31] verwiesen, im Folgen<strong>de</strong>n wird diese Problematik nur kurz erläutert.<br />
Die Auslenkung <strong>de</strong>r Phantomschallquellen wird dadurch erreicht, dass zwischen <strong>de</strong>n<br />
Mikrofonsignalen Pegel- und/o<strong>de</strong>r Laufzeitdifferenzen bestehen, die die Phantomschallquelle<br />
aus <strong>de</strong>r Mitte zwischen zwei Lautsprechern auslenken. Theile erklärt, wie sich<br />
diese bei<strong>de</strong>n Arten von Signaldifferenzen addieren. Die Gesamtauslenkung <strong>de</strong>r Phantomschallquelle<br />
ergibt sich aus <strong>de</strong>r Summe <strong>de</strong>r jeweils durch die Pegel- o<strong>de</strong>r Laufzeitdifferenz<br />
allein sich ergeben<strong>de</strong>n Auslenkung.<br />
Φgesamt=ΦL + Φt<br />
9<br />
siehe Theile: [25], [26]<br />
Diese lineare Addition gilt allerdings nur in <strong>eine</strong>m Bereich <strong>de</strong>r Phantomschallquellenauslenkung<br />
bis ca. 50% <strong>de</strong>r Maximalauslenkung. Danach ergibt sich <strong>eine</strong> allmähliche „Sättigung“<br />
bis hin zur Abbildung in nur <strong>eine</strong>m Lautsprecher. Der Autor dieses Aufsatzes<br />
beschreibt diesen Verlauf als mathematische Funktion ([30], [31], [32], [33], [34]).<br />
Diese Näherungsfunktion ist in Abbildung 9 gezeichnet. Zu beachten ist, dass die Auslenkung<br />
<strong>de</strong>r Phantomschallquelle proportional zur Lautsprecher-Basisbreite ist. Die<br />
Auslenkung wird <strong>de</strong>shalb in % angegeben, um die Allgemeingültigkeit zu behalten. Im<br />
normalen Stereodreieck entspricht <strong>eine</strong> Auslenkung von +/- 100% <strong>de</strong>r Auslenkung von<br />
+/-30°. Eine Auslenkung von 100% entspricht <strong>eine</strong>r Abbildung in nur <strong>eine</strong>m Lautsprecher.<br />
Abbildung 9: Zusammenhang zwischen Pegeldifferenz (links) bzw. Laufzeitdifferenz<br />
(rechts) und Auslenkung <strong>de</strong>r Phantomschallquelle nach:<br />
fettgedruckte Kurve: Wittek [34], 7,5% / dB bzw. 13% / 0,1 ms<br />
A: Leakey [16]<br />
B: Mertens [18]<br />
C: Brittain and Leakey [2]<br />
D: Simonson [23], Basis für die „Williams-Kurven“ [28]<br />
E: Sengpiel [22]<br />
Mithilfe dieser Näherungsfunktion lässt sich die resultieren<strong>de</strong> Abbildung je<strong>de</strong>r stereofonen<br />
Anordnung aus zwei Mikrofonen berechnen. Dies ist im Image Assistant realisiert,
<strong>eine</strong>m als JAVA-Applet ausgeführten Simulationsprogramm zu Berechnung von Lokalisationskurven.<br />
Dieses Applet kann online benützt wer<strong>de</strong>n (www.hauptmikrofon.<strong>de</strong>, siehe<br />
Abbildung 10, siehe Wittek [33]).<br />
Eine Lokalisationskurve beschreibt die Auslenkung <strong>de</strong>r Phantomschallquellen in Abhängigkeit<br />
vom Winkel <strong>de</strong>r Schallquelle im Aufnahmeraum. Die Hauptgrafik im Image Assistant<br />
zeigt <strong>de</strong>n Schallquellenwinkel in Grad auf <strong>de</strong>r x-Achse und die Auslenkung zwischen<br />
<strong>de</strong>n vor<strong>de</strong>ren Lautsprechern in % auf <strong>de</strong>r y-Achse an. Der Aufnahmewinkel lässt<br />
sich ablesen, in<strong>de</strong>m, laut Definition, <strong>de</strong>r Winkelbereich gesucht wird, in <strong>de</strong>m die Schallquellen<br />
zwischen <strong>de</strong>n Lautsprechern abgebil<strong>de</strong>t wer<strong>de</strong>n. Dieser Bereich ist hellblau<br />
eingefärbt, <strong>de</strong>r Aufnahmewinkel (Recording Angle/ Recording Angle 75%) wird außer<strong>de</strong>m<br />
im Fenster in <strong>de</strong>r Hauptgrafik links oben eingeblen<strong>de</strong>t.<br />
Abbildung 10: Simulation mit <strong>de</strong>m “Image Assistant” [33]:<br />
Lokalisationskurve <strong>de</strong>r OCT-Anordnung.<br />
3.1.2. Vergleich <strong>de</strong>r Richtungsabbildungseigenschaften von stereofonen<br />
Anordnungen<br />
Viele Autoren haben das Design <strong>eine</strong>r Mikrofonanordnung wesentlich am Parameter<br />
Richtungsabbildung ausgerichtet. Das liegt nicht nur daran, dass dieser Parameter als<br />
wesentlich eingestuft wird. Vielmehr kann ein daraufhin optimiertes Design auch im<br />
Hinblick auf an<strong>de</strong>re Parameter gut geeignet sein. Sicherlich ist es ratsam, bei <strong>de</strong>r Suche<br />
nach geeigneten Kombinationen aber <strong>de</strong>n Blick fürs Ganze nicht zu vergessen.<br />
10
Die Vorschläge von Williams (MMA, siehe [27] und [29]) sind absichtlich in <strong>de</strong>r Hauptsache<br />
auf <strong>eine</strong> 360°-Rundum-Abbildung <strong>de</strong>s Schallfelds ausgerichtet. Nach Williams<br />
wer<strong>de</strong>n auch an<strong>de</strong>re wesentliche Parameter wie die räumliche Abbildung wesentlich von<br />
<strong>de</strong>r Fähigkeit zur Richtungsabbildung beeinflusst.<br />
Auch Theile argumentiert ähnlich, allerdings empfiehlt er ausdrücklich bestimmte Kombinationen,<br />
um dafür Sorge zu tragen, dass neben <strong>de</strong>r Richtungsabbildung an<strong>de</strong>re Parameter<br />
optimal gestaltet wer<strong>de</strong>n. Ein Beispiel dafür ist die OCT-Anordnung (siehe<br />
Abbildung 11, [25], [20]), die mehrere Vorteile in sich vereint.<br />
Abbildung 11: OCT-Anordnung nach Theile [25], aus [20]<br />
Zum <strong>eine</strong>n verläuft die Lokalisationskurve, die in Abbildung 10 gezeigt ist, sehr gera<strong>de</strong><br />
und bietet somit <strong>eine</strong> sehr naturgetreue Richtungsabbildung ohne geometrische Verzerrungen.<br />
Zum an<strong>de</strong>ren ist <strong>de</strong>r Crosstalk zwischen <strong>de</strong>n Abbildungsbereichen bei <strong>eine</strong>r die<br />
OCT-Anordnung sehr gering, was Vorteile für die räumliche Abbildung, die Robustheit<br />
<strong>de</strong>r Abbildung sowie die Klangfarbe mit sich bringt. Dieser Aspekt wird in Abschnitt 3.3<br />
<strong>de</strong>tailliert beschrieben.<br />
Die Abbildungseigenschaften <strong>de</strong>r <strong>Doppel</strong>-<strong>MS</strong> Anordnung sind abhängig von <strong>de</strong>r Dekodierung<br />
<strong>de</strong>r Signale. Dies ist einleuchtend, wenn man be<strong>de</strong>nkt, dass bei <strong>de</strong>r Dekodierung<br />
sämtliche Varianten <strong>eine</strong>r koinzi<strong>de</strong>nten Anordnung aus bis zu 5 o<strong>de</strong>r sogar mehr Mikrofonen<br />
möglich sind. 5 Mikrofone erster Ordnung können gar nicht hinreichend unterschiedliche<br />
Signale liefern, um sowohl klanglich als auch in Bezug auf die Richtungsabbildung<br />
optimale Ergebnisse zu liefern. Deshalb ist Vorsicht geboten, und oftmals ist die<br />
4-kanalige Dekodierung <strong>eine</strong>r 5-kanaligen klanglich und in Bezug auf <strong>eine</strong> 360°-<br />
Rundumabbildung überlegen.<br />
Abbildung 12 zeigt die resultieren<strong>de</strong> Richtungsabbildung <strong>eine</strong>r 4-Kanal-Variante. Eine<br />
für <strong>MS</strong>/XY-Aufnahme typische, sehr lineare, das heißt proportionale Abbildung zwischen<br />
<strong>de</strong>n Lautsprechern wird erreicht.<br />
Die Richtungsabbildung <strong>eine</strong>r 5-Kanal-Variante wird in Abbildung 13 gezeigt. In <strong>de</strong>r<br />
Simulation ist <strong>de</strong>utlich zu erkennen, dass die theoretisch gewünschte, gleichmäßige<br />
Abbildung zwischen jeweils benachbarten Lautsprechern nicht mehr funktioniert. Der<br />
Grund dafür ist die schlechtere Kanaltrennung (durch Übersprechen, Crosstalk, siehe<br />
Abschnitt 3.3). Die Simulation <strong>de</strong>s Image Assistant zeigt, dass im mittleren Bereich <strong>eine</strong><br />
Abbildung zwischen drei Lautsprecherpaaren existiert. Diese theoretische Mehrfachabbildung<br />
äußert sich in reduzierter Abbildungsschärfe und schlechterer Lokalisiertheit <strong>de</strong>r<br />
Phantomschallquelle. Dies muss nicht unbedingt schlechte Eigenschaften <strong>de</strong>r Aufnahme<br />
zur Folge haben, <strong>de</strong>nn Crosstalk existiert auch bei an<strong>de</strong>ren <strong>Aufnahmetechnik</strong>en. Jedoch<br />
zeigen die an<strong>de</strong>ren Abschnitte dieses Aufsatzes weitere Nachteile von Crosstalk auf.<br />
Hier existiert ein tatsächlicher Wi<strong>de</strong>rspruch zwischen zwei verschie<strong>de</strong>nen Theorien <strong>de</strong>r<br />
Lokalisation: Die Ambisonics-Theorie erlaubt <strong>eine</strong> beliebige Anzahl Lautsprecher und<br />
betrachtet nur die überlagerten Signale im „Sweet Spot“. Auf <strong>de</strong>r an<strong>de</strong>ren Seite ist bei<br />
<strong>eine</strong>r Phantomschallquellenbildung (siehe Theile [25]) ein korreliertes Signal auf mehr<br />
11
als zwei Lautsprechern negativ für Klangfarbe und Lokalisation. Wür<strong>de</strong> man Lokalisation<br />
nach <strong>de</strong>r Ambisonics-Theorie berechnen wollen, müsste man die Signale aller Lautsprecher<br />
gleichzeitig auswerten und nicht nur, wie im Image Assistant, die bestimmter<br />
Lautsprecherpaare. Crosstalk ist kein negativer Parameter im Sinne <strong>de</strong>r Ambisonics-<br />
Theorie.<br />
Abbildung 12: Abbildung zwischen <strong>de</strong>n Lautsprechern L/C/R bei <strong>eine</strong>r 4-Kanal-D<strong>MS</strong>-<br />
Dekodierung (=4ch Setting <strong>de</strong>r Schoeps Hardware Matrix, siehe Abschnitt 5),<br />
(Simulation mit <strong>de</strong>m “Image Assistant” [33])<br />
Abbildung 13: Abbildung zwischen <strong>de</strong>n Lautsprechern L/C/R bei <strong>eine</strong>r 5-Kanal-D<strong>MS</strong>-<br />
Dekodierung, (Simulation mit <strong>de</strong>m “Image Assistant” [33])<br />
12
3.2. Kohärenz / Korrelation<br />
3.2.1. Die Korrelation und ihre Aussagekraft bei <strong>MS</strong>-Stereofonie<br />
Die Kohärenz bzw. die Korrelation 1 im Diffusfeld (=im Nachhall) zwischen <strong>de</strong>n Kanälen<br />
<strong>eine</strong>r stereofonen Aufnahme wird oft als Parameter angesehen, <strong>de</strong>r auf Attribute wie<br />
räumliche Wahrnehmung und Klangfarbe <strong>eine</strong>n wichtigen Einfluss hat (siehe [5], [8],<br />
[17], [19], [25]). Die Diffusfeld-Korrelation wird als ein entschei<strong>de</strong>n<strong>de</strong>r Parameter für<br />
die Unterschie<strong>de</strong> in <strong>de</strong>r räumlichen Wahrnehmung zwischen verschie<strong>de</strong>nen stereofonen<br />
Anordnungen angenommen (vgl. Abbildungen 30 bis 33). So sind Anordnungen, die<br />
Abstän<strong>de</strong> zwischen <strong>de</strong>n Mikrofonen enthalten, eher für <strong>eine</strong> gute räumliche Abbildung<br />
bekannt (siehe z.B. [36]).<br />
Gera<strong>de</strong> bei <strong>de</strong>r Thematik <strong>MS</strong>-Aufnahme sollte <strong>de</strong>r Parameter „Korrelation zwischen <strong>de</strong>n<br />
Kanälen“ (interchannel correlation) im Diffusfeld erhöhte Aufmerksamkeit bekommen,<br />
da er neben <strong>de</strong>r Richtungsabbildung entschei<strong>de</strong>nd für klangliche Unterschie<strong>de</strong> zwischen<br />
<strong>de</strong>n Dekodierungen ist. Diese bei<strong>de</strong>n Parameter sind allerdings bei <strong>eine</strong>r koinzi<strong>de</strong>nten<br />
Aufnahme nicht unabhängig, son<strong>de</strong>rn eng miteinan<strong>de</strong>r verbun<strong>de</strong>n. Vergrößert man <strong>de</strong>n<br />
Aufnahmewinkel, steigt auch die Korrelation. In <strong>de</strong>r Auswahl <strong>de</strong>r Richtcharakteristik <strong>de</strong>r<br />
Mikrofone beeinflusst man die Korrelation und das Abbildungsverhalten. In Abbildung<br />
14 wird <strong>de</strong>r Korrelationsgrad <strong>eine</strong>r koinzi<strong>de</strong>nten Mikrofonanordnung im Diffusfeld in<br />
Abhängigkeit vom Öffnungswinkel 2 angegeben. Der Korrelationsgrad ist dabei abhängig<br />
von <strong>de</strong>r Richtcharakteristik <strong>de</strong>r bei<strong>de</strong>n Mikrofone. Abzulesen ist unter an<strong>de</strong>rem, dass <strong>de</strong>r<br />
Diffusfeld-Korrelationsgrad zweier koinzi<strong>de</strong>nter Nieren niemals unter 0.5 sinken kann.<br />
Ist ein Diffusfeld-Korrelationsgrad von 0 gewünscht, kann dies nur mit Richtcharakteristika<br />
erreicht wer<strong>de</strong>n, die (in etwa) maximal <strong>de</strong>n Kugelanteil <strong>eine</strong>r Superniere haben<br />
(vgl. auch Griesinger [11]).<br />
Abbildung 14 zeigt, dass mit Vergrößern <strong>de</strong>s Öffnungswinkels die Korrelation im Diffusfeld<br />
sinkt. Es muss allerdings beachtet wer<strong>de</strong>n, dass gleichzeitig <strong>de</strong>r Aufnahmewinkel<br />
kl<strong>eine</strong>r wird. Die folgen<strong>de</strong> Tabelle zeigt die Korrelation und <strong>de</strong>n Aufnahmewinkel dreier<br />
Anordnungen mit gleichem Öffnungswinkel, aber verschie<strong>de</strong>ner Richtcharakteristika.<br />
Öffnungswinkel=90° Nieren Supernieren Achten<br />
Korrelationsgrad 0.75 0.49 0.00<br />
Aufnahmewinkel,<br />
(Aufnahmewinkel 75% [31])<br />
180° (142°) 130° (104°) 72° (58°)<br />
1 Zur Klärung <strong>de</strong>r Begriffe und Definition von Korrelation und Kohärenz ist im Anhang<br />
<strong>eine</strong> ausführliche Diskussion enthalten. Die Kohärenz zweier Kanäle ist ein Maß für die<br />
Ähnlichkeit <strong>de</strong>r Signale im Frequenzbereich, ohne Rücksicht auf die Phasenlage. Die<br />
Korrelation zwischen zwei Kanälen ist ein Maß für die Ähnlichkeit <strong>de</strong>r Signale im Zeitbereich.<br />
2 Der Begriff Öffnungswinkel bezeichnet <strong>de</strong>n Winkel, <strong>de</strong>n zwei Mikrofone einschließen.<br />
Es existieren auch an<strong>de</strong>re Begriffe für diesen Winkel, u.a. Hauptachsenwinkel, Versatzwinkel,<br />
etc.<br />
13
Abbildung 14:<br />
Korrelationsgrad <strong>eine</strong>r koinzi<strong>de</strong>nten Mikrofonanordnung im Diffusfeld in Abhängigkeit<br />
vom Öffnungswinkel <strong>de</strong>r Mikrofonanordnung für verschie<strong>de</strong>ne Richtcharakteristika.<br />
Angegeben ist auch <strong>de</strong>r Kugelanteil <strong>de</strong>s Mikrofons nach <strong>de</strong>r Mikrofonformel:<br />
sens = a + (1-a) * cos (φ)<br />
Abbildung 15: Aufnahmewinkel <strong>eine</strong>r koinzi<strong>de</strong>nten Mikrofonanordnung in Abhängigkeit vom<br />
Öffnungswinkel zwischen <strong>de</strong>n bei<strong>de</strong>n Mikrofonen für verschie<strong>de</strong>ne Richtcharakteristika.<br />
Es existiert kein Aufnahmewinkel für <strong>eine</strong> koinzi<strong>de</strong>nte Anordnung aus breiten Nieren o<strong>de</strong>r<br />
Kugeln.<br />
14
Interessant wäre es, die Korrelation <strong>de</strong>r Anordnung in Abhängigkeit vom resultieren<strong>de</strong>n<br />
Aufnahmewinkel anzugeben. Dann kann beobachtet wer<strong>de</strong>n, welche Mikrofonanordnung<br />
bei gegebenem Aufnahmewinkel die optimale Dekorrelation im Diffusfeld erreicht.<br />
Dies ist möglich, wenn zunächst <strong>de</strong>r Aufnahmewinkel in Abhängigkeit von Öffnungswinkel<br />
und Richtcharakteristik berechnet wird. Das Ergebnis dieser Berechnung zeigt<br />
Abbildung 15.<br />
Die Berechnung wur<strong>de</strong> folgen<strong>de</strong>rmaßen durchgeführt: Der Aufnahmewinkel wird als <strong>de</strong>r<br />
doppelte kleinste Versatzwinkel <strong>de</strong>finiert, bei <strong>de</strong>m ein Pegelunterschied von mind. 16dB<br />
zwischen <strong>de</strong>n bei<strong>de</strong>n Mikrofonsignalen auftritt.<br />
Mithilfe dieser Werte kann nun <strong>de</strong>r Korrelationsgrad <strong>eine</strong>r koinzi<strong>de</strong>nten Anordnung aus<br />
zwei Mikrofonen beliebiger Richtcharakteristik in Abhängigkeit vom resultieren<strong>de</strong>n Aufnahmewinkel<br />
angegeben wer<strong>de</strong>n:<br />
Abbildung 16: Korrelationsgrad <strong>eine</strong>r koinzi<strong>de</strong>nten Mikrofonanordnung im Diffusfeld in Abhängigkeit<br />
vom Aufnahmewinkel <strong>de</strong>r Mikrofonanordnung für verschie<strong>de</strong>ne Richtcharakteristika.<br />
Es existiert kein Aufnahmewinkel für <strong>eine</strong> koinzi<strong>de</strong>nte Anordnung aus breiten Nieren o<strong>de</strong>r<br />
Kugeln.<br />
Abbildung 16 zeigt, dass <strong>de</strong>r Diffusfeld-Korrelationsgrad <strong>eine</strong>r koinzi<strong>de</strong>nten Mikrofonanordnung<br />
mit festem Aufnahmewinkel durchaus von <strong>de</strong>r Richtcharakteristik <strong>de</strong>r Mikrofone<br />
abhängt. Allerdings ist man beschränkt bei <strong>de</strong>r Auswahl <strong>de</strong>r Richtcharakteristik, da<br />
durchaus nicht alle in Abbildung 16 angegebenen Werte <strong>eine</strong> sinnvolle Anordnung ergeben<br />
und schließlich die Unterschie<strong>de</strong> in <strong>de</strong>r Korrelation oft klein sind. Ob die bestehen<strong>de</strong>n<br />
Unterschie<strong>de</strong> <strong>eine</strong>n hörbaren Effekt haben, kann hier nicht gesagt wer<strong>de</strong>n. Zu groß<br />
sind auch die gleichzeitig auftreten<strong>de</strong>n Unterschie<strong>de</strong> in <strong>de</strong>r Abbildung <strong>de</strong>s Direktschalls.<br />
Zusammenfassend kann gesagt wer<strong>de</strong>n, dass die Korrelation im Diffusfeld zwischen <strong>de</strong>n<br />
Kanälen <strong>eine</strong>r stereofonen Aufnahme ein wichtiger Parameter für die räumliche Wahrnehmung<br />
ist, <strong>de</strong>r sich allerdings kaum unabhängig vom Aufnahmewinkel steuern lässt.<br />
Damit ist die Korrelation bei koinzi<strong>de</strong>nten Aufnahmen hauptsächlich vom gewünschten<br />
Aufnahmewinkel abhängig.<br />
15
3.2.2. Optimierung <strong>de</strong>s <strong>Doppel</strong>-<strong>MS</strong> Systems hinsichtlich <strong>de</strong>r Diffusfeld-<br />
Korrelation<br />
Das <strong>Doppel</strong>-<strong>MS</strong> System entspricht nach <strong>de</strong>r Dekodierung <strong>eine</strong>r koinzi<strong>de</strong>nten Anordnung<br />
aus 4 o<strong>de</strong>r 5 Mikrofonen erster Ordnung. Größtmögliche Signaltrennung und Gleichmäßigkeit<br />
<strong>de</strong>r Richtungsabbildung sowie kleinstmögliche Diffusfeld-Korrelation zwischen<br />
<strong>de</strong>n Kanälen wird erreicht, wenn folgen<strong>de</strong> For<strong>de</strong>rungen erfüllt wer<strong>de</strong>n:<br />
- <strong>de</strong>r Winkel zwischen <strong>de</strong>n virtuellen Mikrofonen ist maximal<br />
- die Richtwirkung <strong>de</strong>r virtuellen Mikrofone ist maximal<br />
For<strong>de</strong>rung a) lässt sich leicht erfüllen, wenn die Ergebnisse <strong>de</strong>r Dekodierung kontrolliert<br />
wer<strong>de</strong>n. For<strong>de</strong>rung b) führt zur Wahl <strong>eine</strong>r Richtcharakteristik, die <strong>de</strong>n besten Kompromiss<br />
zwischen großer Richtwirkung und stören<strong>de</strong>r Rückkeule darstellt - <strong>de</strong>r Superniere.<br />
Eine diesbezüglich optimale Anordnung ist <strong>de</strong>mnach <strong>eine</strong> Anordnung aus 4 o<strong>de</strong>r 5 Supernieren,<br />
die im Winkel maximal gegeneinan<strong>de</strong>r versetzt sind.<br />
Diese For<strong>de</strong>rungen führen zum Beispiel zu folgen<strong>de</strong>n 4-Kanal und 5-Kanal Dekodierungen:<br />
Abbildung 17a: <strong>eine</strong> optimierte 4-Kanal<br />
Dekodierung <strong>de</strong>s <strong>Doppel</strong>-<strong>MS</strong> Systems<br />
16<br />
Abbildung 17b: <strong>eine</strong> optimierte 5-Kanal<br />
Dekodierung <strong>de</strong>s <strong>Doppel</strong>-<strong>MS</strong> Systems<br />
Die sich ergeben<strong>de</strong>n Korrelationsgra<strong>de</strong> dieser optimierten <strong>Doppel</strong>-<strong>MS</strong>-Dekodierung aus<br />
4 bzw. 5 Supernieren sind:<br />
5-ch Anordnung:<br />
L-C L-R L-LS LS-RS LS-C L-RS<br />
Versatzwinkel 72° 144° 72° 72° 144° 144°<br />
Korrelationsgrad 0.66 0.11 0.66 0.66 0.11 0.11<br />
4-ch Anordnung:<br />
L-C L-R L-LS LS-RS LS-C L-RS<br />
Versatzwinkel - 108° 72° 72° - 198°<br />
Korrelationsgrad - 0.36 0.51 0.66 - 0.04<br />
In obiger Tabelle ist abzulesen, dass <strong>eine</strong> möglichst geringe Diffusfeld-Korrelation beson<strong>de</strong>rs<br />
für die 4-Kanal-Variante erreicht wird. Die Bereiche höherer Korrelation sind<br />
nur im hinteren Bereich. Die 5-Kanal-Variante zeigt <strong>eine</strong> höhere Korrelation durch die<br />
kl<strong>eine</strong>ren Öffnungswinkel <strong>de</strong>r virtuellen Mikrofone.
Es kann vermutet wer<strong>de</strong>n, dass <strong>eine</strong> <strong>Doppel</strong>-<strong>MS</strong> Anordnung mit hoher Korrelation eher<br />
für Aufnahmeszenarien eignen, die gute Richtungsabbildung benötigen. Eine gute Abbildung<br />
von Räumlichkeit und Umhüllung („spaciousness“ und „envelopment“) erfor<strong>de</strong>rt<br />
laut Griesinger ([8], [10], [11]) <strong>eine</strong> hohe Dekorrelation <strong>de</strong>r Kanäle.<br />
Bei <strong>eine</strong>r zweikanaligen <strong>MS</strong>-Aufnahme bzw. XY-Aufnahme ist <strong>eine</strong> Diffusfeld-Korrelation<br />
von 0 möglich. Diese Eigenschaft kann allerdings mit <strong>eine</strong>r XY-Anordnung aus zwei<br />
Nieren nicht ausgenützt wer<strong>de</strong>n, da die Korrelation hier nie unter 0.5 sinken kann. Wohl<br />
auch <strong>de</strong>shalb genießt die <strong>MS</strong>- bzw. XY-Aufnahme generell <strong>eine</strong>n schlechteren Ruf als sie<br />
verdient. XY-Aufnahmen wer<strong>de</strong>n in <strong>de</strong>r Fachliteratur oft als mittig, eng und schlecht für<br />
die Abbildung <strong>de</strong>s Raums beschrieben. Diese Eigenschaften sind allerdings die <strong>eine</strong>r XY-<br />
Aufnahme mit hoher Korrelation <strong>–</strong> treffen also auf <strong>eine</strong> optimale XY-Anordnung nicht<br />
o<strong>de</strong>r wesentlich weniger zu.<br />
In Abbildung 14 kann abgelesen wer<strong>de</strong>n, welche Öffnungswinkel <strong>eine</strong> in diesem Sinne<br />
i<strong>de</strong>ale XY-Anordnung ergeben, in <strong>de</strong>m man <strong>de</strong>n jeweiligen Wert auf <strong>de</strong>r x-Achse für <strong>eine</strong><br />
Korrelation von 0 abliest. Folgen<strong>de</strong> Werte lassen sich ermitteln:<br />
- Achten (a=0): 90° (Blumlein-Technik, Aufnahmewinkel 72°)<br />
- Hypernieren (a=0.25): 110° (Aufnahmewinkel 85°)<br />
- Supernieren (a=0.36): 160° (Aufnahmewinkel 64°)<br />
Dies ist auch in [11] beschrieben. Mithilfe <strong>de</strong>r <strong>Doppel</strong>-<strong>MS</strong> Anordnung können diese und<br />
alle an<strong>de</strong>ren koinzi<strong>de</strong>nten Anordnungen erzeugt und somit auf <strong>de</strong>n Parameter Korrelation<br />
optimiert wer<strong>de</strong>n.<br />
Bei mehrkanaliger koinzi<strong>de</strong>nter <strong>Aufnahmetechnik</strong> ist <strong>eine</strong> Diffusfeld-Korrelation von 0<br />
nicht für alle Mikrofonpaare möglich. Je mehr Kanäle erzeugt wer<strong>de</strong>n sollen, <strong>de</strong>sto höher<br />
ist die Gefahr, stark korrelierte Mikrofonpaare zu erzeugen, wie aus obiger Diskussion<br />
hervorgeht.<br />
Die praktischen Konsequenzen für die Aufnahme sind in Abschnitt 4 beschrieben. Es<br />
zeigt sich: Die Gewinnung von 4 Kanälen ist durch geeignete Dekodierung gut möglich.<br />
Eine Gewinnung von 5 Kanälen aus <strong>eine</strong>m koinzi<strong>de</strong>nten System erster Ordnung ist<br />
schwierig und führt nur dann zu guten Ergebnissen, wenn <strong>de</strong>r Tonmeister die Dekodierung<br />
kritisch kontrolliert und gegebenenfalls geeignete Maßnahmen wie Delay, Pegelsenkung<br />
etc. vornimmt (vgl. Abschnitt 4). Eine Gewinnung von mehr als 5 Kanälen<br />
ohne <strong>eine</strong> starke Ähnlichkeit ist nicht möglich <strong>–</strong> <strong>de</strong>shalb muss davor gewarnt wer<strong>de</strong>n,<br />
allzu vollmundige Versprechungen für neue <strong>Surround</strong>formate wie 7.1 o<strong>de</strong>r 10.2 abzugeben.<br />
Allein die Möglichkeit, beliebig viele Kanäle zu gewinnen sagt noch lange<br />
nichts über <strong>de</strong>ren Qualität aus. Lei<strong>de</strong>r existieren sich auch bestimmte Mikrofonsysteme,<br />
die nur <strong>eine</strong> ungenügen<strong>de</strong> Unabhängigkeit <strong>de</strong>r Kanäle bieten. Dieser Aufsatz versucht,<br />
ein einfaches Mikrofonsystem zu beschreiben, das trotz <strong>de</strong>r Einfachheit hohe Qualität<br />
liefert.<br />
3.3. Crosstalk<br />
3.3.1. Theoretische Analyse<br />
Eine Phantomschallquelle entsteht aus <strong>de</strong>r Wie<strong>de</strong>rgabe <strong>eine</strong>s kohärenten Signals auf<br />
zwei Lautsprechern. Gibt man ein kohärentes Signal zusätzlich auf <strong>eine</strong>m dritten Lautsprecher<br />
wie<strong>de</strong>r, so entstehen verstärkt Kammfiltereffekte, die störend hörbar sein<br />
können.<br />
Dieses dritte Signal wird Crosstalk-Signal genannt. Besteht <strong>de</strong>r Crosstalk aus <strong>eine</strong>m<br />
gegenphasigen Signal, ist dies weniger störend als bei <strong>eine</strong>m gleichphasigen.<br />
In <strong>de</strong>r Literatur wird dieses Thema z.B. von Theile [25] behan<strong>de</strong>lt, <strong>de</strong>r Mehrfach-<br />
Abbildungen durch Crosstalk durch geeignete Mikrofonierung vermei<strong>de</strong>n will. Lee und<br />
Rumsey [14] untersuchten verschie<strong>de</strong>ne Mehrkanal-Mikrofonanordnungen und stellten<br />
17
negative Effekte von Crosstalk vor allem auf Aus<strong>de</strong>hnung und Lokalisiertheit <strong>de</strong>r Phantomschallquellen<br />
fest.<br />
Crosstalk bewirkt auch <strong>eine</strong> Verkl<strong>eine</strong>rung <strong>de</strong>r Hörzone, da durch <strong>de</strong>n Präze<strong>de</strong>nzeffekt<br />
schon <strong>eine</strong> geringe Annäherung an diesen Lautsprecher <strong>eine</strong> Fehllokalisation zur Folge<br />
haben kann. Der Effekt auf die Lokalisation abseits <strong>de</strong>s „Sweet Spot“ kann z.B. mit <strong>de</strong>m<br />
Image Assistant [33] simuliert wer<strong>de</strong>n.<br />
Beim Design <strong>eine</strong>r Mikrofonanordnung ist es wichtig, <strong>de</strong>n Crosstalkpegel so gering wie<br />
möglich zu halten. Zur Optimierung <strong>de</strong>r <strong>Doppel</strong>-<strong>MS</strong> Anordnung im Hinblick auf minimalen<br />
Crosstalk zwischen <strong>de</strong>n Kanälen können dieselben For<strong>de</strong>rungen (a und b) <strong>de</strong>s vorigen<br />
Abschnitts 3.2.2 aufgestellt wer<strong>de</strong>n. Auch hier ist <strong>eine</strong> Anordnung aus virtuellen<br />
Supernieren mit größtmöglichem Winkelversatz optimal.<br />
Die in Abbildung 17 gezeigten optimierten Dekodierungen ergeben folgen<strong>de</strong>s Crosstalkverhalten,<br />
<strong>eine</strong> Illustrierung zeigt Abbildung 18:<br />
Abbildung 18a:<br />
Crosstalkpegel <strong>de</strong>r optimierten 4-Kanal<br />
Dekodierung <strong>de</strong>s <strong>Doppel</strong>-<strong>MS</strong> Systems<br />
(schwarz eingefärbte Bereiche: gleichphasig,<br />
rot eingefärbt: gegenphasig)<br />
18<br />
Abbildung 18b:<br />
Crosstalkpegel <strong>de</strong>r optimierten 5-Kanal<br />
Dekodierung <strong>de</strong>s <strong>Doppel</strong>-<strong>MS</strong> Systems<br />
(schwarz eingefärbte Bereiche:<br />
gleichphasig, rot eingefärbt: gegenphasig)<br />
Die 4-Kanal Dekodierung aus Abbildung 17a hat <strong>eine</strong>n maximalen Crosstalkpegel von<br />
ca. -7.5 dB. Dieser Pegel wird an zwei Stellen erreicht, jeweils bei gleichzeitiger Wie<strong>de</strong>rgabe<br />
durch die Lautsprecher L, LS und RS bzw. R, RS und LS. Der Crosstalk im vor<strong>de</strong>ren<br />
Bereich besteht aus <strong>eine</strong>m gegenphasigen Signal und hat nur <strong>eine</strong>n geringen Pegel.<br />
Die 5-Kanal Dekodierung aus Abbildung 17b hat <strong>eine</strong>n maximalen Crosstalkpegel von<br />
ca. -5 dB. Dieser Pegel wird an mehreren Stellen erreicht.<br />
Der Vergleich zwischen <strong>de</strong>n bei<strong>de</strong>n Varianten ergibt <strong>eine</strong> bessere theoretische Qualität<br />
<strong>de</strong>r 4-kanaligen Dekodierung gegenüber <strong>de</strong>r 5-kanaligen. In wieweit ein solches<br />
schlechteres theoretisches Verhalten auch tatsächlich schlechtere praktische Eigenschaften<br />
nach sich zieht, soll die Untersuchung <strong>de</strong>r nächsten Kapitel zeigen.<br />
Zu <strong>eine</strong>r optimalen Dekodierung <strong>de</strong>s <strong>Doppel</strong>-<strong>MS</strong> Systems gehört nicht zuletzt auch ein<br />
gleichmäßiger Pegel <strong>de</strong>r Phantomschallquellen. Die in Abbildung 17 und Abbildung 18<br />
gestrichelt gezeichneten Linien zeigen die gleichmäßige Verteilung <strong>de</strong>s Summenleistungspegels<br />
in allen Richtungen. Der angegebene Crosstalkpegel ist auf diesen Summenleistungspegel<br />
bezogen.<br />
3.3.2. Praktische Analyse<br />
Zur Ermittlung <strong>de</strong>r Wirkungen <strong>de</strong>s Crosstalks auf verschie<strong>de</strong>ne Attribute <strong>de</strong>r Wahrnehmung<br />
wur<strong>de</strong> ein Hörversuch durchgeführt (zu <strong>de</strong>n Details siehe [11]). Ziel <strong>de</strong>r Untersuchung<br />
war die Ermittlung <strong>de</strong>r Wahrnehmbarkeitsschwelle <strong>eine</strong>s Crosstalksignals in Bezug<br />
auf folgen<strong>de</strong> Attribute <strong>de</strong>r Phantomschallquelle:
- Aus<strong>de</strong>hnung<br />
- Richtung<br />
- Lokalisiertheit („Ist die Quelle leicht zu lokalisieren?“)<br />
- Klangfarbe<br />
Die Phantomschallquelle wur<strong>de</strong> zwischen <strong>de</strong>n Lautsprechern Center und Rechts gebil<strong>de</strong>t,<br />
die Pegeldifferenz betrug ΔL (C/R) = 3.7 dB.<br />
Das Crosstalksignal wur<strong>de</strong> im linken Lautsprecher erzeugt, und zwar mit verschie<strong>de</strong>nen<br />
Pegeln von -20 bis -5 dB.<br />
Die Hörversuchsteilnehmer, die im „Sweet Spot“ saßen, hörten jeweils <strong>eine</strong> Testreihe<br />
aus 2 Vierergruppen <strong>de</strong>r Form A-B-A-B und A-C-A-C. A war das Referenzsignal ohne<br />
Crosstalk, genauso wie <strong>eine</strong>s <strong>de</strong>r Signale B o<strong>de</strong>r C. Das an<strong>de</strong>re Signal war <strong>de</strong>r jeweilige<br />
Stimulus mit Crosstalk. Die Zuordnung zu B o<strong>de</strong>r C war randomisiert, wechselte also<br />
ständig und war <strong>de</strong>n Versuchsteilnehmern nicht bekannt. Mit diesem Verfahren sollte<br />
sichergestellt wer<strong>de</strong>n, dass k<strong>eine</strong> negative Bewertung aufgrund <strong>eine</strong>s Vorurteils <strong>de</strong>s<br />
Versuchsteilnehmers zustan<strong>de</strong> kommen konnte.<br />
Die Teilnehmer sollten auf folgen<strong>de</strong>r Skala die Bewertung vornehmen. Wur<strong>de</strong> <strong>de</strong>r Stimulus<br />
in <strong>de</strong>r falsche Vierergruppe vermutet, wur<strong>de</strong> die Bewertung negativ gezählt.<br />
Es nahmen 15 Personen am Versuch teil.<br />
Der Test wur<strong>de</strong> mit verschie<strong>de</strong>nen Testsignalen durchgeführt, darunter trockene Sprache,<br />
Sprachaufnahme im Raum, trockene Kastagnetten und <strong>eine</strong> Kastagnettenaufnahme<br />
im Raum.<br />
Die Ergebnisse dieses Versuchs sind in Abbildung 19 bis Abbildung 23 dargestellt.<br />
Die Abbildungen 18 bis 21 enthalten beispielhaft die Ergebnisse für das Testsignal<br />
Sprachaufnahme im Raum. Die Diagramme zeigen die Hörbarkeit <strong>eine</strong>r Än<strong>de</strong>rung <strong>de</strong>s<br />
jeweiligen Attributs. Dabei wur<strong>de</strong> die oben gezeigte Skala um eins reduziert, um <strong>de</strong>n<br />
Wert 0 als „k<strong>eine</strong> Än<strong>de</strong>rung“ zu <strong>de</strong>finieren. Die wahrgenommene Än<strong>de</strong>rung wird in Abhängigkeit<br />
vom Crosstalkpegel im dritten Lautsprecher angezeigt.<br />
Abbildung 19: aus [11]:<br />
Hörbarkeit <strong>de</strong>r Aus<strong>de</strong>hnungsän<strong>de</strong>rung.<br />
Signal: Sprache, trocken.<br />
Arithmetischer Mittelwert inkl. 95%-<br />
Konfi<strong>de</strong>nzintervalle.<br />
19<br />
Abbildung 20: aus [11]:<br />
Hörbarkeit <strong>de</strong>r Än<strong>de</strong>rung <strong>de</strong>r Lokalisiertheit.<br />
Signal: Sprache, trocken.<br />
Arithmetischer Mittelwert inkl. 95%-<br />
Konfi<strong>de</strong>nzintervalle.
Abbildung 21: aus [11]:<br />
Hörbarkeit <strong>de</strong>r Richtungsän<strong>de</strong>rung.<br />
Signal: Sprache, trocken.<br />
Arithmetischer Mittelwert inkl. 95%-<br />
Konfi<strong>de</strong>nzintervalle.<br />
20<br />
Abbildung 22: aus [11]:<br />
Hörbarkeit <strong>de</strong>r Klangfarbenän<strong>de</strong>rung.<br />
Signal: Sprache, trocken.<br />
Arithmetischer Mittelwert inkl. 95%-<br />
Konfi<strong>de</strong>nzintervalle.<br />
Es zeigt sich, dass Richtungs- und Aus<strong>de</strong>hnungsän<strong>de</strong>rungen eher wahrgenommen wer<strong>de</strong>n<br />
als Än<strong>de</strong>rungen <strong>de</strong>r Lokalisiertheit und <strong>de</strong>r Klangfarbe. Die Wahrnehmbarkeitsschwelle<br />
(relativ zum Summenpegel <strong>de</strong>r Phantomschallquelle C/R) liegt für Richtungsän<strong>de</strong>rungen<br />
bei ca. -12 dB, für Aus<strong>de</strong>hnungsän<strong>de</strong>rungen bei ca. -9 dB. Die Lokalisiertheit<br />
nimmt ab ca. -9 dB ab und die Klangfarbe <strong>de</strong>r Phantomschallquelle än<strong>de</strong>rt sich ab<br />
ca. -6 dB.<br />
Abbildung 23 zeigt die Ergebnisse aller Testsignale für das Attribut Aus<strong>de</strong>hnungsän<strong>de</strong>rung.<br />
Abbildung 23: aus [11]:<br />
Hörbarkeit <strong>de</strong>r Aus<strong>de</strong>hnungsän<strong>de</strong>rung, Ergebnisse für alle 4 Testsignale.<br />
Arithmetischer Mittelwerte.<br />
Diese Ergebnisse machen <strong>de</strong>utlich, dass Crosstalk soweit wie möglich vermie<strong>de</strong>n wer<strong>de</strong>n<br />
sollte, um negative Effekte zu vermei<strong>de</strong>n. Dies ist möglich, wenn das <strong>Doppel</strong>-<strong>MS</strong> Signal<br />
optimal <strong>de</strong>kodiert wird. Der Crosstalk <strong>de</strong>r optimierten Dekodierungen ist, abhängig von<br />
<strong>de</strong>r Variante, allerdings immer noch knapp über <strong>de</strong>r Wahrnehmbarkeitsschwelle für<br />
einzelne Attribute.<br />
4. Praktische Untersuchung anhand von verschie<strong>de</strong>nen<br />
Testaufnahmen<br />
Es gilt zwar: „Nichts ist praktischer als <strong>eine</strong> gute Theorie“ (Gerhard Steinke), aber <strong>de</strong>nnoch<br />
hat die Theorie ihre Grenzen und kann noch lange nicht alles erklären, was unsere<br />
Wahrnehmung bestimmt. Deshalb ist für <strong>eine</strong> Diskussion <strong>de</strong>r <strong>Doppel</strong>-<strong>MS</strong> Anordnung<br />
auch <strong>eine</strong> praktische Untersuchung notwendig.
Die Zielsetzungen <strong>de</strong>r praktischen Untersuchung sind:<br />
- Test verschie<strong>de</strong>ner Dekodierungsvarianten<br />
- Überprüfung <strong>de</strong>r in <strong>de</strong>n vorangegangenen Kapiteln besprochenen Vor- und<br />
Nachteile <strong>de</strong>r <strong>Doppel</strong>-<strong>MS</strong> <strong>Aufnahmetechnik</strong><br />
- Test <strong>de</strong>r Anwendbarkeit <strong>de</strong>r <strong>Doppel</strong>-<strong>MS</strong> <strong>Aufnahmetechnik</strong> in verschie<strong>de</strong>nen Aufnahmeszenarien,<br />
darunter Musik, Atmo, Theater-Aufzeichnung, Hörspiel, Dokumentation/Film,<br />
Fernsehstudio<br />
- Vergleich <strong>de</strong>s <strong>Doppel</strong>-<strong>MS</strong> Systems mit an<strong>de</strong>ren Referenzanordnungen<br />
Die Qualität <strong>eine</strong>r Aufnahme ist mit wissenschaftlichen Mitteln nicht leicht zu bewerten.<br />
Zu sehr schwanken die unterschiedlichen Erwartungshaltungen und Prioritäten <strong>de</strong>r<br />
verschie<strong>de</strong>nen Hörer. Deshalb sollen hier auch k<strong>eine</strong> allgem<strong>eine</strong>n Ergebnisse postuliert,<br />
son<strong>de</strong>rn nur unsere Erfahrungen und die gesammelten Kommentare an<strong>de</strong>rer beschrieben<br />
wer<strong>de</strong>n.<br />
4.1. Verschie<strong>de</strong>ne Varianten <strong>de</strong>r Dekodierung von <strong>Doppel</strong>-<strong>MS</strong><br />
Die folgen<strong>de</strong>n, mit <strong>de</strong>n Buchstaben A-F bezeichneten Varianten <strong>de</strong>r Dekodierung <strong>de</strong>r<br />
<strong>Doppel</strong>-<strong>MS</strong> Signale sind in <strong>de</strong>r praktischen Untersuchung betrachtet wor<strong>de</strong>n (siehe<br />
[13]). Neben <strong>de</strong>n Polardiagrammen und <strong>de</strong>r Beschreibung <strong>de</strong>r Öffnungswinkel <strong>de</strong>r resultieren<strong>de</strong>n<br />
Ausgangskanäle ist jeweils die genaue Pegelmatrix abgebil<strong>de</strong>t, mit <strong>de</strong>r die<br />
Dekodierung erreicht wur<strong>de</strong>.<br />
Außer<strong>de</strong>m wird auch das jeweils verwen<strong>de</strong>te Delay <strong>de</strong>r hinteren Kanäle angegeben.<br />
A) 4 Supernieren � Dekodierung wie MD<strong>MS</strong> U (4ch),<br />
siehe Abschnitt 5 b)<br />
Die Richtcharakteristik Superniere hat sich als guter<br />
Kompromiss herausgestellt. Aufgrund <strong>de</strong>r starken<br />
Richtwirkung <strong>de</strong>r Superniere bei <strong>eine</strong>r maximalen<br />
Schallunterdrückung im hinteren Halbraum ist diese<br />
Einstellung nur von sehr geringem Crosstalk behaftet.<br />
Vorteilhaft ist <strong>de</strong>r Verzicht auf <strong>de</strong>n Center-Kanal, da so<br />
größere Öffnungswinkel möglich wer<strong>de</strong>n.<br />
Die Richtungsabbildung ist im gesamten Bereich ausgewogen<br />
und präzise. Der Aufnahmewinkel für die<br />
Basis L/R im vor<strong>de</strong>ren Bereich beträgt 110°.<br />
Die Unterdrückung von Direktschall in <strong>de</strong>n hinteren<br />
Kanälen funktioniert gut.<br />
Diese Eigenschaften prä<strong>de</strong>stinieren diese Dekodierung<br />
für Musikaufnahme und Hörspiel, ob allerdings die<br />
Varianten mit Center bevorzugt wer<strong>de</strong>n, hängt nach<br />
<strong>de</strong>r Erfahrung <strong>de</strong>s Autors stark von <strong>de</strong>r Intention und<br />
<strong>de</strong>m Geschmack <strong>de</strong>s einzelnen ab.<br />
21
B) 4 Supernieren, etwas breitere Abbildung<br />
Um <strong>de</strong>n Aufnahmewinkel <strong>eine</strong>r Stereoabbildung zu<br />
verkl<strong>eine</strong>rn, muss entwe<strong>de</strong>r <strong>de</strong>r Versatzwinkel zwischen<br />
<strong>de</strong>n Mikrofonen vergrößert o<strong>de</strong>r <strong>de</strong>ren Richtwirkung<br />
erhöht wer<strong>de</strong>n. Dieses Beispiel unterschei<strong>de</strong>t sich<br />
nur sehr geringfügig vom vorangegangenen, <strong>de</strong>nn<br />
je<strong>de</strong>r Versuch, <strong>de</strong>n L/R-Aufnahmewinkel wesentlich zu<br />
verkl<strong>eine</strong>rn und gleichzeitig <strong>eine</strong> stereofone Abbildung<br />
in LS/RS zu behalten, wür<strong>de</strong> zu <strong>eine</strong>r sehr ungleichmäßigen<br />
Energieverteilung und starkem Übersprechen<br />
<strong>de</strong>r Kanäle führen. Bei dieser Einstellung beträgt <strong>de</strong>r<br />
L/R-Aufnahmewinkel ca. 90° (im Vergleich zu ca. 110°<br />
im Variante A).<br />
C) „konventionelle“ <strong>MS</strong>-Dekodierung 4ch<br />
Diese Dekodierung wur<strong>de</strong> als Negativbeispiel mit in die<br />
Vergleiche aufgenommen. Die starke Rückwärtsempfindlichkeit<br />
<strong>de</strong>r Mikrofone bewirkt ein <strong>de</strong>utliches Übersprechen<br />
und damit starke klangliche Unregelmäßigkeiten<br />
für Hörer außerhalb <strong>de</strong>s „Sweet Spots“.<br />
Die Energieverteilung ist nicht optimal.<br />
Die Hörergebnisse zeigen, dass diese Variante klanglich<br />
und räumlich schlecht beurteilt wird.<br />
´<br />
D) 5 Supernieren � Dekodierung wie MD<strong>MS</strong> U (5ch),<br />
siehe Abschnitt 5 b)<br />
Um <strong>eine</strong> gleichmäßige Energieverteilung und ausgewogene<br />
Lokalisation zu erhalten, sind die Supernieren<br />
für L/R gegenüber <strong>de</strong>r 4-kanaligen Ausführung weiter<br />
nach außen gedreht. Die Abbildung ist ausgewogen,<br />
die Stabilität durch <strong>de</strong>n Center-Kanal gegeben. Ob<br />
diese o<strong>de</strong>r Variante A für Aufnahmen mit ausgewogener<br />
Abbildung Verwendung fin<strong>de</strong>t ist auch Geschmackssache.<br />
Der Center-Pegel kann reduziert wer<strong>de</strong>n, um Crosstalk<br />
vorne zu vermei<strong>de</strong>n und die Richtungsabbildung zu<br />
verbessern. Klanglich ist die 5-Kanal-Variante ohne<br />
22
weitere Maßnahmen <strong>de</strong>r 4-Kanal-Variante unterlegen,<br />
allerdings kann <strong>de</strong>r Center-Kanal durchaus <strong>eine</strong> wichtige<br />
Rolle bei Programm-wichtigem Inhalt übernehmen,<br />
z.B. für Soloinstrumente o<strong>de</strong>r im Hörspiel. Außer<strong>de</strong>m<br />
kann er Stabilität bieten.<br />
E) „konventionelle“ <strong>MS</strong>-Dematrizierung 5ch<br />
Diese Dekodierung wur<strong>de</strong> ebenfalls als Negativbeispiel<br />
mit in die Vergleiche aufgenommen. In dieser<br />
Einstellung überlappen sich die Kanäle beson<strong>de</strong>rs<br />
stark.<br />
Diese Einstellung zeigt auch im praktischen Versuch,<br />
dass <strong>eine</strong> schlechte Dekodierung ohne Kontrolle<br />
schlechte Ergebnisse liefert. Unangenehme<br />
Klangfarbe und mangeln<strong>de</strong> räumliche Transparenz<br />
sind die Folge. Die Klangfarbe än<strong>de</strong>rt sich schon mit<br />
kl<strong>eine</strong>n Kopfbewegungen.<br />
F) Verzögerte <strong>Surround</strong>kanäle<br />
Diese Einstellung stellt <strong>eine</strong> Verbesserung <strong>de</strong>r 5-<br />
Kanal-Variante D dar, da die Unabhängigkeit <strong>de</strong>r<br />
Kanäle vergrößert wird: sowohl vorne durch die<br />
Vergrößerung <strong>de</strong>s Öffnungswinkels als auch zwischen<br />
vorne und hinten durch das Delay<br />
(Δt=10ms).<br />
Diese Variante kann für viele Aufnahmeszenarien<br />
die optimale Lösung sein, wenn <strong>de</strong>r Center-Kanal<br />
gewünscht wird. Allerdings muss natürlich ein Vorne-bezogenes<br />
Klangbild vorliegen, <strong>de</strong>nn das Delay<br />
verhin<strong>de</strong>rt die stabile Hinten-Ortung.<br />
23
4.2. Subjektive Erfahrungen mit <strong>Doppel</strong>-<strong>MS</strong> Aufnahmen<br />
Die Erfahrungen mit verschie<strong>de</strong>nen Aufnahmeszenarien zeigten in vielen Fällen, dass<br />
die <strong>Doppel</strong>-<strong>MS</strong> <strong>Aufnahmetechnik</strong> durchaus gute bis sehr gute Ergebnisse lieferte. Hier<br />
sind unsere subjektiven Erfahrungen wie<strong>de</strong>rgegeben, die auch mit einigen an<strong>de</strong>ren<br />
diskutiert wer<strong>de</strong>n konnten und sich oft mit <strong>de</strong>ren Erfahrungen <strong>de</strong>ckten.<br />
So war z.B. <strong>eine</strong> Atmo mit vielen Direktschallanteilen in allen Richtungen (Marktplatz)<br />
gut darstellbar und zeigte in <strong>de</strong>r 4-Kanal-Dekodierung ähnliche Qualität wie das simultan<br />
aufgezeichnete IRT-Kreuz. Die Flexibilität <strong>de</strong>r Richtungsabbildung nach <strong>de</strong>r <strong>Doppel</strong>-<br />
<strong>MS</strong> Aufnahme stellte sich für die schräg vorbeifahren<strong>de</strong> Straßenbahn als echter Vorteil<br />
heraus.<br />
Eine Atmo, die mehr auf <strong>eine</strong> effektvolle Räumlichkeit zielte (Feuerwerk am Volksfest),<br />
konnte mit <strong>de</strong>m IRT-Kreuz besser und effektvoller wie<strong>de</strong>rgegeben wer<strong>de</strong>n. Das IRT-<br />
Kreuz kann gleichzeitig <strong>eine</strong> gute 360°-Abbildung liefern und <strong>eine</strong>n guten Eindruck von<br />
Umhüllung und Räumlichkeit liefern.<br />
Einige Musikaufnahmen (Klavierkonzert, Kammermusik, großes Orchester) gelangen<br />
überraschend gut mit <strong>de</strong>m <strong>Doppel</strong>-<strong>MS</strong> System, das parallel aufgezeichnete OCT <strong>Surround</strong><br />
Setup lieferte jedoch sehr gute, effektvollere und raumbetonte Ergebnisse. Eine<br />
Entscheidung zwischen diesen Verfahren bleibt <strong>de</strong>m Geschmack <strong>de</strong>s Tonmeisters überlassen.<br />
In unserer Erfahrung kann <strong>Doppel</strong>-<strong>MS</strong> eher kl<strong>eine</strong> Klangkörper darstellen, bei<br />
größeren Klangkörpern in großen Räumen bieten sich eher OCT <strong>Surround</strong> o<strong>de</strong>r an<strong>de</strong>re<br />
Verfahren an. Bei Musikaufnahmen ist die Verwendung <strong>eine</strong>r zusätzlichen Tiefpaßgefilterten<br />
Kugel zur Aufnahme tiefster Frequenzen empfehlenswert. Die Mischung <strong>de</strong>r<br />
<strong>Doppel</strong>-<strong>MS</strong> Signale mit <strong>eine</strong>r Groß-AB Kugel-Aufstellung im Raum brachte außer<strong>de</strong>m<br />
<strong>de</strong>n gewünschten weiträumigen Klang <strong>de</strong>s Raums. Letztere Lösung liefert außer<strong>de</strong>m<br />
<strong>de</strong>korrelierte Tieffrequenzsignale.<br />
Ein A-Cappella Ensemble, das <strong>eine</strong> schöne Abbildung zwischen <strong>de</strong>n Lautsprechern erfor<strong>de</strong>rte,<br />
wur<strong>de</strong> mit <strong>Doppel</strong>-<strong>MS</strong> sehr gut wie<strong>de</strong>rgegeben, bei<strong>de</strong> Dekodierungsvarianten mit<br />
und ohne Center waren möglich.<br />
Ein Jazz-Ensemble in <strong>eine</strong>m Jazzclub mit Publikum wur<strong>de</strong> mit <strong>Doppel</strong>-<strong>MS</strong> und einzelnen<br />
Mikrofonen für die Instrumente aufgezeichnet. Die Atmosphäre und <strong>de</strong>r Raumklang in<br />
<strong>de</strong>n <strong>Doppel</strong>-<strong>MS</strong> Signalen ergänzte gut die Mischung <strong>de</strong>r Instrumentenmikrofone. Ein<br />
parallel aufgezeichnetes <strong>Doppel</strong>-ORTF-Mikrofon lieferte <strong>eine</strong> ähnlich gute, allerdings<br />
weniger flexible Raumabbildung. Die Flexibilität war wichtig, da in <strong>de</strong>r Mischung <strong>de</strong>r<br />
Wunsch nach <strong>eine</strong>r unterschiedlichen Einstellung <strong>de</strong>r Stereobreite bei Musikpassagen<br />
und Applauspassagen entstand.<br />
Abbildung 24: Testaufnahmen mit <strong>de</strong>m <strong>Doppel</strong>-<strong>MS</strong> System und Referenzanordnungen:<br />
links: <strong>Doppel</strong>-<strong>MS</strong> und OCT <strong>Surround</strong> System bei <strong>eine</strong>r Theater-Live-Aufzeichnung<br />
rechts: <strong>Doppel</strong>-<strong>MS</strong> und IRT-Kreuz bei <strong>eine</strong>r Atmoaufnahme am Durlacher Marktplatz.<br />
Die Theater-Live-Aufnahme gelang mit <strong>de</strong>m <strong>Doppel</strong>-<strong>MS</strong> besser als mit OCT. Grund dafür<br />
war wohl die schlechte Räumlichkeit, da die Mikrofone schon im Bühnenhaus hängen<br />
24
mussten und <strong>de</strong>ssen Akustik einfingen. Das <strong>Doppel</strong>-<strong>MS</strong> System stellte <strong>de</strong>n Raum weniger<br />
in <strong>de</strong>n Vor<strong>de</strong>rgrund.<br />
Eine Live-Aufzeichnung <strong>eine</strong>r TV-Sendung mit Publikum gelang sowohl mit IRT-Kreuz<br />
als auch <strong>Doppel</strong>-<strong>MS</strong> gut.<br />
Die Verwendung <strong>de</strong>s <strong>Doppel</strong>-<strong>MS</strong> Setups bei Hörspielaufnahmen bietet sich schon <strong>de</strong>shalb<br />
an, da hier koinzi<strong>de</strong>nte Techniken gerne verwen<strong>de</strong>t wer<strong>de</strong>n und die <strong>Doppel</strong>-<strong>MS</strong><br />
Technik mehr Flexibilität und natürlich die Mehrkanalfähigkeit bietet. Außer<strong>de</strong>m ist<br />
gera<strong>de</strong> bei Hörspielen Abwärts- bzw. sogar Monokompatibilität gefor<strong>de</strong>rt, die mit <strong>de</strong>r<br />
<strong>Doppel</strong>-<strong>MS</strong> Technik i<strong>de</strong>al erreicht wird.<br />
Die Anwendung <strong>de</strong>r <strong>Doppel</strong>-<strong>MS</strong> Technik im Filmton ist seit einiger Zeit bewährte Praxis.<br />
Eine Anwendung <strong>de</strong>s <strong>Doppel</strong>-<strong>MS</strong> Systems im Dokumentarfilm brachte neue I<strong>de</strong>en bei<br />
<strong>de</strong>r Auswahl <strong>de</strong>r Mikrofone, siehe auch [37]: Es ist manchmal sinnvoll, die nach vorne<br />
gerichtete Niere durch <strong>eine</strong> stärker gerichtete Kapsel zu ersetzen, da dieses Mikrofon<br />
diskret für das Dialogsignal im Center verwen<strong>de</strong>t wer<strong>de</strong>n soll. Deshalb kann entwe<strong>de</strong>r<br />
<strong>eine</strong> Superniere verwen<strong>de</strong>t wer<strong>de</strong>n, o<strong>de</strong>r aber es wird ein Rohrrichtmikrofon eingesetzt.<br />
Letzteres erfor<strong>de</strong>rt allerdings <strong>eine</strong> spezielle Anordnung, die weiterhin <strong>eine</strong> optimale<br />
Koinzi<strong>de</strong>nz ermöglicht, siehe Abbildung 25. Die <strong>Doppel</strong>-<strong>MS</strong> Technik bewährte sich gut in<br />
dieser Anwendung, die Vorteile <strong>de</strong>s <strong>Surround</strong>-Tons an <strong>de</strong>r Angel zeigten sich vor allem<br />
dadurch, dass bei <strong>de</strong>r Dokumentarfilmproduktion die Authentizität im <strong>Surround</strong>-Ton<br />
<strong>eine</strong> wichtige Rolle spielt und <strong>de</strong>shalb oft die subjektive Tonperspektive verwen<strong>de</strong>t<br />
wer<strong>de</strong>n kann.<br />
Abbildung 25: Die <strong>Doppel</strong>-<strong>MS</strong> Anordnung mit Rohrrichtmikrofon<br />
links: Realisierung mit <strong>de</strong>m Schoeps Double-M/S Set „CMIT“<br />
(verwen<strong>de</strong>te Mikrofone: CMIT 5U, CCM 4 und CCM 8)<br />
rechts: bei <strong>de</strong>r Anwendung, [37], Foto: André Zacher<br />
5. Werkzeuge zur Dekodierung von <strong>Doppel</strong>-<strong>MS</strong><br />
Da die Anwendungsbereiche <strong>de</strong>r <strong>Doppel</strong>-<strong>MS</strong> Anordnung sehr verschie<strong>de</strong>n sind, existieren<br />
mehrere Möglichkeiten, die Dekodierung vorzunehmen. Dabei ist es egal, ob während<br />
<strong>de</strong>r Aufnahme o<strong>de</strong>r in <strong>de</strong>r Nachbearbeitung (Postproduktion) <strong>de</strong>kodiert wird.<br />
Folgen<strong>de</strong> drei grundsätzliche Möglichkeiten zur Dekodierung wer<strong>de</strong>n erläutert:<br />
a) zwei <strong>MS</strong>-Matrizen in Mischpult o<strong>de</strong>r Schnittsoftware<br />
b) Hardware <strong>Doppel</strong>-<strong>MS</strong> Matrix MD<strong>MS</strong> U<br />
c) Software VST Plugin „Double M/S Tool“<br />
zu a) <strong>Doppel</strong>-<strong>MS</strong> Signale können grundsätzlich genauso wie <strong>MS</strong>-Aufnahmen <strong>de</strong>kodiert<br />
wer<strong>de</strong>n, dazu wer<strong>de</strong>n dann zwei statt nur <strong>eine</strong>r <strong>MS</strong>-Matrix verwen<strong>de</strong>t. Außer<strong>de</strong>m<br />
kann die vor<strong>de</strong>re Niere auch als Center-Signal verwen<strong>de</strong>t wer<strong>de</strong>n. Diese Metho<strong>de</strong><br />
wird in vielen Fällen gute Ergebnisse liefern, das Ergebnis sollte aber vom Tonmeister<br />
kontrolliert wer<strong>de</strong>n, da auch ungünstige Dekodierungen entstehen könnten<br />
(vgl. Abschnitt 4). Falls die <strong>Doppel</strong>-<strong>MS</strong> Technik mit <strong>eine</strong>m Rohrrichtmikrofon<br />
25
als M-Signal verwen<strong>de</strong>t wird, wird diese Metho<strong>de</strong> empfohlen, da <strong>eine</strong> Mischung<br />
zwischen hinterer Niere und Rohrrichtmikrofon k<strong>eine</strong>n Sinn macht.<br />
26<br />
Abbildung 26:<br />
konventionelle <strong>Doppel</strong>-<strong>MS</strong><br />
Dekodierung nach Variante a)<br />
Wie in <strong>de</strong>n vorigen Abschnitten besprochen, lassen sich die Eigenschaften <strong>de</strong>r <strong>Doppel</strong>-<br />
<strong>MS</strong> Anordnung mithilfe <strong>eine</strong>r geeigneten Dekodierung verbessern. Diese Dekodierung<br />
erfor<strong>de</strong>rt die Einbeziehung aller drei Kapseln zur Synthese <strong>de</strong>r Signale L/R/LS/RS und<br />
<strong>de</strong>r zwei Nieren für <strong>de</strong>n Center-Kanal. Diese Dekodierung ist zwar mithilfe von Pegel-<br />
Matrizen o<strong>de</strong>r im Mischpult möglich, aber generell umständlich. Deshalb ist die Verwendung<br />
spezieller Werkzeuge hilfreich, die diese optimierte Dekodierung ermöglichen:<br />
zu b) Hardware-Matrix Schoeps MD<strong>MS</strong> U<br />
Diese analoge, passive Matrix liefert die 4 bzw. 5 <strong>de</strong>kodierten Kanäle<br />
L/R/C/LS/RS aus <strong>de</strong>n drei <strong>Doppel</strong>-<strong>MS</strong> Signalen. Sie kann direkt bei <strong>de</strong>r Aufnahme<br />
im Mikrofonkabel verwen<strong>de</strong>t wer<strong>de</strong>n o<strong>de</strong>r aber in <strong>de</strong>r Nachbearbeitung. Sie<br />
bietet die bei<strong>de</strong>n Dekodierungsvarianten A und D aus Abschnitt 4. In <strong>de</strong>r Matrix<br />
wird die Empfindlichkeit <strong>de</strong>r Schoeps-Kapseln angeglichen.<br />
Abbildung 27:<br />
Hardware Matrix<br />
Schoeps MD<strong>MS</strong> U<br />
zu c) Software VST PlugIn „Double M/S Tool“<br />
Dieses PlugIn wird in <strong>eine</strong>m Sequencerprogramm mit Multichannel VST-<br />
Schnittstelle verwen<strong>de</strong>t. Es eignet sich hervorragend zur flexiblen und intuitiven<br />
Dekodierung <strong>de</strong>r <strong>Doppel</strong>-<strong>MS</strong> Signale. Die Bedienung ist selbsterklärend, da alle<br />
Än<strong>de</strong>rungen sofort in <strong>de</strong>n Polardiagrammen visualisiert wer<strong>de</strong>n. Auch die Audio-<br />
Ausgangssignale wer<strong>de</strong>n in Echtzeit mit <strong>de</strong>n aktuellen Parametern geän<strong>de</strong>rt.<br />
Ebenso wie die Hardware hat das PlugIn drei Eingangskanäle (die Signale <strong>de</strong>r<br />
<strong>Doppel</strong>-<strong>MS</strong> Anordnung) und 5 Ausgangskanäle (L/C/R/LS/RS). Im PlugIn wird<br />
automatisch die unterschiedliche Empfindlichkeit <strong>de</strong>r Schoeps-Kapseln angepasst<br />
und <strong>eine</strong> Entzerrung <strong>de</strong>r Kapsel CCM/MK 8 vorgenommen.<br />
Das PlugIn ist kostenlos zum Download verfügbar [21]. Außer<strong>de</strong>m wer<strong>de</strong>n kurze<br />
Audio-Samples von <strong>Doppel</strong>-<strong>MS</strong> verfügbar sein, damit das PlugIn ausprobiert wer-
<strong>de</strong>n kann.<br />
Es ist bisher nur für Windows erhältlich.<br />
6. Danksagung<br />
27<br />
Abbildung 28:<br />
VST PlugIn<br />
„Double M/S Tool“<br />
Ich will mich für die hervorragen<strong>de</strong> Arbeit bedanken, die Christopher Haut innerhalb<br />
s<strong>eine</strong>r Diplomarbeit und Daniel Keinath innerhalb s<strong>eine</strong>s Praktikums in ihrer Zeit bei <strong>de</strong>r<br />
Firma Schoeps an diesem Thema geleistet haben.<br />
Herzlicher Dank geht auch an Prof.Dr.Jörg Bitzer vom IHA <strong>de</strong>r Fachhochschule Ol<strong>de</strong>nburg<br />
für s<strong>eine</strong> Unterstützung.<br />
7. Literatur<br />
[1] Benjamin E., Chen T.: “The native B-format Microphone, Part I”, 119th AES Convention,<br />
New York, 2005, Preprint No.6621<br />
[2] Brittain, F. H., Leakey, D. M.: "Two-channel stereophonic sound systems. Wireless World<br />
206-210, 1956<br />
[3] Camerer, F.: „Practical <strong>Surround</strong>-Sound-Production - Part 2: TV-Documentaries“, AES 19th<br />
International Conference, Ellmau, May 2001<br />
[4] Cremer: „Zur Verwendung <strong>de</strong>r Worte Korrelationsgrad und Kohärenzgrad“, ACUSTICA,<br />
Vol.35, No.3, p.215-218, Juni 1976<br />
[5] Damaske, P.: „Subjektive Untersuchung von Schallfel<strong>de</strong>rn“, ACUSTICA, Vol.19, No.4,<br />
p.199-213, 1967/1968<br />
[6] Flock, S.: “Theoretische sowie objektive und subjektive Messungen am Soundfield-<br />
Mikrofon”, Diplomarbeit im Studiengang Ton und Bild, FH Düsseldorf<br />
[7] Gerzon, M.: “Periphony: With-Height Sound Reproduction”, Journal of the Audio Engineering<br />
Society, 21(1):2-10, 1973.<br />
[8] Griesinger, D.: „Spaciousness and Localization in Listening rooms <strong>–</strong> how to make coinci<strong>de</strong>nt<br />
recordings sound as spacious as spaced microphone arrays“, 79th AES Convention, New<br />
York, 1985, Preprint No.2294<br />
[9] Griesinger, D.: „New Perspectives on Coinci<strong>de</strong>nt and Semi Coinci<strong>de</strong>nt Microphone Arrays“,<br />
82nd AES Convention, London, 1987, Preprint No.2464<br />
[10] Griesinger, D.: „Physik, Psychoakustik und <strong>Surround</strong>-Technik“, Production Partner Spezial<br />
21.Tonmeistertagung, Musik-Media-Verlag Ulm, 2000, 2.
[11] Griesinger, D.: „Räumliches Hören in Theorie und Praxis: Wie ergänzt man Tiefe und Halligkeit<br />
mit künstlichem Nachhall ohne Beeinträchtigung <strong>de</strong>r Deutlichkeit - The Theory and<br />
Practice of Perceptual Mo<strong>de</strong>ling - How to use Electronic Reverberation to Add Depth and<br />
Envelopment Without Reducing Clarity”, www.world.std.com/~griesngr, Stand Oktober<br />
2006<br />
[12] Haut, C.: „Programmierung und Evaluierung <strong>eine</strong>r parametrisierbaren <strong>Doppel</strong>-<strong>MS</strong> Dekodierung<br />
für <strong>eine</strong> 5.1 <strong>Surround</strong>-Abmischung“, Diplomarbeit <strong>de</strong>s Studienganges Hörtechnik &<br />
Audiologie an <strong>de</strong>r FH Ol<strong>de</strong>nburg, 2006.<br />
[13] Keinath, D.: „Testaufnahmen mit <strong>de</strong>m <strong>Doppel</strong>-<strong>MS</strong> Verfahren“, interner Praktikumsbericht<br />
<strong>de</strong>r Firma Schoeps, Karlsruhe, 2005.<br />
[14] Lee, H. K. und Rumsey F.: ” Investigation into the effect of interchannel Crosstalk in Multichannel<br />
Microphone Technique”, 119 th AES Convention, New York 2005, Preprint No.6374.<br />
[15] Lipshitz, S.P.: "Stereo Microphone Techniques: Are the Purists Wrong?", AES Convention,<br />
Anaheim, May 1985, Preprint No.2261<br />
[16] Leakey, D. M.: "Further thoughts on stereophonic sound systems". Wireless World, 154-<br />
160, 1960<br />
[17] Martin, G.: „The Significance of Interchannel Correlation, Phase and Amplitu<strong>de</strong> Differences<br />
on Multichannel Microphone Techniques“, 113th AES Convention, 2002, Los Angeles,<br />
Preprint No.5671<br />
[18] Mertens, H.: "Directional hearing in stereophony theory and experimental verification”,<br />
Europ. Broadcasting Union Rev. Part A, 92, 1-14, 1965<br />
[19] Pfanzagl, E.: „Über die Wichtigkeit ausreichen<strong>de</strong>r Dekorrelation bei 5.1 <strong>Surround</strong>-<br />
Mikrofonsignalen zur Erzielung besserer Räumlichkeit“, Bericht zur Tonmeistertagung 2002,<br />
Hannover<br />
[20] Schoeps-website: www.schoeps.<strong>de</strong>, Stand 2006<br />
[21] Schoeps-website: Download <strong>de</strong>s VST-PlugIn „Double M/S Tool“ unter<br />
www.schoeps.<strong>de</strong>/dmsplugin.htm, Stand 2006<br />
[22] Sengpiel, E., Vorlesungsunterlagen: „Theoriegrundlagen:“Intensitäts“-Stereofonie“, „Theoriegrundlagen:<br />
Laufzeitstereofonie“,<br />
http://www.sengpielaudio.com/TheorieGrundlaIntensitaet.pdf,<br />
http://www.sengpielaudio.com/TheorieGrundlaLaufzeit.pdf, Stand 12. Mai 2006<br />
[23] Simonson, G.: Master´s Thesis. Lyngby, Denmark, 1984<br />
[24] Soundfield-website: www.soundfield.com, Stand 2006<br />
[25] Theile, G.: “Multichannel natural recording based on psychoacoustics principles”, 108th AES<br />
convention, 2000, Preprint No. 5156.<br />
[26] Theile, G.: "On the performance of two-channel and multi-channel stereophony", 88th AES<br />
Convention, 1990, Preprint No.2932<br />
[27] Williams, M.: “Multichannel sound recording practice using microphone arrays”, 24th AES<br />
International Conference.<br />
[28] Williams, M.: “The Stereophonic Zoom: A Practical Approach to Determining the Characteristics<br />
of a Spaced Pair of Directional Microphones”, 75 th AES Convention, 1984, Preprint<br />
No.2072<br />
[29] Williams, M.: “Microphone Arrays for Stereo and Multichannel Sound recording”, Il Rostro,<br />
Milan, 2000<br />
[30] Wittek, H., Theile, G.: Investigations on directional imaging using L-C-R stereo microphones.<br />
(German), 21. Tonmeistertagung 2000, Proceedings pp. 432-455<br />
[31] Wittek, H., Theile, G.: „The recording angle <strong>–</strong> based on localization curves“, 112th AES<br />
Convention, Munich 2002, Preprint No.5568<br />
[32] Wittek, H.: „Untersuchungen zur Richtungsabbildung mit L-C-R <strong>Hauptmikrofon</strong>en“, Diplomarbeit<br />
<strong>de</strong>s Studienganges Ton- und Bildtechnik an <strong>de</strong>r FH Düsseldorf, 2000.<br />
28
[33] Wittek, H., „Image Assistant“, Java Applet auf www.hauptmikrofon.<strong>de</strong>, Stand 2006<br />
[34] Wittek, H., Neumann, O., Schaeffler, M, Millet, C.: „Studies on Main and Room Microphone<br />
Optimization“, AES 19th Int.Conference, Ellmau, 2001<br />
[35] Wolfram-Homepage, Lösungen zu Kugelflächenfunktionen,<br />
http://mathworld.wolfram.co<strong>MS</strong>phericalHarmonic.html, Stand: Juni 2006.<br />
[36] Wuttke, J.: Principles of microphones and stereo recordings, in: Mikrofonaufsätze, auf<br />
www.schoeps.<strong>de</strong>, Stand 2006<br />
[37] Zacher, A.: „Dragonsongs <strong>–</strong> Lang Lang in China, Dokumentarischer Dreh“, Bericht auf<br />
http://www.proaudio.<strong>de</strong>/reports/praxis/langlang/in<strong>de</strong>x.html, Stand: Oktober 2006<br />
Anhang<br />
Zur Begrifflichkeit <strong>de</strong>r Korrelation und <strong>de</strong>r Kohärenz im Zusammenhang mit <strong>de</strong>r Analyse<br />
<strong>de</strong>r <strong>Aufnahmetechnik</strong>:<br />
Cremer beschreibt in [4] die Definitionen <strong>de</strong>r Begrifflichkeiten recht anschaulich. Auf<br />
diese Quelle bezieht sich <strong>de</strong>r Autor dieses Aufsatzes.<br />
Die Korrelation ist ein Maß für die Ähnlichkeit zweier Signale im Zeitbereich. Es existieren<br />
zwei wichtige Begriffe: Korrelationsgrad und Korrelationsfunktion.<br />
Der Korrelationsgrad gibt die Korrelation bei <strong>de</strong>r Laufzeit τ = 0 an:<br />
+ T 2<br />
p1(<br />
t)<br />
p2(<br />
t)<br />
1<br />
χ = ~ p ~<br />
mit p 1 ( t)<br />
p2(<br />
t)<br />
= lim<br />
1p<br />
→∞<br />
∫ p1<br />
T<br />
2<br />
T −T<br />
2<br />
29<br />
( t)<br />
p ( t)<br />
dt<br />
Erläuterung: Der Korrelationsgrad χ ist <strong>de</strong>r Quotient aus <strong>de</strong>m Produkt <strong>de</strong>r Signale p1<br />
und p2, gemittelt über <strong>de</strong>r Zeit T, und <strong>de</strong>m Produkt <strong>de</strong>r Effektivwerte<br />
(=Autokorrelationsfunktionen zum Zeitpunkt 0). Der Nenner sorgt dafür, dass <strong>de</strong>r Korrelationsgrad<br />
„normiert“ ist, das heißt, er nimmt nur Werte zwischen -1 und 1 an. Das<br />
heißt auch: Der Korrelationsgrad ist nicht abhängig vom Pegelverhältnis <strong>de</strong>r bei<strong>de</strong>n<br />
Signale. Der Korrelationsgrad ist kein guter Wert, um Stereofonie mit Laufzeiten zu<br />
überprüfen, da er nur <strong>de</strong>n Zeitpunkt τ = 0 analysiert. Trotz<strong>de</strong>m wird <strong>de</strong>r Korrelationsgrad<br />
meistens größer 0 sein, wenn AB-Stereofonie verwen<strong>de</strong>t wird, da die tiefen Frequenzen<br />
bei AB-Stereofonie, abhängig vom Abstand, stets korreliert sind.<br />
Die Korrelationsfunktion analysiert nun die Korrelation auch bei allen an<strong>de</strong>ren Werten<br />
für τ :<br />
χ<br />
( τ )<br />
p1( t)<br />
p2(<br />
t + τ )<br />
= ~ p ~ p<br />
1<br />
2<br />
Erläuterung: Es können damit auch solche Signale als „korreliert“ genannt wer<strong>de</strong>n, die<br />
über <strong>eine</strong>n Zeitversatz τ verfügen. Allerdings muss dieser Zeitversatz für alle Frequenzen<br />
gleich sein, da ja im Zeitbereich analysiert wird und damit sonst die Korrelationsfunktion<br />
<strong>eine</strong>n geringeren Wert annimmt. Wenn die Korrelationsfunktion abhängig von<br />
<strong>de</strong>r Frequenz betrachtet wird, das heißt<br />
χ<br />
( τ , ω)<br />
p 1(<br />
t,<br />
ω)<br />
p2(<br />
t + τ , ω)<br />
=<br />
~ p ( ω)<br />
~ p ( ω)<br />
1<br />
2<br />
2
ergibt sich <strong>eine</strong> Funktion, die für je<strong>de</strong> Frequenz separat die Korrelation bestimmen<br />
kann, und dann können auch unterschiedliche τ vorliegen. Damit könnte jetzt auch ab-<br />
Stereofonie analysiert wer<strong>de</strong>n.<br />
Wenn die Analyse <strong>de</strong>r Ähnlichkeit nicht im Zeitbereich, son<strong>de</strong>rn im Frequenzbereich<br />
passiert, spricht man von <strong>de</strong>r<br />
Kohärenzfunktion:<br />
γ<br />
( ω)<br />
=<br />
[ ] 2<br />
1<br />
Φ ( ω)<br />
Φ ( ω)<br />
11<br />
Φ<br />
12<br />
( ω)<br />
22<br />
Die Kohärenzfunktion ist <strong>de</strong>r Quotient aus <strong>de</strong>r Fourier-Transformierten <strong>de</strong>r Kreuzkorrelationsfunktion<br />
und <strong>de</strong>m Produkt <strong>de</strong>r Fourier-Transformierten <strong>de</strong>r Autokorrelationsfunktionen.<br />
Achtung: Meistens wird die Kohärenz(-funktion) im Quadrat angegeben ( γ 2 (ω) ).<br />
Die Verwandtschaft zur frequenzabhängigen Korrelationsfunktion wird ersichtlich, wenn<br />
bei letzterer das Maximum über <strong>de</strong>r Variable τ für je<strong>de</strong> einzelne Frequenz gesucht wird.<br />
Dann gilt:<br />
( ω)<br />
γ ( ω)<br />
χ ′ =<br />
max<br />
Das „Strichlein“ <strong>de</strong>s χ’ be<strong>de</strong>utet, dass diese Beziehung nur gilt, wenn die Frequenzen<br />
einzeln beobachtet wer<strong>de</strong>n. Der Betrag <strong>de</strong>s Maximums <strong>de</strong>r Korrelationsfunktion kann<br />
also als Maß für die Kohärenz angesehen wer<strong>de</strong>n.<br />
Grundsätzlich kann man trennen zwischen <strong>de</strong>r Korrelation, die <strong>eine</strong> Ähnlichkeit <strong>de</strong>r<br />
Signale im Zeitbereich betrachtet und die Gruppenlaufzeiten τ liefert, und <strong>de</strong>r Kohärenz,<br />
die die Ähnlichkeit zweier Signale im Frequenzbereich untersucht und die Phasenbeziehung<br />
dabei außer Acht lässt.<br />
Welches Maß ist nun geeignet, <strong>eine</strong> Aussage über <strong>eine</strong> stereofone Anordnung zu liefern?<br />
Zunächst ist klar: Wird auch Laufzeit-Stereofonie untersucht, muss <strong>eine</strong> frequenzabhängige<br />
Größe gesucht wer<strong>de</strong>n, somit kommt <strong>de</strong>r Korrelationsgrad nicht in Frage. Wenn<br />
von <strong>de</strong>r „Korrelation“ o<strong>de</strong>r „korreliert“ die Re<strong>de</strong> ist, sollte darauf geachtet wer<strong>de</strong>n, was<br />
damit gemeint wird. Meist ist die Korrelationsfunktion gemeint, und für die gilt zum<br />
Beispiel, dass zwei kohärente Signale mit unterschiedlichen Gruppenlaufzeiten <strong>eine</strong><br />
Korrelation kl<strong>eine</strong>r 1 ergeben. Bei ab-Stereofonie ist die Kohärenzfunktion im Diffusfeld<br />
frequenzabhängig, wie Abbildung 33 zeigt. In diesem Fall zeigt <strong>de</strong>r Korrelationsgradmesser<br />
ungefähr <strong>de</strong>n Wert 0.2. Dies geht aus <strong>de</strong>n Untersuchungen Damaskes [5] hervor.<br />
Der Korrelationsgradmesser liefert also in etwa <strong>eine</strong> gewichtete Mittelung aus <strong>de</strong>n<br />
Einzelkorrelationen, wobei die tiefen Frequenzen <strong>eine</strong> wesentliche Rolle spielen.<br />
Abbildung 29 zeigt <strong>de</strong>n Korrelationsgrad <strong>eine</strong>r ab-Anordnung im diffusen Schallfeld in<br />
Abhängigkeit vom Mikrofonabstand.<br />
Es ist ein Erfahrungswert <strong>de</strong>r Tonmeister, welche angezeigte Korrelation am Korrelationsgradmesser<br />
bei AB-Stereofonie welchen Klang ergibt. Die Aussagekraft <strong>de</strong>r Korrelations-/Kohärenzfunktion<br />
für die räumliche Wahrnehmung ist in höchstem Maße interessant.<br />
Wie nimmt das Gehör die Kohärenz bei unterschiedlichen Frequenzen wahr? Offensichtlich<br />
ist das Gehör in <strong>de</strong>r Lage, <strong>eine</strong> Kohärenz zu erkennen, also die Ähnlichkeit<br />
<strong>de</strong>r Signale trotz unterschiedlicher Gruppenlaufzeiten zu analysieren. Wie wertet das<br />
Gehör die Kohärenz in unterschiedlichen Frequenzbereichen aus?<br />
Zur Erläuterung <strong>de</strong>r Aussagekraft <strong>de</strong>r Kohärenz sind nun drei Beispiele <strong>eine</strong>r Kohärenzfunktion<br />
für verschie<strong>de</strong>ne stereofone Anordnungen abgebil<strong>de</strong>t. Es ist <strong>eine</strong> spannen<strong>de</strong><br />
Aufgabe, diese Daten psychoakustisch o<strong>de</strong>r empirisch (in <strong>de</strong>r Tonmeisterpraxis) auszuwerten.<br />
Die Graphen zeigen die quadrierte Kohärenzfunktion in Abhängigkeit von <strong>de</strong>r Frequenz.<br />
Diese ist nur bis 1200 Hz gezeichnet. Die Zahl im Graphen gibt die Kohärenz bei f=0 an.<br />
30
Abbildung 30: Kohärenzfunktion γ 2 :<br />
XY, 2 Nieren 90°, b=0cm<br />
Abbildung 32: Kohärenzfunktion γ 2 :<br />
ORTF, 2 Nieren 110°, b=17cm<br />
31<br />
Abbildung 29: aus Damaske<br />
[5]<br />
Abgebil<strong>de</strong>t ist tatsächlich <strong>de</strong>r<br />
Korrelationsgrad, <strong>de</strong>r aus<br />
<strong>de</strong>m Maximum <strong>de</strong>r Korrelationsfunktion<br />
ermittelt wur<strong>de</strong>.<br />
(Definitionen siehe Anhang)<br />
Da anzunehmen ist, dass in<br />
allen Fällen gilt: τ =0, entspricht<br />
dies <strong>de</strong>m Wert, <strong>de</strong>n<br />
ein Korrelationsgradmesser<br />
liefert.<br />
Abbildung 31: Kohärenzfunktion γ 2 :<br />
Blumlein, 2 Achten 90°, b=0cm<br />
Abbildung 33: Kohärenzfunktion γ 2 :<br />
ab, 2 Kugeln, b=80cm
Ein paar Beispiele zum Unterschied korreliert <strong>–</strong> kohärent (korreliert heißt nun, dass die<br />
Korrelationsfunktion bei <strong>eine</strong>m beliebigen τ ein Maximum von 1 hat):<br />
Signal A: sin(φ)<br />
Signal B: sin(φ)<br />
Signal A: sin(φ)<br />
Signal B: -sin(φ)<br />
Signal A: sin(φ)<br />
Signal B: cos(φ)<br />
Signal A: s<br />
Signal B: s, um 10 ms verzögert<br />
Signal A:<br />
ein Ton (mehrere Sinus-Schwingungen<br />
verschie<strong>de</strong>ner Frequenzen)<br />
Signal B:<br />
ein an<strong>de</strong>rer Ton (Sinus-Schwingungen<br />
<strong>de</strong>r gleichen Frequenzen, aber unterschiedlicher<br />
Phasenlagen)<br />
Signal A/Signal B:<br />
zwei Mikrofone im diffusen Schallfeld mit<br />
Abstand r (ab-Stereofonie)<br />
32<br />
kohärent Korreliert Korrelationsgrad<br />
ja Ja 1<br />
ja Ja -1<br />
ja Ja 0<br />
Ja Ja 0<br />
Ja Nein 0<br />
frequenzabhängige<br />
Kohärenz<br />
Nein<br />