Messung der Separiertheit akustischer Ströme - CES
Messung der Separiertheit akustischer Ströme - CES
Messung der Separiertheit akustischer Ströme - CES
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Universität Karlsruhe (TH)<br />
Institut für Technische Informatik<br />
Lehrstuhl für Eingebettete Systeme<br />
Hochschule für Musik Karlsruhe<br />
Institut für Musikwissenschaft/Musikinformatik<br />
Medienkunst: Sound<br />
Ringseminar ” Hören - The Art of Auditory Streaming“<br />
Wintersemester 2006/2007<br />
<strong>Messung</strong> <strong>der</strong> <strong>Separiertheit</strong> <strong>akustischer</strong> <strong>Ströme</strong><br />
Julian Kurz<br />
Betreuer: Fridtjof Feldbusch<br />
4. Februar 2007<br />
Zusammenfassung<br />
Ausgehend von [Bre99] stellt diese Arbeit zunächst wesentliche Merkmale vor,<br />
die die Aufteilung <strong>der</strong> akustischen Umgebung durch den Menschen in mehrere unabhängige<br />
<strong>Ströme</strong> bestimmen. Es wird analysiert, inwieweit sich diese Merkmale<br />
wie<strong>der</strong>holbar durch physikalische Größen beschreiben lassen und wo die Grenzen <strong>der</strong><br />
Messbarkeit liegen. Insbeson<strong>der</strong>e wird die Messbarkeit dabei auch von Faktoren beschränkt,<br />
die sich auf die Wahrnehmung einer Versuchsperson auswirken.
Inhaltsverzeichnis<br />
1 Einführung und Motivation 1<br />
2 Merkmale, die zur Separierung beitragen 2<br />
2.1 Sequentielle Separierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2<br />
2.1.1 Frequenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2<br />
2.1.2 Klangfarbe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4<br />
2.1.3 Ort . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5<br />
2.2 Simultane Separierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6<br />
2.2.1 Überlappende Einzeltöne . . . . . . . . . . . . . . . . . . . . . . . . 6<br />
2.2.2 Komplexe Töne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7<br />
2.2.3 Gemeinsames Schicksal . . . . . . . . . . . . . . . . . . . . . . . . . 8<br />
2.2.4 Ort . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9<br />
3 Experimentelle <strong>Messung</strong> <strong>der</strong> <strong>Separiertheit</strong> 10<br />
3.1 Abhängigkeit von den Versuchspersonen . . . . . . . . . . . . . . . . . . . 10<br />
3.2 Messverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11<br />
3.3 Zuordnung von Wirkungen zu Ursachen . . . . . . . . . . . . . . . . . . . . 13<br />
4 Zusammenfassung und Ausblick 16<br />
Literatur 17
Julian Kurz — <strong>Separiertheit</strong> von <strong>Ströme</strong>n 1<br />
Abbildung 1: Verschiedene Frequenzen regen unterschiedliche Bereiche <strong>der</strong> Basilarmembran<br />
an.<br />
1 Einführung und Motivation<br />
In einer natürlichen Umgebung ist ein Mensch vielen akustischen Signalen unterschiedlicher<br />
Quellen gleichzeitig und nacheinan<strong>der</strong> ausgesetzt. Um mit diesen Signalen etwas anfangen<br />
zu können und die akustische Wahrnehmung sinnvoll einzusetzen, muss <strong>der</strong> Mensch in <strong>der</strong><br />
Lage sein, diese Signale, die als ein Gemisch bei ihm ankommen, in einzelne Objekte –<br />
die akustischen <strong>Ströme</strong> – zu trennen. Auf diese Weise kann er in seiner Wahrnehmung ein<br />
Bild seiner Umgebung konstruieren, das dieser möglichst genau entspricht. Festzustellen<br />
sind dabei insbeson<strong>der</strong>e, ob aufeinan<strong>der</strong> folgende bzw. welche von mehreren aufeinan<strong>der</strong><br />
folgenden Tönen zusammengehören, also einen akustischen Strom bilden (sequentielle Separierung),<br />
sowie die Frage, aus welchen einzelnen <strong>Ströme</strong>n gleichzeitig wahrgenommene<br />
Töne bestehen (simultane Separierung).<br />
Bregman [Bre99] stellt dabei starke Analogien zur visuellen Wahrnehmung fest, die<br />
ebenfalls in <strong>der</strong> Lage dazu ist, aus <strong>der</strong> Matrix von zeitlich verän<strong>der</strong>lichen Bildpunkten, die<br />
von <strong>der</strong> Netzhaut im Auge wahrgenommen wird, einzelne Objekte zu bilden, die eindeutig<br />
voneinan<strong>der</strong> zu trennen sind. Bei <strong>der</strong> visuellen wie auch <strong>der</strong> akustischen Wahrnehmung<br />
spielt dabei das Prinzip <strong>der</strong> exklusiven Zuordnung (exclusive allocation) eine große Rolle:<br />
Ein visuelles bzw. akustisches Signal kann zu einem Zeitpunkt immer nur zu einem<br />
wahrgenommenen Objekt gehören, nie zu mehreren gleichzeitig.<br />
Wichtig zum Verständnis <strong>der</strong> Separierung in akustische <strong>Ströme</strong> ist dabei die Kenntnis<br />
darüber, wie das menschliche Ohr Töne wahrnimmt. Das Trommelfell nimmt lediglich die<br />
überlagerten Luftschwingungen auf, die verschiedene Schallquellen erzeugen. Aus diesen<br />
scheinbar ungeordneten Variationen direkt Merkmale zu extrahieren scheint unmöglich.<br />
Entscheidend ist die Funktion <strong>der</strong> Gehörschnecke und <strong>der</strong> Basilarmembran. Schwingungen<br />
unterschiedlicher Frequenzen dringen unterschiedlich weit in die Gehörschnecke ein und<br />
regen unterschiedliche Regionen <strong>der</strong> Basilarmembran an (siehe Abbildung 1). Anstatt also<br />
zu jedem Zeitpunkt nur die momentane Amplitude <strong>der</strong> Schwingungen zu messen, führt das<br />
Ohr eine Frequenzanalyse des ankommenden Schalls durch. [Lit65]<br />
Es ergibt sich nun die Fragestellung, wie das Gehirn aus dem Ergebnis <strong>der</strong> Frequenzanalyse<br />
<strong>der</strong> Ohren einzelne akustische <strong>Ströme</strong> bildet; welche Merkmale dazu in welchem<br />
Maße beitragen, wie dies qualitativ und quantitativ zu messen ist, wo dabei die Grenzen<br />
liegen und inwieweit sie von an<strong>der</strong>en Effekten beeinflusst o<strong>der</strong> verfälscht werden können.
Julian Kurz — <strong>Separiertheit</strong> von <strong>Ströme</strong>n 2<br />
2 Merkmale, die zur Separierung beitragen<br />
Bregman unterscheidet bei <strong>der</strong> Separierung grundlegend zwischen primitiver Separierung<br />
und schema-basierter Separierung von <strong>Ströme</strong>n. Primitive Separierung bezeichnet dabei<br />
die Trennung von <strong>Ströme</strong>n anhand physikalisch und mathematisch beschreibbarer Eigenschaften<br />
<strong>der</strong> akustischen Signale, auf die in den folgenden Abschnitten näher eingegangen<br />
wird. Viele dieser Eigenschaften lassen sich nicht nur qualitativ son<strong>der</strong>n auch quantitativ<br />
leicht beschreiben, messen und parametrisiert künstlich erzeugen um geeignete Testszenarien<br />
für Experimente zu bilden. Primitive Separierung lässt sich dabei weiter unterteilen<br />
in die Separierung von aufeinan<strong>der</strong> folgenden Tönen, die also zeitlich disjunkt liegen, und<br />
von ganz o<strong>der</strong> teilweise gleichzeitig gehörten Tönen.<br />
Schema-basierte Separierung hingegen findet nicht anhand einfacher physikalischer Eigenschaften<br />
statt, son<strong>der</strong>n beruht auf erlernten Regelmäßigkeiten in dem Hörer bekannten<br />
Signalen, z.B. Wörtern. Sie basiert also auf dem Wissen, das ein Hörer hat und ist somit<br />
kaum allgemeingültig zu messen, da sie stark von <strong>der</strong> jeweiligen Person abhängt. Primitive<br />
Separation hingegen muss nicht erlernt werden, son<strong>der</strong>n ist dem Menschen angeboren, wie<br />
ein Versuch mit Neugeborenen (S. 41 1 ) nahe legt.<br />
2.1 Sequentielle Separierung<br />
Werden verschiedene Töne nacheinan<strong>der</strong> abgespielt, können zwei verschiedene Dinge auftreten:<br />
1. Eine Versuchsperson hört die Töne als eine Sequenz aufeinan<strong>der</strong> folgen<strong>der</strong> Töne,<br />
o<strong>der</strong> 2. die Folge erscheint nicht als eine Sequenz son<strong>der</strong>n teilt sich auf in zwei o<strong>der</strong> mehr<br />
einzelne Sequenzen, die jeweils einen Teil <strong>der</strong> Töne <strong>der</strong> gesamten Folge beinhalten – teilt<br />
sich also in mehrere akustische <strong>Ströme</strong> auf. Dabei kann je<strong>der</strong> einzelne Ton immer nur zu<br />
genau einem Strom gehören und nie zu mehreren <strong>Ströme</strong>n gleichzeitig.<br />
Die Töne werden also nicht ausschließlich nach zeitlicher Nähe, son<strong>der</strong>n nach Ähnlichkeit<br />
gruppiert und zu jeweils einem Strom zusammengefasst. Wann zwei Töne einan<strong>der</strong> ähnlich<br />
sind und wie dies zu messen ist, sollen die folgenden Unterabschnitte genauer beleuchten.<br />
2.1.1 Frequenz<br />
Eine wesentliche physikalische Eigenschaft <strong>akustischer</strong> Signale ist die Frequenz. Während<br />
die meisten natürlichen Töne aus vielen verschiedenen Frequenzen bestehen, beschränkt<br />
Bregman sich zunächst auf reine Sinustöne, die nur einer einzige Frequenzkomponente<br />
beinhalten (S. 49). Dies hat zum einen den Vorteil, dass man bei Experimenten sicher sein<br />
kann, dass beobachtete Effekte wirklich nur auf dem Frequenzunterschied beruhen und<br />
nicht noch an<strong>der</strong>e Eigenschaften <strong>der</strong> Töne eine Rolle spielen. Außerdem lassen sich reine<br />
Sinustöne sehr einfach und exakt physikalisch beschreiben – und zwar durch ihre Frequenz<br />
(Tonhöhe) und ihre Amplitude (Lautstärke).<br />
1 Seitenangaben sind immer auf [Bre99] bezogen, Angaben von Abschnitten wie 3.1.4 immer auf den<br />
vorliegenden Text.
Julian Kurz — <strong>Separiertheit</strong> von <strong>Ströme</strong>n 3<br />
Frequenzdifferenz (Hz)<br />
1000<br />
100<br />
10<br />
0.1 1 10<br />
Frequenz (kHz)<br />
Abbildung 2: Miller und Heise: Grenzfrequenz für die Trennung in Abhängigkeit <strong>der</strong> Grundfrequenz<br />
Ein erstes systematisches Experiment, das die Separierung anhand <strong>der</strong> Frequenz untersucht,<br />
wurde 1950 von Miller und Heise durchgeführt (S. 51). Dabei wurden zwei reine<br />
Sinustöne gleicher Lautstärke aber unterschiedlicher Frequenz in einer schnellen Folge<br />
abwechselnd abgespielt. Die Rate, in <strong>der</strong> die Töne erzeugt wurden, war dabei fest so eingestellt,<br />
dass die Zeit zwischen dem Anfang eines Tones bis zum Anfang des nächsten<br />
stets 100ms betrug. Sie stellten dabei fest, dass bei niedrigen Frequenzunterschieden zwischen<br />
den beiden Tönen die Folge als ein Strom wahrgenommen wurde, <strong>der</strong> zwischen zwei<br />
Frequenzen wechselte, ab einer bestimmten Differenz sich die Folge aber in zwei <strong>Ströme</strong><br />
aufteilte, die jeweils nur Töne einer <strong>der</strong> Frequenzen beinhaltete.<br />
Bei <strong>der</strong> Wie<strong>der</strong>holung dieser Experimente mit verschiedenen Basisfrequenzen stellte sich<br />
heraus, dass sich die Trennung in zwei separate <strong>Ströme</strong> ab einem Frequenzunterschied von<br />
ungefähr 15% einstellte. Es gibt also keine feste Frequenzdifferenz, son<strong>der</strong>n das Verhältnis<br />
<strong>der</strong> beiden Frequenzen zueinan<strong>der</strong> muss einen bestimmten Wert überschreiten, damit es<br />
zur Separierung kommt. Bei höheren Frequenzen wird dieser Wert allerdings etwas kleiner.<br />
Diagramm 2 zeigt den benötigten Frequenzabstand bei verschiedenen Basisfrequenzen in<br />
logarithmischem Maßstab.<br />
Im Gegensatz zum Experiment von Miller und Heise betrachtet die Veröffentlichung von<br />
Paolo Bozzi und Giovanni Vicario auch die Auswirkung verschiedener Raten (S. 52). Es<br />
stellte sich dabei heraus, dass auch bei größerer Frequenzunterschieden, die nach Miller und<br />
Heise zur Separierung hätten führen müssen, Töne dem gleichen Strom zugeordnet wurden,<br />
wenn sie zeitlich näher aneinan<strong>der</strong> lagen, als sie zu an<strong>der</strong>en Tönen lagen. Relevant war dabei<br />
nicht nur die zeitliche Nähe <strong>der</strong> Töne zueinan<strong>der</strong>, son<strong>der</strong>n ihre Nähe relativ zu an<strong>der</strong>en<br />
Tönen. Analoges beobachteten sie auch für die Frequenzunterschiede: Ob zwei Töne zum
Julian Kurz — <strong>Separiertheit</strong> von <strong>Ströme</strong>n 4<br />
selben Strom gehören wird nicht nur durch den Abstand ihrer beiden Frequenzen bestimmt<br />
son<strong>der</strong>n ist auch davon abhängig, wie groß dieser Abstand in Relation zur Frequenzdifferenz<br />
zu an<strong>der</strong>en Tönen ist.<br />
2.1.2 Klangfarbe<br />
Bisher wurden nur einfache Sinustöne betrachtet, die aus genau einer Frequenzkomponente<br />
bestanden. Natürliche Schallereignisse sind allerdings neben <strong>der</strong> Frequenz und <strong>der</strong><br />
Lautstärke auch durch ihre Klangfarbe charakterisiert. Allerdings gibt es nach Bregman<br />
keine einheitliche, physikalisch greifbare Definition für die Klangfarbe (S. 92). Diverse Experimente<br />
arbeiteten dazu mit natürlichen Klängen wie Musikinstrumenten (Tonleiterillusion,<br />
S. 94) o<strong>der</strong> Geräuschen (Warren, Obusek, Farmer and Warren, S. 94). In beiden Fällen<br />
zeigte sich, dass <strong>der</strong> unterschiedliche Klang zu einer Separierung in einzelne <strong>Ströme</strong> führte.<br />
Allerdings lassen sich diese unterschiedlichen Klänge nur schwer auf einzelne physikalische<br />
Eigenschaften zurückführen.<br />
Ein komplexer Klang ist aus verschiedenen Frequenzen zusammengesetzt. Er ist harmonisch,<br />
wenn alle Teiltöne Vielfache <strong>der</strong> selben Grundfrequenz sind. Die Klangfarbe lässt<br />
sich unter an<strong>der</strong>em – orthogonal zur Lautstärke und Grundfrequenz – durch die Verteilung<br />
dieses Spektrums charakterisieren. Eine Rolle spielt dabei, wie viele harmonische Teiltöne<br />
enthalten sind, wie die Intensität zwischen diesen Tönen verteilt ist sowie einzelne Intensitätsspitzen<br />
im Spektrum des Klangs. Die subjektive Tonhöhe, die <strong>der</strong> Grundfrequenz des<br />
Klangs entspricht, wird dabei auch gehört, wenn sie nicht enthalten ist, son<strong>der</strong>n <strong>der</strong> Klang<br />
nur aus mehreren Harmonischen besteht (“missing fundamental”). Wie ein Versuch von<br />
van Noorden (S. 84) zeigt, ist die Separierung aber nicht von <strong>der</strong> (gehörten aber nicht<br />
vorhandenen) Grundfrequenz abhängig, son<strong>der</strong>n nur von den tatsächlich vorhandenen Frequenzkomponenten.<br />
In einem Experiment von Bregman und Levitan (S. 86) wurde betrachtet, ob die Grundfrequenz<br />
o<strong>der</strong> die Formantenfrequenz, also das Maximum im Spektrum <strong>der</strong> harmonischen<br />
Teiltöne eine stärkere Separierung erzeugen. Dazu verwendeten sie eine Sequenz von 4<br />
Tönen, von denen jeweils zwei in <strong>der</strong> Fundamentalfrequenz nahe beieinan<strong>der</strong> lagen aber<br />
unterschiedliche Formanten hatten, während jeweils zwei Töne mit weiter entfernten Fundamentalfrequenzen<br />
ähnliche Formanten besaßen. Es stellte sich heraus, dass bei Variation<br />
bei<strong>der</strong> Parameter in einigen Fällen die Töne mit ähnlichen Fundamentalfrequenzen zu je<br />
einem Strom gruppiert wurden und in an<strong>der</strong>en Fällen die Töne mit ähnlichen Formanten.<br />
Es zeigte sich aber, dass die Gruppierung <strong>der</strong> <strong>Ströme</strong> anhand <strong>der</strong> Formantenfrequenz<br />
stärker war als anhand <strong>der</strong> Fundamentalfrequenz. Insbeson<strong>der</strong>e zeigte sich dies, wenn die<br />
Abstände <strong>der</strong> Frequenzen jeweils gleich groß gewählt wurden (siehe Abbildung 3).<br />
Die Klangfarbe eines Tons ist nicht nur durch sein Spektrum, son<strong>der</strong>n auch durch zeitliche<br />
Verän<strong>der</strong>ungen – periodisch o<strong>der</strong> nicht – in seinem Spektrum gekennzeichnet. Viele in<br />
<strong>der</strong> Natur vorkommende Klänge unterliegen starken zeitlichen Än<strong>der</strong>ungen. Eine wesentliche<br />
Eigenschaft dieser Verän<strong>der</strong>ung ist ihre “Granularität”, die allerdings schwer analytisch<br />
zu fassen ist. Vergleichbar ist sie etwa mit <strong>der</strong> Textur in <strong>der</strong> visuellen Wahrnehmung. Ein<br />
einfacher Versuch mit einem reinen Sinuston und einem gefilterten weißen Rauschen, des-
Julian Kurz — <strong>Separiertheit</strong> von <strong>Ströme</strong>n 5<br />
Abbildung 3: Versuch von Bregman und Levitan. Kreise bedeuten stärkere Trennung nach<br />
Grundfrequenz; Sterne stärkere Trennung nach Formantenfrequenz. Die Größe gibt die<br />
Stärke <strong>der</strong> festgestellten Trennung an. Frequenzdifferenzen sind in Oktaven angegeben.<br />
sen Spektrum eine starke Spitze an <strong>der</strong> Frequenz des Sinustons aufweist, (S. 105) führt zu<br />
einer sehr starken Aufteilung in <strong>Ströme</strong>. Weitere analytische Experimente nennt Bregman<br />
aber nicht.<br />
2.1.3 Ort<br />
Durch die Auswertung verschiedener Eigenschaften des wahrgenommenen Schalls, kann <strong>der</strong><br />
Mensch ihm eine Richtung und Entfernung zuweisen, ihn also räumlich lokalisieren. Es wäre<br />
nahe liegend, dass akustische Signale, die von verschiedenen Orten kommen, auf jeden Fall<br />
von verschiedenen Quellen stammen und daher auch von <strong>der</strong> menschlichen Wahrnehmung<br />
verschiedenen <strong>Ströme</strong>n zugeordnet werden. Man könnte sogar annehmen, die örtliche Zuordnung<br />
von Schallereignissen alleine würde vollkommen ausreichen um ihn verschiedenen<br />
<strong>Ströme</strong>n zuzuordnen. Die letzten und die folgenden Abschnitte haben bereits gezeigt, dass<br />
dies nicht so ist und noch viele an<strong>der</strong>en Merkmale eine Rolle spielen. Dass auch die erstgenannte<br />
Annahme nicht stimmt, son<strong>der</strong>n es durchaus Ausnahmen geben kann in denen<br />
Töne verschiedenen örtlichen Ursprungs dem selben akustischen Strom zugeordnet werden,<br />
zeigten einige Experimente, die im Folgenden vorgestellt werden.<br />
Bei einem ersten Experiment von Donald Norman (S. 75) wurden zwei Töne unterschiedlicher<br />
Höhe abwechselnd abgespielt. Der Frequenzabstand war dabei allerdings relativ<br />
klein, so dass die Töne zunächst als Auf und Ab wahrgenommen wurden, also als<br />
einziger Strom. Wurden die beiden Töne dagegen auf beiden Ohren alterniert, so konnten<br />
zwei separate <strong>Ströme</strong> wahrgenommen werden. In diesem Fall kam es also zur Separierung<br />
durch unterschiedliche Richtungen. Weitere Experimente von Normal van Noorden (S. 75),<br />
Cherry und Taylor (S. 79) und an<strong>der</strong>en brachten zunächst ähnliche Ergebnisse.<br />
Fest steht also, dass unterschiedliche räumliche Ursprünge sich zumindestens auf die
Julian Kurz — <strong>Separiertheit</strong> von <strong>Ströme</strong>n 6<br />
Wahrscheinlichkeit einer Separierung auswirken. Dabei wurde nur <strong>der</strong> Extremfall betrachtet,<br />
dass die Töne durch verschiedene Ohren wahrgenommen werden. Bei beliebiger räumlicher<br />
Verteilung hingegen würden die wahrgenommenen Töne – je nach Richtung – auf<br />
beiden Ohren unterschiedlich laut und/o<strong>der</strong> unterschiedlich verzögert und/o<strong>der</strong> frequenzgefiltert<br />
ankommen. [Wik] Broadbent kam zu <strong>der</strong> Theorie, dass die beiden Ohren daher als<br />
einzelne “Informationskanäle” zu betrachten sind, die unabhängig voneinan<strong>der</strong> den Schall<br />
verarbeiten und ihn <strong>der</strong> bewussten Wahrnehmung weiterleiten (S. 79).<br />
Die Tonleiterillusion von Diana Deutsch (S. 76) zeigte hingegen, dass <strong>der</strong> räumliche<br />
Ursprung nicht hinreichend für die Separierung ist, son<strong>der</strong>n dass an<strong>der</strong>e Merkmale – in<br />
diesem Fall die Frequenz – stärker sein können und somit zu einer an<strong>der</strong>en Separierung<br />
führen. Die Experimente von Cherry und Taylor (S. 79) und von Schubert und Taylor (S.<br />
80) wi<strong>der</strong>legten die Theorie <strong>der</strong> “Informationskanäle” vollkommen. Bei beiden Versuchen<br />
wurde dem Hörer Sprache vorgespielt, die zwischen beiden Ohren wechselte. Diese teilte sich<br />
ab einer bestimmten Rate in zwei Kanäle, so dass es schwer wurde, die Worte zu verstehen.<br />
Wurde allerdings statt Stille auf dem jeweils an<strong>der</strong>en Ohr ein Rauschen abgespielt, dessen<br />
Intensität gleich <strong>der</strong> Sprache war, wurde die Sprache wesentlich besser verständlich – die<br />
Sprachsignale von beiden Ohren wurden also dem selben Strom zugeordnet. Dies lässt sich<br />
nicht mit <strong>der</strong> Theorie <strong>der</strong> Trennung nach physischen Kanälen vereinen.<br />
2.2 Simultane Separierung<br />
Im Gegensatz zur sequentiellen Separierung, bei <strong>der</strong> aufeinan<strong>der</strong> folgende Töne o<strong>der</strong> Klänge<br />
einzelnen <strong>Ströme</strong>n zugeordnet werden, bezeichnet die simultane Separierung die Aufteilung<br />
gleichzeitig wahrgenommener Schallereignisse in verschiedene akustische <strong>Ströme</strong>. Dazu<br />
muss das Ohr zunächst in <strong>der</strong> Lage sein, die Schallwellen verschiedener Quellen, die<br />
aufsummiert am Trommelfell auftreffen, wie<strong>der</strong> aufzuteilen. Dazu dient unter an<strong>der</strong>em die<br />
in Abschnitt 1 beschriebene Frequenzanalyse. Die weitere Verarbeitung geht aber natürlich<br />
weit über die einfache Frequenzanalyse hinaus, wie die folgenden Unterabschnitte zeigen.<br />
2.2.1 Überlappende Einzeltöne<br />
Ein erster einfacher Versuch von Bregman und Rudnicky (S. 213) war dem von Miller<br />
und Heise (Abschnitt 2.1.1) sehr ähnlich. Allerdings lagen die Töne nun nicht mehr zeitlich<br />
disjunkt, son<strong>der</strong>n überlappten sich in einem variierbaren Zeitrahmen. Während bei<br />
Überlappungen von 25 und 50 Prozent <strong>der</strong> 250ms langen Töne noch ähnlich wie bei Miller<br />
und Heise zwei <strong>Ströme</strong> mit reinen Sinustönen festgestellt wurden, vereinten sie sich ab 88<br />
Prozent Überlappung zu einem Strom mit komplexen Klängen. Analog zu Miller und Heise<br />
war die Separierung größer, wenn die Frequenzdifferenz <strong>der</strong> beiden Töne größer wurde.<br />
In einem leicht modifizierten Versuch (S. 214) wurden die Raten <strong>der</strong> beiden Töne unterschiedlich<br />
gewählt: Während ein Ton 4-mal pro Sekunde gespielt wurde, wurde <strong>der</strong> an<strong>der</strong>e<br />
5-mal gespielt. In diesem Fall wurden ebenfalls zwei <strong>Ströme</strong> zu hören, aber mit einer Beson<strong>der</strong>heit:<br />
Fielen die Anfänge <strong>der</strong> beiden Töne auf den gleichen Zeitpunkt, was einmal
Julian Kurz — <strong>Separiertheit</strong> von <strong>Ströme</strong>n 7<br />
Frequenz f<br />
A<br />
Zeit t<br />
Abbildung 4: Tonfolge beim Versuch von Bregman und Pinker mit Fängerton (A) und zu<br />
fangendem Ton (B)<br />
pro Sekunde <strong>der</strong> Fall ist, so wurde im tiefen Strom ein komplexer und lauterer Ton gehört.<br />
Der Ton im hohen Strom fehlte o<strong>der</strong> war schwächer zu hören.<br />
Wurde noch ein dritter Ton hinzugenommen, bildeten sich bei asynchroner Rate nun<br />
drei <strong>Ströme</strong>, wobei die Separierung allerdings etwas schwächer wahrgenommen wurde. Im<br />
Gegensatz zum Experiment mit zwei Tönen zeigte sich aber ein wesentlicher Unterschied,<br />
wenn alle drei Tonanfänge auf den gleichen Zeitpunkt fielen. Anstatt den Ton eines <strong>der</strong><br />
drei <strong>Ströme</strong> komplexer erscheinen zu lassen, wurde <strong>der</strong> zusammengesetzte Ton als vollkommen<br />
unabhängiger Klang wahrgenommen, <strong>der</strong> keinem <strong>der</strong> drei <strong>Ströme</strong> zugeordnet werden<br />
konnte.<br />
2.2.2 Komplexe Töne<br />
Ein wesentliches Experiment für die Untersuchung von komplexen Tönen ist das von Bregman<br />
und Pinker (S. 216), das in verschiedenen Varianten für zahlreiche Beobachtungen<br />
verwendet wurden. Dabei wurde mit Hilfe von so genannten Fängertönen festgestellt, dass<br />
die akustische Wahrnehmung dazu neigt, einen vorher bereits gehörten Ton (Fängerton)<br />
aus einem darauf folgenden Tongemisch herauszufiltern. Dieser Ton wird dann im Gemisch<br />
als einzelner Ton wahrgenommen, während er ohne den Fängerton als Teil eines komplexen<br />
Tons wahrgenommen worden wäre. Die genaue Anordnung <strong>der</strong> Töne in <strong>der</strong> Sequenz ist in<br />
Abbildung 4 zu sehen.<br />
Diesen Effekt bezeichnet Bregman als die Alt-Plus-Neu-Heuristik (S. 222). Sie besagt:<br />
“Wenn ein Teil einer momentanen Gruppe von akustischen Komponenten plausibel als<br />
Fortführung eines zuvor gehörten Tons interpretiert werden kann, dann soll dies getan<br />
werden und nur <strong>der</strong> verbleibende Teil <strong>der</strong> Komponenten weiter analysiert werden.”<br />
Neben dem Heraushören eines Teiltones, das auch von Helmholtz (S. 223) und van Noorden<br />
(S. 224) beobachtet wurde, hat die Alt-Plus-Neu-Heuristik noch eine weitere wichtige<br />
Implikation: Vom Spektrum des “neuen” zusammengesetzten Ton wird nur soviel subtra-<br />
B<br />
C
Julian Kurz — <strong>Separiertheit</strong> von <strong>Ströme</strong>n 8<br />
hiert, wie <strong>der</strong> “alte” Ton an Intensität besaß. Dies wurde durch ein Experiment von Richard<br />
Warren (S. 225) bestätigt: Verwendetet wurde dazu ein gefiltertes weißes Rauschen mit einer<br />
Oktave Bandbreite. Dieses wurde abwechselnd mit zwei verschiedenen Intensitäten<br />
abgespielt. Wahrgenommen wurde diese Sequenz allerdings so, dass das leise Rauschen<br />
permanent vorhanden war, während in den lauteren Abschnitten ein weiteres Rauschen<br />
hinzukam. Die Alt-Plus-Neu-Heuristik ordnete also einen Teil <strong>der</strong> Intensität des lauten<br />
Rauschens dem gleichen Strom wie dem leisen zu, die verbleibende Differenz bildete einen<br />
neuen Strom. War das lautere Rauschen weniger als doppelt so laut wie das leise (< 3dB<br />
Differenz), wurde es das als zusätzlich wahrgenommene Rauschen konsequenterweise als<br />
leiser empfunden.<br />
2.2.3 Gemeinsames Schicksal<br />
Wie bei <strong>der</strong> sequentiellen Separierung spielt auch bei <strong>der</strong> simultanen Separierung die zeitliche<br />
Verän<strong>der</strong>ung innerhalb von Tönen eine große Rolle – sogar eine wesentlich größere<br />
Rolle. Dabei werden Frequenzkomponenten zu jeweils einem Strom zusammengefasst, die<br />
einen ähnlichen Verlauf von Amplitude und Frequenz haben (“Gesetz des gemeinsamen<br />
Schicksals”).<br />
Eine simple Form eines zeitlich verän<strong>der</strong>ten Tons ist ein reiner Sinuston, dessen Frequenz<br />
zeitlich linear steigt o<strong>der</strong> sinkt. In einem Experiment von Steiger und Bregman (S.<br />
220) wurde ähnlich wie bei Bregman und Pinker (Abschnitt 2.2.2) versucht, eine Komponente<br />
aus einem Sinuston zu “fangen”. Er handelte sich dabei allerdings diesmal nicht um<br />
konstante Sinustöne son<strong>der</strong>n um linear fallend o<strong>der</strong> steigende Töne. Es stellte sich dabei<br />
heraus, dass das Fangen am besten dann möglich war, wenn <strong>der</strong> Fängerton nicht nur die<br />
gleichen Frequenzen son<strong>der</strong>n auch die gleiche zeitliche Verän<strong>der</strong>ung aufwies wie <strong>der</strong> zu fangende<br />
Ton. Ein konstanter Sinuston mit <strong>der</strong> Durchschnitts-, Start- o<strong>der</strong> Endfrequenz des<br />
Frequenzverlaufes war zum Fangen wesentlich schlechter geeignet.<br />
Wesentlich kürzere, periodische Verän<strong>der</strong>ungen in Frequenz o<strong>der</strong> Lautstärke, werden als<br />
Frequenzmodulation (FM) bzw. Amplitudenmodulation (AM) bezeichnet. In einem Versuch<br />
stellte Brian Moore (S. 270) fest, dass sowohl gemeinsame AM als auch gemeinsame FM<br />
geeignet sind, um eine Gruppe von Tönen aus einem Gemisch von vielen zufällig verteilten<br />
Frequenzen zu separieren und als einzelnen Strom hörbar zu machen.<br />
Ähnliche Versuche von Bregman, Abramson, Doehring und Darwin (S. 273) mit Amplitudenmodulierten<br />
Tönen, die wie<strong>der</strong> dem Bregman-Pinker-Schema folgten, zeigten vergleichbare<br />
Ergebnisse. Nebeneffekte, die durch die Amplitudenmodulation entstehen, konnten<br />
dabei als Ursache ausgeschlossen werden, wie in Abschnitt 3.3 genauer erläutert ist.<br />
Analog zur Alt-Plus-Neu-Heuristik lässt sich nun auch für das gemeinsame Schicksal<br />
eine einfache Regel aufstellen: “Wenn es eine Korrespondenz zwischen einer Än<strong>der</strong>ung<br />
einer akustischen Komponente mit etwas an<strong>der</strong>em (einer an<strong>der</strong>en akustischen Komponente<br />
o<strong>der</strong> auch sonstigen Ereignissen 2 ) gibt, ist dies wahrscheinlich kein Zufall und die beiden<br />
Komponenten sollten <strong>der</strong> gleichen wahrgenommenen Quelle zugeordnet werden.” (S. 292)<br />
2 Zum Beispiel visuelle Eindrücke können sich auf die akustische Wahrnehmung auswirken. (S. 290)
Julian Kurz — <strong>Separiertheit</strong> von <strong>Ströme</strong>n 9<br />
2.2.4 Ort<br />
Schallwellen, die gleichzeitig von verschiedenen Orten kommen, sollten eigentlich eine sehr<br />
starke Trennung aufweisen, da sie mit großer Wahrscheinlichkeit nicht von <strong>der</strong> gleichen<br />
Quelle stammen. Es zeigte sich allerdings, dass zwei Töne, die sich nur durch den Ort<br />
unterscheiden und ansonsten identisch sind, sich meist zu einem wahrgenommenen Ton<br />
vereinen, <strong>der</strong> von einer Position zwischen den tatsächlichen Ursprüngen zu stammen scheint<br />
(S. 294). Zwei unterschiedliche Frequenzen hingegen, die auf beiden Ohren gleichzeitig<br />
gehört werden, werden klar getrennt (als unterschiedliche <strong>Ströme</strong>) wahrgenommen, wenn<br />
sich die Frequenzen um einen bestimmte Faktor unterscheiden. Im Frequenzbereich von<br />
250 Hz bis 4000 Hz lag dieser Faktor je nach Frequenz bei maximal 7%.<br />
Bei einer Demonstration am IRCAM, einer Forschungseinrichtung für Akustik und Musik<br />
in Paris, wurde <strong>der</strong> Klang einer Oboe zerlegt und auf zwei Lautsprecher aufgeteilt (S.<br />
296). Ein Lautsprecher gab dabei nur die geraden, ein an<strong>der</strong>er nur die ungeraden harmonischen<br />
Teiltöne wie<strong>der</strong>. Die Signale bei<strong>der</strong> Lautsprecher wurden dabei frequenzmoduliert.<br />
War die Frequenzmodulation synchron, so erschien <strong>der</strong> gesamte Klang so, als käme er von<br />
einer räumlichen Quelle zwischen den beiden Lautsprechern. Wurde die Frequenzmodulation<br />
zwischen den beiden Lautsprechern geän<strong>der</strong>t, während die einzelnen Teiltöne eines<br />
Lautsprechers synchron blieben, teilte sich <strong>der</strong> Klang auf in zwei einzelne <strong>Ströme</strong>, die von<br />
unterschiedlichen räumlichen Quellen – den beiden Lautsprechern – wahrgenommen wurden.<br />
Dabei konnten den beiden <strong>Ströme</strong>n unabhängig voneinan<strong>der</strong> subjektive Merkmale<br />
<strong>der</strong> Klangfarbe zugeordnet werden. Es ist also möglich, gleichzeitig Schallwellen unterschiedlicher<br />
Orte getrennt voneinan<strong>der</strong> wahrzunehmen und auch getrennt voneinan<strong>der</strong> zu<br />
lokalisieren.
Julian Kurz — <strong>Separiertheit</strong> von <strong>Ströme</strong>n 10<br />
3 Experimentelle <strong>Messung</strong> <strong>der</strong> <strong>Separiertheit</strong><br />
Um festzustellen, ob und wie stark zwei akustische <strong>Ströme</strong> von <strong>der</strong> menschlichen Wahrnehmung<br />
getrennt werden, wurden viele Experimente mit Versuchspersonen durchgeführt,<br />
<strong>der</strong>en Ergebnisse teilweise im vorherigen Abschnitt genannt wurden. Dieser Abschnitt soll<br />
sich nun mit verschiedenen Methodiken <strong>der</strong> Experimente befassen und auf <strong>der</strong>en Grenzen<br />
und Schwachstellen eingehen, sowie erläutern, inwieweit die Experimente wirklich eine objektive<br />
<strong>Messung</strong> erlauben o<strong>der</strong> ob sie noch von an<strong>der</strong>en, möglicherweise weniger messbaren,<br />
Eigenschaften abhängen.<br />
3.1 Abhängigkeit von den Versuchspersonen<br />
Bisher wurde bei <strong>der</strong> Beschreibung <strong>der</strong> verschiedenen Merkmale lediglich genannt, dass<br />
bestimmte Effekte bei bestimmter Wahl <strong>der</strong> Parameter eines Versuchs “gehört wurden”<br />
o<strong>der</strong> nicht. Dabei stellt sich die Frage, von wem sie gehört wurden und welchen Einfluss<br />
das auf die Ergebnisse hat. Zum einen kann eine Versuchsperson inhärente Eigenschaften<br />
haben, die ihre Perzeption beeinflussen. So kann beispielsweise ein professioneller Musiker<br />
o<strong>der</strong> aus an<strong>der</strong>en Gründen akustisch versierter Mensch viele Eigenschaften wesentlich<br />
genauer feststellen als ein durchschnittlicher Mensch. Doch auch ein musikalischer Laie<br />
hat durch die tägliche Erfahrung mit akustischen Ereignissen, insbeson<strong>der</strong>e auch Sprache,<br />
möglicherweise an<strong>der</strong>e Voraussetzungen als ein Neugeborener.<br />
So wurde beispielsweise <strong>der</strong> Versuch von Bregman und Rudnicky (Abschnitt 2.2.1)<br />
mit geübten Hörern durchgeführt, die in <strong>der</strong> Lage waren, die gehörten Ereignisse in einer<br />
Weise zu erfahren und beschreiben, die für eine brauchbare Auswertung nötig war. Um<br />
einen vergleichbaren Versuch auch mit “normalen” Hörern durchführen zu können, wurde<br />
das Experiment von Bregman und Pinker erdacht (Abschnitt 2.2.2).<br />
Laurent Demany führte einen Versuch mit 1 1 1 bis 3 Monate alten Neugeborenen durch,<br />
2 2<br />
<strong>der</strong> ermitteln sollte, ob auch die primitive Separierung erst erlernt werden muss. Es zeigten<br />
sich aber auch bei den Neugeborenen Effekte, die einen deutlichen Hinweis auf sequentielle<br />
Separierung von Sinustönen verschiedener Frequenzen hindeuten. Eine direkte Befragung<br />
war natürlich nicht möglich, es wurden aber weitere Versuche durchgeführt, die an<strong>der</strong>e<br />
Ursachen für die beobachteten Effekte ausschließen konnten.<br />
Neben den inhärenten, längerfristigen Eigenschaften <strong>der</strong> Versuchspersonen, die sich auf<br />
die Perzeption auswirken, spielen auch kurzfristige Erscheinungen eine Rolle. Bei einem<br />
Versuch von Broadbent und Ladefoged (S. 149) sollten Hörer die Reihenfolge von zwei verschiedenen<br />
Geräuschen bestimmen, die kurz nacheinan<strong>der</strong> abgespielt wurden. Während dies<br />
anfangs kaum möglich war, wurde dies mit zunehmen<strong>der</strong> Übung immer leichter. Die Hörer<br />
verbesserten dabei allerdings nicht ihre Fähigkeit, die Reihenfolge einzelner Geräusche direkt<br />
zu bestimmen. Vielmehr prägten sie sich qualitative Merkmale <strong>der</strong> gesamten Folge <strong>der</strong><br />
einen o<strong>der</strong> an<strong>der</strong>en Reihenfolge ein, die sie mit dem Gehörten vergleichen können.<br />
Bei einem Versuch von Leo van Noorden (S. 58) zeigte sich noch eine weitere Abhängigkeit<br />
von den Hörern. Es sollte dabei bewertet werden, ob eine Folge von zeitlich nicht überlagerten<br />
hohen und tiefen Tönen als ein gemeinsamer Strom erscheint o<strong>der</strong> sich in zwei
Julian Kurz — <strong>Separiertheit</strong> von <strong>Ströme</strong>n 11<br />
Frequenzdifferenz (Halbtoene)<br />
14<br />
12<br />
10<br />
8<br />
6<br />
4<br />
2<br />
0<br />
TCB<br />
FB<br />
0 50 100 150 200<br />
Wie<strong>der</strong>holungszeit (msec)<br />
Abbildung 5: “Temporal coherence boundary” (TCB) und “Fission boundary” (FB) beim<br />
Versuch von van Noorden<br />
<strong>Ströme</strong> aufteilt, wenn die Frequenzdifferenz geän<strong>der</strong>t wurde. Statt einer scharfen Grenzfrequenz<br />
ergab sich ein breiter Grenzbereich: War die Differenz größer als eine bestimmte<br />
Grenze, die so genannte “temporale Kohärenzgrenze” (“temporal coherence boundary”,<br />
TCB), wurden die Töne auf jeden Fall zwei verschiedenen <strong>Ströme</strong>n zugeteilt. Unterhalb<br />
einer niedrigeren Grenze, <strong>der</strong> “Aufteilungsgrenze” (“fission boundary”, FB), wurden die<br />
Töne dagegen immer als ein einziger Strom gehört.<br />
Interessant ist nun <strong>der</strong> Bereich zwischen <strong>der</strong> TCB und FB: In diesem Bereich hing es<br />
von <strong>der</strong> Intention des Hörers ab, ob er die beiden Töne dem gleichen Strom zuordnete o<strong>der</strong><br />
zwei separate <strong>Ströme</strong> wahrnahm, die jeweils nur die hohen bzw. tiefen Töne beinhalteten.<br />
Es zeigte sich also, dass nicht nur unbewusste Vorbedingungen sich auf die Separation<br />
auswirken, son<strong>der</strong>n dass diese auch – in bestimmten Grenzen – bewusst von einem Hörer<br />
gesteuert werden kann. Die obere Grenze (TCB) des Übergangsbereiches, in dem willkürlich<br />
auf die Separierung Einfluss genommen werden kann, hing dabei stark von <strong>der</strong> Rate ab, in<br />
<strong>der</strong> die Töne abgespielt wurden. Die untere Grenze (FB) hingehen blieb bei Verän<strong>der</strong>ung<br />
<strong>der</strong> Rate nahezu konstant (siehe Abbildung 5).<br />
3.2 Messverfahren<br />
Die Beobachtungen des Versuchs von Leo van Noorden lassen sich auch wie folgt interpretieren:<br />
Lag die Frequenzdifferenz im Übergangsbereich, also zwischen FB und TCP, hing es<br />
von <strong>der</strong> Aufgabenstellung an den Hörer ab, ob er eine Separierung o<strong>der</strong> Fusion <strong>der</strong> beiden<br />
Töne feststellte. Sollte er beurteilen, ob es möglich ist, die Töne als einen Strom zu hören,<br />
so konnte er dies bestätigen. War die Frage aber, ob es möglich ist, die Töne in einzelne<br />
<strong>Ströme</strong> zu trennen, so bejahte er dies ebenfalls. Allgemeiner kann man also sagen, dass auch
Julian Kurz — <strong>Separiertheit</strong> von <strong>Ströme</strong>n 12<br />
Trennungswahrscheinlichkeit<br />
1<br />
0.8<br />
0.6<br />
0.4<br />
0.2<br />
0<br />
B<br />
A<br />
Frequenzunterschied<br />
Abbildung 6: Veranschaulichung <strong>der</strong> Hysterese: Wird die Frequenzdifferenz erhöht, folgt<br />
die Trennungswahrscheinlichkeit Graph A. Wird sie anschließend wie<strong>der</strong> verringert, folgt<br />
sie Graph B.<br />
die Fragestellung und <strong>der</strong> Versuchsaufbau selbst Einfluss auf die Ergebnisse haben kann.<br />
Im Folgenden seien daher einige Methoden vorgestellt, die in verschiedenen Experimenten<br />
verwendet wurden (S. 55).<br />
Methode <strong>der</strong> Justierung (“Method of Adjustment”). Bei diesem Verfahren wird <strong>der</strong> Versuchsperson<br />
eine Sequenz mit Parametern vorgespielt, die sie selbst direkt verän<strong>der</strong>n kann<br />
– etwa die Differenz <strong>der</strong> Frequenzen hoher und tiefer Töne. Die Aufgabe besteht nun darin,<br />
diesen Parameter jeweils so einzustellen, dass sich eine Separierung bzw. Fusion einstellt.<br />
Ein großes Problem dabei ist <strong>der</strong> Effekt <strong>der</strong> Hysterese. Fallen die Töne anfangs in einen<br />
Strom und wird versucht sie zu trennen, so gelingt dies ab einem bestimmten Grenzwert.<br />
Wenn man daraufhin aber die Steuergröße wie<strong>der</strong> in die an<strong>der</strong>e Richtung än<strong>der</strong>t, muss<br />
sie weit über den zuvor festgestellten Grenzwert hinaus gestellt werden, damit die beiden<br />
<strong>Ströme</strong> wie<strong>der</strong> fusionieren (siehe Abbildung 6). Die Wahrnehmung “versucht” also, den<br />
momentanen Zustand so lange wie möglich zu erhalten. Teilweise führt dies dazu, dass die<br />
beiden Grenzwerte recht unterschiedlich ausfallen und die Ergebnisse daher sehr instabil<br />
sind.<br />
Methode <strong>der</strong> Grenzen (“Method of Limits”). Im Gegensatz zur gerade vorgestellten<br />
Methode än<strong>der</strong>t sich hierbei <strong>der</strong> Parameter selbständig kontinuierlich, ohne dass die Versuchsperson<br />
Einfluss darauf nehmen kann. Die Aufgabe besteht lediglich darin zu signalisieren,<br />
ab welchem Wert es zur Separierung bzw. Fusion kommt. Der Durchschnitt zwischen<br />
den Grenzwerten für die Übergänge Separierung-Fusion und Fusion-Separierung wird als<br />
Ergebnis verwendet. Diese Methode leidet ebenfalls unter dem Effekt <strong>der</strong> Hysterese.
Julian Kurz — <strong>Separiertheit</strong> von <strong>Ströme</strong>n 13<br />
Verhältnis zwischen integrierter und separierter Zeiten (“Proportion of Time Integrated<br />
and Segregated”). Die Aufgabe besteht darin, einen Knopf gedrückt zu halten, während die<br />
Töne zu einem Strom fusionieren, und einen an<strong>der</strong>en Knopf, während die Töne getrennt<br />
sind. Als Messergebnis dient dabei das Verhältnis zwischen den Zeiträumen, in denen die<br />
beiden Knöpfe gedrückt wurden. Dieses Verfahren ist insbeson<strong>der</strong>e dann geeignet, wenn<br />
die Tendenz zwei separate <strong>Ströme</strong> wahrzunehmen relativ schwach zu beobachten ist und<br />
die Wahrnehmung dazu neigt, zwischen beiden Zuständen hin und her zu wechseln.<br />
Bewertungsskala (“Rating Scale for Fixed Presentations”). Anstatt nur zwischen “separiert”<br />
und nicht “separiert” zu unterscheiden, wird hierbei eine Skala, z.B. von 1 bis 5<br />
verwendet, über die festgestellt werden soll, wie stark <strong>der</strong> Effekt <strong>der</strong> Separierung ist. Dazu<br />
werden Sequenzen mit unterschiedlichen Bedingungen in zufälliger Reihenfolge vorgespielt<br />
und werden anschließend anhand <strong>der</strong> Skala bewertet. Da die Versuchspersonen aber dazu<br />
neigen, die Skala an die Variation des jeweiligen Experimentes anzupassen, sind die<br />
Ergebnisse kaum dazu geeignet sie mit an<strong>der</strong>en Experimenten zu vergleichen.<br />
Merkmale innerhalb und zwischen <strong>Ströme</strong>n. Die Aufmerksamkeit kann sich immer nur<br />
einem Strom gleichzeitig zuwenden und nimmt währenddessen Qualitäten eines an<strong>der</strong>en<br />
Stromes kaum wahr. Insbeson<strong>der</strong>e ist es daher schwierig, Zusammenhänge zwischen verschiedenen<br />
<strong>Ströme</strong>n festzustellen. Zahlreiche Experimente benutzen dies um festzustellen,<br />
ob o<strong>der</strong> auch welche akustischen Signale dem gleichen Strom zugeordnet wurden und welche<br />
getrennt waren. So geht beispielsweise ein gemeinsamer Rhythmus verloren, wenn sich<br />
die beteiligten Töne durch verän<strong>der</strong>te Parameter in verschiedene <strong>Ströme</strong> aufteilen. Auch<br />
die Reihenfolge von Elementen einer Sequenz ist wesentlich schwieriger feststellbar, wenn<br />
sie sich in verschiedene <strong>Ströme</strong> aufteilen.<br />
Weitere Merkmale, die innerhalb eines Stroms festgestellt werden können, sind die<br />
subjektive Tonhöhe, die Klangfarbe sowie Konsonanz bzw. Dissonanz (S. 328). Bei <strong>der</strong><br />
Oboen-Demonstration am IRCAM (Abschnitt 2.2.4) beispielsweise war zunächst die typische<br />
Klangfarbe einer Oboe zu hören, solange die Schallwellen <strong>der</strong> beiden Lautsprecher<br />
zu einem Strom fusionierten. Teilten sie sich durch asynchrone Mikromodulation auf, so<br />
hatten beide nun zu hörenden Klänge jeweils unterschiedliche Klangfarben, die sich beide<br />
nicht mehr nach einer Oboe anhörten.<br />
Experimente, die diese Effekte ausnutzen, bestehen also aus einer Sequenz mit den oben<br />
genannten Merkmalen, die sich nur innerhalb eines Stroms feststellen lassen. Indem <strong>der</strong><br />
Hörer anschließend diese Merkmale beurteilt, lässt sich also feststellen, ob er die Sequenz<br />
als einen Strom o<strong>der</strong> als zwei getrennte <strong>Ströme</strong> gehört hat. Falsche Ergebnisse etwa bei <strong>der</strong><br />
Bestimmung <strong>der</strong> Reihenfolge o<strong>der</strong> beim zählen von einzelnen Tönen können allerdings nicht<br />
immer eindeutig darauf zurückgeführt werden, dass die Sequenz sich in mehrere <strong>Ströme</strong><br />
aufgeteilt hat. Es können durchaus auch an<strong>der</strong>e Faktoren eine Rolle spielen und zu falscher<br />
Beurteilung führen.<br />
3.3 Zuordnung von Wirkungen zu Ursachen<br />
Je komplexer die verwendeten Sequenzen sind, um so schwieriger wird es, die beobachteten<br />
Effekte eindeutig einer bestimmten Ursache zuzuordnen. So sind verschiedene Parame-
0<br />
Julian Kurz — <strong>Separiertheit</strong> von <strong>Ströme</strong>n 14<br />
0 0.002 0.004 0.006<br />
Zeit (sec)<br />
0<br />
0 0.002 0.004 0.006<br />
Zeit (sec)<br />
0<br />
❡ ✉<br />
0 0.002 0.004 0.006<br />
Zeit (sec)<br />
❡ ✉<br />
-1500 -1000 -500 0 500 1000 1500<br />
Frequenz (Hz)<br />
-1500 -1000 -500 0 500 1000 1500<br />
Frequenz (Hz)<br />
Multiplikation −→ ←− Faltung<br />
❡ ✉<br />
-1500 -1000 -500 0 500 1000 1500<br />
Frequenz (Hz)<br />
Abbildung 7: Entstehung von Seitenfrequenzen bei <strong>der</strong> Amplitudenmodulation<br />
ter oft abhängig voneinan<strong>der</strong> und eine Verän<strong>der</strong>ung erzeugt Nebeneffekte, die ebenso gut<br />
für die wahrgenommene Verän<strong>der</strong>ung (z.B. Aufteilung in zwei <strong>Ströme</strong> bzw. Fusion von<br />
<strong>Ströme</strong>n) verantwortlich sein können. In vielen Fällen wurde dies durch anschließende Folgeexperimente<br />
gegengeprüft, so dass an<strong>der</strong>e Ursachen ausgeschlossen werden konnten.<br />
Ein Beispiel hierfür ist <strong>der</strong> in Abschnitt 2 erwähnte Versuch mit Neugeborenen von<br />
Laurent Demany. Es wurde dazu die im letzten Abschnitt genannte Methode <strong>der</strong> Reihenfolgenbestimmung<br />
genutzt. Um auszuschließen, dass die Kin<strong>der</strong> nicht generell unfähig<br />
waren, die Reihenfolge von Tonsequenzen zu bestimmen, wurden weitere Versuche gemacht,<br />
bei denen auch nach einer Separierung die Reihenfolge aus Sicht eines erwachsenen Hörers<br />
bestimmbar blieb. Die Kin<strong>der</strong> schienen in diesem Fall ebenfalls die Reihenfolge <strong>der</strong> Töne<br />
feststellen zu können, alle Indizien sprechen also für die Separierung.<br />
Bei Experimenten mit Amplitudenmodulation wurde diese nach dem Gesetz des gemeinsamen<br />
Schicksals als Ursache für Separierung interpretiert (Abschnitt 2.2.3). Physikalisch<br />
betrachtet entsteht durch Modulation eines Sinustons allerdings ein verän<strong>der</strong>tes<br />
Spektrum. Die hier verwendete Multiplikation eines Tons mit einem angehobenen Cosinus<br />
führt dazu, dass zwei Seitenbän<strong>der</strong>, also zwei weitere Frequenzbereiche, im Spektrum<br />
auftreten, wie sich durch den Faltungssatzes unmittelbar sehen lässt (Abbildung 7).<br />
Durch unterschiedliche Variationen aller relevanten Parameter wurden viele Messergebnisse<br />
erzeugt, die diese Effekte genauer untersuchen sollten. Es stellte sich dabei insbeson<strong>der</strong>e<br />
die Frage, ob die Harmonie <strong>der</strong> entstehenden Seitenfrequenzen und die entstehende<br />
subjektive Tonhöhe Einfluss auf das Ergebnis hatte. Durch verschiedene harmonische und<br />
inharmonische Konstellationen stellte sich heraus, dass die beobachteten Effekte tatsächlich<br />
nur mit <strong>der</strong> Frequenzdifferenz und <strong>der</strong> gemeinsamen Modulation zusammenhingen.<br />
Auch die Schwierigkeit, bestimmte Sachverhalte zu beschreiben und die Geschwindig-
Julian Kurz — <strong>Separiertheit</strong> von <strong>Ströme</strong>n 15<br />
keit <strong>der</strong> bewussten Verarbeitung können Experimente verfälschen und zu falschen Schlüssen<br />
führen. Ein Beispiel hierfür ist das Experiment von Gillian Rhodes (S. 74). Es sollte zeigen,<br />
dass <strong>der</strong> Raum als Kontinuum wahrgenommen wird, die Aufmerksamkeit sich daher<br />
nur mit endlicher Geschwindigkeit zwischen unterschiedlichen Orten bewegen kann. Hierzu<br />
wurde eine Person in einen Raum mit neun durchnummerierten Lautsprechern gesetzt und<br />
sollte sagen, aus welchem Lautsprecher jeweils ein Ton kam. Es zeigte sich dabei, dass die<br />
Dauer, die die Person brauchte um den Lautsprecher zu bestimmen proportional zum Abstand<br />
zu dem Lautsprecher war, aus dem <strong>der</strong> letzte Ton kam. Bregman vermutet, dass dies<br />
die ganz banale Ursache haben könnte, dass <strong>der</strong> Hörer zunächst die dazwischen liegenden<br />
Lautsprecher durchzählen musste.<br />
Die zuvor genannten Schwierigkeiten bei <strong>der</strong> Bestimmung <strong>der</strong> Reihenfolge von Sequenzen<br />
scheinen ebenfalls anfällig für solche Nebeneffekte zu sein. So stellte sich heraus, dass<br />
es den Versuchspersonen leichter fiel, die Reihenfolge durch das Legen von Karten zu bestimmen<br />
als sie verbal zu beschreiben (S. 153). Auf diese Weise konnten sie die Aufgabe<br />
intuitiver durchführen und in einzelne Teilaufgaben herunterbrechen, die jeweils einfacher<br />
zu bewältigen waren: Das Bestimmen nur des jeweils nächsten Tons in <strong>der</strong> gehörten Sequenz<br />
in jedem Durchgang. Offensichtlich waren die hier festgestellten Unterschiede zwischen <strong>der</strong><br />
Fähigkeit zur verbalen Beschreibung und zur Beschreibung durch Karten keineswegs auf<br />
auditive Phänomene zurückzuführen son<strong>der</strong>n hatten an<strong>der</strong>e Ursachen.
Julian Kurz — <strong>Separiertheit</strong> von <strong>Ströme</strong>n 16<br />
4 Zusammenfassung und Ausblick<br />
Insgesamt kann gesagt werden, dass viele einzelne Merkmale dazu beitragen, dass bestimmte<br />
Schallereignisse zu <strong>Ströme</strong>n zusammengefasst und von an<strong>der</strong>en getrennt werden. Diese<br />
Merkmale und die Art, wie sie sich auswirken, sind dabei nach in <strong>der</strong> natürlichen Umgebung<br />
sinnvollen Kriterien gewählt. Ein wesentlicher Grundsatz zeigt sich zum Beispiel in<br />
<strong>der</strong> Alt-Plus-Neu-Heuristik (Abschnitt 2.2.2) und dem Gesetz des gemeinsamen Schicksals<br />
(Abschnitt 2.2.3): Ähnlichkeiten, die sehr nur mit sehr geringer Wahrscheinlichkeit zufällig<br />
entstehen können, führen dazu, dass Ereignisse dem gleichen Strom zugewiesen werden.<br />
Es zeigte sich aber auch, dass diese Merkmale nicht alle einfach quantitativ zu fassen<br />
sind: Zum einen gibt es Merkmale wie die “Granularität” (Abschnitt 2.1.2), die zwar eine<br />
Rolle zu spielen scheinen, aber kaum physikalisch zu beschreiben sind. Doch auch für<br />
physikalisch einfach zu beschreibende Eigenschaften gibt es Schwierigkeiten wirklich feste<br />
Grenzwerte anzugeben, da diese je nach Versuchsdurchführung und Versuchssubjekten variieren.<br />
Immerhin lassen sich aber für bestimmte Situationen, wie sie in den Versuchen<br />
auftraten, relativ präzise Grenzen angeben.<br />
Eine wirklich allumfassende Theorie für die auditive Szenenanalyse ist also noch lange<br />
nicht in Sicht. Bregman stellt zwar sehr viele Theorien und Ergebnisse verschiedener<br />
Wissenschaftler zusammen, stößt dabei aber auch auf einige wi<strong>der</strong>sprüchliche Annahmen<br />
und teilweise auch Versuchsergebnisse, die sich zu wi<strong>der</strong>sprechen scheinen und nur schwer<br />
zu erklären sind. Oft ist es auch schwer zu beurteilen, ob ein Experiment wirklich das beobachtet<br />
hat, was es beobachten wollte o<strong>der</strong> durch einen ganz an<strong>der</strong>en Effekt beeinflusst<br />
wurde.<br />
Relativ unbekannt ist auch, wie genau die Verarbeitung <strong>der</strong> akustischen Signale im<br />
Nervensystem des Menschen funktioniert. Insbeson<strong>der</strong>e ist dabei auch interessant, auf welcher<br />
Ebene bestimmte Vorverarbeitungen ablaufen. Manche Effekte scheinen auf wesentlich<br />
niedrigerer Ebene zu arbeiten als an<strong>der</strong>e. Es gibt sogar scheinbare Verklemmungssituationen,<br />
bei denen zwei Vorgänge die Ergebnisse des jeweils an<strong>der</strong>en einbeziehen (S. 257).
Julian Kurz — <strong>Separiertheit</strong> von <strong>Ströme</strong>n 17<br />
Literatur<br />
[Bre99] Albert S. Bregman. Auditory Scene Analysis. MIT Press, paperback edition, 1999.<br />
[Lit65] Thomas S. Littler. The physics of the ear. Pergamon Press, 1. ed. edition, 1965.<br />
[Wik] Wikipedia. Lokalisation (akustik). http://de.wikipedia.org/w/index.php?<br />
oldid=26752440. Zugriff: 27.1.2007, 22:24.