Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Feature Extraktion 35<br />
3.2.8.3 Simultane Maskierung<br />
Unter Maskierung versteht man den Effekt, dass e<strong>in</strong> Ton nicht hörbar ist, weil er <strong>von</strong><br />
e<strong>in</strong>em anderen übertönt wird. Simultane Maskierung tritt auf, wenn diese beiden Töne<br />
gleichzeitig erkl<strong>in</strong>gen. Aus biologischer Sicht lässt sich das so erklären, dass die Ba-<br />
silarmembran <strong>in</strong> der Cochlea durch e<strong>in</strong>en lauten Ton so stark erregt wird, dass die<br />
Schw<strong>in</strong>gung, die durch e<strong>in</strong>en leiseren Ton mit ähnlicher Frequenz auf der Membran<br />
erzeugt wird nicht, als eigener Stimulus erkannt wird.<br />
E<strong>in</strong>e weitere Besonderheit ist, dass es e<strong>in</strong>en Unterschied macht, ob es sich bei den je-<br />
weiligen Schw<strong>in</strong>gungen um e<strong>in</strong>zelne Töne oder um Rauschen <strong>in</strong>nerhalb e<strong>in</strong>es relativ<br />
schmalen Bands (1 Bark) handelt. Der Begriff Asymmetrie <strong>von</strong> Maskierung beschreibt,<br />
dass e<strong>in</strong> Ton, der Rauschen maskiert, wesentlich stärker se<strong>in</strong> muss (Signal-Masked-Ratio<br />
SMR = 24dB) als Rauschen, das e<strong>in</strong>en Ton maskiert (SMR = 4dB). Mathematisch be-<br />
schrieben wird diese Asymmetrie durch die beiden Formeln für die Schwellwerte. Diese<br />
drücken aus, ab welcher Intensität T HT e<strong>in</strong> Ton trotz Rausches mit e<strong>in</strong>er Intensität<br />
<strong>von</strong> EN <strong>in</strong>nerhalb des selben kritischen Bands noch zu hören ist bzw. umgekehrt:<br />
bzw.<br />
T HN = ET − 14.5 − B (3.21)<br />
T HT = EN − K (3.22)<br />
B steht dabei für die Nummer des kritischen Bands <strong>und</strong> K ist e<strong>in</strong> <strong>in</strong>dividueller Para-<br />
meter, der <strong>in</strong> der Regel zwischen 3 <strong>und</strong> 5 dB liegt. Abbildung 3.7 verdeutlicht nochmals<br />
das Phänomen der Asymmetrie der Maskierung.<br />
Weiters zu berücksichtigen ist die Ausbreitung des E<strong>in</strong>flusses e<strong>in</strong>es maskierenden Tons<br />
außerhalb des eigenen kritischen Bands. Der Maskierungseffekt auf niedrigere Frequen-<br />
zen ist dabei wesentlich ger<strong>in</strong>ger als jener auf höhere. Näherungsweise ist der Maskie-<br />
rungsschwellwert um 25dB pro Bark <strong>in</strong> absteigende <strong>und</strong> um 10dB pro Bark <strong>in</strong> aufstei-<br />
gende Richtung verr<strong>in</strong>gert. Ausgedrückt wird dies durch die analytische Funktion<br />
SF (x) = 15.81 + 7.5(x + 0.474) − 17.5 1 + (x + 0.474) 2 [dB] (3.23)