Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Feature Extraktion 33<br />
sich am menschlichen Gehör zu orientieren. Der Forschungsbereich der Psycho-Akustik<br />
liefert dazu Modelle, die die Audio-Wahrnehmung des Menschen beschreiben. Diese<br />
Wahrnehmung unterliegt bestimmten E<strong>in</strong>schränkungen bzw. Unschärfen. Berücksich-<br />
tigt man diese, so können e<strong>in</strong>erseits Algorithmen besser an die perzeptuellen Vorgänge<br />
beim Menschen angepasst werden. Andererseits ist es möglich durch Vernachlässigung<br />
<strong>von</strong> Daten, die vom Menschen ohneh<strong>in</strong> nicht wahrgenommen werden, e<strong>in</strong>e Reduktion<br />
des zu verarbeitenden Datenvolumens zu erreichen. Dieses Pr<strong>in</strong>zip machen sich bei-<br />
spielsweise verlustbehaftete Komprimierungsverfahren zu Nutzen.<br />
Die wichtigsten der angesprochenen E<strong>in</strong>schränkungen der Wahrnehmung s<strong>in</strong>d die abso-<br />
lute Hörschwelle, simultane Maskierung, temporale Maskierung <strong>und</strong> Eigenschaften der<br />
kritischen Bänder (vgl. [36] <strong>und</strong> [48]). Ihr E<strong>in</strong>fluss auf die Audioverarbeitung wird im<br />
Folgenden beschrieben.<br />
3.2.8.1 Absolute Hörschwelle<br />
Die absolute Hörschwelle beschreibt den m<strong>in</strong>imalen Schalldruck (<strong>in</strong> dB) der notwendig<br />
ist, damit e<strong>in</strong> Ton ohne jegliche Störgeräusche <strong>von</strong> e<strong>in</strong>em Menschen wahrgenommen<br />
werden kann. Dieser ist abhängig <strong>von</strong> der Frequenz <strong>und</strong> kann verallgeme<strong>in</strong>ernd für<br />
Menschen mit gutem Gehör durch die Funktion<br />
−0.8 f<br />
f<br />
Tq(f) = 3.64<br />
− 6.5e<br />
−0.6( 1000<br />
1000<br />
−3.3)2<br />
+ 10 −3<br />
4 f<br />
1000<br />
[dB] (3.20)<br />
angenähert werden. Entsprechend dieser Formel ist das menschliche Gehör bei Frequen-<br />
zen r<strong>und</strong> um 4kHz am empf<strong>in</strong>dlichsten. Abbildung 3.6 verdeutlicht den Zusammenhang<br />
zwischen Frequenz <strong>und</strong> Hörschwelle.<br />
Diese Erkenntnis kann man sich <strong>in</strong>sofern zu Nutze machen, als dass man alle durch die<br />
bisherigen Arbeitsschritte gef<strong>und</strong>enen Peaks vernachlässigt, deren Intensität unter der<br />
für ihre Frequenz zutreffende Hörschwelle fällt.<br />
3.2.8.2 Kritische Bänder<br />
Die absolute Hörschwelle ist jedoch aus zweierlei Gründen <strong>von</strong> untergeordnetem Wert.<br />
E<strong>in</strong>erseits ist e<strong>in</strong> Ton <strong>in</strong> Musikstücken nie alle<strong>in</strong> zu hören. Aufgr<strong>und</strong> des Mitschw<strong>in</strong>gens<br />
<strong>von</strong> Obertönen s<strong>in</strong>d immer mehrere Frequenzen gleichzeitig präsent. Andererseits spielt