10.10.2013 Aufrufe

Automatische Erkennung von Cover-Versionen und Plagiaten in ...

Automatische Erkennung von Cover-Versionen und Plagiaten in ...

Automatische Erkennung von Cover-Versionen und Plagiaten in ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Feature Extraktion 33<br />

sich am menschlichen Gehör zu orientieren. Der Forschungsbereich der Psycho-Akustik<br />

liefert dazu Modelle, die die Audio-Wahrnehmung des Menschen beschreiben. Diese<br />

Wahrnehmung unterliegt bestimmten E<strong>in</strong>schränkungen bzw. Unschärfen. Berücksich-<br />

tigt man diese, so können e<strong>in</strong>erseits Algorithmen besser an die perzeptuellen Vorgänge<br />

beim Menschen angepasst werden. Andererseits ist es möglich durch Vernachlässigung<br />

<strong>von</strong> Daten, die vom Menschen ohneh<strong>in</strong> nicht wahrgenommen werden, e<strong>in</strong>e Reduktion<br />

des zu verarbeitenden Datenvolumens zu erreichen. Dieses Pr<strong>in</strong>zip machen sich bei-<br />

spielsweise verlustbehaftete Komprimierungsverfahren zu Nutzen.<br />

Die wichtigsten der angesprochenen E<strong>in</strong>schränkungen der Wahrnehmung s<strong>in</strong>d die abso-<br />

lute Hörschwelle, simultane Maskierung, temporale Maskierung <strong>und</strong> Eigenschaften der<br />

kritischen Bänder (vgl. [36] <strong>und</strong> [48]). Ihr E<strong>in</strong>fluss auf die Audioverarbeitung wird im<br />

Folgenden beschrieben.<br />

3.2.8.1 Absolute Hörschwelle<br />

Die absolute Hörschwelle beschreibt den m<strong>in</strong>imalen Schalldruck (<strong>in</strong> dB) der notwendig<br />

ist, damit e<strong>in</strong> Ton ohne jegliche Störgeräusche <strong>von</strong> e<strong>in</strong>em Menschen wahrgenommen<br />

werden kann. Dieser ist abhängig <strong>von</strong> der Frequenz <strong>und</strong> kann verallgeme<strong>in</strong>ernd für<br />

Menschen mit gutem Gehör durch die Funktion<br />

−0.8 f<br />

f<br />

Tq(f) = 3.64<br />

− 6.5e<br />

−0.6( 1000<br />

1000<br />

−3.3)2<br />

+ 10 −3<br />

4 f<br />

1000<br />

[dB] (3.20)<br />

angenähert werden. Entsprechend dieser Formel ist das menschliche Gehör bei Frequen-<br />

zen r<strong>und</strong> um 4kHz am empf<strong>in</strong>dlichsten. Abbildung 3.6 verdeutlicht den Zusammenhang<br />

zwischen Frequenz <strong>und</strong> Hörschwelle.<br />

Diese Erkenntnis kann man sich <strong>in</strong>sofern zu Nutze machen, als dass man alle durch die<br />

bisherigen Arbeitsschritte gef<strong>und</strong>enen Peaks vernachlässigt, deren Intensität unter der<br />

für ihre Frequenz zutreffende Hörschwelle fällt.<br />

3.2.8.2 Kritische Bänder<br />

Die absolute Hörschwelle ist jedoch aus zweierlei Gründen <strong>von</strong> untergeordnetem Wert.<br />

E<strong>in</strong>erseits ist e<strong>in</strong> Ton <strong>in</strong> Musikstücken nie alle<strong>in</strong> zu hören. Aufgr<strong>und</strong> des Mitschw<strong>in</strong>gens<br />

<strong>von</strong> Obertönen s<strong>in</strong>d immer mehrere Frequenzen gleichzeitig präsent. Andererseits spielt

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!