10.10.2013 Aufrufe

Automatische Erkennung von Cover-Versionen und Plagiaten in ...

Automatische Erkennung von Cover-Versionen und Plagiaten in ...

Automatische Erkennung von Cover-Versionen und Plagiaten in ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Feature Extraktion 45<br />

wird. Alternativ dazu kann d über Formel 3.38 berechnet werden, ohne dass e<strong>in</strong> Faktor<br />

m bestimmt werden muss.<br />

<br />

fi<br />

fi<br />

d = 2 12 log2 mod 6 − 12 log2 mod 12<br />

fn<br />

fn<br />

(3.38)<br />

Ist l die Länge des Fensters, <strong>in</strong>nerhalb dessen e<strong>in</strong> Gewicht größer 0 vorhanden se<strong>in</strong> soll,<br />

so ergibt sich die vollständige Gewichtungsfunktion als<br />

w(n, fi) =<br />

In [18] wird für den Parameter l e<strong>in</strong> Wert <strong>von</strong> 4<br />

3<br />

<br />

cos2 <br />

πd<br />

l : für | d |≤ l<br />

2<br />

0 : für | d | > l<br />

2<br />

(3.39)<br />

Halbtönen vorgeschlagen <strong>und</strong> für N –<br />

also die Größe des Featurevektors – e<strong>in</strong> Wert <strong>von</strong> 36, was e<strong>in</strong>er Auflösung <strong>von</strong> 3 Bändern<br />

pro Halbton entspricht. Daraus ergibt sich, dass jeder Peak zu genau 4 verschiedenen<br />

HPCP-Bändern aber nur zur Repräsentation zweier Halbtöne beiträgt.<br />

3.4.2 HPCP <strong>und</strong> Obertonreihen<br />

Bei der Berechnung des HPCP-Feature wird bewusst auf das Vorhandense<strong>in</strong> <strong>von</strong> Ober-<br />

tönen e<strong>in</strong>gegangen. Diese s<strong>in</strong>d, wie bereits beschrieben, die ganzzahligen Vielfachen<br />

der Frequenz des Gr<strong>und</strong>tons. Jede Zweierpotenz als Faktor bewirkt, dass der Oberton<br />

genau um e<strong>in</strong>e oder mehrere Oktaven über dem Gr<strong>und</strong>ton liegt <strong>und</strong> somit <strong>in</strong> die sel-<br />

be Pitch-Klasse fällt. Die anderen jedoch kommen <strong>in</strong> abweichenden Bändern zu liegen<br />

<strong>und</strong> bee<strong>in</strong>flussen so das Ergebnis. Die Pitch-Klasse der n-ten Oberschw<strong>in</strong>gung bef<strong>in</strong>den<br />

sich<br />

i(n) = 2(12 log 2(n))mod 6 − (12 log 2(n))mod 12 (3.40)<br />

Bänder <strong>von</strong> jener des Gr<strong>und</strong>tons entfernt. Für die ersten zwanzig Obertöne liegen die<br />

Frequenzen dabei wie <strong>in</strong> Tabelle 3.4 gezeigt um jeweils d Klassen <strong>in</strong> Bezug zur Gr<strong>und</strong>-<br />

frequenz verschoben. Zur besseren Darstellung wird auch der Ton der jeweiligen Pitch-<br />

Klasse angegeben, wobei <strong>von</strong> e<strong>in</strong>em c als Gr<strong>und</strong>ton ausgegangen wird. Weiters ist zu<br />

beachten, dass die Obertöne mit zunehmender Ordnung an Bedeutung verlieren.<br />

Um die Auswirkungen auf die Verteilung des Feature-Vektors zu m<strong>in</strong>imieren, schlägt<br />

Gómez <strong>in</strong> [18] vor, jeden Peak nicht nur für die Pitch-Klasse se<strong>in</strong>er eigene Frequenz

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!