Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Feature Extraktion 45<br />
wird. Alternativ dazu kann d über Formel 3.38 berechnet werden, ohne dass e<strong>in</strong> Faktor<br />
m bestimmt werden muss.<br />
<br />
fi<br />
fi<br />
d = 2 12 log2 mod 6 − 12 log2 mod 12<br />
fn<br />
fn<br />
(3.38)<br />
Ist l die Länge des Fensters, <strong>in</strong>nerhalb dessen e<strong>in</strong> Gewicht größer 0 vorhanden se<strong>in</strong> soll,<br />
so ergibt sich die vollständige Gewichtungsfunktion als<br />
w(n, fi) =<br />
In [18] wird für den Parameter l e<strong>in</strong> Wert <strong>von</strong> 4<br />
3<br />
<br />
cos2 <br />
πd<br />
l : für | d |≤ l<br />
2<br />
0 : für | d | > l<br />
2<br />
(3.39)<br />
Halbtönen vorgeschlagen <strong>und</strong> für N –<br />
also die Größe des Featurevektors – e<strong>in</strong> Wert <strong>von</strong> 36, was e<strong>in</strong>er Auflösung <strong>von</strong> 3 Bändern<br />
pro Halbton entspricht. Daraus ergibt sich, dass jeder Peak zu genau 4 verschiedenen<br />
HPCP-Bändern aber nur zur Repräsentation zweier Halbtöne beiträgt.<br />
3.4.2 HPCP <strong>und</strong> Obertonreihen<br />
Bei der Berechnung des HPCP-Feature wird bewusst auf das Vorhandense<strong>in</strong> <strong>von</strong> Ober-<br />
tönen e<strong>in</strong>gegangen. Diese s<strong>in</strong>d, wie bereits beschrieben, die ganzzahligen Vielfachen<br />
der Frequenz des Gr<strong>und</strong>tons. Jede Zweierpotenz als Faktor bewirkt, dass der Oberton<br />
genau um e<strong>in</strong>e oder mehrere Oktaven über dem Gr<strong>und</strong>ton liegt <strong>und</strong> somit <strong>in</strong> die sel-<br />
be Pitch-Klasse fällt. Die anderen jedoch kommen <strong>in</strong> abweichenden Bändern zu liegen<br />
<strong>und</strong> bee<strong>in</strong>flussen so das Ergebnis. Die Pitch-Klasse der n-ten Oberschw<strong>in</strong>gung bef<strong>in</strong>den<br />
sich<br />
i(n) = 2(12 log 2(n))mod 6 − (12 log 2(n))mod 12 (3.40)<br />
Bänder <strong>von</strong> jener des Gr<strong>und</strong>tons entfernt. Für die ersten zwanzig Obertöne liegen die<br />
Frequenzen dabei wie <strong>in</strong> Tabelle 3.4 gezeigt um jeweils d Klassen <strong>in</strong> Bezug zur Gr<strong>und</strong>-<br />
frequenz verschoben. Zur besseren Darstellung wird auch der Ton der jeweiligen Pitch-<br />
Klasse angegeben, wobei <strong>von</strong> e<strong>in</strong>em c als Gr<strong>und</strong>ton ausgegangen wird. Weiters ist zu<br />
beachten, dass die Obertöne mit zunehmender Ordnung an Bedeutung verlieren.<br />
Um die Auswirkungen auf die Verteilung des Feature-Vektors zu m<strong>in</strong>imieren, schlägt<br />
Gómez <strong>in</strong> [18] vor, jeden Peak nicht nur für die Pitch-Klasse se<strong>in</strong>er eigene Frequenz