Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Feature Extraktion 62<br />
Innerhalb solcher 50 ms Abschnitte sucht der Algorithmus dann nach stabilen Fragmen-<br />
ten. Das Extrahieren <strong>von</strong> Melodiestimmen besteht <strong>in</strong> der Folge aus dem Gruppieren<br />
passender aufe<strong>in</strong>anderfolgender Fragmente. Dabei wird <strong>in</strong> mehreren Schritten vorge-<br />
gangen.<br />
1. Fragmente mit stark ausgeprägter Obertonreihe werden herausgefiltert. E<strong>in</strong> zwei-<br />
ter Filter elim<strong>in</strong>iert alle jene Fragmente, deren relative Lautheit unter e<strong>in</strong>em be-<br />
stimmten Schwellwert liegt.<br />
2. Auf diese Art ausgewählte signifikante Fragmente werden entsprechend ihrer Ähn-<br />
lichkeit geclustert. Diese ergibt sich anhand mehrere Features. Unter anderem s<strong>in</strong>d<br />
das die Durchschnittsfrequenz, die durchschnittliche Lautstärke, das Verhältnis<br />
ungerader zu geraden Obertönen bzw. die Unregelmäßigkeiten <strong>in</strong> den Obertönen,<br />
die Cepstrum Koeffizienten oder die Dom<strong>in</strong>anz der erzeugenden Tonmodelle im<br />
Verhältnis zum Gesamtklangbild. Das Ergebnis s<strong>in</strong>d zwei bis fünf Cluster, die<br />
anhand des k-means Algorithmus gebildet werden.<br />
3. Gerichtete azyklische Graphen (directed acyclic graphs – DAGs) werden durch<br />
Verb<strong>in</strong>den benachbarter ähnlicher Fragmente desselben Clusters gebildet. Auf<br />
diese Art werden näherungsweise größere Bruchstücke der Melodiestimmen zu-<br />
sammengesetzt. Jedem Fragment wird dabei e<strong>in</strong> Graphknoten zugeordnet. Die<br />
Kanten werden je nach Frequenz- <strong>und</strong> Lautstärkenunterschied, Länge des zeitli-<br />
chen Spalts zwischen den Gruppen sowie Klangfarbenabweichung gewichtet.<br />
4. Kurze Lücken zwischen verb<strong>und</strong>enen signifikanten Fragmenten werden bestmög-<br />
lich geschlossen. Dabei kommt e<strong>in</strong> Shortest Path Algorithmus zur Anwendung<br />
um den besten tatsächlichen Pfad entlang gef<strong>und</strong>ener Fragmente <strong>von</strong> e<strong>in</strong>em DAG-<br />
Knoten zum nächsten zu f<strong>in</strong>den. Die Gewichtung der Kanten entlang e<strong>in</strong>es Pfades<br />
ergibt außerdem die Kosten.<br />
5. Konkurrierende Pfade über die Fragmente werden aufgelöst <strong>in</strong>dem kurze Pfade<br />
bzw. solche mit ger<strong>in</strong>gen Kosten bevorzugt werden.<br />
6. Pfade des dom<strong>in</strong>antesten Clusters formen schließlich die extrahierte Melodie.<br />
Die Dom<strong>in</strong>anz ergibt sich dabei aus e<strong>in</strong>er Komb<strong>in</strong>ation aus Lautstärke, Cluster-<br />
Konsistenz <strong>und</strong> Verhältnis der Gesamtzeit zu jener Zeit, <strong>in</strong> der e<strong>in</strong>e Melodiestim-<br />
me präsent ist.<br />
Anwendung f<strong>in</strong>det dieses Verfahren unter anderem <strong>in</strong> [30] um die Ähnlichkeit zwischen<br />
zwei Musikstücken zu ermitteln. Die ermittelte Melodie wird dabei anhand des durch<br />
e<strong>in</strong>e Rhythmuserkennung gewonnenen Tempos normiert. Weiters f<strong>in</strong>det e<strong>in</strong>e Struktur-