10.10.2013 Aufrufe

Automatische Erkennung von Cover-Versionen und Plagiaten in ...

Automatische Erkennung von Cover-Versionen und Plagiaten in ...

Automatische Erkennung von Cover-Versionen und Plagiaten in ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Feature Extraktion 62<br />

Innerhalb solcher 50 ms Abschnitte sucht der Algorithmus dann nach stabilen Fragmen-<br />

ten. Das Extrahieren <strong>von</strong> Melodiestimmen besteht <strong>in</strong> der Folge aus dem Gruppieren<br />

passender aufe<strong>in</strong>anderfolgender Fragmente. Dabei wird <strong>in</strong> mehreren Schritten vorge-<br />

gangen.<br />

1. Fragmente mit stark ausgeprägter Obertonreihe werden herausgefiltert. E<strong>in</strong> zwei-<br />

ter Filter elim<strong>in</strong>iert alle jene Fragmente, deren relative Lautheit unter e<strong>in</strong>em be-<br />

stimmten Schwellwert liegt.<br />

2. Auf diese Art ausgewählte signifikante Fragmente werden entsprechend ihrer Ähn-<br />

lichkeit geclustert. Diese ergibt sich anhand mehrere Features. Unter anderem s<strong>in</strong>d<br />

das die Durchschnittsfrequenz, die durchschnittliche Lautstärke, das Verhältnis<br />

ungerader zu geraden Obertönen bzw. die Unregelmäßigkeiten <strong>in</strong> den Obertönen,<br />

die Cepstrum Koeffizienten oder die Dom<strong>in</strong>anz der erzeugenden Tonmodelle im<br />

Verhältnis zum Gesamtklangbild. Das Ergebnis s<strong>in</strong>d zwei bis fünf Cluster, die<br />

anhand des k-means Algorithmus gebildet werden.<br />

3. Gerichtete azyklische Graphen (directed acyclic graphs – DAGs) werden durch<br />

Verb<strong>in</strong>den benachbarter ähnlicher Fragmente desselben Clusters gebildet. Auf<br />

diese Art werden näherungsweise größere Bruchstücke der Melodiestimmen zu-<br />

sammengesetzt. Jedem Fragment wird dabei e<strong>in</strong> Graphknoten zugeordnet. Die<br />

Kanten werden je nach Frequenz- <strong>und</strong> Lautstärkenunterschied, Länge des zeitli-<br />

chen Spalts zwischen den Gruppen sowie Klangfarbenabweichung gewichtet.<br />

4. Kurze Lücken zwischen verb<strong>und</strong>enen signifikanten Fragmenten werden bestmög-<br />

lich geschlossen. Dabei kommt e<strong>in</strong> Shortest Path Algorithmus zur Anwendung<br />

um den besten tatsächlichen Pfad entlang gef<strong>und</strong>ener Fragmente <strong>von</strong> e<strong>in</strong>em DAG-<br />

Knoten zum nächsten zu f<strong>in</strong>den. Die Gewichtung der Kanten entlang e<strong>in</strong>es Pfades<br />

ergibt außerdem die Kosten.<br />

5. Konkurrierende Pfade über die Fragmente werden aufgelöst <strong>in</strong>dem kurze Pfade<br />

bzw. solche mit ger<strong>in</strong>gen Kosten bevorzugt werden.<br />

6. Pfade des dom<strong>in</strong>antesten Clusters formen schließlich die extrahierte Melodie.<br />

Die Dom<strong>in</strong>anz ergibt sich dabei aus e<strong>in</strong>er Komb<strong>in</strong>ation aus Lautstärke, Cluster-<br />

Konsistenz <strong>und</strong> Verhältnis der Gesamtzeit zu jener Zeit, <strong>in</strong> der e<strong>in</strong>e Melodiestim-<br />

me präsent ist.<br />

Anwendung f<strong>in</strong>det dieses Verfahren unter anderem <strong>in</strong> [30] um die Ähnlichkeit zwischen<br />

zwei Musikstücken zu ermitteln. Die ermittelte Melodie wird dabei anhand des durch<br />

e<strong>in</strong>e Rhythmuserkennung gewonnenen Tempos normiert. Weiters f<strong>in</strong>det e<strong>in</strong>e Struktur-

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!