10.10.2013 Aufrufe

Automatische Erkennung von Cover-Versionen und Plagiaten in ...

Automatische Erkennung von Cover-Versionen und Plagiaten in ...

Automatische Erkennung von Cover-Versionen und Plagiaten in ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Klassifizierung 81<br />

4.2 Dynamic Time Warp<br />

Unbed<strong>in</strong>gt notwendig zur Klassifizierung zweier Stücke als eigenständig bzw. als Ver-<br />

sionen des selben Songs ist es, deren Merkmale im zeitlichen Verlauf zu beobachten.<br />

Anders als bei allgeme<strong>in</strong>er Ähnlichkeit reicht es nicht, gleiche Akkorde, Harmonien<br />

oder Klangfarben zu identifizieren, sondern es gilt übere<strong>in</strong>stimmende Akkord- oder<br />

Harmonie-Folgen zu f<strong>in</strong>den.<br />

Gesucht ist somit e<strong>in</strong>e Ausrichtung der beiden Musikstücke ane<strong>in</strong>ander, sodass jeder<br />

Frame des e<strong>in</strong>en mit e<strong>in</strong>em möglichst ähnlichen des anderen korrespondiert. Da beide<br />

Stücke <strong>in</strong> der Regel nicht auf den Frame genau gleich lang s<strong>in</strong>d, ist es nötig, Lücken <strong>in</strong><br />

die Anordnung e<strong>in</strong>fügen zu können. Wird etwa der C-Dur Dreiklang <strong>in</strong> e<strong>in</strong>em Tempo<br />

gespielt, bei dem jeder Ton zwei Frames anhält <strong>und</strong> <strong>in</strong> der zweiter Version <strong>in</strong> e<strong>in</strong>em<br />

langsameren Tempo, sodass derselbe Ton jeweils <strong>in</strong> drei Frames aufsche<strong>in</strong>t, so ergibt<br />

dies folgende vere<strong>in</strong>fachte Ausrichtung.<br />

c c − e e − g g −<br />

c c c e e e g g g<br />

E<strong>in</strong> weiteres Beispiel für die Notwendigkeit <strong>von</strong> Lücken <strong>in</strong> e<strong>in</strong>em größeren Rahmen s<strong>in</strong>d<br />

neue Abschnitte <strong>in</strong> e<strong>in</strong>em Song, die im anderen nicht enthalten s<strong>in</strong>d. Geht man etwa <strong>von</strong><br />

e<strong>in</strong>er ursprünglichen Liedform [Intro-Vers-Chorus-Vers-Solo-Vers-Chorus] aus, <strong>und</strong> da-<br />

<strong>von</strong>, dass <strong>in</strong> der <strong>Cover</strong>-Version das Solo fehlt, dafür aber e<strong>in</strong>e zusätzliche Wiederholung<br />

des Refra<strong>in</strong>s am Ende h<strong>in</strong>zugefügt wurde, so entspricht dies folgender Ausrichtung.<br />

Intro V ers Chorus V ers Solo V ers Chorus −<br />

Intro V ers Chorus V ers − V ers Chorus Chorus<br />

Der Dynamic Time Warp (DTW) Algorithmus berechnet anhand e<strong>in</strong>es Maßes für die<br />

Ähnlichkeit zweier Elemente (Frames) der E<strong>in</strong>gabedaten sowie e<strong>in</strong>er festgelegten Strafe<br />

für nötige Lücken die optimale Ausrichtung. Diese Ähnlichkeiten wurden bereits quan-<br />

tifiziert <strong>und</strong> s<strong>in</strong>d aus der Ähnlichkeits-Matrix ersichtlich. Jede Zelle SMi,j entspricht<br />

der Gleichartigkeit zwischen Frame i des e<strong>in</strong>e <strong>und</strong> Frame j des anderen Songs. In der<br />

Visualisierung kann das Ergebnis des DTW-Algorithmus als optimaler Pfad diagonal<br />

durch die aufgespannte Ebene (vgl. Kapitel 4.1) <strong>in</strong>terpretiert werden.<br />

Die e<strong>in</strong>fachste Möglichkeit das Verfahren durchzuführen, besteht <strong>in</strong> der Methode des<br />

Dynamic Programm<strong>in</strong>g. Dabei wird e<strong>in</strong>e (n + 1) × (m + 1)- Matrix DT W aufgestellt,<br />

wobei n <strong>und</strong> m die Längen der beiden Input-Ketten – bestehend aus den Frames der

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!