Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Klassifizierung 81<br />
4.2 Dynamic Time Warp<br />
Unbed<strong>in</strong>gt notwendig zur Klassifizierung zweier Stücke als eigenständig bzw. als Ver-<br />
sionen des selben Songs ist es, deren Merkmale im zeitlichen Verlauf zu beobachten.<br />
Anders als bei allgeme<strong>in</strong>er Ähnlichkeit reicht es nicht, gleiche Akkorde, Harmonien<br />
oder Klangfarben zu identifizieren, sondern es gilt übere<strong>in</strong>stimmende Akkord- oder<br />
Harmonie-Folgen zu f<strong>in</strong>den.<br />
Gesucht ist somit e<strong>in</strong>e Ausrichtung der beiden Musikstücke ane<strong>in</strong>ander, sodass jeder<br />
Frame des e<strong>in</strong>en mit e<strong>in</strong>em möglichst ähnlichen des anderen korrespondiert. Da beide<br />
Stücke <strong>in</strong> der Regel nicht auf den Frame genau gleich lang s<strong>in</strong>d, ist es nötig, Lücken <strong>in</strong><br />
die Anordnung e<strong>in</strong>fügen zu können. Wird etwa der C-Dur Dreiklang <strong>in</strong> e<strong>in</strong>em Tempo<br />
gespielt, bei dem jeder Ton zwei Frames anhält <strong>und</strong> <strong>in</strong> der zweiter Version <strong>in</strong> e<strong>in</strong>em<br />
langsameren Tempo, sodass derselbe Ton jeweils <strong>in</strong> drei Frames aufsche<strong>in</strong>t, so ergibt<br />
dies folgende vere<strong>in</strong>fachte Ausrichtung.<br />
c c − e e − g g −<br />
c c c e e e g g g<br />
E<strong>in</strong> weiteres Beispiel für die Notwendigkeit <strong>von</strong> Lücken <strong>in</strong> e<strong>in</strong>em größeren Rahmen s<strong>in</strong>d<br />
neue Abschnitte <strong>in</strong> e<strong>in</strong>em Song, die im anderen nicht enthalten s<strong>in</strong>d. Geht man etwa <strong>von</strong><br />
e<strong>in</strong>er ursprünglichen Liedform [Intro-Vers-Chorus-Vers-Solo-Vers-Chorus] aus, <strong>und</strong> da-<br />
<strong>von</strong>, dass <strong>in</strong> der <strong>Cover</strong>-Version das Solo fehlt, dafür aber e<strong>in</strong>e zusätzliche Wiederholung<br />
des Refra<strong>in</strong>s am Ende h<strong>in</strong>zugefügt wurde, so entspricht dies folgender Ausrichtung.<br />
Intro V ers Chorus V ers Solo V ers Chorus −<br />
Intro V ers Chorus V ers − V ers Chorus Chorus<br />
Der Dynamic Time Warp (DTW) Algorithmus berechnet anhand e<strong>in</strong>es Maßes für die<br />
Ähnlichkeit zweier Elemente (Frames) der E<strong>in</strong>gabedaten sowie e<strong>in</strong>er festgelegten Strafe<br />
für nötige Lücken die optimale Ausrichtung. Diese Ähnlichkeiten wurden bereits quan-<br />
tifiziert <strong>und</strong> s<strong>in</strong>d aus der Ähnlichkeits-Matrix ersichtlich. Jede Zelle SMi,j entspricht<br />
der Gleichartigkeit zwischen Frame i des e<strong>in</strong>e <strong>und</strong> Frame j des anderen Songs. In der<br />
Visualisierung kann das Ergebnis des DTW-Algorithmus als optimaler Pfad diagonal<br />
durch die aufgespannte Ebene (vgl. Kapitel 4.1) <strong>in</strong>terpretiert werden.<br />
Die e<strong>in</strong>fachste Möglichkeit das Verfahren durchzuführen, besteht <strong>in</strong> der Methode des<br />
Dynamic Programm<strong>in</strong>g. Dabei wird e<strong>in</strong>e (n + 1) × (m + 1)- Matrix DT W aufgestellt,<br />
wobei n <strong>und</strong> m die Längen der beiden Input-Ketten – bestehend aus den Frames der