Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Resultate <strong>und</strong> Perspektiven 87<br />
• Hauptdiagonale<br />
Diese Methode berechnet die Gleichartigkeit zweier Stücke anhand der durch-<br />
schnittlichen Werte entlang der Hauptdiagonale der Ähnlichkeitsmatrix. Dadurch<br />
werden zwar Variationen im Tempo berücksichtigt, die Methode ist jedoch nicht<br />
robust gegenüber Strukturveränderungen.<br />
• 45 Grad Diagonale<br />
E<strong>in</strong>e weitere Variante stellt das Heranziehen des Durchschnittswerte der Ähnlich-<br />
keiten entlang e<strong>in</strong>er Gerade aus dem Ursprung der Ähnlichkeitsmatrix mit e<strong>in</strong>er<br />
Steigung <strong>von</strong> 45 Grad dar. Dieses Vorgehen unterstellt nicht nur e<strong>in</strong>e gleiche<br />
Struktur der beiden verglichenen Songs, sondern auch e<strong>in</strong> gleiches Tempo.<br />
Es liegt auf der Hand, dass die beiden zuletzt genannten Methoden unzulässige Annah-<br />
men treffen. Sie wurden jedoch aus dem Gr<strong>und</strong> <strong>in</strong> die Evaluierung mite<strong>in</strong>bezogen, um zu<br />
sehen, wie stark sich die Ergebnisse durch Berücksichtigung der jeweiligen Strukturen<br />
<strong>und</strong> Tempi der Musikstücke verbessern lassen.<br />
Die Bewertung der e<strong>in</strong>zelnen Komb<strong>in</strong>ationen erfolgt anhand der recall, precision <strong>und</strong><br />
fallout Maße. Diese s<strong>in</strong>d im Kontext <strong>von</strong> Suchaufgaben gebräuchlich <strong>und</strong> messen die<br />
Güte des Ergebnisses unter der Annahme, dass gewisse Informationen über den Such-<br />
raum vorhanden s<strong>in</strong>d.<br />
Der recall misst, wie viele der relevanten Instanzen p tatsächlich gef<strong>und</strong>en wurden <strong>und</strong><br />
ist def<strong>in</strong>iert als<br />
recall =<br />
posfo<strong>und</strong><br />
posfo<strong>und</strong> + posmissed<br />
(5.1)<br />
Als relevante (positive) Instanz wird <strong>in</strong> diesem Kontext e<strong>in</strong> Paar an Songs gewertet, das<br />
aus zwei <strong>Versionen</strong> des gleichen Musikstücks besteht. Durch e<strong>in</strong> Anpassen des Schwell-<br />
werts, ab dem <strong>Versionen</strong> als solche erkannt werden, kann dieser Wert natürlich belie-<br />
big erhöht werden. Dies geht jedoch <strong>in</strong>sofern zu Lasten der Qualität, als dass immer<br />
mehr Instanzen fälschlicherweise im Ergebnis aufsche<strong>in</strong>en. Die precision misst daher das<br />
Verhältnis der richtigen (positiven) Treffer <strong>in</strong> der Ergebnismenge zu den <strong>in</strong>korrekten<br />
(negativen) <strong>und</strong> ist festgelegt als<br />
precision =<br />
posfo<strong>und</strong><br />
posfo<strong>und</strong> + negfo<strong>und</strong><br />
(5.2)