10.10.2013 Aufrufe

Automatische Erkennung von Cover-Versionen und Plagiaten in ...

Automatische Erkennung von Cover-Versionen und Plagiaten in ...

Automatische Erkennung von Cover-Versionen und Plagiaten in ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Resultate <strong>und</strong> Perspektiven 87<br />

• Hauptdiagonale<br />

Diese Methode berechnet die Gleichartigkeit zweier Stücke anhand der durch-<br />

schnittlichen Werte entlang der Hauptdiagonale der Ähnlichkeitsmatrix. Dadurch<br />

werden zwar Variationen im Tempo berücksichtigt, die Methode ist jedoch nicht<br />

robust gegenüber Strukturveränderungen.<br />

• 45 Grad Diagonale<br />

E<strong>in</strong>e weitere Variante stellt das Heranziehen des Durchschnittswerte der Ähnlich-<br />

keiten entlang e<strong>in</strong>er Gerade aus dem Ursprung der Ähnlichkeitsmatrix mit e<strong>in</strong>er<br />

Steigung <strong>von</strong> 45 Grad dar. Dieses Vorgehen unterstellt nicht nur e<strong>in</strong>e gleiche<br />

Struktur der beiden verglichenen Songs, sondern auch e<strong>in</strong> gleiches Tempo.<br />

Es liegt auf der Hand, dass die beiden zuletzt genannten Methoden unzulässige Annah-<br />

men treffen. Sie wurden jedoch aus dem Gr<strong>und</strong> <strong>in</strong> die Evaluierung mite<strong>in</strong>bezogen, um zu<br />

sehen, wie stark sich die Ergebnisse durch Berücksichtigung der jeweiligen Strukturen<br />

<strong>und</strong> Tempi der Musikstücke verbessern lassen.<br />

Die Bewertung der e<strong>in</strong>zelnen Komb<strong>in</strong>ationen erfolgt anhand der recall, precision <strong>und</strong><br />

fallout Maße. Diese s<strong>in</strong>d im Kontext <strong>von</strong> Suchaufgaben gebräuchlich <strong>und</strong> messen die<br />

Güte des Ergebnisses unter der Annahme, dass gewisse Informationen über den Such-<br />

raum vorhanden s<strong>in</strong>d.<br />

Der recall misst, wie viele der relevanten Instanzen p tatsächlich gef<strong>und</strong>en wurden <strong>und</strong><br />

ist def<strong>in</strong>iert als<br />

recall =<br />

posfo<strong>und</strong><br />

posfo<strong>und</strong> + posmissed<br />

(5.1)<br />

Als relevante (positive) Instanz wird <strong>in</strong> diesem Kontext e<strong>in</strong> Paar an Songs gewertet, das<br />

aus zwei <strong>Versionen</strong> des gleichen Musikstücks besteht. Durch e<strong>in</strong> Anpassen des Schwell-<br />

werts, ab dem <strong>Versionen</strong> als solche erkannt werden, kann dieser Wert natürlich belie-<br />

big erhöht werden. Dies geht jedoch <strong>in</strong>sofern zu Lasten der Qualität, als dass immer<br />

mehr Instanzen fälschlicherweise im Ergebnis aufsche<strong>in</strong>en. Die precision misst daher das<br />

Verhältnis der richtigen (positiven) Treffer <strong>in</strong> der Ergebnismenge zu den <strong>in</strong>korrekten<br />

(negativen) <strong>und</strong> ist festgelegt als<br />

precision =<br />

posfo<strong>und</strong><br />

posfo<strong>und</strong> + negfo<strong>und</strong><br />

(5.2)

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!