10.10.2013 Aufrufe

Automatische Erkennung von Cover-Versionen und Plagiaten in ...

Automatische Erkennung von Cover-Versionen und Plagiaten in ...

Automatische Erkennung von Cover-Versionen und Plagiaten in ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Resultate <strong>und</strong> Perspektiven 88<br />

Ähnlich zur precision ist auch der fallout e<strong>in</strong> Maß für den Anteil an falschen Instanzen<br />

im Ergebnis. Der Unterschied ist jedoch, dass diese Menge nicht zum Gesamtumfang des<br />

Ergebnisses, sondern zur Zahl der negativen Instanzen im Suchrauch selbst <strong>in</strong> Beziehung<br />

gesetzt wird.<br />

fallout =<br />

negfo<strong>und</strong><br />

negfo<strong>und</strong> + negmissed<br />

(5.3)<br />

Da diese drei Maßzahlen sehr stark mite<strong>in</strong>ander korrelieren, ist es im S<strong>in</strong>ne e<strong>in</strong>er leich-<br />

teren Vergleichbarkeit <strong>von</strong> Resultaten nützlich, sie zu e<strong>in</strong>em e<strong>in</strong>zelnen Wert zu verknüp-<br />

fen. Dieser so genannte f-Wert ergibt sich als<br />

f = 2 <br />

precision recall<br />

precision + recall<br />

(5.4)<br />

Um Ergebnisse zudem besser beurteilen zu können, wird <strong>in</strong> Anlehnung an [18] e<strong>in</strong>e Ba-<br />

sel<strong>in</strong>e für diese Maße hergeleitet. Sie beschreibt des Ergebnis, das bei zufälliger Auswahl<br />

e<strong>in</strong>er bestimmten Anzahl n an Paaren zustande kommt. Ausgegangen wird dabei <strong>von</strong><br />

e<strong>in</strong>er Sammlung mit N Songs <strong>und</strong> somit Npairs = N(N−1)<br />

2<br />

möglichen Paarungen, <strong>von</strong><br />

denen Ncover tatsächlich <strong>Versionen</strong> des jeweils selben Musikstücks s<strong>in</strong>d. Die Menge der<br />

richtigen Klassifizierungen <strong>in</strong>nerhalb dieser Ergebnismenge ergibt sich als<br />

pos rand<br />

fo<strong>und</strong> =<br />

m<strong>in</strong>(n,Ncover−1)<br />

<br />

k=1<br />

= n (Ncover − 1)<br />

Npairs − 1<br />

k <br />

Npairs−Ncover n−k<br />

Ncover−1 k<br />

<br />

Npairs−1<br />

n<br />

Setzt man posrand fo<strong>und</strong> <strong>in</strong> die Formeln für recall <strong>und</strong> precision e<strong>in</strong>, so ergeben sich<br />

recall rand = posrand<br />

fo<strong>und</strong><br />

Ncover−1 =<br />

n<br />

Npairs − 1<br />

precision rand = posrand<br />

fo<strong>und</strong><br />

n = Ncover − 1<br />

Npairs − 1<br />

f rand = 2 Ncover − 1<br />

Ncover − 1 + n <br />

n<br />

Npairs − 1<br />

<br />

(5.5)<br />

(5.6)<br />

(5.7)<br />

(5.8)

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!