Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Resultate <strong>und</strong> Perspektiven 88<br />
Ähnlich zur precision ist auch der fallout e<strong>in</strong> Maß für den Anteil an falschen Instanzen<br />
im Ergebnis. Der Unterschied ist jedoch, dass diese Menge nicht zum Gesamtumfang des<br />
Ergebnisses, sondern zur Zahl der negativen Instanzen im Suchrauch selbst <strong>in</strong> Beziehung<br />
gesetzt wird.<br />
fallout =<br />
negfo<strong>und</strong><br />
negfo<strong>und</strong> + negmissed<br />
(5.3)<br />
Da diese drei Maßzahlen sehr stark mite<strong>in</strong>ander korrelieren, ist es im S<strong>in</strong>ne e<strong>in</strong>er leich-<br />
teren Vergleichbarkeit <strong>von</strong> Resultaten nützlich, sie zu e<strong>in</strong>em e<strong>in</strong>zelnen Wert zu verknüp-<br />
fen. Dieser so genannte f-Wert ergibt sich als<br />
f = 2 <br />
precision recall<br />
precision + recall<br />
(5.4)<br />
Um Ergebnisse zudem besser beurteilen zu können, wird <strong>in</strong> Anlehnung an [18] e<strong>in</strong>e Ba-<br />
sel<strong>in</strong>e für diese Maße hergeleitet. Sie beschreibt des Ergebnis, das bei zufälliger Auswahl<br />
e<strong>in</strong>er bestimmten Anzahl n an Paaren zustande kommt. Ausgegangen wird dabei <strong>von</strong><br />
e<strong>in</strong>er Sammlung mit N Songs <strong>und</strong> somit Npairs = N(N−1)<br />
2<br />
möglichen Paarungen, <strong>von</strong><br />
denen Ncover tatsächlich <strong>Versionen</strong> des jeweils selben Musikstücks s<strong>in</strong>d. Die Menge der<br />
richtigen Klassifizierungen <strong>in</strong>nerhalb dieser Ergebnismenge ergibt sich als<br />
pos rand<br />
fo<strong>und</strong> =<br />
m<strong>in</strong>(n,Ncover−1)<br />
<br />
k=1<br />
= n (Ncover − 1)<br />
Npairs − 1<br />
k <br />
Npairs−Ncover n−k<br />
Ncover−1 k<br />
<br />
Npairs−1<br />
n<br />
Setzt man posrand fo<strong>und</strong> <strong>in</strong> die Formeln für recall <strong>und</strong> precision e<strong>in</strong>, so ergeben sich<br />
recall rand = posrand<br />
fo<strong>und</strong><br />
Ncover−1 =<br />
n<br />
Npairs − 1<br />
precision rand = posrand<br />
fo<strong>und</strong><br />
n = Ncover − 1<br />
Npairs − 1<br />
f rand = 2 Ncover − 1<br />
Ncover − 1 + n <br />
n<br />
Npairs − 1<br />
<br />
(5.5)<br />
(5.6)<br />
(5.7)<br />
(5.8)