Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Klassifizierung 80<br />
• Normierter W<strong>in</strong>kel<br />
Die Ähnlichkeit entspricht jener der W<strong>in</strong>kel zwischen den beiden Vektoren.<br />
• Korrelation<br />
d(i, j) = 0.5 + 0.5 <br />
u(i) v(j)<br />
| u(i) || v(j) |<br />
(4.2)<br />
Für die Korrelation zweier Variablen gibt es mehrere Maße – das bekannteste ist<br />
jenes nach Pearson <strong>und</strong> ist def<strong>in</strong>iert als<br />
rXY =<br />
Cov(X, Y )<br />
V ar(X) V ar(Y ) =<br />
E((X − E(X))(Y − E(Y )))<br />
E((X − E(X)) 2 ) E((Y − E(Y )) 2 ) (4.3)<br />
mit der Erwartungswertfunktion E. Die Werte reichen dabei <strong>von</strong> -1 bei stärkst<br />
möglichem <strong>in</strong>versem Zusammenhang bis 1 bei Übere<strong>in</strong>stimmung. Um sie ebenfalls<br />
auf e<strong>in</strong>en Bereich <strong>von</strong> [0, 1] zu normieren, erfolgt die Umrechnung nach<br />
• Intervall-basierte Distanz nach [10]<br />
r ′ XY = 0.5 + rXY<br />
2<br />
(4.4)<br />
Nötig ist vorab die Berechnung der Intervallschritte <strong>in</strong>nerhalb <strong>von</strong> u bzw. analog<br />
dazu für v als<br />
ui[s] = 1 −<br />
shift(u(i+1),s) shift(u(i),0)<br />
| maxc uc(i) − maxc vc(j) |<br />
√ 12<br />
(4.5)<br />
Die Vektoren ui enthalten somit die Ähnlichkeiten zwischen u(i) sowie dem um s<br />
geshifteten u(i + 1), was die Dom<strong>in</strong>anz des jeweiligen Intervalls ausdrückt. Diese<br />
Intervall-Wahrsche<strong>in</strong>lichkeits-Vektoren können nun anhand der zuvor beschriebe-<br />
nen Maßzahlen verglichen werden.<br />
E<strong>in</strong>e mögliche Visualisierung ist jene, e<strong>in</strong>e Ebene zwischen zwei Koord<strong>in</strong>atenachsen –<br />
die dem Zeitfortschritt im jeweiligen Song entsprechen – aufzuspannen. Werden Ähn-<br />
lichkeiten durch Farben dargestellt, können Verfahren der Bildverarbeitung zum F<strong>in</strong>den<br />
<strong>von</strong> Ähnlichkeiten angewandt werden. Diese entsprechen nämlich Diagonalen entlang<br />
derer besonders hohe Ähnlichkeitswerte liegen. Der im folgenden Kapitel vorgestellte<br />
Dynamic Time Warp-Algorithmus wird <strong>in</strong> der Bildverarbeitung etwa zum Identifizieren<br />
gleicher Objekte <strong>in</strong> mehreren Bildern angewandt.