Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Feature Extraktion 70<br />
Abbildung 3.21: Selbstähnlichkeits-Matrix aus Abbildung 3.20 <strong>in</strong> der Time-Lag-<br />
Darstellung<br />
3.7.2 <strong>Erkennung</strong> wiederholter Abschnitte<br />
Die <strong>Erkennung</strong> wiederholter Abschnitte geht vom Maß r(t, l) aus, das <strong>in</strong> e<strong>in</strong>em Koordi-<br />
natensystem mit der Zeit t als Abszisse <strong>und</strong> dem Zeitversatz l als Ord<strong>in</strong>ate aufgetragen<br />
wird. Gesucht wird dann nach horizontalen L<strong>in</strong>ien entlang derer hohe r(t, l)-Werte<br />
vorherrschen. Die horizontale Lage bedeutet e<strong>in</strong>en gleichen Offset l <strong>und</strong> somit e<strong>in</strong>e<br />
Parallelität über die Zeit; die hohen Werte deuten auf große Ähnlichkeit h<strong>in</strong>.<br />
Um derartige L<strong>in</strong>iensegmente zu f<strong>in</strong>den, wird für jeden Zeitversatz l berechnet, wie groß<br />
die Erfolgs-Wahrsche<strong>in</strong>lichkeit ist, solche <strong>in</strong> ihm zu f<strong>in</strong>den. Der dafür berechnete Wert<br />
Rall ergibt sich laut folgender Formel.<br />
Rall(t, l) =<br />
t<br />
l<br />
r(τ, l)<br />
dτ (3.62)<br />
t − l<br />
Der Zeitpunkt, bis zu dem gesucht wird, kann dabei über t e<strong>in</strong>gegrenzt werden, ist<br />
jedoch s<strong>in</strong>nvollerweise mit dem Ende des Songs gleichzusetzen. Vor dieser Berechnung<br />
wird r(t, l) zudem durch Subtraktion des lokalen Mittelwerts normalisiert. Das Er-<br />
gebnis dieser Berechnung ist <strong>in</strong> Abbildung 3.22 zu sehen. Ausgegangen wurde dabei<br />
wiederum vom Song Yesterday <strong>von</strong> den Beatles. Die Werte <strong>in</strong> der Ähnlichkeits-Matrix<br />
entsprechen jenen aus Grafik 3.21 – es wurde jedoch zur Verdeutlichung e<strong>in</strong>e höhere<br />
Auflösung gewählt. Die Peaks <strong>in</strong> Rall zeigen, dass <strong>in</strong> den jeweils entsprechenden Zeilen<br />
verhältnismäßig hohe Werte <strong>von</strong> r(t, l) zu f<strong>in</strong>den s<strong>in</strong>d.