10.10.2013 Aufrufe

Automatische Erkennung von Cover-Versionen und Plagiaten in ...

Automatische Erkennung von Cover-Versionen und Plagiaten in ...

Automatische Erkennung von Cover-Versionen und Plagiaten in ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Klassifizierung 83<br />

bale Tempo kann sich <strong>von</strong> e<strong>in</strong>er Version auf die andere zwar sehr wohl ändern; doch ist<br />

anzunehmen, dass die Änderungsrate konstant bleibt. Unterschiedliche Phrasierungen<br />

s<strong>in</strong>d zwar auch gewissermaßen Tempoänderungen, jedoch s<strong>in</strong>d diese derart lokal be-<br />

schränkt, dass sie durch e<strong>in</strong>e entsprechende Verr<strong>in</strong>gerung der Zeitauflösung elim<strong>in</strong>iert<br />

werden können.<br />

Als e<strong>in</strong>fache Variante kann der Durchschnitt der Ähnlichkeitswerte entlang der Haupt-<br />

diagonale der Ähnlichkeits-Matrix als Maß für die Übere<strong>in</strong>stimmung zweier Songs her-<br />

angezogen werden. Probleme treten jedoch auf, sobald entweder die Struktur verändert,<br />

oder e<strong>in</strong>fach e<strong>in</strong>e kurze Stille am Beg<strong>in</strong>n bzw. am Ende e<strong>in</strong>er der Aufnahmen h<strong>in</strong>zuge-<br />

fügt wurde.<br />

Um dieses Problem zu lösen, wird stattdessen nicht die Diagonale sondern jene Gerade<br />

durch die Ähnlichkeits-Matrix, entlang derer sich die größten Werte bef<strong>in</strong>den, zur Klas-<br />

sifikation herangezogen. E<strong>in</strong>e notwendige E<strong>in</strong>schränkung dabei ist, dass die Steigung<br />

grob 45 Grad entspricht, wie es bei unverändertem Tempo der Fall wäre. E<strong>in</strong>en zu-<br />

sätzlichen Nutzen dieser E<strong>in</strong>schränkung des Suchraums stellt außerdem der verr<strong>in</strong>gerte<br />

Rechenaufwand dar.<br />

Zur Identifizierung der dom<strong>in</strong>antesten Gerade wird die Hough-Transformation (vgl. [3]<br />

<strong>und</strong> [40]) herangezogen. Dabei werden die e<strong>in</strong>zelnen Punkte vom herkömmlichen räum-<br />

lichen Koord<strong>in</strong>atensystem (Bildbereich) <strong>in</strong> e<strong>in</strong>en Raum transformiert, dessen Punkte<br />

Geraden entsprechen. Die Koord<strong>in</strong>aten repräsentieren dabei die Steigung θ sowie dem<br />

Abstand zum Nullpunkt ρ. Jede Gerade durch den Punkt (x, y) entspricht somit<br />

ρ = x cos θ + y cos θ (4.7)<br />

Da unendlich viele Geraden durch e<strong>in</strong>en beliebigen Punkt gelegt werden können, besitzt<br />

jeder Punkt im Bildbereich e<strong>in</strong>e Vielzahl an Darstellungen im Hough-Raum. Um diese<br />

dennoch handhaben zu können, wird der Hough-Raum entsprechend e<strong>in</strong>er gewählten<br />

Auflösung <strong>in</strong> äquidistante Abschnitte der Längen ∆θ <strong>und</strong> ∆ρ e<strong>in</strong>geteilt <strong>und</strong> so diskre-<br />

tisiert. Im Unterschied zu ρ, das theoretisch <strong>in</strong>s Unendliche wachsen kann, ist θ – da<br />

die Richtung der Geraden irrelevant ist – auf e<strong>in</strong>en Bereich zwischen 0 <strong>und</strong> 180 Grad<br />

e<strong>in</strong>geschränkt. Jeder Punkt (x, y) hat somit 180<br />

∆θ<br />

entsprechend folgenden Formeln<br />

Repräsentationen im Hough-Raum,<br />

θ(i) = i 180<br />

∆θ<br />

(4.8)<br />

ρ(i) = x cos θ(i) + y cos θ(i) (4.9)

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!