10.10.2013 Aufrufe

Automatische Erkennung von Cover-Versionen und Plagiaten in ...

Automatische Erkennung von Cover-Versionen und Plagiaten in ...

Automatische Erkennung von Cover-Versionen und Plagiaten in ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Feature Extraktion 50<br />

E<strong>in</strong>gabe aus, so ist ohne das Heranziehen zusätzlicher Metadaten die Tonart des vorlie-<br />

genden Musikstücks nicht bekannt. In diesen Fällen muss sie, um nshift zu berechnen,<br />

erst aus den vorhandenen Daten bestimmt werden.<br />

Um die Tonart zu abzuschätzen, wird im ersten Schritt e<strong>in</strong> globaler HP CP -Vektor<br />

aufgestellt. Dieser wird dann mit e<strong>in</strong>er Matrix an möglichen Tonart-Profilen verglichen.<br />

Die beste Übere<strong>in</strong>stimmung ergibt die geschätzte Tonart. Zum Vergleich werden die <strong>in</strong><br />

Abschnitt 2.2.2 beschriebenen Profile für Dur- bzw. Moll-Tonarten, jeweils aufbauend<br />

auf allen der zwölf Halbtöne, herangezogen. Weniger weit verbreitete Systeme, wie etwa<br />

Kirchentonarten oder gar Tonleitern mit fe<strong>in</strong>eren Abstufungen als Halbtonschritten, wie<br />

sie <strong>in</strong> gewissen Musikrichtungen vorkommen, werden nicht berücksichtigt. Im Kontext<br />

aktueller Ma<strong>in</strong>-Stream Pop- <strong>und</strong> Rock-Musik bzw. ähnlicher Stile stellt dies jedoch ke<strong>in</strong><br />

Problem dar, da derartige Skalen so gut wie nie verwendet werden.<br />

Als Maß für die Ähnlichkeit wird laut [18] die Korrelation zwischen dem Referenzprofil<br />

<strong>und</strong> dem tatsächlichen HP CP -Vektor berechnet. Sowohl für Dur als auch für Moll<br />

erhält man dabei N Werte. Diese entsprechen e<strong>in</strong>em Vergleich pro HPCP-Band als<br />

Gr<strong>und</strong>ton. Bezeichnet K(i) das um i Bänder geshiftete Tonartenprofil, so errechnen<br />

sich die Werte als<br />

RDur(i) = r(HP CP , KDur(i))<br />

RMoll(i) = r(HP CP , KMoll(i))<br />

Die Korrelation r(x, y) ist dabei gegeben als<br />

r(x, y) = E[(x − µx) (y − µy)]<br />

σx σy<br />

= cov(x, y)<br />

σx σy<br />

(3.45)<br />

Neben se<strong>in</strong>er Bedeutung zum Schätzen der tatsächlichen Tonart gibt der jeweilige Ma-<br />

ximalwert aus R zudem an, wie stark die entsprechende Tonart präsent ist. E<strong>in</strong> sehr<br />

hoher Wert deutet darauf h<strong>in</strong>, dass sie das ganze Stück über dom<strong>in</strong>ant ist. E<strong>in</strong> Wert,<br />

der sich nicht wesentlich vom zweitgrößten abhebt, ist h<strong>in</strong>gegen e<strong>in</strong> Indiz dafür, dass<br />

im Stück Modulationen vorkommen <strong>und</strong> Teile <strong>in</strong> anderen Tonarten gespielt s<strong>in</strong>d. Dieses<br />

Verfahren ist auch unter dem Namen Krumhansl-Schmuckler Algorithmus bekannt. Es<br />

basiert auf dem Tonart-Bestimmungs Algorithmus aus [45] <strong>und</strong> wurde <strong>in</strong> [24] bezüglich<br />

der verwendeten Tonleiter-Modelle angepasst. Diese wurden bereits <strong>in</strong> Abschnitt 2.2.2<br />

vorgestellt.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!