Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Feature Extraktion 50<br />
E<strong>in</strong>gabe aus, so ist ohne das Heranziehen zusätzlicher Metadaten die Tonart des vorlie-<br />
genden Musikstücks nicht bekannt. In diesen Fällen muss sie, um nshift zu berechnen,<br />
erst aus den vorhandenen Daten bestimmt werden.<br />
Um die Tonart zu abzuschätzen, wird im ersten Schritt e<strong>in</strong> globaler HP CP -Vektor<br />
aufgestellt. Dieser wird dann mit e<strong>in</strong>er Matrix an möglichen Tonart-Profilen verglichen.<br />
Die beste Übere<strong>in</strong>stimmung ergibt die geschätzte Tonart. Zum Vergleich werden die <strong>in</strong><br />
Abschnitt 2.2.2 beschriebenen Profile für Dur- bzw. Moll-Tonarten, jeweils aufbauend<br />
auf allen der zwölf Halbtöne, herangezogen. Weniger weit verbreitete Systeme, wie etwa<br />
Kirchentonarten oder gar Tonleitern mit fe<strong>in</strong>eren Abstufungen als Halbtonschritten, wie<br />
sie <strong>in</strong> gewissen Musikrichtungen vorkommen, werden nicht berücksichtigt. Im Kontext<br />
aktueller Ma<strong>in</strong>-Stream Pop- <strong>und</strong> Rock-Musik bzw. ähnlicher Stile stellt dies jedoch ke<strong>in</strong><br />
Problem dar, da derartige Skalen so gut wie nie verwendet werden.<br />
Als Maß für die Ähnlichkeit wird laut [18] die Korrelation zwischen dem Referenzprofil<br />
<strong>und</strong> dem tatsächlichen HP CP -Vektor berechnet. Sowohl für Dur als auch für Moll<br />
erhält man dabei N Werte. Diese entsprechen e<strong>in</strong>em Vergleich pro HPCP-Band als<br />
Gr<strong>und</strong>ton. Bezeichnet K(i) das um i Bänder geshiftete Tonartenprofil, so errechnen<br />
sich die Werte als<br />
RDur(i) = r(HP CP , KDur(i))<br />
RMoll(i) = r(HP CP , KMoll(i))<br />
Die Korrelation r(x, y) ist dabei gegeben als<br />
r(x, y) = E[(x − µx) (y − µy)]<br />
σx σy<br />
= cov(x, y)<br />
σx σy<br />
(3.45)<br />
Neben se<strong>in</strong>er Bedeutung zum Schätzen der tatsächlichen Tonart gibt der jeweilige Ma-<br />
ximalwert aus R zudem an, wie stark die entsprechende Tonart präsent ist. E<strong>in</strong> sehr<br />
hoher Wert deutet darauf h<strong>in</strong>, dass sie das ganze Stück über dom<strong>in</strong>ant ist. E<strong>in</strong> Wert,<br />
der sich nicht wesentlich vom zweitgrößten abhebt, ist h<strong>in</strong>gegen e<strong>in</strong> Indiz dafür, dass<br />
im Stück Modulationen vorkommen <strong>und</strong> Teile <strong>in</strong> anderen Tonarten gespielt s<strong>in</strong>d. Dieses<br />
Verfahren ist auch unter dem Namen Krumhansl-Schmuckler Algorithmus bekannt. Es<br />
basiert auf dem Tonart-Bestimmungs Algorithmus aus [45] <strong>und</strong> wurde <strong>in</strong> [24] bezüglich<br />
der verwendeten Tonleiter-Modelle angepasst. Diese wurden bereits <strong>in</strong> Abschnitt 2.2.2<br />
vorgestellt.