10.10.2013 Aufrufe

Automatische Erkennung von Cover-Versionen und Plagiaten in ...

Automatische Erkennung von Cover-Versionen und Plagiaten in ...

Automatische Erkennung von Cover-Versionen und Plagiaten in ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Feature Extraktion 49<br />

e<strong>in</strong>em r<strong>in</strong>gförmigen Shiften der e<strong>in</strong>zelnen Werte entsprechen. Derartige Transpositionen<br />

s<strong>in</strong>d <strong>in</strong> der Musik – speziell bei <strong>Cover</strong>-<strong>Versionen</strong> <strong>von</strong> Musikstücken – sehr verbreitet,<br />

um das entsprechende Stück an den Tonumfang der verwendeten Instrumente bzw. die<br />

Stimmlagen der Sänger anzupassen. Dabei bleiben alle Intervalle <strong>und</strong> somit e<strong>in</strong>e sehr<br />

starke Korrelation der Wahrnehmung erhalten.<br />

Dies soll sich auch im Feature niederschlagen. Dazu wird <strong>in</strong> [18] vorgeschlagen, alle<br />

HPCP-Vektoren <strong>in</strong> e<strong>in</strong>e quasi e<strong>in</strong>heitliche Tonart zu transponieren <strong>und</strong> erst diese mo-<br />

difizierten Feature-Werte zur Analyse heranzuziehen. Das daraus resultierende Trans-<br />

posed Harmonic Pitch Class Profile (THPCP) ist def<strong>in</strong>iert als<br />

T HP CP (n) = HP CP ([n − nshift] mod N) (3.43)<br />

Dabei ist N die Dimensionalität des Feature-Vektors <strong>und</strong> nshift die Anzahl an HPCP-<br />

Bändern, um die die jeweilige Tonart des Stücks <strong>von</strong> der (beliebigen, aber fixen) Stan-<br />

dardtonart abweicht.<br />

3.5.1 HPCP für Framegruppen<br />

Im Gegensatz zum HPCP-Feature, das, wie <strong>in</strong> Abschnitt 3.4 erläutert wurde, jeweils<br />

e<strong>in</strong>en e<strong>in</strong>zelnen Frame beschreibt, ist oft erwünscht, größere Segmente bzw. das ganze<br />

Musikstück zu charakterisieren. In diesem Fall müssen statistische Verfahren angewandt<br />

werden, um die E<strong>in</strong>zelwerte zu akkumulieren. Von besonderer Bedeutung ist hier das<br />

arithmetische Mittel<br />

HP CP (n) =<br />

1<br />

iend − istart + 1 <br />

iend <br />

i=istart<br />

HP CPi(n) (3.44)<br />

Je nachdem wie groß die Länge l = iend−istart+1 des Segments gewählt wird, kann ent-<br />

weder der aktuell gespielte Akkord oder die lokale Tonart (bei Modulationen <strong>in</strong>nerhalb<br />

des Stücks) bzw. die globale Haupttonart des Stücks abgeschätzt werden.<br />

3.5.2 Bestimmung der Tonart<br />

In Formel 3.43 ist der Term nshift der Abstand der Tonart des Stücks zur gewählten<br />

Standardtonart. Geht man nicht <strong>von</strong> e<strong>in</strong>em Notenblatt, sondern e<strong>in</strong>er Audiodatei als

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!