Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Feature Extraktion 49<br />
e<strong>in</strong>em r<strong>in</strong>gförmigen Shiften der e<strong>in</strong>zelnen Werte entsprechen. Derartige Transpositionen<br />
s<strong>in</strong>d <strong>in</strong> der Musik – speziell bei <strong>Cover</strong>-<strong>Versionen</strong> <strong>von</strong> Musikstücken – sehr verbreitet,<br />
um das entsprechende Stück an den Tonumfang der verwendeten Instrumente bzw. die<br />
Stimmlagen der Sänger anzupassen. Dabei bleiben alle Intervalle <strong>und</strong> somit e<strong>in</strong>e sehr<br />
starke Korrelation der Wahrnehmung erhalten.<br />
Dies soll sich auch im Feature niederschlagen. Dazu wird <strong>in</strong> [18] vorgeschlagen, alle<br />
HPCP-Vektoren <strong>in</strong> e<strong>in</strong>e quasi e<strong>in</strong>heitliche Tonart zu transponieren <strong>und</strong> erst diese mo-<br />
difizierten Feature-Werte zur Analyse heranzuziehen. Das daraus resultierende Trans-<br />
posed Harmonic Pitch Class Profile (THPCP) ist def<strong>in</strong>iert als<br />
T HP CP (n) = HP CP ([n − nshift] mod N) (3.43)<br />
Dabei ist N die Dimensionalität des Feature-Vektors <strong>und</strong> nshift die Anzahl an HPCP-<br />
Bändern, um die die jeweilige Tonart des Stücks <strong>von</strong> der (beliebigen, aber fixen) Stan-<br />
dardtonart abweicht.<br />
3.5.1 HPCP für Framegruppen<br />
Im Gegensatz zum HPCP-Feature, das, wie <strong>in</strong> Abschnitt 3.4 erläutert wurde, jeweils<br />
e<strong>in</strong>en e<strong>in</strong>zelnen Frame beschreibt, ist oft erwünscht, größere Segmente bzw. das ganze<br />
Musikstück zu charakterisieren. In diesem Fall müssen statistische Verfahren angewandt<br />
werden, um die E<strong>in</strong>zelwerte zu akkumulieren. Von besonderer Bedeutung ist hier das<br />
arithmetische Mittel<br />
HP CP (n) =<br />
1<br />
iend − istart + 1 <br />
iend <br />
i=istart<br />
HP CPi(n) (3.44)<br />
Je nachdem wie groß die Länge l = iend−istart+1 des Segments gewählt wird, kann ent-<br />
weder der aktuell gespielte Akkord oder die lokale Tonart (bei Modulationen <strong>in</strong>nerhalb<br />
des Stücks) bzw. die globale Haupttonart des Stücks abgeschätzt werden.<br />
3.5.2 Bestimmung der Tonart<br />
In Formel 3.43 ist der Term nshift der Abstand der Tonart des Stücks zur gewählten<br />
Standardtonart. Geht man nicht <strong>von</strong> e<strong>in</strong>em Notenblatt, sondern e<strong>in</strong>er Audiodatei als