Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Feature Extraktion 19<br />
3.1 Arbeitsablauf<br />
Ausgehend <strong>von</strong> e<strong>in</strong>em Audio-Signal wird im Schritt der Spektralanalyse das Spektrum<br />
des Musikstücks berechnet <strong>und</strong> aufbereitet. Die Aufbereitungsschritte s<strong>in</strong>d dabei die<br />
Übergangserkennung, die mögliches Rauschen verm<strong>in</strong>dern soll, die Peak-<strong>Erkennung</strong>,<br />
die zu jedem Zeitpunkt die dom<strong>in</strong>ierenden Frequenzen herausfiltert, <strong>und</strong> die Maskie-<br />
rung, die all jene der verbliebenen Frequenzen entfernt, die vom Menschen aufgr<strong>und</strong><br />
<strong>von</strong> Überdeckung mit lauteren Tönen ohneh<strong>in</strong> nicht wahrgenommen werden können.<br />
Resultat dieses Schritts ist e<strong>in</strong>e Liste <strong>von</strong> dom<strong>in</strong>anten Frequenzen zu jedem Zeitpunkt<br />
im Song.<br />
In e<strong>in</strong>em zweiten allgeme<strong>in</strong>en Schritt werden diese Frequenzen auf e<strong>in</strong>en e<strong>in</strong>heitlichen<br />
Stimmton normiert. Dieser ist zwar laut ISO 16:1075 1 als Kammerton a’ mit 440 Hertz<br />
festgelegt; was aber nicht bedeutet, dass Orchester bzw. Bands auch tatsächlich ihre<br />
Instrumente auf diese Höhe stimmen. Ergebnis dieses Schritts s<strong>in</strong>d somit normierte<br />
Frequenzen, die <strong>in</strong> musikalische Noten umgerechnet werden können.<br />
Ausgehend <strong>von</strong> den nun vorliegenden Daten werden die beiden angesprochenen Fea-<br />
tures unabhängig <strong>von</strong>e<strong>in</strong>ander berechnet. Zu dem harmonie-basierten Feature werden<br />
zuerst als Vorstufe e<strong>in</strong>fache Chroma-Vektoren berechnet (HPCP), die noch nicht ge-<br />
genüber Modulationen robust s<strong>in</strong>d. Erst anhand e<strong>in</strong>es weiteren Schritts – der Tonart-<br />
Bestimmung – kann das tatsächliche THPCP-Feature abgeleitet werden.<br />
Bei der Berechnung des zweiten Features durch die Melodieerkennung ist e<strong>in</strong> solcher<br />
Schritt zur Tonart-<strong>Erkennung</strong> nicht notwendig, da Melodien nicht nur absolut, son-<br />
dern auch anhand der Intervalle zwischen ihren e<strong>in</strong>zelnen Tönen beschrieben werden<br />
können.<br />
Neben der Eignung der so berechneten fertigen Features, soll <strong>in</strong> dieser Arbeit auch<br />
untersucht werden, ob die Beschränkung auf den Refra<strong>in</strong> e<strong>in</strong>en Gew<strong>in</strong>n br<strong>in</strong>gt. Unab-<br />
hängig <strong>von</strong> der Art des Features wird somit <strong>in</strong> e<strong>in</strong>em letzten Schritt die zeitliche Lage<br />
der Refra<strong>in</strong>-Passagen ermittelt. Mit dieser Information lassen sich dann die relevanten<br />
Abschnitte <strong>in</strong>nerhalb der fertigen Features extrahieren. Resultat s<strong>in</strong>d somit zwei weitere<br />
Features, die (repräsentativen) Ausschnitten der zuvor vorgestellten entsprechen.<br />
1 http://www.iso.org