Automatische Erkennung von Cover-Versionen und Plagiaten in ...

Weitere Magazine

Empfehlungen

Info

Feature Extraktion 18 3 Feature Extraktion Die Feature Extraktion ist ein elementarer Schritt aller Klassifizierungsaufgaben. Es geht dabei darum, anhand der gegeben Eingangsdaten bzw. der daraus ableitbaren oder messbaren Größen Metadaten (Features) zu extrahieren, die die Zuordnung zu einzelnen Klassen erlauben. Erstrebenswert sind daher solche Merkmale, die bei zwei Instanzen der selben Klasse möglichst ähnlich und bei zwei Instanzen unterschiedlicher Klassen möglichst verschieden sind. Im Kontext von (Cover-)Versions-Erkennung beschreibt eine Klasse ein bestimmtes Musikstück. Instanzen sind demnach verschiedene Versionen eines gleichen Stücks. Da sich die Anzahl voneinander unabhängiger Songs nach oben hin nicht eingrenzen lässt, auf jeden Fall aber sehr groß ist, sind einfach gehaltene Features nicht zweckmäßig, da sie nicht ausreichend zwischen derart vielen Klassen diskriminieren können. Die hier vorgestellten und verglichenen Merkmale sind einerseits die Melodie – ein Vektor mit einer Dimensionalität proportional zur Länge des Musikstücks – und andererseits das Transposed Harmonic Pitch Class Profile (THPCP) nach Gómez [18]. Eine Pitch-Class ist dabei jeweils einer der zwölf Halbtöne (evt. auch noch feiner: Vierteltöne,. . . ) der chromatischen Skala wobei die genaue Oktavenlage vernachlässigt wird. Das entspre- chende Profil ist mit einem Histogramm vergleichbar und misst, wie stark jeder der zwölf Halbtöne zu einem Zeitpunkt präsent ist. Das auf diesem Prinzip aufbauende THPCP-Feature berücksichtigt zudem vorhandene Obertöne und ist robust gegenüber Transpositionen. Zusätzlich zu den Varianten, in denen die Features jeweils in Bezug auf das gesamte Musikstück berechnet werden, untersucht diese Arbeit auch jene Ver- sionen, die sich nur auf den Refrain des Stück beziehen. Dieses Kapitel widmet sich nun den Arbeitsschritten, die notwendig sind, um die beiden genannten Features aus einem Audiosignal zu extrahieren. Effekte, die durch Stereo oder Raumklang hervortreten, werden dabei vernachlässigt. Als Eingangsdaten sind immer Audiosignale in Mono – jedoch mit beliebigen aber gleichen Sample- und Bit-Raten – angenommen. Davon ausgehend ist der Arbeitsablauf zur Extraktion der Features in Abbildung 3.1 dargestellt. An diesem Ablauf orientiert sich auch der Aufbau des vorliegenden Kapitels.
Feature Extraktion 19 3.1 Arbeitsablauf Ausgehend von einem Audio-Signal wird im Schritt der Spektralanalyse das Spektrum des Musikstücks berechnet und aufbereitet. Die Aufbereitungsschritte sind dabei die Übergangserkennung, die mögliches Rauschen vermindern soll, die Peak-Erkennung, die zu jedem Zeitpunkt die dominierenden Frequenzen herausfiltert, und die Maskie- rung, die all jene der verbliebenen Frequenzen entfernt, die vom Menschen aufgrund von Überdeckung mit lauteren Tönen ohnehin nicht wahrgenommen werden können. Resultat dieses Schritts ist eine Liste von dominanten Frequenzen zu jedem Zeitpunkt im Song. In einem zweiten allgemeinen Schritt werden diese Frequenzen auf einen einheitlichen Stimmton normiert. Dieser ist zwar laut ISO 16:1075 1 als Kammerton a’ mit 440 Hertz festgelegt; was aber nicht bedeutet, dass Orchester bzw. Bands auch tatsächlich ihre Instrumente auf diese Höhe stimmen. Ergebnis dieses Schritts sind somit normierte Frequenzen, die in musikalische Noten umgerechnet werden können. Ausgehend von den nun vorliegenden Daten werden die beiden angesprochenen Fea- tures unabhängig voneinander berechnet. Zu dem harmonie-basierten Feature werden zuerst als Vorstufe einfache Chroma-Vektoren berechnet (HPCP), die noch nicht ge- genüber Modulationen robust sind. Erst anhand eines weiteren Schritts – der Tonart- Bestimmung – kann das tatsächliche THPCP-Feature abgeleitet werden. Bei der Berechnung des zweiten Features durch die Melodieerkennung ist ein solcher Schritt zur Tonart-Erkennung nicht notwendig, da Melodien nicht nur absolut, son- dern auch anhand der Intervalle zwischen ihren einzelnen Tönen beschrieben werden können. Neben der Eignung der so berechneten fertigen Features, soll in dieser Arbeit auch untersucht werden, ob die Beschränkung auf den Refrain einen Gewinn bringt. Unab- hängig von der Art des Features wird somit in einem letzten Schritt die zeitliche Lage der Refrain-Passagen ermittelt. Mit dieser Information lassen sich dann die relevanten Abschnitte innerhalb der fertigen Features extrahieren. Resultat sind somit zwei weitere Features, die (repräsentativen) Ausschnitten der zuvor vorgestellten entsprechen. 1 http://www.iso.org
Seite 1 und 2: Automatische Erkennung von Cover-Ve
Seite 3 und 4: Abstract This thesis is dedicated t
Seite 5 und 6: Inhaltsverzeichnis IV 3.5 Transpose
Seite 7 und 8: Abbildungsverzeichnis VI 3.15 Modif
Seite 9 und 10: Einleitung 1 1 Einleitung Die vorli
Seite 11 und 12: Einleitung 3 diese Vorgehensweise e
Seite 13 und 14: Grundlagen 5 2 Grundlagen Dieses Ka
Seite 15 und 16: Grundlagen 7 Typ III: Stimmen Bei d
Seite 17 und 18: Grundlagen 9 Kritische Bänder Im m
Seite 19 und 20: Grundlagen 11 Betrachtet man die mu
Seite 21 und 22: Grundlagen 13 Abbildung 2.7: Flache
Seite 23 und 24: Grundlagen 15 Abbildung 2.11: Empir
Seite 25: Grundlagen 17 Abbildung 2.15: Dreik
Seite 29 und 30: Feature Extraktion 21 3.2 Spektrala
Seite 31 und 32: Feature Extraktion 23 3.2.3 Fenster
Seite 33 und 34: Feature Extraktion 25 Name b SNR De
Seite 35 und 36: Feature Extraktion 27 (a) (b) (c) A
Seite 37 und 38: Feature Extraktion 29 zur Berechnun
Seite 39 und 40: Feature Extraktion 31 e(t) ist dabe
Seite 41 und 42: Feature Extraktion 33 sich am mensc
Seite 43 und 44: Feature Extraktion 35 3.2.8.3 Simul
Seite 45 und 46: Feature Extraktion 37 (a) (b) (c) A
Seite 47 und 48: Feature Extraktion 39 di = ∆i −
Seite 49 und 50: Feature Extraktion 41 Frequenz devn
Seite 51 und 52: Feature Extraktion 43 Abbildung 3.1
Seite 53 und 54: Feature Extraktion 45 wird. Alterna
Seite 57 und 58: Feature Extraktion 49 einem ringfö
Seite 59 und 60: Feature Extraktion 51 Die Methode g
Seite 61 und 62: Feature Extraktion 53 Gewonnen wird
Seite 63 und 64: Feature Extraktion 55 begründet li
Seite 65 und 66: Feature Extraktion 57 a und b stehe
Seite 67 und 68: Feature Extraktion 59 1. Expectatio
Seite 69 und 70: Feature Extraktion 61 3.6.1.4 Erwei
Seite 71 und 72: Feature Extraktion 63 analyse der z
Seite 75 und 76: Feature Extraktion 67 3.7 Struktura
Seite 77 und 78:
Feature Extraktion 69 Die Ähnlichk
Seite 79 und 80:
Feature Extraktion 71 Abbildung 3.2
Seite 81 und 82:
Feature Extraktion 73 einander verg
Seite 83 und 84:
Feature Extraktion 75 Abbildung 3.2
Seite 85 und 86:
Feature Extraktion 77 Ausrichtung z
Seite 87 und 88:
Klassifizierung 79 jedoch von solch
Seite 89 und 90:
Klassifizierung 81 4.2 Dynamic Time
Seite 91 und 92:
Klassifizierung 83 bale Tempo kann
Seite 93 und 94:
Klassifizierung 85 Eine Änderung d
Seite 95 und 96:
Resultate und Perspektiven 87 • H
Seite 97 und 98:
Resultate und Perspektiven 89 Titel
Seite 99 und 100:
Resultate und Perspektiven 91 Abbil
Seite 101 und 102:
Resultate und Perspektiven 93 Grund
Seite 103 und 104:
Literaturverzeichnis 95 Literaturve
Seite 105 und 106:
Literaturverzeichnis 97 Processing,
Seite 107 und 108:
Literaturverzeichnis 99 [48] Steven
Seite 109:
Eidesstattliche Erklärung 101 Eide
Alle anzeigen

Automatische Erkennung von Cover-Versionen und Plagiaten in ...

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?