Automatische Erkennung von Cover-Versionen und Plagiaten in ...

Weitere Magazine

Empfehlungen

Info

Klassifizierung 78 4 Klassifizierung Nachdem beschrieben wurde, wie signifikante Features aus den Audio-Signalen extra- hiert werden können, gilt es nun, anhand dieser Merkmale zu entscheiden, ob ein Mu- sikstück eine Version eines anderen ist oder nicht. Im Rahmen der Mustererkennung bezeichnet man diesen Schritt als Klassifizierung – eine Instanz wird genau einer Klasse zugeordnet. Im gegebenen Kontext entspricht ein solcher Cluster einem eigenständigen Song. Die perfekte Instanz einer jeden Klasse ist somit die Original-Interpretation – alle weiteren Instanzen sind (Cover-)Versionen. In vielen Fällen kann eine Instanz einer bestimmten Klasse zugeordnet werden, indem ihre Übereinstimmung mit allen möglichen berechnet und die ähnlichste ausgewählt wird. Diese Vorgehensweise ist hier nicht möglich, da die Anzahl der Klassen nach oben hin nicht sinnvoll beschränkt werden kann, auf jeden Fall aber enorm groß ist. Alle geeigneten Methoden der Klassifizierung laufen somit darauf hinaus, ein Maß für die Ähnlichkeit eines Songs zu allen bisher bekannten Klassen zu finden und dann zu entscheiden, ob die aktuelle Instanz einer von ihnen zuzurechnen ist, oder ob ein neuer Cluster gebildet werden soll. Für diese Entscheidung muss zusätzlich zur Ähnlichkeits- Metrik auch noch ein geeigneter Schwellwert gefunden werden. Ein eigenes Forschungsgebiet befasst sich mit dem Ermitteln von Ähnlichkeiten zwischen Musikstücken (vgl. beispielsweise [37]). Die dort vorwiegend verwendeten Merk- male wie Klangfarbe oder Rhythmus sind zur Cover-Versions-Erkennung wenig geeig- net, da sie wie in Kapitel 2.1 von einer Version zur anderen variieren können. Weiters geht es nicht darum zu bestimmen, ob zwei Stücke ähnlich klingen, sondern ob die zugrunde liegende Melodie die gleiche ist. Obwohl das Feld der Musik-Ähnlichkeit sehr naheliegend ist, sind seine Methoden (zur Klassifizierung) nur sehr bedingt übertrag- bar. Auch bei Anwendung adaptierter Methoden zur Ermittlung des Übereinstimmungs- grads zweier Musikstücke bleibt die Frage offen, ab welchem Schwellwert sie als Version desselben Stücks einzustufen sind. Diese Frage ist nicht eindeutig beantwortbar und ins- besondere im Hinblick auf Copyright- und Plagiats-Aspekte ein Streitpunkt. Geht man
Klassifizierung 79 jedoch von solchen Versionen als Grundwahrheit aus, die offiziell als solche bezeichnet werden, so kann anhand von Trainingsdaten ein sinnvoller Schwellwert für jede geeignete Kombination aus Feature und Klassifizierungsmethode ermittelt werden. Im Folgenden werden nun zwei Ansätze zur Klassifizierung vorgestellt. Der eine stammt aus [18] und beschreibt direkt die Verwendung des in Kapitel 3.4 vorgestellten HPCP-Features sowie des um Transpositions-Robustheit erweiterten THPCP- Features aus Abschnitt 3.5 zur Cover-Versions-Erkennung basierend auf dem Dynamic Time Warp-Algorithmus. Dieser findet häufig in der Spracherkennung Anwendung und wird auch in [10] zur Strukturanalyse verwendet. Im Rahmen dieser Arbeit erfolgt zu- dem eine Adaption zur Cover-Versions-Erkennung anhand der extrahierten Melodie. Der zweite – in dieser Arbeit entwickelte – Ansatz unterstellt eine konstante globale Tempo-Variation zwischen Original und Cover-Version. Die Annahme erscheint sinnvoll, da Tempoänderungen oft mit der Interpretation eines Songs in einem anderen Stil verbunden sind. Dieser Stil hat dann jedoch in der Regel ein charakteristisches Tem- po, das innerhalb eines Stücks beibehalten wird. Gegenüber lokal sehr beschränkter Änderungen des Tempos, wie sie etwa bei abweichender Phrasierung auftreten, ist die Methode dennoch robust. Sie wird im Weiteren als die des linearen Zeitzusammenhangs bezeichnet. 4.1 Ähnlichkeits-Matrizen Ausgangsbasis für alle hier vorgestellten Klassifizierungsmethoden ist die Ähnlichkeits- Matrix SM der beiden zu vergleichenden Stücke. Jede Zelle SMi,j enthält dabei das Maß an Übereinstimmung des i-ten Frames aus einem Song mit dem j-ten des anderen. In Bezug auf das (T)HPCP-Feature wurden dazu bereits in Kapitel 3.7.1 sowie Ab- schnitt 3.7.6 folgende Metriken vorgestellt, die alle einen möglichen Wertebereich von [0, 1] besitzen. Die Distanzen aus [10] wurden dabei ebenfalls zu Ähnlichkeitsmaßen umgeformt. • Normierte Differenz nach [22] Die Ähnlichkeit entspricht der Kürze des normierten Differenzvektors. r(i, j) = 1 − | −→ u (i) maxc uc(i) − −→ v (j) maxc vc(j) | √ 12 (4.1) Aufgrund der hohen Geschwindigkeit mit der dieses Maß berechnet werden kann, ist es jenes, auf das in dieser Arbeit zurückgegriffen wird. Alle folgenden Schritte bauen somit darauf auf.
Seite 1 und 2:
Automatische Erkennung von Cover-Ve
Seite 3 und 4:
Abstract This thesis is dedicated t
Seite 5 und 6:
Inhaltsverzeichnis IV 3.5 Transpose
Seite 7 und 8:
Abbildungsverzeichnis VI 3.15 Modif
Seite 9 und 10:
Einleitung 1 1 Einleitung Die vorli
Seite 11 und 12:
Einleitung 3 diese Vorgehensweise e
Seite 13 und 14:
Grundlagen 5 2 Grundlagen Dieses Ka
Seite 15 und 16:
Grundlagen 7 Typ III: Stimmen Bei d
Seite 17 und 18:
Grundlagen 9 Kritische Bänder Im m
Seite 19 und 20:
Grundlagen 11 Betrachtet man die mu
Seite 21 und 22:
Grundlagen 13 Abbildung 2.7: Flache
Seite 23 und 24:
Grundlagen 15 Abbildung 2.11: Empir
Seite 25 und 26:
Grundlagen 17 Abbildung 2.15: Dreik
Seite 27 und 28:
Feature Extraktion 19 3.1 Arbeitsab
Seite 29 und 30:
Feature Extraktion 21 3.2 Spektrala
Seite 31 und 32:
Feature Extraktion 23 3.2.3 Fenster
Seite 33 und 34:
Feature Extraktion 25 Name b SNR De
Seite 35 und 36: Feature Extraktion 27 (a) (b) (c) A
Seite 37 und 38: Feature Extraktion 29 zur Berechnun
Seite 39 und 40: Feature Extraktion 31 e(t) ist dabe
Seite 41 und 42: Feature Extraktion 33 sich am mensc
Seite 43 und 44: Feature Extraktion 35 3.2.8.3 Simul
Seite 45 und 46: Feature Extraktion 37 (a) (b) (c) A
Seite 47 und 48: Feature Extraktion 39 di = ∆i −
Seite 49 und 50: Feature Extraktion 41 Frequenz devn
Seite 51 und 52: Feature Extraktion 43 Abbildung 3.1
Seite 53 und 54: Feature Extraktion 45 wird. Alterna
Seite 57 und 58: Feature Extraktion 49 einem ringfö
Seite 59 und 60: Feature Extraktion 51 Die Methode g
Seite 61 und 62: Feature Extraktion 53 Gewonnen wird
Seite 63 und 64: Feature Extraktion 55 begründet li
Seite 65 und 66: Feature Extraktion 57 a und b stehe
Seite 67 und 68: Feature Extraktion 59 1. Expectatio
Seite 69 und 70: Feature Extraktion 61 3.6.1.4 Erwei
Seite 71 und 72: Feature Extraktion 63 analyse der z
Seite 75 und 76: Feature Extraktion 67 3.7 Struktura
Seite 77 und 78: Feature Extraktion 69 Die Ähnlichk
Seite 81 und 82: Feature Extraktion 73 einander verg
Seite 85: Feature Extraktion 77 Ausrichtung z
Seite 89 und 90: Klassifizierung 81 4.2 Dynamic Time
Seite 91 und 92: Klassifizierung 83 bale Tempo kann
Seite 93 und 94: Klassifizierung 85 Eine Änderung d
Seite 95 und 96: Resultate und Perspektiven 87 • H
Seite 97 und 98: Resultate und Perspektiven 89 Titel
Seite 99 und 100: Resultate und Perspektiven 91 Abbil
Seite 101 und 102: Resultate und Perspektiven 93 Grund
Seite 103 und 104: Literaturverzeichnis 95 Literaturve
Seite 105 und 106: Literaturverzeichnis 97 Processing,
Seite 107 und 108: Literaturverzeichnis 99 [48] Steven
Seite 109: Eidesstattliche Erklärung 101 Eide
Alle anzeigen

Automatische Erkennung von Cover-Versionen und Plagiaten in ...

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?