Automatische Erkennung von Cover-Versionen und Plagiaten in ...

Weitere Magazine

Empfehlungen

Info

Feature Extraktion 44 Die Größe des Vektors N ist variabel, sinnvollerweise jedoch ein ganzzahliges Vielfaches von 12. Der Index n bezeichnet die einzelnen Dimensionen des Vektors und somit das jeweilige Band innerhalb der Oktave. fi und ai beschreiben Frequenz und Amplitude des betrachteten Peaks i. Der Term w(n, fi) stellt das Gewicht mit dem eine Frequenz fi zum entsprechenden Band n beiträgt dar. Diese Gewichtungsfunktion soll im nächsten Abschnitt näher erläutert werden. 3.4.1 Gewichtungsfunktion Die Gewichtungsfunktion hat zwei grundlegende Aufgaben. Einerseits ist sie dafür zu- ständig, die Frequenzen aller Peaks – die ja über mehrere Oktaven verstreut liegen – auf eine einzige Oktave zu falten. Andererseits sieht das HPCP-Feature aus [18] im Unterschied zu seinem Vorgänger (vgl. [16]) vor, dass Peaks nicht nur zu genau der Pitch-Klasse beitragen in die sie exakt fallen, sondern auch die benachbarten Klassen innerhalb eines bestimmten Fensters beeinflussen. Der Grund dafür ist jener, dass Peaks auch sehr nahe an der Grenze zwischen zwei Klassen liegen können. In solchen Fällen wird ihr Einfluss dann nicht auf eine Klasse beschränkt, sondern relativ gleichmäßig aufgeteilt. Der Beitrag, den ein Peak nun zu einem Band leistet, entspricht dem Quadrat der Amplitude (in dB) und wird mit einer cos 2 -Funktion gewichtet. Relevant für die Ge- wichtung ist somit der Abstand der tatsächlichen Frequenz eines Peaks fi (übertragen auf eine einheitliche Oktavenlage) von der Mitte des jeweiligen Chroma-Bands gemessen in Halbtönen. Es sei die Mitte des n-ten Bands und deren Abstand zur Frequenz des i-ten Peaks fn = fref 2 n N (3.36) fi d = 12 log2 + m fn (3.37) Der Summand m bewirkt die Faltung auf jene Oktave, in der die Referenzfrequenz und entsprechend Formel 3.36 auch die Bänder des Feature-Vektors liegen. Es handelt sich dabei um eine ganze Zahl, die für jede Frequenz fi so zu wählen ist, dass | d | minimal
Feature Extraktion 45 wird. Alternativ dazu kann d über Formel 3.38 berechnet werden, ohne dass ein Faktor m bestimmt werden muss. fi fi d = 2 12 log2 mod 6 − 12 log2 mod 12 fn fn (3.38) Ist l die Länge des Fensters, innerhalb dessen ein Gewicht größer 0 vorhanden sein soll, so ergibt sich die vollständige Gewichtungsfunktion als w(n, fi) = In [18] wird für den Parameter l ein Wert von 4 3 cos2 πd l : für | d |≤ l 2 0 : für | d | > l 2 (3.39) Halbtönen vorgeschlagen und für N – also die Größe des Featurevektors – ein Wert von 36, was einer Auflösung von 3 Bändern pro Halbton entspricht. Daraus ergibt sich, dass jeder Peak zu genau 4 verschiedenen HPCP-Bändern aber nur zur Repräsentation zweier Halbtöne beiträgt. 3.4.2 HPCP und Obertonreihen Bei der Berechnung des HPCP-Feature wird bewusst auf das Vorhandensein von Ober- tönen eingegangen. Diese sind, wie bereits beschrieben, die ganzzahligen Vielfachen der Frequenz des Grundtons. Jede Zweierpotenz als Faktor bewirkt, dass der Oberton genau um eine oder mehrere Oktaven über dem Grundton liegt und somit in die sel- be Pitch-Klasse fällt. Die anderen jedoch kommen in abweichenden Bändern zu liegen und beeinflussen so das Ergebnis. Die Pitch-Klasse der n-ten Oberschwingung befinden sich i(n) = 2(12 log 2(n))mod 6 − (12 log 2(n))mod 12 (3.40) Bänder von jener des Grundtons entfernt. Für die ersten zwanzig Obertöne liegen die Frequenzen dabei wie in Tabelle 3.4 gezeigt um jeweils d Klassen in Bezug zur Grund- frequenz verschoben. Zur besseren Darstellung wird auch der Ton der jeweiligen Pitch- Klasse angegeben, wobei von einem c als Grundton ausgegangen wird. Weiters ist zu beachten, dass die Obertöne mit zunehmender Ordnung an Bedeutung verlieren. Um die Auswirkungen auf die Verteilung des Feature-Vektors zu minimieren, schlägt Gómez in [18] vor, jeden Peak nicht nur für die Pitch-Klasse seiner eigene Frequenz
Seite 1 und 2: Automatische Erkennung von Cover-Ve
Seite 3 und 4: Abstract This thesis is dedicated t
Seite 5 und 6: Inhaltsverzeichnis IV 3.5 Transpose
Seite 7 und 8: Abbildungsverzeichnis VI 3.15 Modif
Seite 9 und 10: Einleitung 1 1 Einleitung Die vorli
Seite 11 und 12: Einleitung 3 diese Vorgehensweise e
Seite 13 und 14: Grundlagen 5 2 Grundlagen Dieses Ka
Seite 15 und 16: Grundlagen 7 Typ III: Stimmen Bei d
Seite 17 und 18: Grundlagen 9 Kritische Bänder Im m
Seite 19 und 20: Grundlagen 11 Betrachtet man die mu
Seite 21 und 22: Grundlagen 13 Abbildung 2.7: Flache
Seite 23 und 24: Grundlagen 15 Abbildung 2.11: Empir
Seite 25 und 26: Grundlagen 17 Abbildung 2.15: Dreik
Seite 27 und 28: Feature Extraktion 19 3.1 Arbeitsab
Seite 29 und 30: Feature Extraktion 21 3.2 Spektrala
Seite 31 und 32: Feature Extraktion 23 3.2.3 Fenster
Seite 33 und 34: Feature Extraktion 25 Name b SNR De
Seite 35 und 36: Feature Extraktion 27 (a) (b) (c) A
Seite 37 und 38: Feature Extraktion 29 zur Berechnun
Seite 39 und 40: Feature Extraktion 31 e(t) ist dabe
Seite 41 und 42: Feature Extraktion 33 sich am mensc
Seite 43 und 44: Feature Extraktion 35 3.2.8.3 Simul
Seite 45 und 46: Feature Extraktion 37 (a) (b) (c) A
Seite 47 und 48: Feature Extraktion 39 di = ∆i −
Seite 49 und 50: Feature Extraktion 41 Frequenz devn
Seite 51: Feature Extraktion 43 Abbildung 3.1
Seite 55 und 56: Feature Extraktion 47 Abbildung 3.1
Seite 57 und 58: Feature Extraktion 49 einem ringfö
Seite 59 und 60: Feature Extraktion 51 Die Methode g
Seite 61 und 62: Feature Extraktion 53 Gewonnen wird
Seite 63 und 64: Feature Extraktion 55 begründet li
Seite 65 und 66: Feature Extraktion 57 a und b stehe
Seite 67 und 68: Feature Extraktion 59 1. Expectatio
Seite 69 und 70: Feature Extraktion 61 3.6.1.4 Erwei
Seite 71 und 72: Feature Extraktion 63 analyse der z
Seite 75 und 76: Feature Extraktion 67 3.7 Struktura
Seite 77 und 78: Feature Extraktion 69 Die Ähnlichk
Seite 81 und 82: Feature Extraktion 73 einander verg
Seite 85 und 86: Feature Extraktion 77 Ausrichtung z
Seite 87 und 88: Klassifizierung 79 jedoch von solch
Seite 89 und 90: Klassifizierung 81 4.2 Dynamic Time
Seite 91 und 92: Klassifizierung 83 bale Tempo kann
Seite 93 und 94: Klassifizierung 85 Eine Änderung d
Seite 95 und 96: Resultate und Perspektiven 87 • H
Seite 97 und 98: Resultate und Perspektiven 89 Titel
Seite 99 und 100: Resultate und Perspektiven 91 Abbil
Seite 101 und 102: Resultate und Perspektiven 93 Grund
Seite 103 und 104:
Literaturverzeichnis 95 Literaturve
Seite 105 und 106:
Literaturverzeichnis 97 Processing,
Seite 107 und 108:
Literaturverzeichnis 99 [48] Steven
Seite 109:
Eidesstattliche Erklärung 101 Eide
Alle anzeigen

Automatische Erkennung von Cover-Versionen und Plagiaten in ...

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?