10.10.2013 Aufrufe

Automatische Erkennung von Cover-Versionen und Plagiaten in ...

Automatische Erkennung von Cover-Versionen und Plagiaten in ...

Automatische Erkennung von Cover-Versionen und Plagiaten in ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Feature Extraktion 58<br />

gnal besteht aus e<strong>in</strong>er gewichteten Überlagerung an Gr<strong>und</strong>tönen aus e<strong>in</strong>em bestimmten<br />

Intervall<br />

θ (t) = {w (t) (F ) | Flow ≤ F ≤ Fhigh} (3.53)<br />

w (t) (F ) drückt dabei die momentane Gewichtung e<strong>in</strong>er Gr<strong>und</strong>frequenz zum Zeitpunkt<br />

t aus. Sie ist derart normiert, dass das Integral über θ (t) stets 1 ergibt. Daraus folgt die<br />

Dichtefunktion für das Gesamtmodell laut Formel 3.54<br />

p(x; θ (t) ) =<br />

Fhigh<br />

Flow<br />

w (t) (F )p(x | F )dF (3.54)<br />

Da weder die Anzahl der simultan kl<strong>in</strong>genden Gr<strong>und</strong>töne noch deren Lage bzw. In-<br />

tensität a priori bekannt s<strong>in</strong>d, muss der Parameter θ (t) für jeden Frame t so geschätzt<br />

werden, dass das daraus generierte Modell die beobachteten Daten Ψ (t)<br />

Ψ (x) möglichst<br />

gut beschreibt.<br />

Der verwendete Maximum-Likelihood Schätzer wird dabei durch Maximierung der<br />

Mean Log-Likelihood bestimmt. In diesem Fall entspricht dies<br />

∞<br />

−∞<br />

p (t)<br />

Ψ (x) log p(x; θ(t) )dx (3.55)<br />

Da e<strong>in</strong>e analytische Lösung zu komplex wäre, bedient sich PreFEst e<strong>in</strong>es Expectati-<br />

on Maximization (EM) Algorithmus nach [13]. Dieser durchläuft iterativ jeweils e<strong>in</strong>en<br />

E- (expectation) <strong>und</strong> e<strong>in</strong>en M-Schritt (maximization) bis das Ergebnis θ (t) den tat-<br />

sächlichen Wert ausreichend approximiert. Um das Verfahren zudem zu beschleunigen<br />

wird unter der Annahme, dass e<strong>in</strong>zelne Töne längere Zeit stabil bleiben, als Initialwert<br />

jeweils das Ergebnis des vorherigen Frames herangezogen.<br />

Als versteckte Variable wird F e<strong>in</strong>geführt. F beschreibt – wie <strong>in</strong> Formel 3.54 angedeutet<br />

– welcher Gr<strong>und</strong>ton <strong>und</strong> dessen Tonmodell für das Generieren e<strong>in</strong>er beobachteten Fre-<br />

quenz verantwortlich waren. Die beiden Teilschritte jeder Iteration laufen unter diesen<br />

Voraussetzungen wie folgt ab.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!