Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Feature Extraktion 58<br />
gnal besteht aus e<strong>in</strong>er gewichteten Überlagerung an Gr<strong>und</strong>tönen aus e<strong>in</strong>em bestimmten<br />
Intervall<br />
θ (t) = {w (t) (F ) | Flow ≤ F ≤ Fhigh} (3.53)<br />
w (t) (F ) drückt dabei die momentane Gewichtung e<strong>in</strong>er Gr<strong>und</strong>frequenz zum Zeitpunkt<br />
t aus. Sie ist derart normiert, dass das Integral über θ (t) stets 1 ergibt. Daraus folgt die<br />
Dichtefunktion für das Gesamtmodell laut Formel 3.54<br />
p(x; θ (t) ) =<br />
Fhigh<br />
Flow<br />
w (t) (F )p(x | F )dF (3.54)<br />
Da weder die Anzahl der simultan kl<strong>in</strong>genden Gr<strong>und</strong>töne noch deren Lage bzw. In-<br />
tensität a priori bekannt s<strong>in</strong>d, muss der Parameter θ (t) für jeden Frame t so geschätzt<br />
werden, dass das daraus generierte Modell die beobachteten Daten Ψ (t)<br />
Ψ (x) möglichst<br />
gut beschreibt.<br />
Der verwendete Maximum-Likelihood Schätzer wird dabei durch Maximierung der<br />
Mean Log-Likelihood bestimmt. In diesem Fall entspricht dies<br />
∞<br />
−∞<br />
p (t)<br />
Ψ (x) log p(x; θ(t) )dx (3.55)<br />
Da e<strong>in</strong>e analytische Lösung zu komplex wäre, bedient sich PreFEst e<strong>in</strong>es Expectati-<br />
on Maximization (EM) Algorithmus nach [13]. Dieser durchläuft iterativ jeweils e<strong>in</strong>en<br />
E- (expectation) <strong>und</strong> e<strong>in</strong>en M-Schritt (maximization) bis das Ergebnis θ (t) den tat-<br />
sächlichen Wert ausreichend approximiert. Um das Verfahren zudem zu beschleunigen<br />
wird unter der Annahme, dass e<strong>in</strong>zelne Töne längere Zeit stabil bleiben, als Initialwert<br />
jeweils das Ergebnis des vorherigen Frames herangezogen.<br />
Als versteckte Variable wird F e<strong>in</strong>geführt. F beschreibt – wie <strong>in</strong> Formel 3.54 angedeutet<br />
– welcher Gr<strong>und</strong>ton <strong>und</strong> dessen Tonmodell für das Generieren e<strong>in</strong>er beobachteten Fre-<br />
quenz verantwortlich waren. Die beiden Teilschritte jeder Iteration laufen unter diesen<br />
Voraussetzungen wie folgt ab.