21.12.2012 Aufrufe

Diplomarbeit von Michael Schindler

Diplomarbeit von Michael Schindler

Diplomarbeit von Michael Schindler

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

0<br />

(a)<br />

1.1 Dichteschätzung mit einer Mischung multivariater Normalverteilungen 25<br />

t = 0<br />

0.4<br />

50 T 80 T 100 T<br />

2<br />

0<br />

max<br />

C<br />

σ(t)<br />

l(C, σ�X)<br />

−2<br />

−4<br />

(b)<br />

t = 0 50 T 80 T 100 T<br />

1<br />

0<br />

1<br />

(c1)<br />

[cr]1(t)<br />

[cr]2(t)<br />

0<br />

(c2)<br />

0 t=50 T 80 T 100 T<br />

Abbildung 12: (a) Die Funktion σ(t) der univariaten Lernphase in Abb. 11a bis c. Es werden nacheinander<br />

alle Varianzen durchprobiert. In (b) ist für jeden Zeitpunkt, also für jeden der σ-Werte, die<br />

maximale Log-likelihood aufgetragen, die durch Variation der Zentren cr erreicht werden kann. Der<br />

größte dieser Maximalwerte liegt bei 80 T (80 Iterationen über den Datensatz; Pfeil). In (c) sind die<br />

beiden Koordinaten der vier Zentren cr aufgetragen. Man sieht deutlich, dass die Phasenübergänge im<br />

System plötzlich und schnell geschehen. In (c1) ist der erste Phasenübergang zu sehen, der zwischen<br />

Abb. 11a und b abläuft. Beide Codebuchzentren brechen anschließend einzeln zu unterschiedlichen<br />

Zeitpunkten auf (c2).<br />

univariaten Normalverteilungen so auf dem Merkmalsraum verteilen, dass ihre Zentren<br />

cr in den Häufungspunkten (Clustern) der Daten sitzen. Dabei wird σ(t) nach einem<br />

vorgegebenen Schema reduziert.<br />

In Abbildung 12a ist die lineare Funktion σ(t) dargestellt, die im Lernprozess aus<br />

Abb. 11a bis c verwendet wurde. Für jeden Wert <strong>von</strong> σ gibt es, wenn man den Algorithmus<br />

als Maximum-likelihood-Dichteschätzer mit univariaten Normalverteilungen<br />

betrachtet, genau eine optimale Konstellation der Zentren cr. Jede Komponente sitzt<br />

etwa dort, wo sie nach der Stationaritätsbedingung (1-13) sein muss.<br />

Die Entwicklung der für jeden Wert <strong>von</strong> σ(t) jeweils maximierten Log-likelihood zeigt<br />

Abb. 12b. Wie man erkennen kann, nimmt die maximale Likelihood mit der Verkleinerung<br />

<strong>von</strong> σ(t) lange Zeit zu, erreicht bei t=80 T ein Maximum und fällt danach wieder<br />

ab. Hiermit ist klar, wie im univar-Algorithmus die optimale Varianz der univariaten<br />

Modelldichte bestimmt wird, nämlich einfach aus dem in Abb. 12b notierten Verlauf<br />

der Likelihoodkurve als Funktion des Führparameters σ.<br />

Bei dem skizzierten Prozess spalten die Komponenten der univariaten Mischungsdichte<br />

aus einem zunächst vollständig entarteten Zustand (Abb. 11a) sukzessive auf (Abb. 11b<br />

und c). Dadurch wird eine Hierarchie der Zwischenzustände erzeugt. Die Abbildungen<br />

12c beleuchten die Form dieser Aufspaltungen etwas detaillierter. Dort sind die<br />

beiden Koordinaten der Zentren cr aus Abb. 11a–c als Funktionen der Zeit aufgetragen.<br />

Die Form der Aufspaltungen erinnert stark an Bifurkationen, wie sie in der Molekularfeldnäherung<br />

<strong>von</strong> Phasenübergängen zweiter Ordnung erhalten werden. Tatsächlich

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!