Diplomarbeit von Michael Schindler
Diplomarbeit von Michael Schindler
Diplomarbeit von Michael Schindler
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
0<br />
(a)<br />
1.1 Dichteschätzung mit einer Mischung multivariater Normalverteilungen 25<br />
t = 0<br />
0.4<br />
50 T 80 T 100 T<br />
2<br />
0<br />
max<br />
C<br />
σ(t)<br />
l(C, σ�X)<br />
−2<br />
−4<br />
(b)<br />
t = 0 50 T 80 T 100 T<br />
1<br />
0<br />
1<br />
(c1)<br />
[cr]1(t)<br />
[cr]2(t)<br />
0<br />
(c2)<br />
0 t=50 T 80 T 100 T<br />
Abbildung 12: (a) Die Funktion σ(t) der univariaten Lernphase in Abb. 11a bis c. Es werden nacheinander<br />
alle Varianzen durchprobiert. In (b) ist für jeden Zeitpunkt, also für jeden der σ-Werte, die<br />
maximale Log-likelihood aufgetragen, die durch Variation der Zentren cr erreicht werden kann. Der<br />
größte dieser Maximalwerte liegt bei 80 T (80 Iterationen über den Datensatz; Pfeil). In (c) sind die<br />
beiden Koordinaten der vier Zentren cr aufgetragen. Man sieht deutlich, dass die Phasenübergänge im<br />
System plötzlich und schnell geschehen. In (c1) ist der erste Phasenübergang zu sehen, der zwischen<br />
Abb. 11a und b abläuft. Beide Codebuchzentren brechen anschließend einzeln zu unterschiedlichen<br />
Zeitpunkten auf (c2).<br />
univariaten Normalverteilungen so auf dem Merkmalsraum verteilen, dass ihre Zentren<br />
cr in den Häufungspunkten (Clustern) der Daten sitzen. Dabei wird σ(t) nach einem<br />
vorgegebenen Schema reduziert.<br />
In Abbildung 12a ist die lineare Funktion σ(t) dargestellt, die im Lernprozess aus<br />
Abb. 11a bis c verwendet wurde. Für jeden Wert <strong>von</strong> σ gibt es, wenn man den Algorithmus<br />
als Maximum-likelihood-Dichteschätzer mit univariaten Normalverteilungen<br />
betrachtet, genau eine optimale Konstellation der Zentren cr. Jede Komponente sitzt<br />
etwa dort, wo sie nach der Stationaritätsbedingung (1-13) sein muss.<br />
Die Entwicklung der für jeden Wert <strong>von</strong> σ(t) jeweils maximierten Log-likelihood zeigt<br />
Abb. 12b. Wie man erkennen kann, nimmt die maximale Likelihood mit der Verkleinerung<br />
<strong>von</strong> σ(t) lange Zeit zu, erreicht bei t=80 T ein Maximum und fällt danach wieder<br />
ab. Hiermit ist klar, wie im univar-Algorithmus die optimale Varianz der univariaten<br />
Modelldichte bestimmt wird, nämlich einfach aus dem in Abb. 12b notierten Verlauf<br />
der Likelihoodkurve als Funktion des Führparameters σ.<br />
Bei dem skizzierten Prozess spalten die Komponenten der univariaten Mischungsdichte<br />
aus einem zunächst vollständig entarteten Zustand (Abb. 11a) sukzessive auf (Abb. 11b<br />
und c). Dadurch wird eine Hierarchie der Zwischenzustände erzeugt. Die Abbildungen<br />
12c beleuchten die Form dieser Aufspaltungen etwas detaillierter. Dort sind die<br />
beiden Koordinaten der Zentren cr aus Abb. 11a–c als Funktionen der Zeit aufgetragen.<br />
Die Form der Aufspaltungen erinnert stark an Bifurkationen, wie sie in der Molekularfeldnäherung<br />
<strong>von</strong> Phasenübergängen zweiter Ordnung erhalten werden. Tatsächlich