Konzeption und Implementierung eines ... - Stephan, Daniel
Konzeption und Implementierung eines ... - Stephan, Daniel
Konzeption und Implementierung eines ... - Stephan, Daniel
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
5.4. CLUSTERING 68<br />
w j<br />
h<br />
w j+1<br />
h = �<br />
µ j+1<br />
h<br />
Σ j+1<br />
h<br />
=<br />
=<br />
wj<br />
h (x) = �<br />
x∈D<br />
�<br />
x∈D<br />
�<br />
x∈D<br />
�<br />
x∈D<br />
i<br />
w j<br />
i<br />
w j<br />
h (x)<br />
w j<br />
h (x) · x<br />
w j<br />
h (x)<br />
j<br />
· fh(x|µ h , Σj<br />
h )<br />
· fi(x|µ j<br />
i<br />
, Σj<br />
i<br />
w j<br />
h (x)(x − µj+1<br />
h )(x − µ j+1<br />
h ) T<br />
�<br />
x∈D<br />
w j<br />
h (x)<br />
), h = 1, . . ., k (5.19)<br />
, h = 1, . . ., k (5.20)<br />
Die Gleichungen Gleichung 5.19 <strong>und</strong> Gleichung 5.20 verlangen nach etwas<br />
zusätzlicher Erläuterung. Insbesondere wird hier mit dem großen griechischen<br />
Zeichen Sigma ein vorher unbenutztes Symbol verwendet. Es ersetzt das bis-<br />
lang verwendete Symbol σ für die Varianz <strong>und</strong> signalisiert, dass hier dazu über-<br />
gegangen wurde, mehrdimensionale Gaußsche Wahrscheinlichkeitsverteilungen<br />
zu verwenden. Dies ist notwendig, da die zu clusternden Objekte komplexe<br />
Textkörper beinhalten, die kaum auf eindimensionale Art <strong>und</strong> Weise repräsen-<br />
tiert werden können. Daher gehen wir zu mehrdimensionalen Verteilungen über.<br />
Der Erwartungswert µ ist analog mehrdimensional geworden <strong>und</strong> liegt nun in<br />
Form <strong>eines</strong> Vektors vor. Die durch das Sigma dargestellte Varianz ist in der<br />
mehrdimensionalen Form eine Kovarianzmatrix. Sonst ändert sich nichts.<br />
Das Stopp-Kriterium wird von der oben erwähnten Likelihood Funktion ge-<br />
liefert, sobald diese an einem lokalen Maximum konvergiert.