07.01.2013 Aufrufe

Konzeption und Implementierung eines ... - Stephan, Daniel

Konzeption und Implementierung eines ... - Stephan, Daniel

Konzeption und Implementierung eines ... - Stephan, Daniel

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

5.4. CLUSTERING 68<br />

w j<br />

h<br />

w j+1<br />

h = �<br />

µ j+1<br />

h<br />

Σ j+1<br />

h<br />

=<br />

=<br />

wj<br />

h (x) = �<br />

x∈D<br />

�<br />

x∈D<br />

�<br />

x∈D<br />

�<br />

x∈D<br />

i<br />

w j<br />

i<br />

w j<br />

h (x)<br />

w j<br />

h (x) · x<br />

w j<br />

h (x)<br />

j<br />

· fh(x|µ h , Σj<br />

h )<br />

· fi(x|µ j<br />

i<br />

, Σj<br />

i<br />

w j<br />

h (x)(x − µj+1<br />

h )(x − µ j+1<br />

h ) T<br />

�<br />

x∈D<br />

w j<br />

h (x)<br />

), h = 1, . . ., k (5.19)<br />

, h = 1, . . ., k (5.20)<br />

Die Gleichungen Gleichung 5.19 <strong>und</strong> Gleichung 5.20 verlangen nach etwas<br />

zusätzlicher Erläuterung. Insbesondere wird hier mit dem großen griechischen<br />

Zeichen Sigma ein vorher unbenutztes Symbol verwendet. Es ersetzt das bis-<br />

lang verwendete Symbol σ für die Varianz <strong>und</strong> signalisiert, dass hier dazu über-<br />

gegangen wurde, mehrdimensionale Gaußsche Wahrscheinlichkeitsverteilungen<br />

zu verwenden. Dies ist notwendig, da die zu clusternden Objekte komplexe<br />

Textkörper beinhalten, die kaum auf eindimensionale Art <strong>und</strong> Weise repräsen-<br />

tiert werden können. Daher gehen wir zu mehrdimensionalen Verteilungen über.<br />

Der Erwartungswert µ ist analog mehrdimensional geworden <strong>und</strong> liegt nun in<br />

Form <strong>eines</strong> Vektors vor. Die durch das Sigma dargestellte Varianz ist in der<br />

mehrdimensionalen Form eine Kovarianzmatrix. Sonst ändert sich nichts.<br />

Das Stopp-Kriterium wird von der oben erwähnten Likelihood Funktion ge-<br />

liefert, sobald diese an einem lokalen Maximum konvergiert.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!