Dokumenten-Clustering
Dokumenten-Clustering
Dokumenten-Clustering
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Erweiterung auf nummerische Merkmale<br />
Annahme einer Normalverteilung:<br />
P(x i |C j ) = √ 1<br />
(x i −µ j i )2<br />
2(σ<br />
e<br />
j i )2<br />
1πσi<br />
erfordert Schätzung von 2 Parametern pro Merkmal und Cluster:<br />
µ j i<br />
= 1 ∑<br />
n j x mi · P(C j |x m )<br />
d m∈D<br />
σ j i<br />
= 1 ∑<br />
n j (x mi − µ j i )2 · P(C j |x m )<br />
d m∈D