07.01.2013 Aufrufe

Grafiken und Statistik in R

Grafiken und Statistik in R

Grafiken und Statistik in R

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Cluster-Zentren entstehen, die mehr oder weniger weit von den eigentlichen Clustern liegen. ⇒ k-means ist<br />

nicht sehr robust. (s.a.Cluster Analyse Verfahren).<br />

k - medoid PAM funktioniert ähnlich wie k - means. Es werden für e<strong>in</strong>e gegebene Anzahl von k Clustern zunächst<br />

k Repräsentanten, sog. „medoids“, aus der Menge aller Daten gesucht. Die Medoids werden so ermittelt,<br />

daß die Summe der Abstände der Daten zu ihrem jeweils nächstgelegenen Medoid m<strong>in</strong>imal ist. Nach Bestimmung<br />

der k Repräsentanten werden k Cluster gebildet, <strong>in</strong>dem jeder Wert se<strong>in</strong>em nächstgelegenen Medoid<br />

zugeordnet wird. (Quelle: http://www.stat.uni-muenchen.de/~strimmer/publications/diplom-lampert.pdf).<br />

Dieses Verfahren wird als robuster beurteilt (aus -Hilfe). siehe auch Cluster Analyse Verfahren.<br />

Kolmogorov-Smirnov-Test Mit dem Kolmogorov-Smirnov-Test ks.test(...) kann man testen, ob zwei<br />

numerische Datenvektoren X <strong>und</strong> Y von derselben Verteilung stammen. (Nullhypothese H0 Kommen x<br />

<strong>und</strong> y aus derselben Verteilung?)<br />

library(ctest)<br />

x −0.3 bis 0 nicht signifikant korreliert <strong>in</strong> Abhängigkeit von n<br />

0 bis 0.3 nicht signifikant korreliert <strong>in</strong> Abhängigkeit von n<br />

> 0.3 bis 0.7 schwach positiv korreliert<br />

> 0.7 bis < 1 stark positiv korreliert

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!