07.01.2013 Aufrufe

Grafiken und Statistik in R

Grafiken und Statistik in R

Grafiken und Statistik in R

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

D<br />

Datentransformation Die Transformation von Daten hat u.a. das Ziel, verschiedene Datenreihen vergleichbar<br />

zu machen oder den Daten Eigenschaften zu geben, mit denen sie besser analysiert werden können. Zu den<br />

gebräuchlichsten Transformationen gehören das Zentrieren, die Standardisierung, die Normierung <strong>und</strong> das<br />

Symmetrisierung. (Quelle: www.bio.uni-potsdam.de/oeksys/vstatoek.pdf)<br />

Zu Datentransformation bei Ord<strong>in</strong>ationstechniken s. Legendre <strong>und</strong> Gallagher (2001).<br />

DCA Detrended Korrespondenz Analyse s. arch effect <strong>und</strong> CA.<br />

Decorana siehe arch effect.<br />

detrended siehe arch effect.<br />

deviance Summe der Abweichungsquadrate.<br />

Diskrim<strong>in</strong>anzanalyse Wir betrachten e<strong>in</strong> Objekt <strong>und</strong> mehrere gleichartige Klassen. Das Objekt gehört e<strong>in</strong>er<br />

dieser Klassen an, aber welcher, ist unbekannt. Mit Hilfe der Diskrim<strong>in</strong>anzanalyse 42 ordnet man das Objekt<br />

e<strong>in</strong>er der Klassen zu. Die Diskrim<strong>in</strong>anzanalyse ist also e<strong>in</strong> Klassifikationsverfahren. An diesem Objekt kann<br />

m<strong>in</strong>destens e<strong>in</strong> statistisches metrisch skaliertes Merkmal x beobachtet werden. Dieses Merkmal wird im<br />

Modell der Diskrim<strong>in</strong>anzanalyse als e<strong>in</strong>e Zufallsvariable X <strong>in</strong>terpretiert. Die Annahme also: es gibt m<strong>in</strong>destens<br />

zwei verschiedene Gruppen (Populationen, Gr<strong>und</strong>gesamtheiten). Aus e<strong>in</strong>er dieser Gr<strong>und</strong>gesamtheiten stammt<br />

X. Mittels e<strong>in</strong>er Zuordnungsregel, der Klassifikationsregel wird das Objekt e<strong>in</strong>er dieser Gr<strong>und</strong>gesamtheiten<br />

zugeordnet. Die Klassifikationsregel kann oft durch e<strong>in</strong>e Diskrim<strong>in</strong>anzfunktion angegeben werden.<br />

Distanzmaße Gäbe es EIN angemessenes Proximitätsmaß, das alle Distanzen gut beschreibt, so gäbe es ke<strong>in</strong>en<br />

Gr<strong>und</strong> dieses nicht zu verwenden. Meistens jedoch unterliegen diese Distanzmaße zu vielen Fehlern:<br />

die Eigenschaften können unzulänglich se<strong>in</strong>, um unterschieden zu werden, sie können hoch korreliert se<strong>in</strong>,<br />

die entscheidende Grenze könnte gekrümmt se<strong>in</strong>, es kann e<strong>in</strong>deutige Unterklassen <strong>in</strong> den Daten geben, die<br />

räumlichen Eigenschaften können e<strong>in</strong>fach zu komplex se<strong>in</strong>.<br />

(a) Verschiedene Eigenschaften von Clustern<br />

(b) Euklid - Distanz (c) Manhattan-<br />

Metrik (City-Block)<br />

(d) Mahalanobisdistanz<br />

Abbildung 6: Verschiedene Eigenschaften von Clustern sowie Visualisierung der Distanzmessung unterschiedlicher<br />

Distanzmaße<br />

42 lat. discrim<strong>in</strong>are = trennen, absondern<br />

157

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!