Grafiken und Statistik in R
Grafiken und Statistik in R
Grafiken und Statistik in R
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
D<br />
Datentransformation Die Transformation von Daten hat u.a. das Ziel, verschiedene Datenreihen vergleichbar<br />
zu machen oder den Daten Eigenschaften zu geben, mit denen sie besser analysiert werden können. Zu den<br />
gebräuchlichsten Transformationen gehören das Zentrieren, die Standardisierung, die Normierung <strong>und</strong> das<br />
Symmetrisierung. (Quelle: www.bio.uni-potsdam.de/oeksys/vstatoek.pdf)<br />
Zu Datentransformation bei Ord<strong>in</strong>ationstechniken s. Legendre <strong>und</strong> Gallagher (2001).<br />
DCA Detrended Korrespondenz Analyse s. arch effect <strong>und</strong> CA.<br />
Decorana siehe arch effect.<br />
detrended siehe arch effect.<br />
deviance Summe der Abweichungsquadrate.<br />
Diskrim<strong>in</strong>anzanalyse Wir betrachten e<strong>in</strong> Objekt <strong>und</strong> mehrere gleichartige Klassen. Das Objekt gehört e<strong>in</strong>er<br />
dieser Klassen an, aber welcher, ist unbekannt. Mit Hilfe der Diskrim<strong>in</strong>anzanalyse 42 ordnet man das Objekt<br />
e<strong>in</strong>er der Klassen zu. Die Diskrim<strong>in</strong>anzanalyse ist also e<strong>in</strong> Klassifikationsverfahren. An diesem Objekt kann<br />
m<strong>in</strong>destens e<strong>in</strong> statistisches metrisch skaliertes Merkmal x beobachtet werden. Dieses Merkmal wird im<br />
Modell der Diskrim<strong>in</strong>anzanalyse als e<strong>in</strong>e Zufallsvariable X <strong>in</strong>terpretiert. Die Annahme also: es gibt m<strong>in</strong>destens<br />
zwei verschiedene Gruppen (Populationen, Gr<strong>und</strong>gesamtheiten). Aus e<strong>in</strong>er dieser Gr<strong>und</strong>gesamtheiten stammt<br />
X. Mittels e<strong>in</strong>er Zuordnungsregel, der Klassifikationsregel wird das Objekt e<strong>in</strong>er dieser Gr<strong>und</strong>gesamtheiten<br />
zugeordnet. Die Klassifikationsregel kann oft durch e<strong>in</strong>e Diskrim<strong>in</strong>anzfunktion angegeben werden.<br />
Distanzmaße Gäbe es EIN angemessenes Proximitätsmaß, das alle Distanzen gut beschreibt, so gäbe es ke<strong>in</strong>en<br />
Gr<strong>und</strong> dieses nicht zu verwenden. Meistens jedoch unterliegen diese Distanzmaße zu vielen Fehlern:<br />
die Eigenschaften können unzulänglich se<strong>in</strong>, um unterschieden zu werden, sie können hoch korreliert se<strong>in</strong>,<br />
die entscheidende Grenze könnte gekrümmt se<strong>in</strong>, es kann e<strong>in</strong>deutige Unterklassen <strong>in</strong> den Daten geben, die<br />
räumlichen Eigenschaften können e<strong>in</strong>fach zu komplex se<strong>in</strong>.<br />
(a) Verschiedene Eigenschaften von Clustern<br />
(b) Euklid - Distanz (c) Manhattan-<br />
Metrik (City-Block)<br />
(d) Mahalanobisdistanz<br />
Abbildung 6: Verschiedene Eigenschaften von Clustern sowie Visualisierung der Distanzmessung unterschiedlicher<br />
Distanzmaße<br />
42 lat. discrim<strong>in</strong>are = trennen, absondern<br />
157