Grafiken und Statistik in R
Grafiken und Statistik in R
Grafiken und Statistik in R
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Multikol<strong>in</strong>earität Das Vorliegen e<strong>in</strong>er gegenseitigen Abhängigkeit der erklärenden Variablen e<strong>in</strong>er multiplen<br />
Korrelations- oder Regressionsgleichung, d.h. e<strong>in</strong>e hohe Korrelation der erklärenden Variablen untere<strong>in</strong>ander.<br />
Beispiel: Die Produktion von Kieselalgen <strong>in</strong> e<strong>in</strong>em See hängt z.B. von den Faktoren Temperatur, pH - Wert,<br />
Carbonatgehalt, Sonnensche<strong>in</strong>dauer, Trübung,... Vermutlich werden viele dieser Variablen zusammenhängen,<br />
das heißt, hoch mite<strong>in</strong>ander korrelieren (= Multikol<strong>in</strong>earität).<br />
Multiple l<strong>in</strong>eare Regression Klassisches Regressionsverfahren bei denen mehr als e<strong>in</strong>e Variable („multiple“)<br />
<strong>in</strong> die Kalibriergleichung aufgenommen wird. Die Auswahl der Variablen wird per Hand (step up) oder<br />
programmgesteuert (stepwise) vorgenommen.<br />
N<br />
nearest neighbor<br />
– s<strong>in</strong>gle l<strong>in</strong>kage Aus jedem der beiden Cluster wird nur e<strong>in</strong> Objekt betrachtet.<br />
Es werden die beiden Objekte ausgewählt, zwischen denen die ger<strong>in</strong>gste<br />
Distanz besteht. Diese Distanz wird als Distanz zwischen den beiden<br />
Clustern angesehen. Nachteil dieses Verfahrens Verkettungseigenschaft <strong>und</strong><br />
sensitiv gegenüber Ausreißern. (s.a.Cluster Analyse Verfahren).<br />
nichtparametrisch E<strong>in</strong> Test, der ke<strong>in</strong>e Verteilungsannahme der Daten braucht, um durchgeführt zu werden<br />
bezeichnet man als nichtparametrischen Test oder auch „verteilungsfrei“.<br />
NMDS<br />
Nichtmetrische Multidimensionale Skalierung 51 betrachtet die Ähnlichkeit<br />
bzw. Verschiedenheit von n Objekten <strong>und</strong> versucht diese <strong>in</strong> e<strong>in</strong>em<br />
möglichst niederdimensionalen Raum (meist k = 1,2,3) so anzuordnen,<br />
daß die Ähnlichkeit bzw. Verschiedenheit möglichst gut wiedergegeben<br />
wird.<br />
Bei der Bestimmung der Konfiguration der Punkte zue<strong>in</strong>ander verwendet<br />
die NMDS e<strong>in</strong>en iterativen Prozeß. Die Gr<strong>und</strong>idee dieses Prozesses<br />
ist relativ simpel: alle Objekte werden zunächst mehr oder weniger willkürlich im Raum angeordnet. Im<br />
nächsten Schritt werden die Distanzen zwischen den Objekten mit den Ähnlichkeiten verglichen (wobei<br />
das Skalenniveau der Ähnlichkeiten berücksichtigt wird). Wenn nun zwei Objekte im Verhältnis zu ihrer<br />
Ähnlichkeit zu weit ause<strong>in</strong>anderliegen, werden sie aufe<strong>in</strong>ander zu geschoben. Sollten zwei eher unähnliche<br />
Objekte zu nahe bei e<strong>in</strong>ander liegen, werden sie vone<strong>in</strong>ander weg bewegt. Dieser Vorgang wird so lange<br />
fortgesetzt, bis die Konfiguration der Objekte die erhobenen Ähnlichkeiten zufriedenstellend widerspiegelt.<br />
Dabei muß vorher festgelegt werden, wieviel Dimensionen der Raum haben soll (http://www.wiwi.uniwuppertal.de/kappelhoff/papers/mds.pdf,<br />
Ablauf s. Abb. 7 auf der nächsten Seite)<br />
E<strong>in</strong> Unterschied zu den Eigenwertmethoden (PCA,PCoA, oder CA) besteht <strong>in</strong> der Weise, daß sie die Variabilität<br />
auf die Achsen maximieren. Beg<strong>in</strong>nend mit der 1. Achse mit dem höchsten Erklärungsanteil an der<br />
Gesamtvariabilität. Bei der NMDS s<strong>in</strong>d die Achsen h<strong>in</strong>gegen beliebig. D.h. man kann die ganze Ord<strong>in</strong>ation<br />
drehen, zentrieren, <strong>in</strong>vertieren.<br />
In gibt es die Funktion: isoMDS(...) – MASS - Paket..<br />
Nom<strong>in</strong>alskala Die Nom<strong>in</strong>alskala setzt nur die Gleichheit oder Ungleichheit von Eigenschaften (z. B. Geschlecht)<br />
bzw. die Möglichkeit mehrklassiger E<strong>in</strong>teilungen (etwa <strong>in</strong> Berufe, Muttersprache, Haarfarbe, Studienrichtung...<br />
) <strong>in</strong> Kategorien voraus. Diese Kategorien müssen exakt def<strong>in</strong>iert, sich gegenseitig ausschließend <strong>und</strong><br />
erschöpfend se<strong>in</strong>. Die e<strong>in</strong>zig erlaubte Rechenoperation ist Zählen, d. h. es wird festgestellt, ob e<strong>in</strong>e Merkmalsausprägung<br />
überhaupt vorhanden ist <strong>und</strong> wenn ja, wie häufig sie auftritt. Siehe auch Skalenniveau.<br />
51 Anm.: hier herrscht etwas Konfusion, da manchmal sowohl die Metrisch Multidimensionale Skalierung als auch die Nichtmetrische<br />
Multidimensionale Skalierung mit MDS abgekürzt wird. Um dies zu vermeiden wurden hier die Abkürzungen MMDS <strong>und</strong> NMDS<br />
verwendet. Meist ist mit MDS die NMDS geme<strong>in</strong>t.<br />
52 = Ungleichheiten, Unterschiede [lat. disparatum „abgesondert, getrennt“]<br />
169