07.01.2013 Aufrufe

Grafiken und Statistik in R

Grafiken und Statistik in R

Grafiken und Statistik in R

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Multikol<strong>in</strong>earität Das Vorliegen e<strong>in</strong>er gegenseitigen Abhängigkeit der erklärenden Variablen e<strong>in</strong>er multiplen<br />

Korrelations- oder Regressionsgleichung, d.h. e<strong>in</strong>e hohe Korrelation der erklärenden Variablen untere<strong>in</strong>ander.<br />

Beispiel: Die Produktion von Kieselalgen <strong>in</strong> e<strong>in</strong>em See hängt z.B. von den Faktoren Temperatur, pH - Wert,<br />

Carbonatgehalt, Sonnensche<strong>in</strong>dauer, Trübung,... Vermutlich werden viele dieser Variablen zusammenhängen,<br />

das heißt, hoch mite<strong>in</strong>ander korrelieren (= Multikol<strong>in</strong>earität).<br />

Multiple l<strong>in</strong>eare Regression Klassisches Regressionsverfahren bei denen mehr als e<strong>in</strong>e Variable („multiple“)<br />

<strong>in</strong> die Kalibriergleichung aufgenommen wird. Die Auswahl der Variablen wird per Hand (step up) oder<br />

programmgesteuert (stepwise) vorgenommen.<br />

N<br />

nearest neighbor<br />

– s<strong>in</strong>gle l<strong>in</strong>kage Aus jedem der beiden Cluster wird nur e<strong>in</strong> Objekt betrachtet.<br />

Es werden die beiden Objekte ausgewählt, zwischen denen die ger<strong>in</strong>gste<br />

Distanz besteht. Diese Distanz wird als Distanz zwischen den beiden<br />

Clustern angesehen. Nachteil dieses Verfahrens Verkettungseigenschaft <strong>und</strong><br />

sensitiv gegenüber Ausreißern. (s.a.Cluster Analyse Verfahren).<br />

nichtparametrisch E<strong>in</strong> Test, der ke<strong>in</strong>e Verteilungsannahme der Daten braucht, um durchgeführt zu werden<br />

bezeichnet man als nichtparametrischen Test oder auch „verteilungsfrei“.<br />

NMDS<br />

Nichtmetrische Multidimensionale Skalierung 51 betrachtet die Ähnlichkeit<br />

bzw. Verschiedenheit von n Objekten <strong>und</strong> versucht diese <strong>in</strong> e<strong>in</strong>em<br />

möglichst niederdimensionalen Raum (meist k = 1,2,3) so anzuordnen,<br />

daß die Ähnlichkeit bzw. Verschiedenheit möglichst gut wiedergegeben<br />

wird.<br />

Bei der Bestimmung der Konfiguration der Punkte zue<strong>in</strong>ander verwendet<br />

die NMDS e<strong>in</strong>en iterativen Prozeß. Die Gr<strong>und</strong>idee dieses Prozesses<br />

ist relativ simpel: alle Objekte werden zunächst mehr oder weniger willkürlich im Raum angeordnet. Im<br />

nächsten Schritt werden die Distanzen zwischen den Objekten mit den Ähnlichkeiten verglichen (wobei<br />

das Skalenniveau der Ähnlichkeiten berücksichtigt wird). Wenn nun zwei Objekte im Verhältnis zu ihrer<br />

Ähnlichkeit zu weit ause<strong>in</strong>anderliegen, werden sie aufe<strong>in</strong>ander zu geschoben. Sollten zwei eher unähnliche<br />

Objekte zu nahe bei e<strong>in</strong>ander liegen, werden sie vone<strong>in</strong>ander weg bewegt. Dieser Vorgang wird so lange<br />

fortgesetzt, bis die Konfiguration der Objekte die erhobenen Ähnlichkeiten zufriedenstellend widerspiegelt.<br />

Dabei muß vorher festgelegt werden, wieviel Dimensionen der Raum haben soll (http://www.wiwi.uniwuppertal.de/kappelhoff/papers/mds.pdf,<br />

Ablauf s. Abb. 7 auf der nächsten Seite)<br />

E<strong>in</strong> Unterschied zu den Eigenwertmethoden (PCA,PCoA, oder CA) besteht <strong>in</strong> der Weise, daß sie die Variabilität<br />

auf die Achsen maximieren. Beg<strong>in</strong>nend mit der 1. Achse mit dem höchsten Erklärungsanteil an der<br />

Gesamtvariabilität. Bei der NMDS s<strong>in</strong>d die Achsen h<strong>in</strong>gegen beliebig. D.h. man kann die ganze Ord<strong>in</strong>ation<br />

drehen, zentrieren, <strong>in</strong>vertieren.<br />

In gibt es die Funktion: isoMDS(...) – MASS - Paket..<br />

Nom<strong>in</strong>alskala Die Nom<strong>in</strong>alskala setzt nur die Gleichheit oder Ungleichheit von Eigenschaften (z. B. Geschlecht)<br />

bzw. die Möglichkeit mehrklassiger E<strong>in</strong>teilungen (etwa <strong>in</strong> Berufe, Muttersprache, Haarfarbe, Studienrichtung...<br />

) <strong>in</strong> Kategorien voraus. Diese Kategorien müssen exakt def<strong>in</strong>iert, sich gegenseitig ausschließend <strong>und</strong><br />

erschöpfend se<strong>in</strong>. Die e<strong>in</strong>zig erlaubte Rechenoperation ist Zählen, d. h. es wird festgestellt, ob e<strong>in</strong>e Merkmalsausprägung<br />

überhaupt vorhanden ist <strong>und</strong> wenn ja, wie häufig sie auftritt. Siehe auch Skalenniveau.<br />

51 Anm.: hier herrscht etwas Konfusion, da manchmal sowohl die Metrisch Multidimensionale Skalierung als auch die Nichtmetrische<br />

Multidimensionale Skalierung mit MDS abgekürzt wird. Um dies zu vermeiden wurden hier die Abkürzungen MMDS <strong>und</strong> NMDS<br />

verwendet. Meist ist mit MDS die NMDS geme<strong>in</strong>t.<br />

52 = Ungleichheiten, Unterschiede [lat. disparatum „abgesondert, getrennt“]<br />

169

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!