07.01.2013 Aufrufe

Grafiken und Statistik in R

Grafiken und Statistik in R

Grafiken und Statistik in R

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Biplot E<strong>in</strong> Biplot ist e<strong>in</strong> Diagramm, das bei Ord<strong>in</strong>ationstechniken e<strong>in</strong>gesetzt wird, um die Verteilung der Arten<br />

<strong>und</strong> Proben gleichzeitig im Graph zu plotten.<br />

bootstrap Die Idee des bootstrap ist, daß man die n gemessenen Werte x zufällig unter Zurücklegen beprobt.<br />

Somit liegt dem neu entstehenden Datensatz (üblicherweise auch der Größe n) genau die gleiche Verteilung<br />

zugr<strong>und</strong>e, wie den Orig<strong>in</strong>aldaten. Von diesem neuen Datensatz x ′ können wir ebenfalls den Median berechnen.<br />

Und wenn wir diese Prozedur sagen wir 1000 mal wiederholen, können wir arithmetisches Mittel <strong>und</strong><br />

die Varianz der Mediane berechnen. Aus den nach Wert geordneten bootstrap-samples können wir dann<br />

auch 95% Konfidenz<strong>in</strong>tervalle ableiten (nämlich bei dem 25 <strong>und</strong> 975 Wert). In gibt es für das bootstrap<br />

e<strong>in</strong>e eigene Funktionen bootstrap im package bootstrap. Dies ist e<strong>in</strong>e Implementierung der Ideen des<br />

Standardwerkes zum bootstrap (Efron <strong>und</strong> Tibshirani 1993)[Quelle:][]Dormann2004. Der 35 bootstrap ist e<strong>in</strong><br />

nichtparametrisches Verfahren.<br />

C<br />

CA Die Korrespondenzanalyse (CA) galt lange Zeit als Analyseverfahren für Zwei-Wege-Tafeln. Die CA dient<br />

vor allem der Dimensionsreduzierung des Datensatzes. In der ökologie wird die CA hauptsächlich für<br />

Speziesdaten, d.h. für Vorkommen oder Proportionen, verwendet. Die Deskriptoren müssen alle dieselben<br />

physikalischen Dimensionen aufweisen <strong>und</strong> die Zahlenwerte müssen ≥ 0 se<strong>in</strong>. Der Chi-Quadratabstand<br />

(s.auch Chi Qua drat (X 2 ) Di stanz) wird zur Quantifizierung der Beziehungen zwischen den Objekten<br />

benutzt. Er wird im Ord<strong>in</strong>ationsraum, ähnlich wie bei der PCA, beibehalten.<br />

Canberra Metrik Dieses Distanzmaß wird ebenso berechnet, wie die Manhattan-Metrik, jedoch werden die<br />

Punktekoord<strong>in</strong>aten durch die Anzahl der Objekte <strong>und</strong> Variablen gewichtet. s. Distanzmaße.<br />

CAP Constra<strong>in</strong>ed Analysis of Pr<strong>in</strong>cipal Coord<strong>in</strong>ates ist e<strong>in</strong>e Ord<strong>in</strong>ationstechnik, die fast ähnlich mit der der<br />

l<strong>in</strong>earen RDA ist. Der Unterschied besteht nur dar<strong>in</strong>, daß andere Distanzmaße verwendet werden können statt<br />

der für Artendaten ungünstigen Euklid - Distanz. So z.B.: Sørensen, Jaccard u.a. Ist als Distanz "euclidean",<br />

so ist das Ergebnis mit der RDA identisch.<br />

CCA Die CCA (Kanonische Korrespondenzanalyse 36 ) ist die Erweiterung der Korrespondenzanalyse (CA). Sie<br />

wurde vor allem für die Analyse von Speziesdaten entwickelt. Das Verfahren ist dem der RDA gleichzusetzen.<br />

Die CCA hat das Ziel, die Auswirkungen der Variablen der Spezies-Matrix Y durch sie bee<strong>in</strong>flussende<br />

Variablen (Matrix X) zu modellieren. Die Spezies <strong>in</strong> Y reagieren dabei entlang e<strong>in</strong>es Gradienten nichtl<strong>in</strong>ear.<br />

CCorA Die Kanonische Korrelationsanalyse (engl.: canonical correlation analysis) untersucht die Korrelation<br />

zwischen zwei Matrizen. Wobei e<strong>in</strong> l<strong>in</strong>earer Zusammenhang angenommen wird. Sie ist ähnlich der RDA,<br />

PCA <strong>und</strong> CCA, welche aber besser zu den Daten korrespondierenden als die CCorA (Legendre <strong>und</strong> Legendre<br />

1998).<br />

In mit cancor(...) aus dem Paket stats.<br />

Chi Qua drat (X 2 ) Di stanz Dieses Distanzmaß wird ebenso berechnet, wie die Euklid - Distanz, jedoch werden<br />

die Punktekoord<strong>in</strong>aten durch die Anzahl der Objekte <strong>und</strong> Variablen gewichtet. 37<br />

Bei Ordn<strong>in</strong>ationstechniken, wie CA <strong>und</strong> CCA wird dieses Distanzmaß ebenso verwendet. Führt aber dazu,<br />

daß seltene Arten zu stark gewichtet werden. Vermeiden läßt sich dies nur durch abwichten 38 seltener Arten<br />

oder durch Datentransformation. s.a. Distanzmaße.<br />

35 oder das?<br />

36 lat. canonicus = regelmäßig; mlat. correspondere = übere<strong>in</strong>stimmen<br />

37 In e<strong>in</strong>er Tabelle, wie:<br />

Art 1 Art 2 Art 3<br />

Fläche 1 1 0 5<br />

Fläche 2 23 2 4<br />

Fläche 3 33 1 7<br />

werden die Distanzen der Punkte (Fläche1, Art1); (..., ...) durch die<br />

Anzahl der Flächen <strong>und</strong> die Anzahl der Arten gewichtet. Verzerrungseffekte, die durch unterschiedliche Spaltenhäufigkeiten<br />

hervorgerufen werden, werden so elim<strong>in</strong>iert. Dennoch neigt dieses Maß dazu zahlenmäßig ger<strong>in</strong>g vorkommende Arten <strong>in</strong> den<br />

Daten überzubewerten. (Ist e<strong>in</strong> häufiges Distanzmaß bei vielen klassischen Ord<strong>in</strong>ationstechniken.)<br />

38 z.B. durch das Argument iweight bei der Funktion decorana(...) im Paket vegan<br />

154

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!