07.01.2013 Aufrufe

Grafiken und Statistik in R

Grafiken und Statistik in R

Grafiken und Statistik in R

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

(A mit B; A mit C <strong>und</strong> B mit C). Obwohl es hier möglich ist jede Komb<strong>in</strong>ation der Gruppen e<strong>in</strong>zeln zu<br />

vergleichen <strong>und</strong> e<strong>in</strong>e Alpha-Fehler-Angepaßt vorzunehmen, ist e<strong>in</strong>e Varianzanalyse eleganter <strong>und</strong> weniger<br />

aufwendig zu rechnen. Die Varianzanalyse löst das Problem durch e<strong>in</strong>en Trick: Es werden im wesentlichen<br />

zwei Varianzen ermittelt <strong>und</strong> diese mit e<strong>in</strong>em F-Test verglichen (s.auch F - Verteilung). Es werden also auch<br />

hier nur zwei Werte durch den Test verglichen. Die e<strong>in</strong>e Varianz ist die <strong>in</strong>nerhalb der Gruppen, die andere<br />

ist die zwischen den Gruppen. S<strong>in</strong>d die Unterschiede (also die Varianz) zwischen den Gruppen größer als<br />

die Unterschiede <strong>in</strong>nerhalb der Gruppen, so unterscheiden sich die Gruppen. Allerd<strong>in</strong>gs ist dann noch nicht<br />

bekannt, welche Gruppen sich vone<strong>in</strong>ander unterscheiden. Um dies heraus zu f<strong>in</strong>den werden anschließend<br />

doch wieder paarweise Vergleiche durchgeführt.<br />

(Quelle: http://www.wu-wien.ac.at/<strong>in</strong>st/ivm/strunk/pdf/<strong>Statistik</strong>Glossar.pdf)<br />

.<br />

Anteilswert E<strong>in</strong>e relative Häufigkeit betrachtet die absolute Häufigkeit e<strong>in</strong>er Ausprägung e<strong>in</strong>er Variablen <strong>in</strong><br />

Relation zur Gesamtzahl aller Untersuchungse<strong>in</strong>heiten. Diesen Quotienten bezeichnet man auch als Anteilswert<br />

(engl.: proportion). Unter methodischen Gesichtspunkten ist e<strong>in</strong> Anteilswert e<strong>in</strong>e Gliederungszahl.<br />

Anteilswerte s<strong>in</strong>d immer positiv. Ihr Wertebereich reicht von 0 bis 1. Der prozentuale Anteil entspricht<br />

dem Anteilswert multipliziert mit 100 <strong>und</strong> hat daher e<strong>in</strong>en Wertebereich von 0 bis 100. Hat e<strong>in</strong>e Variable<br />

<strong>in</strong>sgesamt c verschiedene Ausprägungen (engl.: categories), dann gibt es (c − 1) vone<strong>in</strong>ander unabhängige<br />

Anteilswerte, weil die Summe aller Anteilswerte notwendigerweise 1 ergibt <strong>und</strong> man daher immer e<strong>in</strong>en<br />

Anteilswert durch Subtraktion der Summe der (c − 1) anderen Anteilswerte von 1 errechnen kann. Notation:<br />

Der Anteil e<strong>in</strong>zelner Ausprägungen <strong>in</strong> der Stichprobe wird mit p abgekürzt, wobei die Variable <strong>und</strong><br />

die jeweilige Ausprägung, deren Anteil gemessen wird, als Superskript bzw. als Index angegeben werden:<br />

z.B. p X k für den Anteil der Ausprägung X = k. Ist aus dem Kontext erkennbar, welche Variable betrachtet<br />

wird, verzichtet man <strong>in</strong> der Regel auf die Nennung der Variablen im Superskript <strong>und</strong> bezeichnet<br />

den Anteil mit pk. Anteilswerte <strong>in</strong> der Gr<strong>und</strong>gesamtheit werden mit θ (griech.: theta) bezeichnet. (Quelle:<br />

http://www.homes.uni-bielefeld.de/hjawww/glossar/).<br />

arch effect<br />

Der „arch effect“ tritt als e<strong>in</strong> Artefakt bei Ord<strong>in</strong>ationstechniken auf, bei der die zweite<br />

Achse e<strong>in</strong>e Bogenfunktion (arch) der ersten darstellt. Dies ist auf die unimodale ( ) Verteilung<br />

von Arten entlang von Gradienten zurückzuführen. Der Bogen tritt dabei bei der<br />

Korrespondenzanalyse <strong>und</strong> anderen Ord<strong>in</strong>ationstechniken auf. Die Detrended Correspondence<br />

Analysis (DCA) (auch Decoarana) beseitigt diesen Effekt. Bei der Faktorenanalyse<br />

PCA nennt man diesen Effekt auch den „horseshoe effect“. Der Algorithmus geht dabei so vor, daß der erste<br />

Gradient senkrecht <strong>in</strong> Segmente geteilt werde, die anschließend unterschiedlich gewichtet werden. In ist<br />

die Vore<strong>in</strong>stellung bei der Funktion decorana(...) (package vegan): 1, 2, 3, 2, 1. Dieses unterschiedliche<br />

Wichten behebt den „arch effect“. Die andere Möglichkeit der „Enttrendung“ besteht dar<strong>in</strong> Abschnittsweise<br />

e<strong>in</strong>e L<strong>in</strong>eartransformation vorzunehmen <strong>und</strong> seltene Arten abzuwichten, da sie e<strong>in</strong>en zu großen E<strong>in</strong>fluß auf<br />

die Ord<strong>in</strong>ation haben. Diese detrended - Methode sollte man jedoch mit Bedacht verwenden, da e<strong>in</strong>ige Autoren<br />

kritisieren, daß zu wenig Informationen über die Stärke der Glättung existieren.<br />

Aus der Hilfe von (Funktion decorana – vegan - package): Nachdem die Achsen neu gewichtet werden,<br />

wird die Achse auf E<strong>in</strong>heiten der Standardabweichung skaliert, so daß bei der Betrachtung des Ordiantionsdiagrammes<br />

die Arten bezüglich des gesamten Gradienten zu beurteilen s<strong>in</strong>d.<br />

arithmetisches Mittel Das arithmetische Mittel ¯x e<strong>in</strong>er Stichprobe wird berechnet, <strong>in</strong>dem die Summe aller<br />

Werte durch die Anzahl aller Werte dividiert wird. E<strong>in</strong>e wichtige Eigenschaft von ¯x ist, daß die Summe der<br />

quadrierten Abweichungen all der Werte aus denen das arithmetischen Mittel berechnet wurde, m<strong>in</strong>imal ist.<br />

. Wird das arithmetische Mittel aus Sicht der Stochastik gesehen, so ändert sich se<strong>in</strong>e Bezeichnung, es wird<br />

dann mit µ bezeichnet.<br />

Autokorrelation Die Autokorrelation ist e<strong>in</strong> Begriff aus der <strong>Statistik</strong> <strong>und</strong> der Signalverarbeitung.<br />

Im statistischen Modell geht man von e<strong>in</strong>er geordneten Folge von Zufallsvariablen aus. Vergleicht man die<br />

Folge mit sich selbst, so spricht man von Autokorrelation. Da jede unverschobene Folge mit sich selbst<br />

152

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!