Grafiken und Statistik in R
Grafiken und Statistik in R
Grafiken und Statistik in R
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
(A mit B; A mit C <strong>und</strong> B mit C). Obwohl es hier möglich ist jede Komb<strong>in</strong>ation der Gruppen e<strong>in</strong>zeln zu<br />
vergleichen <strong>und</strong> e<strong>in</strong>e Alpha-Fehler-Angepaßt vorzunehmen, ist e<strong>in</strong>e Varianzanalyse eleganter <strong>und</strong> weniger<br />
aufwendig zu rechnen. Die Varianzanalyse löst das Problem durch e<strong>in</strong>en Trick: Es werden im wesentlichen<br />
zwei Varianzen ermittelt <strong>und</strong> diese mit e<strong>in</strong>em F-Test verglichen (s.auch F - Verteilung). Es werden also auch<br />
hier nur zwei Werte durch den Test verglichen. Die e<strong>in</strong>e Varianz ist die <strong>in</strong>nerhalb der Gruppen, die andere<br />
ist die zwischen den Gruppen. S<strong>in</strong>d die Unterschiede (also die Varianz) zwischen den Gruppen größer als<br />
die Unterschiede <strong>in</strong>nerhalb der Gruppen, so unterscheiden sich die Gruppen. Allerd<strong>in</strong>gs ist dann noch nicht<br />
bekannt, welche Gruppen sich vone<strong>in</strong>ander unterscheiden. Um dies heraus zu f<strong>in</strong>den werden anschließend<br />
doch wieder paarweise Vergleiche durchgeführt.<br />
(Quelle: http://www.wu-wien.ac.at/<strong>in</strong>st/ivm/strunk/pdf/<strong>Statistik</strong>Glossar.pdf)<br />
.<br />
Anteilswert E<strong>in</strong>e relative Häufigkeit betrachtet die absolute Häufigkeit e<strong>in</strong>er Ausprägung e<strong>in</strong>er Variablen <strong>in</strong><br />
Relation zur Gesamtzahl aller Untersuchungse<strong>in</strong>heiten. Diesen Quotienten bezeichnet man auch als Anteilswert<br />
(engl.: proportion). Unter methodischen Gesichtspunkten ist e<strong>in</strong> Anteilswert e<strong>in</strong>e Gliederungszahl.<br />
Anteilswerte s<strong>in</strong>d immer positiv. Ihr Wertebereich reicht von 0 bis 1. Der prozentuale Anteil entspricht<br />
dem Anteilswert multipliziert mit 100 <strong>und</strong> hat daher e<strong>in</strong>en Wertebereich von 0 bis 100. Hat e<strong>in</strong>e Variable<br />
<strong>in</strong>sgesamt c verschiedene Ausprägungen (engl.: categories), dann gibt es (c − 1) vone<strong>in</strong>ander unabhängige<br />
Anteilswerte, weil die Summe aller Anteilswerte notwendigerweise 1 ergibt <strong>und</strong> man daher immer e<strong>in</strong>en<br />
Anteilswert durch Subtraktion der Summe der (c − 1) anderen Anteilswerte von 1 errechnen kann. Notation:<br />
Der Anteil e<strong>in</strong>zelner Ausprägungen <strong>in</strong> der Stichprobe wird mit p abgekürzt, wobei die Variable <strong>und</strong><br />
die jeweilige Ausprägung, deren Anteil gemessen wird, als Superskript bzw. als Index angegeben werden:<br />
z.B. p X k für den Anteil der Ausprägung X = k. Ist aus dem Kontext erkennbar, welche Variable betrachtet<br />
wird, verzichtet man <strong>in</strong> der Regel auf die Nennung der Variablen im Superskript <strong>und</strong> bezeichnet<br />
den Anteil mit pk. Anteilswerte <strong>in</strong> der Gr<strong>und</strong>gesamtheit werden mit θ (griech.: theta) bezeichnet. (Quelle:<br />
http://www.homes.uni-bielefeld.de/hjawww/glossar/).<br />
arch effect<br />
Der „arch effect“ tritt als e<strong>in</strong> Artefakt bei Ord<strong>in</strong>ationstechniken auf, bei der die zweite<br />
Achse e<strong>in</strong>e Bogenfunktion (arch) der ersten darstellt. Dies ist auf die unimodale ( ) Verteilung<br />
von Arten entlang von Gradienten zurückzuführen. Der Bogen tritt dabei bei der<br />
Korrespondenzanalyse <strong>und</strong> anderen Ord<strong>in</strong>ationstechniken auf. Die Detrended Correspondence<br />
Analysis (DCA) (auch Decoarana) beseitigt diesen Effekt. Bei der Faktorenanalyse<br />
PCA nennt man diesen Effekt auch den „horseshoe effect“. Der Algorithmus geht dabei so vor, daß der erste<br />
Gradient senkrecht <strong>in</strong> Segmente geteilt werde, die anschließend unterschiedlich gewichtet werden. In ist<br />
die Vore<strong>in</strong>stellung bei der Funktion decorana(...) (package vegan): 1, 2, 3, 2, 1. Dieses unterschiedliche<br />
Wichten behebt den „arch effect“. Die andere Möglichkeit der „Enttrendung“ besteht dar<strong>in</strong> Abschnittsweise<br />
e<strong>in</strong>e L<strong>in</strong>eartransformation vorzunehmen <strong>und</strong> seltene Arten abzuwichten, da sie e<strong>in</strong>en zu großen E<strong>in</strong>fluß auf<br />
die Ord<strong>in</strong>ation haben. Diese detrended - Methode sollte man jedoch mit Bedacht verwenden, da e<strong>in</strong>ige Autoren<br />
kritisieren, daß zu wenig Informationen über die Stärke der Glättung existieren.<br />
Aus der Hilfe von (Funktion decorana – vegan - package): Nachdem die Achsen neu gewichtet werden,<br />
wird die Achse auf E<strong>in</strong>heiten der Standardabweichung skaliert, so daß bei der Betrachtung des Ordiantionsdiagrammes<br />
die Arten bezüglich des gesamten Gradienten zu beurteilen s<strong>in</strong>d.<br />
arithmetisches Mittel Das arithmetische Mittel ¯x e<strong>in</strong>er Stichprobe wird berechnet, <strong>in</strong>dem die Summe aller<br />
Werte durch die Anzahl aller Werte dividiert wird. E<strong>in</strong>e wichtige Eigenschaft von ¯x ist, daß die Summe der<br />
quadrierten Abweichungen all der Werte aus denen das arithmetischen Mittel berechnet wurde, m<strong>in</strong>imal ist.<br />
. Wird das arithmetische Mittel aus Sicht der Stochastik gesehen, so ändert sich se<strong>in</strong>e Bezeichnung, es wird<br />
dann mit µ bezeichnet.<br />
Autokorrelation Die Autokorrelation ist e<strong>in</strong> Begriff aus der <strong>Statistik</strong> <strong>und</strong> der Signalverarbeitung.<br />
Im statistischen Modell geht man von e<strong>in</strong>er geordneten Folge von Zufallsvariablen aus. Vergleicht man die<br />
Folge mit sich selbst, so spricht man von Autokorrelation. Da jede unverschobene Folge mit sich selbst<br />
152