Grafiken und Statistik in R
Grafiken und Statistik in R
Grafiken und Statistik in R
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Durch diese Operation verlieren Variablen ihre Dimensionen. Der Mittelwert der standardisierten Variable<br />
ist Null, die Varianz ist E<strong>in</strong>s. s.auch Datentransformation.<br />
statistische Power ist die Wahrsche<strong>in</strong>lichkeit, daß der Test e<strong>in</strong>e falsche Nullhypothese H0 verwirft.<br />
http://en.wikipedia.org/.<br />
sum of squares Mit „sum of squares“ s<strong>in</strong>d die Quadratsummen geme<strong>in</strong>t: mittlere Abweichungsquadrate vom<br />
Mittelwert. ähnlich, aber nicht zu verwechseln mit Varianz.<br />
Symmetrisierung<br />
Die Symmetrisierung e<strong>in</strong>er Datenreihe dient der Annäherung an die<br />
Normalverteilung. Die Normalverteilung ist e<strong>in</strong>e wichtige Voraussetzung<br />
für die Durchführung vieler statistischer Verfahren. E<strong>in</strong>e symmetrische<br />
Verteilung von Daten kann durch verschiedene Transformation<br />
der Daten erreicht werden, z.B. Logarithmus-Transformation,Wurzel-<br />
Transformation, Potenztransformation, usw. Die Art der Transformation<br />
richtet sich nach der Nicht-Symmetrie der Daten <strong>und</strong> nach ihren Eigenschaften<br />
(d.h. quantitative, kategorielle oder proportionale Daten).<br />
Die Transformation von Proportionen erfolgt am effektivsten durch die<br />
W<strong>in</strong>keltransformation:<br />
y ′ i = arcs<strong>in</strong> √ yi<br />
n transformierte Werte Bemerkungen<br />
... ... ↑<br />
3 y 3<br />
l<strong>in</strong>ksschief<br />
... ... ↑<br />
2 y 2<br />
↑<br />
... ... ↑<br />
1 y 1<br />
ohne Effekt<br />
...<br />
0.5<br />
...<br />
√<br />
y<br />
↓<br />
↓<br />
... ... ↓<br />
log log y ↓<br />
...<br />
-0.5<br />
...<br />
1/<br />
↓<br />
√ y ↓<br />
... ... ↓<br />
-1 1/y rechtsschief<br />
... ... ↓<br />
-2 1/y 2<br />
↓<br />
... ... ↓<br />
Durch die Transformation werden Daten an den Rändern dichter <strong>in</strong>s Zentrum plaziert, damit haben Extremwerte<br />
weniger E<strong>in</strong>fluß.<br />
Bei Transformationen für quantitative, schiefe Daten (s.Skewness) unterscheidet man <strong>in</strong> l<strong>in</strong>ksschief <strong>und</strong> rechtsschief<br />
verteilte Daten. E<strong>in</strong>e geeignete Transformation rechtsschiefer Daten muß die Abstände zwischen größeren<br />
Werten stärker reduzieren als zwischen kle<strong>in</strong>eren Werten. Alle Potenztransformationen mit n < 1 leisten<br />
das. (Tabelle)<br />
E<strong>in</strong>en Sonderfall stellt die Logarithmustransformation dar. Sie bewirkt zusätzlich, daß Werte nahe Null entzerrt<br />
werden.<br />
Potenztransformationen bewirken, daß bei n < 1 große Werte stärker zusammenrücken. Potenzfunktionen<br />
mit negativem Exponenten haben dieselbe Wirkung wie die log-Transformation. Bei l<strong>in</strong>ksschief verteilten<br />
Daten muß die Transformation bewirken, dass höhere Werte stärker entzerrt werden. Dazu s<strong>in</strong>d alle Potenztransformationen<br />
mit n > 1 geeignet. E<strong>in</strong>e Entscheidungshilfe zur Auswahl der geeigneten Transformation<br />
bietet die Transformationsleiter (Tabelle).<br />
s.auch Datentransformation (Quelle http://www.bio.uni-potsdam.de/oeksys/vstatoek.pdf).<br />
Sørensen Dieses Distanzmaß wurde ursprünglich für presence - absence Daten entwickelt, aber es kann ebenso<br />
mit quantitativen Daten verwendet werden. Es ist meist verwendbar bei ökologischen Daten. Der Gebrauch<br />
dieser Distanz bei Intervalldaten ist eher empirisch zu rechtfertigen, als theoretisch ableitbar. Verglichen zur<br />
Euklid - Distanz reagiert es weniger sensitiv Ausreißern <strong>und</strong> heterogenen Daten gegenüber. – für B<strong>in</strong>ärdaten,<br />
andere Namen: „Bray - Curtis“, „Lance <strong>und</strong> Williams (SPSS)“, s.a Distanzmaße.<br />
T<br />
t - Test Ist e<strong>in</strong> besonders gebräuchlicher Signifikanztest für den Vergleich von zwei Mittelwerten. Der t-<br />
Test besitzt jedoch e<strong>in</strong>ige Voraussetzungen, die erfüllt se<strong>in</strong> müssen, damit er berechnet werden kann: die<br />
Mittelwerte müssen <strong>in</strong>tervallskaliert se<strong>in</strong> (s.Skalenniveau) <strong>und</strong> normalverteilt se<strong>in</strong>. Die Nullhypothese H0 ist:<br />
Mittelwert 1 <strong>und</strong> Mittelwert 2 s<strong>in</strong>d gleich (kurz: µ1 = µ2). Die die Alternativhypothese HA ist: µ1 �= µ2. Der<br />
t-Test berechnet e<strong>in</strong>en t-Wert tV ersuch. Dieser wird dann mit e<strong>in</strong>em theoretischen t-Wert tT abelle verglichen.<br />
Dieser Wert tT abelle errechnet sich aus den Kenngrößen Anzahl derFreiheitsgrade (F G) <strong>und</strong> Alpha-Fehler<br />
(genau: Vgl. von 2 Mittelwerten ⇒ F G − 2, Vgl. von e<strong>in</strong>em Mittelwert mit e<strong>in</strong>em theoretischen ⇒ F G − 1<br />
). Man schreibt das F (F G; α). Ist tV ers ≦ tT ab dann gilt H0, ist tV ers > tT ab, dann gilt HA. Test auf<br />
180