07.01.2013 Aufrufe

Grafiken und Statistik in R

Grafiken und Statistik in R

Grafiken und Statistik in R

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Durch diese Operation verlieren Variablen ihre Dimensionen. Der Mittelwert der standardisierten Variable<br />

ist Null, die Varianz ist E<strong>in</strong>s. s.auch Datentransformation.<br />

statistische Power ist die Wahrsche<strong>in</strong>lichkeit, daß der Test e<strong>in</strong>e falsche Nullhypothese H0 verwirft.<br />

http://en.wikipedia.org/.<br />

sum of squares Mit „sum of squares“ s<strong>in</strong>d die Quadratsummen geme<strong>in</strong>t: mittlere Abweichungsquadrate vom<br />

Mittelwert. ähnlich, aber nicht zu verwechseln mit Varianz.<br />

Symmetrisierung<br />

Die Symmetrisierung e<strong>in</strong>er Datenreihe dient der Annäherung an die<br />

Normalverteilung. Die Normalverteilung ist e<strong>in</strong>e wichtige Voraussetzung<br />

für die Durchführung vieler statistischer Verfahren. E<strong>in</strong>e symmetrische<br />

Verteilung von Daten kann durch verschiedene Transformation<br />

der Daten erreicht werden, z.B. Logarithmus-Transformation,Wurzel-<br />

Transformation, Potenztransformation, usw. Die Art der Transformation<br />

richtet sich nach der Nicht-Symmetrie der Daten <strong>und</strong> nach ihren Eigenschaften<br />

(d.h. quantitative, kategorielle oder proportionale Daten).<br />

Die Transformation von Proportionen erfolgt am effektivsten durch die<br />

W<strong>in</strong>keltransformation:<br />

y ′ i = arcs<strong>in</strong> √ yi<br />

n transformierte Werte Bemerkungen<br />

... ... ↑<br />

3 y 3<br />

l<strong>in</strong>ksschief<br />

... ... ↑<br />

2 y 2<br />

↑<br />

... ... ↑<br />

1 y 1<br />

ohne Effekt<br />

...<br />

0.5<br />

...<br />

√<br />

y<br />

↓<br />

↓<br />

... ... ↓<br />

log log y ↓<br />

...<br />

-0.5<br />

...<br />

1/<br />

↓<br />

√ y ↓<br />

... ... ↓<br />

-1 1/y rechtsschief<br />

... ... ↓<br />

-2 1/y 2<br />

↓<br />

... ... ↓<br />

Durch die Transformation werden Daten an den Rändern dichter <strong>in</strong>s Zentrum plaziert, damit haben Extremwerte<br />

weniger E<strong>in</strong>fluß.<br />

Bei Transformationen für quantitative, schiefe Daten (s.Skewness) unterscheidet man <strong>in</strong> l<strong>in</strong>ksschief <strong>und</strong> rechtsschief<br />

verteilte Daten. E<strong>in</strong>e geeignete Transformation rechtsschiefer Daten muß die Abstände zwischen größeren<br />

Werten stärker reduzieren als zwischen kle<strong>in</strong>eren Werten. Alle Potenztransformationen mit n < 1 leisten<br />

das. (Tabelle)<br />

E<strong>in</strong>en Sonderfall stellt die Logarithmustransformation dar. Sie bewirkt zusätzlich, daß Werte nahe Null entzerrt<br />

werden.<br />

Potenztransformationen bewirken, daß bei n < 1 große Werte stärker zusammenrücken. Potenzfunktionen<br />

mit negativem Exponenten haben dieselbe Wirkung wie die log-Transformation. Bei l<strong>in</strong>ksschief verteilten<br />

Daten muß die Transformation bewirken, dass höhere Werte stärker entzerrt werden. Dazu s<strong>in</strong>d alle Potenztransformationen<br />

mit n > 1 geeignet. E<strong>in</strong>e Entscheidungshilfe zur Auswahl der geeigneten Transformation<br />

bietet die Transformationsleiter (Tabelle).<br />

s.auch Datentransformation (Quelle http://www.bio.uni-potsdam.de/oeksys/vstatoek.pdf).<br />

Sørensen Dieses Distanzmaß wurde ursprünglich für presence - absence Daten entwickelt, aber es kann ebenso<br />

mit quantitativen Daten verwendet werden. Es ist meist verwendbar bei ökologischen Daten. Der Gebrauch<br />

dieser Distanz bei Intervalldaten ist eher empirisch zu rechtfertigen, als theoretisch ableitbar. Verglichen zur<br />

Euklid - Distanz reagiert es weniger sensitiv Ausreißern <strong>und</strong> heterogenen Daten gegenüber. – für B<strong>in</strong>ärdaten,<br />

andere Namen: „Bray - Curtis“, „Lance <strong>und</strong> Williams (SPSS)“, s.a Distanzmaße.<br />

T<br />

t - Test Ist e<strong>in</strong> besonders gebräuchlicher Signifikanztest für den Vergleich von zwei Mittelwerten. Der t-<br />

Test besitzt jedoch e<strong>in</strong>ige Voraussetzungen, die erfüllt se<strong>in</strong> müssen, damit er berechnet werden kann: die<br />

Mittelwerte müssen <strong>in</strong>tervallskaliert se<strong>in</strong> (s.Skalenniveau) <strong>und</strong> normalverteilt se<strong>in</strong>. Die Nullhypothese H0 ist:<br />

Mittelwert 1 <strong>und</strong> Mittelwert 2 s<strong>in</strong>d gleich (kurz: µ1 = µ2). Die die Alternativhypothese HA ist: µ1 �= µ2. Der<br />

t-Test berechnet e<strong>in</strong>en t-Wert tV ersuch. Dieser wird dann mit e<strong>in</strong>em theoretischen t-Wert tT abelle verglichen.<br />

Dieser Wert tT abelle errechnet sich aus den Kenngrößen Anzahl derFreiheitsgrade (F G) <strong>und</strong> Alpha-Fehler<br />

(genau: Vgl. von 2 Mittelwerten ⇒ F G − 2, Vgl. von e<strong>in</strong>em Mittelwert mit e<strong>in</strong>em theoretischen ⇒ F G − 1<br />

). Man schreibt das F (F G; α). Ist tV ers ≦ tT ab dann gilt H0, ist tV ers > tT ab, dann gilt HA. Test auf<br />

180

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!