Grafiken und Statistik in R
Grafiken und Statistik in R
Grafiken und Statistik in R
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
man schreibt das mathematisch so auf: N(103, 2) oder ganz allgeme<strong>in</strong>: e<strong>in</strong>e Zufallsvariable X ist normalverteilt<br />
mit dem Mittelwert µ <strong>und</strong> der Standardabweichung σ: X ∼ N = (µ, σ)<br />
Test auf Normalverteilung: Shapiro-Wilk Test (shapiro.test(x) Paket ctest/stats für n = 3...5000,<br />
H0 : die Streuung von x gleicht der, der Normalverteilung – Bsp.: P = 0.004, dann ist x NICHT normalverteilt)<br />
oder Kolmogorov-Smirnov-Test (testen, wenn 2 Variablen unabhängig s<strong>in</strong>d, ks.test(x, y) Paket<br />
ctest/stats; H0 : x <strong>und</strong> y s<strong>in</strong>d aus der selben Verteilung).<br />
Normierung Die Normierung dient der Relativierung von Datenreihen. Dabei werden die Daten <strong>in</strong> den<br />
Bereich zwischen Null <strong>und</strong> E<strong>in</strong>s gebracht, <strong>in</strong>dem man sie z.B. auf ihren maximalen Wert skaliert. s.auch<br />
Datentransformation.<br />
Nullhypothese H0 E<strong>in</strong> statistischer Test ist e<strong>in</strong> Verfahren zur Überprüfung e<strong>in</strong>er Annahme oder Hypothese<br />
über die Wahrsche<strong>in</strong>lichkeitsverteilung e<strong>in</strong>er Zufallsvariable aufgr<strong>und</strong> e<strong>in</strong>er Stichprobe. Dabei hilft der<br />
Test zu entscheiden, zwischen welchen beiden Hypothesen man sich guten Gewissens entscheiden darf 53 .<br />
Zeigt e<strong>in</strong> Test ke<strong>in</strong>e Signifikanz an, dann „behält“ man die Nullhypothese bei 54 . Zeigt er Signifikanz an<br />
(i.A. Alpha-Fehler = 5%=p), dann entscheidet man sich für die Alternativhypothese. Zum Beispiel heißt<br />
es beim Kolmogorov-Smirnov-Test: Test auf Gleichverteilung zweier Verteilungen. Das bedeutet H0 =<br />
Gleichverteilung HA ungleiche Verteilungen. Gibt der Test p = 0.023 aus, so entscheidet man sich für HA,<br />
d.h. die zwei getesteten Verteilungen s<strong>in</strong>d verschieden. Tipp: Ist es manchmal ganz unklar, was Nullhypothese<br />
oder Alternativhypothese ist, rechnet man e<strong>in</strong>fach mit identischen Proben.<br />
O<br />
odds - ratio<br />
Die Odds <strong>und</strong> Odds Ratio s<strong>in</strong>d e<strong>in</strong>e Möglichkeit, Anteilswerte<br />
<strong>in</strong> Kreuztabellen auszudrücken <strong>und</strong> zu vergleichen.<br />
Man kann „Odds“ mit „Chancen“ <strong>und</strong> „Odds Ratio“ mit<br />
„relative Chancen“ übersetzen, es hat sich aber (bislang)<br />
auch <strong>in</strong> der deutschen Sprache eher der englische Begriff<br />
Frauen Männer alle<br />
Ke<strong>in</strong> Übergewicht 60% 30% 45%<br />
Übergewicht 40% 70% 55%<br />
N 100 100 200<br />
e<strong>in</strong>gebürgert. Das ist auch deshalb s<strong>in</strong>nvoll, weil „relative Chancen“ leicht mit „relative Risiken“ verwechselt<br />
werden kann (was etwas anderes ist!). Betrachten wir die Tabelle: Übergewicht <strong>in</strong> Abhängigkeit vom Geschlecht.<br />
Wir können nun sagen: Die „Chancen“, daß e<strong>in</strong>e Frau ke<strong>in</strong> Übergewicht hat, betragen 60:40 oder<br />
1,5. (Umgekehrt kann man auch sagen, daß die „Chancen“, Übergewicht aufzuweisen, 40:60 oder 0,66 betragen).<br />
Die „Chancen“ von Männern, ke<strong>in</strong> Übergewicht aufzuweisen, betragen dagegen nur 30:70 oder 0,43.<br />
Gr<strong>und</strong>sätzlich zeigt sich, daß e<strong>in</strong> Wert der Odds von genau 1 e<strong>in</strong> Verhältnis von 50:50 ausdrückt, Werte >1<br />
drücken aus, daß die Kategorie im Zähler, Werte 1, s<strong>in</strong>d die Odds der ersten<br />
Gruppe größer, ist sie