10.10.2013 Aufrufe

σ µ ν µ

σ µ ν µ

σ µ ν µ

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

5. Statistische Testverfahren<br />

∇ Fehlermöglichkeiten bei statistischen<br />

Vergleichen<br />

∇ Prüfung von Varianzen: F-Test<br />

∇ Prüfung von Mittelwertdifferenzen<br />

♦parametrische Testverfahren:<br />

• z-Test, t-Test, Welch-Test<br />

• Ausreißertest<br />

♦nichtparametrische Testverfahren:<br />

• Mann & Whitney, Kolmogorov-Smirnov, Kruskal<br />

& Wallis, Wilcoxon, Dixon & Mood, Friedmann<br />

∇ Prüfung von Verteilungen:<br />

♦Chiquadrat-Test, Kolmogorov-Smirnov-Test<br />

♦graphische Verfahren<br />

z-Test Test für den Vergleich eines Mittelwertes mit dem<br />

Mittelwert <strong>µ</strong><strong>µ</strong> der Grundgesamtheit<br />

∇ Voraussetzung:<br />

♦ näherungsweise Normalverteilung<br />

♦ sehr großer Stichprobenumfang<br />

♦ Varianz <strong>σ</strong> 2 bekannt:<br />

x − <strong>µ</strong><br />

z = *<br />

<strong>σ</strong><br />

Vergleich des berechneten z-Wertes mit dem<br />

Tafelwert für die Standard-Normalverteilung<br />

und vorgegebenes α<br />

Ist der berechnete z-Wert ≥ Tafelwert, wird die<br />

H 0 (Gleichheit der Mittelwerte) mit Irrtumswahrscheinlichkeit<br />

α abgelehnt.<br />

Ist der berechnete z-Wert < Tafelwert, wird die<br />

H 0 angenommen. Eine Irrtumswahrscheinlichkeit<br />

kann nicht angegeben werden.<br />

t-Test Test für den Vergleich eines Mittelwertes mit dem<br />

Mittelwert <strong>µ</strong><strong>µ</strong> der Grundgesamtheit<br />

∇Voraussetzung:<br />

♦näherungsweise Normalverteilung<br />

♦Varianz <strong>σ</strong>2 bekannt oder unbekannt (Schätzung aus s2 ):<br />

x − <strong>µ</strong><br />

t = * n;<br />

<strong>ν</strong> = n −1<br />

s<br />

Vergleich des berechneten t-Wertes mit dem Tafelwert<br />

für <strong>ν</strong> (ny) Freiheitsgrade und vorgegebenes α<br />

Ist der berechnete t-Wert ≥ Tafelwert, wird die H0 (Gleichheit der Mittelwerte) mit Irrtumswahrscheinlichkeit<br />

α abgelehnt.<br />

Ist der berechnete t-Wert < Tafelwert, wird die H0 angenommen. Eine Irrtumswahrscheinlichkeit kann<br />

nicht angegeben werden!<br />

n<br />

Fehlermöglichkeiten bei statistischen Vergleichen<br />

Entscheidung des<br />

Tests<br />

H0 abgelehnt<br />

(HA angenommen)<br />

H0 angenommen<br />

(HA abgelehnt)<br />

H0 wahr<br />

(kein Unterschied)<br />

Fehler 1. Art,<br />

Irrtumswahrscheinlichkeit<br />

α<br />

richtige<br />

Entscheidung<br />

Flächen unter der Normalkurve<br />

1 - 2 ΦΦ(z) (z)<br />

Wirklichkeit<br />

0.1<br />

Irrtumswahrscheinlichkeit α nach der positiven<br />

0<br />

und negativen Seite α = 1 - 2 Φ(z) -3<br />

H0 falsch<br />

(Unterschied<br />

vorhanden)<br />

richtige<br />

Entscheidung<br />

Fehler 2. Art,<br />

Irrtumswahrscheinlichkeit<br />

β<br />

1 – β = Güte<br />

-1 1 3 5 7<br />

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09<br />

0,0 1,0000<br />

0,1<br />

...<br />

.92034<br />

1,0 .37310<br />

...<br />

α = 0,05<br />

1,9 .05743 .05118 .049996<br />

2,0 .04550<br />

...<br />

α = 0,01<br />

2,5<br />

...<br />

.01017 .00988<br />

3,0 .00270<br />

t-Test Test zum Vergleich 2er arithmetischer Mittelwerte<br />

einfacher t-Test<br />

∇ Voraussetzung:<br />

♦näherungsweise Normalverteilung<br />

♦unabhängige Stichproben<br />

♦gleiche Varianzen,<br />

gleicher Stichprobenumfang:<br />

(<strong>σ</strong> 1 2 =<strong>σ</strong>2 2 ; n1=n 2)<br />

0.4<br />

0.3<br />

0.2<br />

N(2,1)<br />

gleiche Varianzen<br />

Homoskedastizität<br />

x1<br />

− x2<br />

tˆ =<br />

2 2<br />

s1<br />

+ s2<br />

n1<br />

<strong>ν</strong> = 2 * n1<br />

− 2<br />

Vergleich des berechneten t-Wertes mit dem Tafelwert für<br />

<strong>ν</strong> Freiheitsgrade und vorgegebenes α<br />

Ist der berechnete t-Wert ≥ Tafelwert, wird die H 0<br />

(Gleichheit der Mittelwerte) mit Irrtumswahrscheinlichkeit<br />

α abgelehnt.<br />

Ist der berechnete t-Wert < Tafelwert, wird die H 0<br />

angenommen. Eine Irrtumswahrscheinlichkeit kann<br />

nicht angegeben werden!<br />

X<br />

z


Wahrscheinlichkeitsdichte<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

0<br />

99<br />

Student's t-Verteilung 4<br />

1<br />

Freiheitsgrade<br />

-7 -4 -1 2 5 8<br />

t<br />

t-Test Test nach Welch<br />

∇ Voraussetzung:<br />

♦ näherungsweise Normalverteilung<br />

∇ t-Test nach Welch<br />

♦ unabhängige Stichproben<br />

♦ ungleiche Varianzen,<br />

♦ gleicher Stichprobenumfang:<br />

♦ (<strong>σ</strong> 2<br />

1 ≠<strong>σ</strong>2 2 ; n1 = n2 )<br />

ungleiche Varianzen<br />

Heteroskedastizität<br />

tˆ =<br />

t = ± 2,78<br />

P = 95 %<br />

α = 0,05<br />

zweiseitig<br />

4 FG<br />

x − x<br />

1<br />

1<br />

2<br />

2<br />

s1<br />

+ s<br />

n<br />

2<br />

2<br />

1 ( n − )( s + s )<br />

<strong>ν</strong> =<br />

2 2 2<br />

1 1 2<br />

2 2 2 2<br />

( s1<br />

) + ( s2)<br />

Vergleich des berechneten t-Wertes mit dem Tafelwert<br />

für <strong>ν</strong> Freiheitsgrade und vorgegebenes α<br />

Ist der berechnete t-Wert ≥ Tafelwert, wird die H 0 (Gleichheit<br />

der Mittelwerte) mit Irrtumswahrscheinlichkeit α abgelehnt.<br />

Ist der berechnete t-Wert < Tafelwert, wird die H 0<br />

angenommen. Eine Irrtumswahrscheinlichkeit kann nicht<br />

angegeben werden!<br />

Beispiel: Wirkung des antidiuretischen Hormons bei Stabheuschrecken: Malpighi-Gefäße<br />

von Stabheuschrecken Wirkung des herauspräpariert, antidiuretischen absorbierte Hormons Menge bei Flüssigkeit Stabheuschrecken<br />

einer Insekten-<br />

Ringerlösung in <strong>µ</strong>l gemessen bei Kontrollgruppe bzw. nach Hormonbehandlung der Gefäße:<br />

Kontrolle <strong>µ</strong>l Kontr. 2 Hormonbehandlung <strong>µ</strong>l<br />

12,0 144,00 57,9 3352,41<br />

23,3 542,89 52,0 2704,00<br />

11,7 136,89 46,2 2134,44<br />

22,7 515,29 45,2 2043,04<br />

29,1 846,81 54,2 2937,64<br />

Summe 98,8 2185,88 255,5 13171,53<br />

Mittelwert 19,76 51,10<br />

Varianz 58,40 28,87<br />

n1 = n2 5 F α 5%; 4; 4: 5<br />

F F-Wert = 58,4/28,87 = 2,023<br />

6,39<br />

alphaberechnet 0,511829<br />

(z.B.: Varianz Kontrolle = (2185,88 - 98,8 * 98,8 / 5) / 4 = 58,40)<br />

t berech. = (19,76 - 51,1) / wurzel((58,398+28,87)/5) = -7,50<br />

FG = 2*n 1 -2 = 8<br />

Die Varianzen unterscheiden<br />

sich nicht signifikant<br />

Tafelwert: t α=0,05;8 = 2,31<br />

x1<br />

− x2<br />

tˆ =<br />

2<br />

s1<br />

+ s<br />

n<br />

1<br />

<strong>ν</strong> = 2n 1 -2<br />

Aussage: H0 wird abgelehnt, die Behandlung erhöht signifikant die<br />

Absorption der Ringerlösung mit einer Irrtumswahrscheinlichkeit


t-Test Test - Paartest<br />

∇ Voraussetzung:<br />

♦ näherungsweise Normalverteilung<br />

∇ Paartest<br />

♦ abhängige Stichproben<br />

♦ (gleiche Varianzen,<br />

gleicher Stichprobenumfang n)<br />

∇ Durchführung<br />

tˆ =<br />

∑<br />

∑<br />

♦ Berechnung der Differenzen<br />

♦ Test der durchschnittlichen Differenz:<br />

Vergleich mit 0<br />

n<br />

d<br />

∑<br />

2 ( d)<br />

d −<br />

n<br />

n(<br />

n −1)<br />

2<br />

d<br />

=<br />

s / n<br />

Vergleich des berechneten t-Wertes mit dem Tafelwert für <strong>ν</strong><br />

Freiheitsgrade und vorgegebenes α<br />

Ist der berechnete t-Wert ≥ Tafelwert, wird die H 0 ( die Differenz<br />

ist nicht von 0 verschieden) mit Irrtumswahrscheinlichkeit α<br />

abgelehnt.<br />

Ist der berechnete t-Wert < Tafelwert, wird die H 0 angenommen.<br />

Eine Irrtumswahrscheinlichkeit kann nicht angegeben werden!<br />

Konfidenzintervall einer Differenz<br />

d<br />

<strong>ν</strong> = n - 1<br />

∇ 99%-Vertrauensbereich für die wahre mittlere<br />

Differenz <strong>µ</strong> d<br />

t ∗ s / n<br />

99% CI DIFF<br />

5<br />

4<br />

3<br />

2<br />

1<br />

0<br />

-1<br />

N =<br />

Konfidenzintervall der Differenz im Paartest bei Mäusen<br />

25<br />

d ± 1−α;<br />

n−1<br />

d<br />

Ausreißertest bei Normalverteilung<br />

3,<br />

63<br />

2 , 04 ± 2,<br />

80*<br />

25<br />

∇ Ausreißertest bei Normalverteilung der Grundgesamtheit, n ≤ 25:<br />

Stichprobenwerte der Größe nach ordnen, Berechnung von<br />

M = |(verdächtiger Wert – Nachbarwert) / (Maximum – Minimum)| bei 3 ≤ n ≤ 7<br />

(Minimum, Maximum: inklusive ausreißerverdächtigem Wert!)<br />

Vergleich mit Tabelle, dort weitere Formeln für 8 ≤ n ≤ 25 (Sachs,<br />

Angew.Statistik)<br />

z.B.<br />

157, 326, 177, 176 157 176 177 326 M = |(326-177)/(326-157)| =0,882<br />

Tafelwert für α 5%, n=4: 0,765 (einseitiger Test), d.h. Wert 326 ist als Ausreißer<br />

ausgewiesen<br />

∇ bei Normalverteilung der Grundgesamtheit und n > 25:<br />

Berechnung von T 1 = | (x 1 – <strong>µ</strong>) / <strong>σ</strong> |<br />

(x 1 : ausreißerverdächtiger Wert, <strong>µ</strong>, <strong>σ</strong> durch arithm. MW bzw. s ersetzen, Vergleich<br />

mit Tabellenwert) (Sachs, Angew.Statistik)<br />

∇ Verwendung zur<br />

♦ routinemäßigen Datenkontrolle<br />

♦ rechtzeitigen Warnung bei Datengewinnung<br />

♦ Erfassung von evtl. bedeutungsvollen Beobachtungen (Entdeckung Penizillin!)<br />

∇ Ausreißer sind um so unwahrscheinlicher, je kleiner die Stichproben sind.<br />

Beispiel: Paartest bei Mäusen: (E.Weber)<br />

25 Würfe von je 1 männl. und 1 weibl. Tier untersucht (E.Weber, Grundriß der<br />

Statistik) - Gewicht nach 125 Tagen bestimmt, für jeden Wurf die Gewichtsdifferenz<br />

berechnet:<br />

Gew. männl Gew. weibl. Differenz D-Quadrat<br />

26,0 16,5 9,5 90,25<br />

20,0 17,0 3 9<br />

18,0 16,0 2 4<br />

28,5 21,0 7,5 56,25<br />

23,5 23,0 0,5 0,25<br />

20,0 19,5 0,5 0,25<br />

22,5 18,0 4,5 20,25<br />

24,0 18,5 5,5 30,25<br />

24,0 20,0 4 16<br />

25,0 28,0 -3 9<br />

22,0 27,5 -5,5 30,25<br />

24,0 20,5 3,5 12,25<br />

22,5 23,0 -0,5 0,25<br />

22,5 20,5 2 4<br />

23,5 19,5 4 16<br />

23,5 22,5 1 1<br />

25,0 20,0 5 25<br />

24,5 20,5 4 16<br />

23,5 18,0 5,5 30,25<br />

20,5 24,5 -4 16<br />

20,0 22,0 -2 4<br />

20,5 20,0 0,5 0,25<br />

25,0 20,0 5 25<br />

23,5 23,0 0,5 0,25<br />

22,0 24,0 -2 4<br />

Summen 51 420<br />

Anzahl 25<br />

Varianz 5,21 9,26 13,165<br />

Standardabw 3,628<br />

Mittelwerte 22,96 20,92 2,04<br />

t-Test (Excel) alpha 0,0108 0,0097<br />

Ausreißer<br />

d = 2,04 s2 d = 13,165 sd = 3,63<br />

alpha = 0,01 vorgegeben<br />

t = 2,04/(3,63 / Wurzel(25)) = 2,811<br />

FG = 24<br />

Tafelwert t24;0,01 = 2,80<br />

H0 wird abgelehnt:<br />

Aussage: Die Gewichtsdifferenz<br />

zwischen männl. und weibl. Mäusen<br />

eines Wurfes beträgt nach 125 Tagen<br />

2,04 g.<br />

Diese Differenz ist signifikant von 0<br />

verschieden mit Irrtumswahrscheinlichkeit<br />

α < 1 %<br />

∇ Ausreißer: Modell-Abweichungen aus Sicht des Beobachters<br />

Ursachen können sein : Ziffernvertauschungen (53 statt 35), Spaltenverschiebungen<br />

in Tabellen, Meßgeräte-Fehler, verschobene Kommata,<br />

Probenverwechslung, geschädigte Probanden, Rechenfehler ...<br />

Bei "zwingend sachlogischen Gründen" müssen diese Werte vor der<br />

weiteren Auswertung gestrichen werden.<br />

∇ allgemeine Regel: bei mindestens 10 Meßwerten (besser n≥25) gilt ein Wert<br />

dann als Ausreißer, wenn er außerhalb liegt x ± 4s<br />

∇ Der Bereich <strong>µ</strong> ± 4<strong>σ</strong><br />

(große Stichprobenumfänge!) umfasst bei<br />

Normalverteilung 99,99%<br />

symmetrisch-eingipfliger Verteilung 97 %<br />

beliebigen Verteilungen 94 %<br />

der Meßwerte.<br />

Zum Test werden Mittelwert und Standardabweichung ohne den<br />

ausreißerverdächtigen Wert berechnet.<br />

∇ Sind Ausreißer "identifiziert" und von der Stichprobe ausgeschlossen, muß<br />

mindestens ihre Zahl bei der Auswertung angegeben werden!<br />

Ausschnitt aus F-Tabelle: F Tabelle: αα = 5%<br />

<strong>ν</strong>1 = Zähler-Freiheitsgrade<br />

<strong>ν</strong>2 1 2 3 4 ... 8 ... 200 ... ∞<br />

1 161 200 216 225 237 254 254<br />

2 18,51 19,00 19,16 19,25 19,37 19,49 19,50<br />

3 10,13 9,55 9,28 9,12 8,84 8,54 8,53<br />

4 7,71 6,94 6,59 6,39 6,04 5,65<br />

...<br />

8 5,32 4,46 3,44<br />

...<br />

20 4,35 2,45 1,87<br />

...<br />

200 3,89 1,98 1,26<br />

...<br />

∞ 3,84 1,00<br />

Entsprechende Tabellen für α 1%; α 0,1 % ...

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!