σ µ ν µ
σ µ ν µ
σ µ ν µ
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
5. Statistische Testverfahren<br />
∇ Fehlermöglichkeiten bei statistischen<br />
Vergleichen<br />
∇ Prüfung von Varianzen: F-Test<br />
∇ Prüfung von Mittelwertdifferenzen<br />
♦parametrische Testverfahren:<br />
• z-Test, t-Test, Welch-Test<br />
• Ausreißertest<br />
♦nichtparametrische Testverfahren:<br />
• Mann & Whitney, Kolmogorov-Smirnov, Kruskal<br />
& Wallis, Wilcoxon, Dixon & Mood, Friedmann<br />
∇ Prüfung von Verteilungen:<br />
♦Chiquadrat-Test, Kolmogorov-Smirnov-Test<br />
♦graphische Verfahren<br />
z-Test Test für den Vergleich eines Mittelwertes mit dem<br />
Mittelwert <strong>µ</strong><strong>µ</strong> der Grundgesamtheit<br />
∇ Voraussetzung:<br />
♦ näherungsweise Normalverteilung<br />
♦ sehr großer Stichprobenumfang<br />
♦ Varianz <strong>σ</strong> 2 bekannt:<br />
x − <strong>µ</strong><br />
z = *<br />
<strong>σ</strong><br />
Vergleich des berechneten z-Wertes mit dem<br />
Tafelwert für die Standard-Normalverteilung<br />
und vorgegebenes α<br />
Ist der berechnete z-Wert ≥ Tafelwert, wird die<br />
H 0 (Gleichheit der Mittelwerte) mit Irrtumswahrscheinlichkeit<br />
α abgelehnt.<br />
Ist der berechnete z-Wert < Tafelwert, wird die<br />
H 0 angenommen. Eine Irrtumswahrscheinlichkeit<br />
kann nicht angegeben werden.<br />
t-Test Test für den Vergleich eines Mittelwertes mit dem<br />
Mittelwert <strong>µ</strong><strong>µ</strong> der Grundgesamtheit<br />
∇Voraussetzung:<br />
♦näherungsweise Normalverteilung<br />
♦Varianz <strong>σ</strong>2 bekannt oder unbekannt (Schätzung aus s2 ):<br />
x − <strong>µ</strong><br />
t = * n;<br />
<strong>ν</strong> = n −1<br />
s<br />
Vergleich des berechneten t-Wertes mit dem Tafelwert<br />
für <strong>ν</strong> (ny) Freiheitsgrade und vorgegebenes α<br />
Ist der berechnete t-Wert ≥ Tafelwert, wird die H0 (Gleichheit der Mittelwerte) mit Irrtumswahrscheinlichkeit<br />
α abgelehnt.<br />
Ist der berechnete t-Wert < Tafelwert, wird die H0 angenommen. Eine Irrtumswahrscheinlichkeit kann<br />
nicht angegeben werden!<br />
n<br />
Fehlermöglichkeiten bei statistischen Vergleichen<br />
Entscheidung des<br />
Tests<br />
H0 abgelehnt<br />
(HA angenommen)<br />
H0 angenommen<br />
(HA abgelehnt)<br />
H0 wahr<br />
(kein Unterschied)<br />
Fehler 1. Art,<br />
Irrtumswahrscheinlichkeit<br />
α<br />
richtige<br />
Entscheidung<br />
Flächen unter der Normalkurve<br />
1 - 2 ΦΦ(z) (z)<br />
Wirklichkeit<br />
0.1<br />
Irrtumswahrscheinlichkeit α nach der positiven<br />
0<br />
und negativen Seite α = 1 - 2 Φ(z) -3<br />
H0 falsch<br />
(Unterschied<br />
vorhanden)<br />
richtige<br />
Entscheidung<br />
Fehler 2. Art,<br />
Irrtumswahrscheinlichkeit<br />
β<br />
1 – β = Güte<br />
-1 1 3 5 7<br />
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09<br />
0,0 1,0000<br />
0,1<br />
...<br />
.92034<br />
1,0 .37310<br />
...<br />
α = 0,05<br />
1,9 .05743 .05118 .049996<br />
2,0 .04550<br />
...<br />
α = 0,01<br />
2,5<br />
...<br />
.01017 .00988<br />
3,0 .00270<br />
t-Test Test zum Vergleich 2er arithmetischer Mittelwerte<br />
einfacher t-Test<br />
∇ Voraussetzung:<br />
♦näherungsweise Normalverteilung<br />
♦unabhängige Stichproben<br />
♦gleiche Varianzen,<br />
gleicher Stichprobenumfang:<br />
(<strong>σ</strong> 1 2 =<strong>σ</strong>2 2 ; n1=n 2)<br />
0.4<br />
0.3<br />
0.2<br />
N(2,1)<br />
gleiche Varianzen<br />
Homoskedastizität<br />
x1<br />
− x2<br />
tˆ =<br />
2 2<br />
s1<br />
+ s2<br />
n1<br />
<strong>ν</strong> = 2 * n1<br />
− 2<br />
Vergleich des berechneten t-Wertes mit dem Tafelwert für<br />
<strong>ν</strong> Freiheitsgrade und vorgegebenes α<br />
Ist der berechnete t-Wert ≥ Tafelwert, wird die H 0<br />
(Gleichheit der Mittelwerte) mit Irrtumswahrscheinlichkeit<br />
α abgelehnt.<br />
Ist der berechnete t-Wert < Tafelwert, wird die H 0<br />
angenommen. Eine Irrtumswahrscheinlichkeit kann<br />
nicht angegeben werden!<br />
X<br />
z
Wahrscheinlichkeitsdichte<br />
0.4<br />
0.3<br />
0.2<br />
0.1<br />
0<br />
99<br />
Student's t-Verteilung 4<br />
1<br />
Freiheitsgrade<br />
-7 -4 -1 2 5 8<br />
t<br />
t-Test Test nach Welch<br />
∇ Voraussetzung:<br />
♦ näherungsweise Normalverteilung<br />
∇ t-Test nach Welch<br />
♦ unabhängige Stichproben<br />
♦ ungleiche Varianzen,<br />
♦ gleicher Stichprobenumfang:<br />
♦ (<strong>σ</strong> 2<br />
1 ≠<strong>σ</strong>2 2 ; n1 = n2 )<br />
ungleiche Varianzen<br />
Heteroskedastizität<br />
tˆ =<br />
t = ± 2,78<br />
P = 95 %<br />
α = 0,05<br />
zweiseitig<br />
4 FG<br />
x − x<br />
1<br />
1<br />
2<br />
2<br />
s1<br />
+ s<br />
n<br />
2<br />
2<br />
1 ( n − )( s + s )<br />
<strong>ν</strong> =<br />
2 2 2<br />
1 1 2<br />
2 2 2 2<br />
( s1<br />
) + ( s2)<br />
Vergleich des berechneten t-Wertes mit dem Tafelwert<br />
für <strong>ν</strong> Freiheitsgrade und vorgegebenes α<br />
Ist der berechnete t-Wert ≥ Tafelwert, wird die H 0 (Gleichheit<br />
der Mittelwerte) mit Irrtumswahrscheinlichkeit α abgelehnt.<br />
Ist der berechnete t-Wert < Tafelwert, wird die H 0<br />
angenommen. Eine Irrtumswahrscheinlichkeit kann nicht<br />
angegeben werden!<br />
Beispiel: Wirkung des antidiuretischen Hormons bei Stabheuschrecken: Malpighi-Gefäße<br />
von Stabheuschrecken Wirkung des herauspräpariert, antidiuretischen absorbierte Hormons Menge bei Flüssigkeit Stabheuschrecken<br />
einer Insekten-<br />
Ringerlösung in <strong>µ</strong>l gemessen bei Kontrollgruppe bzw. nach Hormonbehandlung der Gefäße:<br />
Kontrolle <strong>µ</strong>l Kontr. 2 Hormonbehandlung <strong>µ</strong>l<br />
12,0 144,00 57,9 3352,41<br />
23,3 542,89 52,0 2704,00<br />
11,7 136,89 46,2 2134,44<br />
22,7 515,29 45,2 2043,04<br />
29,1 846,81 54,2 2937,64<br />
Summe 98,8 2185,88 255,5 13171,53<br />
Mittelwert 19,76 51,10<br />
Varianz 58,40 28,87<br />
n1 = n2 5 F α 5%; 4; 4: 5<br />
F F-Wert = 58,4/28,87 = 2,023<br />
6,39<br />
alphaberechnet 0,511829<br />
(z.B.: Varianz Kontrolle = (2185,88 - 98,8 * 98,8 / 5) / 4 = 58,40)<br />
t berech. = (19,76 - 51,1) / wurzel((58,398+28,87)/5) = -7,50<br />
FG = 2*n 1 -2 = 8<br />
Die Varianzen unterscheiden<br />
sich nicht signifikant<br />
Tafelwert: t α=0,05;8 = 2,31<br />
x1<br />
− x2<br />
tˆ =<br />
2<br />
s1<br />
+ s<br />
n<br />
1<br />
<strong>ν</strong> = 2n 1 -2<br />
Aussage: H0 wird abgelehnt, die Behandlung erhöht signifikant die<br />
Absorption der Ringerlösung mit einer Irrtumswahrscheinlichkeit
t-Test Test - Paartest<br />
∇ Voraussetzung:<br />
♦ näherungsweise Normalverteilung<br />
∇ Paartest<br />
♦ abhängige Stichproben<br />
♦ (gleiche Varianzen,<br />
gleicher Stichprobenumfang n)<br />
∇ Durchführung<br />
tˆ =<br />
∑<br />
∑<br />
♦ Berechnung der Differenzen<br />
♦ Test der durchschnittlichen Differenz:<br />
Vergleich mit 0<br />
n<br />
d<br />
∑<br />
2 ( d)<br />
d −<br />
n<br />
n(<br />
n −1)<br />
2<br />
d<br />
=<br />
s / n<br />
Vergleich des berechneten t-Wertes mit dem Tafelwert für <strong>ν</strong><br />
Freiheitsgrade und vorgegebenes α<br />
Ist der berechnete t-Wert ≥ Tafelwert, wird die H 0 ( die Differenz<br />
ist nicht von 0 verschieden) mit Irrtumswahrscheinlichkeit α<br />
abgelehnt.<br />
Ist der berechnete t-Wert < Tafelwert, wird die H 0 angenommen.<br />
Eine Irrtumswahrscheinlichkeit kann nicht angegeben werden!<br />
Konfidenzintervall einer Differenz<br />
d<br />
<strong>ν</strong> = n - 1<br />
∇ 99%-Vertrauensbereich für die wahre mittlere<br />
Differenz <strong>µ</strong> d<br />
t ∗ s / n<br />
99% CI DIFF<br />
5<br />
4<br />
3<br />
2<br />
1<br />
0<br />
-1<br />
N =<br />
Konfidenzintervall der Differenz im Paartest bei Mäusen<br />
25<br />
d ± 1−α;<br />
n−1<br />
d<br />
Ausreißertest bei Normalverteilung<br />
3,<br />
63<br />
2 , 04 ± 2,<br />
80*<br />
25<br />
∇ Ausreißertest bei Normalverteilung der Grundgesamtheit, n ≤ 25:<br />
Stichprobenwerte der Größe nach ordnen, Berechnung von<br />
M = |(verdächtiger Wert – Nachbarwert) / (Maximum – Minimum)| bei 3 ≤ n ≤ 7<br />
(Minimum, Maximum: inklusive ausreißerverdächtigem Wert!)<br />
Vergleich mit Tabelle, dort weitere Formeln für 8 ≤ n ≤ 25 (Sachs,<br />
Angew.Statistik)<br />
z.B.<br />
157, 326, 177, 176 157 176 177 326 M = |(326-177)/(326-157)| =0,882<br />
Tafelwert für α 5%, n=4: 0,765 (einseitiger Test), d.h. Wert 326 ist als Ausreißer<br />
ausgewiesen<br />
∇ bei Normalverteilung der Grundgesamtheit und n > 25:<br />
Berechnung von T 1 = | (x 1 – <strong>µ</strong>) / <strong>σ</strong> |<br />
(x 1 : ausreißerverdächtiger Wert, <strong>µ</strong>, <strong>σ</strong> durch arithm. MW bzw. s ersetzen, Vergleich<br />
mit Tabellenwert) (Sachs, Angew.Statistik)<br />
∇ Verwendung zur<br />
♦ routinemäßigen Datenkontrolle<br />
♦ rechtzeitigen Warnung bei Datengewinnung<br />
♦ Erfassung von evtl. bedeutungsvollen Beobachtungen (Entdeckung Penizillin!)<br />
∇ Ausreißer sind um so unwahrscheinlicher, je kleiner die Stichproben sind.<br />
Beispiel: Paartest bei Mäusen: (E.Weber)<br />
25 Würfe von je 1 männl. und 1 weibl. Tier untersucht (E.Weber, Grundriß der<br />
Statistik) - Gewicht nach 125 Tagen bestimmt, für jeden Wurf die Gewichtsdifferenz<br />
berechnet:<br />
Gew. männl Gew. weibl. Differenz D-Quadrat<br />
26,0 16,5 9,5 90,25<br />
20,0 17,0 3 9<br />
18,0 16,0 2 4<br />
28,5 21,0 7,5 56,25<br />
23,5 23,0 0,5 0,25<br />
20,0 19,5 0,5 0,25<br />
22,5 18,0 4,5 20,25<br />
24,0 18,5 5,5 30,25<br />
24,0 20,0 4 16<br />
25,0 28,0 -3 9<br />
22,0 27,5 -5,5 30,25<br />
24,0 20,5 3,5 12,25<br />
22,5 23,0 -0,5 0,25<br />
22,5 20,5 2 4<br />
23,5 19,5 4 16<br />
23,5 22,5 1 1<br />
25,0 20,0 5 25<br />
24,5 20,5 4 16<br />
23,5 18,0 5,5 30,25<br />
20,5 24,5 -4 16<br />
20,0 22,0 -2 4<br />
20,5 20,0 0,5 0,25<br />
25,0 20,0 5 25<br />
23,5 23,0 0,5 0,25<br />
22,0 24,0 -2 4<br />
Summen 51 420<br />
Anzahl 25<br />
Varianz 5,21 9,26 13,165<br />
Standardabw 3,628<br />
Mittelwerte 22,96 20,92 2,04<br />
t-Test (Excel) alpha 0,0108 0,0097<br />
Ausreißer<br />
d = 2,04 s2 d = 13,165 sd = 3,63<br />
alpha = 0,01 vorgegeben<br />
t = 2,04/(3,63 / Wurzel(25)) = 2,811<br />
FG = 24<br />
Tafelwert t24;0,01 = 2,80<br />
H0 wird abgelehnt:<br />
Aussage: Die Gewichtsdifferenz<br />
zwischen männl. und weibl. Mäusen<br />
eines Wurfes beträgt nach 125 Tagen<br />
2,04 g.<br />
Diese Differenz ist signifikant von 0<br />
verschieden mit Irrtumswahrscheinlichkeit<br />
α < 1 %<br />
∇ Ausreißer: Modell-Abweichungen aus Sicht des Beobachters<br />
Ursachen können sein : Ziffernvertauschungen (53 statt 35), Spaltenverschiebungen<br />
in Tabellen, Meßgeräte-Fehler, verschobene Kommata,<br />
Probenverwechslung, geschädigte Probanden, Rechenfehler ...<br />
Bei "zwingend sachlogischen Gründen" müssen diese Werte vor der<br />
weiteren Auswertung gestrichen werden.<br />
∇ allgemeine Regel: bei mindestens 10 Meßwerten (besser n≥25) gilt ein Wert<br />
dann als Ausreißer, wenn er außerhalb liegt x ± 4s<br />
∇ Der Bereich <strong>µ</strong> ± 4<strong>σ</strong><br />
(große Stichprobenumfänge!) umfasst bei<br />
Normalverteilung 99,99%<br />
symmetrisch-eingipfliger Verteilung 97 %<br />
beliebigen Verteilungen 94 %<br />
der Meßwerte.<br />
Zum Test werden Mittelwert und Standardabweichung ohne den<br />
ausreißerverdächtigen Wert berechnet.<br />
∇ Sind Ausreißer "identifiziert" und von der Stichprobe ausgeschlossen, muß<br />
mindestens ihre Zahl bei der Auswertung angegeben werden!<br />
Ausschnitt aus F-Tabelle: F Tabelle: αα = 5%<br />
<strong>ν</strong>1 = Zähler-Freiheitsgrade<br />
<strong>ν</strong>2 1 2 3 4 ... 8 ... 200 ... ∞<br />
1 161 200 216 225 237 254 254<br />
2 18,51 19,00 19,16 19,25 19,37 19,49 19,50<br />
3 10,13 9,55 9,28 9,12 8,84 8,54 8,53<br />
4 7,71 6,94 6,59 6,39 6,04 5,65<br />
...<br />
8 5,32 4,46 3,44<br />
...<br />
20 4,35 2,45 1,87<br />
...<br />
200 3,89 1,98 1,26<br />
...<br />
∞ 3,84 1,00<br />
Entsprechende Tabellen für α 1%; α 0,1 % ...