χ2 -Test (Chi-Quadrat-Test)
χ2 -Test (Chi-Quadrat-Test)
χ2 -Test (Chi-Quadrat-Test)
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Biometrie Seminar<br />
χ 2 -<strong>Test</strong> (<strong>Chi</strong>-<strong>Quadrat</strong>-<strong>Test</strong>)<br />
METHOD:<br />
Tünde Kupi, András Kengyel<br />
Institut für Biophysik<br />
Method der statistischen Analysen<br />
• Messdaten (gepaart oder unabhängig)<br />
• Aufstellung der Nullhypothese (H 0 )<br />
• Auswahl der <strong>Test</strong>statistik<br />
Alternative Hypothese (H 1 )<br />
• Signifikanzniveu behaupten (p=0,01)<br />
• <strong>Test</strong>statistik auswerten<br />
• Ergebnisse vergleichen (mit Literatur, Tabellebwert,<br />
Normalverteilung...usw.)<br />
• Ergebnis signifikant oder nicht?<br />
• Nullhypothese erfüllt<br />
– ja: Nullhypotese ist angenommen<br />
– nein: alternative Hypothese ist richtig<br />
Anwendungen:<br />
<strong>χ2</strong> -<strong>Test</strong> (<strong>Chi</strong>-<strong>Quadrat</strong>-<strong>Test</strong>)<br />
1. Verteilungstest oder Anpassungstest: Hier<br />
wird geprüft, ob die vorliegende Daten einer<br />
bestimmten Verteilung entstammen.<br />
2. Homogenitätstest: Hier wird geprüft, ob zwei<br />
Stichproben aus derselben Grundgesamheit<br />
stammen können.<br />
3. Unabhängigkeitstest: Hier wird geprüft, ob<br />
zwei Merkmale stochastisch unabhängig sind.<br />
• <strong>Test</strong>statistik (Prüfgröße)<br />
• H 0: Nullhypothese<br />
• H 1: Alternativ Hypothese<br />
• Signifikanzniveau<br />
• Einseitige- zweiseitige Fragestellung<br />
• Fehler erster Art (α-Fehler)<br />
• Fehler zweiter Art (β-Fehler)<br />
• Freiheitsgrad ( degrees of freedom ):<br />
parametrische<br />
• Verbundene<br />
t – Probe<br />
(paarige) (Der<br />
Grösse der<br />
Veränderung<br />
ist auch<br />
gegeben.)<br />
Anzahl der Parameter, womit wir das<br />
System eindeutig behaupten können<br />
df = f = n – p<br />
Wichtige Begriffe<br />
Daten: 5; 9; 12; 4; 8; 15 µ=8,83<br />
Zusammgehörigen Stichproben<br />
(selbstkontrolle oder paarige)<br />
nichtparametrische<br />
• Vorzeichentest<br />
• Wilcoxon-<strong>Test</strong><br />
(anstatt der t-test,<br />
beim nicht<br />
Normalverteilung)<br />
p (Wahrscheinlichkeit)<br />
0,08<br />
0,06<br />
0,04<br />
p=0,03<br />
<strong>Test</strong>verfahren<br />
0,02<br />
H 0<br />
F 2.<br />
H 1<br />
F 1.<br />
0,00<br />
50 100 150 200 250 300 350 400 450 500 550 600 650 700<br />
Unabhängige Stichproben<br />
(2 Population)<br />
stetig kategorial kategorial<br />
stetig<br />
McNemar<br />
test<br />
<strong>Chi</strong>-test<br />
<strong>χ2</strong> -<strong>Test</strong> (<strong>Chi</strong>-<strong>Quadrat</strong>-<strong>Test</strong>)<br />
parametrische<br />
• u-<strong>Test</strong> (z-test)<br />
• Unverbundene<br />
t-Probe<br />
(niedrige Stichprobenumfang)<br />
X Parameter<br />
nichtparametrische<br />
• Mann-<br />
Whitney-<br />
Probe<br />
• Wilcoxon 2-<br />
Proben<br />
Die Form der dargestellten <strong>Test</strong>statistik folgt die <strong>Chi</strong>-<strong>Quadrat</strong><br />
Verteilung. Der Verlauf der Kurve hängt von dem<br />
Freiheitsgrad ab.<br />
Die <strong>Chi</strong>-<strong>Quadrat</strong> Verteilung:<br />
1
Beispiel # 1<br />
Verteilungstest<br />
Vergleichung einer empirischen Verteilung mit einer Gleichverteilung:<br />
• Mit einem Würfel werden 60 Würfe durchgeführt.<br />
Ist der Würfel gefälscht oder gut?<br />
Augenzahl (n)<br />
Beobachtete Häufigkeit (B)<br />
Erwartete Häufigkeit (E)<br />
• H 0: der Würfel ist gut.<br />
• H A: der Würfel ist gefälscht.<br />
A (Opel Corsa)<br />
B (Honda Accord)<br />
C (Audi Q7)<br />
Spaltensumme<br />
(Anzahl der<br />
Stichproben)<br />
1<br />
7<br />
10<br />
<strong>Test</strong>statistik:<br />
120.000 €<br />
3<br />
15<br />
12<br />
30<br />
Zeilensum .<br />
ErwH . = × Spaltensum .<br />
Gesamtsum .<br />
Unabhängigkeitstest<br />
Männer oder Frauen sind haufiger Brillenträger?<br />
Beobachtete H<br />
Mann<br />
Frau<br />
Summe<br />
• H 0: Brilleträgung ist unabhängig von dem Geschlecht.<br />
• H A: Es gibt ein Zusammenhang zwischen dem Geschlecht<br />
und dem Brilleträgung.<br />
<strong>Test</strong>statistik:<br />
Brille<br />
a=50<br />
c=30<br />
2<br />
χ<br />
=<br />
keine Brille<br />
∑<br />
i =<br />
b=50<br />
d=70<br />
n<br />
1<br />
Summe<br />
( B − E )<br />
E<br />
2<br />
2<br />
Zeilensumme<br />
(Häufigkeitsverteilung<br />
von X)<br />
45 (~30%)<br />
70 (~60%)<br />
15 (~10%)<br />
130<br />
Augenzahl (n)<br />
Beobachtete Häufigkeit (B)<br />
Erwartete Häufigkeit (E)<br />
i = 1<br />
• Freiheitsgrad: f = n-1 = 6-1 = 5<br />
• Signifikanzniveau: p = 0,05<br />
• Kritischer χ 2 –Wert (aus der Tabelle):<br />
• 14,8 > 11,07<br />
H 0 ablehnen !<br />
Verteilungstest<br />
1<br />
7<br />
10<br />
2 2<br />
n<br />
2<br />
2 ( B − E ) ( − 3) ( − 1)<br />
χ = ∑<br />
= + ... + = 1 4, 8<br />
E 10 1 0<br />
Beobachtete Häufigkeit<br />
24<br />
25<br />
1<br />
50<br />
i=<br />
1<br />
χ 2 = 11,07<br />
n<br />
2<br />
2 2<br />
2 ( B − E)<br />
(24 −17) (12 − 3)<br />
χ = ∑ = + ... + = 18, 2<br />
E 17 3<br />
f = (n Sp-1)(n Ze-1) = (3-1)(3-1) = 4<br />
2<br />
χ n=<br />
=<br />
18<br />
30<br />
2<br />
50<br />
( 1) 13, 28<br />
3<br />
15<br />
12<br />
30<br />
45<br />
70<br />
15<br />
130<br />
• Beobachtete Häufigkeiten (B):<br />
Beobachtete H<br />
Mann<br />
Frau<br />
Sum<br />
Erwartete H<br />
Mann<br />
Frau<br />
Sum<br />
2<br />
16<br />
10<br />
3<br />
8<br />
10<br />
Unabhängigkeitstest<br />
Brille<br />
40<br />
40<br />
80<br />
4<br />
17<br />
10<br />
Erwartete Häufigkeit<br />
17<br />
27<br />
6<br />
50<br />
<strong>Chi</strong>-<strong>Quadrat</strong> Tabelle<br />
Brille<br />
a=50<br />
c=30<br />
a+c=80<br />
• Erwartete Häufigkeiten (E):<br />
i=<br />
1<br />
Unabhängigkeitstest<br />
keine Brille<br />
b=50<br />
d=70<br />
b+d=120<br />
keine Brille<br />
60<br />
60<br />
120<br />
17<br />
27<br />
6<br />
50<br />
Summe<br />
a+b=100<br />
c+d=100<br />
n=200<br />
Sum<br />
100<br />
100<br />
n=200<br />
5<br />
3<br />
10<br />
6<br />
9<br />
10<br />
<strong>Chi</strong>-<strong>Quadrat</strong> Tabelle<br />
n<br />
2<br />
2 2<br />
2 ( B − E)<br />
(50 − 40) (70 − 60)<br />
χ = ∑ = + ... + = 8,33<br />
E 40 60<br />
f = (n Sp-1)(n Ze-1) = (2-1)(2-1) = 1<br />
11<br />
16<br />
3<br />
30<br />
45<br />
70<br />
15<br />
130<br />
Tabelle<br />
Zeilensum .<br />
ErwH . = ×<br />
Spaltensum .<br />
Gesamtsum .<br />
2<br />
χ ( n=<br />
1) = 3,84 Tabelle<br />
2
Beispiel # 3<br />
Sind die Verletzungsarten unabhängig von der Fahrzeug?<br />
Verkehrsverletzungen im Baranya, in 2008<br />
Kopfverletzung<br />
Brustverletzung<br />
Virblsäureverletzung<br />
Gesamt<br />
• Was ist H 0 und H 1 ?<br />
Fahrrad<br />
40<br />
15<br />
25<br />
• Was sind die erwartete Werten?<br />
• Wieviel ist die Freiheitsgrad?<br />
• Rechnen Sie X 2 -Wert aus!<br />
Unabhängigkeitstest Unabhängigkeitstest<br />
Motorrad<br />
25<br />
20<br />
25<br />
PKW<br />
90<br />
210<br />
130<br />
Gesamt<br />
Beobachtete Häufigkeit:<br />
Kopfsverletzung<br />
Brustverletzung<br />
Virblsäureverletzung<br />
Gesamt<br />
i=<br />
1<br />
Fahrrad<br />
40<br />
15<br />
25<br />
80<br />
Motorrad<br />
25<br />
20<br />
25<br />
70<br />
Zeilensum .<br />
ErwH . = × Spaltensum .<br />
Gesamtsum .<br />
Erwartete Häufigkeit:<br />
Kopfsverletzung<br />
Brustverletzung<br />
Virblsäureverletzung<br />
Gesamt<br />
Fahrrad<br />
21<br />
34<br />
25<br />
80<br />
Motorrad<br />
19<br />
30<br />
21<br />
70<br />
PKW<br />
90<br />
210<br />
130<br />
430<br />
PKW<br />
Gesamt<br />
n<br />
2<br />
2 2<br />
2 ( B − E)<br />
(40 − 21) (130 −134)<br />
χ = ∑ = + ... + = 43,99<br />
E 21 134<br />
115<br />
181<br />
134<br />
430<br />
155<br />
245<br />
180<br />
580<br />
Gesamt<br />
155<br />
245<br />
180<br />
580<br />
f = 4<br />
p = 0,01<br />
Aus der Tabelle:<br />
2<br />
χ ( n=<br />
1) = 13,277<br />
H 0 wurde verworfen!<br />
3