10.01.2013 Aufrufe

χ2 -Test (Chi-Quadrat-Test)

χ2 -Test (Chi-Quadrat-Test)

χ2 -Test (Chi-Quadrat-Test)

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Biometrie Seminar<br />

χ 2 -<strong>Test</strong> (<strong>Chi</strong>-<strong>Quadrat</strong>-<strong>Test</strong>)<br />

METHOD:<br />

Tünde Kupi, András Kengyel<br />

Institut für Biophysik<br />

Method der statistischen Analysen<br />

• Messdaten (gepaart oder unabhängig)<br />

• Aufstellung der Nullhypothese (H 0 )<br />

• Auswahl der <strong>Test</strong>statistik<br />

Alternative Hypothese (H 1 )<br />

• Signifikanzniveu behaupten (p=0,01)<br />

• <strong>Test</strong>statistik auswerten<br />

• Ergebnisse vergleichen (mit Literatur, Tabellebwert,<br />

Normalverteilung...usw.)<br />

• Ergebnis signifikant oder nicht?<br />

• Nullhypothese erfüllt<br />

– ja: Nullhypotese ist angenommen<br />

– nein: alternative Hypothese ist richtig<br />

Anwendungen:<br />

<strong>χ2</strong> -<strong>Test</strong> (<strong>Chi</strong>-<strong>Quadrat</strong>-<strong>Test</strong>)<br />

1. Verteilungstest oder Anpassungstest: Hier<br />

wird geprüft, ob die vorliegende Daten einer<br />

bestimmten Verteilung entstammen.<br />

2. Homogenitätstest: Hier wird geprüft, ob zwei<br />

Stichproben aus derselben Grundgesamheit<br />

stammen können.<br />

3. Unabhängigkeitstest: Hier wird geprüft, ob<br />

zwei Merkmale stochastisch unabhängig sind.<br />

• <strong>Test</strong>statistik (Prüfgröße)<br />

• H 0: Nullhypothese<br />

• H 1: Alternativ Hypothese<br />

• Signifikanzniveau<br />

• Einseitige- zweiseitige Fragestellung<br />

• Fehler erster Art (α-Fehler)<br />

• Fehler zweiter Art (β-Fehler)<br />

• Freiheitsgrad ( degrees of freedom ):<br />

parametrische<br />

• Verbundene<br />

t – Probe<br />

(paarige) (Der<br />

Grösse der<br />

Veränderung<br />

ist auch<br />

gegeben.)<br />

Anzahl der Parameter, womit wir das<br />

System eindeutig behaupten können<br />

df = f = n – p<br />

Wichtige Begriffe<br />

Daten: 5; 9; 12; 4; 8; 15 µ=8,83<br />

Zusammgehörigen Stichproben<br />

(selbstkontrolle oder paarige)<br />

nichtparametrische<br />

• Vorzeichentest<br />

• Wilcoxon-<strong>Test</strong><br />

(anstatt der t-test,<br />

beim nicht<br />

Normalverteilung)<br />

p (Wahrscheinlichkeit)<br />

0,08<br />

0,06<br />

0,04<br />

p=0,03<br />

<strong>Test</strong>verfahren<br />

0,02<br />

H 0<br />

F 2.<br />

H 1<br />

F 1.<br />

0,00<br />

50 100 150 200 250 300 350 400 450 500 550 600 650 700<br />

Unabhängige Stichproben<br />

(2 Population)<br />

stetig kategorial kategorial<br />

stetig<br />

McNemar<br />

test<br />

<strong>Chi</strong>-test<br />

<strong>χ2</strong> -<strong>Test</strong> (<strong>Chi</strong>-<strong>Quadrat</strong>-<strong>Test</strong>)<br />

parametrische<br />

• u-<strong>Test</strong> (z-test)<br />

• Unverbundene<br />

t-Probe<br />

(niedrige Stichprobenumfang)<br />

X Parameter<br />

nichtparametrische<br />

• Mann-<br />

Whitney-<br />

Probe<br />

• Wilcoxon 2-<br />

Proben<br />

Die Form der dargestellten <strong>Test</strong>statistik folgt die <strong>Chi</strong>-<strong>Quadrat</strong><br />

Verteilung. Der Verlauf der Kurve hängt von dem<br />

Freiheitsgrad ab.<br />

Die <strong>Chi</strong>-<strong>Quadrat</strong> Verteilung:<br />

1


Beispiel # 1<br />

Verteilungstest<br />

Vergleichung einer empirischen Verteilung mit einer Gleichverteilung:<br />

• Mit einem Würfel werden 60 Würfe durchgeführt.<br />

Ist der Würfel gefälscht oder gut?<br />

Augenzahl (n)<br />

Beobachtete Häufigkeit (B)<br />

Erwartete Häufigkeit (E)<br />

• H 0: der Würfel ist gut.<br />

• H A: der Würfel ist gefälscht.<br />

A (Opel Corsa)<br />

B (Honda Accord)<br />

C (Audi Q7)<br />

Spaltensumme<br />

(Anzahl der<br />

Stichproben)<br />

1<br />

7<br />

10<br />

<strong>Test</strong>statistik:<br />

120.000 €<br />

3<br />

15<br />

12<br />

30<br />

Zeilensum .<br />

ErwH . = × Spaltensum .<br />

Gesamtsum .<br />

Unabhängigkeitstest<br />

Männer oder Frauen sind haufiger Brillenträger?<br />

Beobachtete H<br />

Mann<br />

Frau<br />

Summe<br />

• H 0: Brilleträgung ist unabhängig von dem Geschlecht.<br />

• H A: Es gibt ein Zusammenhang zwischen dem Geschlecht<br />

und dem Brilleträgung.<br />

<strong>Test</strong>statistik:<br />

Brille<br />

a=50<br />

c=30<br />

2<br />

χ<br />

=<br />

keine Brille<br />

∑<br />

i =<br />

b=50<br />

d=70<br />

n<br />

1<br />

Summe<br />

( B − E )<br />

E<br />

2<br />

2<br />

Zeilensumme<br />

(Häufigkeitsverteilung<br />

von X)<br />

45 (~30%)<br />

70 (~60%)<br />

15 (~10%)<br />

130<br />

Augenzahl (n)<br />

Beobachtete Häufigkeit (B)<br />

Erwartete Häufigkeit (E)<br />

i = 1<br />

• Freiheitsgrad: f = n-1 = 6-1 = 5<br />

• Signifikanzniveau: p = 0,05<br />

• Kritischer χ 2 –Wert (aus der Tabelle):<br />

• 14,8 > 11,07<br />

H 0 ablehnen !<br />

Verteilungstest<br />

1<br />

7<br />

10<br />

2 2<br />

n<br />

2<br />

2 ( B − E ) ( − 3) ( − 1)<br />

χ = ∑<br />

= + ... + = 1 4, 8<br />

E 10 1 0<br />

Beobachtete Häufigkeit<br />

24<br />

25<br />

1<br />

50<br />

i=<br />

1<br />

χ 2 = 11,07<br />

n<br />

2<br />

2 2<br />

2 ( B − E)<br />

(24 −17) (12 − 3)<br />

χ = ∑ = + ... + = 18, 2<br />

E 17 3<br />

f = (n Sp-1)(n Ze-1) = (3-1)(3-1) = 4<br />

2<br />

χ n=<br />

=<br />

18<br />

30<br />

2<br />

50<br />

( 1) 13, 28<br />

3<br />

15<br />

12<br />

30<br />

45<br />

70<br />

15<br />

130<br />

• Beobachtete Häufigkeiten (B):<br />

Beobachtete H<br />

Mann<br />

Frau<br />

Sum<br />

Erwartete H<br />

Mann<br />

Frau<br />

Sum<br />

2<br />

16<br />

10<br />

3<br />

8<br />

10<br />

Unabhängigkeitstest<br />

Brille<br />

40<br />

40<br />

80<br />

4<br />

17<br />

10<br />

Erwartete Häufigkeit<br />

17<br />

27<br />

6<br />

50<br />

<strong>Chi</strong>-<strong>Quadrat</strong> Tabelle<br />

Brille<br />

a=50<br />

c=30<br />

a+c=80<br />

• Erwartete Häufigkeiten (E):<br />

i=<br />

1<br />

Unabhängigkeitstest<br />

keine Brille<br />

b=50<br />

d=70<br />

b+d=120<br />

keine Brille<br />

60<br />

60<br />

120<br />

17<br />

27<br />

6<br />

50<br />

Summe<br />

a+b=100<br />

c+d=100<br />

n=200<br />

Sum<br />

100<br />

100<br />

n=200<br />

5<br />

3<br />

10<br />

6<br />

9<br />

10<br />

<strong>Chi</strong>-<strong>Quadrat</strong> Tabelle<br />

n<br />

2<br />

2 2<br />

2 ( B − E)<br />

(50 − 40) (70 − 60)<br />

χ = ∑ = + ... + = 8,33<br />

E 40 60<br />

f = (n Sp-1)(n Ze-1) = (2-1)(2-1) = 1<br />

11<br />

16<br />

3<br />

30<br />

45<br />

70<br />

15<br />

130<br />

Tabelle<br />

Zeilensum .<br />

ErwH . = ×<br />

Spaltensum .<br />

Gesamtsum .<br />

2<br />

χ ( n=<br />

1) = 3,84 Tabelle<br />

2


Beispiel # 3<br />

Sind die Verletzungsarten unabhängig von der Fahrzeug?<br />

Verkehrsverletzungen im Baranya, in 2008<br />

Kopfverletzung<br />

Brustverletzung<br />

Virblsäureverletzung<br />

Gesamt<br />

• Was ist H 0 und H 1 ?<br />

Fahrrad<br />

40<br />

15<br />

25<br />

• Was sind die erwartete Werten?<br />

• Wieviel ist die Freiheitsgrad?<br />

• Rechnen Sie X 2 -Wert aus!<br />

Unabhängigkeitstest Unabhängigkeitstest<br />

Motorrad<br />

25<br />

20<br />

25<br />

PKW<br />

90<br />

210<br />

130<br />

Gesamt<br />

Beobachtete Häufigkeit:<br />

Kopfsverletzung<br />

Brustverletzung<br />

Virblsäureverletzung<br />

Gesamt<br />

i=<br />

1<br />

Fahrrad<br />

40<br />

15<br />

25<br />

80<br />

Motorrad<br />

25<br />

20<br />

25<br />

70<br />

Zeilensum .<br />

ErwH . = × Spaltensum .<br />

Gesamtsum .<br />

Erwartete Häufigkeit:<br />

Kopfsverletzung<br />

Brustverletzung<br />

Virblsäureverletzung<br />

Gesamt<br />

Fahrrad<br />

21<br />

34<br />

25<br />

80<br />

Motorrad<br />

19<br />

30<br />

21<br />

70<br />

PKW<br />

90<br />

210<br />

130<br />

430<br />

PKW<br />

Gesamt<br />

n<br />

2<br />

2 2<br />

2 ( B − E)<br />

(40 − 21) (130 −134)<br />

χ = ∑ = + ... + = 43,99<br />

E 21 134<br />

115<br />

181<br />

134<br />

430<br />

155<br />

245<br />

180<br />

580<br />

Gesamt<br />

155<br />

245<br />

180<br />

580<br />

f = 4<br />

p = 0,01<br />

Aus der Tabelle:<br />

2<br />

χ ( n=<br />

1) = 13,277<br />

H 0 wurde verworfen!<br />

3

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!