20.11.2014 Aufrufe

Skript - Prof. Georg Hoever - FH Aachen

Skript - Prof. Georg Hoever - FH Aachen

Skript - Prof. Georg Hoever - FH Aachen

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

3. Statistik 56<br />

DamithatmaneinKonfidenzintervallzumNiveau1−αfürdietatsächlicheVarianz.<br />

2. Die χ 2 -Verteilung dient als Grundlager vieler Hypothesentests (χ 2 -Tests).<br />

Eine Anwendung ist beispielsweise der Test, ob eine beobachtete Verteilung einer<br />

hypothetischen Verteilung entspricht:<br />

Situation 1: Diskrete Verteilung<br />

Eine Zufallsvariable X kann N verschiedene Werte x 1 ,...,x N annehmen. Zu testen<br />

ist die Hypothese P(X = x k ) = p k zu vorgegebenen p k .<br />

Dazu werden n Realisierungen von X durchgeführt und die relativen Anteile r k des<br />

Auftretens von x k bestimmt.<br />

Die Testgröße<br />

T = n·<br />

N∑ (r k −p k ) 2<br />

k=1<br />

p k<br />

ist dann (unter der Hypothese) für große n annähernd χ 2 -verteilt mit N −1 Freiheitsgraden.<br />

Dies kann man sich wie folgt plausibilisieren:<br />

Den relativen Anteil R k kann man als Zufallsvariable entsprechend des Mittelwerts<br />

von n Bernoulliexperimenten mit Wert 1, falls x k auftritt, und Wert 0<br />

sonst, ansehen. Unter der Hypothese P(X = x k ) = p k ist das also ein Bernoulliexperiment<br />

mit Erfolgswahrscheinlichkeit p k und Varianz p k ·(1−p k ).<br />

Nach dem zentralen Grenzwertsatz ist dann<br />

X ∗ n,k = √ n·<br />

R k −p k<br />

√<br />

pk ·(1−p k )<br />

annähernd standardnormalverteilt. Die Summe der Quadrate ist dann<br />

N∑<br />

(Xn,k ∗ )2 =<br />

k=1<br />

N∑ (R k −p k ) 2<br />

n·<br />

p k ·(1−p k )<br />

k=1<br />

= n·<br />

N∑<br />

k=1<br />

(R k −p k ) 2 1<br />

· .<br />

p k 1−p k<br />

Sind die einzelnen p k klein, ist<br />

1<br />

1−p k<br />

≈ 1 vernachlässigbar. Da die Summe aller<br />

R k gleich 1 ist, sind die X n,k nicht unabhängig, wodurch sich die N −1 (statt<br />

N) Freiheitsgrade der χ 2 -Verteilung ergibt.<br />

Bei großen Abweichungen, also großem T, sind die Beobachtungen nicht mehr konsistent<br />

zur Hypothese, d.h. zu einem Signifikanzniveau 1 − α wird die Hypothese<br />

abgelehnt, wenn T größer als das 1 − α-Quantil χ 1−α;N−1 der χ 2 -Verteilung mit<br />

N −1 Freiheitsgraden ist.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!