Skript - Prof. Georg Hoever - FH Aachen
Skript - Prof. Georg Hoever - FH Aachen
Skript - Prof. Georg Hoever - FH Aachen
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
3. Statistik 56<br />
DamithatmaneinKonfidenzintervallzumNiveau1−αfürdietatsächlicheVarianz.<br />
2. Die χ 2 -Verteilung dient als Grundlager vieler Hypothesentests (χ 2 -Tests).<br />
Eine Anwendung ist beispielsweise der Test, ob eine beobachtete Verteilung einer<br />
hypothetischen Verteilung entspricht:<br />
Situation 1: Diskrete Verteilung<br />
Eine Zufallsvariable X kann N verschiedene Werte x 1 ,...,x N annehmen. Zu testen<br />
ist die Hypothese P(X = x k ) = p k zu vorgegebenen p k .<br />
Dazu werden n Realisierungen von X durchgeführt und die relativen Anteile r k des<br />
Auftretens von x k bestimmt.<br />
Die Testgröße<br />
T = n·<br />
N∑ (r k −p k ) 2<br />
k=1<br />
p k<br />
ist dann (unter der Hypothese) für große n annähernd χ 2 -verteilt mit N −1 Freiheitsgraden.<br />
Dies kann man sich wie folgt plausibilisieren:<br />
Den relativen Anteil R k kann man als Zufallsvariable entsprechend des Mittelwerts<br />
von n Bernoulliexperimenten mit Wert 1, falls x k auftritt, und Wert 0<br />
sonst, ansehen. Unter der Hypothese P(X = x k ) = p k ist das also ein Bernoulliexperiment<br />
mit Erfolgswahrscheinlichkeit p k und Varianz p k ·(1−p k ).<br />
Nach dem zentralen Grenzwertsatz ist dann<br />
X ∗ n,k = √ n·<br />
R k −p k<br />
√<br />
pk ·(1−p k )<br />
annähernd standardnormalverteilt. Die Summe der Quadrate ist dann<br />
N∑<br />
(Xn,k ∗ )2 =<br />
k=1<br />
N∑ (R k −p k ) 2<br />
n·<br />
p k ·(1−p k )<br />
k=1<br />
= n·<br />
N∑<br />
k=1<br />
(R k −p k ) 2 1<br />
· .<br />
p k 1−p k<br />
Sind die einzelnen p k klein, ist<br />
1<br />
1−p k<br />
≈ 1 vernachlässigbar. Da die Summe aller<br />
R k gleich 1 ist, sind die X n,k nicht unabhängig, wodurch sich die N −1 (statt<br />
N) Freiheitsgrade der χ 2 -Verteilung ergibt.<br />
Bei großen Abweichungen, also großem T, sind die Beobachtungen nicht mehr konsistent<br />
zur Hypothese, d.h. zu einem Signifikanzniveau 1 − α wird die Hypothese<br />
abgelehnt, wenn T größer als das 1 − α-Quantil χ 1−α;N−1 der χ 2 -Verteilung mit<br />
N −1 Freiheitsgraden ist.