11. STATISTIK - Mathe Online
11. STATISTIK - Mathe Online
11. STATISTIK - Mathe Online
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Statistik<br />
Am kompliziertesten ist die Untersuchung des Zusammenhangs von nominal skalierten Daten. Dazu werden<br />
die Daten in eine Tafel eingetragen.<br />
x 1 x 2 x 3 ... x k insgesamt<br />
y 1 H 1,1 H 1,2 H 1,3 ... H 1,k<br />
H1,<br />
j<br />
y 2 H 2,1 H 2,2 H 2,3 ... H 2,k<br />
H2,<br />
j<br />
M M M M M M M<br />
y m H m,1 H m,2 H m,3 ... H m,k<br />
H mj ,<br />
k<br />
∑<br />
j = 1<br />
k<br />
∑<br />
j = 1<br />
k<br />
∑<br />
j = 1<br />
insgesamt<br />
m<br />
H i ,1<br />
i = 1<br />
m<br />
∑ ∑ H i ,2 ∑ H i ,3 ... ∑H ik ,<br />
i = 1<br />
m<br />
i = 1<br />
m<br />
ij ,<br />
⎜<br />
i = 1 i = 1 j = 1<br />
m<br />
⎛ ⎝<br />
k<br />
⎜<br />
∑ ∑<br />
⎞<br />
H ⎟<br />
⎟<br />
⎠<br />
Die Werte H i,j sind die beobachteten Anteile für die Variablenwerte y i und x j . Bei Unabhängigkeit der beiden<br />
Merkmale kann man die Anteile, die zu erwarten wären, berechnen, denn die Häufigkeitsverteilung<br />
hinsichtlich der Merkmalsausprägung x j müßte für alle y i gleich sein. Diese „erwarteten Anteile“ E r,s für die r-<br />
te Zeile und s-te Spalte berechnen sich folgendermaßen:<br />
E<br />
rs ,<br />
m<br />
∑<br />
His<br />
,<br />
k<br />
i = 1<br />
( s − te Spaltensumme) = ⋅ Hrj<br />
, = ⋅ ( r −te Zeilensumme )<br />
n ∑<br />
n<br />
j = 1<br />
Das Maß für die Stärke des Zusammenhangs zwischen den Merkmalen x und y ist der sogenannte<br />
Kontingenzkoeffizient C.<br />
Kontingenzkoeffizient C:<br />
C =<br />
χ<br />
2<br />
n + χ<br />
m k<br />
( )<br />
mit −<br />
=<br />
2 ∑∑<br />
H E ij , ij ,<br />
χ 2 2<br />
i=<br />
1 j = 1<br />
E<br />
ij ,<br />
(χ ... Chi)<br />
C kann Werte zwischen 0 und 1 annehmen. Der maximal mögliche Wert von C hängt jeweils von der Zeilen-<br />
und Spaltenzahl ab. Für quadratische Tafeln m=k gilt C<br />
max =<br />
m − 1 k − 1 = , für rechteckige Tafeln m ≠ k<br />
m k<br />
m k<br />
gilt Cmax ≈ 1<br />
⋅ ⎛ − 1 − 1 ⎞<br />
⎜ +<br />
2 ⎝ m k ⎟ . Das Verfahren ist in der Regel nur anwendbar, wenn kein erwarteter Anteil<br />
⎠<br />
kleiner 1 ist und höchstens ein Fünftel der erwarteten Anteile kleiner 5 ist.<br />
- 168 -