02.11.2013 Aufrufe

11. STATISTIK - Mathe Online

11. STATISTIK - Mathe Online

11. STATISTIK - Mathe Online

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Statistik<br />

Am kompliziertesten ist die Untersuchung des Zusammenhangs von nominal skalierten Daten. Dazu werden<br />

die Daten in eine Tafel eingetragen.<br />

x 1 x 2 x 3 ... x k insgesamt<br />

y 1 H 1,1 H 1,2 H 1,3 ... H 1,k<br />

H1,<br />

j<br />

y 2 H 2,1 H 2,2 H 2,3 ... H 2,k<br />

H2,<br />

j<br />

M M M M M M M<br />

y m H m,1 H m,2 H m,3 ... H m,k<br />

H mj ,<br />

k<br />

∑<br />

j = 1<br />

k<br />

∑<br />

j = 1<br />

k<br />

∑<br />

j = 1<br />

insgesamt<br />

m<br />

H i ,1<br />

i = 1<br />

m<br />

∑ ∑ H i ,2 ∑ H i ,3 ... ∑H ik ,<br />

i = 1<br />

m<br />

i = 1<br />

m<br />

ij ,<br />

⎜<br />

i = 1 i = 1 j = 1<br />

m<br />

⎛ ⎝<br />

k<br />

⎜<br />

∑ ∑<br />

⎞<br />

H ⎟<br />

⎟<br />

⎠<br />

Die Werte H i,j sind die beobachteten Anteile für die Variablenwerte y i und x j . Bei Unabhängigkeit der beiden<br />

Merkmale kann man die Anteile, die zu erwarten wären, berechnen, denn die Häufigkeitsverteilung<br />

hinsichtlich der Merkmalsausprägung x j müßte für alle y i gleich sein. Diese „erwarteten Anteile“ E r,s für die r-<br />

te Zeile und s-te Spalte berechnen sich folgendermaßen:<br />

E<br />

rs ,<br />

m<br />

∑<br />

His<br />

,<br />

k<br />

i = 1<br />

( s − te Spaltensumme) = ⋅ Hrj<br />

, = ⋅ ( r −te Zeilensumme )<br />

n ∑<br />

n<br />

j = 1<br />

Das Maß für die Stärke des Zusammenhangs zwischen den Merkmalen x und y ist der sogenannte<br />

Kontingenzkoeffizient C.<br />

Kontingenzkoeffizient C:<br />

C =<br />

χ<br />

2<br />

n + χ<br />

m k<br />

( )<br />

mit −<br />

=<br />

2 ∑∑<br />

H E ij , ij ,<br />

χ 2 2<br />

i=<br />

1 j = 1<br />

E<br />

ij ,<br />

(χ ... Chi)<br />

C kann Werte zwischen 0 und 1 annehmen. Der maximal mögliche Wert von C hängt jeweils von der Zeilen-<br />

und Spaltenzahl ab. Für quadratische Tafeln m=k gilt C<br />

max =<br />

m − 1 k − 1 = , für rechteckige Tafeln m ≠ k<br />

m k<br />

m k<br />

gilt Cmax ≈ 1<br />

⋅ ⎛ − 1 − 1 ⎞<br />

⎜ +<br />

2 ⎝ m k ⎟ . Das Verfahren ist in der Regel nur anwendbar, wenn kein erwarteter Anteil<br />

⎠<br />

kleiner 1 ist und höchstens ein Fünftel der erwarteten Anteile kleiner 5 ist.<br />

- 168 -

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!