journal - KHS Corpoplast
journal - KHS Corpoplast
journal - KHS Corpoplast
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
technik+innovation ° Fachbegriffe praxisnah: Keine Angst vor der Statistik (Folge 2) 56*57<br />
Tabelle 2: Berechnungen zur linearen Funktion und des Korrelationskoeffizienten<br />
Alter des Alter der<br />
Bräutigams Braut<br />
X Y X-X (X-X) 2 Y-Y (Y-Y) 2 (X-X)(Y-Y)<br />
22 19 -7 49 -6 36 42<br />
25 22 -4 16 -3 9 12<br />
26 21 -3 9 -4 16 12<br />
26 23 -3 9 -2 4 6<br />
27 23 -2 4 -2 4 4<br />
28 24 -1 1 -1 1 1<br />
30 29 1 1 4 16 4<br />
30 27 1 1 2 4 2<br />
35 33 6 36 8 64 48<br />
41 29 12 144 4 16 48<br />
Anzahl 10 10<br />
Summe 290 250 0 270 0 170 179<br />
Mittelwert 29 25<br />
Standardabweichung 5,48 4,35<br />
Varianz 30 18,9<br />
Kovarianz sxy 19,9<br />
Korrelationskoeffizient 0,836<br />
Hier erleben wir wieder (wie in Folge 1) die wundersame Quadrierung<br />
eines Ausdruckes, damit wir ihn immer als positive Zahl haben.<br />
Sie sehen, der Messwert minus Mittelwert kann negativ sein; das<br />
Quadrat dieser Differenz ist immer positiv, und das ist gut so.<br />
Machen wir das Gleiche mit den y-Werten, so fällt der Zusammenhang<br />
auch hier auf. Und nun kommt der formelmäßige Zusammenhang,<br />
der zum Korrelationskoeffizienten r führt:<br />
r = sxy 19,9<br />
s .s = = 0,836<br />
x y 5,48.4,35<br />
sxy = Kovarianz<br />
sx = Standardabweichung der x-Werte<br />
sy = Standardabweichung der y-Werte<br />
Auf eine Herleitung sei an dieser Stelle verzichtet, bitte glauben<br />
Sie mir einfach.<br />
Nehmen wir die Daten von oben, so ergibt sich r = 0,836<br />
und da sich der Korrelationskoeffizient zwischen -1 und +1 bewegen<br />
kann, ist das schon ein sehr hoher Wert und damit sagen wir:<br />
Der Zusammenhang zwischen dem Alter des Bräutigams und der<br />
Braut ist groß und damit vorhanden. Aber Vorsicht! Jede Datenerhebung<br />
aus nur wenigen Werten kann zu Trugschlüssen verleiten.<br />
Wir haben gerade gelernt: Der Wert, der einen zahlenmäßigen<br />
Zusammenhang zwischen unseren Messwerten als eine Maßzahl<br />
wiedergibt, welche die Abweichungen der Messwerte von der<br />
idealen linearen Funktion wiedergibt, das ist der Korrelationskoeffizient.<br />
Aber wie hat man sich das genau vorzustellen? Dazu nehmen<br />
wir eine Hilfsgrafik (Grafik 6) und machen dieses klarer.<br />
Auf den ersten Blick scheint es verwirrend, aber entwirren<br />
wir das Ganze ein wenig: Der eigentliche Messwert ist der rote Punkt<br />
(xi;yi). Nun bildet man die Differenzen vom Messwert zum Mittelwert<br />
jeweils für alle x-Werte und auch für alle y-Werte. Zu guter<br />
Y<br />
7<br />
6<br />
5<br />
4<br />
3<br />
2<br />
1<br />
0<br />
(y i - y) 2<br />
(x i ; y i )<br />
xi ; yi = (4;4)<br />
xi - x = -1/2 ; (xi - x) 2 = 1/4<br />
yi - y = -2 ; (yi - y) 2 = 4<br />
Kovarianz (xi - x)(yi - y) = 1<br />
(y i - y)<br />
(x i - x) 2<br />
x i - x<br />
0 1 2 3 4 X 5 6 7<br />
K<br />
o<br />
v<br />
a<br />
r<br />
i<br />
a<br />
n<br />
z<br />
6