buch.041116.pdf - PDF-Format
buch.041116.pdf - PDF-Format
buch.041116.pdf - PDF-Format
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
in:8<br />
34 KAPITEL 1. BESCHREIBENDE STATISTIK<br />
Auf einen Blick kann man erkennen, daß die Daten relativ dicht gedrängt bis<br />
zur eingezeichneten Stelle 60 Bücher liegen. Jenseits der 60 machen sich die Daten<br />
wesentlich breiter auf der Merkmalsachse. Die zweite Hälfte benötigt mehr Platz,<br />
sie erstreckt sich bis hin zur 800. Wo liegen also die Daten? Kann man die Lage<br />
zusammenfassend beschreiben? Wenn man sich eine Zahl wünschen dürfte, die<br />
ein typischer Repräsentant der Daten sein soll, welche würde man wählen?<br />
Mit den zentralen Lageschätzern versucht man, diese letzten Gedanken<br />
umzusetzen. Es wird eine Zahl aus den Daten generiert, die alle anderen vertritt<br />
und somit für den Datensatz typisch ist. Der zentrale Lageschätzer ist durch einen<br />
minimalen Abstand zu den Beobachtungen ausgezeichnet, er liegt in der Mitte der<br />
Daten. Immer?<br />
Definition: Arithmetisches Mittel<br />
¯x = 1<br />
n<br />
n<br />
i=1<br />
xi = x1 + x2 + . . . + xn<br />
n<br />
(sprich: ” x quer“)<br />
Um das arithmetische Mittel sinnvoll berechnen zu können, müssen die Daten<br />
kardinales Meßniveau aufweisen. Ist die Differenz zwischen zwei Merkmalsausprägungen<br />
sachlogisch der entscheidende Unterschied, nicht das Verhältnis,<br />
dann macht dieser Mittelwert Sinn (vgl. geometrisches Mittel).<br />
Das arithmetische Mittel hat die Eigenschaft der Linearität<br />
yi = a + b · xi ⇒ ¯y = a + b · ¯x<br />
Das arithmetische Mittel ist ausreißerempfindlich. <br />
> mean(x)<br />
out:8 115.75<br />
in:8<br />
Ist ¯x = 115.75 der typische Repräsentant für den Datensatz x? Ein kurzes<br />
Nachzählen auf der Seite 32 der Rangwertreihe von x verrät uns, daß 16 von<br />
20 Studierenden, also 80%, deutlich weniger, die übrigen 4 aber wesentlich mehr<br />
Bücher besitzen. Der gefundene Mittelwert scheint also niemandem gerecht zu<br />
werden.<br />
Wie groß sind die arithmetischen Mittel in den beide gerade genannten Gruppen,<br />
was ist also die mittlere Anzahl Bücher derjenigen, die weniger als 115 Bücher<br />
besitzen bzw. derer, die mehr haben:<br />
out:8 54.0625<br />
362.5<br />
> mean(x[x mean(x[x>mean(x)])