buch.041116.pdf - PDF-Format
buch.041116.pdf - PDF-Format
buch.041116.pdf - PDF-Format
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
in:8<br />
32 KAPITEL 1. BESCHREIBENDE STATISTIK<br />
1.2.2 Zurück zur Urliste<br />
Man hat das Gefühl, daß bei der bloßen Häufigkeitsbetrachtung Informationen<br />
verschenkt werden. Es werden schließlich nicht die tatsächlich beobachteten Daten<br />
bei der Analyse berücksichtigt. Diese sind zunächst transformiert worden, so daß<br />
lediglich Merkmalsausprägungen und deren Häufigkeiten dem Beschreiben der<br />
Daten zugrunde lagen.<br />
Bei nominalskalierten Daten ist dieses Vorgehen zur Erkenntnisgewinnung im<br />
Prinzip das einzig mögliche. In bezug auf ordinal- und vor allem kardinalskalierte<br />
Daten ist das anfänglich beschriebene ungute Gefühl allerdings nicht zu<br />
übergehen: Den Daten kann mehr entlockt werden.<br />
Anhand des auf der Seite 15 vorgestellten Datensatzes buecher.stud soll der<br />
Schritt zurück zur Urliste beschrieben werden. In der Urliste, auch als Rohdaten<br />
bezeichnet, stehen die Daten so, wie sie ursprünglich beobachtet oder erhoben<br />
wurden. Die folgenden Bezeichnungen sollen gelten:<br />
X Allgemeine Bezeichnung für das Merkmal.<br />
n Stichprobenumfang.<br />
xi i-te Beobachtung vom Merkmal X, mit i = 1, 2, . . . , n.<br />
x(i), i = 1 . . . n Dies bezeichnet die Rangwertreihe, also den geordneten Datensatz:<br />
x(1) ist die kleinste, x(n) die größte Beobachtung.<br />
Der Datensatz buecher.stud hat einen Stichprobenumfang von n = 195.<br />
Der Übersicht halber soll daraus zunächst eine Zufallsstichprobe vom Umfang 20<br />
gezogen werden, die wir mit x bezeichnen wollen. Mit der Funktion sample()<br />
kann diese Zufallsstichprobe einfach realisiert werden. Der Datensatz x sowie die<br />
Rangwertreihe von x werden durch die Funktion halbe.halbe() jeweils in 2<br />
gleich große Blöcke aufgeteilt:<br />
> x halbe.halbe(x); halbe.halbe(sort(x))<br />
out:8 150 60 10 70 100 100 40 40 800 100<br />
60 40 70 200 5 60 300 80 20 10<br />
5 10 10 20 40 40 40 60 60 60<br />
70 70 80 100 100 100 150 200 300 800<br />
Während wir durch das Hinschreiben von x kaum zusätzliche Informationen<br />
gewinnen — man stelle sich nun die gleiche Darstellung mit 195 Datenpunkten<br />
vor —, läßt sich durch das Aufteilen der Rangwertreihe in 2 gleich große Hälften<br />
bereits etwas ablesen. Die untere Hälfte der Studierenden besitzt höchstens 60<br />
Bücher, während die Studierenden der zweiten Hälfte mindestens 70 Bücher im