01.09.2013 Aufrufe

buch.041116.pdf - PDF-Format

buch.041116.pdf - PDF-Format

buch.041116.pdf - PDF-Format

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

in:8<br />

32 KAPITEL 1. BESCHREIBENDE STATISTIK<br />

1.2.2 Zurück zur Urliste<br />

Man hat das Gefühl, daß bei der bloßen Häufigkeitsbetrachtung Informationen<br />

verschenkt werden. Es werden schließlich nicht die tatsächlich beobachteten Daten<br />

bei der Analyse berücksichtigt. Diese sind zunächst transformiert worden, so daß<br />

lediglich Merkmalsausprägungen und deren Häufigkeiten dem Beschreiben der<br />

Daten zugrunde lagen.<br />

Bei nominalskalierten Daten ist dieses Vorgehen zur Erkenntnisgewinnung im<br />

Prinzip das einzig mögliche. In bezug auf ordinal- und vor allem kardinalskalierte<br />

Daten ist das anfänglich beschriebene ungute Gefühl allerdings nicht zu<br />

übergehen: Den Daten kann mehr entlockt werden.<br />

Anhand des auf der Seite 15 vorgestellten Datensatzes buecher.stud soll der<br />

Schritt zurück zur Urliste beschrieben werden. In der Urliste, auch als Rohdaten<br />

bezeichnet, stehen die Daten so, wie sie ursprünglich beobachtet oder erhoben<br />

wurden. Die folgenden Bezeichnungen sollen gelten:<br />

X Allgemeine Bezeichnung für das Merkmal.<br />

n Stichprobenumfang.<br />

xi i-te Beobachtung vom Merkmal X, mit i = 1, 2, . . . , n.<br />

x(i), i = 1 . . . n Dies bezeichnet die Rangwertreihe, also den geordneten Datensatz:<br />

x(1) ist die kleinste, x(n) die größte Beobachtung.<br />

Der Datensatz buecher.stud hat einen Stichprobenumfang von n = 195.<br />

Der Übersicht halber soll daraus zunächst eine Zufallsstichprobe vom Umfang 20<br />

gezogen werden, die wir mit x bezeichnen wollen. Mit der Funktion sample()<br />

kann diese Zufallsstichprobe einfach realisiert werden. Der Datensatz x sowie die<br />

Rangwertreihe von x werden durch die Funktion halbe.halbe() jeweils in 2<br />

gleich große Blöcke aufgeteilt:<br />

> x halbe.halbe(x); halbe.halbe(sort(x))<br />

out:8 150 60 10 70 100 100 40 40 800 100<br />

60 40 70 200 5 60 300 80 20 10<br />

5 10 10 20 40 40 40 60 60 60<br />

70 70 80 100 100 100 150 200 300 800<br />

Während wir durch das Hinschreiben von x kaum zusätzliche Informationen<br />

gewinnen — man stelle sich nun die gleiche Darstellung mit 195 Datenpunkten<br />

vor —, läßt sich durch das Aufteilen der Rangwertreihe in 2 gleich große Hälften<br />

bereits etwas ablesen. Die untere Hälfte der Studierenden besitzt höchstens 60<br />

Bücher, während die Studierenden der zweiten Hälfte mindestens 70 Bücher im

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!