buch.041116.pdf - PDF-Format
buch.041116.pdf - PDF-Format
buch.041116.pdf - PDF-Format
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
1.2. ANALYSE UNIVARIATER DATEN 17<br />
Für das Beispiel Alter 6 kann z.B. die folgende stetige (gerundete) Häufigkeitstabelle<br />
generiert werden:<br />
> haeufigkeit.stetig(alter,anzahl.klassen=6) in:5<br />
--------------------------i<br />
ug.i og.i n.i h.i F.i<br />
---------------------------<br />
1 18 20 121 0.457 0.457<br />
2 20 22 86 0.325 0.781<br />
3 22 24 42 0.158 0.940<br />
4 24 26 7 0.026 0.966<br />
5 26 28 7 0.026 0.992<br />
6 28 30 2 0.008 1.000<br />
---------------------------<br />
Als Klassenbreite (für alle Klassen) wurde zwei Jahre gewählt. Für drei Jahre<br />
ergibt sich:<br />
out:5<br />
> haeufigkeit.stetig(alter,anzahl.klassen=4) in:6<br />
--------------------------i<br />
ug.i og.i n.i h.i F.i<br />
---------------------------<br />
1 18 21 179 0.675 0.675<br />
2 21 24 70 0.264 0.940<br />
3 24 27 12 0.045 0.985<br />
4 27 30 4 0.015 1.000<br />
---------------------------<br />
Wie groß geeignete Klassen sind, kommt auf den Datensatz an. Es existieren<br />
gewisse Proportionalitäsregeln, die in statistischen Softwarepaketen implementiert<br />
sind. Zum Beispiel wird die Klassenzahl oft als proportional zum Logarithmus<br />
zur Basis 2 des Stichprobenumfangs bestimmt. Ein solches Vorgehen<br />
erlaubt einer Statistiksoftware, automatisiert Vorschläge für die Klassierung zu<br />
generieren. Letztlich muß man aber selber entscheiden, welche Klassengrenzen<br />
man wählt. Was würde sich übrigens bei einer Klassenbreite von einem Jahr ergeben?<br />
In einer stetigen Häufigkeitstabelle gilt: Die Untergrenze gehört nicht zur Klasse<br />
dazu. Durch dieses Vorgehen wird der Stetigkeit der Daten Rechnung getragen.<br />
Wenn also eine Beobachtung zufällig den Wert einer Untergrenze annimmt, dann<br />
wird sie einer Klasse tiefer zugeordnet. Somit ist eine Eindeutigkeit in bezug auf<br />
die Zuordnung der Daten garantiert.<br />
6 Vgl. Seite 4f für die diskrete Behandlung.<br />
out:6