Skriptum
Skriptum
Skriptum
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Beispiel 1.6. Wir wählen die gleichmäßig verteilten Klassengrenzen {0,1,2,...}<br />
und berechnen zunächst die absoluten Häufigkeiten, z.B. H 3 = |{i | 2 ≤ x i < 3}| =<br />
|{2.36,2.53,2.90}| = 3, und die relativen Häufigkeiten, z.B. h 3 = H 3<br />
n = 3<br />
16 ≈ 0.19.<br />
Dann zeichnen wir die Histogramme wie in Abbildung 1.<br />
Die Wahl der Klassenbreite ist wichtig, wie man in Abbildung 2 sieht. Bei<br />
zu großer Klassenbreite zeigen zwar die Balkenhöhen aussagekräftige Werte an,<br />
aber die Auflösung des Wertebereichs ist zu gering. Bei zu kleiner Klassenbreite<br />
sind wiederum die Balkenhöhen zu gering aufgelöst.<br />
Vor allem wenn die Klassenbreiten nicht gleich sind, ist es sinnvoll, die Balkenhöhe<br />
umgekehrt proportional zur Klassenbreite zu skalieren.<br />
Definition 1.7. Die skalierte Balkenhöhe der k-ten Klassen ist die relative Häufigkeit<br />
dividiert durch die Klassenbreite:<br />
h k<br />
b k −b k−1<br />
.<br />
Dadurch entspricht der Flächeninhalt des Balkens der Häufigkeit: A k = (b k −<br />
h<br />
b k−1 ) k<br />
b k −b k−1<br />
= h k .<br />
Beispiel 1.8. Wir wählen die ungleichmäßig verteilten Klassengrenzen {0,1,2,4,<br />
7,10} und berechnen die relativen Häufigkeiten, z.B. h 3 = 4<br />
16<br />
= 0.25 und die skalierten<br />
Balkenhöhen h 3<br />
b 3 −b 2<br />
= 0.25<br />
4−2<br />
= 0.125. Dann zeichnen wir die Histogramme<br />
wie in Abbildung 3.<br />
Definition 1.9. Die empirische Verteilungsfunktion F (x) gibt für jedes x ∈ R die<br />
relative Häufigkeit der Werte kleiner oder gleich x an:<br />
F (x) := 1 n |{i | x i ≤ x}|<br />
Beispiel 1.10. Die Werte der Verteilungsfunktion können für jedes beliebige x<br />
ausgerechnet werden, z.B. F (0.75) = 1<br />
16 |{0.14,0.27,0.43,0.68}| = 4<br />
16<br />
= 0.25. Am besten<br />
rechnet man es aber für jeden Stichprobenwert x i aus und zeichnet zwischen<br />
den Punkten Plateaus ein. Das Ergebnis sieht man in Abbildung 4.<br />
Bei diskreten Merkmalen (x i ∈ N) ist es wahrscheinlich, dass gleiche Werte<br />
mehrmals auftreten. In diesem Fall ist es geschickter, die Werte in Form einer<br />
Häufigkeitstabelle anzugeben.<br />
Definition 1.11. Eine Häufigkeitstabelle gibt eine diskrete Stichprobe als Liste<br />
von Paaren (x i , H i ) an. Das bedeutet, dass der Wert x i mit der Anzahl H i auftritt.<br />
4