01.03.2014 Aufrufe

Skriptum

Skriptum

Skriptum

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Beispiel 1.6. Wir wählen die gleichmäßig verteilten Klassengrenzen {0,1,2,...}<br />

und berechnen zunächst die absoluten Häufigkeiten, z.B. H 3 = |{i | 2 ≤ x i < 3}| =<br />

|{2.36,2.53,2.90}| = 3, und die relativen Häufigkeiten, z.B. h 3 = H 3<br />

n = 3<br />

16 ≈ 0.19.<br />

Dann zeichnen wir die Histogramme wie in Abbildung 1.<br />

Die Wahl der Klassenbreite ist wichtig, wie man in Abbildung 2 sieht. Bei<br />

zu großer Klassenbreite zeigen zwar die Balkenhöhen aussagekräftige Werte an,<br />

aber die Auflösung des Wertebereichs ist zu gering. Bei zu kleiner Klassenbreite<br />

sind wiederum die Balkenhöhen zu gering aufgelöst.<br />

Vor allem wenn die Klassenbreiten nicht gleich sind, ist es sinnvoll, die Balkenhöhe<br />

umgekehrt proportional zur Klassenbreite zu skalieren.<br />

Definition 1.7. Die skalierte Balkenhöhe der k-ten Klassen ist die relative Häufigkeit<br />

dividiert durch die Klassenbreite:<br />

h k<br />

b k −b k−1<br />

.<br />

Dadurch entspricht der Flächeninhalt des Balkens der Häufigkeit: A k = (b k −<br />

h<br />

b k−1 ) k<br />

b k −b k−1<br />

= h k .<br />

Beispiel 1.8. Wir wählen die ungleichmäßig verteilten Klassengrenzen {0,1,2,4,<br />

7,10} und berechnen die relativen Häufigkeiten, z.B. h 3 = 4<br />

16<br />

= 0.25 und die skalierten<br />

Balkenhöhen h 3<br />

b 3 −b 2<br />

= 0.25<br />

4−2<br />

= 0.125. Dann zeichnen wir die Histogramme<br />

wie in Abbildung 3.<br />

Definition 1.9. Die empirische Verteilungsfunktion F (x) gibt für jedes x ∈ R die<br />

relative Häufigkeit der Werte kleiner oder gleich x an:<br />

F (x) := 1 n |{i | x i ≤ x}|<br />

Beispiel 1.10. Die Werte der Verteilungsfunktion können für jedes beliebige x<br />

ausgerechnet werden, z.B. F (0.75) = 1<br />

16 |{0.14,0.27,0.43,0.68}| = 4<br />

16<br />

= 0.25. Am besten<br />

rechnet man es aber für jeden Stichprobenwert x i aus und zeichnet zwischen<br />

den Punkten Plateaus ein. Das Ergebnis sieht man in Abbildung 4.<br />

Bei diskreten Merkmalen (x i ∈ N) ist es wahrscheinlich, dass gleiche Werte<br />

mehrmals auftreten. In diesem Fall ist es geschickter, die Werte in Form einer<br />

Häufigkeitstabelle anzugeben.<br />

Definition 1.11. Eine Häufigkeitstabelle gibt eine diskrete Stichprobe als Liste<br />

von Paaren (x i , H i ) an. Das bedeutet, dass der Wert x i mit der Anzahl H i auftritt.<br />

4

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!