buch.041116.pdf - PDF-Format
buch.041116.pdf - PDF-Format
buch.041116.pdf - PDF-Format
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
in:8<br />
out:8<br />
60 KAPITEL 1. BESCHREIBENDE STATISTIK<br />
12.831 -0.208<br />
85.407 0.844<br />
Wer auf den alten 10-Mark Schein schaut, weiß, wie die Dichte der Normalverteilung<br />
aussieht — wer keine DM-Noten mehr hat, muß bis Kapitel XXXX<br />
warten. Die beiden Bücherdatensätze haben wesentlich mehr Dichtemasse an den<br />
Rändern. Aufgrund der Schiefemaßzahl wissen wir aber auch, daß diese Masse<br />
nicht symmetrisch, d.h. nicht gleichmäßig rechts und links vom Zentrum liegt.<br />
Mit diesen beiden Maßzahlen hat man auch ein erstes Indiz dafür, ob bei einem<br />
konkreten Datensatz die Normalverteilungsannahme gerechtfertigt ist. Für sehr<br />
viele Verfahren ist diese Annahme nämlich Voraussetzung.<br />
Definition: Box-Cox-Transformation<br />
Ein Datensatz x wird auf einen neuen Datensatz y = T (x) abgebildet, der<br />
in Abhängigkeit vom Parameter λ (sprich: Lambda“) eine geringere Schiefe<br />
”<br />
aufweist als der ursprüngliche Datensatz.<br />
T (x) =<br />
x λ −1<br />
λ<br />
für λ = 0<br />
ln x für λ = 0<br />
Dieses Vorgehen ist dadurch zu begründen, daß weitergehende Analysen und<br />
Modellierungen der Daten mit asymmetrischen Datensätzen schwieriger ist als<br />
mit symmetrischen. <br />
Um beispielsweise der Normalverteilungsannahme näherzukommen, kann sich<br />
die Box-Cox-Transformation als geeignete Maßnahme erweisen. Eine Möglichkeit,<br />
einen günstigen Wert für λ zu ermitteln, ist, eine ganze Reihe von Box-Cox-<br />
Transformationen für einen Datensatz durchzuführen und jeweils S und K ∗ zu<br />
berechnen. Eine graphische Darstellung hilft dann bei der Entscheidung:<br />
> box.cox.plot(x)<br />
> box.cox.plot(buehcer.stud)