12.07.2015 Aufrufe

Lineare Regression (Kap. 1-5) (pdf) - Seminar für Statistik - ETH Zürich

Lineare Regression (Kap. 1-5) (pdf) - Seminar für Statistik - ETH Zürich

Lineare Regression (Kap. 1-5) (pdf) - Seminar für Statistik - ETH Zürich

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

54 4 RESIDUEN-ANALYSEstandardisierte Residuen−2 −1 0 1 2✐ ✏✮ ✏✏✏✏✏✏” gefährliche“Zonen0.10 0.15 0.20 0.25leveragehH iiAbbildung 4.8.c: Hebelarm-Diagramm für das Beispiel der Sprengungender Beobachtungen mit H ii > 0.2 sind ebenfalls beachtenswert. Es könnte sich lohnen, dieAnalyse versuchsweise ohne diese Beobachtungen zu wiederholen.dDie Distanz von Cook fasst die Veränderungen aller angepassten Werte ŷ i beim Weglassender iten Beobachtung zu einer Zahl zusammen (nämlich zu ihrer Quadratsumme(ŷ (−i) − ŷ) T (ŷ (−i) − ŷ), dividiert durch p̂σ 2 ). Sie lässt sich schreiben alsd (C)i=R 2 i H iip̂σ 2 (1 − H ii ) 2 = (1/p) ˜R 2 i H ii/(1 − H ii ) ,ist also ebenfalls eine Funktion der drei erwähnten Grössen.Im Programmsystem R werden die d (C)iin der Reihenfolge der Beobachtungen im Datensatzroutinemässig grafisch dargestellt.e* Der Einfluss einzelner Beobachtungen auf einen einzelnen <strong>Regression</strong>skoeffizienten β j zeigtsich in einem speziellen Streudiagramm, das added variable plot oder partial regression leverageplot genannt wird. (Das erste könnte man als ”Diagramm für zusätzliche Variable“ übersetzen.)Es zeigt die Residuen einer <strong>Regression</strong>s-Analyse ohne die entsprechende erklärende Variable X (j) ,aufgetragen gegen ”korrigierte“ Werte von X (j) . Diese Werte erhält man als Residuen in einer<strong>Regression</strong> von X (j) (als ”Zielvariable“) auf die übrigen erklärenden Variablen – mit der Bildungsolcher Residuen schaltet man die ”indirekten Einflüsse“von X (j) auf Y aus.Wenn man in diesem Streudiagramm eine Gerade (mit Kleinsten Quadraten) anpasst, so hat siegenau die Steigung ̂β j , die auch bei der Schätzung aller Koeffizienten im gesamten Modell herauskommt.Das Diagramm zeigt, wie diese ”Steigung“ zustandekommt, also insbesondere, welcheBeobachtungen einen starken Einfluss auf sie ausüben.In Abbildung 4.8.e fällt ein Punkt im linken Teil auf, der einen starken Einfluss auf den geschätztenKoeffizienten der Distanz hat. Es handelt sich um unseren altbekannten Ausreisser.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!