12.07.2015 Aufrufe

Lineare Regression (Kap. 1-5) (pdf) - Seminar für Statistik - ETH Zürich

Lineare Regression (Kap. 1-5) (pdf) - Seminar für Statistik - ETH Zürich

Lineare Regression (Kap. 1-5) (pdf) - Seminar für Statistik - ETH Zürich

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

4.8. EINFLUSSREICHE BEOBACHTUNGEN 53in diesem Fall klein ausfallen. Leider ist die Verteilung der Teststatistik unter der Nullhypothese derUnabhängigkeit der E i von der den x (j)i -Werten abhängig. Durbin und Watson ist es immerhingelungen, ein Intervall anzugeben, in dem die wahre kritische Grenze für den Test liegen muss.Deshalb ist die Schlussweise im Durbin-Watson-Test unüblich: Man erhält aus Tabellen (die derComputer hoffentlich kennt) zwei Grenzen c ′ und c ′′ mit c ′ < c ′′ und schliesst– auf Verwerfung der Unabhängigkeit, falls T < c ′ ,– auf Beibehaltung der Unabhängigkeit, falls T > c ′′ ,– gar nichts (unentscheidbar), falls T dazwischen liegt.(Vielleicht entschliesst sich jemand gelegentlich, dieses Problem mit den heutigen Rechenmöglichkeitenbefriedigender zu lösen!)c Wenn Korrelationen – zeitliche, räumliche oder andere – vorliegen, dann sind die P-Werte der üblichen Tests häufig grob falsch. Methoden, die Korrelationen berücksichtigen,laufen unter der Bezeichnung Verallgemeinerte Kleinste Quadrate.4.8 Einflussreiche BeobachtungenabcAusreisser wurden schon in 4.5.a diskutiert. Manchmal verschwinden sie durch Verbesserungendes Modells. Soweit sie stehen bleiben, stellt sich die Frage, wie stark sie dieAnalyse beeinflussen. Weshalb ist das wichtig? Wenn es sich um fehlerhafte Beobachtungenhandelt, wird die Analyse verfälscht. Wenn es korrekte Beobachtungen sind und sie dieErgebnisse stark prägen, ist es nützlich, dies zu wissen. Man wird dann als Interpretationdie Möglichkeit bedenken, dass die Ausreisser aus irgendeinem Grund nicht zur gleichenGrundgesamtheit gehören, und dass das an die übrigen Beobachtungen angepasste Modelldie ”typischen“ Zusammenhänge in sinnvoller Weise wiedergibt.Der Effekt eines Ausreissers auf die Resultate kann untersucht werden, indem dieAnalyse ohne die fragliche Beobachtung wiederholt wird. Auf dieser Idee beruhen die(influence) diagnostics“, die von etlichen Programmen als grosse Tabellen geliefert werden:Die Veränderung aller möglichen Resultatgrössen (Schätzwerte, Teststatistiken) beim”Weglassen der iten Beobachtung werden für alle i angegeben. (Dazu muss nicht etwa dieAnalyse n mal wiederholt werden; es sind starke rechnerische Vereinfachungen möglich, sodass der zusätzliche Rechenaufwand unbedeutend wird.) Es ist nützlich, diese diagnosticszu studieren. Leider zeigen sie aber oft nicht, was passieren würde, wenn man zwei odermehrere Ausreisser gleichzeitig weglässt – die Effekte müssen sich nicht einfach addieren.Ein wesentlicher Teil dieser Tabellen kann glücklicherweise mit einer einzigen grafischenDarstellung erfasst werden, die wir Hebelarm-Diagramm (leverage plot) nennen wollen.Etliche influence diagnostics sind nämlich Funktionen des iten Residuum R i ,der so genannten leverage H ii und der geschätzten Standardabweichung ̂σ. Die zweiteGrösse misst auf bestimmte Weise, wie untypisch“ die Beobachtung in bezug auf die”erklärenden Variablen ist.Die (Beträge der) Einfluss-Indikatoren sind jeweils grösser für grössere |R i | und grössereH ii . In einem Streudiagramm der ˜R i gegen die H ii sind die ”gefährlichen“ Beobachtungenrechts, oben und unten, zu finden (Abbildung 4.8.c). Es gibt allerdings keine eindeutigenGrenzen, die festlegen, wo die ”Gefährlichkeit“ beginnt.Im Beispiel ist die grösste leverage bedenklich gross und die beiden extremeren Residuen

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!