12.07.2015 Aufrufe

Lineare Regression (Kap. 1-5) (pdf) - Seminar für Statistik - ETH Zürich

Lineare Regression (Kap. 1-5) (pdf) - Seminar für Statistik - ETH Zürich

Lineare Regression (Kap. 1-5) (pdf) - Seminar für Statistik - ETH Zürich

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

42 4 RESIDUEN-ANALYSE* Die empirische Varianz der Residuen ist nicht gleich der geschätzten Varianz ̂σ 2 der Fehler,sondern gleich ( ∑ R 2 i )/(n − 1) = ̂σ2 (n − p)/(n − 1). Damit das Histogramm mit der Normalverteilung-Dichtevergleichbar wird, muss die Skala auf der vertikalen Achse so gewählt werden, dassdie Summe der Produkte von Balkenhöhe mal Balkenbreite gleich 1 wird.Beachten Sie, dass die Überprüfung der Normalverteilung für die Zielgrösse selbst sinnlosist, da die Y i ja verschiedene Erwartungswerte haben.b* Eine weitere Darstellungsart, das Normalverteilungs-Diagramm oder der normal plot, beruhtauf dem Vergleich der Quantile der empirischen Verteilung der Residuen und der Quantile derNormalverteilung (Stahel (2007), 11.3).cdeIm Beispiel der Sprengungen zeigt das Histogramm (vergleiche Abbildung 4.3.a), dassdie Daten genähert normalverteilt sein könnten bis auf einen extremen Wert, einen sogenannten Ausreisser.Ein Histogramm kann nie perfekt mit einer Dichtekurve übereinstimmen. Die Häufigkeitsverteilungder Residuen wird zufällig immer wieder anders herauskommen, auch wennBeobachtungen genau nach dem Modell erzeugt werden – beispielsweise über Zufallszahlen.Welche Abweichungen können noch als ”rein zufällig“ gelten? Man kann diese Frageformal mit einem statistischen Test beantworten. Dies führt zu den Anpassungstests(goodness of fit tests). Jeder dieser Tests prüft eine bestimmte Art von Abweichungen.Wir gehen hier nicht näher auf diese Methoden ein.Der Vorteil einer grafischen Darstellung besteht gerade darin, dass das Auge auch Besonderheitenentdeckt, an die man vorher nicht gedacht hat. Die Entscheidung, ob einHistogramm ”nur zufällig“ von der idealen Verteilung abweicht oder nicht, braucht Übung– und diese kann man sich verschaffen, indem man durch Simulation (vergleiche 4.2.k)mit dem angepassten Modell immer neue Datensätze erzeugt. So sind die 6 simuliertenResiduen-Histogramme in Abbildung 4.3.e entstanden.Häufigkeit0 5 10 150 2 4 6 8 10 140 2 4 6 8 10 12−0.4 −0.2 0.0 0.2 0.4−0.4 −0.2 0.0 0.2 0.4−0.4 −0.2 0.0 0.2 0.4Häufigkeit0 2 4 6 8 10 140 5 10 150 5 10 15−0.4 −0.2 0.0 0.2 0.4Residuen−0.4 −0.2 0.0 0.2 0.4Residuen−0.4 −0.2 0.0 0.2 0.4ResiduenAbbildung 4.3.e: Histogramme von Residuen aus 6 simulierten Sätzen von Y -Werten imBeispiel der Sprengungen

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!