12.07.2015 Aufrufe

Lineare Regression (Kap. 1-5) (pdf) - Seminar für Statistik - ETH Zürich

Lineare Regression (Kap. 1-5) (pdf) - Seminar für Statistik - ETH Zürich

Lineare Regression (Kap. 1-5) (pdf) - Seminar für Statistik - ETH Zürich

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

4 2 EINFACHE LINEARE REGRESSIONfZunächst überlegen wir, wie ein Wert Y i der Zielgrösse aussehen wird, der zur Ausgangsgrössex i gemessen wird – im Beispiel, wie gross wohl die logarithmierte Erschütterungist, wenn die logarithmierte Distanz zum Sprengort x i = log 10 〈50〉 beträgt. Gemäss dembisher Gesagten ist dies gleich dem Funktionswert α + βx i , bis auf eine AbweichungE i , die wir jetzt als Zufallsvariable betrachten,Y i = α + βx i + E i .Wir nehmen an, dass die Abweichungen E i , i = 1, . . . , n, eine bestimmte Verteilunghaben – alle die gleiche – und stochastisch unabhängig (insbesondere unkorreliert) seien.Sie bilden also eine Zufalls-Stichprobe. Es zeigt sich, dass die Annahme einer Normalverteilungzu den mathematisch einfachsten Resultaten führt. Die Normalverteilung sollErwartungswert 0 und Varianz σ 2 haben. Wir notieren das als E i ∼ N 〈 0, σ 2 〉 .ghDas Modell wird erst dann konkret, wenn wir die drei Zahlen α, β und σ festlegen.Diese Situation ist in der Wahrscheinlichkeitsrechnung und in der <strong>Statistik</strong> üblich: Es wirdein Modell zunächst nur bis auf ein paar Konstante festgelegt. Diese Konstanten nenntman Parameter der Verteilung. Die ”Normalverteilung“ ist eigentlich keine Verteilung,sondern eine Verteilungs-Familie; erst wenn Erwartungswert und Varianz festgelegtsind, entsteht daraus eine Verteilung.In vielen Anwendungsgebieten wird das Wort Parameter für eine gemessene Grösse verwendet– was in der <strong>Statistik</strong> als Variable bezeichnet wird. Ein anderes Wort dafür istMerkmal. Wir hoffen auf Ihr Verständnis für diese Sprachkonfusion.Eine Modell-Vorstellung entsteht in unseren Köpfen. Wir wollen auch gleich noch dieParameter ”erfinden“. Abbildung 2.1.h veranschaulicht das Modell der linearen <strong>Regression</strong>mit den Parameter-Werten α = 4, β = −2 und σ = 0.1. Die Wahrscheinlichkeiten, mitdenen bestimmte Werte für die Y -Variable erwartet werden, sind mit den Wahrscheinlichkeitsdichtendargestellt.Y Wahrschein- lichkeits- dichte101.6 1.8 2.0xAbbildung 2.1.h: Veranschaulichung des <strong>Regression</strong>smodells Y i = 4 − 2x i + E i für dreiBeobachtungen Y 1 , Y 2 und Y 3 zu den x-Werten x 1 = 1.6, x 2 = 1.8 und x 3 = 2

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!