12.07.2015 Aufrufe

Lineare Regression (Kap. 1-5) (pdf) - Seminar für Statistik - ETH Zürich

Lineare Regression (Kap. 1-5) (pdf) - Seminar für Statistik - ETH Zürich

Lineare Regression (Kap. 1-5) (pdf) - Seminar für Statistik - ETH Zürich

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

2.S. S-FUNKTIONEN 15Abweichung der Beobachtung von der geschätzten Geraden zu untersuchen,R 0 = Y 0 − (̂α + ̂βx 0 ) = ( Y 0 − (α + βx 0 ) ) − ( (̂α + ̂βx 0 ) − (α + βx 0 ) ) .Auch wenn α und β unbekannt sind, kennen wir die Verteilungen der Ausdrücke in den grossenKlammern: Beides sind normalverteilte Zufallsvariable, und sie sind unabhängig, weil die erste nurvon der zukünftigen“ Beobachtung Y ” 0 , die zweite nur von den Beobachtungen Y 1 , . . . , Y n abhängt,die zur geschätzten Geraden führten. Beide haben Erwartungswert 0; die Varianzen addieren sichzu( 1var〈R 0 〉 = σ 2 + σ 2 n + (x 0 − x) 2 ) (= σ 2 1 + 1SSQ (X) n + (x 0 − x) 2 ).SSQ (X)Daraus ergibt sich das Vorhersage-Intervall̂α + ̂βx√0 ± q̂σ 1 + 1 n + (x 0 − x) 2 /SSQ (X) = ̂α + ̂βx√0 ± q ̂σ 2 + (se (η) ) 2 ,wobei wieder q = q tn−20.975bedeutet. (Der zweite Ausdruck gilt auch für die multiple <strong>Regression</strong>.)fDie Interpretation dieses Vorhersage-Bandes“ ist nicht ganz einfach: Es gilt nach der Herleitung,dass”P 〈 V0 ∗ 〈x 0 〉 ≤ Y 0 ≤ V1 ∗ 〈x 0 〉 〉 = 0.95ist, wobei V0 ∗〈x0 〉 die untere und V1 ∗〈x0 〉 die obere Grenze des Vorhersage-Intervalls ist.Wenn wir aber eine Aussage für mehr als eine zukünftige Beobachtung machen wollen,dann ist die Anzahl der Beobachtungen im Vorhersage-Band nicht etwa binomialverteiltmit π = 0.95. Die Ereignisse, dass die einzelnen zukünftigen Beobachtungen ins Bandfallen, sind nämlich nicht unabhängig; sie hängen über die zufälligen Grenzen V0 ∗ und V 1∗voneinander ab. Wenn beispielsweise die Schätzung ̂σ zufälligerweise merklich zu kleinherauskam, bleibt für alle zukünftigen Beobachtungen das Band zu schmal, und es werdenzu viele Beobachtungen ausserhalb des Bandes liegen.Um sicher zu gehen, dass mindestens 95% aller zukünftigen Beobachtungen im Intervallliegen, muss dieses nochmals vergrössert werden. Genaueres ist unter dem StichwortToleranz-Intervall beispielsweise in Hartung, Elpelt und Klösener (2002, §IV.1.3.3) nachzulesen.2.S S-FunktionenaAm Ende jedes <strong>Kap</strong>itels wird ein solcher Anhang stehen, in dem die nützlichen S-Funktionenbeschrieben sind. Sofern nichts anderes steht, sind die Angaben für die freie Software Rund das kommerzielle Produkt S-Plus gültig. (Letzteres ist aber zurzeit nicht durchgehendüberprüft.)b Funktion lm. . In S ist lm die grundlegende Funktion zur Anpassung von linearen <strong>Regression</strong>smodellen.Sie erzeugt als Resultat ein Objekt der Klasse lm, für die die zentralengenerischen Funktionen spezielle Methoden kennen.> r.lm

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!