12.07.2015 Aufrufe

Lineare Regression (Kap. 1-5) (pdf) - Seminar für Statistik - ETH Zürich

Lineare Regression (Kap. 1-5) (pdf) - Seminar für Statistik - ETH Zürich

Lineare Regression (Kap. 1-5) (pdf) - Seminar für Statistik - ETH Zürich

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

3.2. VIELFALT DER FRAGESTELLUNGEN 21Coefficients:coef stcoef signif R2.x df p.value(Intercept) 2.832 0.000 6.31 NA 1 0.000log10(dist) -1.511 -0.903 -6.75 0.01659 1 0.000log10(ladung) 0.808 0.176 1.32 0.01659 1 0.011St.dev. of Error = 0.1529 on 45 degrees of freedomMultiple R-Squared: 0.8048F-statistic: 92.79 on 2 and 45 degrees of freedomp-value 1.11e-16Tabelle 3.1.k: Resultat der S-Funktion regr für das Beispiel der SprengungenlEine weitere nützliche Grösse für jede X -Variable, die von einigen Programmen angegebenwird, ist der standardisierte <strong>Regression</strong>s-Koeffizient ( stcoef“ in der Tabelle)”̂β ∗ j = ̂β〈 〉j · sd X (j) / sd〈Y 〉 .(sd steht für die Standardabweichung.) Es ist der Koeffizient, den man erhält, wenn manalle X -Variablen und die Zielgrösse auf Mittelwert 0 und Varianz 1 standardisiert und dasModell mit den neuen Grössen anpasst. In einer einfachen <strong>Regression</strong> ist die so standardisierteSteigung gleich der Korrelation. In der multiplen <strong>Regression</strong> messen die standardisiertenKoeffizienten ebenfalls die Stärke des Einflusses der einzelnen Ausgangs-Variablenauf die Zielgrösse, unabhängig von den Masseinheiten oder Streuungen der Variablen. Ändertman X (j) um eine Standardabweichung sd 〈 X (j) 〉 , dann ändert sich der geschätzteWert der Zielgrösse um ̂β ∗ j Standardabweichungen sd〈Y 〉 .m* Schliesslich erscheint in der Tabelle unter der Spalte ”R2.x“ ein Mass für die so genannte Kollinearitätzwischen den X -Variablen. Wenn eine X -Variable stark mit den anderen zusammenhängt,führt das zu Schwierigkeiten bei der Interpretation und zu grossen Ungenauigkeiten bei der Schätzungder betroffenen Koeffizienten.Das hier verwendete Mass für diese Schwierigkeit wird bestimmt, indem man die <strong>Regression</strong> jederX -Variablen X (j) gegen alle anderen X -Variablen durchführt und das entsprechende BestimmtheitsmassRj2 notiert. Auch wenn eine X -Variable, als Zielgrösse verwendet, allen Annahmendes entsprechenden <strong>Regression</strong>smodells widersprechen sollte, gibt das Bestimmtheitsmass einenbrauchbaren Hinweis auf das Problem der Kollinearität. Der Minimalwert 0 sagt, dass X (j) mitden anderen Ausgangsgrössen nicht (linear) zusammenhängt. Das Maximum 1 tritt auf, wenn X (j)von den anderen X -Variablen vollständig linear abhängt. In diesem Fall tritt sogar ein numerischesProblem auf, da die Koeffizienten nicht mehr eindeutig schätzbar sind (wie in 3.2.e).Ein häufig verwendetes Mass für die Kollinearität ist der Variance Inflation Factor“(VIF), der”gleich 1/(1 − Rj 2 ) ist. Sein Minimum ist 1; er kann beliebig gross werden.3.2 Vielfalt der FragestellungenaDie Ausgangs-Variablen X (1) und X (2) sind in den Beispielen kontinuierliche Messgrössenwie die Zielvariable. Das braucht allgemein nicht so zu sein.Im Modell der multiplen <strong>Regression</strong> werden keine einschränkenden Annahmenüber die X -Variablen getroffen. Sie müssen von keinem bestimmten Datentypsein und schon gar nicht einer bestimmten Verteilung folgen. Sie sind ja nicht einmalals Zufallsvariable eingesetzt.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!