Lineare Regression (Kap. 1-5) (pdf) - Seminar fÃ¼r Statistik - ETH ZÃ¼rich

Weitere Magazine

Empfehlungen

Info

28 3 MULTIPLE LINEARE REGRESSIONHöhe2 3 4 5 6 77.4 7.6 7.8 8.0 8.2 8.4pHAbbildung 3.2.u: Quadratische Regression im Beispiel der basischen BödenwDieser Abschnitt hat gezeigt, dass das Modell der multiplen linearen Regression vieleSituationen beschreiben kann, wenn man die X -Variablen geeignet wählt:• Transformationen der X - (und Y -) Variablen können aus ursprünglich nichtlinearenZusammenhängen lineare machen.• Ein Vergleich von zwei Gruppen lässt sich mit einer zweiwertigen X -Variablen,von mehreren Gruppen mit einem ”Block“ von dummy Variablen als multipleRegression schreiben. Auf diese Art werden nominale erklärende Variable in einRegressionsmodell aufgenommen.• Die Vorstellung von zwei verschiedenen Geraden für zwei Gruppen von Daten kannals ein einziges Modell hingeschrieben werden – das gilt auch für mehrere Gruppen.Auf allgemeinere Wechselwirkungen zwischen erklärenden Variablen kommen wirzurück (4.6.g).• Die polynomiale Regression ist ein Spezialfall der multiplen linearen (!) Regression.
3.3. MULTIPLE REGRESSION IST MEHR ALS VIELE EINFACHE 293.3 Multiple Regression ist viel mehr als viele einfache RegressionenabcDie multiple Regression wurde eingeführt, um den Einfluss mehrerer erklärender Grössenauf eine Zielgrösse zu erfassen. Ein verlockender, einfacherer Ansatz zum gleichenZiel besteht darin, für jede erklärende Variable eine einfache Regression durchzuführen.Man erhält so ebenfalls je einen geschätzten Koeffizienten mit Vertrauensintervall. In derComputer-Ausgabe der multiplen Regression stehen die Koeffizienten in einer einzigenTabelle. Ist das der wesentliche Vorteil?Die Überschrift über diesen Abschnitt behauptet, dass der Unterschied der beiden Ansätze– mehrere einfache gegen eine multiple Regressionsanalyse – viel grundlegender ist. Dassoll im Folgenden begründet werden.⊲ An künstlichen Beispielen lassen sich solche Effekte noch klarer veranschaulichen. InAbbildung 3.3.b sind für den Fall einer kontinuierlichen erklärenden Variablen X (1) undeiner Gruppierungsvariablen X (2) vier mögliche Fälle aufgezeichnet. Die gestrichelten Geradenzeigen das Modell, nach dem die Beobachtungen erzeugt wurden: Zwei paralleleGeraden mit Steigung β 1 und einem vertikalen Abstand von β 2 . Die Beobachtungen derbeiden Gruppen tragen verschiedene Symbole. Die ausgezogene Gerade stellt das Resultateiner einfachen Regression von Y auf X (1) dar; das schmale Rechteck am rechten Randzeigt den Unterschied zwischen den Gruppenmittelwerten der Zielgrösse, was der einfachenRegression von Y gegen X (2) entspricht. Die Gerade und das Rechteck zeigen alsodas Resultat, das man erhält, wenn man die beiden Regressoren X (1) und X (2) je miteinfacher Regression ”abhandelt“.Die Ergebnisse der multiplen Regression sind nicht eingezeichnet; sie widerspiegeln dasModell ziemlich genau. Die vier Fälle zeigen die Schwierigkeiten der Interpretation voneinfachen Regressionen drastisch:(A) Beide Variablen haben einen positiven Effekt, β 1 > 0, β 2 > 0. Die geschätzteSteigung und der Unterschied der Gruppenmittelwerte werden zu gross.(B)Kein Effekt der kontinuierlichen erklärenden Variablen X (1) . Die geschätzte Geradeerhält ihre Steigung durch den Unterschied zwischen den Gruppen.(C) Entgegengesetzte Effekte, β 1 < 0, β 2 > 0. Die geschätzte Steigung zeigt einenpositiven Effekt der kontinuierlichen erklärenden Variablen X (1) auf die Zielgrösse,während er in Wirklichkeit negativ ist!(D)Hier sind die Effekte so eingerichtet, dass sie sich gegenseitig aufheben. Man wirdfälschlicherweise schliessen, dass keine der beiden Variablen einen Einfluss auf Yhat. ⊳Wenn wir uns das Modell der multiplen Regression vergegenwärtigen, wird klar, wie derUnterschied zu den Ergebnissen der einfachen Regression entsteht: Der Koeffizient β 1 beispielsweisegibt an, um wie viel sich der erwartete Wert der Zielgrösse erhöht, wenn X (1)um 1 erhöht wird – und alle anderen erklärenden Variablen gleich bleiben. Im Beispielbleibt die Ladung und die Stelle gleich; wir erhalten also die Steigung der Geraden innerhalbder Stelle bei konstanter Ladung – und gehen, wenn die Wechselwirkung im Modellfehlt, davon aus, dass diese für beide Stellen gleich ist.Betrachten wir die einfache Regression der Zielgrösse auf X (1) , dann wird sich die Bedeutungvon β 1 ändern. Die zweite ausgewählte Stelle wurde bei grösseren Distanzen erfasstals die erste und führte trotzdem tendenziell zu gleich hohen Erschütterungen. Teilweise
Seite 1 und 2: Statistische RegressionsmodelleTeil
Seite 3 und 4: 1.1. BEISPIELE ZUR LINEAREN REGRESS
Seite 5 und 6: 2.1. DAS MODELL 3cdIm Beispiel sche
Seite 7 und 8: 2.1. DAS MODELL 5iAls zweite Verans
Seite 9 und 10: 2.2. SCHÄTZUNG DER PARAMETER 7sie
Seite 11 und 12: 2.3. TESTS UND VERTRAUENSINTERVALLE
Seite 13 und 14: 2.3. TESTS UND VERTRAUENSINTERVALLE
Seite 15 und 16: 2.4. VERTRAUENS- UND VORHERSAGE-BER
Seite 17 und 18: 2.S. S-FUNKTIONEN 15Abweichung der
Seite 19 und 20: 3 Multiple lineare Regression3.1 Mo
Seite 21 und 22: 3.1. MODELL UND STATISTIK 19gDie Gr
Seite 23 und 24: 3.2. VIELFALT DER FRAGESTELLUNGEN 2
Seite 29: 3.2. VIELFALT DER FRAGESTELLUNGEN 2
Seite 33 und 34: 3.S. S-FUNKTIONEN 313.S S-Funktione
Seite 35 und 36: 3.S. S-FUNKTIONEN 33geschätzten Ko
Seite 37 und 38: 4 Residuen-Analyse4.1 Problemstellu
Seite 39 und 40: 4.2. RESIDUEN UND ANGEPASSTE WERTE
Seite 41 und 42: 4.2. RESIDUEN UND ANGEPASSTE WERTE
Seite 43 und 44: 4.3. VERTEILUNG DER FEHLER 41R iWur
Seite 45 und 46: 4.4. ZIELGRÖSSE TRANSFORMIEREN? 43
Seite 47 und 48: 4.4. ZIELGRÖSSE TRANSFORMIEREN? 45
Seite 49 und 50: 4.5. AUSREISSER UND LANGSCHWÄNZIGE
Seite 51 und 52: 4.6. RESIDUEN UND AUSGANGS-VARIABLE
Seite 53 und 54: 4.7. UNABHÄNGIGKEIT 51log(Ladung)0
Seite 55 und 56: 4.8. EINFLUSSREICHE BEOBACHTUNGEN 5
Seite 57 und 58: 4.8. EINFLUSSREICHE BEOBACHTUNGEN 5
Seite 59 und 60: 5.2. WICHTIGKEIT EINES EINZELNEN TE
Seite 61 und 62: 5.3. AUTOMATISIERTE VERFAHREN ZUR M
Seite 67 und 68: 5.S. S-FUNKTIONEN 65Analog zu drop1
Seite 69: 8 13 MODELL-ENTWICKLUNGFox, J. and

Lineare Regression (Kap. 1-5) (pdf) - Seminar fÃ¼r Statistik - ETH ZÃ¼rich

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?