Lineare Regression (Kap. 1-5) (pdf) - Seminar fÃ¼r Statistik - ETH ZÃ¼rich

Weitere Magazine

Empfehlungen

Info

64 5 MODELL-ENTWICKLUNGp⊲ Abbildung 5.3.p zeigt, wie die geschätzten standardisierten Koeffizienten von der relativenSchranke b abhängen. Wenn man von b = 1 rückwärts geht, wird zunächst derKoeffizient von BW gleich 0, dann derjenige von WZ, dann Z, √ N und BZ. Ein merkwürdigesVerhalten zeigt ausgerechnet der Koeffizient der Kostengarantie KG: Er ist im Bereich vonmittleren Schranken am bedeutendsten. ⊳5.4 Strategien der Modell-EntwicklungabcdDie automatisierten Verfahren zur Modellwahl genügen für eine befriedigende explorativeAnalyse aus verschiedenen Gründen nicht:• Wie erwähnt (5.3.k), ist die Auswahl der Variablen in der besten Gleichung entsprechendjedem Kriterium selbst vom Zufall abhängig, und man muss zumindestneben diesem ”besten“ Modell die ”fast gleich guten“ in Betracht ziehen. Um diesezu finden, ist die ”all subsets“-Rechnung immerhin sehr hilfreich.• Wir sind von einem festen Satz von Regressoren ausgegangen. Im <strong>Kap</strong>itel Residuen-Analyse haben wir gesehen, dass oft Variable transformiert oder quadratischeoder Wechselwirkungsterme eingeführt werden sollten. Wollte man alle dieseMöglichkeiten von Anfang an zum ”festen Satz von Regressoren“ hinzufügen, dannwürde dies schon bei wenigen ursprünglichen Ausgangs-Variablen zu einer übergrossenZahl von Regressoren führen. Solche Zusatzterme müssen daher mit anderenMitteln auf ihre Eignung geprüft werden.• Manchmal liefern die Verfahren Modelle, die mit dem gesicherten Fachwissen nichtübereinstimmen. Beispielsweise kann der geschätzte Koeffizient eines Regressors einVorzeichen haben, das ”nicht stimmen kann“. Bevor man eine ganz neue Theorieentwickelt, wird man weitere Modelle prüfen wollen.Zur Modellwahl braucht es also eine ”Strategie“, die allerdings noch selten formuliertund diskutiert wird. Sie wird eher als Kunst angesehen, die allenfalls durch Beispiele zuvermitteln sei.Ein Ansatz dazu ist in Anhang ... entworfen.⊲ Im Beispiel der Baukosten liegt eine solche Fragestellung vor. Es soll ja herausgefundenwerden, ob die Kostengarantie einen (vermindernden) Einfluss auf die ZielgrösseKosten hat. Verschiedene Modelle haben zwiespältige Antworten geliefert. Die Variable N,die zählt, wie viele Werke das gleiche Ingenieur-Team bereits erbaut hat, ist eine kritische“ ”Variable. Mit fachlicher Beurteilung kommt man zu einem überraschend klaren Ergebnis,das wir aber hier nicht ausführen wollen. ⊳Ein dritter Zweck: Vorhersage. Hier ist noch keine Strategie formuliert. Es kommt beidieser Fragestellung nur darauf an, gute angepasste Werte zu erhalten. Kollinearitätensind unwichtig. Für Prognose-Intervalle ist die Form der Verteilung der Fehler wesentlich.5.S S-FunktionenaDie Wichtigkeit eines Terms in der Modellgleichung wird von drop1 geprüft, siehe 3.S.0.f.Diese Funktion liefert nicht nur Test-Resultate (wenn man test="F" setzt), sondern (vorallem) einen AIC-Wert (5.3.g), der den Vergleich zwischen Modellen mit verschiedenenAnzahlen von Regressoren ermöglicht.
5.S. S-FUNKTIONEN 65Analog zu drop1 gibt es eine Funktion add1, die prüft, ob Terme zum bestehenden Modellhinzugefügt werden sollen.b Funktion step. Die schrittweisen Verfahren sind in der Funktion step implementiert.Als erstes Argument verlangt step ein lm- (oder regr-) Resultat. Wenn nichts weiteresgegeben wird, dann läuft die Modellwahl schrittweise rückwärts. Man kann aber als Argumentscope=∼.+X5+X6 zusätzliche Terme (X5 und X6)angeben und auch festlegen, dassgewisse Terme in allen Modellen vorkommen müssen( scope=list(lower=∼X1, upper=∼.+X5+X6) ). Will man ein Vorwärts-Verfahren vom leeren Modell“an durchführen, dann muss man zunächst das leere Modell anpassen“, also t.r”” t.r t.rs t.ras summary(t.ras)Mit nvmax= maximale Anzahl Regressoren und mit force.in= kann man den Aufwandreduzieren und deshalb (noch) grössere Modelle verarbeiten.> t.ras update(t.r,formula= .-BW)zu einem Modell, das sich von dem in t.r abgespeicherten Modell-Ergebnis nur dadurchunterscheiden, dass der Term BW im Modell weggelassen wird. – Allerdings kann es geradeso effizient und transparent sein, mit ”copy-paste“ den vorhergehenden Aufruf von lm zuduplizieren und abzuändern.eDie Lasso-Methode ist im package library(lasso2) unter dem Namen l1ce implementiert.Die Standardisierung der Variablen muss man selber organisieren. Das Argumentbound legt die relative Schranke b fest (ausser man setzt absolute.t=TRUE). Man kanndiesem Argument mehrere Werte geben (einen Vektor), beispielsweisebound=seq(0.05,1,0.05) und erhält dann eine ganze Liste von <strong>Regression</strong>sresultaten.Mit plot(...) erhält man eine Darstellung der erhaltenen Koeffizienten in Abhängigkeitvon der Schranke.> t.r plot(t.r)> summary(t.r[[5]])
Seite 1 und 2:
Statistische RegressionsmodelleTeil
Seite 3 und 4:
1.1. BEISPIELE ZUR LINEAREN REGRESS
Seite 5 und 6:
2.1. DAS MODELL 3cdIm Beispiel sche
Seite 7 und 8:
2.1. DAS MODELL 5iAls zweite Verans
Seite 9 und 10:
2.2. SCHÄTZUNG DER PARAMETER 7sie
Seite 11 und 12:
2.3. TESTS UND VERTRAUENSINTERVALLE
Seite 13 und 14:
2.3. TESTS UND VERTRAUENSINTERVALLE
Seite 15 und 16: 2.4. VERTRAUENS- UND VORHERSAGE-BER
Seite 17 und 18: 2.S. S-FUNKTIONEN 15Abweichung der
Seite 19 und 20: 3 Multiple lineare Regression3.1 Mo
Seite 21 und 22: 3.1. MODELL UND STATISTIK 19gDie Gr
Seite 23 und 24: 3.2. VIELFALT DER FRAGESTELLUNGEN 2
Seite 31 und 32: 3.3. MULTIPLE REGRESSION IST MEHR A
Seite 33 und 34: 3.S. S-FUNKTIONEN 313.S S-Funktione
Seite 35 und 36: 3.S. S-FUNKTIONEN 33geschätzten Ko
Seite 37 und 38: 4 Residuen-Analyse4.1 Problemstellu
Seite 39 und 40: 4.2. RESIDUEN UND ANGEPASSTE WERTE
Seite 41 und 42: 4.2. RESIDUEN UND ANGEPASSTE WERTE
Seite 43 und 44: 4.3. VERTEILUNG DER FEHLER 41R iWur
Seite 45 und 46: 4.4. ZIELGRÖSSE TRANSFORMIEREN? 43
Seite 47 und 48: 4.4. ZIELGRÖSSE TRANSFORMIEREN? 45
Seite 49 und 50: 4.5. AUSREISSER UND LANGSCHWÄNZIGE
Seite 51 und 52: 4.6. RESIDUEN UND AUSGANGS-VARIABLE
Seite 53 und 54: 4.7. UNABHÄNGIGKEIT 51log(Ladung)0
Seite 55 und 56: 4.8. EINFLUSSREICHE BEOBACHTUNGEN 5
Seite 57 und 58: 4.8. EINFLUSSREICHE BEOBACHTUNGEN 5
Seite 59 und 60: 5.2. WICHTIGKEIT EINES EINZELNEN TE
Seite 61 und 62: 5.3. AUTOMATISIERTE VERFAHREN ZUR M
Seite 63 und 64: 5.3. AUTOMATISIERTE VERFAHREN ZUR M
Seite 65: 5.3. AUTOMATISIERTE VERFAHREN ZUR M
Seite 69: 8 13 MODELL-ENTWICKLUNGFox, J. and
Alle anzeigen

Lineare Regression (Kap. 1-5) (pdf) - Seminar fÃ¼r Statistik - ETH ZÃ¼rich

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?