Logistische Regression in SAS

1. Die EinleitungStandardsatz:„Das logistische Regressionsmodell hat sich seit seinerEinführung in den siebziger Jahren zu einerStandardmethode in der Biometrie und Epidemiologieentwickelt, wenn es um die Auswertung von binärenZielgrößen geht.“Beweis:Resultate einer MEDLINE-Suche nach „LogisticRegression“ in Abstract oder Keyword (adjustiert nachder Gesamtzahl der publizierten Artikel)Anzahl Nennungen(pro 100.000)70060050040030020010001967 1972 1977 1982 1987 1992 1997O.Kuß, Logistische Regression in SAS , KSFE 99

Aber:Logistische Regression wird nicht nur in der Biometrieund der Epidemiologie verwendet.Andere Disziplinen:Ökonomie, Informationstechnik, Biologie, Linguistik,Psychologie, Ökologie, Soziologie, Geowissenschaften,Bevölkerungswissenschaft, Politische WissenschaftGründe für die wachsende Beliebtheit:- Interpretierbarkeit der geschätzten Parameter alsOdds Ratios- Wahrscheinlichkeiten für das Eintreten desZielereignisses können geschätzt werden- Anwendung in prospektiven und retrospektivenDesigns- Verfügbarkeit von geeigneter SoftwareO.Kuß, Logistische Regression in SAS , KSFE 99

3. Der BeispieldatensatzStichprobe: 162 Frauen mit unerfülltem KinderwunschZielgröße: SchwangerschaftErklärende Variablen:- Alter (in Jahren),- Dauer der Infertilität (in Jahren),- EileiterdefektErgebnis: ! "#$!$ %&'(() (&*)*+ %&(+,- '&(+*' &. '&',(' '&'+%% (&+-+) '&%%-% '&/,'"#0! '&(+'/ '&')/( *&()*, '&')+1 '&1-/$23456 '&111' '&+%1+ +&%/)* '&'*1% '&+((O.Kuß, Logistische Regression in SAS , KSFE 99

4. Die einzelnen Prozeduren4.1 PROC LOGISTIC7 8 98:798; < :97;;- Kein CLASS-Statement- Interaktionsterme können nicht im MODEL-Statement angegeben werden- Umfangreiche Residuen-Analyse- Hosmer-Lemeshow-Test- ROC-Analyse- Variablen-Selektionsmethoden- Adjustierung nach Overdispersion- Bias-adjustierte geschätzte Wahrscheinlichkeiten(CTABLE-Option)- Andere Modelle können gefittet werden (ProportionalOdds Modell, Bedingte logistische Regression,Bradley-Terry-Modell)O.Kuß, Logistische Regression in SAS , KSFE 99

4.2 PROC GENMOD7 89 :798;87; < :97

4.4 PROC CATMOD7 88 :79 :;89; 79:97;;- Stetige Kovariablen müssen explizit angegebenwerden (DIRECT-Statement)- Andere Parametrisierung, deshalb Odds Ratios fürkategorielle Kovariablen nur auf Umwegen- Multinomiale logistische Regression (nominale undordinale Zielgrößen)- Bedingte logistische Regression- Korrelierte Beobachtungen- WLS-MethodeO.Kuß, Logistische Regression in SAS , KSFE 99

4.6 PROC IMLB"!9 D3898ED;:7>'F8 >@F(@; :A(; :( %'C>>> @@(1@;:;7:((A7>>B@@@;:7G7G7>>B@@; 9:>>>:(@G 9>7@A>:'@G 9>(7@@GC9@;7:H;C:C97G>(7@@;:G;7:=>HB>CG@@;7:7B>HB>CG>7@@@;:A7;;B3896=8$#IJ =9;7':>>:(@GC9@C9@;:'@G 9>(7'@@GC9@;8 :>%G> 9 9'@@;:8 >@(;7 :(7 8>8 F@;7FK ! C"87 K8 7 F;B$#IJ =7;: >=89>7@@; :

5. Die Bugs?5.1 Prüfung auf Existenz der ML-SchätzerSeparation im Raum der Kovariablen ⇔Nichtexistenz der Parameter-SchätzerSeparation: Existenz einer Hyperebene im Raum derKovariablen, so daß diese die Beobachtungen mit Y=0von denen mit Y=1 trennt.Beispiel: 1 Kovariable → Hyperebene ist ein PunktJ =L9MI('&/,,)''%'&*-,/('*'&%)+)%'+'&%)+'*','&%+/+,(-'&*/)1)()'&-%+*,(1'&)'*%/(/'&)(/**((''&/'/(1(Keine einzige Prozedur diagnostiziert die Separationund liefert eine Warnung!!O.Kuß, Logistische Regression in SAS , KSFE 99

5.2 GOF-Tests in PROC GENMOD- EVENT/TRIAL-Syntax0 9. 0 60

6. Das Fazit- SAS bietet eine Vielzahl von Möglichkeiten,logistische Regressionsmodelle zu fitten- Auswahl der Prozeduren ist abhängig vom Modell,für Standardanwendungen sind aber PROCLOGISTIC und PROC GENMOD die Methoden derWahl, alle anderen vorgestellten Prozeduren sind inandere Richtungen spezialisiertO.Kuß, Logistische Regression in SAS , KSFE 99

Logistische Regression in SAS

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?