Logistische Regression in SAS
Logistische Regression in SAS
Logistische Regression in SAS
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
1. Die E<strong>in</strong>leitungStandardsatz:„Das logistische <strong>Regression</strong>smodell hat sich seit se<strong>in</strong>erE<strong>in</strong>führung <strong>in</strong> den siebziger Jahren zu e<strong>in</strong>erStandardmethode <strong>in</strong> der Biometrie und Epidemiologieentwickelt, wenn es um die Auswertung von b<strong>in</strong>ärenZielgrößen geht.“Beweis:Resultate e<strong>in</strong>er MEDLINE-Suche nach „Logistic<strong>Regression</strong>“ <strong>in</strong> Abstract oder Keyword (adjustiert nachder Gesamtzahl der publizierten Artikel)Anzahl Nennungen(pro 100.000)70060050040030020010001967 1972 1977 1982 1987 1992 1997O.Kuß, <strong>Logistische</strong> <strong>Regression</strong> <strong>in</strong> <strong>SAS</strong> , KSFE 99
Aber:<strong>Logistische</strong> <strong>Regression</strong> wird nicht nur <strong>in</strong> der Biometrieund der Epidemiologie verwendet.Andere Diszipl<strong>in</strong>en:Ökonomie, Informationstechnik, Biologie, L<strong>in</strong>guistik,Psychologie, Ökologie, Soziologie, Geowissenschaften,Bevölkerungswissenschaft, Politische WissenschaftGründe für die wachsende Beliebtheit:- Interpretierbarkeit der geschätzten Parameter alsOdds Ratios- Wahrsche<strong>in</strong>lichkeiten für das E<strong>in</strong>treten desZielereignisses können geschätzt werden- Anwendung <strong>in</strong> prospektiven und retrospektivenDesigns- Verfügbarkeit von geeigneter SoftwareO.Kuß, <strong>Logistische</strong> <strong>Regression</strong> <strong>in</strong> <strong>SAS</strong> , KSFE 99
3. Der BeispieldatensatzStichprobe: 162 Frauen mit unerfülltem K<strong>in</strong>derwunschZielgröße: SchwangerschaftErklärende Variablen:- Alter (<strong>in</strong> Jahren),- Dauer der Infertilität (<strong>in</strong> Jahren),- EileiterdefektErgebnis: ! "#$!$ %&'(() (&*)*+ %&(+,- '&(+*' &. '&',(' '&'+%% (&+-+) '&%%-% '&/,'"#0! '&(+'/ '&')/( *&()*, '&')+1 '&1-/$23456 '&111' '&+%1+ +&%/)* '&'*1% '&+((O.Kuß, <strong>Logistische</strong> <strong>Regression</strong> <strong>in</strong> <strong>SAS</strong> , KSFE 99
4. Die e<strong>in</strong>zelnen Prozeduren4.1 PROC LOGISTIC7 8 98:798; < :97;;- Ke<strong>in</strong> CLASS-Statement- Interaktionsterme können nicht im MODEL-Statement angegeben werden- Umfangreiche Residuen-Analyse- Hosmer-Lemeshow-Test- ROC-Analyse- Variablen-Selektionsmethoden- Adjustierung nach Overdispersion- Bias-adjustierte geschätzte Wahrsche<strong>in</strong>lichkeiten(CTABLE-Option)- Andere Modelle können gefittet werden (ProportionalOdds Modell, Bed<strong>in</strong>gte logistische <strong>Regression</strong>,Bradley-Terry-Modell)O.Kuß, <strong>Logistische</strong> <strong>Regression</strong> <strong>in</strong> <strong>SAS</strong> , KSFE 99
4.2 PROC GENMOD7 89 :798;87; < :97
4.4 PROC CATMOD7 88 :79 :;89; 79:97;;- Stetige Kovariablen müssen explizit angegebenwerden (DIRECT-Statement)- Andere Parametrisierung, deshalb Odds Ratios fürkategorielle Kovariablen nur auf Umwegen- Mult<strong>in</strong>omiale logistische <strong>Regression</strong> (nom<strong>in</strong>ale undord<strong>in</strong>ale Zielgrößen)- Bed<strong>in</strong>gte logistische <strong>Regression</strong>- Korrelierte Beobachtungen- WLS-MethodeO.Kuß, <strong>Logistische</strong> <strong>Regression</strong> <strong>in</strong> <strong>SAS</strong> , KSFE 99
4.6 PROC IMLB"!9 D3898ED;:7>'F8 >@F(@; :A(; :( %'C>>> @@(1@;:;7:((A7>>B@@@;:7G7G7>>B@@; 9:>>>:(@G 9>7@A>:'@G 9>(7@@GC9@;7:H;C:C97G>(7@@;:G;7:=>HB>CG@@;7:7B>HB>CG>7@@@;:A7;;B3896=8$#IJ =9;7':>>:(@GC9@C9@;:'@G 9>(7'@@GC9@;8 :>%G> 9 9'@@;:8 >@(;7 :(7 8>8 F@;7FK ! C"87 K8 7 F;B$#IJ =7;: >=89>7@@; :
5. Die Bugs?5.1 Prüfung auf Existenz der ML-SchätzerSeparation im Raum der Kovariablen ⇔Nichtexistenz der Parameter-SchätzerSeparation: Existenz e<strong>in</strong>er Hyperebene im Raum derKovariablen, so daß diese die Beobachtungen mit Y=0von denen mit Y=1 trennt.Beispiel: 1 Kovariable → Hyperebene ist e<strong>in</strong> PunktJ =L9MI('&/,,)''%'&*-,/('*'&%)+)%'+'&%)+'*','&%+/+,(-'&*/)1)()'&-%+*,(1'&)'*%/(/'&)(/**((''&/'/(1(Ke<strong>in</strong>e e<strong>in</strong>zige Prozedur diagnostiziert die Separationund liefert e<strong>in</strong>e Warnung!!O.Kuß, <strong>Logistische</strong> <strong>Regression</strong> <strong>in</strong> <strong>SAS</strong> , KSFE 99
5.2 GOF-Tests <strong>in</strong> PROC GENMOD- EVENT/TRIAL-Syntax0 9. 0 60
6. Das Fazit- <strong>SAS</strong> bietet e<strong>in</strong>e Vielzahl von Möglichkeiten,logistische <strong>Regression</strong>smodelle zu fitten- Auswahl der Prozeduren ist abhängig vom Modell,für Standardanwendungen s<strong>in</strong>d aber PROCLOGISTIC und PROC GENMOD die Methoden derWahl, alle anderen vorgestellten Prozeduren s<strong>in</strong>d <strong>in</strong>andere Richtungen spezialisiertO.Kuß, <strong>Logistische</strong> <strong>Regression</strong> <strong>in</strong> <strong>SAS</strong> , KSFE 99