12.07.2015 Aufrufe

Logistische Regression in SAS

Logistische Regression in SAS

Logistische Regression in SAS

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

1. Die E<strong>in</strong>leitungStandardsatz:„Das logistische <strong>Regression</strong>smodell hat sich seit se<strong>in</strong>erE<strong>in</strong>führung <strong>in</strong> den siebziger Jahren zu e<strong>in</strong>erStandardmethode <strong>in</strong> der Biometrie und Epidemiologieentwickelt, wenn es um die Auswertung von b<strong>in</strong>ärenZielgrößen geht.“Beweis:Resultate e<strong>in</strong>er MEDLINE-Suche nach „Logistic<strong>Regression</strong>“ <strong>in</strong> Abstract oder Keyword (adjustiert nachder Gesamtzahl der publizierten Artikel)Anzahl Nennungen(pro 100.000)70060050040030020010001967 1972 1977 1982 1987 1992 1997O.Kuß, <strong>Logistische</strong> <strong>Regression</strong> <strong>in</strong> <strong>SAS</strong> , KSFE 99


Aber:<strong>Logistische</strong> <strong>Regression</strong> wird nicht nur <strong>in</strong> der Biometrieund der Epidemiologie verwendet.Andere Diszipl<strong>in</strong>en:Ökonomie, Informationstechnik, Biologie, L<strong>in</strong>guistik,Psychologie, Ökologie, Soziologie, Geowissenschaften,Bevölkerungswissenschaft, Politische WissenschaftGründe für die wachsende Beliebtheit:- Interpretierbarkeit der geschätzten Parameter alsOdds Ratios- Wahrsche<strong>in</strong>lichkeiten für das E<strong>in</strong>treten desZielereignisses können geschätzt werden- Anwendung <strong>in</strong> prospektiven und retrospektivenDesigns- Verfügbarkeit von geeigneter SoftwareO.Kuß, <strong>Logistische</strong> <strong>Regression</strong> <strong>in</strong> <strong>SAS</strong> , KSFE 99


3. Der BeispieldatensatzStichprobe: 162 Frauen mit unerfülltem K<strong>in</strong>derwunschZielgröße: SchwangerschaftErklärende Variablen:- Alter (<strong>in</strong> Jahren),- Dauer der Infertilität (<strong>in</strong> Jahren),- EileiterdefektErgebnis: ! "#$!$ %&'(() (&*)*+ %&(+,- '&(+*' &. '&',(' '&'+%% (&+-+) '&%%-% '&/,'"#0! '&(+'/ '&')/( *&()*, '&')+1 '&1-/$23456 '&111' '&+%1+ +&%/)* '&'*1% '&+((O.Kuß, <strong>Logistische</strong> <strong>Regression</strong> <strong>in</strong> <strong>SAS</strong> , KSFE 99


4. Die e<strong>in</strong>zelnen Prozeduren4.1 PROC LOGISTIC7 8 98:798; < :97;;- Ke<strong>in</strong> CLASS-Statement- Interaktionsterme können nicht im MODEL-Statement angegeben werden- Umfangreiche Residuen-Analyse- Hosmer-Lemeshow-Test- ROC-Analyse- Variablen-Selektionsmethoden- Adjustierung nach Overdispersion- Bias-adjustierte geschätzte Wahrsche<strong>in</strong>lichkeiten(CTABLE-Option)- Andere Modelle können gefittet werden (ProportionalOdds Modell, Bed<strong>in</strong>gte logistische <strong>Regression</strong>,Bradley-Terry-Modell)O.Kuß, <strong>Logistische</strong> <strong>Regression</strong> <strong>in</strong> <strong>SAS</strong> , KSFE 99


4.2 PROC GENMOD7 89 :798;87; < :97


4.4 PROC CATMOD7 88 :79 :;89; 79:97;;- Stetige Kovariablen müssen explizit angegebenwerden (DIRECT-Statement)- Andere Parametrisierung, deshalb Odds Ratios fürkategorielle Kovariablen nur auf Umwegen- Mult<strong>in</strong>omiale logistische <strong>Regression</strong> (nom<strong>in</strong>ale undord<strong>in</strong>ale Zielgrößen)- Bed<strong>in</strong>gte logistische <strong>Regression</strong>- Korrelierte Beobachtungen- WLS-MethodeO.Kuß, <strong>Logistische</strong> <strong>Regression</strong> <strong>in</strong> <strong>SAS</strong> , KSFE 99


4.6 PROC IMLB"!9 D3898ED;:7>'F8 >@F(@; :A(; :( %'C>>> @@(1@;:;7:((A7>>B@@@;:7G7G7>>B@@; 9:>>>:(@G 9>7@A>:'@G 9>(7@@GC9@;7:H;C:C97G>(7@@;:G;7:=>HB>CG@@;7:7B>HB>CG>7@@@;:A7;;B3896=8$#IJ =9;7':>>:(@GC9@C9@;:'@G 9>(7'@@GC9@;8 :>%G> 9 9'@@;:8 >@(;7 :(7 8>8 F@;7FK ! C"87 K8 7 F;B$#IJ =7;: >=89>7@@; :


5. Die Bugs?5.1 Prüfung auf Existenz der ML-SchätzerSeparation im Raum der Kovariablen ⇔Nichtexistenz der Parameter-SchätzerSeparation: Existenz e<strong>in</strong>er Hyperebene im Raum derKovariablen, so daß diese die Beobachtungen mit Y=0von denen mit Y=1 trennt.Beispiel: 1 Kovariable → Hyperebene ist e<strong>in</strong> PunktJ =L9MI('&/,,)''%'&*-,/('*'&%)+)%'+'&%)+'*','&%+/+,(-'&*/)1)()'&-%+*,(1'&)'*%/(/'&)(/**((''&/'/(1(Ke<strong>in</strong>e e<strong>in</strong>zige Prozedur diagnostiziert die Separationund liefert e<strong>in</strong>e Warnung!!O.Kuß, <strong>Logistische</strong> <strong>Regression</strong> <strong>in</strong> <strong>SAS</strong> , KSFE 99


5.2 GOF-Tests <strong>in</strong> PROC GENMOD- EVENT/TRIAL-Syntax0 9. 0 60


6. Das Fazit- <strong>SAS</strong> bietet e<strong>in</strong>e Vielzahl von Möglichkeiten,logistische <strong>Regression</strong>smodelle zu fitten- Auswahl der Prozeduren ist abhängig vom Modell,für Standardanwendungen s<strong>in</strong>d aber PROCLOGISTIC und PROC GENMOD die Methoden derWahl, alle anderen vorgestellten Prozeduren s<strong>in</strong>d <strong>in</strong>andere Richtungen spezialisiertO.Kuß, <strong>Logistische</strong> <strong>Regression</strong> <strong>in</strong> <strong>SAS</strong> , KSFE 99

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!