DIPLOMARBEIT - Universität Oldenburg
DIPLOMARBEIT - Universität Oldenburg
DIPLOMARBEIT - Universität Oldenburg
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
4 Methoden 21<br />
Likelihood-Wert) erkennen, welche bei einem Ausschluss der jeweiligen Variable zu<br />
verzeichnen wäre. Je größer dieser Wert, desto stärker wäre der Informationsverlust.<br />
Die Vorteile gegenüber dem vorwärts schrittweisen Verfahren (Aufnahme von Variablen,<br />
bis keine signifikante Verbesserung mehr zu verzeichnen ist) liegen zum einen in der<br />
Berücksichtigung von Variablen, die für sich alleine keine signifikante Verbesserung des<br />
Gesamtmodells bringen, aber in Verbindung mit anderen Variablen gute Modelle liefern<br />
(PEARCE & FERRIER 2000). Zum anderen sind die Ergebnisse genauer, insbesondere bei<br />
vorhandener Kolinearität (HARRELL 2002).<br />
Entscheidend für den Ausschluss bzw. die Aufnahme der Variablen ist das verwendete<br />
Signifikanzniveau. Da ein konservatives Niveau in der Regel zu besseren Modellen führt<br />
(PEARCE & FERRIER 2000) und um ein mögliches overfitting (zu viele erklärende Variablen)<br />
zu vermeiden, wurde für den Ausschluss von Variablen bei der multiplen Analyse ein<br />
Signifikanzwert von p out = 0,05 angewandt.<br />
Durch dieses Verfahren werden diejenigen Variablen mit den höchsten Erklärungsgehalten<br />
herausgefiltert. Die Art des Zusammenhanges mit dem Vorkommen der Art lässt sich<br />
anhand des Regressionskoeffizienten β interpretieren: Positive Werte weisen darauf hin,<br />
dass höhere Werte des entsprechenden Parameters zu höheren Vorkommenswahrscheinlichkeiten<br />
führen. Für negative Werte gilt das umgekehrte Verhältnis. Die Werte<br />
der Exposition gingen in transformierter Form (als Sinus und Cosinusfunktion des<br />
Bogenmaß) in den Modellierungsprozess ein, da die ursprüngliche Skalierung bei der<br />
Berechnung zu Artefakten geführt hätte. Einige Variablen mit unimodalem Kurvenverlauf<br />
wiesen am unteren Ende der Skala Werte < 0 auf. Um Vorzeichenfehler bei der<br />
Potenzierung zu vermeiden, wurde in diesen Fällen die Differenz zu Null vor dem<br />
quadrieren addiert.<br />
4.4.2 Variablenwahl<br />
Das Ziel der statistischen Auswertung ist die Erstellung eines Modells mit hohem<br />
Erklärungsgehalt bei gleichzeitig geringer Komplexität. Daher bietet sich vor der<br />
eigentlichen Modellierung eine Vorauswahl aussagekräftiger Variablen an (HOSMER &<br />
LEMESHOW 2000). Erste Hinweise auf Art und Intensität der Zusammenhänge lassen sich<br />
aus Streudiagrammen ablesen. Dabei werden die beobachteten Vorkommen gegen die<br />
Variable aufgetragen und eine Trendlinie (lowess-plot) durch die Punkte gelegt. Weist die<br />
Trendlinie dabei einen unimodalen Zusammenhang auf, sollte auch die quadrierte Variable<br />
in das Modell eingehen.<br />
Nach dieser visuellen Inspektion wurden für alle Variablen zunächst univariate Modelle<br />
erstellt und mit Hilfe des LR-Tests auf Signifikanz getestet. Aufgrund der großen Anzahl<br />
eingehender Variablen, wurden nur solche mit p < 0,05 für die weitere Modellierung<br />
verwendet. HOSMER & LEMESHOW (2000) schlagen zwar 0,25 vor, doch PEARCE &<br />
FERRIER (2000) erreichten mit konservativeren Signifikanzniveaus bessere und robustere<br />
Modelle.