27.04.2014 Aufrufe

DIPLOMARBEIT - Universität Oldenburg

DIPLOMARBEIT - Universität Oldenburg

DIPLOMARBEIT - Universität Oldenburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

4 Methoden 21<br />

Likelihood-Wert) erkennen, welche bei einem Ausschluss der jeweiligen Variable zu<br />

verzeichnen wäre. Je größer dieser Wert, desto stärker wäre der Informationsverlust.<br />

Die Vorteile gegenüber dem vorwärts schrittweisen Verfahren (Aufnahme von Variablen,<br />

bis keine signifikante Verbesserung mehr zu verzeichnen ist) liegen zum einen in der<br />

Berücksichtigung von Variablen, die für sich alleine keine signifikante Verbesserung des<br />

Gesamtmodells bringen, aber in Verbindung mit anderen Variablen gute Modelle liefern<br />

(PEARCE & FERRIER 2000). Zum anderen sind die Ergebnisse genauer, insbesondere bei<br />

vorhandener Kolinearität (HARRELL 2002).<br />

Entscheidend für den Ausschluss bzw. die Aufnahme der Variablen ist das verwendete<br />

Signifikanzniveau. Da ein konservatives Niveau in der Regel zu besseren Modellen führt<br />

(PEARCE & FERRIER 2000) und um ein mögliches overfitting (zu viele erklärende Variablen)<br />

zu vermeiden, wurde für den Ausschluss von Variablen bei der multiplen Analyse ein<br />

Signifikanzwert von p out = 0,05 angewandt.<br />

Durch dieses Verfahren werden diejenigen Variablen mit den höchsten Erklärungsgehalten<br />

herausgefiltert. Die Art des Zusammenhanges mit dem Vorkommen der Art lässt sich<br />

anhand des Regressionskoeffizienten β interpretieren: Positive Werte weisen darauf hin,<br />

dass höhere Werte des entsprechenden Parameters zu höheren Vorkommenswahrscheinlichkeiten<br />

führen. Für negative Werte gilt das umgekehrte Verhältnis. Die Werte<br />

der Exposition gingen in transformierter Form (als Sinus und Cosinusfunktion des<br />

Bogenmaß) in den Modellierungsprozess ein, da die ursprüngliche Skalierung bei der<br />

Berechnung zu Artefakten geführt hätte. Einige Variablen mit unimodalem Kurvenverlauf<br />

wiesen am unteren Ende der Skala Werte < 0 auf. Um Vorzeichenfehler bei der<br />

Potenzierung zu vermeiden, wurde in diesen Fällen die Differenz zu Null vor dem<br />

quadrieren addiert.<br />

4.4.2 Variablenwahl<br />

Das Ziel der statistischen Auswertung ist die Erstellung eines Modells mit hohem<br />

Erklärungsgehalt bei gleichzeitig geringer Komplexität. Daher bietet sich vor der<br />

eigentlichen Modellierung eine Vorauswahl aussagekräftiger Variablen an (HOSMER &<br />

LEMESHOW 2000). Erste Hinweise auf Art und Intensität der Zusammenhänge lassen sich<br />

aus Streudiagrammen ablesen. Dabei werden die beobachteten Vorkommen gegen die<br />

Variable aufgetragen und eine Trendlinie (lowess-plot) durch die Punkte gelegt. Weist die<br />

Trendlinie dabei einen unimodalen Zusammenhang auf, sollte auch die quadrierte Variable<br />

in das Modell eingehen.<br />

Nach dieser visuellen Inspektion wurden für alle Variablen zunächst univariate Modelle<br />

erstellt und mit Hilfe des LR-Tests auf Signifikanz getestet. Aufgrund der großen Anzahl<br />

eingehender Variablen, wurden nur solche mit p < 0,05 für die weitere Modellierung<br />

verwendet. HOSMER & LEMESHOW (2000) schlagen zwar 0,25 vor, doch PEARCE &<br />

FERRIER (2000) erreichten mit konservativeren Signifikanzniveaus bessere und robustere<br />

Modelle.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!