08.11.2014 Aufrufe

Mosaic Plots (mit einer Zielvariable)

Mosaic Plots (mit einer Zielvariable)

Mosaic Plots (mit einer Zielvariable)

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

<strong>Mosaic</strong> <strong>Plots</strong><br />

(<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>)<br />

Seminar „Statistische Graphik“<br />

Martina Güntner<br />

19.01.2005


Gliederung<br />

1. Einführendes Beispiel: <strong>Mosaic</strong> <strong>Plots</strong><br />

2. Logistische Regression<br />

2.1. Modellgleichung<br />

2.2. Schätzung der Koeffizienten<br />

2.3. Interpretation der Koeffizienten<br />

3. Tests<br />

3.1. Likelihood Ratio Test<br />

3.2. Wald Test<br />

3.3. Score Test<br />

4. Beispiel: Titanic Datensatz<br />

5. Zusammenfassung<br />

6. Empfehlungen<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 2


1. Einführendes Beispiel<br />

Titanic Datensatz<br />

2201 Passagiere<br />

Variablen: Survived (Yes, No)<br />

Sex<br />

Class<br />

Age<br />

(Male, Female)<br />

(First, Second, Third, Crew)<br />

(Adult, Child)<br />

keine fehlenden Werte<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 3


1. Einführendes Beispiel<br />

Spineplots<br />

Durch Highlighting kann die bedingte Verteilung<br />

der Überlebenden dargestellt werden<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 4


1. Einführendes Beispiel<br />

• Überlebensrate der Frauen<br />

in allen Klassen höher als<br />

die der Männer<br />

• alle Kinder aus der 1. und<br />

2. Klasse haben überlebt<br />

• in der 3. Klasse ist die<br />

Überlebensrate der<br />

Mädchen höher als die der<br />

Jungen<br />

• Anteil der Kinder steigt von<br />

der 1. zur 3. Klasse an<br />

• keine Kinder in der Crew<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 5


1. Einführendes Beispiel<br />

Durch unterschiedliche Anordnung der einzelnen Variablen<br />

werden verschiedene Aspekte der Daten betont:<br />

Vergleich der Überlebensraten<br />

zwischen Männern und Frauen<br />

(aufgeteilt nach den Klassen)<br />

Vergleich der Überlebensraten<br />

innerhalb den Klassen<br />

(aufgeteilt nach dem Geschlecht)<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 6


1. Einführendes Beispiel<br />

• bei den Frauen: sehr hohe<br />

Überlebensraten in der 1. und<br />

2. Klasse; deutlich geringere<br />

in der 3. Klasse<br />

• höchste Überlebensrate bei<br />

den Männern in der 1. Klasse<br />

• überraschenderweise<br />

Überlebensrate in der 3. Klasse<br />

höher als in der 2. Klasse<br />

• Welche Stellung hatte die Crew?<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 7


2. Logistische Regression<br />

Logistische Regression<br />

Welchen Einfluss haben eine oder mehrere erklärende Variablen<br />

auf eine binäre <strong>Zielvariable</strong>?<br />

Variablen<br />

<strong>Zielvariable</strong> Y: binär (dichotom)<br />

erklärende Variablen X: stetig oder kategoriell<br />

Logistische Regression = indirektes Modell<br />

Es wird nicht der Einfluss auf die <strong>Zielvariable</strong>, sondern auf die<br />

Wahrscheinlichkeit, dass diese den Wert 1 annimmt, geschätzt.<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 8


2.1. Modellgleichung<br />

Bei <strong>einer</strong> Interpretation als Wahrscheinlichkeit sind nur<br />

Prognosewerte zwischen 0 und 1 sinnvoll<br />

→ linearer Ansatz (analog zur linearen Regression) nicht<br />

möglich!<br />

Statt das lineare Modell auf die ursprüngliche Variable <strong>mit</strong><br />

begrenztem Wertebereich anzuwenden, ließe es sich problemlos<br />

auf eine transformierte <strong>Zielvariable</strong> <strong>mit</strong> unendlichem<br />

Wertebereich anwenden.<br />

Diese Transformation erfolgt in 2 Schritten:<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 9


2.1. Modellgleichung<br />

1. Betrachtung der Odds<br />

Als Odds bezeichnet man den Quotienten aus zwei<br />

Wahrscheinlichkeiten – nämlich der Wahrscheinlichkeit, dass<br />

das Ereignis eintritt (Y=1) und der Wahrscheinlichkeit, dass das<br />

Ereignis nicht eintritt (Y=0).<br />

Odds<br />

=<br />

P(Y = 1 | X)<br />

1−<br />

P(Y = 1|<br />

X)<br />

=<br />

π<br />

1−<br />

π<br />

Der Wertebereich der Odds liegt nun zwischen 0 und + ∞ ,<br />

d.h. er ist immer noch nach unten begrenzt.<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 10


2.1. Modellgleichung<br />

2. Betrachtung der Log Odds (Logit)<br />

Durch Logarithmieren wird die nun auch die untere Begrenzung<br />

aufgehoben, d.h. der Wertebereich wird auf ( −∞,<br />

+∞)<br />

ausgeweitet.<br />

logit(π)<br />

=<br />

⎛ π<br />

ln⎜<br />

⎝1−<br />

π<br />

⎞<br />

⎟<br />

⎠<br />

Im Gegensatz zur linearen Regression wird also nicht die<br />

Ausprägung der <strong>Zielvariable</strong> als Linearkombination der<br />

erklärenden Variablen betracht, sondern der logit:<br />

logit<br />

⎛ π ⎞<br />

π ) = ln⎜<br />

⎟ =<br />

π<br />

Xβ<br />

= β + β X + ... +<br />

⎝1−<br />

⎠<br />

β<br />

0 1<br />

(<br />

1<br />

p X p<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 11


2.1. Modellgleichung<br />

Auflösen nach der Eintrittswahrscheinlichkeit π ergibt:<br />

1<br />

π = 1<br />

Xβ<br />

+ e −<br />

(Logit-Modell)<br />

wobei<br />

F(<br />

x)<br />

1<br />

= 1 + e<br />

−x<br />

die logistische Verteilungsfunktion ist.<br />

Man verbindet also π über eine sogenannte Linkfunktion F <strong>mit</strong><br />

Xβ<br />

dem linearen Prediktor :<br />

π =<br />

F ( Xβ )<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 12


2.1. Modellgleichung<br />

Überblick<br />

Wahrscheinlichkeit Odds Logit<br />

1 π Xβ<br />

π = = e<br />

1<br />

Xβ<br />

+ e −<br />

1−π<br />

⎛ π ⎞<br />

ln⎜<br />

⎟<br />

⎝1−π<br />

⎠<br />

=<br />

Xβ<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 13


2.2. Schätzung der Koeffizienten<br />

Die Parameter β werden <strong>mit</strong> der Maximum - Likelihood Methode<br />

geschätzt.<br />

Idee der ML-Schätzung:<br />

Bestimme die Parameter so, dass das Auftreten der gegebenen<br />

Stichprobe am Wahrscheinlichsten ist.<br />

Yi<br />

ist binomialverteilt:<br />

Y<br />

i<br />

~<br />

B( 1 ,π<br />

i<br />

)<br />

<strong>mit</strong><br />

π<br />

i<br />

1<br />

= 1 + e<br />

− X<br />

i<br />

β<br />

Likelihoodfunktion:<br />

L<br />

=<br />

n<br />

∏<br />

i=<br />

1<br />

π<br />

Yi<br />

i<br />

( 1−π<br />

)<br />

i<br />

(1−Y<br />

)<br />

i<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 14


2.2. Schätzung der Koeffizienten<br />

Da das Maximum der Likelihoodfunktion schwierig zu bestimmen<br />

ist (Produkt!), führt man eine Logarithmustransformation durch:<br />

ln<br />

L<br />

=<br />

n<br />

∑<br />

∑<br />

Y i<br />

⋅lnπ<br />

+ (1 −Y<br />

i<br />

i= 1 i=<br />

1<br />

n<br />

i<br />

) ⋅ln(1<br />

−π<br />

)<br />

i<br />

Um das Maximum zu finden muss diese Funktion für jede<br />

Komponente j des β - Vektors abgeleitet werden<br />

(die Ableitung nennt man Score-Funktion):<br />

∂ ln L<br />

∂β<br />

0<br />

= −<br />

n<br />

∑<br />

i=<br />

1<br />

(1 −<br />

Y i<br />

) +<br />

n<br />

∑<br />

i=<br />

1<br />

(1 −π<br />

) = 0<br />

i<br />

!<br />

∂ ln L<br />

= X<br />

ij<br />

( Yi<br />

−π<br />

i<br />

) =<br />

!<br />

0 ,<br />

∂β<br />

j<br />

j<br />

= 1,...,<br />

p<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 15


2.2. Schätzung der Koeffizienten<br />

Es muss also ein kompliziertes nichtlineares Gleichungssystem<br />

gelöst werden.<br />

meistens nicht exakt lösbar<br />

→ iterative Verfahren (z.B.: Newton Raphson Algorithmus)<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 16


2.3. Interpretation der Koeffizienten<br />

Interpretation oft schwierig:<br />

Die Nicht-Linearität der logistischen Funktion bewirkt, dass sich<br />

eine Zu- bzw. Abnahme von X in unterschiedlichen Regionen<br />

verschieden auswirkt.<br />

„Sättigungseffekt“<br />

Kaum Veränderung<br />

der vorhergesagten<br />

Wahrscheinlichkeit in<br />

den „Extrembereichen“<br />

des X-Wertes<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 17


2.3. Interpretation der Koeffizienten<br />

Logit (additives Modell)<br />

Eine Erhöhung von X i<br />

um eine Einheit bewirkt eine Erhöhung<br />

des logit um den konstante Wert<br />

(analog zur linearen Regression)<br />

Problem: Was bedeutet aber eine Veränderung des logits?<br />

β i<br />

Richtung des Effekts:<br />

β ><br />

i<br />

βi<br />

<<br />

β =<br />

i<br />

0<br />

0<br />

0<br />

positiver Effekt<br />

negativer Effekt<br />

kein Effekt<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 18


2.3. Interpretation der Koeffizienten<br />

Odds (multiplikatives Modell)<br />

Der Exponent des Koeffizienten i gibt den Faktor an, um den<br />

sich die Odds bei einem Anstieg der erklärenden Variablen X i um<br />

eine Einheit verändern.<br />

e β<br />

e β<br />

Den Faktor i nennt man Effektkoeffizient.<br />

Richtung des Effekts:<br />

e<br />

β<br />

i<br />

> 1<br />

positiver<br />

Effekt<br />

e<br />

β<br />

i<br />

< 1<br />

negativer<br />

Effekt<br />

e<br />

β<br />

i<br />

= 1<br />

kein Effekt<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 19


2.3. Interpretation der Koeffizienten<br />

Beispiel (Titanic Datensatz)<br />

Call:<br />

glm(formula = Survived ~ Sex, family = binomial)<br />

Coefficients:<br />

Estimate Std. Error z value Pr(>|z|)<br />

(Intercept) 1.0044 0.1041 9.645


2.3. Interpretation der Koeffzienten<br />

Beispiel (Fortsetzung)<br />

odds ( Yes |<br />

Female)<br />

= e<br />

1.0044<br />

=<br />

2.73<br />

≈<br />

3:1<br />

Odds = Wahrscheinlichkeitsverhältnis<br />

Wahrscheinlichkeit zu Überleben im Verhältnis zur Wahrscheinlichkeit<br />

nicht zu Überleben<br />

Für eine Frau waren die Wahrscheinlichkeit zu überleben in etwa<br />

dreimal so hoch wie nicht zu überleben.<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 21


2.3. Interpretation der Koeffizienten<br />

Beispiel (Fortsetzung)<br />

Bei binären erklärenden Variablen gibt der Effektkoeffizient an,<br />

um welchen Faktor sich die Odds ändern, wenn man von der<br />

Gruppe, die <strong>mit</strong> 0 kodiert (Female) wurde, zu der Gruppe<br />

wechselt, die <strong>mit</strong> 1 (Male) kodiert wurde.<br />

odds ( Yes |<br />

Male)<br />

=<br />

odds<br />

( Yes |<br />

Female)<br />

⋅e<br />

−2.3172<br />

=<br />

2.73⋅0.09855<br />

=<br />

0.27<br />

Für einen Mann standen die Chancen bei 0,27 : 1.<br />

Oder anders ausgedrückt: Für einen Mann war es also fast<br />

viermal so wahrscheinlich zu sterben wie zu überleben.<br />

1<br />

odds ( No | Male)<br />

= = 3.72<br />

0.27<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 22


2.3. Interpretation der Koeffizienten<br />

Beispiel (Fortsetzung)<br />

Um nun die Überlebenschancen von Frauen und Männern<br />

vergleichen zu können, bildet man das Odds Ratio.<br />

Das Odds Ratio ist also ein Maß für die Stärke des Unterschieds<br />

zwischen zwei Gruppen, hier Frauen und Männern.<br />

OddsRatio =<br />

odds(<br />

Yes | Female)<br />

odds(<br />

Yes | Male)<br />

=<br />

2,73<br />

0,27<br />

= 10,1<br />

d.h. die Odds <strong>einer</strong> Frau zu überleben waren ungefähr 10-mal so<br />

groß, wie die der Männer.<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 23


2.3. Interpretation der Koeffizienten<br />

allgemein: Odds Ratio<br />

Vergleich der i-ten Beobachtung (<strong>mit</strong> den erklärenden Variablen<br />

X<br />

i<br />

= ( X<br />

i<br />

, X<br />

i2,...,<br />

X<br />

1 ip<br />

) ) <strong>mit</strong> der j-ten Beobachtung (<strong>mit</strong> den<br />

erklärenden Variablen X = X , X ,..., X ) ):<br />

j<br />

(<br />

j1 j2<br />

jp<br />

β0<br />

+ ∑βk<br />

X ik<br />

p<br />

k 1<br />

Odds X<br />

∑<br />

i<br />

) e<br />

k=<br />

1<br />

OddsRatio = =<br />

p<br />

= e<br />

Odds(<br />

X<br />

j<br />

) β0<br />

+ ∑βk<br />

X jk<br />

k=<br />

1<br />

e<br />

p<br />

(<br />

β<br />

= k ( X ik −<br />

X<br />

jk<br />

)<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 24


3. Tests<br />

allgemeine lineare Hypothese:<br />

H Cβ<br />

= ξ gegen H : Cβ<br />

≠ ξ<br />

0<br />

:<br />

1<br />

wobei C eine r × p Matrix <strong>mit</strong> rang ( C)<br />

= r und ξ ein Vektor ist<br />

r: Anzahl der Restriktionen unter H o<br />

p: Anzahl der geschätzten Parameter<br />

• simultane Tests<br />

• Tests über Linearkombinationen von Parameter<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 25


3. Tests<br />

konkrete Beispiele:<br />

• Test, ob die Variable X i<br />

einen signifikanten Einfluss auf hat:<br />

H0 : β 0 gegen H1<br />

: β ≠<br />

i<br />

=<br />

i<br />

• Test auf Gleichheit zweier Koeffizienten:<br />

0<br />

äquivalent zur allgemeinen Form <strong>mit</strong> C = ( 0...1...0) und ξ = 0<br />

i-te Stelle<br />

π<br />

H<br />

β = β<br />

: β ≠<br />

0<br />

:<br />

i j<br />

gegen H1<br />

⇔ H<br />

0<br />

: β<br />

i<br />

− β<br />

j<br />

= 0 gegen H1<br />

: βi<br />

− β<br />

j<br />

≠ 0<br />

C =<br />

( 0 L 0 1 0 L 0 −1<br />

0 L 0)<br />

i<br />

β<br />

j<br />

ξ = 0<br />

i-te Stelle<br />

j-te Stelle<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 26


3. Tests<br />

• Test, ob r ≤ p der Koeffizienten signifikant von Null<br />

verschieden sind (Annahme: die r ersten Koeffizienten):<br />

C<br />

=<br />

⎛1<br />

⎜<br />

⎜0<br />

⎜ M<br />

⎜<br />

⎝0<br />

0<br />

1<br />

0<br />

L<br />

L<br />

O<br />

L<br />

L<br />

K<br />

1<br />

L<br />

L<br />

L<br />

L<br />

L<br />

L<br />

0⎞<br />

⎟<br />

0⎟<br />

M ⎟<br />

⎟<br />

0<br />

⎠<br />

ξ =<br />

⎛0⎞<br />

⎜ ⎟<br />

⎜0⎟<br />

⎜ M ⎟<br />

⎜ ⎟<br />

⎝0⎠<br />

Achtung:<br />

H<br />

∃ βi<br />

: βi<br />

≠ 0, i = 1,..,r<br />

nicht H : ∀βi<br />

: βi<br />

≠ 0, i 1,..,<br />

r<br />

1<br />

:<br />

1<br />

=<br />

d.h. zur Ablehnung der Nullhypothese ist es nicht erforderlich,<br />

dass alle Koeffizienten ungleich Null sind!<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 27


3.1. Likelihood Ratio Test<br />

Idee des Test:<br />

Vergleich des Wertes der Loglikelihoodfunktion an der Stelle des<br />

unrestringierten Schätzers βˆ <strong>mit</strong> dem Wert an der Stelle des<br />

ˆβ 0<br />

restringierten Schätzers .<br />

Anpassung zweier Modelle erforderlich:<br />

• M1: Modell ohne Restriktionen → Schätzung von βˆ<br />

• M0: Modell <strong>mit</strong> Restriktionen → Schätzung von<br />

ˆβ 0<br />

ˆβ 0<br />

Man erhält also durch Maximierung der Loglikelihoodfunktion<br />

Cβ = ξ<br />

unter den linearen Nebenbedingungen .<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 28


3.1. Likelihood Ratio Test<br />

Teststatistik<br />

LR<br />

= −<br />

⎛<br />

⎜<br />

⎝<br />

L<br />

⎞<br />

⎟<br />

⎠<br />

2<br />

( ln L − ln L ) = −2(<br />

l − l ~ a χ<br />

0<br />

2ln⎜<br />

= −2<br />

0 1<br />

0 1)<br />

r<br />

L ⎟<br />

1<br />

(r = Anzahl der Restriktionen unter H 0 )<br />

wobei: ln L 0<br />

: Loglikelihood des Modells unter der Nullhypothese<br />

ln L 1 : Loglikelihood des Modells ohne Restriktionen<br />

Testentscheidung<br />

α<br />

Lehne H 0 zum Signifikantniveau ab, wenn:<br />

LR > χ r<br />

2<br />

; 1 − α<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 29


3.2. Wald Test<br />

Idee des Test:<br />

Schätzung der Modells ohne Restriktionen<br />

Prüfung, inwieweit die quadrierten und varianzgewichteten<br />

Abweichungen von der Restriktion so erheblich sind, dass<br />

verworfen werden muss.<br />

H 0<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 30


3.2. Wald Test<br />

Teststatistik<br />

• Matrixschreibweise:<br />

H : Cβ = ξ<br />

0<br />

W<br />

=<br />

ˆ β<br />

ξ<br />

ˆ) β<br />

ˆ β<br />

−1<br />

2<br />

( C − )'( C Cov(<br />

C')<br />

( C − ) ~ a<br />

r<br />

ξ<br />

χ<br />

• Spezialfall:<br />

W =<br />

ˆ β<br />

ˆ σ<br />

2<br />

i<br />

2<br />

i<br />

a<br />

~<br />

χ<br />

2<br />

1<br />

H<br />

0<br />

: β i<br />

=<br />

0<br />

Testentscheidung<br />

Lehne H 0<br />

zum Signifikantniveau ab, wenn:<br />

α<br />

W > r<br />

2<br />

χ<br />

; 1 − α<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 31


3.3. Score Test<br />

Idee des Tests<br />

Schätzung des Modells <strong>mit</strong> Restriktionen<br />

Wenn H 0<br />

zutrifft, dann sollte die Steigung der Loglikelihood-<br />

Funktion an der Stelle nicht signifikant von Null verschieden<br />

sein.<br />

ˆβ 0<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 32


3.3. Score Test<br />

Teststatistik<br />

U<br />

=<br />

s<br />

ˆ<br />

ˆ<br />

2<br />

( β<br />

0<br />

)' Cov(<br />

β<br />

0)<br />

s(<br />

β0)<br />

~ χr<br />

ˆ<br />

wobei<br />

s(<br />

ˆ β )<br />

0<br />

=<br />

∂ ln L<br />

∂β<br />

β = ˆ β<br />

0<br />

(Scorevektor)<br />

Testentscheidung<br />

2<br />

Lehne H 0<br />

zum Signifikantniveau ab, wenn: U > r<br />

α<br />

χ<br />

; 1 − α<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 33


Tests - Vergleich<br />

Beziehungen zwischen den drei Teststatistiken<br />

Alle drei Testmethoden können zur Prüfung der gleichen<br />

Hypothesen verwendet werden.<br />

Die Wald – und Score – Statistik sind eine quadratische<br />

Approximation der LR – Statistik.<br />

Alle drei Tests asymptotisch äquivalent, d.h. sie führen für große<br />

Stichprobenumfänge zum gleichen Ergebnis.<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 34


Tests - Vergleich<br />

Welchen Test wann verwenden?<br />

• LR-Test: ist zuverlässiger als der Wald- und Score-Test.<br />

Nachteil: Anpassung zweier Modelle notwendig<br />

• Wald-Test: nur Anpassung des Modells ohne Restriktionen<br />

→ Rückwärtsselektion: Variable <strong>mit</strong> der kleinsten Wald-<br />

Statistik aus dem Modell nehmen<br />

• Score-Test: nur Anpassung des Modells <strong>mit</strong> Restriktionen<br />

→ Vorwärtsselektion: Variable <strong>mit</strong> der größten Score-Statistik<br />

ins Modell aufnehmen<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 35


4. Beispiel: Titanic Datensatz<br />

Mögliche Fragestellungen:<br />

• Waren die Überlebensraten<br />

der Männer in der 2. und 3.<br />

Klasse gleich groß?<br />

• War die Überlebensrate<br />

der männlichen Crew<br />

genauso hoch wie die der<br />

Männer in der 3. Klasse?<br />

• Hatten die Frauen in der<br />

Crew genauso hohe<br />

Überlebensraten wie in der<br />

1. und 2. Klasse?<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 36


4. Beispiel: Titanic Datensatz<br />

Mögliche Fragestellungen:<br />

• Waren die Überlebensraten<br />

der Männer in der 2. und 3.<br />

Klasse gleich groß?<br />

• War die Überlebensrate<br />

der männlichen Crew<br />

genauso hoch wie die der<br />

Männer in der 3. Klasse?<br />

• Hatten die Frauen in der<br />

Crew genauso hohe<br />

Überlebensraten wie in der<br />

1. und 2. Klasse?<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 37


4. Beispiel: Titanic Datensatz<br />

zunächst: welches Modell verwenden?<br />

(Modell <strong>mit</strong> oder ohne Interaktion zwischen Class und Sex)<br />

Modell<br />

m1: Survived ~ Sex + Class<br />

m2: Survived ~ Sex * Class<br />

Devianz<br />

2228.9<br />

2163.7<br />

df<br />

2196<br />

2193<br />

Likelihood Ratio Test<br />

LR = 2228.9<br />

− 2163.7 = 65.2 > 7.8147 = χ<br />

2<br />

3;0.95<br />

d.h. das Modell m2 ist signifikant besser als m1<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 38


4. Beispiel: Titanic Datensatz<br />

Call:<br />

glm(formula = Survived ~ Sex * Class, family = binomial)<br />

Coefficients:<br />

Estimate Std. Error z value Pr(>|z|)<br />

(Intercept) 1.89712 0.61914 3.064 0.00218 **<br />

SexMale -3.14690 0.62453 -5.039 4.68e-07 ***<br />

ClassFirst 1.66535 0.80026 2.081 0.03743 *<br />

ClassSecond 0.07053 0.68630 0.103 0.91815<br />

ClassThird -2.06075 0.63551 -3.243 0.00118 **<br />

SexMale:ClassFirst -1.05911 0.81959 -1.292 0.19627<br />

SexMale:ClassSecond -0.63882 0.72402 -0.882 0.37760<br />

SexMale:ClassThird 1.74286 0.65139 2.676 0.00746 **<br />

---<br />

Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1<br />

(Dispersion parameter for binomial family taken to be 1)<br />

Null deviance: 2769.5 on 2200 degrees of freedom<br />

Residual deviance: 2163.7 on 2193 degrees of freedom<br />

AIC: 2179.7<br />

Number of Fisher Scoring iterations: 6<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 39


Koeffizienten des Modells m2<br />

4. Beispiel: Titanic Datensatz<br />

(Intercept) 1.89712 SexMale:ClassFirst -1.05911<br />

SexMale -3.14690 SexMale:ClassSecond -0.63882<br />

ClassFirst 1.66535 SexMale:ClassThird 1.74286<br />

ClassSecond 0.07053<br />

ClassThird -2.06075<br />

Überlebenswahrscheinlichkeit eines Mannes der 2. Klasse:<br />

1<br />

P ( Y = 1| Male,<br />

Second)<br />

=<br />

− 1.89712−3.14690+<br />

0.07053 0.63882<br />

1+<br />

e<br />

− )<br />

(<br />

=<br />

0.13967<br />

Überlebenswahrscheinlichkeit eines Mannes der 3. Klasse:<br />

1<br />

P ( Y = 1| Male,<br />

Third ) =<br />

− 1.89712−3.14690−2.06075<br />

1.74286<br />

1+<br />

e<br />

+ )<br />

(<br />

=<br />

0.17255<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 40


Koeffizienten des Modells m2<br />

4. Beispiel: Titanic Datensatz<br />

(Intercept) 1.89712 SexMale:ClassFirst -1.05911<br />

SexMale -3.14690 SexMale:ClassSecond -0.63882<br />

ClassFirst 1.66535 SexMale:ClassThird 1.74286<br />

ClassSecond 0.07053<br />

ClassThird -2.06075<br />

Überlebenswahrscheinlichkeit eines Mannes der 2. Klasse:<br />

1<br />

P ( Y = 1| Male,<br />

Second)<br />

=<br />

− 1.89712−3.14690+<br />

0.07053 0.63882<br />

1+<br />

e<br />

− )<br />

(<br />

=<br />

0.13967<br />

Überlebenswahrscheinlichkeit eines Mannes der 3. Klasse:<br />

1<br />

P ( Y = 1| Male,<br />

Third ) =<br />

− 1.89712−3.14690−2.06075<br />

1.74286<br />

1+<br />

e<br />

+ )<br />

(<br />

=<br />

0.17255<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 41


4. Beispiel: Titanic Datensatz<br />

Modellgleichung<br />

logit<br />

=<br />

β + β ⋅ Male + β ⋅ First + β ⋅ Second + β ⋅Third<br />

+<br />

0<br />

+ β ⋅ MaleFirst + β ⋅ MaleSecond + β ⋅ MaleThird<br />

5<br />

1<br />

2<br />

6<br />

3<br />

7<br />

4<br />

Aufstellen der Hypothesen<br />

H 0 : Die Überlebenswahrscheinlichkeiten der Männer in der<br />

zweiten und dritten Klasse sind gleich<br />

⇔<br />

H<br />

: β β β β<br />

β + β ≠ β + β<br />

0 3<br />

+<br />

6<br />

=<br />

4<br />

+<br />

7<br />

gegen H1<br />

:<br />

3<br />

6<br />

4<br />

7<br />

⇔<br />

H<br />

0<br />

: β3<br />

− β4<br />

+ β6<br />

− β7<br />

= 0 gegen H1<br />

: β3<br />

− β4<br />

+ β6<br />

− β7<br />

≠<br />

0<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 42


4. Beispiel: Titanic Datensatz<br />

Wald Test<br />

• Definition der Matrix C und der rechten Seite<br />

allgemeine Nullhypothese:<br />

in diesem Beispiel:<br />

H :<br />

0<br />

Cβ = ξ<br />

H : β − β<br />

0 3 4<br />

+ β 6<br />

− β 7<br />

= 0<br />

also:<br />

C<br />

( 0 0 0 1 -1 0 1 -1) = 0<br />

= ξ<br />

in R:<br />

C


4. Beispiel: Titanic Datensatz<br />

• Funktion waldtest:<br />

waldtest


4. Beispiel: Titanic Datensatz<br />

> waldtest(C,r,m2)<br />

$Teststatstik<br />

[1] 1.041136<br />

$Quantil<br />

[1] 3.841459<br />

$pWert<br />

[1] 0.3075574<br />

Die Nullhypothese wird nicht verworfen. Es besteht also kein<br />

signifikanter Unterschied in der Überlebensraten der Männer in der 2.<br />

und 3. Klasse!<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 45


4. Beispiel: Titanic Datensatz<br />

Likelihood Ratio Test<br />

Es müssen zwei verschiedene Modelle angepasst werden:<br />

• m2: Es werden keine Restriktionen an die Parameter gestellt<br />

• m3: Modell unter der Nullhypothese, d.h. es wird<br />

angenommen, dass gilt: β + β = β +<br />

m2<br />

logit = β<br />

0<br />

3 6 4<br />

β7<br />

+ β ⋅ Male + β ⋅ First + β ⋅ Second + β ⋅Third<br />

+<br />

+ β ⋅ MaleFirst + β ⋅ MaleSecond + β ⋅ MaleThird<br />

5<br />

1<br />

2<br />

6<br />

3<br />

7<br />

4<br />

m3 (<br />

β<br />

3<br />

= β4<br />

+ β7<br />

− β6<br />

+ β ⋅(<br />

MaleSecond<br />

6<br />

0<br />

1<br />

2<br />

in m2 einsetzen)<br />

logit = β + β ⋅ Male + β ⋅ First + β ⋅(<br />

Third<br />

− Second)<br />

+ β ⋅(<br />

MaleThird<br />

7<br />

4<br />

+ Second)<br />

+ β ⋅ MaleFirst<br />

+ Second)<br />

5<br />

+<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 46


4. Beispiel: Titanic Datensatz<br />

Schätzung der Modells m3:<br />

dazu: Definition neuer Variablen (in Excel):<br />

First:<br />

1, falls Class = First<br />

0, sonst<br />

Second:<br />

1, falls Class = Second<br />

0, sonst<br />

Third:<br />

1, falls Class = Third<br />

0, sonst<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 47


4. Beispiel: Titanic Datensatz<br />

MaleFirst:<br />

1, falls Class = First und Sex = Male<br />

0, sonst<br />

MaleSecond: 1, falls Class = Second und Sex = Male<br />

0, sonst<br />

MaleThird:<br />

1, falls Class = Third und Sex = Male<br />

0, sonst<br />

in R:<br />

> X1 X2 X3


4. Beispiel: Titanic<br />

Call:<br />

glm(formula = Survived ~ Sex + First + X1 + MaleFirst + X2 + X3,<br />

family = binomial)<br />

Coefficients:<br />

Estimate Std. Error z value Pr(>|z|)<br />

(Intercept) 1.8971 0.6191 3.064 0.00218 **<br />

SexMale -3.1469 0.6245 -5.039 4.68e-07 ***<br />

First 1.6653 0.8003 2.081 0.03743 *<br />

X1 -2.0607 0.6355 -3.243 0.00118 **<br />

MaleFirst -1.0591 0.8196 -1.292 0.19627<br />

X2 -0.4495 0.6988 -0.643 0.52008<br />

X3 1.6818 0.6490 2.592 0.00956 **<br />

---<br />

Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1<br />

(Dispersion parameter for binomial family taken to be 1)<br />

Null deviance: 2769.5 on 2200 degrees of freedom<br />

Residual deviance: 2164.8 on 2194 degrees of freedom<br />

AIC: 2178.8<br />

Number of Fisher Scoring iterations: 6<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 49


4. Beispiel: Titanic Datensatz<br />

in R:<br />

lrtest


4. Beispiel: Titanic Datensatz<br />

andere Möglichkeit: Chi - Quadrat - Test<br />

Class<br />

Male<br />

Female<br />

No Yes No Yes<br />

Crew 670 192 3 20<br />

First 118 62 4 141<br />

Second 154 25 13 93<br />

Third 422 88 106 90<br />

Pearson's Chi-squared test<br />

data: t<br />

X-squared = 1.045, df = 1, p-value = 0.3067<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 51


4. Beispiel: Titanic Datensatz<br />

Mögliche Fragestellungen:<br />

• Waren die Überlebensraten<br />

der Männer in der 2. und 3.<br />

Klasse gleich groß?<br />

• War die Überlebensrate<br />

der männlichen Crew<br />

genauso hoch wie die der<br />

Männer in der 3. Klasse?<br />

• Hatten die Frauen in der<br />

Crew genauso hohe<br />

Überlebensraten wie in der<br />

1. und 2. Klasse?<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 52


4. Beispiel: Titanic Datensatz<br />

Ausgangspunkt ist wieder das Modell: Survived ~ Sex * Class<br />

logit<br />

= β + β ⋅ Male + β ⋅ First + β ⋅ Second + β ⋅Third<br />

+<br />

0<br />

+ β ⋅ MaleFirst + β ⋅ MaleSecond + β ⋅ MaleThird<br />

5<br />

1<br />

2<br />

6<br />

3<br />

7<br />

4<br />

Crew ist Referenzgruppe!<br />

H 0 : Die Überlebenswahrscheinlichkeiten der Männer in der Crew<br />

und in der dritten Klasse sind gleich<br />

⇔<br />

⇔<br />

H<br />

0<br />

: β4<br />

+ β7<br />

= 0 gegen H1<br />

: β4<br />

+ β7<br />

≠ 0<br />

H<br />

0<br />

: Cβ<br />

= 0 gegen H1<br />

<strong>mit</strong> C =<br />

: Cβ<br />

≠<br />

( 0 0 0 0 1 0 0 1) und ξ = 0<br />

0<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 53


4. Beispiel: Titanic Datensatz<br />

Wald Test<br />

> C r waldtest(C,r,m2)<br />

$Teststatstik<br />

[1] 4.945226<br />

$Quantil<br />

[1] 3.841459<br />

$pWert<br />

[1] 0.02616282<br />

Die Nullhypothese wird zum<br />

Signifikanzniveau von 5%<br />

verworfen.<br />

Es besteht also ein signifikanter<br />

Unterschied zwischen den<br />

Überlebensraten der Männer in<br />

der 3. Klasse und in der Crew.<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 54


4. Beispiel: Titanic Datensatz<br />

Likelihood Ratio Test<br />

m2<br />

logit = β<br />

0<br />

+ β ⋅ Male + β ⋅ First + β ⋅ Second + β ⋅Third<br />

+<br />

+ β ⋅ MaleFirst + β ⋅ MaleSecond + β ⋅ MaleThird<br />

5<br />

1<br />

2<br />

6<br />

3<br />

7<br />

4<br />

m4 (<br />

β<br />

=<br />

−<br />

4<br />

β 7<br />

in m2 einsetzen):<br />

logit<br />

= β + β ⋅ Male + β ⋅ First + β ⋅ Second + β ⋅ MaleFirst<br />

0<br />

6<br />

1<br />

2<br />

+ β ⋅ MaleSecond + β ⋅(<br />

MaleThird<br />

7<br />

3<br />

5<br />

−Third)<br />

+<br />

X


4. Beispiel: Titanic Datensatz<br />

glm(formula = Survived ~ Sex + First + Second + MaleFirst +<br />

MaleSecond + X, family = binomial)<br />

Coefficients:<br />

Estimate Std. Error z value Pr(>|z|)<br />

(Intercept) 1.89712 0.61914 3.064 0.00218 **<br />

SexMale -3.25810 0.62275 -5.232 1.68e-07 ***<br />

First 1.66535 0.80026 2.081 0.03743 *<br />

Second 0.07053 0.68630 0.103 0.91815<br />

MaleFirst -0.94792 0.81824 -1.158 0.24667<br />

MaleSecond -0.52763 0.72249 -0.730 0.46521<br />

X 2.06075 0.63551 3.243 0.00118 **<br />

---<br />

Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1<br />

(Dispersion parameter for binomial family taken to be 1)<br />

Null deviance: 2769.5 on 2200 degrees of freedom<br />

Residual deviance: 2168.8 on 2194 degrees of freedom<br />

AIC: 2182.8<br />

Number of Fisher Scoring iterations: 6<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 56


4. Beispiel: Titanic Datensatz<br />

> lrtest(m2,m4)<br />

$Teststatistik<br />

> waldtest(C,r,m2)<br />

$Teststatistik<br />

[1] 5.059706 [1] 4.945226<br />

$Quantil<br />

$Quantil<br />

[1] 3.841459 [1] 3.841459<br />

$pWert<br />

$pWert<br />

[1] 0.02448839 [1] 0.02616282<br />

LR – Test und Wald – Test liefern beide ähnliche Ergebnisse:<br />

Beide lehnen die Nullhypothese ab, d.h. es besteht ein<br />

signifikanter Unterschied zwischen den Überlebensraten der<br />

Männer in der Crew und in der 3. Klasse.<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 57


4. Beispiel: Titanic Datensatz<br />

Mögliche Fragestellungen:<br />

• Waren die Überlebensraten<br />

der Männer in der 2. und 3.<br />

Klasse gleich groß?<br />

• War die Überlebensrate<br />

der männlichen Crew<br />

genauso hoch wie die der<br />

Männer in der 3. Klasse?<br />

• Hatten die Frauen in der<br />

Crew genauso hohe<br />

Überlebensraten wie in der<br />

1. und 2. Klasse?<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 58


4. Beispiel: Titanic Datensatz<br />

Ausgangspunkt ist wieder das Modell: Survived ~ Sex * Class<br />

logit<br />

= β + β ⋅ Male + β ⋅ First + β ⋅ Second + β ⋅Third<br />

+<br />

0<br />

+ β ⋅ MaleFirst + β ⋅ MaleSecond + β ⋅ MaleThird<br />

5<br />

1<br />

2<br />

6<br />

3<br />

7<br />

4<br />

H 0 : Die Überlebenswahrscheinlichkeiten der Frauen in der Crew<br />

in der zweiten und in der dritten Klasse sind gleich<br />

Die Nullhypothese enthält nun zwei Restriktionen, nämlich:<br />

H β = β = 0 gegen : β ≠ 0 und/oder β<br />

0<br />

H<br />

: 2 3<br />

1 2<br />

3 ≠<br />

0<br />

⎛ β2<br />

⎞<br />

⎛ β2<br />

⎞<br />

H<br />

0<br />

:<br />

⎜<br />

⎟ = 0 gegen H1<br />

:<br />

⎜<br />

⎟ ≠<br />

⎝ β3<br />

⎠<br />

⎝ β3<br />

⎠<br />

0<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 59


4. Beispiel: Titanic Datensatz<br />

also:<br />

C<br />

=<br />

⎛0<br />

⎜<br />

⎝0<br />

0<br />

0<br />

1<br />

0<br />

0<br />

1<br />

0<br />

0<br />

0<br />

0<br />

0<br />

0<br />

0⎞<br />

⎟<br />

0⎠<br />

ξ =<br />

⎛0⎞<br />

⎜ ⎟<br />

⎝0⎠<br />

Wald Test<br />

> C r waldtest(C,r,m1)<br />

$Teststatstik<br />

[1] 7.882447<br />

$Quantil<br />

[1] 5.991465<br />

$pWert<br />

[1] 0.01942443<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 60


4. Beispiel: Titanic Datensatz<br />

Likelihood Ratio Test<br />

m5<br />

logit<br />

= β + β ⋅ Male + β ⋅Third<br />

0<br />

+ β ⋅ MaleThird<br />

7<br />

1<br />

4<br />

+ β ⋅ MaleFirst<br />

5<br />

+ β ⋅ MaleSecond<br />

6<br />

+<br />

> lrtest(m2,m5)<br />

$Teststatistik<br />

[1] 9.878294<br />

$Quantil<br />

[1] 5.991465<br />

$pWert<br />

[1] 0.007160703<br />

Sowohl der Waldtest als auch der LR-Test<br />

lehnt die Nullhypothese ab,<br />

d.h. es besteht ein signifikanter Unterschied<br />

zwischen den Überlebensraten der Frauen in<br />

der 1., 2. Klasse und der Crew.<br />

Der LR-Test lehnt die Nullhypothese noch<br />

etwas deutlicher ab als der Waldtest.<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 61


4. Beispiel: Titanic Datensatz<br />

Die Ablehnung der Nullhypothese beruht hierbei auf dem<br />

signifikanten Unterschied zwischen der 1. Klasse und den<br />

beiden anderen Klassen!<br />

Ein alleiniger Test der 2.<br />

Klasse gegen die Crew<br />

ergibt nämlich, dass die<br />

Überlebensraten dieser<br />

beiden Klassen als gleich<br />

angenommen werden<br />

können.<br />

(p-Wert: 0.9181 Wald Test<br />

0.9186 LR-Test)<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 62


5. Zusammenfassung<br />

<strong>Mosaic</strong> <strong>Plots</strong><br />

• <strong>Mosaic</strong> Plot = multidimensionaler Spineplot<br />

=ˆ<br />

• Highlighting Hinzufügen <strong>einer</strong> zusätzlichen binären Variable<br />

(aber ohne Lücke zwischen den beiden Kategorien)<br />

• Durch eine Veränderung der Reihenfolge der Variablen<br />

können verschiedene Aspekte der Daten verdeutlicht werden<br />

• Interaktive Abfrage<br />

• Leere Zellen werden gekennzeichnet (Mondrian: rote Linie,<br />

Manet: 0) → gut unterscheidbar von Zellen <strong>mit</strong> sehr wenigen<br />

Werten<br />

• Leere Zellen werden nicht mehr weiter unterteilt<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 63


5. Zusammenfassung<br />

Tests<br />

• Zum Test linearer Hypothesen eignen sich sowohl der<br />

Likelihood-Ratio-Test als auch der Wald- und Score-Test<br />

• Alle 3 Tests sind asymptotisch - verteilt.<br />

• Die Wald- und Score-Statistik stellt eine quadratische<br />

Approximation der LR-Statistik dar.<br />

• Die 3 Tests sind asymptotisch äquivalent.<br />

• Führen die Tests zu unterschiedlichen Ergebnissen, so sollte<br />

man den LR-Test bevorzugen.<br />

2<br />

χ<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 64


5. Zusammenfassung<br />

• Beim LR-Test muss sowohl das unrestringierte als auch das<br />

restringierte Modell angepasst werden.<br />

• Der Wald-Test kommt <strong>mit</strong> der Anpassung des unrestringierten<br />

Modells aus.<br />

• Der Score-Test verwendet nur das restringierte Modell.<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 65


5. Zusammenfassung<br />

Probleme bei der Schätzung eines logistischen Modells<br />

glm(formula = Survived ~ Class * Age + Class * Sex, family = binomial)<br />

Coefficients: (1 not defined because of singularities)<br />

Estimate Std. Error z value Pr(>|z|)<br />

...<br />

AgeChild 0.33791 0.26920 1.255 0.209391<br />

SexMale -3.14690 0.62453 -5.039 4.68e-07 ***<br />

ClassFirst:AgeChild 16.51217 858.44954 0.019 0.984654<br />

ClassSecond:AgeChild 17.28628 367.06861 0.047 0.962439<br />

ClassThird:AgeChild NA NA NA NA<br />

ClassFirst:SexMale -1.13608 0.82048 -1.385 0.166162<br />

...<br />

• Leere Zellen<br />

• Eintrittswahrscheinlichkeit nahe 0 oder 1<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 66


6. Empfehlungen<br />

Schätzung des Modells<br />

• Warnung, wenn Eintrittswahrscheinlichkeiten nahe 0 oder 1<br />

vorkommen<br />

<strong>Mosaic</strong>plots<br />

• (ein- und ausblendbare) Beschriftung des <strong>Mosaic</strong>plots<br />

• schnellere und einfachere Veränderung der Reihenfolge der<br />

Variablen<br />

• Speicherung der <strong>Plots</strong> in gängigen Grafikformaten<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 67


6. Empfehlungen<br />

Tests<br />

• Likelihood Ratio Test ist ausreichend, da der Wald Test und<br />

der Score Test nur eine Approximation darstellen<br />

• Auswahl der Zellen im <strong>Mosaic</strong> Plot → geeignetes Aufstellen<br />

der Nullhypothese, Anpassung des Modells unter der<br />

Nullhypothese und Berechnung des Likelihood Ratio Tests<br />

durch die Software<br />

19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 68

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!