Mosaic Plots (mit einer Zielvariable)
Mosaic Plots (mit einer Zielvariable)
Mosaic Plots (mit einer Zielvariable)
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
<strong>Mosaic</strong> <strong>Plots</strong><br />
(<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>)<br />
Seminar „Statistische Graphik“<br />
Martina Güntner<br />
19.01.2005
Gliederung<br />
1. Einführendes Beispiel: <strong>Mosaic</strong> <strong>Plots</strong><br />
2. Logistische Regression<br />
2.1. Modellgleichung<br />
2.2. Schätzung der Koeffizienten<br />
2.3. Interpretation der Koeffizienten<br />
3. Tests<br />
3.1. Likelihood Ratio Test<br />
3.2. Wald Test<br />
3.3. Score Test<br />
4. Beispiel: Titanic Datensatz<br />
5. Zusammenfassung<br />
6. Empfehlungen<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 2
1. Einführendes Beispiel<br />
Titanic Datensatz<br />
2201 Passagiere<br />
Variablen: Survived (Yes, No)<br />
Sex<br />
Class<br />
Age<br />
(Male, Female)<br />
(First, Second, Third, Crew)<br />
(Adult, Child)<br />
keine fehlenden Werte<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 3
1. Einführendes Beispiel<br />
Spineplots<br />
Durch Highlighting kann die bedingte Verteilung<br />
der Überlebenden dargestellt werden<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 4
1. Einführendes Beispiel<br />
• Überlebensrate der Frauen<br />
in allen Klassen höher als<br />
die der Männer<br />
• alle Kinder aus der 1. und<br />
2. Klasse haben überlebt<br />
• in der 3. Klasse ist die<br />
Überlebensrate der<br />
Mädchen höher als die der<br />
Jungen<br />
• Anteil der Kinder steigt von<br />
der 1. zur 3. Klasse an<br />
• keine Kinder in der Crew<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 5
1. Einführendes Beispiel<br />
Durch unterschiedliche Anordnung der einzelnen Variablen<br />
werden verschiedene Aspekte der Daten betont:<br />
Vergleich der Überlebensraten<br />
zwischen Männern und Frauen<br />
(aufgeteilt nach den Klassen)<br />
Vergleich der Überlebensraten<br />
innerhalb den Klassen<br />
(aufgeteilt nach dem Geschlecht)<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 6
1. Einführendes Beispiel<br />
• bei den Frauen: sehr hohe<br />
Überlebensraten in der 1. und<br />
2. Klasse; deutlich geringere<br />
in der 3. Klasse<br />
• höchste Überlebensrate bei<br />
den Männern in der 1. Klasse<br />
• überraschenderweise<br />
Überlebensrate in der 3. Klasse<br />
höher als in der 2. Klasse<br />
• Welche Stellung hatte die Crew?<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 7
2. Logistische Regression<br />
Logistische Regression<br />
Welchen Einfluss haben eine oder mehrere erklärende Variablen<br />
auf eine binäre <strong>Zielvariable</strong>?<br />
Variablen<br />
<strong>Zielvariable</strong> Y: binär (dichotom)<br />
erklärende Variablen X: stetig oder kategoriell<br />
Logistische Regression = indirektes Modell<br />
Es wird nicht der Einfluss auf die <strong>Zielvariable</strong>, sondern auf die<br />
Wahrscheinlichkeit, dass diese den Wert 1 annimmt, geschätzt.<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 8
2.1. Modellgleichung<br />
Bei <strong>einer</strong> Interpretation als Wahrscheinlichkeit sind nur<br />
Prognosewerte zwischen 0 und 1 sinnvoll<br />
→ linearer Ansatz (analog zur linearen Regression) nicht<br />
möglich!<br />
Statt das lineare Modell auf die ursprüngliche Variable <strong>mit</strong><br />
begrenztem Wertebereich anzuwenden, ließe es sich problemlos<br />
auf eine transformierte <strong>Zielvariable</strong> <strong>mit</strong> unendlichem<br />
Wertebereich anwenden.<br />
Diese Transformation erfolgt in 2 Schritten:<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 9
2.1. Modellgleichung<br />
1. Betrachtung der Odds<br />
Als Odds bezeichnet man den Quotienten aus zwei<br />
Wahrscheinlichkeiten – nämlich der Wahrscheinlichkeit, dass<br />
das Ereignis eintritt (Y=1) und der Wahrscheinlichkeit, dass das<br />
Ereignis nicht eintritt (Y=0).<br />
Odds<br />
=<br />
P(Y = 1 | X)<br />
1−<br />
P(Y = 1|<br />
X)<br />
=<br />
π<br />
1−<br />
π<br />
Der Wertebereich der Odds liegt nun zwischen 0 und + ∞ ,<br />
d.h. er ist immer noch nach unten begrenzt.<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 10
2.1. Modellgleichung<br />
2. Betrachtung der Log Odds (Logit)<br />
Durch Logarithmieren wird die nun auch die untere Begrenzung<br />
aufgehoben, d.h. der Wertebereich wird auf ( −∞,<br />
+∞)<br />
ausgeweitet.<br />
logit(π)<br />
=<br />
⎛ π<br />
ln⎜<br />
⎝1−<br />
π<br />
⎞<br />
⎟<br />
⎠<br />
Im Gegensatz zur linearen Regression wird also nicht die<br />
Ausprägung der <strong>Zielvariable</strong> als Linearkombination der<br />
erklärenden Variablen betracht, sondern der logit:<br />
logit<br />
⎛ π ⎞<br />
π ) = ln⎜<br />
⎟ =<br />
π<br />
Xβ<br />
= β + β X + ... +<br />
⎝1−<br />
⎠<br />
β<br />
0 1<br />
(<br />
1<br />
p X p<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 11
2.1. Modellgleichung<br />
Auflösen nach der Eintrittswahrscheinlichkeit π ergibt:<br />
1<br />
π = 1<br />
Xβ<br />
+ e −<br />
(Logit-Modell)<br />
wobei<br />
F(<br />
x)<br />
1<br />
= 1 + e<br />
−x<br />
die logistische Verteilungsfunktion ist.<br />
Man verbindet also π über eine sogenannte Linkfunktion F <strong>mit</strong><br />
Xβ<br />
dem linearen Prediktor :<br />
π =<br />
F ( Xβ )<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 12
2.1. Modellgleichung<br />
Überblick<br />
Wahrscheinlichkeit Odds Logit<br />
1 π Xβ<br />
π = = e<br />
1<br />
Xβ<br />
+ e −<br />
1−π<br />
⎛ π ⎞<br />
ln⎜<br />
⎟<br />
⎝1−π<br />
⎠<br />
=<br />
Xβ<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 13
2.2. Schätzung der Koeffizienten<br />
Die Parameter β werden <strong>mit</strong> der Maximum - Likelihood Methode<br />
geschätzt.<br />
Idee der ML-Schätzung:<br />
Bestimme die Parameter so, dass das Auftreten der gegebenen<br />
Stichprobe am Wahrscheinlichsten ist.<br />
Yi<br />
ist binomialverteilt:<br />
Y<br />
i<br />
~<br />
B( 1 ,π<br />
i<br />
)<br />
<strong>mit</strong><br />
π<br />
i<br />
1<br />
= 1 + e<br />
− X<br />
i<br />
β<br />
Likelihoodfunktion:<br />
L<br />
=<br />
n<br />
∏<br />
i=<br />
1<br />
π<br />
Yi<br />
i<br />
( 1−π<br />
)<br />
i<br />
(1−Y<br />
)<br />
i<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 14
2.2. Schätzung der Koeffizienten<br />
Da das Maximum der Likelihoodfunktion schwierig zu bestimmen<br />
ist (Produkt!), führt man eine Logarithmustransformation durch:<br />
ln<br />
L<br />
=<br />
n<br />
∑<br />
∑<br />
Y i<br />
⋅lnπ<br />
+ (1 −Y<br />
i<br />
i= 1 i=<br />
1<br />
n<br />
i<br />
) ⋅ln(1<br />
−π<br />
)<br />
i<br />
Um das Maximum zu finden muss diese Funktion für jede<br />
Komponente j des β - Vektors abgeleitet werden<br />
(die Ableitung nennt man Score-Funktion):<br />
∂ ln L<br />
∂β<br />
0<br />
= −<br />
n<br />
∑<br />
i=<br />
1<br />
(1 −<br />
Y i<br />
) +<br />
n<br />
∑<br />
i=<br />
1<br />
(1 −π<br />
) = 0<br />
i<br />
!<br />
∂ ln L<br />
= X<br />
ij<br />
( Yi<br />
−π<br />
i<br />
) =<br />
!<br />
0 ,<br />
∂β<br />
j<br />
j<br />
= 1,...,<br />
p<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 15
2.2. Schätzung der Koeffizienten<br />
Es muss also ein kompliziertes nichtlineares Gleichungssystem<br />
gelöst werden.<br />
meistens nicht exakt lösbar<br />
→ iterative Verfahren (z.B.: Newton Raphson Algorithmus)<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 16
2.3. Interpretation der Koeffizienten<br />
Interpretation oft schwierig:<br />
Die Nicht-Linearität der logistischen Funktion bewirkt, dass sich<br />
eine Zu- bzw. Abnahme von X in unterschiedlichen Regionen<br />
verschieden auswirkt.<br />
„Sättigungseffekt“<br />
Kaum Veränderung<br />
der vorhergesagten<br />
Wahrscheinlichkeit in<br />
den „Extrembereichen“<br />
des X-Wertes<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 17
2.3. Interpretation der Koeffizienten<br />
Logit (additives Modell)<br />
Eine Erhöhung von X i<br />
um eine Einheit bewirkt eine Erhöhung<br />
des logit um den konstante Wert<br />
(analog zur linearen Regression)<br />
Problem: Was bedeutet aber eine Veränderung des logits?<br />
β i<br />
Richtung des Effekts:<br />
β ><br />
i<br />
βi<br />
<<br />
β =<br />
i<br />
0<br />
0<br />
0<br />
positiver Effekt<br />
negativer Effekt<br />
kein Effekt<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 18
2.3. Interpretation der Koeffizienten<br />
Odds (multiplikatives Modell)<br />
Der Exponent des Koeffizienten i gibt den Faktor an, um den<br />
sich die Odds bei einem Anstieg der erklärenden Variablen X i um<br />
eine Einheit verändern.<br />
e β<br />
e β<br />
Den Faktor i nennt man Effektkoeffizient.<br />
Richtung des Effekts:<br />
e<br />
β<br />
i<br />
> 1<br />
positiver<br />
Effekt<br />
e<br />
β<br />
i<br />
< 1<br />
negativer<br />
Effekt<br />
e<br />
β<br />
i<br />
= 1<br />
kein Effekt<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 19
2.3. Interpretation der Koeffizienten<br />
Beispiel (Titanic Datensatz)<br />
Call:<br />
glm(formula = Survived ~ Sex, family = binomial)<br />
Coefficients:<br />
Estimate Std. Error z value Pr(>|z|)<br />
(Intercept) 1.0044 0.1041 9.645
2.3. Interpretation der Koeffzienten<br />
Beispiel (Fortsetzung)<br />
odds ( Yes |<br />
Female)<br />
= e<br />
1.0044<br />
=<br />
2.73<br />
≈<br />
3:1<br />
Odds = Wahrscheinlichkeitsverhältnis<br />
Wahrscheinlichkeit zu Überleben im Verhältnis zur Wahrscheinlichkeit<br />
nicht zu Überleben<br />
Für eine Frau waren die Wahrscheinlichkeit zu überleben in etwa<br />
dreimal so hoch wie nicht zu überleben.<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 21
2.3. Interpretation der Koeffizienten<br />
Beispiel (Fortsetzung)<br />
Bei binären erklärenden Variablen gibt der Effektkoeffizient an,<br />
um welchen Faktor sich die Odds ändern, wenn man von der<br />
Gruppe, die <strong>mit</strong> 0 kodiert (Female) wurde, zu der Gruppe<br />
wechselt, die <strong>mit</strong> 1 (Male) kodiert wurde.<br />
odds ( Yes |<br />
Male)<br />
=<br />
odds<br />
( Yes |<br />
Female)<br />
⋅e<br />
−2.3172<br />
=<br />
2.73⋅0.09855<br />
=<br />
0.27<br />
Für einen Mann standen die Chancen bei 0,27 : 1.<br />
Oder anders ausgedrückt: Für einen Mann war es also fast<br />
viermal so wahrscheinlich zu sterben wie zu überleben.<br />
1<br />
odds ( No | Male)<br />
= = 3.72<br />
0.27<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 22
2.3. Interpretation der Koeffizienten<br />
Beispiel (Fortsetzung)<br />
Um nun die Überlebenschancen von Frauen und Männern<br />
vergleichen zu können, bildet man das Odds Ratio.<br />
Das Odds Ratio ist also ein Maß für die Stärke des Unterschieds<br />
zwischen zwei Gruppen, hier Frauen und Männern.<br />
OddsRatio =<br />
odds(<br />
Yes | Female)<br />
odds(<br />
Yes | Male)<br />
=<br />
2,73<br />
0,27<br />
= 10,1<br />
d.h. die Odds <strong>einer</strong> Frau zu überleben waren ungefähr 10-mal so<br />
groß, wie die der Männer.<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 23
2.3. Interpretation der Koeffizienten<br />
allgemein: Odds Ratio<br />
Vergleich der i-ten Beobachtung (<strong>mit</strong> den erklärenden Variablen<br />
X<br />
i<br />
= ( X<br />
i<br />
, X<br />
i2,...,<br />
X<br />
1 ip<br />
) ) <strong>mit</strong> der j-ten Beobachtung (<strong>mit</strong> den<br />
erklärenden Variablen X = X , X ,..., X ) ):<br />
j<br />
(<br />
j1 j2<br />
jp<br />
β0<br />
+ ∑βk<br />
X ik<br />
p<br />
k 1<br />
Odds X<br />
∑<br />
i<br />
) e<br />
k=<br />
1<br />
OddsRatio = =<br />
p<br />
= e<br />
Odds(<br />
X<br />
j<br />
) β0<br />
+ ∑βk<br />
X jk<br />
k=<br />
1<br />
e<br />
p<br />
(<br />
β<br />
= k ( X ik −<br />
X<br />
jk<br />
)<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 24
3. Tests<br />
allgemeine lineare Hypothese:<br />
H Cβ<br />
= ξ gegen H : Cβ<br />
≠ ξ<br />
0<br />
:<br />
1<br />
wobei C eine r × p Matrix <strong>mit</strong> rang ( C)<br />
= r und ξ ein Vektor ist<br />
r: Anzahl der Restriktionen unter H o<br />
p: Anzahl der geschätzten Parameter<br />
• simultane Tests<br />
• Tests über Linearkombinationen von Parameter<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 25
3. Tests<br />
konkrete Beispiele:<br />
• Test, ob die Variable X i<br />
einen signifikanten Einfluss auf hat:<br />
H0 : β 0 gegen H1<br />
: β ≠<br />
i<br />
=<br />
i<br />
• Test auf Gleichheit zweier Koeffizienten:<br />
0<br />
äquivalent zur allgemeinen Form <strong>mit</strong> C = ( 0...1...0) und ξ = 0<br />
i-te Stelle<br />
π<br />
H<br />
β = β<br />
: β ≠<br />
0<br />
:<br />
i j<br />
gegen H1<br />
⇔ H<br />
0<br />
: β<br />
i<br />
− β<br />
j<br />
= 0 gegen H1<br />
: βi<br />
− β<br />
j<br />
≠ 0<br />
C =<br />
( 0 L 0 1 0 L 0 −1<br />
0 L 0)<br />
i<br />
β<br />
j<br />
ξ = 0<br />
i-te Stelle<br />
j-te Stelle<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 26
3. Tests<br />
• Test, ob r ≤ p der Koeffizienten signifikant von Null<br />
verschieden sind (Annahme: die r ersten Koeffizienten):<br />
C<br />
=<br />
⎛1<br />
⎜<br />
⎜0<br />
⎜ M<br />
⎜<br />
⎝0<br />
0<br />
1<br />
0<br />
L<br />
L<br />
O<br />
L<br />
L<br />
K<br />
1<br />
L<br />
L<br />
L<br />
L<br />
L<br />
L<br />
0⎞<br />
⎟<br />
0⎟<br />
M ⎟<br />
⎟<br />
0<br />
⎠<br />
ξ =<br />
⎛0⎞<br />
⎜ ⎟<br />
⎜0⎟<br />
⎜ M ⎟<br />
⎜ ⎟<br />
⎝0⎠<br />
Achtung:<br />
H<br />
∃ βi<br />
: βi<br />
≠ 0, i = 1,..,r<br />
nicht H : ∀βi<br />
: βi<br />
≠ 0, i 1,..,<br />
r<br />
1<br />
:<br />
1<br />
=<br />
d.h. zur Ablehnung der Nullhypothese ist es nicht erforderlich,<br />
dass alle Koeffizienten ungleich Null sind!<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 27
3.1. Likelihood Ratio Test<br />
Idee des Test:<br />
Vergleich des Wertes der Loglikelihoodfunktion an der Stelle des<br />
unrestringierten Schätzers βˆ <strong>mit</strong> dem Wert an der Stelle des<br />
ˆβ 0<br />
restringierten Schätzers .<br />
Anpassung zweier Modelle erforderlich:<br />
• M1: Modell ohne Restriktionen → Schätzung von βˆ<br />
• M0: Modell <strong>mit</strong> Restriktionen → Schätzung von<br />
ˆβ 0<br />
ˆβ 0<br />
Man erhält also durch Maximierung der Loglikelihoodfunktion<br />
Cβ = ξ<br />
unter den linearen Nebenbedingungen .<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 28
3.1. Likelihood Ratio Test<br />
Teststatistik<br />
LR<br />
= −<br />
⎛<br />
⎜<br />
⎝<br />
L<br />
⎞<br />
⎟<br />
⎠<br />
2<br />
( ln L − ln L ) = −2(<br />
l − l ~ a χ<br />
0<br />
2ln⎜<br />
= −2<br />
0 1<br />
0 1)<br />
r<br />
L ⎟<br />
1<br />
(r = Anzahl der Restriktionen unter H 0 )<br />
wobei: ln L 0<br />
: Loglikelihood des Modells unter der Nullhypothese<br />
ln L 1 : Loglikelihood des Modells ohne Restriktionen<br />
Testentscheidung<br />
α<br />
Lehne H 0 zum Signifikantniveau ab, wenn:<br />
LR > χ r<br />
2<br />
; 1 − α<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 29
3.2. Wald Test<br />
Idee des Test:<br />
Schätzung der Modells ohne Restriktionen<br />
Prüfung, inwieweit die quadrierten und varianzgewichteten<br />
Abweichungen von der Restriktion so erheblich sind, dass<br />
verworfen werden muss.<br />
H 0<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 30
3.2. Wald Test<br />
Teststatistik<br />
• Matrixschreibweise:<br />
H : Cβ = ξ<br />
0<br />
W<br />
=<br />
ˆ β<br />
ξ<br />
ˆ) β<br />
ˆ β<br />
−1<br />
2<br />
( C − )'( C Cov(<br />
C')<br />
( C − ) ~ a<br />
r<br />
ξ<br />
χ<br />
• Spezialfall:<br />
W =<br />
ˆ β<br />
ˆ σ<br />
2<br />
i<br />
2<br />
i<br />
a<br />
~<br />
χ<br />
2<br />
1<br />
H<br />
0<br />
: β i<br />
=<br />
0<br />
Testentscheidung<br />
Lehne H 0<br />
zum Signifikantniveau ab, wenn:<br />
α<br />
W > r<br />
2<br />
χ<br />
; 1 − α<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 31
3.3. Score Test<br />
Idee des Tests<br />
Schätzung des Modells <strong>mit</strong> Restriktionen<br />
Wenn H 0<br />
zutrifft, dann sollte die Steigung der Loglikelihood-<br />
Funktion an der Stelle nicht signifikant von Null verschieden<br />
sein.<br />
ˆβ 0<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 32
3.3. Score Test<br />
Teststatistik<br />
U<br />
=<br />
s<br />
ˆ<br />
ˆ<br />
2<br />
( β<br />
0<br />
)' Cov(<br />
β<br />
0)<br />
s(<br />
β0)<br />
~ χr<br />
ˆ<br />
wobei<br />
s(<br />
ˆ β )<br />
0<br />
=<br />
∂ ln L<br />
∂β<br />
β = ˆ β<br />
0<br />
(Scorevektor)<br />
Testentscheidung<br />
2<br />
Lehne H 0<br />
zum Signifikantniveau ab, wenn: U > r<br />
α<br />
χ<br />
; 1 − α<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 33
Tests - Vergleich<br />
Beziehungen zwischen den drei Teststatistiken<br />
Alle drei Testmethoden können zur Prüfung der gleichen<br />
Hypothesen verwendet werden.<br />
Die Wald – und Score – Statistik sind eine quadratische<br />
Approximation der LR – Statistik.<br />
Alle drei Tests asymptotisch äquivalent, d.h. sie führen für große<br />
Stichprobenumfänge zum gleichen Ergebnis.<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 34
Tests - Vergleich<br />
Welchen Test wann verwenden?<br />
• LR-Test: ist zuverlässiger als der Wald- und Score-Test.<br />
Nachteil: Anpassung zweier Modelle notwendig<br />
• Wald-Test: nur Anpassung des Modells ohne Restriktionen<br />
→ Rückwärtsselektion: Variable <strong>mit</strong> der kleinsten Wald-<br />
Statistik aus dem Modell nehmen<br />
• Score-Test: nur Anpassung des Modells <strong>mit</strong> Restriktionen<br />
→ Vorwärtsselektion: Variable <strong>mit</strong> der größten Score-Statistik<br />
ins Modell aufnehmen<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 35
4. Beispiel: Titanic Datensatz<br />
Mögliche Fragestellungen:<br />
• Waren die Überlebensraten<br />
der Männer in der 2. und 3.<br />
Klasse gleich groß?<br />
• War die Überlebensrate<br />
der männlichen Crew<br />
genauso hoch wie die der<br />
Männer in der 3. Klasse?<br />
• Hatten die Frauen in der<br />
Crew genauso hohe<br />
Überlebensraten wie in der<br />
1. und 2. Klasse?<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 36
4. Beispiel: Titanic Datensatz<br />
Mögliche Fragestellungen:<br />
• Waren die Überlebensraten<br />
der Männer in der 2. und 3.<br />
Klasse gleich groß?<br />
• War die Überlebensrate<br />
der männlichen Crew<br />
genauso hoch wie die der<br />
Männer in der 3. Klasse?<br />
• Hatten die Frauen in der<br />
Crew genauso hohe<br />
Überlebensraten wie in der<br />
1. und 2. Klasse?<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 37
4. Beispiel: Titanic Datensatz<br />
zunächst: welches Modell verwenden?<br />
(Modell <strong>mit</strong> oder ohne Interaktion zwischen Class und Sex)<br />
Modell<br />
m1: Survived ~ Sex + Class<br />
m2: Survived ~ Sex * Class<br />
Devianz<br />
2228.9<br />
2163.7<br />
df<br />
2196<br />
2193<br />
Likelihood Ratio Test<br />
LR = 2228.9<br />
− 2163.7 = 65.2 > 7.8147 = χ<br />
2<br />
3;0.95<br />
d.h. das Modell m2 ist signifikant besser als m1<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 38
4. Beispiel: Titanic Datensatz<br />
Call:<br />
glm(formula = Survived ~ Sex * Class, family = binomial)<br />
Coefficients:<br />
Estimate Std. Error z value Pr(>|z|)<br />
(Intercept) 1.89712 0.61914 3.064 0.00218 **<br />
SexMale -3.14690 0.62453 -5.039 4.68e-07 ***<br />
ClassFirst 1.66535 0.80026 2.081 0.03743 *<br />
ClassSecond 0.07053 0.68630 0.103 0.91815<br />
ClassThird -2.06075 0.63551 -3.243 0.00118 **<br />
SexMale:ClassFirst -1.05911 0.81959 -1.292 0.19627<br />
SexMale:ClassSecond -0.63882 0.72402 -0.882 0.37760<br />
SexMale:ClassThird 1.74286 0.65139 2.676 0.00746 **<br />
---<br />
Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1<br />
(Dispersion parameter for binomial family taken to be 1)<br />
Null deviance: 2769.5 on 2200 degrees of freedom<br />
Residual deviance: 2163.7 on 2193 degrees of freedom<br />
AIC: 2179.7<br />
Number of Fisher Scoring iterations: 6<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 39
Koeffizienten des Modells m2<br />
4. Beispiel: Titanic Datensatz<br />
(Intercept) 1.89712 SexMale:ClassFirst -1.05911<br />
SexMale -3.14690 SexMale:ClassSecond -0.63882<br />
ClassFirst 1.66535 SexMale:ClassThird 1.74286<br />
ClassSecond 0.07053<br />
ClassThird -2.06075<br />
Überlebenswahrscheinlichkeit eines Mannes der 2. Klasse:<br />
1<br />
P ( Y = 1| Male,<br />
Second)<br />
=<br />
− 1.89712−3.14690+<br />
0.07053 0.63882<br />
1+<br />
e<br />
− )<br />
(<br />
=<br />
0.13967<br />
Überlebenswahrscheinlichkeit eines Mannes der 3. Klasse:<br />
1<br />
P ( Y = 1| Male,<br />
Third ) =<br />
− 1.89712−3.14690−2.06075<br />
1.74286<br />
1+<br />
e<br />
+ )<br />
(<br />
=<br />
0.17255<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 40
Koeffizienten des Modells m2<br />
4. Beispiel: Titanic Datensatz<br />
(Intercept) 1.89712 SexMale:ClassFirst -1.05911<br />
SexMale -3.14690 SexMale:ClassSecond -0.63882<br />
ClassFirst 1.66535 SexMale:ClassThird 1.74286<br />
ClassSecond 0.07053<br />
ClassThird -2.06075<br />
Überlebenswahrscheinlichkeit eines Mannes der 2. Klasse:<br />
1<br />
P ( Y = 1| Male,<br />
Second)<br />
=<br />
− 1.89712−3.14690+<br />
0.07053 0.63882<br />
1+<br />
e<br />
− )<br />
(<br />
=<br />
0.13967<br />
Überlebenswahrscheinlichkeit eines Mannes der 3. Klasse:<br />
1<br />
P ( Y = 1| Male,<br />
Third ) =<br />
− 1.89712−3.14690−2.06075<br />
1.74286<br />
1+<br />
e<br />
+ )<br />
(<br />
=<br />
0.17255<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 41
4. Beispiel: Titanic Datensatz<br />
Modellgleichung<br />
logit<br />
=<br />
β + β ⋅ Male + β ⋅ First + β ⋅ Second + β ⋅Third<br />
+<br />
0<br />
+ β ⋅ MaleFirst + β ⋅ MaleSecond + β ⋅ MaleThird<br />
5<br />
1<br />
2<br />
6<br />
3<br />
7<br />
4<br />
Aufstellen der Hypothesen<br />
H 0 : Die Überlebenswahrscheinlichkeiten der Männer in der<br />
zweiten und dritten Klasse sind gleich<br />
⇔<br />
H<br />
: β β β β<br />
β + β ≠ β + β<br />
0 3<br />
+<br />
6<br />
=<br />
4<br />
+<br />
7<br />
gegen H1<br />
:<br />
3<br />
6<br />
4<br />
7<br />
⇔<br />
H<br />
0<br />
: β3<br />
− β4<br />
+ β6<br />
− β7<br />
= 0 gegen H1<br />
: β3<br />
− β4<br />
+ β6<br />
− β7<br />
≠<br />
0<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 42
4. Beispiel: Titanic Datensatz<br />
Wald Test<br />
• Definition der Matrix C und der rechten Seite<br />
allgemeine Nullhypothese:<br />
in diesem Beispiel:<br />
H :<br />
0<br />
Cβ = ξ<br />
H : β − β<br />
0 3 4<br />
+ β 6<br />
− β 7<br />
= 0<br />
also:<br />
C<br />
( 0 0 0 1 -1 0 1 -1) = 0<br />
= ξ<br />
in R:<br />
C
4. Beispiel: Titanic Datensatz<br />
• Funktion waldtest:<br />
waldtest
4. Beispiel: Titanic Datensatz<br />
> waldtest(C,r,m2)<br />
$Teststatstik<br />
[1] 1.041136<br />
$Quantil<br />
[1] 3.841459<br />
$pWert<br />
[1] 0.3075574<br />
Die Nullhypothese wird nicht verworfen. Es besteht also kein<br />
signifikanter Unterschied in der Überlebensraten der Männer in der 2.<br />
und 3. Klasse!<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 45
4. Beispiel: Titanic Datensatz<br />
Likelihood Ratio Test<br />
Es müssen zwei verschiedene Modelle angepasst werden:<br />
• m2: Es werden keine Restriktionen an die Parameter gestellt<br />
• m3: Modell unter der Nullhypothese, d.h. es wird<br />
angenommen, dass gilt: β + β = β +<br />
m2<br />
logit = β<br />
0<br />
3 6 4<br />
β7<br />
+ β ⋅ Male + β ⋅ First + β ⋅ Second + β ⋅Third<br />
+<br />
+ β ⋅ MaleFirst + β ⋅ MaleSecond + β ⋅ MaleThird<br />
5<br />
1<br />
2<br />
6<br />
3<br />
7<br />
4<br />
m3 (<br />
β<br />
3<br />
= β4<br />
+ β7<br />
− β6<br />
+ β ⋅(<br />
MaleSecond<br />
6<br />
0<br />
1<br />
2<br />
in m2 einsetzen)<br />
logit = β + β ⋅ Male + β ⋅ First + β ⋅(<br />
Third<br />
− Second)<br />
+ β ⋅(<br />
MaleThird<br />
7<br />
4<br />
+ Second)<br />
+ β ⋅ MaleFirst<br />
+ Second)<br />
5<br />
+<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 46
4. Beispiel: Titanic Datensatz<br />
Schätzung der Modells m3:<br />
dazu: Definition neuer Variablen (in Excel):<br />
First:<br />
1, falls Class = First<br />
0, sonst<br />
Second:<br />
1, falls Class = Second<br />
0, sonst<br />
Third:<br />
1, falls Class = Third<br />
0, sonst<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 47
4. Beispiel: Titanic Datensatz<br />
MaleFirst:<br />
1, falls Class = First und Sex = Male<br />
0, sonst<br />
MaleSecond: 1, falls Class = Second und Sex = Male<br />
0, sonst<br />
MaleThird:<br />
1, falls Class = Third und Sex = Male<br />
0, sonst<br />
in R:<br />
> X1 X2 X3
4. Beispiel: Titanic<br />
Call:<br />
glm(formula = Survived ~ Sex + First + X1 + MaleFirst + X2 + X3,<br />
family = binomial)<br />
Coefficients:<br />
Estimate Std. Error z value Pr(>|z|)<br />
(Intercept) 1.8971 0.6191 3.064 0.00218 **<br />
SexMale -3.1469 0.6245 -5.039 4.68e-07 ***<br />
First 1.6653 0.8003 2.081 0.03743 *<br />
X1 -2.0607 0.6355 -3.243 0.00118 **<br />
MaleFirst -1.0591 0.8196 -1.292 0.19627<br />
X2 -0.4495 0.6988 -0.643 0.52008<br />
X3 1.6818 0.6490 2.592 0.00956 **<br />
---<br />
Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1<br />
(Dispersion parameter for binomial family taken to be 1)<br />
Null deviance: 2769.5 on 2200 degrees of freedom<br />
Residual deviance: 2164.8 on 2194 degrees of freedom<br />
AIC: 2178.8<br />
Number of Fisher Scoring iterations: 6<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 49
4. Beispiel: Titanic Datensatz<br />
in R:<br />
lrtest
4. Beispiel: Titanic Datensatz<br />
andere Möglichkeit: Chi - Quadrat - Test<br />
Class<br />
Male<br />
Female<br />
No Yes No Yes<br />
Crew 670 192 3 20<br />
First 118 62 4 141<br />
Second 154 25 13 93<br />
Third 422 88 106 90<br />
Pearson's Chi-squared test<br />
data: t<br />
X-squared = 1.045, df = 1, p-value = 0.3067<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 51
4. Beispiel: Titanic Datensatz<br />
Mögliche Fragestellungen:<br />
• Waren die Überlebensraten<br />
der Männer in der 2. und 3.<br />
Klasse gleich groß?<br />
• War die Überlebensrate<br />
der männlichen Crew<br />
genauso hoch wie die der<br />
Männer in der 3. Klasse?<br />
• Hatten die Frauen in der<br />
Crew genauso hohe<br />
Überlebensraten wie in der<br />
1. und 2. Klasse?<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 52
4. Beispiel: Titanic Datensatz<br />
Ausgangspunkt ist wieder das Modell: Survived ~ Sex * Class<br />
logit<br />
= β + β ⋅ Male + β ⋅ First + β ⋅ Second + β ⋅Third<br />
+<br />
0<br />
+ β ⋅ MaleFirst + β ⋅ MaleSecond + β ⋅ MaleThird<br />
5<br />
1<br />
2<br />
6<br />
3<br />
7<br />
4<br />
Crew ist Referenzgruppe!<br />
H 0 : Die Überlebenswahrscheinlichkeiten der Männer in der Crew<br />
und in der dritten Klasse sind gleich<br />
⇔<br />
⇔<br />
H<br />
0<br />
: β4<br />
+ β7<br />
= 0 gegen H1<br />
: β4<br />
+ β7<br />
≠ 0<br />
H<br />
0<br />
: Cβ<br />
= 0 gegen H1<br />
<strong>mit</strong> C =<br />
: Cβ<br />
≠<br />
( 0 0 0 0 1 0 0 1) und ξ = 0<br />
0<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 53
4. Beispiel: Titanic Datensatz<br />
Wald Test<br />
> C r waldtest(C,r,m2)<br />
$Teststatstik<br />
[1] 4.945226<br />
$Quantil<br />
[1] 3.841459<br />
$pWert<br />
[1] 0.02616282<br />
Die Nullhypothese wird zum<br />
Signifikanzniveau von 5%<br />
verworfen.<br />
Es besteht also ein signifikanter<br />
Unterschied zwischen den<br />
Überlebensraten der Männer in<br />
der 3. Klasse und in der Crew.<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 54
4. Beispiel: Titanic Datensatz<br />
Likelihood Ratio Test<br />
m2<br />
logit = β<br />
0<br />
+ β ⋅ Male + β ⋅ First + β ⋅ Second + β ⋅Third<br />
+<br />
+ β ⋅ MaleFirst + β ⋅ MaleSecond + β ⋅ MaleThird<br />
5<br />
1<br />
2<br />
6<br />
3<br />
7<br />
4<br />
m4 (<br />
β<br />
=<br />
−<br />
4<br />
β 7<br />
in m2 einsetzen):<br />
logit<br />
= β + β ⋅ Male + β ⋅ First + β ⋅ Second + β ⋅ MaleFirst<br />
0<br />
6<br />
1<br />
2<br />
+ β ⋅ MaleSecond + β ⋅(<br />
MaleThird<br />
7<br />
3<br />
5<br />
−Third)<br />
+<br />
X
4. Beispiel: Titanic Datensatz<br />
glm(formula = Survived ~ Sex + First + Second + MaleFirst +<br />
MaleSecond + X, family = binomial)<br />
Coefficients:<br />
Estimate Std. Error z value Pr(>|z|)<br />
(Intercept) 1.89712 0.61914 3.064 0.00218 **<br />
SexMale -3.25810 0.62275 -5.232 1.68e-07 ***<br />
First 1.66535 0.80026 2.081 0.03743 *<br />
Second 0.07053 0.68630 0.103 0.91815<br />
MaleFirst -0.94792 0.81824 -1.158 0.24667<br />
MaleSecond -0.52763 0.72249 -0.730 0.46521<br />
X 2.06075 0.63551 3.243 0.00118 **<br />
---<br />
Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1<br />
(Dispersion parameter for binomial family taken to be 1)<br />
Null deviance: 2769.5 on 2200 degrees of freedom<br />
Residual deviance: 2168.8 on 2194 degrees of freedom<br />
AIC: 2182.8<br />
Number of Fisher Scoring iterations: 6<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 56
4. Beispiel: Titanic Datensatz<br />
> lrtest(m2,m4)<br />
$Teststatistik<br />
> waldtest(C,r,m2)<br />
$Teststatistik<br />
[1] 5.059706 [1] 4.945226<br />
$Quantil<br />
$Quantil<br />
[1] 3.841459 [1] 3.841459<br />
$pWert<br />
$pWert<br />
[1] 0.02448839 [1] 0.02616282<br />
LR – Test und Wald – Test liefern beide ähnliche Ergebnisse:<br />
Beide lehnen die Nullhypothese ab, d.h. es besteht ein<br />
signifikanter Unterschied zwischen den Überlebensraten der<br />
Männer in der Crew und in der 3. Klasse.<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 57
4. Beispiel: Titanic Datensatz<br />
Mögliche Fragestellungen:<br />
• Waren die Überlebensraten<br />
der Männer in der 2. und 3.<br />
Klasse gleich groß?<br />
• War die Überlebensrate<br />
der männlichen Crew<br />
genauso hoch wie die der<br />
Männer in der 3. Klasse?<br />
• Hatten die Frauen in der<br />
Crew genauso hohe<br />
Überlebensraten wie in der<br />
1. und 2. Klasse?<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 58
4. Beispiel: Titanic Datensatz<br />
Ausgangspunkt ist wieder das Modell: Survived ~ Sex * Class<br />
logit<br />
= β + β ⋅ Male + β ⋅ First + β ⋅ Second + β ⋅Third<br />
+<br />
0<br />
+ β ⋅ MaleFirst + β ⋅ MaleSecond + β ⋅ MaleThird<br />
5<br />
1<br />
2<br />
6<br />
3<br />
7<br />
4<br />
H 0 : Die Überlebenswahrscheinlichkeiten der Frauen in der Crew<br />
in der zweiten und in der dritten Klasse sind gleich<br />
Die Nullhypothese enthält nun zwei Restriktionen, nämlich:<br />
H β = β = 0 gegen : β ≠ 0 und/oder β<br />
0<br />
H<br />
: 2 3<br />
1 2<br />
3 ≠<br />
0<br />
⎛ β2<br />
⎞<br />
⎛ β2<br />
⎞<br />
H<br />
0<br />
:<br />
⎜<br />
⎟ = 0 gegen H1<br />
:<br />
⎜<br />
⎟ ≠<br />
⎝ β3<br />
⎠<br />
⎝ β3<br />
⎠<br />
0<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 59
4. Beispiel: Titanic Datensatz<br />
also:<br />
C<br />
=<br />
⎛0<br />
⎜<br />
⎝0<br />
0<br />
0<br />
1<br />
0<br />
0<br />
1<br />
0<br />
0<br />
0<br />
0<br />
0<br />
0<br />
0⎞<br />
⎟<br />
0⎠<br />
ξ =<br />
⎛0⎞<br />
⎜ ⎟<br />
⎝0⎠<br />
Wald Test<br />
> C r waldtest(C,r,m1)<br />
$Teststatstik<br />
[1] 7.882447<br />
$Quantil<br />
[1] 5.991465<br />
$pWert<br />
[1] 0.01942443<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 60
4. Beispiel: Titanic Datensatz<br />
Likelihood Ratio Test<br />
m5<br />
logit<br />
= β + β ⋅ Male + β ⋅Third<br />
0<br />
+ β ⋅ MaleThird<br />
7<br />
1<br />
4<br />
+ β ⋅ MaleFirst<br />
5<br />
+ β ⋅ MaleSecond<br />
6<br />
+<br />
> lrtest(m2,m5)<br />
$Teststatistik<br />
[1] 9.878294<br />
$Quantil<br />
[1] 5.991465<br />
$pWert<br />
[1] 0.007160703<br />
Sowohl der Waldtest als auch der LR-Test<br />
lehnt die Nullhypothese ab,<br />
d.h. es besteht ein signifikanter Unterschied<br />
zwischen den Überlebensraten der Frauen in<br />
der 1., 2. Klasse und der Crew.<br />
Der LR-Test lehnt die Nullhypothese noch<br />
etwas deutlicher ab als der Waldtest.<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 61
4. Beispiel: Titanic Datensatz<br />
Die Ablehnung der Nullhypothese beruht hierbei auf dem<br />
signifikanten Unterschied zwischen der 1. Klasse und den<br />
beiden anderen Klassen!<br />
Ein alleiniger Test der 2.<br />
Klasse gegen die Crew<br />
ergibt nämlich, dass die<br />
Überlebensraten dieser<br />
beiden Klassen als gleich<br />
angenommen werden<br />
können.<br />
(p-Wert: 0.9181 Wald Test<br />
0.9186 LR-Test)<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 62
5. Zusammenfassung<br />
<strong>Mosaic</strong> <strong>Plots</strong><br />
• <strong>Mosaic</strong> Plot = multidimensionaler Spineplot<br />
=ˆ<br />
• Highlighting Hinzufügen <strong>einer</strong> zusätzlichen binären Variable<br />
(aber ohne Lücke zwischen den beiden Kategorien)<br />
• Durch eine Veränderung der Reihenfolge der Variablen<br />
können verschiedene Aspekte der Daten verdeutlicht werden<br />
• Interaktive Abfrage<br />
• Leere Zellen werden gekennzeichnet (Mondrian: rote Linie,<br />
Manet: 0) → gut unterscheidbar von Zellen <strong>mit</strong> sehr wenigen<br />
Werten<br />
• Leere Zellen werden nicht mehr weiter unterteilt<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 63
5. Zusammenfassung<br />
Tests<br />
• Zum Test linearer Hypothesen eignen sich sowohl der<br />
Likelihood-Ratio-Test als auch der Wald- und Score-Test<br />
• Alle 3 Tests sind asymptotisch - verteilt.<br />
• Die Wald- und Score-Statistik stellt eine quadratische<br />
Approximation der LR-Statistik dar.<br />
• Die 3 Tests sind asymptotisch äquivalent.<br />
• Führen die Tests zu unterschiedlichen Ergebnissen, so sollte<br />
man den LR-Test bevorzugen.<br />
2<br />
χ<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 64
5. Zusammenfassung<br />
• Beim LR-Test muss sowohl das unrestringierte als auch das<br />
restringierte Modell angepasst werden.<br />
• Der Wald-Test kommt <strong>mit</strong> der Anpassung des unrestringierten<br />
Modells aus.<br />
• Der Score-Test verwendet nur das restringierte Modell.<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 65
5. Zusammenfassung<br />
Probleme bei der Schätzung eines logistischen Modells<br />
glm(formula = Survived ~ Class * Age + Class * Sex, family = binomial)<br />
Coefficients: (1 not defined because of singularities)<br />
Estimate Std. Error z value Pr(>|z|)<br />
...<br />
AgeChild 0.33791 0.26920 1.255 0.209391<br />
SexMale -3.14690 0.62453 -5.039 4.68e-07 ***<br />
ClassFirst:AgeChild 16.51217 858.44954 0.019 0.984654<br />
ClassSecond:AgeChild 17.28628 367.06861 0.047 0.962439<br />
ClassThird:AgeChild NA NA NA NA<br />
ClassFirst:SexMale -1.13608 0.82048 -1.385 0.166162<br />
...<br />
• Leere Zellen<br />
• Eintrittswahrscheinlichkeit nahe 0 oder 1<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 66
6. Empfehlungen<br />
Schätzung des Modells<br />
• Warnung, wenn Eintrittswahrscheinlichkeiten nahe 0 oder 1<br />
vorkommen<br />
<strong>Mosaic</strong>plots<br />
• (ein- und ausblendbare) Beschriftung des <strong>Mosaic</strong>plots<br />
• schnellere und einfachere Veränderung der Reihenfolge der<br />
Variablen<br />
• Speicherung der <strong>Plots</strong> in gängigen Grafikformaten<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 67
6. Empfehlungen<br />
Tests<br />
• Likelihood Ratio Test ist ausreichend, da der Wald Test und<br />
der Score Test nur eine Approximation darstellen<br />
• Auswahl der Zellen im <strong>Mosaic</strong> Plot → geeignetes Aufstellen<br />
der Nullhypothese, Anpassung des Modells unter der<br />
Nullhypothese und Berechnung des Likelihood Ratio Tests<br />
durch die Software<br />
19.01.2005 <strong>Mosaic</strong> <strong>Plots</strong> (<strong>mit</strong> <strong>einer</strong> <strong>Zielvariable</strong>) 68