01.01.2015 Aufrufe

Wahrscheinlichkeit & Statistik Musterlösung Serie ... - FIM - ETH Zürich

Wahrscheinlichkeit & Statistik Musterlösung Serie ... - FIM - ETH Zürich

Wahrscheinlichkeit & Statistik Musterlösung Serie ... - FIM - ETH Zürich

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

<strong>ETH</strong> Zürich FS 2013<br />

D-MATH<br />

Hans Rudolf Künsch<br />

Koordinator<br />

Blanka Horvath<br />

<strong>Wahrscheinlichkeit</strong> & <strong>Statistik</strong><br />

Musterlösung <strong>Serie</strong> 14<br />

1. Beim Neyman-Pearson-Test der Hypothese H 0 : X ∼ f(x) dx gegen die Alternative<br />

H A : X ∼ f(x − 1) dx wird der Verwerfungsbereich bestimmt durch die<br />

Ungleichung<br />

f(x − 1)<br />

f(x)<br />

> c = c(α).<br />

Im Fall der Normalverteilung ist f(x−1) = e x− 1 2 , die Verwerfungsbereiche haben<br />

f(x)<br />

wie erwartet die Form (a, ∞) für ein a ∈ R, siehe folgende Graphik.<br />

f(x-1)/f(x)<br />

0 1 2 3 4 5 6 7<br />

-5 -4 -3 -2 -1 0 1 2 3 4 5<br />

x<br />

Im Fall der Cauchyverteilung ist f(x−1) = x2 +1<br />

. Hier tritt das Phänomen auf,<br />

f(x) x 2 −2x+2<br />

dass der Verwerfungsbereich für (die in der Praxis wichtigen) Werte von c > 1<br />

ein beschränktes Intervall ist (bei c = 1 hätte der Verwerfungsbereich die Form<br />

( 1 , ∞), was ein Niveau von ca. 35% bedeuten würde, bei kleineren c’s würde<br />

2<br />

noch häufiger verworfen), siehe folgende Graphik.<br />

f(x-1)/f(x)<br />

0.0 0.5 1.0 1.5 2.0 2.5 3.0<br />

-15 -10 -5 0 5 10 15 20 25<br />

x<br />

Bitte wenden!


Die Erklärung ist, dass bei der Cauchyverteilung sehr grosse Werte sowohl unter<br />

H 0 als auch unter H A etwa gleich unwahrscheinlich sind. Deshalb ist es für nicht<br />

allzu grosse Werte von α beser, bei grosser Beobachtung X die Nullhypothese<br />

nicht zu verwerfen.<br />

Bei der Normalverteilung tritt dieses Phänomen nicht auf, da grosse X unter der<br />

Alternativhypothese sehr viel weniger unwahrscheinlich sind als unter H 0 .<br />

2. Betrachte folgende Figur:<br />

f 1(x)<br />

f (x)<br />

0<br />

f (x)<br />

0<br />

α<br />

f (x) 1<br />

Verwerfungsbereich<br />

0 1/2 1 3/2<br />

a) Für α ∈ (0, 1 2 ] wähle K′ ⊆ ( 1 2 , 1) mit µ L(K ′ ) = α (ist die Situation in<br />

der Figur) und als Verwerfungsbereich K = K ′ ∪ [1, ∞). Dieser Test ist<br />

offensichtlich ein mächtigster Test zum Niveau α, und es gilt φ = 1, falls<br />

f 1 (x) > f 0 (x), und φ = 0, falls f 1 (x) < f 0 (x) (also c = 1).<br />

Für α ∈ [ 1, 1) wähle 2 K′ ⊆ (0, 1) mit µ 2 L(K ′ ) = α − 1 und den Verwerfungsbereich<br />

K = K ′ ∪ ( 1 , ∞). Auch dieser Test ist mächtigst zum Niveau α, und<br />

2<br />

2<br />

er erfüllt die Bedingungen vom Skript mit c = 0.<br />

Solche Tests sind nicht eindeutig, da K ′ eine beliebige Teilmenge von ( 1, 1) 2<br />

bzw. von (0, 1 ) sein kann.<br />

2<br />

b) Für α ∈ ( 1, 1) (zum Beispiel für α = 3) wähle K = ( 1 , ∞). Dieser Test<br />

2 4 2<br />

verwirft immer, wenn die Alternative wahr ist. Er hat also maximale Macht<br />

E 1 [φ] = 1, obwohl er das zur Verfügung stehende Niveau nicht einmal ganz<br />

ausnützt: E 0 [φ] = 1 < 3.<br />

2 4<br />

Siehe nächstes Blatt!


3. Beim Vorzeichentest der Nullhypothese F −1 (0.5) = m lautet die Teststatistik<br />

T n,m = ∑ n<br />

i=1 I [X i >m] und der Test ist gegeben durch<br />

ϕ(x) = 1 falls ∣ Tn,m − n ∣<br />

2 > c(n, α),<br />

wobei x = (x 1 , . . . , x n ) die Beobachtungen, n die Anzahl der Beobachtungen und<br />

α das Niveau des Tests bezeichnet. Weil F als stetig angenommen wurde, ist T n,m<br />

unter der Nullhypothese Bin(n, 0.5)-verteilt. Also ist k = n − c(n, α) bestimmt<br />

2<br />

durch<br />

∑k−1<br />

( n<br />

k∑<br />

( n<br />

0.5<br />

j)<br />

n ≤ α < 0.5<br />

2<br />

j)<br />

n ,<br />

j=0<br />

und n 2 + c(n, α) = n − k. Wenn wir C ⊂ Rn+1 definieren durch<br />

j=0<br />

C = {(x 1 , . . . , x n , m); k ≤<br />

n∑<br />

I [xi >m] ≤ n − k},<br />

i=1<br />

dann ist der Schnitt A(m) = {(x 1 , . . . , x n ); (x 1 , . . . , x n , m) ∈ C} der Annahmebereich<br />

des Vorzeichentests zum Niveau α. Mit dem Dualitätssatz bildet der<br />

Schnitt B(x) = {m; (x 1 , . . . , x n , m) ∈ C} daher einen Vertrauensbereich zum<br />

Niveau 1 − α. Wenn x (1) < x (2) < . . . < x (n) die der Grösse nach geordneten<br />

Beobachtungen bezeichnet, dann gilt<br />

m ∈ [x (j) , x (j+1) ) ⇔<br />

n∑<br />

I [xi >m] = n − j.<br />

i=1<br />

Also ist m ∈ B(x) genau dann, wenn x (k) ≤ m < x (n+1−k) , d.h. (X (k) , X (n+1−k) )<br />

ist ein Vertrauensintervall für den Median zum Niveau 1 − α (weil F als stetig<br />

angenommen wurde, spielt es keine Rolle, ob man das offene oder abgeschlossene<br />

Intervall nimmt). Wegen des zentralen Grenzwertsatzes ist c(n, 0.95) ≈<br />

1.96 √ n/4 ≈ √ n, also ist das Intervall genähert gleich (X (n/2−<br />

√ n) , X (n/2+<br />

√ n) ).<br />

4. a) 1. Sei X die Zufallsvariable welche die Länge der Karotten modelliert, getestes<br />

wird auf den Parameter µ = E[X], die durchschnittliche Länge<br />

der Karotten. Die Nullhypothese ist die Behauptung des Gemüsehändlers,<br />

wir wollen testen ob sie sich widerlegen lässt, daraus ergibt sich ein<br />

linksseitiger Test mit µ 0 = 30cm und den Hypothesen H 0 : µ ≥ µ 0 H A :<br />

µ < µ 0 .<br />

2. Zweiseitiger Test mit µ 0 = 50g sowie den Hypothesen H 0 : µ = µ 0 H A :<br />

µ ≠ µ 0 .<br />

3. Rechtsseitiger Test mit µ 0 = 3mm sowie den Hypothesen H 0 : µ ≤<br />

µ 0 H A : µ > µ 0 .<br />

Bitte wenden!


4. Hier modelliert die Zufallsvariable X mit Wertebereich W X = [0, 1]<br />

den Anteil an holzigen Spargel, getestet wird wieder auf den durchschnittlichen<br />

Wert davon, also auf µ = E[X], aus der Behauptung des<br />

Gemüsehändlers ergibt sich ein rechtsseitiger Test mit µ 0 = 0.003 sowie<br />

den Hypothesen H 0 : µ ≤ µ 0 H A : µ > µ 0 .<br />

5. Zweiseitiger Test mit µ 0 = 0.4 sowie den Hypothesen H 0 : µ = µ 0 H A :<br />

µ ≠ µ 0 .<br />

b) Die Nullhypothese wurde verworfen obwohl sie stimmt, d.h. Fehler 1.Art.<br />

c) Die Nullhypothese wurde nicht verworfen obwohl sie falsch ist, d.h. Fehler<br />

2.Art.<br />

Bemerkung: Da wir ehrliche Gemüsehändler nicht ungerechtfertigt in Misskredit<br />

bringen wollen, müssen wir die <strong>Wahrscheinlichkeit</strong> für einen Fehler 1.Art gering<br />

halten, d.h. wenn wir seine Behauptung anzweifeln, dann müssen wir einen guten<br />

Grund haben dafür, und dieser ist die geringe <strong>Wahrscheinlichkeit</strong> für eine<br />

bestimmte Gesamtheit von Testausgängen falls die Behauptung stimmt (Fehler<br />

1.Art). Da es im Allgemeinen nicht gelingt beide Fehler klein zu halten, bedeutet<br />

ein Akzeptieren der Nullhypothese nicht, dass die Behauptung stimmt, sie konnte<br />

lediglich nicht widerlegt werden. Der Gemüsehändler ist also auf der sicheren Seite,<br />

sagt er die Wahrheit, dann hat er kaum was zu befürchten (Fehler 1.Art), und<br />

wenn er lügt, dann hat er in bestimmten Fällen sogar ein gute Chance (Fehler<br />

2.Art) nicht entlarvt zu werden.<br />

5. a) Die Stichprobe ist ungepaart.<br />

b) Da getestet werden soll, ob das Getränk eine positive Wirkung hat, wird<br />

einseitig getestet.<br />

c) Die Alternativhypothese, die von den vier Möglichkeiten am besten passt ist<br />

in dem Fall die Nummer 3., d.h. Das Getränk bewirkt eine bessere Leistung.<br />

Bemerkung: Die Nullhypothese lautet, dass die Leistung nach Einnahme des<br />

Getränkes genausogut oder schlechter ist.<br />

d) 1. richtig: Der P -Wert ist das kleinste Niveau, auf dem die Nullhypothese<br />

verworfen wird, und 0.01 < 0.034.<br />

2. falsch: Das Niveau gibt die <strong>Wahrscheinlichkeit</strong> an, die Nullhypothese<br />

zu verwerfen, obwohl sie richtig ist. Bei kleinerem Niveau wird daher<br />

weniger oft verworfen.<br />

3. richtig: Fehler 1. Art heisst, die Nullhypothese zu verwerfen, obwohl sie<br />

richtig ist.<br />

Siehe nächstes Blatt!


4. falsch: Beim t-Test ist das Niveau nur exakt richtig unter Normalverteilung,<br />

beim Wilcoxon-Test hingegen für beliebige stetige Verteilungen.<br />

5. richtig: Folgt aus dem Dualitätssatz. Der Annahmebereich bei α =1%<br />

ist grösser als bei α =5% (vergleiche 2.)<br />

6. richtig: Je kleiner |µ|, desto näher liegt die Alternative bei der Nullhypothese,<br />

und desto eher entscheidet man sich für die Nullhypothese statt<br />

für die Alternative.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!