Nichtparametrische Statistik
Nichtparametrische Statistik
Nichtparametrische Statistik
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
<strong>Nichtparametrische</strong> <strong>Statistik</strong><br />
Übungsblatt 6<br />
Aufgabe 1) (alte Klausuraufgabe)<br />
a) Definieren Sie allgemein einen Nadaraya-Watson Kernschätzer einer<br />
Regressionsfunktion.<br />
b) Im nichtparametrischen Regressionsmodell Y i = m(X i ) + ɛ i , i =<br />
1, . . . , n mit äquidistantem Design auf [a, b] = [0, 1] und i.i.d. Fehlertermen,<br />
σ 2 = V ar(ɛ i ), betrachte man die beiden Fälle, dass<br />
bzw.<br />
m(x) = 0.5 + 3x − 20x 3 (0.1)<br />
m(x) = cos(2πx) (0.2)<br />
Nehmen Sie an, dass ein Kernschätzer mit Kernfunktion K und Bandbreite<br />
h zur Schätzung von m verwendet wird. In welchem der beiden<br />
Fälle (1) oder (2) erhält man den kleineren mittleren quadratischen<br />
Fehler MSE( ˆm h (x)) bei der Schätzung am Punkt x = 0.5? Begründen<br />
Sie Ihre Antwort.<br />
Aufgabe 2) (alte Klausuraufgabe)<br />
Gegeben seien i.i.d Beobachtungen (Y 1 , X 1 ), . . . , (Y n , X n ) einer Zielvariable<br />
Y und einer (univariaten) erklärenden Variablen X. Betrachten Sie nun<br />
lokal lineare Schätzer der unbekannten Regressionsfunktion m(x).<br />
a) Wie berechnet man einen lokal linearen Schätzer ˆm h (x) von m(x)?<br />
1
) Beschreiben Sie qualitativ auf welche Weise die optimale Bandbreite<br />
h opt von der Struktur von m, der Stichprobengröße n und der Fehlervarianz<br />
σ 2 abhängt.<br />
c) Nehmen Sie nun an, dass die wahre Rgeressionsfunktion m die spezielle<br />
Struktur m(x) = 1+0.5·x besitzt. Skizzieren Sie (qualitativ) den zugehörigen<br />
Verlauf von MISE( ˆm h ). Wie sollte man in diesem Spezialfall<br />
die Bandbreite h optimal wählen?<br />
d) Im allgemeinen Fall lässt sich mathematisch herleiten, dass bei Verwendung<br />
einer optimalen Bandbreite | ˆm hopt − m(x)| = O P (n −2/5 ) gilt.<br />
Lässt sich aus diesem Resultat direkt schließen, dass ˆm hopt ein schwach<br />
konsistenter Schätzer von m(x) ist? Begründen Sie Ihre Antwort.<br />
e) Zeigen Sie (mathematisch exakt), dass aus | ˆm hopt − m(x)| = O P (n −2/5 )<br />
auch | ˆm hopt − m(x)| 2 = O P (n −4/5 ) folgt.<br />
Aufgabe 3) (alte Klausuraufgabe)<br />
Eine Firma ist international tätig. Die Firmenleitung hat nun den Verdacht,<br />
dass die französischen Außendienstmitarbeiter ineffektiv geführt werden<br />
und daher tendenziell weniger Umsatz erzielen als die deutschen. Um dies<br />
zu testen, werden unabhängige Zufallsstichproben der Umsätze von jeweils<br />
n = m = 10 französischen (Y ) und deutschen (X) Mitarbeitern erhoben.<br />
Bei der Auswertung der Daten ergab sich, dass die Summe der Ränge der<br />
Umsätze der deutschen Mitarbeiter (X) in der geordneten Gesamtstichprobe<br />
gleich 120 ist.<br />
Mit Hilfe von nichtparametrischen Tests soll nun überprüft werden, ob die<br />
Umsätze der deutschen Mitarbeiter (X) tatsächlich tendenziell höher sind als<br />
die der französischen (Y ).<br />
a) Formulieren Sie Nullhypothese und Alternative des nichtparametrischen<br />
Testproblems (in exakter mathematischer Schreibweise).<br />
b) Testen Sie die Nullhypothse zum Niveau α = 5% mit Hilfe des Wilcoxon<br />
Rangsummentests.<br />
2
Benutzen Sie zur Vereinfachung die asymptotische Approximation der<br />
Verteilung der Teststatistik unter der Nullhypothese.<br />
Unter H 0 : W n ∼ N(<br />
m(N + 1)<br />
,<br />
2<br />
mn(N + 1)<br />
)<br />
12<br />
Quantile der Standardnormalverteilung: 95% Quantil= 1.645;<br />
97.5% Quantil= 1.96<br />
c) Ist alternativ die Anwendung des Tests von Siegel-Tukey für das obige<br />
Testproblem sinnvoll? Begründen Sie Ihre Antwort.<br />
3