Klausur zur Vorlesung Statistik I und II, WS 2003/2004
Klausur zur Vorlesung Statistik I und II, WS 2003/2004
Klausur zur Vorlesung Statistik I und II, WS 2003/2004
Verwandeln Sie Ihre PDFs in ePaper und steigern Sie Ihre Umsätze!
Nutzen Sie SEO-optimierte ePaper, starke Backlinks und multimediale Inhalte, um Ihre Produkte professionell zu präsentieren und Ihre Reichweite signifikant zu maximieren.
Name: Vorname: Matrikel-Nr.:<br />
Blatt: 1 von 7<br />
<strong>Klausur</strong> <strong>zur</strong> <strong>Vorlesung</strong> <strong>Statistik</strong> I <strong>und</strong> <strong>II</strong>,<br />
<strong>WS</strong> <strong>2003</strong>/<strong>2004</strong><br />
Aufgabe 1:<br />
(40 Punkte)<br />
Statistische Erhebungen für den Weg <strong>zur</strong> Arbeit oder Bildungsstätte ergaben für Deutschland<br />
im Jahr 2000 folgende Verteilungen für die einfache Entfernung des Weges:<br />
Entfernung<br />
(km)<br />
Erwerbstätige<br />
(Millionen)<br />
0 − 10 15.8<br />
10 − 30 9.7<br />
30 − 50 3.7<br />
> 50 1.4<br />
(a) Bestimmen Sie für die vier Klassen die relativen Häufigkeiten.<br />
(b) Berechnen Sie die empirische Verteilungsfunktion <strong>und</strong> die Dichtefunktion. Nehmen Sie<br />
dabei als Obergrenze 100 km an. Zeichnen Sie die Funktionen in die folgenden Diagramme:<br />
f D<br />
0.06<br />
0.055<br />
0.05<br />
0.045<br />
0.04<br />
0.035<br />
0.03<br />
0.025<br />
0.02<br />
0.015<br />
0.01<br />
0.005<br />
0<br />
0 10 20 30 40 50 60 70 80 90 100<br />
Arbeitsweg (km)<br />
F<br />
1<br />
0.9<br />
0.8<br />
0.7<br />
0.6<br />
0.5<br />
0.4<br />
0.3<br />
0.2<br />
0.1<br />
0<br />
0 10 20 30 40 50 60 70 80 90 100<br />
Arbeitsweg (km)<br />
(c) Beschreiben Sie (ohne Rechnung) die Form der Verteilung bezüglich Symmetrie <strong>und</strong> Modalität.<br />
Handelt es sich um nominal-, ordinal- oder kardinalskalierte Daten? Ist die Verteilung<br />
linkssteil oder rechtssteil?<br />
(d) Nach einem (verworfenen) Vorschlag vom B<strong>und</strong>esfinanzminister sollten künftig nur noch<br />
Arbeitswege von mindestens 21 km Länge von der Steuer absetzbar sein. Wieviel Prozent<br />
könnten auch unter dieser Regelung den Arbeitsweg von der Steuer absetzen?<br />
(e) Erstellen Sie einen Box-and-Whisker Plot der Verteilung.<br />
1
Name: Vorname: Matrikel-Nr.:<br />
Blatt: 2 von 7<br />
Aufgabe 2<br />
(30 Punkte)<br />
Die Einwohner Sachsens waren <strong>2003</strong> wie folgt auf Städte <strong>und</strong> Gemeinden verschiedener Größe<br />
aufgeteilt:<br />
Größenklasse (Einwohner)<br />
Anzahl der<br />
Gemeinden<br />
Gesamtzahl der Einwohner<br />
(Tausend)<br />
< 2 000 123 176.5<br />
2 000 – 10 000 347 1491.2<br />
10 000 – 100 000 65 1387.4<br />
> 100 000 4 1329.2<br />
(a) Berechnen Sie die Lorenzkurve <strong>und</strong> zeichnen Sie sie in untenstehendes Diagramm ein.<br />
(b) Berechnen Sie den Gini-Koeffizienten.<br />
1<br />
0.8<br />
0.6<br />
P<br />
0.4<br />
0.2<br />
0<br />
0 0.2 0.4 0.6 0.8 1<br />
F<br />
2
Name: Vorname: Matrikel-Nr.:<br />
Blatt: 3 von 7<br />
Aufgabe 3<br />
(50 Punkte)<br />
Eine S-Bahn Linie hatte in den letzten beiden Jahren die in der Tabelle angegebenen täglichen<br />
Fahrgastzahlen (in Tausend):<br />
Jahr Quartal 1 Quartal 2 Quartal 3 Quartal 4<br />
2002 410 680 710 430<br />
<strong>2003</strong> 440 720 710 460<br />
Zur Abschätzung des zukünftigen Fahrgastaufkommens soll anhand dieser Daten eine Zeitreihenanalyse<br />
vorgenommmen werden.<br />
(a) Berechnen Sie den gleitenden Durchschnitt der Ordnung 1 Jahr (d.h. 4 Quartale). Begründen<br />
Sie anschaulich, warum in diesem Durchschnitt die jährlichen Schwankungen<br />
weitgehend verschwinden.<br />
(b) Führen Sie eine exponentielle Glättung der Daten mit dem Glättungsparameter α = 1/2<br />
durch. Verwenden Sie als Anfangswert den ersten Datenwert. Welcher Glättungszeitkonstante<br />
(in Jahren oder Quartalen) entspricht obiger Glättungsparameter?<br />
(c) Führen Sie an den Daten eine lineare Regression durch. Welchen Wert hat die Regressionsgerade<br />
im 2. Quartal <strong>2004</strong>?<br />
(d) Zieht man von den Daten den durch die Regressionsgerade gegebenen Trend ab (additive<br />
Aufspaltung), erhält man folgende stationäre Zeitreihe:<br />
Jahr Quartal 1 Quartal 2 Quartal 3 Quartal 4<br />
2002 -137 126 150 -137<br />
<strong>2003</strong> -133 140 124 -133<br />
Berechnen Sie die Saisonfigur für die 4 Quartale.<br />
(e) Geben Sie für alle 8 Zeitpunkte die Restkomponente bei einer additiven Aufspaltung an.<br />
(f) Prognostizieren Sie die Fahrgastzahlen für die 4 Quartale des Jahres <strong>2004</strong> mit Hilfe der<br />
Trend- <strong>und</strong> Saisonkomponente.<br />
3
Name: Vorname: Matrikel-Nr.:<br />
Blatt: 4 von 7<br />
Aufgabe 4<br />
(35 Punkte)<br />
Aus statistischen Untersuchungen ist bekannt, dass alkoholisierte Autofahrer pro gefahrenen<br />
Kilometer ein zehnmal so hohes Unfallrisiko haben wie nichtbetrunkene Fahrer. Ferner ist von<br />
Fahrkontrollen her bekannt, dass 5% aller kontrollierten Fahrer alkoholisiert sind.<br />
(a) Berechnen Sie mit dem Satz von Bayes die Wahrscheinlichkeit dafür, dass ein Unfallverursacher<br />
alkoholisiert ist.<br />
Hinweis: In der Formel für den Satz von Bayes kürzen sich die nicht angegebenen absoluten<br />
Zahlenwerte für die Unfallwahrscheinlichkeiten heraus. Sie können also z.B. die bedingten<br />
Wahrscheinlichkeit dafür, dass ein alkoholisierter Fahrer einen Unfall verursacht, zu 10%<br />
annehmen.<br />
(b) Die vor Ort verwendeten Alkoholtestgeräte sind nicht unfehlbar <strong>und</strong> zeigen nur bei 90%<br />
aller Alkoholisierten ein positives Ergebnis an, während sie bei 5% der Nichtbetrunkenen<br />
einen falschen Alarm geben. Nach einer Alkoholkontrolle mit positivem Ergebnis zweifelt<br />
ein Betroffener das Ergebnis der Messung an. Mit welcher Wahrscheinlichkeit hat er Recht,<br />
wenn die Messung<br />
(i) im Rahmen einer gewöhnlichen Fahrerkontrolle,<br />
(ii) nach einem von ihm verursachten Unfall<br />
stattfand?<br />
Hinweis: Falls Sie Teil (a) nicht gerechnet haben, verwenden Sie den Wert 34.5 % für die<br />
Wahrscheinlichkeit der Alkoholisierung eines Unfallverursachers.<br />
4
Name: Vorname: Matrikel-Nr.:<br />
Blatt: 5 von 7<br />
Aufgabe 5<br />
(45 Punkte)<br />
Bei einem Kraftstoff-Verbrauchstest werden von 5 Fahrzeugen des Typs “3-Liter Auto” die<br />
Verbrauchswerte bestimmt:<br />
Fahrzeug-Nr 1 2 3 4 5<br />
Verbrauch (l/100 km) 3.05 3.35 3.2 3.0 3.0<br />
(a) Berechnen Sie zu einer Fehlerwahrscheinlichkeit von 10% das Konfidenzintervall für den<br />
Verbrauch.<br />
(b) Der Fahrzeughersteller gibt den mittleren Kraftstoffverbrauch des “3-Liter Autos” mit<br />
unter 3 Litern auf 100 km an. Kann man ihn bei einer Fehlerwahrscheinlichkeit von 10%<br />
der Falschaussage bezichtigen? Geben Sie außerdem die Fehlerwahrscheinlichkeit an, bei<br />
der die Aussage gerade noch angenommen wird (es genügt, den nächsten angegebenen<br />
Wert der Tabelle zu nehmen).<br />
(c) Das in (a) errechnete Konfidenzintervall enthält den Wert der Nullhypothese des Aufgabenteils<br />
(b), dennoch kann man in (b) die Nullhypothese verwerfen. Erläutern Sie diese<br />
scheinbar widersprüchlichen Ergebnisse.<br />
(d) Der Tank des “3-Liter Autos” fasst 25 l Kraftstoff. Geben Sie, bei einer Fehlerwahrscheinlichkeit<br />
von 10%, das Konfidenzintervall für die Reichweite mit einer Tankfüllung an.<br />
Hinweis: Verwenden Sie das Ergebnis der Teilaufgabe (a). Falls Sie (a) nicht gelöst haben,<br />
verwenden Sie das Verbrauchs-Konfidenzintervall [2.97 l/100km, 3.27 l/100km].<br />
(e) Kann man bei einer Fehlerwahrscheinlichkeit von 10% die Annahme verwerfen, dass die<br />
Standardabweichung des Verbrauchs über 0.4 l/100 km ist?<br />
Tipp: Es ist ein einseitiger Varianztest durchzuführen.<br />
5
Name: Vorname: Matrikel-Nr.:<br />
Blatt: 6 von 7<br />
Aufgabe 6<br />
(40 Punkte)<br />
Um Informationen über die M<strong>und</strong>-zu-M<strong>und</strong>werbung für das Bahnfahren zu erhalten, erhebt eine<br />
Bahngesellschaft bei 100 ihrer K<strong>und</strong>en Stichproben<br />
(i) über die Weiterempfehlungsabsicht,<br />
(ii) <strong>und</strong> über tatsächliche Weiterempfehlungen<br />
in Abhängigkeit von der Benutzungshäufigkeit. Folgende Tabellen zeigen die Ergebnisse:<br />
Empfehlungsabsicht<br />
ganz bestimmt<br />
eher ja<br />
vielleicht<br />
eher<br />
nicht<br />
Vielfahrer 16 5 4 1 14<br />
Wenigfahrer - 10 15 20 15<br />
ganz bestimmt<br />
nicht<br />
Tatsächlich weiterempfohlen<br />
ja<br />
nein<br />
Vielfahrer 25 15<br />
Wenigfahrer 25 35<br />
(a) Testen Sie mit dem χ 2 -Test bei einer Fehlerwahrscheinlichkeit von α = 1%, ob die Empfehlungsabsicht<br />
unabhängig von der Benutzungshäufigkeit ist.<br />
(b) Testen Sie nun (α = 1%), ob die tatsächliche Häufigkeit der Weiterempfehlungen von der<br />
Benutzungshäufigkeit abhängt.<br />
(c) Ermitteln Sie aus der Tabelle der χ 2 -Quantile die zwei Fehlerwahrscheinlichkeiten, bei<br />
der im Aufgabenteil (b) die Abhängigkeit (i) gerade noch, (ii) gerade nicht mehr, gezeigt<br />
werden kann. Falls Sie Teil (b) nicht gelöst haben, nehmen Sie als Realisierung der χ 2 -<br />
verteilten Testvariablen den Wert 4.17 an.<br />
(d) Warum ist es in dieser Untersuchung wichtig, bei der Erhebung der Empfehlungsabsicht<br />
diese zu differenzieren, also mehr als zwei Stufen zuzulassen? Begründen Sie ihre Aussage,<br />
indem Sie in obiger Tabelle die Stufen ”ganz bestimmt”, ”eher ja” <strong>und</strong> ”vielleicht”<br />
<strong>zur</strong> Aussage ”ja” sowie die Stufen ”eher nicht” <strong>und</strong> ”ganz bestimmt nicht” <strong>zur</strong> Aussage<br />
”nein” zusammenfassen <strong>und</strong> den Test wiederholen. Können Sie das Ergebnis anschaulich<br />
begründen? (Hinweis: Welche Information ginge bei der Zusammenfassung verloren?)<br />
6
Name: Vorname: Matrikel-Nr.:<br />
Blatt: 7 von 7<br />
Tabellen<br />
Quantile t (α)<br />
n<br />
der Studentschen t-Verteilung<br />
n α = 0.60 0.70 0.80 0.90 0.95 0.975 0.990 0.995 0.999 0.9995<br />
1 0.325 0.727 1.376 3.078 6.314 12.706 31.821 63.657 318.31 636.62<br />
2 0.289 0.617 1.061 1.886 2.920 4.303 6.965 9.925 22.327 31.598<br />
3 0.277 0.584 0.978 1.638 2.353 3.182 4.541 5.841 10.215 12.924<br />
4 0.271 0.569 0.941 1.533 2.132 2.776 3.747 4.604 7.173 8.610<br />
5 0.267 0.559 0.920 1.476 2.015 2.571 3.365 4.032 5.893 6.869<br />
6 0.265 0.553 0.906 1.440 1.943 2.447 3.143 3.707 5.208 5.959<br />
7 0.263 0.549 0.896 1.415 1.895 2.365 2.998 3.499 4.785 5.408<br />
8 0.262 0.546 0.889 1.397 1.860 2.306 2.896 3.355 4.501 5.041<br />
9 0.261 0.543 0.883 1.383 1.833 2.262 2.821 3.250 4.297 4.781<br />
10 0.260 0.542 0.879 1.372 1.812 2.228 2.764 3.169 4.144 4.587<br />
15 0.258 0.536 0.866 1.341 1.753 2.131 2.602 2.947 3.733 4.073<br />
20 0.257 0.533 0.860 1.325 1.725 2.086 2.528 2.845 3.552 3.850<br />
25 0.256 0.531 0.856 1.316 1.708 2.060 2.485 2.787 3.450 3.725<br />
30 0.256 0.530 0.854 1.310 1.697 2.042 2.457 2.750 3.385 3.646<br />
∞ 0.253 0.524 0.842 1.282 1.645 1.960 2.326 2.576 3.090 3.291<br />
Quantile q (m)<br />
α<br />
der χ 2 -Verteilung mit n Freiheitsgraden<br />
n α = 0.990 0.975 0.950 0.900 0.800 0.700 0.600 0.500 0.400 0.300 0.200 0.100<br />
1 6.60 5.02 3.84 2.71 0.45 0.02<br />
2 9.210 7.375 5.990 4.605 3.215 2.405 1.830 1.385 1.020 0.7100 0.4450 0.2100<br />
3 11.20 9.285 7.780 6.230 4.630 3.655 2.940 2.360 1.860 1.415 1.000 0.5750<br />
4 13.28 11.14 9.485 7.775 5.985 4.875 4.040 3.355 2.750 2.190 1.645 1.055<br />
5 15.23 12.89 11.10 9.250 7.295 6.065 5.135 4.350 3.655 3.000 2.340 1.605<br />
6 17.06 14.55 12.64 10.67 8.570 7.240 6.215 5.350 4.570 3.830 3.070 2.200<br />
7 18.79 16.14 14.13 12.05 9.820 8.395 7.290 6.350 5.495 4.675 3.825 2.835<br />
8 20.44 17.67 15.58 13.40 11.05 9.535 8.360 7.350 6.425 5.530 4.595 3.490<br />
9 22.03 19.17 17.00 14.72 12.26 10.67 9.420 8.350 7.360 6.395 5.385 4.170<br />
10 23.59 20.64 18.39 16.03 13.46 11.80 10.48 9.350 8.300 7.270 6.180 4.865<br />
15 31.01 27.66 25.08 22.35 19.34 17.34 15.75 14.35 13.04 11.73 10.31 8.550<br />
20 38.04 34.36 31.51 28.46 25.06 22.79 20.97 19.35 17.82 16.27 14.59 12.45<br />
30 51.43 47.20 43.89 40.32 36.28 33.55 31.33 29.35 27.45 25.51 23.37 20.61<br />
50 76.81 71.69 67.65 63.24 58.21 54.75 51.91 49.35 46.88 44.33 41.46 37.70<br />
100 136.7 129.9 124.5 118.6 111.7 106.9 103.0 99.35 95.82 92.14 87.95 82.36<br />
7