08.04.2014 Aufrufe

Klausur zur Vorlesung Statistik I und II, WS 2003/2004

Klausur zur Vorlesung Statistik I und II, WS 2003/2004

Klausur zur Vorlesung Statistik I und II, WS 2003/2004

MEHR ANZEIGEN
WENIGER ANZEIGEN

Verwandeln Sie Ihre PDFs in ePaper und steigern Sie Ihre Umsätze!

Nutzen Sie SEO-optimierte ePaper, starke Backlinks und multimediale Inhalte, um Ihre Produkte professionell zu präsentieren und Ihre Reichweite signifikant zu maximieren.

Name: Vorname: Matrikel-Nr.:<br />

Blatt: 1 von 7<br />

<strong>Klausur</strong> <strong>zur</strong> <strong>Vorlesung</strong> <strong>Statistik</strong> I <strong>und</strong> <strong>II</strong>,<br />

<strong>WS</strong> <strong>2003</strong>/<strong>2004</strong><br />

Aufgabe 1:<br />

(40 Punkte)<br />

Statistische Erhebungen für den Weg <strong>zur</strong> Arbeit oder Bildungsstätte ergaben für Deutschland<br />

im Jahr 2000 folgende Verteilungen für die einfache Entfernung des Weges:<br />

Entfernung<br />

(km)<br />

Erwerbstätige<br />

(Millionen)<br />

0 − 10 15.8<br />

10 − 30 9.7<br />

30 − 50 3.7<br />

> 50 1.4<br />

(a) Bestimmen Sie für die vier Klassen die relativen Häufigkeiten.<br />

(b) Berechnen Sie die empirische Verteilungsfunktion <strong>und</strong> die Dichtefunktion. Nehmen Sie<br />

dabei als Obergrenze 100 km an. Zeichnen Sie die Funktionen in die folgenden Diagramme:<br />

f D<br />

0.06<br />

0.055<br />

0.05<br />

0.045<br />

0.04<br />

0.035<br />

0.03<br />

0.025<br />

0.02<br />

0.015<br />

0.01<br />

0.005<br />

0<br />

0 10 20 30 40 50 60 70 80 90 100<br />

Arbeitsweg (km)<br />

F<br />

1<br />

0.9<br />

0.8<br />

0.7<br />

0.6<br />

0.5<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

0<br />

0 10 20 30 40 50 60 70 80 90 100<br />

Arbeitsweg (km)<br />

(c) Beschreiben Sie (ohne Rechnung) die Form der Verteilung bezüglich Symmetrie <strong>und</strong> Modalität.<br />

Handelt es sich um nominal-, ordinal- oder kardinalskalierte Daten? Ist die Verteilung<br />

linkssteil oder rechtssteil?<br />

(d) Nach einem (verworfenen) Vorschlag vom B<strong>und</strong>esfinanzminister sollten künftig nur noch<br />

Arbeitswege von mindestens 21 km Länge von der Steuer absetzbar sein. Wieviel Prozent<br />

könnten auch unter dieser Regelung den Arbeitsweg von der Steuer absetzen?<br />

(e) Erstellen Sie einen Box-and-Whisker Plot der Verteilung.<br />

1


Name: Vorname: Matrikel-Nr.:<br />

Blatt: 2 von 7<br />

Aufgabe 2<br />

(30 Punkte)<br />

Die Einwohner Sachsens waren <strong>2003</strong> wie folgt auf Städte <strong>und</strong> Gemeinden verschiedener Größe<br />

aufgeteilt:<br />

Größenklasse (Einwohner)<br />

Anzahl der<br />

Gemeinden<br />

Gesamtzahl der Einwohner<br />

(Tausend)<br />

< 2 000 123 176.5<br />

2 000 – 10 000 347 1491.2<br />

10 000 – 100 000 65 1387.4<br />

> 100 000 4 1329.2<br />

(a) Berechnen Sie die Lorenzkurve <strong>und</strong> zeichnen Sie sie in untenstehendes Diagramm ein.<br />

(b) Berechnen Sie den Gini-Koeffizienten.<br />

1<br />

0.8<br />

0.6<br />

P<br />

0.4<br />

0.2<br />

0<br />

0 0.2 0.4 0.6 0.8 1<br />

F<br />

2


Name: Vorname: Matrikel-Nr.:<br />

Blatt: 3 von 7<br />

Aufgabe 3<br />

(50 Punkte)<br />

Eine S-Bahn Linie hatte in den letzten beiden Jahren die in der Tabelle angegebenen täglichen<br />

Fahrgastzahlen (in Tausend):<br />

Jahr Quartal 1 Quartal 2 Quartal 3 Quartal 4<br />

2002 410 680 710 430<br />

<strong>2003</strong> 440 720 710 460<br />

Zur Abschätzung des zukünftigen Fahrgastaufkommens soll anhand dieser Daten eine Zeitreihenanalyse<br />

vorgenommmen werden.<br />

(a) Berechnen Sie den gleitenden Durchschnitt der Ordnung 1 Jahr (d.h. 4 Quartale). Begründen<br />

Sie anschaulich, warum in diesem Durchschnitt die jährlichen Schwankungen<br />

weitgehend verschwinden.<br />

(b) Führen Sie eine exponentielle Glättung der Daten mit dem Glättungsparameter α = 1/2<br />

durch. Verwenden Sie als Anfangswert den ersten Datenwert. Welcher Glättungszeitkonstante<br />

(in Jahren oder Quartalen) entspricht obiger Glättungsparameter?<br />

(c) Führen Sie an den Daten eine lineare Regression durch. Welchen Wert hat die Regressionsgerade<br />

im 2. Quartal <strong>2004</strong>?<br />

(d) Zieht man von den Daten den durch die Regressionsgerade gegebenen Trend ab (additive<br />

Aufspaltung), erhält man folgende stationäre Zeitreihe:<br />

Jahr Quartal 1 Quartal 2 Quartal 3 Quartal 4<br />

2002 -137 126 150 -137<br />

<strong>2003</strong> -133 140 124 -133<br />

Berechnen Sie die Saisonfigur für die 4 Quartale.<br />

(e) Geben Sie für alle 8 Zeitpunkte die Restkomponente bei einer additiven Aufspaltung an.<br />

(f) Prognostizieren Sie die Fahrgastzahlen für die 4 Quartale des Jahres <strong>2004</strong> mit Hilfe der<br />

Trend- <strong>und</strong> Saisonkomponente.<br />

3


Name: Vorname: Matrikel-Nr.:<br />

Blatt: 4 von 7<br />

Aufgabe 4<br />

(35 Punkte)<br />

Aus statistischen Untersuchungen ist bekannt, dass alkoholisierte Autofahrer pro gefahrenen<br />

Kilometer ein zehnmal so hohes Unfallrisiko haben wie nichtbetrunkene Fahrer. Ferner ist von<br />

Fahrkontrollen her bekannt, dass 5% aller kontrollierten Fahrer alkoholisiert sind.<br />

(a) Berechnen Sie mit dem Satz von Bayes die Wahrscheinlichkeit dafür, dass ein Unfallverursacher<br />

alkoholisiert ist.<br />

Hinweis: In der Formel für den Satz von Bayes kürzen sich die nicht angegebenen absoluten<br />

Zahlenwerte für die Unfallwahrscheinlichkeiten heraus. Sie können also z.B. die bedingten<br />

Wahrscheinlichkeit dafür, dass ein alkoholisierter Fahrer einen Unfall verursacht, zu 10%<br />

annehmen.<br />

(b) Die vor Ort verwendeten Alkoholtestgeräte sind nicht unfehlbar <strong>und</strong> zeigen nur bei 90%<br />

aller Alkoholisierten ein positives Ergebnis an, während sie bei 5% der Nichtbetrunkenen<br />

einen falschen Alarm geben. Nach einer Alkoholkontrolle mit positivem Ergebnis zweifelt<br />

ein Betroffener das Ergebnis der Messung an. Mit welcher Wahrscheinlichkeit hat er Recht,<br />

wenn die Messung<br />

(i) im Rahmen einer gewöhnlichen Fahrerkontrolle,<br />

(ii) nach einem von ihm verursachten Unfall<br />

stattfand?<br />

Hinweis: Falls Sie Teil (a) nicht gerechnet haben, verwenden Sie den Wert 34.5 % für die<br />

Wahrscheinlichkeit der Alkoholisierung eines Unfallverursachers.<br />

4


Name: Vorname: Matrikel-Nr.:<br />

Blatt: 5 von 7<br />

Aufgabe 5<br />

(45 Punkte)<br />

Bei einem Kraftstoff-Verbrauchstest werden von 5 Fahrzeugen des Typs “3-Liter Auto” die<br />

Verbrauchswerte bestimmt:<br />

Fahrzeug-Nr 1 2 3 4 5<br />

Verbrauch (l/100 km) 3.05 3.35 3.2 3.0 3.0<br />

(a) Berechnen Sie zu einer Fehlerwahrscheinlichkeit von 10% das Konfidenzintervall für den<br />

Verbrauch.<br />

(b) Der Fahrzeughersteller gibt den mittleren Kraftstoffverbrauch des “3-Liter Autos” mit<br />

unter 3 Litern auf 100 km an. Kann man ihn bei einer Fehlerwahrscheinlichkeit von 10%<br />

der Falschaussage bezichtigen? Geben Sie außerdem die Fehlerwahrscheinlichkeit an, bei<br />

der die Aussage gerade noch angenommen wird (es genügt, den nächsten angegebenen<br />

Wert der Tabelle zu nehmen).<br />

(c) Das in (a) errechnete Konfidenzintervall enthält den Wert der Nullhypothese des Aufgabenteils<br />

(b), dennoch kann man in (b) die Nullhypothese verwerfen. Erläutern Sie diese<br />

scheinbar widersprüchlichen Ergebnisse.<br />

(d) Der Tank des “3-Liter Autos” fasst 25 l Kraftstoff. Geben Sie, bei einer Fehlerwahrscheinlichkeit<br />

von 10%, das Konfidenzintervall für die Reichweite mit einer Tankfüllung an.<br />

Hinweis: Verwenden Sie das Ergebnis der Teilaufgabe (a). Falls Sie (a) nicht gelöst haben,<br />

verwenden Sie das Verbrauchs-Konfidenzintervall [2.97 l/100km, 3.27 l/100km].<br />

(e) Kann man bei einer Fehlerwahrscheinlichkeit von 10% die Annahme verwerfen, dass die<br />

Standardabweichung des Verbrauchs über 0.4 l/100 km ist?<br />

Tipp: Es ist ein einseitiger Varianztest durchzuführen.<br />

5


Name: Vorname: Matrikel-Nr.:<br />

Blatt: 6 von 7<br />

Aufgabe 6<br />

(40 Punkte)<br />

Um Informationen über die M<strong>und</strong>-zu-M<strong>und</strong>werbung für das Bahnfahren zu erhalten, erhebt eine<br />

Bahngesellschaft bei 100 ihrer K<strong>und</strong>en Stichproben<br />

(i) über die Weiterempfehlungsabsicht,<br />

(ii) <strong>und</strong> über tatsächliche Weiterempfehlungen<br />

in Abhängigkeit von der Benutzungshäufigkeit. Folgende Tabellen zeigen die Ergebnisse:<br />

Empfehlungsabsicht<br />

ganz bestimmt<br />

eher ja<br />

vielleicht<br />

eher<br />

nicht<br />

Vielfahrer 16 5 4 1 14<br />

Wenigfahrer - 10 15 20 15<br />

ganz bestimmt<br />

nicht<br />

Tatsächlich weiterempfohlen<br />

ja<br />

nein<br />

Vielfahrer 25 15<br />

Wenigfahrer 25 35<br />

(a) Testen Sie mit dem χ 2 -Test bei einer Fehlerwahrscheinlichkeit von α = 1%, ob die Empfehlungsabsicht<br />

unabhängig von der Benutzungshäufigkeit ist.<br />

(b) Testen Sie nun (α = 1%), ob die tatsächliche Häufigkeit der Weiterempfehlungen von der<br />

Benutzungshäufigkeit abhängt.<br />

(c) Ermitteln Sie aus der Tabelle der χ 2 -Quantile die zwei Fehlerwahrscheinlichkeiten, bei<br />

der im Aufgabenteil (b) die Abhängigkeit (i) gerade noch, (ii) gerade nicht mehr, gezeigt<br />

werden kann. Falls Sie Teil (b) nicht gelöst haben, nehmen Sie als Realisierung der χ 2 -<br />

verteilten Testvariablen den Wert 4.17 an.<br />

(d) Warum ist es in dieser Untersuchung wichtig, bei der Erhebung der Empfehlungsabsicht<br />

diese zu differenzieren, also mehr als zwei Stufen zuzulassen? Begründen Sie ihre Aussage,<br />

indem Sie in obiger Tabelle die Stufen ”ganz bestimmt”, ”eher ja” <strong>und</strong> ”vielleicht”<br />

<strong>zur</strong> Aussage ”ja” sowie die Stufen ”eher nicht” <strong>und</strong> ”ganz bestimmt nicht” <strong>zur</strong> Aussage<br />

”nein” zusammenfassen <strong>und</strong> den Test wiederholen. Können Sie das Ergebnis anschaulich<br />

begründen? (Hinweis: Welche Information ginge bei der Zusammenfassung verloren?)<br />

6


Name: Vorname: Matrikel-Nr.:<br />

Blatt: 7 von 7<br />

Tabellen<br />

Quantile t (α)<br />

n<br />

der Studentschen t-Verteilung<br />

n α = 0.60 0.70 0.80 0.90 0.95 0.975 0.990 0.995 0.999 0.9995<br />

1 0.325 0.727 1.376 3.078 6.314 12.706 31.821 63.657 318.31 636.62<br />

2 0.289 0.617 1.061 1.886 2.920 4.303 6.965 9.925 22.327 31.598<br />

3 0.277 0.584 0.978 1.638 2.353 3.182 4.541 5.841 10.215 12.924<br />

4 0.271 0.569 0.941 1.533 2.132 2.776 3.747 4.604 7.173 8.610<br />

5 0.267 0.559 0.920 1.476 2.015 2.571 3.365 4.032 5.893 6.869<br />

6 0.265 0.553 0.906 1.440 1.943 2.447 3.143 3.707 5.208 5.959<br />

7 0.263 0.549 0.896 1.415 1.895 2.365 2.998 3.499 4.785 5.408<br />

8 0.262 0.546 0.889 1.397 1.860 2.306 2.896 3.355 4.501 5.041<br />

9 0.261 0.543 0.883 1.383 1.833 2.262 2.821 3.250 4.297 4.781<br />

10 0.260 0.542 0.879 1.372 1.812 2.228 2.764 3.169 4.144 4.587<br />

15 0.258 0.536 0.866 1.341 1.753 2.131 2.602 2.947 3.733 4.073<br />

20 0.257 0.533 0.860 1.325 1.725 2.086 2.528 2.845 3.552 3.850<br />

25 0.256 0.531 0.856 1.316 1.708 2.060 2.485 2.787 3.450 3.725<br />

30 0.256 0.530 0.854 1.310 1.697 2.042 2.457 2.750 3.385 3.646<br />

∞ 0.253 0.524 0.842 1.282 1.645 1.960 2.326 2.576 3.090 3.291<br />

Quantile q (m)<br />

α<br />

der χ 2 -Verteilung mit n Freiheitsgraden<br />

n α = 0.990 0.975 0.950 0.900 0.800 0.700 0.600 0.500 0.400 0.300 0.200 0.100<br />

1 6.60 5.02 3.84 2.71 0.45 0.02<br />

2 9.210 7.375 5.990 4.605 3.215 2.405 1.830 1.385 1.020 0.7100 0.4450 0.2100<br />

3 11.20 9.285 7.780 6.230 4.630 3.655 2.940 2.360 1.860 1.415 1.000 0.5750<br />

4 13.28 11.14 9.485 7.775 5.985 4.875 4.040 3.355 2.750 2.190 1.645 1.055<br />

5 15.23 12.89 11.10 9.250 7.295 6.065 5.135 4.350 3.655 3.000 2.340 1.605<br />

6 17.06 14.55 12.64 10.67 8.570 7.240 6.215 5.350 4.570 3.830 3.070 2.200<br />

7 18.79 16.14 14.13 12.05 9.820 8.395 7.290 6.350 5.495 4.675 3.825 2.835<br />

8 20.44 17.67 15.58 13.40 11.05 9.535 8.360 7.350 6.425 5.530 4.595 3.490<br />

9 22.03 19.17 17.00 14.72 12.26 10.67 9.420 8.350 7.360 6.395 5.385 4.170<br />

10 23.59 20.64 18.39 16.03 13.46 11.80 10.48 9.350 8.300 7.270 6.180 4.865<br />

15 31.01 27.66 25.08 22.35 19.34 17.34 15.75 14.35 13.04 11.73 10.31 8.550<br />

20 38.04 34.36 31.51 28.46 25.06 22.79 20.97 19.35 17.82 16.27 14.59 12.45<br />

30 51.43 47.20 43.89 40.32 36.28 33.55 31.33 29.35 27.45 25.51 23.37 20.61<br />

50 76.81 71.69 67.65 63.24 58.21 54.75 51.91 49.35 46.88 44.33 41.46 37.70<br />

100 136.7 129.9 124.5 118.6 111.7 106.9 103.0 99.35 95.82 92.14 87.95 82.36<br />

7

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!