29.01.2015 Aufrufe

Klausur zur Vorlesung Statistik I und II, WS 2005/2006

Klausur zur Vorlesung Statistik I und II, WS 2005/2006

Klausur zur Vorlesung Statistik I und II, WS 2005/2006

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Name: Vorname: Matrikel-Nr.:<br />

Blatt: 1 von 5<br />

<strong>Klausur</strong> <strong>zur</strong> <strong>Vorlesung</strong> <strong>Statistik</strong> I <strong>und</strong> <strong>II</strong>,<br />

<strong>WS</strong> <strong>2005</strong>/<strong>2006</strong><br />

Aufgabe 1<br />

(50 Punkte)<br />

Folgende Tabelle gibt die Zahl der Fluggäste sowie den Umfang der Luftfracht auf deutschen<br />

Flughäfen im Jahre 2003 an:<br />

Flughafen<br />

Fluggäste<br />

(in 1000)<br />

Luftfracht<br />

(t)<br />

Stuttgart 3 715 10 086<br />

München 11 990 76 993<br />

Berlin-Tegel 5 530 6 021<br />

Hamburg 4 700 12 351<br />

Frankfurt/Main 23 980 783 777<br />

Düsseldorf 7 061 23 872<br />

Köln/Bonn 3 841 262 269<br />

Frankfurt Hahn 1 173 18 446<br />

10 weitere Verkehrsflugplätze 7 100 24 500<br />

Alle restlichen 532 Flugplätze 2 513 27<br />

(a) Geben Sie die Herfindahl-Indices der Konzentration der Fluggäste <strong>und</strong> der Luftfracht auf<br />

die deutschen Flughäfen an. Was würde sich ändern, wenn man die 532 kleineren Flugplätze<br />

nicht berücksichtigte<br />

(b) Zeichnen Sie die Lorentzkurve <strong>und</strong> berechnen Sie den Gini-Koeffizienten der Konzentration<br />

der Fluggäste auf die 18 VerkehrsflughäfenFlughäfen, ohne die 532 kleinen zu berücksichtigen.<br />

(c) Ändern sich die relativen Konzentrationsmaße deutlicher als die absoluten, wenn man die<br />

kleinen Flughäfen hinzunimmt (keine Rechnung verlangt!) Was ist also das Problem der<br />

relativen Konzentrationsmaße<br />

(d) Geben Sie den Korrelationskoeffizienten zwischen der Zahl der Fluggäste <strong>und</strong> der Menge<br />

an Luftfracht an.<br />

1


Name: Vorname: Matrikel-Nr.:<br />

Blatt: 2 von 5<br />

Aufgabe 2<br />

(20 Punkte)<br />

Der <strong>Statistik</strong> Dresdner Einwohner entnimmt man für Juni <strong>2005</strong> folgende Daten:<br />

zugezogene Personen 1 506<br />

fortgezogene Personen 1 306<br />

innerhalb Dresdens umgezogene Personen 3 706<br />

Eheschließungen 653<br />

Scheidungen 11<br />

Lebendgeborene 484<br />

Gestorbenene 387<br />

Einwohner 481 429<br />

(a) Geben Sie für jedes statistische Merkmal an, ob es sich um eine Bestands- oder eine<br />

Bewegungsmasse handelt. Finden Sie ein korrespondierendes Paar von Bestands- <strong>und</strong> Bewegungsmassen.<br />

(b) Wie hoch war die Einwohnerzahl im Mai <strong>2005</strong><br />

Aufgabe 3<br />

(50 Punkte)<br />

Für den Fortzug von Dresden in die Alten B<strong>und</strong>esländer ist folgende Zeitreihe gegeben:<br />

Jahr<br />

Quartal Q I Q <strong>II</strong> Q <strong>II</strong>I Q IV<br />

2001 1 600 1 580 2 420 1 980<br />

2002 1 510 1 420 1 820 1 520<br />

2003 1 370 1 200 1 640 1 390<br />

2004 1 240 1 060 1 590 1 440<br />

(a) Begründen Sie, warum ein multiplikatives Modell dem Datenmaterial angemessen ist<br />

(b) Führen Sie eine multiplikative Saisonbereinigung durch. Geben Sie die Saisonindexziffern<br />

an. Wie wäre nach diesem Modell die Prognose für die vier Quartale <strong>2005</strong><br />

2


Name: Vorname: Matrikel-Nr.:<br />

Blatt: 3 von 5<br />

Aufgabe 4<br />

(50 Punkte)<br />

Der <strong>Statistik</strong>stelle der Landeshauptstadt Dresden entnimmt man folgende Verteilung der 481 429<br />

Einwohner Dresdens auf die einzelnen 365 Geburtstage (29. Februar nicht berücksichtigt):<br />

Dresdner Einwohner nach Geburtstagen<br />

Durchschnitt<br />

Feb Apr Jun Aug Okt Dez<br />

(a) Die durchgezogene Kurve gibt eine Glättung der Daten an, welche man z.B. mit dem<br />

gleitenden arithmetischen Mittel gewinnen kann.<br />

(i) Wie groß muss man den Glättungsparameter des gleitenden Mittels wählen, damit<br />

die Geburtstags-Spitze im September nahezu “weggemittelt” wird, die jahreszeitliche<br />

Verteilung “mehr Geburtstage im Frühjahr als im Herbst” aber korrekt wiedergegeben<br />

wird (keine Rechnung, Angabe der Größenordnung genügt!)<br />

(ii) Was muss man zusätzlich bei der Glättung beachten (bedenken Sie, dass der Jahresbeginn<br />

am 1. Januar willkürlich ist!)<br />

(b) Weicht die Geburtstagsverteilung bei einer Fehlerwahrscheinlichkeit von 1 % signifikant<br />

von einer Gleichverteilung ab Berücksichtigen Sie dabei, dass in der Grafik die Fläche<br />

zwischen dem Mittelwert <strong>und</strong> der geglätteten Kurve von Mitte Januar bis Juli (<strong>und</strong> auch<br />

die entsprechende Nettofläche zwischen ungeglätteten Daten <strong>und</strong> Mittelwert) etwa sechs<br />

der von den punktierten Linien begrenzten “Kästchen” entspricht.<br />

Hinweis: Kolmogorow-Smirnov-Anpassungstest.<br />

(c) Kann man die Geburtstags-Spitze im September durch eine statistische Schwankung erklären,<br />

wenn man den Kolmogorow-Smirnov-Test wie oben zugr<strong>und</strong>elegt Falls nein, hat<br />

man damit statistisch eine besonders “fruchtbaren” Empfängniszeitraum im Dezember<br />

bewiesen<br />

(d) In Österreich wurden bei der Volkszählung im Jahre 2001 am ersten Januar 37 700 Geburtstage<br />

erfasst, im Mittel jedoch nur 22 082. In Dresden gab es am 1. Januar ebenfalls<br />

erstaunlich viele Geburtstage (linkester Datenpunkt der Grafik). Was könnte die Ursache<br />

dieser hochsignifikanten Abweichungen sein (jede plausible Erklärung ergibt volle Punktzahl!)<br />

3


Name: Vorname: Matrikel-Nr.:<br />

Blatt: 4 von 5<br />

Aufgabe 5<br />

(30 Punkte)<br />

Eine Kfz-Haftpflichtversicherung teilt ihre K<strong>und</strong>en in vier Schadenfreiheitsklassen (SF-Klassen)<br />

ein. Zur Ermittlung der “Schadenfreiheitsrabatte” wird folgende Tabelle der im letzten Jahr<br />

eingehenden Schadensmeldungen zugr<strong>und</strong>egelegt (die “Unfallfreiheit” gilt natürlich für den Zeitraum<br />

vor der aktuellen Schadensmeldung):<br />

SF-Klasse<br />

Zahl der Mitglieder<br />

Anteil an den Schadensmeldungen<br />

SF 1 (unfallfrei ≤ 2 Jahre) 50 000 30%<br />

SF 2 (unfallfrei 2-5 Jahre) 80 000 30%<br />

SF 3 (unfallfrei 5-10 Jahre) 80 000 24%<br />

SF 4 (unfallfrei > 10 Jahre) 66 667 16%<br />

Die Mitglieder der SF 1 zahlen 100% des Referenzbeitrages, die Mitglieder der SF k = 2 bis<br />

4 bekommen Rabatte, so dass der zu zahlende Versicherungsbetrag proportional <strong>zur</strong> bedingten<br />

Wahrscheinlichkeit dafür ist, dass sie im Bezugszeitraum (mindestens) eine Schadensmeldung<br />

eingereicht haben. Bestimmen Sie die Rabatte mit Hilfe des Satzes von Bayes <strong>und</strong> berücksichtigen<br />

Sie dabei das Gesetz der großen Zahlen.<br />

Hinweis: zu berechnen sind also Quotienten der bedingten Wahrscheinlichkeiten einer Schadensmeldung<br />

eines Mitglieds, falls dieses in SF k ist, bezogen auf die Schadenshäufigkeit von<br />

Mitgliedern der SF 1.<br />

Aufgabe 6<br />

(40 Punkte)<br />

Einer Befragung nach der Verkehrsmittelwahl in Dresden ergab 2002 für den Arbeitsweg folgende<br />

Ergebnisse: 43% PKW Fahrer, 3% PKW Mitfahrer, 1 % Motorrad, Moped o. ä., 20%<br />

Straßenbahn, 12% Bus, 3% S-Bahn, 13% Fahrrad <strong>und</strong> nur 5% zu Fuß ohne Benutzung anderer<br />

Verkehrsmittel.<br />

(a) Zeichnen Sie ein Tortendiagramm dieses Sachverhalts.<br />

(b) Der Stichprobenfehler soll für alle Anteile bei einem Signifikanzniveau von 5% kleiner als<br />

2% sein. Wie groß muss man den Stichprobenumfang mindestens wählen<br />

(c) Gegenüber dem Vorjahr stieg der Anteil der Fahrradbenutzer von 11% auf 13%. Beide<br />

Stichproben hatten den Umfang 2000. Sind die Unterschiede bei einer Fehlerwahrscheinlichkeit<br />

von 1% signifikant Verwenden Sie den Differenztest für zwei unabhängige Stichproben!<br />

4


Name: Vorname: Matrikel-Nr.:<br />

Blatt: 5 von 5<br />

Tabellen<br />

Quantile z q der Standardnormalverteilung<br />

q z q q z q q z q q z q<br />

0.995 2.5758 0.945 1.5982 0.880 1.1750 0.680 0.4677<br />

0.990 2.3263 0.940 1.5548 0.860 1.0803 0.660 0.4125<br />

0.985 2.1701 0.935 1.5141 0.840 0.9945 0.640 0.3585<br />

0.980 2.0537 0.930 1.4758 0.820 0.9154 0.620 0.3055<br />

0.975 1.9600 0.925 1.4395 0.800 0.8416 0.600 0.2533<br />

0.970 1.8808 0.920 1.4051 0.780 0.7722 0.580 0.2019<br />

0.965 1.8119 0.915 1.3722 0.760 0.7063 0.560 0.1510<br />

0.960 1.7507 0.910 1.3408 0.740 0.6433 0.540 0.1004<br />

0.955 1.6954 0.905 1.3106 0.720 0.5828 0.520 0.0502<br />

0.950 1.6448 0.900 1.2815 0.700 0.5244 0.500 0.0000<br />

Quantile t (q)<br />

n<br />

der Studentschen t-Verteilung<br />

n q = 0.60 0.70 0.80 0.90 0.95 0.975 0.990 0.995 0.999 0.9995<br />

1 0.325 0.727 1.376 3.078 6.314 12.706 31.821 63.657 318.31 636.62<br />

2 0.289 0.617 1.061 1.886 2.920 4.303 6.965 9.925 22.327 31.598<br />

3 0.277 0.584 0.978 1.638 2.353 3.182 4.541 5.841 10.215 12.924<br />

4 0.271 0.569 0.941 1.533 2.132 2.776 3.747 4.604 7.173 8.610<br />

5 0.267 0.559 0.920 1.476 2.015 2.571 3.365 4.032 5.893 6.869<br />

6 0.265 0.553 0.906 1.440 1.943 2.447 3.143 3.707 5.208 5.959<br />

7 0.263 0.549 0.896 1.415 1.895 2.365 2.998 3.499 4.785 5.408<br />

8 0.262 0.546 0.889 1.397 1.860 2.306 2.896 3.355 4.501 5.041<br />

9 0.261 0.543 0.883 1.383 1.833 2.262 2.821 3.250 4.297 4.781<br />

10 0.260 0.542 0.879 1.372 1.812 2.228 2.764 3.169 4.144 4.587<br />

15 0.258 0.536 0.866 1.341 1.753 2.131 2.602 2.947 3.733 4.073<br />

20 0.257 0.533 0.860 1.325 1.725 2.086 2.528 2.845 3.552 3.850<br />

25 0.256 0.531 0.856 1.316 1.708 2.060 2.485 2.787 3.450 3.725<br />

30 0.256 0.530 0.854 1.310 1.697 2.042 2.457 2.750 3.385 3.646<br />

∞ 0.253 0.524 0.842 1.282 1.645 1.960 2.326 2.576 3.090 3.291<br />

5

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!