Klausur zur Vorlesung Statistik I und II, WS 2005/2006
Klausur zur Vorlesung Statistik I und II, WS 2005/2006
Klausur zur Vorlesung Statistik I und II, WS 2005/2006
Verwandeln Sie Ihre PDFs in ePaper und steigern Sie Ihre Umsätze!
Nutzen Sie SEO-optimierte ePaper, starke Backlinks und multimediale Inhalte, um Ihre Produkte professionell zu präsentieren und Ihre Reichweite signifikant zu maximieren.
Name: Vorname: Matrikel-Nr.:<br />
Blatt: 1 von 5<br />
<strong>Klausur</strong> <strong>zur</strong> <strong>Vorlesung</strong> <strong>Statistik</strong> I <strong>und</strong> <strong>II</strong>,<br />
<strong>WS</strong> <strong>2005</strong>/<strong>2006</strong><br />
Aufgabe 1<br />
(50 Punkte)<br />
Folgende Tabelle gibt die Zahl der Fluggäste sowie den Umfang der Luftfracht auf deutschen<br />
Flughäfen im Jahre 2003 an:<br />
Flughafen<br />
Fluggäste<br />
(in 1000)<br />
Luftfracht<br />
(t)<br />
Stuttgart 3 715 10 086<br />
München 11 990 76 993<br />
Berlin-Tegel 5 530 6 021<br />
Hamburg 4 700 12 351<br />
Frankfurt/Main 23 980 783 777<br />
Düsseldorf 7 061 23 872<br />
Köln/Bonn 3 841 262 269<br />
Frankfurt Hahn 1 173 18 446<br />
10 weitere Verkehrsflugplätze 7 100 24 500<br />
Alle restlichen 532 Flugplätze 2 513 27<br />
(a) Geben Sie die Herfindahl-Indices der Konzentration der Fluggäste <strong>und</strong> der Luftfracht auf<br />
die deutschen Flughäfen an. Was würde sich ändern, wenn man die 532 kleineren Flugplätze<br />
nicht berücksichtigte<br />
(b) Zeichnen Sie die Lorentzkurve <strong>und</strong> berechnen Sie den Gini-Koeffizienten der Konzentration<br />
der Fluggäste auf die 18 VerkehrsflughäfenFlughäfen, ohne die 532 kleinen zu berücksichtigen.<br />
(c) Ändern sich die relativen Konzentrationsmaße deutlicher als die absoluten, wenn man die<br />
kleinen Flughäfen hinzunimmt (keine Rechnung verlangt!) Was ist also das Problem der<br />
relativen Konzentrationsmaße<br />
(d) Geben Sie den Korrelationskoeffizienten zwischen der Zahl der Fluggäste <strong>und</strong> der Menge<br />
an Luftfracht an.<br />
1
Name: Vorname: Matrikel-Nr.:<br />
Blatt: 2 von 5<br />
Aufgabe 2<br />
(20 Punkte)<br />
Der <strong>Statistik</strong> Dresdner Einwohner entnimmt man für Juni <strong>2005</strong> folgende Daten:<br />
zugezogene Personen 1 506<br />
fortgezogene Personen 1 306<br />
innerhalb Dresdens umgezogene Personen 3 706<br />
Eheschließungen 653<br />
Scheidungen 11<br />
Lebendgeborene 484<br />
Gestorbenene 387<br />
Einwohner 481 429<br />
(a) Geben Sie für jedes statistische Merkmal an, ob es sich um eine Bestands- oder eine<br />
Bewegungsmasse handelt. Finden Sie ein korrespondierendes Paar von Bestands- <strong>und</strong> Bewegungsmassen.<br />
(b) Wie hoch war die Einwohnerzahl im Mai <strong>2005</strong><br />
Aufgabe 3<br />
(50 Punkte)<br />
Für den Fortzug von Dresden in die Alten B<strong>und</strong>esländer ist folgende Zeitreihe gegeben:<br />
Jahr<br />
Quartal Q I Q <strong>II</strong> Q <strong>II</strong>I Q IV<br />
2001 1 600 1 580 2 420 1 980<br />
2002 1 510 1 420 1 820 1 520<br />
2003 1 370 1 200 1 640 1 390<br />
2004 1 240 1 060 1 590 1 440<br />
(a) Begründen Sie, warum ein multiplikatives Modell dem Datenmaterial angemessen ist<br />
(b) Führen Sie eine multiplikative Saisonbereinigung durch. Geben Sie die Saisonindexziffern<br />
an. Wie wäre nach diesem Modell die Prognose für die vier Quartale <strong>2005</strong><br />
2
Name: Vorname: Matrikel-Nr.:<br />
Blatt: 3 von 5<br />
Aufgabe 4<br />
(50 Punkte)<br />
Der <strong>Statistik</strong>stelle der Landeshauptstadt Dresden entnimmt man folgende Verteilung der 481 429<br />
Einwohner Dresdens auf die einzelnen 365 Geburtstage (29. Februar nicht berücksichtigt):<br />
Dresdner Einwohner nach Geburtstagen<br />
Durchschnitt<br />
Feb Apr Jun Aug Okt Dez<br />
(a) Die durchgezogene Kurve gibt eine Glättung der Daten an, welche man z.B. mit dem<br />
gleitenden arithmetischen Mittel gewinnen kann.<br />
(i) Wie groß muss man den Glättungsparameter des gleitenden Mittels wählen, damit<br />
die Geburtstags-Spitze im September nahezu “weggemittelt” wird, die jahreszeitliche<br />
Verteilung “mehr Geburtstage im Frühjahr als im Herbst” aber korrekt wiedergegeben<br />
wird (keine Rechnung, Angabe der Größenordnung genügt!)<br />
(ii) Was muss man zusätzlich bei der Glättung beachten (bedenken Sie, dass der Jahresbeginn<br />
am 1. Januar willkürlich ist!)<br />
(b) Weicht die Geburtstagsverteilung bei einer Fehlerwahrscheinlichkeit von 1 % signifikant<br />
von einer Gleichverteilung ab Berücksichtigen Sie dabei, dass in der Grafik die Fläche<br />
zwischen dem Mittelwert <strong>und</strong> der geglätteten Kurve von Mitte Januar bis Juli (<strong>und</strong> auch<br />
die entsprechende Nettofläche zwischen ungeglätteten Daten <strong>und</strong> Mittelwert) etwa sechs<br />
der von den punktierten Linien begrenzten “Kästchen” entspricht.<br />
Hinweis: Kolmogorow-Smirnov-Anpassungstest.<br />
(c) Kann man die Geburtstags-Spitze im September durch eine statistische Schwankung erklären,<br />
wenn man den Kolmogorow-Smirnov-Test wie oben zugr<strong>und</strong>elegt Falls nein, hat<br />
man damit statistisch eine besonders “fruchtbaren” Empfängniszeitraum im Dezember<br />
bewiesen<br />
(d) In Österreich wurden bei der Volkszählung im Jahre 2001 am ersten Januar 37 700 Geburtstage<br />
erfasst, im Mittel jedoch nur 22 082. In Dresden gab es am 1. Januar ebenfalls<br />
erstaunlich viele Geburtstage (linkester Datenpunkt der Grafik). Was könnte die Ursache<br />
dieser hochsignifikanten Abweichungen sein (jede plausible Erklärung ergibt volle Punktzahl!)<br />
3
Name: Vorname: Matrikel-Nr.:<br />
Blatt: 4 von 5<br />
Aufgabe 5<br />
(30 Punkte)<br />
Eine Kfz-Haftpflichtversicherung teilt ihre K<strong>und</strong>en in vier Schadenfreiheitsklassen (SF-Klassen)<br />
ein. Zur Ermittlung der “Schadenfreiheitsrabatte” wird folgende Tabelle der im letzten Jahr<br />
eingehenden Schadensmeldungen zugr<strong>und</strong>egelegt (die “Unfallfreiheit” gilt natürlich für den Zeitraum<br />
vor der aktuellen Schadensmeldung):<br />
SF-Klasse<br />
Zahl der Mitglieder<br />
Anteil an den Schadensmeldungen<br />
SF 1 (unfallfrei ≤ 2 Jahre) 50 000 30%<br />
SF 2 (unfallfrei 2-5 Jahre) 80 000 30%<br />
SF 3 (unfallfrei 5-10 Jahre) 80 000 24%<br />
SF 4 (unfallfrei > 10 Jahre) 66 667 16%<br />
Die Mitglieder der SF 1 zahlen 100% des Referenzbeitrages, die Mitglieder der SF k = 2 bis<br />
4 bekommen Rabatte, so dass der zu zahlende Versicherungsbetrag proportional <strong>zur</strong> bedingten<br />
Wahrscheinlichkeit dafür ist, dass sie im Bezugszeitraum (mindestens) eine Schadensmeldung<br />
eingereicht haben. Bestimmen Sie die Rabatte mit Hilfe des Satzes von Bayes <strong>und</strong> berücksichtigen<br />
Sie dabei das Gesetz der großen Zahlen.<br />
Hinweis: zu berechnen sind also Quotienten der bedingten Wahrscheinlichkeiten einer Schadensmeldung<br />
eines Mitglieds, falls dieses in SF k ist, bezogen auf die Schadenshäufigkeit von<br />
Mitgliedern der SF 1.<br />
Aufgabe 6<br />
(40 Punkte)<br />
Einer Befragung nach der Verkehrsmittelwahl in Dresden ergab 2002 für den Arbeitsweg folgende<br />
Ergebnisse: 43% PKW Fahrer, 3% PKW Mitfahrer, 1 % Motorrad, Moped o. ä., 20%<br />
Straßenbahn, 12% Bus, 3% S-Bahn, 13% Fahrrad <strong>und</strong> nur 5% zu Fuß ohne Benutzung anderer<br />
Verkehrsmittel.<br />
(a) Zeichnen Sie ein Tortendiagramm dieses Sachverhalts.<br />
(b) Der Stichprobenfehler soll für alle Anteile bei einem Signifikanzniveau von 5% kleiner als<br />
2% sein. Wie groß muss man den Stichprobenumfang mindestens wählen<br />
(c) Gegenüber dem Vorjahr stieg der Anteil der Fahrradbenutzer von 11% auf 13%. Beide<br />
Stichproben hatten den Umfang 2000. Sind die Unterschiede bei einer Fehlerwahrscheinlichkeit<br />
von 1% signifikant Verwenden Sie den Differenztest für zwei unabhängige Stichproben!<br />
4
Name: Vorname: Matrikel-Nr.:<br />
Blatt: 5 von 5<br />
Tabellen<br />
Quantile z q der Standardnormalverteilung<br />
q z q q z q q z q q z q<br />
0.995 2.5758 0.945 1.5982 0.880 1.1750 0.680 0.4677<br />
0.990 2.3263 0.940 1.5548 0.860 1.0803 0.660 0.4125<br />
0.985 2.1701 0.935 1.5141 0.840 0.9945 0.640 0.3585<br />
0.980 2.0537 0.930 1.4758 0.820 0.9154 0.620 0.3055<br />
0.975 1.9600 0.925 1.4395 0.800 0.8416 0.600 0.2533<br />
0.970 1.8808 0.920 1.4051 0.780 0.7722 0.580 0.2019<br />
0.965 1.8119 0.915 1.3722 0.760 0.7063 0.560 0.1510<br />
0.960 1.7507 0.910 1.3408 0.740 0.6433 0.540 0.1004<br />
0.955 1.6954 0.905 1.3106 0.720 0.5828 0.520 0.0502<br />
0.950 1.6448 0.900 1.2815 0.700 0.5244 0.500 0.0000<br />
Quantile t (q)<br />
n<br />
der Studentschen t-Verteilung<br />
n q = 0.60 0.70 0.80 0.90 0.95 0.975 0.990 0.995 0.999 0.9995<br />
1 0.325 0.727 1.376 3.078 6.314 12.706 31.821 63.657 318.31 636.62<br />
2 0.289 0.617 1.061 1.886 2.920 4.303 6.965 9.925 22.327 31.598<br />
3 0.277 0.584 0.978 1.638 2.353 3.182 4.541 5.841 10.215 12.924<br />
4 0.271 0.569 0.941 1.533 2.132 2.776 3.747 4.604 7.173 8.610<br />
5 0.267 0.559 0.920 1.476 2.015 2.571 3.365 4.032 5.893 6.869<br />
6 0.265 0.553 0.906 1.440 1.943 2.447 3.143 3.707 5.208 5.959<br />
7 0.263 0.549 0.896 1.415 1.895 2.365 2.998 3.499 4.785 5.408<br />
8 0.262 0.546 0.889 1.397 1.860 2.306 2.896 3.355 4.501 5.041<br />
9 0.261 0.543 0.883 1.383 1.833 2.262 2.821 3.250 4.297 4.781<br />
10 0.260 0.542 0.879 1.372 1.812 2.228 2.764 3.169 4.144 4.587<br />
15 0.258 0.536 0.866 1.341 1.753 2.131 2.602 2.947 3.733 4.073<br />
20 0.257 0.533 0.860 1.325 1.725 2.086 2.528 2.845 3.552 3.850<br />
25 0.256 0.531 0.856 1.316 1.708 2.060 2.485 2.787 3.450 3.725<br />
30 0.256 0.530 0.854 1.310 1.697 2.042 2.457 2.750 3.385 3.646<br />
∞ 0.253 0.524 0.842 1.282 1.645 1.960 2.326 2.576 3.090 3.291<br />
5