Trainingsaufgaben zur Klausurvorbereitung in Statistik I und II
Trainingsaufgaben zur Klausurvorbereitung in Statistik I und II
Trainingsaufgaben zur Klausurvorbereitung in Statistik I und II
Verwandeln Sie Ihre PDFs in ePaper und steigern Sie Ihre Umsätze!
Nutzen Sie SEO-optimierte ePaper, starke Backlinks und multimediale Inhalte, um Ihre Produkte professionell zu präsentieren und Ihre Reichweite signifikant zu maximieren.
Technische Universität Dresden, Professur für Verkehrsökonometrie <strong>und</strong> -statistik<br />
<strong>Tra<strong>in</strong><strong>in</strong>gsaufgaben</strong> <strong>zur</strong> <strong>Klausurvorbereitung</strong><br />
<strong>in</strong> <strong>Statistik</strong> I <strong>und</strong> <strong>II</strong><br />
Geburtstagsparadoxon<br />
Auf e<strong>in</strong>er Party kommen n Leute zusammen. Wir stellen uns die Frage, wie hoch die<br />
Wahrsche<strong>in</strong>lichkeit dafür ist, dass m<strong>in</strong>destens 2 Leute am gleichen Tag Geburtstag haben.<br />
Gehen Sie vere<strong>in</strong>fachend davon aus, dass ke<strong>in</strong>er am 29. Februar Geburtstag hat <strong>und</strong> alle<br />
Geburtstage gleichwahrsche<strong>in</strong>lich s<strong>in</strong>d.<br />
(a) Zunächst ist die Party mit n = 6 Personen noch kle<strong>in</strong>. Wie hoch ist die Wahrsche<strong>in</strong>lichkeit,<br />
dass m<strong>in</strong>destens 2 Leute am gleichen Tag Geburtstag haben Um wieviel<br />
ist diese Wahrsche<strong>in</strong>lichkeit höher als bei n = 2 Personen<br />
(b) Berechnen Sie die Wahrsche<strong>in</strong>lichkeit P n für beliebige n. Sie können für kle<strong>in</strong>e x von<br />
der Näherung<br />
1 − x ≈ e −x<br />
Gebrauch machen. Praktisch ist auch noch die Gauß’sche Summenformel<br />
1 + 2 + 3 + · · · + (n − 1) =<br />
n(n − 1)<br />
.<br />
2<br />
(c) Ab wieviel Leuten ist P n ≥ 0.5, d.h. wann lohnt es sich zu wetten<br />
Lösung: Geburtstagsparadoxon<br />
Kurze Variante:<br />
Person A hat mit der Wahrsche<strong>in</strong>lichkeit 1/365 am 1. Januar Geburtstag. Dementsprechend<br />
ist die Wahrsche<strong>in</strong>lichkeit für nicht am 1. Januar Geburtstag 364/365. Dass<br />
Person B an e<strong>in</strong>em anderen Tag als Person A Geburtstag hat, hat die Wahrsche<strong>in</strong>lichkeit<br />
364/365. Die Wahrsche<strong>in</strong>lichkeit für Person C an e<strong>in</strong>em anderen Tag als A oder<br />
B ist 363/365 etc. Mit dem Ereignis A = “n Leuten haben an verschiedenen Tagen<br />
Geburtstag” ergibt sich durch Multiplikation<br />
Bevor wir losrechnen, gibt es noch den<br />
P(A) = 365<br />
365 · 364<br />
365 · 363 365 − (n − 1)<br />
· . . .<br />
365 365<br />
(1)<br />
www.mtreiber.de/statistikTra<strong>in</strong><strong>in</strong>gsaufg Seite 1
Technische Universität Dresden, Professur für Verkehrsökonometrie <strong>und</strong> -statistik<br />
0.1 Ausführlichen, formalisierten Ansatz:<br />
Zunächst müssen wir versuchen, e<strong>in</strong> geeignetes Ereignis zu def<strong>in</strong>ieren. Die Aufgabe zielt<br />
darauf ab, die Wahrsche<strong>in</strong>lichkeit P zu messen von<br />
A(n) = “m<strong>in</strong>d. 2 von n Leuten haben am gleichen Tag Geburtstag”. (2)<br />
Wir betrachten das Komplement<br />
A(n) = “n Leute haben an verschiedenen Tagen Geburtstag”. (3)<br />
Das Ereignis A(n) kann man aufbröseln, <strong>in</strong>dem man es zerlegt <strong>in</strong> die Ereignisse mit<br />
durchnummerierten Personen<br />
(a) A 12 “Wahrsche<strong>in</strong>lichkeit, dass Person 1 <strong>und</strong> 2 an verschiedenen Tagen Geburtstag<br />
haben”,<br />
(b) A 123 “Wahrsche<strong>in</strong>lichkeit, dass Person 1,2 <strong>und</strong> 3 an verschiedenen Tagen Geburtstag<br />
haben”,<br />
(c) . . .,<br />
n. A 123...n “Wahrsche<strong>in</strong>lichkeit, dass Person 1, 2, 3 . . .n an verschiedenen Tagen Geburtstag<br />
haben”.<br />
Dafür lassen sich <strong>in</strong>tuitiv bed<strong>in</strong>gte Wahrsche<strong>in</strong>lichkeiten angeben (die Bed<strong>in</strong>gungen stellen<br />
sicher, dass wirklich alle Personen an verschiedenen Tagen Geburtstag haben):<br />
P(A 12 |A 1 ) = 364<br />
365<br />
P(A 123 |A 1 ∩ A 12 ) = 363<br />
365<br />
365 − (n − 1)<br />
P(A 12...n |A 1 ∩ A 12 ∩ · · · ∩ A 12...n ) =<br />
365<br />
Jetzt kann man die formale Rechnung beg<strong>in</strong>nen, wobei wir die Verallgeme<strong>in</strong>erung des<br />
Multiplikationstheorems verwenden 1<br />
P(A(n)) = P(A 1 ∩ A 12 ∩ A 123 ∩ . . .A 123...n )<br />
= P(A 1 ) · P(A 12 |A 1 ) · · · · · P(A 12...n |A 1 ∩ A 12 . . .A 12...(n−1) ).<br />
Die Wahrsche<strong>in</strong>lichkeiten P(A 12 |A 1 ) etc. haben wir uns schon überlegt. Bleibt noch<br />
P(A 1 ). Dazu stellen wir uns den Fall mit n = 1 vor. Welchen Wert würde man P(A(1))<br />
1 Es gilt<br />
P(A 1 ∩A 2 ∩A 3 ∩. . . A n) = P(A 1) ·P(A 2|A 1) ·P(A 3|A 1 ∩A 2) · · · P(A n|A 1 ∩A 2 ∩. . . A 12...(n−1) ), (4)<br />
was man durch Ausschreiben der bed<strong>in</strong>gten Wahrsche<strong>in</strong>lichkeiten der rechten Seite <strong>und</strong> anschliessendes<br />
Kürzen leicht sieht.<br />
www.mtreiber.de/statistikTra<strong>in</strong><strong>in</strong>gsaufg Seite 2
Technische Universität Dresden, Professur für Verkehrsökonometrie <strong>und</strong> -statistik<br />
s<strong>in</strong>nvollerweise zuordnen Damit die Aufgabe nicht trivial wird (man selbst hat immer<br />
am gleichen Tag wie man selbst Geburtstag), def<strong>in</strong>ieren wir P(A(1)) ≡ P(A 1 ) = 0 <strong>und</strong><br />
entsprechend P(A 1 ) = 1 − P(A 1 ) = 1. Man erhält also das Produkt<br />
P ( A (n) ) = 1 · 364<br />
365 · 363 365 − (n − 1)<br />
· . . .<br />
(<br />
365 365<br />
= 1 · 1 − 1 ) (<br />
· 1 − 2 ) (<br />
· · · · · 1 − n − 1 )<br />
365 365 365<br />
Unf jetzt die Näherung:<br />
Für größere n oder den Aufgabenteil 3 ist dieser Ausdruck zu umständlich. Wir wollen<br />
durch e<strong>in</strong>e Näherung das Produkt vere<strong>in</strong>fachen, <strong>in</strong>dem wir ausnutzten, dass man für<br />
kle<strong>in</strong>e x auch schreiben kann<br />
1 − x ≈ e −x . (5)<br />
Damit lautet der Ausdruck<br />
P(A(n)) ≈<br />
1 · e −1/365 · e −2/365 · . . .e −(n−1)/365<br />
= e − 1<br />
365 (1+2+3+...+(n−1))<br />
= e − 1<br />
365 · n(n−1)<br />
2 ,<br />
wobei wir im letzten Schritt die Gauss’sche Summenformel<br />
1 + 2 + 3 + . . . + (n − 1) =<br />
n(n − 1)<br />
2<br />
verwendet haben. Damit erhält man also die Näherungsformel<br />
(6)<br />
P(A(n)) = 1 − P(A(n))<br />
≈ 1 − e − 1 n(n−1)<br />
365 2 .<br />
Party mit 6 Leuten<br />
Berechnen wir erstmal mit der eben gewonnenen Formel die Wahrsche<strong>in</strong>lichkeiten für<br />
n = 6 <strong>und</strong> n = 2 aus:<br />
P(A(6)) = 1 − e − 6·5<br />
730 ≈ 0.04026<br />
P(A(2)) = 1 − e − 2·1<br />
730 ≈ 0.002735<br />
Aus dem Verhältnis der Zahlen ergibt sich, dass die Wahrsche<strong>in</strong>lichkeit um ca. den<br />
Faktor 15 erhöht ist. Auf den ersten Blick paradox, oder 2 Wir könnten uns auch die<br />
Mühe machen <strong>und</strong> die Ergebnisse exakt, d.h. ohne Näherung berechnen:<br />
P (A (2)) = 1 − 1 · 364<br />
365<br />
≈ 0.002740.<br />
2 Dieses Problem wird gerne als Paradoxie bezeichnet, aber es ist eher gegen die Intuition als wirklich<br />
paradox.<br />
www.mtreiber.de/statistikTra<strong>in</strong><strong>in</strong>gsaufg Seite 3
Technische Universität Dresden, Professur für Verkehrsökonometrie <strong>und</strong> -statistik<br />
P (A (6)) = 1 − 1 · 364<br />
365 · 363<br />
365 · 362<br />
365 · 361<br />
365 · 360<br />
365<br />
≈ 0.04046<br />
Der Fehler durch die Näherung ist also (zum<strong>in</strong>dest für n ≤ 6) kle<strong>in</strong>.<br />
Wann ist P(A(n)) ≥ 0.5 <br />
Wir können die Bestimmungsgleichung für n h<strong>in</strong>schreiben:<br />
1 − e − 1 n(n−1)<br />
365 2 ≥ 1 2 . (7)<br />
Logarithmieren der Gleichung <strong>und</strong> ln1/2 = − ln2 führen auf<br />
− ln2 ≥ −<br />
n(n − 1)<br />
. (8)<br />
730<br />
Multiplizieren mit −1 dreht das Ungleichheitszeichen um <strong>und</strong> es ergibt sich die quadratische<br />
Gleichung<br />
0 ≤ n 2 − n − 730 ln2. (9)<br />
Lösung mit der “pq”-Formel 3 (wobei nur die positive Lösung s<strong>in</strong>nvoll ist):<br />
n = 1 2 + √730 ln2 + 1 4<br />
≈ 22.98. (11)<br />
Also ist für e<strong>in</strong>e Gruppe mit n ≥ 23 die Wahrsche<strong>in</strong>lichkeit größer als 50%, dass zwei<br />
Leute am gleichen Tag Geburtstag haben. Man kann noch das Ergebnis der Näherung<br />
mit der “richtigen Lösung” ohne Näherung vergleichen, <strong>in</strong>dem man e<strong>in</strong>en Computer<br />
befragt:<br />
P(A(23)) exakt ≈ 0.507<br />
P(A(23)) genaehrt ≈ 0.500<br />
Die Näherung führt also – wenn auch knapp – zum gleichen n.<br />
3 Eher für mich als für den Rest der Welt: x 2 + px + q = 0 wird gelöst durch<br />
x 1/2 = − p r<br />
p<br />
2 ± 2<br />
− q. (10)<br />
4<br />
www.mtreiber.de/statistikTra<strong>in</strong><strong>in</strong>gsaufg Seite 4
Technische Universität Dresden, Professur für Verkehrsökonometrie <strong>und</strong> -statistik<br />
1<br />
0.8<br />
P(Doppelgeburtstag)<br />
0.6<br />
0.4<br />
0.2<br />
0<br />
n<br />
pDoppel(n)<br />
n<br />
pDoppelNaeh(n)<br />
5 10 15 20 25 30 35 40 45 50<br />
Groesse n der Gruppe<br />
www.mtreiber.de/statistikTra<strong>in</strong><strong>in</strong>gsaufg Seite 5