06.08.2013 Views

Stokastiske variable

Stokastiske variable

Stokastiske variable

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Nanostatistik: Stokastisk variabel<br />

JLJ<br />

Nanostatistik: Stokastisk variabel – p. 1/29


Repetition<br />

Ω: udfaldsrummet: alle de mulige udfald af et experiment<br />

P(A): ss for hændelsen A = frekvens i uafhængige<br />

gentagelser<br />

P(A ∪ B) = P(A) + P(B) når A og B er disjunkte<br />

hændelser<br />

Ex: Kaster en terning to gange.<br />

Ω = {(1, 1), (1, 2),... , (6, 5), (6, 6)}<br />

P(max =3 eller sum = 7) = P((1, 3), (2, 3), (3, 3), (3, 2), (3, 1)<br />

eller (1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1))<br />

= P(max =3) + P(sum = 7)<br />

Nanostatistik: Stokastisk variabel – p. 2/29


Stokastisk variabel<br />

Udfald ω ∈ Ω: et meget kompliceret objekt<br />

Experiment: måle nogle få egenskaber ved ω<br />

Ex: Ω = alle danske mænd over 20 år<br />

experiment: vælge en tilfældig person og måle højden<br />

Stokastisk variabel X: en egenskab ved ω der angives ved<br />

et reelt tal (vi bruger store bogstaver for stokastiske<br />

<strong>variable</strong>)<br />

Formelt: X er en afbildning fra Ω ind i de reelle tal<br />

Diskret stokastisk variabel: X kan kun antage heltallige<br />

værdier<br />

Kontinuert stokastisk variabel: X kan antage alle mulige<br />

værdier<br />

Nanostatistik: Stokastisk variabel – p. 3/29


Stokastisk variabel<br />

Ex1: Møntkast: X(pl) = 0, X(kr) = 1<br />

Ex2: Terningekast:<br />

<br />

X(m øjne) = m<br />

Y (m øjne) =<br />

0<br />

1<br />

hvis m er ulige<br />

hvis m er lige<br />

Ex3: Ω = alle mulige egetræer<br />

X(ω) = antallet af blade på træet ω (diskret)<br />

X(ω) = højden af træet ω (kontinuert)<br />

Nanostatistik: Stokastisk variabel – p. 4/29


Diskret stokastisk variabel<br />

X(ω) = i fortæller os ikke direkte hvad ω er<br />

Ex2: Y = 1 hvis et lige antal øjne på terning<br />

Y = 1 fortæller os at vi har fået enten 2, 4 eller 6 øjne<br />

X(ω) = i ⇔ ω ∈ Ωi = {˜ω|X(˜ω) = i}<br />

ss for X = i: P(X=i)<br />

= frekvens af værdien i i uafhængige gentagelser<br />

= frekvens hvormed vi får hændelsen Ωi = P(Ωi)<br />

Ex2: P(Y = 1) = P({2, 4, 6}) = 3 6<br />

Ex3: Kaste terning 2 gange.<br />

X = øjne i kast 1 - øjne i kast 2<br />

P(X = 2) = P((3, 1), (4, 2), (5, 3), (6, 4)}) = 4<br />

36<br />

Nanostatistik: Stokastisk variabel – p. 5/29


ss-funktion<br />

Notation: sandsynlighedsfunktionen<br />

fX(i) = P(X = i)<br />

Da fX(i) = P(X = i) har vi<br />

( <br />

i fx(i) = <br />

i<br />

0 ≤ fX(i) ≤ 1 <br />

fX(i) = 1<br />

P(X = i) = <br />

i P(Ωi) = P(Ω) = 1)<br />

Notation: Den kumulerede ss-funktion =<br />

fordelingsfunktionen<br />

FX(x) = P(X ≤ x) = <br />

i≤x<br />

i<br />

P(X = i) = <br />

i≤x fX(i)<br />

Nanostatistik: Stokastisk variabel – p. 6/29


ss-funktion<br />

Regneregel: Hvis B er en delmængde af A gælder der<br />

P(A \ B) = P(A) − P(B)<br />

da A = B ∪ (A \ B) har vi P(A) = P(B) + P(A \ B)<br />

FX ↔ fX:<br />

fx(i) = P(X = i) = P(X ≤ i) − P(X ≤ i − 1)<br />

Mere generelt:<br />

VIS PLOT<br />

= FX(i) − FX(i − 1)<br />

P(a < X ≤ b) = FX(b) − FX(a)<br />

Nanostatistik: Stokastisk variabel – p. 7/29


eksempel<br />

Ex3: Kaste terning 2 gange.<br />

X = øjne i kast 1 - øjne i kast 2<br />

P(X = 2) = P((3, 1), (4, 2), (5, 3), (6, 4)}) = 4<br />

36<br />

fX(0) = P(X = 0) = 6<br />

36<br />

fX(1) = P(X = 1) = 5<br />

36<br />

fX(2) = P(X = 2) = 4<br />

36<br />

.<br />

fX(5) = P(X = 5) = 1<br />

36<br />

Vis Plot<br />

= P(X = −1) = fX(−1)<br />

= P(X = −2) = fX(−2)<br />

= P(X = −5) = fX(−5)<br />

Nanostatistik: Stokastisk variabel – p. 8/29


Simultan ss<br />

X og Y : to stokastisk <strong>variable</strong> defineret på samme<br />

udfaldsrum Ω<br />

X : Ω → N Y : Ω → N<br />

Ex: Ω = danske mænd over 20 år<br />

X = højde i hele cm, Y = vægt i hele kg<br />

Den simultane sandsynlighed er<br />

fX,Y (i,j) = P(X = i,Y = j)<br />

= P({ω|X(ω) = i og Y (ω) = j)<br />

Læses: ss for at X = i og Y = j, dvs ss for fællesmængden<br />

{ω|X(ω) = i} ∩ {ω|Y (ω) = j}<br />

Nanostatistik: Stokastisk variabel – p. 9/29


Simultan ss<br />

Ex: Kaster to terninger<br />

Ω = {(i,j)|1 ≤ i,j ≤ 6}<br />

X = max af de to par øjne<br />

Y = summen af de to par øjne<br />

De mulige værdier af X er 1, 2, 3, 4, 5, 6<br />

og de mulige værdier af Y er 2, 3,...,12.<br />

VIS PLOT<br />

Lav tabel på tavlen<br />

P(X = 3,Y = 5) = P({(2, 3), (3, 2)}) = 2<br />

36<br />

Nanostatistik: Stokastisk variabel – p. 10/29


Marginal ss<br />

Fra P(X = i,Y = j) til P(X = i): Da<br />

{ω|X(ω) = i} = ∪j{ω|X(ω) = i,Y (ω) = j}<br />

og disse mængder er disjunkte har vi<br />

P(X = i) = <br />

P(X = i,Y = j)<br />

Ex: Kast med to terninger: X = max, Y = sum<br />

P(X = 3) = P(X = 3,Y = 2) + P(X = 3,Y = 3)<br />

VIS PLOT<br />

= 2<br />

36<br />

j<br />

+P(X = 3,Y = 4) + · · · + P(X = 3,Y = 12)<br />

+ 2<br />

36<br />

+ 1<br />

36<br />

Nanostatistik: Stokastisk variabel – p. 11/29


Betinget ss<br />

Ex: ss for flyulykke under start = antal ulykker / antal starter<br />

Køber billet hos Aeroflot: er det så den rigtige ss ?<br />

Istedet: antal ulykker med Aeroflot / antal starter med<br />

Aeroflot<br />

Dette kaldes en betinget ss: jeg betinger med at det er et<br />

Aeroflot fly. P(Y = j|X = i) læses: ss for at Y er j givet at<br />

X er i<br />

P(ulykke|Aeroflot) =<br />

=<br />

= P(ulykke og Aeroflot)<br />

#(ulykker og Aeroflot)<br />

#starter<br />

#(starter og Aeroflot)<br />

#starter<br />

P(Aeroflot)<br />

#(ulykker og Aeroflot)<br />

#(starter og Aeroflot)<br />

Nanostatistik: Stokastisk variabel – p. 12/29


Betinget ss<br />

Definition: P(X = i|Y = j) =<br />

P(X=i,Y =j)<br />

P(Y =j)<br />

Ex: Kast med to terninger: X = max, Y = sum<br />

P(Y = 5|X = 3) ?<br />

Givet X = 3 kan Y enten være 4, 5 eller 6: Vis plot<br />

der er 2 udfald der giver 4, to der giver 5 og 1 der giver 6, så<br />

P(Y = 5|X = 3) = 2 5<br />

P(X = 3,Y = 5) = 2<br />

36<br />

P(Y = 5|X = 3) = 2<br />

36<br />

5<br />

36<br />

= 2 5<br />

P(X = 3) = 5<br />

36<br />

Betinget ss = frekvens i den relevante delmængde af<br />

uafhængige gentagelser<br />

Nanostatistik: Stokastisk variabel – p. 13/29


Betinget ss<br />

Trækker 2 kort fra et spil kort med 52 kort. Hvad er den<br />

betingede ss for at kort 2 er en ruder givet at kort 1 var en<br />

spar?<br />

Ω = {(i,j)|1 ≤ i,j ≤ 52,j = i}, |Ω| = 52 · 51<br />

alle udfald har samme ss<br />

antal udfald med kort 1 en spar og kort 2 en ruder =<br />

13 · 13<br />

antal udfald med kort 1 en spar = 13 · 51<br />

betingede ss = 13·13<br />

52·51<br />

13·51<br />

52·51<br />

= 13<br />

51<br />

Nanostatistik: Stokastisk variabel – p. 14/29


Betinget ss<br />

Skriver vi rundt på definitionen har vi<br />

Heraf følger<br />

P(X = i,Y = j) = P(X = i|Y = j)P(Y = j)<br />

P(X = i) = <br />

P(X = i,Y = j) = <br />

P(X = i|Y = j)P(Y = j)<br />

j<br />

j<br />

Nanostatistik: Stokastisk variabel – p. 15/29


Uafhængighed<br />

X og Y er uafhængige: Viden om Y fortæller os ikke noget<br />

om X<br />

P(X = i|Y = j) = P(X = i) for alle i,j<br />

Dette er ækvivalent med<br />

eller<br />

P(X = i,Y = j)<br />

P(Y = j)<br />

= P(X = i) for alle i,j<br />

P(X = i,Y = j) = P(X = i)P(Y = j) for alle i,j<br />

Nanostatistik: Stokastisk variabel – p. 16/29


Uafhængighed<br />

Ubevidst brug af dette: To uafhængige kast med en terning:<br />

Alle 36 muligheder har samme ss.<br />

Hver mulighed har ss 1 36 = 1 6 · 1 6<br />

Ex: Kast med to terninger: X = max, Y = sum<br />

P(Y = 5) = P({(1, 4), (2, 3), (3, 2), (4, 1)}) = 4<br />

36 = 1 9<br />

P(Y = 5|X = 3) = 2 18<br />

5 = 45<br />

Altså er Y og X ikke uafhængige:<br />

viden om X giver os viden om Y<br />

= 5<br />

45<br />

Nanostatistik: Stokastisk variabel – p. 17/29


Kontinuert stokastisk variabel<br />

Ex: registreret eet klik i geigertæller i tidsintervallet [0,T]<br />

Hvornår kom klikket? X er tidspunktet<br />

Alle tidspunkter i [0,T] er mulige, ingen er mere oplagte end<br />

andre<br />

[0,T/2] og [T/2,T] har samme ss 1 2 .<br />

Halverer vi igen får vi 4 intervaller der er lige sandsynlige:<br />

X er uniformt fordelt på [0,T]<br />

P(X = x) = 0: alle intervaller af længe 1 n<br />

må have ss T/n<br />

Nanostatistik: Stokastisk variabel – p. 18/29


Kontinuert stokastisk variabel<br />

Istedet beskriver vi X ved dens fordelingsfunktion<br />

FX(x) = P(X ≤ x)<br />

Ud fra denne kan vi finde ss for ethvert interval<br />

P(X ∈ (a,b]) = P(X ≤ b) − P(X ≤ a) = FX(b) − FX(a)<br />

Uniforme fordeling:<br />

P(a < X ≤ b) er proportional med intervallængden<br />

P(a < X ≤ b) = b−a<br />

T<br />

FX(x) = P(X ≤ x) =<br />

⎧<br />

⎪⎨<br />

⎪⎩<br />

0 x ≤ 0<br />

x<br />

T 0 ≤ x ≤ T<br />

1 x > T<br />

Nanostatistik: Stokastisk variabel – p. 19/29


Tæthed<br />

Hvis FX er differentiabel kaldes<br />

for tætheden af X, og vi har<br />

fX(x) = F ′ X (x)<br />

P(X ∈ (a,b)) = FX(b) − FX(a) =<br />

Tæthed intutitivt:<br />

for ɛ lille<br />

b<br />

P(X ∈ [x − ɛ ɛ<br />

,x +<br />

2 2 ]) ≈ fX(x) · ɛ<br />

a<br />

fX(x)dx<br />

Nanostatistik: Stokastisk variabel – p. 20/29


Tæthed<br />

EX: Uniforme fordeling på [0,T]<br />

<br />

1T 0 ≤ x ≤ T<br />

fX(x) =<br />

0 ellers<br />

Nanostatistik: Stokastisk variabel – p. 21/29


Simultan fordeling<br />

X og Y begge kontinuerte <strong>variable</strong>. Fordelingsfunktion<br />

FX,Y (x,y) = P(X ≤ x,Y ≤ y)<br />

Udregning af P(a < X ≤ b,c < Y ≤ d):<br />

VIS PLOT<br />

{a < X ≤ b,c < Y ≤ d}<br />

= {a < X ≤ b,Y ≤ d} \ {a < X ≤ b,Y ≤ c}<br />

= ({X ≤ b,Y ≤ d} \ {X ≤ a,Y ≤ d}) \<br />

({X ≤ b,Y ≤ c} \ {X ≤ a,Y ≤ c})<br />

Nanostatistik: Stokastisk variabel – p. 22/29


Simultan fordeling<br />

Udregning af P(a < X ≤ b,c < Y ≤ d):<br />

P(a < X ≤ b,c < Y ≤ d)<br />

= [F(b,d) − F(a,d)] − [F(b,c) − F(a,c)]<br />

= F(b,d) − F(a,d) − F(b,c) + F(a,c)<br />

Nanostatistik: Stokastisk variabel – p. 23/29


Intuitivt:<br />

Simultan tæthed<br />

fX,Y (x,y) = ∂FX,Y (x,y)<br />

∂x∂y<br />

P(a < X ≤ b,c < Y ≤ d) =<br />

b<br />

a<br />

d<br />

c<br />

fX,Y (u,v)dvdu<br />

P(X ∈ [x − ɛ ɛ ɛ ɛ<br />

,x + ],Y ∈ [y − ,y +<br />

2 2 2 2 ]) ≈ fX,Y (x,y) · ɛ 2<br />

Nanostatistik: Stokastisk variabel – p. 24/29


Marginal tæthed<br />

fX(x) =<br />

fY (y) =<br />

P(a < X ≤ b) =<br />

∞<br />

−∞<br />

∞<br />

−∞<br />

b<br />

a<br />

fX,Y (x,y)dy<br />

fX,Y (x,y)dx<br />

fX(x)dx<br />

Nanostatistik: Stokastisk variabel – p. 25/29


P(a < X ≤ b,c < Y ≤ d) =<br />

Uafhængighed<br />

Betinget tæthed<br />

f X|Y (x|y) = fX,Y (x,y)<br />

fY (y)<br />

d<br />

c<br />

b<br />

fX,Y (x,y) = fX(x) · fY (y)<br />

a<br />

f X|Y (x|y)dx<br />

<br />

fY (y)dy<br />

Nanostatistik: Stokastisk variabel – p. 26/29


Eksempel<br />

Lad Ω = {(x,y)|0 ≤ x,y ≤ 1} være enhedskvadratet, og lad<br />

P være den uniforme fordeling, dvs P(A) er arealet af A<br />

Lad X være 1. koordinaten, Y 2. koordinaten, og lad<br />

U = X + Y<br />

Finde betingede tæthed for X givet U<br />

=<br />

FX,U(x,u)<br />

⎧<br />

⎨<br />

⎩<br />

FU(u) =<br />

⎧<br />

⎨<br />

⎩<br />

1<br />

2 u2 u < 1<br />

1 − 1<br />

2 (2 − u)2 1 ≤ u ≤ 2,<br />

ux − 1<br />

2 x2 u < 1, 0 ≤ x ≤ u<br />

x 2 + (1 − u)(1 − x) + 1<br />

2 (1 − x)2 1 ≤ u ≤ 2, u − 1 ≤ x ≤ 1<br />

Nanostatistik: Stokastisk variabel – p. 27/29


fU(u) =<br />

fX,U(x,u) =<br />

f X|U(x|u) =<br />

⎧<br />

⎨<br />

⎩<br />

⎧<br />

⎨<br />

⎩<br />

⎧<br />

⎨<br />

⎩<br />

Eksempel<br />

u u < 1<br />

(2 − u) 1 ≤ u ≤ 2,<br />

1 u < 1, 0 ≤ x ≤ u<br />

1 1 ≤ u ≤ 2, u − 1 ≤ x ≤ 1<br />

1<br />

u<br />

1<br />

2−u<br />

u < 1, 0 ≤ x ≤ u<br />

1 ≤ u ≤ 2, u − 1 ≤ x ≤ 1<br />

Nanostatistik: Stokastisk variabel – p. 28/29


Resume<br />

Stokastisk variabel: funktion fra udfaldsrum over i de hele<br />

tal eller over i de reelle tal<br />

Sandsynlighedsfunktion (tæthed) og fordelingsfunktion<br />

To stokastiske <strong>variable</strong>: simultan sandsynlighed og betinget<br />

sandsynlighed<br />

Nanostatistik: Stokastisk variabel – p. 29/29

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!