13.07.2015 Views

Noter i sandsynlighedsregning

Noter i sandsynlighedsregning

Noter i sandsynlighedsregning

SHOW MORE
SHOW LESS
  • No tags were found...

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>Noter</strong> i <strong>sandsynlighedsregning</strong>Skrevet af Andreas Næs Aaserud. Dette er en redigeret udgave af et eksamensnotesætjeg skrev til min egen SaSt2-eksamen i 2007. Der tages forbehold forfejl. Senest ændret d. 22/03-08.Den første del af herværende tekst (til og med side 11) er et forsøg på at anskueliggørede vigtigste denitioner og resultater i Kapitel 5, 6 og 8 i MichaelSørensens bog En Introduktion til Sandsynlighedsregning, herefter forkortet MS,og som en oversigt over de forskellige kontinuerte fordelinger der nævnes deri.Bemærk dog at indholdet af det korte afsnit om reelle transformationer i MSKapitel 6 ikke er gentaget her. I den sidste del af denne tekst (side 12) givesnogle bemærkninger til visse almindelige opgavetyper i <strong>sandsynlighedsregning</strong>.En-dimensionelle kontinuerte fordelinger: oversigtEksponentielfordeling med parameter λ.Tæthed:hvor λ ∈ (0, ∞) og x ∈ (0, ∞).Fordelingsfunktionen:{F (x) =Middelværdi: 1/λ. Varians: 1/λ 2 .p(x) = λe −λx ,0, for x ≤ 01 − e −λx , for x > 0Beta-fordeling.Tæthed:hvor β ∈ (0, ∞) og x ∈ (0, 1).Fordelingsfunktionen:Middelværdi: β/(β + 1). Varians:p(x) = βx β−1 ,⎧⎨ 0, for x ≤ 0F (x) = x β , for 0 < x < 1⎩1, for x ≥ 1ββ+2 − β2(β+1) 2 .Bemærk, at hvis X er beta-fordelt, så er Z = 1/X pareto-fordelt (se herunder).Ligefordelingen på [a, b].Tæthed:p(x) = 1 [a,b](x)b − a ,1


hvor x ∈ R.Fordelingsfunktionen:⎧⎨F (x) =⎩0, for x ≤ afor a < x < b1, for x ≥ bx−ab−a ,Middelværdi: b−a(b−a)22. Varians:12.Pareto-fordeling.Tæthed:hvor α ∈ (0, ∞) og x ∈ (1, ∞).Fordelingsfunktionen:{F (x) =p(x) = αx −(α+1) ,0, for x < 11 − x −α , for x ≥ 1(ek-Middelværdi: α/(α − 1) (eksisterer kun hvis α > 1). Varians:sisterer kun hvis α > 2).α(α−2)(α−1) 2Bemærk, at hvis X er pareto-fordelt, så er Z = 1/X beta-fordelt (se herover).Arcus-sinus fordeling.Tæthed:hvor x ∈ (−1, 1).Fordelingsfunktionen:⎧⎨F (x) =⎩Middelværdi: 0. Varians: 1/2.p(x) =1π √ 1 − x 2 ,0, for x ≤ −11π arcsin(x) + 1 2 , for − 1 < x < 11, for x ≥ 1Cauchy-fordeling.Tæthed:hvor x ∈ R.Fordelingsfunktionen:p(x) =1π(1 + x 2 ) ,F (x) = 1 π arctan(x) + 1 2Middelværdi: Eksisterer ikke. Varians: Eksisterer ikke.2


Standard Normalfordeling.Tæthed:hvor x ∈ R.Fordelingsfunktionen:Middelværdi: 0. Varians: 1.ϕ(x) = √ 1)exp(− x2,2π 2Φ(x) =∫ x−∞ϕ(y) dyNormalfordeling med middelværdi µ og varians σ 2 .Denition: Hvis U et standard normalfordelt, er Y = µ + σU, hvor σ > 0 ogµ ∈ R, normalfordelt med middelværdi µ og varians σ 2 .Tæthed:p(x) =hvor σ > 0, µ ∈ R og x ∈ R.Fordelingsfunktionen:Middelværdi: µ. Varians: σ 2 .( )1√ exp (x − µ)2−2πσ2 2σ 2 ,( ) x − µF (x) = ΦσSum af uafhængige normalfordelinger (jf. MS Sætn. 6.3.12): Hvis X 1 , . . . , X n eruafhængige stokastiske variable, og X i er normalfordelt med middelværdi µ i ogvarians σ 2 i , i = 1, . . . , n, så er X 1 + · · · + X n normalfordelt med middelværdiµ 1 + · · · + µ n og varians σ 2 1 + · · · + σ 2 n.Γ-fordeling med formparameter α og skalaparameter β.Tæthed:hvor α > 0, β > 0, x ∈ (0, ∞), ogp(x) = xα−1 e −x/ββ α ,Γ(α)Γ(α) =∫ ∞0y α−1 e −y dyopfylder funktionalligningen Γ(α + 1) = αΓ(α).Middelværdi: αβ. Varians: αβ 2 .Γ-fordelingens foldningsegenskab (jf. MS Sætn. 8.1.3): Hvis X 1 , . . . , X n er uafhængigestokastiske variable, og X i er Γ-fordelt med formparameter α i og skalaparameterβ, i = 1, . . . , n, så er X 1 + · · · + X n Γ-fordelt med formparameter α 1 + · · · + α nog skalaparemeter β.3


Formparameter: Når x går mod 0, så går p(x) mod ∞, hvis α < 1, mod β −1 ,hvis α = 1, og mod 0, hvis α > 1.Skalaparameter: Hvis X er Γ-fordelt med formparameter α og skalaparameterβ, så er cX, hvor c > 0, Γ-fordelt med formparameter α og skalaparameter cβ.χ 2 -fordeling med k frihedsgrader.Denition: Hvis U 1 , . . . , U k er uafhængige standard normalfordelte stokastiskevariable, kaldes fordelingen af U 2 1 +· · ·+U 2 k χ2 -fordelingen med k frihedsgrader.Tæthed:hvor x ∈ (0, ∞), og⎧⎨c k = Γ(k/2) =⎩Middelværdi: k. Varians: 2k.p(x) = xk/2−1 e −x/22 k/2 c k,√ π, for k = 1(k/2 − 1)!, for k lige(k/2 − 1) · · · 12√ π, for k = 3, 5, 7, . . .Bemærk, at χ 2 -fordelingen med k frihedsgrader er Γ-fordelingen med formparameterk/2 og skalaparameter 2.σ 2 χ 2 -fordeling med k frihedsgrader.Denition: Hvis X er χ 2 -fordelt med k frihedsgrader, kaldes fordelingen af σ 2 X,hvor σ 2 > 0, σ 2 χ 2 -fordelingen med k frihedsgrader.Bemærk, at σ 2 χ 2 -fordelingen med k frihedsgrader er Γ-fordelingen med formparameterk/2 og skalaparameter 2σ 2 .Tæthed:p(x) = xk/2−1 e −x/(2σ2 )(2σ 2 ) k/2 c k,hvor x ∈ (0, ∞), og c k er deneret som for χ 2 -fordelingen.Middelværdi: kσ 2 . Varians: 2kσ 4 .F-fordelingen med (f 1 , f 2 ) frihedsgrader.Denition: Hvis Z 1 og Z 2 er uafhængige stokastiske variable, som er χ 2 -fordeltemed hhv. f 1 og f 2 frihedsgrader, kaldes fordelingen afX = Z 1/f 1Z 2 /f 2F-fordelingen med (f 1 , f 2 ) frihedsgrader.Tæthed:p(x) = f f1/21 f f2/22 Γ((f 1 + f 2 )/2) x f1/2−1·Γ(f 1 /2)Γ(f 2 /2) (f 2 + f 1 x) ,(f1+f2)/24


hvor x > 0.Middelværdi:f 2f 2−2 (eksisterer hvis og kun hvis f 2 > 2).t-fordelingen med f frihedsgrader.Denition: Hvis U er standard normalfordelt, og uafhængige af Z, som er χ 2 -fordelt med f frihedsgrader, kaldes fordelingen aft-fordelingen med f frihedsgrader.Tæthed:hvor x > 0.p(x) =T =Bemærk, at hvis f = 1, så er tæthedenU √Z/fΓ((f + 1)/2) 1√ ·πf Γ(f/2) (1 + x 2 /f) , (f+1)/2p(x) =1π(1 + x 2 )så t-fordelingen med 1 frihedsgrad er Cauchy-fordelingen.Middelværdi: 0 (eksisterer hvis og kun hvis f > 1). Varians: f/(f −2) (eksistererhvis og kun hvis f > 2).En-dimensionelle kontinuerte fordelinger: begreberTæthed.En funktion p : I → [0, ∞), hvor I ⊆ R, som opfylder∫p(x) dx = 1,kaldes en (sandsynligheds)tæthed på I.IMed andre ord er en funktion f : I → R, hvor I ⊆ R, en tæthed på I, hvis ogkun hvis den opfylder følgende to betingelser:(1) ∀x ∈ I : f(x) ≥ 0(2) ∫ f(x) dx = 1IHvis p er en tæthed på I, så erq(x) = 1 I (x)p(x)en tæthed på R, som opfylder q(x) = p(x) for alle x ∈ I, og q(x) = 0 for allex /∈ I. Man kan derfor erstatte en tæthed p på et interval I med en tæthed q påhele R for at lette løsning af integraler.5


Kontinuert fordeling.Enhver tæthed p på et interval I ⊆ R denerer et sandsynlighedsmål P på Ived∫∫P (A) = 1 A (x)p(x) dx = p(x) dxIAfor alle A ⊆ I, hvor integralet giver mening.Et sådant sandsynlighedsmål kaldes en kontinuert fordeling, som har tæthed p.Et sandsynlighedsmål P på I kan opfattes som en fordeling på R, ved for B ⊆ Rat sætte P (B) = P (B ∩ I), dvs.∫∫P (B) = 1 B∩I (x)p(x) dx = p(x) dxIB∩IHvis X er en stokastisk variabel, hvis fordeling er kontinuert og har tæthedenp, kaldes en kontinuert stokastisk variabel, og der gælderP (X ∈ A) =for enhver delmængde A ⊆ R.∫ ∞−∞1 A (x)p(x) dxFordelingsfunktion.Fordelingsfunktionen for en kontinuert fordeling på R med tæthed p er en funktionF : R → [0, 1] givet vedF (x) = P ((−∞, x]) =∫ x−∞p(y) dyF opfylder lim n→∞ F (n) = 1 og lim n→∞ F (−n) = 0 og der gælder F ′ (x) = p(x).MS Sætn. 5.1.5: Hvis en fordelingsfunktion F har formenF (x) =∫ x−∞f(y) dyhvor f er ikke-negativ, da er fordelingen svarende til F kontinuert med tæthedf.MS Sætn. 5.1.6: Hvis F er en fordelingsfunktion for en fordeling, som er koncentreretpå et åbent interval I, dvs. P (I) = 1, og F er kontinuert dierentiabel påI, da er den til F svarende fordeling kontinuert med tæthed p(x) = 1 I (x)F ′ (x).Udvidet version: Hvis F er en fordelingsfunktion for en fordeling, som er koncentreretpå et åbent interval I, dvs. P (I) = 1, og F er kontinuert samt kontinuertdierentiabel på I pånær et endeligt antal punkter x 1 , . . . , x n , da er den til Fsvarende fordeling kontinuert med tæthed{ Ff(x) =′ (x), for x ∈ I \ {x 1 , . . . , x n }0, for x ∈ {x 1 , . . . , x n }6


Middelværdi.Hvis X er en kontinuert stokastisk variabel med tæthed p, siges X at havemiddelværdi, hvis∫ ∞−∞|x|p(x) dx < ∞og vi denerer da middelværdien af X somE(X) =∫ ∞−∞xp(x) dxBemærk, at hvis den til X hørende fordeling er koncentreret på et interval [−c, c],hvor c ∈ (0, ∞), da eksisterer middelværdien.MS Sætn. 5.2.3: Hvis X er en kontinuert stokastisk variabel, som er koncentreretpå intervallet I ⊆ R, og som har tæthed p, og t : I → R er en funktion, da harden stokastiske variabel t(X) middelværdi hvis og kun hvis∫|t(x)|p(x) dx < ∞og i så fald erI∫E(t(X)) = t(x)p(x) dxIMS Sætn. 5.2.4: Hvis X er en kontinuert stokastisk variabel, som er koncentreretpå intervallet I ⊆ R, og t 1 og t 2 er funktioner fra I ind i R, som opfylder∫I |t i(x)|p(x) dx < ∞ for i = 1, 2, da har den stokastiske variabel t 1 (X) + t 2 (X)middelværdi, ogE(t 1 (X) + t 2 (X)) = E(t 1 (X)) + E(t 2 (X))MS Sætn. 5.2.5: Hvis X er en kontinuert stokastisk variabel, som har middelværdi,og a og b er vilkårlige reelle tal, da har den stokastiske variabel a + bXmiddelværdi, ogE(a + bX) = a + bE(X)Varians.Hvis X er en kontinuert stokastisk variabel med tæthed p, siges X at havevarians, hvis∫ ∞−∞og vi denerer da variansen af X somVar(X) = E([X − E(X)] 2 ) =x 2 p(x) dx < ∞∫ ∞−∞[x − E(X)] 2 p(x) dxBemærk, at hvis ovenstående betingelse for eksistens af varians gælder, eksistererogså middelværdi.Hvis en kontinuert stokastisk variabel X har varians, gælderogVar(X) = E(X 2 ) − ( E(X) ) 2Var(a + bX) = b 2 Var(X)7


Transformationer af kontinuerte fordelinger på RTransformationssætningen (MS Sætn. 5.4.1).Setup. X er en kontinuert stokastisk variabel, som opfylder P (X ∈ I) = 1, foret interval I ⊆ R. Dener a = inf I og b = sup I, som eventuelt er ±∞. Antagat X har tætheden p, som er kontinuert på (a, b).t : I → R er en kontinuert dierentiabel, strength monoton funktion, dvs.t ′ (x) ≠ 0 for alle x ∈ (a, b).J = t(I) er et interval. Sæt v = inf J og h = sup J, hvor ±∞ tillades somværdier.Konklusion: Y = t(X) er en kontinuert stokastisk variabel med tæthed q givetved{ p(t −1 (y))| dq(y) =dy t−1 (y)|, for y ∈ (v, h)0, for y /∈ (v, h)Fler-dimensionale kontinuerte fordelinger: begreberTæthed.En funktion p : B → [0, ∞), hvor B ⊆ R n , som opfylder∫p(x 1 , . . . , x n ) dx 1 · · · dx n = 1kaldes en (sandsynligheds)tæthed på B.BMed andre ord er en funktion f : B → R, hvor B ⊆ R, en tæthed på B, hvisog kun hvis den opfylder følgende to betingelser:(1) ∀(x 1 , . . . , x n ) ∈ B : f(x 1 , . . . , x n ) ≥ 0(2) ∫ B f(x 1, . . . , x n ) dx 1 · · · dx n = 1Hvis p er en tæthed på B, så erq(x 1 , . . . , x n ) = 1 B (x 1 , . . . , x n )p(x 1 , . . . , x n )en tæthed på R, som opfylder q(x 1 , . . . , x n ) = p(x 1 , . . . , x n ) for alle (x 1 , . . . , x n ) ∈B, og q(x 1 , . . . , x n ) = 0 for alle (x 1 , . . . , x n ) /∈ B. Man kan derfor erstatte p medq for at lette løsning af integraler.Kontinuert fordeling.Enhver tæthed p på B ⊆ R denerer et sandsynlighedsmål P på B ved∫P (A) = 1 A (x 1 , . . . , x n )p(x 1 , . . . , x n ) dx 1 · · · dx nfor alle A ⊆ B.B8


Et sådant sandsynlighedsmål kaldes en kontinuert fordeling, som har tæthed p.Et sandsynlighedsmål P på B kan opfattes som en fordeling på R n , ved forD ⊆ R n at sætte P (D) = P (D ∩ B), dvs.∫P (D) = p(x 1 , . . . , x n ) dx 1 · · · dx nD∩BHvis X = (X 1 , . . . , X n ) er en stokastisk vektor, hvis fordeling er kontinuert oghar tætheden p, kaldes den en kontinuert stokastisk vektor, og der gælder∫P (X ∈ A) = 1 A (x 1 · · · dx n )p(x 1 · · · dx n ) dx 1 · · · dx nR nfor enhver delmængde A ⊆ R n .Marginal fordeling.MS Sætn. 6.1.3: Hvis (X 1 , . . . , X n ) er en kontinuert stokastisk vektor medtæthed p, da er den stokastiske vektor (X 1 , . . . , X k ), hvor k < n, kontinuertmed tæthed∫q(x 1 , . . . , x k ) = p(x 1 , . . . , x k , x k+1 , . . . , x n ) dx k+1 · · · dx nR n−kBemærkninger: Med andre ord integreres med hensyn til de variable man ikkeer interesseret i. Fordelingen af (X 1 , . . . , X k ) kaldes den marginale fordeling af(X 1 , . . . , X k ).Uafhængighed.MS Sætn. 6.2.1: Hvis (X 1 , . . . , X n ) er en n-dimensional kontinuert stokastiskvektor med tæthed p, og tætheden for den marginale fordeling af X i betegnesmed p i , for i = 1, . . . , n, da er følgende tre udsagn ækvivalente:(1) X 1 , . . . , X n er uafhængige.(2) For alle (x 1 , . . . , x n ) ∈ R n erp(x 1 , . . . , x n ) = p 1 (x 1 ) · · · p n (x n )(3) Der ndes n ikke-negative reelle funktioner g i , for i = 1, . . . , n, såfor alle (x 1 , . . . , x n ) ∈ R n .p(x 1 , . . . , x n ) = g 1 (x 1 ) · · · g n (x n )Bemærkninger: g i er proportional med p i for i = 1, . . . , n.Kommentar på s. 185 i MS: Antag at (X 1 , X 2 ) er en 2-dimensional stokastiskvektor. Hvis der ikke ndes en produktmængde T 1 ×T 2 , hvor T i ⊆ R, for i = 1, 2,således at (X 1 , X 2 ) er koncentreret på T , og således at p(x 1 , x 2 ) > 0 for alle(x 1 , x 2 ) ∈ T , så er X 1 og X 2 ikke uafhængige.9


MS Sætn. 6.2.3: Hvis (X 1 , . . . , X n ) er en n-dimensional kontinuert stokastiskvektor, de stokastiske variable X 1 , . . . , X n er uafhængige, og ψ : R n−k → R,hvor k < n, så er de k + 1 stokastiske variable X 1 , . . . , X k , ψ(X k+1 , . . . , X n )uafhængige.Middelværdi.MS Sætn. 6.4.1: Hvis X er en n-dimensional kontinuert stokastisk vektor medtæthed p, og ψ : R n → R er en funktion, da har den stokastiske variabel ψ(X)middelværdi hvis og kun hvis∫R n |ψ(x 1 , . . . , x n )|p(x 1 , . . . , x n ) dx 1 , · · · , dx n < ∞og i så fald er∫E(ψ(X)) = ψ(x 1 , . . . , x n )p(x 1 , . . . , x n ) dx 1 , · · · , dx nR nMS Sætn. 6.4.2: Hvis X 1 , . . . , X n er kontinuerte stokastiske variable, som allehar middelværdi, da har den stokastiske variabel X 1 + · · · + X n middelværdi, ogE(X 1 + · · · + X n ) = E(X 1 ) + · · · + E(X n )Hvis yderligere X 1 , . . . , X n er uafhængige, har også X 1 · X 2 · · · X n middelværdiogE(X 1 · · · X n ) = E(X 1 ) · E(X 2 ) · · · E(X n )MS Sætn. 6.4.4: Hvis (X 1 , X 2 ) er en kontinuert stokastisk vektor, som opfylder,at X 2 har middelværdi, samt at |X 1 | ≤ |X 2 |, da har også X 1 middelværdi.Varians.Hvis de kontinuerte stokastiske variable X 1 og X 2 har varians, gælderVar(X 1 + X 2 ) = Var(X 1 ) + Var(X 2 ) + 2Cov(X 1 , X 2 )Kovarians.Denition: Hvis to kontinuerte stokastiske variable X og Y opfylderE(X 2 ) < ∞ og E(Y 2 ) < ∞deneres deres kovarians vedCov(X, Y ) = E[(X − E(X))(Y − E(Y ))]Kovariansen kan beregnes vedCov(X, Y ) = E(XY ) − E(X)E(Y )Desuden gælder10


(i) Cov(X, X) = Var(X)(ii) Cov(a + bX, c + dY ) = bd Cov(X, Y )(iii) Cov(X + Y, Z) = Cov(X, Z) + Cov(Y, Z)(iv) Cov(X, Y ) = Cov(Y, X)Hvis de kontinuerte stokastiske variable X og Y har varians, gælder desudenMS Sætn. 3.8.3: Hvis X og Y er uafhængige, er Cov(X, Y ) = 0.Hvis de kontinuerte stokastiske variable X 1 , . . . , X n har varians, gældern∑n∑ ∑i−1Var(X 1 + · · · + X n ) = Var(X i ) + 2 Cov(X i , X j )i=1i=2 j=1Korrelation.Denition: For to kontinuerte stokastiske variable X og Y som har varians ogopfylderDenition: To kontinuerte stokastiske variable X og Y kaldes ukorrelerede, hvisde opfylder corr(X, Y ) = 0.Hvis de kontinuerte stokastiske variable X 1 , . . . , X n har varians, gælderMS Sætn. 3.8.8: Hvis X 1 , . . . , X n er parvis ukorrelerede, da gælderVar(X 1 + · · · + X n ) = Var(X 1 ) + · · · + Var(X n )Tranformationer af kontinuerte fordelinger på R nReelle transformationer.Jf. MS s. 187-189.Lineære transformationer.MS Sætn. 6.3.11: Hvis X = (X 1 , . . . , X n ) T er en n-dimensional kontinuert s-tokastisk vektor med simultan tæthed p, og Y = (Y 1 , . . . , Y n ) T = AX, hvorA er en invertibel n × n-matrix (dvs. det(A) ≠ 0), da er Y en n-dimensionalkontinuert stokastisk variabel med simultan tæthedhvor y = (y 1 , . . . , y n ) T .q(y) = p(A −1 y)| det(A −1 )| = p(A−1 y)| det(A)|11


OpgavetyperUdregning af integraler.Det er smart at genkende en funktion som tætheden for en bestemt kontinuertfordeling, ofte eksponentialfordelingen. Nogle gange kan man også genkende etintegral som middelværdien eller andenmomentet (i.e. E(X 2 )) for en kendtkontinuert fordeling.Undersøg om en kontinuert stokastisk variabel X har middelværdiog/eller varians, og angiv disse i bekræftende fald.Hvis X har varians, har den også middelværdi, jf. MS s. 160. Hvis man vil vise atX ikke har middelværdi/varians, skal man vise at visse integraler er uendelige.Her er det nok at vurdere integralerne op med (dvs. vise at integralerne er størreend) integraler der er uendelige.Bestem tæthed for transformeret stokastisk variabel t(X).Hvis t er monoton på det interval hvor X er koncentreret, benyttes transformationssætningen(MS Sætn. 5.4.1). Ellers kan fordelingsfunktionen for t(X)måske bestemmes, og hvis den er kontinuert dierentiabel på et åbent intervalhvor t(X) er koncentreret, da kan MS Sætn. 5.1.6 benyttes.Bestem middelværdi for transformeret stokastisk variabel t(X).Enten ved først at nde tæthed for t(X) og benytte denitionen, eller ved atbruge MS Sætn. 5.2.3. Jf. afsnit Middelværdi under En-dimensionale kontinuertefordelinger herover.Bestem varians for transformeret stokastisk variabel Y = t(X).Enten ved først at nde tæthed for t(X) og dernæst benytte denitionen, ellernogle gange med fordel vha. MS Sætn. 5.2.3, idet man kigger på transformationens(x) = (t(x)) 2 , og så kan bestemme E(Y 2 ) = E(s(X)).Er kontinuerte stokastiske variabel X og Y uafhængige?Hvis (X, Y ) ikke er koncentreret på en produktmængde, da er X og Y ikkeuafhængige. Der gælder p(x, y) = p 1 (x)p 2 (y), hvis og kun hvis X og Y uafhængige.Jf. afsnit Uafhængighed herover.12

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!