3. Stokastiska variabler
3. Stokastiska variabler
3. Stokastiska variabler
Transform your PDFs into Flipbooks and boost your revenue!
Leverage SEO-optimized Flipbooks, powerful backlinks, and multimedia content to professionally showcase your products and significantly increase your reach.
15<br />
<strong>3.</strong> <strong>Stokastiska</strong> <strong>variabler</strong><br />
Ett slumpmässigt försök ger ofta upphov till ett tal som bestäms av utfallet av försöket.<br />
Talet är inte känt före försöket utan bestäms av vilket utfall som kommer att uppstå, alltså<br />
av slumpen. Man kallar talet en stokastisk variabel eller slumpvariabel, förkortat s.v.<br />
Man talar om en flerdimensionell s.v. om det slumpmässiga försöket ger flera tal.<br />
<strong>Stokastiska</strong> <strong>variabler</strong> betecknas med X, Y , Z, osv.<br />
Definition <strong>3.</strong>1. En stokastisk variabel (s.v.) X är en reellvärd funktion definierad<br />
på ett utfallsrum Ω, dvs<br />
X : Ω ↦→ R<br />
Definition <strong>3.</strong>2. Om den s.v. X antar ett ändligt eller uppräkneligt oändligt antal<br />
olika värden k = x 1 ,x 2 ,x 3 ... säger vi att X är diskret annars säger vi att X är<br />
kontinuerlig.<br />
Exempel <strong>3.</strong><strong>3.</strong> a) Låter vi X vara antal ögon som kommer upp vid ett kast av en tärning,<br />
så antar X värdena k = 1,2,... ,6. Den s.v. X är alltså diskret.<br />
b) Om X är livslängden hos en komponent, så antar X alla värden i intervallet [0, ∞[, dvs<br />
X är en kontinuerlig s.v.<br />
Exempel <strong>3.</strong>4. Tillbaka till Exempel 2.44. Bland 12 enheter finns 5 av en viss sort (t.ex.<br />
vita, defekta, dyrbara osv.) och 7 av en annan sort. Bestäm sannolikheten för antal defekta<br />
om man tar på måfå och utan återläggning n = 4 enheter.<br />
Lösning:
16 3 STOKASTISKA VARIABLER<br />
<strong>3.</strong>1. Diskreta s.v.<br />
Definition <strong>3.</strong>5. Antag att X är en diskret s.v. som antar värdena k = x 1 ,x 2 ,x 3 ....<br />
1. Funktionen<br />
p X (k) = P(X = k), k = x 1 ,x 2 ,x 3 ... ,<br />
kallas sannolikhetsfunktionen för den s.v. X och uppfyller<br />
(a) p X (k) ≥ 0 för all k<br />
(b) ∑ p X (k) = 1.<br />
k<br />
2. P(X ∈ A) = ∑ k∈Ap X (k).<br />
<strong>3.</strong> Funktionen<br />
F X (k) = P(X ≤ k)<br />
kallas fördelningsfunktionen för X. Den har egenskaperna<br />
{ 0, x → −∞<br />
(a) F X (x) →<br />
1, x → ∞<br />
(b) F X (x) är en icke-avtagande funktion av x<br />
(c) F X (x) är kontinuerlig till höger för varje x<br />
4. Vi får att<br />
(a) sannolikheten för högst k av en sort ges av<br />
F X (k) = ∑ j≤k<br />
p X (j)<br />
(b) sannolikheten för minst k av en sort ges av<br />
1 − F X (k) = ∑ j≥k<br />
p X (j)<br />
(c) sannolikheten för exakt k av en sort ges av<br />
F X (k) − F X (k − 1) = p X (k).
<strong>3.</strong>1 Diskreta s.v. 17<br />
Exemplet nedan beskriver en av de viktigaste diskreta fördelningarna: Binomialfördelningen.<br />
Exempel <strong>3.</strong>6. Tillbaka till Exempel 2.24. En viss frösort har 80% grobarhet. Om man<br />
planterar 10 st. av dessa frö, hur stor är sannolikheten att<br />
1. exakt k st. gror, där k = 0,1,2,... ,10.<br />
2. högst 1 gror<br />
<strong>3.</strong> minst 2 gror<br />
Lösning:
18 3 STOKASTISKA VARIABLER<br />
<strong>3.</strong>2. Diskreta fördelningar<br />
Låt 0 < p < 1. Den s.v. X har<br />
1. Tvåpunktsfördelning om<br />
p X (a) = p, p X (b) = 1 − p.<br />
2. Likformig fördelning om<br />
p X (k) = 1 m ,<br />
k = 1,2,... ,m.<br />
<strong>3.</strong> För-första-gången-fördelning, X ∈ ffg(p) om<br />
p X (k) = (1 − p) k−1 p, k = 1,2,... .<br />
4. Geometrisk fördelning, X ∈ Geo(p) om<br />
p X (k) = (1 − p) k p, k = 0,1,2,... .<br />
5. Binomialfördelning, X ∈ Bin(n,p) om<br />
( ) n<br />
p X (k) = p k (1 − p) n−k ,<br />
k<br />
k = 0,1,2,... ,n.<br />
6. Hypergeometrisk fördelning, X ∈ Hyp(N,n,p) om<br />
( ) ( )<br />
Np N(1 − p)<br />
k n − k<br />
p X (k) = ( ) , k = 0,1,2,... ,Np.<br />
N<br />
n<br />
7. Poisson-fördelning, X ∈ P(µ) om<br />
p X (k) = µk<br />
k! e−µ , k = 0,1,2,... , µ > 0.
<strong>3.</strong>3 Kontinuerliga s.v. 19<br />
<strong>3.</strong><strong>3.</strong> Kontinuerliga s.v.<br />
En kontinuerlig s.v. X antar alla värden i ett intervall A = [a,b], så att<br />
P(X ∈ A) = P(a ≤ X ≤ b).<br />
Här finns ingen sannolikhetsfunktion utan vi gör följande definition.<br />
Definition <strong>3.</strong>7. X är en kontinuerlig s.v.:<br />
1. Om det finns en funktion f X (x) sådan att<br />
P(a ≤ X ≤ b) =<br />
∫ b<br />
a<br />
f X (x)dx<br />
för alla A = [a,b], säges X vara en kontinuerlig s.v.<br />
2. Funktionen f X (x), kallas täthetsfunktionen för X och uppfyller<br />
(a) f(x) ≥ 0 för alla x ∈ R<br />
(b)<br />
∫ ∞<br />
−∞<br />
f(x)dx = 1<br />
<strong>3.</strong> f X (x) anger hur mycket sannolikhetsmassa per längdenhet som finns i punkten<br />
x.<br />
4. Funktionen F X (x) = P(X ≤ x), −∞ < x < ∞, kallas fördelningsfunktionen<br />
för den s.v. X och uppfyller<br />
F X (x) = P(X ≤ x) =<br />
∫ x<br />
−∞<br />
f(x)dx.<br />
5. För egenskaper hos fördelningsfunktionen F X (x), se Definition <strong>3.</strong>5.<br />
6. I varje punkt x där f X (x) är kontinuerlig gäller att<br />
F ′ X (x) = f X(x).
20 3 STOKASTISKA VARIABLER<br />
<strong>3.</strong>4. Kontinuerliga fördelningar<br />
Den s.v. X har<br />
1. Normalfördelning, X ∈ N(µ,σ) om<br />
där µ och σ > 0 är givna tal.<br />
f X (x) = 1<br />
σ √ 2π e−(x−µ)2 /2σ 2 , −∞ < x < ∞,<br />
2. Likformig fördelning, X ∈ U(a,b) om<br />
⎧<br />
1 ⎪⎨<br />
f X (x) = b − a a < x < b,<br />
⎪⎩<br />
0 annars<br />
Andra beteckningar<br />
Rektangulär fördelning, X ∈ R(a,b).<br />
<strong>3.</strong> Exponentialfördelning, X ∈ Exp(µ), µ > 0, om<br />
⎧<br />
1 ⎪⎨<br />
f X (x) = µ e−x/µ x > 0,<br />
⎪⎩<br />
0 x ≤ 0<br />
Observera att i Blomsbok så är X ∈ Exp(λ), där λ = 1 µ .
<strong>3.</strong>4 Kontinuerliga fördelningar 21<br />
Exempel <strong>3.</strong>8. Låt X vara livslängden i timmar hos en komponent och låt<br />
där c > 0.<br />
f X (x) =<br />
{ ce<br />
−0.01x<br />
x > 0,<br />
0 x ≤ 0<br />
1. Bestäm konstanten c så att f X (x) blir en täthetsfunktion för X.<br />
2. Bestäm också sannolikheten att en sådan komponent har en livslängd som överstiger<br />
200 timmar.<br />
<strong>3.</strong> Vad är sannoliketen att av 5 sådana komponenter exakt två har en livslängd som<br />
överstiger 200 timmar. Antag att oberoende föreligger.<br />
4. Antag att 2 sådana komponenter sammankopplas till ett system. Vad är sannolikheten<br />
att systemets livslängd överstiger 200 timmar om komponenterna seriekopplas<br />
Komponenterna parallellkopplas<br />
Lösning:
22 3 STOKASTISKA VARIABLER<br />
<strong>3.</strong>5. Funktioner av stokastiska <strong>variabler</strong><br />
I exemplet nedan ska vi titta på hur vi kan bestämma fördelningen för en funktion Y = g(X)<br />
av s.v. X.<br />
Exempel <strong>3.</strong>9. Antag att X ∈ U(−1,2) och låt Y = X 2 . Bestäm täthetsfunktionen f Y (y).<br />
Lösning: Eftersom den s.v. Y antar endast icke-negativa värden y ≥ 0, så är<br />
Anta nu att y ≥ 0. Då gäller<br />
Derivering m.a.p y ger:<br />
F Y (y) = P(Y ≤ y) = 0 för y ≤ 0.<br />
F Y (y) = P(Y ≤ y) = P(X 2 ≤ y) = P(− √ y ≤ X ≤ √ y)<br />
= P(X ≤ √ y) − P(X ≤ − √ y) = F X ( √ y) − F X (− √ y).<br />
⎧<br />
⎨<br />
f Y (y) =<br />
⎩<br />
1<br />
2 √ (<br />
fX ( √ y) + f X (− √ y) ) , y > 0<br />
y<br />
0 y ≤ 0.<br />
Eftersom X har täthetsfunktionen f X (x) = 1/3, −1 < x < 2, så är<br />
En kontroll visar att<br />
∫ ∞<br />
−∞<br />
⎧<br />
⎪⎨<br />
f Y (y) =<br />
⎪⎩<br />
f Y (y)dy = 1.<br />
1<br />
3 √ y , 0 < y < 1<br />
1<br />
6 √ y , 1 ≤ y ≤ 4<br />
0, annars.
<strong>3.</strong>6 Binomialfördelningen 23<br />
<strong>3.</strong>6. Binomialfördelningen<br />
Binomialfördelningen som är en av de viktigaste diskreta fördelningarna uppträder vid<br />
oberoende slumpmässiga försök. Antag att man utför n oberoende försök där en händelse<br />
A inträffar med sannolikheten P(A) = p och alltså är P(A ∗ ) = 1 −p. Låt oss betrakta fallet<br />
då A inträffar k gånger. En av många tänkbara följder är att dessa inträffar enligt<br />
En annan följd är<br />
A 1 ,A 2 ,A 3 ,... ,A<br />
} {{ k ,A ∗ }<br />
k+1 ,A∗ k+2 ,...,A∗ n .<br />
} {{ }<br />
k st.<br />
n−k st.<br />
A ∗ 1,A ∗ 2,A ∗ 3,... ,A ∗ n−k−1,A n−k ,A n−k+1 ,... ,A n .<br />
} {{ } } {{ }<br />
n−k st.<br />
k st.<br />
( ) n<br />
Totalt vet vi att det finns olika kominationer av dessa var och en med sannolikheten<br />
k<br />
(1 − p) n−k p k .<br />
Om vi låter den s.v. X vara antal gånger som händelsen A inträffar, så antar X värden<br />
k = 0,1,2,... ,n. Vidare ges sannolikheten för att A inträffar k gånger, dvs X = k, av<br />
( ) n<br />
P(X = k) = (1 − p) n−k p k , k = 0,1,2,... ,n.<br />
k<br />
Att detta är en sannolikhetsfunktion följer av att<br />
( ) n<br />
(1 − p) n−k p k ≥ 0, k = 0,1,2,... ,n<br />
k<br />
samt binomialsatsen Sats 2.41 att<br />
1 = (p + (1 − p)) n =<br />
n∑<br />
( n<br />
k<br />
k=0<br />
)<br />
p k · (1 − p) n−k .<br />
Vi säger då att X är binomialfördelad, X ∈ Bin(n,p).
24 3 STOKASTISKA VARIABLER<br />
<strong>3.</strong>7. Poissonfördelningen<br />
Antag att händelser inträffar slumpmässigt och oberoende av varandra i tiden. Låt N(t)<br />
vara antal händelser som inträffar under tidsintervallet (0,t). Vi delar upp intervallet (0,t)<br />
i n lika delintervall av längd t . Vi tänker oss nu att n är så stort att sannolikheten för<br />
n<br />
2 händelse eller fler ska inträffa i ett delinterval är 0. Då är antalet händelser N(t) i hela<br />
intervallet lika med antalet delintervall som det inträffar en händelse i. Om vi låter p vara<br />
sannolikheten för att en händelse inträffar i ett delintervall så är N(t) ∈ Bin(n,p) med<br />
väntevärdet E(N(t)) = np. (Vi definierar begreppet väntevärde i Kapitel 5.)<br />
Vi antar vidare att dessa händelser inträffar med en konstant intensitet λ per tidsenhet,<br />
dvs antal förväntade händelser under tiden (0,t) är µ = λt. Vi får därmed att<br />
np = λt dvs p = µ n .<br />
Låt oss nu titta närmare på fördelningen för N(t) för stora n som vi har antagit ovan.<br />
Eftersom N(t) ∈ Bin(n,p), där p = µ , så gäller att<br />
n<br />
P(N(t) = k) =<br />
=<br />
( n<br />
k<br />
)<br />
p k (1 − p) (n−k) =<br />
n(n − 1) · · · (n − k + 1) µ k (1 − µ/n) n<br />
n k k! (1 − µ/n) k .<br />
n! µ<br />
) k (<br />
1 −<br />
(n − k)! · k!( µ ) n−k<br />
n n<br />
Vi undersöker nu vad som händer med sannolikheten P(N(t) = k) för stora värden på n.<br />
Eftersom<br />
n(n − 1) · · · (n − k + 1)<br />
n k → 1, n → ∞,<br />
och<br />
enligt standardgränsvärde så gäller att<br />
Dessutom gäller att<br />
och<br />
∞∑<br />
k=0<br />
(1 − µ/n) k → 1, n → ∞,<br />
(1 − µ/n) n → e −µ , n → ∞<br />
P(N(t) = k) → µk<br />
k! e−µ n → ∞.<br />
µ k<br />
k! e−µ ≥ 0<br />
µ k ∑<br />
∞<br />
k! e−µ = e −µ<br />
k=0<br />
µ k<br />
k! = e−µ e µ = 1.<br />
Vi säger att den s.v. X har poissionfördelning med parametern µ, X ∈ Po(µ), om<br />
P(X = k) = µk<br />
k! e−µ , k = 0,1,2,3,... .
<strong>3.</strong>8 Exponentialfördelningen 25<br />
<strong>3.</strong>8. Exponentialfördelningen<br />
Låt som tidigare N(t) vara antal händelser som inträffar under tiden (0,t) med den konstanta<br />
intensitetn λ. Då är<br />
P(N(t) = k) = (λt)k e −λt .<br />
k!<br />
Låter vi nu X 1 vara tiden fram till första händelsen inträffar, så gäller att<br />
Fördelningsfunktionen för X 1 är då<br />
P(X 1 > t) = P(N(t) = 0) = e −λt ,<br />
F X1 (t) = P(X 1 ≤ t) = 1 − e −λt , t ≥ 0.<br />
Funktionen<br />
f X1 (t) = d dt F X 1<br />
(t) = λe −λt , t ≥ 0,<br />
är en täthetsfunktion för X 1 , ty<br />
och<br />
∫ ∞<br />
0<br />
f X1 (t) ≥ 0<br />
f X1 (t)dt = 1.<br />
Låter vi nu X 2 vara tiden mellan 1:a och 2:a händelsen, så får vi på samma sätt som ovan<br />
att X 2 har samma fördelningsfunktion som X 1 . Fortsätter vi på detta sätt får vi en följd<br />
av s.v. {X 1 ,X 2 ,X 3 ,...,} med samma fördelningsfunktion, där X 3 som är tiden mellan 2:a<br />
och 3:a händelsen osv.<br />
Vi säger att X har en exponentialfördelning med parameter λ > 0, X ∈ Exp(λ), om<br />
f X (x) =<br />
{ λe<br />
−λx<br />
x > 0,<br />
0 x ≤ 0<br />
Observera att i formelsamlingen så är X ∈ Exp(µ), där µ = 1 λ .<br />
En viktig egenskap hos exponentialfördelningen är vad som kallas för minneslöshet. T.ex.,<br />
kan X vara livslängden hos en komponent. Om vi ska beräkna sannolikheten för att komponenten<br />
ska fungera ytterliggare x tidsenheter givet att den har fungerat i t tidsenheter<br />
får vi<br />
P(X > x + t|X > t) =<br />
P(X > x + t, X > x)<br />
P(X > t)<br />
= e−λ(x+t)<br />
e −λt<br />
= e −λx = P(X > x),<br />
dvs P(X > x + t|X > t) är oberoende av t. Man skulle kunna säga att en komponent som<br />
har fungerat i t tidsenheter skulle fungera lika bra som en ny. En komponent åldras inte!
26 3 STOKASTISKA VARIABLER<br />
<strong>3.</strong>9. Geometriska fördelningen<br />
Vi låter som tidigare p vara sannolikheten för att en händelse inträffar och X vara antalet<br />
försök tills första händelsen inträffar. Då är<br />
en sannolikhetsfunktion för X, ty<br />
och<br />
P(X = k) = (1 − p) k p, k = 0,1,2,...<br />
p<br />
(1 − p) k p ≥ 0<br />
∞∑<br />
(1 − p) k 1<br />
= p<br />
1 − (1 − p) = 1.<br />
k=0<br />
Vi säger då att X har en geometrisk fördelning, X ∈ Geo(p).<br />
Geometriska fördelningen är nära besläktad med exponentialfördelningen. T.ex., så är<br />
1. Geometriska fördelningen är minneslös, ty<br />
P(X ≥ k + n|X ≥ n) =<br />
=<br />
P(X ≥ k + n, X ≥ n)<br />
P(X ≥ n)<br />
= p ∑ ∞<br />
j=k+n<br />
(1 − p)j<br />
p ∑ ∞<br />
(1 − p)j<br />
j=n<br />
(1 − p)n+k<br />
(1 − p) n = (1 − p) k = P(X ≥ k).<br />
Detta visar att P(X ≥ k + n|X ≥ n) inte beror på n.<br />
2. Geometriska fördelnnigen kan för små p approximeras med exponentialfördelningen, ty<br />
om n = λt<br />
p så<br />
F X (n) = P(X ≤ n) = P(X ≤ λt<br />
λt<br />
) = 1 −(1 −p) p<br />
p<br />
dvs X är exponentialfördelad för små p.<br />
(<br />
= 1 − (1 −p) 1/p) λt<br />
→ 1 −e −λt , p → 0,<br />
Anmärkning <strong>3.</strong>10. Vi har ovan använt summan för geometriska serien. T.ex så är<br />
∞∑<br />
j=0<br />
q j = 1<br />
1 − q , |q| < 1<br />
och<br />
∞∑<br />
j=n<br />
q j = qn<br />
, |q| < 1,<br />
1 − q