Met 3431 Statistikk Kapittel 6
Met 3431 Statistikk Kapittel 6
Met 3431 Statistikk Kapittel 6
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
1 Section 6-2: Standard normalfordelingen<br />
2 Section 6-3: Anvendelser av normalfordelingen<br />
3 Section 6-4: Observator fordeling<br />
4 Section 6-5: Sentralgrenseteoremet
Oversikt <strong>Kapittel</strong> 6
Kontinuerlige tilfeldige variable<br />
Kontinuerlige vs. diskrete variable<br />
I forrige kapittel handlet det om diskrete tilfeldige variable.<br />
F.eks.<br />
Hvor mye du får når du triller en terning<br />
Antall suksesser i en binomisk forsøksrekke - binomial<br />
fordelingen<br />
I kapittel 6 handler det om tilfeldige variable som er<br />
kontinuerlige. F.eks.<br />
Vekten til en tilfeldig valgt pasient<br />
Lønna til en tilfeldig valgt innbygger
Normalfordelingen<br />
Normalfordelingen<br />
Sannsynlighetstettheten:<br />
f (x) = 1<br />
σ √ 2π exp(x − µ<br />
σ )2
Men hvorfor er normalfordelingen viktig?<br />
Normalfordelingen<br />
Mange typer målinger fordeler seg som denne kurven<br />
Høyden på mennesker<br />
IQ er normalfordelt med µ = 100 og σ 2 = 10 2<br />
Summen av tilfeldigheter er normalfordelt: sentralgrenseteorem
Tetthetskurven (eng: density curve)<br />
Grafen til sannsynlighetstettheten<br />
Krav:<br />
1 Totale areal under grafen er 1<br />
2 Kurven må ligge over x-aksen<br />
Areal ↔ Sannsynlighet<br />
Figur: 6-3. Uniform tetthet.
Standard normalfordelingen<br />
Kjennetegn ved standard<br />
normalfordeling<br />
Klokkeformet og<br />
symmetrisk<br />
Gjennomsnittet: µ = 0<br />
Standardavviket: σ = 1
Finne arealet under grafen<br />
Arealet under standard normalfordeling<br />
Viktig å kunne finne arealet til et område under grafen.<br />
Slike areal tolkes som sannsynligheter<br />
Bruk tabell A-2
Termometer- eksempel 1<br />
Example<br />
Du produserer termometere. Termometrene viser litt forskjellige<br />
temperaturer pga. tilfeldig variasjon. Ved 0℃:<br />
Gjennomnsittlig viser termometrene µ = 0℃<br />
Standardavviket er σ =1℃<br />
Hva er sannsynligheten for at et tilfeldig valgt termometer viser<br />
mindre enn 1.58℃ når temperaturen faktisk er 0℃?<br />
Svar:<br />
Tabell A-2 gir at<br />
sannsynligheten er<br />
0.9429
Termometer- eksempel 2<br />
Example<br />
Ved 0℃:<br />
Gjennomnsittlig viser termometrene µ = 0℃<br />
Standardavviket er σ =1℃<br />
Hva er sannsynligheten for at et tilfeldig valgt termometer viser mer<br />
enn −1.23℃ når temperaturen faktisk er 0℃?<br />
Svar:<br />
89.07 % av<br />
termometrene viser mer<br />
enn −1.23℃ ved 0℃
Termometer- eksempel 3<br />
Example<br />
Et termometer velges tilfeldig. Hva er sannsynligheten for at det<br />
viser mellom −2.00℃ og 1.50℃?<br />
Svar:<br />
Sannsynligheten er<br />
0.9104
Figure 6-10<br />
th<br />
Finne z-verdien<br />
Finne z-verdi som passer til en sannsynlighet<br />
Vi snur problemet på hodet: Hvilken z-verdi gjør at<br />
arealet/sannsynligheten til høyre er 0.05?<br />
Finding z Scores<br />
When Given Probabilities<br />
5% or 0.05<br />
Svar:<br />
z = 1.645<br />
(z verdien blir positiv)
Finne z-verdien<br />
Finne z-verdi som passer til en sannsynlighet<br />
Hvilke z-verdier gjør at 95% av arealet ligger mellom dem?<br />
Svar:<br />
z = ±1.96
Samme varians σ 2 = 1<br />
1<br />
0,56<br />
0,48<br />
N(-1,1)<br />
0,4<br />
N(0,1)<br />
N(2,1)<br />
0,32<br />
0,24<br />
1 x ∼ N(0, 1)<br />
2 x ∼ N(2, 1)<br />
3 x ∼ N(−1, 1)<br />
0,16<br />
0,08<br />
-5 -2,5 0 2,5 5<br />
-0,08
-0,1<br />
1<br />
Samme µ, men forskjellig varians σ 2<br />
0,8<br />
0,7<br />
N(0,0.25)<br />
0,6<br />
N(0,1)<br />
0,5<br />
0,4<br />
0,3<br />
1 x ∼ N(0, 1)<br />
2 x ∼ N(0, 4)<br />
3 x ∼ N(0, 0.25)<br />
N(0,4)<br />
0,2<br />
0,1<br />
-5 -2,5 0 2,5 5
Mange typer normalfordelinger<br />
Normalfordelinger<br />
Standard normalfordelingen er bare ett eksempel på<br />
normalfordeling, N(0, 1)<br />
For hver µ-verdi og σ-verdi så finnes det en egen<br />
normalfordeling, N(µ, σ)<br />
Omregne til z<br />
Hovedpoenget er at vi kan standardiser enhver normalfordelt verdi<br />
til en standard normalfordelt z-verdi, og så bruke tabell A-2:<br />
z = x − µ<br />
σ
Omregne til standard normalfordeling<br />
Converting to a Standard<br />
Normal Distribution<br />
z =<br />
x – µ<br />
!<br />
Figur: OmregneFigure en x-verdi 6-12til en z-verdi<br />
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.<br />
Slide
Å regne ut z-verdien<br />
Enhver normalfordelt variabel kan standariseres<br />
Anta at x er normalfordelt med µ = 45 og σ = 3<br />
En x-verdien lik 39 vil ha standardisert z-verdi<br />
z =<br />
39 − 45<br />
3<br />
= −2<br />
Alle normalfordelte variabler x kan standardiseres til z<br />
Dermed trenger vi bare sannsynlighetstabeller for z! (tabell<br />
A-2)
Vekteksempel 1<br />
Example<br />
Anta at vekten på menn er normalfordelt<br />
Gjennomsnitt µ = 172 pounds<br />
Standardavvik på σ = 29 pounds.<br />
Example - cont<br />
Sannsynligheten for at tilfeldig mann veier mindre enn 174 pounds?<br />
µ = 172<br />
! = 29<br />
z =<br />
174 – 172<br />
29<br />
= 0.07<br />
Sannsynlighet:
Vekteksempel 2<br />
Example<br />
Gjennomsnitt µ = 172 pounds<br />
Standardavvik på σ = 29 pounds.<br />
Hvilken vekt skiller de 0.5% tyngste fra de 99.5% letteste?<br />
Svar<br />
x = 172+2.575·29<br />
x = 246.675
Rekrutter 1<br />
Example<br />
Høyden på1<br />
rekruttene er normalfordelt med µ = 179.5 og σ = 6.4.<br />
Hva er sannsynligheten for at en tilfeldig rekrutt er høyere enn 195<br />
cm?<br />
0,4<br />
0,35<br />
0,3<br />
0,25<br />
0,2<br />
0,15<br />
0,1<br />
0,05<br />
-3 -2 -1 0 1 2 3<br />
1 Regn ut z-verdien til 1.95:<br />
z = 195−179.5<br />
6.4<br />
= 2.42<br />
2 Hva er sannsynligheten for at<br />
z er større enn 2.42?<br />
3 P(z > 2.42) = 1 − P(z < 2.42) =<br />
0.0078 (Se Tabell A2)<br />
4 Det er bare 0.78% sannsynlighet<br />
for at en rekrutt er over 195 cm<br />
-0,05
Rekrutter 2<br />
Example<br />
Hva er sannsynligheten for at en tilfeldig rekrutt er høyere enn 175<br />
cm?<br />
0,4<br />
0,35<br />
0,3<br />
0,25<br />
0,2<br />
0,15<br />
0,1<br />
0,05<br />
1 z-verdien til 175:<br />
z = 175−179.5<br />
6.4<br />
= −0.70<br />
2 P(z > −0.70) =<br />
1 − P(z < −0.70) =<br />
1 − 0.242 = 0.758<br />
3 75.8% sannsynlighet for at en<br />
rekrutt er høyere enn 175cm<br />
-2,4 -1,6 -0,8 0 0,8 1,6 2,4<br />
-0,05
IQ<br />
1<br />
Example<br />
IQ er normalfordelt med µ = 100 og σ = 10. Hva er<br />
sannsynligheten for at en person har IQ over 115? Under 95?<br />
-3 -2 -1 0 1 2 3<br />
1 z-verdien til 115: z = 115−100<br />
10<br />
= 1.5<br />
2 Tabell a2: P(z > 1.5) = 1 − P(z <<br />
1.5) = 1 − 0.9332 = 0.0668<br />
3 Sannsynligheten for at en person har IQ<br />
over 115 er 6.7%<br />
4 z-verdien til 95: z = 95−100<br />
10<br />
= −0.5<br />
5 P(z < −0.5)i tabell A2<br />
6 P(z < −0.5) = 0.3085<br />
7 Det er 30.9% sannsynlighet for at en<br />
person har IQ under 95
Fordelingen til en observator<br />
Observatorfordeling (eng: sampling distribution)<br />
I seksjon 6-4 handler det om å forstå at en observator er en tilfeldig<br />
variabel. Den har derfor en sannsynlighetsfordeling. Denne kalles<br />
observatorfordelingen .<br />
Estimator<br />
Ofte er en observator ment å skulle estimere en<br />
populasjonsparameter. Da kalles observatoren for en estimator.<br />
Example<br />
Tenk deg at du tar mange stikkprøver, hver på størrelse n.<br />
x er en estimator for µ<br />
Denne estimatoren variererer fra stikkprøve til stikkprøve (eng:<br />
sampling variability)
Forventningsrette estimatorer<br />
Alle stikkprøver av<br />
størrelse n = 2<br />
Noen estimatorer er<br />
forventningsrette<br />
x<br />
s 2<br />
ˆp<br />
Noen er ikke:<br />
Median<br />
Variasjonsbredde<br />
s
Seksjon 6-5<br />
Prosedyrene i denne seksjone er grunnlaget for å estimere<br />
populasjonsparameter og for hypotesetesting.<br />
Notasjon<br />
µ x er gjennomsnittet til x<br />
σ x er standardavviket til x<br />
Sentralgrenseteoremet<br />
Anta at vi har en stor stikkprøve av x-er fra en populasjon med<br />
gjennomsnitt µ og standardavvik σ<br />
Da vil gjennomsnittet x være normalfordelt med<br />
µ x = µ, σ x = σ √ n
Sentralgrenseteoremet<br />
Vi antar at:<br />
1 Den tilfeldige variabelen x har gjennomsnitt µ og<br />
standardavvik σ.<br />
2 Man tar mange tilfeldige utvalg av størrelse n fra populasjonen<br />
Da følger det at:<br />
Sentralgrenseteoremet<br />
1 Fordelingen til x blir mer og mer lik en normalfordeling når n<br />
er vokser<br />
2 Gjennomsnittet til x er µ<br />
3 Standardavviket til x er σ/ √ n
Sentralgrenseteorem demo i JMP<br />
JMP Demo<br />
1 Åpne fila C:\Program Files \SAS \JMP \8 \Support Files<br />
English \Sample Data<br />
2 Velg Rows>Add rows og legg til 200 rader<br />
Variabelen N = 50 inneholder en formel for gjennomsnittet av<br />
n = 50 tilfeldige variable. Når vi adderer 200 rader, så simulerer vi<br />
200 stikkprøver på størrelse n = 50.
Praktiske regler + Notasjon<br />
Når kan vi stole på sentralgrenseteoremet?<br />
1 Når stikkprøven er større enn n = 30<br />
2 Hvis x’ene selv er normalfordelte, så gjelder<br />
sentralgrenseteoremet for alle stikkprøvestørrelser.
Vekt igjen<br />
Example<br />
Anta at vekten på menn er normalfordelt<br />
Finn:<br />
Gjennomsnitt µ = 172 pounds<br />
Standardavvik på σ = 29 pounds.<br />
1 Sannsynligheten for at tilfeldig mann veier mer enn 175<br />
pounds?<br />
2 20 menn er tilfeldig utvalgt. Hva er sannsynligheten for at<br />
deres gjennomsnittsvekt er mer enn 175 pounds?
a) if one man is randomly selected, find t<br />
probability that his weight is greater th<br />
175 lb.<br />
Vekt igjen, spørsmål 1<br />
z = 175 – 172 = 0.10<br />
29<br />
Figur: Sannsynligheten er 0.4602 for at en mann veier mer enn 175
) if 20 different men are randomly select<br />
find the probability that their mean wei<br />
greater than 172 lb.<br />
Vekt igjen, spørsmål 2<br />
z = 175 – 172 = 0.46<br />
29<br />
20<br />
Figur: Sannsynligheten er 0.3228 for at 20 mann veier mer enn 175 i snitt<br />
Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Vekt igjen, Oppsummering<br />
Sannsynligheten for at 1 mann veier mer enn 175 er<br />
P(x > 175) = 0.4602<br />
Sannsynligheten for at 20 mann i snitt veier mer enn 175 er<br />
P(x > 175) = 0.3228<br />
Det er lettere for en enkelt mann å veie mer enn 175 enn det<br />
er for 20 menn å veier mer enn 175 i snitt!
95%<br />
Kritiske verdier<br />
til 2.5%<br />
95% ↔ 1.96<br />
-3 -2 -1 0 1 2 3<br />
-1.96 1.96
To viktige kritiske verdier<br />
1<br />
1<br />
95% ↔ 1.96<br />
90% ↔ 1.645<br />
95%<br />
90%<br />
-3 -2 -1 0 1 2 3<br />
-1.96 1.96<br />
-3 -2 -1 0 1 2 3<br />
-1.645 1.645
Eksamen <strong>Met</strong>8006 20.12.05