08.11.2014 Views

Met 3431 Statistikk Kapittel 6

Met 3431 Statistikk Kapittel 6

Met 3431 Statistikk Kapittel 6

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

1 Section 6-2: Standard normalfordelingen<br />

2 Section 6-3: Anvendelser av normalfordelingen<br />

3 Section 6-4: Observator fordeling<br />

4 Section 6-5: Sentralgrenseteoremet


Oversikt <strong>Kapittel</strong> 6


Kontinuerlige tilfeldige variable<br />

Kontinuerlige vs. diskrete variable<br />

I forrige kapittel handlet det om diskrete tilfeldige variable.<br />

F.eks.<br />

Hvor mye du får når du triller en terning<br />

Antall suksesser i en binomisk forsøksrekke - binomial<br />

fordelingen<br />

I kapittel 6 handler det om tilfeldige variable som er<br />

kontinuerlige. F.eks.<br />

Vekten til en tilfeldig valgt pasient<br />

Lønna til en tilfeldig valgt innbygger


Normalfordelingen<br />

Normalfordelingen<br />

Sannsynlighetstettheten:<br />

f (x) = 1<br />

σ √ 2π exp(x − µ<br />

σ )2


Men hvorfor er normalfordelingen viktig?<br />

Normalfordelingen<br />

Mange typer målinger fordeler seg som denne kurven<br />

Høyden på mennesker<br />

IQ er normalfordelt med µ = 100 og σ 2 = 10 2<br />

Summen av tilfeldigheter er normalfordelt: sentralgrenseteorem


Tetthetskurven (eng: density curve)<br />

Grafen til sannsynlighetstettheten<br />

Krav:<br />

1 Totale areal under grafen er 1<br />

2 Kurven må ligge over x-aksen<br />

Areal ↔ Sannsynlighet<br />

Figur: 6-3. Uniform tetthet.


Standard normalfordelingen<br />

Kjennetegn ved standard<br />

normalfordeling<br />

Klokkeformet og<br />

symmetrisk<br />

Gjennomsnittet: µ = 0<br />

Standardavviket: σ = 1


Finne arealet under grafen<br />

Arealet under standard normalfordeling<br />

Viktig å kunne finne arealet til et område under grafen.<br />

Slike areal tolkes som sannsynligheter<br />

Bruk tabell A-2


Termometer- eksempel 1<br />

Example<br />

Du produserer termometere. Termometrene viser litt forskjellige<br />

temperaturer pga. tilfeldig variasjon. Ved 0℃:<br />

Gjennomnsittlig viser termometrene µ = 0℃<br />

Standardavviket er σ =1℃<br />

Hva er sannsynligheten for at et tilfeldig valgt termometer viser<br />

mindre enn 1.58℃ når temperaturen faktisk er 0℃?<br />

Svar:<br />

Tabell A-2 gir at<br />

sannsynligheten er<br />

0.9429


Termometer- eksempel 2<br />

Example<br />

Ved 0℃:<br />

Gjennomnsittlig viser termometrene µ = 0℃<br />

Standardavviket er σ =1℃<br />

Hva er sannsynligheten for at et tilfeldig valgt termometer viser mer<br />

enn −1.23℃ når temperaturen faktisk er 0℃?<br />

Svar:<br />

89.07 % av<br />

termometrene viser mer<br />

enn −1.23℃ ved 0℃


Termometer- eksempel 3<br />

Example<br />

Et termometer velges tilfeldig. Hva er sannsynligheten for at det<br />

viser mellom −2.00℃ og 1.50℃?<br />

Svar:<br />

Sannsynligheten er<br />

0.9104


Figure 6-10<br />

th<br />

Finne z-verdien<br />

Finne z-verdi som passer til en sannsynlighet<br />

Vi snur problemet på hodet: Hvilken z-verdi gjør at<br />

arealet/sannsynligheten til høyre er 0.05?<br />

Finding z Scores<br />

When Given Probabilities<br />

5% or 0.05<br />

Svar:<br />

z = 1.645<br />

(z verdien blir positiv)


Finne z-verdien<br />

Finne z-verdi som passer til en sannsynlighet<br />

Hvilke z-verdier gjør at 95% av arealet ligger mellom dem?<br />

Svar:<br />

z = ±1.96


Samme varians σ 2 = 1<br />

1<br />

0,56<br />

0,48<br />

N(-1,1)<br />

0,4<br />

N(0,1)<br />

N(2,1)<br />

0,32<br />

0,24<br />

1 x ∼ N(0, 1)<br />

2 x ∼ N(2, 1)<br />

3 x ∼ N(−1, 1)<br />

0,16<br />

0,08<br />

-5 -2,5 0 2,5 5<br />

-0,08


-0,1<br />

1<br />

Samme µ, men forskjellig varians σ 2<br />

0,8<br />

0,7<br />

N(0,0.25)<br />

0,6<br />

N(0,1)<br />

0,5<br />

0,4<br />

0,3<br />

1 x ∼ N(0, 1)<br />

2 x ∼ N(0, 4)<br />

3 x ∼ N(0, 0.25)<br />

N(0,4)<br />

0,2<br />

0,1<br />

-5 -2,5 0 2,5 5


Mange typer normalfordelinger<br />

Normalfordelinger<br />

Standard normalfordelingen er bare ett eksempel på<br />

normalfordeling, N(0, 1)<br />

For hver µ-verdi og σ-verdi så finnes det en egen<br />

normalfordeling, N(µ, σ)<br />

Omregne til z<br />

Hovedpoenget er at vi kan standardiser enhver normalfordelt verdi<br />

til en standard normalfordelt z-verdi, og så bruke tabell A-2:<br />

z = x − µ<br />

σ


Omregne til standard normalfordeling<br />

Converting to a Standard<br />

Normal Distribution<br />

z =<br />

x – µ<br />

!<br />

Figur: OmregneFigure en x-verdi 6-12til en z-verdi<br />

Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.<br />

Slide


Å regne ut z-verdien<br />

Enhver normalfordelt variabel kan standariseres<br />

Anta at x er normalfordelt med µ = 45 og σ = 3<br />

En x-verdien lik 39 vil ha standardisert z-verdi<br />

z =<br />

39 − 45<br />

3<br />

= −2<br />

Alle normalfordelte variabler x kan standardiseres til z<br />

Dermed trenger vi bare sannsynlighetstabeller for z! (tabell<br />

A-2)


Vekteksempel 1<br />

Example<br />

Anta at vekten på menn er normalfordelt<br />

Gjennomsnitt µ = 172 pounds<br />

Standardavvik på σ = 29 pounds.<br />

Example - cont<br />

Sannsynligheten for at tilfeldig mann veier mindre enn 174 pounds?<br />

µ = 172<br />

! = 29<br />

z =<br />

174 – 172<br />

29<br />

= 0.07<br />

Sannsynlighet:


Vekteksempel 2<br />

Example<br />

Gjennomsnitt µ = 172 pounds<br />

Standardavvik på σ = 29 pounds.<br />

Hvilken vekt skiller de 0.5% tyngste fra de 99.5% letteste?<br />

Svar<br />

x = 172+2.575·29<br />

x = 246.675


Rekrutter 1<br />

Example<br />

Høyden på1<br />

rekruttene er normalfordelt med µ = 179.5 og σ = 6.4.<br />

Hva er sannsynligheten for at en tilfeldig rekrutt er høyere enn 195<br />

cm?<br />

0,4<br />

0,35<br />

0,3<br />

0,25<br />

0,2<br />

0,15<br />

0,1<br />

0,05<br />

-3 -2 -1 0 1 2 3<br />

1 Regn ut z-verdien til 1.95:<br />

z = 195−179.5<br />

6.4<br />

= 2.42<br />

2 Hva er sannsynligheten for at<br />

z er større enn 2.42?<br />

3 P(z > 2.42) = 1 − P(z < 2.42) =<br />

0.0078 (Se Tabell A2)<br />

4 Det er bare 0.78% sannsynlighet<br />

for at en rekrutt er over 195 cm<br />

-0,05


Rekrutter 2<br />

Example<br />

Hva er sannsynligheten for at en tilfeldig rekrutt er høyere enn 175<br />

cm?<br />

0,4<br />

0,35<br />

0,3<br />

0,25<br />

0,2<br />

0,15<br />

0,1<br />

0,05<br />

1 z-verdien til 175:<br />

z = 175−179.5<br />

6.4<br />

= −0.70<br />

2 P(z > −0.70) =<br />

1 − P(z < −0.70) =<br />

1 − 0.242 = 0.758<br />

3 75.8% sannsynlighet for at en<br />

rekrutt er høyere enn 175cm<br />

-2,4 -1,6 -0,8 0 0,8 1,6 2,4<br />

-0,05


IQ<br />

1<br />

Example<br />

IQ er normalfordelt med µ = 100 og σ = 10. Hva er<br />

sannsynligheten for at en person har IQ over 115? Under 95?<br />

-3 -2 -1 0 1 2 3<br />

1 z-verdien til 115: z = 115−100<br />

10<br />

= 1.5<br />

2 Tabell a2: P(z > 1.5) = 1 − P(z <<br />

1.5) = 1 − 0.9332 = 0.0668<br />

3 Sannsynligheten for at en person har IQ<br />

over 115 er 6.7%<br />

4 z-verdien til 95: z = 95−100<br />

10<br />

= −0.5<br />

5 P(z < −0.5)i tabell A2<br />

6 P(z < −0.5) = 0.3085<br />

7 Det er 30.9% sannsynlighet for at en<br />

person har IQ under 95


Fordelingen til en observator<br />

Observatorfordeling (eng: sampling distribution)<br />

I seksjon 6-4 handler det om å forstå at en observator er en tilfeldig<br />

variabel. Den har derfor en sannsynlighetsfordeling. Denne kalles<br />

observatorfordelingen .<br />

Estimator<br />

Ofte er en observator ment å skulle estimere en<br />

populasjonsparameter. Da kalles observatoren for en estimator.<br />

Example<br />

Tenk deg at du tar mange stikkprøver, hver på størrelse n.<br />

x er en estimator for µ<br />

Denne estimatoren variererer fra stikkprøve til stikkprøve (eng:<br />

sampling variability)


Forventningsrette estimatorer<br />

Alle stikkprøver av<br />

størrelse n = 2<br />

Noen estimatorer er<br />

forventningsrette<br />

x<br />

s 2<br />

ˆp<br />

Noen er ikke:<br />

Median<br />

Variasjonsbredde<br />

s


Seksjon 6-5<br />

Prosedyrene i denne seksjone er grunnlaget for å estimere<br />

populasjonsparameter og for hypotesetesting.<br />

Notasjon<br />

µ x er gjennomsnittet til x<br />

σ x er standardavviket til x<br />

Sentralgrenseteoremet<br />

Anta at vi har en stor stikkprøve av x-er fra en populasjon med<br />

gjennomsnitt µ og standardavvik σ<br />

Da vil gjennomsnittet x være normalfordelt med<br />

µ x = µ, σ x = σ √ n


Sentralgrenseteoremet<br />

Vi antar at:<br />

1 Den tilfeldige variabelen x har gjennomsnitt µ og<br />

standardavvik σ.<br />

2 Man tar mange tilfeldige utvalg av størrelse n fra populasjonen<br />

Da følger det at:<br />

Sentralgrenseteoremet<br />

1 Fordelingen til x blir mer og mer lik en normalfordeling når n<br />

er vokser<br />

2 Gjennomsnittet til x er µ<br />

3 Standardavviket til x er σ/ √ n


Sentralgrenseteorem demo i JMP<br />

JMP Demo<br />

1 Åpne fila C:\Program Files \SAS \JMP \8 \Support Files<br />

English \Sample Data<br />

2 Velg Rows>Add rows og legg til 200 rader<br />

Variabelen N = 50 inneholder en formel for gjennomsnittet av<br />

n = 50 tilfeldige variable. Når vi adderer 200 rader, så simulerer vi<br />

200 stikkprøver på størrelse n = 50.


Praktiske regler + Notasjon<br />

Når kan vi stole på sentralgrenseteoremet?<br />

1 Når stikkprøven er større enn n = 30<br />

2 Hvis x’ene selv er normalfordelte, så gjelder<br />

sentralgrenseteoremet for alle stikkprøvestørrelser.


Vekt igjen<br />

Example<br />

Anta at vekten på menn er normalfordelt<br />

Finn:<br />

Gjennomsnitt µ = 172 pounds<br />

Standardavvik på σ = 29 pounds.<br />

1 Sannsynligheten for at tilfeldig mann veier mer enn 175<br />

pounds?<br />

2 20 menn er tilfeldig utvalgt. Hva er sannsynligheten for at<br />

deres gjennomsnittsvekt er mer enn 175 pounds?


a) if one man is randomly selected, find t<br />

probability that his weight is greater th<br />

175 lb.<br />

Vekt igjen, spørsmål 1<br />

z = 175 – 172 = 0.10<br />

29<br />

Figur: Sannsynligheten er 0.4602 for at en mann veier mer enn 175


) if 20 different men are randomly select<br />

find the probability that their mean wei<br />

greater than 172 lb.<br />

Vekt igjen, spørsmål 2<br />

z = 175 – 172 = 0.46<br />

29<br />

20<br />

Figur: Sannsynligheten er 0.3228 for at 20 mann veier mer enn 175 i snitt<br />

Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.


Vekt igjen, Oppsummering<br />

Sannsynligheten for at 1 mann veier mer enn 175 er<br />

P(x > 175) = 0.4602<br />

Sannsynligheten for at 20 mann i snitt veier mer enn 175 er<br />

P(x > 175) = 0.3228<br />

Det er lettere for en enkelt mann å veie mer enn 175 enn det<br />

er for 20 menn å veier mer enn 175 i snitt!


95%<br />

Kritiske verdier<br />

til 2.5%<br />

95% ↔ 1.96<br />

-3 -2 -1 0 1 2 3<br />

-1.96 1.96


To viktige kritiske verdier<br />

1<br />

1<br />

95% ↔ 1.96<br />

90% ↔ 1.645<br />

95%<br />

90%<br />

-3 -2 -1 0 1 2 3<br />

-1.96 1.96<br />

-3 -2 -1 0 1 2 3<br />

-1.645 1.645


Eksamen <strong>Met</strong>8006 20.12.05

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!