26.10.2014 Views

Fx. “en normalfordelt obs. række” m. kendt varians

Fx. “en normalfordelt obs. række” m. kendt varians

Fx. “en normalfordelt obs. række” m. kendt varians

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Tema<br />

Model og modelkontrol<br />

( <strong>Fx</strong>. “en <strong>normalfordelt</strong> <strong>obs</strong>. række” m. <strong>kendt</strong> <strong>varians</strong>)<br />

Estimation af parametre. Fordeling.<br />

(<strong>Fx</strong>. ¯x . → µ)<br />

Hypotese og test. Teststørrelse.<br />

(<strong>Fx</strong>. H 0 : µ = µ 0 )<br />

konfidensintervaller<br />

Vi tager udgangspunkt i Ex. 3.1 i BG.<br />

– p. 1/??


Model<br />

M : X i ∼ N(µ,σ 2 ) for i = 1,...,n hvor µ ∈ R og σ 2 > 0 er<br />

u<strong>kendt</strong>e.<br />

(“En <strong>normalfordelt</strong> <strong>obs</strong>ervationsrække”).<br />

Kontrolleres ved et fraktildiagram.<br />

Tidligere antog vi at σ 2 er <strong>kendt</strong>.<br />

I Ex. 3.1 kan µ fortolkes som middel-diameteren<br />

fratrukket 5160 micrometer; σ 2 modellerer variationen.<br />

– p. 2/??


Estimation<br />

Vi benytter<br />

¯x . → µ<br />

s 2 → σ 2<br />

hvor<br />

s 2 = 1<br />

n−1<br />

∑ n<br />

i=1 (x i − ¯x . ) 2 .<br />

– p. 3/??


Estimation<br />

Vi benytter<br />

¯x . → µ<br />

s 2 → σ 2<br />

hvor<br />

s 2 = 1<br />

n−1<br />

∑ n<br />

i=1 (x i − ¯x . ) 2 .<br />

Vi kalder s 2 for det middelværdirette <strong>varians</strong>skøn, jvf.<br />

senere.<br />

– p. 3/??


Fordelingerne<br />

¯X . ∼ N(µ, σ2<br />

n )<br />

1<br />

n − 1<br />

n∑<br />

(X i − ¯X . ) 2 ∼ σ 2 χ 2 (n − 1)/(n − 1)<br />

i=1<br />

og disse stokastiske variable er uafhængige.<br />

Specielt er<br />

E 1<br />

n − 1<br />

V ar<br />

n∑<br />

(X i − ¯X . ) 2 = σ 2<br />

i=1<br />

1<br />

n − 1<br />

n∑<br />

(X i − ¯X . ) 2 = 2σ 4 /(n − 1)<br />

i=1<br />

– p. 4/??


Huskeregel<br />

1<br />

n − 1<br />

n∑<br />

(x i − ¯x . ) 2 ∼∼ σ 2 χ 2 (n − 1)/(n − 1) .<br />

i=1<br />

Hvorfor n − 1?<br />

n er antallet af <strong>obs</strong>ervationer<br />

1 svarer til at vi skal estimere een parameter (nemlig µ) i<br />

middelværdien.<br />

Dvs. n − 1 er antallet af <strong>obs</strong>ervationer minus antallet af<br />

u<strong>kendt</strong>e parametre i middelværdien.<br />

– p. 5/??


Hypotese og test<br />

Test: H 0 : µ = µ 0 . (I Ex. 3.1 er µ 0 = 40).<br />

Når vi kender σ 2 benyttes<br />

som teststørrelse.<br />

u(x) = ¯x . − µ<br />

√ 0<br />

σ 2<br />

n<br />

– p. 6/??


Hypotese og test<br />

Test: H 0 : µ = µ 0 . (I Ex. 3.1 er µ 0 = 40).<br />

Når vi kender σ 2 benyttes<br />

som teststørrelse.<br />

u(x) = ¯x . − µ<br />

√ 0<br />

σ 2<br />

n<br />

Her kender vi ikke σ 2 så i stedet benyttes det<br />

middelværdirette <strong>varians</strong>skøn. Dvs<br />

t(x) = ¯x . − µ<br />

√ 0<br />

s 2<br />

n<br />

– p. 6/??


Hypotese og test - fortsat<br />

Som tidligere har vi, at numerisk store værdier er kritiske for<br />

H 0 .<br />

På tavlen vises: t(x) ∼∼ t(n − 1).<br />

– p. 7/??


Hypotese og test - fortsat<br />

Som tidligere har vi, at numerisk store værdier er kritiske for<br />

H 0 .<br />

På tavlen vises: t(x) ∼∼ t(n − 1).<br />

Dermed er<br />

p <strong>obs</strong> (x) = 2(1 − F t(n−1) (|t(x)|)) .<br />

I Ex. 3.1 kan vi stadig acceptere H 0 .<br />

– p. 7/??


Konfidensinterval for µ<br />

Antag: niveauet er α. Hypotese H 0 : µ = µ 0 .<br />

Dvs. H 0 accepteres hviss<br />

p <strong>obs</strong> (x) = 2(1 − F t(n−1) (|t(x)|)) ≥ α<br />

som er ækvivalent med<br />

F t(n−1) (|t(x)|) ≤ 1 − α/2 .<br />

– p. 8/??


Konfidensinterval for µ - fortsat<br />

Dette er ækvivalent med<br />

|t(x)| ≤ (F t(n−1) ) −1 (1 − α/2) = t 1−α/2 (n − 1).<br />

– p. 9/??


Konfidensinterval for µ - fortsat<br />

Dette er ækvivalent med<br />

|t(x)| ≤ (F t(n−1) ) −1 (1 − α/2) = t 1−α/2 (n − 1).<br />

Altså: H 0 accepteres hviss µ 0 tilhører intervallet med<br />

grænser<br />

√<br />

¯x . ± t 1−α/2 (n − 1) s 2 /n .<br />

– p. 9/??


(1 − α)-konfidensintervallet for µ<br />

Er intervallet bestående af de µ 0 for hvilke hypotesen<br />

µ = µ 0 accepteres.<br />

– p. 10/??


(1 − α)-konfidensintervallet for µ<br />

Er intervallet bestående af de µ 0 for hvilke hypotesen<br />

µ = µ 0 accepteres.<br />

Dvs. jvf. ovenfor har (1 − α)-konfidensintervallet grænser<br />

√<br />

¯x . ± t 1−α/2 (n − 1) s 2 /n .<br />

Specielt har 95%-konfidensintervallet grænser givet ved<br />

√<br />

¯x . ± t 0.975 (n − 1) s 2 /n .<br />

(se (3.22) side 63 i BG).<br />

– p. 10/??


Konfidensinterval - bemærkninger<br />

Løst skrevet består 95%-konfidensintervallet af de<br />

værdier af den u<strong>kendt</strong>e parameter som vi kan tro på på<br />

baggrund af data.<br />

I BG, side 62, er det vist, at sandsynligheden for at µ<br />

tilhører 95%-konfidensintervallet er 95%.<br />

Læs selv om konfidensinterval for µ når σ 2 er <strong>kendt</strong>.<br />

(Side 62).<br />

– p. 11/??


Test i <strong>varians</strong>en<br />

Model: En <strong>normalfordelt</strong> <strong>obs</strong>ervationsrække - u<strong>kendt</strong><br />

<strong>varians</strong>.<br />

Variansskønnet i Ex. 3.1 er<br />

s 2 = 53.31 ∼∼ σ 2 χ 2 (n − 1)/(n − 1).<br />

H 0 : σ 2 = σ 2 0 (I Ex. 3.1 er σ2 0 = 100). – p. 12/??


Test i <strong>varians</strong>en - fortsat<br />

Hvis H 0 er sand, vil vi forvente at s 2 /σ 2 0<br />

er tæt på 1.<br />

Derfor er både store og små værdier af s 2 /σ0 2<br />

H 0 .<br />

kritiske for<br />

– p. 13/??


Test i <strong>varians</strong>en - fortsat<br />

I eksemplet er s 2 /σ0 2 = 05331 og sandsynligheden for at<br />

få en mindre <strong>obs</strong>ervation er<br />

F χ2 (39)/39(0.5331) = 0.00743.<br />

Hvordan defineres de “mere kritiske store værdier”????<br />

– p. 14/??


Test i <strong>varians</strong>en - fortsat<br />

I eksemplet er s 2 /σ0 2 = 05331 og sandsynligheden for at<br />

få en mindre <strong>obs</strong>ervation er<br />

F χ2 (39)/39(0.5331) = 0.00743.<br />

Hvordan defineres de “mere kritiske store værdier”????<br />

Løsning: Der ganges med 2;<br />

Dvs. testsandsynligheden er<br />

p <strong>obs</strong> (x) = 2 · 0.00743 = 0.0148.<br />

Dermed forkastes H 0 i Ex. 3.1!<br />

– p. 14/??


Test i <strong>varians</strong>en - fortsat<br />

Se (3.12) i BG for den generelle formel for<br />

testsandsynligheden.<br />

Se (3.14) i BG for formlen for konfidensintervallet. (f er<br />

antallet af frihedsgrader for <strong>varians</strong>skønnet; her<br />

f = n − 1).<br />

– p. 15/??


Beregningsformler:<br />

x . kaldes ofte for S (summen);<br />

Lad SSD = ∑ n<br />

i=1 (x i − ¯x . ) 2<br />

(Sum of Squares of Deviations).<br />

Lad USS = ∑ n<br />

i=1 x2 i<br />

(Uncorrected Sum of Squares)<br />

– p. 16/??


Beregningsformler:<br />

x . kaldes ofte for S (summen);<br />

Lad SSD = ∑ n<br />

i=1 (x i − ¯x . ) 2<br />

(Sum of Squares of Deviations).<br />

Lad USS = ∑ n<br />

i=1 x2 i<br />

(Uncorrected Sum of Squares)<br />

Da gælder<br />

SSD = USS − S2<br />

n<br />

og dermed<br />

s 2 = 1<br />

n−1<br />

(USS −<br />

S2<br />

n ). – p. 16/??


Intro til Std Error<br />

t-teststørrelsen for H 0 : µ = µ 0 er<br />

hvor ¯x . → µ.<br />

Nævneren<br />

t(x) = ¯x . − µ<br />

√ 0<br />

s 2<br />

n<br />

√<br />

s 2<br />

er den estimerede spredning på estimatet ¯x . for µ og<br />

betegnes<br />

Std Error eller Std Error(¯x . ).<br />

n<br />

– p. 17/??


Intro til Std Error - fortsat<br />

Strukturen af t-teststørrelsen er derfor<br />

t(x) = estimat − µ 0<br />

Std Error<br />

og 95%-konfidensintervallet har grænser<br />

estimat ± t 0.025 (f) Std Error .<br />

hvor f er frihedsgraderne for <strong>varians</strong>skønnet; her f = n − 1.<br />

Ovenstående er nyttigt at vide, bl.a. når man skal aflæse<br />

udskrifter fra statistiske programpakker.<br />

– p. 18/??


F -fordelingen - side 166<br />

Lad Z i ∼ χ 2 (f i )/f i for i = 1, 2 være uafhængige. Tænk på Z i<br />

som et <strong>varians</strong>skøn.<br />

Definer<br />

F = Z 1<br />

Z 2<br />

Vi siger, at F er F -fordelt med f 1 frihedsgrader i tælleren og<br />

f 2 frihedsgrader i nævneren.<br />

Skrives F ∼ F(f 1 ,f 2 ).<br />

– p. 19/??


F -fordelingen - fortsat<br />

Bemærk at<br />

t ∼ t(f) ⇒ t 2 ∼ F(1,f)<br />

Vigtig formel i forbindelse med tabelopslag:<br />

F F(f1 ,f 2 )(x) = 1 − F F(f2 ,f 1 )( 1 x ) . – p. 20/??

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!