26.12.2014 Views

Begreber

Begreber

Begreber

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Begreber</strong><br />

Model og modelkontrol<br />

Estimation af parametre. Fordeling.<br />

Hypotese og test. Teststørrelse.<br />

konfidensintervaller<br />

Dages tema: “to normalfordelte observationsrækker” (3.2.1<br />

i BG)<br />

Relevant at undersøge om varianserne er ens og om<br />

middelværdierne er ens. Vi tager udgangspunkt i Ex. 2.5.<br />

(De stakkels fluer).<br />

– p. 1/22


To normalfordelte obs. rækker - intro<br />

Lad x ij betegne den jte observation i den ite gruppe for<br />

i = 1, 2 og j = 1,...,n i .<br />

Det vil sige at i angiver gruppen, mens j angiver<br />

gentagelsen.<br />

I Ex. 2.5 har vi, at<br />

i = 1 svarer til gas i 30s<br />

i = 2 svarer til gas i 60s.<br />

Dermed er<br />

n 1 = 16 idet 16 fluer får gas i 30s<br />

n 2 = 15 idet 15 fluer får gas i 60s.<br />

– p. 2/22


Model:<br />

M 0 : X ij ∼ N(µ i ,σ 2 i ).<br />

“To normalfordelte observationsrækker”<br />

Det vil sige<br />

Der er samme fordeling indenfor hver gruppe (“Fluer<br />

der får gas i lige lang tid reagerer ens”).<br />

For fastholdt i har vi blot “en normalfordelt<br />

observationsrække”.<br />

µ i og σi 2 angiver middelværdi hhv. varians i den ite<br />

gruppe.<br />

Eks.: µ 1 er middelværdien for fluer der får gas i 30s i Ex.<br />

2.5.<br />

– p. 3/22


Modelkontrol:<br />

Fraktildiagrammer hvor man kigger efter systematiske<br />

afvigelser fra rette linjer.<br />

I Eks. 2.5 viser fraktildiagrammerne, at vi er nødt til at<br />

logaritmetransformere.<br />

Det vil sige, at x ij angiver logaritmen til kontakttiden for<br />

den jte flue i den ite gruppe.<br />

– p. 4/22


Estimation<br />

Da vi blot har 2× “en normalfordelt observationsrække”,<br />

beregnes estimaterne naturligvis som i Afsnit 3.1.<br />

Dvs. med den nye notation har vi<br />

µ i ← ¯x i. ∼∼ N(µ i ,σ 2 i /n i )<br />

σ 2 i ← s 2 (i) = SSD (i)<br />

f (i)<br />

∼∼ σ 2 i χ 2 (f (i) )/f (i)<br />

for i = 1, 2, hvor<br />

f (i) = n i − 1 og SSD (i) er summen af<br />

kvadratafvigelserne i gruppe i.<br />

– p. 5/22


Bemærkninger<br />

Vi benytter fodtegn (i) til at markere størrelser, der<br />

beregnes i gruppe i.<br />

Alle 4 stokastiske variable er uafhængige.<br />

– p. 6/22


Hypotese og test:<br />

To relevante hypoteser:<br />

H 0σ<br />

2 : σ 2 1 = σ2 2<br />

(samme varians i de to grupper)<br />

H 0µ : µ 1 = µ 2<br />

(samme middelværdi i de to grupper)<br />

Hvis man først kan få accepteret H 0σ 2, er det let at teste<br />

H 0µ .<br />

Vi undersøger derfor først H 0σ 2.<br />

– p. 7/22


Test for H 0σ 2<br />

Vi har<br />

σ 2 i ← s 2 (i) = SSD (i)<br />

f (i)<br />

∼∼ σ 2 i χ 2 (f (i) )/f (i)<br />

Hvis H 0σ<br />

2 er sand, har vi derfor at<br />

F := s2 (1)<br />

s 2 (2)<br />

∼∼ F(f (1) ,f (2) ) .<br />

(Udledning på tavlen).<br />

– p. 8/22


Test for H 0σ 2 - fortsat<br />

Vi forventer at F er tæt på 1.<br />

Det vil sige at store (>> 1) og små (


Test for H 0σ 2 - i Ex. 2.5<br />

Sandsynligheden for at få noget der er større er<br />

P(F > 1.077) = 1 − F F(f(1) ,f (2) )(1.077) = 0.447 .<br />

Hvilke små værdier er mere kritiske end 1.077 →<br />

vanskeligt at afgøre.<br />

– p. 10/22


Test for H 0σ 2 - i Ex. 2.5<br />

Sandsynligheden for at få noget der er større er<br />

P(F > 1.077) = 1 − F F(f(1) ,f (2) )(1.077) = 0.447 .<br />

Hvilke små værdier er mere kritiske end 1.077 →<br />

vanskeligt at afgøre.<br />

Vi ganger derfor med 2 som tidligere og får<br />

Hypotesen accepteres.<br />

p obs (x) = 2 · 0.447 = 0.894 .<br />

– p. 10/22


Generel formel til beregning af testss.<br />

Lad<br />

s 2 tæller = max{s2 (1) ,s2 (2) }<br />

s 2 nævner = min{s 2 (1) ,s2 (2) };<br />

Definer f tæller og f nævner tilsvarende.<br />

(Af regnetekniske årsager er det smart at have det største<br />

variansskøn i tælleren).<br />

Da kan testsandsynligheden for H 0σ<br />

2 beregnes som<br />

p obs (x) = 2<br />

(<br />

( s<br />

2<br />

))<br />

1 − F tæller<br />

F(ftæller ,f nævner )<br />

s 2 .<br />

nævner<br />

– p. 11/22


Bemærkninger vedr. M 1<br />

Antag at H 0σ<br />

2 accepteres–som i Ex. 2.5. Da er vor model:<br />

M 1 : X ij ∼ N(µ i ,σ 2 ), i = 1, 2,j = 1,...,n i<br />

hvor σ 2 angiver den fælles varians.<br />

Vigtig struktur:<br />

Alle observationer er uafhængige, normalfordelte og<br />

har samme (ukendte) varians.<br />

Der er to ukendte parametre i middelværdistrukturen,<br />

nemlig de to middelværdier µ 1 og µ 2 .<br />

– p. 12/22


Estimation under M 1<br />

Middelværdierne estimeres naturligvis stadig ved<br />

gennemsnittene:<br />

µ i ← ¯x i. ∼∼ N(µ i ,σ 2 /n i )<br />

Senere defineres det middelværdirette variansskøn under<br />

M 1 . Kaldes s 2 1 . – p. 13/22


Estimation under M 1 - fortsat<br />

Vi får derfor, at<br />

Std Error(¯x i. ) =<br />

√<br />

s 2 1<br />

n i<br />

.<br />

Når vi har fundet frihedsgraderne f 1 for s 2 1<br />

beregne 95%-ki for µ i som<br />

kan vi derfor<br />

¯x i. ± t 0.975 (f 1 ) Std Error(¯x i. )<br />

(Ikke samme interval som under M 0 –vi benytter jo et nyt<br />

variansskøn).<br />

– p. 14/22


Variansskønnet s 2 1<br />

Beregnes som et vægtet gennemsnit af de to oprindelige<br />

variansskøn;<br />

σ 2 ← s 2 1 =<br />

f (1)<br />

f (1) + f (2)<br />

s 2 (1) + f (2)<br />

f (1) + f (2)<br />

s 2 (2)<br />

hvor f 1 = f (1) + f (2) .<br />

= SSD (1) + SSD (2)<br />

f 1<br />

– p. 15/22


Variansskønnet s 2 1 - bemærkninger<br />

Fodtegn 1 på variansskøn og frihedsgrader skyldes at<br />

modellen kaldes M 1 .<br />

Der gælder<br />

s 2 1 ∼∼ σ 2 χ 2 (f 1 )/f 1 .<br />

Dermed kan vi udlede et 95%-ki for σ 2 som tidligere.<br />

Dvs vi benytter (3.15); se side 85.<br />

– p. 16/22


Huskeregler:<br />

f 1 = f (1) + f (2) = (n 1 − 1) + (n 2 − 1)<br />

= n 1 + n 2 − 2<br />

er<br />

antallet af observationer minus antallet af ukendte<br />

parametre i middelværdistrukturen.<br />

Vi har<br />

s 2 1 = SSD (1) + SSD (2)<br />

f 1<br />

=<br />

∑ 2<br />

i=1<br />

∑ ni<br />

j=1 (x ij − ¯x i. ) 2<br />

f 1<br />

– p. 17/22


Hypotese H 0µ : µ 1 = µ 2<br />

Bemærk at da<br />

¯x i. ∼∼ N(µ i ,σ 2 /n i )<br />

følger af uafhængigheden at<br />

¯x 1. − ¯x 2. ∼∼ N<br />

(µ 1 − µ 2 ,σ 2 ( 1<br />

n 1<br />

+ 1 n 2<br />

))<br />

Vi forventer at denne forskel er lille (tæt på 0).<br />

– p. 18/22


Test for H 0µ<br />

Dermed betragter vi<br />

t(x) =<br />

√<br />

¯x 1. − ¯x 2.<br />

( ) ∼∼ t(f 1)<br />

1n1<br />

+<br />

n 1 2<br />

s 2 1<br />

hvor store værdier er kritiske. (Udledning på tavlen).<br />

Dvs<br />

p obs (x) = 2(1 − F t(f1 )(|t(x)|))<br />

– p. 19/22


Konfidensinterval for µ 1 − µ 2<br />

Vi ser, at den estimerede spredning på ¯x 1. − ¯x 2. er<br />

Std Error(¯x 1. − ¯x 2. ) =<br />

√<br />

s 2 1<br />

( 1<br />

n 1<br />

+ 1 n 2<br />

)<br />

Et 95%-ki udledes som tidligere, og vi får<br />

¯x 1. − ¯x 2. ± t 0.975 (f 1 ) Std Error(¯x 1. − ¯x 2. ) .<br />

– p. 20/22


Accept af µ 1 = µ 2<br />

Accepteres µ 1 = µ 2 har vi modellen<br />

M 2 : X ij ∼ N(µ,σ 2 )<br />

som jo blot er “en normal fordelt obs. række”.<br />

Estimater:<br />

µ ← ¯x .. ∼∼ N(µ,σ 2 /(n 1 + n 2 ))<br />

←<br />

1 ∑∑<br />

(xij − ¯x .. ) 2<br />

n 1 + n 2 − 1<br />

σ 2<br />

∼∼ σ 2 χ 2 (n 1 + n 2 − 1)/(n 1 + n 2 − 1) .<br />

– p. 21/22


Beregningsformler<br />

Bemærk at i dette tilfælde gælder<br />

USS = USS 1 + USS 2 , S = S 1 + S 2<br />

hvor USS i angiver USSen i ite gruppe, og USS er den<br />

samlede USS.<br />

– p. 22/22

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!