Begreber
Begreber
Begreber
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
<strong>Begreber</strong><br />
Model og modelkontrol<br />
Estimation af parametre. Fordeling.<br />
Hypotese og test. Teststørrelse.<br />
konfidensintervaller<br />
Dages tema: “to normalfordelte observationsrækker” (3.2.1<br />
i BG)<br />
Relevant at undersøge om varianserne er ens og om<br />
middelværdierne er ens. Vi tager udgangspunkt i Ex. 2.5.<br />
(De stakkels fluer).<br />
– p. 1/22
To normalfordelte obs. rækker - intro<br />
Lad x ij betegne den jte observation i den ite gruppe for<br />
i = 1, 2 og j = 1,...,n i .<br />
Det vil sige at i angiver gruppen, mens j angiver<br />
gentagelsen.<br />
I Ex. 2.5 har vi, at<br />
i = 1 svarer til gas i 30s<br />
i = 2 svarer til gas i 60s.<br />
Dermed er<br />
n 1 = 16 idet 16 fluer får gas i 30s<br />
n 2 = 15 idet 15 fluer får gas i 60s.<br />
– p. 2/22
Model:<br />
M 0 : X ij ∼ N(µ i ,σ 2 i ).<br />
“To normalfordelte observationsrækker”<br />
Det vil sige<br />
Der er samme fordeling indenfor hver gruppe (“Fluer<br />
der får gas i lige lang tid reagerer ens”).<br />
For fastholdt i har vi blot “en normalfordelt<br />
observationsrække”.<br />
µ i og σi 2 angiver middelværdi hhv. varians i den ite<br />
gruppe.<br />
Eks.: µ 1 er middelværdien for fluer der får gas i 30s i Ex.<br />
2.5.<br />
– p. 3/22
Modelkontrol:<br />
Fraktildiagrammer hvor man kigger efter systematiske<br />
afvigelser fra rette linjer.<br />
I Eks. 2.5 viser fraktildiagrammerne, at vi er nødt til at<br />
logaritmetransformere.<br />
Det vil sige, at x ij angiver logaritmen til kontakttiden for<br />
den jte flue i den ite gruppe.<br />
– p. 4/22
Estimation<br />
Da vi blot har 2× “en normalfordelt observationsrække”,<br />
beregnes estimaterne naturligvis som i Afsnit 3.1.<br />
Dvs. med den nye notation har vi<br />
µ i ← ¯x i. ∼∼ N(µ i ,σ 2 i /n i )<br />
σ 2 i ← s 2 (i) = SSD (i)<br />
f (i)<br />
∼∼ σ 2 i χ 2 (f (i) )/f (i)<br />
for i = 1, 2, hvor<br />
f (i) = n i − 1 og SSD (i) er summen af<br />
kvadratafvigelserne i gruppe i.<br />
– p. 5/22
Bemærkninger<br />
Vi benytter fodtegn (i) til at markere størrelser, der<br />
beregnes i gruppe i.<br />
Alle 4 stokastiske variable er uafhængige.<br />
– p. 6/22
Hypotese og test:<br />
To relevante hypoteser:<br />
H 0σ<br />
2 : σ 2 1 = σ2 2<br />
(samme varians i de to grupper)<br />
H 0µ : µ 1 = µ 2<br />
(samme middelværdi i de to grupper)<br />
Hvis man først kan få accepteret H 0σ 2, er det let at teste<br />
H 0µ .<br />
Vi undersøger derfor først H 0σ 2.<br />
– p. 7/22
Test for H 0σ 2<br />
Vi har<br />
σ 2 i ← s 2 (i) = SSD (i)<br />
f (i)<br />
∼∼ σ 2 i χ 2 (f (i) )/f (i)<br />
Hvis H 0σ<br />
2 er sand, har vi derfor at<br />
F := s2 (1)<br />
s 2 (2)<br />
∼∼ F(f (1) ,f (2) ) .<br />
(Udledning på tavlen).<br />
– p. 8/22
Test for H 0σ 2 - fortsat<br />
Vi forventer at F er tæt på 1.<br />
Det vil sige at store (>> 1) og små (
Test for H 0σ 2 - i Ex. 2.5<br />
Sandsynligheden for at få noget der er større er<br />
P(F > 1.077) = 1 − F F(f(1) ,f (2) )(1.077) = 0.447 .<br />
Hvilke små værdier er mere kritiske end 1.077 →<br />
vanskeligt at afgøre.<br />
– p. 10/22
Test for H 0σ 2 - i Ex. 2.5<br />
Sandsynligheden for at få noget der er større er<br />
P(F > 1.077) = 1 − F F(f(1) ,f (2) )(1.077) = 0.447 .<br />
Hvilke små værdier er mere kritiske end 1.077 →<br />
vanskeligt at afgøre.<br />
Vi ganger derfor med 2 som tidligere og får<br />
Hypotesen accepteres.<br />
p obs (x) = 2 · 0.447 = 0.894 .<br />
– p. 10/22
Generel formel til beregning af testss.<br />
Lad<br />
s 2 tæller = max{s2 (1) ,s2 (2) }<br />
s 2 nævner = min{s 2 (1) ,s2 (2) };<br />
Definer f tæller og f nævner tilsvarende.<br />
(Af regnetekniske årsager er det smart at have det største<br />
variansskøn i tælleren).<br />
Da kan testsandsynligheden for H 0σ<br />
2 beregnes som<br />
p obs (x) = 2<br />
(<br />
( s<br />
2<br />
))<br />
1 − F tæller<br />
F(ftæller ,f nævner )<br />
s 2 .<br />
nævner<br />
– p. 11/22
Bemærkninger vedr. M 1<br />
Antag at H 0σ<br />
2 accepteres–som i Ex. 2.5. Da er vor model:<br />
M 1 : X ij ∼ N(µ i ,σ 2 ), i = 1, 2,j = 1,...,n i<br />
hvor σ 2 angiver den fælles varians.<br />
Vigtig struktur:<br />
Alle observationer er uafhængige, normalfordelte og<br />
har samme (ukendte) varians.<br />
Der er to ukendte parametre i middelværdistrukturen,<br />
nemlig de to middelværdier µ 1 og µ 2 .<br />
– p. 12/22
Estimation under M 1<br />
Middelværdierne estimeres naturligvis stadig ved<br />
gennemsnittene:<br />
µ i ← ¯x i. ∼∼ N(µ i ,σ 2 /n i )<br />
Senere defineres det middelværdirette variansskøn under<br />
M 1 . Kaldes s 2 1 . – p. 13/22
Estimation under M 1 - fortsat<br />
Vi får derfor, at<br />
Std Error(¯x i. ) =<br />
√<br />
s 2 1<br />
n i<br />
.<br />
Når vi har fundet frihedsgraderne f 1 for s 2 1<br />
beregne 95%-ki for µ i som<br />
kan vi derfor<br />
¯x i. ± t 0.975 (f 1 ) Std Error(¯x i. )<br />
(Ikke samme interval som under M 0 –vi benytter jo et nyt<br />
variansskøn).<br />
– p. 14/22
Variansskønnet s 2 1<br />
Beregnes som et vægtet gennemsnit af de to oprindelige<br />
variansskøn;<br />
σ 2 ← s 2 1 =<br />
f (1)<br />
f (1) + f (2)<br />
s 2 (1) + f (2)<br />
f (1) + f (2)<br />
s 2 (2)<br />
hvor f 1 = f (1) + f (2) .<br />
= SSD (1) + SSD (2)<br />
f 1<br />
– p. 15/22
Variansskønnet s 2 1 - bemærkninger<br />
Fodtegn 1 på variansskøn og frihedsgrader skyldes at<br />
modellen kaldes M 1 .<br />
Der gælder<br />
s 2 1 ∼∼ σ 2 χ 2 (f 1 )/f 1 .<br />
Dermed kan vi udlede et 95%-ki for σ 2 som tidligere.<br />
Dvs vi benytter (3.15); se side 85.<br />
– p. 16/22
Huskeregler:<br />
f 1 = f (1) + f (2) = (n 1 − 1) + (n 2 − 1)<br />
= n 1 + n 2 − 2<br />
er<br />
antallet af observationer minus antallet af ukendte<br />
parametre i middelværdistrukturen.<br />
Vi har<br />
s 2 1 = SSD (1) + SSD (2)<br />
f 1<br />
=<br />
∑ 2<br />
i=1<br />
∑ ni<br />
j=1 (x ij − ¯x i. ) 2<br />
f 1<br />
– p. 17/22
Hypotese H 0µ : µ 1 = µ 2<br />
Bemærk at da<br />
¯x i. ∼∼ N(µ i ,σ 2 /n i )<br />
følger af uafhængigheden at<br />
¯x 1. − ¯x 2. ∼∼ N<br />
(µ 1 − µ 2 ,σ 2 ( 1<br />
n 1<br />
+ 1 n 2<br />
))<br />
Vi forventer at denne forskel er lille (tæt på 0).<br />
– p. 18/22
Test for H 0µ<br />
Dermed betragter vi<br />
t(x) =<br />
√<br />
¯x 1. − ¯x 2.<br />
( ) ∼∼ t(f 1)<br />
1n1<br />
+<br />
n 1 2<br />
s 2 1<br />
hvor store værdier er kritiske. (Udledning på tavlen).<br />
Dvs<br />
p obs (x) = 2(1 − F t(f1 )(|t(x)|))<br />
– p. 19/22
Konfidensinterval for µ 1 − µ 2<br />
Vi ser, at den estimerede spredning på ¯x 1. − ¯x 2. er<br />
Std Error(¯x 1. − ¯x 2. ) =<br />
√<br />
s 2 1<br />
( 1<br />
n 1<br />
+ 1 n 2<br />
)<br />
Et 95%-ki udledes som tidligere, og vi får<br />
¯x 1. − ¯x 2. ± t 0.975 (f 1 ) Std Error(¯x 1. − ¯x 2. ) .<br />
– p. 20/22
Accept af µ 1 = µ 2<br />
Accepteres µ 1 = µ 2 har vi modellen<br />
M 2 : X ij ∼ N(µ,σ 2 )<br />
som jo blot er “en normal fordelt obs. række”.<br />
Estimater:<br />
µ ← ¯x .. ∼∼ N(µ,σ 2 /(n 1 + n 2 ))<br />
←<br />
1 ∑∑<br />
(xij − ¯x .. ) 2<br />
n 1 + n 2 − 1<br />
σ 2<br />
∼∼ σ 2 χ 2 (n 1 + n 2 − 1)/(n 1 + n 2 − 1) .<br />
– p. 21/22
Beregningsformler<br />
Bemærk at i dette tilfælde gælder<br />
USS = USS 1 + USS 2 , S = S 1 + S 2<br />
hvor USS i angiver USSen i ite gruppe, og USS er den<br />
samlede USS.<br />
– p. 22/22