Noter til E6 - dirac
Noter til E6 - dirac
Noter til E6 - dirac
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
16 Den statistiske model<br />
Man delte 20 nogenlunde ens marsvin op i to grupper, hvoraf den ene fik<br />
appelsinsaft, og den anden fik en <strong>til</strong>svarende mængde »kunstigt« C-vitamin.<br />
Efter seks ugers behandling målte man længden af fortændernes odontoblaster<br />
(det tandbensdannende væv). Man fik da disse resultater (i hver gruppe er<br />
observationerne ordnet efter størrelse):<br />
appelsinsaft: 8.2 9.4 9.6 9.7 10.0 14.5 15.2 16.1 17.6 21.5<br />
kunstigt C-vitamin: 4.2 5.2 5.8 6.4 7.0 7.3 10.1 11.2 11.3 11.5<br />
Man kan fastslå at der må være tale om en art tostikprøveproblem. Karakteren<br />
af observationerne gør at det ikke er urimeligt at forsøge sig med en normalfordelingsmodel<br />
af en slags, og det er alt i alt nærliggende at sige at der er tale<br />
om et »tostikprøveproblem med normalfordelte observationer«. Vi vil analysere<br />
observationerne ved brug af denne model, mere nøjagtigt vil vi undersøge<br />
om odontoblasternes middelvækst er den samme i de to grupper.<br />
⊲ [Eksemplet fortsætter som eksempel 3.6 side 28.]<br />
Simpel lineær regression<br />
Regressionsanalyse, der er en stor underafdeling inden for statistik, handler<br />
om at modellere middelværdistrukturen for (det som modellen opfatter<br />
som) de stokastiske variable ved hjælp af et større eller mindre antal<br />
kvantitative variable. Her ser vi på det simpleste <strong>til</strong>fælde.<br />
Der foreligger et antal sammenhørende værdier (x i , y i ), i = 1, 2, . . . , n,<br />
hvor y i ’erne opfattes som observerede værdier af stokastiske variable<br />
Y 1 , Y 2 , . . . , Y n , og x i ’erne er såkaldte baggrundsvariable eller forklarende<br />
variable. Det er en væsentlig pointe at x’erne ifølge modellen er ikke-stokastiske.<br />
Den simple lineære regressionsmodel går ud på at Y i ’erne er indbyrdes<br />
uafhængige normalfordelte stokastiske variable med samme varians σ 2 og<br />
med en middelværdistruktur af formen E Y i = α + βx i , eller sagt mere<br />
præcist: der findes konstanter α og β således at E Y i = α + βx i for<br />
alle i. Modellen indeholder således tre ukendte parametre, α, β og σ 2 .<br />
Modelfunktionen er<br />
n∏<br />
(<br />
f(y, α, β, σ 2 1<br />
) = √ exp − 1 (y i − (α + βx i )) 2 )<br />
i=1 2πσ<br />
2 2 σ 2<br />
(<br />
= (2πσ 2 ) −n/2 exp − 1<br />
n<br />
)<br />
∑<br />
2σ 2 (y i − (α + βx i )) 2<br />
hvor y = (y 1 , y 2 , . . . , y n ) ∈ R n , α, β ∈ R og σ 2 > 0. Log-likelihoodfunktionen<br />
er<br />
⊲ [Fortsættes side 28.]<br />
ln L(α, β, σ 2 ) = − n 2 ln σ2 − 1<br />
2σ 2<br />
n ∑<br />
i=1<br />
i=1<br />
(y i − (α + βx i )) 2 . (2.5)