26.10.2014 Views

Noter til E6 - dirac

Noter til E6 - dirac

Noter til E6 - dirac

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

16 Den statistiske model<br />

Man delte 20 nogenlunde ens marsvin op i to grupper, hvoraf den ene fik<br />

appelsinsaft, og den anden fik en <strong>til</strong>svarende mængde »kunstigt« C-vitamin.<br />

Efter seks ugers behandling målte man længden af fortændernes odontoblaster<br />

(det tandbensdannende væv). Man fik da disse resultater (i hver gruppe er<br />

observationerne ordnet efter størrelse):<br />

appelsinsaft: 8.2 9.4 9.6 9.7 10.0 14.5 15.2 16.1 17.6 21.5<br />

kunstigt C-vitamin: 4.2 5.2 5.8 6.4 7.0 7.3 10.1 11.2 11.3 11.5<br />

Man kan fastslå at der må være tale om en art tostikprøveproblem. Karakteren<br />

af observationerne gør at det ikke er urimeligt at forsøge sig med en normalfordelingsmodel<br />

af en slags, og det er alt i alt nærliggende at sige at der er tale<br />

om et »tostikprøveproblem med normalfordelte observationer«. Vi vil analysere<br />

observationerne ved brug af denne model, mere nøjagtigt vil vi undersøge<br />

om odontoblasternes middelvækst er den samme i de to grupper.<br />

⊲ [Eksemplet fortsætter som eksempel 3.6 side 28.]<br />

Simpel lineær regression<br />

Regressionsanalyse, der er en stor underafdeling inden for statistik, handler<br />

om at modellere middelværdistrukturen for (det som modellen opfatter<br />

som) de stokastiske variable ved hjælp af et større eller mindre antal<br />

kvantitative variable. Her ser vi på det simpleste <strong>til</strong>fælde.<br />

Der foreligger et antal sammenhørende værdier (x i , y i ), i = 1, 2, . . . , n,<br />

hvor y i ’erne opfattes som observerede værdier af stokastiske variable<br />

Y 1 , Y 2 , . . . , Y n , og x i ’erne er såkaldte baggrundsvariable eller forklarende<br />

variable. Det er en væsentlig pointe at x’erne ifølge modellen er ikke-stokastiske.<br />

Den simple lineære regressionsmodel går ud på at Y i ’erne er indbyrdes<br />

uafhængige normalfordelte stokastiske variable med samme varians σ 2 og<br />

med en middelværdistruktur af formen E Y i = α + βx i , eller sagt mere<br />

præcist: der findes konstanter α og β således at E Y i = α + βx i for<br />

alle i. Modellen indeholder således tre ukendte parametre, α, β og σ 2 .<br />

Modelfunktionen er<br />

n∏<br />

(<br />

f(y, α, β, σ 2 1<br />

) = √ exp − 1 (y i − (α + βx i )) 2 )<br />

i=1 2πσ<br />

2 2 σ 2<br />

(<br />

= (2πσ 2 ) −n/2 exp − 1<br />

n<br />

)<br />

∑<br />

2σ 2 (y i − (α + βx i )) 2<br />

hvor y = (y 1 , y 2 , . . . , y n ) ∈ R n , α, β ∈ R og σ 2 > 0. Log-likelihoodfunktionen<br />

er<br />

⊲ [Fortsættes side 28.]<br />

ln L(α, β, σ 2 ) = − n 2 ln σ2 − 1<br />

2σ 2<br />

n ∑<br />

i=1<br />

i=1<br />

(y i − (α + βx i )) 2 . (2.5)

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!