Noter til E6 - dirac

dirac.ruc.dk

Noter til E6 - dirac

7 Lineære normale modeller

Dette kapitel præsenterer de klassiske lineære normalfordelingsmodeller

som variansanalyse og regressionsanalyse formuleret i lineær algebrasprog.

7.1 Estimation og test, generelt

Vi vil studere den generelle model der siger at y er en observation af en

n-dimensionalt normalfordelt stokastisk variabel Y med middelværdivektor

µ og variansmatrix σ 2 I; det antages at parameteren µ er et punkt

i underrummet L af V = R n , og at σ 2 > 0, dvs. parameterrummet

er L × ] 0 ; −∞ [. En sådan model kaldes en lineær normal model fordi

middelværdien tilhører et lineært underrum L.

Likelihoodfunktionen svarende til observationen y er

L(µ, σ 2 1

) =

(−

(2π) n/2 (σ 2 ) exp 1 ‖y − µ‖ 2 )

n/2 2

σ 2 .

Estimation

Lad p betegne ortogonalprojektionen af V = R n på L. For et vilkårligt

z ∈ V er z = (z − pz) + pz hvor z − pz ⊥ pz, og dermed er ‖z‖ 2 =

‖z − pz‖ 2 + ‖pz‖ 2 (Pythagoras); anvendt på z = y − µ giver det at

‖y − µ‖ 2 = ‖y − py‖ 2 + ‖py − µ‖ 2

hvoraf følger at L(µ, σ 2 ) ≤ L(py, σ 2 ) for ethvert σ 2 , dvs. maksimaliseringsestimatet

for µ er py. Ved sædvanlige metoder finder man at

L(py, σ 2 ) maksimaliseres med hensyn til σ 2 når σ 2 er lig 1 n ‖y − py‖2 .

Fra sætning 6.6 anvendt på X − µ ved vi at ‖X − pX‖ 2 er χ 2 -fordelt

med n − dim L frihedsgrader og skalaparameter σ 2 , specielt har den middelværdi

(n − dim L)σ 2 . Vi har hermed vist

Sætning 7.1

I den generelle lineære model gælder at

◦ Middelværdivektoren µ estimeres ved ̂µ = py, altså projektionen af

y vinkelret ned på L.

◦ Variansen σ 2 estimeres centralt ved s 2 1

=

n−dim L ‖y − py‖2 .

Maksimaliseringsestimatoren for σ 2 er ̂σ 2 = 1 n ‖y − py‖2 .

81

More magazines by this user
Similar magazines