Noter til E6 - dirac

dirac.ruc.dk

Noter til E6 - dirac

106 Lineære normale modeller

Opgave 7.2

Betragt den simple lineære regressionsmodel E Y = α + xβ, og antag at der

foreligger et antal sammenhørende værdier (y i, x i), i = 1, 2, . . . , n.

Hvordan ser designmatricen ud? Skriv normalligningerne op og løs dem.

Find formler for middelfejlene (dvs. standardafvigelserne) på bα og b β, samt

en formel for korrelationen mellem de to estimatorer. Tip: udnyt formel (7.7).

I visse typer forsøg kan eksperimentator (eller statistikeren) selv bestemme

x-værdierne inden for visse grænser. Hvordan skal man vælge x-erne?

Opgave 7.3 (Indianere i Peru)

En gruppe antropologer undersøgte hvordan blodtrykket ændrer sig hos peruvianske

indianere der flyttes fra deres oprindelige primitive samfund i de høje

Andesbjerge til den såkaldte civilisation, dvs. storbyen, der i øvrigt ligger i

langt mindre højde over havets overflade end deres oprindelig bopæl. Antropologerne

udvalgte en stikprøve på 39 mænd over 21 år der havde undergået

en sådan flytning. På hver af disse måltes blodtrykket (både det systoliske og

det diastoliske) samt en række baggrundsvariable, heriblandt alder, antal år

siden flytningen, højde, vægt og puls. Desuden har man udregnet endnu en

baggrundsvariabel, nemlig »brøkdel af livet levet i de nye omgivelser«, dvs.

antal år siden flytning divideret med nuværende alder. Man forestillede sig at

denne baggrundsvariabel kunne have stor »forklaringsevne«.

Her vil vi ikke se på hele talmaterialet, men kun på blodtrykket (det systoliske)

der skal optræde som y-variabel, og på de to x-variable brøkdel af livet i

de nye omgivelser og vægt. Disse er angivet i tabel 7.8.

Antropologerne mente at x 1 (brøkdel levet i de nye omgivelser) var et godt

mål for hvor længe personerne havde levet i de civiliserede omgivelser, og at det

derfor måtte være interessant at se hvor godt x 1 kunne forklare blodtrykket y.

Første skridt kunne derfor være at fitte en simpel lineær regressionsmodel med

x 1 som forklarende variabel. – Gør det.

Hvis man i et koordinatsystem afsætter y mod x 1, viser det sig imidlertid

at det bestemt ikke virker særlig rimeligt at hævde at (middelværdien af) y

afhænger lineært af x 1. Derfor må man give sig til at overveje om andre af de

målte baggrundsvariable med fordel kan inddrages.

Nu ved man at en persons vægt har betydning for den pågældendes blodtryk,

så næste modelforslag kunne være en multipel regressionsmodel med både

x 1 og x 2 som forklarende variable. – Estimér parametrene i denne model. Hvad

sker der med variansestimatet?

Undersøg residualerne for at vurdere modellens kvalitet.

Giv en tolkning af slutmodellen i forhold til de peruvianske indianere.

More magazines by this user
Similar magazines