Noter til E6 - dirac

More documents

Recommendations

Info

$Guide to Imfufa LaTeX - dirac$

98 Lineære normale modeller Hvis man undersøger om der er en forsvindende fosforvirkning, så må også denne hypotese forkastes, dvs. det har også en signifikant virkning at tilføre fosforgødning. Variansanalyseskemaet (tabel 7.6) giver en samlet oversigt over analysen. 7.6 Regressionsanalyse § Præsentation Regressionsanalyse handler om at undersøge hvordan én målt størrelse afhænger af en eller flere andre. Antag at der foreligger et statistisk datamateriale som er fremkommet på den måde at man på hvert af nogle »individer« (f.eks. forsøgspersoner eller forsøgsdyr eller enkelt-laboratorieforsøg osv.) har målt værdien af et antal størrelser (variable). En af disse størrelser indtager en særstilling, idet man nemlig gerne vil »beskrive« eller »forklare« denne størrelse ved hjælp af de øvrige. Tit kalder man den variabel der skal beskrives for y, og de variable ved hjælp af hvilke man vil beskrive, for x 1 , x 2 , . . . , x p . Andre betegnelser fremgår af følgende oversigt: y den modellerede variabel den afhængige variabel den forklarede variabel responsvariabel x 1 , x 2 , . . . , x p baggrundsvariable de uafhængige variable de forklarende variable Her skitseres et par eksempler: 1. Lægen observerer den tid y som patienten overlever efter at være blevet behandlet for sygdommen, men lægen har også registreret en mængde baggrundsoplysninger om patienten, så som køn, alder, vægt, detaljer om sygdommen osv. Nogle af baggrundsoplysningerne kan måske indeholde information om hvor længe patienten kan forventes at overleve. 2. I en række nogenlunde ens i-lande har man bestemt mål for lungekræftforekomst, cigaretforbrug og forbrug af fossilt brændstof, altsammen pr. indbygger. Man kan da udnævne lungekræftforekomst til y-variabel og søge at »forklare« den ved hjælp af de to andre variable, der så får rollen som forklarende variable. 3. Man ønsker at undersøge et bestemt stofs giftighed. Derfor giver man det i forskellige koncentrationer til nogle grupper af forsøgsdyr og ser hvor mange af dyrene der dør. Her er koncentrationen x en uafhængig variabel hvis værdi eksperimentator bestemmer, og antallet y af døde er den afhængige variabel. § Dette afsnit er genbrug fra IMFUFA-tekst 254.
7.6 Regressionsanalyse 99 Regressionsanalyse går ud på at finde en statistisk model hvormed man kan beskrive en y-variabel ved hjælp af en kendt simpel funktion af nogle baggrundsvariable og nogle parametre. Parametrene er de samme for alle observationssæt, hvorimod baggrundsvariablene typisk ikke er det. Man må naturligvis ikke forvente at den statistiske model leverer en perfekt beskrivelse, et perfekt fit, dels fordi den model man måtte finde frem til, næppe er fuldstændig rigtig, dels fordi en af pointerne med statistiske modeller netop er at de kun beskriver hovedtrækkene i datamaterialet og ser stort på de finere detaljer. Der vil derfor være en vis forskel mellem den observerede værdi y og den såkaldt fittede værdi ŷ, dvs. den værdi som man ifølge regressionsmodellen skulle få med de givne værdier af baggrundsvariablene. Denne forskel kaldes residualet og betegnes ofte e. Vi har så opspaltningen y = ŷ + e observeret værdi = fittet værdi + residual. Residualerne er det som modellen ikke beskriver, og derfor er det naturligt at man (eller rettere modellen) anser dem for tilfældige, dvs. for at være tilfældige tal fra en vis sandsynlighedsfordeling. To væsentlige forudsætninger for at kunne benytte regressionsanalyse er 1. at det ikke er x-erne, men kun y-erne og residualerne, der er behæftede med tilfældig variation (»usikkerhed«), 2. at de enkelte målinger er stokastisk uafhængige af hinanden, hvilket vil sige at de tilfældigheder der indvirker på én bestemt y-værdi (efter at man har taget højde for baggrundsvariablene), ikke har nogen sammenhæng med de tilfældigheder der spiller ind på de øvrige y-værdier. Det simpleste eksempel på regressionsanalyse er det hvor der kun er én enkelt baggrundsvariabel, som vi så kan betegne x. Opgaven bliver da at beskrive y-værdierne ved hjælp af en kendt simpel funktion af x. Det simpleste ikke-trivielle bud på en sådan funktion må vel være en funktion af typen y = α + xβ hvor α og β er to parametre, dvs. man formoder at y er en affin funktion af x. Derved får man den såkaldte simple lineære regressionsmodel, jf. side 16. En lidt mere avanceret model er den multiple lineære regressionsmodel hvor man har p forklarende variable x 1 , x 2 , . . . , x p og søger at beskrive p∑ y-værdierne med en funktion af formen y = x j β j . Formulering af modellen For at regressionsmodellen kan blive til en genuin statistisk model, skal man specificere den sandsynlighedsfordeling som skal beskrive y-ernes j=1
Page 1 and 2:
Noter til E6 Del 2: Statistik Jørg
Page 3 and 4:
Indhold 1 Indledning 3 2 Den statis
Page 5 and 6:
1 Indledning Hvor sandsynlighedsreg
Page 7 and 8:
2 Den statistiske model Vi vil før
Page 9 and 10:
2.1 Eksempler 7 Den simple binomial
Page 11 and 12:
2.1 Eksempler 9 Tabel 2.2 Rismelsbi
Page 13 and 14:
2.1 Eksempler 11 Tabel 2.3 Genotype
Page 15 and 16:
2.1 Eksempler 13 tionen er n∏ f(y
Page 17 and 18:
2.1 Eksempler 15 observationer grup
Page 19 and 20:
2.2 Opgaver 17 Tabel 2.6 Forbes’
Page 21 and 22:
3 Estimation En statistisk model er
Page 23 and 24:
3.2 Eksempler 21 asymptotisk varian
Page 25 and 26:
3.2 Eksempler 23 Eksempel 3.2 (Rism
Page 27 and 28:
3.2 Eksempler 25 I Poissonfordeling
Page 29 and 30:
3.2 Eksempler 27 med 63 frihedsgrad
Page 31 and 32:
3.2 Eksempler 29 idet de øvrige to
Page 33:
3.3 Opgaver 31 3.3 Opgaver Opgave 3
Page 36 and 37:
34 Hypoteseprøvning eller mere udf
Page 38 and 39:
36 Hypoteseprøvning Eksempel 4.1 (
Page 40 and 41:
38 Hypoteseprøvning Tabel 4.1 Rism
Page 42 and 43:
40 Hypoteseprøvning hvor by 1 = 69
Page 44 and 45:
42 Hypoteseprøvning Vi har tidlige
Page 46 and 47:
44 Hypoteseprøvning forhånd kan s
Page 49 and 50: 5 Nogle eksempler 5.1 Rismelsbiller
Page 51 and 52: 5.1 Rismelsbiller 49 brøkdel døde
Page 53 and 54: 5.1 Rismelsbiller 51 3 M logit(brø
Page 55 and 56: 5.1 Rismelsbiller 53 brøkdel døde
Page 57 and 58: 5.2 Lungekræft i Fredericia 55 br
Page 59 and 60: 5.2 Lungekræft i Fredericia 57 Tab
Page 61 and 62: 5.2 Lungekræft i Fredericia 59 = k
Page 67 and 68: 5.2 Lungekræft i Fredericia 65 Her
Page 69 and 70: 5.3 Ulykker på en granatfabrik 67
Page 75 and 76: 6 Den flerdimensionale normalfordel
Page 77 and 78: 6.2 Definition og egenskaber 75 6.2
Page 79 and 80: 6.2 Definition og egenskaber 77 Sæ
Page 81: 6.2 Definition og egenskaber 79 og
Page 84 and 85: 82 Lineære normale modeller ◦ De
Page 86 and 87: 84 Lineære normale modeller Hypote
Page 88 and 89: 86 Lineære normale modeller Tabel
Page 90 and 91: 88 Lineære normale modeller skal h
Page 92 and 93: 90 Lineære normale modeller samme
Page 94 and 95: 92 Lineære normale modeller gjaldt
Page 96 and 97: 94 Lineære normale modeller og alt
Page 98 and 99: 96 Lineære normale modeller Tabel
Page 102 and 103: 100 Lineære normale modeller varia
Page 104 and 105: 102 Lineære normale modeller og no
Page 106 and 107: 104 Lineære normale modeller Konce
Page 108 and 109: 106 Lineære normale modeller Opgav
Page 110 and 111: 108
Page 112 and 113: 110 En udledning af normalfordeling
Page 114 and 115: 112
Page 116 and 117: 114 Nogle resultater fra lineær al
Page 118 and 119: 116
Page 120 and 121: 118 Tabeller Fraktiler i χ 2 -ford
Page 122 and 123: 120 Tabeller 90% fraktiler i F -for
Page 124 and 125: 122 Tabeller 97.5% fraktiler i F -f
Page 126 and 127: 124 Tabeller Fraktiler i t-fordelin
Page 128 and 129: 126
Page 130 and 131: 128 Stikord - middelværdi 73 - var
show all

Noter til E6 - dirac

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?