Formelsamling
Formelsamling
Formelsamling
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Innhold<br />
1 Grunnleggende statistikk 2<br />
1.1 Beregning av standardavvik s . . . . . . . . . . . . . . . . . . . . . . . . 2<br />
1.2 Enkel T -test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2<br />
1.3 Uparet T -test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3<br />
1.4 Paret T -test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3<br />
2 Modeller 4<br />
2.1 Enveis ANOVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4<br />
2.2 Enveis ANOVA med like store gjentak . . . . . . . . . . . . . . . . . . . 5<br />
2.3 Toveis ANOVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6<br />
2.4 Treveis ANOVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7<br />
2.5 Faktorielt gjentaksforsøk med 2 variabler uten blokking . . . . . . . . . . 8<br />
2.6 Split-plot blokkforsøk med 2 variabler i tillegg til blokk . . . . . . . . . . 9<br />
2.7 Split-plot gjentaksforsøk med 2 variabler (uten blokking) . . . . . . . . . 10<br />
3 Detaljanalyse 11<br />
3.1 Diagram . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11<br />
3.2 Parvis sammenlikning . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11<br />
3.3 LSD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11<br />
3.4 Lineær kontrast . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11<br />
4 Korrelasjon og regresjon 12<br />
4.1 Korrelasjon og regresjon: Enkle lineære sammenhenger . . . . . . . . . . 12<br />
4.2 Testing av regresjon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13<br />
5 Tabeller 14<br />
5.1 Students T -fordeling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14<br />
5.2 Fischers F -fordeling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14<br />
6 Nøkkel for ˚a finne riktig modell i kurset førsøksmetodikk 16<br />
7 Indekser ijk brukt i formelsamlingen 17<br />
1
1 Grunnleggende statistikk 2<br />
1 Grunnleggende statistikk<br />
1.1 Beregning av standardavvik s<br />
For ˚a finne ut hvor stort standardavviket er i et sett med tall.<br />
Framgangsm˚ate:<br />
Gjennomsnitt er X: X =<br />
X<br />
N<br />
Korreksjonsledd er CT : CT = N · X 2 = ( X) 2<br />
Kvadratsum er SS : SS = X 2 −CT<br />
Frihetsgrader er DF : DF = N − 1<br />
Middelkvadratsum er MS : MS = SS<br />
DF<br />
Standardavvik er s : s = √ MS<br />
1.2 Enkel T -test<br />
Testing av en populasjon.<br />
Det er tilsammen N m˚alinger med verdier X1 til XN.<br />
<br />
X<br />
Gjennomsnitt er X : X =<br />
N<br />
Standardavvik er sX : sX =<br />
Standardfeil er SE : SE = sX<br />
√N<br />
Testobservator er TT : TT =<br />
X 2 − N · X 2<br />
X − µ0<br />
SE<br />
N − 1<br />
Konfidensintervall : µ = X ± t DF<br />
α/2 SE<br />
Forutsetter at differansen X − µ0 er positiv. Hvis n˚a TT er større enn Tα eller Tα/2<br />
(ensidig eller tosidig for gitt signifikansniv˚a α) har vi p˚avist statistisk sikker forskjell.<br />
N
1 Grunnleggende statistikk 3<br />
1.3 Uparet T -test<br />
Testing av forskjell mellom 2 normalfordelte populasjoner. To tilfeldige utvalg av prøver<br />
fra normalfordelte populasjoner testes. Det trenger ikke være like mange prøver fra hver<br />
populasjon. Spesialtilfelle av enveis ANOVA.<br />
Indeksen i har verdiene 1 g 2 for de to utvalgene. For eksempel har utvalg 1 N1<br />
m˚alinger.<br />
Gjennomsnitt Xi og standardavvik si : Xi =<br />
Xi<br />
Ni<br />
, si =<br />
Blandet varians er s 2 P : s2 P = DF1 · s 2 1 + DF2 · s 2 2<br />
DF1 + DF2<br />
<br />
Standardfeil er SE : SE = sP<br />
1<br />
+ 1<br />
=<br />
Testobservator er TT : TT = X1 − X2<br />
SE<br />
N1<br />
N2<br />
= ∆X<br />
SE<br />
<br />
2 2<br />
Xi − Ni · Xi<br />
<br />
s 2 P<br />
N1<br />
Ni − 1<br />
+ s2 P<br />
N2<br />
Konfidensintervall : ∆µ = ∆X ± t DF<br />
α/2 SE der ∆µ = µ1 − µ2<br />
Forutsetter at differansen ∆X = X1 − X2 er positiv. Hvis n˚a TT er større enn Tα<br />
eller Tα/2 (ensidig eller tosidig for gitt signifikansniv˚a α) har vi p˚avist en forskjell.<br />
1.4 Paret T -test<br />
Testing av forskjell i en populasjon p˚a to tidspunkter eller to steder eller under to<br />
forskjellige forhold. Det samme individet m˚ales før og etter eller her og der eller under<br />
det ene forholdet og s˚a under det andre forholdet. Spesialtilfelle av to-veis ANOVA.<br />
Det er tilsammen N m˚alinger med differansene D1 til DN.<br />
<br />
D<br />
Gjennomsnitt og standardavvik : D= sD =<br />
N<br />
Standardfeil og testobservator : SE = sD<br />
√N<br />
TT = D<br />
SE<br />
D 2 − N · D 2<br />
N − 1<br />
Konfidensintervall : ∆µ = D ± t DF<br />
α/2 SE der ∆µ = µ1 − µ2<br />
Forutsetter at differansen D er positiv. Hvis n˚a TT er større enn Tα eller Tα/2 (ensidig<br />
eller tosidig for gitt signifikansniv˚a α) har vi p˚avist en forskjell.
2 Modeller 4<br />
2 Modeller<br />
2.1 Enveis ANOVA<br />
For ˚a teste om 3 eller flere normalfordelte populasjoner er forskjellige, og hvilke av<br />
populasjonen som er forskjellige.<br />
Det behøver ikke være like mange prøver/gjentak fra hver populasjon.<br />
Populasjonene er A, B, C, ...<br />
XA, XB, XC, ... tallobservasjonene i utvalgene<br />
NA, NB, NC, ... antall observasjoner i utvalgene<br />
N = NA + NB + NC + . . . er det totale antall observasjoner i materialet som testes.<br />
NP er antall populasjoner som testes.<br />
Framgangsm˚ate<br />
1. Gjennomsnittet for hvert utvalg er XA = XA/NA (tilsvarende for B, C etc).<br />
2. Frihetsgradene for hvert utvalg er DFA = NA − 1 (tilsvarende for B, C etc).<br />
3. Korreksjonsleddet for hele materialet er CT = N · X 2 = ( X) 2 /N.<br />
Her er X = XA + XB + XC + . . .<br />
4. Sett opp variansanalysen etter følgende formler :<br />
Kilde<br />
Faktor NP − 1<br />
Frihetsgrader Kvadratsum M.kv.sum Testobs.<br />
DF SS MS FT<br />
( XA) 2 /NA + ( XB) 2 /NB<br />
+( XC) 2 /NC + . . . − CT<br />
Feil DFA + DFB + DFC + . . . SS Total − SS Faktor<br />
Total NA + NB + NC + . . . − 1<br />
Her er X 2 = X 2 A + X 2 B + X 2 C<br />
+ . . ..<br />
X 2 − CT<br />
SS Faktor<br />
DFFaktor SSFeil DFFeil 5. Dersom testobservator FT er større enn kritisk verdi Fα i F -tabellen er det signifikant<br />
forskjell mellom to eller flere av populasjonene, med det signifikansniv˚aet α<br />
man velger. (DF Teller →, DF Nevner ↓)<br />
6. Test p˚a forskjell mellom bare to av utvalgene, for eksempel utvalgene A og B,<br />
blir som beskrevet foran (Uparet T -test). Blandet varians blir s 2 P = MS Feil og<br />
utvalgsstørrelsene blir NA og NB (hvis vi sammenlikner populasjonene A og B).<br />
MS Faktor<br />
MS Feil
2 Modeller 5<br />
2.2 Enveis ANOVA med like store gjentak<br />
Antall gjentak er a, og i er nummer av gjentak. Det er ingen systematisk innbyrdes<br />
forskjell mellom gjentakene. NB! Gjentakene f˚ar ingen egen linje i variansanalysen under !<br />
Variabel B er forsøksfaktoren og kan være sorter, gjødselmengder, bakterietyper,<br />
konsentrasjoner, lysstyrker eller ...<br />
Indeksen j er nummer av B, b = antall av B.<br />
Variansanalysen : CT = X 2 ••/(a · b)<br />
Kilde<br />
Frihetsgrader Kvadratsum Middelkvadrat Testobs.<br />
DF SS MS FT<br />
B b − 1<br />
<br />
j X2 •j<br />
− CT MSB =<br />
a<br />
SSB<br />
DFB<br />
Feil b · (a − 1) SS Total − SSB MS Feil = SS Feil<br />
DF Feil<br />
Total (a · b) − 1 <br />
i,j X2 ij − CT<br />
MSB<br />
MS Feil<br />
Hvis FT er større enn Fα i F -tabellen er det signifikant forskjell mellom to eller flere<br />
trinn av variabel B, med valgt signifikansniv˚ae α. (DF Teller →, DF Nevner ↓)<br />
Se ellers under Detaljanalyse.
2 Modeller 6<br />
2.3 Toveis ANOVA<br />
Blokkforsøk med 1 variabel i tillegg til blokk.<br />
Antall blokker er a og i er nummer av blokk. (Blokk er gjentak med en antatt<br />
systematisk innbyrdes forskjell som f.eks. jordstykker etter hverandre i en helling, griser<br />
fra et kull er en blokk og griser fra et annet kull er en annen blokk osv.)<br />
Variabel B = Sorter, gjødselmengder, bakterietyper, konsentrasjoner, lysstyrker etc.<br />
Indeksen j er nummer av sort og b = antall av B.<br />
Variansanalysen : CT = X 2 ••/(a · b)<br />
Kilde<br />
Frihetsgrader Kvadratsum Middelkvadrat Testobs.<br />
DF SS MS FT<br />
Blokk a − 1<br />
B b − 1<br />
<br />
i X2 i•<br />
b<br />
− CT MS Blokk = SS Blokk<br />
DF Blokk<br />
<br />
j X2 •j<br />
− CT MSB =<br />
a<br />
SSB<br />
DFB<br />
Feil (a − 1) · (b − 1) SSTotal − SSBlokk − SSB MSFeil = SS <br />
i,j<br />
Feil<br />
DFFeil X2 ij − CT<br />
Total (a · b) − 1<br />
MS Blokk<br />
MS Feil<br />
MSB<br />
MS Feil<br />
Hvis FT er større enn Fα i F -tabellen er det signifikant forskjell mellom to eller flere<br />
trinn av variabel B, med valgt signifikansniv˚ae α. (DF Teller →, DF Nevner ↓)<br />
Se ellers under Detaljanalyse.
2 Modeller 7<br />
2.4 Treveis ANOVA<br />
Faktorielt blokkforsøk med 2 variabler i tillegg til blokk. Variabel B og C kombineres i<br />
hvert ledd – for eksempel i hver forsøksrute eller p˚a hvert forsøksdyr.<br />
• Antall blokker er a, i nummer av blokk.<br />
• Variabel B, j = nummer av B, b = antall av B<br />
• Variabel C, k = nummer av C, c = antall av C.<br />
CT = X 2 •••/(a · b · c)<br />
Kilde<br />
Blokk a − 1<br />
B b − 1<br />
C c − 1<br />
Samspill B ∗ C (b − 1)(c − 1)<br />
Frihetsgrader Kvadratsum Middelkvadrat Testobs.<br />
DF SS MS FT<br />
Feil (a − 1) · (bc − 1)<br />
Total (a · b · c) − 1<br />
<br />
i X2 i••<br />
b · c − CT MS Blokk = SS Blokk<br />
<br />
j X2 •j•<br />
DF Blokk<br />
a · c − CT MSB = SSB<br />
DFB<br />
<br />
k X2 ••k<br />
a · b − CT MSC = SSC<br />
DFC<br />
<br />
j,k X2 •jk<br />
− CT<br />
a<br />
−SSB − SSC<br />
SS Total − SS Blokk − SSB<br />
−SSC − SSB∗C<br />
− CT<br />
<br />
i,j,k X2 ijk<br />
MSB∗C = SSB∗C<br />
DFB∗C<br />
MS Feil = SS Feil<br />
DF Feil<br />
Hvis testobservatoren FB∗C ikke viser samspill kan hovedeffektene B og C testes. For<br />
disse faktorene kan det beregnes LSD med standardfeil<br />
<br />
SEB = MSFeil · 2<br />
a · c og SEC<br />
<br />
= MSFeil · 2<br />
a · b .<br />
for de to variablene.<br />
Hvis testobservatoren FB∗C viser samspill kan det beregnes LSD for ulike kombinasjoner<br />
av B og C med standardfeil<br />
<br />
SEB∗C = MSFeil · 2<br />
a .<br />
For kontraster m˚a teller under rottegnet tilpasses situasjonen (se Detaljanalyse).<br />
MS Blokk<br />
MS Feil<br />
MSB<br />
MS Feil<br />
MSC<br />
MS Feil<br />
MSB∗C<br />
MS Feil
2 Modeller 8<br />
2.5 Faktorielt gjentaksforsøk med 2 variabler uten blokking<br />
Variabel B og C kombineres i hvert ledd – for eksempel i hver forsøksrute eller p˚a hvert<br />
forsøksdyr.<br />
• Antall gjentak er a, i er nummer av gjentak.<br />
• Variabel B, j = nummer av B, b = antall av B<br />
• Variabel C, k = nummer av C, c = antall av C.<br />
CT = X 2 •••/(a · b · c)<br />
Kilde<br />
B b − 1<br />
C c − 1<br />
Frihetsgrader Kvadratsum Middelkvadrat Testobs.<br />
DF SS MS FT<br />
<br />
j X2 •j•<br />
a · c − CT MSB = SSB<br />
DFB<br />
<br />
k X2 ••k<br />
a · b − CT MSC = SSC<br />
DFC<br />
<br />
j,k X2 •jk<br />
− CT<br />
Samspill B ∗ C (b − 1)(c − 1) a<br />
−SSB − SSC<br />
SSTotal − SSB<br />
Feil (a − 1) · b · c<br />
−SSC − SSB∗C<br />
Total (a · b · c) − 1 <br />
i,j,k X2 ijk − CT<br />
MSB∗C = SSB∗C<br />
DFB∗C<br />
MS Feil = SS Feil<br />
DF Feil<br />
MSB<br />
MS Feil<br />
MSC<br />
MS Feil<br />
MSB∗C<br />
MS Feil<br />
Hvis testobservatoren FB∗C ikke viser samspill kan hovedeffektene B og C testes. For<br />
disse faktorene kan det beregnes LSD med standardfeil<br />
<br />
SEB = MSFeil · 2<br />
a · c og SEC<br />
<br />
= MSFeil · 2<br />
a · b .<br />
for de to variablene.<br />
Hvis testobservatoren FB∗C viser samspill kan det beregnes LSD for ulike kombinasjoner<br />
av B og C med standardfeil<br />
<br />
SEB∗C = MSFeil · 2<br />
a .<br />
For kontraster m˚a teller under rottegnet tilpasses situasjonen (se Detaljanalyse).
2 Modeller 9<br />
2.6 Split-plot blokkforsøk med 2 variabler i tillegg til blokk<br />
Antall blokker er a, i = nummer av blokk.<br />
Variabel B = storrutefaktor, j = nummer av B og b = antall av B.<br />
Variabel C = sm˚arutefaktor, k = nummer av C og c = antall av C.<br />
Variansanalysen : CT = X 2 •••/(a · b · c)<br />
Frihetsgrader Kvadratsum Middelkvadrat Testobs.<br />
Kilde<br />
DF SS MS FT<br />
<br />
Blokk a − 1<br />
i X2 i••/(b · c) − CT SSBlokk/DFBlokk MSBlokk/MSFeil <br />
B b − 1<br />
j X2 •j•/(a · c) − CT SSB/DFB MSB/MSBlokk∗B Blokk∗B (a − 1)(b − 1)<br />
C c − 1<br />
B ∗ C (b − 1)(c − 1)<br />
<br />
i,j X2 ij•/c − CT<br />
−SS Blokk − SSB<br />
SS Blokk∗B/DF Blokk∗B<br />
MS Blokk∗B/MS Feil<br />
<br />
k X2 ••k /(a · b) − CT SSC/DFC MSC/MS Feil<br />
<br />
j,k X2 •jk<br />
/a − CT<br />
−SSB − SSC<br />
SS Total − SS Blokk − SSB<br />
Feil (a − 1) · b · (c − 1) −SSBlokk∗B − SSC − SSB∗C<br />
Total (a · b · c) − 1<br />
<br />
i,j,k X2 ijk − CT<br />
SSB∗C/DFB∗C<br />
SS Feil/DF Feil<br />
Hvis det ikke er samspill mellom faktorene B og C kan storrutefaktoren B testes<br />
med<br />
FB = MSB<br />
.<br />
MSBlokk∗B Sm˚arutefaktoren C testes p˚a vanlig m˚ate ved<br />
FC = MSC<br />
.<br />
MSFeil Ved beregning av LSD for hovedeffektene blir standardfeilene<br />
<br />
SEB = MSBlokk∗B · 2<br />
a · c og SEC<br />
<br />
= MSFeil · 2<br />
a · b<br />
for storrutefaktoren B og for sm˚arutefaktoren C<br />
Ved samspill kan man teste forskjellige kombinasjoner av B og C. Standardfeilen for<br />
LSD blir da<br />
<br />
SEB∗C = MSFeil · 2<br />
a .<br />
For kontraster m˚a teller under rottegnet tilpasses situasjonen (se Detaljanalyse).<br />
MSB∗C/MS Feil
2 Modeller 10<br />
2.7 Split-plot gjentaksforsøk med 2 variabler (uten blokking)<br />
Antall gjentak er a, i = nummer av gjentak.<br />
Variabel B = storrutefaktor, j = nummer av B og b = antall av B.<br />
Variabel C = sm˚arutefaktor, k = nummer av C og c = antall av C.<br />
Variansanalysen : CT = X 2 •••/(a · b · c)<br />
Frihetsgrader Kvadratsum Middelkvadrat Testobs.<br />
Kilde<br />
DF SS MS FT<br />
<br />
B b − 1<br />
j X2 •j•/(a · c) − CT SSB/DFB MSB/MSBlokk∗B <br />
Blokk∗B (a − 1) · b<br />
<br />
C c − 1<br />
k X2 ••k /(a · b) − CT SSC/DFC MSC/MSFeil B ∗ C (b − 1)(c − 1)<br />
i,j X2 ij•/c − CT − SSB SS Blokk∗B/DF Blokk∗B MS Blokk∗B/MS Feil<br />
<br />
j,k X2 •jk<br />
/a − CT<br />
−SSB − SSC<br />
SSTotal − SSB<br />
Feil (a − 1) · b · (c − 1)<br />
−SSBlokk∗B − SSC − SSB∗C<br />
Total (a · b · c) − 1<br />
<br />
i,j,k X2 ijk − CT<br />
SSB∗C/DFB∗C<br />
SS Feil/DF Feil<br />
Hvis det ikke er samspill mellom faktorene B og C kan storrutefaktoren B testes<br />
med<br />
FB = MSB<br />
.<br />
MSBlokk∗B Sm˚arutefaktoren C testes p˚a vanlig m˚ate ved<br />
FC = MSC<br />
.<br />
MSFeil Ved beregning av LSD for hovedeffektene blir standardfeilene<br />
<br />
SEB = MSBlokk∗B · 2<br />
a · c og SEC<br />
<br />
= MSFeil · 2<br />
a · b<br />
for storrutefaktoren B og for sm˚arutefaktoren C<br />
Ved samspill kan man teste forskjellige kombinasjoner av B og C. Standardfeilen for<br />
LSD blir da<br />
<br />
SEB∗C = MSFeil · 2<br />
a .<br />
For kontraster m˚a teller under rottegnet tilpasses situasjonen (se Detaljanalyse).<br />
MSB∗C/MS Feil
3 Detaljanalyse 11<br />
3 Detaljanalyse<br />
3.1 Diagram<br />
For kvantitativ forsøksfaktor med 3 eller flere trinn er det greit ˚a tegne en responskurve.<br />
En kvalitativ forsøksfaktor kan tegnes som søyledigram.<br />
3.2 Parvis sammenlikning<br />
Parvis sammenlikning av to ledd blir som beskrevet under Uparet T -test. Blandet<br />
varians blir MS Feil med frihetsgrader DF Feil.<br />
3.3 LSD<br />
Hvis det er aktuelt med mere enn en sammenlikning er det vanlig ˚a beregne LSD for et<br />
gitt signifikansniv˚a α.<br />
Standardfeilen SE er<br />
<br />
SE = MSFeil · 2<br />
n<br />
der n er antall observasjoner i gjennomsnittsverdiene som sammenliknes. For eksempel<br />
blir n = a (a er antall gjentak/blokker) i enveis og toveis ANOVA. Frihetsgradene blir<br />
DF Feil. N˚a blir<br />
LSD = T DFFeil<br />
α/2 · SE<br />
De differansene mellom gjennomsnittsverdier som er større enn LSD er signifikant forskjellige<br />
p˚a niv˚a α.<br />
3.4 Lineær kontrast<br />
For en kvalitativ forsøksfaktor med for eksempel 4 trinn (trinn nummer 1, 2, 3 og 4) er<br />
en (av flere mulige) lineær kontrast L gitt ved<br />
L = h1X1 + h2X2 + h3X3 + h4X4 der h1 + h2 + h3 + h4 = 0 .<br />
Testobservator for denne forskjellen blir<br />
TL = L<br />
<br />
<br />
<br />
med standardfeil SE =<br />
SE<br />
MSFeil<br />
h 2 1 + h 2 2 + h 2 3 + h 2 4<br />
der n er antall observasjoner i gjennomsnittsverdiene som sammenliknes. Frihetsgradene<br />
blir DF Feil. For et gitt signifikansniv˚a α sammenliknes testobservator med kritisk verdi<br />
T DFFeil<br />
α/2<br />
n
4 Korrelasjon og regresjon 12<br />
4 Korrelasjon og regresjon<br />
4.1 Korrelasjon og regresjon: Enkle lineære sammenhenger<br />
Ofte er det interessant ˚a knytte to størrelser sammen for ˚a se hvordan den ene avhenger<br />
av den andre. For eksempel vil avling avhenge av gjødsling, en aktivitet (hos dyr eller<br />
planter) kan avhenge av temperatur, oppslutning om et politisk parti kan endre seg over<br />
tid. Slike sammenhenger kan analyseres ved hjelp av lineær regresjon. Uavhengig variabel<br />
kalles X (gjødsling, temperatur, tid) og responsvariabel eller avhengig variabel<br />
(avling, aktivitet, oppslutning) kalles Y .<br />
Korrelasjonskoeffisienten R har alltid en verdi mellom -1 og +1. Hvis absoluttverdien<br />
er nær 1 kan vi slutte at det er god lineær sammenheng. N˚ar den er nær 0 er<br />
sammenhengen d˚arlig. Mer presist kan vi si at for 0.7 < |R| ≤ 1 er den lineære sammenhengen<br />
god. Ellers er den d˚arlig til fraværende. Men vi kan ikke stole blindt p˚a R. Ogs˚a<br />
for krumlinjete sammenhenger vil R kunne f˚a verdi nær ±1. Determinasjonskoeffisienten<br />
R 2 uttrykker hvor stor del av endringen i Y som skyldes endring i X.<br />
Sammenhengen mellom variablene X og Y er gitt ved regresjonslinjen :<br />
ˆY = ˆα + ˆ βX<br />
der ˆ β er stigningstallet eller regresjonskoeffisienten og ˆα er konstantleddet (skjæringen<br />
med Y -aksen).<br />
For˚a beregne R, ˆ β og ˆα i et utvalg med n par av observasjoner trenger vi gjennomsnitt<br />
og kvadratsummer til X og Y :<br />
N˚a blir<br />
X = ( X)/n Y = ( Y )/n<br />
SSX = X 2 − ( X) 2 /n SSY = Y 2 − ( Y ) 2 /n<br />
SSXY = X · Y − ( X) ( Y ) /n<br />
R =<br />
SSXY<br />
√ SSX · SSY<br />
,<br />
ˆ β = SSXY<br />
SSX<br />
Eksempel p˚a oppsett for grunnlagsberegningene :<br />
X Y X 2 XY Y 2<br />
obs.1 2 5 4 10 25<br />
obs.2 3 4 9 12 16<br />
obs.3 4 3 16 12 9<br />
Sum 9 12 29 34 50<br />
Middel (n = 3) 3 4<br />
og ˆα = Y − ˆ β · X
4 Korrelasjon og regresjon 13<br />
4.2 Testing av regresjon<br />
For ˚a analysere regresjonslinjen trenger vi standardfeilen for regresjonen gitt ved<br />
<br />
(1 − R<br />
SE =<br />
2 )SSY<br />
n − 2<br />
N˚a blir et (1 − α) · 100%-konfidensintervall for regresjonskoeffisienten β<br />
β = ˆ β ± T n−2<br />
α/2<br />
SE<br />
√ .<br />
SSX<br />
Hvis 0 ligger inne i intervallet er det ingen sammenheng mellom X og Y .<br />
Et (1 − α) · 100%-konfidensintervall for hele regresjonslinjen blir<br />
α + βX = (ˆα + ˆ βX) ± T n−2<br />
α/2<br />
· SE ·<br />
<br />
1 (X − X)2<br />
+<br />
n SSX<br />
Et (1 − α) · 100%-prediksjonsintervall for en enkeltobservasjon blir<br />
α + βX = (ˆα + ˆ βX) ± T n−2<br />
<br />
α/2 · SE · 1 + 1 (X − X)2<br />
+<br />
n SSX
5 Tabeller 14<br />
5 Tabeller<br />
5.1 Students T -fordeling<br />
α → α →<br />
DF 0,1 0,05 0,025 0,01 0,005 DF 0,1 0,05 0,025 0,01 0,005<br />
1 3,078 6,314 12,71 31,82 63,66 21 1,323 1,721 2,080 2,518 2,831<br />
2 1,886 2,920 4,303 6,965 9,925 22 1,321 1,717 2,074 2,508 2,819<br />
3 1,638 2,353 3,182 4,541 5,841 23 1,319 1,714 2,069 2,500 2,807<br />
4 1,533 2,132 2,776 3,747 4,604 24 1,318 1,711 2,064 2,492 2,797<br />
5 1,476 2,015 2,571 3,365 4,032 25 1,316 1,708 2,060 2,485 2,787<br />
6 1,440 1,943 2,447 3,143 3,707 26 1,315 1,706 2,056 2,479 2,779<br />
7 1,415 1,895 2,365 2,998 3,499 27 1,314 1,703 2,052 2,473 2,771<br />
8 1,397 1,860 2,306 2,896 3,355 28 1,313 1,701 2,048 2,467 2,763<br />
9 1,383 1,833 2,262 2,821 3,250 29 1,311 1,699 2,045 2,462 2,756<br />
10 1,372 1,812 2,228 2,764 3,169 30 1,310 1,697 2,042 2,457 2,750<br />
11 1,363 1,796 2,201 2,718 3,106 40 1,303 1,684 2,021 2,423 2,704<br />
12 1,356 1,782 2,179 2,681 3,055 50 1,299 1,676 2,009 2,403 2,678<br />
13 1,350 1,771 2,160 2,650 3,012 60 1,296 1,671 2,000 2,390 2,660<br />
14 1,345 1,761 2,145 2,624 2,977 80 1,292 1,664 1,990 2,374 2,639<br />
15 1,341 1,753 2,131 2,602 2,947 100 1,290 1,660 1,984 2,364 2,626<br />
16 1,337 1,746 2,120 2,583 2,921 200 1,286 1,653 1,972 2,345 2,601<br />
17 1,333 1,740 2,110 2,567 2,898 500 1,283 1,648 1,965 2,334 2,586<br />
18 1,330 1,734 2,101 2,552 2,878 1000 1,282 1,646 1,962 2,330 2,581<br />
19 1,328 1,729 2,093 2,539 2,861 ∞ 1,282 1,645 1,960 2,326 2,576<br />
20 1,325 1,725 2,086 2,528 2,845<br />
5.2 Fischers F -fordeling<br />
Frihetsgrader for teller<br />
α DF 1 2 3 4 5 6 8 10 20 30 50 100 200 ∞<br />
0,05 2 18,5 19,0 19,2 19,3 19,3 19,3 19,4 19,4 19,5 19,5 19,5 19,5 19,5 19,5<br />
0,01 98,5 99,0 99,2 99,3 99,3 99,3 99,4 99,4 99,5 99,5 99,5 99,5 99,5 99,5<br />
0,001 998 998 999 999 999 999 999 999 999 999 999 999 999 999<br />
0,05 3 10,13 9,55 9,28 9,12 9,01 8,94 8,85 8,79 8,66 8,62 8,58 8,55 8,54 8,53<br />
0,01 34,1 30,8 29,5 28,7 28,2 27,9 27,5 27,2 26,7 26,5 26,4 26,2 26,2 26,1<br />
0,001 167 148 141 137 135 133 131 129 126 125 125 124 124 123<br />
0,05 4 7,71 6,94 6,59 6,39 6,26 6,16 6,04 5,96 5,80 5,75 5,70 5,66 5,65 5,63<br />
0,01 21,2 18,0 16,7 16,0 15,5 15,2 14,8 14,6 14,0 13,8 13,7 13,6 13,5 13,5<br />
0,001 74,1 61,3 56,2 53,4 51,7 50,5 49,0 48,1 46,1 45,4 44,9 44,5 44,3 44,0<br />
0,05 5 6,61 5,79 5,41 5,19 5,05 4,95 4,82 4,74 4,56 4,50 4,44 4,41 4,39 4,37<br />
0,01 16,3 13,3 12,1 11,4 11,0 10,7 10,3 10,1 9,55 9,38 9,24 9,13 9,08 9,02<br />
0,001 47,1 37,1 33,2 31,1 29,8 28,8 27,7 26,9 25,4 24,9 24,4 24,1 24,0 23,8
5 Tabeller 15<br />
Frihetsgrader for teller<br />
α DF 1 2 3 4 5 6 8 10 20 30 50 100 200 ∞<br />
0,05 6 5,99 5,14 4,76 4,53 4,39 4,28 4,15 4,06 3,87 3,81 3,75 3,71 3,69 3,67<br />
0,01 13,8 11,0 9,78 9,15 8,75 8,47 8,10 7,87 7,40 7,23 7,09 6,99 6,93 6,88<br />
0,001 35,5 27,0 23,7 21,9 20,8 20,0 19,0 18,4 17,1 16,7 16,3 16,0 15,9 15,8<br />
0,05 7 5,59 4,74 4,35 4,12 3,97 3,87 3,73 3,64 3,44 3,38 3,32 3,27 3,25 3,23<br />
0,01 12,3 9,55 8,45 7,85 7,46 7,19 6,84 6,62 6,16 5,99 5,86 5,75 5,70 5,65<br />
0,001 29,3 21,7 18,8 17,2 16,2 15,5 14,6 14,1 12,9 12,5 12,2 12,0 11,8 11,7<br />
0,05 8 5,32 4,46 4,07 3,84 3,69 3,58 3,44 3,35 3,15 3,08 3,02 2,97 2,95 2,93<br />
0,01 11,3 8,65 7,59 7,01 6,63 6,37 6,03 5,81 5,36 5,20 5,07 4,96 4,91 4,86<br />
0,001 25,4 18,5 15,8 14,4 13,5 12,9 12,1 11,5 10,5 10,1 9,80 9,57 9,45 9,33<br />
0,05 9 5,12 4,26 3,86 3,63 3,48 3,37 3,23 3,14 2,94 2,86 2,80 2,76 2,73 2,71<br />
0,01 10,6 8,02 6,99 6,42 6,06 5,80 5,47 5,26 4,81 4,65 4,52 4,41 4,36 4,31<br />
0,001 22,9 16,4 13,9 12,6 11,7 11,1 10,4 9,89 8,90 8,55 8,26 8,04 7,93 7,81<br />
0,05 10 4,96 4,10 3,71 3,48 3,33 3,22 3,07 2,98 2,77 2,70 2,64 2,59 2,56 2,54<br />
0,01 10,0 7,56 6,55 5,99 5,64 5,39 5,06 4,85 4,41 4,25 4,12 4,01 3,96 3,91<br />
0,001 21,0 14,9 12,6 11,3 10,5 9,93 9,20 8,75 7,80 7,47 7,19 6,98 6,87 6,76<br />
0,05 12 4,75 3,89 3,49 3,26 3,11 3,00 2,85 2,75 2,54 2,47 2,40 2,35 2,32 2,30<br />
0,01 9,33 6,93 5,95 5,41 5,06 4,82 4,50 4,30 3,86 3,70 3,57 3,47 3,41 3,36<br />
0,001 18,6 13,0 10,8 9,63 8,89 8,38 7,71 7,29 6,40 6,09 5,83 5,63 5,52 5,42<br />
0,05 14 4,60 3,74 3,34 3,11 2,96 2,85 2,70 2,60 2,39 2,31 2,24 2,19 2,16 2,13<br />
0,01 8,86 6,51 5,56 5,04 4,69 4,46 4,14 3,94 3,51 3,35 3,22 3,11 3,06 3,00<br />
0,001 17,1 11,8 9,73 8,62 7,92 7,44 6,80 6,40 5,56 5,25 5,00 4,81 4,71 4,60<br />
0,05 16 4,49 3,63 3,24 3,01 2,85 2,74 2,59 2,49 2,28 2,19 2,12 2,07 2,04 2,01<br />
0,01 8,53 6,23 5,29 4,77 4,44 4,20 3,89 3,69 3,26 3,10 2,97 2,86 2,81 2,75<br />
0,001 16,1 11,0 9,01 7,94 7,27 6,80 6,20 5,81 4,99 4,70 4,45 4,26 4,16 4,06<br />
0,05 20 4,35 3,49 3,10 2,87 2,71 2,60 2,45 2,35 2,12 2,04 1,97 1,91 1,88 1,84<br />
0,01 8,10 5,85 4,94 4,43 4,10 3,87 3,56 3,37 2,94 2,78 2,64 2,54 2,48 2,42<br />
0,001 14,8 9,95 8,10 7,10 6,46 6,02 5,44 5,08 4,29 4,00 3,77 3,58 3,48 3,38<br />
0,05 30 4,17 3,32 2,92 2,69 2,53 2,42 2,27 2,16 1,93 1,84 1,76 1,70 1,66 1,62<br />
0,01 7,56 5,39 4,51 4,02 3,70 3,47 3,17 2,98 2,55 2,39 2,25 2,13 2,07 2,01<br />
0,001 13,3 8,77 7,05 6,12 5,53 5,12 4,58 4,24 3,49 3,22 2,98 2,79 2,69 2,59<br />
0,05 40 4,08 3,23 2,84 2,61 2,45 2,34 2,18 2,08 1,84 1,74 1,66 1,59 1,55 1,51<br />
0,01 7,31 5,18 4,31 3,83 3,51 3,29 2,99 2,80 2,37 2,20 2,06 1,94 1,87 1,80<br />
0,001 12,6 8,25 6,59 5,70 5,13 4,73 4,21 3,87 3,15 2,87 2,64 2,44 2,34 2,23<br />
0,05 60 4,00 3,15 2,76 2,53 2,37 2,25 2,10 1,99 1,75 1,65 1,56 1,48 1,44 1,39<br />
0,01 7,08 4,98 4,13 3,65 3,34 3,12 2,82 2,63 2,20 2,03 1,88 1,75 1,68 1,60<br />
0,001 12,0 7,77 6,17 5,31 4,76 4,37 3,86 3,54 2,83 2,55 2,32 2,12 2,01 1,89<br />
0,05 120 3,92 3,07 2,68 2,45 2,29 2,18 2,02 1,91 1,66 1,55 1,46 1,37 1,32 1,25<br />
0,01 6,85 4,79 3,95 3,48 3,17 2,96 2,66 2,47 2,03 1,86 1,70 1,56 1,48 1,38<br />
0,001 11,4 7,32 5,78 4,95 4,42 4,04 3,55 3,24 2,53 2,26 2,02 1,81 1,68 1,54<br />
0,05 ∞ 3,84 3,00 2,60 2,37 2,21 2,10 1,94 1,83 1,57 1,46 1,35 1,24 1,17 1,01<br />
0,01 6,64 4,61 3,78 3,32 3,02 2,80 2,51 2,32 1,88 1,70 1,52 1,36 1,25 1,01<br />
0,001 10,8 6,91 5,42 4,62 4,10 3,74 3,27 2,96 2,27 1,99 1,73 1,49 1,34 1,00
6 Nøkkel for modell 16<br />
6 Nøkkel for˚a finne riktig modell i kurset førsøksmetodikk<br />
1 variabel<br />
– Hvor mange ledd/niv˚aer/trinn har variabelen ?<br />
∗ 2 ledd : uparet eller paret T -test<br />
∗ 3 eller flere ledd<br />
· Ulikt antall observasjoner/gjentak : 1-veis ANOVA<br />
· Likt antall observasjoner/gjentak<br />
Gjentaksforsøk : 1-veis ANOVA med like mange gjentak<br />
Blokkforsøk : 2-veis ANOVA<br />
2 variabler p˚a samme niv˚a (ikke storruter og sm˚aruter)<br />
– Blokk : faktorielt blokkforsøk med 2 variabler (3-veis ANOVA)<br />
– Gjentak : faktorielt gjentaksforsøk med 2 variabler<br />
2 variabler der den ene er p˚a storruter og den andre p˚a sm˚aruter<br />
– Blokk : split-plot blokkforsøk med 2 variabler<br />
– Gjentak : split-plot gjentaksforsøk med 2 variabler<br />
1 variabel<br />
Blokkforsøk Gjentaksforsøk<br />
Blokkforsøk med 1 variabel Gjentaksforsøk med 1 variabel<br />
(2-veis ANOVA) (1-veis ANOVA)<br />
Faktorielt Split-plot Faktorielt Split-plot<br />
2 variabler blokkforsøk blokkforsøk gjentaksforsøk gjentaksforsøk<br />
med 2 variabler med 2 variabler med 2 variabler med 2 variabler<br />
(3-veis ANOVA)
7 Indekser brukt i formelsamlingen 17<br />
7 Indekser ijk brukt i formelsamlingen<br />
Eksempel : 2 faktorer (3 blokker og 4 ledd)<br />
• Xij betyr en enkeltobservasjon<br />
• Xi• betyr summen av observasjoner i en blokk<br />
Eksempel : X2• = X21 + X22 + X23 + X24<br />
• X•j betyr summen av observasjoner for hvert ledd<br />
Eksempel : X•3 = X13 + X23 + X33<br />
• X•• betyr summen av alle observasjoner<br />
Eksempel : X•• = X11 + X12 + . . . + X34<br />
• X 2 •• betyr kvadratet av summen av alle observasjoner<br />
Eksempel : X 2 •• = (X11 + X12 + . . . + X34) 2<br />
i = 1 i = 2 i = 3 X•j<br />
j = 1 X11 X21 X31 X•1<br />
j = 2 X12 X22 X32 X•2<br />
j = 3 X13 X23 X33 X•3<br />
j = 4 X14 X24 X34 X•4<br />
Xi• X1• X2• X3•<br />
• X 2 ij betyr summen av kvadatene av hver observasjon<br />
Eksempel : X 2 ij = X 2 11 + X 2 12 + . . . + X 2 34<br />
• X 2 i• betyr summen av kvadratene av summene i hver blokk<br />
Eksempel : X 2 i• = (X11 + X12 + X13 + X14) 2 + (X21 + X22 + X23 + X24) 2 + (X31 +<br />
X32 + X33 + X34) 2<br />
• X 2 •j betyr summen av kvadratene av summene for hvert ledd<br />
Eksempel : X 2 •j = (X11 + X21 + X31) 2 + (X12 + X22 + X32) 2 + (X13 + X23 +<br />
X33) 2 + (X14 + X24 + X34) 2<br />
N˚ar det er snakk om blokk + 2 faktorer utvides kodesystemet til ˚a inkludere indeksen<br />
k for den andre faktoren i en treveistabell.