Prognosemetoder – en oversikt - Telenor
Prognosemetoder – en oversikt - Telenor
Prognosemetoder – en oversikt - Telenor
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
36<br />
samme som observasjon<strong>en</strong> i forrige<br />
kvartal pluss støyleddet. Vi får da:<br />
yt = yt-4 + et Figur 7.23 viser autokorrelasjonsfunksjon<strong>en</strong><br />
til støyledd<strong>en</strong>e i d<strong>en</strong>ne <strong>en</strong>kle<br />
sesongmodell<strong>en</strong>.<br />
Vi ser nå at de sterke sesongmessige<br />
autokorrelasjon<strong>en</strong>e er fjernet. I tillegg ser<br />
vi at usikkerhetsgr<strong>en</strong>s<strong>en</strong>e har avtatt fordi<br />
vi har fjernet <strong>en</strong> del autokorrelasjon i<br />
støyledd<strong>en</strong>e.<br />
Det er fullt mulig å arbeide videre for å<br />
finne <strong>en</strong> <strong>en</strong>da bedre modell. Dermed vil<br />
krav<strong>en</strong>e til støyledd<strong>en</strong>e tilfredsstilles ytterligere.<br />
Under modellbygging<strong>en</strong> kan det være<br />
h<strong>en</strong>siktsmessig å differ<strong>en</strong>siere tidsrekk<strong>en</strong><br />
på sesong slik som vist her. Det kan også<br />
være h<strong>en</strong>siktsmessig å differ<strong>en</strong>siere i<br />
avstand 1. Det vil si:<br />
yt = yt-1 + et For øvrig bør det tas med parametere i<br />
modell<strong>en</strong> som gjør tilpasning<strong>en</strong> til de<br />
aktuelle observasjon<strong>en</strong>e <strong>en</strong>da bedre.<br />
Autokorrelasjonsfunksjon<strong>en</strong> til støyledd<strong>en</strong>e<br />
<strong>–</strong> d<strong>en</strong> variasjon<strong>en</strong> som er tilbake <strong>–</strong><br />
skal da i utgangspunktet illustrere tilfeldig<br />
støy.<br />
8 Regresjonsmodeller<br />
I de komm<strong>en</strong>de kapitl<strong>en</strong>e vil følg<strong>en</strong>de<br />
prognosemodeller bli omtalt:<br />
- Regresjonsmodeller<br />
- Metningsmodeller<br />
- Glattingsmodeller<br />
- Tidsrekkemodeller<br />
- Kalmanfiltermodeller.<br />
Det vil bli pekt på spesielle eg<strong>en</strong>skaper<br />
til de ulike modell<strong>en</strong>e, ut<strong>en</strong> at det gås ned<br />
på spesielt detaljert nivå.<br />
Regresjonsmodeller er <strong>en</strong> meget b<strong>en</strong>yttet<br />
type modeller som brukes til prognostisering.<br />
I mange tilfeller inkluderes det<br />
økonomiske variable i disse modell<strong>en</strong>e<br />
for å kunne modellere etterspørsel<strong>en</strong>. For<br />
næremere studier i regresjon h<strong>en</strong>vises det<br />
til [9], [14], [15], [16], [17] og [53].<br />
8.1 Enkel regresjon<br />
Det er vanlig å skille mellom <strong>en</strong>kel regresjonsmodell<br />
og multippel regresjonsmodell.<br />
I d<strong>en</strong> <strong>en</strong>kle regresjonsmodell<strong>en</strong> angis<br />
det <strong>en</strong> relasjon mellom to variable, m<strong>en</strong>s<br />
i d<strong>en</strong> multiple regresjonsmodell<strong>en</strong> angis<br />
det relasjoner mellom flere variable.<br />
La y være d<strong>en</strong> variable som det skal lages<br />
prognoser for. D<strong>en</strong> andre variable kan<br />
eksempelvis ha betegnels<strong>en</strong> t. Vi kaller<br />
gjerne variabel<strong>en</strong> t for forklaringsvariabel<strong>en</strong><br />
fordi det er d<strong>en</strong>ne variable som forklarer<br />
utvikling<strong>en</strong> av d<strong>en</strong> andre variabel<strong>en</strong><br />
y.<br />
For å konkretisere ser vi på et eksempel.<br />
I tabell 8.1 har vi angitt abonnem<strong>en</strong>tstetthet<strong>en</strong><br />
for telefon i Norge fra 1975<br />
til1989. Abonnem<strong>en</strong>tstetthet<strong>en</strong> er definert<br />
som antall abonnem<strong>en</strong>t pr. 100 innbyggere.<br />
Variabel<strong>en</strong> y står i tabell<strong>en</strong> for<br />
abonnem<strong>en</strong>tstetthet<strong>en</strong>, m<strong>en</strong>s variabel<strong>en</strong> t,<br />
som er tid<strong>en</strong> i tabell<strong>en</strong>, er forklaringsvariabel<strong>en</strong>.<br />
I dette tilfellet vil regresjonsmodell<strong>en</strong>,<br />
som angir samm<strong>en</strong>h<strong>en</strong>g<strong>en</strong> mellom utvikling<br />
i abonnem<strong>en</strong>tstetthet<strong>en</strong> og tid<strong>en</strong>,<br />
være gitt ved:<br />
y = a + bt + ε (8.1)<br />
der a og b er parametere i modell<strong>en</strong>, m<strong>en</strong>s<br />
e er støyleddet. Vanligvis brukes det<br />
greske bokstaver for parametr<strong>en</strong>e.<br />
I figur 8.1 er regresjonslinj<strong>en</strong> tegnet opp<br />
og de ulike verdi<strong>en</strong>e på abonnem<strong>en</strong>tstetthet<strong>en</strong><br />
som funksjon av tid<strong>en</strong>. Vinkel<strong>en</strong> på<br />
regresjonslinj<strong>en</strong> er d<strong>en</strong> estimerte verdi<strong>en</strong><br />
på b, m<strong>en</strong>s avstand<strong>en</strong> fra origo og opp til<br />
regresjonslinj<strong>en</strong> når tid<strong>en</strong> t = 0, er d<strong>en</strong><br />
estimerte verdi<strong>en</strong> på a. Hvordan blir så<br />
verdi<strong>en</strong>e på a og b beregnet eller estimert?<br />
Det gjøres ved <strong>en</strong> bergingsmetode som<br />
heter minste kvadraters metode. D<strong>en</strong>ne<br />
statistiske metod<strong>en</strong> bestemmer verdi<strong>en</strong><br />
på a og b slik at summ<strong>en</strong> av kvadratavstand<strong>en</strong><br />
fra punkt<strong>en</strong>e y til regresjonslinj<strong>en</strong><br />
blir minimert. Populært kan vi si at<br />
verdi<strong>en</strong> på a og b bestemmes slik at<br />
regresjonslinj<strong>en</strong> går på best mulig måte<br />
mellom punkt<strong>en</strong>e.<br />
D<strong>en</strong>ne regresjonslinj<strong>en</strong> blir da vår regresjonsmodell.<br />
Ved å forl<strong>en</strong>ge regresjonslinj<strong>en</strong><br />
lineært fra t = 15 og framover, får<br />
vi prognoser for abonnem<strong>en</strong>tstetthet<strong>en</strong>.<br />
I figur 8.1 ser vi også no<strong>en</strong> stiplede<br />
linjer. Det er konfid<strong>en</strong>sintervall eller<br />
usikkerhetsgr<strong>en</strong>ser. Disse intervall<strong>en</strong>e<br />
sier hvor sikker beregning<strong>en</strong> av parametr<strong>en</strong>e<br />
a og b er. I dette tilfellet ser vi at<br />
de estimerte verdi<strong>en</strong>e av parametr<strong>en</strong>e er<br />
svært gode fordi de angitte intervall<strong>en</strong>e<br />
gir lit<strong>en</strong> frihetsgrad til å <strong>en</strong>dre på vinkel<strong>en</strong><br />
på kurv<strong>en</strong> og høyd<strong>en</strong> på kurv<strong>en</strong><br />
inn<strong>en</strong> de intervaller som er satt opp. Forl<strong>en</strong>gelse<br />
av det ytterste intervallet som vi<br />
ser krummer noe, angir konfid<strong>en</strong>sintervallet<br />
for prognos<strong>en</strong>. Krumming<strong>en</strong> betyr<br />
at usikkerhet<strong>en</strong> i prognos<strong>en</strong>e øker som<br />
funksjon av tid<strong>en</strong>.<br />
I d<strong>en</strong> angitte regresjonsmodell er det <strong>en</strong><br />
lineær samm<strong>en</strong>h<strong>en</strong>g mellom y og forklaringsvariabel<strong>en</strong><br />
t. Det kan også t<strong>en</strong>kes helt<br />
andre samm<strong>en</strong>h<strong>en</strong>ger. Et eksempel er:<br />
y = a + bt + ε (8.2)<br />
Her vil vi ha <strong>en</strong> ekspon<strong>en</strong>tiell økning<br />
som funksjon av tid<strong>en</strong>. En slik utvikling<br />
kan være riktig over <strong>en</strong> periode, m<strong>en</strong> så<br />
vil stigningsgrad<strong>en</strong> etter hvert avta (da<br />
intet vokser inn i u<strong>en</strong>delig).<br />
8.2 Multippel regresjon<br />
I eksempl<strong>en</strong>e så langt har tid<strong>en</strong> t vært<br />
forklaringsvariabel<strong>en</strong>. I de fleste regresjonsmodeller<br />
vil vi ha suppler<strong>en</strong>de eller<br />
andre forklaringsvariable. Det som ubetinget<br />
er <strong>en</strong> fordel med å ha med tid<strong>en</strong><br />
som forklaringsvariabel, er at utvikling<strong>en</strong><br />
til tid<strong>en</strong> er helt deterministisk og ut<strong>en</strong><br />
usikkerhet. B<strong>en</strong>ytter vi andre forklaringsvariable,<br />
er det viktig å være klar over at<br />
når det skal lages prognoser, må det også<br />
lages prognoser for utvikling<strong>en</strong> av disse<br />
forklaringsvariable som da i seg selv vil<br />
være beheftet med usikkerhet. Dette<br />
induserer <strong>en</strong> ekstra usikkerhet i prognos<strong>en</strong>e.<br />
Eksempler på slike forklaringsvariable<br />
er pris for tj<strong>en</strong>est<strong>en</strong> og konsumprisindeks<strong>en</strong>.<br />
Som nevnt kalles regresjonsmodeller<br />
med flere forklaringsvariable for multiple<br />
regresjonsmodeller. Et eksempel på slike<br />
modeller er:<br />
y = a + bu + cv + dw + ε (8.3)<br />
Her er u, v og w tre forklaringsvariable og<br />
a, b, c og d parametr<strong>en</strong>e i d<strong>en</strong> multiple<br />
regresjonsmodell<strong>en</strong>. På samme måte som<br />
i d<strong>en</strong> <strong>en</strong>kle regresjonsmodell<strong>en</strong> skal nå<br />
parametr<strong>en</strong>e bestemmes på best mulig<br />
måte. Dermed brukes minste kvadraters<br />
metode som gir optimale verdier på parametr<strong>en</strong>e.<br />
I selve utvikling<strong>en</strong> av prognosemodell<strong>en</strong><br />
går mye av arbeidet med til å bestemme<br />
hvilke variable som bør tas med og<br />
hvilke variable som bør utelates fra modell<strong>en</strong>.<br />
I utvikling<strong>en</strong> b<strong>en</strong>yttes de samme<br />
prinsipp<strong>en</strong>e som i forrige kapittel. I tillegg<br />
b<strong>en</strong>yttes spesielle teknikker for<br />
regresjonsanalyse. D<strong>en</strong> multiple korrelasjonskoeffisi<strong>en</strong>t<br />
er viktig med h<strong>en</strong>syn til å<br />
samm<strong>en</strong>likne de ulike modell<strong>en</strong>e. D<strong>en</strong>ne<br />
størrels<strong>en</strong> beregner i hvor stor grad regresjonsmodell<strong>en</strong>e<br />
greier å forklare varia-