02.05.2013 Views

Prognosemetoder – en oversikt - Telenor

Prognosemetoder – en oversikt - Telenor

Prognosemetoder – en oversikt - Telenor

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

36<br />

samme som observasjon<strong>en</strong> i forrige<br />

kvartal pluss støyleddet. Vi får da:<br />

yt = yt-4 + et Figur 7.23 viser autokorrelasjonsfunksjon<strong>en</strong><br />

til støyledd<strong>en</strong>e i d<strong>en</strong>ne <strong>en</strong>kle<br />

sesongmodell<strong>en</strong>.<br />

Vi ser nå at de sterke sesongmessige<br />

autokorrelasjon<strong>en</strong>e er fjernet. I tillegg ser<br />

vi at usikkerhetsgr<strong>en</strong>s<strong>en</strong>e har avtatt fordi<br />

vi har fjernet <strong>en</strong> del autokorrelasjon i<br />

støyledd<strong>en</strong>e.<br />

Det er fullt mulig å arbeide videre for å<br />

finne <strong>en</strong> <strong>en</strong>da bedre modell. Dermed vil<br />

krav<strong>en</strong>e til støyledd<strong>en</strong>e tilfredsstilles ytterligere.<br />

Under modellbygging<strong>en</strong> kan det være<br />

h<strong>en</strong>siktsmessig å differ<strong>en</strong>siere tidsrekk<strong>en</strong><br />

på sesong slik som vist her. Det kan også<br />

være h<strong>en</strong>siktsmessig å differ<strong>en</strong>siere i<br />

avstand 1. Det vil si:<br />

yt = yt-1 + et For øvrig bør det tas med parametere i<br />

modell<strong>en</strong> som gjør tilpasning<strong>en</strong> til de<br />

aktuelle observasjon<strong>en</strong>e <strong>en</strong>da bedre.<br />

Autokorrelasjonsfunksjon<strong>en</strong> til støyledd<strong>en</strong>e<br />

<strong>–</strong> d<strong>en</strong> variasjon<strong>en</strong> som er tilbake <strong>–</strong><br />

skal da i utgangspunktet illustrere tilfeldig<br />

støy.<br />

8 Regresjonsmodeller<br />

I de komm<strong>en</strong>de kapitl<strong>en</strong>e vil følg<strong>en</strong>de<br />

prognosemodeller bli omtalt:<br />

- Regresjonsmodeller<br />

- Metningsmodeller<br />

- Glattingsmodeller<br />

- Tidsrekkemodeller<br />

- Kalmanfiltermodeller.<br />

Det vil bli pekt på spesielle eg<strong>en</strong>skaper<br />

til de ulike modell<strong>en</strong>e, ut<strong>en</strong> at det gås ned<br />

på spesielt detaljert nivå.<br />

Regresjonsmodeller er <strong>en</strong> meget b<strong>en</strong>yttet<br />

type modeller som brukes til prognostisering.<br />

I mange tilfeller inkluderes det<br />

økonomiske variable i disse modell<strong>en</strong>e<br />

for å kunne modellere etterspørsel<strong>en</strong>. For<br />

næremere studier i regresjon h<strong>en</strong>vises det<br />

til [9], [14], [15], [16], [17] og [53].<br />

8.1 Enkel regresjon<br />

Det er vanlig å skille mellom <strong>en</strong>kel regresjonsmodell<br />

og multippel regresjonsmodell.<br />

I d<strong>en</strong> <strong>en</strong>kle regresjonsmodell<strong>en</strong> angis<br />

det <strong>en</strong> relasjon mellom to variable, m<strong>en</strong>s<br />

i d<strong>en</strong> multiple regresjonsmodell<strong>en</strong> angis<br />

det relasjoner mellom flere variable.<br />

La y være d<strong>en</strong> variable som det skal lages<br />

prognoser for. D<strong>en</strong> andre variable kan<br />

eksempelvis ha betegnels<strong>en</strong> t. Vi kaller<br />

gjerne variabel<strong>en</strong> t for forklaringsvariabel<strong>en</strong><br />

fordi det er d<strong>en</strong>ne variable som forklarer<br />

utvikling<strong>en</strong> av d<strong>en</strong> andre variabel<strong>en</strong><br />

y.<br />

For å konkretisere ser vi på et eksempel.<br />

I tabell 8.1 har vi angitt abonnem<strong>en</strong>tstetthet<strong>en</strong><br />

for telefon i Norge fra 1975<br />

til1989. Abonnem<strong>en</strong>tstetthet<strong>en</strong> er definert<br />

som antall abonnem<strong>en</strong>t pr. 100 innbyggere.<br />

Variabel<strong>en</strong> y står i tabell<strong>en</strong> for<br />

abonnem<strong>en</strong>tstetthet<strong>en</strong>, m<strong>en</strong>s variabel<strong>en</strong> t,<br />

som er tid<strong>en</strong> i tabell<strong>en</strong>, er forklaringsvariabel<strong>en</strong>.<br />

I dette tilfellet vil regresjonsmodell<strong>en</strong>,<br />

som angir samm<strong>en</strong>h<strong>en</strong>g<strong>en</strong> mellom utvikling<br />

i abonnem<strong>en</strong>tstetthet<strong>en</strong> og tid<strong>en</strong>,<br />

være gitt ved:<br />

y = a + bt + ε (8.1)<br />

der a og b er parametere i modell<strong>en</strong>, m<strong>en</strong>s<br />

e er støyleddet. Vanligvis brukes det<br />

greske bokstaver for parametr<strong>en</strong>e.<br />

I figur 8.1 er regresjonslinj<strong>en</strong> tegnet opp<br />

og de ulike verdi<strong>en</strong>e på abonnem<strong>en</strong>tstetthet<strong>en</strong><br />

som funksjon av tid<strong>en</strong>. Vinkel<strong>en</strong> på<br />

regresjonslinj<strong>en</strong> er d<strong>en</strong> estimerte verdi<strong>en</strong><br />

på b, m<strong>en</strong>s avstand<strong>en</strong> fra origo og opp til<br />

regresjonslinj<strong>en</strong> når tid<strong>en</strong> t = 0, er d<strong>en</strong><br />

estimerte verdi<strong>en</strong> på a. Hvordan blir så<br />

verdi<strong>en</strong>e på a og b beregnet eller estimert?<br />

Det gjøres ved <strong>en</strong> bergingsmetode som<br />

heter minste kvadraters metode. D<strong>en</strong>ne<br />

statistiske metod<strong>en</strong> bestemmer verdi<strong>en</strong><br />

på a og b slik at summ<strong>en</strong> av kvadratavstand<strong>en</strong><br />

fra punkt<strong>en</strong>e y til regresjonslinj<strong>en</strong><br />

blir minimert. Populært kan vi si at<br />

verdi<strong>en</strong> på a og b bestemmes slik at<br />

regresjonslinj<strong>en</strong> går på best mulig måte<br />

mellom punkt<strong>en</strong>e.<br />

D<strong>en</strong>ne regresjonslinj<strong>en</strong> blir da vår regresjonsmodell.<br />

Ved å forl<strong>en</strong>ge regresjonslinj<strong>en</strong><br />

lineært fra t = 15 og framover, får<br />

vi prognoser for abonnem<strong>en</strong>tstetthet<strong>en</strong>.<br />

I figur 8.1 ser vi også no<strong>en</strong> stiplede<br />

linjer. Det er konfid<strong>en</strong>sintervall eller<br />

usikkerhetsgr<strong>en</strong>ser. Disse intervall<strong>en</strong>e<br />

sier hvor sikker beregning<strong>en</strong> av parametr<strong>en</strong>e<br />

a og b er. I dette tilfellet ser vi at<br />

de estimerte verdi<strong>en</strong>e av parametr<strong>en</strong>e er<br />

svært gode fordi de angitte intervall<strong>en</strong>e<br />

gir lit<strong>en</strong> frihetsgrad til å <strong>en</strong>dre på vinkel<strong>en</strong><br />

på kurv<strong>en</strong> og høyd<strong>en</strong> på kurv<strong>en</strong><br />

inn<strong>en</strong> de intervaller som er satt opp. Forl<strong>en</strong>gelse<br />

av det ytterste intervallet som vi<br />

ser krummer noe, angir konfid<strong>en</strong>sintervallet<br />

for prognos<strong>en</strong>. Krumming<strong>en</strong> betyr<br />

at usikkerhet<strong>en</strong> i prognos<strong>en</strong>e øker som<br />

funksjon av tid<strong>en</strong>.<br />

I d<strong>en</strong> angitte regresjonsmodell er det <strong>en</strong><br />

lineær samm<strong>en</strong>h<strong>en</strong>g mellom y og forklaringsvariabel<strong>en</strong><br />

t. Det kan også t<strong>en</strong>kes helt<br />

andre samm<strong>en</strong>h<strong>en</strong>ger. Et eksempel er:<br />

y = a + bt + ε (8.2)<br />

Her vil vi ha <strong>en</strong> ekspon<strong>en</strong>tiell økning<br />

som funksjon av tid<strong>en</strong>. En slik utvikling<br />

kan være riktig over <strong>en</strong> periode, m<strong>en</strong> så<br />

vil stigningsgrad<strong>en</strong> etter hvert avta (da<br />

intet vokser inn i u<strong>en</strong>delig).<br />

8.2 Multippel regresjon<br />

I eksempl<strong>en</strong>e så langt har tid<strong>en</strong> t vært<br />

forklaringsvariabel<strong>en</strong>. I de fleste regresjonsmodeller<br />

vil vi ha suppler<strong>en</strong>de eller<br />

andre forklaringsvariable. Det som ubetinget<br />

er <strong>en</strong> fordel med å ha med tid<strong>en</strong><br />

som forklaringsvariabel, er at utvikling<strong>en</strong><br />

til tid<strong>en</strong> er helt deterministisk og ut<strong>en</strong><br />

usikkerhet. B<strong>en</strong>ytter vi andre forklaringsvariable,<br />

er det viktig å være klar over at<br />

når det skal lages prognoser, må det også<br />

lages prognoser for utvikling<strong>en</strong> av disse<br />

forklaringsvariable som da i seg selv vil<br />

være beheftet med usikkerhet. Dette<br />

induserer <strong>en</strong> ekstra usikkerhet i prognos<strong>en</strong>e.<br />

Eksempler på slike forklaringsvariable<br />

er pris for tj<strong>en</strong>est<strong>en</strong> og konsumprisindeks<strong>en</strong>.<br />

Som nevnt kalles regresjonsmodeller<br />

med flere forklaringsvariable for multiple<br />

regresjonsmodeller. Et eksempel på slike<br />

modeller er:<br />

y = a + bu + cv + dw + ε (8.3)<br />

Her er u, v og w tre forklaringsvariable og<br />

a, b, c og d parametr<strong>en</strong>e i d<strong>en</strong> multiple<br />

regresjonsmodell<strong>en</strong>. På samme måte som<br />

i d<strong>en</strong> <strong>en</strong>kle regresjonsmodell<strong>en</strong> skal nå<br />

parametr<strong>en</strong>e bestemmes på best mulig<br />

måte. Dermed brukes minste kvadraters<br />

metode som gir optimale verdier på parametr<strong>en</strong>e.<br />

I selve utvikling<strong>en</strong> av prognosemodell<strong>en</strong><br />

går mye av arbeidet med til å bestemme<br />

hvilke variable som bør tas med og<br />

hvilke variable som bør utelates fra modell<strong>en</strong>.<br />

I utvikling<strong>en</strong> b<strong>en</strong>yttes de samme<br />

prinsipp<strong>en</strong>e som i forrige kapittel. I tillegg<br />

b<strong>en</strong>yttes spesielle teknikker for<br />

regresjonsanalyse. D<strong>en</strong> multiple korrelasjonskoeffisi<strong>en</strong>t<br />

er viktig med h<strong>en</strong>syn til å<br />

samm<strong>en</strong>likne de ulike modell<strong>en</strong>e. D<strong>en</strong>ne<br />

størrels<strong>en</strong> beregner i hvor stor grad regresjonsmodell<strong>en</strong>e<br />

greier å forklare varia-

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!