02.05.2013 Views

Prognosemetoder – en oversikt - Telenor

Prognosemetoder – en oversikt - Telenor

Prognosemetoder – en oversikt - Telenor

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Når vi bruker minste kvadraters metode<br />

bestemmes modell<strong>en</strong> ut fra at summ<strong>en</strong> av<br />

kvadratet av residual<strong>en</strong>e er minst mulig.<br />

Når vi bruker d<strong>en</strong>ne type metoder er det<br />

derfor viktig gå nøye igj<strong>en</strong>nom residual<strong>en</strong>e<br />

for å undersøke om det forekommer<br />

outliere fordi disse vil påvirke modell<strong>en</strong> i<br />

sterk grad. Dette skyldes at når selve residualet<br />

er stort, vil kvadratet av residualet<br />

bli dominer<strong>en</strong>de og dermed tvinge fram<br />

<strong>en</strong> modell som gir <strong>en</strong> dårlig beskrivelse<br />

av tidsrekk<strong>en</strong>. Dette er illustrert i figur<br />

7.11 og 7.12.<br />

Vi må derfor være varsomme når vi oppdager<br />

spesielt store avvik i residual<strong>en</strong>e. I<br />

første omgang bør det stilles spørsmål<br />

om hvorfor de er så store. Det kan<br />

skyldes feilmålinger, ann<strong>en</strong> type registreringsfeil,<br />

ev<strong>en</strong>tuelle misforståelser/<br />

kommunikasjonssvikt, innleggingsfeil av<br />

data, etc. I slike tilfeller må data<strong>en</strong>e rettes<br />

slik at de blir korrekte.<br />

En outlier kan også skyldes spesielt oppståtte,<br />

m<strong>en</strong> unormale situasjoner. Det kan<br />

eksempelvis bli registrert lav etterspørsel<br />

på grunn av <strong>en</strong> streik e l. I slike tilfeller er<br />

data<strong>en</strong>e korrekte, m<strong>en</strong> de gir ikke noe<br />

repres<strong>en</strong>tativt bilde av situasjon<strong>en</strong>. Det vil<br />

ikke være riktig å bruke d<strong>en</strong>ne observasjon<strong>en</strong><br />

som grunnlag for videre prognostisering<br />

når det ikke vil være no<strong>en</strong> streik de<br />

komm<strong>en</strong>de perioder. Dersom vi imidlertid<br />

vet at det kommer <strong>en</strong> streik, må vi selvsagt<br />

ta h<strong>en</strong>syn til det i prognos<strong>en</strong>e.<br />

I figur 7.11 og 7.12 er det vist hvorledes<br />

<strong>en</strong> stor outlier påvirker modell<strong>en</strong> og dermed<br />

også prognos<strong>en</strong>e. Vi har i figur 7.11<br />

<strong>en</strong> <strong>en</strong>kel regresjonsmodell med tid<strong>en</strong> som<br />

forklaringsvariabel og hvor det er <strong>en</strong><br />

spesielt stor outlier i begynnels<strong>en</strong> av<br />

observasjon<strong>en</strong>e. Vi har i figur<strong>en</strong> foretatt<br />

<strong>en</strong> modelltilpasning ut<strong>en</strong> at det er korrigert<br />

for outlier<strong>en</strong>. I figur 7.12 har vi de<br />

samme observasjon<strong>en</strong>e, m<strong>en</strong> her er det<br />

korrigert for outlier<strong>en</strong>, noe som må<br />

gjøres under modellbygging<strong>en</strong>. Vi ser nå<br />

at vi får <strong>en</strong> helt ann<strong>en</strong> modell og dermed<br />

også helt andre prognoser.<br />

I no<strong>en</strong> tilfeller kan vi klart se at vi har <strong>en</strong><br />

outlier fordi d<strong>en</strong> ligger svært langt borte<br />

fra det som er normalt. I andre tilfeller<br />

kan det være vanskeligere å avgjøre om<br />

vi har <strong>en</strong> outlier eller ikke. No<strong>en</strong> programpakker<br />

framstiller tidssekv<strong>en</strong>splottet<br />

av residual<strong>en</strong>e med et usikkerhetsintervall<br />

som er lik to ganger standardavviket<br />

til residual<strong>en</strong>e. Dette er vist i figur 7.13.<br />

I kapittel 5.6.2 ble eg<strong>en</strong>skaper til normalfordeling<strong>en</strong><br />

gj<strong>en</strong>nomgått. Vanligvis vil<br />

støy<strong>en</strong> (residual<strong>en</strong>e) tilnærmet tilfreds-<br />

stille <strong>en</strong> normalfordeling. Da vil<br />

omlag 5 % av residual<strong>en</strong>e ligge ut<strong>en</strong>for<br />

to ganger standardaviket, m<strong>en</strong>s<br />

kun 0,3 % av residual<strong>en</strong>e vil ligge<br />

ut<strong>en</strong>for tre ganger standardavviket.<br />

Dette betyr at dersom ett av residual<strong>en</strong>e<br />

avviker i størrelsesord<strong>en</strong> tre<br />

ganger standardavviket eller mer, er<br />

det grunn til å stille spørsmålstegn<br />

ved d<strong>en</strong> observasjon<strong>en</strong> som har g<strong>en</strong>erert<br />

residualet. D<strong>en</strong>ne må karakteriseres<br />

som <strong>en</strong> outlier.<br />

Det siste som bør ses på, er i hvilk<strong>en</strong><br />

grad residual<strong>en</strong>e tilfredsstiller normalfordeling<strong>en</strong>.<br />

Dette kan gjøres på<br />

flere måter. I no<strong>en</strong> programpakker er<br />

det lagt inn et spesielt normalfordelingsplott.<br />

Dette kan da b<strong>en</strong>yttes.<br />

Plottet gjøres på <strong>en</strong> spesiell form slik<br />

at når residual<strong>en</strong>e ordnes i stig<strong>en</strong>de<br />

rekkefølge skal de tilnærmet ligge på<br />

<strong>en</strong> rett linje. Skala<strong>en</strong> i plottet er transformert<br />

slik som vist i figur 7.14.<br />

Det er også mulig å plotte residual<strong>en</strong>e<br />

slik som vist i figur 5.2 for å få et<br />

inntrykk av fordeling<strong>en</strong> til residual<strong>en</strong>e.<br />

Det anbefales imidlertid å<br />

b<strong>en</strong>ytte et normalfordelingsplott dersom<br />

dette er tilgj<strong>en</strong>gelig i programpakk<strong>en</strong>.<br />

Det bør også sies at forutsetning<strong>en</strong><br />

om normalfordelte støyledd ikke er<br />

det mest kritiske. Det er fullt mulig å<br />

foreta mestepart<strong>en</strong> av modellbygging<strong>en</strong><br />

ut<strong>en</strong> forutsetning om at<br />

støyledd<strong>en</strong>e er normalfordelte.<br />

Vi har nå vært igj<strong>en</strong>nom <strong>en</strong> del ulike<br />

mønstre som vi kan ha på plottet av<br />

residual<strong>en</strong>e. Vi forstår nå hvor viktig<br />

det er å foreta slike plott etter at vi<br />

har laget <strong>en</strong> modell. Figur 7.1<br />

beskriver nettopp dette. På grunnlag<br />

av data<strong>en</strong>e lager vi <strong>en</strong> modell,<br />

deretter samm<strong>en</strong>likner vi observasjon<strong>en</strong>e<br />

i tidsrekk<strong>en</strong> med de tilpassede<br />

data<strong>en</strong>e fra modellering<strong>en</strong>. Differans<strong>en</strong><br />

mellom disse er residual<strong>en</strong>e<br />

som så plottes ut. Dersom disse ikke<br />

tilfredsstiller de krav som er gitt i<br />

kapittel 7.2 for støy<strong>en</strong>, må vi prøve å<br />

finne fram til <strong>en</strong> bedre modell.<br />

Selv om vi <strong>en</strong>nå ikke har beskrevet<br />

de aktuelle prognosemetod<strong>en</strong>e, har vi<br />

så langt fått et godt grunnlag for<br />

hvorledes det må arbeides med modellbygging<strong>en</strong><br />

for å få fram gode prognosemodeller.<br />

Det som vi skal stå tilbake med til<br />

slutt er et residualplott slik som vist i<br />

figur 7.15, der residual<strong>en</strong>e er tilfeldig<br />

e t<br />

0<br />

e t<br />

0<br />

e t<br />

0<br />

y t<br />

observasjon modell II<br />

Figur 7.5 Tidsrekke, modell II av tidsrekk<strong>en</strong> og residual<strong>en</strong>e<br />

(støy<strong>en</strong>)<br />

Figur 7.6 Plott av residualer fra <strong>en</strong> modell som bør ha <strong>en</strong><br />

tr<strong>en</strong>d<br />

Figur 7.7 Plott av residualer fra <strong>en</strong> modell som gir dårlig<br />

tilpasning<br />

Figur 7.8 Plott av residualer fra <strong>en</strong> modell som ikke har<br />

bygget inn sesongvariasjoner<br />

t<br />

31

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!