Prognosemetoder – en oversikt - Telenor

More documents

Recommendations

Info

36 samme som observasjonen i forrige kvartal pluss støyleddet. Vi får da: yt = yt-4 + et Figur 7.23 viser autokorrelasjonsfunksjonen til støyleddene i denne enkle sesongmodellen. Vi ser nå at de sterke sesongmessige autokorrelasjonene er fjernet. I tillegg ser vi at usikkerhetsgrensene har avtatt fordi vi har fjernet en del autokorrelasjon i støyleddene. Det er fullt mulig å arbeide videre for å finne en enda bedre modell. Dermed vil kravene til støyleddene tilfredsstilles ytterligere. Under modellbyggingen kan det være hensiktsmessig å differensiere tidsrekken på sesong slik som vist her. Det kan også være hensiktsmessig å differensiere i avstand 1. Det vil si: yt = yt-1 + et For øvrig bør det tas med parametere i modellen som gjør tilpasningen til de aktuelle observasjonene enda bedre. Autokorrelasjonsfunksjonen til støyleddene – den variasjonen som er tilbake – skal da i utgangspunktet illustrere tilfeldig støy. 8 Regresjonsmodeller I de kommende kapitlene vil følgende prognosemodeller bli omtalt: - Regresjonsmodeller - Metningsmodeller - Glattingsmodeller - Tidsrekkemodeller - Kalmanfiltermodeller. Det vil bli pekt på spesielle egenskaper til de ulike modellene, uten at det gås ned på spesielt detaljert nivå. Regresjonsmodeller er en meget benyttet type modeller som brukes til prognostisering. I mange tilfeller inkluderes det økonomiske variable i disse modellene for å kunne modellere etterspørselen. For næremere studier i regresjon henvises det til [9], [14], [15], [16], [17] og [53]. 8.1 Enkel regresjon Det er vanlig å skille mellom enkel regresjonsmodell og multippel regresjonsmodell. I den enkle regresjonsmodellen angis det en relasjon mellom to variable, mens i den multiple regresjonsmodellen angis det relasjoner mellom flere variable. La y være den variable som det skal lages prognoser for. Den andre variable kan eksempelvis ha betegnelsen t. Vi kaller gjerne variabelen t for forklaringsvariabelen fordi det er denne variable som forklarer utviklingen av den andre variabelen y. For å konkretisere ser vi på et eksempel. I tabell 8.1 har vi angitt abonnementstettheten for telefon i Norge fra 1975 til1989. Abonnementstettheten er definert som antall abonnement pr. 100 innbyggere. Variabelen y står i tabellen for abonnementstettheten, mens variabelen t, som er tiden i tabellen, er forklaringsvariabelen. I dette tilfellet vil regresjonsmodellen, som angir sammenhengen mellom utvikling i abonnementstettheten og tiden, være gitt ved: y = a + bt + ε (8.1) der a og b er parametere i modellen, mens e er støyleddet. Vanligvis brukes det greske bokstaver for parametrene. I figur 8.1 er regresjonslinjen tegnet opp og de ulike verdiene på abonnementstettheten som funksjon av tiden. Vinkelen på regresjonslinjen er den estimerte verdien på b, mens avstanden fra origo og opp til regresjonslinjen når tiden t = 0, er den estimerte verdien på a. Hvordan blir så verdiene på a og b beregnet eller estimert? Det gjøres ved en bergingsmetode som heter minste kvadraters metode. Denne statistiske metoden bestemmer verdien på a og b slik at summen av kvadratavstanden fra punktene y til regresjonslinjen blir minimert. Populært kan vi si at verdien på a og b bestemmes slik at regresjonslinjen går på best mulig måte mellom punktene. Denne regresjonslinjen blir da vår regresjonsmodell. Ved å forlenge regresjonslinjen lineært fra t = 15 og framover, får vi prognoser for abonnementstettheten. I figur 8.1 ser vi også noen stiplede linjer. Det er konfidensintervall eller usikkerhetsgrenser. Disse intervallene sier hvor sikker beregningen av parametrene a og b er. I dette tilfellet ser vi at de estimerte verdiene av parametrene er svært gode fordi de angitte intervallene gir liten frihetsgrad til å endre på vinkelen på kurven og høyden på kurven innen de intervaller som er satt opp. Forlengelse av det ytterste intervallet som vi ser krummer noe, angir konfidensintervallet for prognosen. Krummingen betyr at usikkerheten i prognosene øker som funksjon av tiden. I den angitte regresjonsmodell er det en lineær sammenheng mellom y og forklaringsvariabelen t. Det kan også tenkes helt andre sammenhenger. Et eksempel er: y = a + bt + ε (8.2) Her vil vi ha en eksponentiell økning som funksjon av tiden. En slik utvikling kan være riktig over en periode, men så vil stigningsgraden etter hvert avta (da intet vokser inn i uendelig). 8.2 Multippel regresjon I eksemplene så langt har tiden t vært forklaringsvariabelen. I de fleste regresjonsmodeller vil vi ha supplerende eller andre forklaringsvariable. Det som ubetinget er en fordel med å ha med tiden som forklaringsvariabel, er at utviklingen til tiden er helt deterministisk og uten usikkerhet. Benytter vi andre forklaringsvariable, er det viktig å være klar over at når det skal lages prognoser, må det også lages prognoser for utviklingen av disse forklaringsvariable som da i seg selv vil være beheftet med usikkerhet. Dette induserer en ekstra usikkerhet i prognosene. Eksempler på slike forklaringsvariable er pris for tjenesten og konsumprisindeksen. Som nevnt kalles regresjonsmodeller med flere forklaringsvariable for multiple regresjonsmodeller. Et eksempel på slike modeller er: y = a + bu + cv + dw + ε (8.3) Her er u, v og w tre forklaringsvariable og a, b, c og d parametrene i den multiple regresjonsmodellen. På samme måte som i den enkle regresjonsmodellen skal nå parametrene bestemmes på best mulig måte. Dermed brukes minste kvadraters metode som gir optimale verdier på parametrene. I selve utviklingen av prognosemodellen går mye av arbeidet med til å bestemme hvilke variable som bør tas med og hvilke variable som bør utelates fra modellen. I utviklingen benyttes de samme prinsippene som i forrige kapittel. I tillegg benyttes spesielle teknikker for regresjonsanalyse. Den multiple korrelasjonskoeffisient er viktig med hensyn til å sammenlikne de ulike modellene. Denne størrelsen beregner i hvor stor grad regresjonsmodellene greier å forklare varia-
sjonene eller utviklingen til y. Valget mellom de ulike regresjonsmodeller med ulike forklaringsvariable baseres blant annet på hvor god den multiple korrelasjonskoeffisient er. Det finnes også metoder som trinnvis regresjon som suksessivt beregner seg fram til den beste regresjonsmodellen ut fra et sett med forklaringsvariable. Den velger da ut hvilke forklaringsvariable som skal tas med i modellen. Det ses nå på en problemstilling der vi har flere forklaringsvariable. Det skal lages en prognosemodell for årlig etterspørsel etter hovedabonnement for telefon. Tabell 8.2 viser etterspørselen. Det ses at den årlige etterspørselen har økt fram til 1981, deretter har den avtatt. Spørmålet er så hva slags forklaringsvariable som bør inkluderes i regresjonsmodellen. Etterspørselen vil være avhengig av prisen på tjenesten. Aktuelle forklaringsvariable er: - Kvartalsavgift - Innmeldingsavgift - Teletakstindeks - Tiden. Teletakstindeks var tidligere en sentral indeks for telefontjenesten som ble beregnet av Økonomiavdelingen. Tabell 8.3 angir verdien på disse forklaringsvariable. Den taksten som er angitt her, er ikke justert for den generelle prisutvikling. Dette kunne vært gjort ved å dividere de aktuelle forklaringsvariable med konsumprisindeksen. Dette ville også være relevante regresjonsmodeller som må prøves ut i en evalueringsfase. Ved å benytte en trinnvis regresjon, ble resultatet at: Tiden, Kvartalsavgiften og Innmeldingsavgiften gav den beste regresjonsmodellen. Dette gav følgende regresjonsmodell: Abonnementsetterspørsel = 175565 + 10340 * tid + 17,95 * innmeldingsavgift + 127,25 * kvartalsavgift (8.4) De tallene som vi har i likning (8.4) er nå verdiene på de estimerte parametrene a, b, c og d. Tilpasningen her må sies å være brukbar med en multippel korrelasjonskoeffisient på 0,94 og Durbin Watson observator på 1,79 som indikerer liten autokorrelasjon i residualene. Så langt har dette eksemplet vært en god reklame for regresjonsmodeller. Siden vi har brukt statistikk fram til 1984, kjenner vi resultatene videre. Utviklingen fra 1985 til 1988 var som vist i tabell 8.4 for forklaringsvariablene. Vi legger merke til at tiden t = 1 i 1976 og tiden følgelig har verdi 10 i 1985, etc. Vi kan nå sette verdien til forklaringsvariablene fra 1985 til 1988 inn i likning (8.4). Vi får da prognoser for 1985–1988. Dette er imidlertid en tildragelse, fordi vi egentlig ikke kjenner verdien på de aktuelle forklaringsvariable – unntatt tiden. Det betyr at den prognosen som nå lages har mindre usikkerhet enn det som er realistisk. Ser vi på de aktuelle forklaringsvariable, så er innmeldingsavgiften uforandret unntatt i 1988, da den ble redusert med 25 %. Kvartalsavgiften har hatt en noe rar stigning: Uforandret fra 1985 til 1986, for deretter å stige. Noe av denne policyen kunne nok vært avdekket før en lagde prognosene. Resultatet av prognosene er nå gitt sammen med de faktiske verdier i tabell 8.5. Tabellen viser at den faktiske etterspørselen når en topp i 1985 for så å falle dramatisk etterpå. Årsaken til dette fallet er at markedet på hovedabonnement nærmer seg metning. Dermed avtar også den årlige etterspørselen. Dette ble også forsterket av en depresjon i næringslivet fra 1988. Konklusjonen fra dette eksempelet er ikke at regresjonsmodeller er ubrukbare prognosemodeller, men at det er viktig å sette seg nøye inn i et produkts og en tjenestes utvikling når det skal lages prognoser. De prognosene som er laget her, har ikke noe med Televerkets offisielle prognoser å gjøre. De er vist som en argumentasjon for neste kapittel der vi skal se på metningsmodeller, som er en meget aktuell modelltype for prognostisering. 9 Metningsmodeller 9.1 Generelt Det finnes mange navn på disse modellene. I litteraturen kalles de både metningsmodeller, vekstmodeller, diffusjonsmodeller og S-kurver. Modellene kjennetegnes ved at de har en forklaringsvariabel som er tiden t. Modellene inneholder fra 2 til 4 parametere. I en mer komplisert form kan modellene også inneholde flere forklaringsvariable. Modellene beskriver et forløp der etterspørselen til å begynne med øker til- nærmet eksponentielt for så i avslutningsfasen, når det nærmer seg metning, å avta tilnærmet eksponentielt. Modellen baserer seg på akkumulerte data. Det betyr at inngangsdataene eksempelvis er totaletterspørsel etter abonnement og Tabell 8.1 Abonnementstetthet for telefon 1975–1989 Tid År Abonnementstetthet 1 1975 23,60 2 1976 24,87 3 1977 26,38 4 1978 27,95 5 1979 29,75 6 1980 31,48 7 1981 33,64 8 1982 35,55 9 1983 37,43 10 1984 39,27 11 1985 41,58 12 1986 43,83 13 1987 45,67 14 1988 47,14 15 1989 48,23 53 48 43 38 33 28 23 0 3 6 9 12 15 Figur 8.1 Regresjonsmodell for abonnementstetthet for telefon med tiden som forklaringsvariabel 37
Page 2 and 3: Innhold TEMA: Introduksjon, Kjell S
Page 5 and 6: 1 Utvikling av prognosearbeidet i T
Page 7 and 8: - Prognoser for vanlig telefonabonn
Page 9 and 10: De økonomiske beregninger som ligg
Page 11 and 12: ment fra bedrifter. I tillegg er de
Page 13 and 14: Tele-hjemmearbeid Kommunikasjon mel
Page 15 and 16: observasjoner, fordi det er en ny t
Page 17 and 18: 1.nyttårsdag (x 10 000) 400 350 30
Page 19 and 20: 20 dere med antall abonnenter. niv
Page 21 and 22: Indeks 220 200 180 160 140 120 100
Page 23 and 24: menes at det statistisk ikke er tro
Page 25 and 26: klassiske prognosemetoden i den fø
Page 27 and 28: Tabell 6.3 Tidsrekker med forskjell
Page 29 and 30: 38 7.3 Enkel modellbygging Utgangsp
Page 31 and 32: Når vi bruker minste kvadraters me
Page 33 and 34: e t 0 99.9 Figur 7.13 Plott av resi
Page 35: 58 53 48 43 38 33 28 1 0.5 0 -0.5 -
Page 39 and 40: det kommunisere med. Dermed blir tj
Page 41 and 42: 1 og ved t med (1 - b) og summerer
Page 43 and 44: i etterspørselen i påfølgende m
Page 45 and 46: aggregerte prognosen er riktig. Ned
Page 47 and 48: prognosene vil med sikkerhet ikke v
Page 49 and 50: skyld, er lite, vil det også være
Page 51: Ed: O D Anderson. Amsterdam, North
Page 54 and 55: 54 Diverse enkeltpersoner 16 Televe
Page 56 and 57: Figur 3.3 Innhenting av informasjon
Page 58 and 59: 58 Selvbetjening over telenettet Tj
Page 60 and 61: 60 Det kan være vanskelig med noen
Page 62 and 63: 62 I TITAN-prosjektet ble det foret
Page 64 and 65: 64 Prosentandel av husstander 25 20
Page 66 and 67: 66 I N E T T E T Annullerte bestill
Page 68 and 69: (x 100) 22 17 12 68 7 2 -3 01/87 +
Page 70 and 71: periodene, skyldes at dette skjules
Page 72 and 73: 72 “givende” sentralen til den
Page 74 and 75: 74 spesielt er opptatt av forklarin
Page 76 and 77: 001.18:621.39 76 Glattingsmodeller
Page 78 and 79: 78 Tabell 2 De opprinnelige sesongo
Page 80 and 81: 80 0.025 0.02 0.015 0.01 0.005 y' t
Page 82 and 83: Tabell 3 Holts metode 82 År t Anta
Page 84 and 85: Tabell 5 Hvordan Holt-Winters addit
Page 86 and 87:
(x 100) 20 15 10 86 5 0 antall abon
Page 88 and 89:
Abonnement 540 520 500 480 460 88 n
Page 90 and 91:
90 ingsprosedyre som skal iterere s
Page 92 and 93:
92 forbedringer av modellen. Plott
Page 94 and 95:
94 Vi ser av (5.12) at variansen ti
Page 96 and 97:
96 Figur 7.2 Residualer fra lineær
Page 98 and 99:
98 Tabellen viser at alle parameter
Page 100 and 101:
disse til å lage prognoser med. So
Page 102 and 103:
102 16 Bøe, J, Stordahl, K. Teller
Page 104 and 105:
200 180 160 140 120 100 80 60 40 Fi
Page 106 and 107:
106 1 0.8 0.6 0.4 0.2 0 1 0.8 0.6 0
Page 108 and 109:
108 Tabell 2 viser de historiske da
Page 110 and 111:
001.18:621.39 110 Box-Jenkins metod
Page 112 and 113:
Standardavvik 600 550 500 450 400 S
Page 114 and 115:
114 AR-parametre og q MA-parametre
Page 116 and 117:
116 Figur 13 Autokorrelasjonsfunksj
Page 118 and 119:
118 Korrelasjonsverdi Vi ser av fig
Page 120 and 121:
120 Aksepter hypotesen om at parame
Page 122 and 123:
Residualer 0.4 0.3 0.2 0.1 122 0 -0
Page 124 and 125:
124 Referanser 1 Stordahl, K, Hjelk
Page 126 and 127:
Tabell 1 Volum tellerskritt, abonne
Page 128 and 129:
128 Tabell 3a Prognose fra modell b
Page 130 and 131:
Page 132 and 133:
Page 134 and 135:
001.18:621.39 134 Prognoser for abo
Page 136 and 137:
136 Tabell 3 Analyse av støyledden
Page 138 and 139:
138 Tabell 5 Utskrift av prognosepr
Page 140 and 141:
vi ikke diskutere her. Poenget er
Page 142 and 143:
142 prognosen. Da “beskjæres”
Page 144 and 145:
144 7 Stordahl, K. Prognosemetoder:
Page 146 and 147:
Tabell 1 Oversikt over takstklassen
Page 148 and 149:
148 Tabell 5 Antall samtalesekunder
Page 150 and 151:
150 a) (x1000) 45 35 25 15 5 (x1000
Page 152 and 153:
152 Tabell 8 viser de avleste telle
Page 154 and 155:
154 Tabell 11 Komplett datasett med
Page 156 and 157:
001.18:621.39 156 Prognoser for nye
Page 158 and 159:
158 3.1 Vurderinger av foreliggende
Page 160 and 161:
160 passer utmerket, med relativt l
Page 162 and 163:
2B+D aksesser (x1000) 7 6 5 4 3 2 1
Page 164 and 165:
164 (x1000) 10 8 6 4 2 0 Tabell 6 I
Page 166 and 167:
001.18:621.39 166 Prognoser for pri
Page 168 and 169:
168 der ˆσ β* = ˆσ = ˆy t =
Page 170 and 171:
n r (t) 90 % 10 170 1,00 0,80 0,60
Page 172 and 173:
ønsker å benytte disse metodene f
Page 174 and 175:
174 Remote router/ Bridge hand, the
Page 176 and 177:
176 Figure 5 ATM cell Bridge 48 byt
Page 178 and 179:
178 DTE less than 2 Mbit/s, Frame R
Page 180 and 181:
180 References 1 Mannsåker, B et a
Page 182 and 183:
182 Table of contents page Introduc
Page 184 and 185:
006 621.391 184 Signal processing B
Page 186 and 187:
006:681.324 006:681.327.8 186 Data
Page 188 and 189:
006 621.39 188 Teletraffic and dime
Page 190 and 191:
190 contractor. The project had a b
Page 192 and 193:
Table 2 ITU Recommendations for con
Page 194 and 195:
006 654.01:65 194 Telecommunication
Page 196 and 197:
006 196 Introduction EURESCOM is an
Page 198:
198 Intelligent networks 26 % Infra
show all

Prognosemetoder – en oversikt - Telenor

Create successful ePaper yourself

Delete template?

Save as template?