Prognosemetoder – en oversikt - Telenor

More documents

Recommendations

Info

90 ingsprosedyre som skal iterere seg frem til estimerte verdier. Tar vi med alle forklaringsvariablene vil utgangspunktet for modellen være: TS t = β 0 + β 10 P t + β 11 P t-1 + β 12 P t-2 + β 13 P t-3 + β 14 P t-4 + β 2 AB t + β 3 T t + β 4 Vdag t + β 52 S2 t + β 53 S3 t + β 54 S4 t (2.1) hvor TSt = etterspurt volum tellerskritt i periode t Pt-i = realpris i periode t, i = 0, 1, 2, 3, 4. ABt = innkoblede abonnement i periode t Tt = tiden i periode t Vdagt = antall virkedager i periode t Sjt = dummyvariabel for sesong j, periode t β 0 , β 1i (i = 1, 2, 3, 4), β 2 , β 3 , β 4 , β 5j (j = 2, 3, 4) er parametere som skal estimeres. Etter at regresjonsanalysen er foretatt, vil det vise seg om noen av de aktuelle variablene ikke får signifikant innvirkning. Da skal de i utgangspunktet utelates fra modellen. Ser vi f eks på β10 angir den hvor mye volum tellerskritt endrer seg med når realprisen i den perioden prisen gjelder endrer seg med en enhet, cet. par., dvs den er den partielt deriverte av TSt mhp Pt . For å få frem korttids priselastisiteten for denne perioden kan vi da multiplisere med Pt og dividere med TSt . Vi har altså at korttids priselastisiteten er gitt ved β10 * Pt /TSt (2.2) Mens β 10 er en konstant (punkt-estimat) ser vi at priselastisiteten er avhengig av forholdet mellom P t og TS t og vil derfor variere over tid. Hvis effekten av en prisendring har slått tilnærmet fullt ut i etterspørselen etter volum tellerskritt etter 4 perioder, har vi at langtids priselastisiteten er gitt ved 4 β1i ∗P t−i / TS ∑ t i=0 (2.3) På samme måte angir β 2 , β 3 og β 4 hvor mye volum tellerskritt endrer seg når hhv abonnement, tid og virkedager endrer seg med en enhet, og det kan her også beregnes elastisiteter. β 5j (j = 2, 3, 4) sier hvor mye sesongutslagene utgjør i forhold til 1. kvartal. 2.2.2 Loglineær modell Denne type modeller er i utgangspunktet ikkelineære. Det er imidlertid ofte mulig ved bruk av en logaritmisk transformasjon å overføre den opprinnelige modellen til en lineær form. Ofte vil begrunnelsen for valg av en slik modellform ligge i observasjon og teori for en variabels utvikling: En eksponentiell utvikling kan f eks beskrives ved en eksponential-funksjon eller en funksjon der variablene inngår multiplikativt. En mye brukt variant er hentet fra økonomisk teori om bedriftenes tilpasning. Der benyttes en såkalt Cobb-Douglas produktfunksjon, hvor variablene (og konstanten) inngår multiplikativt med parametrene som eksponenter. Dette er overførbart til vårt eksempel og gir følgende modell når vi innlemmer alle de relevante forklaringsvariablene: TS t = β 0 * P t β 10 * P t-1 β 11 * P t-2 β 12 * P t-3 β 13 * Pt-4 β 14 * ABt β 2 * T t β 3 * Vdagt β 4 * e (β 52 S2 t + β 53 S3 t + β 54 S4 t ) (2.4) hvor e er grunntallet i eksponentialfunksjonen. Også her vil det bli reduksjon i modellen etter at regresjonsanalysen er foretatt og kun de signifikante variable er inkludert. I praksis gir ofte en slik utforming av etterspørselsfunksjonen en bedre tilpasning til data enn den lineære. Spesielt gjelder dette i tilfeller hvor vekst og sesongutslag er økende. Ofte kan imidlertid dette være vanskelig å avgjøre i utgangspunktet, og derfor prøves begge funksjonsformer for å se hvilken som gir best resultater. En transformasjon over til lineær form i parametrene gjøres ved å ta logaritmen til (2.4). Det gir følgende: lnTSt = lnβ0 + β10lnPt + β11lnPt-1 + β 12 lnP t-2 + β 13 lnP t-3 + β 14 lnP t-4 + β 2 lnAB t + β 3 lnT t + β 4 lnVdag t + β 52 S2 t + β 53 S3 t + β 54 S4 t (2.5) Elastisiterer vi TS t mhp P t direkte i (2.4) gir dette β 10 , som er korttids priselastisiteten. I denne utformingen av etterspørselsfunksjonen er altså korttids priselastisiteten konstant, og gitt direkte ved denne parameteren. Langtids priselastisiteten er da gitt som 4 β ∑ 1i i=0 (2.6) 2.2.3 Ikkelineær regresjonsmodell I denne artikkelen er det ikke nødvendig å se på ikkelineære modeller fordi vi får meget god tilpasning med de prognosemodeller som vi har valgt ut. Dersom en kan unngå ikkelineære modeller, så er det en fordel. Det er her en risiko for at estimeringsprosessen kan havne i lokalt og ikke globalt minimumspunkt – noe som vil føre til faktisk feil resultater. 2.2.4 Veiet regresjonsmodell I de tilfeller hvor variansen til støyleddet øker eksempelvis med tiden, kan det være aktuelt å ta en logaritmisk transformasjon for å dempe denne økningen. Eventuelt kan det være aktuelt å veie de enkelte observasjoner etter et gitt mønster. En slik metode kalles veiet regresjon. I det dataunderlaget som er her, har det vist seg unødvendig å foreta veiet regresjonsanalyse. Før vi nå foretar selve modellbyggingen med basis i de forklaringsvariablene som er trukket frem, går vi igjennom de forutsetninger som skal være til stede i regresjonsanalysen og det verktøy som kan brukes til utvikling av prognosemodellen. 3 Stokastisk utforming – modellforutsetninger i regresjon Prosessen med utarbeiding av en prognosemodell er godt beskrevet i [12]. De fleste av de prinsipper for modellering som gjennomgås der, benyttes i regresjonsanalysen. Det fundamentale i modellbyggingsprosessen er residualene. Arbeidet går kort ut på å analysere residualene og ut fra dette eventuelt komme frem med forslag til forbedring av modellen. Residualet ved tidspunkt t betegnes med et . Det er definert som differansen mellom observasjonen ved tidspunkt og den tilpassede verdi som er den verdi som modellen anslår ved tidspunkt t. I regresjonsmodellene innfører vi en variabel εt som også kalles støyleddet. Denne
henges additivt på den lineære modellen (2.1) og multiplikativt på modellen (2.4). Denne variabelen angir det vi ikke greier å forklare i modellen. Det kan være variasjon i variable som ikke er spesifisert i modellen, avvik mellom faktisk funksjonsform og den vi har valgt, eventuelt målefeil i variablene samt tilfeldige avvik. Målet er selvsagt at støyleddene skal være små i forhold til observasjonene. Det er viktig under modellbyggingen å velge ut variable og finne frem til en funksjonsform av variabler og parametere som inngår i modellen som gjør at det vi ikke greier å forklare – støyen – er minst mulig. Residualene er realiseringen av støyen. Det er med andre ord de kvantitative verdiene på støyen som fremkommer når modellen er gitt og de tilpassede verdier beregnet. Et krav til prognosemodeller er selvsagt at støyen er minst mulig. I regresjonsmodeller ivaretas dette i estimeringen ved bruk av minste kvadraters metode. For øvrig må det ivaretas i selve modellarbeidet ved riktig valg av forklaringsvariable og funksjonsform. De krav som stilles til støyleddet, er: i) E εt = 0 for alle t (3.1) ii) Var εt = σ2 for alle t (3.2) iii) Cov (εt , εt+k ) = 0 for alle t≠k (3.3) iv) εt skal være Normalfordelt (3.4) Med innføring av disse forutsetningene for støyleddene sier vi at modellene er gitt en stokastisk formulering. Med hensyn til krav nr i) om at støyen skal ha forventningsverdi 0, så ivaretas dette automatisk i regresjonsanalysen. Minste kvadraters metode estimerer parametrene i modellen slik at gjennomsnittet av alle residualene i en regresjonsmodell er lik 0. Som sagt må residualene analyseres for å undersøke om de tilfredsstiller disse kravene. Dersom ett eller flere krav ikke er tilfredsstilt, betyr det at estimeringen av parametrene i modellen blir mer usikker. Dette kan eksempelvis føre til forventningsskjevhet i parametrene. 4 Minste kvadraters metode og estimering i multippel regresjon En lineær multippel regresjonsmodell kan skrives på form: y t = β 0 + β 1 X 1,t + β 2 X 2,t + ... + β p-1 X p-1,t + ε t (4.1) I denne likningen har vi p parametere, β, og p-1 forklaringsvariable X. Den første parameteren angir konstantleddet i modellen. De øvrige parametrene er relatert til de p-1 forklaringsvariable som er trukket inn i modellen. Anta nå at vi har n observasjoner. Da vil vi ha n slike likninger for t = 1, t = 2, ..., t =nsom er angitt i (4.1) Disse kunne vi plassere rett under hverandre. Dette likningssystemet med n likninger kan da skrives på vektorform ved: y = Xβ + ε (4.2) Her er y en n-dimensjonal vektor som består av tidsrekken (observasjonene), mens X er en (n x p) dimensjonal matrise som består av de respektive verdier på forklaringsvariablene i hvert av de n tidspunktene. β er en p-dimensjonal vektor som består av parametrene, og ε er ndimensjonal vektor med støyleddene. En konsekvens av kravet (3.1) om at forventningen til støyleddet skal være lik 0 (E ε = 0) er: E y = Xβ (4.3) En konsekvens av kravene (3.2) og (3.3) er Cov y = Cov ε = σ2 I (4.4) der I er en (n x n) dimensjonal diagonalmatrise med bare 1-ere på diagonalen og 0 ellers i matrisen. I multippel regresjon er da regresjonsmodellen gitt ved matriselikningen (4.2), mens kravene til modellen er gitt ved likning (4.3) og (4.4). I tillegg kreves det at ε er Normalfordelt. Minste kvadraters estimatorene finnes ved å minimere uttrykket: n Q = ( yt − Ey t )2 ∑ t=1 (4.5) Her er y t observasjonene og Ey t er forventet observasjonsverdi gitt ved likning (4.3) eller (4.1) når ε t = 0. Minste kvadraters estimatorene vil være de verdier på β som minimerer likning (4.5). I likning (4.5) inngår det p parametere. For å finne de optimale verdier på β må likning (4.5) deriveres med hensyn på hver enkelt β og settes lik 0. Vi vil da ha et lineært likningssystem med p likninger og p ukjente parametere. Løsningen av dette likningssystemet gir minste kvadraters estimatorene. På matriseform kan likning (4.5) uttrykkes på følgende måte: Q = (y - Xβ)'(y - Xβ) (4.6) Derivasjon av dette uttrykket med hensyn på β og så sette det deriverte uttrykket lik 0 gir: 0 = -2y'X + 2βX'X Av dette uttrykket følger minste kvadraters estimatorene på vektorform: β = (X'X) -1X'y (4.7) Selv om dette uttrykket på matriseform ser forholdsvis enkelt ut, er det svært komplisert å løse. I [13] er det angitt løsninger i en regresjonsmodell med en forklaringsvariabel. Der går det frem at selv disse løsningene krever en god del regnearbeid. Det er først nå når vi har fått elektroniske regnemaskiner at vi har fått mulighet til enkelt å løse regresjonsmodeller med mange parametere. Regnearbeidet går i hovedsak ut på å beregne den inverse til matrisen (X'X). Det kan her oppstå spesielle problemer under estimeringen (beregningene) hvis noen av kolonnene i X tilnærmet er lineært avhengig av hverandre. Da vil determinanten til (X'X) nærme seg 0, og vi vil få stor instabilitet i beregningene. Dette betyr at en ikke bør inkludere forklaringsvariable i modellen som er sterkt avhengig av hverandre. Dette problemet betegnes i regresjonsanalyse som multikolinearitet. Dersom dette problemet oppstår, kan en omgå det ved f eks å benytte “Ridge regresjon” der det adderes til en diagonalmatrise under estimeringen for å unngå instabiliteten, se kapittel 5.6. 5 Tester for å evaluere aktuelle modeller Anvendelse av testene vil vi se nærmere på i kapittel 7 og 8 i tilknytning til modellbyggingen. De tester og kriterier som spesielt er viktig i regresjonsanalysen, er - Multippel regresjonskoeffisient - Signifikanstest på hver enkelt parameter - Standardavviket til residualene - Durbin-Watson test - Autokorrelasjonsfunksjon - Korrelasjonsmatrise for parametrene - Prediksjons- og konfidensintervall. I tillegg vil forskjellige plott av residualene være viktig både for å vurdere kvaliteten på modellen og for å få underlag for 91
Page 2 and 3:
Innhold TEMA: Introduksjon, Kjell S
Page 5 and 6:
1 Utvikling av prognosearbeidet i T
Page 7 and 8:
- Prognoser for vanlig telefonabonn
Page 9 and 10:
De økonomiske beregninger som ligg
Page 11 and 12:
ment fra bedrifter. I tillegg er de
Page 13 and 14:
Tele-hjemmearbeid Kommunikasjon mel
Page 15 and 16:
observasjoner, fordi det er en ny t
Page 17 and 18:
1.nyttårsdag (x 10 000) 400 350 30
Page 19 and 20:
20 dere med antall abonnenter. niv
Page 21 and 22:
Indeks 220 200 180 160 140 120 100
Page 23 and 24:
menes at det statistisk ikke er tro
Page 25 and 26:
klassiske prognosemetoden i den fø
Page 27 and 28:
Tabell 6.3 Tidsrekker med forskjell
Page 29 and 30:
38 7.3 Enkel modellbygging Utgangsp
Page 31 and 32:
Når vi bruker minste kvadraters me
Page 33 and 34:
e t 0 99.9 Figur 7.13 Plott av resi
Page 35 and 36:
58 53 48 43 38 33 28 1 0.5 0 -0.5 -
Page 37 and 38:
sjonene eller utviklingen til y. Va
Page 39 and 40: det kommunisere med. Dermed blir tj
Page 41 and 42: 1 og ved t med (1 - b) og summerer
Page 43 and 44: i etterspørselen i påfølgende m
Page 45 and 46: aggregerte prognosen er riktig. Ned
Page 47 and 48: prognosene vil med sikkerhet ikke v
Page 49 and 50: skyld, er lite, vil det også være
Page 51: Ed: O D Anderson. Amsterdam, North
Page 54 and 55: 54 Diverse enkeltpersoner 16 Televe
Page 56 and 57: Figur 3.3 Innhenting av informasjon
Page 58 and 59: 58 Selvbetjening over telenettet Tj
Page 60 and 61: 60 Det kan være vanskelig med noen
Page 62 and 63: 62 I TITAN-prosjektet ble det foret
Page 64 and 65: 64 Prosentandel av husstander 25 20
Page 66 and 67: 66 I N E T T E T Annullerte bestill
Page 68 and 69: (x 100) 22 17 12 68 7 2 -3 01/87 +
Page 70 and 71: periodene, skyldes at dette skjules
Page 72 and 73: 72 “givende” sentralen til den
Page 74 and 75: 74 spesielt er opptatt av forklarin
Page 76 and 77: 001.18:621.39 76 Glattingsmodeller
Page 78 and 79: 78 Tabell 2 De opprinnelige sesongo
Page 80 and 81: 80 0.025 0.02 0.015 0.01 0.005 y' t
Page 82 and 83: Tabell 3 Holts metode 82 År t Anta
Page 84 and 85: Tabell 5 Hvordan Holt-Winters addit
Page 86 and 87: (x 100) 20 15 10 86 5 0 antall abon
Page 88 and 89: Abonnement 540 520 500 480 460 88 n
Page 92 and 93: 92 forbedringer av modellen. Plott
Page 94 and 95: 94 Vi ser av (5.12) at variansen ti
Page 96 and 97: 96 Figur 7.2 Residualer fra lineær
Page 98 and 99: 98 Tabellen viser at alle parameter
Page 100 and 101: disse til å lage prognoser med. So
Page 102 and 103: 102 16 Bøe, J, Stordahl, K. Teller
Page 104 and 105: 200 180 160 140 120 100 80 60 40 Fi
Page 106 and 107: 106 1 0.8 0.6 0.4 0.2 0 1 0.8 0.6 0
Page 108 and 109: 108 Tabell 2 viser de historiske da
Page 110 and 111: 001.18:621.39 110 Box-Jenkins metod
Page 112 and 113: Standardavvik 600 550 500 450 400 S
Page 114 and 115: 114 AR-parametre og q MA-parametre
Page 116 and 117: 116 Figur 13 Autokorrelasjonsfunksj
Page 118 and 119: 118 Korrelasjonsverdi Vi ser av fig
Page 120 and 121: 120 Aksepter hypotesen om at parame
Page 122 and 123: Residualer 0.4 0.3 0.2 0.1 122 0 -0
Page 124 and 125: 124 Referanser 1 Stordahl, K, Hjelk
Page 126 and 127: Tabell 1 Volum tellerskritt, abonne
Page 128 and 129: 128 Tabell 3a Prognose fra modell b
Page 134 and 135: 001.18:621.39 134 Prognoser for abo
Page 136 and 137: 136 Tabell 3 Analyse av støyledden
Page 138 and 139: 138 Tabell 5 Utskrift av prognosepr
Page 140 and 141:
vi ikke diskutere her. Poenget er
Page 142 and 143:
142 prognosen. Da “beskjæres”
Page 144 and 145:
144 7 Stordahl, K. Prognosemetoder:
Page 146 and 147:
Tabell 1 Oversikt over takstklassen
Page 148 and 149:
148 Tabell 5 Antall samtalesekunder
Page 150 and 151:
150 a) (x1000) 45 35 25 15 5 (x1000
Page 152 and 153:
152 Tabell 8 viser de avleste telle
Page 154 and 155:
154 Tabell 11 Komplett datasett med
Page 156 and 157:
001.18:621.39 156 Prognoser for nye
Page 158 and 159:
158 3.1 Vurderinger av foreliggende
Page 160 and 161:
160 passer utmerket, med relativt l
Page 162 and 163:
2B+D aksesser (x1000) 7 6 5 4 3 2 1
Page 164 and 165:
164 (x1000) 10 8 6 4 2 0 Tabell 6 I
Page 166 and 167:
001.18:621.39 166 Prognoser for pri
Page 168 and 169:
168 der ˆσ β* = ˆσ = ˆy t =
Page 170 and 171:
n r (t) 90 % 10 170 1,00 0,80 0,60
Page 172 and 173:
ønsker å benytte disse metodene f
Page 174 and 175:
174 Remote router/ Bridge hand, the
Page 176 and 177:
176 Figure 5 ATM cell Bridge 48 byt
Page 178 and 179:
178 DTE less than 2 Mbit/s, Frame R
Page 180 and 181:
180 References 1 Mannsåker, B et a
Page 182 and 183:
182 Table of contents page Introduc
Page 184 and 185:
006 621.391 184 Signal processing B
Page 186 and 187:
006:681.324 006:681.327.8 186 Data
Page 188 and 189:
006 621.39 188 Teletraffic and dime
Page 190 and 191:
190 contractor. The project had a b
Page 192 and 193:
Table 2 ITU Recommendations for con
Page 194 and 195:
006 654.01:65 194 Telecommunication
Page 196 and 197:
006 196 Introduction EURESCOM is an
Page 198:
198 Intelligent networks 26 % Infra
show all

Prognosemetoder – en oversikt - Telenor

Create successful ePaper yourself

Delete template?

Save as template?