Serie storiche
Serie storiche
Serie storiche
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
<strong>Serie</strong> <strong>storiche</strong><br />
Danilo Cavapozzi<br />
danilo.cavapozzi@unipd.it<br />
In tutte le scorse esercitazioni abbiamo utilizzato dati cross-section<br />
che riguardavano campioni rappresentativi di persone o imprese 1 .<br />
• Non era possibile in nessun modo creare un ordinamento<br />
temporale tra le diverse osservazioni;<br />
• Se cambiavamo l’ordine delle osservazioni nel dataset, i<br />
risultati rimanevano identici.<br />
In questa esercitazione prenderemo in considerazione le serie<br />
<strong>storiche</strong>.<br />
• Le serie <strong>storiche</strong> permettono di studiare l’evoluzione<br />
temporale di un fenomeno, ad esempio, la disoccupazione, il<br />
PIL, il prezzo di un titolo azionario;<br />
• L’ordinamento delle osservazioni è fondamentale.<br />
I dati a cui facciamo riferimento mostrano le serie giornaliere di<br />
prezzi di titoli quotati presso la Borsa Valori di Milano e<br />
dell’indice Mibtel, che ha lo scopo di riassumere l’andamento del<br />
mercato azionario.<br />
• I dati fanno riferimento a tutto il biennio 2006-2007 (dal 2<br />
gennaio 2006 al 31 dicembre 2007);<br />
1 Questi appunti sono le tracce delle esercitazioni con il software gretl (http://gretl.sourceforge.net/gretl_italiano.html)<br />
realizzate per il corso di Econometria della Facoltà di Economia dell’Università di Brescia, A.A. 2011-2012. Alla<br />
pagina web http://www.decon.unipd.it/personale/curri/cavapozzi/eco_11.html trovate il materiale relativo alle<br />
esercitazioni di questo corso. (versione del 05/12/2011)<br />
1
• L’unità di tempo di riferimento è il giorno. Si considerano<br />
solo i giorni in cui i mercati azionari sono aperti<br />
(generalmente 5 giorni a settimana).<br />
Consideriamo la serie storica relativa al titolo espresso e<br />
calcoliamone il grafico.<br />
• Clicchiamo con il tasto destro e selezioniamo Grafico serie<br />
storica.<br />
Il grafico mostra chiaramente che la serie storica del titolo ha un<br />
trend decrescente.<br />
• Questo è incompatibile con l’ipotesi di stazionarietà alla base<br />
dei modelli che utilizzeremo. Per risolvere questo problema,<br />
calcoliamo le differenze prime della serie espresso;<br />
• Andiamo su Aggiungi e selezioniamo Differenze delle<br />
variabili selezionate. Apparirà una nuova variabile chiamata<br />
d_espresso;<br />
o La differenza prima del titolo espresso al tempo t è<br />
definita come espressot-espressot-1.<br />
• Per pura comodità, generiamo nello stesso modo la differenza<br />
prima della serie storica dell’indice mibtel (la utilizzeremo<br />
più avanti), che verrà salvata nella variabile d_mibtel.<br />
2
La serie differenziata oscilla intorno ad un valore<br />
approssimativamente costante lungo tutto il periodo di riferimento.<br />
Questo supporta l’ipotesi di stazionarietà. Nel resto della nostra<br />
analisi ci concentreremo su questa serie storica.<br />
• Il grafico di una serie storica può essere utile a livello<br />
intuitivo per capire se l’ipotesi di stazionarietà vale o meno,<br />
ma NON è un test formale dell’assunzione di stazionarietà.<br />
Il nostro obiettivo è costruire un modello che ci permetta di<br />
prevedere l’andamento futuro della serie storica d_espresso sulla<br />
base del suo passato.<br />
• Prevedere le differenze prime del titolo espresso permette di<br />
derivare i valori futuri del titolo stesso.<br />
• Supponiamo di osservare i prezzi del titolo espresso fino al<br />
tempo t. Se voglio stimare il prezzo del titolo al tempo t+1,<br />
stimare la differenza tra espressot+1 ed espressot permette di<br />
ottenere una stima di espressot+1 perché espressot è noto.<br />
∆espressot=espressot-espressot-1<br />
∆espressot+1=espressot+1-espressot<br />
espressot+1=espressot+∆espressot+1<br />
3
Calcoliamo l’autocorrelazione gloabale e l’autocorrelazione<br />
parziale di d_espresso selezionando questa variabile, cliccando<br />
con il tasto destro e scegliendo l’opzione Correlogramma.<br />
Funzione di autocorrelazione per d_ESPRESSO<br />
LAG ACF PACF Q-stat. [p-value]<br />
1 -0,0560 -0,0560 1,6401 [0,200]<br />
2 0,1251 *** 0,1223 *** 9,8353 [0,007]<br />
3 0,0003 0,0136 9,8354 [0,020]<br />
4 0,0598 0,0461 11,7185 [0,020]<br />
5 -0,0529 -0,0503 13,1962 [0,022]<br />
6 -0,0540 -0,0736 * 14,7347 [0,022]<br />
7 -0,0458 -0,0423 15,8469 [0,027]<br />
8 0,0143 0,0242 15,9558 [0,043]<br />
9 -0,0510 -0,0320 17,3359 [0,044]<br />
10 -0,0300 -0,0342 17,8163 [0,058]<br />
11 -0,0912 ** -0,0900 ** 22,2514 [0,022]<br />
12 0,0292 0,0183 22,7063 [0,030]<br />
13 -0,0416 -0,0163 23,6309 [0,035]<br />
14 -0,0904 ** -0,1002 ** 28,0166 [0,014]<br />
15 0,0043 0,0016 28,0267 [0,021]<br />
16 0,0150 0,0200 28,1474 [0,030]<br />
17 0,0223 0,0192 28,4148 [0,040]<br />
18 -0,0529 -0,0552 29,9281 [0,038]<br />
19 0,0044 -0,0205 29,9387 [0,053]<br />
20 0,0113 -0,0022 30,0084 [0,070]<br />
21 -0,0166 -0,0239 30,1583 [0,089]<br />
22 0,0281 0,0310 30,5889 [0,105]<br />
23 -0,0243 -0,0238 30,9108 [0,125]<br />
24 0,0075 -0,0227 30,9414 [0,155]<br />
25 0,0446 0,0342 32,0328 [0,157]<br />
26 0,0197 0,0327 32,2472 [0,185]<br />
27 0,0073 -0,0022 32,2767 [0,222]<br />
Guardiamo al ritardo di ordine 3 (LAG=3),<br />
La funzione di autocorrelazione globale<br />
(ACF) è pari a 0.0003. Facendo riferimento<br />
al grafico sotto per ACF, questo valore è<br />
riassunto dal "rettangolo rosso" in<br />
corrispondenza del terzo ritardo. Il<br />
"rettangolo rosso" rimane all'interno delle<br />
"bande blu" che delimitano l’intervallo<br />
±1.96/sqrt(T). L'autocorrelazione globale al<br />
terzo ritardo non è quindi statisticamente<br />
diversa da 0 al livello di significatività del<br />
5%. In altre parole, l’autocorrelazione<br />
globale tra un valore della serie (ad esempio<br />
t) ed il suo ritardo di terzo ordine (t-3) non è<br />
significativa.<br />
La funzione di autocorrelazione parziale<br />
(PACF) è pari a 0.0136. Se guardiamo al<br />
grafico sotto per PACF, vediamo che anche<br />
in questo caso il "rettangolo rosso" rimane<br />
all'interno delle "bande blu", indicando che<br />
l'autocorrelazione paraizle al terzo ritardo<br />
non è statisticamente diversa da 0 al livello<br />
di significatività del 5%. Questo risultato ci<br />
dice che, al netto dei ritardi di primo e<br />
secondo ordine, la correlazione tra un<br />
valore della serie (ad esempio t) ed il suo<br />
ritardo di terzo ordine (t-3) non è<br />
significativo.<br />
Q-stat è la statistica di Ljung-Box che<br />
saggia (in questo caso) l’ipotesi nulla che<br />
tutte le autocorrelazioni globali fino al<br />
ritardo 3 siano nulle. L’ipotesi alternativa è<br />
che almeno una di queste autocorrelazioni<br />
globali sia diversa da 0. Questa statistica si<br />
distribuisce (in questo caso) come una chiquadro<br />
con 3 gradi di libertà. Il p-value pari<br />
a 0.020 ci porta a rifiutare l’ipotesi nulla al<br />
5%.<br />
Ai ritardi di ordine 2, 11 e 15 abbiamo<br />
autocorrelazioni globali e parziali<br />
statisticamente significative perché le<br />
“barre rosse”, che indicano i valori delle<br />
autocorrelazioni, escono dalle bande blu,<br />
che delimitano l’intervallo ±1.96/sqrt(T).<br />
4
Stimiamo un modello autoregressivo che ha il valore corrente<br />
della serie storica d_espresso come variabile dipendente ed i suoi<br />
ritardi tra le esplicative.<br />
• Per decidere quanti ritardi utilizzare, prenderemo in<br />
considerazione principalmente i criteri AIC e BIC e R-quadro<br />
corretto, che combinano il numero dei ritardi nel modello con<br />
il numero di osservazioni su cui questo viene stimato;<br />
• L’utilizzo di questi criteri porta ad un compromesso tra la<br />
parsimonia del modello ed il miglioramento dell’adattamento<br />
ai dati che deriva dall’introduzione di un numero sempre<br />
maggiore di regressori.<br />
Assumiamo che il massimo numero di ritardi che vogliamo<br />
includere nel modello sia pari a 4 (scelta puramente arbitraria). Per<br />
decidere quanti ritardi utilizzare, stimiamo sullo stesso campione<br />
una serie di modelli autoregressivi di quarto, terzo, secondo e<br />
primo ordine.<br />
• Restringiamo il campione facendo iniziare la serie storica<br />
coinvolta nella stima 5 periodi di tempo dopo;<br />
• Se non facessi questa operazione, stimerei i modelli su un<br />
numero di osservazioni che diminuisce all’aumentare dei<br />
ritardi inseriti. Ad esempio, il quarto ritardo della differenza<br />
prima sarà pari alla differenza espressot-4-espressot-5. Questa<br />
variabile è definita solo per le osservazioni che hanno almeno<br />
5 osservazioni precedenti;<br />
• Andiamo su Campione/Imposta intervallo e dichiariamo che<br />
l’inizio del periodo di riferimento deve avvenire 5 periodi più<br />
avanti (il 2006/01/09);<br />
• Vedremo che in fondo alla finestra di gretl verrà mostrato che<br />
il campione attuale è ristretto.<br />
Stimiamo un modello autoregressivo di ordine 4 per la serie<br />
storica d_espresso. Andiamo su Modello/OLS e dichiariamo che la<br />
variabile dipendente è d_espresso. Per inserire i ritardi clicchiamo<br />
5
su Ritardi e dichiariamo che vogliamo inserire tutti i ritardi di<br />
d_espresso dal primo al quarto.<br />
• Bisogna assicurarsi che la matrice di varianze e covarianze<br />
dello stimatore sia stimata con il metodo HAC, che tiene<br />
conto dell’autocorrelazione del termine di errore nel modello.<br />
• A meno di non assumere che i 4 ritardi siano sufficienti per<br />
spiegare interamente la determinazione del valore di<br />
d_espresso, è opportuno ammettere che l’errore del modello<br />
di regressione sia autocorrelato.<br />
AR(4)<br />
Modello 12: OLS, usando le osservazioni 2006/01/09-2007/12/31 (T = 516)<br />
Variabile dipendente: d_ESPRESSO<br />
Errori standard HAC, larghezza di banda 6 (Kernel di Bartlett)<br />
coefficiente errore std. rapporto t p-value<br />
----------------------------------------------------------------<br />
const -0,00248696 0,00155298 -1,601 0,1099<br />
d_ESPRESSO_1 -0,0527765 0,0434477 -1,215 0,2250<br />
d_ESPRESSO_2 0,124819 0,0431152 2,895 0,0040 ***<br />
d_ESPRESSO_3 0,0154085 0,0427663 0,3603 0,7188<br />
d_ESPRESSO_4 0,0452496 0,0372630 1,214 0,2252<br />
Media var. dipendente -0,002859 SQM var. dipendente 0,036679<br />
Somma quadr. residui 0,677226 E.S. della regressione 0,036405<br />
R-quadro 0,022545 R-quadro corretto 0,014894<br />
F(4, 511) 2,741177 P-value(F) 0,028066<br />
Log-verosimiglianza 979,8789 Criterio di Akaike -1949,758<br />
Criterio di Schwarz -1928,527 Hannan-Quinn -1941,438<br />
rho 0,002254 Valore h di Durbin 0,306579<br />
Note: SQM = scarto quadratico medio; E.S. = errore standard<br />
Ora vediamo come varia l’adattamento ai dati togliendo un ritardo<br />
alla volta e stimando così modelli autoregressivi di ordine<br />
inferiore.<br />
AR(3)<br />
Modello 13: OLS, usando le osservazioni 2006/01/09-2007/12/31 (T = 516)<br />
Variabile dipendente: d_ESPRESSO<br />
Errori standard HAC, larghezza di banda 6 (Kernel di Bartlett)<br />
coefficiente errore std. rapporto t p-value<br />
----------------------------------------------------------------<br />
const -0,00260149 0,00156446 -1,663 0,0970 *<br />
d_ESPRESSO_1 -0,0521179 0,0433356 -1,203 0,2297<br />
d_ESPRESSO_2 0,130452 0,0442643 2,947 0,0034 ***<br />
d_ESPRESSO_3 0,0130882 0,0433268 0,3021 0,7627<br />
Media var. dipendente -0,002859 SQM var. dipendente 0,036679<br />
6
Somma quadr. residui 0,678640 E.S. della regressione 0,036407<br />
R-quadro 0,020505 R-quadro corretto 0,014766<br />
F(3, 512) 3,102859 P-value(F) 0,026337<br />
Log-verosimiglianza 979,3409 Criterio di Akaike -1950,682<br />
Criterio di Schwarz -1933,697 Hannan-Quinn -1944,026<br />
rho -0,000743 Valore h di Durbin -0,093047<br />
Note: SQM = scarto quadratico medio; E.S. = errore standard<br />
AR(2)<br />
Modello 14: OLS, usando le osservazioni 2006/01/09-2007/12/31 (T = 516)<br />
Variabile dipendente: d_ESPRESSO<br />
Errori standard HAC, larghezza di banda 6 (Kernel di Bartlett)<br />
coefficiente errore std. rapporto t p-value<br />
----------------------------------------------------------------<br />
const -0,00263443 0,00158346 -1,664 0,0968 *<br />
d_ESPRESSO_1 -0,0504727 0,0441905 -1,142 0,2539<br />
d_ESPRESSO_2 0,129834 0,0441840 2,938 0,0034 ***<br />
Media var. dipendente -0,002859 SQM var. dipendente 0,036679<br />
Somma quadr. residui 0,678758 E.S. della regressione 0,036375<br />
R-quadro 0,020334 R-quadro corretto 0,016515<br />
F(2, 513) 4,534551 P-value(F) 0,011165<br />
Log-verosimiglianza 979,2959 Criterio di Akaike -1952,592<br />
Criterio di Schwarz -1939,854 Hannan-Quinn -1947,600<br />
rho -0,001787 Durbin-Watson 2,000236<br />
AR(1)<br />
Modello 16: OLS, usando le osservazioni 2006/01/09-2007/12/31 (T = 516)<br />
Variabile dipendente: d_ESPRESSO<br />
Errori standard HAC, larghezza di banda 6 (Kernel di Bartlett)<br />
coefficiente errore std. rapporto t p-value<br />
----------------------------------------------------------------<br />
const -0,00303673 0,00176032 -1,725 0,0851 *<br />
d_ESPRESSO_1 -0,0586608 0,0503737 -1,165 0,2448<br />
Media var. dipendente -0,002859 SQM var. dipendente 0,036679<br />
Somma quadr. residui 0,690463 E.S. della regressione 0,036651<br />
R-quadro 0,003440 R-quadro corretto 0,001501<br />
F(1, 514) 1,356090 P-value(F) 0,244757<br />
Log-verosimiglianza 974,8846 Criterio di Akaike -1945,769<br />
Criterio di Schwarz -1937,277 Hannan-Quinn -1942,441<br />
rho 0,008143 Durbin-Watson 1,980360<br />
Note: SQM = scarto quadratico medio; E.S. = errore standard<br />
Il modello autoregressivo di secondo ordine minimizza i criteri<br />
AIC, BIC e massimizza il criterio R-quadro corretto 2 . Questo<br />
modello realizza il miglior compromesso tra adattamento ai dati e<br />
parsimonia della specificazione 3 .<br />
2 Non sempre si arriva ad una situazione in cui una specificazione minimizza AIC e BIC e massimizza R-quadro<br />
corretto. Ad esempio, se si fosse dovuto scegliere tra i soli modelli AR(3) e AR(4), si poteva optare per AR(3) alla luce<br />
del fatto che questa specificazione minimizzava i criteri AIC e BIC ed il ritardo di ordine 4 non era significativo.<br />
3 Se avessimo per esempio guardato ad R-quadro, che non premia la parsimonia del modello, avremmo dovuto scegliere<br />
il modello autoregressivo di quarto ordine.<br />
7
Supponiamo ora che voglia utilizzare il modello AR(2) stimato<br />
per prevedere l’andamento della serie storica d_espresso nei 5<br />
periodi di tempo successivi alla fine della finestra temporale per<br />
cui osservo la serie storica.<br />
• Andiamo su Analisi/Previsione e dichiariamo che vogliamo<br />
inserire 5 nuove osservazioni.<br />
• Selezioniamo la modalità previsione automatica e<br />
dichiariamo che vogliamo disegnare l’intervallo di<br />
confidenza attraverso le Linee di confidenza.<br />
o Ricordate che l’intervallo di confidenza si basa<br />
sull’assunzione di normalità dell’errore (che poi<br />
verificheremo). Se questa assunzione non è supportata,<br />
l’intervallo di confidenza non è valido.<br />
Il grafico mostra in rosso i valori osservati, in blu quelli predetti<br />
ed in verde gli estremi degli intervalli di confidenza al 95% delle<br />
previsioni.<br />
• Il confronto tra valori osservati e predetti per il periodo su cui<br />
abbiamo stimato la serie storica è una misura<br />
dell’adattamento del modello ai dati;<br />
• Entrambe le serie <strong>storiche</strong> oscillano intorno<br />
(approssimativamente) allo 0 grazie all’inclusione della<br />
costante nella specificazione. Tuttavia, i picchi positivi e<br />
8
negativi dei valori osservati non sono replicati dai valori<br />
predetti, come potevamo aspettarci visto il basso R-quadro<br />
ottenuto.<br />
Andiamo ora a verificare se l’errore del modello si distribuisce<br />
effettivamente secondo una normale.<br />
• Salvo i residui del modello nella variabile resid.<br />
• Il grafico dei residui mostra che la loro distribuzione<br />
campionaria è concentrata intorno allo 0. Tuttavia, il test di<br />
normalità riportato (di Doornik-Hansen, che combina gli<br />
indici di asimmetria e curtosi) porta a rifiutare l’ipotesi nulla<br />
che i residui si distribuiscono secondo una normale;<br />
• Questo risultato mostra che gli intervalli di confidenza della<br />
previsione che abbiamo visto prima non sono corretti perché<br />
si basavano sull’assunzione di normalità degli errori del<br />
modello, di cui i residui sono stime;<br />
• L’inferenza sui parametri del modello può invece essere<br />
sviluppata utilizzando tutti i risultati asintotici visti nel corso.<br />
Il correlogramma dei residui mostra autocorrelazioni globali e<br />
parziali significative ai ritardi 6 e 14.<br />
• Questo risultato ci porta a pensare che gli errori del modello<br />
siano autocorrelati e supporta la scelta di utilizzare lo<br />
9
stimatore HAC per la matrice di varianze e covarianze dello<br />
stimatore dei parametri sulle esplicative del modello.<br />
Ora andiamo a verificare formalmente se la serie storica<br />
d_espresso possa essere ritenuta stazionaria o meno. L’ipotesi di<br />
stazionarietà è alla base dei modelli autoregressivi che abbiamo<br />
utilizzato.<br />
Una prima fonte di non stazionarietà può derivare dalla presenza<br />
di radici unitarie. Effettuiamo il test Augmented Dickey-Fuller.<br />
• Questo test consiste nel regredire la differenza prima della<br />
serie (nel nostro caso la differenza prima di d_espresso) su<br />
costante, valore ritardato della serie storica (nel nostro caso il<br />
ritardo di d_espresso) ed una serie di ritardi delle differenze<br />
prima della serie (nel nostro caso i ritardi delle differenze<br />
prime di d_espresso);<br />
o In alternativa, si può aggiungere a questo set di<br />
esplicative anche un trend temporale.<br />
• La statistica test da considerare è la statistica t sul parametro<br />
del valore ritardato della serie. In questo caso però la<br />
statistica t non ha distribuzione normale ed i valori critici<br />
devono essere calcolati ad hoc;<br />
• Selezioniamo la variabile d_espresso, andiamo su<br />
Variabile/Test per radice unitaria/Test Dickey-Fuller<br />
10
aumentato. Effettuiamo il test alternativamente sia con la sola<br />
costante che con costante e trend.<br />
• L’ipotesi nulla di questo test è che la serie storica d_espresso<br />
abbia radici unitarie. L’ipotesi alternativa è l’assenza di radici<br />
unitarie.<br />
Augmented Dickey-Fuller test for d_ESPRESSO<br />
inclusi 13 ritardi di (1-L)d_ESPRESSO (max was 18)<br />
Ampiezza campionaria 506<br />
Ipotesi nulla di radice unitaria: a = 1<br />
Test con costante<br />
Modello: (1-L)y = b0 + (a-1)*y(-1) + ... + e<br />
Coefficiente di autocorrelazione del prim'ordine per e: 0,000<br />
differenze ritardate: F(13, 491) = 1,935 [0,0245]<br />
Valore stimato di (a - 1): -1,25476<br />
Statistica test: tau_c(1) = -7,52925<br />
p-value asintotico 1,136e-011<br />
Con costante e trend<br />
Modello: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e<br />
Coefficiente di autocorrelazione del prim'ordine per e: -0,000<br />
differenze ritardate: F(13, 490) = 1,945 [0,0235]<br />
Valore stimato di (a - 1): -1,27472<br />
Statistica test: tau_ct(1) = -7,61222<br />
p-value asintotico 3,495e-011<br />
Il p-value ci porta a rifiutare l’ipotesi nulla di presenza di radici<br />
unitarie in entrambi i casi.<br />
• Questi risultati sono in linea con il grafico della serie storica<br />
d_espresso visto prima, dove non erano visibili trend.<br />
Proviamo a rifare lo stesso test, ma guardando direttamente alla<br />
variabile espresso.<br />
• Vogliamo condurre un test formale per verificare la presenza<br />
di radici unitarie in questa serie storica;<br />
• Sulla base del grafico della serie ci aspettavamo la presenza<br />
di un trend negativo.<br />
Augmented Dickey-Fuller test for ESPRESSO<br />
inclusi 14 ritardi di (1-L)ESPRESSO (max was 18)<br />
Ampiezza campionaria 506<br />
11
Ipotesi nulla di radice unitaria: a = 1<br />
Test con costante<br />
Modello: (1-L)y = b0 + (a-1)*y(-1) + ... + e<br />
Coefficiente di autocorrelazione del prim'ordine per e: -0,000<br />
differenze ritardate: F(14, 490) = 2,072 [0,0121]<br />
Valore stimato di (a - 1): 0,00246612<br />
Statistica test: tau_c(1) = 0,456229<br />
p-value asintotico 0,9852<br />
Con costante e trend<br />
Modello: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e<br />
Coefficiente di autocorrelazione del prim'ordine per e: 0,001<br />
differenze ritardate: F(14, 489) = 1,951 [0,0198]<br />
Valore stimato di (a - 1): -0,0153155<br />
Statistica test: tau_ct(1) = -1,29083<br />
p-value asintotico 0,8899<br />
In questo caso invece accetto l’ipotesi nulla di presenza di radici<br />
unitarie. Se avessi stimato i modelli autoregressivi direttamente<br />
sui livelli di espresso, avrei ottenuto risultati non validi in quanto<br />
questi modelli ipotizzano la stazionarietà della serie.<br />
Un ulteriore motivo che può compromettere la stazionarietà della<br />
serie è la presenza di break strutturali dovuti per esempio a crisi<br />
finanziarie o cambi nelle politiche di gestione dell’azienda.<br />
• Questi cambiamenti possono modificare da un certo<br />
momento in avanti la costante o i coefficienti sui ritardi del<br />
modello autoregressivo stimato, rendendoli non invarianti nel<br />
tempo.<br />
Ipotizziamo di volere verificare la presenza di un break strutturale<br />
con punto di rottura (break point) 1 gennaio 2007. Vogliamo<br />
vedere se ci sono differenze nei parametri relativi nel nostro<br />
modello tra il periodo antecedente al 1 gennaio 2007 e quello<br />
successivo.<br />
• Andiamo su Test/Chow BREAK strutturale ed inseriamo la<br />
data del punto di rottura.<br />
12
Il test prevede la stima di un ulteriore modello che alle variabili<br />
esplicative già incluse aggiunge<br />
• una dummy che vale 1 per tutte le osservazioni successive al<br />
1 gennaio 2007 (compreso) e 0 per quelle precedenti;<br />
• le interazioni tra questa variabile dummy ed i ritardi di<br />
d_espresso.<br />
L’ipotesi nulla del test di stabilità strutturale pone congiuntamente<br />
pari a 0 tutti i parametri delle nuove esplicative aggiunte. Se i<br />
parametri relativi alle nuove variabili inserite non sono<br />
statisticamente significativi, allora non c’è break strutturale ed il<br />
nostro modello iniziale è appropriato per studiare l’andamento<br />
della serie storica in entrambi i periodi.<br />
• In altre parole, secondo l’ipotesi nulla costante e parametri<br />
sui ritardi non variano tra il periodo precedente all’1 gennaio<br />
2007 e quello successivo.<br />
• L’ipotesi alternativa invece assume che almeno uno di questi<br />
parametri sia diverso da 0. Se è così, i dati supportano<br />
l’ipotesi che l’1 gennaio 2007 si sia verificato un break<br />
strutturale che ha cambiato la costante o almeno uno dei<br />
parametri sui ritardi.<br />
La statistica test si distribuisce asintoticamente secondo una chiquadro<br />
con gradi di libertà pari al numero di variabili aggiunte nel<br />
modello (nel nostro caso 3).<br />
Regressione aumentata per il test Chow<br />
OLS, usando le osservazioni 2006/01/09-2007/12/31 (T = 516)<br />
Variabile dipendente: d_ESPRESSO<br />
Errori standard HAC, larghezza di banda 6 (Kernel di Bartlett)<br />
coefficiente errore std. rapporto t p-value<br />
---------------------------------------------------------------<br />
const -0,00181416 0,00214406 -0,8461 0,3979<br />
d_ESPRESSO_1 -0,0342325 0,0636705 -0,5377 0,5911<br />
d_ESPRESSO_2 0,0577450 0,0562140 1,027 0,3048<br />
splitdum -0,00154595 0,00314311 -0,4919 0,6230<br />
sd_d_ESPRESSO_1 -0,0291007 0,0869532 -0,3347 0,7380<br />
sd_d_ESPRESSO_2 0,130498 0,0852982 1,530 0,1267<br />
Media var. dipendente -0,002859 SQM var. dipendente 0,036679<br />
13
Somma quadr. residui 0,675162 E.S. della regressione 0,036385<br />
R-quadro 0,025523 R-quadro corretto 0,015970<br />
F(5, 510) 2,315247 P-value(F) 0,042645<br />
Log-verosimiglianza 980,6662 Criterio di Akaike -1949,332<br />
Criterio di Schwarz -1923,856 Hannan-Quinn -1939,349<br />
rho 0,002454 Durbin-Watson 1,991644<br />
Note: SQM = scarto quadratico medio; E.S. = errore standard<br />
Test Chow per break strutturale all'osservazione 2007/01/01<br />
Chi-quadro(3) = 2,55447 con p-value 0,4655<br />
Il p-value relativo alla distribuzione chi-quadro porta ad accettare<br />
l’ipotesi nulla che non ci sia un break strutturale avvenuto l’1<br />
gennaio.<br />
• Questo non esclude che non si possano essere verificati altri<br />
punti di rottura in altri istanti di tempo.<br />
Ora vogliamo valutare se l’andamento del mercato finanziario<br />
possa essere una informazione rilevante per predire l’andamento<br />
della serie storica d_espresso.<br />
L’andamento del mercato finanziario può essere riassunto dalla<br />
serie storica dell’indice Mibtel, che raccoglie un vasto numero di<br />
titoli sufficientemente diversificati;<br />
• L’indice Mibtel può essere interpretato come un portafoglio<br />
di mercato;<br />
• Inserire la serie storica mibtel tra le esplicative del modello<br />
ne aumenta la capacità predittiva?<br />
La serie storica di mibtel non pare essere in linea con l’assunzione<br />
di stazionarietà.<br />
14
Inserisco nel modello le differenze prime di questa serie, che sono<br />
state salvate precedentemente in d_mibtel. In aggiunta, inserisco<br />
nel modello anche tutti i ritardi fino al secondo ordine delle<br />
differenze prime.<br />
Modello 5: OLS, usando le osservazioni 2006/01/09-2007/12/31 (T = 516)<br />
Variabile dipendente: d_ESPRESSO<br />
Errori standard HAC, larghezza di banda 6 (Kernel di Bartlett)<br />
coefficiente errore std. rapporto t p-value<br />
--------------------------------------------------------------<br />
const -0,00317269 0,00139184 -2,279 0,0231 **<br />
d_MIBTEL 7,38282e-05 5,99204e-06 12,32 1,02e-030 ***<br />
d_MIBTEL_1 1,43554e-05 5,92576e-06 2,423 0,0158 **<br />
d_MIBTEL_2 1,88210e-06 5,89925e-06 0,3190 0,7498<br />
d_ESPRESSO_1 -0,0758190 0,0474423 -1,598 0,1106<br />
d_ESPRESSO_2 0,0992680 0,0376798 2,635 0,0087 ***<br />
Media var. dipendente -0,002859 SQM var. dipendente 0,036679<br />
Somma quadr. residui 0,499736 E.S. della regressione 0,031303<br />
R-quadro 0,278720 R-quadro corretto 0,271648<br />
F(5, 510) 40,70387 P-value(F) 3,09e-35<br />
Log-verosimiglianza 1058,291 Criterio di Akaike -2104,583<br />
Criterio di Schwarz -2079,106 Hannan-Quinn -2094,599<br />
rho -0,002187 Durbin-Watson 2,001839<br />
Note: SQM = scarto quadratico medio; E.S. = errore standard<br />
Per verificare se nel complesso l’informazione riguardante il<br />
portafoglio di mercato contribuisce ad aumentare la capacità<br />
predittiva del modello devo condurre il test di causalità di<br />
Granger.<br />
Questo test consiste nel verificare la significatività congiunta delle<br />
differenze prime di mibtel e di tutti i loro ritardi.<br />
15
• L’ipotesi nulla è che i parametri relativi a d_MIBTEL,<br />
d_MIBTEL_1 e d_MIBTEL_2 siano congiuntamente pari a 0.<br />
L’ipotesi alternativa è che almeno uno di questi parametri<br />
non sia pari a 0.<br />
La statistica test ha come sempre una distribuzione chi-quadro con<br />
gradi di libertà pari al numero di variabili di cui stiamo testando la<br />
significatività congiunta.<br />
• Se questo test viene effettuato con il comando Test/Omit,<br />
bisogna selezionare l’opzione Test di Wald perché vogliamo<br />
sfruttare la stima della matrice di varianze e covarianze<br />
ottenuta con lo stimatore HAC.<br />
Ipotesi nulla: i parametri della regressione valgono zero per le<br />
variabili<br />
d_MIBTEL, d_MIBTEL_1, d_MIBTEL_2<br />
Statistica test asintotica:<br />
Chi-quadro di Wald(3) = 159,726, con p-value = 2,1002e-034<br />
L’ipotesi nulla è rifiutata. In particolare, possiamo vedere che<br />
questo risultato è guidato principalmente dalla significatività dei<br />
parametri relativi a d_MIBTEL e d_MIBTEL_1.<br />
• L’informazione relativa alle differenze prime dell’indice<br />
Mibtel ed ai loro ritardi aumenta significativamente la<br />
capacità predittiva del modello.<br />
• Le variabili che abbiamo aggiunto sono significativamente<br />
correlate con il valore corrente di d_espresso, anche se ci<br />
condizioniamo ai suoi ritardi di ordine 1 e 2.<br />
• Questo risultato è statisticamente valido ma nulla ci dice<br />
circa la relazione tra rendimenti del titolo espresso e<br />
rendimenti del mercato.<br />
Il modello teorico che permette di capire come i rendimenti di un<br />
titolo rischioso variano con quelli del mercato si chiama Capital<br />
Asset Pricing Model (CAPM).<br />
16
Definiamo i rendimenti giornalieri rt di un titolo a partire dal suo<br />
prezzo giornaliero pt utilizzando la formula<br />
Δ ln(<br />
⎛<br />
⎜<br />
⎝<br />
p<br />
⎞<br />
⎟<br />
⎠<br />
t<br />
t<br />
t t−1<br />
t t−1<br />
p t ) = ln( pt<br />
) − ln( pt<br />
−1)<br />
= ln<br />
⎜<br />
=<br />
=<br />
≅ =<br />
p ⎟<br />
ln<br />
⎜<br />
−1<br />
+ 1<br />
t p ⎟<br />
ln<br />
⎜<br />
+ 1<br />
t<br />
p ⎟<br />
−1<br />
−1<br />
t−1<br />
pt<br />
−1<br />
Il CAPM definisce la seguente equazione fondamentale<br />
⎛<br />
⎜<br />
⎝<br />
( r r ) ( r r )<br />
p<br />
− = α + β − + η<br />
i F M F i<br />
t i i t t<br />
• r F è il rendimento giornaliero dei titoli non rischiosi, che può<br />
essere ragionevolmente posto pari a 0;<br />
• αi misura la differenza nel rendimento medio del titolo i al<br />
tempo t rispetto al rendimento del mercato;<br />
o Un valore positivo (negativo) di αi indica un eccesso<br />
(difetto) di rendimento medio del titolo rispetto al<br />
rendimento del mercato.<br />
• βi misura la sensibilità del titolo i rispetto ai movimenti del<br />
mercato.<br />
o Un βi inferiore a 1 indica che il titolo i è difensivo (cioè<br />
attenua i movimenti del mercato);<br />
o Un βi superiore a 1 indica che il titolo i è aggressivo<br />
(cioè amplifica i movimenti del mercato);<br />
o Un βi pari a 1 indica invece una variabilità dei<br />
rendimenti in linea con quella del mercato.<br />
Per stimare l’equazione del CAPM per il titolo espresso dobbiamo<br />
prima di tutto definire i rendimenti di questo titolo e quelli del<br />
portafoglio di mercato, che come prima descriviamo attraverso la<br />
serie mibtel.<br />
• Selezioniamo espresso ed andiamo su Aggiungi/Differenze<br />
logaritmiche delle variabili selezionate. Facciamo lo stesso<br />
con mibtel.<br />
⎞<br />
⎟<br />
⎠<br />
⎛ p<br />
⎜<br />
⎝<br />
− p<br />
⎞<br />
⎟<br />
⎠<br />
p<br />
− p<br />
r<br />
t<br />
17
• Le due nuove variabili si chiameranno rispettivamente<br />
ld_espresso e ld_mibtel.<br />
Stimiamo l’equazione del CAPM selezionando Modello/OLS<br />
specificando un modello avente come variabile dipendente<br />
ld_espresso e come variabili esplicative la costante e ld_mibtel.<br />
Modello 2: OLS, usando le osservazioni 2006/01/09-2007/12/31 (T = 516)<br />
Variabile dipendente: ld_ESPRESSO<br />
Errori standard HAC, larghezza di banda 6 (Kernel di Bartlett)<br />
coefficiente errore std. rapporto t p-value<br />
---------------------------------------------------------------<br />
const -0,000849581 0,000363464 -2,337 0,0198 **<br />
ld_MIBTEL 0,576885 0,0464181 12,43 3,43e-031 ***<br />
Media var. dipendente -0,000763 SQM var. dipendente 0,009451<br />
Somma quadr. residui 0,033947 E.S. della regressione 0,008127<br />
R-quadro 0,262012 R-quadro corretto 0,260576<br />
F(1, 514) 154,4557 P-value(F) 3,43e-31<br />
Log-verosimiglianza 1752,123 Criterio di Akaike -3500,246<br />
Criterio di Schwarz -3491,754 Hannan-Quinn -3496,918<br />
rho -0,085180 Durbin-Watson 2,165052<br />
Note: SQM = scarto quadratico medio; E.S. = errore standard<br />
La stima della costante è una stima del parametro α del CAPM.<br />
• Verifico il sistema di ipotesi H0: α=0, H1: α
• In particolare, il rendimento medio del titolo espresso è<br />
inferiore a quello di mercato di 0.08(=100*(0.000849581))<br />
punti percentuali.<br />
La stima del parametro relativo a ld_mibtel è una stima del<br />
coefficiente βld_mibtel dell'equazione fondamentale del CAPM.<br />
• La stima puntuale di βld_mibtel è inferiore a 1;<br />
• Verifico il sistema di ipotesi H0: βld_mibtel=1, H1: βld_mibtel
Per verificare questa ipotesi devo effettuare nuovamente un test di<br />
stabilità strutturale.<br />
• L’ipotesi nulla prevede che costante e parametro relativo a<br />
ld_mibtel non varino tra il periodo antecedente al 30 marzo<br />
2007 ed il periodo successivo;<br />
• L’ipotesi alternativa prevede invece che almeno uno dei due<br />
parametri vari.<br />
Analogamente a prima, vengono inserite nel modello<br />
• una dummy che vale 1 per tutte le osservazioni successive al<br />
30 marzo 2007 (compreso) e 0 per quelle precdenti;<br />
• l’interazione tra questa variabile dummy e ld_mibtel.<br />
• Se queste due variabili sono congiuntamente non<br />
significative, l’ipotesi nulla è accettata.<br />
Nel nostro caso la statistica test si distribuisce asintoticamente<br />
secondo una chi-quadro con due gradi di libertà.<br />
Regressione aumentata per il test Chow<br />
OLS, usando le osservazioni 2006/01/09-2007/12/31 (T = 516)<br />
Variabile dipendente: ld_ESPRESSO<br />
Errori standard HAC, larghezza di banda 6 (Kernel di Bartlett)<br />
coefficiente errore std. rapporto t p-value<br />
--------------------------------------------------------------<br />
const -0,000732545 0,000397308 -1,844 0,0658 *<br />
ld_MIBTEL 0,608675 0,0620387 9,811 6,16e-021 ***<br />
splitdum -0,000350749 0,000808660 -0,4337 0,6647<br />
sd_ld_MIBTEL -0,0719411 0,0915287 -0,7860 0,4322<br />
Media var. dipendente -0,000763 SQM var. dipendente 0,009451<br />
Somma quadr. residui 0,033886 E.S. della regressione 0,008135<br />
R-quadro 0,263344 R-quadro corretto 0,259028<br />
F(3, 512) 53,54939 P-value(F) 4,06e-30<br />
Log-verosimiglianza 1752,589 Criterio di Akaike -3497,178<br />
Criterio di Schwarz -3480,194 Hannan-Quinn -3490,523<br />
rho -0,084555 Durbin-Watson 2,163364<br />
Note: SQM = scarto quadratico medio; E.S. = errore standard<br />
Test Chow per break strutturale all'osservazione 2007/03/30<br />
Chi-quadro(2) = 0,949279 con p-value 0,6221<br />
Il p-value mi porta ad accettare l’ipotesi nulla di stabilità<br />
strutturale.<br />
20