20.05.2013 Views

Serie storiche

Serie storiche

Serie storiche

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Serie</strong> <strong>storiche</strong><br />

Danilo Cavapozzi<br />

danilo.cavapozzi@unipd.it<br />

In tutte le scorse esercitazioni abbiamo utilizzato dati cross-section<br />

che riguardavano campioni rappresentativi di persone o imprese 1 .<br />

• Non era possibile in nessun modo creare un ordinamento<br />

temporale tra le diverse osservazioni;<br />

• Se cambiavamo l’ordine delle osservazioni nel dataset, i<br />

risultati rimanevano identici.<br />

In questa esercitazione prenderemo in considerazione le serie<br />

<strong>storiche</strong>.<br />

• Le serie <strong>storiche</strong> permettono di studiare l’evoluzione<br />

temporale di un fenomeno, ad esempio, la disoccupazione, il<br />

PIL, il prezzo di un titolo azionario;<br />

• L’ordinamento delle osservazioni è fondamentale.<br />

I dati a cui facciamo riferimento mostrano le serie giornaliere di<br />

prezzi di titoli quotati presso la Borsa Valori di Milano e<br />

dell’indice Mibtel, che ha lo scopo di riassumere l’andamento del<br />

mercato azionario.<br />

• I dati fanno riferimento a tutto il biennio 2006-2007 (dal 2<br />

gennaio 2006 al 31 dicembre 2007);<br />

1 Questi appunti sono le tracce delle esercitazioni con il software gretl (http://gretl.sourceforge.net/gretl_italiano.html)<br />

realizzate per il corso di Econometria della Facoltà di Economia dell’Università di Brescia, A.A. 2011-2012. Alla<br />

pagina web http://www.decon.unipd.it/personale/curri/cavapozzi/eco_11.html trovate il materiale relativo alle<br />

esercitazioni di questo corso. (versione del 05/12/2011)<br />

1


• L’unità di tempo di riferimento è il giorno. Si considerano<br />

solo i giorni in cui i mercati azionari sono aperti<br />

(generalmente 5 giorni a settimana).<br />

Consideriamo la serie storica relativa al titolo espresso e<br />

calcoliamone il grafico.<br />

• Clicchiamo con il tasto destro e selezioniamo Grafico serie<br />

storica.<br />

Il grafico mostra chiaramente che la serie storica del titolo ha un<br />

trend decrescente.<br />

• Questo è incompatibile con l’ipotesi di stazionarietà alla base<br />

dei modelli che utilizzeremo. Per risolvere questo problema,<br />

calcoliamo le differenze prime della serie espresso;<br />

• Andiamo su Aggiungi e selezioniamo Differenze delle<br />

variabili selezionate. Apparirà una nuova variabile chiamata<br />

d_espresso;<br />

o La differenza prima del titolo espresso al tempo t è<br />

definita come espressot-espressot-1.<br />

• Per pura comodità, generiamo nello stesso modo la differenza<br />

prima della serie storica dell’indice mibtel (la utilizzeremo<br />

più avanti), che verrà salvata nella variabile d_mibtel.<br />

2


La serie differenziata oscilla intorno ad un valore<br />

approssimativamente costante lungo tutto il periodo di riferimento.<br />

Questo supporta l’ipotesi di stazionarietà. Nel resto della nostra<br />

analisi ci concentreremo su questa serie storica.<br />

• Il grafico di una serie storica può essere utile a livello<br />

intuitivo per capire se l’ipotesi di stazionarietà vale o meno,<br />

ma NON è un test formale dell’assunzione di stazionarietà.<br />

Il nostro obiettivo è costruire un modello che ci permetta di<br />

prevedere l’andamento futuro della serie storica d_espresso sulla<br />

base del suo passato.<br />

• Prevedere le differenze prime del titolo espresso permette di<br />

derivare i valori futuri del titolo stesso.<br />

• Supponiamo di osservare i prezzi del titolo espresso fino al<br />

tempo t. Se voglio stimare il prezzo del titolo al tempo t+1,<br />

stimare la differenza tra espressot+1 ed espressot permette di<br />

ottenere una stima di espressot+1 perché espressot è noto.<br />

∆espressot=espressot-espressot-1<br />

∆espressot+1=espressot+1-espressot<br />

espressot+1=espressot+∆espressot+1<br />

3


Calcoliamo l’autocorrelazione gloabale e l’autocorrelazione<br />

parziale di d_espresso selezionando questa variabile, cliccando<br />

con il tasto destro e scegliendo l’opzione Correlogramma.<br />

Funzione di autocorrelazione per d_ESPRESSO<br />

LAG ACF PACF Q-stat. [p-value]<br />

1 -0,0560 -0,0560 1,6401 [0,200]<br />

2 0,1251 *** 0,1223 *** 9,8353 [0,007]<br />

3 0,0003 0,0136 9,8354 [0,020]<br />

4 0,0598 0,0461 11,7185 [0,020]<br />

5 -0,0529 -0,0503 13,1962 [0,022]<br />

6 -0,0540 -0,0736 * 14,7347 [0,022]<br />

7 -0,0458 -0,0423 15,8469 [0,027]<br />

8 0,0143 0,0242 15,9558 [0,043]<br />

9 -0,0510 -0,0320 17,3359 [0,044]<br />

10 -0,0300 -0,0342 17,8163 [0,058]<br />

11 -0,0912 ** -0,0900 ** 22,2514 [0,022]<br />

12 0,0292 0,0183 22,7063 [0,030]<br />

13 -0,0416 -0,0163 23,6309 [0,035]<br />

14 -0,0904 ** -0,1002 ** 28,0166 [0,014]<br />

15 0,0043 0,0016 28,0267 [0,021]<br />

16 0,0150 0,0200 28,1474 [0,030]<br />

17 0,0223 0,0192 28,4148 [0,040]<br />

18 -0,0529 -0,0552 29,9281 [0,038]<br />

19 0,0044 -0,0205 29,9387 [0,053]<br />

20 0,0113 -0,0022 30,0084 [0,070]<br />

21 -0,0166 -0,0239 30,1583 [0,089]<br />

22 0,0281 0,0310 30,5889 [0,105]<br />

23 -0,0243 -0,0238 30,9108 [0,125]<br />

24 0,0075 -0,0227 30,9414 [0,155]<br />

25 0,0446 0,0342 32,0328 [0,157]<br />

26 0,0197 0,0327 32,2472 [0,185]<br />

27 0,0073 -0,0022 32,2767 [0,222]<br />

Guardiamo al ritardo di ordine 3 (LAG=3),<br />

La funzione di autocorrelazione globale<br />

(ACF) è pari a 0.0003. Facendo riferimento<br />

al grafico sotto per ACF, questo valore è<br />

riassunto dal "rettangolo rosso" in<br />

corrispondenza del terzo ritardo. Il<br />

"rettangolo rosso" rimane all'interno delle<br />

"bande blu" che delimitano l’intervallo<br />

±1.96/sqrt(T). L'autocorrelazione globale al<br />

terzo ritardo non è quindi statisticamente<br />

diversa da 0 al livello di significatività del<br />

5%. In altre parole, l’autocorrelazione<br />

globale tra un valore della serie (ad esempio<br />

t) ed il suo ritardo di terzo ordine (t-3) non è<br />

significativa.<br />

La funzione di autocorrelazione parziale<br />

(PACF) è pari a 0.0136. Se guardiamo al<br />

grafico sotto per PACF, vediamo che anche<br />

in questo caso il "rettangolo rosso" rimane<br />

all'interno delle "bande blu", indicando che<br />

l'autocorrelazione paraizle al terzo ritardo<br />

non è statisticamente diversa da 0 al livello<br />

di significatività del 5%. Questo risultato ci<br />

dice che, al netto dei ritardi di primo e<br />

secondo ordine, la correlazione tra un<br />

valore della serie (ad esempio t) ed il suo<br />

ritardo di terzo ordine (t-3) non è<br />

significativo.<br />

Q-stat è la statistica di Ljung-Box che<br />

saggia (in questo caso) l’ipotesi nulla che<br />

tutte le autocorrelazioni globali fino al<br />

ritardo 3 siano nulle. L’ipotesi alternativa è<br />

che almeno una di queste autocorrelazioni<br />

globali sia diversa da 0. Questa statistica si<br />

distribuisce (in questo caso) come una chiquadro<br />

con 3 gradi di libertà. Il p-value pari<br />

a 0.020 ci porta a rifiutare l’ipotesi nulla al<br />

5%.<br />

Ai ritardi di ordine 2, 11 e 15 abbiamo<br />

autocorrelazioni globali e parziali<br />

statisticamente significative perché le<br />

“barre rosse”, che indicano i valori delle<br />

autocorrelazioni, escono dalle bande blu,<br />

che delimitano l’intervallo ±1.96/sqrt(T).<br />

4


Stimiamo un modello autoregressivo che ha il valore corrente<br />

della serie storica d_espresso come variabile dipendente ed i suoi<br />

ritardi tra le esplicative.<br />

• Per decidere quanti ritardi utilizzare, prenderemo in<br />

considerazione principalmente i criteri AIC e BIC e R-quadro<br />

corretto, che combinano il numero dei ritardi nel modello con<br />

il numero di osservazioni su cui questo viene stimato;<br />

• L’utilizzo di questi criteri porta ad un compromesso tra la<br />

parsimonia del modello ed il miglioramento dell’adattamento<br />

ai dati che deriva dall’introduzione di un numero sempre<br />

maggiore di regressori.<br />

Assumiamo che il massimo numero di ritardi che vogliamo<br />

includere nel modello sia pari a 4 (scelta puramente arbitraria). Per<br />

decidere quanti ritardi utilizzare, stimiamo sullo stesso campione<br />

una serie di modelli autoregressivi di quarto, terzo, secondo e<br />

primo ordine.<br />

• Restringiamo il campione facendo iniziare la serie storica<br />

coinvolta nella stima 5 periodi di tempo dopo;<br />

• Se non facessi questa operazione, stimerei i modelli su un<br />

numero di osservazioni che diminuisce all’aumentare dei<br />

ritardi inseriti. Ad esempio, il quarto ritardo della differenza<br />

prima sarà pari alla differenza espressot-4-espressot-5. Questa<br />

variabile è definita solo per le osservazioni che hanno almeno<br />

5 osservazioni precedenti;<br />

• Andiamo su Campione/Imposta intervallo e dichiariamo che<br />

l’inizio del periodo di riferimento deve avvenire 5 periodi più<br />

avanti (il 2006/01/09);<br />

• Vedremo che in fondo alla finestra di gretl verrà mostrato che<br />

il campione attuale è ristretto.<br />

Stimiamo un modello autoregressivo di ordine 4 per la serie<br />

storica d_espresso. Andiamo su Modello/OLS e dichiariamo che la<br />

variabile dipendente è d_espresso. Per inserire i ritardi clicchiamo<br />

5


su Ritardi e dichiariamo che vogliamo inserire tutti i ritardi di<br />

d_espresso dal primo al quarto.<br />

• Bisogna assicurarsi che la matrice di varianze e covarianze<br />

dello stimatore sia stimata con il metodo HAC, che tiene<br />

conto dell’autocorrelazione del termine di errore nel modello.<br />

• A meno di non assumere che i 4 ritardi siano sufficienti per<br />

spiegare interamente la determinazione del valore di<br />

d_espresso, è opportuno ammettere che l’errore del modello<br />

di regressione sia autocorrelato.<br />

AR(4)<br />

Modello 12: OLS, usando le osservazioni 2006/01/09-2007/12/31 (T = 516)<br />

Variabile dipendente: d_ESPRESSO<br />

Errori standard HAC, larghezza di banda 6 (Kernel di Bartlett)<br />

coefficiente errore std. rapporto t p-value<br />

----------------------------------------------------------------<br />

const -0,00248696 0,00155298 -1,601 0,1099<br />

d_ESPRESSO_1 -0,0527765 0,0434477 -1,215 0,2250<br />

d_ESPRESSO_2 0,124819 0,0431152 2,895 0,0040 ***<br />

d_ESPRESSO_3 0,0154085 0,0427663 0,3603 0,7188<br />

d_ESPRESSO_4 0,0452496 0,0372630 1,214 0,2252<br />

Media var. dipendente -0,002859 SQM var. dipendente 0,036679<br />

Somma quadr. residui 0,677226 E.S. della regressione 0,036405<br />

R-quadro 0,022545 R-quadro corretto 0,014894<br />

F(4, 511) 2,741177 P-value(F) 0,028066<br />

Log-verosimiglianza 979,8789 Criterio di Akaike -1949,758<br />

Criterio di Schwarz -1928,527 Hannan-Quinn -1941,438<br />

rho 0,002254 Valore h di Durbin 0,306579<br />

Note: SQM = scarto quadratico medio; E.S. = errore standard<br />

Ora vediamo come varia l’adattamento ai dati togliendo un ritardo<br />

alla volta e stimando così modelli autoregressivi di ordine<br />

inferiore.<br />

AR(3)<br />

Modello 13: OLS, usando le osservazioni 2006/01/09-2007/12/31 (T = 516)<br />

Variabile dipendente: d_ESPRESSO<br />

Errori standard HAC, larghezza di banda 6 (Kernel di Bartlett)<br />

coefficiente errore std. rapporto t p-value<br />

----------------------------------------------------------------<br />

const -0,00260149 0,00156446 -1,663 0,0970 *<br />

d_ESPRESSO_1 -0,0521179 0,0433356 -1,203 0,2297<br />

d_ESPRESSO_2 0,130452 0,0442643 2,947 0,0034 ***<br />

d_ESPRESSO_3 0,0130882 0,0433268 0,3021 0,7627<br />

Media var. dipendente -0,002859 SQM var. dipendente 0,036679<br />

6


Somma quadr. residui 0,678640 E.S. della regressione 0,036407<br />

R-quadro 0,020505 R-quadro corretto 0,014766<br />

F(3, 512) 3,102859 P-value(F) 0,026337<br />

Log-verosimiglianza 979,3409 Criterio di Akaike -1950,682<br />

Criterio di Schwarz -1933,697 Hannan-Quinn -1944,026<br />

rho -0,000743 Valore h di Durbin -0,093047<br />

Note: SQM = scarto quadratico medio; E.S. = errore standard<br />

AR(2)<br />

Modello 14: OLS, usando le osservazioni 2006/01/09-2007/12/31 (T = 516)<br />

Variabile dipendente: d_ESPRESSO<br />

Errori standard HAC, larghezza di banda 6 (Kernel di Bartlett)<br />

coefficiente errore std. rapporto t p-value<br />

----------------------------------------------------------------<br />

const -0,00263443 0,00158346 -1,664 0,0968 *<br />

d_ESPRESSO_1 -0,0504727 0,0441905 -1,142 0,2539<br />

d_ESPRESSO_2 0,129834 0,0441840 2,938 0,0034 ***<br />

Media var. dipendente -0,002859 SQM var. dipendente 0,036679<br />

Somma quadr. residui 0,678758 E.S. della regressione 0,036375<br />

R-quadro 0,020334 R-quadro corretto 0,016515<br />

F(2, 513) 4,534551 P-value(F) 0,011165<br />

Log-verosimiglianza 979,2959 Criterio di Akaike -1952,592<br />

Criterio di Schwarz -1939,854 Hannan-Quinn -1947,600<br />

rho -0,001787 Durbin-Watson 2,000236<br />

AR(1)<br />

Modello 16: OLS, usando le osservazioni 2006/01/09-2007/12/31 (T = 516)<br />

Variabile dipendente: d_ESPRESSO<br />

Errori standard HAC, larghezza di banda 6 (Kernel di Bartlett)<br />

coefficiente errore std. rapporto t p-value<br />

----------------------------------------------------------------<br />

const -0,00303673 0,00176032 -1,725 0,0851 *<br />

d_ESPRESSO_1 -0,0586608 0,0503737 -1,165 0,2448<br />

Media var. dipendente -0,002859 SQM var. dipendente 0,036679<br />

Somma quadr. residui 0,690463 E.S. della regressione 0,036651<br />

R-quadro 0,003440 R-quadro corretto 0,001501<br />

F(1, 514) 1,356090 P-value(F) 0,244757<br />

Log-verosimiglianza 974,8846 Criterio di Akaike -1945,769<br />

Criterio di Schwarz -1937,277 Hannan-Quinn -1942,441<br />

rho 0,008143 Durbin-Watson 1,980360<br />

Note: SQM = scarto quadratico medio; E.S. = errore standard<br />

Il modello autoregressivo di secondo ordine minimizza i criteri<br />

AIC, BIC e massimizza il criterio R-quadro corretto 2 . Questo<br />

modello realizza il miglior compromesso tra adattamento ai dati e<br />

parsimonia della specificazione 3 .<br />

2 Non sempre si arriva ad una situazione in cui una specificazione minimizza AIC e BIC e massimizza R-quadro<br />

corretto. Ad esempio, se si fosse dovuto scegliere tra i soli modelli AR(3) e AR(4), si poteva optare per AR(3) alla luce<br />

del fatto che questa specificazione minimizzava i criteri AIC e BIC ed il ritardo di ordine 4 non era significativo.<br />

3 Se avessimo per esempio guardato ad R-quadro, che non premia la parsimonia del modello, avremmo dovuto scegliere<br />

il modello autoregressivo di quarto ordine.<br />

7


Supponiamo ora che voglia utilizzare il modello AR(2) stimato<br />

per prevedere l’andamento della serie storica d_espresso nei 5<br />

periodi di tempo successivi alla fine della finestra temporale per<br />

cui osservo la serie storica.<br />

• Andiamo su Analisi/Previsione e dichiariamo che vogliamo<br />

inserire 5 nuove osservazioni.<br />

• Selezioniamo la modalità previsione automatica e<br />

dichiariamo che vogliamo disegnare l’intervallo di<br />

confidenza attraverso le Linee di confidenza.<br />

o Ricordate che l’intervallo di confidenza si basa<br />

sull’assunzione di normalità dell’errore (che poi<br />

verificheremo). Se questa assunzione non è supportata,<br />

l’intervallo di confidenza non è valido.<br />

Il grafico mostra in rosso i valori osservati, in blu quelli predetti<br />

ed in verde gli estremi degli intervalli di confidenza al 95% delle<br />

previsioni.<br />

• Il confronto tra valori osservati e predetti per il periodo su cui<br />

abbiamo stimato la serie storica è una misura<br />

dell’adattamento del modello ai dati;<br />

• Entrambe le serie <strong>storiche</strong> oscillano intorno<br />

(approssimativamente) allo 0 grazie all’inclusione della<br />

costante nella specificazione. Tuttavia, i picchi positivi e<br />

8


negativi dei valori osservati non sono replicati dai valori<br />

predetti, come potevamo aspettarci visto il basso R-quadro<br />

ottenuto.<br />

Andiamo ora a verificare se l’errore del modello si distribuisce<br />

effettivamente secondo una normale.<br />

• Salvo i residui del modello nella variabile resid.<br />

• Il grafico dei residui mostra che la loro distribuzione<br />

campionaria è concentrata intorno allo 0. Tuttavia, il test di<br />

normalità riportato (di Doornik-Hansen, che combina gli<br />

indici di asimmetria e curtosi) porta a rifiutare l’ipotesi nulla<br />

che i residui si distribuiscono secondo una normale;<br />

• Questo risultato mostra che gli intervalli di confidenza della<br />

previsione che abbiamo visto prima non sono corretti perché<br />

si basavano sull’assunzione di normalità degli errori del<br />

modello, di cui i residui sono stime;<br />

• L’inferenza sui parametri del modello può invece essere<br />

sviluppata utilizzando tutti i risultati asintotici visti nel corso.<br />

Il correlogramma dei residui mostra autocorrelazioni globali e<br />

parziali significative ai ritardi 6 e 14.<br />

• Questo risultato ci porta a pensare che gli errori del modello<br />

siano autocorrelati e supporta la scelta di utilizzare lo<br />

9


stimatore HAC per la matrice di varianze e covarianze dello<br />

stimatore dei parametri sulle esplicative del modello.<br />

Ora andiamo a verificare formalmente se la serie storica<br />

d_espresso possa essere ritenuta stazionaria o meno. L’ipotesi di<br />

stazionarietà è alla base dei modelli autoregressivi che abbiamo<br />

utilizzato.<br />

Una prima fonte di non stazionarietà può derivare dalla presenza<br />

di radici unitarie. Effettuiamo il test Augmented Dickey-Fuller.<br />

• Questo test consiste nel regredire la differenza prima della<br />

serie (nel nostro caso la differenza prima di d_espresso) su<br />

costante, valore ritardato della serie storica (nel nostro caso il<br />

ritardo di d_espresso) ed una serie di ritardi delle differenze<br />

prima della serie (nel nostro caso i ritardi delle differenze<br />

prime di d_espresso);<br />

o In alternativa, si può aggiungere a questo set di<br />

esplicative anche un trend temporale.<br />

• La statistica test da considerare è la statistica t sul parametro<br />

del valore ritardato della serie. In questo caso però la<br />

statistica t non ha distribuzione normale ed i valori critici<br />

devono essere calcolati ad hoc;<br />

• Selezioniamo la variabile d_espresso, andiamo su<br />

Variabile/Test per radice unitaria/Test Dickey-Fuller<br />

10


aumentato. Effettuiamo il test alternativamente sia con la sola<br />

costante che con costante e trend.<br />

• L’ipotesi nulla di questo test è che la serie storica d_espresso<br />

abbia radici unitarie. L’ipotesi alternativa è l’assenza di radici<br />

unitarie.<br />

Augmented Dickey-Fuller test for d_ESPRESSO<br />

inclusi 13 ritardi di (1-L)d_ESPRESSO (max was 18)<br />

Ampiezza campionaria 506<br />

Ipotesi nulla di radice unitaria: a = 1<br />

Test con costante<br />

Modello: (1-L)y = b0 + (a-1)*y(-1) + ... + e<br />

Coefficiente di autocorrelazione del prim'ordine per e: 0,000<br />

differenze ritardate: F(13, 491) = 1,935 [0,0245]<br />

Valore stimato di (a - 1): -1,25476<br />

Statistica test: tau_c(1) = -7,52925<br />

p-value asintotico 1,136e-011<br />

Con costante e trend<br />

Modello: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e<br />

Coefficiente di autocorrelazione del prim'ordine per e: -0,000<br />

differenze ritardate: F(13, 490) = 1,945 [0,0235]<br />

Valore stimato di (a - 1): -1,27472<br />

Statistica test: tau_ct(1) = -7,61222<br />

p-value asintotico 3,495e-011<br />

Il p-value ci porta a rifiutare l’ipotesi nulla di presenza di radici<br />

unitarie in entrambi i casi.<br />

• Questi risultati sono in linea con il grafico della serie storica<br />

d_espresso visto prima, dove non erano visibili trend.<br />

Proviamo a rifare lo stesso test, ma guardando direttamente alla<br />

variabile espresso.<br />

• Vogliamo condurre un test formale per verificare la presenza<br />

di radici unitarie in questa serie storica;<br />

• Sulla base del grafico della serie ci aspettavamo la presenza<br />

di un trend negativo.<br />

Augmented Dickey-Fuller test for ESPRESSO<br />

inclusi 14 ritardi di (1-L)ESPRESSO (max was 18)<br />

Ampiezza campionaria 506<br />

11


Ipotesi nulla di radice unitaria: a = 1<br />

Test con costante<br />

Modello: (1-L)y = b0 + (a-1)*y(-1) + ... + e<br />

Coefficiente di autocorrelazione del prim'ordine per e: -0,000<br />

differenze ritardate: F(14, 490) = 2,072 [0,0121]<br />

Valore stimato di (a - 1): 0,00246612<br />

Statistica test: tau_c(1) = 0,456229<br />

p-value asintotico 0,9852<br />

Con costante e trend<br />

Modello: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e<br />

Coefficiente di autocorrelazione del prim'ordine per e: 0,001<br />

differenze ritardate: F(14, 489) = 1,951 [0,0198]<br />

Valore stimato di (a - 1): -0,0153155<br />

Statistica test: tau_ct(1) = -1,29083<br />

p-value asintotico 0,8899<br />

In questo caso invece accetto l’ipotesi nulla di presenza di radici<br />

unitarie. Se avessi stimato i modelli autoregressivi direttamente<br />

sui livelli di espresso, avrei ottenuto risultati non validi in quanto<br />

questi modelli ipotizzano la stazionarietà della serie.<br />

Un ulteriore motivo che può compromettere la stazionarietà della<br />

serie è la presenza di break strutturali dovuti per esempio a crisi<br />

finanziarie o cambi nelle politiche di gestione dell’azienda.<br />

• Questi cambiamenti possono modificare da un certo<br />

momento in avanti la costante o i coefficienti sui ritardi del<br />

modello autoregressivo stimato, rendendoli non invarianti nel<br />

tempo.<br />

Ipotizziamo di volere verificare la presenza di un break strutturale<br />

con punto di rottura (break point) 1 gennaio 2007. Vogliamo<br />

vedere se ci sono differenze nei parametri relativi nel nostro<br />

modello tra il periodo antecedente al 1 gennaio 2007 e quello<br />

successivo.<br />

• Andiamo su Test/Chow BREAK strutturale ed inseriamo la<br />

data del punto di rottura.<br />

12


Il test prevede la stima di un ulteriore modello che alle variabili<br />

esplicative già incluse aggiunge<br />

• una dummy che vale 1 per tutte le osservazioni successive al<br />

1 gennaio 2007 (compreso) e 0 per quelle precedenti;<br />

• le interazioni tra questa variabile dummy ed i ritardi di<br />

d_espresso.<br />

L’ipotesi nulla del test di stabilità strutturale pone congiuntamente<br />

pari a 0 tutti i parametri delle nuove esplicative aggiunte. Se i<br />

parametri relativi alle nuove variabili inserite non sono<br />

statisticamente significativi, allora non c’è break strutturale ed il<br />

nostro modello iniziale è appropriato per studiare l’andamento<br />

della serie storica in entrambi i periodi.<br />

• In altre parole, secondo l’ipotesi nulla costante e parametri<br />

sui ritardi non variano tra il periodo precedente all’1 gennaio<br />

2007 e quello successivo.<br />

• L’ipotesi alternativa invece assume che almeno uno di questi<br />

parametri sia diverso da 0. Se è così, i dati supportano<br />

l’ipotesi che l’1 gennaio 2007 si sia verificato un break<br />

strutturale che ha cambiato la costante o almeno uno dei<br />

parametri sui ritardi.<br />

La statistica test si distribuisce asintoticamente secondo una chiquadro<br />

con gradi di libertà pari al numero di variabili aggiunte nel<br />

modello (nel nostro caso 3).<br />

Regressione aumentata per il test Chow<br />

OLS, usando le osservazioni 2006/01/09-2007/12/31 (T = 516)<br />

Variabile dipendente: d_ESPRESSO<br />

Errori standard HAC, larghezza di banda 6 (Kernel di Bartlett)<br />

coefficiente errore std. rapporto t p-value<br />

---------------------------------------------------------------<br />

const -0,00181416 0,00214406 -0,8461 0,3979<br />

d_ESPRESSO_1 -0,0342325 0,0636705 -0,5377 0,5911<br />

d_ESPRESSO_2 0,0577450 0,0562140 1,027 0,3048<br />

splitdum -0,00154595 0,00314311 -0,4919 0,6230<br />

sd_d_ESPRESSO_1 -0,0291007 0,0869532 -0,3347 0,7380<br />

sd_d_ESPRESSO_2 0,130498 0,0852982 1,530 0,1267<br />

Media var. dipendente -0,002859 SQM var. dipendente 0,036679<br />

13


Somma quadr. residui 0,675162 E.S. della regressione 0,036385<br />

R-quadro 0,025523 R-quadro corretto 0,015970<br />

F(5, 510) 2,315247 P-value(F) 0,042645<br />

Log-verosimiglianza 980,6662 Criterio di Akaike -1949,332<br />

Criterio di Schwarz -1923,856 Hannan-Quinn -1939,349<br />

rho 0,002454 Durbin-Watson 1,991644<br />

Note: SQM = scarto quadratico medio; E.S. = errore standard<br />

Test Chow per break strutturale all'osservazione 2007/01/01<br />

Chi-quadro(3) = 2,55447 con p-value 0,4655<br />

Il p-value relativo alla distribuzione chi-quadro porta ad accettare<br />

l’ipotesi nulla che non ci sia un break strutturale avvenuto l’1<br />

gennaio.<br />

• Questo non esclude che non si possano essere verificati altri<br />

punti di rottura in altri istanti di tempo.<br />

Ora vogliamo valutare se l’andamento del mercato finanziario<br />

possa essere una informazione rilevante per predire l’andamento<br />

della serie storica d_espresso.<br />

L’andamento del mercato finanziario può essere riassunto dalla<br />

serie storica dell’indice Mibtel, che raccoglie un vasto numero di<br />

titoli sufficientemente diversificati;<br />

• L’indice Mibtel può essere interpretato come un portafoglio<br />

di mercato;<br />

• Inserire la serie storica mibtel tra le esplicative del modello<br />

ne aumenta la capacità predittiva?<br />

La serie storica di mibtel non pare essere in linea con l’assunzione<br />

di stazionarietà.<br />

14


Inserisco nel modello le differenze prime di questa serie, che sono<br />

state salvate precedentemente in d_mibtel. In aggiunta, inserisco<br />

nel modello anche tutti i ritardi fino al secondo ordine delle<br />

differenze prime.<br />

Modello 5: OLS, usando le osservazioni 2006/01/09-2007/12/31 (T = 516)<br />

Variabile dipendente: d_ESPRESSO<br />

Errori standard HAC, larghezza di banda 6 (Kernel di Bartlett)<br />

coefficiente errore std. rapporto t p-value<br />

--------------------------------------------------------------<br />

const -0,00317269 0,00139184 -2,279 0,0231 **<br />

d_MIBTEL 7,38282e-05 5,99204e-06 12,32 1,02e-030 ***<br />

d_MIBTEL_1 1,43554e-05 5,92576e-06 2,423 0,0158 **<br />

d_MIBTEL_2 1,88210e-06 5,89925e-06 0,3190 0,7498<br />

d_ESPRESSO_1 -0,0758190 0,0474423 -1,598 0,1106<br />

d_ESPRESSO_2 0,0992680 0,0376798 2,635 0,0087 ***<br />

Media var. dipendente -0,002859 SQM var. dipendente 0,036679<br />

Somma quadr. residui 0,499736 E.S. della regressione 0,031303<br />

R-quadro 0,278720 R-quadro corretto 0,271648<br />

F(5, 510) 40,70387 P-value(F) 3,09e-35<br />

Log-verosimiglianza 1058,291 Criterio di Akaike -2104,583<br />

Criterio di Schwarz -2079,106 Hannan-Quinn -2094,599<br />

rho -0,002187 Durbin-Watson 2,001839<br />

Note: SQM = scarto quadratico medio; E.S. = errore standard<br />

Per verificare se nel complesso l’informazione riguardante il<br />

portafoglio di mercato contribuisce ad aumentare la capacità<br />

predittiva del modello devo condurre il test di causalità di<br />

Granger.<br />

Questo test consiste nel verificare la significatività congiunta delle<br />

differenze prime di mibtel e di tutti i loro ritardi.<br />

15


• L’ipotesi nulla è che i parametri relativi a d_MIBTEL,<br />

d_MIBTEL_1 e d_MIBTEL_2 siano congiuntamente pari a 0.<br />

L’ipotesi alternativa è che almeno uno di questi parametri<br />

non sia pari a 0.<br />

La statistica test ha come sempre una distribuzione chi-quadro con<br />

gradi di libertà pari al numero di variabili di cui stiamo testando la<br />

significatività congiunta.<br />

• Se questo test viene effettuato con il comando Test/Omit,<br />

bisogna selezionare l’opzione Test di Wald perché vogliamo<br />

sfruttare la stima della matrice di varianze e covarianze<br />

ottenuta con lo stimatore HAC.<br />

Ipotesi nulla: i parametri della regressione valgono zero per le<br />

variabili<br />

d_MIBTEL, d_MIBTEL_1, d_MIBTEL_2<br />

Statistica test asintotica:<br />

Chi-quadro di Wald(3) = 159,726, con p-value = 2,1002e-034<br />

L’ipotesi nulla è rifiutata. In particolare, possiamo vedere che<br />

questo risultato è guidato principalmente dalla significatività dei<br />

parametri relativi a d_MIBTEL e d_MIBTEL_1.<br />

• L’informazione relativa alle differenze prime dell’indice<br />

Mibtel ed ai loro ritardi aumenta significativamente la<br />

capacità predittiva del modello.<br />

• Le variabili che abbiamo aggiunto sono significativamente<br />

correlate con il valore corrente di d_espresso, anche se ci<br />

condizioniamo ai suoi ritardi di ordine 1 e 2.<br />

• Questo risultato è statisticamente valido ma nulla ci dice<br />

circa la relazione tra rendimenti del titolo espresso e<br />

rendimenti del mercato.<br />

Il modello teorico che permette di capire come i rendimenti di un<br />

titolo rischioso variano con quelli del mercato si chiama Capital<br />

Asset Pricing Model (CAPM).<br />

16


Definiamo i rendimenti giornalieri rt di un titolo a partire dal suo<br />

prezzo giornaliero pt utilizzando la formula<br />

Δ ln(<br />

⎛<br />

⎜<br />

⎝<br />

p<br />

⎞<br />

⎟<br />

⎠<br />

t<br />

t<br />

t t−1<br />

t t−1<br />

p t ) = ln( pt<br />

) − ln( pt<br />

−1)<br />

= ln<br />

⎜<br />

=<br />

=<br />

≅ =<br />

p ⎟<br />

ln<br />

⎜<br />

−1<br />

+ 1<br />

t p ⎟<br />

ln<br />

⎜<br />

+ 1<br />

t<br />

p ⎟<br />

−1<br />

−1<br />

t−1<br />

pt<br />

−1<br />

Il CAPM definisce la seguente equazione fondamentale<br />

⎛<br />

⎜<br />

⎝<br />

( r r ) ( r r )<br />

p<br />

− = α + β − + η<br />

i F M F i<br />

t i i t t<br />

• r F è il rendimento giornaliero dei titoli non rischiosi, che può<br />

essere ragionevolmente posto pari a 0;<br />

• αi misura la differenza nel rendimento medio del titolo i al<br />

tempo t rispetto al rendimento del mercato;<br />

o Un valore positivo (negativo) di αi indica un eccesso<br />

(difetto) di rendimento medio del titolo rispetto al<br />

rendimento del mercato.<br />

• βi misura la sensibilità del titolo i rispetto ai movimenti del<br />

mercato.<br />

o Un βi inferiore a 1 indica che il titolo i è difensivo (cioè<br />

attenua i movimenti del mercato);<br />

o Un βi superiore a 1 indica che il titolo i è aggressivo<br />

(cioè amplifica i movimenti del mercato);<br />

o Un βi pari a 1 indica invece una variabilità dei<br />

rendimenti in linea con quella del mercato.<br />

Per stimare l’equazione del CAPM per il titolo espresso dobbiamo<br />

prima di tutto definire i rendimenti di questo titolo e quelli del<br />

portafoglio di mercato, che come prima descriviamo attraverso la<br />

serie mibtel.<br />

• Selezioniamo espresso ed andiamo su Aggiungi/Differenze<br />

logaritmiche delle variabili selezionate. Facciamo lo stesso<br />

con mibtel.<br />

⎞<br />

⎟<br />

⎠<br />

⎛ p<br />

⎜<br />

⎝<br />

− p<br />

⎞<br />

⎟<br />

⎠<br />

p<br />

− p<br />

r<br />

t<br />

17


• Le due nuove variabili si chiameranno rispettivamente<br />

ld_espresso e ld_mibtel.<br />

Stimiamo l’equazione del CAPM selezionando Modello/OLS<br />

specificando un modello avente come variabile dipendente<br />

ld_espresso e come variabili esplicative la costante e ld_mibtel.<br />

Modello 2: OLS, usando le osservazioni 2006/01/09-2007/12/31 (T = 516)<br />

Variabile dipendente: ld_ESPRESSO<br />

Errori standard HAC, larghezza di banda 6 (Kernel di Bartlett)<br />

coefficiente errore std. rapporto t p-value<br />

---------------------------------------------------------------<br />

const -0,000849581 0,000363464 -2,337 0,0198 **<br />

ld_MIBTEL 0,576885 0,0464181 12,43 3,43e-031 ***<br />

Media var. dipendente -0,000763 SQM var. dipendente 0,009451<br />

Somma quadr. residui 0,033947 E.S. della regressione 0,008127<br />

R-quadro 0,262012 R-quadro corretto 0,260576<br />

F(1, 514) 154,4557 P-value(F) 3,43e-31<br />

Log-verosimiglianza 1752,123 Criterio di Akaike -3500,246<br />

Criterio di Schwarz -3491,754 Hannan-Quinn -3496,918<br />

rho -0,085180 Durbin-Watson 2,165052<br />

Note: SQM = scarto quadratico medio; E.S. = errore standard<br />

La stima della costante è una stima del parametro α del CAPM.<br />

• Verifico il sistema di ipotesi H0: α=0, H1: α


• In particolare, il rendimento medio del titolo espresso è<br />

inferiore a quello di mercato di 0.08(=100*(0.000849581))<br />

punti percentuali.<br />

La stima del parametro relativo a ld_mibtel è una stima del<br />

coefficiente βld_mibtel dell'equazione fondamentale del CAPM.<br />

• La stima puntuale di βld_mibtel è inferiore a 1;<br />

• Verifico il sistema di ipotesi H0: βld_mibtel=1, H1: βld_mibtel


Per verificare questa ipotesi devo effettuare nuovamente un test di<br />

stabilità strutturale.<br />

• L’ipotesi nulla prevede che costante e parametro relativo a<br />

ld_mibtel non varino tra il periodo antecedente al 30 marzo<br />

2007 ed il periodo successivo;<br />

• L’ipotesi alternativa prevede invece che almeno uno dei due<br />

parametri vari.<br />

Analogamente a prima, vengono inserite nel modello<br />

• una dummy che vale 1 per tutte le osservazioni successive al<br />

30 marzo 2007 (compreso) e 0 per quelle precdenti;<br />

• l’interazione tra questa variabile dummy e ld_mibtel.<br />

• Se queste due variabili sono congiuntamente non<br />

significative, l’ipotesi nulla è accettata.<br />

Nel nostro caso la statistica test si distribuisce asintoticamente<br />

secondo una chi-quadro con due gradi di libertà.<br />

Regressione aumentata per il test Chow<br />

OLS, usando le osservazioni 2006/01/09-2007/12/31 (T = 516)<br />

Variabile dipendente: ld_ESPRESSO<br />

Errori standard HAC, larghezza di banda 6 (Kernel di Bartlett)<br />

coefficiente errore std. rapporto t p-value<br />

--------------------------------------------------------------<br />

const -0,000732545 0,000397308 -1,844 0,0658 *<br />

ld_MIBTEL 0,608675 0,0620387 9,811 6,16e-021 ***<br />

splitdum -0,000350749 0,000808660 -0,4337 0,6647<br />

sd_ld_MIBTEL -0,0719411 0,0915287 -0,7860 0,4322<br />

Media var. dipendente -0,000763 SQM var. dipendente 0,009451<br />

Somma quadr. residui 0,033886 E.S. della regressione 0,008135<br />

R-quadro 0,263344 R-quadro corretto 0,259028<br />

F(3, 512) 53,54939 P-value(F) 4,06e-30<br />

Log-verosimiglianza 1752,589 Criterio di Akaike -3497,178<br />

Criterio di Schwarz -3480,194 Hannan-Quinn -3490,523<br />

rho -0,084555 Durbin-Watson 2,163364<br />

Note: SQM = scarto quadratico medio; E.S. = errore standard<br />

Test Chow per break strutturale all'osservazione 2007/03/30<br />

Chi-quadro(2) = 0,949279 con p-value 0,6221<br />

Il p-value mi porta ad accettare l’ipotesi nulla di stabilità<br />

strutturale.<br />

20

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!