Calcoliamo l’autocorrelazione gloabale e l’autocorrelazione parziale di d_espresso selezionando questa variabile, cliccando con il tasto destro e scegliendo l’opzione Correlogramma. Funzione di autocorrelazione per d_ESPRESSO LAG ACF PACF Q-stat. [p-value] 1 -0,0560 -0,0560 1,6401 [0,200] 2 0,1251 *** 0,1223 *** 9,8353 [0,007] 3 0,0003 0,0136 9,8354 [0,020] 4 0,0598 0,0461 11,7185 [0,020] 5 -0,0529 -0,0503 13,1962 [0,022] 6 -0,0540 -0,0736 * 14,7347 [0,022] 7 -0,0458 -0,0423 15,8469 [0,027] 8 0,0143 0,0242 15,9558 [0,043] 9 -0,0510 -0,0320 17,3359 [0,044] 10 -0,0300 -0,0342 17,8163 [0,058] 11 -0,0912 ** -0,0900 ** 22,2514 [0,022] 12 0,0292 0,0183 22,7063 [0,030] 13 -0,0416 -0,0163 23,6309 [0,035] 14 -0,0904 ** -0,1002 ** 28,0166 [0,014] 15 0,0043 0,0016 28,0267 [0,021] 16 0,0150 0,0200 28,1474 [0,030] 17 0,0223 0,0192 28,4148 [0,040] 18 -0,0529 -0,0552 29,9281 [0,038] 19 0,0044 -0,0205 29,9387 [0,053] 20 0,0113 -0,0022 30,0084 [0,070] 21 -0,0166 -0,0239 30,1583 [0,089] 22 0,0281 0,0310 30,5889 [0,105] 23 -0,0243 -0,0238 30,9108 [0,125] 24 0,0075 -0,0227 30,9414 [0,155] 25 0,0446 0,0342 32,0328 [0,157] 26 0,0197 0,0327 32,2472 [0,185] 27 0,0073 -0,0022 32,2767 [0,222] Guardiamo al ritardo di ordine 3 (LAG=3), La funzione di autocorrelazione globale (ACF) è pari a 0.0003. Facendo riferimento al grafico sotto per ACF, questo valore è riassunto dal "rettangolo rosso" in corrispondenza del terzo ritardo. Il "rettangolo rosso" rimane all'interno delle "bande blu" che delimitano l’intervallo ±1.96/sqrt(T). L'autocorrelazione globale al terzo ritardo non è quindi statisticamente diversa da 0 al livello di significatività del 5%. In altre parole, l’autocorrelazione globale tra un valore della serie (ad esempio t) ed il suo ritardo di terzo ordine (t-3) non è significativa. La funzione di autocorrelazione parziale (PACF) è pari a 0.0136. Se guardiamo al grafico sotto per PACF, vediamo che anche in questo caso il "rettangolo rosso" rimane all'interno delle "bande blu", indicando che l'autocorrelazione paraizle al terzo ritardo non è statisticamente diversa da 0 al livello di significatività del 5%. Questo risultato ci dice che, al netto dei ritardi di primo e secondo ordine, la correlazione tra un valore della serie (ad esempio t) ed il suo ritardo di terzo ordine (t-3) non è significativo. Q-stat è la statistica di Ljung-Box che saggia (in questo caso) l’ipotesi nulla che tutte le autocorrelazioni globali fino al ritardo 3 siano nulle. L’ipotesi alternativa è che almeno una di queste autocorrelazioni globali sia diversa da 0. Questa statistica si distribuisce (in questo caso) come una chiquadro con 3 gradi di libertà. Il p-value pari a 0.020 ci porta a rifiutare l’ipotesi nulla al 5%. Ai ritardi di ordine 2, 11 e 15 abbiamo autocorrelazioni globali e parziali statisticamente significative perché le “barre rosse”, che indicano i valori delle autocorrelazioni, escono dalle bande blu, che delimitano l’intervallo ±1.96/sqrt(T). 4
Stimiamo un modello autoregressivo che ha il valore corrente della serie storica d_espresso come variabile dipendente ed i suoi ritardi tra le esplicative. • Per decidere quanti ritardi utilizzare, prenderemo in considerazione principalmente i criteri AIC e BIC e R-quadro corretto, che combinano il numero dei ritardi nel modello con il numero di osservazioni su cui questo viene stimato; • L’utilizzo di questi criteri porta ad un compromesso tra la parsimonia del modello ed il miglioramento dell’adattamento ai dati che deriva dall’introduzione di un numero sempre maggiore di regressori. Assumiamo che il massimo numero di ritardi che vogliamo includere nel modello sia pari a 4 (scelta puramente arbitraria). Per decidere quanti ritardi utilizzare, stimiamo sullo stesso campione una serie di modelli autoregressivi di quarto, terzo, secondo e primo ordine. • Restringiamo il campione facendo iniziare la serie storica coinvolta nella stima 5 periodi di tempo dopo; • Se non facessi questa operazione, stimerei i modelli su un numero di osservazioni che diminuisce all’aumentare dei ritardi inseriti. Ad esempio, il quarto ritardo della differenza prima sarà pari alla differenza espressot-4-espressot-5. Questa variabile è definita solo per le osservazioni che hanno almeno 5 osservazioni precedenti; • Andiamo su Campione/Imposta intervallo e dichiariamo che l’inizio del periodo di riferimento deve avvenire 5 periodi più avanti (il 2006/01/09); • Vedremo che in fondo alla finestra di gretl verrà mostrato che il campione attuale è ristretto. Stimiamo un modello autoregressivo di ordine 4 per la serie storica d_espresso. Andiamo su Modello/OLS e dichiariamo che la variabile dipendente è d_espresso. Per inserire i ritardi clicchiamo 5