25.12.2012 Views

Dispense

Dispense

Dispense

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

6.1. LA MATRICE DI CORRELAZIONE 321<br />

6.1.1 Elevata correlazione non è sinonimo di causalità<br />

Questo è un principio importante. Quando si riscontra un’elevata correlazione tra due<br />

variabili X ed Y , nulla indica che X agisca su Y , che X sia la causa delle variazioni di<br />

Y .<br />

Un’ovvia ragione di tipo logico è che la correlazione è un’operazione simmetrica. Non<br />

si vede come sia possibile quindi dedurne una causalità asimmetrica, in cui una delle due<br />

variabili sia la causa (dovrebbe essere vero anche il viceversa, ma questo è assurdo nella<br />

maggior parte dei problemi causa-e¤etto).<br />

Cosa può allora indicare un’elevata correlazione tra X ed Y ? Almeno tre cose possibili:<br />

X agisce su Y<br />

Y agisce su X<br />

c’è una causa comune Z; quando Z cambia, provoca cambiamenti di X e di Y simultaneamente;<br />

noi osserviamo questi cambiamenti simultanei, quindi osserviamo una<br />

correlazione tra X e Y .<br />

Facciamo un esempio banale di errore che si commetterebbe attribuendo ad un’elevata<br />

correlazione l’indicazione di una relazione causa-e¤etto: se si prende un gruppo di paesi<br />

industrializzati con un livello di sviluppo simile, si può osservare che il numero X di cittadini<br />

impegnati nell’istruzione è correlato al numero Y di cittadini impegnati nei trasporti. Ma<br />

questo è semplicemente e¤etto delle dimensioni delle nazioni: una nazione più grossa avrà<br />

più insegnanti e più trasporti, una più piccola ne avrà meno. Invece, è chiaro che X non è la<br />

causa di Y e viceversa.<br />

E’d’altra parte vero che un’elevata correlazione è improbabile tra due campioni indipendenti,<br />

come mostra il paragrafo seguente. Quindi a fronte di un’elevata correlazione non<br />

possiamo ignorare il fatto che un legame ci sia; resta però aperto il problema di quale sia<br />

(cioè se sia diretto oppure indiretto).<br />

Analisi Monte Carlo della correlazione di campioni indipendenti<br />

Supponiamo che X1; :::; Xn sia un campione estratto da X ed Y1; :::; Yn un campione estratto<br />

da Y , indipendenti. Per semplicità, supponiamo che le v.a. siano tutte gaussiane e, visto<br />

che di correlazione si tratta, supponiamole standardizzate (questo non è restrittivo: la correlazione<br />

di due v.a. o due campioni è uguale a quella delle v.a. o campioni standardizzati).<br />

Che valori può assumere la correlazione? Fissato n, generiamo con R due stringhe di tal tipo<br />

e calcoliamone la correlazione, e ripetiamo questo N volte. Tracciamo un istogramma dei<br />

valori.<br />

n=10; N=10000<br />

COR

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!