25.12.2012 Views

Dispense

Dispense

Dispense

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

334 CAPITOLO 6. STATISTICA MULTIVARIATA<br />

caso non ci sarebbe nulla di nuovo rispetto al paragrafo precedente, le cui considerazioni<br />

andrebbero applicate separatamente a ciascuna Yi. Il discorso si generalizza senza problemi<br />

al caso di più input e più output.<br />

Completamente diverso invece è il caso in cui le due grandezze Y1; Y2 sono misurabili,<br />

disponiamo di loro dati sperimentali, mentre X non è misurabile, anzi forse non è nemmeno<br />

completamente ben de…nita. Immaginiamo ad esempio, sempre con riferimento all’esempio<br />

della Sezione 6.2, di sospettare che ci sia un fattore X che in‡uenza Y1 =SA.SC e Y2 =SC.<br />

Abbiamo le misurazionii delle grandezze Y1 e Y2 ma non di X, di cui anzi non ci è chiaro<br />

nemmeno il signi…cato. la domanda è: c’è un fattore, che ancora dobbiamo scoprire, mettere<br />

allo scoperto, che in‡uenza entrambe SA.SC e SC? Un fattore nascosto? Che spiega (si suol<br />

dire) la variabilità di SA.SC e SC? Cosa c’è dietro il fatto che certe regioni hanno una minore<br />

spesa complessiva familiare ed una maggior proporzione di spesa per alimentari, rispetto ad<br />

altre regioni in cui queste grandezze sono invertite?<br />

A modo suo, il metodo PCA serve anche a questo scopo: esso ha individuato una nuova<br />

grandezza aleatoria, Comp1, a cui abbiamo attribuito un signi…cato del tipo “benessere economico”,<br />

legata ad entrambe SC e SA.SC. Discuteremo sotto il metodo dell’analisi fattoriale,<br />

alternativo a PCA, tornando però anche su PCA in relazione al problema ora posto.<br />

6.3.2 Regressione lineare semplice<br />

Iniziamo lo studio della regressione col caso della regressione lineare semplice, cioè con un<br />

solo fattore, probabilmente già nota dai corsi di statistica elementare. Premettiamo un breve<br />

riassunto su covarianza e correlazione, già esposte altrove, ma che può essere utile.<br />

Covarianza e coe¢ ciente di correlazione<br />

Date due v.a. X ed Y , chiamiamo covarianza il numero<br />

Cov (X; Y ) = E [(X E [X]) (Y E [Y ])] :<br />

La covarianza generalizza la varianza: se X ed Y sono uguali, vale<br />

Cov (X; X) = V ar [X] :<br />

Analogamente alla varianza, vale la formula (di facile dimostrazione)<br />

Cov (X; Y ) = E [XY ] E [X] E [Y ] :<br />

Ricordiamo che, se X ed Y sono indipendenti allora E [XY ] = E [X] E [Y ], ma non vale il<br />

viceversa. Da questi fatti si deduce la seguente proprietà:<br />

Proposizione 30 Se X ed Y sono indipendenti allora Cov (X; Y ) = 0.<br />

Il viceversa però non è vero: non basta veri…care la singola condizione numerica Cov (X; Y ) =<br />

0 per dedurre l’indipendenza. Tuttavia, nella pratica, c’è una certa (e giusti…cata) tendenza<br />

a ritenere che la condizione Cov (X; Y ) = 0 sia un notevole sintomo di indipendenza.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!