25.12.2012 Views

Dispense

Dispense

Dispense

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

332 CAPITOLO 6. STATISTICA MULTIVARIATA<br />

6.3 Modelli lineari<br />

Questa sezione è dedicata alla descrizione sintentica di una coppia di metodi di statistica<br />

multivariata: la regressione lineare multipla e l’analisi fattoriale.<br />

6.3.1 Introduzione: modelli lineari di legame tra variabili aleatorie<br />

La teoria che stiamo per esporre vuole descrivere relazioni matematiche tra variabili aleatorie:<br />

in tali relazioni appariranno variabili di input, dette ad esempio fattori o predittori, e variabili<br />

di output, dette ad esempio risposte oppure osservabili. Le relazioni più semplici sono quelle<br />

lineari o a¢ ni, che ora descriveremo.<br />

Supponiamo che certe variabili di output Yi, i = 1; :::; m, siano legate a certe variabili di<br />

input Xj, j = 1; :::; n, dalle relazioni a¢ ni<br />

Yi = ai1X1 + ::: + ainXn + bi + i"i<br />

i = 1; :::; m<br />

dove i numeri aij sono i coe¢ cienti della relazione, i numeri bi sono le intercette (in senso<br />

generalizzato), mentre le espressioni i"i sono variabili aleatorie che rappresentano gli errori<br />

presenti nella relazione, errori ascrivibili a diverse cause, o di aleatorietà intrinseca o di<br />

mancanza nostra di conoscenza e precisione nella descrizione dei legamo tra le X e le Y . Per<br />

comodità, in tali errori separiamo una parte aleatoria "i a media nulla (l’eventuale media<br />

non nulla dell’errore supponiamo di averla inglobata in bi) e varianza unitaria, per cui i<br />

coe¢ cienti i rappresentano le deviazioni standard degli errori (questa convenzione è diversa<br />

da quella adottata in certe parti del capitolo sulle serie temporali, ma non dovrebbe generarsi<br />

confusione).<br />

Una risposta, più fattori<br />

Il caso di una sola v.a. di output Y ed uno o più fattori in input X1; :::; Xn è quello esaminato<br />

dalla regressione lineare semplice (un fattore) o multipla (più fattori).<br />

Esempio 107 Riprendiamo l’esempio della Sezione 6.2. Sappiamo che SA.SC, la proporzione<br />

delle spese medie familiari dedicata ai soli alimenti, è (approssimativamente, si intende) direttamente<br />

proporzionale a TD, il tasso di disoccupazione. Posto Y =SA.SC, X1 =TD, si<br />

potrebbe studiare la regressione lineare semplice del tipo<br />

Y = a1X1 + b + "<br />

usando il comando lm(Y~X). Precisamente, se A

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!