25.12.2012 Views

Dispense

Dispense

Dispense

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

6.3. MODELLI LINEARI 333<br />

viene pari a 0.8198) si vede che il legame lineare c’è, buono, ma non fortissimo. Una parte della<br />

variabilità di Y resta inspiegata. In e¤etti, a buon senso, non è il solo tasso di disoccupazione<br />

che in‡uenza quanto le famiglie dedicano agli alimenti rispetto al totale delle loro spese. Ci<br />

saranno altri fattori, legati ad altri aspetti generali del loro benessere economico o sviluppo<br />

sociale, come il grado di istruzione. Individuato un secondo potenziale fattore X2, si può<br />

esaminare il modello di regressione multipla<br />

Y = a1X1 + a2X2 + b + ":<br />

Si potrebbe rappresentare questa situazione col seguente diagramma:<br />

Y<br />

.<br />

-<br />

Lo studio della regressione multipla con R è immediato: basta usare il comando lm(Y~X1+X2).<br />

Esercizio 38 Cercare in rete un altro potenziale fattore associato ad SA.SC ed eseguire con<br />

R la regressione multipla. Quanto viene il coe¢ ciente R 2 ? E’ migliorato rispetto al caso di<br />

un fattore solo? Se non si ha voglia di cercare nuove grandezze in rete, si provi ad eseguire<br />

la regressione lm(SA:SC~TD + SC).<br />

Il coe¢ ciente R 2 (nella regressione multipla, ad esempio quella relativa all’esercizio appena<br />

enunciato) ha di nuovo il signi…cato di varianza spiegata. E’chiaro che aumenta aggiungendo<br />

più fattori, anche se sono insigni…canti; però aumenta poco o tanto a seconda della rilevanza<br />

di ciò che si è aggiunto.<br />

Il numero P r(> jtj) è il cosidetto p-value di un test che spiegheremo. L’idea empirica è:<br />

se P r(> jtj) è piccolo, il fattore è rilevante, altrimenti no. Quanto piccolo, è soggettivo; 0.05<br />

è una scelta condivisa da molti.<br />

Esercizio 39 Si eseguano le tre regressioni lm(SA:SC~TD + SC), lm(SA:SC~TD), lm(SA:SC~SC).<br />

Confrontare i valori di R 2 e P r(> jtj). Trarre qualche conclusione basandosi sul buon senso.<br />

Un fattore, più risposte<br />

Una situazione diametralmente opposta alla precedente è quella in cui c’è una sola X e<br />

diverse Yi, ad esempio tre grandezze X; Y1; Y2 tali che Y1 sia in‡uenzata da X ed anche Y2<br />

sia in‡uenzata dallo stesso X.<br />

Y1<br />

-<br />

X<br />

.<br />

Y2<br />

Se disponiamo di dati sperimentali per tutte queste grandezze, basta esaminare un modello<br />

lineare per la coppia (X; Y1) e poi un’altro, separatamente, per la coppia (X; Y2). In questo<br />

X1<br />

X2

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!