25.12.2012 Views

Dispense

Dispense

Dispense

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

6.3. MODELLI LINEARI 343<br />

Poi, per calcolare b, serve una nuova equazione. Essa si trova semplicemente calcolando<br />

il valor medio a destra e sinistra dell’equazione che de…nisce il modello:<br />

Allora vale<br />

E [Y ] = a1E [X1] + ::: + apE [Xp] + b:<br />

b = E [Y ] (a1E [X1] + ::: + apE [Xp])<br />

da cui si può calcolare un valore empirico b a partire dai dati.<br />

Con un po’di sforzo si potrebbe riconoscere che il risultato è identico a quello ottenuto<br />

sopra con i minimi quadrati. Ci si chiede allora: cosa ha sostituito, qui, la richiesta fatta<br />

sopra che i valori ottimali fossero quelli che minimizzavano SQM? L’indipendenza tra " e le<br />

Xi. Se per certi valori dei parametri risulta " indipendente dalle Xi, signi…ca che il modello<br />

è buono, nel senso che abbiamo sfruttato nel modo migliore le informazioni contenute nelle<br />

Xi, senza ritrovarci parte di quelle informazioni nel resto ". Il resto contiene ciò che non<br />

siamo riusciti a spiegare, e non è nullo, ma l’importante è che non contenga residui legati alle<br />

variabili Xi, altrimenti signi…ca che c’era un’altro modo di usare le Xi più e¢ ciente.<br />

6.3.4 Predizione con modelli regressivi<br />

Nel Paragrafo 6.1.1 abbiamo sottolineato come l’evidenza di elevata correlazione non implichi<br />

in alcun modo l’esitenza di un legame causa-e¤etto. Quando impostiamo un modello di regressione,<br />

invece, stiamo ipotizzando che certe variabili giochino il ruolo di fattori, predittori,<br />

ed altre di output. Mentre nel calcolo della correlazione e nella PCA le variabili sono esaminate<br />

tutte in modo simmetrico, la simmetria è rotta a priori da noi quando impostiamo un<br />

modello regressivo.<br />

Dobbiamo pertanto assicurarci che esista davvero una tale relazione causa-e¤etto, quando<br />

facciamo la regressione? Altrimenti non ha senso farla? Dipende dagli scopi. Se lo scopo<br />

del modello regressivo è solo quello di e¤ettuare previsioni e non di sostenere l’esistenza di<br />

una relazione causa-e¤etto che magari non hanno alcun senso, allora va benissimo applicare<br />

i metodi di regressione anche a variabili che non hanno un legame causa-e¤etto, ma sono<br />

semplicemente ben correlate.<br />

Cosa si intende per “predizione con modelli regressivi”: sulla base di dati noti, si identi…ca<br />

quantitativamente il legame tra certi fattori X1; :::; Xd ed una variabile da predire Y (si<br />

calcolano i coe¢ cienti del modello); in queste situazioni note, si conoscono i valori assunti<br />

da tutte le variabili (X1; :::; Xd; Y ); poi, si applica il modello a situazioni nuove, dove si<br />

conoscono solo i valori assunti dalle variabili (X1; :::; Xd), usanto il modello per calcolare<br />

(predire) il valore di Y .<br />

Bene, ha perfettamente senso applicare questa strategia anche quando le variabili in gioco<br />

non sono legate da relazioni causa-e¤etto; basta che sia buona la loro correlazione.<br />

A parte una banale logica strumentale (il modello funziona bene come scatola nera per<br />

fare predizioni), ci può essere una logica dietro questo fatto? Pensiamo al caso in cui due<br />

variabili X ed Y sono molto correlate, ma non c’è relazione causa-e¤etto; e supponiamo invece<br />

che ci sia una variabile Z che sia causa di entrambe, ma non la possiamo misurare, magari<br />

non l’abbiamo nemmeno individuata. Troviamo la formula regressiva Y = aX + b (che non<br />

ha alcun signi…cato …sico/economico ecc.). In situazioni nuove, misurata X, prevediamo che

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!