25.12.2012 Views

Dispense

Dispense

Dispense

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

352 CAPITOLO 6. STATISTICA MULTIVARIATA<br />

A partire da un set di dati, cioè di individui di cui si conoscano sia i predittori sia la classe,<br />

A o B, a cui appartengono, si calcolano i coe¢ cienti del modello. Poi, esaminando nuovi<br />

individui che vogliamo classi…care sulla base della sola conoscenza dei predittori, calcoliamo<br />

il numero p di un individuo, ed assegnamolo alla classe che ha probabilità maggiore (A se<br />

p > 1=2). Eseguita così è una classi…cazione perentoria, ma è corredata dal numero p stesso,<br />

che fornisce un’indicazione del grado di sicurezza che abbiamo, nella classi…cazione appena<br />

eseguita.<br />

E’la stessa logica della predizione tramite modello regressivo, Paragrafo 6.3.4. Invece che<br />

desiderare una predizione numerica di una grandezza Y associata a certe unità sperimentali,<br />

desideriamo sapere se quelle unità appartengono ad una categoria o ad un’altra.<br />

Modelli lineari generalizzati<br />

Sono una generalizzazione del modello base, gaussiano,<br />

Y = a1X1 + ::: + apXp + b + "<br />

e di quello bernoulliano (detto modello binomiale, in questo contensto) appena visto<br />

Y B (1; p) con p =<br />

exp ( )<br />

1 + exp ( ) dove = a1x1 + ::: + apxp + b:<br />

In generale, si ipotizza che l’output Y abbia distribuzione di una certa classe, ad esempio<br />

appunto gaussiana, Bernoulli, Poisson, ecc., e si ipotizza che un suo parametro fondamentale<br />

, di solito la media ( per la gaussiana, p per la Bernoulli, per la Poisson) sia legato ai<br />

fattori attraverso una formula del tipo<br />

dove<br />

= g 1 ( )<br />

= a1x1 + ::: + apxp + b<br />

è chiamiato predittore lineare. Chiamiamo link function la funzione g. Nella regressione<br />

logistica si prende come g la funzione logit. Nella regressione tradizionale, g è l’identità.<br />

Il comando di R che esegue la regressione per i modelli lineari generalizzati è glm.<br />

6.4.2 Formulazione probabilistica del problema decisionale e regola di Bayes<br />

Per capire il prossimo metodo di classi…cazione, è utile qualche premessa di teoria delle<br />

decisioni.<br />

L’idea base della teoria delle decisioni si può descrivere tramite le nozioni forndamentali<br />

del calcolo delle probabilità: l’universo degli eventi, le partizioni, la formula di fattorizzazione<br />

e quella di Bayes.<br />

Supponiamo di avere un universo , una partizione (Ck) (ad esempio la suddivisione di<br />

in un insieme C1 ed il suo complementare C2 = C c 1<br />

), e dobbiamo prendere una decisione:<br />

quale degli eventi Ck si è veri…cato (o si veri…cherà)? Abbiamo usato la lettera C come<br />

“classe”, immaginando di voler e¤ettuare una classi…cazione.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!