25.12.2012 Views

Dispense

Dispense

Dispense

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

350 CAPITOLO 6. STATISTICA MULTIVARIATA<br />

Pensiamo ad un esempio: supponiamo che gli individui siano le nazioni europee e che, per<br />

una certa nazione, sia Y = 1 se la nazione migliora la propria condizione economica (Y = 0<br />

altrimenti) durante l’anno 2011. I predittori potrebbero essere gli investimenti in ricerca, e<br />

così via del 2010. Noti i valori dei predittori, la casualità non è certo esaurita, quindi Y resta<br />

aleatorio, ma la sua legge (cioè p) è ora determinata, nota. Nel modello RLog si suppone che<br />

la probabilità p di miglioramento sia nota quando sono noti i predittori. Inoltre si suppone<br />

che p dipenda dai predittori solo attraverso la loro combinazione a¢ ne .<br />

Un altro esempio: gli individui sono esemplari di complessi sistemi meccanici o elettronici,<br />

Y = 1 se il sistema funziona per un anno, i predittori possono essere valori misurati di<br />

caratteristiche meccaniche ecc. di sottoparti, del materiale ecc.<br />

Essendo p una probabilità, non possiamo pensare che la relazione tra p ed sia del tipo<br />

p = , cioè<br />

p = a1x1 + ::: + apxp + b<br />

altrimenti otterremmo per p valori anche esterni a [0; 1]. Si deve adottare un modello del tipo<br />

g (p) = a1x1 + ::: + apxp + b<br />

dove g è una funzione de…nita in [0; 1] a valori reali, invertibile. In modo che sia<br />

p = g 1 (a1x1 + ::: + apxp + b) :<br />

Una scelta molto comune è la funzione detta logit<br />

g (p) = log<br />

p<br />

1 p<br />

Per p ! 0 essa tende a 1, mentre per p ! 1 tende a +1; ed è strettamente crescente,<br />

oltre che regolare. La sua funzione inversa è<br />

[Infatti log<br />

p<br />

1 p<br />

= ,<br />

p<br />

1 p<br />

exp( )<br />

1+exp( ) .] In de…nitiva, il modello è<br />

Y B (1; p) con p =<br />

g 1 ( ) =<br />

:<br />

exp ( )<br />

1 + exp ( )<br />

= exp ( ), p = (1 p) exp ( ), p (1 + exp ( )) = exp ( ), p =<br />

exp ( )<br />

1 + exp ( ) dove = a1x1 + ::: + apxp + b:<br />

Quando i coe¢ cienti a1; :::; ap; b sono divenuti noti, preso un nuovo individuo, calcolati i valori<br />

dei suoi predittori x1; :::; xp, si calcola la probabilità p relativa a quell’individuo (probabilità<br />

di questo o quell’accadimento, dipende dal problema). Se p è molto elevata, siamo abbastanza<br />

sicuri che per quell’individuo sarà Y = 1, mentre se è molto bassa, conteremo che sia Y = 0;<br />

nel mezzo ovviamente c’è molta indecisione sul valore di Y di quell’individuo, pur valendo<br />

comunque che se p > 1=2 è più probabile Y = 1 e viceversa.<br />

Nella teoria generale dei modelli lineari generalizzati, il numero = a1x1 + ::: + apxp + b<br />

viene detto predittore lineare, la funzione g 1 viene detta link function e la funzione g viene<br />

detta mean function. Nella regressione logistica, la link function è la funzione logistica,<br />

rappresentata in …gura.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!