25.12.2012 Views

Dispense

Dispense

Dispense

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

6.4. METODI DI CLASSIFICAZIONE E CLUSTERING 351<br />

y<br />

1.0<br />

0.5<br />

­4 ­2 0 2 4<br />

Funzione logistica<br />

exp( )<br />

1+exp( ) .<br />

Resta il problema di trovare i coe¢ cienti. Si devono avere n individui di cui si conoscano<br />

i valori dei predittori Xi e di Y . Si usa il metodo della massima verosimiglianza. Noti i valori<br />

x1; :::; xp dei predittori di un individuo, abbiamo detto che Y è B (1; p), con p = g 1 ( ),<br />

= a1x1 + ::: + apxp + b. Quindi P (Y = 1) = p, P (Y = 0) = 1 p. Se indichiamo uno dei<br />

due numeri 0 o 1 con y, si può scrivere in una sola formula<br />

P (Y = y) = p y (1 p) 1 y :<br />

Supponiamo come abbiamo detto che, per un individuo noto, sia noto anche il valore di Y ,<br />

che chiamiamo con y. Il numero p y (1 p) 1 y è la verosimiglianza relativa a quell’individuo.<br />

In astratto, la verosimiglianza è funzione di molte grandezze: x1; :::; xp, y, a1; :::; ap; b.<br />

Trattandosi di un individuo con x1; :::; xp, y noti, ben precisi, la verosimiglianza è funzione di<br />

a1; :::; ap; b. Se poi consideriamo gli n individui indipendenti, ed indichiamo con x (i)<br />

1 ; :::; x(i) p ,<br />

y (i) i loro valori noti, vale<br />

P Y (1) = y (1) ; :::; Y (n) = y (n) nY<br />

=<br />

(i)<br />

p<br />

y(i)<br />

1<br />

(i)<br />

p<br />

1 y(i)<br />

dove<br />

p (i) = g<br />

1 (i)<br />

;<br />

i=1<br />

(i) = a1x (i)<br />

1<br />

x<br />

+ ::: + apx (i)<br />

p + b:<br />

Questa è la verosimiglianza del campione sperimentale, funzione di a1; :::; ap; b. Il metodo<br />

di massima verosimiglianza consiste nel cercare i valori di a1; :::; ap; b che rendono massima<br />

nY<br />

la verosimiglianza, cioè p (i) y(i)<br />

1 p (i) 1 y(i)<br />

. Tecnicamente, conviene massimizzare il<br />

i=1<br />

logaritmo della verosimiglianza (è equivalente), cioè<br />

nX<br />

y (i) log p (i) + 1 y (i)<br />

log 1 p (i)<br />

i=1<br />

Il software esegue la massimizzazione con un procedimento iterativo.<br />

Classi…cazione tramite regressione logistica<br />

Il metodo della regressione logistica serve ad esempio per e¤ettuare una classi…cazione non<br />

perentoria. L’output Y può assumere due valori, che per comodità espositiva chiamiamo A e<br />

B. Assume A con probabilità p.<br />

:

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!