13.11.2014 Views

Un algoritmo per la regressione multipla con dati categoriali

Un algoritmo per la regressione multipla con dati categoriali

Un algoritmo per la regressione multipla con dati categoriali

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

UN ALGORITMO REGRESSIONE 5<br />

Σ i φ(z i os - ∧ z i ) ≤ Σ i φ(z i - ∧ z i ) ∀ z ∈ C z (10)<br />

<strong>per</strong> ogni φ <strong>con</strong>vessa (es. φ = || . || P , Malmgren, 1972).<br />

Proseguendo nel passo di scaling, va minimizzato il se<strong>con</strong>do membro del<strong>la</strong> (7);<br />

una soluzione naturale <strong>per</strong> y u sarebbe:<br />

y u = (G¢G) -1 G′ ∧ z (11)<br />

ma non è una strada <strong>per</strong>corribile <strong>per</strong>chè i vettori colonna in G sono linearmente<br />

dipendenti, rendendo G¢G non invertibile. La matrice a blocchi G′G è il corrispettivo<br />

del<strong>la</strong> matrice di covarianza <strong>per</strong> variabili <strong>categoriali</strong> poiché nei blocchi diagonali essa<br />

evidenzia <strong>la</strong> struttura categoriale di ogni variabile categoriale (G j ′G j ) e nei blocchi<br />

esterni <strong>la</strong> struttura incrociata di ogni coppia di variabili (G i ′G j ).<br />

<strong>Un</strong>a <strong>regressione</strong> <strong>con</strong> variabili dummy <strong>con</strong> intercetta, eliminando una colonna <strong>per</strong> ogni<br />

variabile indipendente nelle matrici G j , rende comunque i parametri stimati non<br />

<strong>con</strong>frontabili <strong>con</strong> y nel<strong>la</strong> (6). Nè è efficiente l'utilizzo di D=diag(C), ignorando <strong>la</strong><br />

struttura di ogni coppia di variabili esplicative (ponendo i blocchi esterni di C uguali<br />

a zero).<br />

La soluzione proposta <strong>per</strong> stimare ogni y j * <strong>con</strong>siste nel proiettare ∧ z su x 1 0 , ..x j-1 0 ,<br />

x j+1 0 .. x k 0 (=X -j ):<br />

ed ottenere il vettore:<br />

∧<br />

z -j = b 1 x 1 0 +.…+ b j-i x j-1<br />

0<br />

+ b j+1 x j+1<br />

0<br />

+…+ b k x k 0 = X -j b -j (12)<br />

∧<br />

z j = ∧ z - ∧ z -j (13)<br />

dove ∧ z j è il <strong>con</strong>tributo da parte di x j . 0 (di x j<br />

0<br />

cioè al netto di X -j ) al<strong>la</strong> stima di ∧ z .<br />

Tale vettore è scomposto in k termini ortogonali <strong>per</strong> costruzione:<br />

∧<br />

z = Σ j<br />

∧<br />

z j = Σ j P j<br />

∧<br />

z Σj P j = I, P j P i = P j P i =0 (14)<br />

dove P j è <strong>la</strong> matrice di proiezione ortogonale generata da x j . (di x j al netto delle<br />

corre<strong>la</strong>zioni tra x j ed X -j ). Il se<strong>con</strong>do termine del<strong>la</strong> (7) può essere espressa allora<br />

come:<br />

SSQ( ∧ z -Gy * ) = SSQ (Σ j<br />

∧<br />

z j -Σ j G j y j b j ) = Σ j SSQ( ∧ z j - G j y j b j ) + Σ ij a ij (15)

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!