13.11.2014 Views

Un algoritmo per la regressione multipla con dati categoriali

Un algoritmo per la regressione multipla con dati categoriali

Un algoritmo per la regressione multipla con dati categoriali

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

8 P.G. LOVAGLIO<br />

Infine il presente <strong>algoritmo</strong> <strong>con</strong>sente <strong>la</strong> <strong>regressione</strong> tra <strong>dati</strong> misti (quantitativi e<br />

<strong>categoriali</strong>) di qualsiasi tipo (nominale, ordinale), mentre Canals non ammette<br />

variabili <strong>con</strong>tinue oltre ad avere gli stessi limiti di Morals nel passo di scaling.<br />

d) Ignorare <strong>la</strong> struttura di covarianza delle variabili indipendenti nel passo di<br />

scaling, dato che Morals ne tiene <strong>con</strong>to solo nel passo di stima di b, limita<br />

fortemente l'analisi. Tale problema viene risolto nell’<strong>algoritmo</strong> proposto <strong>con</strong> <strong>la</strong> teoria<br />

dei proiettori (Takeuchi et al. 1982), scindendo il previsore lineare dei minimi<br />

∧<br />

quadrati z , che tiene <strong>con</strong>to del<strong>la</strong> corre<strong>la</strong>zione tra z 0 e <strong>la</strong> struttura di covarianza tra le<br />

k(k-1)/2 coppie di variabili <strong>categoriali</strong>, in k componenti ortogonali ∧ z j .<br />

4. <strong>Un</strong>a Applicazione<br />

La tecnica proposta è stata applicata ad un collettivo di 190 studenti universitari<br />

estratti casualmente dal<strong>la</strong> popo<strong>la</strong>zione di studenti residenti nel 1999 nelle residenze<br />

universitarie dell’<strong>Un</strong>iversità di Bologna.<br />

Alle unità statistiche si è somministrato un questionario <strong>con</strong> item ordinali, su sca<strong>la</strong><br />

Likert a sette gradi, (1 indica completo disaccordo, 7 completo accordo <strong>con</strong> ogni<br />

item) <strong>per</strong> testare <strong>la</strong> soddisfazione dei residenti dopo un anno trascorso nel<strong>la</strong> residenza<br />

universitaria. La variabile dipendente (X1) è l’item “soddisfazione”, mentre le<br />

variabili indipendenti (X2….X8) riguardano gli item:<br />

X2= “in questo collegio ho sviluppato una buona capacità re<strong>la</strong>zionale”<br />

X3= “in questo collegio mi sento sicuro”<br />

X4= “sono costantemente aiutato nello studio”<br />

X5= ”in collegio ho trovato difficoltà nello studio”<br />

X6= “il direttore è sensibile alle mie richieste”<br />

X7= “<strong>la</strong> qualità del<strong>la</strong> mensa è buona”<br />

X8= “<strong>la</strong> stanza è <strong>con</strong>fortevole”<br />

Tutte le variabili sono di natura ordinale e vanno trasformate in modo da<br />

minimizzare <strong>la</strong> devianza residua; l’output dell’<strong>algoritmo</strong> restituisce i coefficienti di<br />

<strong>regressione</strong> stimati, i re<strong>la</strong>tivi standard error, (Tab.II) e i parametri di scaling che<br />

vengono proiettati sulle categorie iniziali del questionario (Figura1) definendo <strong>la</strong><br />

trasformazione ottima <strong>per</strong> ogni item.<br />

Tab.I mostra il numero di iterazioni prima del<strong>la</strong> <strong>con</strong>vergenza dell’<strong>algoritmo</strong>. Il<br />

valore di R 2 =0.5 e i coefficienti stimati mostrano che le uniche informazione<br />

“prevedibili” sui segni dei coefficiente di <strong>regressione</strong> (negativo di X5 e positivo <strong>per</strong><br />

le altre variabili) sono rispettate. <strong>Un</strong>a analoga <strong>regressione</strong> lineare, trattando le<br />

categorie come punteggi restituisce R 2 =0.36.<br />

8

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!