Enrico Feoli, Paola Ganis - Università degli Studi di Trieste
Enrico Feoli, Paola Ganis - Università degli Studi di Trieste
Enrico Feoli, Paola Ganis - Università degli Studi di Trieste
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
k<br />
2<br />
2 (| fok<br />
− fak<br />
| −0.5)<br />
χ = ∑<br />
(4.40)<br />
fa<br />
i=<br />
1<br />
k<br />
4.11.2 Test chi-quadrato per due campioni in<strong>di</strong>pendenti<br />
Quando si vuole ottenere la <strong>di</strong>stribuzione congiunta <strong>di</strong> due caratteri categoriali 3 osservati<br />
sullo stesso insieme <strong>di</strong> dati, e' necessario tabulare i dati tramite una tabella a doppia entrata o<br />
tabella <strong>di</strong> contingenza (Tab. 4.11). In essa le righe e le colonne rappresentano le categorie <strong>di</strong>screte<br />
(classi) per ciascuna delle due variabili e i valori esprimono la frequenza con cui i due caratteri,<br />
nelle loro specifiche classi, ricorrono contemporaneamente nel campione.<br />
Tab. 4.11 Schema <strong>di</strong> tabella <strong>di</strong> contingenza. Sulle righe sono <strong>di</strong>sposte<br />
tre categorie della variabile a e sulle colonne due categorie della variabile<br />
b. Il valore generico f ij in<strong>di</strong>ca la frequenza delle osservazioni che<br />
assumono contemporaneamente lo stato i-esimo <strong>di</strong> a e lo stato j-esimo<br />
<strong>di</strong> b. A lato e in basso sono in<strong>di</strong>cati i totali marginali <strong>di</strong> riga (n a. ) e <strong>di</strong><br />
colonna (n b. ). N rappresenta il totale generale, cioe’ il numero<br />
complessivo <strong>di</strong> osservazioni.<br />
b 1 b 2<br />
a 1 f 11 f 12 n a1<br />
a 2 f 21 f 22 n a2<br />
a 3 f 31 f 32 n a3<br />
n b1 n b2 N<br />
Il test del chi-quadrato (χ 2 ) applicato ad una tabella <strong>di</strong> contingenza verifica se c'e' una<br />
relazione significativa tra la <strong>di</strong>stribuzione in classi <strong>di</strong> un carattere e quella dell'altro carattere.<br />
L'ipotesi nulla <strong>di</strong>ce che i caratteri sono in<strong>di</strong>pendenti l'uno dall'altro, cioe' che la <strong>di</strong>stribuzione<br />
<strong>di</strong> un carattere non e' influenzata dai valori assunti dall'altro carattere. In questo caso i valori <strong>di</strong><br />
frequenza all’interno della tabella si <strong>di</strong>stribuiscono in maniera uniforme. Se questa ipotesi non e'<br />
vera, i valori all'interno della tabella tendono invece a <strong>di</strong>stribuirsi in maniera eterogenea<br />
evidenziando relazioni tra gli stati delle due variabili. La statistica del chi-quadrato da' quin<strong>di</strong><br />
in<strong>di</strong>cazione sia sulla relazione tra i caratteri che sull’omogeneita' della tabella 4 perche’ il grado <strong>di</strong><br />
eterogeneita’ della tabella riflette il grado <strong>di</strong> relazione tra i caratteri.<br />
⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯<br />
3 Per dati categoriali si intendono i dati organizzati in categorie <strong>di</strong>screte cioe’ tutti i dati misurati su<br />
scala nominale ma anche quelli derivati dalla <strong>di</strong>scretizzazione <strong>di</strong> variabili continue (es. classi <strong>di</strong> lunghezza,<br />
classi <strong>di</strong> peso).<br />
4 Nel paragrafo 2.4 abbiamo gia’ visto che la mutua informazione [eq. (2.2)] e’ una misura utile per<br />
valutare l’omogenita’ <strong>di</strong> una tabella. La mutua informazione moltiplicata per il doppio del totale generale<br />
della tabella approssima il chi-quadrato: χ 2 = 2N H (r,c) .<br />
4-55