22.10.2014 Views

Enrico Feoli, Paola Ganis - Università degli Studi di Trieste

Enrico Feoli, Paola Ganis - Università degli Studi di Trieste

Enrico Feoli, Paola Ganis - Università degli Studi di Trieste

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

k<br />

2<br />

2 (| fok<br />

− fak<br />

| −0.5)<br />

χ = ∑<br />

(4.40)<br />

fa<br />

i=<br />

1<br />

k<br />

4.11.2 Test chi-quadrato per due campioni in<strong>di</strong>pendenti<br />

Quando si vuole ottenere la <strong>di</strong>stribuzione congiunta <strong>di</strong> due caratteri categoriali 3 osservati<br />

sullo stesso insieme <strong>di</strong> dati, e' necessario tabulare i dati tramite una tabella a doppia entrata o<br />

tabella <strong>di</strong> contingenza (Tab. 4.11). In essa le righe e le colonne rappresentano le categorie <strong>di</strong>screte<br />

(classi) per ciascuna delle due variabili e i valori esprimono la frequenza con cui i due caratteri,<br />

nelle loro specifiche classi, ricorrono contemporaneamente nel campione.<br />

Tab. 4.11 Schema <strong>di</strong> tabella <strong>di</strong> contingenza. Sulle righe sono <strong>di</strong>sposte<br />

tre categorie della variabile a e sulle colonne due categorie della variabile<br />

b. Il valore generico f ij in<strong>di</strong>ca la frequenza delle osservazioni che<br />

assumono contemporaneamente lo stato i-esimo <strong>di</strong> a e lo stato j-esimo<br />

<strong>di</strong> b. A lato e in basso sono in<strong>di</strong>cati i totali marginali <strong>di</strong> riga (n a. ) e <strong>di</strong><br />

colonna (n b. ). N rappresenta il totale generale, cioe’ il numero<br />

complessivo <strong>di</strong> osservazioni.<br />

b 1 b 2<br />

a 1 f 11 f 12 n a1<br />

a 2 f 21 f 22 n a2<br />

a 3 f 31 f 32 n a3<br />

n b1 n b2 N<br />

Il test del chi-quadrato (χ 2 ) applicato ad una tabella <strong>di</strong> contingenza verifica se c'e' una<br />

relazione significativa tra la <strong>di</strong>stribuzione in classi <strong>di</strong> un carattere e quella dell'altro carattere.<br />

L'ipotesi nulla <strong>di</strong>ce che i caratteri sono in<strong>di</strong>pendenti l'uno dall'altro, cioe' che la <strong>di</strong>stribuzione<br />

<strong>di</strong> un carattere non e' influenzata dai valori assunti dall'altro carattere. In questo caso i valori <strong>di</strong><br />

frequenza all’interno della tabella si <strong>di</strong>stribuiscono in maniera uniforme. Se questa ipotesi non e'<br />

vera, i valori all'interno della tabella tendono invece a <strong>di</strong>stribuirsi in maniera eterogenea<br />

evidenziando relazioni tra gli stati delle due variabili. La statistica del chi-quadrato da' quin<strong>di</strong><br />

in<strong>di</strong>cazione sia sulla relazione tra i caratteri che sull’omogeneita' della tabella 4 perche’ il grado <strong>di</strong><br />

eterogeneita’ della tabella riflette il grado <strong>di</strong> relazione tra i caratteri.<br />

⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯<br />

3 Per dati categoriali si intendono i dati organizzati in categorie <strong>di</strong>screte cioe’ tutti i dati misurati su<br />

scala nominale ma anche quelli derivati dalla <strong>di</strong>scretizzazione <strong>di</strong> variabili continue (es. classi <strong>di</strong> lunghezza,<br />

classi <strong>di</strong> peso).<br />

4 Nel paragrafo 2.4 abbiamo gia’ visto che la mutua informazione [eq. (2.2)] e’ una misura utile per<br />

valutare l’omogenita’ <strong>di</strong> una tabella. La mutua informazione moltiplicata per il doppio del totale generale<br />

della tabella approssima il chi-quadrato: χ 2 = 2N H (r,c) .<br />

4-55

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!