22.10.2014 Views

Enrico Feoli, Paola Ganis - Università degli Studi di Trieste

Enrico Feoli, Paola Ganis - Università degli Studi di Trieste

Enrico Feoli, Paola Ganis - Università degli Studi di Trieste

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

contemporanea (co-occorrenza) negli oggetti.<br />

Una tabella puo’ essere ristrutturata <strong>di</strong>versamente secondo i risultati ottenuti con i <strong>di</strong>versi<br />

in<strong>di</strong>ci <strong>di</strong> similarita’ e algoritmi <strong>di</strong> classificazione applicati. Se, ad esempio, sono stati applicati 3<br />

meto<strong>di</strong> per la classificazione della variabili ed altrettanti meto<strong>di</strong> per quella <strong>degli</strong> oggetti, in tutto si<br />

potranno ottenere 3x3=9 tabelle ristrutturate secondo tutte le possibilita’ <strong>di</strong> rior<strong>di</strong>namento. Tutte<br />

queste tabelle potrebbero essere equivalenti, oppure qualcuna potrebbe rappresentare meglio<br />

delle altre la struttura dei dati, cioe’ le relazioni tra variabili/gruppi <strong>di</strong> variabili e gruppi <strong>di</strong> rilievi.<br />

Puo’ tornare utile confrontare i risultati delle <strong>di</strong>verse classificazioni in termini <strong>di</strong> composizione delle<br />

classi ottenute a specifici livelli gerarchici del dendrogramma. Per confrontare due classificazioni si<br />

utilizzano la statistica chi-quadrato [eq. (4.41)] o l’in<strong>di</strong>ce <strong>di</strong> Cramer [eq. (4.44)] da esso derivato o<br />

la mutua informazione [eq. (2.2)] applicate ad una tabella <strong>di</strong> contingenza in cui le righe<br />

rappresentano le classi della prima classificazione e le colonne quelle della seconda. I valori <strong>di</strong><br />

frequenza nella tabella in<strong>di</strong>cano il numero <strong>di</strong> elementi che appartengono ad entrambe le<br />

classificazioni nei gruppi corrispondenti.<br />

Ad esempio, supponiamo <strong>di</strong> aver classificato con due meto<strong>di</strong> <strong>di</strong>versi 25 rilievi e <strong>di</strong> aver<br />

in<strong>di</strong>viduato 3 gruppi principali in entrambe le classificazioni. Attribuendo a ciascun rilievo il gruppo<br />

<strong>di</strong> appartenenza per ciascuna classificazione (Tab. 7.9), risulta poi facile costruire la tabella <strong>di</strong><br />

incrocio tra i vettori delle appartenenze alle classi delle due classificazioni. Infatti per sapere quanti<br />

rilievi appartengono al primo gruppo della prima classificazione e contemporaneamente al primo<br />

gruppo della seconda classificazione si contano i rilievi che hanno la coppia <strong>di</strong> valori 1,1 e si<br />

procede in questa maniera fino ad aver inserito nella tabella d’incrocio tutti i rilievi.<br />

Tab. 7.9 Valori <strong>di</strong> appartenenza <strong>di</strong> 25 rilievi ai gruppi ottenuti con due <strong>di</strong>verse classificazioni.<br />

Rilievi 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25<br />

I classif. 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3<br />

II classif. 1 1 1 1 1 3 3 3 3 3 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2<br />

La <strong>di</strong>stribuzione dei valori nella tabella <strong>di</strong> contingenza (Tab. 7.10) in<strong>di</strong>ca che non tutti i gruppi<br />

ottenuti con una classificazione corrispondono in modo consistente ai gruppi ottenuti con l’altra. Il<br />

gruppo che rimane piu’ stabile in entrambe le classificazioni e’ il 2; infatti, 10 rilievi su 13 del<br />

gruppo 2 della prima classificazione si confermano nel gruppo 2 della seconda classificazione<br />

costituito da 12 rilievi. Si puo’ osservare invece che i primi gruppi <strong>di</strong> entrambe le classificazioni si<br />

smembrano in due gruppi nella classificazione alternativa.<br />

L’in<strong>di</strong>ce <strong>di</strong> Cramer applicato a tabelle d’incrocio <strong>di</strong> questo tipo e’ uguale a 0 quando la<br />

<strong>di</strong>fferenza tra le classificazioni e’ massima, cioe’ quando i valori relativi alle classi <strong>di</strong> una<br />

7-92

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!