Enrico Feoli, Paola Ganis - Università degli Studi di Trieste
Enrico Feoli, Paola Ganis - Università degli Studi di Trieste
Enrico Feoli, Paola Ganis - Università degli Studi di Trieste
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
contemporanea (co-occorrenza) negli oggetti.<br />
Una tabella puo’ essere ristrutturata <strong>di</strong>versamente secondo i risultati ottenuti con i <strong>di</strong>versi<br />
in<strong>di</strong>ci <strong>di</strong> similarita’ e algoritmi <strong>di</strong> classificazione applicati. Se, ad esempio, sono stati applicati 3<br />
meto<strong>di</strong> per la classificazione della variabili ed altrettanti meto<strong>di</strong> per quella <strong>degli</strong> oggetti, in tutto si<br />
potranno ottenere 3x3=9 tabelle ristrutturate secondo tutte le possibilita’ <strong>di</strong> rior<strong>di</strong>namento. Tutte<br />
queste tabelle potrebbero essere equivalenti, oppure qualcuna potrebbe rappresentare meglio<br />
delle altre la struttura dei dati, cioe’ le relazioni tra variabili/gruppi <strong>di</strong> variabili e gruppi <strong>di</strong> rilievi.<br />
Puo’ tornare utile confrontare i risultati delle <strong>di</strong>verse classificazioni in termini <strong>di</strong> composizione delle<br />
classi ottenute a specifici livelli gerarchici del dendrogramma. Per confrontare due classificazioni si<br />
utilizzano la statistica chi-quadrato [eq. (4.41)] o l’in<strong>di</strong>ce <strong>di</strong> Cramer [eq. (4.44)] da esso derivato o<br />
la mutua informazione [eq. (2.2)] applicate ad una tabella <strong>di</strong> contingenza in cui le righe<br />
rappresentano le classi della prima classificazione e le colonne quelle della seconda. I valori <strong>di</strong><br />
frequenza nella tabella in<strong>di</strong>cano il numero <strong>di</strong> elementi che appartengono ad entrambe le<br />
classificazioni nei gruppi corrispondenti.<br />
Ad esempio, supponiamo <strong>di</strong> aver classificato con due meto<strong>di</strong> <strong>di</strong>versi 25 rilievi e <strong>di</strong> aver<br />
in<strong>di</strong>viduato 3 gruppi principali in entrambe le classificazioni. Attribuendo a ciascun rilievo il gruppo<br />
<strong>di</strong> appartenenza per ciascuna classificazione (Tab. 7.9), risulta poi facile costruire la tabella <strong>di</strong><br />
incrocio tra i vettori delle appartenenze alle classi delle due classificazioni. Infatti per sapere quanti<br />
rilievi appartengono al primo gruppo della prima classificazione e contemporaneamente al primo<br />
gruppo della seconda classificazione si contano i rilievi che hanno la coppia <strong>di</strong> valori 1,1 e si<br />
procede in questa maniera fino ad aver inserito nella tabella d’incrocio tutti i rilievi.<br />
Tab. 7.9 Valori <strong>di</strong> appartenenza <strong>di</strong> 25 rilievi ai gruppi ottenuti con due <strong>di</strong>verse classificazioni.<br />
Rilievi 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25<br />
I classif. 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3<br />
II classif. 1 1 1 1 1 3 3 3 3 3 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2<br />
La <strong>di</strong>stribuzione dei valori nella tabella <strong>di</strong> contingenza (Tab. 7.10) in<strong>di</strong>ca che non tutti i gruppi<br />
ottenuti con una classificazione corrispondono in modo consistente ai gruppi ottenuti con l’altra. Il<br />
gruppo che rimane piu’ stabile in entrambe le classificazioni e’ il 2; infatti, 10 rilievi su 13 del<br />
gruppo 2 della prima classificazione si confermano nel gruppo 2 della seconda classificazione<br />
costituito da 12 rilievi. Si puo’ osservare invece che i primi gruppi <strong>di</strong> entrambe le classificazioni si<br />
smembrano in due gruppi nella classificazione alternativa.<br />
L’in<strong>di</strong>ce <strong>di</strong> Cramer applicato a tabelle d’incrocio <strong>di</strong> questo tipo e’ uguale a 0 quando la<br />
<strong>di</strong>fferenza tra le classificazioni e’ massima, cioe’ quando i valori relativi alle classi <strong>di</strong> una<br />
7-92