22.10.2014 Views

Enrico Feoli, Paola Ganis - Università degli Studi di Trieste

Enrico Feoli, Paola Ganis - Università degli Studi di Trieste

Enrico Feoli, Paola Ganis - Università degli Studi di Trieste

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Una modalita’ soggettiva <strong>di</strong> operare per in<strong>di</strong>viduare graficamente nel dendrogramma le classi<br />

e’ scegliere a priori un valore soglia <strong>di</strong> somiglianza in corrispondenza del quale si traccia una linea<br />

parallela alle linee che uniscono i sottogruppi rispetto alla quale si osserva in quanti gruppi si<br />

ripartisce l'insieme <strong>degli</strong> oggetti (ve<strong>di</strong> Fig. 7.6). L’in<strong>di</strong>viduazione dei gruppi viene fatta da alcuni<br />

ricercatori in maniera soggettiva anche stabilendo un valore <strong>di</strong> somiglianza che permetta <strong>di</strong><br />

in<strong>di</strong>viduare quei gruppi che grossolanamente erano gia' stati in<strong>di</strong>viduati a priori sulla base <strong>di</strong> idee<br />

preconcette. Questo modo <strong>di</strong> operare servirebbe per confermare o no cio’ che il ricercatore si<br />

aspetta. La scelta del taglio del dendrogramma puo' essere fatta piu’ rigorosamente secondo criteri<br />

oggettivi che si basano principalmente sulla valutazione dell'omogeneita' all'interno dei gruppi<br />

stimata, per esempio, tramite la statistica del chi-quadrato. Questi in<strong>di</strong>viduano il taglio ottimale,<br />

cioe’ quello che crea gruppi piu’ <strong>di</strong>somogenei tra loro e piu’ omogenei al loro interno.<br />

E’ utile a questo punto introdurre il concetto <strong>di</strong> pre<strong>di</strong>ttivita’. Con questo termine si intende la<br />

capacita’ <strong>di</strong> una classificazione <strong>di</strong> oggetti <strong>di</strong> pre<strong>di</strong>re stati <strong>di</strong> variabili. Se le variabili appartengono<br />

all’insieme <strong>di</strong> variabili utilizzate per ottenere la classificazione allora si parla <strong>di</strong> pre<strong>di</strong>ttivita’ interna,<br />

se le variabili non sono servite per la classificazione allora si parla <strong>di</strong> pre<strong>di</strong>ttivita’ esterna. Si <strong>di</strong>ce<br />

che una classificazione e’ pre<strong>di</strong>ttiva nei confronti <strong>di</strong> una variabile se esiste una <strong>di</strong>fferenza<br />

significativa tra i valori che la variabile assume nelle <strong>di</strong>verse classi <strong>di</strong> oggetti.<br />

Se i dati sono continui, per misurare la significativita’ delle <strong>di</strong>fferenze tra le classi possono<br />

essere applicati i meto<strong>di</strong> statistici che si basano sulla varianza come il test F e il test t <strong>di</strong> Student<br />

[eq. (4.24)]. Se i dati sono <strong>di</strong>screti (frequenze), si possono usare i meto<strong>di</strong> basati sul chi-quadrato<br />

[eq. (4.41)] <strong>di</strong> tabelle <strong>di</strong> contingenza. Se una classificazione e’ pre<strong>di</strong>ttiva per una certa variabile e<br />

non lo e’ per un’altra, allora la prima variabile e’ <strong>di</strong>scriminante e la seconda no. La pre<strong>di</strong>ttivita’ <strong>di</strong><br />

una classificazione e la capacita’ <strong>di</strong>scriminante delle variabili sono due concetti strettamente<br />

collegati. Le variabili <strong>di</strong>scriminanti per una determinata classificazione sono quelle che<br />

maggiormente giustificano la classificazione per i <strong>di</strong>fferenti valori che assumono nelle varie classi<br />

che rimangono appunto <strong>di</strong>stinte.<br />

Un’operazione molto semplice che aiuta ad in<strong>di</strong>viduare e/o definire le classi <strong>di</strong> oggetti e <strong>di</strong><br />

variabili consiste nella ristrutturazione della tabella dei dati secondo il nuovo or<strong>di</strong>ne <strong>di</strong> righe e/o<br />

colonne dettato dalle sequenze dei dendrogrammi. Il rior<strong>di</strong>namento della matrice semplifica la<br />

lettura della matrice stessa favorendo la definizione dei gruppi. Infatti poiche’ i vettori riga e<br />

colonna sono rior<strong>di</strong>nati in base alla somiglianza dei loro valori, sono facilmente in<strong>di</strong>viduabili<br />

all’interno della matrice omogeneita’ <strong>di</strong> valori in corrispondenza <strong>di</strong> elementi dello stesso gruppo e<br />

<strong>di</strong>scontinuita’ al passaggio da un gruppo all’altro. Cio’ agevola la descrizione delle classi poiche’ i<br />

gruppi <strong>di</strong> oggetti sono facilmente in<strong>di</strong>viduabili sulla base <strong>di</strong> tutte le variabili che li caratterizzano<br />

anche da un punto <strong>di</strong> vista quantitativo, e i gruppi <strong>di</strong> variabili sulla base della loro presenza<br />

7-91

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!