Enrico Feoli, Paola Ganis - Università degli Studi di Trieste
Enrico Feoli, Paola Ganis - Università degli Studi di Trieste
Enrico Feoli, Paola Ganis - Università degli Studi di Trieste
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
7 . C L A S S I F I C A Z I O N E<br />
I termini classificazione e "cluster analysis" comprendono tutte le tecniche numeriche che<br />
hanno lo scopo <strong>di</strong> riunire in gruppi gli oggetti o le variabili basandosi sulla loro somiglianza o<br />
correlazione in modo tale che gli elementi <strong>di</strong> un gruppo siano il piu' possibile simili tra loro e il piu'<br />
possibile <strong>di</strong>fferenziati dagli elementi <strong>degli</strong> altri gruppi. In altre parole i meto<strong>di</strong> ottengono un'alta<br />
omogeneita' a livello dei gruppi e un'alta eterogeneita' tra i gruppi. Per classificare oggetti o<br />
variabili e' necessario quin<strong>di</strong> valutare quanto queste entita’ si assomigliano tra loro e, una volta<br />
ottenute queste informazioni, raggruppare le entita’ in classi sulla base della loro somiglianza<br />
reciproca.<br />
Le tecniche <strong>di</strong> classificazione possono seguire strategie <strong>di</strong>verse, gerarchiche e non<br />
gerarchiche, <strong>di</strong>visive e agglomerative, monotetiche e politetiche. I meto<strong>di</strong> gerarchici raggruppano<br />
gli elementi da classificare in insiemi e questi, a loro volta, in insiemi sempre piu' vasti, creando<br />
una struttura ad albero che graficamente si esprime tramite un dendrogramma. I meto<strong>di</strong> non<br />
gerarchici creano soltanto delle partizioni o la partizione ottimale <strong>degli</strong> elementi senza nulla <strong>di</strong>re<br />
riguardo alla relazione esistente tra gli insiemi ottenuti. I meto<strong>di</strong> <strong>di</strong>visivi creano l'albero dalla<br />
ra<strong>di</strong>ce, <strong>di</strong>videndo cioe' progressivamente l'insieme <strong>degli</strong> elementi sulla base <strong>degli</strong> stati <strong>di</strong> un<br />
carattere per volta (monotetici) o sulla base delle matrici <strong>di</strong> devianze e codevianze <strong>di</strong> tutte le<br />
variabili (politetici). I meto<strong>di</strong> agglomerativi creano l'albero dalle foglie, cioe' aggregano gli elementi<br />
da classificare in insiemi via via piu' vasti. I meto<strong>di</strong> gerarchici agglomerativi sono solo politetici<br />
poiché il confronto tra elementi avviene sempre sulla base <strong>di</strong> tutti i caratteri descrittivi. Questi<br />
ultimi sono da noi presi in considerazione nel paragrafo 7.9.<br />
7.1 FUNZIONI DI SIMILARITA’<br />
La similarita' tra oggetti o variabili è valutata a coppie <strong>di</strong> elementi tramite <strong>degli</strong> in<strong>di</strong>ci o<br />
funzioni <strong>di</strong> somiglianza o <strong>di</strong> <strong>di</strong>stanza. Le funzioni <strong>di</strong> somiglianza valutano quanto due entita’ si<br />
assomigliano ed assumono valori crescenti in rapporto alla somiglianza. Per questo un valore <strong>di</strong><br />
in<strong>di</strong>ce uguale a zero in<strong>di</strong>ca somiglianza nulla. Gli in<strong>di</strong>ci <strong>di</strong> <strong>di</strong>stanza invece si basano sulla <strong>di</strong>stanza <strong>di</strong><br />
due oggetti nello spazio multi<strong>di</strong>mensionale e, poiche’ punti <strong>di</strong>stanti in<strong>di</strong>cano maggiore<br />
<strong>di</strong>ssomiglianza, assumono valori decrescenti rispetto alla somiglianza; in questo caso un valore<br />
uguale a zero in<strong>di</strong>ca <strong>di</strong>stanza nulla e quin<strong>di</strong> uguaglianza tra gli oggetti confrontati. Riassumendo<br />
possiamo <strong>di</strong>re che l'andamento delle funzioni <strong>di</strong> somiglianza e' inverso rispetto a quello delle<br />
funzioni <strong>di</strong> <strong>di</strong>stanza, cioe' la funzione <strong>di</strong> somiglianza cresce laddove quella <strong>di</strong> <strong>di</strong>stanza decresce.<br />
Le funzioni <strong>di</strong> similarita’ possono essere convenientemente sud<strong>di</strong>vise in tre categorie in<br />
7-73