22.10.2014 Views

Enrico Feoli, Paola Ganis - Università degli Studi di Trieste

Enrico Feoli, Paola Ganis - Università degli Studi di Trieste

Enrico Feoli, Paola Ganis - Università degli Studi di Trieste

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

7 . C L A S S I F I C A Z I O N E<br />

I termini classificazione e "cluster analysis" comprendono tutte le tecniche numeriche che<br />

hanno lo scopo <strong>di</strong> riunire in gruppi gli oggetti o le variabili basandosi sulla loro somiglianza o<br />

correlazione in modo tale che gli elementi <strong>di</strong> un gruppo siano il piu' possibile simili tra loro e il piu'<br />

possibile <strong>di</strong>fferenziati dagli elementi <strong>degli</strong> altri gruppi. In altre parole i meto<strong>di</strong> ottengono un'alta<br />

omogeneita' a livello dei gruppi e un'alta eterogeneita' tra i gruppi. Per classificare oggetti o<br />

variabili e' necessario quin<strong>di</strong> valutare quanto queste entita’ si assomigliano tra loro e, una volta<br />

ottenute queste informazioni, raggruppare le entita’ in classi sulla base della loro somiglianza<br />

reciproca.<br />

Le tecniche <strong>di</strong> classificazione possono seguire strategie <strong>di</strong>verse, gerarchiche e non<br />

gerarchiche, <strong>di</strong>visive e agglomerative, monotetiche e politetiche. I meto<strong>di</strong> gerarchici raggruppano<br />

gli elementi da classificare in insiemi e questi, a loro volta, in insiemi sempre piu' vasti, creando<br />

una struttura ad albero che graficamente si esprime tramite un dendrogramma. I meto<strong>di</strong> non<br />

gerarchici creano soltanto delle partizioni o la partizione ottimale <strong>degli</strong> elementi senza nulla <strong>di</strong>re<br />

riguardo alla relazione esistente tra gli insiemi ottenuti. I meto<strong>di</strong> <strong>di</strong>visivi creano l'albero dalla<br />

ra<strong>di</strong>ce, <strong>di</strong>videndo cioe' progressivamente l'insieme <strong>degli</strong> elementi sulla base <strong>degli</strong> stati <strong>di</strong> un<br />

carattere per volta (monotetici) o sulla base delle matrici <strong>di</strong> devianze e codevianze <strong>di</strong> tutte le<br />

variabili (politetici). I meto<strong>di</strong> agglomerativi creano l'albero dalle foglie, cioe' aggregano gli elementi<br />

da classificare in insiemi via via piu' vasti. I meto<strong>di</strong> gerarchici agglomerativi sono solo politetici<br />

poiché il confronto tra elementi avviene sempre sulla base <strong>di</strong> tutti i caratteri descrittivi. Questi<br />

ultimi sono da noi presi in considerazione nel paragrafo 7.9.<br />

7.1 FUNZIONI DI SIMILARITA’<br />

La similarita' tra oggetti o variabili è valutata a coppie <strong>di</strong> elementi tramite <strong>degli</strong> in<strong>di</strong>ci o<br />

funzioni <strong>di</strong> somiglianza o <strong>di</strong> <strong>di</strong>stanza. Le funzioni <strong>di</strong> somiglianza valutano quanto due entita’ si<br />

assomigliano ed assumono valori crescenti in rapporto alla somiglianza. Per questo un valore <strong>di</strong><br />

in<strong>di</strong>ce uguale a zero in<strong>di</strong>ca somiglianza nulla. Gli in<strong>di</strong>ci <strong>di</strong> <strong>di</strong>stanza invece si basano sulla <strong>di</strong>stanza <strong>di</strong><br />

due oggetti nello spazio multi<strong>di</strong>mensionale e, poiche’ punti <strong>di</strong>stanti in<strong>di</strong>cano maggiore<br />

<strong>di</strong>ssomiglianza, assumono valori decrescenti rispetto alla somiglianza; in questo caso un valore<br />

uguale a zero in<strong>di</strong>ca <strong>di</strong>stanza nulla e quin<strong>di</strong> uguaglianza tra gli oggetti confrontati. Riassumendo<br />

possiamo <strong>di</strong>re che l'andamento delle funzioni <strong>di</strong> somiglianza e' inverso rispetto a quello delle<br />

funzioni <strong>di</strong> <strong>di</strong>stanza, cioe' la funzione <strong>di</strong> somiglianza cresce laddove quella <strong>di</strong> <strong>di</strong>stanza decresce.<br />

Le funzioni <strong>di</strong> similarita’ possono essere convenientemente sud<strong>di</strong>vise in tre categorie in<br />

7-73

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!