30.04.2013 Views

versione pdf - Sardegna DigitalLibrary

versione pdf - Sardegna DigitalLibrary

versione pdf - Sardegna DigitalLibrary

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

L’influsso delle lingue dominanti sul lessico e la fonologia dei dialetti sardi 247<br />

consonanti, mentre le semivocali [j] e [w] vengono trattate sia come consonanti<br />

sia come vocali.<br />

3.2.3 Clustering e scalatura multidimensionale<br />

Lo scopo del clustering è quello di identificare raggruppamenti rilevanti<br />

all’interno di strutture complesse. 23 L’algoritmo si può spiegare più agevolmente<br />

usando un esempio. Supponiamo che si abbia la matrice seguente:<br />

(6) Italiano Spagnolo Catalano Iglesias Scano<br />

Italiano 0 17.6 20.0 17.9 18.3<br />

Spagnolo 0 15.2 20.0 19.8<br />

Catalano 0 20.6 21.0<br />

Iglesias 0 12.1<br />

Scano 0<br />

La distanza di ciascuna lingua da sé stessa è naturalmente uguale a 0. Poiché<br />

la matrice è simmetrica non occorre rappresentare nuovamente i dati della metà<br />

in basso a sinistra della matrice.<br />

Il clustering costituisce un processo iterativo. In ogni passaggio del processo<br />

si individua la distanza più piccola nella matrice e le lingue tra cui esiste<br />

questa distanza vengono riunite in un cluster. Successivamente si determina la<br />

distanza tra il cluster formato e le altre lingue. Questa operazione si effettua<br />

sulla base di un algoritmo di aggiornamento della tabella. Jain/Dubes (1988)<br />

menzionano sette di questi algoritmi. Ai fini di questa ricerca, l’algoritmo che<br />

ha fornito i risultati più soddisfacenti (cioè, più logici) si è rivelato quello che<br />

prende in considerazione la media delle distanze. La distanza di k da un nuovo<br />

cluster [ij] è costituita dalla media delle distanze tra i e k e tra j e k. 24 Nella<br />

matrice delle distanza presentata qui sopra, la distanza tra Iglesias e Scano si<br />

rivela essere la più piccola. Dopo aver raggruppato le due località in un cluster,<br />

si calcolano le distanze tra il nuovo cluster e gli elementi rimasti. Per<br />

esempio, la distanza tra l’italiano e Iglesias-Scano si calcola nel modo seguente:<br />

dItaliano (Iglesias,Scano)<br />

= (dItaliano-Iglesias + dItaliano-Scano) : 2 = (17.9+18.3) : 2 = 18.1.<br />

Dopo aver calcolato la distanza tra l’italiano e Iglesias-Scano, il catalano e<br />

Iglesias-Scano, e lo spagnolo e Iglesias-Scano si ottiene la matrice seguente (i<br />

nuovi valori sono rappresentati in grassetto, mentre quelli introdotti in precedenza<br />

sono rappresentati con caratteri normali):

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!