13.06.2013 Views

2 I dizionari fondamentali e di frequenza della lingua italiana

2 I dizionari fondamentali e di frequenza della lingua italiana

2 I dizionari fondamentali e di frequenza della lingua italiana

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

questo or<strong>di</strong>namento, e i due ranghi che competono al lemma nell’or<strong>di</strong>namento per<br />

<strong>frequenza</strong> e <strong>di</strong>spersione decrescenti.<br />

Notiamo che il LIF è stato il primo grande progetto <strong>di</strong> costituzione <strong>di</strong> una lista <strong>di</strong><br />

<strong>frequenza</strong>, non tagliato su un singolo autore o su testi specificatamente letterari, in più, è<br />

stato il primo <strong><strong>di</strong>zionari</strong>o <strong>di</strong> <strong>frequenza</strong> realizzato con l’ausilio <strong>di</strong> calcolatori elettronici. Il<br />

LIF serve come base per la costruzione del Vocabolario <strong>di</strong> base <strong>di</strong> De Mauro et al.<br />

(1980).<br />

2.2.9 Juilland A., Traversa V. (1973) Frequency Dictionary of<br />

Italian Words, The Hague, Mouton. (FDI)<br />

Il volume è stato pubblicato nell’ambito del cosiddetto Romance Languages<br />

Project dell’Università <strong>di</strong> Pennsylvania, <strong>di</strong>retto da A. Juilland, che mirava a fornire una<br />

descrizione dei lessici <strong>di</strong> tutte le lingue romanze. Il <strong><strong>di</strong>zionari</strong>o per l’italiano vede la luce<br />

dopo la pubblicazione delle liste per lo spagnolo (1964), rumeno (1965) e francese<br />

(1970).<br />

La lista per l’italiano contiene 5.014 parole, tra cui anche quelle grammaticali. Il corpus è<br />

<strong>di</strong> 500.000 occorrenze, tratte da testi pubblicati tra il 1920 e il 1940, raggruppati in 5<br />

sezioni <strong>di</strong> 100.000 parole ciascuno: opere teatrali; romanzi e novelle; saggistica (saggi,<br />

memorie, corrispondenze); perio<strong>di</strong>ci (giornali e riviste); testi tecnici e scientifici (pp. XII-<br />

XVIII).<br />

Le voci sono comprese fra uso massimo 24.798,22 e <strong>frequenza</strong> massima 28.659 <strong>della</strong><br />

preposizione <strong>di</strong> ed uso minimo 2,39 <strong>di</strong> ascensione, calce, ecc. e <strong>di</strong>spersione minima 4,88<br />

<strong>di</strong> strato. Il limite inferiore è quin<strong>di</strong> la <strong>frequenza</strong> superiore a 4, l’in<strong>di</strong>ce <strong>di</strong> uso superiore a<br />

3, e l’occorrenza in almeno 3 sottoinsiemi (p. XLVI).<br />

La <strong>di</strong>spersione è calcolata secondo la regola introdotta da Juilland e Chang Rodriguez nel<br />

Frequency Dictionary of Spanish Words (1964: XLV-LV), cioè in base al rapporto tra la<br />

<strong>frequenza</strong> me<strong>di</strong>a nei 5 sottoinsiemi e lo scarto dalla me<strong>di</strong>a delle frequenze realmente<br />

trovate. Con 5 sottoinsiemi e una <strong>frequenza</strong> totale <strong>di</strong> 10, abbiamo una me<strong>di</strong>a <strong>di</strong> 2 per<br />

sottoinsieme. Con una <strong>di</strong>stribuzione <strong>di</strong> 22222 lo scarto è <strong>di</strong> zero, la <strong>di</strong>stribuzione è<br />

considerata perfetta, avrà il valore 1, mentre nel caso <strong>di</strong> una <strong>di</strong>stribuzione meno uniforme<br />

l’in<strong>di</strong>ce tende verso zero. 9<br />

È merito degli autori <strong>di</strong> aver introdotto, sempre nell’elaborazione <strong>della</strong> lista dello<br />

spagnolo, l’in<strong>di</strong>ce d’uso, ossia un valore che nasce dalla combinazione <strong>della</strong> <strong>frequenza</strong> e<br />

<strong>di</strong>stribuzione. L’assunzione <strong>di</strong> base è che le frequenze <strong>di</strong>stribuite in modo uniforme sono<br />

“dense”, nel senso che non <strong>di</strong>minuiscono al crescere del corpus, mentre le frequenze mal<br />

<strong>di</strong>stribuite sono “gonfie” e in un corpus più rappresentativo tendono a ridursi. Alla<br />

correlazione tra <strong>frequenza</strong> e <strong>di</strong>strobuzione Sciarone (1977: 59-87) de<strong>di</strong>ca l’intero capitolo<br />

quarto del suo libro, giungendo alla conclusione che più una parola è frequente, meglio è<br />

<strong>di</strong>stribuita, pertanto il valore d’uso non serve per or<strong>di</strong>nare le parole secondo un criterio<br />

d’importanza. Gli stessi autori riconoscono, infatti, che più numerose sono le occorrenze,<br />

più uniforme è la loro <strong>di</strong>spersione, quin<strong>di</strong> l’aggiustamento causato dal valore d’uso sarà<br />

minore (le prime 100 parole in or<strong>di</strong>ne <strong>di</strong> <strong>frequenza</strong> decrescente sono identiche alle prime<br />

100 parole in or<strong>di</strong>ne d’uso decrescente); mentre più bassa è la <strong>frequenza</strong> e meno<br />

uniforme la <strong>di</strong>stribuzione, l’aggiustamento sarà proporzionalmente maggiore (Juilland<br />

1973: XLIV-XLV). Ciò suggerisce che il coefficiente d’uso è rilevante per prevedere<br />

9 Secondo Sciarone (1977: 61) il punto critico è che la formula non prende in considerazione il numero dei<br />

sottoinsiemi in cui la parola è presente, anche se questo fatto sembra importante per la determinazione <strong>della</strong><br />

<strong>di</strong>stribuzione.<br />

46

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!