25.08.2013 Views

PDF (Online Text) - EURAC

PDF (Online Text) - EURAC

PDF (Online Text) - EURAC

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

crea non pochi problemi nel caso di lingue non standardizzate e frammentarie come<br />

il sardo.<br />

2. Un progetto sperimentale: il Sardinian Digital Corpus<br />

Il sardo è, come ben noto, suddiviso in diverse varietà e non standardizzato,<br />

nonché in costante regresso. Esistono diverse grammatiche e dizionari e, su internet,<br />

è disponibile il Sardinian <strong>Text</strong> Database (http://www.lingrom.fu-berlin.de/sardu/<br />

textos.html), una raccolta di testi in sardo curata dall’Università di Colonia. Si tratta<br />

di un’interessante iniziativa, che però non risponde ai criteri di rappresentatività,<br />

campionamento e bilanciamento. I testi vengono infatti inseriti dai vari autori e non<br />

vi è uniformità nella codifica.<br />

2.1 La pianificazione<br />

Come noto, la fase di pianificazione è fondamentale in quanto, proprio in questa<br />

fase, si prendono decisioni che determinano la fisionomia del corpus e che, da un<br />

certo momento in poi, non possono più essere modificate.<br />

Nel descrivere le fasi della progettazione del SDC, seguiremo la fondamentale<br />

tassonomia di Ball (anno:pag.).<br />

Una prima distinzione è quella per mezzo. Nel progettare un corpus di una lingua<br />

in pericolo di estinzione, ovviamente sarebbe da privilegiare la presenza di campioni<br />

di lingua orale. Tuttavia, quando esista una tradizione scritta, la scelta potrebbe<br />

ricadere anche su una tipologia di corpus mista, in modo da avere una visione quanto<br />

più possibile globale della lingua. Nel caso del sardo, ad esempio, un corpus misto<br />

sarebbe possibile, in quanto esiste una certa produzione scritta sia “tradizionale”<br />

(romanzi, racconti, testi poetici, articoli di giornale), sia “elettronica” (mailing lists<br />

e siti in sardo).<br />

Il SDC dovrebbe essere un corpus monolingue, ma rappresentativo delle diverse<br />

varietà. La creazione di corpora multilingui o paralleli potrebbe essere un passo<br />

successivo, particolarmente interessante sia dal punto di vista della linguistica<br />

comparativa che della glottodidattica.<br />

Per le stesse ragioni enumerate sopra, il SDC si propone come un corpus sincronico,<br />

dato che abbiamo mostrato come sia urgente documentare lo stato di lingua attuale.<br />

Il confronto con stati di lingua passati e quindi la creazione di un corpus diacronico<br />

dovrà essere necessariamente successiva.<br />

47

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!