25.01.2014 Views

ItalWordNet: Rete Semantico-Lessicale per l'Italiano - Cnr

ItalWordNet: Rete Semantico-Lessicale per l'Italiano - Cnr

ItalWordNet: Rete Semantico-Lessicale per l'Italiano - Cnr

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Linea 1.3 ItalWordnet<br />

DLR. DMAIL.IT DIGITALWORK.COM COM-AMM-GR-R 8<br />

7. termini presenti ma non trovati causa mancata (o errata) lemmatizzazione da parte del<br />

sistema di test:<br />

MACROECOMICI MACROECONOMICHE MACROECONOMICI<br />

1.7 Trattamento MultiWord<br />

Il trattamento di termini polilessicali o ‘multiword’ (quali ad esempio ‘tasso di sconto’)<br />

rappresenta un problema, già evidenziato e tuttora esistente. La valutazione quantitativa<br />

dell’impatto di questa tematica non è stata effettuata, poichè le procedure di test utilizzate lavorano<br />

sul singolo lemma e, in tutti i casi, il giudizio sul fatto che un dato ‘concetto’ debba o non debba<br />

essere co<strong>per</strong>to da una entry in wordnet sono tutt’altro che oggettivi. Tuttavia, quand’anche fosse<br />

ipotizzabile verificare la presenza di termini multiword tramite ‘multilookup’ nel sistema (e.s. in<br />

presenza di termini quali ‘tasso’ seguiti nel corpus da ‘di sconto’, verificare, sul match del primo<br />

elemento il completamento) questo richiederebbe estensioni alle API <strong>per</strong> <strong>per</strong>metterlo. Il fenomeno<br />

non è triviale, visto che nel wordnet economico-finanziario si hanno 3579 multiword su 4708<br />

nouns.<br />

La tematica deve essere affrontata e rappresenterà uno dei temi della linea 1.4.<br />

8 Sigle di questo tipo sono normalmente sigle degli autori, che compaiono nei testi Radiocor all’interno della notizia<br />

(e non come informazioni di testata).<br />

41

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!