ItalWordNet: Rete Semantico-Lessicale per l'Italiano - Cnr
ItalWordNet: Rete Semantico-Lessicale per l'Italiano - Cnr
ItalWordNet: Rete Semantico-Lessicale per l'Italiano - Cnr
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Linea 1.3 ItalWordnet<br />
DLR. DMAIL.IT DIGITALWORK.COM COM-AMM-GR-R 8<br />
7. termini presenti ma non trovati causa mancata (o errata) lemmatizzazione da parte del<br />
sistema di test:<br />
MACROECOMICI MACROECONOMICHE MACROECONOMICI<br />
1.7 Trattamento MultiWord<br />
Il trattamento di termini polilessicali o ‘multiword’ (quali ad esempio ‘tasso di sconto’)<br />
rappresenta un problema, già evidenziato e tuttora esistente. La valutazione quantitativa<br />
dell’impatto di questa tematica non è stata effettuata, poichè le procedure di test utilizzate lavorano<br />
sul singolo lemma e, in tutti i casi, il giudizio sul fatto che un dato ‘concetto’ debba o non debba<br />
essere co<strong>per</strong>to da una entry in wordnet sono tutt’altro che oggettivi. Tuttavia, quand’anche fosse<br />
ipotizzabile verificare la presenza di termini multiword tramite ‘multilookup’ nel sistema (e.s. in<br />
presenza di termini quali ‘tasso’ seguiti nel corpus da ‘di sconto’, verificare, sul match del primo<br />
elemento il completamento) questo richiederebbe estensioni alle API <strong>per</strong> <strong>per</strong>metterlo. Il fenomeno<br />
non è triviale, visto che nel wordnet economico-finanziario si hanno 3579 multiword su 4708<br />
nouns.<br />
La tematica deve essere affrontata e rappresenterà uno dei temi della linea 1.4.<br />
8 Sigle di questo tipo sono normalmente sigle degli autori, che compaiono nei testi Radiocor all’interno della notizia<br />
(e non come informazioni di testata).<br />
41