25.01.2014 Views

ItalWordNet: Rete Semantico-Lessicale per l'Italiano - Cnr

ItalWordNet: Rete Semantico-Lessicale per l'Italiano - Cnr

ItalWordNet: Rete Semantico-Lessicale per l'Italiano - Cnr

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Linea 1.3 ItalWordnet<br />

elementi ‘spurii’. Questo al fine di avere una valutazione non solo della co<strong>per</strong>tura rispetto ad un<br />

testo ‘ideale’ (una stima si ottiene comunque dal quarto test, e misure più precise saranno<br />

comunque derivate nella linea 1.4) ma anche rispetto a testi reali, contenti un normale ‘rumore’<br />

dovuto ad errori o altro.<br />

1.5.1 Risultati dei test<br />

Vengono riportati nel seguito i risultati dei test automatici di co<strong>per</strong>tura, eseguiti <strong>per</strong> la risorsa<br />

generica e <strong>per</strong> quella finanziaria. La non disponibilità alla data dei test dell’integrazione delle due<br />

risorse ha ovviamente rappresentato una limitazione, ma i test, anche separati, <strong>per</strong>mettono<br />

comunque di valure l’ipotetica co<strong>per</strong>tura di una risorsa integrata. Nella valutazione dei risultati della<br />

risorsa economica sono stati infatti ‘esclusi’ i termini mancanti ma risultanti da una ricerca nella<br />

risorsa generica. In questo modo è stato possibile valutare almeno qualitativamente i risultati<br />

ottenibili sulla risorsa integrata.<br />

La co<strong>per</strong>tura sembra ragionevole (considerando i due lessici come integrati, ovvero valutando i<br />

risultati complessivi); la maggior parte dei lemmi non trovati sono rappresentati da errori<br />

tipografici, parole straniere, sigle ed altro, una parte è rappresentata da aggettivi e solo una parte<br />

ridotta rappresenta una effettiva mancata co<strong>per</strong>tura. Il successivo paragrafo riporta le casistiche<br />

determinate. E’ tuttavia da notare che considerando queste casistiche si rimane su valori (76%<br />

quando il test viene effettuato su tutti i lemmi presenti nel corpus e 90% quanto il test è eseguito sui<br />

lemmi rilevanti al fine della classificazione) di cui bisogna tener conto nel confronto su un corpus<br />

‘reale’ e non filtrato a priori.<br />

1.5.1.1 Test 1 – database generico - (su tutti i lemmi presenti nel corpus)<br />

Numero Lemmi cercati: 5577<br />

Numero e <strong>per</strong>centuale Lemmi trovati nella risorsa generica: 4235 (76%), non trovati 1342<br />

Lista Lemmi non presenti in IWN<br />

A.D. A.S.ROMA A130MILA ABBASTANZA<br />

ACCELERAIZONE ACCELERE ACCISE ACCOGLIBILE<br />

ACCORD ACCUMULE ACQUISI ACQUISTER`<br />

ACTION ACTIONNARIAT ADB ADDEBITABILE<br />

ADDIRITTURA ADESSO ADOLOR ADOTTANDO<br />

AERIENNES AFETR AFTER AFTER-SERVICE<br />

AGEVOLATO AGOSTO-SETTEMBRE AGR AGRANDIT<br />

AIUTER` ALIMENTE ALLEMAND ALLEMANDES<br />

ALLIANCE ALLIE ALLIER ALLORA<br />

ALMENO ALTRIMENTI AMERICAINE AMM-MLP-R<br />

AMM-MLP-R-Y AMM-R AMM-Y-R ANCHE<br />

ANCHENELLA ANDRIESE ANNEE ANNONCENT<br />

ANNì ANS ANTI-GATES ANTI-INFLAZIONE<br />

ANTI-TRUST ANTICOMPETITIVE ANTICONCORRENZIALI ANTIMONOPOLISTICI<br />

ANTINFLATTIVO ANTIRICICLAGGIO ANZITEMPO APPELLENT<br />

APPENA APPLICATIONS APPOSITO APPOSITO<br />

APPREZZATORI APR APRES APRILE-INIZIO<br />

APRILEGIUGNO ART ASPIRAPOLVERI ASSAI<br />

ASSEMBLEARI ASSET ASSURANCES AT&AMP;T<br />

AT&AMP;T ATESA ATTEINT ATTENDENDERSI<br />

27

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!