ItalWordNet: Rete Semantico-Lessicale per l'Italiano - Cnr
ItalWordNet: Rete Semantico-Lessicale per l'Italiano - Cnr
ItalWordNet: Rete Semantico-Lessicale per l'Italiano - Cnr
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Linea 1.3 ItalWordnet<br />
elementi ‘spurii’. Questo al fine di avere una valutazione non solo della co<strong>per</strong>tura rispetto ad un<br />
testo ‘ideale’ (una stima si ottiene comunque dal quarto test, e misure più precise saranno<br />
comunque derivate nella linea 1.4) ma anche rispetto a testi reali, contenti un normale ‘rumore’<br />
dovuto ad errori o altro.<br />
1.5.1 Risultati dei test<br />
Vengono riportati nel seguito i risultati dei test automatici di co<strong>per</strong>tura, eseguiti <strong>per</strong> la risorsa<br />
generica e <strong>per</strong> quella finanziaria. La non disponibilità alla data dei test dell’integrazione delle due<br />
risorse ha ovviamente rappresentato una limitazione, ma i test, anche separati, <strong>per</strong>mettono<br />
comunque di valure l’ipotetica co<strong>per</strong>tura di una risorsa integrata. Nella valutazione dei risultati della<br />
risorsa economica sono stati infatti ‘esclusi’ i termini mancanti ma risultanti da una ricerca nella<br />
risorsa generica. In questo modo è stato possibile valutare almeno qualitativamente i risultati<br />
ottenibili sulla risorsa integrata.<br />
La co<strong>per</strong>tura sembra ragionevole (considerando i due lessici come integrati, ovvero valutando i<br />
risultati complessivi); la maggior parte dei lemmi non trovati sono rappresentati da errori<br />
tipografici, parole straniere, sigle ed altro, una parte è rappresentata da aggettivi e solo una parte<br />
ridotta rappresenta una effettiva mancata co<strong>per</strong>tura. Il successivo paragrafo riporta le casistiche<br />
determinate. E’ tuttavia da notare che considerando queste casistiche si rimane su valori (76%<br />
quando il test viene effettuato su tutti i lemmi presenti nel corpus e 90% quanto il test è eseguito sui<br />
lemmi rilevanti al fine della classificazione) di cui bisogna tener conto nel confronto su un corpus<br />
‘reale’ e non filtrato a priori.<br />
1.5.1.1 Test 1 – database generico - (su tutti i lemmi presenti nel corpus)<br />
Numero Lemmi cercati: 5577<br />
Numero e <strong>per</strong>centuale Lemmi trovati nella risorsa generica: 4235 (76%), non trovati 1342<br />
Lista Lemmi non presenti in IWN<br />
A.D. A.S.ROMA A130MILA ABBASTANZA<br />
ACCELERAIZONE ACCELERE ACCISE ACCOGLIBILE<br />
ACCORD ACCUMULE ACQUISI ACQUISTER`<br />
ACTION ACTIONNARIAT ADB ADDEBITABILE<br />
ADDIRITTURA ADESSO ADOLOR ADOTTANDO<br />
AERIENNES AFETR AFTER AFTER-SERVICE<br />
AGEVOLATO AGOSTO-SETTEMBRE AGR AGRANDIT<br />
AIUTER` ALIMENTE ALLEMAND ALLEMANDES<br />
ALLIANCE ALLIE ALLIER ALLORA<br />
ALMENO ALTRIMENTI AMERICAINE AMM-MLP-R<br />
AMM-MLP-R-Y AMM-R AMM-Y-R ANCHE<br />
ANCHENELLA ANDRIESE ANNEE ANNONCENT<br />
ANNì ANS ANTI-GATES ANTI-INFLAZIONE<br />
ANTI-TRUST ANTICOMPETITIVE ANTICONCORRENZIALI ANTIMONOPOLISTICI<br />
ANTINFLATTIVO ANTIRICICLAGGIO ANZITEMPO APPELLENT<br />
APPENA APPLICATIONS APPOSITO APPOSITO<br />
APPREZZATORI APR APRES APRILE-INIZIO<br />
APRILEGIUGNO ART ASPIRAPOLVERI ASSAI<br />
ASSEMBLEARI ASSET ASSURANCES AT&T<br />
AT&T ATESA ATTEINT ATTENDENDERSI<br />
27