22.04.2013 Views

Euskal morfologiaren tratamendu automatikorako tresnak

Euskal morfologiaren tratamendu automatikorako tresnak

Euskal morfologiaren tratamendu automatikorako tresnak

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

IV. &apitulua<br />

izateko aukerak, eta analisi estandarrean zein aldaeren analisian ezer lortzen ez denean<br />

bakarrik burutuko da lexikorik gaheko analisia .<br />

Analisiaren emaitzak anbiguoak izan daitezke eta irekitako ikerlerrotzat dugu hitz bati<br />

dagozkion analisi guztien arteko desanbiguazioa, lan hau EUSLEM proiektuaren barruan<br />

garatzen ari garela (Aldcazabal et al ., 94) (Aduriz et pil ., 95) .<br />

Testu bat hiru analisi-aukeretatik -estandarra, aldaerena eta lexikorik gahekoa- pasa<br />

eta gero lortzen den cmaitz_a C eranskinean ikus daiteke . Hala ere IV .10 irudian zati txiki bat<br />

azaltzen da . Ematen den emaitza tratatua izan da, token-ezagutzailea lortutako informazioa<br />

erantsiz eta analisi-aukera bakoitza lerro hakar hatean azalduz . Analisi hakoitzean lema eta<br />

aldaera ager daiteke, haina, analisi estandarretan lema hakarrik agertzen da, eta lexikorik<br />

gaheko analisietan lema hipotetikoa aldacia hezala agertzen da .<br />

t Aldaeren analisian ehi lexikorik gaheko an :ilisi :m emaitza 'z.chaizat jotzen da analisi zilegia egeltzeli baldin<br />

bada . heste analisi hipotetiko desegokiak egon arren . Desanbiguazio-pruzesuarai lana i-/zingo (Ia analisi<br />

egokia auker7ltzea .<br />

126<br />

Kontzeptua<br />

A<br />

(Argia)<br />

IV .11 irudia .- Analizatzaile morfologikoari buruzko estatistikak<br />

Estaldura-tasari dagokionean 9 1(1(1 da ia lexikoik gaheko analisiari esker, haina gerta<br />

daiteke hitz haizuen analisia desegokia izatea ; heraz, zehaztasun-tasari begiratu beharko zaio<br />

orain, hau da, analisi egokirik dutenen proportzioari . Corpus txikiekin egindako prohetan<br />

zuzentasunaz %99tik gora (lela egiaztatu da (ikus IV .11 irudia) .<br />

B<br />

(Filosofia) A+B<br />

Hitzak (corpusa) 4 .864 2 .343 7 .207<br />

Hitz desberdinak (-_emenda) 2 .607 1 .429 4 .036<br />

Zerrendako hitzen artean ezezaeunak 307 85 392<br />

analizatzaile estandarrerako % 12 %6 % 10<br />

Aldaerak 101 28 129<br />

Analizaturako aldaerak 85 ( 1/o84) 22 (%%79) 107 (%83)<br />

Erroreak 21 4 25<br />

Zehaztasuna %99,2 %99,7 %99,4

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!