Euskal morfologiaren tratamendu automatikorako tresnak
Euskal morfologiaren tratamendu automatikorako tresnak
Euskal morfologiaren tratamendu automatikorako tresnak
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
IV. &apitulua<br />
izateko aukerak, eta analisi estandarrean zein aldaeren analisian ezer lortzen ez denean<br />
bakarrik burutuko da lexikorik gaheko analisia .<br />
Analisiaren emaitzak anbiguoak izan daitezke eta irekitako ikerlerrotzat dugu hitz bati<br />
dagozkion analisi guztien arteko desanbiguazioa, lan hau EUSLEM proiektuaren barruan<br />
garatzen ari garela (Aldcazabal et al ., 94) (Aduriz et pil ., 95) .<br />
Testu bat hiru analisi-aukeretatik -estandarra, aldaerena eta lexikorik gahekoa- pasa<br />
eta gero lortzen den cmaitz_a C eranskinean ikus daiteke . Hala ere IV .10 irudian zati txiki bat<br />
azaltzen da . Ematen den emaitza tratatua izan da, token-ezagutzailea lortutako informazioa<br />
erantsiz eta analisi-aukera bakoitza lerro hakar hatean azalduz . Analisi hakoitzean lema eta<br />
aldaera ager daiteke, haina, analisi estandarretan lema hakarrik agertzen da, eta lexikorik<br />
gaheko analisietan lema hipotetikoa aldacia hezala agertzen da .<br />
t Aldaeren analisian ehi lexikorik gaheko an :ilisi :m emaitza 'z.chaizat jotzen da analisi zilegia egeltzeli baldin<br />
bada . heste analisi hipotetiko desegokiak egon arren . Desanbiguazio-pruzesuarai lana i-/zingo (Ia analisi<br />
egokia auker7ltzea .<br />
126<br />
Kontzeptua<br />
A<br />
(Argia)<br />
IV .11 irudia .- Analizatzaile morfologikoari buruzko estatistikak<br />
Estaldura-tasari dagokionean 9 1(1(1 da ia lexikoik gaheko analisiari esker, haina gerta<br />
daiteke hitz haizuen analisia desegokia izatea ; heraz, zehaztasun-tasari begiratu beharko zaio<br />
orain, hau da, analisi egokirik dutenen proportzioari . Corpus txikiekin egindako prohetan<br />
zuzentasunaz %99tik gora (lela egiaztatu da (ikus IV .11 irudia) .<br />
B<br />
(Filosofia) A+B<br />
Hitzak (corpusa) 4 .864 2 .343 7 .207<br />
Hitz desberdinak (-_emenda) 2 .607 1 .429 4 .036<br />
Zerrendako hitzen artean ezezaeunak 307 85 392<br />
analizatzaile estandarrerako % 12 %6 % 10<br />
Aldaerak 101 28 129<br />
Analizaturako aldaerak 85 ( 1/o84) 22 (%%79) 107 (%83)<br />
Erroreak 21 4 25<br />
Zehaztasuna %99,2 %99,7 %99,4