22.04.2013 Views

Euskal morfologiaren tratamendu automatikorako tresnak

Euskal morfologiaren tratamendu automatikorako tresnak

Euskal morfologiaren tratamendu automatikorako tresnak

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Analizatzaile sendoa o.ratzen<br />

• Eraginkortasunaren aldetik antzekotasun handia susmatzen da hi sistemen artean,<br />

katek paraleloan egiten duena hestea sekuentzian haratuko duelako .<br />

IV .1 .3 . Eguneratzeko prozedura .<br />

Aipatu den hezala, lexikoa eguneratzea da lexiko berezituen erabilerak dakarren<br />

eragozpen bakarra . Eguneratze hrni ezin da automatikoa izan, eta crahiltzaileari eskatu behar<br />

zaizkio informazio desberdinak morl'olaktika eta ezaugarri morfologikoei buruz .<br />

Gure inplementazioan eskatzen diren informazioak honako hauek dira :<br />

• kategoria : azpilexikoa identifikatzeko, heraz sei hauen artean aukeratu<br />

beharko du crahiltz_ailcak : izena, adjektiboa, aditz-erroa, adberbioa, sigla eta<br />

hesterik .<br />

• azpikategoria, izenaren kasuan : bereizi behar dira izen arruntak, leku-<br />

izenak eta pertsona-izenak, heren deklinabidea desherdina da eta .<br />

• r mota : gogorra ala higuna r-z bukatutako lemetan, kasuaren arabera<br />

zenbait erregelaren aplikazioa aldatzen haiza .<br />

Informazio hau eskatuz lexikoa eguncralzen duen prozedurak osagai okerrak edo<br />

zaharkituak czahatzcko aukera ere badu . Seigarren kapituluan azalduko denez, prozedura<br />

honetarako elkarrizketa erahiltcrraz_a eta atsegina diseinatu da zuzentzaile ortografikoari<br />

hegira.<br />

Infonnazio horiez gain heste inl'ormazio batzuk suposatu dira erahiltzailcari galdetu gahe .<br />

Batetik, aditz-erro herri guztien morfotaktika tu hukacra duen infinitihoaren paradigmaren<br />

ildotik suposatu da, gainontzekoak aditz zaharrei dagozkielakoan, eta hauek guztiak, jaso<br />

ditugulakoan irxiak izanik . Beste aldetik, kontsonantez bukatutako siglen deklinabidean<br />

gerta daitczkecn epentesiak aldakorrak dira haien ahoskeraren arabera, haina crahiltz_ailcari<br />

galdetu beharrean -askotan cz dago hain argi zein den dagokion ahoskera- hautapen-<br />

marka hertzi bai definitu da halako kasuetarako, /diakritikoa hain zuzen (ikus §111 .3 .2),<br />

heraren bidez hi ahoskerei dagokien deklinabidea onartzen delarik . Automatikoki ezartzen<br />

da marka hori siglaren azken letraren arabera .<br />

Modulu honen crahilpena testu-zuzenketan izango hacia ere, corpusen analisian etc aplika<br />

daiteke, analisia egin ahala eguneratze semiautomatikoa kidera baitaiteke, ezagutzen ez diren<br />

hitzen analisia lortzeko eta etorkizunerako analizatzaile sendoagoa lortzeko asmoz .<br />

Jakintza-arlo desberdinetarako lexiko herezitucn ekoizpena ere sartzen da gure<br />

proiektuen barruan .<br />

107

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!