22.04.2013 Views

Euskal morfologiaren tratamendu automatikorako tresnak

Euskal morfologiaren tratamendu automatikorako tresnak

Euskal morfologiaren tratamendu automatikorako tresnak

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

VII. kapŕtulua<br />

Eratorpena gai korapilatsua da, irregularra izanik ondo aztertu gahe dagoelako . Taldeko<br />

linguistak egiten ari diren lan teorikoaren emaitzaz, emankortasun handiko morfema<br />

sinpleetan oinarritutako eratorpena landuko da, orain arte landutako eratorpen lexikalizatua<br />

osatuz .<br />

VII .2 .2 Zuzenketa .<br />

Zuzenketan egindako lana aldaerak deitu ditugun gaitasun-en •o rcen aldetik oso interesgarria<br />

den bitartean, errore tipografikoen trataera hi aldetatik hohe liteke : hatcko edizio-distantzia<br />

baino handiago duten hitzen zuzenketari ekinez katetik, eta hestetik, testuingurua kontuan<br />

hartuz, proposamenen artean zuzenketa ondo aukeratzeko zein "kenetako hitzaren en . orcak"<br />

detektatzeko asmoz .<br />

Lehen ekimenean oso abiapuntu interesgarria da Ollazcn eta Guzey-rena (1994), emaitza<br />

onak lortzeko oraindik eragiketa asko burutu hehar hadira cre, honek eraginkortasunean<br />

duen ondorio kaltegarriarekin . Ekarpen hori hohe daitekeelakoan gaude, lexikorik gaheko<br />

analisiak honetan lagun dezakeelarik .<br />

Proposamenen artean zuzena zein den erabakitzea oso zaila gertatzen da testuingurua<br />

kontuan hartzen ez hada . Hori egiaztatzeko eskuz egitea baino ez. da egin hehar,<br />

testuingurua ikusi gahe pertsonek ere zalantza handiak dituztelako hiv.ak zuzentzeko .<br />

Testuingurua kontuan hartu gahe hohekuniza haizuk oraindik egin hadaitezkc ere -adib .<br />

hitzen maiztasunak kontuan hartzea, tcklatuanen arahera zein aztertutako erroreen arabera<br />

aldaketei pisuak esleitzea- mugatik nahikoa genio gaude eta testuingurua kontuan hartzea<br />

ezinbestekoa da emaitza horiek nabarmen hohetzeko, halez ene OCR eta hizketaren<br />

prozesaketarako erahili nahi hada zuzenketarako tresna hau . Gainera, testuingurua kontuan<br />

hantzen hada, heretako hitzaren erroreak detektatu eta hitz-mugaren gaineko erroreak<br />

zuzendu daitezke, higamen hela unaldiko zuzentzailea sortuz . Testuingurua kontuan hartzeko<br />

lau hide hercizten dira nagusiki : corpus-en gaineko estatistikak, sintaxia, semantika -hitzen<br />

anteko erlazioak lortuz-, eta soluzio partikularrak . Metodo hauek konhina dailczke haina<br />

lehen hiruetarako oinarrizko lanen garapena hehar da aurretik : analizatzaile sintaktiko osoa<br />

edo partziala, esanahien hilketa eta egituraketa datu-hasean eta haien anteko distantzia<br />

kalkulatzeko metodoa semantikarako, eta corpusak ustiatzeko <strong>tresnak</strong> . Oinarrizko tresna<br />

hauetan an gara lanean epe erdian zu7.enketan aplikatzeko asmoz. .<br />

VII .2 .3 EUSLEM .<br />

Garatzen ari garen euskararako oinarrizko lematizatzaile/etiketatzailea da EUSLEM .<br />

Hitzaren esparrua gainditzen duenez, lan honetatik kanpo utzi dugu haina aurreratu samarra<br />

dago, aurkeztutako analisi morfologikoan oinarriturik haitago . Bere diseinurako aztertutako<br />

178

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!