Euskal morfologiaren tratamendu automatikorako tresnak
Euskal morfologiaren tratamendu automatikorako tresnak
Euskal morfologiaren tratamendu automatikorako tresnak
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
VII. kapŕtulua<br />
Eratorpena gai korapilatsua da, irregularra izanik ondo aztertu gahe dagoelako . Taldeko<br />
linguistak egiten ari diren lan teorikoaren emaitzaz, emankortasun handiko morfema<br />
sinpleetan oinarritutako eratorpena landuko da, orain arte landutako eratorpen lexikalizatua<br />
osatuz .<br />
VII .2 .2 Zuzenketa .<br />
Zuzenketan egindako lana aldaerak deitu ditugun gaitasun-en •o rcen aldetik oso interesgarria<br />
den bitartean, errore tipografikoen trataera hi aldetatik hohe liteke : hatcko edizio-distantzia<br />
baino handiago duten hitzen zuzenketari ekinez katetik, eta hestetik, testuingurua kontuan<br />
hartuz, proposamenen artean zuzenketa ondo aukeratzeko zein "kenetako hitzaren en . orcak"<br />
detektatzeko asmoz .<br />
Lehen ekimenean oso abiapuntu interesgarria da Ollazcn eta Guzey-rena (1994), emaitza<br />
onak lortzeko oraindik eragiketa asko burutu hehar hadira cre, honek eraginkortasunean<br />
duen ondorio kaltegarriarekin . Ekarpen hori hohe daitekeelakoan gaude, lexikorik gaheko<br />
analisiak honetan lagun dezakeelarik .<br />
Proposamenen artean zuzena zein den erabakitzea oso zaila gertatzen da testuingurua<br />
kontuan hartzen ez hada . Hori egiaztatzeko eskuz egitea baino ez. da egin hehar,<br />
testuingurua ikusi gahe pertsonek ere zalantza handiak dituztelako hiv.ak zuzentzeko .<br />
Testuingurua kontuan hartu gahe hohekuniza haizuk oraindik egin hadaitezkc ere -adib .<br />
hitzen maiztasunak kontuan hartzea, tcklatuanen arahera zein aztertutako erroreen arabera<br />
aldaketei pisuak esleitzea- mugatik nahikoa genio gaude eta testuingurua kontuan hartzea<br />
ezinbestekoa da emaitza horiek nabarmen hohetzeko, halez ene OCR eta hizketaren<br />
prozesaketarako erahili nahi hada zuzenketarako tresna hau . Gainera, testuingurua kontuan<br />
hantzen hada, heretako hitzaren erroreak detektatu eta hitz-mugaren gaineko erroreak<br />
zuzendu daitezke, higamen hela unaldiko zuzentzailea sortuz . Testuingurua kontuan hartzeko<br />
lau hide hercizten dira nagusiki : corpus-en gaineko estatistikak, sintaxia, semantika -hitzen<br />
anteko erlazioak lortuz-, eta soluzio partikularrak . Metodo hauek konhina dailczke haina<br />
lehen hiruetarako oinarrizko lanen garapena hehar da aurretik : analizatzaile sintaktiko osoa<br />
edo partziala, esanahien hilketa eta egituraketa datu-hasean eta haien anteko distantzia<br />
kalkulatzeko metodoa semantikarako, eta corpusak ustiatzeko <strong>tresnak</strong> . Oinarrizko tresna<br />
hauetan an gara lanean epe erdian zu7.enketan aplikatzeko asmoz. .<br />
VII .2 .3 EUSLEM .<br />
Garatzen ari garen euskararako oinarrizko lematizatzaile/etiketatzailea da EUSLEM .<br />
Hitzaren esparrua gainditzen duenez, lan honetatik kanpo utzi dugu haina aurreratu samarra<br />
dago, aurkeztutako analisi morfologikoan oinarriturik haitago . Bere diseinurako aztertutako<br />
178