26.08.2013 Views

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

I.2 Lanaren kokapena 7<br />

berezitasun<strong>eta</strong>ra egokitu; edo modu independente <strong>eta</strong> orokorrean, <strong>eta</strong> ondoren,<br />

behar izanez gero, moldatu. Azken ikuspuntuarekin sortu da esku artean<br />

dugun tesi-lana. Ildo beretik zihoan Gojenolaren doktoretza-tesia (Gojenola,<br />

2000), zein<strong>eta</strong>n euskararako testuingururik gabeko gramatikan baterakuntzarako<br />

murriztapenak erlaxatzen ziren <strong>errore</strong>ak <strong>detektatzeko</strong>. Eta, bide<br />

bera jarraitzen du garapenean dagoen Arri<strong>eta</strong>ren doktoretza-tesiak (Alegria<br />

et al., 2006). Azkenekoan <strong>errore</strong>ak <strong>detektatzeko</strong> asmoarekin corpus<strong>eta</strong>n oinarritutako<br />

teknikak (ikask<strong>eta</strong> automatikoa, kasu hon<strong>eta</strong>n) erabiltzen dira.<br />

Hori<strong>eta</strong>z gain, aipatutako bi alorrei egokitzen zaien lana aspaldi ari da egiten<br />

taldean, <strong>eta</strong> horixe da, ondorengo bi azpiatal<strong>eta</strong>n laburbilduko duguna.<br />

I.2.1 IXA taldea <strong>eta</strong> ortografia- <strong>eta</strong> gramatika-zuzentzaileak<br />

Euskararako Xuxen egiaztatzaile/zuzentzaile ortografikoa garatu ondoren<br />

(Agirre et al., 1992), azken urteotan xuxeng gramatika-zuzentzailea euskaldun<br />

guztien eskura ipintzea du helburu IXA taldeak. Errore <strong>sintaktikoak</strong> era<br />

askotakoak dira <strong>eta</strong> ortografikoak baino konplexuagoak <strong>detektatzeko</strong>, beraz,<br />

analisi- <strong>eta</strong> inplementazio-lan sakona eskatzen dute. Hementxe egin dezake<br />

tesi-lan honek bere ekarpena. Sintaxi-<strong>errore</strong>ak <strong>detektatzeko</strong> <strong>eta</strong> <strong>zuzentzeko</strong><br />

definituko ditugun erregelak, xuxeng zuzentzailean integratu ahalko dira.<br />

Tesi-lana ortografia- <strong>eta</strong> gramatika-zuzentzaileen ingurunean zein tokitan<br />

kokatuko litzatekeen adieraztea du helburu I.1 irudiak. Irudiko elementuak<br />

labur-labur azalduko ditugu ondorengo lerro<strong>eta</strong>n.<br />

Xuxen 6 egiaztatzaile/zuzentzaile ortografikoa 1992 urtean sortu zen euskararako<br />

analizatzaile morfologikoaren garapena aurreratua zegoenean (Urkia,<br />

1997; Alegria, 1995). Oinarrian Kukich-en (1992) ideia hau zuen: deskribapen<br />

morfologikoa egina dagoenean, erraza da ortografia-zuzentzaile bat<br />

garatzea. Analizatzaileak estandar moduan analizatzen dituen hitzak zuzenak<br />

lirateke, <strong>eta</strong> ezagutzen ez dituenak okerrak (ikus informazio zabalagoa<br />

III. kapituluan). Orduz geroztik, zuzentzailea datu berriekin elikatua izan da<br />

<strong>eta</strong> testu-prozesadore desberdin<strong>eta</strong>rako, web-erako <strong>eta</strong> OCR-rako 7 bertsioak<br />

sortu dira. 2008 urtean, GNU/Linux munduko aplikazio<strong>eta</strong>n erabilgarria den<br />

Xuxenen bertsio bat jarri da eskuragarri (Alegria et al., 2008).<br />

Morfologia edo morfosintaxia lantzen jarraitzen badugu ere, hainbat tesi-lanek<br />

egiaztatzen duten moduan, azken urteotan IXA ikerk<strong>eta</strong>-taldean<br />

sintaxian lan handia egin da. Besteak beste honakoak egin dira: euskararen<br />

murriztapen-gramatikari buruzkoa (Aduriz, 2000), Murriztapen Gramatikaren<br />

bidez hiztegiko definizioen analisi sintaktikoa (Arriola, 2000), aditz-azpi-<br />

6 http://www.xuxen.com helbidean topa ditzakezue Xuxenen bertsio guztiak.<br />

7 Optical character recognition edo karaktere-ezagutze optikoa.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!