26.08.2013 Views

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

III.3 Erroreak <strong>zuzentzeko</strong> teknikak 69<br />

• Skeleton key izeneko teknikan, ideia nagusia honakoa da: karaktere-<br />

-kate bat hiztegikoa den hitz batean bihur badaiteke oinarrizko edizio-<br />

-eragik<strong>eta</strong>k erabilita (txertak<strong>eta</strong>, ezabak<strong>eta</strong>, aldak<strong>eta</strong>, transposizioa),<br />

orduan, hitz hori karaktere-kate horrentzako zuzenk<strong>eta</strong> posible bat da.<br />

• Bigarren metodoan, gaizki osatuta dagoen hitzari dagozkion baliokide<br />

fonetikoak lortzen dira. Transdukzio-prozesu baten bidez, karaktere-<br />

-kate bat oinarri hartuta, horri lotutako transkripzio fonetiko guztiak<br />

ematen dira. Adibidez, chevale hitz okerrerako “ch.é.v.a.l.”, “k.é.v.a.l.”<br />

...transkripzioak lortuko lirateke <strong>eta</strong> hori<strong>eta</strong>tik, idatzizko formak (kevale,<br />

cheval, keval, chéval, chèval). Azkenean, grafikoki zuzenak diren<br />

karaktere-kateak lortzen dira. Kasu hon<strong>eta</strong>n, cheval, zaldi, hitz zuzena<br />

lortzen dute egileek.<br />

• Azkenik, analisi <strong>eta</strong> sorkuntza morfologikoa erabiltzen dute, zehazkiago<br />

egoera finituko transduktore bat, leman edo morfeman gertatzen<br />

diren <strong>errore</strong>en ordezko zuzenak emateko.<br />

Agirre et al. egileek (Agirre et al., 1998a, b), zuzenk<strong>eta</strong>rako proposamenen<br />

zerrendako lehen posizioan aukerarik egokiena eskaintzeko lan bat<br />

egin zuten. Lana Ispell erabilita, ingeleserako <strong>eta</strong> hitz zuzen<strong>eta</strong>n gertatzen<br />

diren <strong>errore</strong><strong>eta</strong>rako egin zen. Helburua lortzeko, ezagutza sintagmatikoa,<br />

paradigmatikoa <strong>eta</strong> estatistikoa konbinatu zituzten. Ezagutza sintagmatikoa<br />

Murriztapen Gramatikaren baliatuz adierazten da, ordain zuzenen artean<br />

gramatika-kategoria okerrekoak kendu egiten baitira. Horrela, kategoria<br />

berdinekoen artean ezin da desberdintasunik egin. Izena kategoria duten<br />

ordainen artean testuinguruarekiko semantikoki hurbilen dagoen hitza aukeratzeko<br />

erabiltzen den osagai paradigmatikoa, dentsitate kontzeptuala da<br />

(Agirre <strong>eta</strong> Rigau, 1996). Honek WordNet-eko izenen arteko afinitate-distantzia<br />

erabiltzen du. Azkenik, hitzen agerpenen-maiztasuna <strong>eta</strong> testuinguruaren<br />

informazioa erabiltzen da (ezagutza estatistikoa). Zenbait heuristiko<br />

ere erabili dira proposamenak ezabatzeko. Ez da <strong>errore</strong>ei buruzko inolako<br />

informaziorik erabili nahi izan. Teknika hauen guztien konbinazioak egin dira<br />

modu ezberdin<strong>eta</strong>n, teknikei pisu ezberdinak emanez. Dokumentu bereko<br />

neurri estatistikoak <strong>eta</strong> MG oso erabilgarriak izan dira. Dentsitate kontzeptualak,<br />

ordea, ez du ekarpen handirik egin garai horr<strong>eta</strong>ko tresnen garapen<br />

urria dela <strong>eta</strong>. % 90 inguruko doitasuna lortu da <strong>eta</strong> proposamen bakarra<br />

kasuen % 100ean.<br />

Cucerzan <strong>eta</strong> Brillen arabera (2004), Interneten bilak<strong>eta</strong> bat egiten dugunean,<br />

erabiltzailearen logean hizkuntzari buruzko informazio inplizitu <strong>eta</strong><br />

esplizitu kopuru handia geratzen da. Egileek, hizkuntza-informazio hau <strong>eta</strong>

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!