26.08.2013 Views

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

18 Gramatika-zuzentzaileak <strong>eta</strong> OLHIA sistemak<br />

probatu zuten. Testu <strong>eta</strong> ezaugarri multzo berak erabiliz bi teknika<br />

hauek konparatu direnean, (Golding <strong>eta</strong> Roth, 1996), Winnow erabiltzen<br />

duen sistemak errendimendu hobea erakutsi du. Azken sistema<br />

honek ezaugarri kopuru oso handia <strong>eta</strong> dagozkion pisuak ikasteko gaitasun<br />

handia du <strong>eta</strong> gaitasun honek performantzia asko hobetzen omen<br />

du (Mangu <strong>eta</strong> Brill, 1997; Golding <strong>eta</strong> Roth, 1999).<br />

• Ezaugarri <strong>eta</strong> pisu multzo ilunak lortu beharrean, ulergarriak diren<br />

erregela sinple gutxitan harrapatzen dute testu<strong>eta</strong>ko ezagutza linguistikoa<br />

Mangu <strong>eta</strong> Brill-ek (1997). Nahask<strong>eta</strong> multzoen desanbiguazioa<br />

dute helburu hauek ere, baina aldi berean, era errazean uler daitekeen<br />

ezagutza jaso nahi dute. Hon<strong>eta</strong>rako, transformazioan oinarritutako<br />

ikask<strong>eta</strong> erabiltzen dute erregelak ikasteko. Adibidez, piece, peace<br />

nahask<strong>eta</strong> multzoarentzako honako moduko erregelak ikastea lortu<br />

dute “Change peace to piece if the previous word is every”. Zenbait<br />

esperimentu egin dituzte <strong>eta</strong> honako ondorio<strong>eta</strong>ra iritsi dira: Mangu<br />

<strong>eta</strong> Brill-en (1997) lanean, baldintza ber<strong>eta</strong>n, Winnow erabiltzen duen<br />

sistemarekin konparatuz gero, emaitza okerragoak lortu dira. Ikask<strong>eta</strong>rako<br />

leiho txikiagoa erabiltzen badute <strong>eta</strong> analizatzaile morfologiko<br />

bat gehitu, Winnowekin lortutako emaitzak lortzera iristen dira. Hori<br />

bai, ikasitako informazioa tamainan askoz txikiagoa da <strong>eta</strong> ulertzeko<br />

askoz ere errazagoa.<br />

• Kumar <strong>eta</strong> Nair-en (2007) lanean corpus<strong>eta</strong>n oinarritzen den teknika<br />

bat aurkezten dute hurbilpen berritzaile batekin: inmunologia-sistema<br />

artifizialeko (Artificial Immune System (AIS) ingelesez) oinarriak erabiltzen<br />

dituzte gramatika-<strong>errore</strong>ak <strong>detektatzeko</strong>. Erroreak testu<strong>eta</strong>ko<br />

patogenoak bailiran tratatzen dituzte, <strong>eta</strong> antigorputz detektatzaileak<br />

eraikitzen dituzte hauek <strong>detektatzeko</strong>.<br />

Gizakion inmunologia-sistema linfozito izeneko zelula inmunologiko<br />

batzu<strong>eta</strong>n oinarritzen da. Zelula hauek batez ere B <strong>eta</strong> T motatakoak<br />

dira <strong>eta</strong> patogenoen patroi antigenoak ezagutzeko gai diren molekula<br />

hartzaileak dituzte.<br />

Egileek AISeko algoritmoak hizkuntzaren tratamendu automatikora<br />

egokitu dituzte. Haientzako, corpusa esaldi zuzenen multzo batek osatzen<br />

du <strong>eta</strong> zelula multzo bezala ikus dezakegu. Corpusa analizatu<br />

egiten da <strong>eta</strong> bertako hitzen kategoria-gramatikalen bigramekin, trigramekin<br />

<strong>eta</strong> tetragramekin egiten da lan. Detektatzaileak corpusean<br />

aurkitzen ez ditugun egiturak dira (n-gramak) <strong>eta</strong> <strong>errore</strong> moduan kontsidera<br />

daitezke (corpusean agertzen ez diren egitura zuzenak ere, erro-

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!