26.08.2013 Views

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

10 Gramatika-zuzentzaileak <strong>eta</strong> OLHIA sistemak<br />

Microsoft c○-eko gramatika-zuzentzaileak Critique sisteman oinarrituta<br />

daude (Riley et al., 2004).<br />

• Paggio-k (2000), Eskandinavian testu-edizioari dagokionez sortzen diren<br />

beharrak asetzen saiatzen den SCARRIE proiektuaren barnean,<br />

daniera hizkuntzarako gramatika-zuzentzailea garatu zuen. Danierarako<br />

atalean, ohiko zuzenk<strong>eta</strong> ortografikoa <strong>eta</strong> gramatika-zuzenk<strong>eta</strong><br />

konbinatzen dira. Ortografia-mailako zuzenk<strong>eta</strong>, egunkariekin osatutako<br />

corpus batetik erauzitako 251.000 hitz-forma dituen hiztegi bat<br />

erabiliz egiten da. Honi hitz anitzeko terminoak dituen zerrenda bat<br />

gehitu zaio. Ordain zuzenak emateko, ordezkapenak egiten dituzte, <strong>eta</strong><br />

horr<strong>eta</strong>rako, trigramen <strong>eta</strong> trifonemen analisian oinarritzen den algoritmo<br />

bat erabiltzen dute. Testuinguruaren mendekoak diren <strong>errore</strong>ak<br />

<strong>detektatzeko</strong> (sintaxi-mailakoak), testua Tomita-ren algoritmoan (Tomita,<br />

1986) oinarritzen den analizatzaile sintaktiko batekin analizatzen<br />

dute. Honi <strong>errore</strong>ak <strong>detektatzeko</strong> modulu bat gehitu zaio. Modulu hon<strong>eta</strong>n,<br />

TGG hedatu bat erabiltzen da, erregel<strong>eta</strong>n <strong>errore</strong>-pisuak <strong>eta</strong><br />

<strong>errore</strong>-mezuak dituena. Errorea baterakuntza egitean ezaugarriak bat<br />

etortzen ez direlako gertatzen bada (adib. komunztadura-<strong>errore</strong><strong>eta</strong>n),<br />

ezaugarria ez da kontuan hartzen (erlaxazioa) <strong>eta</strong> hiztegian ordezko<br />

bat bilatzen da. Errorea egitura ez-osoa izateagatik gertatzen bada<br />

(adib. aditzaren forma nahastu da <strong>eta</strong> aditz-sintagmak ez du bururik),<br />

<strong>errore</strong>-mezu bat ematen da. Lehendabizi, egitura zuzenak definitzeko<br />

erregelak aplikatzen dira, <strong>eta</strong> gero, <strong>errore</strong>ak deskribatzen dituztenak.<br />

Landutako <strong>errore</strong>ak honakoak dira: hitz arrunt<strong>eta</strong>n <strong>eta</strong> konposatu<strong>eta</strong>n<br />

ematen direnak, izen-sintagmen barneko komunztadura <strong>eta</strong> aditz-kate<strong>eta</strong>n<br />

ematen direnak dira. Sistemaren ebaluazioan estaldura egokia<br />

lortu da (% 58,1) baina, doitasuna oso baxua (% 20,6). Honen arrazoia<br />

hitz asko sistemarentzako ezezagunak izatea da (izen bereziak). Hitz<br />

horiek kenduta % 34,9ko doitasuna lortuko litzatekeela diote egileek.<br />

• Foster <strong>eta</strong> Vogel-ek (2004b) chart-<strong>eta</strong>n oinarritutako behetik goranzko<br />

(bottom-up) analizatzaile bat erabiltzen dute sarrerako esaldia analizatzeko.<br />

Analizatzailea sintaxi-analisi bat lortzeko gai ez bada, adibidez<br />

esaldia gaizki osatuta dagoelako, <strong>errore</strong>-gramatika bat erabiltzen dute<br />

esaldiaren analisi bat lortzen saiatzeko. Sintaxi-analizatzailearen ondoren<br />

aplikatutako <strong>errore</strong>-gramatika, 1113 erregelekin osatutako testuingururik<br />

gabeko gramatika da. Errore-erregelak gramatika arruntetik<br />

eratorri dira baina testu <strong>errore</strong>dun<strong>eta</strong>ko informazioa kontuan hartuta.<br />

Gramatika hau, berreskuratze-algoritmo sendo batek aplikatzen du.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!