26.08.2013 Views

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

8 Gramatika-zuzentzaileak <strong>eta</strong> OLHIA sistemak<br />

numero <strong>eta</strong> genero komunztadura, aditz-kateko buruaren <strong>eta</strong> subjektuaren<br />

arteko komunztadura <strong>eta</strong> komak aipatzen dira. ReGra gramatika-zuzentzaileak<br />

% 45,6ko estaldura <strong>eta</strong> % 31,21ko doitasuna lortzen<br />

ditu.<br />

• Arabiera hizkuntza semitikoa da <strong>eta</strong> morfologia <strong>eta</strong> sintaxia aberatsak<br />

ditu. Arabiera Moderno Estandarra lantzeko sortu da Arabic<br />

GramCheck gramatika-zuzentzailea (Shaalan, 2005). SICStus Prolog<br />

erabiliz inplementatu da <strong>eta</strong> arabieran ematen diren gramatika-<strong>errore</strong><br />

arruntenak <strong>detektatzeko</strong> gai da, arazoa deskribatzen du <strong>eta</strong> zuzenk<strong>eta</strong>rako<br />

proposamenak ematen ditu. Gramatika-zuzentzaileak bi zati ditu:<br />

arabierarako analizatzaile morfologikoa <strong>eta</strong> gramatika-egiaztatzaile<br />

batekin hedatutako sintaxi-analizatzailea. Analizatzaile morfologikoa,<br />

analisia egiten duen moduluak, lexiko-mailako desanbiguazioa egiten<br />

duen moduluak <strong>eta</strong> ezaugarriak erauzten dituen moduluak osatzen dute.<br />

Sintaxi-analizatzailea, baterakuntzan oinarrituta dago <strong>eta</strong> bertan<br />

sintaxi-<strong>errore</strong>ak <strong>detektatzeko</strong> erlaxazioa erabiltzen da. Sintagma barruko<br />

komunztadurak landu dituzte batez ere Arabic GramChecken,<br />

hots, generoa, aditzaren kasua. ... Ebaluaziorako 100 esaldi motz <strong>eta</strong><br />

sinpleak (batez beste 4 hitz<strong>eta</strong>koak) erabili dira, 10 gramatikalak <strong>eta</strong><br />

90 ez-gramatikalak. Corpus honekin ez da harritzekoa emaitza onak<br />

lortzea: % 96,6ko doitasuna <strong>eta</strong> % 95,5eko estaldura lortzen dituzte.<br />

• Erlaxazioaren teknika erabiltzean, sintaxi-analizatzaileak analisi posible<br />

ugari eman ohi ditu, esaldi bat analizatzeko erregela erlaxatu gabeak<br />

<strong>eta</strong> erlaxatuak erabiltzen baitira. Ingelesa moduko hizkuntz<strong>eta</strong>n,<br />

osagaien ordena nahiko finkoa da <strong>eta</strong> osagai horien arteko komunztadura,<br />

eskasa. Euskara, errusiera <strong>eta</strong> latina moduko ordena askeko<br />

<strong>eta</strong> komunztadura aberatseko hizkuntz<strong>eta</strong>n sor daitekeen analisi kopurua<br />

gehiegizkoa izan daiteke. Hau dela <strong>eta</strong>, Gojenola <strong>eta</strong> Sarasola-k<br />

(1994) (Gojenola, 2000) ezaugarrien erlaxazio mailakatua proposatzen<br />

dute. Metodo hon<strong>eta</strong>n, maila bakoitzean murriztapen multzo bat erlaxatuko<br />

litzateke, erlaxazio-konbinazioak murriztuaz. Hasiera batean,<br />

analisia gramatika osoarekin egiten saiatzen dira. Analisirik lortzen ez<br />

bada, lehenengo murriztapenen multzoa erlaxatzen da. Hala ere, analisirik<br />

lortzen ez bada, bigarren murriztapenen multzoa erlaxatzen da<br />

e.a. Maila bakoitzean, <strong>errore</strong> mota ezberdinak landuko dira, konputazio-koste<br />

<strong>eta</strong> zailtasun gutxienetik hasita, handienera joaz. Euskarako<br />

teknika hau aplikatu denean, gramatika idazteko, inolako teoria<br />

sintaktikorekin loturarik ez duen <strong>eta</strong> PATR-II-rekin bateragarria den

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!