26.08.2013 Views

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

270 Saroi <strong>eta</strong> komunztadura-<strong>errore</strong>ak<br />

Analizatzaile sintaktiko honi kontrajarriaz, oraindik analisi-katean integratu<br />

ez den MaltIxa analizatzaile sintaktiko estatistikoa erabili dugu. Honako<br />

ezaugarriak ditu:<br />

• Esaldiko hitz guztiei esleitzen die dependentzia-etik<strong>eta</strong>ren bat: analisi-<br />

-zuhaitz oso bakarra eman ohi du.<br />

• Tresnak sarreratzat morfosintaktikoki guztiz desanbiguatutako sarrera<br />

behar du. Ez du funtzio sintaktikorik erabiltzen.<br />

• Corpus<strong>eta</strong>n oinarritutako teknika erabiltzen du, teknika enpirikoa.<br />

Analisi-katean anbiguotasun morfosintaktikoa guztiz ebatzi gabe dagoenez<br />

<strong>eta</strong> gainera artean MaltIxa sortu gabe zegoenez, EDGK erabiltzea erabaki<br />

genuen hasiera batean.<br />

Corpusa<br />

Corpus <strong>errore</strong>duna orokorra dela esan genuen, hots, ez da euskara ikasleen<br />

testu<strong>eta</strong>ra mugatzen. Euskaltegi<strong>eta</strong>ko maila ertain<strong>eta</strong>ko <strong>eta</strong> goi-mail<strong>eta</strong>ko<br />

ikasleen testuez gain, karrera amaierako proiektuak <strong>eta</strong> euskara teknikoko<br />

unibertsitate-ikasleen testuek osatzen dute. Corpusaren osaera VII.14 taulan<br />

ikus dezakegu (guztira 7992 hitz).<br />

Corpus <strong>errore</strong>duna<br />

Garapenerako Probarako<br />

corpusa (% 60a) corpusa (% 40a)<br />

Hitz kopurua 4995 2997<br />

VII.14 Taula: Corpus <strong>errore</strong>dunaren banak<strong>eta</strong> ebaluaziorako.<br />

Ondorengo atalean erakutsiko ditugun emaitzak probarako corpusarekin<br />

lortutakoak dira. Probarako erabili dugun testu-bilduma 267 esaldik osatzen<br />

dute, <strong>eta</strong> hori<strong>eta</strong>n 4995 hitz biltzen dira. Hau da, batez beste 18,7 hitzeko<br />

esaldi errealekin egin dugu lan. Orokorrean esaldiak luzeak dira (luzeenak<br />

65 hitz ditu) <strong>eta</strong> inola ere ez laborategikoak. Egitura konplexuak <strong>eta</strong> batzu<strong>eta</strong>n<br />

oso traketsak erabiltzen dituzte. Corpus hon<strong>eta</strong>n hizkuntzalari batek 45<br />

komunztadura-<strong>errore</strong> etik<strong>eta</strong>tu ditu, <strong>errore</strong>a hasiera <strong>eta</strong> amaiera adierazten<br />

dituzten etiketekin mugatuaz (orokorrean hizkuntzalariak <strong>errore</strong>aren eremutzat<br />

perpausa etik<strong>eta</strong>tu du).

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!