26.08.2013 Views

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

II.3 Corpus <strong>errore</strong>dunak 33<br />

ipini aurretik, normalean, gramatika aldetik zuzendu egiten dituzte. Modu<br />

erraz samarrean lor daitezkeen corpusak, Interneten atzigarri egon daitezkeen<br />

euskarazko egunkariak, aldizkariak, liburuak <strong>eta</strong>b., ia beti gramatikalki<br />

zuzenak dira. Zenbaitzuk, hori horrela izanik, <strong>errore</strong>en tratamenduaren alorrean<br />

Internet hizkuntza gramatikalaren adibide moduan erabiltzen duten<br />

arren (Sjöbergh, 2006; Moré et al., 2004), hori egiteak sor ditzakeen arazoak<br />

ikusten dituzte:<br />

“There are many web sites with intentional examples of incorrect<br />

language use, and recognizing these can be hard”<br />

(Sjöbergh, 2006)<br />

Interneten topa daitezkeen testu <strong>errore</strong>dunak zuzen<strong>eta</strong>tik bereiztea lan<br />

astuna izan daitekeenez, <strong>errore</strong>ak izateko probabilitate handia duten testuak<br />

biltzea erabaki dugu. Honako iturri<strong>eta</strong>ko testu <strong>errore</strong>dunak erabili ditugu<br />

<strong>errore</strong>en detekziorako <strong>eta</strong> zuzenk<strong>eta</strong>rako:<br />

• Euskaltegi<strong>eta</strong>koak. Euskaltegi hau<strong>eta</strong>ko testuak jaso dira, besteak beste:<br />

Nafarroako AEK-koak, Trintxerpeko AEK euskaltegikoak, irakasleen<br />

trebakuntzarako Irale programakoak <strong>eta</strong> Donostiako Ilazki euskaltegikoak.<br />

Jasotako testu-bilduma testuen zenbait ezaugarriren arabera<br />

sailkatu da. Adibidez, i) irakasleak proposatutako arik<strong>eta</strong> motaren arabera<br />

(laburpena, proposatutako gai bati buruzko idazlana, gutuna...)<br />

edo ii) egilearen arabera. 1990 urtean hasi ginen testu hauek jasotzen<br />

<strong>eta</strong> gaur egun, oraindik, horr<strong>eta</strong>n dihardugu. Guztira 125.000 hitz inguruko<br />

corpusa osatu <strong>eta</strong> erabili dugu.<br />

Euskaltegi<strong>eta</strong>n lantzen diren testu<strong>eta</strong>n zailtasun-maila <strong>eta</strong> <strong>errore</strong>-tasa<br />

oso desberdinak direnez (ikasleen jakintza-mailaren araberakoak),<br />

testuok hiru mailatan banatu ditugu: behe-mailan garai bateko 1-5<br />

urrats<strong>eta</strong>ko testuak bildu ditugu, maila ertainean 6-8 urrats<strong>eta</strong>koak,<br />

<strong>eta</strong> goi-mailan 9-12 urrats<strong>eta</strong>koak (Maritxalar, 1999). Mailak gutxi<br />

gorabehera bat etorriko lirateke HABEko “Helduen Euskalduntzearen<br />

Oinarrizko Kurrikuluko (HEOK)” lehen hiru mailekin (4 daude).<br />

• EuskaraZ zerrenda. EuskaraZ zerrenda 5 1996an sortu zen <strong>eta</strong> euskararekin<br />

loturiko informazioa trukatzea zuen helburu. Zerrenda horr<strong>eta</strong>tik<br />

2000 <strong>eta</strong> 2001 urte<strong>eta</strong>n idatzitako posta elektronikoko 3.049 mezu<br />

(542.866 hitz) jaso genituen. Corpus hau erraz atzigarria da, modu<br />

5 http://www.sarean.com/artxiboak/000401.html

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!