26.08.2013 Views

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

II.3 Corpus <strong>errore</strong>dunak 31<br />

sentences which are not necessarily produced in a language-<br />

-learning context and which contain competence and performance<br />

errors produced by native and non-native speakers of<br />

the language (Becker et al., 1999; Foster <strong>eta</strong> Vogel, 2004a;<br />

Foster, 2005)≫<br />

Gure lanerako, corpus <strong>errore</strong>duna hizkuntza-ikasleena izatera mugatu<br />

gabe, corpus orokorrago bat erabili nahi izan dugu, zein<strong>eta</strong>n hiztun<br />

osoen <strong>eta</strong> hiztun ez-osoen <strong>errore</strong>ak bilduko diren. Erroreekin egindako<br />

lanaren azken erabilera esparrua bikoitza denez, gramatika-zuzentzaileak<br />

<strong>eta</strong> hizkuntzen irakaskuntzarako sistemak, corpus orokorra erabiltzea<br />

iruditu zaigu egokiena.<br />

• Corpus errealak vs sortutako corpusak. Erroreak dituzten corpus errealak<br />

biltzea lan neketsua da, ez baita soilik <strong>errore</strong>rik ote dagoen ala<br />

ez aztertu behar, honez gain, zein <strong>errore</strong> gertatu den etik<strong>eta</strong>tu behar<br />

izaten da. Azken boladan, lan hori aurreztearren, esaldi gramatikalekin<br />

osatutako testu<strong>eta</strong>tik abiatuz corpus <strong>errore</strong>dunak sortu dituzte,<br />

adibidez, hitzak gehituz, ezabatuz edo aldatuz (Wagner et al., 2007;<br />

Bigert, 2004). Ingeles ez-gramatikalaz osatutako treebank bat ere sortu<br />

dute (Foster, 2007), helburu bikoitzarekin: batetik, analizatzaile<br />

sintaktikoen sendotasuna neurtzeko balio lezake, <strong>errore</strong>ak egon arren<br />

analizatzaileek analisia egiteko gai izan behar baitute; beste aldetik,<br />

esaldi <strong>errore</strong>dunak analizatzeko gai den gramatika bat ikasteko balioko<br />

luke. Automatikoki sortutako corpus <strong>errore</strong>dunak era naturalean<br />

sortutakoen antzekoak izateko ahaleginak egin diren arren, gure ustez,<br />

“errealistak” ez izatearen arazoa izan dezakete. Gainera, <strong>errore</strong>ak<br />

sortzeko prozesuan, esaldi zuzenak sor daitezke <strong>eta</strong> automatikoki oker<br />

moduan etik<strong>eta</strong>tu. Hori horrela izanik, corpus errealak biltzea erabaki<br />

dugu.<br />

• Probarako zerrendak vs corpusak. Lortzeko lan handiagoa ematen duten<br />

arren, probarako kasu-zerrendak ebaluatu beharreko egitur<strong>eta</strong>ra<br />

hobeto egokitzen omen dira, <strong>eta</strong> beraz, gure ustez, emaitza zehatzagoak<br />

ematen dituzte. Corpusek, ordea, tamaina egokikoak izanik, <strong>errore</strong>en<br />

maiztasun erreala zehazten dute. Bi testu mota hauen abantailak<br />

biltzeko asmoz, lan hon<strong>eta</strong>n corpusak bildu egin ditugu, horrek ematen<br />

duen lanarekin, <strong>eta</strong> berau<strong>eta</strong>tik abiatuta probarako zerrendak sortu ditugu.<br />

Horrela, berariazko fenomenoak zehatzago landu ditugu, testu<br />

osoan fenomeno horiek duten agerpen-maiztasuna galdu gabe.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!