26.08.2013 Views

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

III.6 Laburpena <strong>eta</strong> ondorioak 75<br />

III.6 Laburpena <strong>eta</strong> ondorioak<br />

Erroreak detektatzea, haien diagnosia egitea <strong>eta</strong> ordain zuzen posibleak ematea,<br />

ezinbestekoa da ortografia- <strong>eta</strong> gramatika-zuzentzaile<strong>eta</strong>n, <strong>eta</strong> garrantzitsua,<br />

OLHIA sistem<strong>eta</strong>n. Hizkuntzaren tratamendu automatikoaren alorrean<br />

<strong>errore</strong>ak <strong>detektatzeko</strong> <strong>eta</strong> <strong>zuzentzeko</strong> erabiltzen diren tekniken <strong>eta</strong><br />

hauek erabiltzen dituzten sistemen errepasoa egin dugu kapitulu hon<strong>eta</strong>n.<br />

Aipatutako teknikak, bi multzo nagusitan banatu ditugu: alde batetik<br />

hizkuntza-ezagutzan oinarritutako teknikak edo teknika sinbolikoak daude,<br />

zeintzu<strong>eta</strong>n hizkuntzari buruzko ezagutza erregel<strong>eta</strong>n edo beste adierazpide<strong>eta</strong>n<br />

kodetzen den modu esplizituan (gogoratu III.2.1 atala). Beste alde<br />

batetik, corpus<strong>eta</strong>n oinarritutako teknikak edo teknika enpirikoak daude<br />

(III.2.2 atala). Teknika sinbolikoak egoera finituko makin<strong>eta</strong>n <strong>eta</strong> testuingururik<br />

gabeko gramatik<strong>eta</strong>n sailkatu ditugu. Teknika enpirikoek informazio<br />

iturri nagusiena corpus<strong>eta</strong>n duten prozedurak erabiltzen dituzte: estatistika<br />

<strong>eta</strong> ikask<strong>eta</strong> automatikoa.<br />

Ortografia- <strong>eta</strong> gramatika-zuzentzaile<strong>eta</strong>n sistemaren azkartasunean eragin<br />

handiegirik ez duen edozein teknika erabil daitekeen bitartean, aztertutako<br />

OLHIA sistema gehien<strong>eta</strong>n patroi-erregelak <strong>eta</strong> baterakuntza formalismoak<br />

erabili direla ikusi dugu. Horren zergatia, ikasleari eskaini behar zaion<br />

berrelikaduran dago. Teknika horiek diagnosirako informazio oso zehatza<br />

emateko aukera dute, gainontzeko teknikek (estatistikak <strong>eta</strong> ikask<strong>eta</strong> automatikoak),<br />

ordea, ez dute normalean horrelako informaziorik eskaintzen.<br />

Zenbait ondoriotara iristeko parada izan dugu azterk<strong>eta</strong> bibliografikoa<br />

egin ondoren:<br />

• Corpusen tamainari dagokionez, corpus gero <strong>eta</strong> handiagoak lortzea<br />

erraza denez, azken urteotako joera corpus<strong>eta</strong>n oinarritutako teknikak<br />

—estatistika <strong>eta</strong> ikask<strong>eta</strong> automatikoa— erabiltzea da. Gizakiok<br />

egindako erregelak ez omen dira inoiz gai izango hizkuntzak duen konplexutasuna<br />

jasotzeko. Corpus handiak etik<strong>eta</strong>tuz gero, ordea, testu<strong>eta</strong>tik<br />

jasoko dugu behar dugun ezagutza. Corpusen etik<strong>eta</strong>tzean izaten<br />

dute teknika enpirikoek zailtasun handiena. Lan hau egina duten hizkuntz<strong>eta</strong>n,<br />

ingelesean adibidez, teknika erabilerrazak <strong>eta</strong> egokiak dira.<br />

Euskara moduko<strong>eta</strong>n, berriz, informazio zuzena duen corpusa biltzea<br />

zaila bada, interesatzen zaigun atazari dagokion <strong>errore</strong>dun corpusa biltzea,<br />

are <strong>eta</strong> neketsuagoa da. Hori dela <strong>eta</strong>, tesi-lan hon<strong>eta</strong>n hizkuntza-<br />

-ezagutzan oinarritutako teknikak erabiliko ditugu. Bestelako teknikak<br />

etorkizunerako, testu-bilduma handiagoak ditugun garai<strong>eta</strong>rako, utziko<br />

ditugu.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!