26.08.2013 Views

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

52 Erroreak <strong>detektatzeko</strong> <strong>eta</strong> <strong>zuzentzeko</strong> teknikak<br />

zerrenda batean gorde daitezke, <strong>eta</strong> zerrenda horrekin hizki-zuhaitz moduko<br />

egoera finituko automata bat eraiki. Horrela, hitz zuzenak ezagutuko<br />

lirateke <strong>eta</strong> hitz <strong>errore</strong>dunak baztertu. Suomiera, hungariera, turkiera <strong>eta</strong><br />

euskara moduko flexio-maila handiko hizkuntz<strong>eta</strong>n forma flexionatu kopuru<br />

izugarria sortzen da, <strong>eta</strong> arazoak egoten dira forma guztiak hiztegian gorde<br />

ahal izateko. Arazoa konpontzeko premiazkoa da hitzak morfologikoki behar<br />

bezala lantzen dituzten teknikak erabiltzea.<br />

Ondorengo lerro<strong>eta</strong>n, egiaztatzaile-zuzentzaile ortografiko<strong>eta</strong>n erabiltzen<br />

diren tekniken errepasoa egingo dugu.<br />

• Egiaztatzaile-zuzentzaile ortografiko batzu<strong>eta</strong>n, egiaztatzaileak hiztegi<br />

bat gordetzen du sisteman erabilgarria den hizkuntza bakoitzerako.<br />

Hiztegi hori<strong>eta</strong>n lemak <strong>eta</strong> morfemak gordetzen dira hitzen sorkuntzarako<br />

zenbait erregelekin batera. Adibidez, ingeleserako hiztegian<br />

twenty/H bikotea gordeko genuke. Lehena hitzaren lema izango litzateke,<br />

<strong>eta</strong> bigarrena, hitzaren flexioa adieraziko lukeen honako H izeneko<br />

erregela:<br />

(8) H etik<strong>eta</strong>:<br />

Y >-Y, IETH # As in twenty >twentieth<br />

[ˆ Y] >TH # As in hundred >hundredth<br />

Zuzentzaileak twentieth topatzen duenean, erregela atzekoz aurrera<br />

erabiltzen du ieth ezabatuz <strong>eta</strong> y gehituz. Gero hiztegian begiratzen<br />

du twenty zuzena ote den. Teknika hau Ispell 1 (Unix sistema eragilea,<br />

emacs editorea), Aspell 2 (Opera, AbiWord, LyX <strong>eta</strong> gedit tresnak),<br />

Hunspell 3 (morfologia aberatsa <strong>eta</strong> hitzen konposak<strong>eta</strong> konplexua<br />

duten hizkuntz<strong>eta</strong>rako, OpenOfficeko aplikazio<strong>eta</strong>n) <strong>eta</strong> MySpell<br />

(OpenOffice, Mozilla firefox <strong>eta</strong> Vim) kode irekiko zuzentzaile ortografiko<strong>eta</strong>n<br />

erabiltzen da.<br />

• Aurreko paragrafoan aipatutako teknika flexio handiko hizkuntz<strong>eta</strong>n<br />

erabiltzea oso zaila dela esan dugu dagoeneko. Erabili beharreko hiztegiak<br />

tamaina itzela izango luke, bertan lema, <strong>eta</strong> batez ere, morfema<br />

kopuru izugarria gorde beharko bailitzateke. Horren aurrean, <strong>errore</strong>ak<br />

onartzen dituzten egoera finituko eredu ezagutzaileak erabiltzen ditu<br />

Oflazer-ek (1996) turkierarako. Lemak <strong>eta</strong> morfemak automata batean<br />

1 http://fmg-www.cs.ucla.edu/geoff/isspell.html<br />

2 http://aspell.sourceforge.net<br />

3 http://hunspell.sourceforge.net

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!