26.08.2013 Views

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

A.1 Gramatika-zuzentzaileak 15<br />

III.2.2.1 atalean azaldu dugu. Sistemak <strong>errore</strong> dezente omen du baina<br />

abiaduraz azkarra omen da, <strong>eta</strong> ezer baino hobea, egilearen arabera.<br />

• Funtsean aurrekoaren ideia bera jarraitzen duen baina informazio linguistikoa<br />

gehitzen duen sistema hibrido baten berri ematen dute Bigert<br />

<strong>eta</strong> Knutsson-ek (2002). Egileek hitz zuzen erabilera nahask<strong>eta</strong>k <strong>eta</strong><br />

hitz-konposatuen banak<strong>eta</strong> okerraren ondorioz sortutako <strong>errore</strong>ak detektatzen<br />

dituzte. Lan hon<strong>eta</strong>n ideia nagusia honakoa da: etik<strong>eta</strong> morfosintaktiko<br />

sekuentzia arraroak <strong>errore</strong>a izan daitezkeela suposatzen<br />

dute. n-gramaren maiztasun txikiaren arrazoi<strong>eta</strong>ko bat datu-urritasuna<br />

izan daiteke. Beraz, etik<strong>eta</strong> maiztasun handiagoko batekin ordezten<br />

da <strong>eta</strong> berriro kalkulatzen da n-gramaren maiztasuna. Hau oraindik<br />

txikia bada, <strong>errore</strong> bat detektatu da.<br />

Markov-en eredu ezkutua erabiltzen duen analizatzaile bat erabili dute<br />

n-gramak ikasteko <strong>eta</strong> corpusa morfologia-mailan analizatu <strong>eta</strong> desanbiguatu<br />

dute. Informazio hau soilik jaso duen metodo ez-gainbegiratu<br />

bat erabili dutenean, <strong>errore</strong>en detekzio-maila ona lortu dute, baina<br />

alarma faltsu kopuru handia. Sintagmei buruzko informazioa gehitu<br />

diotenean, alarma faltsuen kopurua asko jaitsi da. Sintagmak identifikatzeko,<br />

erregel<strong>eta</strong>n oinarritutako sistema bat erabili dute. Ezagutza<br />

linguistikoa gehitzeak onura izugarria suposatu du <strong>errore</strong> detekzioaren<br />

doitasunari dagokionez. Ez dute <strong>errore</strong>ak <strong>detektatzeko</strong> atazari buruzko<br />

ebaluazio-emaitzarik ematen.<br />

• Aurreko puntuan azaldutako lanaren antzekoa egiten du Sjöbergh-<br />

-ek (2005) unitate moduan osagai sintaktiko sinpleak (izen-sintagmak,<br />

aditz-kateak. . .) erabiliaz. Testu berri bat zatitzaile batekin analizatzen<br />

du <strong>eta</strong> hori zuzenak diren zatiekin konparatu. Zati-sekuentzia<br />

arraroak <strong>errore</strong> kontsideratzen dira. Zati mota desberdinak gutxi direnez<br />

<strong>eta</strong> testu zuzen<strong>eta</strong>n agertzen direnez, datu urritasunaren arazoa<br />

txikiagoa da, baita alarma faltsuena ere. Alarma faltsu gutxi detektatzearekin<br />

batera, <strong>errore</strong> gutxi detektatzen dira. Hauen artean, koma<br />

toki okerrean ipintzea edo ez ipintzea, <strong>errore</strong>ak hitzen ordenan, hitz<br />

zuzenen nahask<strong>eta</strong>k e.a. daude. Teknika hau oso merkea omen da,<br />

etik<strong>eta</strong>tu gabeko corpusa <strong>eta</strong> zatitzaile bat edukitzea nahikoa baita.<br />

Aurkeztutako lanean emaitzak ez dira argi azaltzen.<br />

• Estatistika oinarri hartuta, hiztegi zehatz baten erabilera ez-egokia detektatzen<br />

dute Chodorow <strong>eta</strong> Leacock-ek (2000). Horr<strong>eta</strong>rako, Test of<br />

English as a Foreign Language, (TOEFL)-eko idazlanak jasotzen dituzte<br />

<strong>eta</strong> ALEK (Assessing Lexical Knowledge) izeneko sistema esta-

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!