26.08.2013 Views

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

312 Ondorioak <strong>eta</strong> etorkizuneko lanak<br />

VIII.3.2 Saroiren moduluen hobekuntza<br />

Saroi tresna sendoa <strong>eta</strong> erabilgarria dela uste dugun arren, beti egin dezake<br />

hobera. Atal hon<strong>eta</strong>n, Saroi osatzen duten modulu<strong>eta</strong>n egin daitezkeen<br />

hobekuntzak zerrendatuko ditugu.<br />

• Analisi sintaktikorako modulua<br />

– Une hon<strong>eta</strong>n Saroiren sintaxi-analisirako moduluak sarrera anbiguoa<br />

lehertu egiten du <strong>eta</strong> sarrera horri dagozkion zuhaitz posible<br />

guztiak ematen ditu. Hori beharrezkoa da <strong>errore</strong>ak <strong>detektatzeko</strong>,<br />

sarrerako esaldia okerra denean ez baitakigu zein zuhaitz<strong>eta</strong>n topatuko<br />

dugun gaizki eratutako egitura. Zenbait aplikaziotarako,<br />

edo azkartasuna helburu dugunean, ordea, analisi-zuhaitz bakarra<br />

nahikoa izango da. Esaldiko zuhaitz bakarra lortzeko, anbiguotasun<br />

morfologikoa <strong>eta</strong> sintaktikoa aldez aurretik, analisiak<br />

Saroiren analisirako modulura iritsi aurretik ebatzi beharko lirateke.<br />

Adibidez, sarrera guztiz desanbiguatua hartzen dute (Nivre<br />

<strong>eta</strong> Scholz, 2004; Nivre et al., 2007; Bengoetxea <strong>eta</strong> Gojenola,<br />

2007) lan<strong>eta</strong>n <strong>eta</strong> sarrera horri algoritmo deterministak aplikatzen<br />

dizkiote. Sarrerako analisiak automatikoki sortuak direnean<br />

anbiguoak izan ohi direnez, sortutako zuhaitzen arteko desanbiguazioa<br />

egin beharko litzateke. Analizatutako testuak zuzenak direnean,<br />

desanbiguazioa egiteko erregelak treebanketik ikasi ahalko<br />

lirateke. Analizatzaile sintaktiko estatistikoek aspalditik erabiltzen<br />

dituzte desanbiguaziorako eredu estatistikoak analisi onena<br />

lortzeko (Charniak, 2000; Collins, 1997).<br />

– Zuhaitz-egituran beheko mailako adabegi<strong>eta</strong>tik goragoko mail<strong>eta</strong>ra<br />

informazioa goratzeko aukera gehitzea interesgarria litzateke.<br />

Adibidez, komunztadura-<strong>errore</strong>en detekziorako erregel<strong>eta</strong>n<br />

komunztatzen duten elementuek zuhaitz-egitur<strong>eta</strong>n kokaleku desberdina<br />

dutela ikusi dugu. Hala, *zentral nuklearrak zakarra eratzen<br />

dute esaldian subjektuaren modifikatzailean bilatzen dugu<br />

kasua (@!ncsubj!ncmod.kas), <strong>eta</strong> *zentralak zakarra eratzen dute<br />

esaldian subjektuan bertan bilatuko genuke (@!ncsubj.kas). Adabegi<strong>eta</strong>n<br />

zehar informazioa goratuz gero, bi erregelen ordez, bakarra<br />

(azkena) erabiliko genuke bi egitur<strong>eta</strong>n <strong>errore</strong>a <strong>detektatzeko</strong>.<br />

– Analisiak informazio semantikoarekin (sinonimoekin, hiperonimoekin,<br />

hiponimoekin.. .) aberats daitezke, edo entitate izendunei<br />

buruzko informazioarekin. Horrela, Saroi informazioaren

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!