26.08.2013 Views

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

VI.2 Arkitektura nagusia 179<br />

Anotazio-amaraunaren parte den (ikus IV. kapituluko IV.2 irudia) baina<br />

erabiltzen ez den hizkuntza-informazioa aztertu ondoren, garrantzi berezia<br />

duen dependentzia-erlazioen (dep.xml) dokumentuaren inguruan arituko gara<br />

hurrengo lerro<strong>eta</strong>n. Dokumentu horrek, mendekotasun-erlazioren batean<br />

parte hartzen duten esaldiko token/multitokenen interpr<strong>eta</strong>zio-pareak lotzen<br />

ditu. Honako hiru ezaugarriengatik iruditzen zaigu aipagarria:<br />

1. Analisi-unitatea. Mendekotasun-erlazioak interpr<strong>eta</strong>zioen artean ezartzen<br />

dira <strong>eta</strong> ez tokenen artean. Aukera honen zergatia hizkuntza guztiek<br />

duten berezko anbiguotasunean, <strong>eta</strong> hau adierazteko beharrean,<br />

dago. Adibidez, Txakurrak ikusi ditu txoriak esaldian txakurrak hitzak,<br />

bai subjektuaren papera, baita objektuaren papera ere, har dezake.<br />

Mendekotasun-zuhaitzean hitza izango balitz loturarako unitatea, ezingo<br />

genuke berezko anbiguotasun hau modu egokian adierazi, Txakurrak<br />

<strong>eta</strong> ikusi hitzen artean mendekotasun-erlazio etik<strong>eta</strong> bakarra ipintzeko<br />

aukera egongo bailitzake. Mendekotasun-erlazioak interpr<strong>eta</strong>zioen<br />

artean ezartzea beharrezkoa da, <strong>eta</strong> batzu<strong>eta</strong>n interpr<strong>eta</strong>zio bakoitzarekin<br />

lotuko den mendekotasun-erlazioa desberdina izango da (aurreko<br />

kasuan, ncsubj kasu batean, <strong>eta</strong> ncobj 7 bestean). Ezaugarri horrek<br />

zailtasunak gehitzen dizkio gure lanari.<br />

2. Anbiguotasuna. Erlazioak interpr<strong>eta</strong>zioen artean ezartzen direnez, normalean<br />

esaldi baten analisiaren ondorioz mendekotasun-zuhaitz bat<br />

baino gehiago lortuko da. Berezko anbiguotasunari, analisi automatikoa<br />

erabiltzen den kasu<strong>eta</strong>n eustaggeren desanbiguazio-akatsen ondorioz<br />

sortutako anbiguotasuna gehitzen zaio. Azterk<strong>eta</strong> helburu dugun<br />

dep.xml dokumentuan mendekotasun-erlazio<strong>eta</strong>n parte hartzen<br />

duten interpr<strong>eta</strong>zio-pare guztiak adierazten dira zuhaitz berean erabil<br />

daitezkeen ala ez begiratu gabe. Token bakoitzeko interpr<strong>eta</strong>zio bakarra<br />

izango da aldioro mendekotasun-erlazio batean parte-hartzaile.<br />

Adibidez, VI.6 irudian ikus dezakegunez, zentral hitzak interpr<strong>eta</strong>zio<br />

bakarra du <strong>eta</strong> nuklearrak hitzak hiru. zentral hitzeko “1” zenbakidun<br />

interpr<strong>eta</strong>zioa 8 , nuklearrak hitzeko “2” zenbakidun interpr<strong>eta</strong>zioarekin,<br />

edo “4” duenarekin, edo “5” duenarekin lotu ahal izango da, baina “1-<br />

-2”, “1-4” <strong>eta</strong> “1-5” pareak ez dira aldi berean gertatuko. Hori kontuan<br />

hartuta, VI.6 irudiko zuhaitzetik abiatuta, VI.7 irudiko sei zuhaitzak<br />

lortuko ditugu.<br />

7 ncobj: Non Clausal object (perpausa ez den objektua).<br />

8 “1” zenbakia ipini diogu interpr<strong>eta</strong>zio honi, lsfi.xml dokumentuan lsfi1 identifikadorea<br />

baitu. Gauza bera egin dugu gainontzeko interpr<strong>eta</strong>zioekin.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!