26.08.2013 Views

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

82 Hizkuntzaren analisia <strong>eta</strong> errepresentazioa<br />

katean erabiltzen dira modu sekuentzialean <strong>eta</strong> modulu<strong>eta</strong>n bilduta. Modulu<strong>eta</strong>ko<br />

batzuk, mendekotasun-ezartzailea kasu, trukagarriak dira; hots, analisi-kateko<br />

azken geruzan erregel<strong>eta</strong>n oinarritutako Euskararako Dependentzia<br />

Gramatika Konputazionala (EDGK) (Aranzabe, 2008) erabil dezakegu,<br />

edo Maltparser (Nivre et al., 2007) mendekotasun-erlazio ezartzaile estatistikoaren<br />

euskararako egokitzapena (Maltixa) Bengoetxea <strong>eta</strong> Gojenola (2007).<br />

Moduluak aurrerago deskribatuko ditugu. Lehenago, analizatzailearen ezaugarriak<br />

aipatzea egokiagoa iruditu zaigu ikuspegi orokorragoa izateko:<br />

• Sendoa. Analisi-katea sendoa da Mokhtar et al. (2002) lanean ematen<br />

den definizioari jarraituz: “Robustness can be broadly defined as<br />

the ability for a language analyzer to provide useful analyses of real-<br />

-world input text”. Sarreran edozein karaktere-kate duela, gure analizatzaileak<br />

beti ematen du nolabaiteko analisi erabilgarriren bat. Analisi<br />

erabilgarriak zuzenak direnak (batzu<strong>eta</strong>n partzialki) <strong>eta</strong> aplikazio<br />

edo ataza automatikoren batean erabil daitezkeenak dira. Analizatzaile<br />

sendoek gutxienez analisi bat ematen dute mundu errealeko sarrerekin<br />

(ez zero), <strong>eta</strong> analisien artean preferentziaren bat ezar dezakete.<br />

• Orokorrean, hizkuntza-ezagutzan oinarritutakoa. Analisi-katean, orokorrean,<br />

hizkuntzari buruzko ezagutza erregel<strong>eta</strong>n kodetzen da modu<br />

esplizituan, ez da testu<strong>eta</strong>tik erauzten (hurbilpen sinbolikoa). Hala<br />

ere, geruza batzu<strong>eta</strong>n, lematizatzailean desanbiguazioa egiten denean<br />

adibidez, hurbilpen sinbolikoa teknika estatistikoekin (ikuspegi enpirikoa)<br />

konbinatu egiten da edo teknika estatistiko hutsak erabiltzen dira<br />

(MaltIxa analizatzaile sintaktikoan, adibidez).<br />

• Analisi partziala. Analisi partziala terminoak deskribatzen duen kontzeptua<br />

izendatzeko azaleko analisia <strong>eta</strong> analisi arina terminoak ere<br />

erabili izan dira. Analisi partziala testuen gramatika-analisi ez-osoa da.<br />

Sintaxi-analizatzaile partzialek sintaxi-egitura minimoak sortzen dituzte,<br />

zeintzu<strong>eta</strong>n anbiguotasuna ez den guztiz ebatzi (Mokhtar et al.,<br />

2002). Carroll-en arabera (2003), azaleko sintaxian sarrerako karaktere-katea<br />

teilakatzen ez diren unitate-sekuentzi<strong>eta</strong>n edo zati<strong>eta</strong>n banatzen<br />

omen da. Hitz-sekuentzia bakoitza kategoria sintaktiko batekin<br />

etik<strong>eta</strong>tzen da, <strong>eta</strong> batzu<strong>eta</strong>n, zatiaren burua adierazten da. Azken<br />

definizio honek deskribatutakoa baino analisi sakonagoa egiten du gure<br />

sintaxi-analizatzaileak, hitzen arteko erlazioak ezartzeko gai baita.<br />

Hala ere, esaldia osorik ulertzera <strong>eta</strong> analizatzera iritsi ez garenez,<br />

analizatzaile partzial moduan definitu dugu gurea. Analisi partzialak,

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!