26.08.2013 Views

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

VII.7 Komunztadura-<strong>errore</strong>ak <strong>eta</strong> anbiguotasuna 277<br />

• Enumerazioa (M <strong>eta</strong> E). Zerrend<strong>eta</strong>ko osagaiak unitate bakarrean biltzen<br />

ez badira, osagai<strong>eta</strong>ko bakoitzean errepikatzen da mendekotasun-<br />

-etik<strong>eta</strong> (ikus (74) adibidea), kombik subj <strong>eta</strong> kombik obj erregelen<br />

aplikazioa eraginez.<br />

(74) Lehenengo sailkapenean Hondarrabikoa (ncsubj>), Kontxa <strong>eta</strong><br />

Ondarr<strong>eta</strong> (ncsubj>) sartzen dira.<br />

• Koordinazioa (M <strong>eta</strong> E). Zerrenden inguruan deskribatu berri dugun<br />

arazoa, koordinazioarekin errepikatu egiten da (ikus (75) adibidea).<br />

(75) Liburu (ncsubj>) <strong>eta</strong> informazio gehienak (ncsubj>) erderaz<br />

daude...<br />

• Hitzak nahasteagatik. Komunztadura-<strong>errore</strong>rik ez duen arren, (76) adibideko<br />

esaldi <strong>errore</strong>dunean, basapisti hitza gaizki erabili da. Gure ustez,<br />

idazleak basati hitza erabili nahi izan du. Nahastuta erabili duen hitzaren<br />

gramatika-kategoriaren aldak<strong>eta</strong>k, <strong>errore</strong> baten detekzioa ahalbidetu<br />

du (komunztadura-<strong>errore</strong>a ez den arren, bi objektu markatu<br />

dira).<br />

(76) *Txakur (ncobj>) basapisti (ncobj>) bat enkargatu dugu.<br />

VII.7.3.2 Corpus zuzena<br />

Aurreko atalean, analizatzaile sintaktikoen analisi-akatsek komunztadura-<br />

-<strong>errore</strong>en detekziorako erregelen ebaluazioa eragozten dutela ikusi dugu.<br />

Bestela esateko, komunztadura-<strong>errore</strong>ak <strong>detektatzeko</strong> erregelek maiz analizatzaileen<br />

akatsak azalarazten dituzte, gaizki eratutako mendekotasun-<br />

-zuhaitzak detektatzen dituzte, <strong>errore</strong>ak detektatu beharrean. Komunztadura-<strong>errore</strong>ak<br />

detektatzen dituen gramatikaren doitasuna probatzeko modua,<br />

erregelak euskarazko treebankean, teorian analisi-zuhaitz perfektuen<br />

bankuan, aplikatzea dela otu zaigu.<br />

<strong>Euskarazko</strong> treebanka<br />

<strong>Euskarazko</strong> treebanka (Aduriz et al., 2003b) 3LB proiektuaren barnean garatu<br />

zen. Proiektuak maila morfosintaktiko <strong>eta</strong> sintaktikoan eskuz etik<strong>eta</strong>tutako<br />

corpusak sortu zituen katalanerako, euskararako <strong>eta</strong> gaztelerarako<br />

(Palomar et al., 2004). Katalanerako <strong>eta</strong> gaztelerarako corpusak osagai-egitur<strong>eta</strong>n<br />

oinarrituta analizatu ziren <strong>eta</strong> euskarazkoa mendekotasun-egiturak<br />

oinarri hartuta.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!