26.08.2013 Views

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

V.2 Transduktoreak <strong>eta</strong> datak 123<br />

ezezaguna leku-izen moduan analizatu delako detektatu da existitzen<br />

ez den <strong>errore</strong>a.<br />

Zuzenk<strong>eta</strong>ri lotutako emaitzei dagokienez, data bateko <strong>errore</strong> guztiak<br />

detektatu ez arren, guztiak zuzentzen direla esan dugu: nahikoa da data<br />

batean <strong>errore</strong> bat detektatzea bere ordain guztiz zuzenak sortzeko. Esan<br />

dezakegu zuzenk<strong>eta</strong> % 100ean egiten dela ongi.<br />

Adibidea Errorearen arrazoia<br />

1998ko abenduak 20. Bizkaiko →<br />

1998ko abenduak 25.<br />

Primakovek 1998ko irailaren 11n hartu<br />

zuen...<br />

Analisi morfologikoa egiten denean ez da lerro-<br />

-amaiera detektatzen <strong>eta</strong> lehen lerroko Bizkaiko<br />

leku-izena bigarren lerroko datarekin batera analizatzen<br />

da. Kasu horr<strong>eta</strong>n koma faltako litzateke<br />

leku-izenaren ondoren.<br />

Primakov hitz ezezaguna leku-izentzat hartzen<br />

du.<br />

V.4 Taula: Alarma faltsuak daten detekzioan.<br />

Interesgarria iruditu zaigu aztertzea <strong>errore</strong>en detekzioan anbiguotasun<br />

morfo<strong>sintaktikoak</strong> izan dezakeen eragina. Horregatik, proba bat egin dugu<br />

<strong>errore</strong>en detekzioa eustaggeren desanbiguazio-mailaren arabera nola aldatzen<br />

den aztertzeko asmoz. Emaitzak V.5 taulan ikus ditzakegu. Sarrerako<br />

testua analizatzerakoan inolako desanbiguaziorik egin gabe <strong>eta</strong> testua lehen<br />

mailan (kategoria-mailako anbiguotasuna ebatzita) edo bigarren mailan (kategoria<br />

<strong>eta</strong> azpikategoria) desanbiguatuta, emaitzak ez direla aldatzen ikus<br />

dezakegu. Kasu-marka kontuan hartzen denean, ordea, (hirugarren mailan)<br />

emaitzek okerrera egiten dute. Detektatu ez diren <strong>errore</strong>ak beti dira mota<br />

berekoak: dat nah kas le <strong>eta</strong> dat geh punt u. Garapenerako corpusean<br />

18 <strong>errore</strong> gutxiago detektatzen dira <strong>eta</strong> probarako corpusean 6 <strong>errore</strong> gutxiago.<br />

Errore gehien -garren adierazten duen puntuaren detekzioan gertatzen<br />

da (dat geh punt u), daten definizioan urteak lekuzko genitibo kasu-marka<br />

edukitzea eskatzen baita <strong>eta</strong> analisi hau hirugarren mailan desanbiguatuta<br />

desagertu egiten da, <strong>errore</strong>a detektatzea galeraziz. Leku-izenaren <strong>eta</strong><br />

egunaren kasu-markak berdin deklinatuta egon daitezen eskatzen duen <strong>errore</strong>-erregelak<br />

huts egiten du hirugarren desanbiguazio-mailan, leku-izenean<br />

absolutibo kasua daraman analisia desagertu egiten delako. Laugarren desanbiguazio-mailan<br />

(gogoratu, desanbiguazioa murriztapen gramatika soilik<br />

erabiliz egiten da) <strong>errore</strong> bat gutxiago detektatzen da. Alarma faltsuei da-

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!