26.08.2013 Views

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

70 Erroreak <strong>detektatzeko</strong> <strong>eta</strong> <strong>zuzentzeko</strong> teknikak<br />

estatistika erabili dituzte bilak<strong>eta</strong>-galderak <strong>zuzentzeko</strong>. Milioika pertsonek<br />

egindako kontsulten log-ak aztertuta (bilatzaile batek jasotako bilak<strong>eta</strong>-galderen<br />

histogramak), hitz baten baliagarritasuna neurtzen dute. Horr<strong>eta</strong>rako,<br />

sarrerako galdera tokenizatu egiten dute. Ondoren, token bakoitzari oso era<br />

zehatz <strong>eta</strong> formalean definitu duten edizio-funtzio bat <strong>eta</strong> atalase funtzio<br />

batzuk aplikatzen dizkiote, aldaera posible batzuk lortuz. Aldaera horiekin<br />

osatutako hitz-zerrendak, bilak<strong>eta</strong>-galderen log<strong>eta</strong>n bilatzen dira, bertako<br />

maiztasuna kontuan hartuta. Bilak<strong>eta</strong>-galdera maiztasunaren arabera ordenatutako<br />

aldaeren zerrendan goiko postu<strong>eta</strong>n agertzen bada, ongi idatzita<br />

dagoela suposatzen dute. Bestela, zerrendaren behealdean badago, gaizki<br />

idatzia egongo da, baina dagokion zuzenk<strong>eta</strong> zerrendaren hasieran egongo<br />

da. Esperimentu hon<strong>eta</strong>n, ordain zuzenen % 85,5eko zuzentasuna lortzen<br />

dute, % 88,4ko doitasuna <strong>eta</strong> % 85,4ko estaldura.<br />

III.3.2 Gramatika<br />

Azterk<strong>eta</strong> bibliografikoan gainbegiratutako lan gehien<strong>eta</strong>n gramatika-mailako<br />

zuzenk<strong>eta</strong> <strong>errore</strong>a detektatu ondoren egiten dela ikusi dugu. Hala ere,<br />

detekziorik gabeko zuzenk<strong>eta</strong> egiten duten lanak ere topatu ditugu. Azkeneko<br />

moduko zuzenk<strong>eta</strong> egiten da adibidez, Mitjushin-en (1996) lanean. Esaldi<br />

<strong>errore</strong>dunari ezin zaionean egitura sintaktikorik egokitu, esaldia <strong>eta</strong> analisi-<br />

-zuhaitza aldatu egiten dira, analisi bat lortzea posible den arte. Lortutako<br />

esaldi-aldaerak, abiapuntutzat hartutako esaldiaren zuzenk<strong>eta</strong> posibletzat<br />

jotzen dira. Hori egin daiteke, gertatutako <strong>errore</strong>ak identifikatu gabe.<br />

Hurbilpen hori baino ohikoagoa da, behin <strong>errore</strong>a detektatu dela, <strong>errore</strong>aren<br />

parte diren esaldiko osagaiak zuzentzea. Adibidez, komunztadura-<br />

-<strong>errore</strong><strong>eta</strong>n, esaldi osoa zuzendu beharrean, komunztatzen ez duten osagaien<br />

zuzenk<strong>eta</strong>ra jotzen da. Osagai horien ordain zuzenak lortu ondoren, bi osagai<br />

berrien arteko egokitasuna aztertu beharko litzateke, behin <strong>eta</strong> berriro,<br />

<strong>errore</strong>a desagertzen den arte. Ordain zuzenak lortzeko erabili daitezkeen teknikak,<br />

hitz-mailako zuzenk<strong>eta</strong>k lortzeko erabiltzen diren teknika berberak<br />

dira. Aipatutakoez gain, honakoak ere topatu ditugu:<br />

Bustamante <strong>eta</strong> Leónen lanean (1996) analisia-transferentzia-sintesia ziklo<br />

bat erabiltzen da zuzenk<strong>eta</strong> egiteko. Informazio okerra duten egitura linguistikoak<br />

zuzen moduan definitu den gaztelerara transferitzen dira itzulpen<br />

automatikoko tekniken antza duen teknika bat erabiliz.<br />

Bender et al. (2004) lanean linguistikoki okerrak diren karaktere-kateak<br />

ongi eratutako adierazpen semantikoekin parekatzen dira. Adierazpen<br />

semantiko<strong>eta</strong>tik abiatuta, <strong>errore</strong>ari buruzko diagnosia egin daiteke, baita<br />

<strong>errore</strong>ei dagozkien ordezko zuzenak sortu ere.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!