26.08.2013 Views

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

II.5 Ebaluazioa 45<br />

Erakutsitako neurriek esaldi edo egitura okerrak <strong>detektatzeko</strong> gaitasuna<br />

neurtzen dutela esan dugu. Era berean neur zitekeen esaldi edo egitura zuzenak<br />

<strong>detektatzeko</strong> gaitasuna baina, gure ustez, lehen neurria ulerterrazagoa<br />

da esku artean dugun ataza kontuan hartuta.<br />

Riley et al. (2004) egile taldearen ustez, erabiltzaileari sistema batek<br />

ehuneko hainbateko doitasuna <strong>eta</strong> ehuneko bestelako estaldura duela esatea<br />

ez omen da oso esanguratsua, <strong>eta</strong> ez omen du sistemaren erabilgarritasunaren<br />

aztarnarik ematen. Haiek, <strong>errore</strong> motako doitasuna <strong>eta</strong> estaldura emateaz<br />

gain, orrialdeko alarma faltsu kopurua (“false flags per page”(ffpp))<br />

neurria ematea proposatzen dute. Balio hori kalkulatzea erraza den arren,<br />

ez ematea erabaki dugu. Beste sistemekin konparak<strong>eta</strong>k egin ahal izateko,<br />

ohikoagoak diren neurriak erabiltzea erabaki dugu.<br />

Azkenik, gogora dezagun estalduran <strong>eta</strong> doitasunean eragin zuzena dutela<br />

aukeratutako corpusek (corpusen deskribapena II.3.1 atalean egin da).<br />

Ondorengo atalean, besteak beste, ebaluaziorako corpus hori<strong>eta</strong>n erabaki<br />

dugun banak<strong>eta</strong> azalduko dugu.<br />

II.5.3 Exekuzioa<br />

Aipatutako corpus<strong>eta</strong>ko bakoitza (<strong>errore</strong>duna zein <strong>errore</strong>rik gabea) bi zatitan<br />

banatu dugu. Adibide bilduma bakoitzaren % 60 erregelen garapenerako<br />

<strong>eta</strong> birfink<strong>eta</strong>rako erabili dugu, <strong>eta</strong> gainontzeko % 40 probarako.<br />

Garapenerako corpusa behin <strong>eta</strong> berriro aztertu dugu azterk<strong>eta</strong> ziklo<br />

bakoitzean bi urrats eginez: a) erregelak corpusean aplikatu ditugu, <strong>eta</strong> b)<br />

emaitzak aztertu ditugu detektatu ez diren <strong>errore</strong>en <strong>eta</strong> alarma faltsuen<br />

bila. Topatutako hutsuneak aztertu ondoren, erregelak birfindu egin ditugu<br />

hobetze aldera <strong>eta</strong> zikloarekin jarraitu dugu, emaitzak ahalik <strong>eta</strong> hoberenak<br />

zirela uste izan dugun arte. Lan hau gramatiken garatzaileak egin du.<br />

Probarako corpusean erregelak behin soilik pasa ditugu, ez dugu inolako<br />

erregela birfink<strong>eta</strong>rik egin, <strong>eta</strong> lan hau, noski, garatzailea ez den pertsona<br />

batek egin du.<br />

Helburu desberdinekin aztertu ditugu corpus <strong>errore</strong>duna <strong>eta</strong> zuzena.<br />

Lehenengoan, <strong>errore</strong>-erregelen detekzio-maila neurtzea izan dugu helburu,<br />

<strong>eta</strong> bigarrenean, berriz, <strong>errore</strong>-erregelek sor ditzaketen alarma faltsuak neurtzea.<br />

Helburu zehatzak horiek izan diren arren, <strong>errore</strong>ak <strong>eta</strong> alarma faltsuak<br />

bi corpus<strong>eta</strong>n aztertu ditugu (zuzenean ere <strong>errore</strong>ak topatu ditugu). Honako<br />

neurriak kalkulatu ditugu 10 :<br />

10 Oharra: corpus zuzenak oso handiak direnez, ez dugu bertan dagoen <strong>errore</strong> kopurua<br />

zehaztu, ezta detektatu gabeko <strong>errore</strong>en kopurua ere.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!