26.08.2013 Views

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

III.2 Erroreak <strong>detektatzeko</strong> teknikak 67<br />

Erroreak <strong>detektatzeko</strong> lan<strong>eta</strong>n erabilitako algoritmoei dagokionez, transformazioan<br />

oinarritutako ikask<strong>eta</strong>11 (Sjöbergh <strong>eta</strong> Knutsson, 2005), memorian<br />

oinarritutako ikask<strong>eta</strong>12 ( Örvar Kárason, 2005) <strong>eta</strong> entropia handieneko<br />

eredua 13 (Izumi et al., 2003) erabiltzen dituzten lanak topatu ditugu. Ikask<strong>eta</strong>rako,<br />

<strong>errore</strong> mota bakoitzeko ikask<strong>eta</strong> automatikoko modulu bat entrena<br />

daiteke, edo <strong>errore</strong> mota desberdin<strong>eta</strong>rako modulu bakarra. Lehen hurbilpenak,<br />

zuzenk<strong>eta</strong>k proposatu ahal izatearen abantaila du.<br />

Hitz zuzenen erabilera nahask<strong>eta</strong>ren atazarako ikask<strong>eta</strong> automatikoa oso<br />

teknika egokia da, arazoa desanbiguazio-ataza moduan ikustea erraza baita.<br />

Era formalean, honela definitzen da arazoa (Carlson et al., 2001) lanean:<br />

sarrerako esaldi bat <strong>eta</strong> helburu hitz bat emanda, jakin nahi da hitz hori<br />

noiz den zuzena edo noiz aldatu behar dugun. Hitzen arteko anbiguotasuna<br />

nahask<strong>eta</strong> multzoekin modelatzen da (adibidez, ingelesezko, (among,<br />

between), (cite, sight, site), (I,me). ..). C = w1,...,wn nahask<strong>eta</strong> multzo batean<br />

wi hitz bakoitza anbiguoa da multzoko beste hitzekiko. Testuingurua<br />

kontuan izanik zein hitz den egokiena aukeratzea da egin beharrekoa. Arazo<br />

honen ingurukoak dira (Golding, 1995; Golding <strong>eta</strong> Roth, 1996, 1999;<br />

Carlson et al., 2001) lanak. Hori<strong>eta</strong>n, nahiz <strong>eta</strong> emaitza onak lortzen diren<br />

(% 92-95eko zuzentasuna), lan eremua nahask<strong>eta</strong> multzo zehatz batzu<strong>eta</strong>ra<br />

mugatuta dago.<br />

Datu kopuru eskergarekin aipatutako teknikak probatuz gero, emaitzek<br />

bat egiten dutela ikusi da. Hori dela <strong>eta</strong>, LNPko ikerlarion etorkizuneko lana<br />

etik<strong>eta</strong>tutako corpusak sortzera bidera dadin proposatzen dute Banko <strong>eta</strong><br />

Brill-ek (2001), ikask<strong>eta</strong> teknika berriak probatu <strong>eta</strong> konparatzera baino.<br />

Ikask<strong>eta</strong> automatikoak hizkuntzen irakaskuntzan izan dezakeen erabilerari<br />

dagokionez, Zock-ek (1996) zera dio:<br />

≪It is also worth mentioning that no cross fertilization has<br />

taken place between the ICALL community and people working<br />

in the Machine Learning paradigm”. ≫<br />

Irakaskuntzarako sistema gutxi topatu ditugu ikask<strong>eta</strong> automatikoa erabiltzen<br />

dutenak. Adibidez, Interneten oinarritutako Web-EasyMath algebrako<br />

tutoreak ikask<strong>eta</strong> automatikoko teknikak erabiltzen ditu ikasle-eredua<br />

sortzeko <strong>eta</strong> mantentzeko (Tsiriga <strong>eta</strong> Virvou, 2003). Ikasleen ezaugarriak<br />

inferitzeko ere erabili da ikask<strong>eta</strong> automatikoa. Adibidez, ikasle batek erantzun<br />

zuzena emateko zein probabilitate duen <strong>eta</strong> erantzuna sortzeak zenbat<br />

11 Transformation-Based Learning.<br />

12 Memory-based Learning.<br />

13 Maximum Entropy (ME) model.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!