Azaleko sintaxiaren tratamendua ikasketa automatikoko tekniken ...
Azaleko sintaxiaren tratamendua ikasketa automatikoko tekniken ...
Azaleko sintaxiaren tratamendua ikasketa automatikoko tekniken ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Gaiaren motibazioa eta kokapena 5<br />
(Aduriz et al., 1998), MORFEUSen oinarritutako Xuxen euskarako zuzentzaile<br />
ortografikoa (Agirre et al., 1992; Alegria et al., 2008b), zenbait analizatzaile<br />
sintaktiko (Aduriz et al., 2006a), corpusak (Aduriz et al., 2006b; Agirre<br />
et al., 2006), hiztegi elektronikoak (Arregi et al., 2003; Díaz de Ilarraza et al.,<br />
2007), sare semantikoa (Pociello, 2008) eta beste hainbat.<br />
Baina orain arte, IXA taldean, eta batez ere <strong>sintaxiaren</strong> eta erroreen tratamendu<br />
automatikoaren alorrean, landu diren tresna eta baliabide gehienak<br />
lehen hurbilpenari jarraiki garatu dira; alegia, hizkuntzaren ezagutzan oinarritzen<br />
diren teknikak baliatuz.<br />
Sintaxiaren alorrean, adibidez, (Aduriz, 2000) eta (Arriola, 2000) lanei<br />
segida eman zaio (Aranzabe, 2008) tesi-lanean, eta desanbiguazio morfosintaktikorako<br />
euskararen murriztapen-gramatika, kateen detekzioa egiten duen<br />
gramatika eta dependentzien gramatika finkatuta geratu dira. Hiru tesi-lan<br />
hauetan landutako teknikak hizkuntza-ezagutzan oinarritutakoak izan dira.<br />
Corpusetan oinarritutako teknikekin ere, egin da lanik, ordea. Ezeizak (2002)<br />
euskarako etiketatzaile morfosintaktikoa burutzeko desanbiguatzaile estokastiko<br />
bat eraiki zuen, esate baterako. Gainera, dependentzietan oinarritutako<br />
euskarako analizatzaile sintaktiko estatistiko bat (Bengoetxea eta Gojenola,<br />
2007) ere bidean da, dagoeneko.<br />
Euskarako erroreen <strong>tratamendua</strong>n, berriz, (Maritxalar, 1999), (Oronoz,<br />
2009) eta (Uria, 2009) tesi-lanak aipatu beharrean gaude. Lehenengoan,<br />
bigarren hizkuntzako ikasleen hizkuntza-ezagutza eskuratzeko sistema bat<br />
diseinatzeaz gain, ikasleari, idazteko prozesuan, laguntza ematen dion aplikazioa<br />
ere sortu zen. Hala, erroreen <strong>tratamendua</strong>n eta hizkuntzen ikaskuntzan<br />
aurrera jotzeko lehen urratsa izan zen tesi-lan hau. Beste bi lanetan,<br />
euskaraz egin ohi diren zenbait erroreren azterketa eta detekzioa landu zen.<br />
Oronozek (2009), esaterako, komunztadura-erroreak, datetan egindako erroreak<br />
edo postposizio-lokuzioetan egindakoak detektatzeko lana egin zuen;<br />
Uriak (2009), berriz, determinatzaile-erroreak detektatzeko gramatika bat<br />
osatu zuen, besteak beste. Errore mota hauek guztiak automatikoki detektatzeko<br />
erabilitako teknikak, halaber, hizkuntza-ezagutzan oinarritutakoen<br />
artean kokatzen dira; hau da, hizkuntzari buruzko ezagutza erregeletan edo<br />
antzeko adierazpideetan adierazia dator modu esplizituan.<br />
Sintaxiaren eta erroreen <strong>tratamendua</strong>ren alorretatik kanpo, semantikaren<br />
eta itzulpen automatikoaren arloetan, esaterako, gehiago landu dira corpusetan<br />
oinarritutako teknikak IXA taldean. Hala, teknika hauek baliatu<br />
zituzten, besteak beste, Martinezek (2004) eta Lopez De Lacallek (2009) hi-