Euskal morfologiaren tratamendu automatikorako tresnak
Euskal morfologiaren tratamendu automatikorako tresnak
Euskal morfologiaren tratamendu automatikorako tresnak
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Hitzaurrea<br />
Berrargitaratzen den tesi hau 1995.ean bukatu nuen. Tesia eskuratzeko<br />
zailtasunak ez zeuden arren (Interneten eskegita zegoen), interesgarria iruditu<br />
zait argitalpen digital hau bideratzea, euskarazko tesien bildumaren barruan,<br />
etorkizunerako berme bat delako eta bilduma osatzea bera oso proiektu<br />
garrantzitsu iruditzen zaidalako.<br />
<strong>Euskal</strong> <strong>morfologiaren</strong> <strong>tratamendu</strong> <strong>automatikorako</strong> <strong>tresnak</strong> izeneko tesia ez da<br />
lan isolatu bat izan. Garai berean gure elkarlanaren emaitza izan zen Miriam<br />
Urkiaren tesiarekin (<strong>Euskal</strong> <strong>morfologiaren</strong> <strong>tratamendu</strong> informatikorantz) batera<br />
euskal <strong>morfologiaren</strong> deskribapen konputazional osoa berreraiki dezake<br />
horretan interesatuta egon daitekeena.<br />
Bion lana elkartuta liburu bat argitaratu genuen UEUren eskutik 2002 urtean<br />
gradu-ondoko ikasketei begira: Morfologia konputazionala: euskararen<br />
<strong>morfologiaren</strong> deskribapena.<br />
Abiapuntu honetatik lan-ildo oparoa sortu genuen IXA taldearen barruan.<br />
Aplikazioaren aldetik Xuxen zuzentzaile ortografikoa izan da bere agerpen<br />
ezagunena, ezinbesteko laguntza hainbat idazle, itzultzaile, irakasle zein<br />
ikaslerentzat. Bertsio 1 anitz sortu dira eta, beste zereginen artean, bertsio<br />
horiek sortzen eta egokitzen dabilen enpresa bat: Eleka 2 . Baina, aplikazio<br />
xuxen horrez gain, analizatzaile morfologikoa oinarrizko tresna izan da hainbat<br />
proiektutan: corpusgintzan testu-masa handiak analizatzeko prozesuaren parte<br />
gisa 3 eta erdaretatik euskarara itzulpen automatikoan euskararen sorkuntza<br />
bideratzeko 4 esaterako.<br />
Aplikazio berriak bideratzeko ikerketa ezinbesteko urratsa izanda ezin aipatu<br />
gabe utzi tesi honen jarraipen zuzena izan zen Nerea Ezeiza lagunaren 2002ko<br />
tesia: Corpusak ustiatzeko tresna linguistikoak. Euskararen etiketatzaile<br />
morfosintaktiko sendo eta malgua. Ondoren IXAko taldekide batzuk urrats<br />
garrantzitsuak eman duten prozesaketa sintaktikoan eta semantikoan 5 .<br />
Tesiaren edukiari erreparatzeko gai nagusiak aipatu nahi ditut banan-banan:<br />
• Egoera finituko <strong>morfologiaren</strong> inguruan. Bigarren kapitulua da eta<br />
morfologia konputazionalaren urte emankorrenak deskribatzen ditu.<br />
Dena den azken urtetan egindako aurrerapenetan interesatuta dagoena<br />
2007an argitaratutako Computational Approaches to Morphology and<br />
Syntax liburuarekin osa dezake lana.<br />
• Prozesadore morfologiko bat euskara estandarrerako. Bertan<br />
deskribatzen dena gaur egun guztiz baliagarria eta erabilgarria da,<br />
Xuxenen erabiltzen jarraitzen da aldaketa gutxirekin. Azken urtean<br />
software librera egokitze aldera foma 6 konpiladorearekin bateragarri izan<br />
dadin erregela paraleloak sekuentzialak bihurtu ditugu lan gehiegirik<br />
gabe. Lan hau momentuz ingelesez 7 baino ezin da kontsultatu.<br />
• Analizatzaile sendoa osatzen. Parte hau izan zen tesiaren alde<br />
berritzaileena, bertan proposatzen baitira soluziobideak aldaeren