22.04.2013 Views

Euskal morfologiaren tratamendu automatikorako tresnak

Euskal morfologiaren tratamendu automatikorako tresnak

Euskal morfologiaren tratamendu automatikorako tresnak

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Lanaren nondik norakoak eta aurkezpen orokorra<br />

Aldaeren <strong>tratamendu</strong>a funtsezkoa da hain batze-hide laburra duen hizkuntza katerako .<br />

Aldaerak, hi mailatako morfologiaz kudeatzen direnez, hi multzotan banatu ditugu : oso<br />

orokorrak direlako erregela morfofonologikoen bitartez adieraz daitezkeenak batetik, eta<br />

morfema zehatzei dagozkielako lexikoan adierazten direnak hestetik . Tratamendu honen<br />

bidez analizatzailearen estaldua-tasa hobetzeaz gain, forma ez-estandarrei dagozkien<br />

estandarrak lor daitezke, prozedura hau zuzenketan eta ordenadorez lagunduriko<br />

irakaskuntzan aplikazio zuzenekoa izanik .<br />

Aurreko metodoez hitz bat analizatzerik ez dagoenean, analizatzaile morfologiko sendo<br />

bat lortzeko hchinik behin, analisia lortzeko bideren bat bilatu hakar da . Gure ehazpideak, hi<br />

mailatako formalismo hartuan kokatzen denak, lemarik gaheko lexiko txiki bat erahiltz_en du<br />

fonologiarako erabilitako metodo bati (Black et al ., 91) jarraituz . Prozesu honi "lexikorik<br />

gaheko analisia" deitu diogu eta aipaturiko azpilexikoaz gain hi mailatako erregela berezi<br />

pare bat erabiltzen du .<br />

Tratamendu-multzo horrekin aberasturiko analizatzaileak honako ezau .,antiak ditu :<br />

• Orokorra : euskara estandarraren forma gehienak analiz_aiz_eko eta sortzeko gai .<br />

• Malgua : erabiltzailearen lexikoek eta aldaeren <strong>tratamendu</strong>ak hideratzen dute ez-<br />

•<br />

orokorrak edo ez-estandarrak diren formen ezagutza, prozesadore morfologikoari<br />

malgutasuna emanez .<br />

Sendoa : Lexikorik gaheko lematizazioari esker heste urraLsetan ezagutzen ez ziren<br />

hitzen analisia bideratzen da, sistemari sendotasun handiagoa emanez .<br />

Deskribatutako prozesadore morfologiko hau oinarria da eraiki dugun Xuxen izeneko<br />

egiaztatzaile- -zuzentzaile ortografikorako, garatzen ari garen EUSLEM izeneko euskararako<br />

lematizatzaile/etiketatzaile orokorrerako eta etorkizun hurbilerako helburu dugun<br />

analizatzaile sintaktikorako .<br />

1.6 . Prozesaketa moifologikoa hobetzen : Lexikoitzultzaileak.<br />

Bi mailatako morfologiarcn arrakasta izugan'ia izan ala, eta gure proiektua aurrera joan den<br />

bitartean heste talde batzuk haren inguruan hobekuntzak burutzen joan dira .<br />

Hobekuntza horien artean a'rpin1arratzekoa da lexiko-itz.ulizoile izenarekin ezagutarazi<br />

dena, Xerox-en garatua izan dena . Oinarri teorikoa (Karttunen et al ., 92) eta aplikazio<br />

praktikoa (Karttunen, 94) azkcn hi urteetan aman dira aditzera eta ekarri dituzten<br />

hobekuntzak hi ahotan kana daitezke :<br />

2 1

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!