22.04.2013 Views

Euskal morfologiaren tratamendu automatikorako tresnak

Euskal morfologiaren tratamendu automatikorako tresnak

Euskal morfologiaren tratamendu automatikorako tresnak

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

II. kapirurluua<br />

3 4<br />

• Hiztegiak : morfemak hiltzen dituzten azpilexikoak . Gehienez zazpi dira,<br />

erregeletatik kudea daitezke, eta bertan honak informazio hauek azaltzen dira : hitz-<br />

zatia, hau da, aldatzen ez den morfemaren zatirik luzeena, dagokion formatoa eta<br />

unitate lexikoa erro amankomuna duten hitz-zatiak hiltzeko erabilia- eta<br />

gainerako informazio morfologikoa .<br />

• Formatoak : hiztegiko unitate-multzo bati dagokion informazioa hiltzen duen<br />

eredua . Ohizkoa da atzizki herdinak hartzen dituzten lexikoko unitateei formato<br />

bera egokitzea .<br />

• Gramatika (erregelak) : erregelen multzoa, hiztegietan aurkitutako hitz-zatiei<br />

dagozkien formatoen arabera aktibatzen direnak eta zenhait ekintza huru daitezen<br />

eragiten dutenak . Berauetan bestelako baldintzak zehatz daitezke, ekintza<br />

garrantzitsuenak ondokoak izanik : aldagaien gaineko eragiketak, hiztegien<br />

irekitzea edo ixtea, eta testu-aldaketa .<br />

Programak etengabe bilatzen ditu hitz-zatiak hiztegietan, eta aurkitutakoei dagokien<br />

informazioa aldagaiei esleitzeaz gain, herauen formatoen arabera aplikatzen ditu erregelak .<br />

Aipatutako osagaiekin morfotaktikaren zein <strong>tratamendu</strong> morlosintaktikoaren deskripzioa<br />

erraza eta malgua den hitartean, salbuespenak modu dotorean adieraztea hideratuz, aldaketa<br />

morfofonologikoen <strong>tratamendu</strong>a kaxkarra da oso, horretarako mnrfotaktika helhurua duten<br />

erregelak erabili behar baitira . Hori dela eta, aldaketa morl •o fonologiko sinpleak adierazteko<br />

ere, zenhait amarru eta zeharkako hide erahili behar dira beti .<br />

Horrez gain, heste hi eragozpen ditu sistema honek :<br />

•<br />

Programa ezagumendu linguistikotik independente hada ere gramatikaren idazketa<br />

ez da erazagutzailea, metalengoaia agintzaile hasetik gertu dagoen zerbait baizik .<br />

• Programa ez da eskuragarria eta here zehaztasunak ez dira ezagunak, eta gainera<br />

garaiko IBM mai~rfirune-tean baino ezin zen erahili .<br />

Martí-k (1987) espainierarako proposatutako AM analizatzaileak, lematizatzaile baten<br />

parte denak, zenhait ezaugarri du amankomunean aurrekoarekin :<br />

• Analisirako bakarrik hallo du .<br />

• Morfotaktika azpilexikoetan oinarritutako erregelen hiclez hurutzen da eta erregela<br />

hauek informazio morfologikoarekin lotutako ezaugarrien menpe jar daitezke .<br />

AM-n eratorpen-morfologia dcl'initz .eko erahiltzen da aukera hau .<br />

• Lexikoan UD (hiztegi-unitate) izeneko hitz-zatiak gordetzen dira .

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!