22.04.2013 Views

Euskal morfologiaren tratamendu automatikorako tresnak

Euskal morfologiaren tratamendu automatikorako tresnak

Euskal morfologiaren tratamendu automatikorako tresnak

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

IV. kapitulua<br />

Lema generikotik henetako lemara pasatzeko prestatu dugun heuristikoak azaleko<br />

adierazpidea hartzen du erreferentzia nagusitzat, eta gerta daitezkeen aldaketak kontuan<br />

hartuz analisiari dagokion halizko lemak sortzen ditu . Balizko lema hauek gainontzeko<br />

morfemekin batera sorkuntza estandarretik iraganarazten dira, emandako azaleko forma<br />

lortzen ez dituztenak hazterluz_ (ikus IV .9 irudia) .<br />

IV .3 .2 .2 . Desanbiguazio lokala<br />

Lexikorik gaheko analisiak burutzean analisi asko lortz_cn da hit .z bakoitzeko . Ez da arraroa<br />

forma katetik hogei analisi desberdin baino gehiago lortzea, eta hau ez da erabilgarria .<br />

Aipatutako artikuluan Black-ek eta bere lankideek hau aurrikusi zuten eta eragozpen hori<br />

konpontzeko desanhiguaziorako zenhait irizpide ornan zuten, honako analisi hauek<br />

lehenetsiz_ : lema motzenak dituztenak -edo gauza hora dena, hizkien bidez zati luzeena<br />

ezagutzen dituztenak-, aplikatutako erregelen cta hereizitako hizkien prohahilitatea .<br />

Beraick desanbiguatzeko zuten premia gure sistemarena baino handiagoa zen, zeren<br />

ahoskerarako aukera Nakarra aukeratu behar haitzen . Gure kasuan aukera hat baino gehiago<br />

hauta daiteke, clesanhiguarzcko gainontzeko lana testuingurua kontuan hartzen duten heste<br />

prozesuetarako utz baitaiteke .<br />

Gure desanhiguazio lokalean jarraitu diren irizpideak hauexek izan elira :<br />

• Kontrakoa erahakitzcn cz eten hitartean kategoria hakoitzeko gutxienez analisi hat<br />

lortuko da .<br />

• Kategoria hercko analisien artean lema motzenak dituztenak aukeratuko dira, letra<br />

haseko aldea duten guztiak ere mantentzen direlarik .<br />

• Puntu ondoren etorri gahe maiuskulaz hasten diren hitzetan, pertsona- eta Icku-<br />

izena ez diren aukerak haztertzen elira .<br />

Desanbiguazio-prozesu hau arintzeko, egokia iruditu zaigu eratorpen-atzizki ohizkoenak<br />

integratzea lexikorik gaheko lexikoan, horrela hoheto bideratuko baitira aurreko kapituluko<br />

111 .10 irudian B3 kodearekin jasotzen diren eratorpen "herri"cn analisiak -ez<br />

ezagututakoen arloan %%l0ctik gora direnak- . Halako eratorpen herriotan cratorpen-<br />

morfema ezagutzen kada lema motzago izango da, dcsanhigua -z.io-prozesua argituz .<br />

IVA Analizatzaile sendoa . Emaitzak .<br />

Kapitula honetan aztertutakoarekin aurreko kapituluan azaltzen zen prozesadore<br />

morfologiko estandarra osatu egiten da, analizatzaile sendo eta orokor hat lortzeko asmoz .<br />

124

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!