22.04.2013 Views

Euskal morfologiaren tratamendu automatikorako tresnak

Euskal morfologiaren tratamendu automatikorako tresnak

Euskal morfologiaren tratamendu automatikorako tresnak

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

VI. kapitulua<br />

164<br />

• Edizio-distantzia edo aipatutako hestetako distantziaren neurriak . Azken hauek dira<br />

zuzenketa automatikoan erahilt-zen direnak . Dena den edizio-distantzia erabiltzen<br />

hada metodoren batez hereizi heharko dira distantzia hera dutenak .<br />

• Errore-corpusen gainean aplikatutako metodo estokastikoak, taula estatistikoak,<br />

eredu markoviarrak edo sare neuronalen hedezkoak erabiliz_ .<br />

• Proposamenen maiztasuna : estatistikak, errorearen eta dagokion zuzenketaren<br />

arteko erlazioan oinarritu beharrean, hitz zilegien datu sinpleetan oinarri daitezke .<br />

Metodo hau aurrekoa baino askoz sinpleagoa da, haina errore-corpusik ez da<br />

behar .<br />

Gtire kasuan sailkapena proposamen hipotetikoen gainean egin zitekeen, haina kontuan<br />

hartu behar da kasu horretan aldaeren <strong>tratamendu</strong>az_ sortutako proposamenak sailkapenetik<br />

at geldituko liratekeela . Beste aldetik errore-corpus fidagarririk ez dagoenez bigarren<br />

puntuko irizpideak ezin izan dira aplikatu, eta heraz, hirugarrenekoak aplikatu dira .<br />

Proposamenak egiteko honako algoritmoari jarraitzen zain, bai maiztasuneko handieneko<br />

akatsei dagozkien zuzenketak sortzean, bai zuzenketa-prozesuan zehar :<br />

1) Bateko edizio-distantzian eta maiztasun handieneko hitz zilegien hul lerrean dauden<br />

proposamenak . Hauek maiztasunaren arabera sailkatu heharko lirateke, haina<br />

maiztegi izeneko buffer horretan maiztasunaren halioa ez da jasotzen memoria-<br />

hartze arrazoiak direla eta . Horren ordez harneko trigramen pisuaren arabera<br />

sailkatzen dira .<br />

2) Aurreko puntuan sartzen ez diren aldaeren <strong>tratamendu</strong>z lortutako proposamenak,<br />

hurrenez hurren edizio-distantziaren arahera ela harneko trigramen eraketaren<br />

arahera sailkatuak .<br />

3) Gainontzeko proposamenak morl'ologikoki egiaztatu ahala, aurretik harneko<br />

trigramen eraketaren arahera sailkaturik haitaude .<br />

Algoritmo honekin lortutako emaitzak V1 .7 atalean azaltzen dira .<br />

VI .5 .2 . Erabiltzailearen hiztegia .<br />

Hizkuntza eranskarien zuzenketan dauden arazo herezien artean, hiztegiaren aheraskcta<br />

aipatu da aurreko kapituluan (ikusi V .4 . I atala) .<br />

Sistema komertzial haizuetan egilea den hitz-zerrendaren bidezko crahiltzailearcn hiztegia<br />

ez da, inola cre, egokia hizkuntza eranskarietarako . Hitzen ordez morfemak -gehienetan<br />

lemak- metatu eta erabili behar dira .

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!