22.04.2013 Views

Euskal morfologiaren tratamendu automatikorako tresnak

Euskal morfologiaren tratamendu automatikorako tresnak

Euskal morfologiaren tratamendu automatikorako tresnak

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

V kapitulua<br />

Egiaztapena burutzeko metodoak sailkatzeko orduan irizpide desherdinak erahiltzen dira .<br />

Askotan metodo heterogenoak erabiltzen diren an -en, hilketa honetan hiru multzotan hanatu<br />

ditugu metodo hauek, erahiltzcn dituzten datuen arabera : hitz-zerrenden hidezkoak, hitz-<br />

zatien bidezkoak eta morfologian oinarritutakoak .<br />

Bakoitza here aldetik aztertuko dugu, dagozkien abantailak eta eragozpenak azpimarratuz<br />

eta erreferentziaren hat aipatuz .<br />

V .2 .1 Hitz-zerrendetan oinarritutako metodoak<br />

Sistema hauetan hitza onartu egiten da haldin eta hitz-zerrendan agertzen hada . Zehaztasun<br />

minimo bat lortzeko behinik behin, hira-zerrenda oso luzca izaten da : hizkuntzaren arahera<br />

aldatzen da, haina 50 .000 edo 100 .00(1 hitzetik gorakoa izan ohi da . Datu-kopuru horiekin<br />

lan egiteko datuak gordetzeko eta atzitzeko hideak sakonean aztertu behar direlarik .<br />

Gainera, halako hiztegi erraldoi bat eraikitzeko hitz askoko corpus zuzen bat (errorerik<br />

gahekoa) behar da iturhuru gisa, miloi hat hitzetatik gorakoa gomcnclatzen da . Horrela<br />

egiten ez denean zehaztasunaren kalterako izalco da eta honako ondorio hauck izaten ditu :<br />

corpus txikien kidez_ hitz zilegi haizuk erroretzat hartuko dira, eta zuzendu gaheko corpusen<br />

kidez, herriz, errore haizuk ontzat hartzeko arrisku dago . Azken hau oso kaltegarria litzateke<br />

euskara hezala ondo hatu gaheko hizkuntzetan .<br />

Metodo horien ezaugarriak hauek izaten (lira orokorrean :<br />

• Flexio aberatsa duten hizkuntzetarako desegokia, gordetzeko zerrenda izugarri<br />

luzatzen delako, ela ondorioz "ikasteko" corpusak askoz handiagoa izan behar<br />

duelako . Gainera, sistema ez, da malgua izango jakintza-arlo herri edo termino<br />

herrientzat, erro herri hakoitzcko here deklinabide guztia sartu beharko<br />

litzatekeelako .<br />

• Flexio txikiko hizkuntzetarako aurreko arazoak saihets haclaitezke ere, beri iraungo<br />

du katek, koherentziarenak alegia . Erabiltzaileari oso ulergaitz egiten zaio erro<br />

haten flexio haizuk onartzen dituen hitarlean heste haizuk errefusatzen direla<br />

ikustea, azken hauek prohahilitate txikiagokoak izan arren .<br />

• Garatzeko azkarrak eta merkeak .<br />

t Kasu praktikoen adibide esku eman litezke . uso hihliografia (ipurua dugu etu . Ilaia ere, nahiago izua dugu<br />

ezaugarrien arabera gauzatze garrantzitsuenak errclcrentzia gehiegi ematea bainu . Kukich-en<br />

aipaturiko at'tikulumt hihliugralia usua aurki daiteke .<br />

130

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!