22.04.2013 Views

Euskal morfologiaren tratamendu automatikorako tresnak

Euskal morfologiaren tratamendu automatikorako tresnak

Euskal morfologiaren tratamendu automatikorako tresnak

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

VI. kapitulua<br />

dira .<br />

• UZEIn sortu eta sakatutako testu tekniko zuzendu gaheak . Terminologia teknikoa<br />

kenduta testu estandarra da eta horregatik aldaera gutxi detektatzen dira .<br />

Terminologiaren arazoak ehazteko hiztegi berezitu bat aherastu da aurretik .<br />

• Egunkariatik lortutako prentsako testu zuzendu gaheak . Estandarrak dira hein<br />

hatean, hala ere izen nagusien eragina saihesteko maiuskulaz hasitako izenak ez<br />

dira kontuan hartu, eta honegatik ezagutu gaheko hitzak gutxiago dira heste testu-<br />

zatietan baino .<br />

Beraz, irudian azaltzen diren datuetatik atera daitezkeen ondorioak espero zitezkeenak<br />

Jakintza-arloarekin lotutako lexikoa hiztegi hcrezituetan antolatzeagatik, eta egindako<br />

deskrihapen morfologikoari dagokion gainsorrera-ezorengatik, benetako hitzaren<br />

erroreak ekiditen dira ahal den neurrian . Horien zcnhatekoa corpusetan oinarriturik<br />

kalkulatzea zaila da, automatikoki egitea ezinezkoa ela eta, ondorioz lagin adierazgarria<br />

aztertzea oso neketsua izango litzateke . Horren ordez hurhilpen estatistikoa egin dugu .<br />

170<br />

Luzera Hitz.<br />

Kopurua .<br />

Benetako<br />

hitzak(°/%)<br />

2 18 9,7<br />

74 6,8<br />

4 81 6,0<br />

5 56 5,5<br />

6 67 3,0<br />

7 61 2,6<br />

8 39 1,7<br />

9 41 1,5<br />

10 21 (),9<br />

11 20 1,()<br />

12 13 ( .0<br />

13 3 (1 .5<br />

14 0 .4<br />

hest . 3 0 .0<br />

GUZT . 500 4 .0<br />

VI .8 irudia .- Benetako hitzaren enorecn prohalititatca (hurhilpcna) .

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!