22.04.2013 Views

Euskal morfologiaren tratamendu automatikorako tresnak

Euskal morfologiaren tratamendu automatikorako tresnak

Euskal morfologiaren tratamendu automatikorako tresnak

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

III. kapitulua<br />

92<br />

•<br />

proposatzen dira, zenbait leku- zein pertsona-izen lexikoan sartu behar diren<br />

bitartean, hesteentzat lexiko berezituak proposatzen dira (ikus 4 . kapitulua) .<br />

Hirugarrenez eratorpen eta elkarketa "herriak" dauzkagu . Eratorpena<br />

irregularra denez eta euskararena ondo aztertu gahe dagoenez, egin dugun<br />

aukeraren arabera eratorpen zeharo erregularrak bakanik sartu dira morfema<br />

gisa, gainontzekoetan eratorpen lexikalizatuak lema gisa sartu direlarik<br />

lexikoan .<br />

• Azkenik, euskararako analizatzaile batek ezagutu ezin dituen heste<br />

hizkuntzetako hitzak .<br />

Kontzeptua 1b-n 2b-n bietan<br />

Ezagutu gaheko hitzak (guztira) . 307 85 392<br />

('/,1(0) (% 100) (To 1(m)<br />

A.-Erabilpen cz-estandarra 101 28<br />

129<br />

(% 32,9) (%32,9) (% 32,9)<br />

B 1 .-Erdararen eragina 31<br />

2<br />

33<br />

(°/,10,1) (%2,4) (%8,4)<br />

B2 .-Lexikoan ez egotea 68<br />

16<br />

84<br />

(%%22,1) (%,18,8) (%21,4)<br />

B3 .-Eratorpen/elkarketa "berria" 33<br />

13<br />

46<br />

(%,10,7) (% 15,3) (%:11,7)<br />

B4 .-Hitz arrotzak 39<br />

14<br />

53<br />

(IX, 12,7) (%% 16,5) (c/o13,5)<br />

C .-Akatsak 30<br />

10<br />

40<br />

(%9,8) (%,11,8) (%o10,2)<br />

D .-Bestelakoak 5<br />

2<br />

7<br />

1,6) (%%2,4) (% 1,8)<br />

111 .10 irudia .- Ez-estaltzearen arrazoiak ebaluatzen .<br />

Hauez gain hizkuntzari dagozkion zenbait "eragozpen" (laudo . Euskararen flexio<br />

aberatsa dela eta, erro katen faltak forrua ezezagun anitz eragiten dezake . Gainera<br />

juntagailurik ez egotean, corpusen kasuan ez dago juntagailuen maiztasun handien<br />

eraginaz baliatu .<br />

Datorren kapituluan proposatuko diren hohckuntza hatzuk huiatuz emaitzak hohetzen<br />

dira, eta %95etik gorakoak izaten dira .<br />

111 .10 irudian hi testu-zatiren gainean egindako azterketaren emaitzak azaltzen (lira,<br />

zehaztutako arrazoiei pisu bat egokitzearren . Aukeratutako testuak hitz-zerrendak dira, I b<br />

eta 2h kodearekin identifikatu ditugun Argiako zatiena eta filosofi testuarena hain zuzen .<br />

Datu hauek hartu ditugu kontuan analizatzailea sendotzeko teknikak diseinatzerakoan,<br />

datorren kapituluan ikusiko den legez .

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!