Euskal morfologiaren tratamendu automatikorako tresnak
Euskal morfologiaren tratamendu automatikorako tresnak
Euskal morfologiaren tratamendu automatikorako tresnak
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
III. kapitulua<br />
92<br />
•<br />
proposatzen dira, zenbait leku- zein pertsona-izen lexikoan sartu behar diren<br />
bitartean, hesteentzat lexiko berezituak proposatzen dira (ikus 4 . kapitulua) .<br />
Hirugarrenez eratorpen eta elkarketa "herriak" dauzkagu . Eratorpena<br />
irregularra denez eta euskararena ondo aztertu gahe dagoenez, egin dugun<br />
aukeraren arabera eratorpen zeharo erregularrak bakanik sartu dira morfema<br />
gisa, gainontzekoetan eratorpen lexikalizatuak lema gisa sartu direlarik<br />
lexikoan .<br />
• Azkenik, euskararako analizatzaile batek ezagutu ezin dituen heste<br />
hizkuntzetako hitzak .<br />
Kontzeptua 1b-n 2b-n bietan<br />
Ezagutu gaheko hitzak (guztira) . 307 85 392<br />
('/,1(0) (% 100) (To 1(m)<br />
A.-Erabilpen cz-estandarra 101 28<br />
129<br />
(% 32,9) (%32,9) (% 32,9)<br />
B 1 .-Erdararen eragina 31<br />
2<br />
33<br />
(°/,10,1) (%2,4) (%8,4)<br />
B2 .-Lexikoan ez egotea 68<br />
16<br />
84<br />
(%%22,1) (%,18,8) (%21,4)<br />
B3 .-Eratorpen/elkarketa "berria" 33<br />
13<br />
46<br />
(%,10,7) (% 15,3) (%:11,7)<br />
B4 .-Hitz arrotzak 39<br />
14<br />
53<br />
(IX, 12,7) (%% 16,5) (c/o13,5)<br />
C .-Akatsak 30<br />
10<br />
40<br />
(%9,8) (%,11,8) (%o10,2)<br />
D .-Bestelakoak 5<br />
2<br />
7<br />
1,6) (%%2,4) (% 1,8)<br />
111 .10 irudia .- Ez-estaltzearen arrazoiak ebaluatzen .<br />
Hauez gain hizkuntzari dagozkion zenbait "eragozpen" (laudo . Euskararen flexio<br />
aberatsa dela eta, erro katen faltak forrua ezezagun anitz eragiten dezake . Gainera<br />
juntagailurik ez egotean, corpusen kasuan ez dago juntagailuen maiztasun handien<br />
eraginaz baliatu .<br />
Datorren kapituluan proposatuko diren hohckuntza hatzuk huiatuz emaitzak hohetzen<br />
dira, eta %95etik gorakoak izaten dira .<br />
111 .10 irudian hi testu-zatiren gainean egindako azterketaren emaitzak azaltzen (lira,<br />
zehaztutako arrazoiei pisu bat egokitzearren . Aukeratutako testuak hitz-zerrendak dira, I b<br />
eta 2h kodearekin identifikatu ditugun Argiako zatiena eta filosofi testuarena hain zuzen .<br />
Datu hauek hartu ditugu kontuan analizatzailea sendotzeko teknikak diseinatzerakoan,<br />
datorren kapituluan ikusiko den legez .