26.08.2013 Views

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

VII.8 Hiztegi aberask<strong>eta</strong> 291<br />

• Kasu<strong>eta</strong>tik 36tan (% 67,9) hiztegi-sarreran aditzaren alternantziaren<br />

bat falta da (inpertsonala, inkoatiboa. ..). Kasu hon<strong>eta</strong>n, corpusean<br />

topatutako alternantzia-egiturak <strong>eta</strong> dagozkien adibideak gehi daitezke<br />

hiztegian.<br />

• 11 kasutan (% 20,7) aditza hiztegian <strong>eta</strong> corpusean desberdin erabili<br />

da. Kasu horiek aditzen egungo erabilera <strong>eta</strong> erabilera-aldaketen arrazoiak<br />

aztertzeko erabil daitezke.<br />

• 5 <strong>errore</strong> (% 9,4) identifikatu ditugu hiztegian. Kasuak banan-banan<br />

eskuz aztertu ditugu <strong>eta</strong> hiztegi-sarreran laguntzaile mota bat zehazten<br />

bazen ere, adibide<strong>eta</strong>n beste batzuk adierazten zirela ikusi dugu.<br />

• Kasu bakarrean (% 1,9) nahiz <strong>eta</strong> hitz-forma berdina izan, corpusean<br />

<strong>eta</strong> hiztegian erabilitako adierak desberdinak direla ikusi dugu.<br />

Saroi erabilita 1.293 aditzeko zerrenda batean 53 aditz (% 4) inkoherentziadun<br />

moduan markatu dira. Hizkuntzalari batek aurkeztutako proposamen<br />

guztiak ben<strong>eta</strong>ko inkoherentziak direla baieztatu du, beraz, emaitza<br />

fidagarriak lortu ditugu. Inkoherentzia hauek hiztegirako aditz-alternantzia<br />

<strong>eta</strong> aditz-erabilera berriak proposatzeko erabili dira. Gainera, corpusak hizkuntza-informazio<br />

<strong>eta</strong> hizkuntza-erabilera iturri moduan duen garrantzia<br />

erakutsi dute.<br />

VII.8.4 EH hiztegian sarrerak gehitzen<br />

Bigarren esperimentuaren helburua, EH aditz-sarrera berriekin aberastea<br />

da. Horr<strong>eta</strong>rako, “Corpusean soilik” (CS) aditzen zerrenda <strong>eta</strong> treebanka<br />

erabili ditugu.<br />

Aditz bat EH hiztegian gehitzeko proposatuko dugu, baldin <strong>eta</strong> corpusean<br />

agertzeaz gain, treebankean ere agertzen bada. Treebanka eskuz etik<strong>eta</strong>tu<br />

denez, hizkuntza-informazio zuzenaren eredutzat jotzen da <strong>eta</strong> aurkeztu<br />

dugun helbururako nahikoa bermea ematen duela uste dugu. Treebanken<br />

abantaila da bertako datuek sintaxi-analizatzaileekin lortuko liratekeen datuek<br />

baino zarata txikiagoa dutela (Zeman <strong>eta</strong> Sarkar, 2000).<br />

VII.8.4.1 Esperimentua<br />

Corpusean <strong>eta</strong> treebankean tokia duten, baina hiztegian agertzen ez diren<br />

aditzak prozesu hau jarraituz lortu ditugu (prozesuaren eskema VII.16 irudian):

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!