26.08.2013 Views

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

142 Patroiak, datak <strong>eta</strong> postposizio-lokuzioak<br />

arte OBa duen postposizio-lokuzioarekin jarraituko dugu. Horrekin lortutako<br />

emaitzak V.17 taulan zehaztu ditugu. Corpus <strong>errore</strong>duneko garapenerako<br />

zatian 20 <strong>errore</strong> ongi detektatu dira; beraz, desanbiguatu gabeko corpus<br />

<strong>errore</strong>dunean % 80ko estaldura lortu dugu. Detektatu ez ditugun egituren<br />

artean (16), (17) <strong>eta</strong> (18) adibide<strong>eta</strong>n aipatutako egiturak daude. Probarako<br />

corpusean 5 <strong>errore</strong> geratu dira detektatu gabe, <strong>eta</strong> honen eraginez, estaldura<br />

% 28,6 da. Egitura hori<strong>eta</strong>ko bi “bereziak” dira <strong>eta</strong> ez genituzke orokortuko<br />

detekziorako erregel<strong>eta</strong>n isla izan dezaten, <strong>errore</strong> mekanikoak direla uste baitugu<br />

(adibidez, orduan arte <strong>eta</strong> denon artea hitzegitea egiturak). Gainontzeko<br />

hiru egiturek, berriz, zenbait deskribapenen zehaztapena eskatzen dute. Har<br />

dezagun (22) adibidea. Bertan azaltzen den egitura, “-en artean”, zuzen<br />

moduan deskribatuta dago V.12 taulan. Hala <strong>eta</strong> guztiz ere, postposizioa<br />

gaizki erabili da. Postposizio-lokuzioen erabilera zehazten den gramatika-liburu<strong>eta</strong>n,<br />

egitura hori postposizio-atzizkian pluraleko mugatasun ezaugarria<br />

duten hitzekin soilik dela zuzena zehaztu beharko litzateke 19 .<br />

(22) *Mendiaren artean bezala biziko gara.<br />

Zehaztu beharreko beste egitura bat (23) adibideari dagokiona da. Egitura<br />

zuzena litzateke, osagai beregainaren ondorengo hitzaren kategoria aditza<br />

ez balitz (adibidez, erlazio hau bi entitateen arteko harremana ezartzeko<br />

hobesten da egitura, zuzena da). Errorea <strong>detektatzeko</strong>, beraz, postposizio-<br />

-lokuzioaren ondorengo hitzaren kategoria zehaztu beharko litzateke.<br />

(23) *Erlazio hau bi entitateen arteko hobesten da.<br />

Doitasunari dagokionez, garapenerako corpusean % 100ekoa bada ere,<br />

probarako corpusean % 28koa da alarma faltsuen detekzioagatik (aurrerago<br />

aztertuko ditugu alarma faltsuak).<br />

Corpus zuzenean, garapenerako corpusean zehazkiago, % 29ko doitasuna<br />

lortu da <strong>errore</strong>-etik<strong>eta</strong> jaso duten egitur<strong>eta</strong>tik 12 ben<strong>eta</strong>ko <strong>errore</strong>ak baitira<br />

<strong>eta</strong> 29 alarma faltsuak. Kopuru altua dirudien arren, kontuan hartu beharra<br />

dago 7769 esaldirekin (“arte” forma dutenak, denak) egin dela proba.<br />

Honek % 0,37ko alarma faltsuen tasa ematen du (alarma faltsuak/elementu<br />

kopurua) 20 . Probarako corpusean antzeko emaitzak lortu ditugu % 28ko doi-<br />

19 Segur aski, munduaren ezagutza suposatzen delako ez da zehazten ezaugarri hau (unitate<br />

anitzen artean ibiliko gara, ez bakarraren artean), baina datu hau <strong>errore</strong>en detekziorako<br />

ezinbestekoa da.<br />

20 Tasa zehatza emateko, alarma faltsuak / elementu kopurua - <strong>errore</strong> guztiak formula<br />

erabili beharko genuke, baina horr<strong>eta</strong>rako corpuseko <strong>errore</strong> guztiak ezagutu behar dira.<br />

Ematen dugun neurria estimazio bat den arren, fidagarria dela uste dugu <strong>eta</strong> ben<strong>eta</strong>ko<br />

baliotik oso hurbil dago.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!