26.08.2013 Views

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

116 Patroiak, datak <strong>eta</strong> postposizio-lokuzioak<br />

matura aldatzen da. Adibideko data <strong>errore</strong>dunaren analisi morfosintaktikoa<br />

XMLz biltegiratzeko erabiltzen den ezaugarri-egitura V.2 irudian<br />

“1” etik<strong>eta</strong>rekin adierazia ikus dezakegu. Bertan, data osatzen duten<br />

elementuen kategoria gramatikala (kat), azpikategoria gramatikala<br />

(azp), kasua (kas), numeroa (num) <strong>eta</strong> mugatasuna (mug) adierazten<br />

dira 5 . Iragazki-programa hau pasa ondoren lortuko genukeen formatu<br />

sinplifikatua “2” etik<strong>eta</strong>rekin erakusten da irudi berean 6 .<br />

2. Dat<strong>eta</strong>n <strong>errore</strong>ak <strong>detektatzeko</strong> egoera finituko transduktoreak. Dat<strong>eta</strong>n<br />

gertatzen diren <strong>errore</strong>ak detektatu ahal izateko, egoera finituko bederatzi<br />

transduktore aplikatu dizkiogu era sekuentzialean sarrerako testuari<br />

(transduktore bat <strong>errore</strong> mota bakoitzeko). Transduktore<strong>eta</strong>ko<br />

bakoitza aplikatu ondoren, hark detektatzen duen egitura linguistiko<br />

<strong>errore</strong>duna etik<strong>eta</strong> pare batekin inguratuko da. Etiketek <strong>errore</strong> mota<br />

adierazteaz gain, <strong>errore</strong>aren hasiera (errhas) <strong>eta</strong> bukaera (errbuk)<br />

markatzen dituzte. Transduktoreen aplikazioaren emaitza V.2 irudian<br />

“3” zenbakiarekin etik<strong>eta</strong>tua ikus dezakegu. Transduktoreak aplikatzen<br />

goazen heinean, <strong>errore</strong>ak adierazteko erabiltzen diren etik<strong>eta</strong>k<br />

gehitzen joango dira analisian.<br />

3. “Zenbaki<strong>eta</strong>ra” iragazkia. Dat<strong>eta</strong>ko <strong>errore</strong>ak automatikoki detektatu<br />

<strong>eta</strong> etik<strong>eta</strong>tu ondoren (ohikoa da data berean <strong>errore</strong> bat baino gehiago<br />

topatzea), zuzenk<strong>eta</strong>-prozesuari ekingo diogu. Zuzenk<strong>eta</strong>rako, (Otaegi,<br />

2006) lanean sortutako transduktore multzoko azpimultzo bat erabiliko<br />

dugu. Lan horr<strong>eta</strong>n, euskara-ikasleei laguntza ematen zaie, digitu-segidak<br />

idatzita, dagozkien datak, orduak <strong>eta</strong> zenbakiak hizkiak<br />

erabiliz idatzita emanez 7 . Daten sorkuntzarako transduktore multzoa<br />

soilik erabili dugu data zuzenak sortzeko. Zenbaki<strong>eta</strong>ra iragazkiak “urte/hilabete/egun”<br />

moduko digituzko adierazpenak lortzen ditu gutxienez<br />

<strong>errore</strong> batekin markatutako dat<strong>eta</strong>tik abiatuta. Dataren aurretik<br />

komaz jarraitutako leku-izen berezi bat balego, puntu hon<strong>eta</strong>n leku-<br />

-izenaren lema <strong>eta</strong> komaren kokalekua adieraziko lukeen LIB etik<strong>eta</strong><br />

genituzke (ikus V.2 irudian “4” etik<strong>eta</strong>).<br />

4. Daten sorkuntzarako egoera finituko transduktoreak. Aurretik aipatu<br />

5 Analisiko laburtzapenek honako esanahia dute: Kategoria gramatikalak: ize = izena;<br />

Azpikategoria gramatikalak: zki = zenbakia, arr = arrunta; Kasuak: gel = lekuzko<br />

genitiboa, gen = genitiboa; Numeroa: s= singularra; Mugatasuna: m = mugatua.<br />

6 Informazio morfosintaktikoari honako etik<strong>eta</strong>k gehitu dizkiogu XFSTz definitutako<br />

adierazpen erregularren diseinua errazteko: hh (hitz-hasiera), hb (hitz-bukaera), lh (lematizazio-analisiaren<br />

hasiera) <strong>eta</strong> lb (lematizazio-analisiaren amaiera).<br />

7 http://kantauri.eleka.net/neh <strong>eta</strong> http://sisx04.si.ehu.es/∼iniebla001/idazlagun/

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!