26.08.2013 Views

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

50 Erroreak <strong>detektatzeko</strong> <strong>eta</strong> <strong>zuzentzeko</strong> teknikak<br />

egoera-makinak, erregela-sistema formalak, analisi logikoa, probabilitatearen<br />

teoria <strong>eta</strong> ikask<strong>eta</strong> automatikoan oinarritutako erremintak dira.<br />

Egoera-makinak <strong>eta</strong> erregela-sistema formalak fonologiako, morfologiako<br />

<strong>eta</strong> sintaxiko ezagutza lantzeko tresna nagusiak dira. Sintaxian duten<br />

erabilera III.2.1.2 atalean aztertuko dugu.<br />

Semantika, pragmatika <strong>eta</strong> diskurtsoarekin lan egitean erabiltzen den<br />

eredu formala analisi logikoa da normalean, baina eremu hauek gure helburu<strong>eta</strong>tik<br />

kanpo geratzen dira.<br />

Probabilitatea da aitatu dugun azken eredu formala. Probabilitatearen<br />

erabilera nagusia anbiguotasun-arazoak ebaztea da <strong>eta</strong> LNPko arazo gehienak<br />

“sarrera (input ingelesez) anbiguo batentzako N aukera emanda, probabilitate<br />

handienekoa aukeratu” moduan definitu daitezkeenez, oso erabilia<br />

da. Ikask<strong>eta</strong> automatikoarekin oso lotuta dago probabilitatea. Bi eredu hauek<br />

III.2.2 atalean aztertuko ditugu.<br />

Tekniken eredu formalak aztertu ondoren, oinarrian erabiltzen duten informazio<br />

mota irizpide hartuta, honako sailkapena egin dugu:<br />

1. Hizkuntza-ezagutzan oinarritutako teknikak.<br />

2. Corpus<strong>eta</strong>n oinarritutako teknikak.<br />

Hizkuntza-ezagutzan oinarritutako teknikek, teknika sinboliko izena ere<br />

jasotzen dute. Metodo sinbolikoak honela definitzen dira (Dale, 2000) lanean:<br />

“symbolic methods —where knowledge about language is explicitly<br />

encoded in rules or other forms of representation— ”. Hau da, teknika sinboliko<strong>eta</strong>n<br />

hizkuntzari buruzko ezagutza erregel<strong>eta</strong>n edo beste adierazpide<strong>eta</strong>n<br />

kodetzen da modu esplizituan. Teknika sinbolikoak oso erabiliak izan dira<br />

azken 40 urte<strong>eta</strong>n, baina mundu errealeko arazoei aplikatzen zaizkienean<br />

hedagarritasunaren arazoa dute.<br />

Arazo honen aurrean, azken 10 edo 15 urteotan corpus<strong>eta</strong>n oinarritutako<br />

teknikek edo teknika enpirikoek hazkunde izugarria izan dute. Hori<strong>eta</strong>n,<br />

datu kopuru oso handiak erabiltzen dira (LNPren kasuan corpusak), <strong>eta</strong><br />

horiekin batera, estatistikaren inguruko prozedurak. Ezagutza testu<strong>eta</strong>tik<br />

automatikoki erauzi egiten da, erregel<strong>eta</strong>n eskuz kodetu beharrean.<br />

Gaur egun, giza-hizkuntzaren prozesamenduaren gakoa teknika sinboliko<br />

<strong>eta</strong> enpirikoen konbinazio egokian dagoela onartzen dute ikertzaile gehienek.<br />

III.1 taulan, hizkuntza-ezagutzan oinarritutako tekniken (sinbolikoak)<br />

<strong>eta</strong> corpus<strong>eta</strong>n oinarritutako tekniken (enpirikoak) arteko desberdintasun<br />

nagusienak adierazten saiatu gara:<br />

Metodo sinbolikoak erabiltzen dituzten teknikak hurrengo atalean aztertuko<br />

ditugu (III.2.1). Enpirikoak, berriz, III.2.2 atalerako utzi ditugu.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!