26.08.2013 Views

Azaleko sintaxiaren tratamendua ikasketa automatikoko tekniken ...

Azaleko sintaxiaren tratamendua ikasketa automatikoko tekniken ...

Azaleko sintaxiaren tratamendua ikasketa automatikoko tekniken ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Ikasketa automatikoa HPan 15<br />

ziren: desanbiguazio lexikorako edo morfosintaktikorako, egiturazko desanbiguaziorako<br />

(esaldiaren baitako erlazioen ebazpena), azaleko analisi sintaktikorako,<br />

informazioaren eskuratzerako, laburpenen sorkuntza automatikorako,<br />

itzulpen automatikorako. . .<br />

Ezagutza linguistikoa eskuratzeko teknikak, hasiera batean, estatistikan<br />

oinarritu ziren, baina urteen poderioz, <strong>ikasketa</strong> <strong>automatikoko</strong> (ML 1 ) teknikak<br />

nagusitu dira. Dena dela, estatistikan eta <strong>ikasketa</strong> automatikoan oinarritutakoak<br />

bereiztea ez da batere erraza. Izan ere, <strong>ikasketa</strong> <strong>automatikoko</strong> teknikak,<br />

oro har, estatistikaz baliatzen dira. Bi <strong>tekniken</strong> arteko muga lausoa dela esan<br />

daiteke.<br />

Estatistikaz lagundutako teknikak eta <strong>ikasketa</strong> <strong>automatikoko</strong>ak —biak<br />

ala biak— tratatzen dituzten problemak desanbiguazioko atazak izaten dira<br />

normalean. Beraz, egin beharrekoa zera izaten da, laburbilduz: interpretazio<br />

anitzen artean, testuinguru horretarako zuzena dena aukeratzea (Màrquez,<br />

2002). Kontuan hartu behar da desanbiguazio-arazoak daudela HPko maila<br />

guzti-guztietan (maila lexikoan, sintaktikoan, semantikoan eta pragmatikoan).<br />

Ikasketa automatikoan algoritmo anitz aplikatu izan dira: batetik, <strong>ikasketa</strong><br />

sinbolikoko algoritmo klasikoak 2 (erabaki-zuhaitzak, erregelen indukzioa,<br />

adibideetan oinarritutako <strong>ikasketa</strong>. . . ); bestetik, metodo azpisinbolikoak<br />

(neurona-sareak, algoritmo genetikoak, support vector machines. . . );<br />

hauetaz gain, <strong>ikasketa</strong> estokastikoa ere erabili izan da, eta <strong>ikasketa</strong> ez-gainbegiratua<br />

ere bai (clustering 3 delakoa, esaterako).<br />

Ikasketa automatikoaren funtsa ataza jakin batzuk betetzeko ezagutza<br />

eskuratzean datza, betiere ezagutza hori modu —gehiago edo gutxiago— inplizituan<br />

adierazia dakarten datu batzuk baliatuz; hau da, adibide batzuk<br />

baliatzen dira kontzeptu bat ikasteko, domeinu bereko beste adibide batzuetan<br />

kontzeptu berari buruzko iragarpena egiteko (Màrquez, 2002).<br />

1 Machine Learning.<br />

2 Ez nahastu hizkuntzaren ezagutzan oinarritutako hurbilpenekin; teknika sinbolikoak<br />

deitzen zaie horiei ere. Ikasketa sinbolikoko algoritmoak, ordea, <strong>ikasketa</strong> automatikoaren<br />

familiakoak izanik, bigarren hurbilpenean kokatzen dira: corpusean oinarritutako <strong>tekniken</strong><br />

artean, hain zuzen. Sinbolikoak direla esaten da, hizkuntza-ezagutzan oinarritutako<br />

hurbilpenen moduan, eskuratzen den ezagutza gizaki batek ulertzeko modukoa delako<br />

(aurrerago ikusiko dugun moduan).<br />

3 Clustering teknika: <strong>ikasketa</strong> ez-gainbegiratua egiteko teknika bat da. Ikasketa-corpuseko<br />

instantziak sailkatu gabe ditugunean —euren klasea ezagutzen ez dugunean, alegia—,<br />

instantzia horiek euren arteko zenbait antzekotasunen arabera bil daitezke; horietako multzo<br />

bakoitza klase bat edo cluster bat dela esaten da.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!