Azaleko sintaxiaren tratamendua ikasketa automatikoko tekniken ...
Azaleko sintaxiaren tratamendua ikasketa automatikoko tekniken ...
Azaleko sintaxiaren tratamendua ikasketa automatikoko tekniken ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Ikasketa automatikoa HPan 15<br />
ziren: desanbiguazio lexikorako edo morfosintaktikorako, egiturazko desanbiguaziorako<br />
(esaldiaren baitako erlazioen ebazpena), azaleko analisi sintaktikorako,<br />
informazioaren eskuratzerako, laburpenen sorkuntza automatikorako,<br />
itzulpen automatikorako. . .<br />
Ezagutza linguistikoa eskuratzeko teknikak, hasiera batean, estatistikan<br />
oinarritu ziren, baina urteen poderioz, <strong>ikasketa</strong> <strong>automatikoko</strong> (ML 1 ) teknikak<br />
nagusitu dira. Dena dela, estatistikan eta <strong>ikasketa</strong> automatikoan oinarritutakoak<br />
bereiztea ez da batere erraza. Izan ere, <strong>ikasketa</strong> <strong>automatikoko</strong> teknikak,<br />
oro har, estatistikaz baliatzen dira. Bi <strong>tekniken</strong> arteko muga lausoa dela esan<br />
daiteke.<br />
Estatistikaz lagundutako teknikak eta <strong>ikasketa</strong> <strong>automatikoko</strong>ak —biak<br />
ala biak— tratatzen dituzten problemak desanbiguazioko atazak izaten dira<br />
normalean. Beraz, egin beharrekoa zera izaten da, laburbilduz: interpretazio<br />
anitzen artean, testuinguru horretarako zuzena dena aukeratzea (Màrquez,<br />
2002). Kontuan hartu behar da desanbiguazio-arazoak daudela HPko maila<br />
guzti-guztietan (maila lexikoan, sintaktikoan, semantikoan eta pragmatikoan).<br />
Ikasketa automatikoan algoritmo anitz aplikatu izan dira: batetik, <strong>ikasketa</strong><br />
sinbolikoko algoritmo klasikoak 2 (erabaki-zuhaitzak, erregelen indukzioa,<br />
adibideetan oinarritutako <strong>ikasketa</strong>. . . ); bestetik, metodo azpisinbolikoak<br />
(neurona-sareak, algoritmo genetikoak, support vector machines. . . );<br />
hauetaz gain, <strong>ikasketa</strong> estokastikoa ere erabili izan da, eta <strong>ikasketa</strong> ez-gainbegiratua<br />
ere bai (clustering 3 delakoa, esaterako).<br />
Ikasketa automatikoaren funtsa ataza jakin batzuk betetzeko ezagutza<br />
eskuratzean datza, betiere ezagutza hori modu —gehiago edo gutxiago— inplizituan<br />
adierazia dakarten datu batzuk baliatuz; hau da, adibide batzuk<br />
baliatzen dira kontzeptu bat ikasteko, domeinu bereko beste adibide batzuetan<br />
kontzeptu berari buruzko iragarpena egiteko (Màrquez, 2002).<br />
1 Machine Learning.<br />
2 Ez nahastu hizkuntzaren ezagutzan oinarritutako hurbilpenekin; teknika sinbolikoak<br />
deitzen zaie horiei ere. Ikasketa sinbolikoko algoritmoak, ordea, <strong>ikasketa</strong> automatikoaren<br />
familiakoak izanik, bigarren hurbilpenean kokatzen dira: corpusean oinarritutako <strong>tekniken</strong><br />
artean, hain zuzen. Sinbolikoak direla esaten da, hizkuntza-ezagutzan oinarritutako<br />
hurbilpenen moduan, eskuratzen den ezagutza gizaki batek ulertzeko modukoa delako<br />
(aurrerago ikusiko dugun moduan).<br />
3 Clustering teknika: <strong>ikasketa</strong> ez-gainbegiratua egiteko teknika bat da. Ikasketa-corpuseko<br />
instantziak sailkatu gabe ditugunean —euren klasea ezagutzen ez dugunean, alegia—,<br />
instantzia horiek euren arteko zenbait antzekotasunen arabera bil daitezke; horietako multzo<br />
bakoitza klase bat edo cluster bat dela esaten da.