26.08.2013 Views

Azaleko sintaxiaren tratamendua ikasketa automatikoko tekniken ...

Azaleko sintaxiaren tratamendua ikasketa automatikoko tekniken ...

Azaleko sintaxiaren tratamendua ikasketa automatikoko tekniken ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Ikasketa automatikoa HPan 19<br />

Ikasketa <strong>automatikoko</strong> eskema gehienetan, ez zaie garrantzi handirik<br />

ematen falta diren balioei: ezezagunak dira, eta kito. Baina arrazoi on<br />

bat egon daiteke balioa falta izatearen atzean. Hauen azterketa egitea<br />

komeni izaten da, behar bezala kodetzeko, mota desberdinetako falta<br />

diren balioak era desberdinean adieraziz. Izan ere, ez da gauza bera<br />

falta den balio bat falta izatea ezezaguna delako, edo mediku batek,<br />

adibidez, atributu horri balioa ematen dion proba ez egitea erabaki<br />

duelako (ez dela esanguratsua uste duelako). Aztergai den problemaren<br />

domeinuko adituak kontsultatzea komeni da kasu hauek ebazteko<br />

(Witten eta Frank, 2005).<br />

• Estimazio-arazoak: datuen sakabanaketa eta leuntzearen beharra.<br />

– Datuen sakabanaketa edo corpus sparseness: ondorio estatistikoak<br />

ateratzeko, corpusean datuak sakabanatuegi daudenean gertatzen<br />

da. Beste modu batean esanda, normalean, gertaera batzuk corpusean<br />

oso gutxitan edo inoiz ez dira agertzen, eta, beraz, gertaera<br />

horiei buruz ezin da ondorio garbirik atera (Màrquez, 2002).<br />

– Leuntzea edo smoothing-aren beharra: Ikasketa-corpusean inoiz<br />

gertatu ez diren kasuak izan daitezke test-corpusean. Ikasketa-corpusa<br />

txikia den kasuetan ematen da arazo hau, batez ere. Halakoetan,<br />

probabilitateekin gabiltzanez, teknika desberdinak daude<br />

inoiz gertatzen ez diren kasuei zero ez den probabilitate txiki-txiki<br />

bat emateko. Leuntzea (smoothing) deitzen zaio prozesu honi.<br />

• Ikasketa inkrementalaren edo on-line <strong>ikasketa</strong>ren beharra:<br />

Problema batzuetan beharrezkoa da <strong>ikasketa</strong> <strong>automatikoko</strong> eskema batek<br />

instantzia bati esleitu dion etiketa kontuan hartzea hurrengo instantzian;<br />

alegia, batzuetan, instantzia baten kontzeptu bat ikasteko, komenigarria<br />

izaten da emaitza-atributuan bere aurreko instantziek duten<br />

balioa jakitea. Horretarako, <strong>ikasketa</strong> inkrementala erabiltzen da. Hala,<br />

instantzia bati emaitza-atributuan esleitzen zaion balioa hurrengo<br />

instantziari jakinarazten zaio, horretarako aurreikusitako atributuari<br />

balio hori emanez.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!