26.08.2013 Views

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

A.1 Gramatika-zuzentzaileak 17<br />

ditu <strong>eta</strong> hauen kopurua jaisteak detektatutako <strong>errore</strong> kopurua ere jaistea<br />

suposatzen du. Azkenean, alarma faltsu kopuru onargarri bat lortzen<br />

denean, <strong>errore</strong>en % 65a detektatzen du.<br />

• Ingelesa bigarren hizkuntza moduan ikasten duten ikasle japoniarren<br />

ahozko etorria transkribatu ondoren, ikask<strong>eta</strong> automatikoa erabiltzen<br />

dute Izumi et al.-ek (2003) gramatikako <strong>eta</strong> lexikoko <strong>errore</strong>ak <strong>detektatzeko</strong>.<br />

Transkribatutako milioi hitzeko ikasle-corpusa, eskuz etik<strong>eta</strong>tu<br />

dute <strong>errore</strong> bakoitzerako gramatika-kategoria, gramatika-lexiko sistema<br />

<strong>eta</strong> forma zuzendua idatziz. Erroreak bi multzotan banatu dituzte<br />

egileek. Alde batetik, ez-egite <strong>errore</strong>ak daude zeintzu<strong>eta</strong>n beharrezko<br />

hitza falta den <strong>eta</strong> hori adierazten duen etik<strong>eta</strong> bat ipintzen den.<br />

Bestetik, berriz, ordezkatze-<strong>errore</strong>ak daude, <strong>eta</strong> hau<strong>eta</strong>n, hitz okerra<br />

etik<strong>eta</strong> batzuen artean txertatzen da zuzenk<strong>eta</strong>ren orduan bere forma<br />

zuzenarekin ordezteko.<br />

Ikask<strong>eta</strong> automatikorako, entropia handieneko eredua (Jaynes, 1957)<br />

erabili dute. Teknika hau, datuen banak<strong>eta</strong> probabilitatea estimatzeko<br />

erabiltzen da <strong>eta</strong> ezer ez denean ezaguna, datuen banak<strong>eta</strong>k ahalik<br />

<strong>eta</strong> uniformeena izan behar duela dio. Hau gertatzen denean, entropiaren<br />

balio maximoa lortzen da. Aipatutako artikuluan, ez-egite<br />

<strong>errore</strong>ekin <strong>eta</strong> ordezkatze-<strong>errore</strong><strong>eta</strong>ko bakoitzarekin bi metodo probatu<br />

dituzte. Sinplifikatzeko, lehenengoan, <strong>errore</strong>-kategoria bakoitzeko<br />

<strong>errore</strong>a gertatzen da, ez da gertatzen klase<strong>eta</strong>n sailkatzen dute. Bigarren<br />

metodoan, n <strong>errore</strong><strong>eta</strong>rako egiten dute proba <strong>eta</strong> gertatzeaz gain,<br />

<strong>errore</strong>a zein kategori<strong>eta</strong>koa den estimatzen saiatzen dira. Zuriuneak<br />

<strong>eta</strong> hitzak klase hau<strong>eta</strong>n sailkatzeko, sailkatzaileari ematen zaizkion<br />

testuinguru-ezaugarriak 23 dira. Hauen artean, aurreko <strong>eta</strong> ondorengo<br />

bi hitzak, hitzen konbinazioak <strong>eta</strong> ondorengo hitzaren lehen <strong>eta</strong> azken<br />

hizkiak daude. Teknika honekin, % 30eko estaldura lortzen dute<br />

<strong>eta</strong> % 50eko doitasuna. Corpusa esaldi zuzenekin <strong>eta</strong> era artifizialean<br />

sortutako <strong>errore</strong>ekin aberastuta, % 80eko doitasuna lortzen dute, estaldura<br />

mantenduaz.<br />

• Hitz zuzenen erabilera nahask<strong>eta</strong>k desanbiguazio-ataza moduan ikustea<br />

erraza denez, <strong>errore</strong> hauek <strong>detektatzeko</strong> ikask<strong>eta</strong> automatikoa <strong>eta</strong><br />

nahask<strong>eta</strong> multzoak erabiltzea ohikoa da. Nahask<strong>eta</strong> multzo<strong>eta</strong>n desanbiguazio<br />

lanak egiteko sailkatzaile Bayesiarrak <strong>eta</strong> erabakitze-zerrendak<br />

erabili zituen Golding-ek (1995) bere lanean. Geroago, Carlson<br />

et al.-en lanean (2001) SNoW sailkatzailea <strong>eta</strong> eguneraket<strong>eta</strong>rako<br />

Winnow erregela erabiltzen dituen ikask<strong>eta</strong> automatikoko teknika bat

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!