Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

More documents

Recommendations

Info

14 Gramatika-zuzentzaileak eta OLHIA sistemak (84) Burua * mendekoa := pisuen zerrenda Adib.: subc * det := -32 5 subc * adjq := -16, -15 Pisuak mendekoak buruaren azpian duen posizioa adierazten du, non pisu negatibo batek ezkerraldean kokatzen dela adierazi nahi duen eta pisu positiboak, eskuineko aldean. Formalismoa sinplea da baina ez du aipatutako posizioaz gain testuinguruaren inguruko inolako kontrolik ahalbidetzen. Erregela hauek zuhaitz baten eraketa ahalbidetzen dute baina adierazpen-muga handiak dituzte. Muga hauek direla eta, koherentziarik gabeko zuhaitz-egitura franko sortzen dira. Arazo hau konpontzeko, kategoria lexiko bakoitzeko, zein zuhaitz-egitura diren posibleak zehazten duten konfigurazioak gehitu dira. Esaldi bati dagozkion mendekotasun-egiturak lortu ondoren, sintaxi-egiaztatzailearen lana hasten da. Sintaxi-egiaztapenerako moduluak bi egitura erabiltzen ditu: esaldi batekin lotutako mendekotasun-zuhaitza eta sintaxia egiaztatzeko erregelak. Sintaxia egiaztatzeko erregelak PROLOG moduko erregela multzoak dira eta beraien helburua, mendekotasun- -zuhaitzean bi adabegiren arteko lotura bat onartzea da bi emaitza sortuaz: informazio lexiko-semantikoa eta komunztadura-errorerik ote duen adierazten duen adierazle bat. Sortutako informazio berriarekin buru-mendeko parerako, adabegi bakarra sortzen da. Adierazleak errorea dagoela adierazten badu, egiaztatzaileak hitza eta informazio morfologikoa zuzenketa moduluari pasatzen dizkio eta honek dagozkion forma zuzenak sortzen ditu PILAFen sorkuntza morfologikorako modulua erabiliaz. Hau egitean, erabiltzaileak proposamen zuzenetako bat onartzen badu, hitz okerra bere zuzenketarekin ordezten da sintaxi-zuhaitzean, ez da berriro analisirik egiten eta egiaztapenarekin, jarraitzen da. Ez dute sistemaren ebaluaziorik egiten. • CLAWS (Constituent Likelihood Automatic Word-tagging System), estatistika oinarri duen analizatzaile morfologikoa da. Ez du analisi osoa egiten, Markov-en eredu ezkutua erabiltzen du hitz bati etiketa-klase bat esleitzeko. Atwell-ek (1987), etiketatzailea alda daitekeela dio, gramatika-erroreak detektatu ahal izateko. Sistemak erabilitako teknika 5 Mendekoa den determinatzailea subjektuaren ezkerraldean.
A.1 Gramatika-zuzentzaileak 15 III.2.2.1 atalean azaldu dugu. Sistemak errore dezente omen du baina abiaduraz azkarra omen da, eta ezer baino hobea, egilearen arabera. • Funtsean aurrekoaren ideia bera jarraitzen duen baina informazio linguistikoa gehitzen duen sistema hibrido baten berri ematen dute Bigert eta Knutsson-ek (2002). Egileek hitz zuzen erabilera nahasketak eta hitz-konposatuen banaketa okerraren ondorioz sortutako erroreak detektatzen dituzte. Lan honetan ideia nagusia honakoa da: etiketa morfosintaktiko sekuentzia arraroak errorea izan daitezkeela suposatzen dute. n-gramaren maiztasun txikiaren arrazoietako bat datu-urritasuna izan daiteke. Beraz, etiketa maiztasun handiagoko batekin ordezten da eta berriro kalkulatzen da n-gramaren maiztasuna. Hau oraindik txikia bada, errore bat detektatu da. Markov-en eredu ezkutua erabiltzen duen analizatzaile bat erabili dute n-gramak ikasteko eta corpusa morfologia-mailan analizatu eta desanbiguatu dute. Informazio hau soilik jaso duen metodo ez-gainbegiratu bat erabili dutenean, erroreen detekzio-maila ona lortu dute, baina alarma faltsu kopuru handia. Sintagmei buruzko informazioa gehitu diotenean, alarma faltsuen kopurua asko jaitsi da. Sintagmak identifikatzeko, erregeletan oinarritutako sistema bat erabili dute. Ezagutza linguistikoa gehitzeak onura izugarria suposatu du errore detekzioaren doitasunari dagokionez. Ez dute erroreak detektatzeko atazari buruzko ebaluazio-emaitzarik ematen. • Aurreko puntuan azaldutako lanaren antzekoa egiten du Sjöbergh- -ek (2005) unitate moduan osagai sintaktiko sinpleak (izen-sintagmak, aditz-kateak. . .) erabiliaz. Testu berri bat zatitzaile batekin analizatzen du eta hori zuzenak diren zatiekin konparatu. Zati-sekuentzia arraroak errore kontsideratzen dira. Zati mota desberdinak gutxi direnez eta testu zuzenetan agertzen direnez, datu urritasunaren arazoa txikiagoa da, baita alarma faltsuena ere. Alarma faltsu gutxi detektatzearekin batera, errore gutxi detektatzen dira. Hauen artean, koma toki okerrean ipintzea edo ez ipintzea, erroreak hitzen ordenan, hitz zuzenen nahasketak e.a. daude. Teknika hau oso merkea omen da, etiketatu gabeko corpusa eta zatitzaile bat edukitzea nahikoa baita. Aurkeztutako lanean emaitzak ez dira argi azaltzen. • Estatistika oinarri hartuta, hiztegi zehatz baten erabilera ez-egokia detektatzen dute Chodorow eta Leacock-ek (2000). Horretarako, Test of English as a Foreign Language, (TOEFL)-eko idazlanak jasotzen dituzte eta ALEK (Assessing Lexical Knowledge) izeneko sistema esta-
Page 1 and 2:
Jakintza-arloa: Informatika Euskara
Page 3:
Lengoaia eta Sistema Informatikoak
Page 7:
Etxekoei, bereziki amari eta aitari
Page 10 and 11:
• A las “Euskericas” (Ainhoa,
Page 13:
“utopia zeruertzean dago; bi urra
Page 16 and 17:
ii GAIEN AURKIBIDEA II.5 Ebaluazioa
Page 18 and 19:
iv GAIEN AURKIBIDEA VI.2.2.4 Itzulp
Page 20 and 21:
vi GAIEN AURKIBIDEA
Page 22 and 23:
viii ALGORITMOEN ZERRENDA
Page 24 and 25:
x IRUDIEN ZERRENDA VI.2 Saroiren es
Page 26 and 27:
xii IRUDIEN ZERRENDA
Page 28 and 29:
xiv TAULEN ZERRENDA V.12 Aukeratuta
Page 30 and 31:
xvi TAULEN ZERRENDA E.4 Komunztadur
Page 33 and 34:
Proiektuaren nondik norakoak I.1 Sa
Page 35 and 36:
I.1 Sarrera 5 arauen zehaztapenean
Page 37 and 38:
I.2 Lanaren kokapena 7 berezitasune
Page 39 and 40:
I.2 Lanaren kokapena 9 I.2.2 IXA ta
Page 41 and 42:
I.3 Aurkezpen orokorra eta helburua
Page 43 and 44:
I.4 Tesi-txostenaren eskema eta arg
Page 45 and 46:
Page 47 and 48:
Page 49:
ERROREEN DETEKZIO ETA ZUZENKETA AUT
Page 52 and 53:
22 Erroreak, corpusak, sailkapena e
Page 54 and 55:
Page 56 and 57:
Page 58 and 59:
Page 60 and 61:
Page 62 and 63:
Page 64 and 65:
Page 66 and 67:
Page 68 and 69:
Page 70 and 71:
Page 72 and 73:
Page 74 and 75:
Page 76 and 77:
Page 78 and 79:
Page 80 and 81:
50 Erroreak detektatzeko eta zuzent
Page 82 and 83:
Page 84 and 85:
Page 86 and 87:
Page 88 and 89:
Page 90 and 91:
Page 92 and 93:
Page 94 and 95:
Page 96 and 97:
Page 98 and 99:
Page 100 and 101:
Page 102 and 103:
Page 104 and 105:
Page 106 and 107:
Page 108 and 109:
Page 110 and 111:
Page 112 and 113:
82 Hizkuntzaren analisia eta errepr
Page 114 and 115:
Page 116 and 117:
Page 118 and 119:
Page 120 and 121:
Page 122 and 123:
Page 124 and 125:
Page 126 and 127:
Page 128 and 129:
Page 130 and 131:
100 Hizkuntzaren analisia eta errep
Page 132 and 133:
Page 134 and 135:
Page 137 and 138:
V. KAPITULUA Patroien erabilera dat
Page 139 and 140:
V.2 Transduktoreak eta datak 109 Ga
Page 141 and 142:
V.2 Transduktoreak eta datak 111
Page 143 and 144:
V.2 Transduktoreak eta datak 113 el
Page 145 and 146:
V.2 Transduktoreak eta datak 115 V.
Page 147 and 148:
V.2 Transduktoreak eta datak 117 V.
Page 149 and 150:
V.2 Transduktoreak eta datak 119 1.
Page 151 and 152:
V.2 Transduktoreak eta datak 121 Zu
Page 153 and 154:
V.2 Transduktoreak eta datak 123 ez
Page 155 and 156:
V.3 Murriztapen Gramatika eta postp
Page 157 and 158:
Page 159 and 160:
Page 161 and 162:
Page 163 and 164:
Page 165 and 166:
Page 167 and 168:
Page 169 and 170:
Page 171 and 172:
Page 173 and 174:
Page 175 and 176:
Page 177 and 178:
Page 179 and 180:
Page 181 and 182:
Page 183 and 184:
Page 185 and 186:
Page 187 and 188:
Page 189 and 190:
Page 191 and 192:
V.4 Laburpena eta ondorioak 161 Dat
Page 193 and 194:
V.4 Laburpena eta ondorioak 163 XFS
Page 195:
TESTUINGURU ZABALEKO ERROREEN DETEK
Page 198 and 199:
168 Saroi tasun-zuhaitzetan informa
Page 200 and 201:
170 Saroi • Emaitzen aurkezpenera
Page 202 and 203:
172 Saroi VI.2 Irudia: Saroiren esk
Page 204 and 205:
174 Saroi formations) moduko lengoa
Page 206 and 207:
176 Saroi berarentzat hainbat funtz
Page 208 and 209:
178 Saroi - -
Page 210 and 211:
180 Saroi 3. Kontzeptuen nahasketa.
Page 212 and 213:
182 Saroi tzaileen eta lengoaia “
Page 214 and 215:
184 Saroi dep.xml deplnk.xml Mendek
Page 216 and 217:
186 Saroi Gure adibidean, nuklearra
Page 218 and 219:
188 Saroi Algoritmoa 1 Permutazioak
Page 220 and 221:
190 Saroi 2002). Lengoaiak hainbat
Page 222 and 223:
192 Saroi Tarteko maila Goimaila Be
Page 224 and 225:
194 Saroi egiturazko ordena, hitzen
Page 226 and 227:
196 Saroi DepFuntzio -tag:{ncsubj,
Page 228 and 229:
198 Saroi zeintzuk diren eta zein m
Page 230 and 231:
200 Saroi siak dakarren informazio
Page 232 and 233:
202 Saroi 1. 1. Kontsultaren emaitz
Page 234 and 235:
204 Saroi Nabigazio horizontalerako
Page 236 and 237:
206 Saroi Abstrakzioa Kontsultak eg
Page 238 and 239:
208 Saroi Nabigazio horizontala Iz
Page 240 and 241:
210 Saroi VI.2.2.3 Erregelak. Deskr
Page 242 and 243:
212 Saroi zentral ncmod nuklearrak
Page 244 and 245:
214 Saroi tapena, erlazioak, noranz
Page 246 and 247:
216 Saroi MultzoLista 1 Multzo 1 1
Page 248 and 249:
218 Saroi Detekziorako osagaien non
Page 250 and 251:
220 Saroi Estrategia -erregelakZuha
Page 252 and 253:
222 Saroi Eskaera horiek aurrera er
Page 254 and 255:
224 Saroi bidez, zuhaitzak ez diren
Page 256 and 257:
226 Saroi tuz edo gehituz. ..Bistar
Page 258 and 259:
228 Saroi VI.3 Laburpena eta ondori
Page 260 and 261:
230 Saroi eta komunztadura-erroreak
Page 262 and 263:
Page 264 and 265:
Page 266 and 267:
Page 268 and 269:
Page 270 and 271:
Page 272 and 273:
Page 274 and 275:
Page 276 and 277:
Page 278 and 279:
Page 280 and 281:
Page 282 and 283:
Page 284 and 285:
Page 286 and 287:
Page 288 and 289:
Page 290 and 291:
Page 292 and 293:
Page 294 and 295:
Page 296 and 297:
Page 298 and 299:
Page 300 and 301:
Page 302 and 303:
Page 304 and 305:
Page 306 and 307:
Page 308 and 309:
Page 310 and 311:
Page 312 and 313:
Page 314 and 315:
Page 316 and 317:
Page 318 and 319:
Page 320 and 321:
Page 322 and 323:
Page 324 and 325:
Page 326 and 327:
Page 328 and 329:
Page 331 and 332:
Ondorioak eta etorkizuneko lanak VI
Page 333 and 334:
VIII.1 Ondorio nagusiak 303 • Ana
Page 335 and 336:
VIII.1 Ondorio nagusiak 305 Testuin
Page 337 and 338: VIII.2 Ekarpenak 307 eta alarma fal
Page 339 and 340: VIII.2 Ekarpenak 309 fologia, morfo
Page 341 and 342: VIII.3 Etorkizuneko lanak 311 benet
Page 343 and 344: VIII.3 Etorkizuneko lanak 313 erauz
Page 345 and 346: VIII.3 Etorkizuneko lanak 315 zuhai
Page 347 and 348: Bibliografia Abeillé A. Introducti
Page 349 and 350: BIBLIOGRAFIA 319 Agirre E. Kontzept
Page 351 and 352: BIBLIOGRAFIA 321 Alegria I. Euskal
Page 353 and 354: BIBLIOGRAFIA 323 tional Conference
Page 355 and 356: BIBLIOGRAFIA 325 Bouma G. eta Kloos
Page 357 and 358: BIBLIOGRAFIA 327 Clark J. eta DeRos
Page 359 and 360: BIBLIOGRAFIA 329 Díaz de Ilarraza
Page 361 and 362: BIBLIOGRAFIA 331 dependency formali
Page 363 and 364: BIBLIOGRAFIA 333 Izumi E., Uchimoto
Page 365 and 366: BIBLIOGRAFIA 335 Levison M., Lessar
Page 367 and 368: BIBLIOGRAFIA 337 Naber D. A Rule-Ba
Page 369 and 370: BIBLIOGRAFIA 339 CALL applications.
Page 371 and 372: BIBLIOGRAFIA 341 Tesnière L. Élé
Page 373: Lengoaia eta Sistema Informatikoak
Page 376 and 377: 2 Gramatika-zuzentzaileak eta OLHIA
Page 384 and 385: 10 Gramatika-zuzentzaileak eta OLHI
Page 400 and 401: 26 Saroi. Klase-diagramak mak eraku
Page 402 and 403: 1 F 28 Saroi. Klase-diagramak FVL 1
Page 404 and 405: 30 Saroi. Klase-diagramak AditzErab
Page 406 and 407: 32 Saroi. Klase-diagramak
Page 408 and 409: 34 Saroiren erregelen itzulpena Osa
Page 410 and 411: 36 Saroiren erregelen itzulpena Sar
Page 412 and 413: 38 Saroiren erregelen itzulpena Mul
Page 414 and 415: 40 Saroiren erregelen itzulpena Mul
Page 416 and 417: 42 Saroiren erregelen itzulpena Det
Page 418 and 419: 44 Saroiren erregelen itzulpena |Zb
Page 420 and 421: 46 Saroiren erregelen itzulpena {ko
Page 422 and 423: 48 Saroiren erregelen itzulpena
Page 424 and 425: 50 Saroi. Document Type Definition
Page 426 and 427: 52 Saroi. Document Type Definition
Page 428 and 429: 54 Saroi. Komunztadura-erroreen det
Page 438 and 439:
64 Saroi. Komunztadura-erroreen det
Page 440 and 441:
Page 442 and 443:
Page 444 and 445:
show all

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko ...

Create successful ePaper yourself

Delete template?

Save as template?