Análisis sintáctico conducido por un diccionario de patrones de ...

More documents

Recommendations

Info

Capítulo 1. Retrospectiva histórica de los formalismos gramaticales y algunas herramientas en lingüística computacional precedente, nada más. La estructura estadística se puede describir por un conjunto de probabilidades de transición P i (j), la probabilidad de que la letra i sea seguida de la letra j. Una forma equivalente de especificar esta estructura es con las probabilidades de bigrams o de la secuencia de dos caracteres P(i, j), la frecuencia relativa del bigram i,j. El siguiente paso en complejidad involucra frecuencias trigram. Para esto se requiere un conjunto de frecuencias trigram P(i, j, k) o probabilidades de transición P ij (k). Por ejemplo, los trigram encontrados por [Pratt, 42] para el inglés son: THE, ING, ENT, ION. Arriba de este nivel, se topa uno con la ley de regresos disminuidos y muy grandes, matrices de transición muy poco densas. Los procesos estocásticos del tipo descrito se conocen como procesos discretos de Markov. La teoría de estos procesos fue desarrollada por [Markov, 16]. En un modelo de Markov, cada estado exitoso depende solamente del estado presente, así que una cadena de Markov es la primera generalización posible, alejada de una secuencia independiente de experimentos. Un proceso complejo de Markov es uno donde la dependencia entre estados se extiende más adelante, a una cadena precedente al estado actual. Por ejemplo, cada estado exitoso puede depender de los dos estados previos. Una fuente de Markov para la cual la selección del estado depende de los n estados precedentes da una aproximación de orden (n+1)-iésimo al lenguaje del cual las probabilidades de transición fueron delineadas y se denota como un modelo de Markov de orden n-iésimo. Si cada estado exitoso depende de los dos estados previos, tenemos un modelo de Markov de segundo orden, produciendo una aproximación de tercer orden al lenguaje. Shannon describió los procesos ergódicos de Markov como procesos en los cuales cada secuencia producida de suficiente longitud tiene las mismas propiedades estáticas que las frecuencias de letras y frecuencias de bigrams. En estos modelos cada estado del modelo puede alcanzarse desde cualquier otro estado en un número finito de pasos. El lenguaje natural es un ejemplo de un proceso ergódico de Markov. Un modelo oculto de Markov (en inglés, Hidden Markov Model, HMM) es un proceso doblemente estocástico que consiste de: (a) un proceso estocástico subyacente que no puede observarse, y (b) un proceso estocástico cuyos símbolos de salida pueden observarse, representados por las probabilidades de salida del sistema. Los componentes esenciales de este modelo pueden resumirse en: el conjunto completo de probabilidades de transiciones, el conjunto completo de probabilidades de salida, y su estado inicial. Básicamente, un modelo HMM es un autómata finito en el cuál las transiciones entre estados tienen probabilidades y cuya salida también es probabilística. [Sharman, 89] establece que cuando estos modelos se aplican prácticamente, deben solucionarse tres problemas importantes: evaluación, estimación y entrenamiento. El problema de evaluación es calcular la probabilidad de que una secuencia de 112
Métodos estadísticos: una herramienta para búsqueda de regularidades símbolos observada ocurra como resultado de un modelo dado. En el problema de estimación se observa una secuencia de símbolos producidos por el modelo HMM. La tarea es estimar la secuencia más probable de estados que el modelo realiza para producir esa secuencia de símbolos. Durante el entrenamiento, los parámetros iniciales del modelo se ajustan para maximizar la probabilidad de una secuencia observada de símbolos. Esto permitirá que el modelo prediga secuencias futuras de símbolos. La solución a la ecuación de la probabilidad de que sea la marca t1 dada la marca previa t0 dada la probabilidad de que la palabra1 tenga la marca t1 tiene al menos dos algoritmos conocidos: Viterbi y backward-forward. Este modelo ha sido muy empleado en reconocimiento de voz, un tutorial extenso en este tema se encuentra en [Rabiner, 89]. Técnicas estadísticas basadas en HMM están bien establecidas [Holmes, 88] para esa área. En el área de análisis sintáctico, [Collins, 99] usó bigrams, es decir, probabilidades de dependencias entre pares de palabras, como estadísticas para mejorar el análisis sintáctico, emplea el núcleo-h del constituyente asociado a otro núcleo-h dependiente. En las llamadas gramáticas de Markov [Charniak, 97] se almacenan las probabilidades que permiten inventar reglas de improviso. Por ejemplo, al inventar reglas de NP se debe conocer la probabilidad de que un NP empiece con un determinante (una probabilidad alta) o con una preposición (una probabilidad baja). Similarmente, al estar creando una frase nominal y con una entrada de determinante se debe saber cual es la probabilidad de que el siguiente constituyente sea un adjetivo (una probabilidad alta) u otro determinante (una probabilidad baja). Sin embrago, estas estadísticas se obtienen de los llamados bancos de árboles (tree-bank, en inglés), es decir, corpus analizados y marcados sintácticamente cuya labor manual es intensiva en extremo. También hay que considerar que tienen errores y son limitados. INFORMACIÓN MUTUA ENTRE PALABRAS DE UNA SECUENCIA A continuación se describe la llamada información mutua en el contexto establecido de la teoría de la información. Considerando h e i como los eventos que ocurren dentro de secuencias de eventos, en un contexto lingüístico, h podría ser una palabra de entrada a un canal ruidoso mientras que i es una palabra de salida del canal. h e i deben ser miembros de la misma secuencia. Por ejemplo, dos palabras que ocurren en una colocación idiomática. [Sharman, 89] describe cómo la información mutua, denotada I(h, i) muestra qué información se provee del evento h por la ocurrencia de i. P(h | i) es la probabilidad del evento h habiendo ocurrido cuando se sabe que el evento i ha ocurrido, llamada la probabilidad a posteriori; y P(h) es la probabilidad del evento h habiendo ocurrido cuando no se sabe si i ha ocurrido, llamada la probabilidad a priori. La relación entre la probabilidad a posteriori de h y la probabilidad a priori de 113
Page 1:
B Instituto Politécnico Nacional C
Page 4 and 5:
ABSTRACT Syntactic analysis of Span
Page 6 and 7:
VISTA GENERAL DE LA TESIS ABSTRACT
Page 8 and 9:
2.9 Ejemplos de complicaciones de p
Page 10 and 11:
LISTA DE FIGURAS Figura 1. Estructu
Page 12 and 13:
Introducción MOTIVACIÓN Y RELEVAN
Page 14 and 15:
Introducción En los últimos 50 a
Page 16 and 17:
Introducción ÁMBITO Lenguaje natu
Page 18 and 19:
Introducción decir, se requieren f
Page 20 and 21:
Introducción En la perspectiva de
Page 22 and 23:
Introducción significado de la otr
Page 24 and 25:
Introducción diferenciar el signif
Page 26 and 27:
Introducción OBJETIVO Esta tesis p
Page 28 and 29:
Introducción Compilación del dicc
Page 30 and 31:
Introducción Presentamos primero l
Page 32 and 33:
Capítulo 1. Retrospectiva históri
Page 34 and 35:
Page 36 and 37:
Page 38 and 39:
Page 40 and 41:
Page 42 and 43:
Page 44 and 45:
Page 46 and 47:
Page 48 and 49:
Page 50 and 51:
Page 52 and 53:
Page 54 and 55:
Page 56 and 57:
Page 58 and 59:
Page 60 and 61:
Page 62 and 63: Capítulo 1. Retrospectiva históri
Page 122 and 123: En este capítulo presentamos la ca
Page 124 and 125: Capítulo 2. Compilación del dicci
Page 162 and 163:
Capítulo 2. Compilación del dicci
Page 164 and 165:
Page 166 and 167:
Page 168 and 169:
Page 170 and 171:
Page 172 and 173:
Page 174 and 175:
En este capítulo presentamos el mo
Page 176 and 177:
Capítulo 3. avanzados Análisis si
Page 178 and 179:
Page 180 and 181:
Page 182 and 183:
Page 184 and 185:
Page 186 and 187:
Page 188 and 189:
Page 190 and 191:
Page 192 and 193:
Page 194 and 195:
Page 196 and 197:
Page 198 and 199:
Page 200 and 201:
Page 202 and 203:
Page 204 and 205:
Page 206 and 207:
Page 208 and 209:
Page 210 and 211:
Page 212 and 213:
Page 214 and 215:
Page 216 and 217:
Page 218 and 219:
Page 220 and 221:
Page 222 and 223:
Page 224 and 225:
Page 226 and 227:
Page 228 and 229:
Page 230 and 231:
Page 232 and 233:
Page 234 and 235:
Page 236 and 237:
CAPÍTULO 4. COLECCIÓN DE ESTADÍS
Page 238 and 239:
Capítulo 4. Colección de estadís
Page 240 and 241:
Page 242 and 243:
Page 244 and 245:
Page 246 and 247:
Page 248 and 249:
Page 250 and 251:
Page 252 and 253:
Page 254 and 255:
Page 256 and 257:
Page 258 and 259:
Page 260 and 261:
Page 262 and 263:
Page 264 and 265:
Page 266 and 267:
Page 268 and 269:
Page 270 and 271:
Page 272 and 273:
Page 274 and 275:
Page 276 and 277:
Page 278 and 279:
Page 280 and 281:
Page 282 and 283:
Page 284 and 285:
Page 286 and 287:
Page 288 and 289:
Page 290 and 291:
Page 292 and 293:
292 CONCLUSIONES
Page 294 and 295:
Conclusiones dirigida por el núcle
Page 296 and 297:
Conclusiones y a características e
Page 298 and 299:
Conclusiones La cantidad de datos d
Page 300 and 301:
Glosario Constituyente: elemento li
Page 302 and 303:
VOCABULARIO BILINGÜE DE TÉRMINOS
Page 304 and 305:
Vocabulario bilingüe de términos
Page 306 and 307:
actuante...........................
Page 308 and 309:
LISTA DE PUBLICACIONES DE LA TESIST
Page 310 and 311:
Lista de publicaciones de la tesist
Page 312 and 313:
Lista de publicaciones de la tesist
Page 314 and 315:
314 REFERENCIAS
Page 316 and 317:
Referencias [Atkins et al, 86] Atki
Page 318 and 319:
Referencias [Bresnan, 95] Bresnan,
Page 320 and 321:
Referencias nueva sintaxis. Teoría
Page 322 and 323:
Referencias Natural Language and in
Page 324 and 325:
Referencias [Gibbon, 99] Gibbon, D.
Page 326 and 327:
Referencias Conference Research on
Page 328 and 329:
Referencias [Lombardi & Lesmo, 98]
Page 330 and 331:
Referencias partir de texto etiquet
Page 332 and 333:
Referencias [Rambow & Joshi, 92] Ra
Page 334 and 335:
Referencias Linguistics (COLING-92)
Page 336 and 337:
Referencias [Uszkoreit, 96] Uszkore
Page 338 and 339:
APÉNDICE CONJUNTO DE PRUEBA 338
Page 340 and 341:
Apéndice conjunto de prueba En su
show all

Análisis sintáctico conducido por un diccionario de patrones de ...

Create successful ePaper yourself

Delete template?

Save as template?