RESOLUCIÓN AUTOMÁTICA DE LA ANÁFORA INDIRECTA EN EL ...

More documents

Recommendations

Info

INTRODUCCIÓN 1996; Baldwin, 1997; Mitkov, 1998a, 2000b y 2000c]. Se han utilizado además estrategias combinadas para la resolución de la anáfora en el Español [Palomar et al, 2001]. La posibilidad de corpus sin etiquetar y de corpus etiquetados con enlaces referenciales, dio un fuerte impulso a la resolución de la anáfora tomando en cuenta el entrenamiento y la evaluación; los corpus (especialmente cuando están etiquetados) son un recurso de gran valor para la investigación empírica y los métodos de aprendizaje automático que animan el desarrollo de diferentes enfoques, posibilitando también medios para la evaluación de algoritmos desarrollados. Desde simples reglas de co-ocurrencia [Dagan e Itai, 1991] pasando por el entrenamiento de árboles de decisión para identificar las parejas anáfora y antecedente [Aone y Bennett, 1995], hasta algoritmos genéticos para optimizar los factores que afectan la resolución de la anáfora [Orasan et al, 2000], han sido logrados gracias a la posibilidad de contar con corpus adecuados. El preprocesamiento del texto, o procesamiento previo a la aplicación del método de resolución de la anáfora a un texto, es un problema significativo ya que la exactitud es demasiada baja y como consecuencia el rendimiento de estos sistemas está lejos del ideal; la dependencia vital del sistema de resolución de la anáfora es tal que tendrá poco rendimiento, aunque el método sea muy bueno. En esta etapa, los problemas principales se encuentran en el análisis morfológico, etiquetado de partes de la oración, reconocimiento de entidades nominales, reconocimiento de pronombres, reconocimiento de palabras desconocidas, extracción de frases nominales, descomposición analítica (parsing), etc. Por ejemplo: la mejor exactitud encontrada para la descomposición analítica de textos sin restricción es alrededor del 87% [Collins, 1997]; el mejor rendimiento logrado con etiquetadores de entidades nominales da una exactitud del 96% cuando se prueba y utiliza en corpus con noticias sobre un dominio o tema específico [Mitkov, 2001]. Como resultado de las limitantes mencionadas, la mayoría de los sistemas de resolución de la anáfora no operan de modo totalmente automático, y algunos métodos han sido simulados sólo manualmente. Como ejemplos ilustrativos: la resolución propuesta por Hobbs no fue implantada en su versión original [Hobbs, 1976, 1978]; hay trabajos donde se corrigieron manualmente los resultados de las etapas de preprocesamiento (para poder utilizarlas en el algoritmo de resolución anafórica) [Lappin, 1994; Ferrandez et al, 1997; 9
INTRODUCCIÓN Mitkov, 1998b]; finalmente hay trabajos donde se utilizaron corpus etiquetados manualmente sin etapa de preprocesamiento [Ge et al, 1998; Tetreault, 1999]. Reaccionando a la situación mostrada se han iniciado esfuerzos, a largo plazo, para lograr sistemas totalmente automatizados [Fukumoto et al, 2000; Tanev y Mitkov, 2000; Mitkov, 2001]. 1.2.2 La anáfora indirecta De los modelos de análisis de la anáfora indirecta, tres son los que más influencia han tenido en el área: • El modelo de relevancia • El modelo de tópico o focal • El modelo de escenario 1.2.2.1 El modelo de relevancia La teoría de relevancia supone que el mecanismo cognitivo central del ser humano es un dispositivo deductivo generador de inferencias que trabaja tratando de maximizar la relevancia con respecto a la comunicación; el principio de relevancia es el responsable de recuperar el contenido explícito o implícito de un enunciado. En otras palabras, al interpretar un enunciado el receptor estará siempre “maximizando los efectos contextuales del enunciado” y “minimizando los esfuerzos de procesamiento del enunciado” [Matsui, 1995]. Dentro de este modelo, Kempson [1988a] observa que la interpretación de la anáfora indirecta requiere un análisis semántico / pragmático, más que gramatical, y de la información asociada con premisas adicionales implícitas. En el modelo de relevancia, la idea básica es que la interpretación de la anáfora indirecta se encuentra suponiendo conexiones que se apoyan en efectos contextuales apropiados pero sin sujetar el lenguaje a esfuerzos injustificados para obtener estos efectos. La validez del análisis de la anáfora con el modelo de relevancia depende crucialmente de cómo se aplica el principio, o más concretamente de cómo se pueden obtener y balancear tanto los “efectos contextuales” como los “esfuerzos de procesamiento”. Desgraciadamente, en los trabajos consultados [Matsui, 1993, 1995; Kempson, 1988a, 1988b; Sperber y Wilson, 1995; 10
Page 1 and 2: INSTITUTO POLITÉCNICO NACIONAL CEN
Page 3 and 4: INTRODUCCIÓN 1.3 Definición del p
Page 5 and 6: INTRODUCCIÓN Figura 17 Proceso 7 P
Page 7 and 8: INTRODUCCIÓN ABSTRACT This thesis
Page 9: INTRODUCCIÓN Inteligencia Artifici
Page 13 and 14: INTRODUCCIÓN 1.2.2.4 Comparación
Page 15 and 16: INTRODUCCIÓN principio de relevanc
Page 17 and 18: INTRODUCCIÓN En este trabajo se co
Page 19 and 20: INTRODUCCIÓN 1.7 Organización del
Page 21 and 22: FUNDAMENTOS LINGÜÍSTICOS medio de
Page 23 and 24: FUNDAMENTOS LINGÜÍSTICOS la habil
Page 25 and 26: FUNDAMENTOS LINGÜÍSTICOS Un texto
Page 27 and 28: FUNDAMENTOS LINGÜÍSTICOS 4. El ma
Page 29 and 30: 3 TRABAJO RELACIONADO Se encontraro
Page 31 and 32: 4 RESOLUCIÓN CON ESCENARIO AMPLIAD
Page 33 and 34: RESOLUCIÓN CON ESCENARIO AMPLIADO
Page 61 and 62:
RESOLUCIÓN CON ESCENARIO AMPLIADO
Page 63 and 64:
Page 65 and 66:
Page 67 and 68:
Page 69 and 70:
Page 71 and 72:
Page 73 and 74:
Page 75 and 76:
Page 77 and 78:
Page 79 and 80:
Page 81 and 82:
DESARROLLO DE DATOS LINGÜÍSTICOS
Page 83 and 84:
Page 85 and 86:
Page 87 and 88:
Page 89 and 90:
Page 91 and 92:
Page 93 and 94:
Page 95 and 96:
Page 97 and 98:
Page 99 and 100:
ANÁLISIS DE RESULTADOS adicional,
Page 101 and 102:
ANÁLISIS DE RESULTADOS p = 91 = 10
Page 103 and 104:
ANÁLISIS DE RESULTADOS Archivo Exp
Page 105 and 106:
ANÁLISIS DE RESULTADOS EXPERTO Si
Page 107 and 108:
ANÁLISIS DE RESULTADOS 6.5 Tamaño
Page 109 and 110:
ANÁLISIS DE RESULTADOS En todas la
Page 111 and 112:
ANÁLISIS DE RESULTADOS Observando
Page 113 and 114:
ANÁLISIS DE RESULTADOS En la tabla
Page 115 and 116:
7 CONCLUSIONES 7.1 Resultados obten
Page 117 and 118:
CONCLUSIONES 7.3 Recomendaciones y
Page 119 and 120:
GLOSARIO La inclusión de este glos
Page 121 and 122:
GLOSARIO contexto (lingüístico) c
Page 123 and 124:
GLOSARIO escenario explícito, a (o
Page 125 and 126:
GLOSARIO meronimia metáfora metát
Page 127 and 128:
GLOSARIO sinécdoque sinonímia; si
Page 129 and 130:
GLOSARIO unidad morfológica (UM) E
Page 131 and 132:
Publicaciones Evaluation of TnT tag
Page 133 and 134:
15. Cornish, Francis (1999) Anaphor
Page 135 and 136:
49. Kurohashi, Sadao; Murata, Masak
Page 137 and 138:
79. Schank, Roger C. y Abelson, Rob
Page 139 and 140:
Unidad léxica Funciones Determinan
Page 141 and 142:
Unidad léxica Funciones Determinan
Page 143 and 144:
Anexo C: Ejemplo del texto usado pa
Page 145 and 146:
44. Y aun cuando la olvidemos, como
Page 147 and 148:
personas persona NCFP000 ; ; Fx só
Page 149 and 150:
las el DA0FP0 villas villa NCFP000
Page 151 and 152:
esto este PD0NS000 ha haber VAIP3S0
Page 153 and 154:
, , Fc en en SPS00 la el DA0FS0 his
Page 155 and 156:
Marcado de nombres comunes 3 sender
Page 157 and 158:
Anexo F: Fuentes de Programas Sólo
Page 159 and 160:
* Programa principal para el proces
Page 161 and 162:
f_in.close (); // Almacenado el arc
Page 163 and 164:
else izquierda = izquierda->Izq; };
Page 165 and 166:
derecha = texto.Inicio(); cout Elem
Page 167 and 168:
cad1[k][l] = 0; cad2[k][l] = 0; } /
Page 169 and 170:
Resultados del archivo Contra la gu
Page 171 and 172:
Resultados del archivo Contra la gu
Page 173 and 174:
Resultados del archivo Instituto Or
Page 175 and 176:
Resultados del archivo El Cerebro N
Page 177 and 178:
Resultados del archivo El Cerebro N
Page 179 and 180:
El segundo es un archivo de correo
Page 181 and 182:
Cada cosa que hacemos y experimenta
Page 183 and 184:
( 53) o ( 54) pisoteo ( 55) de ( 56
Page 185 and 186:
información adicional se puede obt
Page 187 and 188:
nótese que el nombre aparece sin l
Page 189 and 190:
Interpretación del archivo de sali
show all

RESOLUCIÓN AUTOMÁTICA DE LA ANÁFORA INDIRECTA EN EL ...

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?