Representación del conocimiento textual mediante técnicas lógico ...

More documents

Recommendations

Info

130 5. Evaluación del recurso lógico-conceptual para la representación formal del texto Accuracy 0,55 0,545 0,54 0,535 0,53 0,525 0,52 0,515 0,51 0,505 0,5 0,1 0,2 0,21 0,23 0,24 0,25 0,26 0,3 0,5 0,7 Umbral Figura 5.5. Ajuste del umbral sobre el corpus de desarrollo ción se considera el valor de 0.24. WNLin WNsuperficial WNcomplejo Como se puede apreciar en los ejemplos de vinculación textual de la tabla 5.7, debe existir cierta vinculación entre los pares de palabras del texto y de la hipótesis (ej. husband y widow, treat y administer, president y citizen, etc). Por ello, para la desambiguación del sentido de las palabras se consideran, en conjunto, los pares de palabras del texto y la hipótesis. Para ello son tenidos en cuenta únicamente la mitad de los sentidos de WordNet ordenados por frecuencia de aparición. Dada esta consideración del número de sentidos a considerar, a continuación se analizan las relaciones de similitud semántica existentes entre los pares de conceptos asociados a las palabras del texto y la hipótesis. La relación que maximiza la similitud semántica desambigua el sentido del par de palabras del texto y la hipótesis. Ello permite determinar el concepto asociado a cada predicado de la forma lógica. A continuación se especifican las dos estrategias seguidas para determinar la similitud semántica entre los pares de palabras del texto y la hipótesis. Estrategia basada en las relaciones entre sentidos de Word- Net. En la base de datos léxica WordNet (Miller, 1995), un synset es un conjunto de conceptos que expresan el mismo significado. Se define un concepto como el uso de una palabra en un determinado contexto (sentido). De este modo, esta estrategia nos permite conocer si dos conceptos distintos están relacionados entre si mediante la composición de diferentes relaciones definidas en WordNet. Estas relaciones son: hiperonimia, hiponimia, entailment, similitud, meronimia y holonimia. La longitud del camino que debe relacionar los dos conceptos, en el caso de que exista esta relación, nunca debe exceder los cuatro synsets. Cada una de estas relaciones definida en WordNet tiene asociado un peso: 0.8 para la relación de hiperonimia, 0.7 para la relaciones de hiponimia y entailment, 0.9 para la relación de similitud, y 0.5 para las relaciones de meronimia y holonimia. De este modo, el peso del camino entre dos conceptos distintos se calcula como el producto de los pesos de las relaciones existentes en el camino. Esta técnica es una derivación de
5.3 Participación en la tarea Recognising Textual Entailment del PASCAL 2006 131 la técnica empleada por Moldovan y Novischi (2002) en su algoritmo SpreadWeights. Estrategia basada en la medida de Lin. En este enfoque, la relación entre dos conceptos es un valor calculado aplicando la medida de similitud de Lin (1998a) que viene integrada en el recurso Word- Net::Similarity (Pedersen et al. , 2004). Este recurso consiste en un software de dominio abierto desarrollado en la Universidad de Minnesota que permite calcular la relación existente entre dos conceptos, o entre dos palabras. La medida de similitud de Lin se centra en el análisis de las relaciones es-a de WordNet. Está considerada como una medida basada en el contenido de la información, frente a la anterior medida que se centra en la ruta de las relaciones. Esta medida aumenta el contenido de la información del least common subsumer (LCS) 3 de dos conceptos con la suma del contenido de información de los propios conceptos. 5.3.4 Resultados La evaluación del sistema de Textual Entailment se enmarca dentro de la evaluación estándar definida en la tarea PASCAL Second Recognising Textual Entailment Challenge (Bar-Haim et al. , 2006). En ella, los sistemas tiene que decidir si existe entailment o no entre los 800 pares de texto e hipótesis de la colección de test. Los resultados del Textual Entailment vienen determinados a través de dos medidas de evaluación: la precisión (accuracy) y la precisión media (average precision). La tabla 5.8 muestra los resultados obtenidos obtenidos por los sistemas participantes en la tarea. Ambas medidas de evaluación presentan ligeras contradicciones a la hora de decidir, según los números obtenidos en ellas, que el sistema A es mejor que el sistema B. Por ejemplo, se puede dar el caso en el que sistema A obtiene mejor resultado que el sistema B en la medida de precisión, pero el sistema B obtiene mejor resultado que el sistema A en la medida de precisión media. Concretamente, en la competición RTE2 participaron 23 sistemas en 41 ejecuciones. La media de la precisión de estos sistemas ronda el 58,55 % mientras que la media de la precisión media ronda los 59,09 puntos porcentuales. Según la medida de precisión, la ejecución basada en la medida Lin ocupa el puesto número 29 alcanzando una precisión del 55,63 %, mientras que la ejecución basada en relaciones de WordNet ocupa el puesto número 34 obteniendo una precisión del 54,75 %. En cambio, si nos fijamos en la medida de precisión media, la participación fue de 18 sistemas con un total de 31 ejecuciones. En el ámbito de la precisión media, la ejecución basada en la medida Lin ocupa el puesto número 12 alcanzando un valor de 3 LCS es el concepto más específico que dos conceptos comparten como antecesor
Page 1:
Representación del conocimiento te
Page 5:
Agradecimientos Esta Tesis no habr
Page 8 and 9:
VI Índice general 2.5.7. La repres
Page 11 and 12:
Índice de tablas 2.1. Ejemplo de r
Page 13:
Índice de tablas XI 6.18.Preguntas
Page 17 and 18:
1. Introducción El Procesamiento d
Page 19 and 20:
1.3 Exposición del problema 3 1.2
Page 21 and 22:
1.3 Exposición del problema 5 de c
Page 23 and 24:
1.3 Exposición del problema 7 La r
Page 25 and 26:
1.3 Exposición del problema 9 Para
Page 27 and 28:
del conocimiento son: 1.3 Exposici
Page 29 and 30:
1.4 Objetivos de la tesis 13 Como p
Page 31 and 32:
2. Estado del arte Es bastante com
Page 33 and 34:
2.1 Aplicaciones del PLN 17 textos
Page 35 and 36:
2.1 Aplicaciones del PLN 19 reglas
Page 37 and 38:
2.2 Representación textual sin con
Page 39 and 40:
2.3 Representación textual con con
Page 41 and 42:
Page 43 and 44:
Page 45 and 46:
Page 47 and 48:
2.5 La representación formal del t
Page 49 and 50:
Page 51 and 52:
Page 53 and 54:
Page 55 and 56:
Page 57 and 58:
2.6 Conclusiones 41 fo y a cada arc
Page 59 and 60:
3. La Forma Lógica El instrumento
Page 61 and 62:
3.1 El cálculo de predicados de pr
Page 63 and 64:
la evaluación de fórmulas. 3.1.1
Page 65 and 66:
3.1 El cálculo de predicados de pr
Page 67 and 68:
3.2 La forma lógica en el PLN 51 D
Page 69 and 70:
3.2 La forma lógica en el PLN 53 r
Page 71 and 72:
3.3 La forma lógica en aplicacione
Page 73 and 74:
3.3 La forma lógica en aplicacione
Page 75 and 76:
tringido de manuales del sistema op
Page 77 and 78:
3.4 La forma lógica extendida: ind
Page 79 and 80:
Page 81 and 82:
Page 83 and 84:
Page 85 and 86:
Page 87 and 88:
Page 89 and 90:
Page 91:
3.5 Conclusiones 75 El formato de l
Page 94 and 95:
78 4. La forma lógico-conceptual d
Page 96 and 97: 80 4. La forma lógico-conceptual p
Page 98 and 99: 82 4. La forma lógico-conceptual I
Page 100 and 101: 84 4. La forma lógico-conceptual S
Page 102 and 103: 86 4. La forma lógico-conceptual C
Page 104 and 105: 88 4. La forma lógico-conceptual U
Page 106 and 107: 90 4. La forma lógico-conceptual y
Page 108 and 109: 92 4. La forma lógico-conceptual d
Page 110 and 111: 94 4. La forma lógico-conceptual P
Page 112 and 113: 96 4. La forma lógico-conceptual d
Page 114 and 115: 98 4. La forma lógico-conceptual f
Page 116 and 117: 100 4. La forma lógico-conceptual
Page 125 and 126: 5. Evaluación del recurso lógico-
Page 127 and 128: 5.1 Análisis y determinación de l
Page 129 and 130: 5.2 Evaluación en la tarea Cross-L
Page 139 and 140: story:NN(x14) 5.2 Evaluación en la
Page 141 and 142: 5.3 Participación en la tarea Reco
Page 145: 5.3 Participación en la tarea Reco
Page 151 and 152: 5.4 Participación en la tarea Answ
Page 153 and 154: 5.4 Participación en la tarea Answ
Page 155 and 156: 5.5 Participación en la tarea Mult
Page 157 and 158: 5.5 Participación en la tarea Mult
Page 159 and 160: 5.6 Evaluación en la clasificació
Page 169 and 170: en el ámbito del restringido domin
Page 171 and 172: 5.7 Conclusiones 155 Más concretam
Page 173 and 174: 6. Conclusiones finales Durante los
Page 175 and 176: PLN durante la última década. 6.1
Page 177 and 178: Incorporación de roles semánticos
Page 179 and 180: 6.3 Producción científica 163 ter
Page 181 and 182: 6.3 Producción científica 165 Mag
Page 183 and 184: Anexo A. Reglas simples de derivaci
Page 185: Nodo hoja: on Predicado inferido:
Page 188 and 189: 172 ción de existencia de algún t
Page 190 and 191: 174 último, el ejemplo 66 muestra
Page 192 and 193: 176 Reglas de derivación de predic
Page 194 and 195: 178 Reglas de derivación de predic
Page 196 and 197:
180 british:JJ(x4) prime:NN(x5) pri
Page 198 and 199:
182 Preguntas de entrenamiento Prim
Page 200 and 201:
184 Tercer tipo genérico La tabla
Page 202 and 203:
186 Quinto tipo genérico La tabla
Page 204 and 205:
188 Séptimo tipo genérico La tabl
Page 206 and 207:
190 Noveno tipo genérico La tabla
Page 208 and 209:
192 Preguntas de evaluación Primer
Page 210 and 211:
194 Tercer tipo genérico La tabla
Page 212 and 213:
196 Quinto tipo genérico La tabla
Page 214 and 215:
198 Séptimo tipo genérico La tabl
Page 216 and 217:
200 Noveno tipo genérico La tabla
Page 219 and 220:
Referencias Amini, M.-R., Zaragoza,
Page 221 and 222:
Referencias 205 Croft, W.B., Turtle
Page 223 and 224:
Referencias 207 Garrido, M. 2003. L
Page 225 and 226:
Referencias 209 statistics. In: Pro
Page 227 and 228:
Referencias 211 Partee, B. H., ter
Page 229 and 230:
Referencias 213 ge Resources and In
show all

Representación del conocimiento textual mediante técnicas lógico ...

Create successful ePaper yourself

Delete template?

Save as template?