Representación del conocimiento textual mediante técnicas lógico ...

More documents

Recommendations

Info

34 2. Estado del arte Representación: Bin NN(x1) & Laden NN(x2) & nn NNC(x3, x1, x2) & human NE(x3) & reportedly RB(x4, e1) & purchase VB(e1, x3, x5) & anthrax NN(x5) & half JJ(x6, x7) & decade NN(x7) & ago JJ(x8, x7) & from IN(e1, x9) & supplier NN(x9) & in IN(x9, x12) & North NN(x10) & Korea NN(x11) & nn NNC(x12, x10, x11) & location NE(x12) Las relaciones semánticas de la frase del ejemplo están expresadas en la tabla 2.11. Estas relaciones semánticas se representan en la forma lógica mediante la introducción de nuevos predicados. Estos nuevos predicados conservan la estructura de sus análogos originales detallados en secciones anteriores de este capítulo introduciendo como novedad el concepto de rol semántico (Moreda et al. , 2008). Un rol semántico describe una función abstracta desempeñada por un elemento que participa en una acción. Básicamente modelan el tipo de relación semántica existente (rol semántico), y sus argumentos se corresponden con los argumentos identificadores de los predicados de la forma lógica vinculados en las relaciones semánticas. A continuación, el ejemplo 13 muestra la representación de las relaciones semánticas existentes en la frase. (13) Frase: Bin Laden reportedly purchased anthrax a half decade ago from a supplier in North Korea. Representación de relaciones semánticas: AGENT SR(x3, e1) & TOPIC SR(e1, x4) & THEME SR(x5, e1) & RECIPIENT SR(x9, e1) & TEMPORAL SR(x7, e1) & MEASURE SR(x6, x7) & LOCATION SR(x12, x9) Relaciones semánticas AGENT(Bin Laden, purchased) TOPIC(purchased, reportedly) THEME(anthrax, purchased) RECIPIENT(a supplier in North Korea, purchased) TEMPORAL(a half decade ago, purchased) MEASURE(a half, decade) LOCATION(in North Korea, a supplier) Tabla 2.11. Relaciones semánticas de la frase del ejemplo El sistema de Demner-Fushman et al. (2007) aplica un preproceso de los documentos a representar consistente en la normalización de los mismos. Para ello elimina plurales, posesivos, palabras compuestas, otros guiones, variantes deletreadas (spelling variants), etc. A continuación
2.5 La representación formal del texto en los sistemas de PLN 35 obtiene una representación estadística de los documentos siguiendo el modelo de n-gramas, teniendo un total de 1250391 n-gramas con tamaño de n variable desde 1 hasta 8. En el proceso de representación, el índice almacena el número de ocurrencias de cada n-grama en cada documento. Como mejora y optimización de la representación formal del texto se propone utilizar una representación basada en el modelo de análisis sintáctico y el reconocimiento de la terminología del corpus. El sistema DIOGENE de Bernardo Magnini et. al (2002) hace un preproceso que consiste, en un primer paso, en una tokenización y etiquetado PoS de las palabras y, en un segundo paso, en el reconocimiento de expresiones multipalabra. Una vez realizado este preproceso, el texto es representado formalmente siguiendo el modelo de representación híbrido. Para ello identifica cada palabra o expresión multipalabra con su sentido asociado en la base de datos léxica WordNet. 2.5.2 La representación formal del texto en los sistemas de Recuperación de Información En este apartado se detallan los modelos de representación formal del texto que utilizan los sistemas de Recuperación de Información desarrollados en los centros de investigación de Amsterdam, Barcelona (Yahoo) y Maryland bajo la supervisión de los investigadores Marteen de Rijke, Ricardo Baeza-Yates y Jimmy Lin respectivamente. El sistema de Balog et al. (2007) obtiene una representación formal del documento basada en el modelo de bolsa de palabras (bag-of-words). De este modo, las estimaciones que hace para determinar si un documento es candidato a ser relevante para una query es puramente estadística ya que se basa en la formulación propuesta por Bayes: P (documento|query) = P (query|documento)P (documento)/P (query). El sistema de Baeza-Yates et al. (2007) obtiene una representación formal del texto basada en el modelo de bolsa de palabras. En el proceso de recuperación maneja conceptos totalmente estadísticos tales como las frecuencias normalizadas de los términos, la distribución de las frecuencias, y las correlaciones de las frecuencias entre los términos de los documentos y de las queries. El sistema de Jimmy Lin (2006), al igual que los dos sistemas predecesores en este apartado, obtiene también una representación formal del texto basada en el modelo de bolsa de palabras. Para ello utiliza una variante del modelo de pesado TF.IDF. Básicamente se centra en
Page 1: Representación del conocimiento te
Page 5: Agradecimientos Esta Tesis no habr
Page 8 and 9: VI Índice general 2.5.7. La repres
Page 11 and 12: Índice de tablas 2.1. Ejemplo de r
Page 13: Índice de tablas XI 6.18.Preguntas
Page 17 and 18: 1. Introducción El Procesamiento d
Page 19 and 20: 1.3 Exposición del problema 3 1.2
Page 21 and 22: 1.3 Exposición del problema 5 de c
Page 23 and 24: 1.3 Exposición del problema 7 La r
Page 25 and 26: 1.3 Exposición del problema 9 Para
Page 27 and 28: del conocimiento son: 1.3 Exposici
Page 29 and 30: 1.4 Objetivos de la tesis 13 Como p
Page 31 and 32: 2. Estado del arte Es bastante com
Page 33 and 34: 2.1 Aplicaciones del PLN 17 textos
Page 35 and 36: 2.1 Aplicaciones del PLN 19 reglas
Page 37 and 38: 2.2 Representación textual sin con
Page 39 and 40: 2.3 Representación textual con con
Page 47 and 48: 2.5 La representación formal del t
Page 49: 2.5 La representación formal del t
Page 57 and 58: 2.6 Conclusiones 41 fo y a cada arc
Page 59 and 60: 3. La Forma Lógica El instrumento
Page 61 and 62: 3.1 El cálculo de predicados de pr
Page 63 and 64: la evaluación de fórmulas. 3.1.1
Page 65 and 66: 3.1 El cálculo de predicados de pr
Page 67 and 68: 3.2 La forma lógica en el PLN 51 D
Page 69 and 70: 3.2 La forma lógica en el PLN 53 r
Page 71 and 72: 3.3 La forma lógica en aplicacione
Page 73 and 74: 3.3 La forma lógica en aplicacione
Page 75 and 76: tringido de manuales del sistema op
Page 77 and 78: 3.4 La forma lógica extendida: ind
Page 91: 3.5 Conclusiones 75 El formato de l
Page 94 and 95: 78 4. La forma lógico-conceptual d
Page 96 and 97: 80 4. La forma lógico-conceptual p
Page 98 and 99: 82 4. La forma lógico-conceptual I
Page 100 and 101:
84 4. La forma lógico-conceptual S
Page 102 and 103:
86 4. La forma lógico-conceptual C
Page 104 and 105:
88 4. La forma lógico-conceptual U
Page 106 and 107:
90 4. La forma lógico-conceptual y
Page 108 and 109:
92 4. La forma lógico-conceptual d
Page 110 and 111:
94 4. La forma lógico-conceptual P
Page 112 and 113:
96 4. La forma lógico-conceptual d
Page 114 and 115:
98 4. La forma lógico-conceptual f
Page 116 and 117:
100 4. La forma lógico-conceptual
Page 118 and 119:
Page 120 and 121:
Page 122 and 123:
Page 125 and 126:
5. Evaluación del recurso lógico-
Page 127 and 128:
5.1 Análisis y determinación de l
Page 129 and 130:
5.2 Evaluación en la tarea Cross-L
Page 131 and 132:
Page 133 and 134:
Page 135 and 136:
Page 137 and 138:
Page 139 and 140:
story:NN(x14) 5.2 Evaluación en la
Page 141 and 142:
5.3 Participación en la tarea Reco
Page 143 and 144:
Page 145 and 146:
Page 147 and 148:
Page 149 and 150:
Page 151 and 152:
5.4 Participación en la tarea Answ
Page 153 and 154:
5.4 Participación en la tarea Answ
Page 155 and 156:
5.5 Participación en la tarea Mult
Page 157 and 158:
5.5 Participación en la tarea Mult
Page 159 and 160:
5.6 Evaluación en la clasificació
Page 161 and 162:
Page 163 and 164:
Page 165 and 166:
Page 167 and 168:
Page 169 and 170:
en el ámbito del restringido domin
Page 171 and 172:
5.7 Conclusiones 155 Más concretam
Page 173 and 174:
6. Conclusiones finales Durante los
Page 175 and 176:
PLN durante la última década. 6.1
Page 177 and 178:
Incorporación de roles semánticos
Page 179 and 180:
6.3 Producción científica 163 ter
Page 181 and 182:
6.3 Producción científica 165 Mag
Page 183 and 184:
Anexo A. Reglas simples de derivaci
Page 185:
Nodo hoja: on Predicado inferido:
Page 188 and 189:
172 ción de existencia de algún t
Page 190 and 191:
174 último, el ejemplo 66 muestra
Page 192 and 193:
176 Reglas de derivación de predic
Page 194 and 195:
178 Reglas de derivación de predic
Page 196 and 197:
180 british:JJ(x4) prime:NN(x5) pri
Page 198 and 199:
182 Preguntas de entrenamiento Prim
Page 200 and 201:
184 Tercer tipo genérico La tabla
Page 202 and 203:
186 Quinto tipo genérico La tabla
Page 204 and 205:
188 Séptimo tipo genérico La tabl
Page 206 and 207:
190 Noveno tipo genérico La tabla
Page 208 and 209:
192 Preguntas de evaluación Primer
Page 210 and 211:
194 Tercer tipo genérico La tabla
Page 212 and 213:
196 Quinto tipo genérico La tabla
Page 214 and 215:
198 Séptimo tipo genérico La tabl
Page 216 and 217:
200 Noveno tipo genérico La tabla
Page 219 and 220:
Referencias Amini, M.-R., Zaragoza,
Page 221 and 222:
Referencias 205 Croft, W.B., Turtle
Page 223 and 224:
Referencias 207 Garrido, M. 2003. L
Page 225 and 226:
Referencias 209 statistics. In: Pro
Page 227 and 228:
Referencias 211 Partee, B. H., ter
Page 229 and 230:
Referencias 213 ge Resources and In
show all

Representación del conocimiento textual mediante técnicas lógico ...

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?