08.05.2013 Views

Representación del conocimiento textual mediante técnicas lógico ...

Representación del conocimiento textual mediante técnicas lógico ...

Representación del conocimiento textual mediante técnicas lógico ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

5.3 Participación en la tarea Recognising Textual Entailment <strong>del</strong> PASCAL 2006 131<br />

la técnica empleada por Moldovan y Novischi (2002) en su algoritmo<br />

SpreadWeights.<br />

Estrategia basada en la medida de Lin. En este enfoque, la relación<br />

entre dos conceptos es un valor calculado aplicando la medida<br />

de similitud de Lin (1998a) que viene integrada en el recurso Word-<br />

Net::Similarity (Pedersen et al. , 2004). Este recurso consiste en un<br />

software de dominio abierto desarrollado en la Universidad de Minnesota<br />

que permite calcular la relación existente entre dos conceptos, o<br />

entre dos palabras. La medida de similitud de Lin se centra en el análisis<br />

de las relaciones es-a de WordNet. Está considerada como una medida<br />

basada en el contenido de la información, frente a la anterior medida que<br />

se centra en la ruta de las relaciones. Esta medida aumenta el contenido<br />

de la información <strong>del</strong> least common subsumer (LCS) 3 de dos conceptos<br />

con la suma <strong>del</strong> contenido de información de los propios conceptos.<br />

5.3.4 Resultados<br />

La evaluación <strong>del</strong> sistema de Textual Entailment se enmarca dentro de<br />

la evaluación estándar definida en la tarea PASCAL Second Recognising<br />

Textual Entailment Challenge (Bar-Haim et al. , 2006). En ella,<br />

los sistemas tiene que decidir si existe entailment o no entre los 800<br />

pares de texto e hipótesis de la colección de test. Los resultados <strong>del</strong><br />

Textual Entailment vienen determinados a través de dos medidas de<br />

evaluación: la precisión (accuracy) y la precisión media (average precision).<br />

La tabla 5.8 muestra los resultados obtenidos obtenidos por los<br />

sistemas participantes en la tarea.<br />

Ambas medidas de evaluación presentan ligeras contradicciones a la hora<br />

de decidir, según los números obtenidos en ellas, que el sistema A<br />

es mejor que el sistema B. Por ejemplo, se puede dar el caso en el que<br />

sistema A obtiene mejor resultado que el sistema B en la medida de precisión,<br />

pero el sistema B obtiene mejor resultado que el sistema A en<br />

la medida de precisión media. Concretamente, en la competición RTE2<br />

participaron 23 sistemas en 41 ejecuciones. La media de la precisión de<br />

estos sistemas ronda el 58,55 % mientras que la media de la precisión<br />

media ronda los 59,09 puntos porcentuales. Según la medida de precisión,<br />

la ejecución basada en la medida Lin ocupa el puesto número 29<br />

alcanzando una precisión <strong>del</strong> 55,63 %, mientras que la ejecución basada<br />

en relaciones de WordNet ocupa el puesto número 34 obteniendo<br />

una precisión <strong>del</strong> 54,75 %. En cambio, si nos fijamos en la medida de<br />

precisión media, la participación fue de 18 sistemas con un total de 31<br />

ejecuciones. En el ámbito de la precisión media, la ejecución basada<br />

en la medida Lin ocupa el puesto número 12 alcanzando un valor de<br />

3 LCS es el concepto más específico que dos conceptos comparten como antecesor

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!