08.05.2013 Views

Representación del conocimiento textual mediante técnicas lógico ...

Representación del conocimiento textual mediante técnicas lógico ...

Representación del conocimiento textual mediante técnicas lógico ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

136 5. Evaluación <strong>del</strong> recurso <strong>lógico</strong>-conceptual para la representación formal <strong>del</strong> texto<br />

CIDO así como excluidos de la evaluación.<br />

La colección se ha construido <strong>del</strong> siguiente modo: los textos se corresponden<br />

con cada una de las respuestas devueltas por los sistemas de<br />

Búsqueda de Respuestas para cada una de las preguntas, mientras que<br />

las hipótesis se obtienen a partir de las preguntas expresadas de modo<br />

afirmativo junto con su respuesta correcta.<br />

Debido a que se trata de un problema de re<strong>conocimiento</strong> <strong>del</strong> Textual<br />

Entailment, el experimento realizado para resolver el problema planteado<br />

por la tarea AVE (Ferrández et al. , 2007) es exactamente el mismo<br />

que el realizado para la tarea PASCAL RTE detallado en la sección<br />

anterior <strong>del</strong> capítulo con la salvedad de las particularidades incluidas<br />

en las medidas de evaluación de la tarea AVE frente a las de la tarea<br />

PASCAL RTE.<br />

5.4.4 Resultados<br />

La tabla 5.9 muestra los resultados obtenidos de la participación en la<br />

tarea AVE <strong>del</strong> CLEF 2006.<br />

Grupo Sistema Medida F Precisión Cobertura<br />

LCC COGEX 0.4559 0.3261 0.7576<br />

Roma ZNZ - TV 2 0.4106 0.2838 0.7424<br />

ITC-irst itc-irst 0.3919 0.3090 0.5354<br />

Roma ZNZ - TV 1 0.3780 0.2707 0.6263<br />

Alicante MLEnt 2 0.3720 0.2487 0.7374<br />

Alicante Lin 0.3177 0.2040 0.7172<br />

Alicante MLEnt 1 0.3174 0.2114 0.6364<br />

Alicante Rel. WN 0.3070 0.2144 0.5404<br />

Twente utwente.ta 0.3022 0.3313 0.2778<br />

Twente utwente.lcs 0.2759 0.2692 0.2828<br />

Valencia ebisbal 0.075 0.2143 0.0455<br />

Tabla 5.9. Resultados de la evaluación en la tarea Answer Validation Exercise<br />

A pesar de que se utilizan las medidas de evaluación precisión, cobertura<br />

y medida F, es ésta última la que combina los resultados obtenidos por<br />

las dos anteriores y, en consecuencia, es la más adecuada para sacar las<br />

conclusiones pertinentes a la validez de los sistemas desde el punto de<br />

vista de la eficacia. La media de la medida F de todos los sistemas es<br />

de 32,76 puntos porcentuales. Comparando este valor con los resultados<br />

obtenidos por el sistema desarrollado (31,77 % para la ejecución basada<br />

en la medida Lin y 30,70 % para la ejecución basada en la exploración<br />

de las relaciones de WordNet) cabe concluir que el sistema desarrollado

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!