08.05.2013 Views

Representación del conocimiento textual mediante técnicas lógico ...

Representación del conocimiento textual mediante técnicas lógico ...

Representación del conocimiento textual mediante técnicas lógico ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

5.5 Participación en la tarea Multilingual Question Answering <strong>del</strong> CLEF 2008 139<br />

la agencia española de noticias EFE.<br />

Las preguntas pueden ser de tres tipos:<br />

Factuales. Estas preguntas se basan en hechos y pueden referirse a una<br />

persona, un lugar, etc. Estas preguntas sólo pueden tener ocho tipos<br />

de respuesta: persona, tiempo, lugar, organización, medida, cómputo,<br />

objeto y otro.<br />

Definición. Éstas son <strong>del</strong> tipo “Qué/Quién es X?” y se dividen en<br />

cuatro subtipos: persona, organización, objeto y otro.<br />

Lista cerrada. La respuesta a este tipo de preguntas es una lista de<br />

elementos.<br />

Los criterios de evaluación consideran la respuestas devueltas por los<br />

sistemas en uno de los siguientes cuatro tipos:<br />

R (correcta) si la respuesta es correcta.<br />

W (incorrecta) si la respuesta es incorrecta.<br />

X (inexacta) si la respuesta contiene menos o más información de la<br />

requerida como correcta.<br />

U (no soportada) si el documento contenedor de la respuesta es<br />

erróneo o no se corresponde con ninguno de los de la colección. También<br />

se consideran en este tipo aquellas respuestas cuya porción de<br />

texto no contiene la respuesta exacta.<br />

La principal medida de evaluación es la precisión aunque también, debido<br />

a que los sistemas pueden devolver más de una respuesta por pregunta,<br />

se consideran en la evaluación las dos siguientes medidas:<br />

la medida de confianza ponderada Confident Weighted Score (CWS).<br />

Las respuestas están en un orden decreciente de confianza y CWS<br />

premia a los sistemas dan las respuestas correctas en los primeros lugares<br />

<strong>del</strong> ranking.<br />

el rango de media recíproca Mean Reciprocal Rank (MRR) sobre N<br />

respuestas calculadas por pregunta (para considerar las tres respuestas).<br />

Esta medida mide el número de respuestas correctas en las primeras<br />

N posiciones. Por ejemplo, si la respuesta correcta está en la<br />

tercera posición y N vale 3, su valor es de 1/3.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!