08.05.2013 Views

Representación del conocimiento textual mediante técnicas lógico ...

Representación del conocimiento textual mediante técnicas lógico ...

Representación del conocimiento textual mediante técnicas lógico ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

5.3 Participación en la tarea Recognising Textual Entailment <strong>del</strong> PASCAL 2006 125<br />

(50) Texto (T): His family has steadfastly denied the charges.<br />

Hipótesis (H): The charges were denied by his family.<br />

La tarea PASCAL RTE (Recognising Textual Entailment) (Bar-Haim<br />

et al. , 2006) promociona la formación de una comunidad investigadora<br />

en al ámbito de la tarea de vinculación <strong>textual</strong>. La principal tarea consiste<br />

en determinar si una hipótesis (H) es vinculada por un texto (T).<br />

Uno de los principales objetivos de su conjunto de datos se centra en<br />

proveer ejemplos “realistas” de pares texto-hipótesis, la mayoría de ellos<br />

basados en las salidas proporcionadas por los sistemas actuales de PLN.<br />

En concreto se basan en las características de aplicación de los sistemas<br />

mencionados anteriormente: Búsqueda de Respuestas, Recuperación de<br />

Información, Extracción de Información y Generación Automática de<br />

Resúmenes. Cada porción <strong>del</strong> conjunto de datos incluye ejemplos típicos<br />

de pares texto-hipótesis obtenidas a partir de los aciertos y los fallos<br />

obtenidos por estas aplicaciones. Los ejemplos representan diferentes<br />

niveles de razonamiento de la vinculación tales como léxico, sintáctico,<br />

morfo<strong>lógico</strong> y <strong>lógico</strong>.<br />

Dicha tarea proporciona un marco de evaluación común a los sistemas<br />

de Textual Entailment. Los sistemas de Textual Entailment participantes<br />

en esta tarea de evaluación deberán decidir dados los pares texto e<br />

hipótesis, si el texto vincula a la hipótesis o no, y estos resultados se<br />

compararán con las anotaciones manuales correspondientes.<br />

La evaluación de las ejecuciones de los sistemas es automática. Los criterios<br />

devueltos por los sistemas son comparados con los criterios de<br />

relevancia asignados manualmente por los anotadores. El porcentaje de<br />

emparejamiento de criterios debe proveer la precisión de la tarea (ej. la<br />

relación de respuestas correctas).<br />

Como una segunda medida de evaluación, la precisión media (average<br />

precision) evalúa la capacidad de los sistemas en determinar las implicaciones<br />

correctas de acuerdo a su coeficiente de confianza, en orden<br />

decreciente desde el par texto-hipótesis que posee un coeficiente mayor<br />

hasta el que posee el menor coeficiente. Se define formalmente esta medida<br />

como:<br />

P recMedia = 1 ni=1 #correctos hasta par i<br />

E(i) R<br />

i<br />

donde n es la cantidad de pares en el corpus, R es la cantidad de pares<br />

positivos, E(i) es 1 si el par es positivo y 0 si no lo es, e i recorre todos<br />

los pares ordenados según el coeficiente de confianza. Estas dos medidas

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!