08.05.2013 Views

Representación del conocimiento textual mediante técnicas lógico ...

Representación del conocimiento textual mediante técnicas lógico ...

Representación del conocimiento textual mediante técnicas lógico ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

5.3 Participación en la tarea Recognising Textual Entailment <strong>del</strong> PASCAL 2006 129<br />

sumados y normalizados, produciendo el factor de similitud entre texto<br />

e hipótesis. Si este factor de similitud supera cierto umbral implica que<br />

existe una relación de vinculación <strong>textual</strong> entre T y H; en otro caso, no<br />

existe dicha relación de vinculación <strong>textual</strong> entre T y H. Este umbral<br />

ha sido establecido previamente en la fase de entrenamiento <strong>del</strong> sistema<br />

con el corpus de desarrollo. La figura 5.4 resume esta arquitectura<br />

general <strong>del</strong> sistema de vinculación <strong>textual</strong>.<br />

FL Texto<br />

Texto<br />

Derivación de las<br />

Formas Lógicas<br />

Computación de la similitud<br />

Semántica entre Formas Lógicas<br />

factor<br />

¿Implicación?<br />

SI NO<br />

Figura 5.4. Arquitectura <strong>del</strong> sistema de vinculación <strong>textual</strong><br />

Hipótesis<br />

FL Hipótesis<br />

Para el cálculo <strong>del</strong> peso de la relación entre pares de predicados se han<br />

seguido dos estrategias: la primera de ellas está basada en las relaciones<br />

entre sentidos definidas en el recurso léxico WordNet (Miller, 1995)<br />

mientras que la segunda está basada en la medida de Lin (Lin, 1998a).<br />

Ambas estrategias se basan en la jerarquía definida en WordNet.<br />

Para determinar el valor <strong>del</strong> umbral se asignan valores empíricos sobre<br />

tres ejecuciones diferentes: WNsuperficial, WNdetallado y WNLin.<br />

WNsuperficial hace uso de tres relaciones de WordNet (sinonimia, hiponimia<br />

y entailment) que se consideran más adecuadas para la tarea de<br />

implicación <strong>textual</strong>. WNdetallado utiliza seis relaciones (hiperonimia,<br />

hiponimia, implicación, sinonimia, meronimia y holonimia) para obtener<br />

el peso de similitud entre dos conceptos. La última ejecución, que<br />

utiliza la medida de similitud de Lin, se le denomina WNLin. La figura<br />

5.5 muestra la relación existente entre los valores empíricos que toma<br />

el umbral y la precisión obtenida por el sistema para cada uno de estos<br />

valores en la fase de entrenamiento <strong>del</strong> sistema.<br />

El umbral que mejores resultados de precisión obtiene sobre el corpus<br />

de desarrollo es de 0.24 para las ejecuciones WNLin y WNdetallado,<br />

mientras que para la ejecución WNsuperficial el mejor umbral empírico<br />

es de 0.25. Aunque los umbrales son bastante parecidos y sufren un<br />

comportamiento similar conforme se van aumentando, para la evalua-

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!