08.05.2013 Views

Representación del conocimiento textual mediante técnicas lógico ...

Representación del conocimiento textual mediante técnicas lógico ...

Representación del conocimiento textual mediante técnicas lógico ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

116 5. Evaluación <strong>del</strong> recurso <strong>lógico</strong>-conceptual para la representación formal <strong>del</strong> texto<br />

5.2.3 Desarrollo<br />

En el marco de las tareas de evaluación derivadas en el ámbito de la Recuperación<br />

de Información en las competencias CLEF, los tópicos están<br />

compuestos de un título, una descripción y una narrativa. El título contiene<br />

las palabras clave de búsqueda y suele estar formado entre dos y<br />

seis palabras. La descripción es bastante similar al título y describe de<br />

manera escueta en una sola frase la acción a realizar. La narrativa detalla<br />

en mayor medida el objeto <strong>del</strong> tópico y suele estar formada por<br />

varias frases. La tabla 5.2 muestra un ejemplo de tópico.<br />

Tópico Descripción Narrativa<br />

Jewish Provide testimonies or The relevant material should<br />

resistance describe actions of describe actions of only- or mostly<br />

in Europe Jewish resistance in Europe Jewish resistance in Europe. Both<br />

before and during the war. individual and group-based actions...<br />

Tabla 5.2. Ejemplo de tópico<br />

Para realizar el proceso de Recuperación de Información, se utiliza el<br />

sistema estadístico de Recuperación de Pasajes IR-n (Llopis, 2003) que,<br />

en su fase de indexación, asigna un peso a las palabras (términos) presentes<br />

en la colección documental según el mo<strong>del</strong>o bag of words.<br />

Tras hacer un pequeño análisis sobre la descripción de los tópicos, se<br />

concluye que determinadas palabras podrían ser más relevantes que<br />

otras en el proceso de Recuperación de Información. Es por ello que<br />

el peso de estas palabras debería sufrir un incremento moderado <strong>del</strong><br />

peso original asignado por el sistema IR-n en la fase de indexación.<br />

Concretamente, estas palabras son aquellas que en la oración actúan<br />

como objeto indirecto o circunstancial. De ahí que la heurística <strong>del</strong> tipo<br />

lingüístico aplicada consista en hacer un análisis sobre la forma lógica<br />

de los tópicos, detectando este tipo de palabras con el propósito de incrementarles<br />

su peso original en un determinado porcentaje.<br />

A continuación se presenta la materialización de esta heurística aplicando<br />

el recurso de representación formal <strong>del</strong> texto desarrollado en la<br />

investigación, se analizan los resultados en términos de eficacia que la incorporación<br />

de esta heurística produce en el sistema de Recuperación de<br />

Pasajes IR-n y, por último, se analizan los resultados en términos de eficiencia<br />

desde dos enfoques claramente diferenciados: el primer enfoque<br />

consiste en analizar los resultados de eficiencia aplicando la heurística<br />

<strong>mediante</strong> el recurso desarrollado, mientras que, el segundo enfoque<br />

consiste en analizar los resultados en términos de eficiencia aplicando

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!