08.05.2013 Views

Representación del conocimiento textual mediante técnicas lógico ...

Representación del conocimiento textual mediante técnicas lógico ...

Representación del conocimiento textual mediante técnicas lógico ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

114 5. Evaluación <strong>del</strong> recurso <strong>lógico</strong>-conceptual para la representación formal <strong>del</strong> texto<br />

ASRTEXT2003A. Contiene la secuencia de palabras producida por<br />

un transcriptor de habla con una elevada tasa de error.<br />

ASRTEXT2004A. Contiene la secuencia de palabras producida por<br />

un transcriptor de habla con una tasa de error inferior a la anterior.<br />

AUTOKEYWORD2004A1. Contiene un conjunto de palabras clave<br />

extraídas <strong>del</strong> tesauro de modo automático a partir de un clasificador<br />

basado en el vecino más cercano sobre las palabras de la transcripción<br />

ASRTEXT2004A.<br />

AUTOKEYWORD2004A2. Contiene un conjunto de palabras clave<br />

extraídas <strong>del</strong> tesauro de modo automático a partir de un clasificador<br />

basado en el segundo vecino más cercano sobre las palabras de la<br />

transcripción ASRTEXT2004A.<br />

La tarea Cross-Language Speech Retrieval presenta diferentes medidas<br />

de evaluación que revelan la validez de los sistemas participantes en<br />

dicha tarea. Concretamente, estas medidas de evaluación son: la media<br />

de precisión no interpolada (MAP), la r-precisión (Rprec), la medida<br />

basada en la preferencia binaria (Bpref) y la precisión a los N documentos<br />

recuperados (pN). A continuación se define cada una de ellas:<br />

La media de precisión no interpolada (MAP) actúa sobre la lista de<br />

mil documentos que los sistemas consideran relevantes para cada tópico.<br />

Esta medida, sobre la lista de documentos devuelta por los sistemas,<br />

destaca aquellos que son relevantes y penaliza aquellos que no lo<br />

son. Por ello, la medida recompensa los sistemas que recuperan los documentos<br />

relevantes en los primeros lugares. La MAP es la media de<br />

la precisión obtenida después que cada documento relevante es recuperado,<br />

siendo la precisión la relación entre el número de documentos<br />

relevantes recuperados y el número de documentos recuperados. Para<br />

calcularla se considera:<br />

• Cuando no se ha recuperado todavía ningún documento relevante,<br />

la precisión es 0.<br />

• Cada vez que se obtiene un documento relevante se calcula la precisión.<br />

• La MAP se calcula como media aritmética de las precisiones anteriores.<br />

La r-precisión (Rprec) calcula la precisión considerando que existen<br />

un total de r documentos relevantes para cada tópico y, en consecuen-

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!