09.11.2013 Views

Recuperación de información para respuesta a preguntas en ...

Recuperación de información para respuesta a preguntas en ...

Recuperación de información para respuesta a preguntas en ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

En los mo<strong>de</strong>los <strong>de</strong> recuperación, la hipótesis <strong>de</strong> relevancia (R) se basa <strong>en</strong> la observación (o<br />

evi<strong>de</strong>ncia acerca) <strong>de</strong>l cont<strong>en</strong>ido <strong>de</strong> un docum<strong>en</strong>to (D) y una solicitud específica (Q). La<br />

estimación <strong>de</strong> | se pue<strong>de</strong> consi<strong>de</strong>rar como la acumulación <strong>de</strong> piezas <strong>de</strong> evi<strong>de</strong>ncia<br />

proporcionadas por difer<strong>en</strong>tes repres<strong>en</strong>taciones <strong>de</strong> la solicitud y/o los docum<strong>en</strong>tos. La<br />

acumulación <strong>de</strong> más piezas <strong>de</strong> evi<strong>de</strong>ncia podría resultar <strong>en</strong> estimados <strong>de</strong> probabilidad <strong>de</strong><br />

relevancia más precisos si la evi<strong>de</strong>ncia no se correlaciona. A m<strong>en</strong>udo los mo<strong>de</strong>los <strong>de</strong><br />

recuperación introduc<strong>en</strong> conceptos intermedios que ocultan la relación <strong>en</strong>tre las<br />

observaciones y la hipótesis, no obstante, aun <strong>en</strong> tales casos este mo<strong>de</strong>lo simple justifica <strong>en</strong><br />

parte el uso <strong>de</strong> la combinación <strong>de</strong> evi<strong>de</strong>ncia.<br />

En lo que respecta a la combinación <strong>de</strong> los resultados proporcionados por difer<strong>en</strong>tes<br />

algoritmos <strong>de</strong> recuperación sobre una misma repres<strong>en</strong>tación o la combinación <strong>de</strong> la salida<br />

<strong>de</strong> difer<strong>en</strong>tes sistemas <strong>de</strong> recuperación, ambos pue<strong>de</strong>n ser mo<strong>de</strong>lados como una<br />

combinación <strong>de</strong> clasificadores; esto ha mostrado que reduce también los errores <strong>de</strong><br />

clasificación (Tumer y Ghosh, 1999). Un sistema <strong>de</strong> recuperación pue<strong>de</strong> ser consi<strong>de</strong>rado<br />

como un clasificador binario (con la clase relevante y no-relevante). Para un docum<strong>en</strong>to<br />

dado, la salida <strong>de</strong>l sistema correspon<strong>de</strong> a la probabilidad que dicho docum<strong>en</strong>to pert<strong>en</strong>ezca a<br />

la clase relevante. En este <strong>en</strong>foque, los errores <strong>de</strong> clasificación reduc<strong>en</strong> la efectividad <strong>de</strong> la<br />

recuperación. La cantidad <strong>de</strong> reducción <strong>de</strong>l error con la combinación <strong>de</strong>p<strong>en</strong><strong>de</strong> <strong>de</strong> la<br />

correlación <strong>de</strong> las salidas <strong>de</strong> los clasificadores; <strong>en</strong>tre m<strong>en</strong>or correlación mejores resultados.<br />

Se ha mostrado que este mo<strong>de</strong>lo proporciona una explicación <strong>de</strong> muchos <strong>de</strong> los f<strong>en</strong>óm<strong>en</strong>os<br />

observados <strong>en</strong> experim<strong>en</strong>tos <strong>de</strong> combinación (Vogt y Cottrell, 1998), como el <strong>de</strong>l<br />

increm<strong>en</strong>to <strong>de</strong> la probabilidad <strong>de</strong> relevancia <strong>de</strong> un docum<strong>en</strong>to <strong>en</strong> el caso <strong>de</strong> ser evaluado<br />

altam<strong>en</strong>te relevante por difer<strong>en</strong>tes sistemas. También proporciona condiciones básicas <strong>para</strong><br />

lograr una combinación óptima.<br />

Debido a los logros alcanzados con el <strong>en</strong>foque <strong>de</strong> combinación (conocido también como<br />

fusión) <strong>en</strong> la tarea <strong>de</strong> recuperación <strong>de</strong> <strong>información</strong>, la combinación ha sido aplicada a tareas<br />

relacionadas como filtrado (Hull et al., 1996), categorización (Lewis y Hayes, 1994; Larkey<br />

& Croft, 1996), Búsqueda <strong>de</strong> Respuestas, (Aceves-Pérez, 2008), evaluación <strong>de</strong> resúm<strong>en</strong>es<br />

automáticos (Lapata, 2006) y ha sido estudiada también <strong>en</strong> otros campos como el<br />

apr<strong>en</strong>dizaje automático (Mitchell, 1997; Fürnkranz y Hüllermeier, 2011), o Biología<br />

26

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!