Recuperación de información para respuesta a preguntas en ...
Recuperación de información para respuesta a preguntas en ...
Recuperación de información para respuesta a preguntas en ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
En los mo<strong>de</strong>los <strong>de</strong> recuperación, la hipótesis <strong>de</strong> relevancia (R) se basa <strong>en</strong> la observación (o<br />
evi<strong>de</strong>ncia acerca) <strong>de</strong>l cont<strong>en</strong>ido <strong>de</strong> un docum<strong>en</strong>to (D) y una solicitud específica (Q). La<br />
estimación <strong>de</strong> | se pue<strong>de</strong> consi<strong>de</strong>rar como la acumulación <strong>de</strong> piezas <strong>de</strong> evi<strong>de</strong>ncia<br />
proporcionadas por difer<strong>en</strong>tes repres<strong>en</strong>taciones <strong>de</strong> la solicitud y/o los docum<strong>en</strong>tos. La<br />
acumulación <strong>de</strong> más piezas <strong>de</strong> evi<strong>de</strong>ncia podría resultar <strong>en</strong> estimados <strong>de</strong> probabilidad <strong>de</strong><br />
relevancia más precisos si la evi<strong>de</strong>ncia no se correlaciona. A m<strong>en</strong>udo los mo<strong>de</strong>los <strong>de</strong><br />
recuperación introduc<strong>en</strong> conceptos intermedios que ocultan la relación <strong>en</strong>tre las<br />
observaciones y la hipótesis, no obstante, aun <strong>en</strong> tales casos este mo<strong>de</strong>lo simple justifica <strong>en</strong><br />
parte el uso <strong>de</strong> la combinación <strong>de</strong> evi<strong>de</strong>ncia.<br />
En lo que respecta a la combinación <strong>de</strong> los resultados proporcionados por difer<strong>en</strong>tes<br />
algoritmos <strong>de</strong> recuperación sobre una misma repres<strong>en</strong>tación o la combinación <strong>de</strong> la salida<br />
<strong>de</strong> difer<strong>en</strong>tes sistemas <strong>de</strong> recuperación, ambos pue<strong>de</strong>n ser mo<strong>de</strong>lados como una<br />
combinación <strong>de</strong> clasificadores; esto ha mostrado que reduce también los errores <strong>de</strong><br />
clasificación (Tumer y Ghosh, 1999). Un sistema <strong>de</strong> recuperación pue<strong>de</strong> ser consi<strong>de</strong>rado<br />
como un clasificador binario (con la clase relevante y no-relevante). Para un docum<strong>en</strong>to<br />
dado, la salida <strong>de</strong>l sistema correspon<strong>de</strong> a la probabilidad que dicho docum<strong>en</strong>to pert<strong>en</strong>ezca a<br />
la clase relevante. En este <strong>en</strong>foque, los errores <strong>de</strong> clasificación reduc<strong>en</strong> la efectividad <strong>de</strong> la<br />
recuperación. La cantidad <strong>de</strong> reducción <strong>de</strong>l error con la combinación <strong>de</strong>p<strong>en</strong><strong>de</strong> <strong>de</strong> la<br />
correlación <strong>de</strong> las salidas <strong>de</strong> los clasificadores; <strong>en</strong>tre m<strong>en</strong>or correlación mejores resultados.<br />
Se ha mostrado que este mo<strong>de</strong>lo proporciona una explicación <strong>de</strong> muchos <strong>de</strong> los f<strong>en</strong>óm<strong>en</strong>os<br />
observados <strong>en</strong> experim<strong>en</strong>tos <strong>de</strong> combinación (Vogt y Cottrell, 1998), como el <strong>de</strong>l<br />
increm<strong>en</strong>to <strong>de</strong> la probabilidad <strong>de</strong> relevancia <strong>de</strong> un docum<strong>en</strong>to <strong>en</strong> el caso <strong>de</strong> ser evaluado<br />
altam<strong>en</strong>te relevante por difer<strong>en</strong>tes sistemas. También proporciona condiciones básicas <strong>para</strong><br />
lograr una combinación óptima.<br />
Debido a los logros alcanzados con el <strong>en</strong>foque <strong>de</strong> combinación (conocido también como<br />
fusión) <strong>en</strong> la tarea <strong>de</strong> recuperación <strong>de</strong> <strong>información</strong>, la combinación ha sido aplicada a tareas<br />
relacionadas como filtrado (Hull et al., 1996), categorización (Lewis y Hayes, 1994; Larkey<br />
& Croft, 1996), Búsqueda <strong>de</strong> Respuestas, (Aceves-Pérez, 2008), evaluación <strong>de</strong> resúm<strong>en</strong>es<br />
automáticos (Lapata, 2006) y ha sido estudiada también <strong>en</strong> otros campos como el<br />
apr<strong>en</strong>dizaje automático (Mitchell, 1997; Fürnkranz y Hüllermeier, 2011), o Biología<br />
26