Recuperación de información para respuesta a preguntas en ...
Recuperación de información para respuesta a preguntas en ...
Recuperación de información para respuesta a preguntas en ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
1.4. Combinación<br />
Como lo muestran las secciones anteriores exist<strong>en</strong> diversos mo<strong>de</strong>los <strong>de</strong> IR. Muchos otros<br />
han sido propuestos y aún sigu<strong>en</strong> si<strong>en</strong>do tema <strong>de</strong> investigación (van Rijsberg<strong>en</strong>, 1986;<br />
Deerwester et al., 1990; Fuhr, 1992; Turtle y Croft, 1992). Conforme tales mo<strong>de</strong>los han ido<br />
<strong>de</strong>sarrollándose, éstos han sido también evaluados int<strong>en</strong>sam<strong>en</strong>te. Des<strong>de</strong> los primeros<br />
experim<strong>en</strong>tos, se observó que difer<strong>en</strong>tes mo<strong>de</strong>los, o alternativam<strong>en</strong>te algoritmos <strong>de</strong><br />
recuperación, <strong>de</strong>volvían relativam<strong>en</strong>te pocos docum<strong>en</strong>tos <strong>en</strong> común, aun cuando la<br />
efectividad <strong>de</strong> recuperación <strong>de</strong> los algoritmos era semejante (McGill et al., 1979; Croft y<br />
Harper, 1979). Estudios similares mostraron que la práctica <strong>de</strong> repres<strong>en</strong>tar los docum<strong>en</strong>tos<br />
con múltiples repres<strong>en</strong>taciones basadas <strong>en</strong> sus difer<strong>en</strong>tes elem<strong>en</strong>tos como sólo el título o el<br />
resum<strong>en</strong>, etc., ofrecía mejores resultados que únicam<strong>en</strong>te todo el cont<strong>en</strong>ido <strong>de</strong>l docum<strong>en</strong>to<br />
(Fisher y Elches<strong>en</strong>, 1972; McGill et al., 1979; Katzer et al., 1982). Éstas, y otras<br />
investigaciones, sugirieron que la localización <strong>de</strong> docum<strong>en</strong>tos relevantes <strong>para</strong> una solicitud<br />
<strong>de</strong> <strong>información</strong> podría estar más allá <strong>de</strong> las capacida<strong>de</strong>s <strong>de</strong> un único mo<strong>de</strong>lo <strong>de</strong><br />
recuperación o una sola forma <strong>de</strong> repres<strong>en</strong>tación. La aus<strong>en</strong>cia <strong>de</strong> coinci<strong>de</strong>ncia observada<br />
<strong>en</strong>tre los conjuntos <strong>de</strong> docum<strong>en</strong>tos relevantes con el uso <strong>de</strong> difer<strong>en</strong>tes algoritmos <strong>de</strong><br />
recuperación (o repres<strong>en</strong>taciones) llevó a dos distintos <strong>en</strong>foques <strong>para</strong> el <strong>de</strong>sarrollo <strong>de</strong><br />
nuevos sistemas y mo<strong>de</strong>los <strong>de</strong> recuperación. Un acercami<strong>en</strong>to ha sido a través <strong>de</strong> la<br />
creación <strong>de</strong> mo<strong>de</strong>los que puedan <strong>de</strong>scribir explícitam<strong>en</strong>te y combinar múltiples fu<strong>en</strong>tes <strong>de</strong><br />
evi<strong>de</strong>ncia acerca <strong>de</strong> la relevancia <strong>de</strong> los docum<strong>en</strong>tos. Estos mo<strong>de</strong>los han sido<br />
principalm<strong>en</strong>te probabilísticos, motivados por el principio <strong>de</strong> or<strong>de</strong>nación probabilístico<br />
(Robertson, 1977), el cual establece que una forma <strong>de</strong> alcanzar la efectividad <strong>de</strong><br />
recuperación óptima es mediante la or<strong>de</strong>nación <strong>de</strong> los textos <strong>en</strong> forma <strong>de</strong>sc<strong>en</strong><strong>de</strong>nte con<br />
respecto a su probabilidad <strong>de</strong> relevancia. El otro <strong>en</strong>foque ha sido el diseñar sistemas que<br />
puedan combinar <strong>de</strong> forma efectiva los resultados <strong>de</strong> múltiples búsquedas, basadas <strong>en</strong><br />
difer<strong>en</strong>tes mo<strong>de</strong>los <strong>de</strong> recuperación. Esta combinación pue<strong>de</strong> realizarse <strong>en</strong> una única<br />
arquitectura (Croft y Thompson, 1987; Fox y France, 1987) o <strong>en</strong> un medio ambi<strong>en</strong>te<br />
heterogéneo y distribuido (Lee, 1995, 1997; Voorhees, et al., 1995; Callan et al., 1995). La<br />
combinación <strong>de</strong> múltiples resultados <strong>de</strong> búsqueda se ha convertido <strong>en</strong> una técnica<br />
importante <strong>en</strong> las bases <strong>de</strong> datos multimedia (Fagin, 1996, 1998) y es actualm<strong>en</strong>te la base<br />
24