09.11.2013 Views

Recuperación de información para respuesta a preguntas en ...

Recuperación de información para respuesta a preguntas en ...

Recuperación de información para respuesta a preguntas en ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

1.4. Combinación<br />

Como lo muestran las secciones anteriores exist<strong>en</strong> diversos mo<strong>de</strong>los <strong>de</strong> IR. Muchos otros<br />

han sido propuestos y aún sigu<strong>en</strong> si<strong>en</strong>do tema <strong>de</strong> investigación (van Rijsberg<strong>en</strong>, 1986;<br />

Deerwester et al., 1990; Fuhr, 1992; Turtle y Croft, 1992). Conforme tales mo<strong>de</strong>los han ido<br />

<strong>de</strong>sarrollándose, éstos han sido también evaluados int<strong>en</strong>sam<strong>en</strong>te. Des<strong>de</strong> los primeros<br />

experim<strong>en</strong>tos, se observó que difer<strong>en</strong>tes mo<strong>de</strong>los, o alternativam<strong>en</strong>te algoritmos <strong>de</strong><br />

recuperación, <strong>de</strong>volvían relativam<strong>en</strong>te pocos docum<strong>en</strong>tos <strong>en</strong> común, aun cuando la<br />

efectividad <strong>de</strong> recuperación <strong>de</strong> los algoritmos era semejante (McGill et al., 1979; Croft y<br />

Harper, 1979). Estudios similares mostraron que la práctica <strong>de</strong> repres<strong>en</strong>tar los docum<strong>en</strong>tos<br />

con múltiples repres<strong>en</strong>taciones basadas <strong>en</strong> sus difer<strong>en</strong>tes elem<strong>en</strong>tos como sólo el título o el<br />

resum<strong>en</strong>, etc., ofrecía mejores resultados que únicam<strong>en</strong>te todo el cont<strong>en</strong>ido <strong>de</strong>l docum<strong>en</strong>to<br />

(Fisher y Elches<strong>en</strong>, 1972; McGill et al., 1979; Katzer et al., 1982). Éstas, y otras<br />

investigaciones, sugirieron que la localización <strong>de</strong> docum<strong>en</strong>tos relevantes <strong>para</strong> una solicitud<br />

<strong>de</strong> <strong>información</strong> podría estar más allá <strong>de</strong> las capacida<strong>de</strong>s <strong>de</strong> un único mo<strong>de</strong>lo <strong>de</strong><br />

recuperación o una sola forma <strong>de</strong> repres<strong>en</strong>tación. La aus<strong>en</strong>cia <strong>de</strong> coinci<strong>de</strong>ncia observada<br />

<strong>en</strong>tre los conjuntos <strong>de</strong> docum<strong>en</strong>tos relevantes con el uso <strong>de</strong> difer<strong>en</strong>tes algoritmos <strong>de</strong><br />

recuperación (o repres<strong>en</strong>taciones) llevó a dos distintos <strong>en</strong>foques <strong>para</strong> el <strong>de</strong>sarrollo <strong>de</strong><br />

nuevos sistemas y mo<strong>de</strong>los <strong>de</strong> recuperación. Un acercami<strong>en</strong>to ha sido a través <strong>de</strong> la<br />

creación <strong>de</strong> mo<strong>de</strong>los que puedan <strong>de</strong>scribir explícitam<strong>en</strong>te y combinar múltiples fu<strong>en</strong>tes <strong>de</strong><br />

evi<strong>de</strong>ncia acerca <strong>de</strong> la relevancia <strong>de</strong> los docum<strong>en</strong>tos. Estos mo<strong>de</strong>los han sido<br />

principalm<strong>en</strong>te probabilísticos, motivados por el principio <strong>de</strong> or<strong>de</strong>nación probabilístico<br />

(Robertson, 1977), el cual establece que una forma <strong>de</strong> alcanzar la efectividad <strong>de</strong><br />

recuperación óptima es mediante la or<strong>de</strong>nación <strong>de</strong> los textos <strong>en</strong> forma <strong>de</strong>sc<strong>en</strong><strong>de</strong>nte con<br />

respecto a su probabilidad <strong>de</strong> relevancia. El otro <strong>en</strong>foque ha sido el diseñar sistemas que<br />

puedan combinar <strong>de</strong> forma efectiva los resultados <strong>de</strong> múltiples búsquedas, basadas <strong>en</strong><br />

difer<strong>en</strong>tes mo<strong>de</strong>los <strong>de</strong> recuperación. Esta combinación pue<strong>de</strong> realizarse <strong>en</strong> una única<br />

arquitectura (Croft y Thompson, 1987; Fox y France, 1987) o <strong>en</strong> un medio ambi<strong>en</strong>te<br />

heterogéneo y distribuido (Lee, 1995, 1997; Voorhees, et al., 1995; Callan et al., 1995). La<br />

combinación <strong>de</strong> múltiples resultados <strong>de</strong> búsqueda se ha convertido <strong>en</strong> una técnica<br />

importante <strong>en</strong> las bases <strong>de</strong> datos multimedia (Fagin, 1996, 1998) y es actualm<strong>en</strong>te la base<br />

24

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!