Tesis Doctoral Sistemas de clasificación de preguntas basados - gplsi
Tesis Doctoral Sistemas de clasificación de preguntas basados - gplsi
Tesis Doctoral Sistemas de clasificación de preguntas basados - gplsi
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
2.6. Otras aplicaciones<br />
a acotar la información que están buscando usando directorios temáticos o<br />
taxonomías. El segundo paradigma, la búsqueda directa presente en sitios<br />
como Google, permite a los usuarios escribir sus propias peticiones como<br />
una conjunto <strong>de</strong> palabras clave en una caja <strong>de</strong> texto para llevar a cabo la<br />
búsqueda <strong>de</strong> información.<br />
La búsqueda facetada (Yee et al., 2003) es una nueva aproximación<br />
<strong>de</strong> reciente aparición. Este paradigma preten<strong>de</strong> combinar la búsqueda por<br />
navegación y directa, permitiendo a los usuarios navegar en un espacio<br />
<strong>de</strong> información multidimensional, combinando la búsqueda textual con<br />
una reducción progresiva <strong>de</strong> opciones <strong>de</strong> selección en cada dimensión. Los<br />
sistemas <strong>de</strong> búsqueda facetada asumen que la información está organizada<br />
en múltiples facetas in<strong>de</strong>pendientes, en lugar <strong>de</strong> en una única taxonomía.<br />
Por ejemplo, po<strong>de</strong>mos <strong>de</strong>finir para una guía <strong>de</strong> restaurantes atributos como<br />
cocina, ciudad o servicios. Estos atributos son facetas que ayudan a los<br />
usuarios a navegar a través <strong>de</strong> ellas seleccionando los valores <strong>de</strong>seados,<br />
como por ejemplo mejicana para cocina, madrid para ciudad o aparcamiento<br />
propio para servicios.<br />
Este paradigma se complementa con la búsqueda por categorías (Tunkelang,<br />
2006), que no es una búsqueda directa sobre la información guardada,<br />
sino una búsqueda en el espacio <strong>de</strong> valores posibles <strong>de</strong> las facetas. Mientras<br />
que la búsqueda directa <strong>de</strong>vuelve un conjunto <strong>de</strong> documentos que pue<strong>de</strong>n<br />
ser refinadas posteriormente usando una aproximación basada en búsqueda<br />
facetada, la búsqueda por categorías proporciona resultados que son en<br />
sí mismos puntos <strong>de</strong> entrada <strong>de</strong> una búsqueda facetada. En el ejemplo <strong>de</strong> la<br />
guía <strong>de</strong> restaurantes, un usuario interrogaría al sistema con peticiones como<br />
madrid o italiana para restringir los resultados a restaurantes en esa ciudad<br />
o con este tipo <strong>de</strong> cocina.<br />
Las interfaces actuales a la búsqueda por categoría están limitados a<br />
búsqueda por palabras clave sobre valores <strong>de</strong> las facetas. En el trabajo que<br />
<strong>de</strong>sarrollamos en (Tomás y Vicedo, 2007a) realizamos una novedosa propuesta<br />
para la búsqueda por categorías. Afrontamos el reto <strong>de</strong> i<strong>de</strong>ntificar valores<br />
<strong>de</strong> facetas presentes <strong>de</strong> forma implícita en <strong>preguntas</strong> formuladas en lenguaje<br />
natural. El problema se abordó <strong>de</strong>s<strong>de</strong> el punto <strong>de</strong> vista <strong>de</strong> la CP. Mientras<br />
que los sistemas tradicionales <strong>de</strong> CP están limitados a clasificar <strong>preguntas</strong><br />
sobre una única taxonomía, en este trabajo introdujimos la i<strong>de</strong>a <strong>de</strong> la CP en<br />
múltiples taxonomías. En el contexto <strong>de</strong> la búsqueda por categorías, nuestro<br />
sistema recibe una pregunta y <strong>de</strong>tecta las diferentes facetas (taxonomías) y<br />
sus valores (clases) implícitamente presentes en la pregunta. Los valores<br />
asignados permiten reducir el conjunto <strong>de</strong> documentos relevantes a sólo<br />
aquellos que pertenecen a las clases y taxonomías i<strong>de</strong>ntificadas. Siguiendo el<br />
ejemplo previo, una pregunta como “Estoy buscando un restaurante turco en<br />
Madrid” fijaría el valor <strong>de</strong> la faceta cocina a turco y el <strong>de</strong> ciudad a madrid,<br />
para así <strong>de</strong>volver sólo documentos relativos a restaurantes que cumplan con<br />
estas dos restricciones.<br />
37