16.08.2013 Views

Tesis Doctoral Sistemas de clasificación de preguntas basados - gplsi

Tesis Doctoral Sistemas de clasificación de preguntas basados - gplsi

Tesis Doctoral Sistemas de clasificación de preguntas basados - gplsi

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

2.6. Otras aplicaciones<br />

a acotar la información que están buscando usando directorios temáticos o<br />

taxonomías. El segundo paradigma, la búsqueda directa presente en sitios<br />

como Google, permite a los usuarios escribir sus propias peticiones como<br />

una conjunto <strong>de</strong> palabras clave en una caja <strong>de</strong> texto para llevar a cabo la<br />

búsqueda <strong>de</strong> información.<br />

La búsqueda facetada (Yee et al., 2003) es una nueva aproximación<br />

<strong>de</strong> reciente aparición. Este paradigma preten<strong>de</strong> combinar la búsqueda por<br />

navegación y directa, permitiendo a los usuarios navegar en un espacio<br />

<strong>de</strong> información multidimensional, combinando la búsqueda textual con<br />

una reducción progresiva <strong>de</strong> opciones <strong>de</strong> selección en cada dimensión. Los<br />

sistemas <strong>de</strong> búsqueda facetada asumen que la información está organizada<br />

en múltiples facetas in<strong>de</strong>pendientes, en lugar <strong>de</strong> en una única taxonomía.<br />

Por ejemplo, po<strong>de</strong>mos <strong>de</strong>finir para una guía <strong>de</strong> restaurantes atributos como<br />

cocina, ciudad o servicios. Estos atributos son facetas que ayudan a los<br />

usuarios a navegar a través <strong>de</strong> ellas seleccionando los valores <strong>de</strong>seados,<br />

como por ejemplo mejicana para cocina, madrid para ciudad o aparcamiento<br />

propio para servicios.<br />

Este paradigma se complementa con la búsqueda por categorías (Tunkelang,<br />

2006), que no es una búsqueda directa sobre la información guardada,<br />

sino una búsqueda en el espacio <strong>de</strong> valores posibles <strong>de</strong> las facetas. Mientras<br />

que la búsqueda directa <strong>de</strong>vuelve un conjunto <strong>de</strong> documentos que pue<strong>de</strong>n<br />

ser refinadas posteriormente usando una aproximación basada en búsqueda<br />

facetada, la búsqueda por categorías proporciona resultados que son en<br />

sí mismos puntos <strong>de</strong> entrada <strong>de</strong> una búsqueda facetada. En el ejemplo <strong>de</strong> la<br />

guía <strong>de</strong> restaurantes, un usuario interrogaría al sistema con peticiones como<br />

madrid o italiana para restringir los resultados a restaurantes en esa ciudad<br />

o con este tipo <strong>de</strong> cocina.<br />

Las interfaces actuales a la búsqueda por categoría están limitados a<br />

búsqueda por palabras clave sobre valores <strong>de</strong> las facetas. En el trabajo que<br />

<strong>de</strong>sarrollamos en (Tomás y Vicedo, 2007a) realizamos una novedosa propuesta<br />

para la búsqueda por categorías. Afrontamos el reto <strong>de</strong> i<strong>de</strong>ntificar valores<br />

<strong>de</strong> facetas presentes <strong>de</strong> forma implícita en <strong>preguntas</strong> formuladas en lenguaje<br />

natural. El problema se abordó <strong>de</strong>s<strong>de</strong> el punto <strong>de</strong> vista <strong>de</strong> la CP. Mientras<br />

que los sistemas tradicionales <strong>de</strong> CP están limitados a clasificar <strong>preguntas</strong><br />

sobre una única taxonomía, en este trabajo introdujimos la i<strong>de</strong>a <strong>de</strong> la CP en<br />

múltiples taxonomías. En el contexto <strong>de</strong> la búsqueda por categorías, nuestro<br />

sistema recibe una pregunta y <strong>de</strong>tecta las diferentes facetas (taxonomías) y<br />

sus valores (clases) implícitamente presentes en la pregunta. Los valores<br />

asignados permiten reducir el conjunto <strong>de</strong> documentos relevantes a sólo<br />

aquellos que pertenecen a las clases y taxonomías i<strong>de</strong>ntificadas. Siguiendo el<br />

ejemplo previo, una pregunta como “Estoy buscando un restaurante turco en<br />

Madrid” fijaría el valor <strong>de</strong> la faceta cocina a turco y el <strong>de</strong> ciudad a madrid,<br />

para así <strong>de</strong>volver sólo documentos relativos a restaurantes que cumplan con<br />

estas dos restricciones.<br />

37

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!