16.08.2013 Views

Tesis Doctoral Sistemas de clasificación de preguntas basados - gplsi

Tesis Doctoral Sistemas de clasificación de preguntas basados - gplsi

Tesis Doctoral Sistemas de clasificación de preguntas basados - gplsi

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

1.4. Estructura <strong>de</strong> la tesis<br />

corpus <strong>de</strong> entrenamiento para ofrecer una cobertura a<strong>de</strong>cuada al problema.<br />

Las tareas a realizar en esta fase son:<br />

Definir un mo<strong>de</strong>lo para la adquisición automática <strong>de</strong> muestras <strong>de</strong><br />

entrenamiento. Evitamos <strong>de</strong> esta manera la adquisición <strong>de</strong> gran<strong>de</strong>s<br />

conjuntos <strong>de</strong> datos <strong>de</strong> entrenamiento.<br />

Desarrollar un conjunto <strong>de</strong> datos <strong>de</strong> evaluación sobre una taxonomía<br />

refinada que nos permita medir el rendimiento <strong>de</strong>l sistema.<br />

Evaluar el sistema sobre diferentes idiomas.<br />

Comparar nuestra aproximación con los sistemas <strong>de</strong> aprendizaje<br />

existentes, valorando las ventajas aportadas por nuestra propuesta.<br />

1.4. Estructura <strong>de</strong> la tesis<br />

Vamos a esbozar a continuación la organización y contenido <strong>de</strong>l resto <strong>de</strong><br />

capítulos que conforman este trabajo <strong>de</strong> tesis:<br />

En el capítulo 2 presentaremos la problemática que afrontan las<br />

aplicaciones que trabajan con lenguaje natural. Describiremos formalmente<br />

los sistemas <strong>de</strong> CP y los situaremos <strong>de</strong>ntro <strong>de</strong>l campo <strong>de</strong> la BR.<br />

Se ofrecerán también referencias a otras tareas don<strong>de</strong> los sistemas <strong>de</strong><br />

CP resultan <strong>de</strong> utilidad.<br />

En el capítulo 3 <strong>de</strong>scribiremos en <strong>de</strong>talle los sistemas <strong>de</strong> CP <strong>basados</strong><br />

en aprendizaje automático y presentaremos el pasado y presente <strong>de</strong><br />

estos sistemas <strong>de</strong>s<strong>de</strong> diferentes perspectivas: según los algoritmos,<br />

según las características <strong>de</strong> aprendizaje, según los recursos empleados<br />

y según los corpus y taxonomías sobre los que apren<strong>de</strong>n y clasifican.<br />

En el capítulo 4 mostraremos el trabajo realizado para completar la<br />

primera aproximación <strong>de</strong> nuestra metodología. Haremos un estudio<br />

comparativo <strong>de</strong> diferentes corpus y características <strong>de</strong> aprendizaje,<br />

seleccionando las mejores configuraciones para la obtención <strong>de</strong> sistemas<br />

<strong>de</strong> CP flexibles.<br />

En el capítulo 5 afrontaremos las tareas necesarias para completar<br />

la segunda aproximación <strong>de</strong> la metodología. Plantearemos un método<br />

para la incorporación <strong>de</strong> información semántica al proceso <strong>de</strong><br />

aprendizaje que mejore la funcionalidad <strong>de</strong>l sistema <strong>de</strong> CP, todo ello<br />

sin comprometer su capacidad <strong>de</strong> adaptarse a diferentes idiomas y<br />

dominios.<br />

11

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!