Tesis Doctoral Sistemas de clasificación de preguntas basados - gplsi
Tesis Doctoral Sistemas de clasificación de preguntas basados - gplsi
Tesis Doctoral Sistemas de clasificación de preguntas basados - gplsi
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
1.4. Estructura <strong>de</strong> la tesis<br />
corpus <strong>de</strong> entrenamiento para ofrecer una cobertura a<strong>de</strong>cuada al problema.<br />
Las tareas a realizar en esta fase son:<br />
Definir un mo<strong>de</strong>lo para la adquisición automática <strong>de</strong> muestras <strong>de</strong><br />
entrenamiento. Evitamos <strong>de</strong> esta manera la adquisición <strong>de</strong> gran<strong>de</strong>s<br />
conjuntos <strong>de</strong> datos <strong>de</strong> entrenamiento.<br />
Desarrollar un conjunto <strong>de</strong> datos <strong>de</strong> evaluación sobre una taxonomía<br />
refinada que nos permita medir el rendimiento <strong>de</strong>l sistema.<br />
Evaluar el sistema sobre diferentes idiomas.<br />
Comparar nuestra aproximación con los sistemas <strong>de</strong> aprendizaje<br />
existentes, valorando las ventajas aportadas por nuestra propuesta.<br />
1.4. Estructura <strong>de</strong> la tesis<br />
Vamos a esbozar a continuación la organización y contenido <strong>de</strong>l resto <strong>de</strong><br />
capítulos que conforman este trabajo <strong>de</strong> tesis:<br />
En el capítulo 2 presentaremos la problemática que afrontan las<br />
aplicaciones que trabajan con lenguaje natural. Describiremos formalmente<br />
los sistemas <strong>de</strong> CP y los situaremos <strong>de</strong>ntro <strong>de</strong>l campo <strong>de</strong> la BR.<br />
Se ofrecerán también referencias a otras tareas don<strong>de</strong> los sistemas <strong>de</strong><br />
CP resultan <strong>de</strong> utilidad.<br />
En el capítulo 3 <strong>de</strong>scribiremos en <strong>de</strong>talle los sistemas <strong>de</strong> CP <strong>basados</strong><br />
en aprendizaje automático y presentaremos el pasado y presente <strong>de</strong><br />
estos sistemas <strong>de</strong>s<strong>de</strong> diferentes perspectivas: según los algoritmos,<br />
según las características <strong>de</strong> aprendizaje, según los recursos empleados<br />
y según los corpus y taxonomías sobre los que apren<strong>de</strong>n y clasifican.<br />
En el capítulo 4 mostraremos el trabajo realizado para completar la<br />
primera aproximación <strong>de</strong> nuestra metodología. Haremos un estudio<br />
comparativo <strong>de</strong> diferentes corpus y características <strong>de</strong> aprendizaje,<br />
seleccionando las mejores configuraciones para la obtención <strong>de</strong> sistemas<br />
<strong>de</strong> CP flexibles.<br />
En el capítulo 5 afrontaremos las tareas necesarias para completar<br />
la segunda aproximación <strong>de</strong> la metodología. Plantearemos un método<br />
para la incorporación <strong>de</strong> información semántica al proceso <strong>de</strong><br />
aprendizaje que mejore la funcionalidad <strong>de</strong>l sistema <strong>de</strong> CP, todo ello<br />
sin comprometer su capacidad <strong>de</strong> adaptarse a diferentes idiomas y<br />
dominios.<br />
11