Tesis Doctoral Sistemas de clasificación de preguntas basados - gplsi
Tesis Doctoral Sistemas de clasificación de preguntas basados - gplsi
Tesis Doctoral Sistemas de clasificación de preguntas basados - gplsi
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Índice general<br />
3.4.7. Naive Bayes . . . . . . . . . . . . . . . . . . . . . . . . 74<br />
3.4.8. Otros algoritmos . . . . . . . . . . . . . . . . . . . . . 75<br />
3.5. Aproximaciones especiales . . . . . . . . . . . . . . . . . . . . 76<br />
3.6. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . 77<br />
4. CP supervisada basada en n-gramas 81<br />
4.1. Corpus y taxonomías . . . . . . . . . . . . . . . . . . . . . . . 82<br />
4.1.1. Corpus TREC . . . . . . . . . . . . . . . . . . . . . . 82<br />
4.1.2. Corpus QALL-ME . . . . . . . . . . . . . . . . . . . . 85<br />
4.2. Características <strong>de</strong> aprendizaje . . . . . . . . . . . . . . . . . . 86<br />
4.3. Algoritmo <strong>de</strong> aprendizaje . . . . . . . . . . . . . . . . . . . . 90<br />
4.4. Evaluación <strong>de</strong>l sistema . . . . . . . . . . . . . . . . . . . . . . 91<br />
4.4.1. Medidas <strong>de</strong> rendimiento . . . . . . . . . . . . . . . . . 91<br />
4.4.2. Validación cruzada . . . . . . . . . . . . . . . . . . . . 92<br />
4.4.3. Credibilidad <strong>de</strong> los resultados . . . . . . . . . . . . . . 93<br />
4.5. Experimentación . . . . . . . . . . . . . . . . . . . . . . . . . 94<br />
4.5.1. Comparación entre idiomas . . . . . . . . . . . . . . . 95<br />
4.5.2. Comparación entre dominios . . . . . . . . . . . . . . 98<br />
4.5.3. Selección <strong>de</strong> características . . . . . . . . . . . . . . . 101<br />
4.6. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . 112<br />
5. CP semisupervisada explotando textos no etiquetados 115<br />
5.1. Análisis <strong>de</strong> la semántica latente . . . . . . . . . . . . . . . . . 118<br />
5.2. Kernels para la <strong>clasificación</strong> <strong>de</strong> <strong>preguntas</strong> . . . . . . . . . . . 121<br />
5.2.1. Kernel bolsa <strong>de</strong> palabras . . . . . . . . . . . . . . . . . 122<br />
5.2.2. Kernels semánticos . . . . . . . . . . . . . . . . . . . . 123<br />
5.2.3. Kernels compuestos . . . . . . . . . . . . . . . . . . . 126<br />
5.3. Experimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . 126<br />
5.3.1. Descripción <strong>de</strong>l conjunto <strong>de</strong> datos . . . . . . . . . . . 127<br />
5.3.2. Configuración <strong>de</strong> los experimentos . . . . . . . . . . . 127<br />
5.3.3. Resultados experimentales . . . . . . . . . . . . . . . . 129<br />
5.4. Comparación con otros sistemas . . . . . . . . . . . . . . . . . 132<br />
5.5. Conclusiones y trabajo futuro . . . . . . . . . . . . . . . . . . 135<br />
6. CP mínimamente supervisada sobre taxonomías refinadas 137<br />
6.1. Fundamentos estadísticos . . . . . . . . . . . . . . . . . . . . 138<br />
6.1.1. Distribución <strong>de</strong> Poisson . . . . . . . . . . . . . . . . . 138<br />
6.1.2. Divergencia <strong>de</strong> Jensen-Shannon . . . . . . . . . . . . . 139<br />
6.2. Descripción <strong>de</strong>l sistema . . . . . . . . . . . . . . . . . . . . . 139<br />
6.2.1. Generación <strong>de</strong>l conjunto <strong>de</strong> datos . . . . . . . . . . . . 140<br />
6.2.2. Extracción <strong>de</strong> términos y estimación <strong>de</strong> pesos . . . . . 141<br />
6.2.3. Asignación <strong>de</strong> la clase . . . . . . . . . . . . . . . . . . 146<br />
6.3. Experimentos y evaluación . . . . . . . . . . . . . . . . . . . . 148<br />
6.3.1. Configuración <strong>de</strong>l sistema . . . . . . . . . . . . . . . . 151<br />
IV