16.08.2013 Views

Tesis Doctoral Sistemas de clasificación de preguntas basados - gplsi

Tesis Doctoral Sistemas de clasificación de preguntas basados - gplsi

Tesis Doctoral Sistemas de clasificación de preguntas basados - gplsi

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Índice general<br />

3.4.7. Naive Bayes . . . . . . . . . . . . . . . . . . . . . . . . 74<br />

3.4.8. Otros algoritmos . . . . . . . . . . . . . . . . . . . . . 75<br />

3.5. Aproximaciones especiales . . . . . . . . . . . . . . . . . . . . 76<br />

3.6. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . 77<br />

4. CP supervisada basada en n-gramas 81<br />

4.1. Corpus y taxonomías . . . . . . . . . . . . . . . . . . . . . . . 82<br />

4.1.1. Corpus TREC . . . . . . . . . . . . . . . . . . . . . . 82<br />

4.1.2. Corpus QALL-ME . . . . . . . . . . . . . . . . . . . . 85<br />

4.2. Características <strong>de</strong> aprendizaje . . . . . . . . . . . . . . . . . . 86<br />

4.3. Algoritmo <strong>de</strong> aprendizaje . . . . . . . . . . . . . . . . . . . . 90<br />

4.4. Evaluación <strong>de</strong>l sistema . . . . . . . . . . . . . . . . . . . . . . 91<br />

4.4.1. Medidas <strong>de</strong> rendimiento . . . . . . . . . . . . . . . . . 91<br />

4.4.2. Validación cruzada . . . . . . . . . . . . . . . . . . . . 92<br />

4.4.3. Credibilidad <strong>de</strong> los resultados . . . . . . . . . . . . . . 93<br />

4.5. Experimentación . . . . . . . . . . . . . . . . . . . . . . . . . 94<br />

4.5.1. Comparación entre idiomas . . . . . . . . . . . . . . . 95<br />

4.5.2. Comparación entre dominios . . . . . . . . . . . . . . 98<br />

4.5.3. Selección <strong>de</strong> características . . . . . . . . . . . . . . . 101<br />

4.6. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . 112<br />

5. CP semisupervisada explotando textos no etiquetados 115<br />

5.1. Análisis <strong>de</strong> la semántica latente . . . . . . . . . . . . . . . . . 118<br />

5.2. Kernels para la <strong>clasificación</strong> <strong>de</strong> <strong>preguntas</strong> . . . . . . . . . . . 121<br />

5.2.1. Kernel bolsa <strong>de</strong> palabras . . . . . . . . . . . . . . . . . 122<br />

5.2.2. Kernels semánticos . . . . . . . . . . . . . . . . . . . . 123<br />

5.2.3. Kernels compuestos . . . . . . . . . . . . . . . . . . . 126<br />

5.3. Experimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . 126<br />

5.3.1. Descripción <strong>de</strong>l conjunto <strong>de</strong> datos . . . . . . . . . . . 127<br />

5.3.2. Configuración <strong>de</strong> los experimentos . . . . . . . . . . . 127<br />

5.3.3. Resultados experimentales . . . . . . . . . . . . . . . . 129<br />

5.4. Comparación con otros sistemas . . . . . . . . . . . . . . . . . 132<br />

5.5. Conclusiones y trabajo futuro . . . . . . . . . . . . . . . . . . 135<br />

6. CP mínimamente supervisada sobre taxonomías refinadas 137<br />

6.1. Fundamentos estadísticos . . . . . . . . . . . . . . . . . . . . 138<br />

6.1.1. Distribución <strong>de</strong> Poisson . . . . . . . . . . . . . . . . . 138<br />

6.1.2. Divergencia <strong>de</strong> Jensen-Shannon . . . . . . . . . . . . . 139<br />

6.2. Descripción <strong>de</strong>l sistema . . . . . . . . . . . . . . . . . . . . . 139<br />

6.2.1. Generación <strong>de</strong>l conjunto <strong>de</strong> datos . . . . . . . . . . . . 140<br />

6.2.2. Extracción <strong>de</strong> términos y estimación <strong>de</strong> pesos . . . . . 141<br />

6.2.3. Asignación <strong>de</strong> la clase . . . . . . . . . . . . . . . . . . 146<br />

6.3. Experimentos y evaluación . . . . . . . . . . . . . . . . . . . . 148<br />

6.3.1. Configuración <strong>de</strong>l sistema . . . . . . . . . . . . . . . . 151<br />

IV

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!