15.11.2013 Views

Análisis sintáctico conducido por un diccionario de patrones de ...

Análisis sintáctico conducido por un diccionario de patrones de ...

Análisis sintáctico conducido por un diccionario de patrones de ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Introducción<br />

OBJETIVO<br />

Esta tesis propone <strong>un</strong> mo<strong>de</strong>lo para resolver el problema <strong>de</strong>l análisis <strong>sintáctico</strong><br />

relacionado a la gran cantidad <strong>de</strong> variantes generadas cuando se analizan textos sin<br />

restricciones. El mo<strong>de</strong>lo consi<strong>de</strong>ra <strong>un</strong> algoritmo <strong>de</strong> <strong>de</strong>sambiguación basado en tres<br />

diferentes fuentes <strong>de</strong> conocimiento <strong>de</strong>l lenguaje, <strong>de</strong> las cuales la fuente principal<br />

dirige el análisis mediante conocimiento lingüístico. El algoritmo <strong>de</strong> <strong>de</strong>sambiguación<br />

sintáctica restringe la gran cantidad <strong>de</strong> variantes que normalmente se generan, así que<br />

la base <strong>de</strong>l análisis <strong>sintáctico</strong> pasa <strong>de</strong> la tarea infinita <strong>de</strong> <strong>de</strong>finir <strong>un</strong>a gramática <strong>de</strong><br />

cobertura total para el lenguaje, la forma tradicional, a la tarea principal <strong>de</strong> buscar los<br />

objetos <strong>de</strong> cada palabra.<br />

La primera fuente <strong>de</strong> conocimiento es lingüística y se <strong>de</strong>scribe en <strong>un</strong>a<br />

colección <strong>de</strong> <strong>patrones</strong> <strong>de</strong> manejo <strong>sintáctico</strong> que reúnen información <strong>de</strong> cómo las<br />

palabras <strong>de</strong>l español especifican léxicamente sus objetos, la seg<strong>un</strong>da fuente se<br />

<strong>de</strong>scribe en <strong>un</strong>a gramática extendida in<strong>de</strong>pendiente <strong>de</strong>l contexto para el español, y la<br />

tercera fuente se basa en proximidad semántica entre palabras.<br />

Para lograr este objetivo, primero analizamos las características <strong>de</strong>l español,<br />

principalmente las que difieren <strong>de</strong> los lenguajes cuyo or<strong>de</strong>n <strong>de</strong> palabras es más<br />

estricto, para <strong>de</strong>scribirlas bajo <strong>un</strong> enfoque generalizado <strong>de</strong> <strong>de</strong>scripción <strong>de</strong> valencias,<br />

con mayor énfasis en el formalismo <strong>de</strong> la MTT. Basándonos en este análisis<br />

proponemos <strong>un</strong>a forma nueva <strong>de</strong> <strong>de</strong>scripción <strong>de</strong> los Patrones <strong>de</strong> manejo, la<br />

<strong>de</strong>nominamos Patrones <strong>de</strong> manejo avanzados, con información cualitativa para el<br />

análisis <strong>sintáctico</strong>. Debido al conocimiento lingüístico que se requiere en dichos<br />

<strong>patrones</strong>, proponemos <strong>un</strong> método semiautomático <strong>de</strong> adquisición <strong>de</strong> esa información,<br />

a partir <strong>de</strong> <strong>un</strong> corpus <strong>de</strong> textos. Por último, proponemos <strong>un</strong> algoritmo para reducir el<br />

número <strong>de</strong> variantes posibles <strong>de</strong> análisis, es <strong>de</strong>cir, <strong>de</strong> <strong>de</strong>sambiguación sintáctica.<br />

Por lo que la investigación <strong>de</strong>scrita en esta tesis incluye nuevas contribuciones<br />

en los aspectos explicados en las siguientes secciones.<br />

26

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!