15.11.2013 Views

Análisis sintáctico conducido por un diccionario de patrones de ...

Análisis sintáctico conducido por un diccionario de patrones de ...

Análisis sintáctico conducido por un diccionario de patrones de ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Capítulo 3.<br />

avanzados<br />

<strong>Análisis</strong> <strong>sintáctico</strong> y <strong>de</strong>sambiguación basada en <strong>patrones</strong> <strong>de</strong> manejo<br />

El empleo <strong>de</strong> procesos <strong>de</strong> edición previos al análisis, para <strong>de</strong>limitar los<br />

constituyentes haría menos complejo el análisis <strong>sintáctico</strong>. Sin embargo, esta tarea<br />

requeriría reglas claras <strong>de</strong>l uso <strong>de</strong> la p<strong>un</strong>tuación en el lenguaje. Esto sin consi<strong>de</strong>rar<br />

otras características como la <strong>de</strong>limitación estilística, mediante comillas, guiones,<br />

apóstrofos, etc. la cual tiene <strong>un</strong>a variedad mayor.<br />

2) La insuficiencia <strong>de</strong> cobertura, es <strong>de</strong>cir, tratar con casos <strong>de</strong> oraciones <strong>de</strong><br />

entrada que están fuera <strong>de</strong> la cobertura sintáctica <strong>de</strong>l sistema <strong>de</strong> reglas se ha<br />

consi<strong>de</strong>rado como <strong>un</strong> problema <strong>de</strong> labor intensiva y <strong>de</strong> compilación <strong>de</strong> cantida<strong>de</strong>s<br />

extensas <strong>de</strong> conocimiento lingüístico, dada la propiedad <strong>de</strong> los lenguajes naturales <strong>de</strong><br />

ser infinitos. Sin embargo, esa labor se tiene que <strong>de</strong>tener en algún momento, <strong>por</strong> su<br />

imposibilidad <strong>de</strong> ser total. Esto <strong>de</strong>bido a que cualquier mo<strong>de</strong>lo es limitado, no tiene<br />

<strong>un</strong>a cobertura total <strong>de</strong>l fenómeno que intenta representar. En el caso <strong>de</strong> las gramáticas<br />

generativas, cada <strong>un</strong>a tiene su propia cobertura, siempre restringida.<br />

La ampliación <strong>de</strong> la cobertura no se logra simplemente añadiendo más reglas,<br />

es necesario estudiar cómo afecta cada inserción a la gramática global. A<strong>de</strong>más, como<br />

explicaremos más a<strong>de</strong>lante, la cobertura se ve afectada <strong>por</strong> el grado <strong>de</strong> acierto <strong>de</strong> la<br />

gramática.<br />

3) La <strong>de</strong>sambiguación se requiere para disminuir la gran cantidad generada <strong>de</strong><br />

variantes <strong>de</strong> estructuras. A mayor cobertura, menor número <strong>de</strong> restricciones y <strong>por</strong> lo<br />

tanto mayor cantidad <strong>de</strong> variantes. La introducción <strong>de</strong> mayor cantidad <strong>de</strong> reglas para<br />

la <strong>de</strong>limitación <strong>de</strong> constituyentes (<strong>por</strong> la falta <strong>de</strong> reglas precisas), también introduce<br />

otras posibilida<strong>de</strong>s <strong>de</strong> enlaces <strong>de</strong> constituyentes y <strong>un</strong>a cantidad adicional <strong>de</strong> variantes.<br />

Por lo que el problema a enfocar es la <strong>de</strong>sambiguación.<br />

Mo<strong>de</strong>los empleados<br />

Los mo<strong>de</strong>los matemáticos <strong>de</strong>l lenguaje [Uszkoreit, 96] son, básicamente, <strong>de</strong><br />

dos tipos: los solamente simbólicos y los que adicionalmente aplican métodos<br />

estadísticos. Los simbólicos son sistemas formales axiomáticos compuestos <strong>por</strong> <strong>un</strong><br />

conj<strong>un</strong>to <strong>de</strong> símbolos y <strong>de</strong> reglas, que establecen las combinaciones <strong>de</strong> símbolos. Se<br />

postulan propieda<strong>de</strong>s generales sobre los símbolos así como sus relaciones, y a partir<br />

<strong>de</strong> estos axiomas se obtienen nuevas propieda<strong>de</strong>s <strong>de</strong> manera <strong>de</strong>ductiva. Ejemplos <strong>de</strong><br />

estos mo<strong>de</strong>los son los ya vistos en los enfoques <strong>de</strong> constituyentes y <strong>de</strong> <strong>de</strong>pen<strong>de</strong>ncias.<br />

Los mo<strong>de</strong>los estadísticos fueron <strong>de</strong>sarrollados a partir <strong>de</strong> la Teoría <strong>de</strong> la<br />

Información [Shannon, 49] y la estadística. Estos mo<strong>de</strong>los <strong>de</strong>scriben el lenguaje como<br />

<strong>un</strong> conj<strong>un</strong>to <strong>de</strong> sucesos que presentan <strong>un</strong>a <strong>de</strong>terminada frecuencia; cada morfema,<br />

cada categoría sintáctica, cada sintagma, cada significado tienen <strong>un</strong>a cierta<br />

probabilidad <strong>de</strong> aparecer en <strong>un</strong> <strong>de</strong>terminado contexto. Los mo<strong>de</strong>los estadísticos se<br />

f<strong>un</strong>damentan en los datos obtenidos a partir <strong>de</strong> corpus lingüísticos. La principal<br />

<strong>de</strong>sventaja <strong>de</strong> los métodos estadísticos es que requieren <strong>un</strong>a base estable, requieren<br />

corpus <strong>de</strong> textos que cuenten con todas las palabras necesarias y con frecuencias que<br />

176

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!