15.11.2013 Views

Análisis sintáctico conducido por un diccionario de patrones de ...

Análisis sintáctico conducido por un diccionario de patrones de ...

Análisis sintáctico conducido por un diccionario de patrones de ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Capítulo 3.<br />

avanzados<br />

<strong>Análisis</strong> <strong>sintáctico</strong> y <strong>de</strong>sambiguación basada en <strong>patrones</strong> <strong>de</strong> manejo<br />

I<strong>de</strong>a <strong>de</strong> combinación <strong>de</strong> métodos<br />

En esta investigación, consi<strong>de</strong>ramos que la resolución <strong>de</strong> la ambigüedad<br />

sintáctica requiere <strong>un</strong> sistema compuesto <strong>de</strong> <strong>un</strong> conj<strong>un</strong>to <strong>de</strong> métodos. Es <strong>de</strong>cir, se<br />

requiere <strong>de</strong>sarrollar <strong>un</strong> conj<strong>un</strong>to <strong>de</strong> módulos basados en mo<strong>de</strong>los <strong>de</strong> tipos diferentes<br />

<strong>de</strong> conocimiento, que analicen las oraciones, y <strong>de</strong> sus resultados tomar la <strong>de</strong>cisión<br />

final <strong>de</strong> cuáles son las variantes aceptables en base a <strong>un</strong>a votación. De esta forma,<br />

cada <strong>un</strong>o <strong>de</strong> los módulos dará <strong>un</strong>a medida cuantitativa <strong>de</strong> la probabilidad <strong>de</strong> <strong>un</strong>a u<br />

otra variante <strong>de</strong> estructura, y finalmente el sistema completo elegirá las variantes con<br />

los valores máximos <strong>de</strong> esas evaluaciones estadísticas.<br />

La i<strong>de</strong>a no es muy nueva. En otras áreas como en el marcaje <strong>de</strong> POS se ha<br />

empleado esta misma i<strong>de</strong>a. En este marcaje existen métodos híbridos que combinan<br />

diferentes aproximaciones, <strong>por</strong> ejemplo el uso <strong>de</strong> recursos basados en estadísticas y<br />

en conocimiento lingüístico, como en [Tzoukerman et al, 94]. [Samuelson &<br />

Voutilainen, 97] presentan <strong>un</strong>a discusión comparativa <strong>de</strong> marcadores <strong>de</strong> partes <strong>de</strong>l<br />

habla basados en lingüística y en estadística. [Padró, 98] usa relajación, <strong>un</strong> algoritmo<br />

iterativo para realizar optimización <strong>de</strong> f<strong>un</strong>ciones basada en información local, que<br />

también permite el uso <strong>de</strong> restricciones con múltiples características provenientes <strong>de</strong><br />

diversas fuentes.<br />

En el análisis <strong>sintáctico</strong>, se ha intentado emplear diferentes mo<strong>de</strong>los como<br />

base <strong>de</strong> <strong>un</strong> método solo. Por ejemplo, [Abney, 91] se basa en estudios sicolingüísticos<br />

<strong>de</strong> [Gee & Grosjean, 83] para proponer el análisis <strong>sintáctico</strong> superficial. [Gee &<br />

Grosjean, 83] enlazan duraciones <strong>de</strong> pausa en la lectura y esquematización <strong>de</strong><br />

oraciones ingenuas, a grupos <strong>de</strong> texto, que <strong>de</strong> <strong>un</strong>a manera muy general correspon<strong>de</strong>n<br />

a la separación <strong>de</strong> <strong>un</strong>a ca<strong>de</strong>na <strong>de</strong> palabras <strong>de</strong>spués <strong>de</strong> cada núcleo-h. El análisis<br />

<strong>sintáctico</strong> superficial analiza partes <strong>de</strong> la oración. La oración se segmenta en partes no<br />

traslapadas, el análisis <strong>de</strong> estos segmentos es la base <strong>de</strong>l análisis <strong>sintáctico</strong> total, que<br />

<strong>de</strong>tecta los argumentos <strong>de</strong>l verbo y pospone <strong>de</strong>cisiones <strong>de</strong> enlaces <strong>de</strong> grupos<br />

preposicionales.<br />

[Magerman, 95] basa el análisis <strong>sintáctico</strong> en métodos estadísticos que<br />

reemplacen las habilida<strong>de</strong>s <strong>de</strong> toma <strong>de</strong> <strong>de</strong>cisiones <strong>de</strong>l ser humano con algoritmos <strong>de</strong><br />

toma <strong>de</strong> <strong>de</strong>cisión. Emplea algoritmos <strong>de</strong> clasificación <strong>de</strong> árboles <strong>de</strong> <strong>de</strong>cisiones, que<br />

a<strong>de</strong>más <strong>de</strong> i<strong>de</strong>ntificar características relevantes para cada <strong>de</strong>cisión y <strong>de</strong>cidir la<br />

selección basándose en esas características, asignan <strong>un</strong>a distribución <strong>de</strong><br />

probabilida<strong>de</strong>s a las elecciones posibles.<br />

Para nosotros, dado que no po<strong>de</strong>mos reproducir las habilida<strong>de</strong>s humanas para<br />

enten<strong>de</strong>r <strong>un</strong>a oración, el análisis <strong>sintáctico</strong> y su <strong>de</strong>sambiguación <strong>de</strong>be basarse en<br />

mo<strong>de</strong>los <strong>de</strong> conocimiento diverso. La elección <strong>de</strong> estructura <strong>de</strong>be hacerse en términos<br />

cuantitativos, asignando pesos, o evaluaciones estadísticas, a cada <strong>un</strong>a <strong>de</strong> las variantes<br />

<strong>de</strong> estructura sintáctica. La variante con el peso más gran<strong>de</strong> se consi<strong>de</strong>ra como la<br />

mejor, mientras mayor sea el peso más posibilida<strong>de</strong>s tiene <strong>de</strong> ser la variante correcta.<br />

178

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!