15.11.2013 Views

Análisis sintáctico conducido por un diccionario de patrones de ...

Análisis sintáctico conducido por un diccionario de patrones de ...

Análisis sintáctico conducido por un diccionario de patrones de ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Capítulo 2. Compilación <strong>de</strong>l <strong>diccionario</strong> <strong>de</strong> verbos españoles con sus estructuras <strong>de</strong><br />

valencias<br />

<strong>de</strong> Cultura la <strong>de</strong>signación <strong>de</strong> dos inspectores técnicos.<br />

Los aficionados solicitaron <strong>un</strong>os pases con el <strong>de</strong>legado.<br />

Y <strong>de</strong> entre estas realizaciones alg<strong>un</strong>as son más frecuentes que otras, es <strong>de</strong>cir,<br />

tienen diferentes probabilida<strong>de</strong>s. La obligatoriedad queda implícita en este peso. Si<br />

<strong>un</strong>a valencia tiene presencia en todas las oraciones extraídas <strong>de</strong>l corpus para <strong>un</strong> verbo<br />

específico, se consi<strong>de</strong>ra como <strong>un</strong>a evi<strong>de</strong>ncia <strong>de</strong> obligatoriedad.<br />

El último atributo, correspon<strong>de</strong> a la cuarta sección <strong>de</strong> los PM, los ejemplos <strong>de</strong><br />

combinaciones posibles y <strong>de</strong> las combinaciones no permitidas. Entre las dificulta<strong>de</strong>s<br />

que se presentan para <strong>de</strong>finir los ejemplos <strong>de</strong> esta sección se encuentran los<br />

siguientes:<br />

• No <strong>de</strong>ben ser aleatorios.<br />

• Se basan en experiencia.<br />

• Se requiere que sean exhaustivos.<br />

Lo que implica que los ejemplos posibles e imposibles se <strong>de</strong>ben <strong>de</strong>scribir <strong>por</strong><br />

personas muy calificadas. A<strong>de</strong>más <strong>de</strong> esto hay que consi<strong>de</strong>rar que el español tiene <strong>un</strong><br />

or<strong>de</strong>n <strong>de</strong> palabras más libre que el inglés pero no totalmente libre, <strong>por</strong> lo que las<br />

posibles combinaciones <strong>de</strong> valencias son limitadas. A partir <strong>de</strong> la indicación <strong>de</strong><br />

obligatoriedad se pue<strong>de</strong>n <strong>de</strong>finir alg<strong>un</strong>as combinaciones no <strong>de</strong>seadas, pero no la<br />

totalidad. Las combinaciones posibles y las prohibidas pue<strong>de</strong>n <strong>de</strong>finirse basándose en<br />

cierta experiencia pero no reflejarían los cambios en el lenguaje ni las preferencias en<br />

dominios específicos. Por lo que para adquirir esta información consi<strong>de</strong>ramos la<br />

obtención <strong>de</strong> pesos estadísticos.<br />

Para el inglés f<strong>un</strong>ciona bien buscar usualmente todos los objetos <strong>de</strong>l verbo<br />

<strong>de</strong>spués <strong>de</strong> él. Sin embargo, para el español, la información <strong>de</strong> posibles posiciones <strong>de</strong><br />

la valencia es necesaria para el analizador <strong>sintáctico</strong>. Por ejemplo, en las frases 1, 2 y<br />

3, anteriores, el objeto indirecto no aparece <strong>de</strong>spués <strong>de</strong>l verbo, <strong>de</strong> tres maneras<br />

distintas: 1) en la forma a GN antes <strong>de</strong>l verbo, 2) como pronombre reflexivo entre<br />

sujeto y verbo, y 3) como clítico <strong>de</strong>ntro <strong>de</strong>l verbo.<br />

Así que a<strong>de</strong>más <strong>de</strong> la información <strong>de</strong>terminística, incluimos en los PAM<br />

información <strong>de</strong> evaluación, en forma numérica <strong>de</strong> probabilida<strong>de</strong>s <strong>de</strong> diferentes<br />

opciones. La información <strong>de</strong> evaluación incluye:<br />

• Probabilida<strong>de</strong>s <strong>de</strong> llenado <strong>de</strong> diferentes valencias.<br />

• Probabilida<strong>de</strong>s <strong>de</strong>l uso <strong>de</strong> diferentes opciones <strong>de</strong> la misma valencia.<br />

• Medidas <strong>de</strong> compatibilidad <strong>de</strong> varias combinaciones <strong>de</strong> opciones<br />

específicas para diferentes valencias.<br />

Esta información, <strong>de</strong>terminística y probabilística, es muy útil para el<br />

procesamiento lingüístico <strong>de</strong> textos <strong>por</strong> computadora. Esta información tiene uso<br />

170

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!