Aciertos y errores en la traducción automática - Onomázein
Aciertos y errores en la traducción automática - Onomázein
Aciertos y errores en la traducción automática - Onomázein
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
218 MARÍA ISABEL DIÉGUEZ M.<br />
sale del programa. En otras pa<strong>la</strong>bras, se evalúa el programa solo a<br />
través de su funcionami<strong>en</strong>to. Por lo tanto, como no se puede acceder<br />
a todos los mecanismos del mismo, lo que sería una evaluación de<br />
“caja de cristal” reservada para los que crean y desarrol<strong>la</strong>n los programas<br />
de TA, <strong>la</strong>s afirmaciones sobre <strong>la</strong>s posibles causas de los<br />
<strong>errores</strong> sólo se pued<strong>en</strong> p<strong>la</strong>ntear a nivel de hipótesis, pues no se<br />
pued<strong>en</strong> comprobar empíricam<strong>en</strong>te.<br />
Algunas de <strong>la</strong>s posibles causas de los <strong>errores</strong> más recurr<strong>en</strong>tes<br />
pued<strong>en</strong> ser <strong>la</strong>s sigui<strong>en</strong>tes:<br />
• pres<strong>en</strong>cia de término compuesto unido con guión (no reconoce<br />
el guión)<br />
• el lexema o término no figura <strong>en</strong> lexicón (lexicón mal alim<strong>en</strong>tado)<br />
• pres<strong>en</strong>cia de sintagma de dos o más términos, uno de los cuales<br />
está unido con guión (algoritmo sintáctico defici<strong>en</strong>te)<br />
• pres<strong>en</strong>cia de forma verbal compuesta separada por parte de <strong>la</strong><br />
oración (algoritmo sintáctico defici<strong>en</strong>te)<br />
• elipsis del verbo principal o de lexemas (algoritmo sintáctico<br />
defici<strong>en</strong>te)<br />
• ambigüedad semántica, polisemia, homografía y fraseología<br />
• uso de l<strong>en</strong>guaje figurado<br />
• espacios <strong>en</strong> b<strong>la</strong>nco<br />
• aus<strong>en</strong>cia de conectores<br />
• listado de términos descontextualizados<br />
• algoritmos sintáctico y semántico defici<strong>en</strong>tes.<br />
Antes de concluir, quisiéramos destacar que si bi<strong>en</strong> no se ha<br />
realizado un estudio estadístico cuantitativo de los <strong>errores</strong> pres<strong>en</strong>tes<br />
<strong>en</strong> cada texto del corpus parcial, sí podemos seña<strong>la</strong>r que se observa<br />
un marg<strong>en</strong> mayor de error <strong>en</strong> el resum<strong>en</strong> especializado sobre medio<br />
ambi<strong>en</strong>te que <strong>en</strong> el texto semiespecializado sobre el instituto de<br />
biotecnología. Creemos que este hecho refleja una vez más los resultados<br />
observados <strong>en</strong> investigaciones anteriores (véanse Diéguez y<br />
Riedemann, 1998 y Diéguez y Cabrera, 1998), los cuales demuestran<br />
que, ante <strong>la</strong> pres<strong>en</strong>cia de oraciones re<strong>la</strong>tivam<strong>en</strong>te breves y de sintaxis<br />
simple, el programa de TA reduce considerablem<strong>en</strong>te su marg<strong>en</strong> de<br />
error. Esto se puede observar, <strong>en</strong> g<strong>en</strong>eral, <strong>en</strong> <strong>la</strong>s oraciones analizadas<br />
<strong>en</strong> el texto sobre biotecnología.<br />
Por otra parte, fr<strong>en</strong>te a oraciones sintácticam<strong>en</strong>te cond<strong>en</strong>sadas,<br />
el marg<strong>en</strong> de error es mucho mayor, como se puede observar <strong>en</strong> el<br />
resum<strong>en</strong> sobre medio ambi<strong>en</strong>te. Por razones de economía de l<strong>en</strong>guaje,<br />
<strong>en</strong> este último texto abundan, por ejemplo, <strong>la</strong>s oraciones con<br />
secu<strong>en</strong>cias de dos o más lexemas yuxtapuestos y antepuestos al