10.05.2013 Views

Revisión asistida por ordenador de traducciones - OpenTranslation

Revisión asistida por ordenador de traducciones - OpenTranslation

Revisión asistida por ordenador de traducciones - OpenTranslation

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

José Ignacio Perea Sardón<br />

5.1.1. Ortografía y gramática<br />

5.1.1.1. Pretratamiento <strong>de</strong> la traducción<br />

Las comprobaciones <strong>de</strong> ortografía y gramática utilizan etiquetas gramaticales<br />

para <strong>de</strong>tectar posibles anomalías. Para ello, es necesario aplicar previamente<br />

PETRA TAG I, el etiquetador <strong>de</strong>scrito en § 4.1.1.2.1, a la traducción.<br />

Para realizar estas comprobaciones correctamente, el etiquetado <strong>de</strong>be ser<br />

lo más completo y exacto posible. El <strong>por</strong>centaje <strong>de</strong> etiquetado <strong>de</strong> los token<br />

<strong>de</strong>l conjunto <strong>de</strong> textos <strong>de</strong>stinado al entrenamiento oscila entre el mínimo<br />

<strong>de</strong> 97,03% <strong>de</strong> KDE y el máximo <strong>de</strong> 99,52% <strong>de</strong> OpenOffice, con una media<br />

<strong>de</strong>l 98,28% (tabla 15).<br />

176<br />

Proyecto<br />

Total<br />

token<br />

Token<br />

etiquetados<br />

Mozilla 24052 23809 98,99<br />

Ubuntu 73397 71659 97,63<br />

Gnome 54711 53470 97,73<br />

OpenOffice 118045 117484 99,52<br />

KDE 51838 50296 97,03<br />

Otros 82139 80495 98,00<br />

Total 404182 397213 98,28<br />

Tabla 15. Token etiquetados<br />

A pesar <strong>de</strong> ser bastante elevado, este <strong>por</strong>centaje es algo inferior al recomendable,<br />

ya que los resultados <strong>de</strong>l etiquetado tienen numerosas aplicaciones.<br />

Aunque una parte <strong>de</strong> las palabras que no se han podido etiquetar<br />

pue<strong>de</strong> achacarse a que el diccionario <strong>de</strong>l etiquetador no es suficientemente<br />

completo, otro número consi<strong>de</strong>rable <strong>de</strong> palabras no se pue<strong>de</strong> etiquetar <strong>por</strong><br />

la presencia <strong>de</strong> <strong>de</strong>terminados caracteres que, colocados con el objetivo <strong>de</strong><br />

indicar los aceleradores <strong>de</strong> teclado, saltos <strong>de</strong> línea, tabuladores, etc., confun<strong>de</strong>n<br />

al etiquetador, que consi<strong>de</strong>ra dos palabras algunas secuencias que no<br />

son más que una, como muestran los ejemplos 72 y 73:<br />

O Displa&y service for:<br />

T Mo&strar servicio para:<br />

Ejemplo 72. Token no etiquetado a consecuencia<br />

<strong>de</strong> un carácter <strong>de</strong> método abreviado<br />

%

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!