10.05.2013 Views

Revisión asistida por ordenador de traducciones - OpenTranslation

Revisión asistida por ordenador de traducciones - OpenTranslation

Revisión asistida por ordenador de traducciones - OpenTranslation

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Revisión</strong> <strong>asistida</strong> <strong>por</strong> <strong>or<strong>de</strong>nador</strong> <strong>de</strong> <strong>traducciones</strong><br />

Antes Después<br />

Proyecto Total token Etiquetados % Total token Etiquetados % Diferenc.<br />

Mozilla 24052 23809 98,99 24080 23865 99,11 0,12<br />

Ubuntu 73397 71659 97,63 69832 69308 99,25 1,62<br />

Gnome 54711 53470 97,73 53535 52928 98,87 1,13<br />

OpenOffice 118045 117484 99,52 118047 117543 99,57 0,05<br />

KDE 51838 50296 97,03 51035 50393 98,74 1,72<br />

Otros 82139 80495 98,00 82120 81060 98,71 0,71<br />

Total 404182 397213 98,28 398649 395097 99,11 0,83<br />

Tabla 17. Token etiquetados antes y <strong>de</strong>spués <strong>de</strong>l pretratamiento<br />

Estas cifras indican ya un <strong>por</strong>centaje razonable <strong>de</strong> token etiquetados, aunque<br />

también hay que tener en cuenta que el etiquetador ha seguido el<br />

criterio <strong>de</strong> no asignar etiqueta alguna a las palabras escritas incorrectamente.<br />

Dado que todos los proyectos tienen un número consi<strong>de</strong>rable <strong>de</strong><br />

errores <strong>de</strong> ortografía o mecanografiado, las cifras <strong>de</strong> palabras etiquetadas<br />

mostradas en la tabla 17 serían consi<strong>de</strong>rablemente superiores si todas las<br />

palabras se hubieran escrito correctamente.<br />

5.1.1.2. Errores <strong>de</strong> ortografía o mecanografiado<br />

La lista <strong>de</strong> palabras que el etiquetador no ha podido reconocer tiene una<br />

doble utilidad. Por una parte, indica <strong>de</strong> manera reducida y bastante<br />

precisa las palabras que no aparecen en el diccionario <strong>de</strong>l etiquetador. Así,<br />

si se aplica a esta lista el corrector ortográfico <strong>de</strong> cualquier procesador <strong>de</strong><br />

texto (<strong>por</strong> ejemplo, el <strong>de</strong>l OpenOffice Writer), es posible <strong>de</strong>tectar con<br />

rapi<strong>de</strong>z las palabras mal escritas. Si esta misma operación se realizase<br />

directamente sobre el texto <strong>de</strong> la traducción se tardaría mucho más, ya<br />

que la lista excluye muchos elementos que <strong>de</strong>mandan la atención <strong>de</strong>l<br />

usuario al usar el corrector. Estos elementos, que no suelen obrar en los<br />

diccionarios <strong>de</strong> los correctores ortográficos, son los siguientes:<br />

Elementos que aparecen en la traducción igual que en el<br />

original. Estos elementos se marcan directamente como nombres<br />

propios. Por ejemplo, el comando sudo.<br />

Elementos que comienzan <strong>por</strong> mayúsculas. Estos elementos<br />

también se etiquetan directamente como nombres propios. Por ejemplo,<br />

muchos términos geográficos, como Groenlandia.<br />

179

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!