10.05.2013 Views

Revisión asistida por ordenador de traducciones - OpenTranslation

Revisión asistida por ordenador de traducciones - OpenTranslation

Revisión asistida por ordenador de traducciones - OpenTranslation

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

José Ignacio Perea Sardón<br />

Cuando la diferencia era superior al 5%, se trasladaba un archivo <strong>de</strong> una parte<br />

a la otra, si el número <strong>de</strong> archivos disponibles lo permitía. Después se reexaminaba<br />

el <strong>por</strong>centaje y se repetía el proceso hasta que la diferencia <strong>por</strong>centual<br />

<strong>de</strong> segmentos entre los dos grupos fue inferior al 5%. La tabla 8 <strong>de</strong>scribe<br />

los dos conjuntos <strong>por</strong> el número total <strong>de</strong> archivos, segmentos y token.<br />

156<br />

Entrenamiento Evaluación<br />

Proyecto Archivos Segmentos Token Archivos Segmentos Token<br />

Mozilla 1 3814 23644 1 1887 7481<br />

Ubuntu 36 4052 95462 21 3962 93081<br />

Gnome 25 8191 57003 20 8320 82018<br />

OpenOffice 104 37545 395333 149 39244 380866<br />

KDE 314 42988 307272 272 40119 291368<br />

Otros 186 93197 716511 241 95206 743234<br />

Total 666 189787 1595225 704 188738 1598048<br />

Tabla 8. Número <strong>de</strong> archivos, segmentos y token <strong>de</strong> los<br />

bloques <strong>de</strong> entrenamiento y evaluación<br />

Los componentes tienen tamaños muy distintos. En algunos casos eran<br />

excesivamente gran<strong>de</strong>s, lo que dificultaba el análisis y la exposición <strong>de</strong> los<br />

resultados <strong>de</strong> las operaciones <strong>de</strong> revisión. Por tanto, se optó <strong>por</strong> extraer<br />

una muestra representativa <strong>de</strong> cada uno <strong>de</strong> los bloques. Para ello, se<br />

aplicaron dos criterios. En primer lugar, cuando el número lo permitía, se<br />

tomó un mínimo <strong>de</strong> veinte archivos, para disponer <strong>de</strong>l suficiente texto<br />

traducido que garantizara el funcionamiento <strong>de</strong> algunas operaciones <strong>de</strong><br />

revisión que requieren cierta cantidad <strong>de</strong> texto. En segundo lugar, el<br />

<strong>por</strong>centaje <strong>de</strong> archivos extraídos <strong>de</strong>bía ser siempre superior al diez <strong>por</strong><br />

ciento <strong>de</strong>l total <strong>de</strong> archivos <strong>de</strong> dicho componente en ambos bloques. Este<br />

<strong>por</strong>centaje se estipuló siguiendo las directrices <strong>de</strong>l LISA QA Mo<strong>de</strong>l, que lo<br />

consi<strong>de</strong>ra aceptable para obtener una evaluación fiable <strong>de</strong> una traducción.<br />

Los tamaños <strong>de</strong> las muestras resultantes se resumen en la tabla 9.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!