10.05.2013 Views

Revisión asistida por ordenador de traducciones - OpenTranslation

Revisión asistida por ordenador de traducciones - OpenTranslation

Revisión asistida por ordenador de traducciones - OpenTranslation

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

José Ignacio Perea Sardón<br />

5.2. Evaluación<br />

Tras optimizar PETRA REV con los resultados <strong>de</strong> analizar los archivos <strong>de</strong> la<br />

muestra extraída <strong>de</strong>l conjunto <strong>de</strong> entrenamiento, el siguiente paso es<br />

aplicarla, fijados los parámetros en los valores óptimos, a los archivos <strong>de</strong><br />

la muestra extraída <strong>de</strong>l conjunto <strong>de</strong> evaluación.<br />

5.2.1. Ortografía y gramática<br />

Para localizar los errores <strong>de</strong> ortografía presentes en el conjunto <strong>de</strong> evaluación<br />

se utiliza el diccionario actualizado con los términos añadidos (cf. §<br />

5.1.1). También se examinan los <strong>por</strong>centajes <strong>de</strong> etiquetado conseguidos<br />

antes <strong>de</strong> actualizar el diccionario, lo que permite hacerse una i<strong>de</strong>a <strong>de</strong> la<br />

mejora <strong>de</strong>rivada <strong>de</strong> actualizar el diccionario con los términos <strong>de</strong>sconocidos<br />

proce<strong>de</strong>ntes un texto <strong>de</strong> características similares. En todos estos casos, se<br />

aplicó el pretratamiento <strong>de</strong>l texto <strong>de</strong>scrito en § 5.1.1.<br />

Proyecto<br />

232<br />

Con diccionario inicial Con diccionario actualizado Diferencia<br />

Total<br />

token<br />

Token<br />

etiquetados<br />

%<br />

Total<br />

token<br />

Token<br />

etiquetados<br />

% % 1 % 2<br />

Mozilla 7618 7467 98,02 7618 7470 98,06 0,04 1,99<br />

Ubuntu 97170 96509 99,32 97170 96566 99,38 0,06 8,62<br />

Gnome 82442 81461 98,81 82442 81637 99,02 0,21 17,94<br />

OpenOffice 67188 66858 99,51 67188 66910 99,59 0,08 15,76<br />

KDE 68675 67765 98,67 68675 67783 98,70 0,03 1,98<br />

Otros 86941 85574 98,43 86941 85575 98,43 0,00 0,07<br />

Total 410034 405634 98,93 410034 405941 99,00 0,07 6,98<br />

Tabla 56. Token etiquetados antes y <strong>de</strong>spués <strong>de</strong> la<br />

actualización <strong>de</strong>l diccionario<br />

La tabla 56 indica las diferencias entre el etiquetado conseguido con el<br />

diccionario inicial y el actualizado. Las diferencias entre los dos se indican<br />

tanto respecto al total <strong>de</strong> token (%1) como respecto al total <strong>de</strong> token no<br />

etiquetados (%2). Por ejemplo, en el caso <strong>de</strong> Mozilla, antes se etiquetaban<br />

7467 <strong>de</strong> 7618 token existentes y quedaban sin etiquetar 151. Tras la actualización<br />

<strong>de</strong>l diccionario, se etiquetan 7470 <strong>de</strong> 7618 token y quedan sin<br />

etiquetar 148. Es <strong>de</strong>cir, se etiquetan 3 token (151 menos 148) que antes no<br />

se etiquetaban. Este número es muy pequeño respecto al número total <strong>de</strong><br />

token, como indica el primer <strong>por</strong>centaje %1=(3/7618)=0,04%. No obstante,

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!