10.05.2013 Views

Revisión asistida por ordenador de traducciones - OpenTranslation

Revisión asistida por ordenador de traducciones - OpenTranslation

Revisión asistida por ordenador de traducciones - OpenTranslation

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

4.1.1.2. Etiquetado <strong>de</strong> textos<br />

<strong>Revisión</strong> <strong>asistida</strong> <strong>por</strong> <strong>or<strong>de</strong>nador</strong> <strong>de</strong> <strong>traducciones</strong><br />

PETRA REV cuenta con un lematizador y etiquetador morfológico, cuya<br />

función consiste en <strong>de</strong>terminar la categoría gramatical y el lema (la forma<br />

canónica) <strong>de</strong> cada palabra <strong>de</strong> un texto y asociarle una etiqueta i<strong>de</strong>ntificativa.<br />

Por ejemplo, en el caso <strong>de</strong> la oración Ambos guardaban hacía rato<br />

un profundo silencio, las etiquetas a<strong>de</strong>cuadas serían:<br />

Palabra Ambos guardaban hacía rato un profundo silencio .<br />

Etiqueta pn0mp000 vmii3p0 vmii3s0 ncms000 di0ms0 aq0ms0 ncms000 Fp<br />

Lema ambos guardar hacer rato uno profundo silencio .<br />

Ejemplo 22. Etiquetado y lematizado <strong>de</strong> una oración en PETRA REV.<br />

Las etiquetas son un código que permite con<strong>de</strong>nsar las características morfológicas.<br />

Por ejemplo, en el caso <strong>de</strong> rato, la etiqueta ncms000 indica que<br />

se trata <strong>de</strong> un nombre común masculino y singular. Hay varios etiquetarios<br />

ya <strong>de</strong>sarrollados que cumplen esta función, entre los cuales se ha elegido el<br />

etiquetario <strong>de</strong>l corpus CLiC-TALP (Civit 2000 y 2001), según se <strong>de</strong>talla en<br />

el apéndice A.3. El etiquetador escogido, <strong>de</strong> factura propia y liberado<br />

como software libre en http://sourceforge.net/projects/petrapostagger/,<br />

es el PETRA TAG I (Perea 2007), que presenta las siguientes ventajas:<br />

Fácil integración en el software. Al estar <strong>de</strong>sarrollado en C++<br />

mediante programación orientada a objetos, pue<strong>de</strong> integrarse cómodamente<br />

en cualquier sistema compatible con esta plataforma.<br />

Orientado específicamente a la traducción. Su orientación<br />

a la traducción le permite ofrecer características especialmente<br />

interesantes para la traducción, como la posibilidad <strong>de</strong> etiquetar<br />

textos en varios idiomas. A<strong>de</strong>más, cuando el texto que se <strong>de</strong>sea<br />

etiquetar está disponible en dos idiomas, se aprovechan ambas<br />

versiones para lograr un etiquetado más preciso.<br />

Personalización. El diccionario usado para realizar el etiquetado<br />

pue<strong>de</strong> modificarse con facilidad. Cuando el texto que se <strong>de</strong>sea<br />

etiquetar correspon<strong>de</strong> a un dominio concreto, se pue<strong>de</strong> adaptar<br />

cómodamente a ese contexto específico, lo que permite aumentar<br />

mucho la precisión.<br />

Motor <strong>de</strong> búsquedas. El sistema no sólo ofrece el etiquetado <strong>de</strong><br />

texto, sino que también incor<strong>por</strong>a funciones <strong>de</strong> búsqueda con una<br />

notación pre<strong>de</strong>finida que permite efectuar búsquedas en los archi-<br />

69

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!