13.07.2015 Views

La traducció automàtica i l'experiència del BOE en català

La traducció automàtica i l'experiència del BOE en català

La traducció automàtica i l'experiència del BOE en català

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

2. Es passa el verificador ortogràfic perevitar al màxim les inter ferències.3. Com que el sistema no trad ueix les paraulesqu e estan <strong>en</strong> contacte amb determinatssím bols (claudàtors, arroves, etc.), pelfet qu e in terpreta qu e aquests signes i elterme <strong>en</strong> qü estió form<strong>en</strong> un sol lexema,amb l'ein a Reemplazar assignem l'idiomad' arribada a aquests símbo ls de man era qu es'ignorin i es tradueixi la paraula qu e hi està<strong>en</strong> contac te s<strong>en</strong>se necessitat d'eliminar elscodis.Exemple:Davant una cad<strong>en</strong> a com la següe nt, <strong>en</strong>qu è no es pot alt erar la codificació - sempre<strong>en</strong>tre c1audàtors- però sí qu e cal tradu irel text <strong>en</strong> contacte:[lLR]D I S P O N G O :[FP4][lLR12]TíTULO I[FP4][2LN12]Disposiciones g<strong>en</strong>erales[FP4][1LA]Artículo 1.[002]Objeto.[FP2][2LA] EI pres<strong>en</strong>te Real Decreto ti<strong>en</strong>e porobjeto (...) .[FP2]El canvi qu e es fa és el següe nt:Buscar [I\?I\?I\?I\?I\?] (I\? = cualquiercaràcte r)Reemplazar por formato idioma catalan.Buscar [I\?I\?I\?I\?]Reemplazar por formato idioma catalan.Buscar [I\?I\?I\?)Reemplazar por formato idioma catalan.Buscar [I\?I\?]Reemplazar por formato idioma catalan.Així neutra litzem tot es les seqüènc ies [...]i la paraul a qu e hi està <strong>en</strong> contacte qu edatra duïda. <strong>La</strong> gradació <strong>en</strong> els canvis successiusés a causa de la presèn cia de codis qu eoscil-l<strong>en</strong> <strong>en</strong>tre els cinc i els dos caràcters .4. Tot seguit es neutralitza (cal <strong>en</strong>t<strong>en</strong>dreper neutralització l'assignació de l'idiomad'arr ibada per evitar qu e el sistema de traducció auto mà tica hi in te rving ui) el segü<strong>en</strong>t:a) Els noms propis de la signa tura <strong>del</strong> docum<strong>en</strong>tper evitar qu e qu edin traduïts i s'o b­tinguin resulta ts com «Ma rgarida Mariscalde Cant i Badoc" per «Margarita Mariscal deGan te y M ir ón - o «Rodrigo Estona " per«Rodrigo Rato».b) Les fórmules matemà tiques, si n'hi ha,per evitar la traducció <strong>del</strong>s símbo ls i l'aparicióde símbols estranys qu e de vegad espo d<strong>en</strong> desmuntar l'estructura <strong>del</strong> text .Exemp le:ID = ti/T 100, don de:ti = tiempo de ind ispo nibilidad de lainstalación y (horas)ID = índice de disponibilidad<strong>La</strong> traducció automàtica, s<strong>en</strong>se preed ició,donaria el resultat següe nt:ANEU-HI = tu/t 100, ontu = temps d'indisponibiIitat de la installacióANEU-HI = índex de disponibilitatCal fer not ar qu e el resultat de la traduccióno es pot atribuir a cap defecte <strong>del</strong> programa(hi ha hagut una traducció literalqu e, d'<strong>en</strong>trada, pod ria ser viable). Per a nosaltresés més r<strong>en</strong>dible neutralitzar tot a laseqüència (és a dir, im pedir qu e es tra du eixi)i fer-ne la versió catalana manualm<strong>en</strong>t,incloe n t-hi el text explicatiu, per evitar errors<strong>en</strong> algun símbo l mal traduït.c) També es ne utralitz<strong>en</strong> noms de lloc qu <strong>en</strong>o hagin de qu edar traduït s, <strong>en</strong> cas qu <strong>en</strong>'apareguin més o m<strong>en</strong>ys agru pats <strong>en</strong> pocsparàgrafs o <strong>en</strong> llistes. Això no inclou llistesde països perquè el sistema els tradueix demanera correcta gairebé sem pre.Exemple:Depósito regulador <strong>en</strong> Tías y tuberías deconexión con la red de aguas depuradasde Arrecife a Tinajo . TT.MM. de Tías y SanBartolomé (isla de <strong>La</strong>nzarote).Dipòsit regulador <strong>en</strong> Ties i canonades decon nexió amb la xarxa d'aigües depuradesd'Escull a Tinajo. TT.MM. de Ties i SanBartolomé (illa de <strong>La</strong>nzarote).En tots aquests casos s'ha de valorar si ésmés r<strong>en</strong> dible qu e quedin traduïts els nomscomuns i els to pònims, qu e no es tradueixicap paraula o dedicar un temps a seleccionarmot a mot el que no ha de traduir. Siguicom sigui, <strong>en</strong> la postedició sempre soma temps de substituir el text traduït per l'original i traduir manua lme nt el qu e calgui.d) A continuació, es ne utralitz<strong>en</strong> seqüè nciesqu e no es vol que el sistema tradueixiperquè l'experiència <strong>en</strong>s ha dem ostrat qu eprovoqu<strong>en</strong> errades que po d<strong>en</strong> passar desa-16


percebudes <strong>en</strong> una postedició ràpid a, com<strong>en</strong> el cas de la seqüència «e)>>, que norm alm<strong>en</strong>tdesigna un paràgraf d'algun docum<strong>en</strong>tnormatiu, però que queda traduïdacom a « [].» (perquè s'interpreta com a conjunció).De tota manera, <strong>en</strong> cas que no esneutralitzés, el programa ofereix <strong>en</strong> el texttraduït informaci ó sufici<strong>en</strong>t perquè puguemdetectar que la «[]» correspon a un a «e)» :com qu e els elem<strong>en</strong>ts que el sistema deixas<strong>en</strong>se traduir qued<strong>en</strong> marcats de color blau,qualsevol «i)>> no marcada correspondrà auna «e)>> a l'orig<strong>en</strong> . Això és aplicable alsnoms de lloc i als noms propi s.5. Una altra fase <strong>del</strong> procés de preedicióés l'apli cació de taules de canvis automàticsque es van ampliant amb l'experiènciadiària. Aquestes taules (o filtres) <strong>en</strong>s permet<strong>en</strong>adequar l'aplicació de majúscules i minúsculesi els ordinals als criteris establertsper a la versió catalana, i canviar alguns símbolsque la pràctica <strong>en</strong>s ha demostrat quepod <strong>en</strong> portar problemes de desajustam<strong>en</strong>t<strong>del</strong> format original (per exemple, se substitueix<strong>en</strong>les com etes angulars (


Quan s'obre el text traduït, <strong>en</strong>s trobemamb un garbuix de codis indesxifrables quecal processar amb un es macros preparadesde què disposem a la barra d'eines. Un copprocessades les marques, obt<strong>en</strong>im el texttraduït que <strong>en</strong>s arriba amb una informacióafegida <strong>en</strong> forma de claus, barres inclinadesi marques de colors.Aquestes marq ues són les segü<strong>en</strong>ts:Cla us 11: <strong>en</strong>s inform<strong>en</strong> que hi ha més d'unatraducció possible (homònims de la matei ­xa categoria gramatical) i <strong>en</strong>s ofereix<strong>en</strong> unaalternativa. Però cal t<strong>en</strong>ir <strong>en</strong> compte que elfet que una paraula no tingu i una alternativamarcada <strong>en</strong>tre claus no significa quesigui la correcta <strong>en</strong> aquell context i, d'altrabanda, no sempre apareix<strong>en</strong> les alternativescorrectes, sinó que de vegades la solucióque cal aplicar és una tercera paraula(per exemple «llevar a cabo» queda traduïtper «portar a caporallcap]»).Així, paraules com :abono, abonat, étgano, registradas, número,balsaArrib<strong>en</strong> traduïdes de la manera segü<strong>en</strong>t:ad ob {abonam<strong>en</strong>t!, adobar{abonar!,òrgan[orgue}, registradeslescorcollades],nornbreln úmero], railbassa]Barra inclinada /: té la mateixa funcióque les claus, però està reservada als ho ­mònims verbals.Colors: el programa treba lla amb diversosdiccionaris. Un cop feta l'anàlisi sintàcticade la frase, la màquina n'id<strong>en</strong>tificales paraules <strong>en</strong> la ll<strong>en</strong>gua d'orig<strong>en</strong> al diccionarimonolingüe, <strong>en</strong> busca l'equivalènciaal diccionari bilingüe i <strong>en</strong> pres<strong>en</strong>ta laflexió després de buscar la informació correspon<strong>en</strong>t al diccionari monolingüe de lall<strong>en</strong>gua d'arribada. En aquest procés potsucceir que no trobi la paraula <strong>en</strong> el diccionarimonolingüe de la ll<strong>en</strong>gua de sortida,que no la trobi <strong>en</strong> el diccionari bilingüe o que no <strong>en</strong> trobi la flexi ó <strong>en</strong> eldiccionari monolingüe de la ll<strong>en</strong>gua d'arribada.Segons el cas que es produeixi,marca la paraula amb un color difer<strong>en</strong>t:• Blau : [<strong>en</strong> cursiva <strong>en</strong> els exemp les] indicaque la parau la no ha estat traduïda. <strong>La</strong>causapot ser que no l'hagi trobada <strong>en</strong> el diccionaride la ll<strong>en</strong>gua d'orig<strong>en</strong> (monolingüe),o que estigui <strong>en</strong> contacte amb un símbolestrany (claudàtor, arrova , etc.); també potser que formi part d'una seqüència de paraules<strong>en</strong> majúscules, que <strong>en</strong> la fase d'anàlisisintàctica se li hagi atorgat una categoriagramatical erròn ia i n o la sàpigaid<strong>en</strong>tificar, etc. Per tant , la deixa <strong>en</strong> la ll<strong>en</strong>guad'orig<strong>en</strong>.S'han posat <strong>en</strong> marxa una sèrie de mesuresper a l'eradicació i el control de les<strong>en</strong>cefalopatias espongiformes transmissibles<strong>del</strong>s animals de les espècies bovina, ovinai caprina.Canonades d'interconnexió a lesMedianias de Gran Canaria 7T.MM. de SanMateo. Teror i Santa Brígida (illa de GranCanària).• Verdoliva: [<strong>en</strong> negreta <strong>en</strong> els exemp les] indicaque la paraula sí que és al diccionari <strong>del</strong>a ll<strong>en</strong>gua d'orig<strong>en</strong> però no <strong>en</strong> el bilingüe.Es consider<strong>en</strong> de caràcter sumptuari lespells s<strong>en</strong>se depilar d'ermini, astrakanes,breistchwaz, burunduky, muflón, llúdriademar, panda, pantera, vicuña, visons.• Vermellgranat: [<strong>en</strong> versaletes <strong>en</strong> els exemples]indica que la paraula és al diccionarimonolingüe de la ll<strong>en</strong>gua d'orig<strong>en</strong> i <strong>en</strong> elbilingüe però que no n'ha trobat la correspondènciaflexi onada <strong>en</strong> el diccionarimonolingüe de la ll<strong>en</strong>gua d'arribada i, pertant, la paraula queda <strong>en</strong> la forma principalde la ll<strong>en</strong>gua d'arribada.Instal-lacío ns d'ajuts RADIOELÈCTRIC, de gestiói explotació. Def<strong>en</strong>ses i elem<strong>en</strong>tsd'amarratge. Material diversTambé sota aquest principi d'homog<strong>en</strong>eïtzació,es FI EXIBILlTZAR i clarifiqu<strong>en</strong> els requisitsd'autorització, Registre i revocació• Marca fosforesc<strong>en</strong>t: [emmarcades <strong>en</strong> elsexempl es] està reservada a les paraules queport <strong>en</strong> un com<strong>en</strong>tari afegit; ara com ara,només qued<strong>en</strong> marcades les majúscules qu<strong>en</strong>o van precedides de punt. Només cal posarel cursor al damunt de la paraula marcadaper poder llegir-ne el com<strong>en</strong>tari.Tot això s'ha de comunicar allConsorci I<strong>del</strong> Comp<strong>en</strong>sació I~ ' Assegurances ~ quanactuï com a assegurador directe.Una vegada corregit el text, cal eliminaraquestes marques. Pel que fa a lesclaus, s'elimin<strong>en</strong>a mesura que es corregeix. Pel quefa als colors blau, granat i verd oliva, al fi-18


nal se selecciona el text i, des <strong>del</strong> m<strong>en</strong> úFormato Fu<strong>en</strong>te, se li assigna el color negre.Pel que fa al groc fosforesc<strong>en</strong>t, un a macroaccionable amb un bot ó a la barra d'ein es<strong>del</strong> Word s'<strong>en</strong>carrega de l'eliminació.Una vegada pro cessats els codis, el correctors'<strong>en</strong>dinsa <strong>en</strong> la correcció <strong>del</strong> text traduïtqu e conté marques i colors múltiples.El resultat d'un text traduït amb un programade traducció automàtica és difer<strong>en</strong>t <strong>del</strong>qu e s'o bté amb la traducció manual; podríemdir qu e cal vigilar uns altres aspectes .En principi, no hi ha errades ortog ràfiques qu e no siguin les derivades d'un errord'interpretació gramatical <strong>del</strong> programa (publica/pública)o <strong>del</strong> fet qu e el programa noha gi traduït la paraula per algun mot iu.D'altra banda, <strong>en</strong> la tradu cció mai no hi faltatext, cosa qu e repres<strong>en</strong>ta un estalvi de tempsimportant perquè no cal acarar traducció ioriginal per comprovar qu e hi són totes lesfrases. Un alt re avantatge és qu e el pro gramaté incorporada molt a terminologia i, toti qu e sempre és recoma nable comprovar­Ia, l'estalvi de tem ps qu e això compor tatambé és notable.D'altra banda, els errors de ls textos traduïtsautomàticam <strong>en</strong>t amb aq uest sistemaprov<strong>en</strong> <strong>en</strong> de cau ses difer<strong>en</strong>ts:a) Els diccionaris no són infi nits i, per tant,hi ha paraules no traduïdes. Aquestes pod<strong>en</strong>ser terminologia, neologismes, nomspropis, etc., no traduïts, com tam bé parauleso sintagmes respecte als quals la màquinano troba l'equi valènci a <strong>en</strong> la ll<strong>en</strong>gua d'arribadaperqu è no n'id<strong>en</strong>tifica la categoriagramatical correcta, etc.b) Traducció de noms propis i topònims qu <strong>en</strong>o s'han neutralitzat <strong>en</strong> la fase de preedició.c) Errades o limitacions <strong>en</strong> l'anàlisi sintàctica:<strong>en</strong> el cas de para ules qu e tinguin diversescategories gramaticals, pot ser qu e el programafaci un a interpretació in adequada.• En la traducció <strong>del</strong>s participis (


textos per al <strong>BOE</strong>, cal vigilar sobretot la terminologia:auto/autos queda traduït com interlocutòria/interlocutòries,quan <strong>en</strong> molts casoscorrespondria a actuacions;emplazami<strong>en</strong>topot ser emplaçam<strong>en</strong>t o citació a termini;apremio pot ser pressa o constr<strong>en</strong>yim<strong>en</strong>t. Cal,doncs, t<strong>en</strong>ir molt <strong>en</strong> compte quin es són lesincidènci es que es pod<strong>en</strong> pres<strong>en</strong>tar. Tambéporta problemes la traducció de mots invariables<strong>en</strong> una ll<strong>en</strong>gua i amb alternança degènere o nombre <strong>en</strong> l'altra, com <strong>en</strong> el cas dedos, que pot serdos i dues;com ún pot sercom úi comuna; an àlisis per anàlisi o anàlisis, etc.;<strong>en</strong> aquests casos el sistema sempre <strong>en</strong> fa latraducció més literal.• També s'ha de comprovar la traducciód'elem<strong>en</strong>ts estranys, com ara fórm ules matemàtiques(DA =demanda anual <strong>del</strong> sistema<strong>en</strong> MWh per DÓNA = demandaanual <strong>del</strong>sistema <strong>en</strong> MWh ), traducció de determinadesabreviatures (seg. pot aparèixer traduïtcom segon, quan hauria de correspondre asegm<strong>en</strong>t; e) per i) , o nombres romans (VIdóna com a resultat VAIG VEURE).A tall de conclusió, doncs, podem afirmarque per a l'EADOP el sistema de traduccióautomàtica és l'eina de base que permetgarantir el com plim<strong>en</strong>t de terminis i lafiabilitat <strong>en</strong> la traducció <strong>del</strong>s textos que conform<strong>en</strong>la versió catalana <strong>del</strong> <strong>BOE</strong>. D'altrabanda, la tasca indisp<strong>en</strong>sable <strong>del</strong> correctorha de consistir, segons l'experiència quehem com<strong>en</strong>tat, no solam<strong>en</strong>t <strong>en</strong> la revisióacurada <strong>del</strong> text, tal com succeeix <strong>en</strong> docum<strong>en</strong>ts traduïts amb mitjans tradicionals,sinó que tam bé té un paper fonam<strong>en</strong>tal <strong>en</strong>l'optimització <strong>del</strong> sistema.•20

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!