Modelo estocÃ¡stico de traducciÃ³n basado en N ... - TALP - UPC

Modelo estocástico de traducción basado en N-gramas de tuplasbilingües y combinación log-lineal de característicasJosé B. MariñoRafael BanchsJosep Mª CregoAdrià de GispertPatrik LambertJosé A. R. FonollosaMarta R. Costa-jussàCentro de Investigación TALPUniversidad Politécnica de CataluñaCampus Nord UPC. 08034-Barcelona.{canton, rbanchs, jmcrego, agispert, lambert, adrian, mruiz}@gps.tsc.upc.eduResumen: En esta comunicación se presenta un sistema de traducción estocástica basado en elmodelado mediante N-gramas de la probabilidad conjunta de textos bilingües. La unidad básicadel modelo es la tupla, par de cadenas de palabras del lenguaje fuente (a traducir) y el lenguajedestino (traducción). La traducción se lleva a cabo mediante la maximización de unacombinación lineal de los logaritmos de la probabilidad asignada a la traducción por el modelode traducción y otras características, siguiendo la aproximación de entropía máxima. Lasprestaciones del sistema de traducción son evaluadas con una tarea de traducción del habla: latraducción entre inglés y español (y viceversa) de transcripciones de intervenciones de losmiembros del Parlamento Europeo. Los resultados alcanzados se encuentran al nivel del estadodel arte.Palabras clave: traducción automática del habla, traducción estocástica, N-gramas, modelo delenguaje de entropía máxima.Abstract: This communication introduces a stochastic machine translation system based on N-gram modelling of the joint probability of bilingual texts. The basic unit of this model is called atuple and consists of a pair of both source (to be translated) language and target language(translation) word-strings. Translation is driven by a log-linear combination of the N-grammodel probability and other features, according to the maximum entropy language modellingapproach. The translation performance is evaluated by means of a speech-to-speech translationtasks: translation from Spanish to English (and viceversa) of European Parliament speeches.The system reaches a state-of-art performance.Keywords: stochastic machine translation, speech-to-speech translation, N-gram model,maximum entropy language modelling.1 IntroducciónRecientemente los sistemas estocásticos detraducción han adquirido un notableprotagonismo, gracias a los buenos resultadosque han obtenido cuando se aplican a tareas decarácter limitado. Cuando se trata de traducir elhabla, emerge otra razón importante para supopularidad: su capacidad para afrontar latraducción de oraciones no bien formadas desdeel punto de vista gramatical. Estaagramaticalidad puede originarse en el carácterespontáneo del habla o en los errores de lossistemas de reconocimiento que actúan deintermediarios entre la señal de voz y el sistemade traducción. Por todo ello, hoy asistimos a unnotable esfuerzo encaminado al desarrollo desistemas estocásticos de traducción del hablacapaces de abordar campos de aplicación nolimitados, tanto en la talla del vocabulario comoen su contenido semántico.La aproximación estocástica considera quecualquier oración f de una lengua fuente (frase atraducir) puede ser traducida en cualquier otra ddel lenguaje destino (en el que se desea latraducción) con probabilidad no nula. Latraducción consiste precisamente en determinarla oración d con mayor probabilidad deconstituir una traducción para la oración

original f. Las diferencias entre los distintossistemas de traducción se originan en el modoque modelan la probabilidad de que d sea unatraducción de f. Un rasgo común en estaaproximación es la necesidad de corpusbilingües paralelos (formados por pares deoraciones que se traducen mutuamente) a partirde los cuales estimar los parámetros delmodelo.El primer planteamiento (Brown et al.,1990) utilizó la palabra como la unidad básicadel modelo de traducción. La probabilidad detraducción se establece en función de laprobabilidad de traducción de las palabras, deun modelo estocástico de distorsión del ordende las palabras entre las dos lenguas y de lafertilidad de las palabras (la probabilidad de queuna palabra de una lengua se traduzca en una,dos, tres, etc. palabras de la otra). Dentro deeste planteamiento se establecieron diferentesmodelos de complejidad creciente (llamadoscomúnmente modelos de IBM1, IBM2, etc.).Estos modelos son asimétricos, ya que para unpar de lenguas dadas dependen del sentido de latraducción. El principal inconveniente de estaaproximación es la independencia del contextode la probabilidad de traducción de las palabrasy la dificultad algorítmica para estimar losmodelos y realizar la traducción. Hoy en día, elprincipal fruto de este planteamiento y sussucesivos refinamientos es su capacidad paraestablecer un alineamiento entre las palabras deun par de oraciones que son traduccionesmutuas en el par de lenguas de interés. Es decir,como resultado del entrenamiento del modelode traducción, se obtiene para cada par de frasesdel corpus de entrenamiento las palabras que serelacionan en la traducción o, dicho de otromodo, las palabras vinculadas (o enlazadas)entre sí de una y otra lengua (véase un ejemploen la figura 1). GIZA++ (Och, 2003) es laherramienta distribuida gratuitamente de usohabitual a este fin.Los sistemas estocásticos actuales detraducción utilizan como unidad básica delmodelo secuencias de palabras (segmentos deoración) del par de lenguas que se encuentranvinculadas en la traducción. Este planteamientopermite adjudicar contexto a la traducción delas palabras. Estos segmentos son determinadostras un proceso de alineado de pares bilingüesde oraciones pertenecientes a un corpus deentrenamiento. El modo en que se definen estossegmentos y se utilizan para modelar laprobabilidad de traducción da origen a losdiferentes sistemas.Recientemente ha sido propuesto (Och yNey, 2002) el uso del modelo de entropíamáxima en la traducción estocástica. En estapropuesta, el modelo de traducción es unainformación más entre varias que puedengobernar la traducción. Siguiendo la solucióndual al problema de modelado (Berger et al,1996), los logaritmos de las probabilidadesasociadas a las diversas informaciones(características) son combinados linealmentepara definir una función cuya maximizaciónestablece la traducción (modelo log-lineal). Estaestrategia es análoga a la combinación de losmodelos fonético y de lenguaje empleadacomúnmente en los sistemas de reconocimientode voz. Los coeficientes de la combinaciónlineal son optimizados de acuerdo con algúncriterio objetivo de la calidad de la traducción.El sistema de traducción que se presenta enesta comunicación sigue el planteamiento deentropía máxima y es deudor del modelo detraducción basado en segmentos bilingües depalabras. En lo que sigue, se describeteóricamente el sistema de traducción (sección2), se describe la tarea de traducción abordadaen la sección 3, se recogen los detallesexperimentales del entrenamiento del sistema ydel proceso de traducción en la sección 4 y seofrecen y discuten los resultados obtenidos enlas secciones 5 y 6, respectivamente.I wish a system NULO providing correct translationsNULO quisiera tener un sistemaque proporcione traducciones correctasFigura 1: Par de oraciones bilingües en el que, mediante flechas, se indican las palabras vinculadas enla traducción. Mediante recuadros se muestran los pares bilingües de segmentos (tuplas) en los que sesegmenta monótonamente el par de oraciones.

mediante la probabilidad de la secuencia detuplas t K en que puede segmentarse:K∏p(d, f) = Pr{ t K } = pt (k| tk− 1, ..., tk− N+1)k = 1Este planteamiento es heredero de lossistemas de traducción del habla basados enautómatas de estados finitos (Vidal, 1997) (deGispert y Mariño, 2002) y similar a (Picó et al.,2004).2.4 Las características adicionalesComo ya se ha mencionado anteriormente, en lafunción que dirige la búsqueda de la mejortraducción se incluyen otras informaciones ocaracterísticas además del modelo detraducción:K∏h 1 (d, f) = log pt (k| tk− 1, ..., tk− N+1)k = 1Actualmente, nuestro sistema incluye lassiguientes características adicionales:• Las probabilidades de traducción en cadadirección (de fuente a destino p(d k / f k ) y dedestino a fuente p(f k / d k ) ) asignada por elmodelo IBM1 a los segmentos de oraciónque constituyen cada tupla t k = (d k , f k ).Ambas probabilidades se consideraninformaciones independientes.h 2 (d, f) = logh 3 (d, f) = logK∏k = 1K∏k = 1p( d / f )kkp( f / d )• La probabilidad de la oración generada parala lengua destino asignada por un N-gramaen palabras:I∏h 4 (d) = log pd (i| di− 1, ..., di− N+1)i=1• Una penalización para las traducciones máscortas, que compense la tendencia a lageneración de traducciones con el menornúmero de palabras:h 5 (d) = Idonde I es el número de palabras de latraducción hipotetizada.3 Descripción de la tarea abordadaEl sistema descrito ha sido aplicado a latraducción de intervenciones en las sesionesplenarias del Parlamento Europeo (EPPS). Laslenguas elegidas han sido inglés y español,kkrealizándose traducciones en ambasdirecciones.En la tabla 1 se proporciona las principalesestadísticas de los corpus de entrenamiento ytest: número de oraciones (orcn), número totalde palabras (plbr), talla de los correspondientesvocabularios (vcblr) y longitud media enpalabras de las oraciones (media).EntrenamientoLng Orcn Plbr Vcblr Mediaen 33.4 M 105 k 27.31.223 kes34.8 M 169 k 28.4Testen 1094 26.8 k 3.9 k 24.5es 840 22.7 k 4.0 k 27.0Tabla 1: Estadísticas de los materiales deentrenamiento y test (M expresa millones y kmiles de palabras).El material de entrenamiento recoge lastranscripciones de las sesiones desde abril de1996 hasta septiembre de 2004. Este material esdistribuido por el Parlamento Europeo a travésde su página web 1 . En nuestra experimentaciónhemos hecho uso de la versión distribuida porRWTH de Aachen en el ámbito del proyectoTC-STAR 2 .El material de test corresponde al materialutilizado en la primera evaluación realizada enel proyecto en marzo de 2005. Este materialconsiste en la transcripción de las sesiones del15 al 18 de noviembre de 2004. Ha sidodistribuido por ELDA 3 .En el caso del material de entrenamiento lasoraciones son paralelas; es decir, el corpus estáformado por parejas de frases que se traducenmutuamente. Puede observarse que el númerototal de palabras en el corpus de entrenamientoes muy parejo. No obstante, el número depalabras distintas (talla del vocabulario) esmucho mayor para el español. Esto puedeexplicarse por el carácter mucho más flexivodel español, con formas diversas para losadjetivos y, sobre todo, para los verbos.El material de test es independiente paracada sentido de traducción. En este corpus sehan encontrado 112 palabras inglesas y 46españolas no presentes en el entrenamiento, que1 http://www.europarl.eu.int/2 http://www.tc-star.org/3 http://www.elda.org/

constituyen, respectivamente, el 0.4% y 0.2%del total de palabras del test. De estas palabras,son diferentes 81 y 40 en cada lengua. A efectosde evaluar la calidad de la traducción realizadase dispuso de 2 traducciones de referencia porcada frase a traducir.4 Detalles experimentales4.1 Preprocesado y alienamientoLos textos de material de entrenamientofueron tratados para individualizar todos los“tokens” (palabras, signos de puntuación,números, etc.). No se ha realizadocategorización, de modo que nombres propios,números, fechas, etc. no reciben tratamientoespecial. Se han eliminado los pares bilingüesen el que una de las oraciones contenía más de100 palabras o en el que el cociente entre elnúmero de palabras de una y otra oraciónexcedía 2.4 (fertilidad superior a 2.4).Mediante la aplicación GIZA++ se realizó elalineamiento de los textos bilingües paralelosdel material de entrenamiento, ejecutándose 5iteraciones de los modelos IBM1 y HMM y 3iteraciones de los modelos IBM3 e IBM4. Seobtuvo el alineamiento en las dos direccionesde traducción: tomando sucesivamente el inglésy el español como lenguas fuente. A partir deestos dos alineamientos básicos, se obtuvieronlos alineamientos unión e intersección de losmismos, definidos, respectivamente, por losconjuntos unión e intersección de los enlacesestablecidos en los alineamientos básicos. Elprimero proporciona la mejor cobertura(“recall”) de los enlaces entre las palabras deambas lenguas, que es importante para generarsegmentos bilingües correctos. El segundogenera enlaces con alta precisión, que seránusados para la traducción de palabras.4.2 Modelo de traducción4.2.1 Selección de las tuplasUna vez obtenido el alineamiento unión seprocedió a la segmentación en tuplas delmaterial de entrenamiento. En la tabla 2 semuestra la estadística de las tuplas: el total enambas direcciones de traducción (que nocoinciden debido a la presencia de los enlaces aNULO) y la talla del vocabulario de tuplas. Enlas figuras 2 y 3 se presentan los histogramas delas tuplas en función del número de aparicionesen el entrenamiento y el número detraducciones diferentes que las tuplas ofrecenpara una misma parte fuente. Como puedeobservarse la mayor parte de las tuplas aparecenmuy pocas veces y abundan más las tuplas queofrecen un número reducido de traduccionesalternativas.Número de tuplas en el entrenamientosentido total 30 20es-> en 19.2 M 18.6 M 18.3 Men -> es 18.6 M 17.7 M 17.5 MTalla del vocabulario de tuplases-> en 2.5 M 2.1 M 2.0 Men -> es 2.5 M 2.0 M 1.9 MTabla 2: Estadística de las tuplas (M significamillón de tuplas).Figura 2: Histograma de tuplas en función delnúmero de apariciones.Figura 3: Histograma de tuplas en función delnúmero de traducciones disponibles para laparte del idioma fuente.A efectos de simplificar el sistema detraducción, el vocabulario de tuplas se limitó aaquellas que, para un mismo segmento fuente,contenían hasta 30 traducciones del inglés y

hasta 20 del español. Estos límites sedeterminaron experimentalmente de modo quela calidad de las traducciones no se vieseafectada. Así, se redujo el vocabulario de tuplasen un 20% (véase la tabla 2).4.2.2 Estimación del modeloPara estimar el modelo se utilizó la herramientaSRILM (Stolcke, 2002) de libre distribución.En este proceso se limitó el vocabulario delmodelo de lenguaje bilingüe a las tuplasseleccionadas conforme se ha explicadoanteriormente, al que se añadió una traducción(tupla) para todas aquellas palabras que noaparecían solas en ninguna tupla (por lo que nose podrían traducir si en el test apareciesen enun contexto distinto a los existentes en elmaterial de entrenamiento). Estas tuplas detraducción para las palabras “incrustadas”(“embedded”) fueron generadas a partir delalineamiento intersección.Como técnica de suavizado se utilizó elmétodo de Kneser-Ney e interpolación lineal(Kneser and Ney, 1995).El modelo generado fue un trigrama (N=3)de tuplas. En la tabla 3 se indica el número deunigramas, bigramas y trigramas contenidos enlos modelos para cada sentido de traducción. Latabla 4 proporciona la perplejidad de losmodelos de traducción en ambos sentidosevaluada en el material de entrenamiento.es->en en->es1-gramas 2.039.514 2.022.8232-gramas 6.008.896 6.091.8093-gramas 1.797.578 1.747.148Tabla 3: Histograma de n-gramas en losmodelos de traducción.sentido perplejidades->en 88.1en->es 89.6Tabla 4: Perplejidad en el material deentrenamiento de los modelos de traducción.J I1i jp(d k / f k ) =( / )J ∏ ∑ p dkfk( I + 1) j=1 i=0donde J e I son las longitudes en palabras delas partes fuente y destino, y f y d son,respectivamente, las palabras de cada una dedichas partes. Las probabilidades condicionalesde traducción entre palabras se toman delalineamiento proporcionado por GIZA++ parael sentido de la traducción. Análogamente, sedetermina la probabilidad para la direccióncontraria.Para estimar el modelo para el lenguajedestino se volvió a hacer uso de la herramientaSRILM, con N=3 y la técnica de suavizado deKneser-Ney. Como material de entrenamientose hizo uso de los textos de la lenguacorrespondiente en el corpus bilingüe. En latabla 5 se indica la perplejidad de estos modelosmedida sobre el material de entrenamiento.jkidioma perplejidaden 39.5es 38.5Tabla 5: Perplejidad en el material deentrenamiento de los modelos de lenguaje.Los coeficientes λ i de la combinación loglineal(1) se optimizaron mediante el algoritmoSimplex (Press et al., 2002) para maximizar lamedida de calidad BLEU (Papineni et al., 2002)de la traducción de 500 oraciones de un corpusde desarrollo que contenía 3 traducciones dereferencia por cada texto origen. Este corpusfue extraído de las intervenciones en el plenariodel Parlamento Europeo entre el 25 y el 28 deoctubre de 2004. En la tabla 6 se proporcionanlos valores de los coeficientes λ i para lasconfiguraciones de los sistemas de traducciónque utilizan todas las características. Dadosestos valores, puede decirse que todas lascaracterísticas tienen un grado significativo deinfluencia en la traducción, aunque condiferentes matices en función del sentido de lamisma.i k4.3 Características adicionalesLa probabilidad de traducción asignada por elmodelo IBM1 a los segmentos de oración queconstituyen cada tupla se calcula mediante laexpresiónsentido λ 1 λ 2 λ 3 λ 4 λ 5es->en 1 0.48 0.13 0.48 0.28en->es 1 0.23 0.18 0.80 0.75Tabla 6: Coeficientes de la combinación loglinealpara los sistemas completos.

4.4 El algoritmo de traducciónLa traducción del material de test fue llevada acabo mediante la herramienta MARIE (Crego,Mariño y de Gispert, 2005), que maximiza lafunción U en (1) mediante un algoritmo deprogramación lineal de búsqueda en haz.La búsqueda construye traduccionesparciales (hipótesis), que se conservan endiferentes listas. Cada lista contiene aquellashipótesis que han traducido las mismas palabrasde la frase de entrada. Las hipótesis de cadalista se ordenan según la puntuación acumulada,lo que permite podar por separado en cada lista.Se mantienen las mejores hipótesis (poda porhistograma) y aquéllas que tienen asignada unapuntuación próxima a la mejor hipótesis de lalista (poda por umbral).El algoritmo de búsqueda permite avanzaren la traducción cubriendo partes de la frase deorigen de manera desordenada (distorsión), loque da lugar a una traducción no monótona.Esta posibilidad no ha sido utilizada en losexperimentos realizados en esta comunicación,dado que sólo es aconsejable en la traducciónde pares de lenguas con necesidad dereordenamientos lejanos.5 Resultados alcanzadosEn las tablas 7 y 8 se muestran los resultados dela evaluación de las traducciones obtenidas parael material de test. La tabla 7 recoge elporcentaje de error en palabras (mWER) y elBLEU de la traducción al inglés de los textos enespañol. El mWER se determina a partir delerror en la referencia de traducción para la quese produce menor error. El BLEU es unamedida basada en el número de N-gramas (N de1 a 4) correctos en la traducción en relación conlos que contienen las referencias. Losalgoritmos de evaluación utilizados fueron losoficiales del proyecto TC-STAR facilitados porELDA, con distinción de mayúsculas yminúsculas. En la tabla se incluyen lasevaluaciones para 4 configuraciones del sistemade traducción:• Sistema con el modelo de traducción detuplas únicamente (1).• Sistema con el modelo de traducción detuplas y las probabilidades de traducciónde los segmentos de las tuplas (1, 2, 3).• Sistema con el modelo de traducción detuplas, modelo de lenguaje destino y lapenalización para las traducciones cortas(1, 4, 5).• Sistema completo con todas lasinformaciones (1, 2, 3, 4, 5).En la tabla 8 se resumen las evaluaciones de lastraducciones al español de los textos en inglés.informaciones mWER BLEU1 39.55 0.4761, 2, 3 35.65 0.5371, 4, 5 39.61 0.4851, 2, 3, 4, 5 34.91 0.543Tabla 7: Evaluación de la traducción en elsentido del español al inglés.informaciones mWER BLEU1 44.45 0.4281, 2, 3 41.69 0.4501, 4, 5 44.67 0.4361, 2, 3, 4, 5 40.96 0.466Tabla 8: Evaluación de la traducción en elsentido del inglés al español.6 DiscusiónEn primer lugar debe señalarse que lasevaluaciones obtenidas se comparanfavorablemente con las alcanzadas por lossistemas que describen el estado actual del arte(TC-STAR, 2005).Por otro lado, de la comparación de ambastablas se desprende que la traducción al ingléses de mayor calidad que la traducción alespañol. Esto puede explicarse por el caráctermás flexivo del español que se ha mencionadoanteriormente. En ocasiones la traducción dellema es correcta pero no la instancia producida:error en número, género, tiempo verbal,persona, etc. (ver el ejemplo más adelante).En cuanto a la aportación de las diversasinformaciones a la calidad de las traduccionesgeneradas puede establecerse:• La limitada influencia del modelo dellenguaje destino y la penalización de lastraducciones cortas.• La importante contribución de laprobabilidad de traducción de loscomponentes de las tuplas.Se puede señalar incluso un incremento delmWER al incluir el modelo del idioma destinoal modelo de traducción, aunque se observe unamejoría del BLEU. Este comportamiento puedecomprenderse si se tiene en cuenta que la

optimización de los coeficientes λ i de (1) serealiza en función del BLEU.La influencia de la traducción de loscomponentes de la tupla sugiere el interés deexplorar el uso de esta probabilidad comocriterio para seleccionar las tuplas en elmomento de la estimación del modelo detraducción.En el siguiente ejemplo de traducción semuestran los tipos de error más frecuente:Durante una semana el lasamericano fuerzas americanas deocupación comete han cometido uncrimen abominable en la ciudad deFaluya en Iraq.Se han tachado las palabras que corresponden aerrores en la traducción y se han añadido ennegrita las correcciones. Las fuentes de errormostradas son:• Falta de concordancia de género y número,que podrían subsanarse con el uso deinformación morfosintáctica.• Orden equivocado entre nombre y adjetivo,que podría corregirse con la capacidad dereordenamiento del algoritmo de búsqueda.• Defecto en la traducción de tiemposverbales y personas. Su enmienda puedeser obtenida mediante el uso deinformación lingüística (de Gispert, 2005).7 AgradecimientosEste trabajo ha sido financiado parcialmente porla CICYT a través del proyecto TIC2002-04447-C02 (ALIADO) y la Unión Europeamediante el proyecto FP6-506738 (TC-STAR).BibliografíaBerger, A., Della Pietra, S. y Della Pietra, V.1996. A Maximun Entropy Approach toNatural Language Processing.Computational Linguistics, 22(1): 39-72.Brown, P., Cocke, J., Della Pietra, S., DellaPietra, V., Jelinek, F., Lafferty, J.D., Mercer,D. y Rocín, P.S. 1990. A statistical approachto machine translation. ComputationalLinguistics, 16(2): 79-85.Crego, J.M., Mariño, J.B. y de Gispert, A.2004. Finite-state-based and Phrase-basedStatistical Machine Translation. En Proc. ofthe Int. Conf. on Spoken LanguageProcessing. Jeju, Corea.Crego, J.M., Mariño, J.B. y de Gispert, A.2005. Algoritmo de decodificación detraducción automática estocástica basada enN-gramas. SEPLN’05. Granada.De Gispert, A. y Mariño, J.B. 2002. Using X-grams for speech-to-speech translation. EnProc. of the Int. Conf. on Spoken LanguageProcessing, páginas 1885-1888. Denver, CO(USA).De Gispert, A. 2005. Phrase linguisticclassification and generalization forimproving statistical machine translation.Aceptado en ACL’05 Student Workshop.Kneser, R. y Ney, H. 1995. Improved backingofffor m-gram language modelling. EnProc. IEEE Int. Conf. on Acoustic, Speechand Signal Processing, páginas 49-52,Detroit. MI (USA).Och, F.J. y Ney, H. 2002. Discriminativetraining and maximum entropy models forstatistical machina translation. En Proc. 40 thAnnual Meeting of the Association forComputational Linguistics, páginas 295-302.Och, F.J. 2003. GIZA++. http://www-16.informatik.rwth-aachen.de/∼och/software/giza++.html .Papineni, K., Roukos, S., Ward, T. y Zhu, W-J.2002. BLEU: a method for automaticevaluation of machine translation. En Proc.of the 40 th Ann. Conf. of the ACL.Philadelphia, PA (USA).Picó, D., Tomás, J. y Casacuberta, F. 2004.GIATI: a general methodology for finitestatetranslation using alignments. En Proc.SSPR2004 and SPR2004. Lisboa. Portugal.Press, W.H., Teukolsky, S.A., Vetterling, W.T.y Flannery, B.P. 2002. Numerical Recipiesin C++: the Art of Scientific Computing.Cambridge University Press.Stolcke, A. 2002. SRILM: an extensiblelanguage modelling toolkit. En Proc. of theInt. Conf. on Spoken Language Processing,páginas 901-904. Denver, CO (USA).TC-STAR. 2005. Deliverable D5: SLT progressreport. http://www.tc-star.org/documents/deliverable/Deliv_D5_Total_21May05.pdf.Vidal, E. 1997. Finite-State Speech-to-SpeechTranslation. En Proc. of 1997 IEEEInternacional Conference on Acoustics,Speech and Signal Processing, páginas: 111-114. Munich, Germany.

Modelo estocÃ¡stico de traducciÃ³n basado en N ... - TALP - UPC

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?