15.02.2015 Views

Descarga en formato PDF (3,8 MB) - Centro Ramón Piñeiro para a ...

Descarga en formato PDF (3,8 MB) - Centro Ramón Piñeiro para a ...

Descarga en formato PDF (3,8 MB) - Centro Ramón Piñeiro para a ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Tecnoloxías da linguaxe<br />

diversos campos: pesos, medidas, ferram<strong>en</strong>tas, obxectos de culto, roupas, lingua xurídica e relixiosa,<br />

así como a análise de fórmulas e estructutras docum<strong>en</strong>tais na busca de posibles interpolacións ou<br />

falsificacións” (p. 756).<br />

736. Gómez Guinovart, Xavier / Sacau Font<strong>en</strong>la, El<strong>en</strong>a: “Métodos de optimización de la<br />

extracción de léxico bilingüe a partir de corpus <strong>para</strong>lelos”, PLN, 33, 2004:133-140. | [Ed. <strong>en</strong><br />

liña n.v.]: [2004], , [Formato:<br />

<strong>PDF</strong>], [Consulta: 16/04/2005]. | [Ed. <strong>en</strong> liña n.v.]: Vigo, Universidade de Vigo, Seminario<br />

de Lingüística Informática, [2004], , [Formato: <strong>PDF</strong>], [Consulta:<br />

31/08/2004].<br />

1. investigación | 2. ámb. galego | 3. sincrónico | 4. c | 5. lingua escrita<br />

Preséntanse as estratexias adoptadas na extracción de léxico bilingüe inglés-galego a partir do CLUVI:<br />

Corpus Lingüístico da Universidade de Vigo (2003-, <strong>en</strong>trada 728), elaborado polo Seminario de Lingüística<br />

Informática. Coa int<strong>en</strong>ción de minimizar as desviacións derivadas das asimetrías típicas dos corpus<br />

<strong>para</strong>lelos constituídos por textos orixinais e traducións (adición, supresión ou reord<strong>en</strong>am<strong>en</strong>to de<br />

segm<strong>en</strong>tos de tradución), os autores deseñaron estratexias <strong>para</strong> optimizar a extracción automática de<br />

léxico bilingüe inglés-galego. O traballo complétase coa inclusión dun apartado dedicado a avaliar os<br />

resultados da devandita extracción (Adaptación do resumo que aparece na publicación) [P.M.F.].<br />

737. Gómez Guinovart, Xavier / Sacau Font<strong>en</strong>la, El<strong>en</strong>a: “Parallel Corpora for the Galician<br />

Language: Building and Processing of the CLUVI (Linguistic Corpus of the University of Vigo)”,<br />

<strong>en</strong> Maria Teresa Lino, Maria Francisca Xavier, Fátima Ferreira, Rute Costa e Raquel Silva (eds.),<br />

Proceedings of the 4th International Confer<strong>en</strong>ce on Language Resources and Evaluation, LREC<br />

2004 (Lisboa, 26-28 May 2004), IV, Paris, European Language Resources Association (ELRA),<br />

2004:1179-1182. | [Ed. dix.]: Paris, European Language Resources Association (ELRA),<br />

2004, 1 CD-ROM. | [Ed. <strong>en</strong> liña n.v.]: Vigo, Universidade de Vigo, Seminario de Lingüística<br />

Informática, 2004, , [Formato: <strong>PDF</strong>], [Consulta: 20/07/2004].<br />

1. investigación | 2. ámb. galego | 3. sincrónico | 4. c | 5. lingua escrita<br />

Descrición da metodoloxía des<strong>en</strong>volvida polo Seminario de Lingüística Informática da Universidade<br />

de Vigo <strong>para</strong> a construción e procesam<strong>en</strong>to do CLUVI: Corpus Lingüístico da Universidade de Vigo (2003-,<br />

<strong>en</strong>trada 728). Para a lematización e a etiquetación morfosintáctica dos textos empregouse o estándar<br />

XML e un conxunto de etiquetas elaborado polo propio Seminario, a partir das recom<strong>en</strong>dacións<br />

de EAGLES (Expert Advisory Group on Language Engineering Standards). Amósanse as características do<br />

<strong>formato</strong> TMX, que constitúe o sistema de codificación estándar <strong>en</strong> linguaxe XML <strong>para</strong> as memorias<br />

de tradución e corpus <strong>para</strong>lelos, con indep<strong>en</strong>d<strong>en</strong>cia da aplicación utilizada, e as solucións adoptadas<br />

no CLUVI <strong>para</strong> codificar as equival<strong>en</strong>cias de tradución, cando a correspond<strong>en</strong>cia <strong>en</strong>tre o orixinal e a<br />

tradución non é directa debido á omisión, adición ou reord<strong>en</strong>ación de frases na tradución. Tamén se<br />

pres<strong>en</strong>ta a solución adoptada <strong>para</strong> unir a información morfosintáctica coa relativa ás equival<strong>en</strong>cias de<br />

tradución, así como as técnicas computacionais e lingüísticas empregadas <strong>para</strong> xerar dicionarios bilingües<br />

baseados <strong>en</strong> corpus. Por último, descríbese a aplicación web creada <strong>para</strong> facilitar o acceso libre a<br />

través da Internet aos corpus <strong>para</strong>lelos que constitú<strong>en</strong> o CLUVI.<br />

346 Bibliografía analítica da lingua galega (2004)

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!