Descarga en formato PDF (3,8 MB) - Centro Ramón Piñeiro para a ...
Descarga en formato PDF (3,8 MB) - Centro Ramón Piñeiro para a ...
Descarga en formato PDF (3,8 MB) - Centro Ramón Piñeiro para a ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Tecnoloxías da linguaxe<br />
diversos campos: pesos, medidas, ferram<strong>en</strong>tas, obxectos de culto, roupas, lingua xurídica e relixiosa,<br />
así como a análise de fórmulas e estructutras docum<strong>en</strong>tais na busca de posibles interpolacións ou<br />
falsificacións” (p. 756).<br />
736. Gómez Guinovart, Xavier / Sacau Font<strong>en</strong>la, El<strong>en</strong>a: “Métodos de optimización de la<br />
extracción de léxico bilingüe a partir de corpus <strong>para</strong>lelos”, PLN, 33, 2004:133-140. | [Ed. <strong>en</strong><br />
liña n.v.]: [2004], , [Formato:<br />
<strong>PDF</strong>], [Consulta: 16/04/2005]. | [Ed. <strong>en</strong> liña n.v.]: Vigo, Universidade de Vigo, Seminario<br />
de Lingüística Informática, [2004], , [Formato: <strong>PDF</strong>], [Consulta:<br />
31/08/2004].<br />
1. investigación | 2. ámb. galego | 3. sincrónico | 4. c | 5. lingua escrita<br />
Preséntanse as estratexias adoptadas na extracción de léxico bilingüe inglés-galego a partir do CLUVI:<br />
Corpus Lingüístico da Universidade de Vigo (2003-, <strong>en</strong>trada 728), elaborado polo Seminario de Lingüística<br />
Informática. Coa int<strong>en</strong>ción de minimizar as desviacións derivadas das asimetrías típicas dos corpus<br />
<strong>para</strong>lelos constituídos por textos orixinais e traducións (adición, supresión ou reord<strong>en</strong>am<strong>en</strong>to de<br />
segm<strong>en</strong>tos de tradución), os autores deseñaron estratexias <strong>para</strong> optimizar a extracción automática de<br />
léxico bilingüe inglés-galego. O traballo complétase coa inclusión dun apartado dedicado a avaliar os<br />
resultados da devandita extracción (Adaptación do resumo que aparece na publicación) [P.M.F.].<br />
737. Gómez Guinovart, Xavier / Sacau Font<strong>en</strong>la, El<strong>en</strong>a: “Parallel Corpora for the Galician<br />
Language: Building and Processing of the CLUVI (Linguistic Corpus of the University of Vigo)”,<br />
<strong>en</strong> Maria Teresa Lino, Maria Francisca Xavier, Fátima Ferreira, Rute Costa e Raquel Silva (eds.),<br />
Proceedings of the 4th International Confer<strong>en</strong>ce on Language Resources and Evaluation, LREC<br />
2004 (Lisboa, 26-28 May 2004), IV, Paris, European Language Resources Association (ELRA),<br />
2004:1179-1182. | [Ed. dix.]: Paris, European Language Resources Association (ELRA),<br />
2004, 1 CD-ROM. | [Ed. <strong>en</strong> liña n.v.]: Vigo, Universidade de Vigo, Seminario de Lingüística<br />
Informática, 2004, , [Formato: <strong>PDF</strong>], [Consulta: 20/07/2004].<br />
1. investigación | 2. ámb. galego | 3. sincrónico | 4. c | 5. lingua escrita<br />
Descrición da metodoloxía des<strong>en</strong>volvida polo Seminario de Lingüística Informática da Universidade<br />
de Vigo <strong>para</strong> a construción e procesam<strong>en</strong>to do CLUVI: Corpus Lingüístico da Universidade de Vigo (2003-,<br />
<strong>en</strong>trada 728). Para a lematización e a etiquetación morfosintáctica dos textos empregouse o estándar<br />
XML e un conxunto de etiquetas elaborado polo propio Seminario, a partir das recom<strong>en</strong>dacións<br />
de EAGLES (Expert Advisory Group on Language Engineering Standards). Amósanse as características do<br />
<strong>formato</strong> TMX, que constitúe o sistema de codificación estándar <strong>en</strong> linguaxe XML <strong>para</strong> as memorias<br />
de tradución e corpus <strong>para</strong>lelos, con indep<strong>en</strong>d<strong>en</strong>cia da aplicación utilizada, e as solucións adoptadas<br />
no CLUVI <strong>para</strong> codificar as equival<strong>en</strong>cias de tradución, cando a correspond<strong>en</strong>cia <strong>en</strong>tre o orixinal e a<br />
tradución non é directa debido á omisión, adición ou reord<strong>en</strong>ación de frases na tradución. Tamén se<br />
pres<strong>en</strong>ta a solución adoptada <strong>para</strong> unir a información morfosintáctica coa relativa ás equival<strong>en</strong>cias de<br />
tradución, así como as técnicas computacionais e lingüísticas empregadas <strong>para</strong> xerar dicionarios bilingües<br />
baseados <strong>en</strong> corpus. Por último, descríbese a aplicación web creada <strong>para</strong> facilitar o acceso libre a<br />
través da Internet aos corpus <strong>para</strong>lelos que constitú<strong>en</strong> o CLUVI.<br />
346 Bibliografía analítica da lingua galega (2004)