18.04.2013 Views

Actas da - Xunta de Galicia

Actas da - Xunta de Galicia

Actas da - Xunta de Galicia

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Recursos e activi<strong>da</strong><strong>de</strong>s necesarias para <strong>de</strong>senvolver<br />

tecnoloxía <strong>da</strong> fala en galego<br />

Carmen García Mateo<br />

Departamento <strong>de</strong> Teoría do Sinal e Comunicacións<br />

ETSE Telecomunicación - Campus Universitario- 36200 VIGO<br />

0. Introducción<br />

Da<strong>da</strong> a tecnoloxía dispoñible na actuali<strong>da</strong><strong>de</strong> para o <strong>de</strong>senvolvemento dun<br />

sistema <strong>de</strong> diálogo home-máquina é indispensable dispoñer dunha serie <strong>de</strong><br />

recursos orais e <strong>de</strong> texto no(s) idioma(s) <strong>de</strong> que se trate. Estas bases <strong>de</strong> <strong>da</strong>tos,<br />

tamén chama<strong>da</strong>s córpora, presentan unhas características particulares que fan<br />

que en moitos casos non sexa posible reutilizar material xa existente, e fan<br />

necesario embarcarse en proce<strong>de</strong>mentos <strong>de</strong> <strong>de</strong>seño, captura e etiquetaxe moi<br />

laboriosos e custosos.<br />

A non dispoñibili<strong>da</strong><strong>de</strong> <strong>de</strong>stes recursos é unha <strong>da</strong>s causas do baixo nivel <strong>de</strong><br />

<strong>de</strong>senvolvemento <strong>da</strong> tecnoloxía <strong>da</strong> fala en idiomas minoritarios ou minorizados<br />

como po<strong>de</strong> se-lo idioma galego. Unicamente co concurso <strong>da</strong> axu<strong>da</strong> institucional<br />

é posible hoxe en día afrontar este tipo <strong>de</strong> proxectos.<br />

Non só os recursos lingüísticos son específicos do idioma, tamén todos<br />

aqueles subsistemas que precisen dunha análise morfosintáctica do texto que hai<br />

que procesar <strong>de</strong>pen<strong>de</strong>n en maior ou menor medi<strong>da</strong> <strong>da</strong> linguaxe, salvo que para a<br />

súa implementación se empregaran algoritmos a<strong>de</strong>strados a partir <strong>de</strong> <strong>da</strong>tos.<br />

No diagrama <strong>de</strong> bloques <strong>da</strong> Figura 1 móstranse os bloques fun<strong>da</strong>mentais que<br />

hai que <strong>de</strong>senvolver nun sistema <strong>de</strong> diálogo. Po<strong>de</strong>mos distinguir tres gran<strong>de</strong>s<br />

módulos:<br />

1. Conversor texto-fala. Debe ser multilocutor e capaz <strong>de</strong> xerar voz con<br />

distintas entoacións. Asociado a este bloque, está o módulo <strong>de</strong> xeración<br />

<strong>de</strong> mensaxes do sistema.<br />

2. Recoñecedor <strong>de</strong> fala. Debe po<strong>de</strong>r recoñecer fala continua e dispor dun<br />

vocabulario <strong>de</strong> máis <strong>de</strong> 50.000 palabras. Os compoñentes <strong>de</strong>pen<strong>de</strong>ntes<br />

do idioma son: os mo<strong>de</strong>los acústicos, o lexicón e o mo<strong>de</strong>lo <strong>de</strong> linguaxe.<br />

3. Xestión do diálogo. Debe ser capaz <strong>de</strong> extrae-los conceptos semánticos<br />

<strong>de</strong> ca<strong>da</strong> quen<strong>da</strong> e dirixi-lo diálogo cara ó fin <strong>de</strong>sexado permitindo a<br />

intervención do usuario na toma <strong>de</strong> <strong>de</strong>cisións.<br />

Ca<strong>da</strong> un <strong>de</strong>stes módulos presenta unha <strong>de</strong>pen<strong>de</strong>ncia do idioma <strong>de</strong> traballo. A<br />

continuación <strong>de</strong>scribirémo-lo estado actual <strong>de</strong> <strong>de</strong>senvolvemento, segundo o<br />

noso coñecemento, <strong>de</strong>stes sistemas para o idioma galego.<br />

— 151 —

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!