10.07.2015 Views

RAPPORT D'ACTIVITÉ 2003 - WWW Ircam

RAPPORT D'ACTIVITÉ 2003 - WWW Ircam

RAPPORT D'ACTIVITÉ 2003 - WWW Ircam

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>RAPPORT</strong> DETAILLERECHERCHE ET DEVELOPPEMENTANALYSE ET SYNTHESE DES SONSResponsable : A. RoebelParticipants : J. Escribe, A. RoebelCollaboration interne : société PSA3.1.2 Contrôle de la synthèse par sélection d'unitésDans les systèmes de synthèse de la parole à partir du texte,une nouvelle technique, nommée sélection d'unités, permet uneamélioration de qualité considérable. Son application à lasynthèse sonore et musicale de haute qualité est étudiée ici.La méthode utilise une large base de données hétérogènes desons choisis (notes séparées ou phrases complètes) et decaractéristiques, classés et segmentés suivant des paramètresestimés sur le signal. Le segment qui ressemble le mieux, ausens d'un certain critère, au résultat désiré, est sélectionnépar l'algorithme. Le segment sonore trouvé peut êtretransformé par des techniques temporelles ou fréquentielles dere-synthèse telles que Psola, re-synthèse additive, etc. Ilest enchaîné avec les segments trouvés pour les autres partiesdu signal à construire, en appliquant des techniquesd'interpolation pour former les transitions. En <strong>2003</strong>, la basede sons de test a été constituée en analysant et segmentantenviron deux heures de sons à l'aide des outils desegmentation par Dynamic Time Warping, décrit en [Soulez03a].De nombreux outils de visualisation des contenus de la base desons ont été développés. L'algorithme de sélection d'unités aété mis au point et validé. D. Schwarz a soutenu sa thèse enjanvier 2004 [Schwarz04a]. Ce travail sur la synthèse fondéesur les données a été présenté aux conférences DAFx[Schwarz03a] et ICMC [Schwarz03b] et a rencontré un vifintérêt. Il est à noter que, dans ces deux conférences,d'autres présentations traitaient du même principe de(re)synthèse sonore, donc en rapport avec le travail àl'<strong>Ircam</strong>. La couche logicielle fondamentale d'accès à la basede données PostGreSQL à partir de Matlab a été publiée souslicence libre open source "GNU Lesser Public License (LGPL)"et mis en accès à l’adresse :http://gborg.postgresql.org/project/pgmatlab.Responsable : X. RodetParticipant : D. Schwarz (thèse)Collaborations internes : F. Soulez, J. Escribe3.1.3 Plugin Psola dans DiphoneAu cours d’un stage, D. Tardieu a porté le moteur de calcul deDiphone de Mac OS-9 vers Unix (Linux) en gardant naturellementune source unique. Cela permet de faire facilement des calculsen batch et a préparer le portage vers Mac OS-X. De plus, il aécrit un nouveau plugin pour Diphone implantant la méthodePsola. Enfin il a écrit un synthétiseur Psola en Matlab pourfaire la synthèse, c'est-à-dire convertir les données Psolagénérées par Diphone (enregistrées dans le standard SDIF type1DIP et 1REF) en signal sonore [Tardieu03a].Responsable : X. RodetParticipants : D. Tardieu (stage)- 88 -

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!