10.07.2015 Views

RAPPORT D'ACTIVITÉ 2003 - WWW Ircam

RAPPORT D'ACTIVITÉ 2003 - WWW Ircam

RAPPORT D'ACTIVITÉ 2003 - WWW Ircam

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>RAPPORT</strong> DETAILLERECHERCHE ET DEVELOPPEMENTANALYSE ET SYNTHESE DES SONSpermettrait de traiter spécifiquement les différentescomposantes dans les modèles spectraux (vocodeur de phase).Nous avons donc étudié différents descripteurs des picsspectraux, liés à la fréquence réassignée, au centre gravitédu signal, à la durée du signal et à une largeur de bandenormalisée du pic. En appliquant ces descripteurs aux picsappartenant à trois classes (sinusoïde avec AM/FM, bruits,lobe secondaire) nous avons déterminé les distributions desdescripteurs pour ces classes et nous avons établi un arbre dedécision qui permet de classer les pics dans les troisclasses. Par rapport aux méthodes de classificationexistantes, notamment la méthode de corrélation avec le picd’une sinusoïde stationnaire, l'arbre de décision établi donnedes résultats beaucoup plus fiables pour la classification despics représentant des sinusoïdes non stationnaires[Zivanovic03a]. La méthode de classification des pics serautilisée dans le futur pour améliorer le "partial tracking"dans les modèles additifs non harmoniques.Responsable : A. RoebelParticipant : M. Zivanovic3.1.6 Traitement pour le film TirésiaPour le film Tirésia, le réalisateur B. Bonello a eu besoin detransformer la voix d'une actrice en une voix d'homme.Plusieurs méthodes ont été comparées. Le meilleur résultat aété jugé celui obtenu avec le logiciel SuperVP. B. Bonello atrouvé ces transformations "au-delà de ses espérances". Lavoix transformée est apparue dans le film en compétition àCannes et sorti sur les écrans dans l'année.Responsable : X. RodetParticipants : G. Denis, A. Roebel3.1.7 Transformation de la voixCette thèse, débutée au mois d'Octobre, a pour finalité detrouver une fonction de transformation qui permette de donnerl'identité de la voix d'un locuteur "cible" à celle d’unlocuteur 'source'. Elle utilisera l'extraction,l'apprentissage et la modification de paramètres du signalvocal (fréquence fondamentale, formants, excitation, etc.)liés au locuteur. Une première étude de ce sujet a étéréalisée dans le cadre du programme DEA-Atiam par G. Denis[Denis03a]. Dans cette étude, un système simplifié a étédeveloppé en utilisant la technique Psola et des résultatspréliminaires obtenus. En particulier un algorithmed'alignement temporel de deux phrases a été développé. Iltrouve des applications notamment pour l’indexation de corpusen synthèse de la parole et pourrait être utilisé dans desapplications artistiques.Avec ce point de départ, certaines idées ont été testées pourl'élaboration d'une direction de recherche. La proximitéperceptive au locuteur cible et la généralisation souhaitéesont considérées comme les problématiques principales de latransformation, ainsi qu'une amélioration de l'alignementtemporel comme premier pas du futur système.Les résultats et propositions publiées dans la littératurescientifique n'apportent pas encore une qualité et unegénéralisation suffisantes. En revanche, les améliorations- 90 -

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!