Rapport d'activitÃ© - WWW Ircam

More documents

Recommendations

Info

RECHERCHE ET DEVELOPPEMENTANALYSE ET SYNTHESE DES SONSRAPPORT DÉTAILLÉCollaborations extérieures : D. Hart, CEA, Haption, Ondim, CEDRIC et l'Atelier desFeuillantines.1.4.1.7. Projet PILEPILE est un projet pluridisciplinaire qui vise à mieux comprendre l'émergence du langage. Unprotocole d'enregistrement, son et vidéo, de bébés en interaction avec leurs parents, a été misen place afin de permettre une analyse à plusieurs niveaux. Une analyse par des cliniciens,psychologues et pédopsychiatres, une analyse du geste et du regard par une équipe derecherche au LISIF, une analyse du son par l'équipe Analyse/synthèse à l'<strong>Ircam</strong> et une analysestatistique par une équipe au CERMICS. Le rôle de l'<strong>Ircam</strong> est plus spécifiquement de mettre enœuvre des techniques de modélisation du signal (extraction d'observations – au sensstatistique - pertinentes), séparation de sources, modélisation des processus dynamiques (àcourt terme - sur la durée d'une interaction - et à long terme – évolution au cours de lacroissance -), reconnaissance de formes et classification automatique (intelligence artificiellesupervisée ou non). Le stage de Th. Gerbeau [Gerbeau05a] a permis de constituer une base dedonnées préliminaire d’enregistrements de bébés, et de proposer une catégorisationpréliminaire de ces enregistrements et un certain nombre d’indices acoustiquescaractéristiques de ces classes. La thèse de M. Derio, commencée en décembre, poursuit cetravail de manière beaucoup plus large.Participants : Th. Gerbeau (stage), M. Derio (thèse).Collaborations internes : X. Rodet, G. Peeters.Collaborations extérieures : association PILE, LISIF, CERMICS.1.4.2. TRAITEMENT DE LA VOIXDe nombreuses demandes de traitement de la voix [Rodet05d] proviennent des musiciens, duthéâtre, du film et du multimédia. Des recherches débutent sur la transformation d’identité etla synthèse par sélection d'unités et la maîtrise de l’expressivité. Un important projet RIAMcommencera en 2006 (projet VIVOS). Dans les groupes Voix et Orchestration, des travaux avecdes compositeurs étudient une orchestration qui approcherait une voix et le passage voixparlée-voix chantée. Plusieurs travaux ont été menés pour aider des compositeurs enproduction, notamment P. Alessandrini, J. Fineberg et M. Lanza.1.4.2.1. Transformation de l’identité de la voixEn continuation des travaux de 2004, cette thèse a pour finalité de trouver une fonction detransformation qui soit capable de donner l'identité de la voix d'un locuteur "source" à unlocuteur "cible" à l'aide de l'extraction, de l'apprentissage et de la modification des paramètresdu signal de vocal (fréquence fondamentale, enveloppe spectrale, source d'excitation) liés aulocuteur [Villavicencio05a].Pendant l'année 2005, les travaux ont compris le développement d'un corpus de parole deplusieurs locuteurs pour évaluer la performance de la fonction de conversion sur une based'entraînement plus importante par rapport aux évaluations préliminaires. Des résultatspréliminaires ont clarifié la problématique pour l'apprentissage (mélange de gaussiennesGMM) des paramètres liés à la taille de la base de données d'entraînement, la dimensionnalitédes données et la limite de performance dans la transformation des paramètres. Dans unpremier temps, des modifications sur la structure des données ont été appliquées pourmesurer leur impact sur la performance de la transformation. Actuellement, plusieurs voies74 IRCAMRAPPORT D'ACTIVITÉ 2005
RAPPORT DÉTAILLÉRECHERCHE ET DÉVELOPPEMENTANALYSE ET SYNTHESE DES SONSsont en cours d'étude et d'évaluation dans le but d'améliorer la performance de latransformation des paramètres.Participant : F. Villavicencio (thèse).Collaboration interne : A. Roebel.1.4.2.2. Analyse, segmentation et synthèse de la voix : TalkapillarDans le projet de reconstitution d'une voix, mené jusqu’à présent par des stagiaires [Beller05a,c], le système Talkapillar permet de synthétiser une parole par sélection d’unités dans unebase de données [Lannes05a], comme si le locuteur l'avait prononcée. "Talkapillar" permetd’enregistrer un texte, de le segmenter et de créer automatiquement une base de données(PostgreSQL) d’unités de parole munies de très nombreuses informations (labels et valeursphonétiques, acoustiques, syntaxiques, prosodiques, etc.). Une sélection de groupesprosodiques permet de préserver l'identité du locuteur. Un langage interactif permet de fairedes requêtes très élaborées dans cette base, ainsi que l’analyse, synthèse et transformation devoix [Hueber05a]. C’est déjà un remarquable outil de recherche sur la parole (plusieurs heuresd’enregistrement entièrement labellisées). Analyse, synthèse et transformation de voix parTalkapillar peuvent être effectuées avec une interface graphique (Gtts, [Hueber05a]) :http://iii.ircam.fr/analyse_synthese/documentation/doc_user/talkapillar.Il est utilisé pour la pièce Lolita de J. Fineberg, (cf. paragraphe Modèle "shape invariant" dansle vocodeur de phase), pour la thèse de G. Beller sur l’expressivité et sera utilisé pour leprojet VIVOS.Le système a bénéficié des améliorations suivantes :• mise en place d'un nouveau corpus de parole de haute qualité ;• implémentation d'une interface de correction de l'alignement ;• mise en place d'un sous-corpus aligné manuellement, afin d'améliorer la procédured'alignement automatique ;• optimisation de l'importation des données dans la base ;• développement d'outils et d'interfaces pour l'analyse et l'élaboration de statistiques desdonnées de la base ;• possibilité d’utiliser la prosodie pour la synthèse de phrases musicales [Beller05a],[Beller05b] ;• lien avec SuperVP pour des transformations dépendantes du contexte (expressivités parexemple).Participants : X. Rodet, T. Hueber (stage), G. Beller (thèse), Y. Lannes (stage), A. Marty (stage).Collaboration interne : D. Schwarz (équipe Applications temps réel).1.4.2.3. Étude de l’expressivité d’une voix : analyse, modélisation, et synthèseCette thèse, débutée au mois de septembre 2005, a pour objectif de conférer de l'expressivité àune voix, par transformation. Il s’agit donc de modéliser chaque expressivité par un ensemblede fonctions de transformation des paramètres du signal de la voix (fréquence fondamentale,enveloppe spectrale, source d'excitation).Les travaux pendant l'année 2005 ont permis une introduction au problème lors d’un stage[Beller05c]. Dans un premier temps, une base de données de parole expressive a étéconstituée. Puis la modélisation des modifications des paramètres prosodiques (f0, énergie,débit [Beller06]), induite par les expressivités a permis la transformation de phrases neutres enphrases affectées de tristesse, colère, joie, peur, ennui, dégoût, indignation, surprise négativeou positive.IRCAM 75RAPPORT D'ACTIVITÉ 2005
Page 1:
institut de recherche et coordinati
Page 6 and 7:
SOMMAIRE4.3.9. Site ForumNet.......
Page 9 and 10:
INTRODUCTIONFrank Madlener, Directe
Page 11:
I. Synthèse
Page 14 and 15:
RECHERCHE ET DÉVELOPPEMENTSYNTHÈS
Page 16 and 17:
Page 18 and 19:
Page 20 and 21:
Page 23: SYNTHÈSECRÉATION ET DIFFUSION MUS
Page 27 and 28: SYNTHÈSEPÉDAGOGIE/COORDINATION3.
Page 29 and 30: SYNTHÈSEPÉDAGOGIE/COORDINATIONPar
Page 31 and 32: SYNTHÈSEPÉDAGOGIE/COORDINATION•
Page 33 and 34: SYNTHÈSERELATIONS EXTÉRIEURES4. R
Page 35 and 36: SYNTHÈSECOMMUNICATION5. COMMUNICAT
Page 37: SYNTHÈSEMÉDIATHÈQUE ET BUREAU É
Page 41 and 42: RAPPORT DÉTAILLÉRECHERCHE ET DÉV
Page 54 and 55: RECHERCHE ET DÉVELOPPEMENTACOUSTIQ
Page 62 and 63: RECHERCHE ET DÉVELOPPEMENTPERCEPTI
Page 73: RAPPORT DÉTAILLÉRECHERCHE ET DÉV
Page 92 and 93: RECHERCHE ET DÉVELOPPEMENTREPRÉSE
Page 122 and 123: RECHERCHE ET DÉVELOPPEMENTAPPLICAT
Page 124 and 125:
RECHERCHE ET DÉVELOPPEMENTAPPLICAT
Page 126 and 127:
Page 128 and 129:
Page 130 and 131:
Page 132 and 133:
Page 134 and 135:
Page 136 and 137:
Page 139 and 140:
RAPPORT DÉTAILLÉRECHERCHE ET DÉV
Page 141 and 142:
Page 143 and 144:
Page 145 and 146:
Page 147 and 148:
Page 149:
Page 152 and 153:
RECHERCHE ET DÉVELOPPEMENTANNEXESR
Page 154 and 155:
RECHERCHE ET DÉVELOPPEMENTANNEXESR
Page 157 and 158:
RAPPORT DÉTAILLÉCRÉATION ET DIFF
Page 159 and 160:
Page 161 and 162:
Page 163 and 164:
Page 165 and 166:
Page 167 and 168:
Page 169 and 170:
Page 171 and 172:
Page 173 and 174:
Page 175 and 176:
RAPPORT DÉTAILLÉPÉDAGOGIEFORMATI
Page 177 and 178:
Page 179 and 180:
Page 181 and 182:
Page 183 and 184:
Page 185 and 186:
Page 187 and 188:
Page 189 and 190:
Page 191 and 192:
RAPPORT DÉTAILLÉPÉDAGOGIEATELIER
Page 193 and 194:
RAPPORT DÉTAILLÉPÉDAGOGIECONFÉR
Page 195 and 196:
Page 197 and 198:
Page 199 and 200:
Page 201 and 202:
Page 203 and 204:
RAPPORT DÉTAILLÉPÉDAGOGIECOORDIN
Page 205:
RAPPORT DÉTAILLÉPÉDAGOGIECOORDIN
Page 208 and 209:
RELATIONS EXTÉRIEURESVALORISATION
Page 210 and 211:
RELATIONS EXTÉRIEURESPROJETS NATIO
Page 212 and 213:
Page 214 and 215:
Page 216 and 217:
RELATIONS EXTÉRIEURESFORUM, LOGICI
Page 218 and 219:
Page 220 and 221:
Page 222 and 223:
Page 224 and 225:
RELATIONS EXTÉRIEURESÉDITIONSRAPP
Page 226 and 227:
RELATIONS EXTÉRIEURESÉDITIONSRAPP
Page 228 and 229:
RELATIONS EXTÉRIEURESPROJETS TRANS
Page 230 and 231:
Page 232 and 233:
Page 234 and 235:
Page 236 and 237:
COMMUNICATIONCONFIRMER L'IDENTITÉ
Page 238 and 239:
COMMUNICATIONCONFIRMER L'IDENTITÉ
Page 240 and 241:
COMMUNICATIONÉLARGISSEMENT DES PUB
Page 242 and 243:
Page 244 and 245:
Page 246 and 247:
Page 248 and 249:
Page 250 and 251:
COMMUNICATIONCOMMUNICATION INTERNER
Page 252 and 253:
COMMUNICATIONRELATIONS AVEC LA PRES
Page 254 and 255:
Page 256 and 257:
Page 258 and 259:
Page 260 and 261:
COMMUNICATIONCONCERTS DE LA SAISONR
Page 262 and 263:
COMMUNICATIONFESTIVAL AGORA 8ÈME
Page 264 and 265:
Page 266 and 267:
Page 268 and 269:
Page 270 and 271:
Page 272 and 273:
Page 274 and 275:
Page 276 and 277:
COMMUNICATIONFONCTIONNEMENT DU SERV
Page 278 and 279:
MÉDIATHÈQUE ET BUREAU D'ÉTUDESM
Page 280 and 281:
MÉDIATHÈQUE ET BUREAU D'ÉTUDESM
Page 282 and 283:
MÉDIATHÈQUE ET BUREAU D'ÉTUDESBU
Page 284 and 285:
Page 286 and 287:
Page 288 and 289:
Page 291 and 292:
L'ÉQUIPE IRCAMDIRECTION• Directe
Page 293 and 294:
L'ÉQUIPE IRCAMAssistants pédagogi
show all

Rapport d'activitÃ© - WWW Ircam

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?