rapport d'activitÃ© 2009 - WWW Ircam

More documents

Recommendations

Info

5 Développer la recherche et les logiciels applicatifsen une bibliothèque C++ temps réel multiplate-forme, Voice-Forger, fondée sur la bibliothèque SuperVP d’ A. Roebel.Projet Angel Studio : Feder ; période : juil. 09-juin 10 ; coordinateur: As An AngelCe projet (P. Lanchantin) a pour but la conversion de voix.Les principaux travaux ont consisté en une étude sur latransformation de la fréquence fondamentale, l’analyseet la synthèse par superVP, et, pour la transformation del’enveloppe spectrale, la réduction de la variance de la loiconditionnelle aux observations de la voix source (augmentationdu nombre de composantes gaussiennes et réductionde dimensionnalité du modèle GMM, utilisation de HMMlors de l’apprentissage).Transformations expressives de la paroleProjet Respoken : FEDER DRIRE ; période : fév. 09-déc. 10 ;coordinateur : VocallyCe projet, mené par C. Veaux, vise le développement d’unplugin (e.g. pro-tools) de transformation expressive de laparole. Les transformations font appel à la bibliothèque voiceTransdont les fonctionnalités sont étendues. Une base dedonnées de parole expressive a été analysée pour définir unsystème de contrôle des transformations. Les principauxtravaux ont concerné l’estimation de la fréquence fondamentalepour les voix expressives, la détection de proéminencesà partir de l’audio, des effets (e.g. « creaky ») et unsystème de transformation prosodique par règles pour lesexpressivités joie, tristesse, peur, colère, etc.Analyse et modélisation de la prosodieProjet Rhapsodie : ANR SHS ; période : fév. 08-déc. 11 ; coordinateur: univ. Paris-10La thèse de N. Obin a pour but des modèles de prosodie dela voix parlée dans les différents styles de parole (journalisteradio, homme politique, conversation, etc.), pour utilisationen synthèse notamment. Les principaux travaux ont été :• amélioration du modèle de détection de proéminencesyllabique par analyse linéaire discriminante et prise encompte du contexte linguistique ;• extraction d’information syntaxique de haut niveau pourla prosodie ;• constitution d’un corpus annoté pour la synthèse de stylede parole.Segmentation et synthèse à partir du texteLa segmentation automatique ircamAlign de P. Lanchantina été étendue à l’anglais (A. Gonzales) et à la voix chantée(Hypermusic Prologue d’H. Parra). Le système de synthèsede parole à partir du texte ircamTTS de C. Veaux a été amélioréet pourvu de nouvelles voix (A. Dussolier, projet avecG. Aperghis) et testé pour l’anglais. La synthèse paramétriqueHTS a été testée par P. Lanchantin et améliorée avecle modèle de glotte de G. Degottex, et des informationslinguistiques de haut niveau (N. Obin). Enfin des modèlesde génération de texte (e.g. mélange de langues) ont étédéveloppés pour des applications artistiques (compagnieMabel Octobre).■ Traitement par le contenu et nouveaux outilspour la musiqueLes travaux relatifs à la description du contenu audio d’unmorceau de musique sont effectués dans le cadre des projetsOseo Quaero (dont l’Ircam coordonne le work packageaudio et musique), ANR DISCO, les thèses de L. Régnier etH. Papadopoulos.Programmes : (Oseo Quaero) ; période : mai 2008-avril 2013 ;coordinateur : (Thomson) et : (ANR DISCO) ; période : janv. 2008– déc. 2010 ; coordinateur : Paris-DauphineLe travail s’articule autour des quatre points principauxdétaillés ci-dessous.Création de corpus annotésDans le projet Quaero, l’Ircam constitue un corpus de référencepour la recherche et l’évaluation des technologiesd’indexation musicale. Ceci comprend l’élaboration denouveaux critères d’annotation, de critères de mesure devalidité de l’annotation [Peeters09c] [Peeters09b], le développementd’outils d’annotation locale (QIMAL) et globale(interface en ligne QIMAQ), la collecte de corpus représentatifs(collaboration avec EMI France) et l’annotation destitres choisis. Une équipe spécifique d’annotateurs a étécréée pour cela en 2009.Estimation locale du contenu musicalLe contenu local du signal audio d’un morceau de musiquea été étudié selon différents points de vue :• détection des parties chantées/non-chantées par clusteringde partiels vibrés [Regnier09a], similarité entre chanteurssur base de critères de vibrato ;• amélioration de la détection des battements et détectionsimultanée du premier temps par un nouveau système basésur une modélisation Viterbi inversée [Peeters09a] ;• description simultanée de la suite d’accords, tonalitélocale et premier temps sur la base d’un modèle de Markovétendu (prise en compte d’erreurs potentielles d’estimationde beats) et amélioration du front end par Constant-Q[Papadopoulos09a], [Papadopoulos10a] ;• caractérisation du rythme : premier-temps, attente(expectancy) rythmique [Smith09a], similarité de patternsrythmique, groupement de motifs.Estimation globale du contenu musicalLe système d’indexation automatique ircamclassifier aété étendu afin de permettre le traitement des problèmessingle-class et multi-class. Pour cela, chaque problème esttransformé en un ensemble de problèmes binaires. Pourchaque sous-problème un SVM, dont l’optimisation desparamètres est automatique, est utilisé [Burred09b]. Denouveaux descripteurs et de nouvelles modélisations temporellesont été incorporés à ircamdescriptor. Ce systèmeIRCAM – RAPPORT D’ACTIVITÉ 200988
5 Développer la recherche et les logiciels applicatifspermet le développement des systèmes de reconnaissancede genre musical et d’humeur musicale.Le projet DISCO se concentre sur l’étude des meilleuresstructures d’index (recherches rapides dans de très grandesbases de données) en fonction de la topologie (distribution)des descripteurs. L’Ircam adapte ces techniques (en particulierle M-tree) pour une application aux métriques utiliséesen audio.Développement et évaluation des technologiesL’essentiel des technologies développées dans le projetQuaero a fait l’objet de développements en C++ et d’uneintégration auprès de partenaires industriels.Elles ont également été évaluées lors des campagnesd’évaluation MIREX-09 (très bons résultats pour la détectionde beat et en classification) et Quaero-Eval-09. L’Ircama fortement contribué à la création des environnementsd’évaluation de Quaero-Eval-09 (données, mesures, logicielsd’évaluation).■ Modélisation physique pour la synthèse sonoreRéalisation en guides d’ondes numériques stablesd’un modèle acoustique pour la simulation en temps réeld’instrument à ventThèse EDITE de R. Mignot ; période : sept.06-déc.09 (liée auprojet CONSONNES)Les points essentiels sont : une structure séparant leseffets de discontinuité de section, de pente et de courburede tubes, l’inclusion de pertes visco-thermiques réalistes,un formalisme pour créer des réseaux de tubes, la levéeReprésentation de l’approximation de la réflexion d’ondes à la jonction de 2 tubes évasésavec pertes visco-thermiques, dans le plan complexe de la variable s de Laplace (le domaine de Fourierest l’axe imaginaire en blanc pointillé, pour s = iw).d’un paradoxe avec la découverte de guides d’ondes stablespour les profils convexes (extrémité du cor anglais, tête deflûte traversière, etc.).Simulation de propagation non linéaire par les sériesde VolterraThèse SMAE de D. Roze ; période : déc.06-mai10 (liée au projetCONSONNES)La simulation réaliste de cordes et poutres incluant leseffets couplés de torsion et flexion a été permise dernièrementgrâce à l’utilisation de groupes de Lie (configurationsgéométriques garanties quelle que soit la résolution numériqueutilisée) et celle des séries de Volterra (résolutionfaible coût de la dynamique non linéaire). Une corde grave(ou souple) frottée qui conjugue ces difficultés (couplage,forts déplacements, etc.) devient ainsi synthétisable.Modélisation, analyse et identification de circuits nonlinéaires : application aux amplificateurs de guitare pour lasimulation en temps réelThèse EDITE d’I. Cohen ; période : janv.07-janv.11 (thèse CIFRE-ANRT avec Orosys)L’amélioration des modèles de lampes (triodes, pentodes),le développement d’un banc pour leur mesure et reconstructionvirtuelle, la mise en place de modélisation etméthodes numériques dédiées ont conduit à des simulationstemps réel d’étages de pré-amplification de qualitéjusqu’ici non égalée. La suite consiste à construire la chaînecomplète d’amplification.IRCAM – RAPPORT D’ACTIVITÉ 200989
Page 1:
Rapport d’activitéinstitutde rec
Page 4 and 5:
politique générale...............
Page 7:
1politique générale
Page 10 and 11:
1 politique générale■ Orchestre
Page 12 and 13:
1 politique généraleLE CONSEIL SC
Page 15:
216625 61630,81%Les chiffres clés3
Page 19:
3Un modèle d’innovation :l’art
Page 22 and 23:
3 un modèle d’innovation : l’a
Page 24 and 25:
Page 26 and 27:
Page 28 and 29:
Page 30 and 31:
Page 32 and 33:
Page 34 and 35:
Page 36 and 37:
Page 38 and 39: 3 un modèle d’innovation : l’a
Page 41: 4Singularité artistique,démocrati
Page 44: 4 singularité artistique, démocra
Page 47 and 48: 4 singularité artistique, démocra
Page 67: 4 singularité artistique, démocra
Page 71 and 72: 5 Développer la recherche et les l
Page 87: 5 Développer la recherche et les l
Page 129: 5 Développer la recherche et les l
Page 133 and 134: 6 les structures de soutienSERVICE
Page 135 and 136: 6 les structures de soutienGÉNÉRA
Page 137 and 138: 6 les structures de soutienrelation
Page 141:
7Annexes
Page 144 and 145:
7 annexes■ DoctorantsYun-Kang Ahn
Page 146 and 147:
7 annexes[Londero09a] Londero A., V
Page 148 and 149:
7 annexesPédagogie■ Stages Ircam
Page 150 and 151:
7 annexes■ Ouvrages scientifiques
Page 152 and 153:
7 annexesMaMuX - « Approche foncto
Page 154 and 155:
7 annexes12 mars, N. Donin et M. Du
Page 156:
mai 2010 • Graphisme Olivier Umec
show all

rapport d'activitÃ© 2009 - WWW Ircam

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?