Untitled - WWW Ircam
Untitled - WWW Ircam
Untitled - WWW Ircam
- No tags were found...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
4 RECHERCHE ET DÉVELOPPEMENT, L’UMR STMS<br />
Estimation de la structure temporelle<br />
L’étude de l’estimation de la structure temporelle a suivi trois<br />
axes en 2011. Le premier concerne l’estimation de la structure<br />
basée sur les changements au cours du temps de la<br />
tonalité locale. Le deuxième concerne l’estimation d’un paramètre<br />
permettant de désigner (pour un morceau donné et un<br />
pré-calcul donné) la représentation (parmi celles en état et<br />
en séquence) la plus appropriée [Peeters11e]. Le troisième<br />
concerne la proposition de nouvelles mesures de discrimination<br />
entre séquence et non-séquence dans une matrice de<br />
similarité.<br />
Recherche par similatité acoustique<br />
La version 2.0 du système de similarité acoustique développée<br />
en 2011 prend en compte les problèmes de scalabilité<br />
et de robustesse. Pour cela une modélisation sous<br />
forme d’UBM (universal background model) dans un espace<br />
métrique est proposée [Charbuillet11a]. Une expérience de<br />
similarité entre titres musicaux a été menée permettant de<br />
conclure à l’équivalence des recommandations de type Pandora<br />
(référence dans le domaine) et la version 2.0. La version<br />
2.0 a été soumise aux campagnes d’évaluation internationale<br />
MIREX (premier ex-æquo) et Quaero-Eval-11.<br />
Classification mono – label, multi-label<br />
La version 3.0 du système de classification générique de<br />
l’<strong>Ircam</strong> a été développée en 2011. Elle repose sur un nouvel<br />
étage d’analyse modélisant les descripteurs MFCC et SFM<br />
d’une part par le nouveau modèle UBM/Super-Vector et,<br />
d’autre part, par un modèle AR vectoriel (coefficient a_k<br />
ainsi que modélisation du résiduel ARV par un UBM/Supervector).<br />
Ces descripteurs modélisés sont ensuite utilisés<br />
pour l’apprentissage de classifieurs binaires de types SVM<br />
(noyau RBF). Ce système a été utilisé pour l’apprentissage<br />
des classes genre, humeur, instrumentation, live/studio ainsi<br />
que la segmentation voix chantée/musique dans le prototype<br />
MSSE d’Orange. Le système a été évalué très positivement<br />
(deuxième place) lors de l’évaluation internationale MIREX,<br />
ainsi que Quaero-Eval-11.<br />
Parallèlement, les études sur le timbre instrumental ont été<br />
poursuivies à travers la mise à disposition d’une ToolBox<br />
Matlab référençant les descripteurs de timbre ([Peeters11d],<br />
et à travers l’étude de la fusion perceptive et du timbre de<br />
dyades instrumentales composées d’un instrument percussif<br />
et d’un instrument tenu [Tardieu12a]. Une étude innovante<br />
sur l’effet du processus de production (mastering et utilisation<br />
du champ stéréo) en musique, a également été effectuée<br />
donnant lieu à de niveau descripteurs [Tardieu 11a].<br />
Identification audio<br />
En 2011, le processus de synchronisation des codes entre<br />
base et flux, présenté cette année à l’ICASSP [Ramona11c],<br />
a été consolidé de manière à garantir un flux « pseudorégulier<br />
» de time-stamps, même en cas de non détection<br />
d’onsets. Afin de comparer avec précision la détection<br />
d’onsets sur les deux signaux, un processus de correction<br />
et de synchronisation des annotations a été développé<br />
[Ramona11f]. L’évaluation Quaero 2011 a également été un<br />
rendez-vous majeur de l’année. De par le volume de la base<br />
d’apprentissage (100.000 titres), elle a nécessité le développement<br />
d’outils de détection de correction des redondances<br />
au sein d’une collection d’extraits audio. Un article collaboratif<br />
sur l’environnement d’évaluation [Ramona11b] est en<br />
instance d’être publié.<br />
Annotations, campagnes d’évaluation et Intégration<br />
La deuxième phase de création de corpus pour le projet<br />
Quaero s’est poursuivie en 2011. L’<strong>Ircam</strong> a également fourni<br />
les corpus et les environnements d’évaluation pour de nombreuses<br />
tâches de Quaero-Eval-11 et participé aux campagnes<br />
MIREX-11 et Quaero-Eval-11. Les technologies de<br />
l’<strong>Ircam</strong> du projet Quaero ont également été intégrées dans<br />
les applications MUMA (Exalead), MSSE (Orange).<br />
Quaero : Intégration des modules d’indexation dans le démonstrateur<br />
MSSE développé par Orange Labs<br />
■ Modélisation physique pour l’analyse<br />
et la synthèse du son<br />
Validation de modèles 1D de tubes acoustiques<br />
à section variable<br />
Les résonateurs d’instruments à vent ont souvent été approchés<br />
par des cascades de tubes droits ou coniques, tant pour<br />
la synthèse sonore par guides d’ondes que le calcul de fonctions<br />
de transferts caractéristiques (impédance d’entrée,<br />
transmittance, etc.) : la raison principale est d’exploiter les<br />
propriétés simples des ondes planes ou sphériques (décomposition<br />
en ondes progressives et formalisme en guides<br />
d’ondes numériques, méthode des matrices de transfert à<br />
expression analytique, etc.)<br />
Ces dernières années, des raffinements possibles de ce type<br />
de modélisation ont été recherchés et élaborés, en particulier<br />
pour traiter le cas délicat des cuivres et des pavillons.<br />
IRCAM – RAPPORT D’ACTIVITÉ 2011<br />
82