26.01.2015 Views

Untitled - WWW Ircam

Untitled - WWW Ircam

Untitled - WWW Ircam

SHOW MORE
SHOW LESS
  • No tags were found...

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

4 RECHERCHE ET DÉVELOPPEMENT, L’UMR STMS<br />

Estimation de la structure temporelle<br />

L’étude de l’estimation de la structure temporelle a suivi trois<br />

axes en 2011. Le premier concerne l’estimation de la structure<br />

basée sur les changements au cours du temps de la<br />

tonalité locale. Le deuxième concerne l’estimation d’un paramètre<br />

permettant de désigner (pour un morceau donné et un<br />

pré-calcul donné) la représentation (parmi celles en état et<br />

en séquence) la plus appropriée [Peeters11e]. Le troisième<br />

concerne la proposition de nouvelles mesures de discrimination<br />

entre séquence et non-séquence dans une matrice de<br />

similarité.<br />

Recherche par similatité acoustique<br />

La version 2.0 du système de similarité acoustique développée<br />

en 2011 prend en compte les problèmes de scalabilité<br />

et de robustesse. Pour cela une modélisation sous<br />

forme d’UBM (universal background model) dans un espace<br />

métrique est proposée [Charbuillet11a]. Une expérience de<br />

similarité entre titres musicaux a été menée permettant de<br />

conclure à l’équivalence des recommandations de type Pandora<br />

(référence dans le domaine) et la version 2.0. La version<br />

2.0 a été soumise aux campagnes d’évaluation internationale<br />

MIREX (premier ex-æquo) et Quaero-Eval-11.<br />

Classification mono – label, multi-label<br />

La version 3.0 du système de classification générique de<br />

l’<strong>Ircam</strong> a été développée en 2011. Elle repose sur un nouvel<br />

étage d’analyse modélisant les descripteurs MFCC et SFM<br />

d’une part par le nouveau modèle UBM/Super-Vector et,<br />

d’autre part, par un modèle AR vectoriel (coefficient a_k<br />

ainsi que modélisation du résiduel ARV par un UBM/Supervector).<br />

Ces descripteurs modélisés sont ensuite utilisés<br />

pour l’apprentissage de classifieurs binaires de types SVM<br />

(noyau RBF). Ce système a été utilisé pour l’apprentissage<br />

des classes genre, humeur, instrumentation, live/studio ainsi<br />

que la segmentation voix chantée/musique dans le prototype<br />

MSSE d’Orange. Le système a été évalué très positivement<br />

(deuxième place) lors de l’évaluation internationale MIREX,<br />

ainsi que Quaero-Eval-11.<br />

Parallèlement, les études sur le timbre instrumental ont été<br />

poursuivies à travers la mise à disposition d’une ToolBox<br />

Matlab référençant les descripteurs de timbre ([Peeters11d],<br />

et à travers l’étude de la fusion perceptive et du timbre de<br />

dyades instrumentales composées d’un instrument percussif<br />

et d’un instrument tenu [Tardieu12a]. Une étude innovante<br />

sur l’effet du processus de production (mastering et utilisation<br />

du champ stéréo) en musique, a également été effectuée<br />

donnant lieu à de niveau descripteurs [Tardieu 11a].<br />

Identification audio<br />

En 2011, le processus de synchronisation des codes entre<br />

base et flux, présenté cette année à l’ICASSP [Ramona11c],<br />

a été consolidé de manière à garantir un flux « pseudorégulier<br />

» de time-stamps, même en cas de non détection<br />

d’onsets. Afin de comparer avec précision la détection<br />

d’onsets sur les deux signaux, un processus de correction<br />

et de synchronisation des annotations a été développé<br />

[Ramona11f]. L’évaluation Quaero 2011 a également été un<br />

rendez-vous majeur de l’année. De par le volume de la base<br />

d’apprentissage (100.000 titres), elle a nécessité le développement<br />

d’outils de détection de correction des redondances<br />

au sein d’une collection d’extraits audio. Un article collaboratif<br />

sur l’environnement d’évaluation [Ramona11b] est en<br />

instance d’être publié.<br />

Annotations, campagnes d’évaluation et Intégration<br />

La deuxième phase de création de corpus pour le projet<br />

Quaero s’est poursuivie en 2011. L’<strong>Ircam</strong> a également fourni<br />

les corpus et les environnements d’évaluation pour de nombreuses<br />

tâches de Quaero-Eval-11 et participé aux campagnes<br />

MIREX-11 et Quaero-Eval-11. Les technologies de<br />

l’<strong>Ircam</strong> du projet Quaero ont également été intégrées dans<br />

les applications MUMA (Exalead), MSSE (Orange).<br />

Quaero : Intégration des modules d’indexation dans le démonstrateur<br />

MSSE développé par Orange Labs<br />

■ Modélisation physique pour l’analyse<br />

et la synthèse du son<br />

Validation de modèles 1D de tubes acoustiques<br />

à section variable<br />

Les résonateurs d’instruments à vent ont souvent été approchés<br />

par des cascades de tubes droits ou coniques, tant pour<br />

la synthèse sonore par guides d’ondes que le calcul de fonctions<br />

de transferts caractéristiques (impédance d’entrée,<br />

transmittance, etc.) : la raison principale est d’exploiter les<br />

propriétés simples des ondes planes ou sphériques (décomposition<br />

en ondes progressives et formalisme en guides<br />

d’ondes numériques, méthode des matrices de transfert à<br />

expression analytique, etc.)<br />

Ces dernières années, des raffinements possibles de ce type<br />

de modélisation ont été recherchés et élaborés, en particulier<br />

pour traiter le cas délicat des cuivres et des pavillons.<br />

IRCAM – RAPPORT D’ACTIVITÉ 2011<br />

82

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!