10.07.2015 Views

RAPPORT D'ACTIVITÉ 2003 - WWW Ircam

RAPPORT D'ACTIVITÉ 2003 - WWW Ircam

RAPPORT D'ACTIVITÉ 2003 - WWW Ircam

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>RAPPORT</strong> DETAILLERECHERCHE ET DEVELOPPEMENTANALYSE ET SYNTHESE DES SONS3.3.1.3 Résumés musicaux visuels et sonores : approchepar séquenceL’estimation de la structure d’oeuvres musicales à partir dusignal a été étudiée en <strong>2003</strong> suivant l’approche dite « parséquences », c'est-à-dire par recherche de répétitions desuccessions d’événements au cours du temps (en 2002, une étudeavait porté sur une représentation « par états »). L’approchepar séquence est particulièrement appropriée pour la détectionde mélodies ou de phrases musicales répétées d’un morceau[Peeters03a], [Peeters03d], [Peeters03e]. Pour cela, deuxnouveaux algorithmes sont proposés : 1) pour la détection desdiagonales (répétitions) de la matrice de similarité (filtragestructurant 2D) 2) pour la combinaison des diagonales(répétitions) afin de former les séquences-mères. Commel’approche par état, l’approche par séquence donne lieu à unereprésentation visuelle (piano-roll) et une représentationsonore (résumé sonore).Responsable: G. Peeters3.3.2 Reconnaissance des instruments et indexation desenregistrementsLe travail de Geoffroy Peeters en 2002 sur la reconnaissancedes instruments a été poursuivi pendant <strong>2003</strong>. Différentsalgorithmes de classification ont été comparés [Livshin03b].D’autres algorithmes ont été développés pour évaluer lespropriétés des bases de données, en particulier pour détecteret enlever les échantillons trop excentriques par rapport à ladistribution de leur classe. Un nouvel algorithme de sélectionde descripteurs a été mis au point. Enfin une comparaison aété effectuée de différentes techniques d'évaluation desméthodes de classification [Livshin03b]. Dans la premièrepartie de l’année, l’étude a porté sur la classificationautomatique des instruments dans les bases de données de notesmusicales isolées (en particulier la base Studio en ligne del'<strong>Ircam</strong>). Un des principaux résultats est que les basesgénéralement disponibles ne couvrent qu’une très petiteportion des enregistrements de notes possibles pour uninstrument. Pour y remédier, il faut compiler de nombreusesbases d’origines aussi variées que possible [Livshin03a]. Lapremière partie de l’année, a été consacrée à lareconnaissance dans des enregistrements musicaux réels, en selimitant au début à des enregistrements solos. Des résultatstrès intéressants ont été obtenus qui permettent d’aborderavec confiance le véritable problème, c'est-à-dire lareconnaissance des instruments (indexation) dans lesenregistrements polyphoniques.Responsable : X. RodetParticipants : G. Peeters, A. Livshin (thèse)Collaborations internes : E. Vincent (thèse)3.3.3 Collaboration multimodale pour l'indexationLe but de cette thèse est de comprendre les mécanismes quirelient les informations contenues dans les différents médiasd'un document multimédia. Dans le contexte d'une base dedonnées multimédia, on cherche à caractériser ces relations defaçon à permettre l'indexation et la recherche des contenus- 95 -

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!