10.07.2015 Views

RAPPORT D'ACTIVITÉ 2003 - WWW Ircam

RAPPORT D'ACTIVITÉ 2003 - WWW Ircam

RAPPORT D'ACTIVITÉ 2003 - WWW Ircam

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>RAPPORT</strong> DETAILLERECHERCHE ET DEVELOPPEMENTACOUSTIQUE - Acoustique des sallesscène à partir des signaux audio qui la composent. Ladisponibilité de cette description ouvre la voie à destransformations ultérieures ou à l’inclusion d’un nouvelélément dont la spatialisation sera synthétisée en fonction dela description de scène obtenue (placement automatique dessources dans l’espace pour minimiser les masquages mutuels etrespect de l’effet de salle). Le travail de thèse présentéci-dessous constitue une première étape dans une voie que nousdésirons poursuivre dans les prochaines années.1.2.2.1 Extraction automatique de descripteurs spatiauxL'objet de cette recherche est de proposer des méthodesautomatiques de description objective des aspects spatiauxd'une scène sonore enregistrée, sans connaissance préalable nides sources qui la composent, ni du message sonore diffusé, nides caractéristiques du lieu d'enregistrement. L'étude seconcentre plus spécifiquement sur l'estimation de la directionde la source (supposée unique et stable dans un premier temps)et sur une caractérisation de l'enveloppe de réverbération. Uncadre théorique, inspiré des modèles d'audition spatiale,permet de développer un ensemble homogène de méthodes dedétection et d'estimation, basées sur des statistiques nonstationnaires d'ordre 2 relatives aux relations entre lesvoies de l'enregistrement. Les informations obtenues danschaque bande de fréquences sont ensuite regroupées etinterprétées au moyen de descripteurs de plus haut niveau. Lapertinence de cette approche est étudiée sur desenregistrements binauraux synthétiques et réels.L'essentiel du travail mené en <strong>2003</strong> a consisté en une synthèsedes différentes études menées jusqu'ici, dans une optique derédaction du mémoire [Baskind03b]. Cela a été notammentl'occasion de développer et de consolider le modèle dedétection et de localisation dit "par égalisation etannulation", inspiré par des modèles psychoacoustiquesd'audition spatiale, et reposant en pratique sur desalgorithmes inspirés des techniques monophoniques de détectionde sons harmoniques développées par Alain de Cheveigné del'équipe Perception et Cognition Musicales à travers leprogramme 'Yin' [DeCheveigne02k]. La récente implémentation entemps réel de Yin par Norbert Schnell de l'équipe"Applications temps réel" permet de souligner la pertinence decette approche, et d'envisager le développement d'applicationsbasées sur les méthodes de détection et de descriptionproposées dans ce travail. Cette thèse a été présentée etsoutenue publiquement en décembre <strong>2003</strong>.Toujours dans le cadre de cette collaboration ont étéprésentés, à la 24e conférence spécialisée de l'AES, destravaux annexes basés sur l'estimation de fréquencefondamentale en milieu réverbérant [Baskind03a].Participants : A. Baskind (thèse)Collaborations internes : A. de Cheveigné (équipe Perceptionet cognition musicales)1.2.3 Cognition spatiale auditiveDans le domaine de la reproduction sonore ou de lacommunication les technologies audio futures tenteront deprivilégier les sensations d’immersion et de présence. Cesnotions sont intimement liées aux dimensions spatiales d’une- 51 -

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!