12.07.2015 Views

Conception des modèles d'observation audio temps réel à l ... - atiam

Conception des modèles d'observation audio temps réel à l ... - atiam

Conception des modèles d'observation audio temps réel à l ... - atiam

SHOW MORE
SHOW LESS
  • No tags were found...

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

2.3 Formalisation du problème 11base d’entraînement que le système a perdu toute généralisation.Diminuer l’utilisation <strong>des</strong> ressources pendant la classificationPour beaucoup de classifieurs, diminuer le nombre de dimensions selonlesquelles les vecteurs sont décrit permet de diminuer la quantité de calculnécessaire à la classification <strong>des</strong> vecteurs.En plus de la diminution du nombre d’opérations à effectuer à chaquefenêtre de <strong>des</strong>cripteurs, la réduction de dimensionnalité a pour conséquencede diminuer la quantité de mémoire nécessaire au classifieur. Pour la plupart<strong>des</strong> classifieurs, plus le nombre de dimensions selon lesquelles les exemplessont décrits est faible, moins la quantité de mémoire nécessaire pour classifierun vecteur est élevée.Dans le domaine de l’interaction musicale en <strong>temps</strong>-réel, les environnementstels que Max/MSP ou PureData imposent <strong>des</strong> contraintes fortes surle <strong>temps</strong> de calcul <strong>des</strong> <strong>des</strong>cripteurs à partir du signal et le <strong>temps</strong> de classificationd’un vecteur de <strong>des</strong>cripteurs. Or, ces deux grandeurs dépendent précisémentdu nombre de <strong>des</strong>cripteurs utilisés. Réduire la dimensionnalité duproblème de classification permet donc de rendre possible la prise en compted’un nombre de <strong>des</strong>cripteurs de la base d’entraînement supérieur à ce quele système est capable de calculer en <strong>temps</strong>-réel. Ceci pose le problème de laprise en compte du coût de calcul <strong>des</strong> <strong>des</strong>cripteurs, que nous avons abordédurant ces recherches.But caché : créer de <strong>des</strong>cripteursLes <strong>des</strong>cripteurs <strong>audio</strong> courament utilisés sont <strong>des</strong> <strong>des</strong>cripteurs bas-niveaux,dans le sens où ils représentent <strong>des</strong> concepts dérivés (de façon plus ou moinscomplexe) du signal. Nous savons déjà qu’ils peuvent avoir un caractère discriminantquand ils sont utilisés pour entraîner <strong>des</strong> algorithmes de classification.Or, certains évènements que nous cherchons à détecter dans le signalcorrespondent à <strong>des</strong> concepts musicaux de haut niveau (ex : métrique,rythme, etc.). Dans cette perspective, certaines recherches ([29], [30]) ont prisla direction de la création automatique de <strong>des</strong>cripteurs. Ce principe a été appliquérécemment au domaine <strong>des</strong> applications <strong>audio</strong> [33].2.3 Formalisation du problèmeD’une part, nous considérons une fonction de détection f : x ↦→ label(x),où x ∈ R n est un vecteur de valeurs de <strong>des</strong>cripteurs et label(x) ∈ {0,1}est le label associé à ce vecteur (0 si il s’agit d’une attaque, 1 sinon). D’autrepart, nous disposons d’un ensemble E d’exemples d’apprentissage. Chaqueexemple est un couple (d,l), où d ∈ R n est un vecteur de valeurs de <strong>des</strong>cripteurset l ∈ {0,1} est le label associé à ce vecteur. Un sous-ensemblede l’espace dans lequel sont décrit les exemples est donné par un vecteurs ∈ {0,1} n . Notre but est de trouver un vecteur s maximisant la performancede détection de f. Nous aborderons le problème de l’évaluation de cette performancedans la suite de ce texte.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!