Conception des modÃ¨les d'observation audio temps rÃ©el Ã l ... - atiam

More documents

Recommendations

Info

16 Sélection de descripteurset l’évaluation du classifieur sont longs, et très sujets à la dimensionnalité).En revanche, il a le mérite de permettre d’optimiser en fonction d’un critère quiprend en compte le classifieur. C’est ce qui le distingue autres algorithmes présentés.2.7 Classifieurs utilisésLes stratégies de sélection de descripteurs abordées précédemment sontapplicables à tout type de classifieur. Nous allons ici présenter les deux classifieursque nous avons utilisé lors de nos expériences. Leur entraînement etleur évaluation demande peu de calculs, ce qui les rend cohérents avec l’utilisationdans le cadre du suivi de partition.Classifieur bayésien naïf Pour deux évènements A et B, la formule deBayes permet d’exprimer la probabilité conjointe de A et B en fonction dela probabilité a posteriori de l’évènement B sachant la réalisation de l’évènementA, et de la probabilité de l’évènement A :P(A ∩ B) = P(B|A) × P(A)La formule de Bayes donne la probabilité a posteriori de l’évènement A sachantla réalisation de l’évènement B :P(A|B) =P(A) × P(B|A)P(B)Le classifieur bayésien naïf [16] s’appuie sur cette formule pour estimer lesprobabilités conditionnelles P(C i |D), où les C i sont les différentes classespossibles, et D un vecteur de valeurs de descripteurs à classifier. La classechoisie est celle qui maximise la probabilité conditionnelle. Il convient de noterque le modèle de Bayes suppose une indépendance statistique entre lesparamètres (ici, les descripteurs), ce qui constitue bien sûr une approximationdans notre application.Gaussiennes multi-dimensionnelles modélisant chaque classe L’autre approcheutilisée (décrite dans [4]) consiste à modéliser chaque classe à l’aided’une gaussienne multi-dimensionnelle, où chaque dimension correspond àun descripteur. Les paramètres µ et σ de chaque gaussienne sont évaluésgrâce à l’algorithme Expectation Maximization [7]. Les deux gaussiennes multidimensionnellesainsi formées permettent de déduire une probabilité d’appartenancepour chaque classe. Pour étiqueter un vecteur de descripteurs, laclasse pour laquelle la probabilité d’appartenance est maximale est retenue.Le fonctionnement de ce classifieur est naïf dans la mesure où il supposeque les classes sont représentables par des groupes de points. En revanche,l’étiquetage d’un vecteur demande une quantité de calculs extrêmementfaible, ce qui fait de cet algorithme un bon candidat pour les applicationstemps-réel. Il est très sensible au bruit, ce qui en fait un classifieurpertinent dans le cadre d’un travail sur la sélection de descripteurs.
2.8 Évaluation de la performance 172.8 Évaluation de la performanceConcernant l’évaluation des algorithmes de sélection de descripteurs, leproblème posé par les approches filter (c’est-à-dire la non connaissance del’influence du nombre de descripteurs sur les performances du classifieur)met en avant la nécessité d’utiliser des critères d’évaluation relatifs à la performancede l’algorithme de classification qui effectue la segmentation. D’autrescritères [10] indépendants du classifieur existent : une mesure de la séparabilitédes classes (pour lequel un bon sous-ensemble de descripteurs assure unebonne séparabilité) ou encore une mesure d’entropie (pour laquelle un bonsous-ensemble de descripteurs est non-redondant). Nous ne les avons pas retenusdans la mesure où ils ne permettent pas de juger de la performance dusystème.L’évaluation des performances des algorithmes de sélection de descripteurspasse donc par l’évaluation de la performance de détection du classifieur.Celle-ci peut être estimée en calculant la proportion de vecteurs malclassifiés (erreur de classification) sur une base de test distincte de la based’apprentissage. Une variante très courante de cette méthode, la k-fold crossvalidation,est plus adaptée aux situations où les utilisateurs des algorithmesde sélection ne disposent pas d’une base de test séparée de la base d’entraînement.Elle consiste à partitionner la base d’entraînement en k parties, àentraîner le modèle de classification utilisé sur k − 1 parties, puis à estimerla proportion de classifications correctes en utilisant la partie restante commebase de test. Le procédé est répété k fois de façons à ce que chacune des kparties joue une fois le rôle de base de tests. Les performances obtenues dansles k configurations différentes sont finalement moyennées.Enfin, il existe un dernier critère d’évaluation : l’aire sous la courbe ROC.L’utilisation d’un classifieur passe par le choix d’un seuil de sensibilité permettantde définir à partir de quelle probabilité d’appartenance un vecteurest déclaré "positif", soit appartenant à la classe. Issue de la théorie de la détectiondu signal, la courbe ROC (Reciever Operating Characteristic) est calculéeen mesurant le compromis entre faux positifs et faux négatifs pour les différentesvaleurs du seuil de sensibilité. La figure 2.2 page suivante en donneun exemple. Un classifieur qui étiquette les vecteurs au hasard correspond àla diagonale entre (0,0) et (1,1), soit une aire sour la courbe de valeur 0,5. Àl’opposé, un classifieur "parfait" correspond à une droite entre (0,1) et (1,1),soit une aire sous la courbe de valeur 1.Comparé à l’erreur de classification, l’aire sous la courbe ROC a le méritede prendre en compte les différentes valeurs possibles du seuil de détection.De plus, certaines publications récentes ([15], [5]) affirment que l’aire sous lacourbe ROC est un meilleur critère que l’erreur de classification pour caractériserla "qualité" de détection d’un modèle d’apprentissage.Pour savoir comment sont évalués les algorithmes de sélection de descripteurs,nous avons considéré comme référence le concours de sélection dedescripteurs NIPS 2003, dont les résultats sont analysés dans [13]. Les algorithmesde sélection sont évalués selon les critères suivants :– L’erreur de classification équilibrée (balanced error rate), qui est la pro-
Page 1: Université Pierre & Marie Curie, P
Page 5: AbstractMusical interaction between
Page 8 and 9: viii
Page 10 and 11: xTABLE DES MATIÈRES5 Discussion et
Page 12 and 13: stage. Celles-ci mettent en exergue
Page 14 and 15: 4 Pré-requisindépendamment l’un
Page 16 and 17: 6 Pré-requisFenêtre de signalCalc
Page 18 and 19: 8 Pré-requissont calculés à part
Page 20 and 21: 10 Sélection de descripteursà la
Page 22 and 23: 12 Sélection de descripteursSi les
Page 24 and 25: 14 Sélection de descripteursclasse
Page 28 and 29: 18 Sélection de descripteursFIG. 2
Page 30 and 31: 20 Sélection de descripteurs et ca
Page 38 and 39: 28 Expérimentationsune représenta
Page 40 and 41: 30 Expérimentations4.4 Première a
Page 42 and 43: 32 Expérimentationsvaleurs mesuré
Page 44 and 45: 34 Expérimentations181716Wrapper (
Page 46 and 47: 36 ExpérimentationsGain de perform
Page 48 and 49: 38 ExpérimentationsCoût de calcul
Page 50 and 51: 40 Expérimentations0.850.8Aire sou
Page 52 and 53: 42 Discussion et directions futures
Page 54 and 55: 44 Discussion et directions futures
Page 57: ConclusionDurant ce stage, nous avo
Page 60 and 61: [13] Isabelle Guyon, Steve Gunn, As
Page 63 and 64: Annexes
Page 65: Nom du descripteurNombre de dimensi
Page 69: Liste des tableaux4.1 Erreur d’ap

Conception des modÃ¨les d'observation audio temps rÃ©el Ã l ... - atiam

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?