traitement d'images par modèles discrets sur ... - Olivier Lezoray

More documents

Recommendations

Info

70 Chapitre 3 - Classification de données d’images par apprentissage 3.4 Construction de fonctions de décision parcimonieuses ☞ Mes publications associées : [13, 14, 43, 44, 48–50, 52, 60, 64, 65, 71] 3.4.1 Sélection de modèle et parcimonie La construction de fonctions de décision simplifiées est essentielle dans les applications ayant des contraintes de temps réel importantes. L’objectif est alors de pouvoir produire des solutions fortement parcimonieuses tout en conservant des capacités en généralisation performantes. Dans nos travaux, nous nous sommes intéressés à la construction de fonctions de décision parcimonieuses pour les SVM [ABE05, CRISTI00]. La réduction de la complexité des fonctions de décision des SVM peut être réalisée en agissant sur deux points essentiels : – la réduction de la taille de la base d’apprentissage, en ne conservant que les exemples les plus informatifs, – la sélection des attributs les plus utiles pour un problème donné de classification. La complexité, en temps d’évaluation de la fonction de décision d’un SVM, est linéairement dépendante du nombre de vecteurs de support. Comme ce nombre est borné par le nombre d’exemples, l’utilisation d’une base d’apprentissage de taille réduite permet de s’assurer une limitation contrôlée de sa complexité. Les SVM ont par nature la possibilité de sélectionner un nombre réduit d’exemples comme vecteurs de support, mais les données d’apprentissage étant bruitées dans la majorité des cas, ce nombre est généralement élevé. Nous avons vu dans la section précédente qu’il n’est pas toujours nécessaire d’utiliser l’ensemble des données d’apprentissage. En revanche, il est très intéressant de choisir un ensemble réduit d’exemples représentatifs du problème d’apprentissage, pour produire une fonction de décision performante avec l’algorithme des SVM. Bien entendu, plus il y a de données pour décrire un problème d’apprentissage et plus les possibilités pour produire une fonction de décision performante à partir de ces données sont grandes. La sélection d’un sous-ensemble réduit d’exemples (ou d’attributs) est lui-même un processus d’apprentissage et elle doit utiliser un principe d’inférence robuste pour garantir de bonnes capacités en généralisation. Ces deux points se retrouvent également dans le processus de fouille de données. Pour tous les classificateurs, la sélection d’un modèle a une grande influence sur les capacités en généralisation. Les SVM n’y échappent pas. Il est en effet nécéssaire de régler deux hyperparamètres que sont la largeur de bande du noyau Gaussien σ et la constante de régularisation C. Si l’algorithme des SVM permet de sélectionner un hyperplan de séparation optimal, lorsque ces différents paramètres sont fixés, la façon de réaliser le choix des valeurs optimales à donner aux paramètres libres d’un modèle reste à définir. Une procédure classique, nommée grid search [CHANG01], est suffisante dans le cas où le noyau n’a qu’un paramètre à sélectionner (en plus de la valeur de la constante de régularisation C), mais elle devient difficilement exploitable avec plus de deux paramètres. Parmi les paramètres que l’on peut souhaiter régler, on trouve par exemple : – La recherche d’un sous-ensemble d’exemples pertinents, – La recherche d’un sous-ensemble d’attributs pertinents, – Le réglage des hyper-paramètres de l’algorithme (σ et C). Dans la littérature liée à la classification de données provenant d’images, les SVM sont souvent écartés pour plusieurs raisons [MARÉ03, MARTIN04]. Premièrement, si la base d’apprentissage est grande, l’apprentissage des SVM peut s’avérer très long. De plus, si la fonction de
3.4. Construction de fonctions de décision parcimonieuses 71 décision produite par un SVM utilise beaucoup de vecteurs de support (ce qui risque d’arriver si les données sont bruitées), le processus de classification sera également long. En outre, les SVM sont souvent utilisés sans réellement prendre garde à optimiser les précédents paramètres que nous avons cités et ceci peut avoir une grande influence sur leurs performances, comme pour tout algorithme d’apprentissage artificiel supervisé. Nous nous attacherons dans la suite à montrer qu’en cherchant à construire des fonctions de décision simplifiées, les SVM peuvent, à l’aide d’une sélection de modèle appropriée, fournir les modèles parcimonieux adaptés à la classification de données d’images. 3.4.2 Construction de fonctions de décision simplifiées Partant des constatations précédentes, nous avons proposé d’exploiter des techniques de classification non-supervisées pour réduire la redondance inutile dans les données, et ainsi découvrir une représentation simplifiée et représentative de la base initiale. Comme les SVM sont sensibles à une sélection efficace des hyper-paramètres, nous avons également pour objectif de réaliser une optimisation de ceux-ci. La recherche d’un modèle performant combinant le choix des hyper-paramètres des SVM, la simplification de la base en nombre d’exemples et en nombre d’attributs utilisés correspond à l’exploration d’un espace de recherche de dimension importante. Pour pallier cet inconvénient, une méthode méta-heuristique à base de recherche avec tabous a été définie. Un nouveau critère de qualité qui correspond à un compromis entre capacité de généralisation et rapidité de la décision est proposé. Il permet à l’utilisateur de spécifier quel taux de dégradation de la qualité prédictive de la fonction de décision il est prêt à accepter, si cela conduit à une amélioration significative des temps de décision. Nous détaillons tous ces principes dans la suite. 3.4.2.1 Prototypage d’une base Naturellement, nous nous sommes intéressés aux techniques d’apprentissage non supervisé pour produire un ensemble réduit de prototypes à partir d’un ensemble plus conséquent de données d’apprentissage [JAIN99, MEILA05, XU05, TAN06]. Notre but est de produire un ensemble de prototypes suffisamment représentatifs de la base de données. Ces prototypes seront ensuite utilisés pour entraîner un SVM. Les prototypes ne sont pas nécessairement des exemples de la base d’apprentissage, mais des données synthétisées à partir d’elle. Nous avons choisi d’utiliser l’algorithme de quantification vectorielle LBG (Linde, Buzo et Gray [LINDE80]). Le but de notre méthode de simplification est de produire, pour un niveau donné de simplification, un ensemble réduit de prototypes qui soit fortement représentatif de la répartition des données de chaque classe. Chaque prototype produit par notre méthode de simplification doit résumer le mieux possible un ensemble d’exemples d’une classe donnée de la base d’apprentissage. Pour produire ce résultat, l’algorithme LBG est appliqué, pour une valeur de k fixée représentant le niveau de simplification, à tous les exemples d’une classe donnée (maximum 2 k prototypes sont obtenus). Une valeur de k faible correspondra à un niveau de simplification important, et réciproquement. La figure 3.7 présente la construction d’un ensemble de prototypes sur une base d’apprentissage de classification de pixels. Nous avons pu mettre en évidence [LEBRUN06], sur plusieurs bases de référence, que l’apprentissage d’un SVM sur une base prototypée est plus sensible aux choix de ses hyper-paramètres (C et σ). Cependant, l’apprentissage sur des prototypes fournit des informations utiles sur les couples d’hyper-paramètres performants. La simplifica-
Page 1:
UNIVERSITÉ de CAEN BASSE-NORMANDIE
Page 5 and 6:
TABLE DES MATIÈRES 1 Introduction
Page 7:
Table des matières VII A.5.2 Activ
Page 10 and 11:
2 Chapitre 1 - Introduction génér
Page 12 and 13:
4 Chapitre 2 - Traitement d’image
Page 14 and 15:
Page 16 and 17:
Page 18 and 19:
10 Chapitre 2 - Traitement d’imag
Page 20 and 21:
Page 22 and 23:
Page 24 and 25:
Page 26 and 27:
Page 28 and 29: 20 Chapitre 2 - Traitement d’imag
Page 34 and 35: 26 2.2.5 Conclusion et perspectives
Page 50 and 51: 42 2.4 Hiérarchies de partitions 2
Page 66 and 67: 58 Chapitre 3 - Classification de d
Page 105 and 106: CHAPITRE 4 Conclusion générale et
Page 107 and 108: 4.2. Perspectives et Projets 99 cap
Page 109 and 110: 4.2. Perspectives et Projets 101 pr
Page 111 and 112: CHAPITRE 5 Bibliographie [ABE05] [A
Page 113 and 114: Chapitre 5 - Bibliographie 105 [CEL
Page 115 and 116: Chapitre 5 - Bibliographie 107 [GOU
Page 117 and 118: Chapitre 5 - Bibliographie 109 [KUL
Page 119 and 120: Chapitre 5 - Bibliographie 111 [MEY
Page 121 and 122: Chapitre 5 - Bibliographie 113 [SCH
Page 123: Chapitre 5 - Bibliographie 115 [VER
Page 126 and 127: 118 Annexe A - Curriculum Vitae - D
Page 128 and 129:
120 Annexe A - Curriculum Vitae FIG
Page 130 and 131:
122 Annexe A - Curriculum Vitae afi
Page 132 and 133:
124 Annexe A - Curriculum Vitae - R
Page 135 and 136:
ANNEXE B Publications Publications
Page 137 and 138:
Annexe B - Publications 129 [18] O.
Page 139 and 140:
Annexe B - Publications 131 [44] G.
Page 141:
Annexe B - Publications 133 [71] G.
show all

traitement d'images par modèles discrets sur ... - Olivier Lezoray

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?