télécharger egc10_atelier_fdc.pdf
télécharger egc10_atelier_fdc.pdf
télécharger egc10_atelier_fdc.pdf
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Approche graphique pour l’agrégation de classifications non supervisées<br />
être fixées et les partitions correspondantes sont ensuite comparées. L’existence d’une telle<br />
variabilité intra et inter méthodes est souvent évaluée par des indices de qualité en mode<br />
concurrentiel pour justifier la préférence d’une partition ou d’une méthode par rapport à une<br />
autre. Dans le cadre de ce travail, nous proposons de contourner ce problème de variabilité<br />
dans les approches de classification automatique par une alliance des différentes partitions<br />
retournées. il s'agit de mettre en place une approche de classification ensembliste (consensus)<br />
basée sur une technique de la théorie des graphes baptisée la coloration minimale permettant<br />
de retourner une seule partition finale et relativement stable, par le biais de la combinaison<br />
de différentes partitions.<br />
Plusieurs approches de consensus (Ghemi et al 2009)) ont été proposées dans la littérature<br />
dont on peut citer les approches de partitionnement d’un graphe, les approches par vote, les<br />
approches qui cherchent à optimiser l’information mutuelle comme fonction objectif et aussi<br />
les approches basées sur une matrice de co-association. Strehl et Ghosh (2002) se sont situés<br />
dans la famille des approches de partitionnement de graphe afin de développer trois<br />
algorithmes de combinaison de partitions CSPA 1 , CSPA 2 et HGPA 3 . Ces algorithmes<br />
consistent à transposer le problème de consensus dans la classification non supervisée à un<br />
problème d’algorithmique dans la théorie des graphes. Pour cela ils proposent la<br />
modélisation des différentes partitions à combiner par un hypergraphe définit par un<br />
ensemble de sommets (les individus) et d’hyper-arêtes (une arête dans un graphe permet de<br />
connecter deux sommets alors qu’une hyper-arête dans un hypergraphe peut connecter un<br />
ensemble de sommets).<br />
Les différents algorithmes proposés, cherchent à maximiser la même fonction objective dite<br />
l’information mutuelle. Pour un problème de consensus donné les auteurs proposent<br />
d’appliquer les trois algorithmes et de ne retenir que la partition retournée par l’algorithme<br />
offrant la meilleure qualité en termes d’information mutuelle. Cette partition est dite la Supra<br />
Consensus.<br />
.<br />
2 Approche proposée : Consensus par coloration de graphes<br />
Dans cette section, nous présentons une nouvelle méthodologie basée sur la théorie des<br />
graphes. Cette approche, utilisée pour résoudre le problème de combinaison des partitions,<br />
consiste à chercher une seule partition finale et relativement stable. Cette dernière provient<br />
d’un ensemble de partitions, obtenues suite à l’application de plusieurs algorithmes de<br />
classification non supervisée.<br />
1 Clusterd –based Similarity Partitionning Algorithm.<br />
2 Clusterd –based Similarity Partitionning Algorithm.<br />
3 HyperGraph-Partitionning Algorithm