18.01.2015 Views

télécharger egc10_atelier_fdc.pdf

télécharger egc10_atelier_fdc.pdf

télécharger egc10_atelier_fdc.pdf

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Approche graphique pour l’agrégation de classifications non supervisées<br />

être fixées et les partitions correspondantes sont ensuite comparées. L’existence d’une telle<br />

variabilité intra et inter méthodes est souvent évaluée par des indices de qualité en mode<br />

concurrentiel pour justifier la préférence d’une partition ou d’une méthode par rapport à une<br />

autre. Dans le cadre de ce travail, nous proposons de contourner ce problème de variabilité<br />

dans les approches de classification automatique par une alliance des différentes partitions<br />

retournées. il s'agit de mettre en place une approche de classification ensembliste (consensus)<br />

basée sur une technique de la théorie des graphes baptisée la coloration minimale permettant<br />

de retourner une seule partition finale et relativement stable, par le biais de la combinaison<br />

de différentes partitions.<br />

Plusieurs approches de consensus (Ghemi et al 2009)) ont été proposées dans la littérature<br />

dont on peut citer les approches de partitionnement d’un graphe, les approches par vote, les<br />

approches qui cherchent à optimiser l’information mutuelle comme fonction objectif et aussi<br />

les approches basées sur une matrice de co-association. Strehl et Ghosh (2002) se sont situés<br />

dans la famille des approches de partitionnement de graphe afin de développer trois<br />

algorithmes de combinaison de partitions CSPA 1 , CSPA 2 et HGPA 3 . Ces algorithmes<br />

consistent à transposer le problème de consensus dans la classification non supervisée à un<br />

problème d’algorithmique dans la théorie des graphes. Pour cela ils proposent la<br />

modélisation des différentes partitions à combiner par un hypergraphe définit par un<br />

ensemble de sommets (les individus) et d’hyper-arêtes (une arête dans un graphe permet de<br />

connecter deux sommets alors qu’une hyper-arête dans un hypergraphe peut connecter un<br />

ensemble de sommets).<br />

Les différents algorithmes proposés, cherchent à maximiser la même fonction objective dite<br />

l’information mutuelle. Pour un problème de consensus donné les auteurs proposent<br />

d’appliquer les trois algorithmes et de ne retenir que la partition retournée par l’algorithme<br />

offrant la meilleure qualité en termes d’information mutuelle. Cette partition est dite la Supra<br />

Consensus.<br />

.<br />

2 Approche proposée : Consensus par coloration de graphes<br />

Dans cette section, nous présentons une nouvelle méthodologie basée sur la théorie des<br />

graphes. Cette approche, utilisée pour résoudre le problème de combinaison des partitions,<br />

consiste à chercher une seule partition finale et relativement stable. Cette dernière provient<br />

d’un ensemble de partitions, obtenues suite à l’application de plusieurs algorithmes de<br />

classification non supervisée.<br />

1 Clusterd –based Similarity Partitionning Algorithm.<br />

2 Clusterd –based Similarity Partitionning Algorithm.<br />

3 HyperGraph-Partitionning Algorithm

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!