tÃ©lÃ©charger egc10_atelier_fdc.pdf

More documents

Recommendations

Info

Approche graphique pour l’agrégation de classifications non supervisées (3) 2.2 Modélisation du problème par la théorie des graphes Dans cette partie, nous allons modéliser les informations des différentes partitions à l’aide d’un graphe. Pour cela, nous considérons la représentation graphique des données à grouper comme un graphe complet, non orienté et pondéré. Dans ce graphe les sommets sont les individus à analyser et les arêtes les liens pondérés par les dissimilarités entre les paires de données. Une définition classique suppose qu’une classe ou «cluster» est un ensemble d’éléments similaires ou semblables, et les éléments de différentes classes sont différents. En effet une classe devrait satisfaire les deux conditions suivantes : la première c’est que l’homogénéité interclasses doit être élevée ; la deuxième consiste à une hétérogénéité forte entre les éléments de classes différentes. Ces deux conditions s’élèvent à affirmer que les arêtes entre deux sommets de la même classes devraient avoir une forte similarité reflétant une faible pondération ; et ceux entre les sommets de classes différentes devraient avoir une faible similarité donc une pondération élevée. 2.2.1 Coloration minimale pour un consensus de classification non supervisée Afin de définir notre algorithme, qui permet de trouver le meilleur compromis entre les différentes partitions à combiner, nous nous sommes basés sur le principe de la coloration minimale. L’approche fondée sur la coloration minimale permet de définir des partitions à faible diamètre (Hanssen et al (1978)) (un critère d’homogénéité intraclasse). Ceci répond exactement à notre objectif qui est de maximiser l’information mutuelle de la partition retenue, considérée lui aussi comme un critère d’homogénéité intraclasse (Strehl et al (2002)). La représentation par graphe complet ne convient pas au problème de classification non supervisée. En effet, la coloration minimale du graphe retournerait la classification "triviale" où chaque cluster (couleur) contient un seul individu (singleton). La coloration minimale passe donc par la construction d’un graphe seuil supérieur défini comme le graphe partiel du graphe de départ. Un graphe seuil supérieur G(V,E) est un graphe simple ayant pour ensemble de sommets les sommets du graphe d’origine V={v 1 ,...,v n } et pour ensemble d’arêtes E les paires de sommets dont la dissimilarité est supérieure à un seuil choisi à partir de la table de dissimilarité des individus (i.e. ∀v i ,v j ∈ V , l’arête (v i ,v j ) existe ssi D(v i ,v j ) > où D(v i ,v j ) est la dissimilarité entre v i et v j ). Dans la suite de cet article, deux sommets sont voisins (resp. non voisins) s’ils sont "adjacents" (resp. "non adjacents"). Nous cherchons donc à établir une coloration valide du graphe G(V, ), qui consiste à affecter une couleur c à chaque sommet v
F. Hamdi et al tel que deux sommets adjacents n’ont pas la même couleur. Le nombre de couleur utilisé doit être minimal. • Algorithme de coloration minimale Plusieurs algorithmes ont été développés afin de résoudre le problème de la coloration minimale d’un graphe, le plus connu et le plus utilisé c’est l’algorithme Largest First (LF) développé par Welsh et Powell en 1967. Cet algorithme permet de ranger l’ensemble des sommets dans un ordre décroissant par rapport à leurs degrés, il vise à construire une partition de l’ensemble des données à classer sans donner de l’importance à la séparation entre les classes. Cet algorithme présente quelques limitations liées au choix de couleurs des sommets dans certain cas. En effet il n’attribut pas un critère de choix entre les sommets du moment où ils ont le même degré. • Adaptation et/ou amélioration de LF : G-Cons Dans un premier temps, nous avons adapté l’algorithme LF à la problématique d’agrégation des partitions, ce qui nous a permis d’obtenir des résultats encourageants. Néanmoins le LF présente certaines faiblesses. Par conséquent, nous avons proposé un algorithme ensembliste appelé G-Cons. Cet algorithme est une modification de Largest First dans le but d’améliorer la qualité de la partition retournée en apportant des solutions à ces problèmes. Dans une première étape de notre algorithme nous proposons d’effectuer un prétraitement des individus, en regroupant ceux qui sont toujours ensemble dans toutes les partitions. Le prétraitement des individus va conduire à la construction d’une nouvelle matrice réduite D’ de taille n’ x n’ (n’
Page 1: Extraction et Gestion de Connaissan
Page 4 and 5: Fouille de données complexes - com
Page 6 and 7: Fouille de données complexes - com
Page 9 and 10: Fusion de segmentation et classific
Page 11 and 12: Lengrand-Lambert et al. FIG. 2 - Ex
Page 13 and 14: Lengrand-Lambert et al. Fisher est
Page 15 and 16: Lengrand-Lambert et al. 4 Algorithm
Page 17 and 18: Lengrand-Lambert et al. tats en sor
Page 19 and 20: Lengrand-Lambert et al. ride roche
Page 21 and 22: Modélisation du conflit dans les b
Page 23 and 24: Chebbah et al. Une fonction de mass
Page 25 and 26: Chebbah et al. de l’intégration
Page 27 and 28: Chebbah et al. La fiabilité absolu
Page 29 and 30: Chebbah et al. 1 0.9 0.8 0.7 0.6 K
Page 31 and 32: Chebbah et al. FIG. 2 - Distributio
Page 33 and 34: Recalage et fusion d’images sonar
Page 35 and 36: Rominger et Martin FIG. 1 - Techniq
Page 37 and 38: Rominger et Martin La fonction de m
Page 39 and 40: Rominger et Martin Formellement, no
Page 41 and 42: Rominger et Martin dance deux trace
Page 43 and 44: Rominger et Martin Références App
Page 45 and 46: Approche graphique pour l’agréga
Page 47: F. Hamdi et al 2.1 Description gén
Page 51 and 52: F. Hamdi et al Algorithme 1 : G-Con
Page 53 and 54: F. Hamdi et al 3.1 Etude comparativ
Page 55 and 56: F. Hamdi et al L’indice de Davie
Page 57 and 58: Etude d’opérateurs d’agrégati
Page 59 and 60: J. Nagau et al. FIG. 1 - Résultat
Page 61 and 62: J. Nagau et al. et 0 < √ a 2 + b
Page 63 and 64: J. Nagau et al. Le seul opérateur
Page 65 and 66: J. Nagau et al. groupe de pixels pa
Page 67: J. Nagau et al. Zimmerman, H. et P.
Page 70 and 71: Visualisation de données spatiotem
Page 82 and 83: Étude de données multisources par
Page 92 and 93: Grands graphes de l’application.
Page 94 and 95: Grands graphes L’approche la plus
Page 96 and 97: Grands graphes 3.1.2 Mesure de rép
Page 98 and 99:
Grands graphes 4 Expérimentation N
Page 100 and 101:
Grands graphes FIG. 3 - Visualisati
Page 102 and 103:
Grands graphes fictation, en déter
Page 104 and 105:
Un langage et un générateur pour
Page 106 and 107:
Page 108 and 109:
Page 110 and 111:
Page 112 and 113:
Page 114 and 115:
Page 116 and 117:
Liaisons complexes entre variables
Page 118 and 119:
Page 120 and 121:
Page 122 and 123:
Page 124 and 125:
Page 126 and 127:
Page 128 and 129:
Les multi-sources dans un contexte
Page 130 and 131:
Page 132 and 133:
Page 134 and 135:
Page 136 and 137:
Page 138 and 139:
Page 140 and 141:
Event Annotation based on Machine L
Page 142 and 143:
Page 144 and 145:
Page 146 and 147:
Page 148 and 149:
Page 150:
show all

tÃ©lÃ©charger egc10_atelier_fdc.pdf

Create successful ePaper yourself

Delete template?

Save as template?