Actes - Société Francophone de Classification

Recommendations

Info

SFC 2009 Algorithme 1 CAH pour données ordinales Démarrer avec chaque objet dans sa propre classe Calcul des dissimilarités entre les classes à l’aide ∆(zk,z ′ k ), ∀k, k′ =1, . . . , n tel que k �= k ′ Tant que Nombre de classes strictement supérieur à1Faire Agrégation des deux classes les plus proches zk et z ′ k en une nouvelle classe z∗ k Pour Chaque variable j =1, . . . , d Faire Recherche des modalités principales a j k∗ (en respectant p j ak∗ ≥ pe∀e =1, . . . , cj) Fin Pour Calcul des nouvelles dissimilarités ∆(zℓ,z∗ k ) entre chaque classe zℓ (avec ℓ �= k, k ′ ) et la nouvelle classe créée z∗ k Fin Tant que 5. Conclusion Nous abordons dans ce travail la classification hiérarchique de données ordinales sous l’approche modèle de mélange. Le critère d’agrégation utilisé est issu d’un modèle de mélange multinomial contraint, permettant de prendre en compte le caractère ordinal des données. Des expériences à partir de données simulées seront présentées en tenant compte de plusieurs situations. Cellesci dépendront du nombre de classes, du degré de mélange et du paramètre q. Nous comparerons les résultats de l’algorithme 1 et l’algorithme obtenu lorsqu’on considère le modèle multinomial sans contraintes (les variables étant considérées comme qualitatives nominales) et le modèle gaussien (les variables étant considérées comme quantitatives). Cette étude sera illustrée par une application sur des données réelles. 6. Bibliographie [BAN 93] BANFIELD J. D., RAFTERY A. E., Model-based Gaussian and non-Gaussian Clustering, Biometrics, vol. 49, 1993, p. 803–821. [CEL 92] CELEUX G., GOVAERT G., A Classification EM Algorithm for Clustering and Two Stochastic Versions, Computational Statistics & Data Analysis, vol. 14, 1992, p. 315–332. [CEL 95] CELEUX G., GOVAERT G., Gaussian Parcimonious Clustering Methods, Pattern Recognition, vol. 28, 1995, p. 781–793. [CHE 96] CHEESEMAN P., STUTZ J., Bayesian Classification (AutoClass) : Theory and Results, FAYYAD U., PIATETSKY- SHAPIRO G., UTHURUSAMY R., Eds., Advances in Knowledge Discovery and Data Mining, AAAI Press, 1996, p. 61–83. [D’E 05] D’ELIA A., PICCOLO D., A mixture model for preferences data analysis, Computational Statistics & Data Analysis, vol. 49, 2005, p. 917–934. [FLI 93] FLIGNER M., VERDUCCI J., Probability models and statistical analysis of ranking data, Springer, New-York, 1993. [GOU 06] GOUGET C., Utilisation des modèles de mélange pour la classification automatique de données ordinales, PhD thesis, Université de Technologie de Compiègne, December 2006. [LAZ 68] LAZARFELD P., HENRY N., Latent Structure Analysis, Houghton Mifflin, Boston, 1968. [MAR 95] MARDEN J., Analyzing and modeling rank data, Chapman & Hall, London, 1995. [NAD 93] NADIF M., MARCHETTI F., Classification de donnés qualitatives et modèles, Revue de Statistique Appliquée, vol. XLI, n o 1, 1993, p. 55–69. 96
Structure des réseaux phylogénétiques de niveau borné Philippe Gambette, Vincent Berry, Christophe Paul Laboratoire d’Informatique, de Robotique et de Microélectronique de Montpellier. C.N.R.S., Université Montpellier 2. 161 rue Ada, 34392 Montpellier Cedex 5 France RÉSUMÉ. Les réseaux phylogénétiques généralisent les arbres phylogénétiques en représentant des échanges de matériel génétique entre espèces par des branches qui se rejoignent pour former des parties réticulées. Le niveau est un paramètre introduit sur les réseaux phylogénétiques enracinés pour décrire la complexité de leur structure par rapport à un arbre [JAN 04]. Des algorithmes polynomiaux ont récemment été proposés pour reconstruire un réseau de niveau borné compatible avec un ensemble de triplets fournis en entrée [IER 08, TO 09]. Nous étudions la structure d’un réseau de niveau borné pour montrer qu’il peut être décomposé en un arbre de générateurs choisis parmi un ensemble fini. Nous nous intéressons alors à la pertinence du paramètre de niveau dans le cadre d’un modèle d’évolution avec recombinaisons : le modèle coalescent. MOTS-CLÉS : Combinatoire, Décomposition, Graphe, Réseau phylogénétique. 1. Introduction et définitions Un arbre phylogénétique est un arbre binaire enraciné avec des arcs (orientés, donc) et des feuilles étiquetées bijectivement par un ensemble X de taxons, qui représentent le plus souvent des espèces ou des gènes. Un réseau phylogénétique explicite est une généralisation d’arbre phylogénétique qui permet de prendre en compte les échanges de matériel génétique entre espèces, qui sont très fréquents entre les bactéries [DOO 99] mais aussi présents chez les végétaux ou même les animaux [HUB 55]. Ces échanges peuvent correspondre à divers événements biologiques : hybridation, recombinaison, transferts horizontaux. . . On peut définir formellement un réseau phylogénétique explicite comme un multigraphe orienté acyclique, contenant : exactement un sommet a degré entrant 0 et degré sortant 2 (la racine) ; des sommets de degré entrant 1 et de degré sortant 2 (sommets de spéciation) ; des sommets de degré entrant 2 et de degré sortant au plus 1 (sommets hybrides) ; des sommets étiquetés bijectivement par un ensemble X de taxons, de degré entrant 1 et de degré sortant 0 (feuilles). Dans la Figure 2(a) est représenté un réseau phylogénétique explicite N de racine ρ et d’ensemble de taxons X = {a, b, c, d, e, f, g, h, i}. Les sommets hi sont des sommets hybrides et ceux non étiquetés sont des sommets de spéciation. Notons que parler de multigraphe, c’est à dire autoriser la présence de plusieurs arcs entre deux sommets, est un détail technique qui permet la présence de cycles à deux sommets dans le réseau phylogénétique, comme celui contenant h1 en figure 2(a). Un graphe orienté est dit biconnexe s’il ne contient aucun sommet d’articulation (dont la suppression déconnecte le graphe). Une composante biconnexe (ou blob) d’un réseau phylogénétique N est un sous-graphe biconnexe maximal de N. Pour tout arc (u, v) de N, on appelle u un père de v, et v un fils de u. Un réseau phylogénétique explicite est dit de niveau k [JAN 04] si toute composante biconnexe contient au plus k sommets hybrides. Un réseau de niveau k qui n’est pas de niveau k-1 est dit strictement de niveau k. Par exemple, dans la Figure 2(a), la composante biconnexe de N qui contient le plus de sommets hybrides est située dans la zone grise (elle contient h3 et h4), donc N est strictement de niveau 2. 97
Page 1:
XVIèmes Rencontres de la Société
Page 5 and 6:
Préface Construire le programme sc
Page 7:
Comité de programme Président : G
Page 10 and 11:
Classification supervisée avec sec
Page 12 and 13:
DONNEES SYMBOLIQUES Extension de l'
Page 15 and 16:
Réduction non-linéaire de dimensi
Page 17 and 18:
Inférence de langages stochastique
Page 19 and 20:
Approximations en norme du supremum
Page 21 and 22:
Ordonnancement et optimisation de l
Page 23 and 24:
Forêts aléatoires : importance et
Page 25 and 26:
Adaptation des modèles d’auto-or
Page 27 and 28:
- le critère objectif évalue le d
Page 29 and 30:
Kohonen Approach for Assisted Livin
Page 31 and 32:
4. Results During the Quatra projec
Page 33 and 34:
Auto-organisation d’une structure
Page 35 and 36:
structure/problème sont les suivan
Page 37 and 38:
A Latent Logistic Model to Uncover
Page 39 and 40:
The maximum ln p(X | α, ˜ W) of L
Page 41 and 42:
Classification de variables et dét
Page 43 and 44:
Afin de contourner cette difficult
Page 45 and 46:
Données manquantes en ACM : l’al
Page 47 and 48:
Application des SVM à la classific
Page 49 and 50:
TABLE 1. Paramètres retenus pour l
Page 51 and 52:
Dissimilarity-based metric for data
Page 53 and 54:
where ! = [1 1 "1 "2] T is the norm
Page 55 and 56:
Analyse Discriminante Dissymétriqu
Page 57 and 58:
Propriété: My étant un produit s
Page 59 and 60: Classification supervisée avec sec
Page 61 and 62: sique, Ii est classée selon la mé
Page 63 and 64: Discrimination sur des données arb
Page 65 and 66: 2.3. Indices de similarité sur les
Page 67 and 68: Reliability of error estimators in
Page 69 and 70: FIG. 1. Comparison of the true and
Page 71 and 72: Comparaison et classification de s
Page 73 and 74: ang k =0est associé au vecteur con
Page 75 and 76: Apprentissage de différentes class
Page 77 and 78: TAB. 1. Caractéristiques des donn
Page 79 and 80: Comparaison et évaluation de métr
Page 81 and 82: g ∈ [−0.05, 0.05] et ag ∈ [0,
Page 83 and 84: Analyse de la stabilité d’une pa
Page 85 and 86: algorithme de partionnement Ak en k
Page 87 and 88: Indice de distance sur les structur
Page 89 and 90: Imbrication de deux partitions semi
Page 91 and 92: Détermination du nombre de classes
Page 93 and 94: à la disjonction floue des degrés
Page 95 and 96: Distance de compression et classifi
Page 97 and 98: On appelle fermé minimal de E, tou
Page 99 and 100: !"#$%&'(&#)*+"#$%&**","#$)##&%-."#$
Page 101 and 102: !"#$%#&'()'*'+#$,'-.$/%#'0'()'1'-.$
Page 103 and 104: Une méthode de partitionnement pou
Page 105 and 106: 3. Applications Dans cette section,
Page 107 and 108: Classification hiérarchique de don
Page 109: j et x je i =1si l’individu i pre
Page 113 and 114: Ce théorème de décomposition en
Page 115 and 116: Résumés de textes par extraction
Page 117 and 118: alors que TEXTRANK décrit un proce
Page 119 and 120: Analyse de graphes de données text
Page 121 and 122: minimal de toute triangulation mini
Page 123 and 124: Estimation des paramètres d’une
Page 125 and 126: La dérivée f ′ d ln Γ(x) (δ)
Page 127 and 128: Vers une discrétisation locale pou
Page 129 and 130: 2.2. Les treillis dichotomiques et
Page 131 and 132: Combiner treillis de Galois et anal
Page 133 and 134: FIG. 1. Résultats de l’AFM et tr
Page 135 and 136: An approach based on Formal Concept
Page 137 and 138: In this paper, we only consider num
Page 139 and 140: Tatouages et motivations pour se fa
Page 141 and 142: FIGURE 1 - !"#$%&'%(&"(()*+"$+),(&%
Page 143 and 144: Approche pour le suivi des changeme
Page 145 and 146: Total of clusters 0 1 2 3 4 5 6 7 8
Page 147 and 148: Classification des émotions dans u
Page 149 and 150: 3. Méthode Conformément à la pro
Page 151 and 152: Utilisation de RandomForest pour la
Page 153 and 154: par pouvoir discriminant décroissa
Page 155 and 156: Une méthode de combinaison de rés
Page 157 and 158: Avant d’expliquer la manière don
Page 159 and 160: Consensus de partitions : une appro
Page 161 and 162:
une partition de score nul. Le cas
Page 163 and 164:
Analyse en Composantes Principales
Page 165 and 166:
modalité), la matrice de variance
Page 167 and 168:
Une méthode d’ACP de données en
Page 169 and 170:
B n = Mn ( ZnZ n '! " n" n '), On d
Page 171 and 172:
Régression - corrélation : un poi
Page 173 and 174:
où les b j i (resp. les b0i )dési
Page 175 and 176:
Classification non-supervisée de d
Page 177 and 178:
Algorithm 1 CoFKM Entrée : Ensembl
Page 179 and 180:
Classification floue de données in
Page 181 and 182:
x " i xˆ # x " i " iMAX ! x ! ! iM
Page 183 and 184:
!"#$%&'()&"*+ #,'+ #$-,*#(*.,'+ %".
Page 185 and 186:
!"#$%&'#()*+,-+."(+/&,01/1."$(-"2$+
Page 187 and 188:
Classification sous contraintes gé
Page 189 and 190:
3. Introduction du Modèle Nous pro
Page 191 and 192:
177
Page 193 and 194:
179
Page 195 and 196:
New LISA indices for spatio-tempora
Page 197 and 198:
semi-definite positive by construct
Page 199 and 200:
K-mean clustering of misaligned fun
Page 201 and 202:
Moreover, define the labelling func
Page 203 and 204:
Multiple Comparison Procedures for
Page 205 and 206:
3. Simulation study and results A s
Page 207 and 208:
Dynamic clustering of data describe
Page 209 and 210:
H where i p ( ) ( j f H f ) i = ! j
Page 211 and 212:
Correspondence analysis with linear
Page 213 and 214:
where UT U = I, VT V = I and Λ is
Page 215 and 216:
Applying Differential Geometric LAR
Page 217 and 218:
Let ru (β A(γ)) = (ru(β1(γ0)),
Page 219 and 220:
Catégorisation de documents à l
Page 221 and 222:
3.2. Les résultats Les documents o
Page 223 and 224:
Essais de classification par l’in
Page 225 and 226:
Pour la modélisation de l’interm
Page 227 and 228:
Index R. Abdesselam 41 J. Aguilar-M
show all

Actes - Société Francophone de Classification

Create successful ePaper yourself

Delete template?

Save as template?