Actes - Société Francophone de Classification
Actes - Société Francophone de Classification
Actes - Société Francophone de Classification
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
SFC 2009<br />
Algorithme 1 CAH pour données ordinales<br />
Démarrer avec chaque objet dans sa propre classe<br />
Calcul <strong>de</strong>s dissimilarités entre les classes à l’ai<strong>de</strong> ∆(zk,z ′ k ), ∀k, k′ =1, . . . , n tel que k �= k ′<br />
Tant que Nombre <strong>de</strong> classes strictement supérieur à1Faire<br />
Agrégation <strong>de</strong>s <strong>de</strong>ux classes les plus proches zk et z ′ k en une nouvelle classe z∗ k<br />
Pour Chaque variable j =1, . . . , d Faire<br />
Recherche <strong>de</strong>s modalités principales a j<br />
k∗ (en respectant p j<br />
ak∗ ≥ pe∀e =1, . . . , cj)<br />
Fin Pour<br />
Calcul <strong>de</strong>s nouvelles dissimilarités ∆(zℓ,z∗ k ) entre chaque classe zℓ (avec ℓ �= k, k ′ ) et la nouvelle classe<br />
créée z∗ k<br />
Fin Tant que<br />
5. Conclusion<br />
Nous abordons dans ce travail la classification hiérarchique <strong>de</strong> données ordinales sous l’approche modèle <strong>de</strong><br />
mélange. Le critère d’agrégation utilisé est issu d’un modèle <strong>de</strong> mélange multinomial contraint, permettant <strong>de</strong><br />
prendre en compte le caractère ordinal <strong>de</strong>s données.<br />
Des expériences à partir <strong>de</strong> données simulées seront présentées en tenant compte <strong>de</strong> plusieurs situations. Cellesci<br />
dépendront du nombre <strong>de</strong> classes, du <strong>de</strong>gré <strong>de</strong> mélange et du paramètre q. Nous comparerons les résultats <strong>de</strong><br />
l’algorithme 1 et l’algorithme obtenu lorsqu’on considère le modèle multinomial sans contraintes (les variables<br />
étant considérées comme qualitatives nominales) et le modèle gaussien (les variables étant considérées comme<br />
quantitatives). Cette étu<strong>de</strong> sera illustrée par une application sur <strong>de</strong>s données réelles.<br />
6. Bibliographie<br />
[BAN 93] BANFIELD J. D., RAFTERY A. E., Mo<strong>de</strong>l-based Gaussian and non-Gaussian Clustering, Biometrics, vol. 49, 1993,<br />
p. 803–821.<br />
[CEL 92] CELEUX G., GOVAERT G., A <strong>Classification</strong> EM Algorithm for Clustering and Two Stochastic Versions, Computational<br />
Statistics & Data Analysis, vol. 14, 1992, p. 315–332.<br />
[CEL 95] CELEUX G., GOVAERT G., Gaussian Parcimonious Clustering Methods, Pattern Recognition, vol. 28, 1995,<br />
p. 781–793.<br />
[CHE 96] CHEESEMAN P., STUTZ J., Bayesian <strong>Classification</strong> (AutoClass) : Theory and Results, FAYYAD U., PIATETSKY-<br />
SHAPIRO G., UTHURUSAMY R., Eds., Advances in Knowledge Discovery and Data Mining, AAAI Press, 1996, p. 61–83.<br />
[D’E 05] D’ELIA A., PICCOLO D., A mixture mo<strong>de</strong>l for preferences data analysis, Computational Statistics & Data Analysis,<br />
vol. 49, 2005, p. 917–934.<br />
[FLI 93] FLIGNER M., VERDUCCI J., Probability mo<strong>de</strong>ls and statistical analysis of ranking data, Springer, New-York, 1993.<br />
[GOU 06] GOUGET C., Utilisation <strong>de</strong>s modèles <strong>de</strong> mélange pour la classification automatique <strong>de</strong> données ordinales, PhD<br />
thesis, Université <strong>de</strong> Technologie <strong>de</strong> Compiègne, December 2006.<br />
[LAZ 68] LAZARFELD P., HENRY N., Latent Structure Analysis, Houghton Mifflin, Boston, 1968.<br />
[MAR 95] MARDEN J., Analyzing and mo<strong>de</strong>ling rank data, Chapman & Hall, London, 1995.<br />
[NAD 93] NADIF M., MARCHETTI F., <strong>Classification</strong> <strong>de</strong> donnés qualitatives et modèles, Revue <strong>de</strong> Statistique Appliquée,<br />
vol. XLI, n o 1, 1993, p. 55–69.<br />
96