30.01.2013 Views

Actes - Société Francophone de Classification

Actes - Société Francophone de Classification

Actes - Société Francophone de Classification

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

SFC 2009<br />

Algorithme 1 CAH pour données ordinales<br />

Démarrer avec chaque objet dans sa propre classe<br />

Calcul <strong>de</strong>s dissimilarités entre les classes à l’ai<strong>de</strong> ∆(zk,z ′ k ), ∀k, k′ =1, . . . , n tel que k �= k ′<br />

Tant que Nombre <strong>de</strong> classes strictement supérieur à1Faire<br />

Agrégation <strong>de</strong>s <strong>de</strong>ux classes les plus proches zk et z ′ k en une nouvelle classe z∗ k<br />

Pour Chaque variable j =1, . . . , d Faire<br />

Recherche <strong>de</strong>s modalités principales a j<br />

k∗ (en respectant p j<br />

ak∗ ≥ pe∀e =1, . . . , cj)<br />

Fin Pour<br />

Calcul <strong>de</strong>s nouvelles dissimilarités ∆(zℓ,z∗ k ) entre chaque classe zℓ (avec ℓ �= k, k ′ ) et la nouvelle classe<br />

créée z∗ k<br />

Fin Tant que<br />

5. Conclusion<br />

Nous abordons dans ce travail la classification hiérarchique <strong>de</strong> données ordinales sous l’approche modèle <strong>de</strong><br />

mélange. Le critère d’agrégation utilisé est issu d’un modèle <strong>de</strong> mélange multinomial contraint, permettant <strong>de</strong><br />

prendre en compte le caractère ordinal <strong>de</strong>s données.<br />

Des expériences à partir <strong>de</strong> données simulées seront présentées en tenant compte <strong>de</strong> plusieurs situations. Cellesci<br />

dépendront du nombre <strong>de</strong> classes, du <strong>de</strong>gré <strong>de</strong> mélange et du paramètre q. Nous comparerons les résultats <strong>de</strong><br />

l’algorithme 1 et l’algorithme obtenu lorsqu’on considère le modèle multinomial sans contraintes (les variables<br />

étant considérées comme qualitatives nominales) et le modèle gaussien (les variables étant considérées comme<br />

quantitatives). Cette étu<strong>de</strong> sera illustrée par une application sur <strong>de</strong>s données réelles.<br />

6. Bibliographie<br />

[BAN 93] BANFIELD J. D., RAFTERY A. E., Mo<strong>de</strong>l-based Gaussian and non-Gaussian Clustering, Biometrics, vol. 49, 1993,<br />

p. 803–821.<br />

[CEL 92] CELEUX G., GOVAERT G., A <strong>Classification</strong> EM Algorithm for Clustering and Two Stochastic Versions, Computational<br />

Statistics & Data Analysis, vol. 14, 1992, p. 315–332.<br />

[CEL 95] CELEUX G., GOVAERT G., Gaussian Parcimonious Clustering Methods, Pattern Recognition, vol. 28, 1995,<br />

p. 781–793.<br />

[CHE 96] CHEESEMAN P., STUTZ J., Bayesian <strong>Classification</strong> (AutoClass) : Theory and Results, FAYYAD U., PIATETSKY-<br />

SHAPIRO G., UTHURUSAMY R., Eds., Advances in Knowledge Discovery and Data Mining, AAAI Press, 1996, p. 61–83.<br />

[D’E 05] D’ELIA A., PICCOLO D., A mixture mo<strong>de</strong>l for preferences data analysis, Computational Statistics & Data Analysis,<br />

vol. 49, 2005, p. 917–934.<br />

[FLI 93] FLIGNER M., VERDUCCI J., Probability mo<strong>de</strong>ls and statistical analysis of ranking data, Springer, New-York, 1993.<br />

[GOU 06] GOUGET C., Utilisation <strong>de</strong>s modèles <strong>de</strong> mélange pour la classification automatique <strong>de</strong> données ordinales, PhD<br />

thesis, Université <strong>de</strong> Technologie <strong>de</strong> Compiègne, December 2006.<br />

[LAZ 68] LAZARFELD P., HENRY N., Latent Structure Analysis, Houghton Mifflin, Boston, 1968.<br />

[MAR 95] MARDEN J., Analyzing and mo<strong>de</strong>ling rank data, Chapman & Hall, London, 1995.<br />

[NAD 93] NADIF M., MARCHETTI F., <strong>Classification</strong> <strong>de</strong> donnés qualitatives et modèles, Revue <strong>de</strong> Statistique Appliquée,<br />

vol. XLI, n o 1, 1993, p. 55–69.<br />

96

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!