10.07.2015 Views

ANALYSE FACTORIELLE MULTIPLE PROCRUSTEENNE

ANALYSE FACTORIELLE MULTIPLE PROCRUSTEENNE

ANALYSE FACTORIELLE MULTIPLE PROCRUSTEENNE

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>ANALYSE</strong> <strong>FACTORIELLE</strong> <strong>MULTIPLE</strong> <strong>PROCRUSTEENNE</strong>Elisabeth Morand & Jérôme PagèsAgrocampus RennesLaboratoire de mathématiques appliquéesCS 8421535042 Rennes cedexRésuméPour comparer deux nuages de points homologues, la méthode de référence estl’analyse procrustéenne et, dans le cas de plus de deux nuages, l’analyseprocrustéenne généralisée (GPA). L’analyse factorielle multiple (AFM) fournit aussiune représentation superposée de nuages de points homologues. Cette dernièrereprésentation bénéficie, par rapport à celle issue de la GPA, d’avantages (elles’inscrit dans le cadre d’une analyse factorielle riche en aides à l’interprétation) etd’inconvénients (les nuages à comparer subissent des déformations autres queles seules projections et rotations).Il est possible de compléter l’AFM par un ajustement procrustéen de chacun desnuages initiaux sur le nuage moyen de l’AFM. On obtient ainsi unereprésentation de ces nuages qui à la fois respecte le modèle procrustéen ets’inscrit dans le cadre de l’AFM. D’où le nom d’analyse factorielle multipleprocustéenne (AFMP). Nous présentons ici quelques unes de ses propriétés.Cette nouvelle représentation est précieuse lorsque les nuages initiaux sontbidimensionnels. Une application dans ce cas particulier est présentée.Mots-clés : Analyse Procrustéenne Généralisée, Analyse Factorielle Multiple,Analyse Factorielle Multiple Procrustéenne.AbstractTo compare two homologous clouds of points, the method mainly used is theprocrustes analysis and in the case of more than two clouds of points, theGeneralized Procrustes Analysis (GPA). The Multiple Factor Analysis (MFA) alsoprovides a superposed representation of several homologous clouds of points.This latter representation gets, against the one stemmed from, advantages (it isincluded in the framework of a factor analysis rich in viewpoints in analysis ofseveral clouds of points) and drawbacks (the clouds to compare experiencedifferent distortions than the only projections and rotations)We can complement the MFA by a procrustes adjustment of each initial cloud onthe average cloud of the MFA. We thus get representation of those clouds whichboth respect the procrustes pattern and is included into the framework of theMFA. Hence the name of procrustes multiple factor analysis (PMFA). We presenthere its properties. This new representation is very useful when the initial cloudsare two-dimensional.An application of this particular case is presented.Key words : Generalized Procrustes Analysis, Multiple Factor Analysis,Procrustes Multiple Factor Analysis.1


La coordonnée, sur l’axe principal de rang s, de l’individu i vu par le groupe j,notée F s(i j ), s’exprime comme combinaison linéaire des coordonnées des seulesvariables du groupe j sur ce même axe. Ceci se traduit par la formule detransition suivante, dans laquelle on reconnaît la restriction au groupe j de larelation de transition classique :j j 1 1Fs( i ) = Fs( i)= ∑ xikGs( k)jλsλ1k∈Kjen notant :F s(i j )projection de l’individu i j sur l’axe principal de rang s du nuage desindividus N I ;G s(k) projection sur l’axe de rang s de la variable k ;λ s est l’inertie projetée du nuage N I .En contrepartie de cette précieuse propriété, cette représentation présente desdéformations autres que celles induites par les projections. En effet, chaquenuage partiel est projeté sur deux axes n’appartenant pas à son sous-espaceinitial (figure 2).⊕R K= R K jθ sji ju su sjR K jFigure 2. Projection de l’individu i du nuage j dans N Iu s: axe principal de rang s du nuage des individusu sj: composante de u sdans l’espace du nuage partiel j.i j , i ème ligne de X ~jet appartenant à R Kj , est dans unjpremier temps projeté sur u spuis, en multipliant lescoordonnées par cos( θ ), sur u sisNous proposons ci-après une représentation procrustéenne à la fois intégrée àl’AFM, d’où la dénomination d’analyse factorielle multiple procrustéenne (AFMP),et telle que les nuages initiaux ne subissent aucune autre déformation que cellesrésultant des projections.Toutefois, il est à noter que dans le cas où les nuages partiels sont dans unespace à plus de deux dimensions, la représentation procrustéenne, bien que nondéformée dans l’espace total, le sera lors de sa représentation finale en deuxdimensions, par projection sur un espace de dimension inférieure.MéthodePrincipejChaque nuage partiel NIest ajusté, à l’aide d’une rotation procrustéenne, sur lenuage moyen N I de l’AFM.Du point de vue de l’algorithme, on utilise les S premières composantes de lareprésentation moyenne de l’AFM. Le choix de la dimension, S, est à discuter3


suivant les cas. Le tableau ainsi obtenu, de dimension (I, S), est noté F ~ . Onconsidère ensuite, pour chaque groupe j, les tableaux X j pondérés comme en1AFM, soit les tableaux Xjj. Nous cherchons à les rapprocher de F ~ par uneλrotation procrustéenne de1⎡⎛⎞⎛transformation géométrique T jtel que ⎢⎜~ 1 ⎟⎜~Trace F − XjTjF −⎢⎜j ⎟⎜⎣⎝λ1⎠⎝et ce sous la contrainteT jT j′=I.On obtient alors les tableaux ‘‘ procrustéanisés ”,1λj1XjXˆjsur F ~ . Cela revient donc à chercher une=1λj1XjTj'⎤1 ⎞X ⎟ ⎥jTsoit minimumjjλ ⎟ ⎥1 ⎠ ⎦Xˆ jpar les relations suivantes.Où T j=V jU j′ avec :V jla matrice orthogonale des vecteurs propres normés de la matrice :1 ' ~~ 'Xj jFFXjλ1U jla matrice orthogonale des vecteurs propres normés de la matrice :1 ~ ' ' ~F X X Fjλ 1jjCe calcul revient à effectuer la dernière boucle de l’algorithme de Gower (1975) enprenant comme consensus le nuage moyen issu de l’AFM.PropriétésPour la représentation des nuages partiels ainsi obtenue, il n’y a plus de relationsde transition partielles. En contrepartie, les nuages partiels n’ont subi aucunedéformation autre que les rotations orthogonales.Remarque. Cette représentation est particulièrement intéressante dans le casbidimensionnel, puisque la représentation des nuages partiels n’est absolumentpas déformée.ExempleOn présente ici un exemple dans le cadre bidimensionnel pour illustrer l’intérêtde la nouvelle méthode par rapport à la représentation superposée usuelle del’AFM.DonnéesOn a demandé à 11 dégustateurs de fournir chacun une représentationeuclidienne de 10 vins blancs de Val de Loire (5 Chenins, numérotés de 1 à 5, et5 Sauvignons, numérotés de 6 à 10) en les positionnant sur une nappe. Ondispose alors de J=11 représentations euclidiennes. Ainsi, des vins proches surune nappe sont des vins qui paraissent similaires au juge. Les données analyséessont les coordonnées X j(i) et Y j(i) de chaque vin i, mesurées sur la nappe du juge j.4


1Juge1 Juge j Juge 11X 1Y 1X jY jX 11Y 11vins i X 1(i) Y 1(i) X j(i) Y j(i) X 11(i) Y 11(i)I=10RésultatsA titre d’exemple, nous représentons ici la nappe fournie par le juge 9.Remarquons en particulier sur cette nappe les vins 7 et 10 relativementexcentrés.37.5Y93 T Trotignon30.022.56 V Aub. Silex2 T Renaudie4 T Buisse Domaine8 V Font. Domaine15.010 V Font Coteaux7 V Aub. Marigny5 T Buisse Cristal7.59 V Font. Brûlés1 T MichaudX900 15 30 45 60Figure 3 : Représentation des 10 vins par le juge 9Ces données sont traitées par une AFM dans laquelle chaque nappe constitue ungroupe de deux variables non réduites.8Facteur 2 - 26.68 %8Facteur 2 - 26.68 %40318294 567 10403G91G98G99G95G94G92G96G910G97G9-4-4-4 0 4Facteur 1 - 39.39 %Figure 4a. Représentation du nuagemoyende l’AFM-4 0 4 Facteur 1 - 39.39 %Figure 4b. Représentation du nuagepartiel du juge 9 pour l’AFMSur la représentation moyenne des individus ainsi obtenue (figure 4a) il estcommode d’orienter les commentaires selon les deux bissectrices. La premièrebissectrice sépare les Sauvignons (vins 1 à 5) des Chenins (vins 6 à 10). La5

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!