08.05.2014 Views

Analyse en composantes principales

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

220<br />

225<br />

230<br />

235<br />

240<br />

où v j k est la j-ème coordonnée du vecteur v k.<br />

Ainsi, bi<strong>en</strong> qu’ayant ret<strong>en</strong>u un sous-espace factoriel expliquant une part importante de l’inertie totale,<br />

il est possible que certaines variables ou individus d’intérêt soi<strong>en</strong>t mal représ<strong>en</strong>tés dans ce sous-espace.<br />

Il sera alors intéressant de compléter le sous-espace factoriel <strong>en</strong> ajoutant des axes factoriels supplém<strong>en</strong>taires<br />

de sorte que ces variables ou individus d’intérêt soi<strong>en</strong>t bi<strong>en</strong> représ<strong>en</strong>tés.<br />

4.2 Sélection du nombre k d’axes factoriels à ret<strong>en</strong>ir<br />

La sélection du nombre d’axes à ret<strong>en</strong>ir, abordée précédemm<strong>en</strong>t, est une étape importante d’une<br />

ACP. Les critères utilisés sont <strong>en</strong> général empiriques : la méthode du coude qui consiste à détecter un<br />

coude sur le diagramme des valeurs propres, ou le critère de Kaiser. Ce dernier consiste à ne ret<strong>en</strong>ir<br />

que les valeurs propres supérieures à la moy<strong>en</strong>ne : puisqu’on est <strong>en</strong> ACP normée la somme des valeurs<br />

propres est égale au nombre p de ces valeurs propres, et la moy<strong>en</strong>ne des valeurs propres est donc égale<br />

à 1. On ne reti<strong>en</strong>dra donc par le critère de Kaiser que les valeurs propres supérieures à 1.<br />

4.3 Interprétation<br />

La méthode la plus naturelle pour interpréter les <strong>composantes</strong> <strong>principales</strong> (ou les axes factoriels)<br />

est de les relier aux variables initiales, <strong>en</strong> utilisant les corrélations précédemm<strong>en</strong>t introduites. Généralem<strong>en</strong>t,<br />

pour un couple de <strong>composantes</strong> <strong>principales</strong> c 1 et c 2 , on représ<strong>en</strong>te les corrélations dans une<br />

figure appelée cercle de corrélation (Figure 3), où chaque variable z j est représ<strong>en</strong>tée par un point de<br />

coordonnées (r(c 1 , z j ), r(c 2 , z j )).<br />

Une fois les <strong>composantes</strong> <strong>principales</strong> interprétées, on représ<strong>en</strong>te les individus dans les plans factoriels<br />

formés <strong>en</strong> croisant deux à deux les axes factoriels ret<strong>en</strong>us (Figure 4). Chaque représ<strong>en</strong>tation est interprétée<br />

<strong>en</strong> essayant de repérer des groupes d’individus et <strong>en</strong> donnant à ces groupes une signification <strong>en</strong><br />

fonction de leur place dans les plans factoriels.<br />

5 Application à l’exemple des cidres<br />

Une ACP normée a été réalisée sur les données de cidres précédemm<strong>en</strong>t introduites, et nous prés<strong>en</strong>tons<br />

une analyse synthétique des résultats dans cette section.<br />

La première étape consiste à sélectionner le nombre d’axes factoriels que l’on souhaite conserver. En<br />

utilisant le critère de Kaiser, nous sélectionnons les 3 premières valeurs propres (Tableau 3), qui expliqu<strong>en</strong>t<br />

<strong>en</strong>semble plus de 87% de l’inertie totale du nuage de points. Néanmoins, comme le troisième<br />

λ 1 λ 2 λ 3 λ 4 λ 5 λ 6 λ 7 λ 8 λ 9 λ 10<br />

valeur propre 5,154 2,502 1,097 0,834 0,194 0,14 0,049 0,024 0,006 0<br />

inertie expliquée (%) 51,54 25,02 10,97 8,34 1,94 1,40 0,49 0,24 0,06 0<br />

inertie expl. cumulée (%) 51,54 76,56 87,53 95,87 97,81 99,21 99,70 99,94 100 100<br />

TAB. 3 – Tableau des valeurs propres.<br />

245<br />

axe n’est corrélé significativem<strong>en</strong>t qu’avec une seule variable, la variable acidité, nous ne le considérons<br />

pas dans l’interprétation synthétique prés<strong>en</strong>tée dans ce docum<strong>en</strong>t.<br />

Le cercle des corrélations pour le plan formé des deux premiers axes factoriels est représ<strong>en</strong>té Figure<br />

3. Exceptée la variable acidité, qui est fortem<strong>en</strong>t corrélée avec le troisième axe factoriel, toutes les<br />

9

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!