16.07.2014 Views

Analyse en Composantes Principales Suite

Analyse en Composantes Principales Suite

Analyse en Composantes Principales Suite

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Université Paul Sabatier 2012-2013<br />

L3 MMESI<br />

TD5<br />

<strong>Analyse</strong> <strong>en</strong> <strong>Composantes</strong> <strong>Principales</strong> <strong>Suite</strong><br />

Exercice 1 On étudie les consommations annuelles <strong>en</strong> 1972, exprimées <strong>en</strong> francs, de 8<br />

d<strong>en</strong>rées alim<strong>en</strong>taires (les variables), les individus étant 8 catégories socio-professionnelles.<br />

Les données sont des moy<strong>en</strong>nes par CSP, et sont stockées dans l'objet conso_alim de R.<br />

Ci-dessous sont données les signications des codes utilisés, puis diverses sorties du logiciel<br />

R lors du calcul d'une ACP.<br />

AGRI : Exploitants agricoles<br />

SAAG : Salariés agricoles<br />

PRIN : Professions indép<strong>en</strong>dantes<br />

CSUP : Cadres supérieurs<br />

CMOY : Cadres moy<strong>en</strong>s<br />

EMPL : Employés<br />

OUVR : Ouvriers<br />

INAC : Inactifs<br />

PAO : Pain ordinaire<br />

PAA : Autre pain<br />

VIO : Vin ordinaire<br />

VIA : Autre vin<br />

POT : Pommes de terre<br />

LEC : Légumes secs<br />

RAI : Raisin de tables<br />

PLP : Plats préparés<br />

> conso_alim<br />

PAO PAA VIO VIA POT LEC RAI PLP<br />

AGRI 167 1 163 23 41 8 6 6<br />

SAAG 162 2 141 12 40 12 4 15<br />

PRIN 119 6 69 56 39 5 13 41<br />

CSUP 87 11 63 111 27 3 18 39<br />

CMOY 103 5 68 77 32 4 11 30<br />

EMPL 111 4 72 66 34 6 10 28<br />

OUVR 130 3 76 52 43 7 7 16<br />

INAC 138 7 117 74 53 8 12 20<br />

> E=eig<strong>en</strong>(cor(conso_alim))<br />

> names(E$values)=colnames(E$vectors)=paste("Axe",1:8)<br />

> round(E$values,4)<br />

Axe 1 Axe 2 Axe 3 Axe 4 Axe 5 Axe 6 Axe 7 Axe 8<br />

6.2079 0.8797 0.4160 0.3065 0.1684 0.0181 0.0034 0.0000<br />

> round(E$vectors,4)<br />

Axe 1 Axe 2 Axe 3 Axe 4 Axe 5 Axe 6 Axe 7 Axe 8<br />

[1,] 0.3913 -0.1378 0.1617 0.1193 -0.2940 0.3977 -0.1069 0.7290<br />

[2,] -0.3487 -0.4406 0.3199 0.2179 0.2654 0.5207 0.4231 -0.1178<br />

[3,] 0.3492 -0.2017 0.6806 -0.0289 -0.2457 -0.4648 0.2539 -0.1801<br />

[4,] -0.3736 -0.2603 0.0735 -0.3965 0.3456 -0.4229 0.0333 0.5750<br />

[5,] 0.2464 -0.7438 -0.5577 -0.0740 -0.1757 -0.1077 0.0934 -0.1354<br />

[6,] 0.3648 -0.1280 0.0324 0.5189 0.6692 -0.1849 -0.3131 0.0127<br />

[7,] -0.3731 -0.3260 0.2542 0.0637 -0.2715 0.0163 -0.7659 -0.1590<br />

[8,] -0.3617 0.0502 -0.1617 0.7081 -0.3329 -0.3602 0.2250 0.2189<br />

> X=scale(conso_alim)*sqrt(8/7) # données c<strong>en</strong>trées réduites<br />

> PC=X %*% E$vectors;round(PC,4)<br />

Axe 1 Axe 2 Axe 3 Axe 4 Axe 5 Axe 6 Axe 7 Axe 8<br />

AGRI 3.3716 0.2458 0.8396 -0.6217 -0.5766 0.0218 -0.0223 0<br />

1


SAAG 3.5217 0.4474 0.3515 0.9162 0.4937 0.0050 0.0316 0<br />

PRIN -1.4720 -0.0585 -0.5530 0.8545 -0.7493 0.0586 -0.0046 0<br />

CSUP -4.3588 -0.1761 1.0292 0.0152 0.2588 0.1265 -0.0159 0<br />

CMOY -1.7181 0.8566 -0.1746 -0.4119 -0.0399 -0.1400 0.1170 0<br />

EMPL -0.8065 0.8085 -0.3448 -0.0691 0.2059 -0.1957 -0.1095 0<br />

OUVR 0.8991 0.1830 -0.9777 -0.5508 0.2932 0.2337 -0.0059 0<br />

INAC 0.5630 -2.3068 -0.1702 -0.1323 0.1142 -0.1099 0.0097 0<br />

> PC2=PC^2<br />

> inertie_indiv=rowSums(PC2)<br />

> round(PC2/inertie_indiv,4)<br />

Axe 1 Axe 2 Axe 3 Axe 4 Axe 5 Axe 6 Axe 7 Axe 8<br />

AGRI 0.8844 0.0047 0.0548 0.0301 0.0259 0.0000 0.0000 0<br />

SAAG 0.8981 0.0145 0.0089 0.0608 0.0176 0.0000 0.0001 0<br />

PRIN 0.5746 0.0009 0.0811 0.1936 0.1489 0.0009 0.0000 0<br />

CSUP 0.9418 0.0015 0.0525 0.0000 0.0033 0.0008 0.0000 0<br />

CMOY 0.7529 0.1872 0.0078 0.0433 0.0004 0.0050 0.0035 0<br />

EMPL 0.4278 0.4299 0.0782 0.0031 0.0279 0.0252 0.0079 0<br />

OUVR 0.3606 0.0149 0.4264 0.1353 0.0383 0.0244 0.0000 0<br />

INAC 0.0555 0.9319 0.0051 0.0031 0.0023 0.0021 0.0000 0<br />

> round(t(t(PC2)/colSums(PC2)),4)<br />

Axe 1 Axe 2 Axe 3 Axe 4 Axe 5 Axe 6 Axe 7 Axe 8<br />

AGRI 0.2289 0.0086 0.2118 0.1577 0.2467 0.0033 0.0181 0.0140<br />

SAAG 0.2497 0.0284 0.0371 0.3424 0.1808 0.0002 0.0363 0.0034<br />

PRIN 0.0436 0.0005 0.0919 0.2978 0.4167 0.0237 0.0008 0.0036<br />

CSUP 0.3826 0.0044 0.3183 0.0001 0.0497 0.1107 0.0092 0.0287<br />

CMOY 0.0594 0.1043 0.0092 0.0692 0.0012 0.1356 0.4961 0.4737<br />

EMPL 0.0131 0.0929 0.0357 0.0019 0.0315 0.2650 0.4349 0.4389<br />

OUVR 0.0163 0.0048 0.2872 0.1238 0.0638 0.3779 0.0013 0.0001<br />

INAC 0.0064 0.7561 0.0087 0.0071 0.0097 0.0836 0.0034 0.0376<br />

> Corr=cor(cbind(conso_alim,PC))[1:8,9:16];round(Corr,4)<br />

Axe 1 Axe 2 Axe 3 Axe 4 Axe 5 Axe 6 Axe 7 Axe 8<br />

PAO 0.9750 -0.1293 0.1043 0.0661 -0.1207 0.0535 -0.0063 -0.2437<br />

PAA -0.8687 -0.4132 0.2064 0.1206 0.1089 0.0700 0.0248 0.1939<br />

VIO 0.8700 -0.1892 0.4390 -0.0160 -0.1008 -0.0625 0.0149 -0.1966<br />

VIA -0.9309 -0.2441 0.0474 -0.2195 0.1418 -0.0568 0.0020 0.1803<br />

POT 0.6139 -0.6976 -0.3597 -0.0410 -0.0721 -0.0145 0.0055 -0.3068<br />

LEC 0.9090 -0.1201 0.0209 0.2872 0.2746 -0.0249 -0.0184 -0.2969<br />

RAI -0.9295 -0.3057 0.1640 0.0353 -0.1114 0.0022 -0.0450 0.1639<br />

PLP -0.9011 0.0471 -0.1043 0.3920 -0.1366 -0.0484 0.0132 0.2268<br />

1. A-t-on réalisé une ACP normée ou non-normée ?<br />

2. Combi<strong>en</strong> d'axes factoriels faut-il étudier ?<br />

3. Réaliser des graphiques du nuages de points et des variables selon les axes factoriels<br />

sélectionnés.<br />

4. Faites un tableau (avec des signes) des variables qui contribu<strong>en</strong>t le plus à l'axe 1.<br />

Quelles variables sont bi<strong>en</strong> expliquées par l'axe 1 ? Que signie l'axe 1 ?<br />

5. Faites un tableau des individus qui contribu<strong>en</strong>t le plus à l'axe 1. Ces individus sont-ils<br />

bi<strong>en</strong> représ<strong>en</strong>tés sur l'axe 1 ? Interprêter ces résultats.<br />

6. Repr<strong>en</strong>dre les deux questions précéd<strong>en</strong>tes pour les autres axes factoriels sélectionnés.<br />

2

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!