Analyse en composantes principales

Recommendations

Info

car (x t iMu) t = x t iMu puisque c’est un scalaire et que M est symétrique, ( ) I ∆ ⊥ u = u t 1 n∑ M x i x t i Mu = 1 n n ut MX t XMu. (15) i=1 Ainsi, si X est centrée de matrice de variance V , on a I ∆ ⊥ u = u t MV Mu (16) 125 130 140 2.2 L’espace des variables Chaque variable est considérée comme un vecteur d’un espace de dimension n, l’espace des variables. La métrique utilisée pour le calcul des distances entre variables est la métrique identité, car on suppose que tous les individus ont le même poids. Si ce n’est pas le cas une métrique spécifique doit alors être utilisée. Soit y 1 , . . .,y p les variables x 1 , . . ., x p centrées. On a les propriétés suivantes : – le produit scalaire entre deux variables y k et y l (sous la métrique identité) est n∑ < y k , y l >= yi k yl i = v kl, (17) – le carré de la norme d’une variable est égale à sa variance i=1 ||y k || 2 = s 2 k (18) et l’écart-type de la variance représente donc sa longueur, – le cosinus de l’angle θ kl entre deux variables y k et y l est leur coefficient de corrélation linéaire : cos(θ kl ) = < yk , y l > ||y k ||||y l || = v kl s k s l = r kl . (19) Nous nous intéressons donc, dans l’espace des variables, aux angles entre variables plutôt qu’aux distances, et on représente les variables comme des vecteurs et non des points. 3 L’analyse en composantes principales 145 150 Nous travaillons désormais en ACP normée, avec le tableau de données centrées Z = (X − 1g t )D 1/s et la métrique identité. Les individus et les variables sont désormais les z i et z j . L’ACP consiste à chercher un sous-espace F k de dimension k inférieure à celle de l’espace de départ, tel que le nuage, une fois projeté dans ce sous-espace, soit au minimum déformé. Comme la projection diminue nécessairement les distances, on cherche le sous-espace F k qui maximise la moyenne des carrés des distances entre individus : 1 n 2 n∑ i=1 n∑ d 2 (i, j) = 2I g . (20) j=1 Il faut donc que l’inertie du nuage projeté soit maximale. 6
Théorème 3.1. Soit F k un sous-espace portant l’inertie maximale, alors le sous-espace de dimension k + 1 portant l’inertie maximale est la somme directe de F k et du sous-espace de dimension 1 orthogonal à F k portant l’inertie maximale. 155 160 165 La démonstration de ce théorème figure en annexe 5.2. Il est donc possible de rechercher le sous espace F k séquentiellement axe par axe, en cherchant tout d’abord l’axe portant l’inertie maximale, puis celui orthogonal à ce dernier portant l’inertie maximale, et ainsi de suite. 3.1 Recherche de l’axe portant l’inertie maximale On cherche l’axe ∆ u tel que l’inertie I ∆ ⊥ u expliquée par cet axe soit maximale. Cela revient à chercher ∆ u tel que I ∆u soit minimale d’après le théorème de Huygens (12). Puisqu’en projetant sur l’axe ∆ u on perd l’inertie I ∆u , on aura bien une inertie restante I ∆ ⊥ u maximale, ce qui revient à déformer le moins possible le nuage des individus. Comme on est en ACP normée la métrique M est l’identité et la matrice de variance V est égale à la matrice de corrélation R (cf. remarque 2.1). L’inertie expliquée par l’axe ∆ u est alors I ∆ ⊥ u = u t Ru d’après (16). Il faut donc trouver le vecteur unitaire u solution du problème d’optimisation sous contrainte suivant : { maxu u t Ru u t u = 1 (21) 170 La matrice de corrélation R étant symétrique elle est diagonalisable : R = P∆P t , où ∆ est la matrice diagonale composée des valeurs propres λ 1 ≥ . . . ≥ λ j ≥ . . . ≥ λ p , et où la matrice de passage P est la matrice orthogonale dont les colonnes sont les vecteurs propres v j de R. Il vient alors que u t Ru = p∑ λ j < u, v j > 2 . (22) j=1 En nommant u j les composantes du vecteur u (normé) dans la base des vecteurs propres, on a u t Ru = p∑ λ j u 2 j ≤ λ 1(u 2 1 + . . . + u2 p) ≤ λ 1 . (23) } {{ } =u t u=1 j=1 175 Le vecteur u maximisant cette quantité n’est autre que v 1 , le vecteur propre associé à la plus grande valeur propre λ 1 de R, pour lequel on a donc I ∆ ⊥ v1 = λ 1 . 3.2 Recherche des axes suivants Nous cherchons cette fois un vecteur unitaire u, orthogonal au précédent (v 1 ), et maximisant la quantité u t Ru. En nommant encore u j les composantes de ce vecteur u dans la base des vecteurs propres, on a : u t Ru = p∑ λ j u 2 j ≤ λ 2 (u 2 2 + . . . + u 2 p) ≤ λ 2 . (24) j=2 7
Page 1 and 2: Analyse en composantes principales
Page 3 and 4: odeur sucre acide amer astringence
Page 5: h F ⊥ i F ⊥ x i F g h Fi FIG. 1
Page 9 and 10: 220 225 230 235 240 où v j k est l
Page 11 and 12: FIG. 4 - Projections des individus

Analyse en composantes principales

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?