Analyse en composantes principales
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Théorème 3.1. Soit F k un sous-espace portant l’inertie maximale, alors le sous-espace de dim<strong>en</strong>sion<br />
k + 1 portant l’inertie maximale est la somme directe de F k et du sous-espace de dim<strong>en</strong>sion 1<br />
orthogonal à F k portant l’inertie maximale.<br />
155<br />
160<br />
165<br />
La démonstration de ce théorème figure <strong>en</strong> annexe 5.2.<br />
Il est donc possible de rechercher le sous espace F k séqu<strong>en</strong>tiellem<strong>en</strong>t axe par axe, <strong>en</strong> cherchant tout<br />
d’abord l’axe portant l’inertie maximale, puis celui orthogonal à ce dernier portant l’inertie maximale,<br />
et ainsi de suite.<br />
3.1 Recherche de l’axe portant l’inertie maximale<br />
On cherche l’axe ∆ u tel que l’inertie I ∆ ⊥ u<br />
expliquée par cet axe soit maximale. Cela revi<strong>en</strong>t à<br />
chercher ∆ u tel que I ∆u soit minimale d’après le théorème de Huyg<strong>en</strong>s (12). Puisqu’<strong>en</strong> projetant<br />
sur l’axe ∆ u on perd l’inertie I ∆u , on aura bi<strong>en</strong> une inertie restante I ∆ ⊥ u<br />
maximale, ce qui revi<strong>en</strong>t à<br />
déformer le moins possible le nuage des individus.<br />
Comme on est <strong>en</strong> ACP normée la métrique M est l’id<strong>en</strong>tité et la matrice de variance V est égale<br />
à la matrice de corrélation R (cf. remarque 2.1). L’inertie expliquée par l’axe ∆ u est alors I ∆ ⊥ u<br />
=<br />
u t Ru d’après (16). Il faut donc trouver le vecteur unitaire u solution du problème d’optimisation sous<br />
contrainte suivant :<br />
{<br />
maxu u t Ru<br />
u t u = 1<br />
(21)<br />
170<br />
La matrice de corrélation R étant symétrique elle est diagonalisable : R = P∆P t , où ∆ est la matrice<br />
diagonale composée des valeurs propres λ 1 ≥ . . . ≥ λ j ≥ . . . ≥ λ p , et où la matrice de passage P est<br />
la matrice orthogonale dont les colonnes sont les vecteurs propres v j de R. Il vi<strong>en</strong>t alors que<br />
u t Ru =<br />
p∑<br />
λ j < u, v j > 2 . (22)<br />
j=1<br />
En nommant u j les <strong>composantes</strong> du vecteur u (normé) dans la base des vecteurs propres, on a<br />
u t Ru =<br />
p∑<br />
λ j u 2 j ≤ λ 1(u 2 1 + . . . + u2 p) ≤ λ 1 . (23)<br />
} {{ }<br />
=u t u=1<br />
j=1<br />
175<br />
Le vecteur u maximisant cette quantité n’est autre que v 1 , le vecteur propre associé à la plus grande<br />
valeur propre λ 1 de R, pour lequel on a donc I ∆ ⊥ v1<br />
= λ 1 .<br />
3.2 Recherche des axes suivants<br />
Nous cherchons cette fois un vecteur unitaire u, orthogonal au précéd<strong>en</strong>t (v 1 ), et maximisant la<br />
quantité u t Ru. En nommant <strong>en</strong>core u j les <strong>composantes</strong> de ce vecteur u dans la base des vecteurs<br />
propres, on a :<br />
u t Ru =<br />
p∑<br />
λ j u 2 j ≤ λ 2 (u 2 2 + . . . + u 2 p) ≤ λ 2 . (24)<br />
j=2<br />
7