08.05.2014 Views

Analyse en composantes principales

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Théorème 3.1. Soit F k un sous-espace portant l’inertie maximale, alors le sous-espace de dim<strong>en</strong>sion<br />

k + 1 portant l’inertie maximale est la somme directe de F k et du sous-espace de dim<strong>en</strong>sion 1<br />

orthogonal à F k portant l’inertie maximale.<br />

155<br />

160<br />

165<br />

La démonstration de ce théorème figure <strong>en</strong> annexe 5.2.<br />

Il est donc possible de rechercher le sous espace F k séqu<strong>en</strong>tiellem<strong>en</strong>t axe par axe, <strong>en</strong> cherchant tout<br />

d’abord l’axe portant l’inertie maximale, puis celui orthogonal à ce dernier portant l’inertie maximale,<br />

et ainsi de suite.<br />

3.1 Recherche de l’axe portant l’inertie maximale<br />

On cherche l’axe ∆ u tel que l’inertie I ∆ ⊥ u<br />

expliquée par cet axe soit maximale. Cela revi<strong>en</strong>t à<br />

chercher ∆ u tel que I ∆u soit minimale d’après le théorème de Huyg<strong>en</strong>s (12). Puisqu’<strong>en</strong> projetant<br />

sur l’axe ∆ u on perd l’inertie I ∆u , on aura bi<strong>en</strong> une inertie restante I ∆ ⊥ u<br />

maximale, ce qui revi<strong>en</strong>t à<br />

déformer le moins possible le nuage des individus.<br />

Comme on est <strong>en</strong> ACP normée la métrique M est l’id<strong>en</strong>tité et la matrice de variance V est égale<br />

à la matrice de corrélation R (cf. remarque 2.1). L’inertie expliquée par l’axe ∆ u est alors I ∆ ⊥ u<br />

=<br />

u t Ru d’après (16). Il faut donc trouver le vecteur unitaire u solution du problème d’optimisation sous<br />

contrainte suivant :<br />

{<br />

maxu u t Ru<br />

u t u = 1<br />

(21)<br />

170<br />

La matrice de corrélation R étant symétrique elle est diagonalisable : R = P∆P t , où ∆ est la matrice<br />

diagonale composée des valeurs propres λ 1 ≥ . . . ≥ λ j ≥ . . . ≥ λ p , et où la matrice de passage P est<br />

la matrice orthogonale dont les colonnes sont les vecteurs propres v j de R. Il vi<strong>en</strong>t alors que<br />

u t Ru =<br />

p∑<br />

λ j < u, v j > 2 . (22)<br />

j=1<br />

En nommant u j les <strong>composantes</strong> du vecteur u (normé) dans la base des vecteurs propres, on a<br />

u t Ru =<br />

p∑<br />

λ j u 2 j ≤ λ 1(u 2 1 + . . . + u2 p) ≤ λ 1 . (23)<br />

} {{ }<br />

=u t u=1<br />

j=1<br />

175<br />

Le vecteur u maximisant cette quantité n’est autre que v 1 , le vecteur propre associé à la plus grande<br />

valeur propre λ 1 de R, pour lequel on a donc I ∆ ⊥ v1<br />

= λ 1 .<br />

3.2 Recherche des axes suivants<br />

Nous cherchons cette fois un vecteur unitaire u, orthogonal au précéd<strong>en</strong>t (v 1 ), et maximisant la<br />

quantité u t Ru. En nommant <strong>en</strong>core u j les <strong>composantes</strong> de ce vecteur u dans la base des vecteurs<br />

propres, on a :<br />

u t Ru =<br />

p∑<br />

λ j u 2 j ≤ λ 2 (u 2 2 + . . . + u 2 p) ≤ λ 2 . (24)<br />

j=2<br />

7

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!