Análisis en Componentes Principales - Oldemar RodrÃguez Rojas
Análisis en Componentes Principales - Oldemar RodrÃguez Rojas
Análisis en Componentes Principales - Oldemar RodrÃguez Rojas
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
This is page i<br />
Printer: Opaque this<br />
Análisis <strong>en</strong> Compon<strong>en</strong>tes <strong>Principales</strong><br />
Dr. <strong>Oldemar</strong> Rodríguez <strong>Rojas</strong><br />
29 de mayo de 2008
This is page iii<br />
Printer: Opaque this<br />
Cont<strong>en</strong>ts<br />
1. Análisis <strong>en</strong> Compon<strong>en</strong>tes <strong>Principales</strong> (ACP) V<br />
1. Los datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . vi<br />
2. El problema . . . . . . . . . . . . . . . . . . . . . . . . . . . vii<br />
3. Cálculo de los factores y de las compon<strong>en</strong>tes principales . . viii<br />
3.1. En el espacio de los individuos . . . . . . . . . . . . viii<br />
4. En el espacio de las variables . . . . . . . . . . . . . . . . . x<br />
5. Equival<strong>en</strong>cia de los dos análisis – Relaciones de dualidad . . x<br />
6. Varianza explicada por cada eje . . . . . . . . . . . . . . . . xi<br />
7. Gráficos y su interpretación . . . . . . . . . . . . . . . . . . xii<br />
7.1. Repres<strong>en</strong>tación de los individuos . . . . . . . . . . . xii<br />
7.2. Calidad de la repres<strong>en</strong>tación de un individuo . . . . xiii<br />
7.3. Las contribuciones de los individuos a la varianza totalxiv<br />
7.4. Repres<strong>en</strong>tación de las variables . . . . . . . . . . . . xiv<br />
7.5. Interpretación de la dualidad <strong>en</strong> los gráficos . . . . . xvi
Análisis <strong>en</strong> Compon<strong>en</strong>tes<br />
<strong>Principales</strong> (ACP)<br />
This is page v<br />
Printer: Opaque this<br />
El Análisis de Compon<strong>en</strong>tes <strong>Principales</strong> (ACP) es una técnica prov<strong>en</strong>i<strong>en</strong>te<br />
del análisis exploratorio de datos cuyo objetivo es la síntesis de la información,<br />
o reducción de la dim<strong>en</strong>sión (número de variables). Es decir, ante una<br />
tabla de datos con muchas variables, el objetivo será reducirlas a un m<strong>en</strong>or<br />
número perdi<strong>en</strong>do la m<strong>en</strong>or cantidad de información posible. El ACP es<br />
uno de los métodos más utilizados <strong>en</strong> Minería de Datos <strong>en</strong> países como<br />
Francia. Fue primeram<strong>en</strong>te introducido por Pearson <strong>en</strong> 1901 y desarrollado<br />
indep<strong>en</strong>di<strong>en</strong>tem<strong>en</strong>te <strong>en</strong> 1933 por Hotelling y la primera implem<strong>en</strong>tación<br />
computacional se dío <strong>en</strong> los años 60. Fue aplicado para analizar <strong>en</strong>cuestas<br />
de opinión pública por Jean Pages. Como ya se m<strong>en</strong>cionó el objetivo es construir<br />
un pequeño número de nuevas variables (compon<strong>en</strong>tes) <strong>en</strong> las cuales<br />
se conc<strong>en</strong>tre la mayor cantidad posible de información, como se ilustra <strong>en</strong><br />
la Figura 1.<br />
FIGURE 1. Transformación de las variables originales <strong>en</strong> compon<strong>en</strong>tes.<br />
Estas nuevos compon<strong>en</strong>tes principales o factores son calculados como una<br />
combinacin lineal de las variables originales, y además serán linealm<strong>en</strong>te<br />
indep<strong>en</strong>di<strong>en</strong>tes. Un aspecto clave <strong>en</strong> ACP es la interpretación, ya que ésta<br />
no vi<strong>en</strong>e dada a priori, sino que será deducida tras observar la relación de<br />
los compon<strong>en</strong>tes principales con las variables originales, para esto hay que<br />
estudiar tanto el signo como la magnitud de las correlaciones, como vermos<br />
<strong>en</strong> detalle más adelante. Esto no siempre es fácil, y será de vital importancia<br />
el conocimi<strong>en</strong>to que el experto t<strong>en</strong>ga sobre la materia de investigación.<br />
Los n individuos de una tabla de datos se pued<strong>en</strong> ver como una nube de<br />
puntos <strong>en</strong> R p , como se ilustra <strong>en</strong> la Figura 2-a, con su c<strong>en</strong>tro de gravedad<br />
localizado <strong>en</strong> el orig<strong>en</strong>, y lo que se busca es un subespacio q−dim<strong>en</strong>sional L<br />
de R p , usualm<strong>en</strong>te un plano (ver Figura 2-b), tal que la proyección ortogonal<br />
de los n puntos sobre L (ver Figura 2-c) ti<strong>en</strong><strong>en</strong> varianza máxima, lo cual<br />
permitirá el estudio de relaciones, clases, etc. <strong>en</strong>tre los individuos (filas) de
vi<br />
1. Análisis <strong>en</strong> Compon<strong>en</strong>tes <strong>Principales</strong> (ACP)<br />
la tabla de datos.<br />
FIGURE 2. Proyección de los individuos <strong>en</strong> el plano de varianza máxima<br />
1. Los datos<br />
Se parte de una tabla de datos:<br />
⎛<br />
⎞<br />
x 11 · · · x 1j · · · x 1m<br />
. . .. . . .<br />
X =<br />
x i1 · · · x ij · · · x im<br />
←↪ individuo i<br />
⎜<br />
⎝<br />
. ⎟<br />
. . . .. . ⎠<br />
x n1 · · · x nj · · · x nm<br />
que se puede transformar <strong>en</strong> la sigui<strong>en</strong>te matriz de distancias:<br />
⎛<br />
⎞<br />
d 11 · · · d 1j · · · d 1n<br />
. . .. . . .<br />
D =<br />
d i1 · · · d ij · · · x in<br />
⎜<br />
⎝<br />
. ⎟<br />
. . . .. . ⎠<br />
d n1 · · · d nj · · · d nn
2. El problema<br />
1. Análisis <strong>en</strong> Compon<strong>en</strong>tes <strong>Principales</strong> (ACP) vii<br />
Se trata de sintetizar los datos cont<strong>en</strong>idos <strong>en</strong> una tabla de datos X<br />
<strong>en</strong> un conjunto más pequeño de nuevas variables C 1 , C 2 , . . . llamadas<br />
compon<strong>en</strong>tes principales, mant<strong>en</strong>i<strong>en</strong>do la información esc<strong>en</strong>cial de X.<br />
Así, <strong>en</strong> la etapa 1 del algoritmo se <strong>en</strong>cu<strong>en</strong>tra una variable sintética<br />
C 1 , la primera compon<strong>en</strong>te principal, la cual es combinación lineal<br />
de las variables originales X j , es decir:<br />
C 1 = a 11 X 1 + · · · + a 1j X j + · · · + a 1m X m ,<br />
donde X j es la columna j de X. Esto significa que el valor de C 1<br />
para el individuo i−ésimo está dado por:<br />
C 1 i = a 11 x i1 + · · · + a 1j x ij + · · · + a 1m x im ,<br />
G<strong>en</strong>eralm<strong>en</strong>te esta primer compon<strong>en</strong>te principal, C 1 , no es sufici<strong>en</strong>te<br />
para cond<strong>en</strong>sar la información cont<strong>en</strong>ida <strong>en</strong> X, por lo que se construye<br />
una segunda compon<strong>en</strong>te principal C 2 , luego una tercera C 3 y<br />
así sucesivam<strong>en</strong>te.<br />
En g<strong>en</strong>eral <strong>en</strong> la etapa k, se construye la compon<strong>en</strong>te principal k−ésima<br />
dada por:<br />
C k = a k1 X 1 + · · · + a kj X j + · · · + a km X m .<br />
Matricialm<strong>en</strong>te se ti<strong>en</strong>e que:<br />
C k = Xa k ,<br />
donde:<br />
⎛ ⎞<br />
a k1<br />
.<br />
a k =<br />
a kj<br />
.<br />
⎜ ⎟<br />
⎝ . ⎠<br />
a km<br />
a k se llama el k−ésimo factor.<br />
Los factores a kj constituy<strong>en</strong> un sistema de pesos para las variables,<br />
los cuales indican cuanto aporta cada variables a la construcción de<br />
la compon<strong>en</strong>te.
viii<br />
1. Análisis <strong>en</strong> Compon<strong>en</strong>tes <strong>Principales</strong> (ACP)<br />
Algunos factores a kj serán negativos y otros serán positivos. El valor<br />
de cada peso por si solo no es importante, sino la relación con respecto<br />
a los otros pesos. Para evitar un problema de escalas se impone la<br />
sigui<strong>en</strong>te restricción:<br />
m∑<br />
(a kj ) 2 = 1.<br />
j=1<br />
3. Cálculo de los factores y de las compon<strong>en</strong>tes<br />
principales<br />
Como <strong>en</strong> regresión, el ACP puede ser pres<strong>en</strong>tado tanto <strong>en</strong> el espacio de las<br />
variables como <strong>en</strong> el espacio de los individuos.<br />
3.1. En el espacio de los individuos<br />
Se supondrá que las variables están c<strong>en</strong>tradas y reducidas.<br />
V = 1 n Xt X es la matriz de varianzas–covarianzas. Como las variables<br />
están c<strong>en</strong>tradas y reducidas <strong>en</strong>tonces V = R, la matriz de correlaciones,<br />
pues:<br />
v ij = cov(X i , X j ) = cov(Xi , X j )<br />
σ X iσ X j<br />
= R(X i , X j ).<br />
Por lo tanto el espacio de las filas de X <strong>en</strong> R m es el espacio de<br />
individuos cuyo orig<strong>en</strong> será el c<strong>en</strong>tro de la nube de puntos.<br />
El objetivo del ACP es describir de manera sintética la nube de individuos.<br />
Teorema 1 En la etapa 1 de un ACP se calcula el eje D 1 que pasa por<br />
el orig<strong>en</strong> para el cual la dispersión de la nube de puntos sea máxima, este<br />
eje D 1 pasa <strong>en</strong>tonces lo más cerca posible de la nube de puntos, es decir,<br />
el promedio de las distancias al cuadrado de los n puntos de la nube y el<br />
eje D 1 es minimal (ver Figura ).<br />
Sea a 1 es vector director normado (norma 1) del eje (recta) D 1 <strong>en</strong>tonces:<br />
a 1 es el vector propio asociado al valor propio más grande de la matriz de<br />
V de varianzas–covarianzas.<br />
Teorema 2 En la etapa 2 de un ACP se calcula el eje D 2 que pasa por<br />
el orig<strong>en</strong> para el cual la dispersión de la nube de puntos sea máxima, este<br />
eje D 2 pasa <strong>en</strong>tonces lo más cerca posible de la nube de puntos, es decir,
1. Análisis <strong>en</strong> Compon<strong>en</strong>tes <strong>Principales</strong> (ACP) ix<br />
el promedio de las distancias al cuadrado de los n puntos de la nube y el<br />
eje D 2 es minimal.<br />
Sea a 2 es vector director normado (norma 1) del eje (recta) D 2 el cual<br />
será ortogonal al vector a 1 construido <strong>en</strong> la etapa 1, <strong>en</strong>tonces: Se ti<strong>en</strong>e el<br />
sigui<strong>en</strong>te problema de optimización:<br />
(<br />
1<br />
máx ) n a<br />
2 t<br />
X t Xa 2<br />
sujeto<br />
{ (a<br />
2 ) t<br />
a 2 = 1<br />
(<br />
a<br />
2 ) t<br />
a 2 = 0<br />
cuya solución es el vector propio asociado al segundo valor propio más<br />
grande de la matriz de V de varianzas–covarianzas.<br />
Teorema 3 En la etapa k de un ACP se calcula el eje D k que pasa por<br />
el orig<strong>en</strong> para el cual la dispersión de la nube de puntos sea máxima, este<br />
eje D k pasa <strong>en</strong>tonces lo más cerca posible de la nube de puntos, es decir,<br />
el promedio de las distancias al cuadrado de los n puntos de la nube y el<br />
eje D k es minimal.<br />
Sea a k es vector director normado (norma 1) del eje (recta) D k el cual<br />
será ortogonal al vector a r ∀ r < k construidos <strong>en</strong> las etapas 1, 2, . . . , k − 1<br />
<strong>en</strong>tonces: Se ti<strong>en</strong>e el sigui<strong>en</strong>te problema de optimización:<br />
(<br />
1<br />
máx ) n a<br />
k t<br />
X t Xa k<br />
sujeto<br />
{ (a<br />
k ) t<br />
a k = 1<br />
(<br />
a<br />
k ) t<br />
a k = 0 para r = 1, 2, . . . , k − 1<br />
cuya solución es el vector propio asociado al k−ésimo valor propio más<br />
grande de la matriz de V de varianzas–covarianzas.<br />
4. En el espacio de las variables<br />
Teorema 4 En la etapa 1 de un ACP se calcula una variable sintética<br />
(eje) C 1 que resuma lo mejor posible las variables originales, es decir, de<br />
tal manera que:<br />
m∑<br />
R 2 (C 1 , X j ) sea máxima.<br />
j=1<br />
Entonces: C 1 es el vector propio de 1 n XXt asociado al valor propio más<br />
grande.
x<br />
1. Análisis <strong>en</strong> Compon<strong>en</strong>tes <strong>Principales</strong> (ACP)<br />
Teorema 5 En la etapa k de un ACP se calcula una variable sintética<br />
(eje) C k que resuma lo mejor posible las variables originales y que no<br />
esté correlacionada las primeras k − 1 compon<strong>en</strong>tes principales (variables<br />
sintéticas) ya calculadas, es decir, de tal manera que:<br />
máx<br />
m∑<br />
R 2 (C k , X j )<br />
j=1<br />
sujeto R 2 (C k , C r ) = 0 para r = 1, 2, . . . , k − 1<br />
Entonces: C k es el vector propio de 1 n XXt asociado al k−ésimo valor propio<br />
más grande.<br />
5. Equival<strong>en</strong>cia de los dos análisis – Relaciones de<br />
dualidad<br />
Espacio de los individuos ↦→ 1 n Xt X que es tamaño m × m.<br />
Espacio de las variables ↦→ 1 n XXt que es tamaño n × n.<br />
Usualem<strong>en</strong>te el número de variables es m<strong>en</strong>or que el número de individuos,<br />
por supondremos <strong>en</strong> adelante sin pérdidad de g<strong>en</strong>eralidad que m < n.<br />
Teorema 6 [Relaciones de Dualidad]<br />
1. Si v k es el k−ésimo vector propio de norma 1 asociado a λ k de la<br />
matriz 1 n XXt <strong>en</strong>tonces:<br />
u k = Xt v<br />
√ k<br />
, nλk<br />
es el k−ésimo vector propio de norma 1 asociado a λ k de la matriz<br />
1<br />
n Xt X.<br />
2. Si u k es el k−ésimo vector propio de norma 1 asociado a λ k de la<br />
matriz 1 n Xt X <strong>en</strong>tonces:<br />
v k = Xu k<br />
√ nλk<br />
,<br />
es el k−ésimo vector propio de norma 1 asociado a λ k de la matriz<br />
1<br />
n XXt .
1. Análisis <strong>en</strong> Compon<strong>en</strong>tes <strong>Principales</strong> (ACP) xi<br />
6. Varianza explicada por cada eje<br />
Teorema 7<br />
1<br />
n Xt X y 1 n XXt ti<strong>en</strong><strong>en</strong> los mismos valores propios, β 1 , β 2 , . . . , β m .<br />
Además el rango de ambas matrices es n − m y los últimos n − m<br />
valores propios de 1 n XXt son nulos.<br />
Teorema 8<br />
m∑<br />
β k = m.<br />
k=1<br />
El ACP ti<strong>en</strong>e m etapas, <strong>en</strong> cada etapa se construye un resum<strong>en</strong> de la tabla<br />
X, m<strong>en</strong>os interesante que el construido <strong>en</strong> la etapa anterior.<br />
¿Cómo medir la calidad de la etapa k<br />
En la etapa k, el criterio del ACP es maximizar:<br />
como:<br />
1<br />
n<br />
n∑<br />
(Ci k ) 2 ,<br />
i=1<br />
1<br />
n<br />
n∑<br />
(Ci k ) 2 = 1 n (ak ) t X t Xa k = (a k ) t β k a k = β k .<br />
i=1<br />
Entonces β k es la varianza explicada por el eje k−ésimo, es decir por<br />
C k .<br />
Como:<br />
se ti<strong>en</strong>e que:<br />
m∑<br />
β k = m,<br />
k=1<br />
β k<br />
m = % de la varianza explicada por el eje Ck = % de INERCIA.<br />
Por ejemplo, la inercia explicada por el plano principal, ejes 1 y 2<br />
es:<br />
β 1 + β 2<br />
m .
xii<br />
1. Análisis <strong>en</strong> Compon<strong>en</strong>tes <strong>Principales</strong> (ACP)<br />
7. Gráficos y su interpretación<br />
7.1. Repres<strong>en</strong>tación de los individuos<br />
Recordemos que para calcular las coord<strong>en</strong>adas de un individuos se ti<strong>en</strong>e<br />
que (La matriz X se supone c<strong>en</strong>trada y reducida):<br />
C s = Xa s donde a s es el vector propio de R = 1 n Xt X asociado a λ s .<br />
De donde:<br />
es decir:<br />
C s i = a s 1X i1 + · · · + a s jX ij + · · · + a s mX im ,<br />
m∑<br />
Ci s = X ij a s j<br />
j=1<br />
Análogam<strong>en</strong>te:<br />
C r = Xa r donde a r es el vector propio de R = 1 n Xt X asociado a λ r .<br />
De donde:<br />
es decir:<br />
C r i = a r 1X i1 + · · · + a r jX ij + · · · + a r mX im ,<br />
C r i =<br />
m∑<br />
X ij a r j<br />
j=1<br />
Gráficam<strong>en</strong>te se ilustra como sigue:<br />
Así, dos individuos i y j cuyas proyecciones son cercanas son “semejantes”<strong>en</strong><br />
la nube de puntos.<br />
Para proyectar un individuo <strong>en</strong> suplem<strong>en</strong>tario s = (s 1 , . . . , s m ) simplem<strong>en</strong>te<br />
se c<strong>en</strong>tra y reduce como si fuera la última fila de X, como<br />
sigue:<br />
(<br />
s1 −<br />
˜s =<br />
¯X 1<br />
, . . . , s m − ¯X m )<br />
,<br />
σ m<br />
σ 1<br />
donde ¯X j es la media de la columna j−ésima de la matriz X. Entonces<br />
las coord<strong>en</strong>adas se calculan como sigue:<br />
C s i =<br />
m∑<br />
˜s j a s j<br />
j=1
1. Análisis <strong>en</strong> Compon<strong>en</strong>tes <strong>Principales</strong> (ACP) xiii<br />
7.2. Calidad de la repres<strong>en</strong>tación de un individuo<br />
En el espacio de los individuos se ti<strong>en</strong><strong>en</strong> 2 bases ortonormales:<br />
1. La base original, <strong>en</strong> la cual las coord<strong>en</strong>adas del individuo i son:<br />
i = (X i1 , . . . , X ij , . . . , X im ).<br />
2. La base construida por los m factores, <strong>en</strong> la cual las coord<strong>en</strong>adas<br />
del individuo i son:<br />
i = (C 1 i , . . . , C k i , . . . , C m i ),<br />
<strong>en</strong>tonces la distancia del punto al orig<strong>en</strong> se puede medir con<br />
ambas repres<strong>en</strong>taciones, lo que implica que:<br />
m∑<br />
m∑<br />
(X ij ) 2 = (Ci k ) 2 .<br />
j=1<br />
De modo que el individuo i ti<strong>en</strong>e una bu<strong>en</strong>a repres<strong>en</strong>tación <strong>en</strong> el eje<br />
n∑<br />
r si (Ci r)2 ti<strong>en</strong>e un valor importante respecto a la suma (X ij ) 2 .<br />
Por lo que la calidad de la repres<strong>en</strong>tación del individuo i sobre el eje<br />
r está dada por:<br />
k=1<br />
j=1<br />
(C r i )2<br />
= % del individuo i repres<strong>en</strong>tado <strong>en</strong> el eje r.<br />
m∑<br />
(X ij ) 2<br />
j=1<br />
Lo anterior es útil para qué tan bi<strong>en</strong> está repres<strong>en</strong>tado un individuo<br />
<strong>en</strong> un eje o plano.<br />
7.3. Las contribuciones de los individuos a la varianza total<br />
La varianza total <strong>en</strong> la etapa r es igual a:<br />
1<br />
n<br />
n∑<br />
(Ci r ) 2 = β r .<br />
i=1<br />
La parte de esta varianza explicada por el individuo i es:<br />
1<br />
n (Cr i ) 2
xiv<br />
1. Análisis <strong>en</strong> Compon<strong>en</strong>tes <strong>Principales</strong> (ACP)<br />
Entonces, la contribución del individuo i a la varianza total del eje r<br />
está dada por:<br />
(C r i )2<br />
nβ r<br />
= % de contribución del individuo i a la formación del eje r.<br />
Lo anterior es útil para intepretar los ejes.<br />
7.4. Repres<strong>en</strong>tación de las variables<br />
La coord<strong>en</strong>ada de la variable X j sobre el eje r está dada por:<br />
R(X j , C r ),<br />
que es el coefici<strong>en</strong>te de correlación <strong>en</strong>tre la variable j−ésima y la<br />
compon<strong>en</strong>te principal r−ésima.<br />
Entonces las coord<strong>en</strong>adas de X j sobre la base de compon<strong>en</strong>tes principales<br />
son:<br />
esto implica que:<br />
(R(X j , C 1 ), . . . , R(X j , C s ), . . . , R(X j , C m )),<br />
m∑<br />
R 2 (X j , C k ) = 1<br />
k=1<br />
Por lo que si se usan solam<strong>en</strong>te 2 compon<strong>en</strong>tes C r y C s se ti<strong>en</strong>e que:<br />
R 2 (X j , C s ) + R 2 (X j , C r ) 1.<br />
Por esta razón las variables pued<strong>en</strong> ser repres<strong>en</strong>tadas <strong>en</strong> un círculo<br />
de radio 1 como se ilustra a continuación:<br />
Teorema 9 [Cálculo de las correlaciones]<br />
⎛<br />
R(X 1 , C r ⎞<br />
⎛ √<br />
)<br />
βr a r ⎞<br />
1<br />
.<br />
R(X j , C r )<br />
= √ .<br />
√ β r · a r =<br />
βr a r j<br />
,<br />
⎜ ⎟<br />
⎜ ⎟<br />
⎝ . ⎠<br />
⎝ . ⎠<br />
R(X m , C r √<br />
)<br />
βr a r m<br />
donde a r es el r−ésimo vector propio de R = 1 n Xt X asociado a λ r .
1. Análisis <strong>en</strong> Compon<strong>en</strong>tes <strong>Principales</strong> (ACP) xv<br />
Por dualidad, <strong>en</strong> el espacio de las variables, para calcular las coord<strong>en</strong>adas<br />
(correlaciones) se podría diagonalizar la matriz H = 1 n XXt<br />
(que es tamaño n × n) y proceder a calcular dichas coord<strong>en</strong>adas de<br />
manera completam<strong>en</strong>te análoga al caso de los individuos.<br />
Es decir, suponi<strong>en</strong>do que la matriz X está c<strong>en</strong>trada y reducida, y si<br />
d<strong>en</strong>otamos por Z = X t <strong>en</strong>tonces:<br />
R s = Za s donde a s es el vector propio de H = 1 n XXt asociado a λ s .<br />
De donde:<br />
es decir:<br />
R s i = a s 1Z i1 + · · · + a s jZ ij + · · · + a s nZ in ,<br />
R s i =<br />
n∑<br />
Z ij a s j<br />
j=1<br />
Para proyectar una variable suplememtaria:<br />
⎛<br />
y = ⎜<br />
⎝<br />
y 1<br />
y 2<br />
.<br />
y n<br />
primero se c<strong>en</strong>tra y se reduce respecto a sí misma como sigue:<br />
⎞<br />
⎟<br />
⎠<br />
⎛<br />
y c =<br />
⎜<br />
⎝<br />
y 1−ȳ<br />
σ y<br />
y 2−ȳ<br />
σ y<br />
.<br />
y n−ȳ<br />
σ y<br />
⎞<br />
⎟<br />
⎠<br />
y luego se calculan las correlaciones de y c con las compon<strong>en</strong>tes principales,<br />
de manera análoga a proyectar una columna de X.<br />
INTERPRETACIÓN<br />
• Si la proyección de X j está cercana al borde del círculo (la suma<br />
de las correlaciones al cuadrado está cerca de 1), significa que<br />
está bi<strong>en</strong> repres<strong>en</strong>tada <strong>en</strong> ese plano, pues t<strong>en</strong>dría fuerte correlación<br />
con las 2 compon<strong>en</strong>tes (o con alguna de ellas) y por la<br />
tanto la correlación con las demás compon<strong>en</strong>tes es débil.
xvi<br />
1. Análisis <strong>en</strong> Compon<strong>en</strong>tes <strong>Principales</strong> (ACP)<br />
• Si dos variables X j y X j′ están cercanas al borde del círculo,<br />
<strong>en</strong>tonces el ángulo G <strong>en</strong>tre la proyección de estas dos variables<br />
será muy cercano al ángulo que ambas variables ti<strong>en</strong><strong>en</strong> <strong>en</strong> la nube<br />
de puntos (variables) y así el cos<strong>en</strong>o de G será muy cercano a la<br />
correlación <strong>en</strong>tre ambas variables (ver el sigui<strong>en</strong>te gráfico), luego<br />
la interpretación es la sigui<strong>en</strong>te:<br />
◦ Si X j y X j′ están cercanas <strong>en</strong>tre si, <strong>en</strong>tonces X j y X j′ son<br />
fuerte y positivam<strong>en</strong>te correlacionadas.<br />
◦ Si el ángulo <strong>en</strong>tre X j y X j′ es cercano a los 90 ◦ <strong>en</strong>tonces<br />
NO existe ninguna correlación <strong>en</strong>tre ambas variables.<br />
◦ Si X j y X j′ están opuestas al vértice (orig<strong>en</strong>) <strong>en</strong>tonces existe<br />
una correlacin fuerte y negativa <strong>en</strong>tre X j y X j′ .<br />
7.5. Interpretación de la dualidad <strong>en</strong> los gráficos