13.01.2015 Views

Análisis en Componentes Principales - Oldemar Rodríguez Rojas

Análisis en Componentes Principales - Oldemar Rodríguez Rojas

Análisis en Componentes Principales - Oldemar Rodríguez Rojas

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

This is page i<br />

Printer: Opaque this<br />

Análisis <strong>en</strong> Compon<strong>en</strong>tes <strong>Principales</strong><br />

Dr. <strong>Oldemar</strong> Rodríguez <strong>Rojas</strong><br />

29 de mayo de 2008


This is page iii<br />

Printer: Opaque this<br />

Cont<strong>en</strong>ts<br />

1. Análisis <strong>en</strong> Compon<strong>en</strong>tes <strong>Principales</strong> (ACP) V<br />

1. Los datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . vi<br />

2. El problema . . . . . . . . . . . . . . . . . . . . . . . . . . . vii<br />

3. Cálculo de los factores y de las compon<strong>en</strong>tes principales . . viii<br />

3.1. En el espacio de los individuos . . . . . . . . . . . . viii<br />

4. En el espacio de las variables . . . . . . . . . . . . . . . . . x<br />

5. Equival<strong>en</strong>cia de los dos análisis – Relaciones de dualidad . . x<br />

6. Varianza explicada por cada eje . . . . . . . . . . . . . . . . xi<br />

7. Gráficos y su interpretación . . . . . . . . . . . . . . . . . . xii<br />

7.1. Repres<strong>en</strong>tación de los individuos . . . . . . . . . . . xii<br />

7.2. Calidad de la repres<strong>en</strong>tación de un individuo . . . . xiii<br />

7.3. Las contribuciones de los individuos a la varianza totalxiv<br />

7.4. Repres<strong>en</strong>tación de las variables . . . . . . . . . . . . xiv<br />

7.5. Interpretación de la dualidad <strong>en</strong> los gráficos . . . . . xvi


Análisis <strong>en</strong> Compon<strong>en</strong>tes<br />

<strong>Principales</strong> (ACP)<br />

This is page v<br />

Printer: Opaque this<br />

El Análisis de Compon<strong>en</strong>tes <strong>Principales</strong> (ACP) es una técnica prov<strong>en</strong>i<strong>en</strong>te<br />

del análisis exploratorio de datos cuyo objetivo es la síntesis de la información,<br />

o reducción de la dim<strong>en</strong>sión (número de variables). Es decir, ante una<br />

tabla de datos con muchas variables, el objetivo será reducirlas a un m<strong>en</strong>or<br />

número perdi<strong>en</strong>do la m<strong>en</strong>or cantidad de información posible. El ACP es<br />

uno de los métodos más utilizados <strong>en</strong> Minería de Datos <strong>en</strong> países como<br />

Francia. Fue primeram<strong>en</strong>te introducido por Pearson <strong>en</strong> 1901 y desarrollado<br />

indep<strong>en</strong>di<strong>en</strong>tem<strong>en</strong>te <strong>en</strong> 1933 por Hotelling y la primera implem<strong>en</strong>tación<br />

computacional se dío <strong>en</strong> los años 60. Fue aplicado para analizar <strong>en</strong>cuestas<br />

de opinión pública por Jean Pages. Como ya se m<strong>en</strong>cionó el objetivo es construir<br />

un pequeño número de nuevas variables (compon<strong>en</strong>tes) <strong>en</strong> las cuales<br />

se conc<strong>en</strong>tre la mayor cantidad posible de información, como se ilustra <strong>en</strong><br />

la Figura 1.<br />

FIGURE 1. Transformación de las variables originales <strong>en</strong> compon<strong>en</strong>tes.<br />

Estas nuevos compon<strong>en</strong>tes principales o factores son calculados como una<br />

combinacin lineal de las variables originales, y además serán linealm<strong>en</strong>te<br />

indep<strong>en</strong>di<strong>en</strong>tes. Un aspecto clave <strong>en</strong> ACP es la interpretación, ya que ésta<br />

no vi<strong>en</strong>e dada a priori, sino que será deducida tras observar la relación de<br />

los compon<strong>en</strong>tes principales con las variables originales, para esto hay que<br />

estudiar tanto el signo como la magnitud de las correlaciones, como vermos<br />

<strong>en</strong> detalle más adelante. Esto no siempre es fácil, y será de vital importancia<br />

el conocimi<strong>en</strong>to que el experto t<strong>en</strong>ga sobre la materia de investigación.<br />

Los n individuos de una tabla de datos se pued<strong>en</strong> ver como una nube de<br />

puntos <strong>en</strong> R p , como se ilustra <strong>en</strong> la Figura 2-a, con su c<strong>en</strong>tro de gravedad<br />

localizado <strong>en</strong> el orig<strong>en</strong>, y lo que se busca es un subespacio q−dim<strong>en</strong>sional L<br />

de R p , usualm<strong>en</strong>te un plano (ver Figura 2-b), tal que la proyección ortogonal<br />

de los n puntos sobre L (ver Figura 2-c) ti<strong>en</strong><strong>en</strong> varianza máxima, lo cual<br />

permitirá el estudio de relaciones, clases, etc. <strong>en</strong>tre los individuos (filas) de


vi<br />

1. Análisis <strong>en</strong> Compon<strong>en</strong>tes <strong>Principales</strong> (ACP)<br />

la tabla de datos.<br />

FIGURE 2. Proyección de los individuos <strong>en</strong> el plano de varianza máxima<br />

1. Los datos<br />

Se parte de una tabla de datos:<br />

⎛<br />

⎞<br />

x 11 · · · x 1j · · · x 1m<br />

. . .. . . .<br />

X =<br />

x i1 · · · x ij · · · x im<br />

←↪ individuo i<br />

⎜<br />

⎝<br />

. ⎟<br />

. . . .. . ⎠<br />

x n1 · · · x nj · · · x nm<br />

que se puede transformar <strong>en</strong> la sigui<strong>en</strong>te matriz de distancias:<br />

⎛<br />

⎞<br />

d 11 · · · d 1j · · · d 1n<br />

. . .. . . .<br />

D =<br />

d i1 · · · d ij · · · x in<br />

⎜<br />

⎝<br />

. ⎟<br />

. . . .. . ⎠<br />

d n1 · · · d nj · · · d nn


2. El problema<br />

1. Análisis <strong>en</strong> Compon<strong>en</strong>tes <strong>Principales</strong> (ACP) vii<br />

Se trata de sintetizar los datos cont<strong>en</strong>idos <strong>en</strong> una tabla de datos X<br />

<strong>en</strong> un conjunto más pequeño de nuevas variables C 1 , C 2 , . . . llamadas<br />

compon<strong>en</strong>tes principales, mant<strong>en</strong>i<strong>en</strong>do la información esc<strong>en</strong>cial de X.<br />

Así, <strong>en</strong> la etapa 1 del algoritmo se <strong>en</strong>cu<strong>en</strong>tra una variable sintética<br />

C 1 , la primera compon<strong>en</strong>te principal, la cual es combinación lineal<br />

de las variables originales X j , es decir:<br />

C 1 = a 11 X 1 + · · · + a 1j X j + · · · + a 1m X m ,<br />

donde X j es la columna j de X. Esto significa que el valor de C 1<br />

para el individuo i−ésimo está dado por:<br />

C 1 i = a 11 x i1 + · · · + a 1j x ij + · · · + a 1m x im ,<br />

G<strong>en</strong>eralm<strong>en</strong>te esta primer compon<strong>en</strong>te principal, C 1 , no es sufici<strong>en</strong>te<br />

para cond<strong>en</strong>sar la información cont<strong>en</strong>ida <strong>en</strong> X, por lo que se construye<br />

una segunda compon<strong>en</strong>te principal C 2 , luego una tercera C 3 y<br />

así sucesivam<strong>en</strong>te.<br />

En g<strong>en</strong>eral <strong>en</strong> la etapa k, se construye la compon<strong>en</strong>te principal k−ésima<br />

dada por:<br />

C k = a k1 X 1 + · · · + a kj X j + · · · + a km X m .<br />

Matricialm<strong>en</strong>te se ti<strong>en</strong>e que:<br />

C k = Xa k ,<br />

donde:<br />

⎛ ⎞<br />

a k1<br />

.<br />

a k =<br />

a kj<br />

.<br />

⎜ ⎟<br />

⎝ . ⎠<br />

a km<br />

a k se llama el k−ésimo factor.<br />

Los factores a kj constituy<strong>en</strong> un sistema de pesos para las variables,<br />

los cuales indican cuanto aporta cada variables a la construcción de<br />

la compon<strong>en</strong>te.


viii<br />

1. Análisis <strong>en</strong> Compon<strong>en</strong>tes <strong>Principales</strong> (ACP)<br />

Algunos factores a kj serán negativos y otros serán positivos. El valor<br />

de cada peso por si solo no es importante, sino la relación con respecto<br />

a los otros pesos. Para evitar un problema de escalas se impone la<br />

sigui<strong>en</strong>te restricción:<br />

m∑<br />

(a kj ) 2 = 1.<br />

j=1<br />

3. Cálculo de los factores y de las compon<strong>en</strong>tes<br />

principales<br />

Como <strong>en</strong> regresión, el ACP puede ser pres<strong>en</strong>tado tanto <strong>en</strong> el espacio de las<br />

variables como <strong>en</strong> el espacio de los individuos.<br />

3.1. En el espacio de los individuos<br />

Se supondrá que las variables están c<strong>en</strong>tradas y reducidas.<br />

V = 1 n Xt X es la matriz de varianzas–covarianzas. Como las variables<br />

están c<strong>en</strong>tradas y reducidas <strong>en</strong>tonces V = R, la matriz de correlaciones,<br />

pues:<br />

v ij = cov(X i , X j ) = cov(Xi , X j )<br />

σ X iσ X j<br />

= R(X i , X j ).<br />

Por lo tanto el espacio de las filas de X <strong>en</strong> R m es el espacio de<br />

individuos cuyo orig<strong>en</strong> será el c<strong>en</strong>tro de la nube de puntos.<br />

El objetivo del ACP es describir de manera sintética la nube de individuos.<br />

Teorema 1 En la etapa 1 de un ACP se calcula el eje D 1 que pasa por<br />

el orig<strong>en</strong> para el cual la dispersión de la nube de puntos sea máxima, este<br />

eje D 1 pasa <strong>en</strong>tonces lo más cerca posible de la nube de puntos, es decir,<br />

el promedio de las distancias al cuadrado de los n puntos de la nube y el<br />

eje D 1 es minimal (ver Figura ).<br />

Sea a 1 es vector director normado (norma 1) del eje (recta) D 1 <strong>en</strong>tonces:<br />

a 1 es el vector propio asociado al valor propio más grande de la matriz de<br />

V de varianzas–covarianzas.<br />

Teorema 2 En la etapa 2 de un ACP se calcula el eje D 2 que pasa por<br />

el orig<strong>en</strong> para el cual la dispersión de la nube de puntos sea máxima, este<br />

eje D 2 pasa <strong>en</strong>tonces lo más cerca posible de la nube de puntos, es decir,


1. Análisis <strong>en</strong> Compon<strong>en</strong>tes <strong>Principales</strong> (ACP) ix<br />

el promedio de las distancias al cuadrado de los n puntos de la nube y el<br />

eje D 2 es minimal.<br />

Sea a 2 es vector director normado (norma 1) del eje (recta) D 2 el cual<br />

será ortogonal al vector a 1 construido <strong>en</strong> la etapa 1, <strong>en</strong>tonces: Se ti<strong>en</strong>e el<br />

sigui<strong>en</strong>te problema de optimización:<br />

(<br />

1<br />

máx ) n a<br />

2 t<br />

X t Xa 2<br />

sujeto<br />

{ (a<br />

2 ) t<br />

a 2 = 1<br />

(<br />

a<br />

2 ) t<br />

a 2 = 0<br />

cuya solución es el vector propio asociado al segundo valor propio más<br />

grande de la matriz de V de varianzas–covarianzas.<br />

Teorema 3 En la etapa k de un ACP se calcula el eje D k que pasa por<br />

el orig<strong>en</strong> para el cual la dispersión de la nube de puntos sea máxima, este<br />

eje D k pasa <strong>en</strong>tonces lo más cerca posible de la nube de puntos, es decir,<br />

el promedio de las distancias al cuadrado de los n puntos de la nube y el<br />

eje D k es minimal.<br />

Sea a k es vector director normado (norma 1) del eje (recta) D k el cual<br />

será ortogonal al vector a r ∀ r < k construidos <strong>en</strong> las etapas 1, 2, . . . , k − 1<br />

<strong>en</strong>tonces: Se ti<strong>en</strong>e el sigui<strong>en</strong>te problema de optimización:<br />

(<br />

1<br />

máx ) n a<br />

k t<br />

X t Xa k<br />

sujeto<br />

{ (a<br />

k ) t<br />

a k = 1<br />

(<br />

a<br />

k ) t<br />

a k = 0 para r = 1, 2, . . . , k − 1<br />

cuya solución es el vector propio asociado al k−ésimo valor propio más<br />

grande de la matriz de V de varianzas–covarianzas.<br />

4. En el espacio de las variables<br />

Teorema 4 En la etapa 1 de un ACP se calcula una variable sintética<br />

(eje) C 1 que resuma lo mejor posible las variables originales, es decir, de<br />

tal manera que:<br />

m∑<br />

R 2 (C 1 , X j ) sea máxima.<br />

j=1<br />

Entonces: C 1 es el vector propio de 1 n XXt asociado al valor propio más<br />

grande.


x<br />

1. Análisis <strong>en</strong> Compon<strong>en</strong>tes <strong>Principales</strong> (ACP)<br />

Teorema 5 En la etapa k de un ACP se calcula una variable sintética<br />

(eje) C k que resuma lo mejor posible las variables originales y que no<br />

esté correlacionada las primeras k − 1 compon<strong>en</strong>tes principales (variables<br />

sintéticas) ya calculadas, es decir, de tal manera que:<br />

máx<br />

m∑<br />

R 2 (C k , X j )<br />

j=1<br />

sujeto R 2 (C k , C r ) = 0 para r = 1, 2, . . . , k − 1<br />

Entonces: C k es el vector propio de 1 n XXt asociado al k−ésimo valor propio<br />

más grande.<br />

5. Equival<strong>en</strong>cia de los dos análisis – Relaciones de<br />

dualidad<br />

Espacio de los individuos ↦→ 1 n Xt X que es tamaño m × m.<br />

Espacio de las variables ↦→ 1 n XXt que es tamaño n × n.<br />

Usualem<strong>en</strong>te el número de variables es m<strong>en</strong>or que el número de individuos,<br />

por supondremos <strong>en</strong> adelante sin pérdidad de g<strong>en</strong>eralidad que m < n.<br />

Teorema 6 [Relaciones de Dualidad]<br />

1. Si v k es el k−ésimo vector propio de norma 1 asociado a λ k de la<br />

matriz 1 n XXt <strong>en</strong>tonces:<br />

u k = Xt v<br />

√ k<br />

, nλk<br />

es el k−ésimo vector propio de norma 1 asociado a λ k de la matriz<br />

1<br />

n Xt X.<br />

2. Si u k es el k−ésimo vector propio de norma 1 asociado a λ k de la<br />

matriz 1 n Xt X <strong>en</strong>tonces:<br />

v k = Xu k<br />

√ nλk<br />

,<br />

es el k−ésimo vector propio de norma 1 asociado a λ k de la matriz<br />

1<br />

n XXt .


1. Análisis <strong>en</strong> Compon<strong>en</strong>tes <strong>Principales</strong> (ACP) xi<br />

6. Varianza explicada por cada eje<br />

Teorema 7<br />

1<br />

n Xt X y 1 n XXt ti<strong>en</strong><strong>en</strong> los mismos valores propios, β 1 , β 2 , . . . , β m .<br />

Además el rango de ambas matrices es n − m y los últimos n − m<br />

valores propios de 1 n XXt son nulos.<br />

Teorema 8<br />

m∑<br />

β k = m.<br />

k=1<br />

El ACP ti<strong>en</strong>e m etapas, <strong>en</strong> cada etapa se construye un resum<strong>en</strong> de la tabla<br />

X, m<strong>en</strong>os interesante que el construido <strong>en</strong> la etapa anterior.<br />

¿Cómo medir la calidad de la etapa k<br />

En la etapa k, el criterio del ACP es maximizar:<br />

como:<br />

1<br />

n<br />

n∑<br />

(Ci k ) 2 ,<br />

i=1<br />

1<br />

n<br />

n∑<br />

(Ci k ) 2 = 1 n (ak ) t X t Xa k = (a k ) t β k a k = β k .<br />

i=1<br />

Entonces β k es la varianza explicada por el eje k−ésimo, es decir por<br />

C k .<br />

Como:<br />

se ti<strong>en</strong>e que:<br />

m∑<br />

β k = m,<br />

k=1<br />

β k<br />

m = % de la varianza explicada por el eje Ck = % de INERCIA.<br />

Por ejemplo, la inercia explicada por el plano principal, ejes 1 y 2<br />

es:<br />

β 1 + β 2<br />

m .


xii<br />

1. Análisis <strong>en</strong> Compon<strong>en</strong>tes <strong>Principales</strong> (ACP)<br />

7. Gráficos y su interpretación<br />

7.1. Repres<strong>en</strong>tación de los individuos<br />

Recordemos que para calcular las coord<strong>en</strong>adas de un individuos se ti<strong>en</strong>e<br />

que (La matriz X se supone c<strong>en</strong>trada y reducida):<br />

C s = Xa s donde a s es el vector propio de R = 1 n Xt X asociado a λ s .<br />

De donde:<br />

es decir:<br />

C s i = a s 1X i1 + · · · + a s jX ij + · · · + a s mX im ,<br />

m∑<br />

Ci s = X ij a s j<br />

j=1<br />

Análogam<strong>en</strong>te:<br />

C r = Xa r donde a r es el vector propio de R = 1 n Xt X asociado a λ r .<br />

De donde:<br />

es decir:<br />

C r i = a r 1X i1 + · · · + a r jX ij + · · · + a r mX im ,<br />

C r i =<br />

m∑<br />

X ij a r j<br />

j=1<br />

Gráficam<strong>en</strong>te se ilustra como sigue:<br />

Así, dos individuos i y j cuyas proyecciones son cercanas son “semejantes”<strong>en</strong><br />

la nube de puntos.<br />

Para proyectar un individuo <strong>en</strong> suplem<strong>en</strong>tario s = (s 1 , . . . , s m ) simplem<strong>en</strong>te<br />

se c<strong>en</strong>tra y reduce como si fuera la última fila de X, como<br />

sigue:<br />

(<br />

s1 −<br />

˜s =<br />

¯X 1<br />

, . . . , s m − ¯X m )<br />

,<br />

σ m<br />

σ 1<br />

donde ¯X j es la media de la columna j−ésima de la matriz X. Entonces<br />

las coord<strong>en</strong>adas se calculan como sigue:<br />

C s i =<br />

m∑<br />

˜s j a s j<br />

j=1


1. Análisis <strong>en</strong> Compon<strong>en</strong>tes <strong>Principales</strong> (ACP) xiii<br />

7.2. Calidad de la repres<strong>en</strong>tación de un individuo<br />

En el espacio de los individuos se ti<strong>en</strong><strong>en</strong> 2 bases ortonormales:<br />

1. La base original, <strong>en</strong> la cual las coord<strong>en</strong>adas del individuo i son:<br />

i = (X i1 , . . . , X ij , . . . , X im ).<br />

2. La base construida por los m factores, <strong>en</strong> la cual las coord<strong>en</strong>adas<br />

del individuo i son:<br />

i = (C 1 i , . . . , C k i , . . . , C m i ),<br />

<strong>en</strong>tonces la distancia del punto al orig<strong>en</strong> se puede medir con<br />

ambas repres<strong>en</strong>taciones, lo que implica que:<br />

m∑<br />

m∑<br />

(X ij ) 2 = (Ci k ) 2 .<br />

j=1<br />

De modo que el individuo i ti<strong>en</strong>e una bu<strong>en</strong>a repres<strong>en</strong>tación <strong>en</strong> el eje<br />

n∑<br />

r si (Ci r)2 ti<strong>en</strong>e un valor importante respecto a la suma (X ij ) 2 .<br />

Por lo que la calidad de la repres<strong>en</strong>tación del individuo i sobre el eje<br />

r está dada por:<br />

k=1<br />

j=1<br />

(C r i )2<br />

= % del individuo i repres<strong>en</strong>tado <strong>en</strong> el eje r.<br />

m∑<br />

(X ij ) 2<br />

j=1<br />

Lo anterior es útil para qué tan bi<strong>en</strong> está repres<strong>en</strong>tado un individuo<br />

<strong>en</strong> un eje o plano.<br />

7.3. Las contribuciones de los individuos a la varianza total<br />

La varianza total <strong>en</strong> la etapa r es igual a:<br />

1<br />

n<br />

n∑<br />

(Ci r ) 2 = β r .<br />

i=1<br />

La parte de esta varianza explicada por el individuo i es:<br />

1<br />

n (Cr i ) 2


xiv<br />

1. Análisis <strong>en</strong> Compon<strong>en</strong>tes <strong>Principales</strong> (ACP)<br />

Entonces, la contribución del individuo i a la varianza total del eje r<br />

está dada por:<br />

(C r i )2<br />

nβ r<br />

= % de contribución del individuo i a la formación del eje r.<br />

Lo anterior es útil para intepretar los ejes.<br />

7.4. Repres<strong>en</strong>tación de las variables<br />

La coord<strong>en</strong>ada de la variable X j sobre el eje r está dada por:<br />

R(X j , C r ),<br />

que es el coefici<strong>en</strong>te de correlación <strong>en</strong>tre la variable j−ésima y la<br />

compon<strong>en</strong>te principal r−ésima.<br />

Entonces las coord<strong>en</strong>adas de X j sobre la base de compon<strong>en</strong>tes principales<br />

son:<br />

esto implica que:<br />

(R(X j , C 1 ), . . . , R(X j , C s ), . . . , R(X j , C m )),<br />

m∑<br />

R 2 (X j , C k ) = 1<br />

k=1<br />

Por lo que si se usan solam<strong>en</strong>te 2 compon<strong>en</strong>tes C r y C s se ti<strong>en</strong>e que:<br />

R 2 (X j , C s ) + R 2 (X j , C r ) 1.<br />

Por esta razón las variables pued<strong>en</strong> ser repres<strong>en</strong>tadas <strong>en</strong> un círculo<br />

de radio 1 como se ilustra a continuación:<br />

Teorema 9 [Cálculo de las correlaciones]<br />

⎛<br />

R(X 1 , C r ⎞<br />

⎛ √<br />

)<br />

βr a r ⎞<br />

1<br />

.<br />

R(X j , C r )<br />

= √ .<br />

√ β r · a r =<br />

βr a r j<br />

,<br />

⎜ ⎟<br />

⎜ ⎟<br />

⎝ . ⎠<br />

⎝ . ⎠<br />

R(X m , C r √<br />

)<br />

βr a r m<br />

donde a r es el r−ésimo vector propio de R = 1 n Xt X asociado a λ r .


1. Análisis <strong>en</strong> Compon<strong>en</strong>tes <strong>Principales</strong> (ACP) xv<br />

Por dualidad, <strong>en</strong> el espacio de las variables, para calcular las coord<strong>en</strong>adas<br />

(correlaciones) se podría diagonalizar la matriz H = 1 n XXt<br />

(que es tamaño n × n) y proceder a calcular dichas coord<strong>en</strong>adas de<br />

manera completam<strong>en</strong>te análoga al caso de los individuos.<br />

Es decir, suponi<strong>en</strong>do que la matriz X está c<strong>en</strong>trada y reducida, y si<br />

d<strong>en</strong>otamos por Z = X t <strong>en</strong>tonces:<br />

R s = Za s donde a s es el vector propio de H = 1 n XXt asociado a λ s .<br />

De donde:<br />

es decir:<br />

R s i = a s 1Z i1 + · · · + a s jZ ij + · · · + a s nZ in ,<br />

R s i =<br />

n∑<br />

Z ij a s j<br />

j=1<br />

Para proyectar una variable suplememtaria:<br />

⎛<br />

y = ⎜<br />

⎝<br />

y 1<br />

y 2<br />

.<br />

y n<br />

primero se c<strong>en</strong>tra y se reduce respecto a sí misma como sigue:<br />

⎞<br />

⎟<br />

⎠<br />

⎛<br />

y c =<br />

⎜<br />

⎝<br />

y 1−ȳ<br />

σ y<br />

y 2−ȳ<br />

σ y<br />

.<br />

y n−ȳ<br />

σ y<br />

⎞<br />

⎟<br />

⎠<br />

y luego se calculan las correlaciones de y c con las compon<strong>en</strong>tes principales,<br />

de manera análoga a proyectar una columna de X.<br />

INTERPRETACIÓN<br />

• Si la proyección de X j está cercana al borde del círculo (la suma<br />

de las correlaciones al cuadrado está cerca de 1), significa que<br />

está bi<strong>en</strong> repres<strong>en</strong>tada <strong>en</strong> ese plano, pues t<strong>en</strong>dría fuerte correlación<br />

con las 2 compon<strong>en</strong>tes (o con alguna de ellas) y por la<br />

tanto la correlación con las demás compon<strong>en</strong>tes es débil.


xvi<br />

1. Análisis <strong>en</strong> Compon<strong>en</strong>tes <strong>Principales</strong> (ACP)<br />

• Si dos variables X j y X j′ están cercanas al borde del círculo,<br />

<strong>en</strong>tonces el ángulo G <strong>en</strong>tre la proyección de estas dos variables<br />

será muy cercano al ángulo que ambas variables ti<strong>en</strong><strong>en</strong> <strong>en</strong> la nube<br />

de puntos (variables) y así el cos<strong>en</strong>o de G será muy cercano a la<br />

correlación <strong>en</strong>tre ambas variables (ver el sigui<strong>en</strong>te gráfico), luego<br />

la interpretación es la sigui<strong>en</strong>te:<br />

◦ Si X j y X j′ están cercanas <strong>en</strong>tre si, <strong>en</strong>tonces X j y X j′ son<br />

fuerte y positivam<strong>en</strong>te correlacionadas.<br />

◦ Si el ángulo <strong>en</strong>tre X j y X j′ es cercano a los 90 ◦ <strong>en</strong>tonces<br />

NO existe ninguna correlación <strong>en</strong>tre ambas variables.<br />

◦ Si X j y X j′ están opuestas al vértice (orig<strong>en</strong>) <strong>en</strong>tonces existe<br />

una correlacin fuerte y negativa <strong>en</strong>tre X j y X j′ .<br />

7.5. Interpretación de la dualidad <strong>en</strong> los gráficos

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!