Analisis Multivariado 1 (Apunte basado en notas de clases del ...
Analisis Multivariado 1 (Apunte basado en notas de clases del ...
Analisis Multivariado 1 (Apunte basado en notas de clases del ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Veamos por ultimo que la primer opcion (trabajar con Y s ) brinda,<br />
sin embargo, una interpretacion muy util <strong>en</strong> terminos <strong>de</strong> distancias<br />
<strong>en</strong>tre puntos, es <strong>de</strong>cir, las distancias repres<strong>en</strong>tadas <strong>en</strong> el biplot <strong>en</strong>tre<br />
los puntos Y s aproximan a las distancias <strong>de</strong> Mahalanobis <strong>de</strong> las<br />
observaciones originales. Veamos<br />
=<br />
<br />
<br />
Λ −1/2<br />
k<br />
=<br />
Y1 − Λ −1/2<br />
<br />
Λ −1/2<br />
k<br />
d (Y s 1, Y s 2) 2 = Y s 1 − Y s 2 2 =<br />
k<br />
Y2<br />
<br />
<br />
2<br />
=<br />
<br />
<br />
Λ −1/2<br />
k<br />
T ′ k (X1<br />
′ <br />
− X2)<br />
Λ −1/2<br />
k<br />
T ′ kX1 − Λ −1/2<br />
k<br />
T ′ kX2<br />
T ′ k (X1<br />
<br />
− X2)<br />
= (X1 − X2) ′ TkΛ −1/2<br />
k Λ −1/2<br />
k T ′ k (X1 − X2) =<br />
= (X1 − X2) ′ TkΛ −1<br />
k T ′ k (X1 − X2) =<br />
y vi<strong>en</strong>do que T ′ ⎢<br />
kT = ⎣<br />
<br />
<br />
2 <br />
<br />
=<br />
⎡<br />
1<br />
.<br />
· · ·<br />
. ..<br />
0<br />
.<br />
0 · · ·<br />
. ..<br />
0<br />
.<br />
⎤<br />
⎥<br />
⎦ = [Ik×k0k×d−k]<br />
0 · · · 1 0 · · · 0<br />
= (X1 − X2) ′ TkT ′ k T Λ−1 T ′ TkT ′ k (X1 − X2) =<br />
= (X1 − X2) ′ TkT ′ k Σ−1 TkT ′ k (X1 − X2) =<br />
= (TkT ′ k X1 − TkT ′ k X2) ′ Σ −1 (TkT ′ k X1 − TkT ′ k X2) =<br />
= (P (X1, L ∗ ) − P (X2, L ∗ )) ′ Σ −1 (P (X1, L ∗ ) − P (X2, L ∗ )) =<br />
= DMΣ (P (X1, L ∗ ), P (X2, L ∗ ))<br />
17 Ejercicio <strong>de</strong> Compon<strong>en</strong>tes Principales<br />
=<br />
Λ −1/2<br />
k<br />
Basado <strong>en</strong> el conjunto <strong>de</strong> datos “crim<strong>en</strong>.csv”, que conti<strong>en</strong>e informacion<br />
<strong>de</strong> tasas <strong>de</strong>lictivas, para cada uno <strong>de</strong> los estados <strong>de</strong> USA, medidas <strong>en</strong><br />
un periodo <strong>de</strong> tiempo, se pi<strong>de</strong> realizar un <strong>Analisis</strong> <strong>de</strong> Compon<strong>en</strong>tes<br />
Principales <strong>de</strong>l mismo.<br />
Los datos conforman una matriz <strong>de</strong> 50 filas (estados) y 9 columnas<br />
(variables). Las variables se <strong>de</strong>tallan a continuacion:<br />
• STATEN: Nombre <strong>de</strong>l estado <strong>de</strong> EEUU.<br />
47<br />
T ′ <br />
<br />
k (X1 − X2) 2<br />
=