Data depth in Multivariate Statistics - European Mathematical Society
Data depth in Multivariate Statistics - European Mathematical Society
Data depth in Multivariate Statistics - European Mathematical Society
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
<strong>Data</strong> <strong>depth</strong> <strong>in</strong> <strong>Multivariate</strong> <strong>Statistics</strong>s 159<br />
3.4. Profundidad de Mahalanobis<br />
La profundidad de Mahalanobis fue propuesta por Liu y S<strong>in</strong>gh [25] como una<br />
transformación de la distancia de Mahalanobis (ver Mahalanobis [27]) de cada<br />
punto al vector de medias. Con dicha transformación se consigue que la función<br />
esté en el <strong>in</strong>tervalo [0, 1] y también que tome valores próximos a 1 cuando el<br />
punto sea cercano a la esperanza de la variable, para la cual la profundidad<br />
toma su máximo valor. Su def<strong>in</strong>ición formal es<br />
MhD(x; P ) = 1 + (x − µ) ′ Σ −1 (x − µ) −1 ,<br />
donde µ y Σ son el vector de medias y la matriz de covarianzas de la distribución<br />
de probabilidad P . Su versión muestral se construye a partir de estimaciones del<br />
vector de medias y de la matriz de covarianzas. Habitualmente se toman x =<br />
n−1 n i=1 xi y S = n−1 n i=1 (xi − x) (xi − x) ′ .<br />
Esta profundidad verifica las propiedades D1–D4 y D4’. Además, los contornos<br />
de sus regiones centrales son elipsoides centradas en la media.<br />
Como <strong>in</strong>convenientes de la profundidad de Mahalanobis tenemos, en primer<br />
lugar, la necesidad de existencia de los dos primeros momentos de la distribución.<br />
En segundo lugar, el hecho de que sus curvas de nivel sean elípticas hace que<br />
para distribuciones que no son angularmente simétricas se obtengan valores de<br />
centralidad poco representativos.<br />
3.5. Profundidad de Oja<br />
La profundidad de Oja (o del volumen simplicial) fue <strong>in</strong>troducida por Zuo<br />
y Serfl<strong>in</strong>g [43] <strong>in</strong>spirándose en el trabajo de Oja [33]. Se basa en el volumen<br />
esperado de un símplex con un vértice fijo (el punto del que queremos hallar<br />
su profundidad) y el resto aleatorios (observaciones <strong>in</strong>dependientes de P ). Dado<br />
un punto x y muestra X1, X2, ..., Xd de d vectores aleatorios <strong>in</strong>depedientes con<br />
distribución P , la profundidad de Oja se def<strong>in</strong>e como<br />
OD(x; P ) = 1 + E (vol(co{x, X1, X2, ..., Xd})) −1 .<br />
Si x se encuentra alejado de los vértices aleatorios, el volumen esperado de la<br />
envolvente convexa será elevado. Su versión muestral se obtiene a partir del<br />
volumen medio de los símplices construidos a partir de todos los subconjuntos<br />
de d observaciones dist<strong>in</strong>tas de la muestra, es decir,<br />
⎛<br />
ODn(x) = ⎝1 +<br />
−1 n <br />
vol(co{x, xi1, xi2, ..., xid<br />
d<br />
1≤i1