Data depth in Multivariate Statistics - European Mathematical Society

More documents

Recommendations

Info

158 I. Cascos, A. López and J. Romo Es decir, la región de nivel α = k/n es la envolvente convexa de las medias de todos los subconjuntos de la muestra de tamaño k. Satisface las propiedades R0–R4 y R4’ y el punto más profundo es la media, ZD 1 (PX) = {EX}, que obviamente no tiene porqué coincidir con el centro de simetría angular de una distribucion simétrica. El nombre de regiones del zonoide viene de su relación con una familia de cuerpos convexos ampliamente estudiados en geometría estocástica así denominados. En concreto, podemos construir las regiones del zonoide a partir del zonoide elevado de una distribución. El zonoide elevado es una manera de representar una distribución de probabilidad y, en torno suyo, se ha construido toda una teoría en la que tienen cabida las ordenaciones estocásticas, las curvas de Lorenz y los estadísticos en dispersión (en concreto el índice y la diferencia media de Gini) tanto univariantes como multivariantes, ver la colección de trabajos Koshevoy y Mosler [17; 18; 20] y la monografía Mosler [31]. La profundidad del zonoide se obtiene a partir de sus regiones centrales tal como se indica en (2.1). A partir de (3.4), la profundidad del zonoide respecto de una muestra puede plantearse trivialmente como la solución a un problema de programación lineal. Envolvente convexa esperada Cascos [4] define las regiones de la envolvente convexa esperada de una muestra a partir de la suma elemento a elemento de las envolventes convexas de todos los subconjuntos de k puntos distintos de una muestra, CD 1/k n = −1 n co{Xi1, Xi2, . . . , Xik } , k 1≤i1
Data depth in Multivariate Statisticss 159 3.4. Profundidad de Mahalanobis La profundidad de Mahalanobis fue propuesta por Liu y Singh [25] como una transformación de la distancia de Mahalanobis (ver Mahalanobis [27]) de cada punto al vector de medias. Con dicha transformación se consigue que la función esté en el intervalo [0, 1] y también que tome valores próximos a 1 cuando el punto sea cercano a la esperanza de la variable, para la cual la profundidad toma su máximo valor. Su definición formal es MhD(x; P ) = 1 + (x − µ) ′ Σ −1 (x − µ) −1 , donde µ y Σ son el vector de medias y la matriz de covarianzas de la distribución de probabilidad P . Su versión muestral se construye a partir de estimaciones del vector de medias y de la matriz de covarianzas. Habitualmente se toman x = n−1 n i=1 xi y S = n−1 n i=1 (xi − x) (xi − x) ′ . Esta profundidad verifica las propiedades D1–D4 y D4’. Además, los contornos de sus regiones centrales son elipsoides centradas en la media. Como inconvenientes de la profundidad de Mahalanobis tenemos, en primer lugar, la necesidad de existencia de los dos primeros momentos de la distribución. En segundo lugar, el hecho de que sus curvas de nivel sean elípticas hace que para distribuciones que no son angularmente simétricas se obtengan valores de centralidad poco representativos. 3.5. Profundidad de Oja La profundidad de Oja (o del volumen simplicial) fue introducida por Zuo y Serfling [43] inspirándose en el trabajo de Oja [33]. Se basa en el volumen esperado de un símplex con un vértice fijo (el punto del que queremos hallar su profundidad) y el resto aleatorios (observaciones independientes de P ). Dado un punto x y muestra X1, X2, ..., Xd de d vectores aleatorios indepedientes con distribución P , la profundidad de Oja se define como OD(x; P ) = 1 + E (vol(co{x, X1, X2, ..., Xd})) −1 . Si x se encuentra alejado de los vértices aleatorios, el volumen esperado de la envolvente convexa será elevado. Su versión muestral se obtiene a partir del volumen medio de los símplices construidos a partir de todos los subconjuntos de d observaciones distintas de la muestra, es decir, ⎛ ODn(x) = ⎝1 + −1 n vol(co{x, xi1, xi2, ..., xid d 1≤i1
Page 1 and 2: Boletín de Estadística e Investig
Page 3 and 4: Data depth in Multivariate Statisti
Page 7: Data depth in Multivariate Statisti

Data depth in Multivariate Statistics - European Mathematical Society

Create successful ePaper yourself

Delete template?

Save as template?