Data depth in Multivariate Statistics - European Mathematical Society
Data depth in Multivariate Statistics - European Mathematical Society
Data depth in Multivariate Statistics - European Mathematical Society
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
<strong>Data</strong> <strong>depth</strong> <strong>in</strong> <strong>Multivariate</strong> <strong>Statistics</strong>s 161<br />
3.8. Profundidad de la mayoría<br />
La profundidad de la mayoría fue utilizada por primera vez por Liu y S<strong>in</strong>gh [25]<br />
para cuantificar la disparidad entre dos distribuciones. Es la probabilidad de que<br />
x pertenezca al semiespacio con mayor probabilidad P , de los dos que separa el<br />
hiperplano def<strong>in</strong>ido por d observaciones <strong>in</strong>dependientes de P . Dados x1, . . . , xd,<br />
d puntos af<strong>in</strong>mente <strong>in</strong>dependientes en Rd , consideramos el hiperplano que def<strong>in</strong>en.<br />
Este hiperplano delimitará dos semiespacios cerrados, tomamos el que tenga<br />
mayor probabilidad P y lo denotamos como HP . Podemos entonces def<strong>in</strong>ir<br />
x1,...,xd<br />
la profundidad de la mayoría como<br />
MjD(x; PX) = Pr{(X1, . . . , Xd) : x ∈ H P X1,...,Xd } .<br />
En el caso univariante es 1 menos la probabilidad que hay entre el valor x y la mediana<br />
MjD(x; PX) = 1/2+mín{FX(x), 1−FX(x)}. Satisface las propiedades D1,<br />
D3 y D4, pero puede no satisfacer D2, como ocurre en el caso unidimensional.<br />
En distribuciones angularmente simétricas la profundidad angular es máxima en<br />
el punto de simetría.<br />
3.9. Profundidad por bandas<br />
La profundidad por bandas fue <strong>in</strong>troducida por López-P<strong>in</strong>tado y Romo [26].<br />
Cuantifica la centralidad a través de la probabilidad de pertenencia del punto<br />
a hipercubos con vértices aleatorios (o bandas, en coordenadas paralelas). Los<br />
vértices aleatorios se calculan mediante los máximos y los mínimos de cada<br />
coordenada para un conjunto de s puntos, es decir,<br />
<br />
B (x1, . . . , xs) = y ∈ R d : mín<br />
1≤i≤s xk)<br />
i ≤ yk) ≤ máx<br />
1≤i≤s xk)<br />
<br />
i para 1 ≤ k ≤ d ,<br />
donde x k)<br />
i e yk) son las k-ésimas coordenadas de xi e y. La profundidad por bandas<br />
de un punto x con respecto a una distribución P para bandas determ<strong>in</strong>adas<br />
por hasta S ≥ 2 puntos, se def<strong>in</strong>e como<br />
BD (x; P ) =<br />
S<br />
Pr {x ∈ B (X1, X2, . . . , Xs)} . (3.5)<br />
s=2<br />
La profundidad por bandas satisface las propiedades D2 y D3. Bajo ciertas<br />
condiciones extra satisface además D4 y que, para distribuciones angularmente<br />
simétricas, alcanza su máximo en el centro. Su pr<strong>in</strong>cipal ventaja es su tiempo<br />
de cómputo en problemas de elevada dimensión. S<strong>in</strong> embargo, si la dimensión<br />
del espacio es elevada y no se dispone de tamaños muestrales grandes, es posible<br />
que las profundidades muestrales sean muy próximas a cero y sólo presenten<br />
pequeñas variaciones para los dist<strong>in</strong>tos puntos de la muestra. La profundidad