07.05.2013 Views

Data depth in Multivariate Statistics - European Mathematical Society

Data depth in Multivariate Statistics - European Mathematical Society

Data depth in Multivariate Statistics - European Mathematical Society

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>Data</strong> <strong>depth</strong> <strong>in</strong> <strong>Multivariate</strong> <strong>Statistics</strong>s 161<br />

3.8. Profundidad de la mayoría<br />

La profundidad de la mayoría fue utilizada por primera vez por Liu y S<strong>in</strong>gh [25]<br />

para cuantificar la disparidad entre dos distribuciones. Es la probabilidad de que<br />

x pertenezca al semiespacio con mayor probabilidad P , de los dos que separa el<br />

hiperplano def<strong>in</strong>ido por d observaciones <strong>in</strong>dependientes de P . Dados x1, . . . , xd,<br />

d puntos af<strong>in</strong>mente <strong>in</strong>dependientes en Rd , consideramos el hiperplano que def<strong>in</strong>en.<br />

Este hiperplano delimitará dos semiespacios cerrados, tomamos el que tenga<br />

mayor probabilidad P y lo denotamos como HP . Podemos entonces def<strong>in</strong>ir<br />

x1,...,xd<br />

la profundidad de la mayoría como<br />

MjD(x; PX) = Pr{(X1, . . . , Xd) : x ∈ H P X1,...,Xd } .<br />

En el caso univariante es 1 menos la probabilidad que hay entre el valor x y la mediana<br />

MjD(x; PX) = 1/2+mín{FX(x), 1−FX(x)}. Satisface las propiedades D1,<br />

D3 y D4, pero puede no satisfacer D2, como ocurre en el caso unidimensional.<br />

En distribuciones angularmente simétricas la profundidad angular es máxima en<br />

el punto de simetría.<br />

3.9. Profundidad por bandas<br />

La profundidad por bandas fue <strong>in</strong>troducida por López-P<strong>in</strong>tado y Romo [26].<br />

Cuantifica la centralidad a través de la probabilidad de pertenencia del punto<br />

a hipercubos con vértices aleatorios (o bandas, en coordenadas paralelas). Los<br />

vértices aleatorios se calculan mediante los máximos y los mínimos de cada<br />

coordenada para un conjunto de s puntos, es decir,<br />

<br />

B (x1, . . . , xs) = y ∈ R d : mín<br />

1≤i≤s xk)<br />

i ≤ yk) ≤ máx<br />

1≤i≤s xk)<br />

<br />

i para 1 ≤ k ≤ d ,<br />

donde x k)<br />

i e yk) son las k-ésimas coordenadas de xi e y. La profundidad por bandas<br />

de un punto x con respecto a una distribución P para bandas determ<strong>in</strong>adas<br />

por hasta S ≥ 2 puntos, se def<strong>in</strong>e como<br />

BD (x; P ) =<br />

S<br />

Pr {x ∈ B (X1, X2, . . . , Xs)} . (3.5)<br />

s=2<br />

La profundidad por bandas satisface las propiedades D2 y D3. Bajo ciertas<br />

condiciones extra satisface además D4 y que, para distribuciones angularmente<br />

simétricas, alcanza su máximo en el centro. Su pr<strong>in</strong>cipal ventaja es su tiempo<br />

de cómputo en problemas de elevada dimensión. S<strong>in</strong> embargo, si la dimensión<br />

del espacio es elevada y no se dispone de tamaños muestrales grandes, es posible<br />

que las profundidades muestrales sean muy próximas a cero y sólo presenten<br />

pequeñas variaciones para los dist<strong>in</strong>tos puntos de la muestra. La profundidad

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!