07.05.2013 Views

Data depth in Multivariate Statistics - European Mathematical Society

Data depth in Multivariate Statistics - European Mathematical Society

Data depth in Multivariate Statistics - European Mathematical Society

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

156 I. Cascos, A. López and J. Romo<br />

Las regiones semiespaciales de nivel α están formadas por todos los puntos cuya<br />

profundidad (semiespacial) es, al menos, α. Podemos también caracterizarlas<br />

a partir de la <strong>in</strong>tersección de todos los semiespacios cerrados cuya probabilidad<br />

es mayor que 1 − α<br />

HD α (P ) = {H : H semiespacio cerrado, P (H) > 1 − α} .<br />

En el caso unidimensional consisten en el <strong>in</strong>tervalo que va desde el α-cuantil<br />

más pequeño q −<br />

X (α) = ínf{x : FX(x) ≥ α} hasta el mayor (1 − α)-cuantil<br />

qX(1 − α) = ínf{x : FX(x) > 1 − α}. Obviamente satisfacen las propiedades<br />

R0–R4 y R4’.<br />

Profundidad semiespacial aleatorizada Uno de los grandes <strong>in</strong>convenientes<br />

de la profundidad semiespacial, común a la mayoría de las profundidades, es la<br />

complejidad de su cómputo exacto en altas (y no tan altas) dimensiones. Rousseeuw<br />

y Struyf [37] proponen un algoritmo de complejidad O(n d−1 log n) para el<br />

cómputo exacto de la profundidad semiespacial en R d . Además, proponen que<br />

para su cómputo aproximado en dimensiones altas, en lugar del ínfimo de las probabilidades<br />

de todos los semiespacios con x en su frontera, ver (3.1), se tome el<br />

mínimo de las probabilidades de ciertos semiespacios que ellos describen. De un<br />

modo similar, pero más <strong>in</strong>genioso, Cuesta-Albertos y Nieto-Reyes [7] proponen<br />

aleatorizar la propia profundidad. De este modo, tienen en cuenta sólo una cantidad<br />

f<strong>in</strong>ita de semiespacios (direcciones) que son seleccionadas aleatoriamente<br />

con arreglo a una medida de probabilidad.<br />

3.2. Profundidad simplicial<br />

Liu [22] def<strong>in</strong>ió la profundidad simplicial como la probabilidad de que un<br />

punto esté en el símplex cuyos vértices son d + 1 observaciones <strong>in</strong>dependientes<br />

de una distribución P ,<br />

SD(x; P ) = Pr{x ∈ co{X1, X2, . . . , Xd+1}} , (3.2)<br />

donde ‘co’ representa la envolvente convexa y X1, X2, . . . , Xd+1 son las observaciones<br />

<strong>in</strong>dependientes de P .<br />

En el caso univariante y para distribuciones absolutamente cont<strong>in</strong>uas, obtenemos<br />

el doble del producto de la función de distribución por la función de<br />

supervivencia, SD(x; PX) = 2FX(x)(1 − FX(x)).<br />

Satisface las propiedades D1–D3 y para probabilidades absolutamente cont<strong>in</strong>uas<br />

y angularmente simétricas, la profundidad simplicial del punto de simetría<br />

angular es 2 −d . Este valor es el máximo alcanzable en cualquier distribución<br />

absolutamente cont<strong>in</strong>ua, ver Wagner y Welzl [41].<br />

La profunidad simplicial muestral se construye como un U-estadístico. Es la<br />

proporción de símplices que contienen al punto x dentro de todos aquellos cuyos

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!