Data depth in Multivariate Statistics - European Mathematical Society
Data depth in Multivariate Statistics - European Mathematical Society
Data depth in Multivariate Statistics - European Mathematical Society
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
<strong>Data</strong> <strong>depth</strong> <strong>in</strong> <strong>Multivariate</strong> <strong>Statistics</strong>s 169<br />
5.1. Profundidad paramétrica - localización y escala<br />
Para cualquier tipo de parámetro de una distribución, un nonfit es un elemento<br />
del espacio paramétrico que no sirve como parámetro de una distribución<br />
dada. Mizera [29] construye un marco teórico a partir de la idea de que la profundidad<br />
de un parámetro respecto de una muestra es la menor proporción de<br />
observaciones que hay que elim<strong>in</strong>ar para que ese parámetro sea un nonfit. Así,<br />
puede demostrarse que la profundidad semiespacial es la menor fracción de observaciones<br />
que hay que elim<strong>in</strong>ar para que un punto quede fuera de la envolvente<br />
convexa de una muestra. En el caso de la profundidad semiespacial estamos considerando<br />
parámetros de localización y un punto es un nonfit como parámetro<br />
de localización si está fuera de la envolvente convexa de la muestra.<br />
Mizera y Müller [30] extienden la noción de profundidad a parámetros (bidimensionales)<br />
de localizacion y escala. Así, construyen una profundidad de localización<br />
y escala basada en modelos de distribución unidimensionales.<br />
5.2. Profundidad en regresión<br />
Rousseeuw y Ruts [35] extienden el concepto de profundidad al campo de la<br />
regresión l<strong>in</strong>eal simple. Es este contexto, def<strong>in</strong>en un nonfit como una recta de<br />
regresión cuyos residuos (ordenados) cambian de signo sólo una vez; o equivalentemente<br />
como una recta que podemos rotar sobre uno de sus puntos hasta<br />
que sea vertical s<strong>in</strong> tocar n<strong>in</strong>gún punto de la nube; o equivalentemente como<br />
una recta de regresión para la que la envolvente convexa de los predictores con<br />
residuo positivo no <strong>in</strong>terseque con la envolvente convexa de los predictores con<br />
residuo negativo. Puede comprobarse que esta noción de nonfit da lugar a la<br />
profundidad de regresión descrita en la expresion (4.1).<br />
5.3. Profundidad para datos funcionales<br />
En épocas recientes, el análisis de datos funcionales ha recibido mucha atención<br />
por parte de la comunidad estadística, ver Ramsay y Silverman [34]. Cada<br />
dato funcional se representa por una función real xi (t), donde t ∈ T es un<br />
<strong>in</strong>tervalo de números reales. La extensión de ciertos conceptos de profundidad<br />
estadística a este tipo de datos tiene por objetivo obtener técnicas más robustas,<br />
pero puede conllevar una dificultad notable, ya que pasamos de espacios<br />
de dimensión f<strong>in</strong>ita, a uno de dimensión <strong>in</strong>f<strong>in</strong>ita. Además, se pretende construir<br />
profundidades cuyo cómputo muestral pueda realizarse de manera eficiente.<br />
Fraiman y Muñiz [13] construyeron la primera noción de profundidad para<br />
datos funcionales: dados n procesos estocásticos idénticamente distribuidos con<br />
trayectorias cont<strong>in</strong>uas en el <strong>in</strong>tervalo [0, 1], X1 (·) , X2 (·) , . . . , Xn (·), y una profundidad<br />
univariante, Dn (x), se def<strong>in</strong>e la profundidad del proceso Xi (t) como<br />
1<br />
0 Dn (Xi (t)) dt. Es decir, como el promedio en t de las profundidades de Xi(t)<br />
respecto de la muestra univariante X1 (t) , X2 (t) , . . . , Xn (t). Otras nociones de<br />
produndidad para datos funcionales pueden encontrarse en [26], donde se con-