Data depth in Multivariate Statistics - European Mathematical Society

More documents

Recommendations

Info

168 I. Cascos, A. López and J. Romo • Valor en riesgo: V@Rα(X) = −qX(α) • Déficit esperado: ESα(X) = − 1 α α 0 qX(t)dt = − mín ZD α (PX) • Mínimo esperado: EM 1/n(X) = −E mín{X1, . . . , Xn} = − mín CD 1/n (PX) Si disponemos de una cartera con inversiones en diferentes divisas, podemos modelarla como un vector aleatorio X = (X1, . . . , Xd) donde cada componente representa un activo. Jouini, Meddeb y Touzi [15] construyeron la teoría básica para medidas de riesgo coherentes para vectores aleatorios que toman como valor un conjunto, es decir, el riesgo ρ(X) es un conjunto. Cascos y Molchanov [6] construyen una teoría general, en la que las medidas de riesgo toman valores en un cono ordenado y demuestran que si ese cono es el espacio euclídeo ddimensional, cualquier medida de riesgo coherente ρ(X) ∈ R d es marginalizada, es decir, ρ(X) = (ρ1(X1), . . . , ρd(Xd)), donde cada ρi es una medida de riesgo coherente unidimensional. Se establece, por tanto, la necesidad de un espacio más rico para evaluar riesgos, por ejemplo las familias de conjuntos propuestas en [15]. Los conjuntos de las carteras cuyo riesgo estamos dispuestos a asumir juegan un papel crucial en la teoría de los riesgos coherentes. En el contexto de las funciones de profundidad, podemos considerar aceptables todas aquellas carteras cuya región central (de cierto nivel) está contenida en un cono de aceptación igual o mayor que el primer cuadrante. Para que una región central nos permita cuantificar riesgos de manera coherente, debemos exigirle dos propiedades extra: R5 Monotonía: Si X ≤ Y c.s., entonces Dα (PX) ⊕ Rd + ⊆ Dα (PY ) ⊕ Rd + , donde ‘≤’ debe ser interpretado componente a componente y Rd + representa el primer cuadrante; R6 Subaditividad: D α (PX+Y ) ⊆ D α (PX) ⊕ D α (PY ) . Estas propiedades las satisfacen, por ejemplo, las regiones del zonoide y las de la envolvente convexa esperada 5. Extensiones de la profundidad Hasta ahora hemos identificado la profundidad con el grado de centralidad de un punto respecto de una distribución multivariante. Alternativamente, podemos pensar en ella como en el grado de idoneidad de un punto como parámetro de localización respecto de la distribución. Esto nos da pie a extender la profundidad a cualquier tipo de parámetro. También podemos extender la profundidad al campo infinito dimensional. Es decir, estudiar el grado de centralidad de una función concreta respecto de un proceso estocástico, o de un conjunto de funciones.
Data depth in Multivariate Statisticss 169 5.1. Profundidad paramétrica - localización y escala Para cualquier tipo de parámetro de una distribución, un nonfit es un elemento del espacio paramétrico que no sirve como parámetro de una distribución dada. Mizera [29] construye un marco teórico a partir de la idea de que la profundidad de un parámetro respecto de una muestra es la menor proporción de observaciones que hay que eliminar para que ese parámetro sea un nonfit. Así, puede demostrarse que la profundidad semiespacial es la menor fracción de observaciones que hay que eliminar para que un punto quede fuera de la envolvente convexa de una muestra. En el caso de la profundidad semiespacial estamos considerando parámetros de localización y un punto es un nonfit como parámetro de localización si está fuera de la envolvente convexa de la muestra. Mizera y Müller [30] extienden la noción de profundidad a parámetros (bidimensionales) de localizacion y escala. Así, construyen una profundidad de localización y escala basada en modelos de distribución unidimensionales. 5.2. Profundidad en regresión Rousseeuw y Ruts [35] extienden el concepto de profundidad al campo de la regresión lineal simple. Es este contexto, definen un nonfit como una recta de regresión cuyos residuos (ordenados) cambian de signo sólo una vez; o equivalentemente como una recta que podemos rotar sobre uno de sus puntos hasta que sea vertical sin tocar ningún punto de la nube; o equivalentemente como una recta de regresión para la que la envolvente convexa de los predictores con residuo positivo no interseque con la envolvente convexa de los predictores con residuo negativo. Puede comprobarse que esta noción de nonfit da lugar a la profundidad de regresión descrita en la expresion (4.1). 5.3. Profundidad para datos funcionales En épocas recientes, el análisis de datos funcionales ha recibido mucha atención por parte de la comunidad estadística, ver Ramsay y Silverman [34]. Cada dato funcional se representa por una función real xi (t), donde t ∈ T es un intervalo de números reales. La extensión de ciertos conceptos de profundidad estadística a este tipo de datos tiene por objetivo obtener técnicas más robustas, pero puede conllevar una dificultad notable, ya que pasamos de espacios de dimensión finita, a uno de dimensión infinita. Además, se pretende construir profundidades cuyo cómputo muestral pueda realizarse de manera eficiente. Fraiman y Muñiz [13] construyeron la primera noción de profundidad para datos funcionales: dados n procesos estocásticos idénticamente distribuidos con trayectorias continuas en el intervalo [0, 1], X1 (·) , X2 (·) , . . . , Xn (·), y una profundidad univariante, Dn (x), se define la profundidad del proceso Xi (t) como 1 0 Dn (Xi (t)) dt. Es decir, como el promedio en t de las profundidades de Xi(t) respecto de la muestra univariante X1 (t) , X2 (t) , . . . , Xn (t). Otras nociones de produndidad para datos funcionales pueden encontrarse en [26], donde se con-
Page 1 and 2: Boletín de Estadística e Investig
Page 3 and 4: Data depth in Multivariate Statisti
Page 17: Data depth in Multivariate Statisti

Data depth in Multivariate Statistics - European Mathematical Society

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?