Data depth in Multivariate Statistics - European Mathematical Society
Data depth in Multivariate Statistics - European Mathematical Society
Data depth in Multivariate Statistics - European Mathematical Society
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
<strong>Data</strong> <strong>depth</strong> <strong>in</strong> <strong>Multivariate</strong> <strong>Statistics</strong>s 165<br />
<br />
<br />
(a) Mismos parámetros<br />
<br />
<br />
(b) Cambio de localización<br />
<br />
<br />
(c) Cambio de escala<br />
Figura 3: DD-plot para muestras de normales bivariantes.<br />
Figura 3: DD-plot para muestras de normales bivariantes.<br />
4.3. Análisis Discrim<strong>in</strong>ante<br />
El objetivo del análisis discrim<strong>in</strong>ante es la obtención de reglas de clasificación<br />
para la asignación de observaciones a grupos conocidos. En el contexto<br />
de la profundidad estadística podemos encontrar diversos trabajos centrados en<br />
su aplicación en problemas de clasificación. Así, Mosler y Hoberg [32], analizan<br />
el comportamiento de las profundidades del zonoide, la de Mahalanobis y<br />
una comb<strong>in</strong>ación suya para dist<strong>in</strong>tos conjuntos de datos bivariantes. La regla<br />
de clasificación que emplean consiste en asignar cada observación al grupo con<br />
respecto al cual tienen una mayor profundidad. Comparan los resultados obtenidos<br />
con varias reglas clásicas de clasificación obteniendo resultados de errores<br />
de clasificación muy similares a los de éstas.<br />
De un modo alternativo, Ghosh y Chauduri [14] emplean la profundidad semiespacial<br />
y la de la regresión (ver Secciones 4.5 y 5.2) para obtener reglas de<br />
clasificación no l<strong>in</strong>eales. El método que proponen consiste en proyectar los datos<br />
en espacios de dimensiones superiores, donde aplican reglas de clasificación<br />
l<strong>in</strong>eales construidas a partir de las profundidades. Al estar basadas en nociones<br />
de profundidad, las reglas de clasificación obtenidas no dependen de una distribución<br />
y presentan una mayor robustez que las reglas de clasificación l<strong>in</strong>eal y<br />
cuadrática clásicas.<br />
En último lugar, nos referiremos al trabajo de Li, Cuesta-Albertos y Liu [21],<br />
quienes proponen utilizar los DD-plots (ver Sección 4.2) en problemas de clasificación.<br />
Su método consiste básicamente en discrim<strong>in</strong>ar entre dos grupos a partir<br />
de la curva que mejor separa sus muestras en el DD-plot.<br />
4.4. Análisis de Conglomerados<br />
El análisis de conglomerados, o cluster<strong>in</strong>g, consiste en la búsqueda de agrupamientos<br />
que aparecen en un conjunto de datos, de tal forma que los <strong>in</strong>dividuos<br />
dentro del mismo grupo sean muy similares entre sí y dist<strong>in</strong>tos del resto. Existen<br />
varios algoritmos de cluster<strong>in</strong>g basados en la profundidad y aplicados a datos de<br />
alta dimensión. D<strong>in</strong>g y otros [10] diseñan un algoritmo que comb<strong>in</strong>a el cluster<strong>in</strong>g