07.05.2013 Views

Data depth in Multivariate Statistics - European Mathematical Society

Data depth in Multivariate Statistics - European Mathematical Society

Data depth in Multivariate Statistics - European Mathematical Society

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>Data</strong> <strong>depth</strong> <strong>in</strong> <strong>Multivariate</strong> <strong>Statistics</strong>s 165<br />

<br />

<br />

(a) Mismos parámetros<br />

<br />

<br />

(b) Cambio de localización<br />

<br />

<br />

(c) Cambio de escala<br />

Figura 3: DD-plot para muestras de normales bivariantes.<br />

Figura 3: DD-plot para muestras de normales bivariantes.<br />

4.3. Análisis Discrim<strong>in</strong>ante<br />

El objetivo del análisis discrim<strong>in</strong>ante es la obtención de reglas de clasificación<br />

para la asignación de observaciones a grupos conocidos. En el contexto<br />

de la profundidad estadística podemos encontrar diversos trabajos centrados en<br />

su aplicación en problemas de clasificación. Así, Mosler y Hoberg [32], analizan<br />

el comportamiento de las profundidades del zonoide, la de Mahalanobis y<br />

una comb<strong>in</strong>ación suya para dist<strong>in</strong>tos conjuntos de datos bivariantes. La regla<br />

de clasificación que emplean consiste en asignar cada observación al grupo con<br />

respecto al cual tienen una mayor profundidad. Comparan los resultados obtenidos<br />

con varias reglas clásicas de clasificación obteniendo resultados de errores<br />

de clasificación muy similares a los de éstas.<br />

De un modo alternativo, Ghosh y Chauduri [14] emplean la profundidad semiespacial<br />

y la de la regresión (ver Secciones 4.5 y 5.2) para obtener reglas de<br />

clasificación no l<strong>in</strong>eales. El método que proponen consiste en proyectar los datos<br />

en espacios de dimensiones superiores, donde aplican reglas de clasificación<br />

l<strong>in</strong>eales construidas a partir de las profundidades. Al estar basadas en nociones<br />

de profundidad, las reglas de clasificación obtenidas no dependen de una distribución<br />

y presentan una mayor robustez que las reglas de clasificación l<strong>in</strong>eal y<br />

cuadrática clásicas.<br />

En último lugar, nos referiremos al trabajo de Li, Cuesta-Albertos y Liu [21],<br />

quienes proponen utilizar los DD-plots (ver Sección 4.2) en problemas de clasificación.<br />

Su método consiste básicamente en discrim<strong>in</strong>ar entre dos grupos a partir<br />

de la curva que mejor separa sus muestras en el DD-plot.<br />

4.4. Análisis de Conglomerados<br />

El análisis de conglomerados, o cluster<strong>in</strong>g, consiste en la búsqueda de agrupamientos<br />

que aparecen en un conjunto de datos, de tal forma que los <strong>in</strong>dividuos<br />

dentro del mismo grupo sean muy similares entre sí y dist<strong>in</strong>tos del resto. Existen<br />

varios algoritmos de cluster<strong>in</strong>g basados en la profundidad y aplicados a datos de<br />

alta dimensión. D<strong>in</strong>g y otros [10] diseñan un algoritmo que comb<strong>in</strong>a el cluster<strong>in</strong>g

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!