03.06.2016 Aufrufe

Descargar PDF - Ivie

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

2.6. A modo de resumen: “Box-plots”<br />

Ofrecemos en este epígrafe una forma gráfica y conveniente de resumir gran parte<br />

de la información suministrada por los estadísticos descriptivos que hemos descrito en esta<br />

sección, los denominados diagramas de caja o box-plots que proporcionan una forma<br />

rápida de examinar los datos.<br />

Un box-plot no es más que una representación plana de algunas de las<br />

características más sobresalientes de un conjunto de datos. Proporciona información que<br />

está a medio camino entre los estadísticos descriptivos y una representación de un<br />

histograma, su principal ventaja es que dado que es una representación plana pueden<br />

observarse simultáneamente varios box-plots en un mismo gráfico lo que permite el estudio<br />

dinámico de la evolución de algunas características importantes de la distribución de la<br />

variable en cuestión, por ejemplo existencia, aparición o desaparición de outliers,<br />

dispersión o concentración de los datos, así como la simetría o asimetría de la distribución.<br />

De hecho una de las utilidades básicas de los box-plots es el análisis gráfico de outliers.<br />

A continuación describimos un box-plot estándar, que adopta la definición de<br />

outliers basada en el rango inter-cuartílico y examinada en el epígrafe 2.4, existen otros<br />

tipos de box-plots más completos o que adoptan otra definición de las observaciones<br />

atípicas pero no serán mencionados en este trabajo (Tukey (1977), McGill, Tukey y Larsen<br />

(1978), Velleman y Hoaglin (1981), Mills (1990, Cap.-3, Sec.-3.4), Cleveland (1993),<br />

Everitt (1994)).<br />

Un box-plot, con todos sus elementos, puede examinarse en el gráfico 4. El eje<br />

horizontal carece de sentido y simplemente representa cada variable en cuestión, mientras<br />

que el eje vertical representa la escala de la variable. El cuadrado o caja, box, representa el<br />

rango inter-cuartílico, el cuartíl 0.75, ξ .75<br />

, constituye la parte superior y el cuartíl 0.25,<br />

ξ .25<br />

, constituye la parte inferior del cuadrado. Por construcción dentro del box está<br />

contenido el 50% de la masa de probabilidad de la distribución. La altura del box<br />

representa, por tanto, el rango inter-cuartílico, que como ya hemos indicado constituye<br />

una medida de dispersión habitual. Un rango inter-cuartílico mayor se visualizará mediante<br />

un box de mayor altura indicando que el 50% de la densidad de x está relativamente<br />

42

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!