Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
2.6. A modo de resumen: “Box-plots”<br />
Ofrecemos en este epígrafe una forma gráfica y conveniente de resumir gran parte<br />
de la información suministrada por los estadísticos descriptivos que hemos descrito en esta<br />
sección, los denominados diagramas de caja o box-plots que proporcionan una forma<br />
rápida de examinar los datos.<br />
Un box-plot no es más que una representación plana de algunas de las<br />
características más sobresalientes de un conjunto de datos. Proporciona información que<br />
está a medio camino entre los estadísticos descriptivos y una representación de un<br />
histograma, su principal ventaja es que dado que es una representación plana pueden<br />
observarse simultáneamente varios box-plots en un mismo gráfico lo que permite el estudio<br />
dinámico de la evolución de algunas características importantes de la distribución de la<br />
variable en cuestión, por ejemplo existencia, aparición o desaparición de outliers,<br />
dispersión o concentración de los datos, así como la simetría o asimetría de la distribución.<br />
De hecho una de las utilidades básicas de los box-plots es el análisis gráfico de outliers.<br />
A continuación describimos un box-plot estándar, que adopta la definición de<br />
outliers basada en el rango inter-cuartílico y examinada en el epígrafe 2.4, existen otros<br />
tipos de box-plots más completos o que adoptan otra definición de las observaciones<br />
atípicas pero no serán mencionados en este trabajo (Tukey (1977), McGill, Tukey y Larsen<br />
(1978), Velleman y Hoaglin (1981), Mills (1990, Cap.-3, Sec.-3.4), Cleveland (1993),<br />
Everitt (1994)).<br />
Un box-plot, con todos sus elementos, puede examinarse en el gráfico 4. El eje<br />
horizontal carece de sentido y simplemente representa cada variable en cuestión, mientras<br />
que el eje vertical representa la escala de la variable. El cuadrado o caja, box, representa el<br />
rango inter-cuartílico, el cuartíl 0.75, ξ .75<br />
, constituye la parte superior y el cuartíl 0.25,<br />
ξ .25<br />
, constituye la parte inferior del cuadrado. Por construcción dentro del box está<br />
contenido el 50% de la masa de probabilidad de la distribución. La altura del box<br />
representa, por tanto, el rango inter-cuartílico, que como ya hemos indicado constituye<br />
una medida de dispersión habitual. Un rango inter-cuartílico mayor se visualizará mediante<br />
un box de mayor altura indicando que el 50% de la densidad de x está relativamente<br />
42