12.04.2014 Views

libro_GCZ2009

libro_GCZ2009

libro_GCZ2009

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

30 Medidas características de una distribución<br />

De la misma forma podemos definir los deciles como aquellos valores de la variable que dividen la muestra,<br />

ordenada, en 10 partes iguales. Estos valores, denotados por D k , con k =1, 2,...,9, tienen entonces un valor<br />

tal que el decil k–esimo deja por debajo de él al 10xk por ciento de los datos de la muestra. De la misma<br />

manera se definen los percentiles, también llamados centiles, como aquellos valores P k (con k =1, 2,...,99)<br />

que dividen la muestra en 100 partes iguales. Es decir el percentil P k deja por debajo de él al k por ciento<br />

de la muestra ordenada.<br />

La forma de calcular deciles y percentiles es igual a la de la mediana y los cuartiles, sustituyendo N/2 por<br />

la fracción del número total de datos correspondiente. Evidentemente algunos valores de cuartiles, deciles y<br />

centiles coinciden, cumpliéndose por ejemplo<br />

P 50 = D 5 = Q 1/2 = M e<br />

3.2. Medidas de dispersión<br />

Las medidas de centralización vistas anteriormente reducen la información recogida de la muestra a un<br />

solo valor. Sin embargo, dicho valor central, o medio, será más o menos representativo de los valores de la<br />

muestra dependiendo de la dispersión que las medidas individuales tengan respecto a dicho centro. Para<br />

analizar la representatividad de las medidas de centralización se definen las llamadas medidas de dispersión.<br />

Estas nos indicarán la variabilidad de los datos en torno a su valor promedio, es decir si se encuentran muy o<br />

poco esparcidos en torno a su centro. Se pueden definir entonces, diversas medidas de desviación o dispersión,<br />

siendo éstas fundamentales para la descripción estadística de la muestra.<br />

3.2.1. Recorridos<br />

Una evaluación rápida de la dispersión de los datos se puede realizar calculando el recorrido (también<br />

llamado rango), o diferencia entre el valor máximo y mínimo que toma la variable estadística. Con el fin de<br />

eliminar la excesiva influencia de los valores extremos en el recorrido, se define el recorrido intercuartílico<br />

como la diferencia entre el trecer y primer cuartil<br />

R I = Q 3/4 − Q 1/4 . (3.11)<br />

Está claro que este recorrido nos dará entonces el rango que ocupan el 50 % central de los datos. En ocasiones<br />

se utiliza el recorrido semiintercuartílico, o mitad del recorrido intercuartílico<br />

R SI = Q 3/4 − Q 1/4<br />

.<br />

2<br />

3.2.2. Desviación media<br />

Otra manera de estimar la dispersión de los valores de la muestra es comparar cada uno de estos con<br />

el valor de una medida de centralización. Una de las medidas de dispersión más usada es la desviación<br />

media, también llamada con más precisión desviación media respecto a la media aritmética. Se define ésta<br />

como la media aritmética de las diferencias absolutas entre los valores de la variable y la media aritmética<br />

de la muestra. Suponiendo que en una muestra de tamaño N los k distintos valores x i de la variable tengan<br />

Estadística Básica para Estudiantes de Ciencias Febrero 2009

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!