16.01.2020 Views

Estadística. Serie Schaum- 4ta edición - Murray R. Spiegel.pdf (1)

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

98 CAPÍTULO 4 DESVIACIÓN ESTÁNDAR Y OTRAS MEDIDAS DE DISPERSIÓN

Cuando en una distribución de frecuencia se tienen datos agrupados y los intervalos de clase son de un mismo

tamaño c, se tiene d j = cu j , o X j = A + cu j y la fórmula (10) se trasforma en

s ¼ c

sffi

X K

j¼1

N

f j u 2 j

0

B

@

X K

j¼1

N

1

2

f j u j C

A

sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

P P fu

2 fu 2

qffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

¼ c

¼ c u 2 u 2

N N

(11)

Esta última fórmula proporciona un método muy sencillo para el cálculo de la desviación estándar y se recomienda su

uso para datos agrupados, siempre que los intervalos de clase sean de un mismo tamaño. A este método se le llama

método de compilación y es exactamente análogo al empleado en el capítulo 3 para calcular la media aritmética de

datos agrupados. (Ver problemas 4.16 a 4.19.)

PROPIEDADES DE LA DESVIACIÓN ESTÁNDAR

1. La desviación estándar se puede definir como

s ¼

sffi

X N

j¼1

ðX j aÞ 2

N

donde a es un promedio cualquiera además de la media aritmética. De todas las desviaciones estándar, la mínima

es aquella en la que a = X, debido a la propiedad 2 del capítulo 3. Esta propiedad es una razón importante para

definir la desviación estándar como se definió antes. En el problema 4.27 se presenta una demostración de esta

propiedad.

2. En las distribuciones normales (ver capítulo 7) se encuentra que (como se muestra en la figura 4.1):

a) 68.27% de los casos está comprendido entre X − s y X + s (es decir, una desviación estándar a cada lado de

la media).

b) 95.45% de los casos está comprendido entre X − 2s y X + 2s (es decir, dos desviaciones estándar a cada lado

de la media).

c) 99.73% de los casos está comprendido entre X − 3s y X + 3s (es decir, tres desviaciones estándar a cada lado

de la media).

En distribuciones moderadamente sesgadas, estos porcentajes se satisfacen de manera aproximada (ver problema

4.24).

3. Supóngase que dos conjuntos que constan de N 1 y N 2 números (o dos distribuciones de frecuencia con frecuencias

totales N 1 y N 2 ) tienen varianzas s 2 1 y s 2 2, respectivamente, y una misma media X. Entonces, la varianza combinada

o conjunta de los dos conjuntos (o de las dos distribuciones de frecuencia) está dada por

s 2 ¼ N 1s 2 1 þ N 2 s 2 2

N 1 þ N 2

(12)

Obsérvese que ésta es una media aritmética ponderada de las dos varianzas. Esta fórmula puede generalizarse a tres

o más conjuntos.

4. El teorema de Chebyshev establece que para k > 1, por lo menos (1 − (1/k 2 )) × 100% de la distribución de probabilidad

de cualquier variable está a no más de k desviaciones estándar de la media. En particular, para k = 2, por

lo menos (1 − (1/2 2 )) × 100% o bien 75% de los datos está en el intervalo ðx 2S, x þ 2SÞ; para k = 3, por lo

menos (1 − (1/3 2 )) × 100% u 89% de los datos está en el intervalo ðx 3S, x þ 3SÞ, y para k = 4, por lo menos

(1 − (1/4 2 )) × 100% o bien 93.75% de los datos está en el intervalo ðx 4S, x þ 4SÞ.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!