17.04.2015 Views

Distribuciones muestrales - Edu-esta.org

Distribuciones muestrales - Edu-esta.org

Distribuciones muestrales - Edu-esta.org

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

7. <strong>Distribuciones</strong> <strong>muestrales</strong><br />

7.1 Introducción<br />

Una <strong>esta</strong>dística es cualquier función real de variables aleatorias observables en una muestra y<br />

constantes conocidas.<br />

7.2.1 Distribución Normal<br />

p. 353 - 355. Estudia cuidadosamente el Teorema 7.1 y Ejemplos 7.2, 7.3. Ven preparado para<br />

presentarlos en clase. Usa R para calcular las probabilidades indicadas.<br />

Teorema 7.1.<br />

Sea X₁, X₂, …, X n una muestra aleatoria de tamaño n de una distribución normal con media μ y varianza<br />

σ², entonces ̅ ∑ tiene una distribución normal con media μ y varianza σ²/n. Bajo <strong>esta</strong>s<br />

X <br />

condiciones, Z tiene una distribución normal estándar.<br />

<br />

<br />

n <br />

Ejemplo 7.2 Intervalo de probabilidad<br />

Una máquina está calibrada parta echar un promedio de μ onzas en cada botella. La desviación<br />

estándar de la cantidad echada es σ = 1.0 onza. Se toma una muestra de n = 9 botellas llenas y se mide<br />

la cantidad que contienen. Encuentra la probabilidad de que la media muestral difiera por 0.3 onzas o<br />

menos de la media poblacional μ.<br />

P(| X | 0.3) pnorm(0.9) pnorm( 0.9) 0.6318.<br />

(Estandariza para resolver) ▪<br />

Ejemplo 7.2b Calibra la máquina<br />

La máquina del ejemplo anterior debe ser calibrada a una cantidad promedio μ 0 de manera que el 95%<br />

de las botellas contenga 12 onzas o más. Encuentra el valor de μ 0 .<br />

PX ( 12) 0.95 (Estandariza para obtener μ 0 = 12 + qnorm(.95) = 13.645. onzas) ▪<br />

Ejemplo 7.3 Número de observaciones<br />

¿Cuántas observaciones debe tomarse si la media muestral debe tener una diferencia menor o igual a<br />

0.3 onzas de la media poblacional μ con probabilidad 0.95?<br />

P(| X | 0.3) 0.95<br />

<br />

X 0.3 0.3 <br />

P P Z 0.975,<br />

<br />

<br />

<br />

<br />

n n<br />

<br />

<br />

n <br />

0.3 1.96<br />

de donde qnorm(0.975) 1.96; n 6.533, por lo tanto, n 42.68444 43.<br />

1<br />

<br />

▪<br />

0.3<br />

n<br />

Notas sobre el tamaño de muestra n<br />

1. El tamaño de muestra depende de la probabilidad (confiabilidad) del intervalo.<br />

2. El tamaño de muestra depende de la variabilidad de la población σ.<br />

3. El tamaño de muestra depende del ancho del intervalo deseado (margen de error).


density<br />

0.00 0.05 0.10 0.15 0.20 0.25<br />

7. <strong>Distribuciones</strong> <strong>muestrales</strong> p. 2<br />

PJ Rodríguez Esquerdo<br />

4. El tamaño de muestra NO depende del tamaño de la población (a menos que la población sea<br />

pequeña).<br />

7.2.2 Distribución Ji-cuadrado<br />

p. 355 - 359. Estudia cuidadosamente los Teoremas 7.2 y 7.3, los ejemplos 7.4 y 7.5. Usa R para calcular<br />

las probabilidades indicadas. Estudia el documento en nuestra página sobre la independencia de la<br />

media y la varianza muestral, también en Mendenhall.<br />

Si Z tiene distribución normal estándar, entonces Z² tiene una distribución gamma con parámetros<br />

α = ½, β = 2, también conocida como la distribución Ji cuadrado con un grado de libertad. Esto se<br />

demuestra por medio del método de funciones de distribución para encontrar la función de densidad a<br />

partir de F( a ) = P( Z² ≤ a ). Su función de densidad, con n grados de libertad es<br />

( n 2) 1 y<br />

2<br />

y e<br />

f ( y) , y 0.<br />

<br />

n 2<br />

2 n 2<br />

Su función generatriz de momentos está dada por:<br />

n<br />

2<br />

f ( t) (1 2 t) , t 1 2.<br />

<br />

Comparison of Chi Square densities<br />

df = 4<br />

df = 10<br />

df = 20<br />

0 5 10 15 20<br />

x<br />

La figura arriba muestra la gráfica 1 de la distribución Ji-cuadrado para 4, 10, y 20 grados de libertad.<br />

Tarea<br />

Instala R Commander, disponible en http://www.rcommander.com/.<br />

1 x


7. <strong>Distribuciones</strong> <strong>muestrales</strong> p. 3<br />

PJ Rodríguez Esquerdo<br />

Teorema 7.2.<br />

Sea X₁, X₂, …, X n una muestra aleatoria de tamaño n de una distribución normal con media μ y varianza<br />

σ². Sea Z i = (X i – μ)/σ para i = 1,.2, …, n, entonces ∑ tiene una distribución Ji cuadrado con n grados<br />

de libertad.<br />

Prueba<br />

Usa la independencia de X₁, X₂, …, X n y la función generatriz de momentos. ▪<br />

Ejemplo 7.4<br />

Si Z₁, Z₂, …, Z 6 es una muestra aleatoria de una distribución normal estándar, el número b tal que<br />

( ∑ ) ( ) Por otro lado, la distribución Ji<br />

cuadrado no es simétrica:<br />

( ∑ ) ( )<br />

( ∑ ) ( )<br />

Si X es una variable aleatoria con distribución Ji cuadrado con n grados de libertad y 0 ≤ α ≤ 1, el ejemplo<br />

anterior muestra cómo encontrar fácilmente el valor x α tal que P( X ≤ x α ) = α.<br />

Teorema 7.3<br />

Sea X₁, X₂, …, X n una muestra aleatoria de tamaño n de una distribución normal con media μ y varianza<br />

σ². Entonces<br />

2<br />

n<br />

( n1) S 1<br />

<br />

2 2<br />

i 1<br />

( X X)<br />

Tiene un distribución Ji cuadrado con n – 1 grados de libertad. Las variables aleatorias X y S² son<br />

independientes.<br />

Prueba<br />

Examina el libro de texto para el caso n = 2 (p. 383). Una excelente demostración está disponible en el<br />

texto de DeGroot y en http://www.edu-<strong>esta</strong>.<strong>org</strong>/materiales/probabilidad/indep-media-var.pdf. ▪<br />

Ejemplo 7.5<br />

En el Ejemplo 7.2, dados el tamaño de la muestra, la varianza poblacional σ² = 1 y el margen de error, se<br />

encontró la probabilidad de que la media muestral estuviese a menos de 0.3 unidades de la media<br />

poblacional. Ahora se desea obtener un intervalo [a, b] que contenga el valor de S², con probabilidad<br />

0.90, P( a ≤ S² ≤ b) = 0.90.<br />

1 1 2<br />

1<br />

<br />

2<br />

n a n S n b <br />

P<br />

a S b P<br />

<br />

<br />

2 2 2<br />

<br />

<br />

<br />

( n 1) a qchisq(0.05, n 1) y ( n 1) b qchisq(0.95, n 1)<br />

a 0.369, b1.880<br />

En <strong>esta</strong> solución se sustituyó σ² = 1, n = 10 y se usó R para el cómputo. En general hay un número<br />

infinito de intervalos posibles, en este caso especial, las probabilidades de las colas es la misma, 0.05.<br />

Pudo haberse seleccionado cualesquier probabilidades α, β para las colas de manera que α + β = 0.10. ▪<br />

i<br />

2


7. <strong>Distribuciones</strong> <strong>muestrales</strong> p. 4<br />

PJ Rodríguez Esquerdo<br />

7.2.3 Distribución t de Student<br />

Student´s t (razón de normal y ji cuadrado): p. 359 - 361. Estudia la definición 7.2, el ejemplo 7.6 y la<br />

derivación de la función de densidad de la distribución t. Usa R para calcular las probabilidades<br />

indicadas.<br />

La sección 7.2.1 discutió el caso de la distribución de la media muestral cuando el valor de la varianza<br />

poblacional σ² es conocida. Esta sección estudia el caso de la distribución de ese estimador cuando el<br />

valor de σ² es desconocido.<br />

Bajo las condiciones del Teorema 7.1<br />

X <br />

Z <br />

<br />

<br />

<br />

n <br />

X <br />

tiene una distribución normal estándar. Al<br />

2<br />

<br />

n<br />

X <br />

cambiar la condición de que la varianza sea conocida, es necesario estimarla, obteniéndose t ,<br />

2<br />

S n<br />

que ya no tiene una distribución normal, al ser la razón de dos variables aleatorias independientes,<br />

y S². La variable √ , la desviación estándar de la media muestral, se conoce como el error<br />

estándar.<br />

Definición<br />

Sea Z una variable aleatoria normal estándar y sea W una variable aleatoria con distribución Ji-cuadrado<br />

con v grados de libertad. Si Z y W son independientes, decimos que la variable aleatoria<br />

√ ⁄ tiene<br />

una distribución Student´s t con v grados de libertad.<br />

v<br />

1<br />

v1<br />

<br />

<br />

<br />

2<br />

La función de densidad 2 2 x <br />

2 <br />

de <strong>esta</strong> distribución es g( x) <br />

<br />

1<br />

12 <br />

v<br />

v<br />

2<br />

v <br />

para x .<br />

La mediana y moda de una variable aleatoria con <strong>esta</strong> distribución es 0, su media también es cero<br />

cuando v > 1 y su varianza es ⁄ ( )<br />

para v > 2. En el caso en que v = 1, se le conoce como la<br />

distribución de Cauchy, con densidad ( ) [ ( )] . La distribución t es simétrica alrededor de<br />

cero converge a la distribución normal estándar cuando el número de grados de libertad crece hacia<br />

infinito. La siguiente Figura muestra la gráfica 3 de la distribución t para v = 1, 2, 4, y 10 grados de<br />

libertad, también las compara con la normal estándar.<br />

2 Véase http://www.edu-<strong>esta</strong>.<strong>org</strong>/materiales/probabilidad/distribucion_t.pdf para su derivación. La página<br />

Student's t-distribution http://en.wikipedia.<strong>org</strong>/wiki/Student%27s_t-distribution tiene un resumen de sus<br />

propiedades.<br />

3 x


7. <strong>Distribuciones</strong> <strong>muestrales</strong> p. 5<br />

PJ Rodríguez Esquerdo<br />

En particular, si X₁, X₂, …, X n es una muestra aleatoria de tamaño n de una distribución normal con media<br />

2<br />

X <br />

( n1)<br />

S<br />

μ y varianza σ², entonces Z tiene una normal estándar y W tiene una distribución<br />

<br />

2<br />

<br />

<br />

n <br />

Ji-cuadrado con n – 1 grados de libertad. Al aplicar la definición de la distribución t se obtiene que<br />

X <br />

<br />

<br />

<br />

n X X X<br />

t<br />

<br />

<br />

<br />

n<br />

2 2<br />

( n 1) S S S<br />

es una variable aleatoria t con n-1 grados de libertad.<br />

S <br />

2<br />

n n<br />

<br />

( n 1)<br />

Ejemplo 7.6<br />

Se toman seis observaciones independientes de una distribución normal con media y varianza<br />

desconocidos. Se desea encontrar la probabilidad de que a una distancia de no más de dos errores<br />

estándar de la media verdadera, en otras palabras, usando R<br />

<br />

<br />

<br />

<br />

2S 2S X <br />

P X P <br />

2 2 <br />

pt(2,5) - pt(-2,5) 0.8980605.<br />

n<br />

n S <br />

<br />

n <br />

▪<br />

7. 2.4 Distribución F de Fisher<br />

F de Fisher (razón de dos varianzas): p. 361 -364. Estudia la definición 7.3 y Ejemplo 7.7. Usa R para<br />

calcular las probabilidades indicadas.<br />

lines( x, tdens10, col=5)<br />

legend( x=2.5, y=.4, lty = c(1,1,1,1,1), col = c(1,2,3,4,5),legend = c("normal(0,1)", "df = 1", "df = 2", "df = 4", "df = 10"))


7. <strong>Distribuciones</strong> <strong>muestrales</strong> p. 6<br />

PJ Rodríguez Esquerdo<br />

En muchas ocasiones se desea comparar las varianzas desconocidas de dos poblaciones independientes.<br />

para ello se toman muestras independientes X₁, X₂, …, X n , y Y₁, Y₂, …, Y m una de tamaño n y m<br />

respectivamente. Se toma la razón de las varianzas de esas muestras S x ² / S y ² para obtener una idea de<br />

las magnitudes relativas. Como S x ² estima a σ x ² la razón S x ²/σ x ² debe <strong>esta</strong>r distribuida alrededor de 1. Lo<br />

mismo ocurre para S y ²/σ y ². De similar manera, S x ²/σ x ² ÷ S y ²/σ y ² también debe <strong>esta</strong>r distribuida alrededor<br />

de 1.<br />

Definición<br />

Sean V y W dos variables aleatorias independientes con distribución Ji cuadrado con v y w grados de<br />

libertad respectivamente. La distribución de la variable aleatoria<br />

distribución F de Fisher con v y w grados de libertad.<br />

La función de densidad de <strong>esta</strong> distribución es<br />

1 v 1 w 1<br />

2 2<br />

(1 )<br />

0<br />

v<br />

vw<br />

<br />

2 v 1<br />

v 2<br />

2<br />

1 v <br />

f ( x) x 1 x<br />

, x 0.<br />

t t dt w w <br />

<br />

⁄<br />

⁄<br />

se conoce como la<br />

Su media no depende de los grados de libertad del numerador, E( F ) = w/(w - 2) si w > 2. La siguiente<br />

figura muestra la gráfica 4 de la función de densidad para distintos combinaciones de grados de libertad.<br />

4 x


7. <strong>Distribuciones</strong> <strong>muestrales</strong> p. 7<br />

PJ Rodríguez Esquerdo<br />

Es conocido que<br />

2<br />

( v1) S x<br />

<br />

2<br />

x<br />

grados de libertad respectivamente. Por lo tanto<br />

distribución F con v y w grados de libertad.<br />

Ejemplo 7.7<br />

y<br />

2<br />

( w1) S y<br />

son independientes y tienen distribución Ji cuadrado con v y w<br />

<br />

2<br />

y<br />

V <br />

v<br />

( v 1) S / ( v 1)<br />

S<br />

F <br />

<br />

<br />

W ( w 1) S / ( w 1) S<br />

w <br />

<br />

2 2 2 2<br />

x x<br />

x<br />

<br />

x<br />

2 2<br />

2 2<br />

y<br />

<br />

y<br />

y<br />

<br />

y<br />

Se toman muestras independientes de tamaños n = 6 y m = 10 de dos distribuciones normales con igual<br />

varianza, entonces el valor de b en ( ) se obtiene usando R, b = qf(.95, 5, 9) = 3.4817. ▪<br />

tiene

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!