Distribuciones muestrales - Edu-esta.org
Distribuciones muestrales - Edu-esta.org
Distribuciones muestrales - Edu-esta.org
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
7. <strong>Distribuciones</strong> <strong>muestrales</strong><br />
7.1 Introducción<br />
Una <strong>esta</strong>dística es cualquier función real de variables aleatorias observables en una muestra y<br />
constantes conocidas.<br />
7.2.1 Distribución Normal<br />
p. 353 - 355. Estudia cuidadosamente el Teorema 7.1 y Ejemplos 7.2, 7.3. Ven preparado para<br />
presentarlos en clase. Usa R para calcular las probabilidades indicadas.<br />
Teorema 7.1.<br />
Sea X₁, X₂, …, X n una muestra aleatoria de tamaño n de una distribución normal con media μ y varianza<br />
σ², entonces ̅ ∑ tiene una distribución normal con media μ y varianza σ²/n. Bajo <strong>esta</strong>s<br />
X <br />
condiciones, Z tiene una distribución normal estándar.<br />
<br />
<br />
n <br />
Ejemplo 7.2 Intervalo de probabilidad<br />
Una máquina está calibrada parta echar un promedio de μ onzas en cada botella. La desviación<br />
estándar de la cantidad echada es σ = 1.0 onza. Se toma una muestra de n = 9 botellas llenas y se mide<br />
la cantidad que contienen. Encuentra la probabilidad de que la media muestral difiera por 0.3 onzas o<br />
menos de la media poblacional μ.<br />
P(| X | 0.3) pnorm(0.9) pnorm( 0.9) 0.6318.<br />
(Estandariza para resolver) ▪<br />
Ejemplo 7.2b Calibra la máquina<br />
La máquina del ejemplo anterior debe ser calibrada a una cantidad promedio μ 0 de manera que el 95%<br />
de las botellas contenga 12 onzas o más. Encuentra el valor de μ 0 .<br />
PX ( 12) 0.95 (Estandariza para obtener μ 0 = 12 + qnorm(.95) = 13.645. onzas) ▪<br />
Ejemplo 7.3 Número de observaciones<br />
¿Cuántas observaciones debe tomarse si la media muestral debe tener una diferencia menor o igual a<br />
0.3 onzas de la media poblacional μ con probabilidad 0.95?<br />
P(| X | 0.3) 0.95<br />
<br />
X 0.3 0.3 <br />
P P Z 0.975,<br />
<br />
<br />
<br />
<br />
n n<br />
<br />
<br />
n <br />
0.3 1.96<br />
de donde qnorm(0.975) 1.96; n 6.533, por lo tanto, n 42.68444 43.<br />
1<br />
<br />
▪<br />
0.3<br />
n<br />
Notas sobre el tamaño de muestra n<br />
1. El tamaño de muestra depende de la probabilidad (confiabilidad) del intervalo.<br />
2. El tamaño de muestra depende de la variabilidad de la población σ.<br />
3. El tamaño de muestra depende del ancho del intervalo deseado (margen de error).
density<br />
0.00 0.05 0.10 0.15 0.20 0.25<br />
7. <strong>Distribuciones</strong> <strong>muestrales</strong> p. 2<br />
PJ Rodríguez Esquerdo<br />
4. El tamaño de muestra NO depende del tamaño de la población (a menos que la población sea<br />
pequeña).<br />
7.2.2 Distribución Ji-cuadrado<br />
p. 355 - 359. Estudia cuidadosamente los Teoremas 7.2 y 7.3, los ejemplos 7.4 y 7.5. Usa R para calcular<br />
las probabilidades indicadas. Estudia el documento en nuestra página sobre la independencia de la<br />
media y la varianza muestral, también en Mendenhall.<br />
Si Z tiene distribución normal estándar, entonces Z² tiene una distribución gamma con parámetros<br />
α = ½, β = 2, también conocida como la distribución Ji cuadrado con un grado de libertad. Esto se<br />
demuestra por medio del método de funciones de distribución para encontrar la función de densidad a<br />
partir de F( a ) = P( Z² ≤ a ). Su función de densidad, con n grados de libertad es<br />
( n 2) 1 y<br />
2<br />
y e<br />
f ( y) , y 0.<br />
<br />
n 2<br />
2 n 2<br />
Su función generatriz de momentos está dada por:<br />
n<br />
2<br />
f ( t) (1 2 t) , t 1 2.<br />
<br />
Comparison of Chi Square densities<br />
df = 4<br />
df = 10<br />
df = 20<br />
0 5 10 15 20<br />
x<br />
La figura arriba muestra la gráfica 1 de la distribución Ji-cuadrado para 4, 10, y 20 grados de libertad.<br />
Tarea<br />
Instala R Commander, disponible en http://www.rcommander.com/.<br />
1 x
7. <strong>Distribuciones</strong> <strong>muestrales</strong> p. 3<br />
PJ Rodríguez Esquerdo<br />
Teorema 7.2.<br />
Sea X₁, X₂, …, X n una muestra aleatoria de tamaño n de una distribución normal con media μ y varianza<br />
σ². Sea Z i = (X i – μ)/σ para i = 1,.2, …, n, entonces ∑ tiene una distribución Ji cuadrado con n grados<br />
de libertad.<br />
Prueba<br />
Usa la independencia de X₁, X₂, …, X n y la función generatriz de momentos. ▪<br />
Ejemplo 7.4<br />
Si Z₁, Z₂, …, Z 6 es una muestra aleatoria de una distribución normal estándar, el número b tal que<br />
( ∑ ) ( ) Por otro lado, la distribución Ji<br />
cuadrado no es simétrica:<br />
( ∑ ) ( )<br />
( ∑ ) ( )<br />
Si X es una variable aleatoria con distribución Ji cuadrado con n grados de libertad y 0 ≤ α ≤ 1, el ejemplo<br />
anterior muestra cómo encontrar fácilmente el valor x α tal que P( X ≤ x α ) = α.<br />
Teorema 7.3<br />
Sea X₁, X₂, …, X n una muestra aleatoria de tamaño n de una distribución normal con media μ y varianza<br />
σ². Entonces<br />
2<br />
n<br />
( n1) S 1<br />
<br />
2 2<br />
i 1<br />
( X X)<br />
Tiene un distribución Ji cuadrado con n – 1 grados de libertad. Las variables aleatorias X y S² son<br />
independientes.<br />
Prueba<br />
Examina el libro de texto para el caso n = 2 (p. 383). Una excelente demostración está disponible en el<br />
texto de DeGroot y en http://www.edu-<strong>esta</strong>.<strong>org</strong>/materiales/probabilidad/indep-media-var.pdf. ▪<br />
Ejemplo 7.5<br />
En el Ejemplo 7.2, dados el tamaño de la muestra, la varianza poblacional σ² = 1 y el margen de error, se<br />
encontró la probabilidad de que la media muestral estuviese a menos de 0.3 unidades de la media<br />
poblacional. Ahora se desea obtener un intervalo [a, b] que contenga el valor de S², con probabilidad<br />
0.90, P( a ≤ S² ≤ b) = 0.90.<br />
1 1 2<br />
1<br />
<br />
2<br />
n a n S n b <br />
P<br />
a S b P<br />
<br />
<br />
2 2 2<br />
<br />
<br />
<br />
( n 1) a qchisq(0.05, n 1) y ( n 1) b qchisq(0.95, n 1)<br />
a 0.369, b1.880<br />
En <strong>esta</strong> solución se sustituyó σ² = 1, n = 10 y se usó R para el cómputo. En general hay un número<br />
infinito de intervalos posibles, en este caso especial, las probabilidades de las colas es la misma, 0.05.<br />
Pudo haberse seleccionado cualesquier probabilidades α, β para las colas de manera que α + β = 0.10. ▪<br />
i<br />
2
7. <strong>Distribuciones</strong> <strong>muestrales</strong> p. 4<br />
PJ Rodríguez Esquerdo<br />
7.2.3 Distribución t de Student<br />
Student´s t (razón de normal y ji cuadrado): p. 359 - 361. Estudia la definición 7.2, el ejemplo 7.6 y la<br />
derivación de la función de densidad de la distribución t. Usa R para calcular las probabilidades<br />
indicadas.<br />
La sección 7.2.1 discutió el caso de la distribución de la media muestral cuando el valor de la varianza<br />
poblacional σ² es conocida. Esta sección estudia el caso de la distribución de ese estimador cuando el<br />
valor de σ² es desconocido.<br />
Bajo las condiciones del Teorema 7.1<br />
X <br />
Z <br />
<br />
<br />
<br />
n <br />
X <br />
tiene una distribución normal estándar. Al<br />
2<br />
<br />
n<br />
X <br />
cambiar la condición de que la varianza sea conocida, es necesario estimarla, obteniéndose t ,<br />
2<br />
S n<br />
que ya no tiene una distribución normal, al ser la razón de dos variables aleatorias independientes,<br />
y S². La variable √ , la desviación estándar de la media muestral, se conoce como el error<br />
estándar.<br />
Definición<br />
Sea Z una variable aleatoria normal estándar y sea W una variable aleatoria con distribución Ji-cuadrado<br />
con v grados de libertad. Si Z y W son independientes, decimos que la variable aleatoria<br />
√ ⁄ tiene<br />
una distribución Student´s t con v grados de libertad.<br />
v<br />
1<br />
v1<br />
<br />
<br />
<br />
2<br />
La función de densidad 2 2 x <br />
2 <br />
de <strong>esta</strong> distribución es g( x) <br />
<br />
1<br />
12 <br />
v<br />
v<br />
2<br />
v <br />
para x .<br />
La mediana y moda de una variable aleatoria con <strong>esta</strong> distribución es 0, su media también es cero<br />
cuando v > 1 y su varianza es ⁄ ( )<br />
para v > 2. En el caso en que v = 1, se le conoce como la<br />
distribución de Cauchy, con densidad ( ) [ ( )] . La distribución t es simétrica alrededor de<br />
cero converge a la distribución normal estándar cuando el número de grados de libertad crece hacia<br />
infinito. La siguiente Figura muestra la gráfica 3 de la distribución t para v = 1, 2, 4, y 10 grados de<br />
libertad, también las compara con la normal estándar.<br />
2 Véase http://www.edu-<strong>esta</strong>.<strong>org</strong>/materiales/probabilidad/distribucion_t.pdf para su derivación. La página<br />
Student's t-distribution http://en.wikipedia.<strong>org</strong>/wiki/Student%27s_t-distribution tiene un resumen de sus<br />
propiedades.<br />
3 x
7. <strong>Distribuciones</strong> <strong>muestrales</strong> p. 5<br />
PJ Rodríguez Esquerdo<br />
En particular, si X₁, X₂, …, X n es una muestra aleatoria de tamaño n de una distribución normal con media<br />
2<br />
X <br />
( n1)<br />
S<br />
μ y varianza σ², entonces Z tiene una normal estándar y W tiene una distribución<br />
<br />
2<br />
<br />
<br />
n <br />
Ji-cuadrado con n – 1 grados de libertad. Al aplicar la definición de la distribución t se obtiene que<br />
X <br />
<br />
<br />
<br />
n X X X<br />
t<br />
<br />
<br />
<br />
n<br />
2 2<br />
( n 1) S S S<br />
es una variable aleatoria t con n-1 grados de libertad.<br />
S <br />
2<br />
n n<br />
<br />
( n 1)<br />
Ejemplo 7.6<br />
Se toman seis observaciones independientes de una distribución normal con media y varianza<br />
desconocidos. Se desea encontrar la probabilidad de que a una distancia de no más de dos errores<br />
estándar de la media verdadera, en otras palabras, usando R<br />
<br />
<br />
<br />
<br />
2S 2S X <br />
P X P <br />
2 2 <br />
pt(2,5) - pt(-2,5) 0.8980605.<br />
n<br />
n S <br />
<br />
n <br />
▪<br />
7. 2.4 Distribución F de Fisher<br />
F de Fisher (razón de dos varianzas): p. 361 -364. Estudia la definición 7.3 y Ejemplo 7.7. Usa R para<br />
calcular las probabilidades indicadas.<br />
lines( x, tdens10, col=5)<br />
legend( x=2.5, y=.4, lty = c(1,1,1,1,1), col = c(1,2,3,4,5),legend = c("normal(0,1)", "df = 1", "df = 2", "df = 4", "df = 10"))
7. <strong>Distribuciones</strong> <strong>muestrales</strong> p. 6<br />
PJ Rodríguez Esquerdo<br />
En muchas ocasiones se desea comparar las varianzas desconocidas de dos poblaciones independientes.<br />
para ello se toman muestras independientes X₁, X₂, …, X n , y Y₁, Y₂, …, Y m una de tamaño n y m<br />
respectivamente. Se toma la razón de las varianzas de esas muestras S x ² / S y ² para obtener una idea de<br />
las magnitudes relativas. Como S x ² estima a σ x ² la razón S x ²/σ x ² debe <strong>esta</strong>r distribuida alrededor de 1. Lo<br />
mismo ocurre para S y ²/σ y ². De similar manera, S x ²/σ x ² ÷ S y ²/σ y ² también debe <strong>esta</strong>r distribuida alrededor<br />
de 1.<br />
Definición<br />
Sean V y W dos variables aleatorias independientes con distribución Ji cuadrado con v y w grados de<br />
libertad respectivamente. La distribución de la variable aleatoria<br />
distribución F de Fisher con v y w grados de libertad.<br />
La función de densidad de <strong>esta</strong> distribución es<br />
1 v 1 w 1<br />
2 2<br />
(1 )<br />
0<br />
v<br />
vw<br />
<br />
2 v 1<br />
v 2<br />
2<br />
1 v <br />
f ( x) x 1 x<br />
, x 0.<br />
t t dt w w <br />
<br />
⁄<br />
⁄<br />
se conoce como la<br />
Su media no depende de los grados de libertad del numerador, E( F ) = w/(w - 2) si w > 2. La siguiente<br />
figura muestra la gráfica 4 de la función de densidad para distintos combinaciones de grados de libertad.<br />
4 x
7. <strong>Distribuciones</strong> <strong>muestrales</strong> p. 7<br />
PJ Rodríguez Esquerdo<br />
Es conocido que<br />
2<br />
( v1) S x<br />
<br />
2<br />
x<br />
grados de libertad respectivamente. Por lo tanto<br />
distribución F con v y w grados de libertad.<br />
Ejemplo 7.7<br />
y<br />
2<br />
( w1) S y<br />
son independientes y tienen distribución Ji cuadrado con v y w<br />
<br />
2<br />
y<br />
V <br />
v<br />
( v 1) S / ( v 1)<br />
S<br />
F <br />
<br />
<br />
W ( w 1) S / ( w 1) S<br />
w <br />
<br />
2 2 2 2<br />
x x<br />
x<br />
<br />
x<br />
2 2<br />
2 2<br />
y<br />
<br />
y<br />
y<br />
<br />
y<br />
Se toman muestras independientes de tamaños n = 6 y m = 10 de dos distribuciones normales con igual<br />
varianza, entonces el valor de b en ( ) se obtiene usando R, b = qf(.95, 5, 9) = 3.4817. ▪<br />
tiene