Contraste de Hipótesis - E.T.S.I.T.G.C.

2. CONTRASTE DE HIPÓTESIS 

Contraste de hipótesis 

2.1. Introducción 

2.2. Contraste de una hipótesis estadística 

2.3. Test unilateral y bilateral 

2.4. Test relacionados con una sola media (varianza conocida) 

2.5. Relación con la estimación del intervalo de confianza 

2.6. Test sobre una sola media (varianza desconocida) 

2.7. Test sobre dos medias 

2.7.1. Varianzas conocidas 

2.7.2. Varianzas desconocidas 

2.8. Pruebas relacionadas con varianzas 

2.9. Test de Bondad de ajuste. Aplicaciones 

Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M. 

1

2.1. INTRODUCCIÓN 


2. CONTRASTE DE HIPOTESIS 

No siempre los problemas a los que se enfrenta el científico o el ingeniero, se 

refieren sólo a la estimación de un parámetro de la población, sino por el contrario, 

la formulación de un procedimiento de decisión basado en datos, que puede 

producir una conclusión acerca de algún sistema científico. Se postula o conjetura 

algo acerca de un sistema. La conjetura se puede exponer como una hipótesis 

estadística. Los procedimientos que conducen a la aceptación o rechazo de 

hipótesis estadísticas, comprenden un área muy importante de la inferencia 

estadística. 

Una hipótesis estadística es una afirmación o conjetura acerca de una o 

más poblaciones. Es importante remarcar que las hipótesis son proposiciones sobre 

la población en estudio, nunca sobre la muestra. 

Contrastar una hipótesis estadísticamente es tomar una decisión sobre si 

cierta propiedad de una población es compatible con lo observado en una muestra 

de dicha población. 

La técnica del contraste de hipótesis constituye una parte de la Inferencia 

Estadística que consiste en utilizar la información muestral para examinar la validez 

de afirmaciones realizadas sobre una característica poblacional. 

Nunca se sabe con absoluta certeza la verdad o falsedad de una hipótesis 

estadística, a no ser que se examine la población entera. Como esto no es práctico, 

se elige una muestra aleatoria de la población que se estudia, y se utilizan los datos 

que contiene dicha muestra para proporcionar evidencias que confirmen o no la 

hipótesis. 

La evidencia de la muestra que es inconsistente con la hipótesis planteada, 

lleva al rechazo de la misma; mientras que la evidencia que apoya a la hipótesis, 

conduce a su aceptación. 


2


Desde luego el diseño de un procedimiento de decisión, debe llevarse a cabo 

con la idea de probabilidad de una conclusión equivocada. Es decir, la 

aceptación de una hipótesis implica tan sólo que los datos de la muestra no 

proporcionan evidencia suficiente para rechazarla. El rechazo de la hipótesis implica 

que la evidencia de la muestra la refuta. 

Existen dos tipos de contrastes: 

Contrastes paramétricos si la hipótesis concierne a parámetros 

poblacionales tales como la media o la varianza. 

Contrastes no paramétricos son los que afectan a cualidades de la 

distribución, tales como la bondad o de ajuste, homogeneidad de poblaciones, 

independencia. 

2.2. CONTRASTE DE UNA HIPÓTESIS ESTADÍSTICA 

La estructura de la prueba de hipótesis (test de hipótesis) se formulará 

utilizando el término hipótesis nula. 

Llamamos hipótesis nula, H 0 , a la hipótesis que vamos a contrastar, H 0 

representa la hipótesis que mantendremos mientras los datos no nos indiquen su 

falsedad. 

El rechazo de Ho da como resultado la aceptación de una hipótesis 

alternativa, que se representa por H1. 

rechaza. 

Llamamos hipótesis alternativa, H 1, a la hipótesis que se aceptará si H 0 se 

Una hipótesis nula referente a un parámetro de la población, siempre será 

establecida en forma tal que especifique un valor exacto del parámetro; la hipótesis 

alternativa admite la posibilidad de varios valores. 


3


Las fases en un contraste de hipótesis son: 

1) Definir la hipótesis a contrastar que llamaremos H 0 . 

2) Definir una medida de discrepancia D que mida la diferencia entre los valores 

observados y los esperados (de acuerdo con H 0 ). 

3) Calcular D. Si la discrepancia D es muy grande, rechazaremos H 0 ; en caso 

contrario, aceptamos H 0 . 

Por tanto para realizar un contraste necesitamos una medida de discrepancia, 

y una ley para juzgar cuando las discrepancias son demasiado grandes. 

Al probar cualquier hipótesis estadística, se presentan cuatro posibles 

situaciones que determinan si la decisión es correcta o equivocada: 

La hipótesis nula, es verdadera o falsa y se acepta o se rechaza. No se 

comete error alguno si es verdadera y se acepta, o si es falsa y se rechaza. Sin 

embargo, se cometerá error si es verdadera y se rechaza o si es falsa y se acepta. 

REALIDAD 

Decimos que se comete un error de tipo I cuando H 0 es verdadera pero se 

rechaza, se comete un error de tipo II cuando H 0 es falsa pero se acepta. 

Para definir qué valores de las discrepancias son grandes fijamos un valor 

que denominaremos nivel de significación. El valor es la probabilidad de cometer 

un error de tipo I, y determina un valor d c de forma que: P 

DECISIÓN 

Se Acepta Se Rechaza 

H 0 Es Verdadera Decisión correcta Error de tipo I 

H 0 Es Falsa Error de tipo II Decisión correcta 

( D dc) 


4


P(error tipo I)=P(rechazar H 0 / H 0 es cierta) 

La probabilidad de cometer error tipo II, representado por , es imposible 

calcularla a no ser que tenga una hipótesis alternativa específica: 

P(error tipo II)=P(aceptar H 0 / H 0 es falsa) 

Al conjunto de reglas que lleva a aceptar o no una cierta hipótesis, es lo que 

se llama "un test o contraste de hipótesis". 

La potencia del contraste es la probabilidad de rechazar H 0 , dada una 

alternativa específica verdadera: 

1 Potencia=P(rechazar H 0 / H 0 es falsa) 

Un test muy potente es altamente capaz de detectar la falsedad de los datos. 

Uno poco potente no detecta la falsedad de los datos. 

En general, a todo número que, obtenido a partir de las observaciones de una 

muestra, sirve para decidirse por H0 ó H 1, 

se llama estadístico de contraste. 

Pero para realizar un test de hipótesis, el investigador no sólo debe fijar H 0 y 

H 1, 

y el estadístico de contraste, sino que también habrá de decidir de antemano el 

valor del error que está dispuesto a aceptar. 

La figura siguiente muestra gráficamente este método. Si la discrepancia 

observada D cae dentro de la región de rechazo (probabilidad de rechazar y ser 

verdadera), rechazamos la hipótesis H0, en caso contrario la aceptaremos. 


5


Definimos la región de rechazo o región crítica por D dces el conjunto de 

valores del estadístico de 

contraste que lleva a la 

decisión de rechazar la 

hipótesis nula H0 y la región de 

aceptación de H0 será D dc de . 

Consideraciones acerca 

1) Aceptar o rechazar la 

hipótesis H 0 puede depender 

del valor , siendo posible rechazar H 0 con = 0.05 y aceptar H 0 con = 0.04 

2) Dar sólo el resultado del test no indica el grado de discrepancia. Se acostumbra a 

utilizar niveles de significación del 0.05 ó 0.01. 

Si, por ejemplo se elige un nivel de significación del 0.05 entonces hay 

aproximadamente 5 ocasiones de cada 100 en que se rechazaría la hipótesis 

cuando debe ser aceptada. 

El nivel de significación () se fija a priori independientemente del estadístico. 

Un procedimiento para resolver estas consideraciones es utilizar el nivel 

crítico p de un test, en vez del nivel de significación (). 

Se define el nivel crítico o p valor como el mínimo nivel de significación para 

el que, con los datos de una muestra concreta, se tendría que rechazar H 0 . 

pP(D D n) 

. 

Es decir, la probabilidad de obtener una discrepancia mayor o igual que la 

observada en la muestra. De esta forma, el valor de p no se fija a priori, sino que se 

determina en función de la muestra. 


 

< 

> Aceptación d Rechazo 

c 

6


Como se evidencia en la figura siguiente, cuanto menor sea el valor crítico, 

menor es la probabilidad de existir discrepancia como la observada, y menor es la 

certidumbre de H0. 

Esto es; cuanto más cercano a cero sea su valor con mayor confianza se rechazará 

H0. Puesto que, pP(D D n) 

y Dn un valor fijo, si p es grande Dn es un valor 

pequeño, por tanto, para un valor fijo de 

H0, 

aceptar H 0 . 

En general, cuanto más próximo a 1 sea p con mayor evidencia se habrá de 

A título orientativo, 

Si p>0.25 no existe suficiente evidencia para rechazar H0. 

Si 0.01


Al error de la primera RC que rechaza H0, se le llama nivel crítico ó nivel 

mínimo de significación. 

Los valores fuera de la región de rechazo son los valores de la región de 

aceptación R(H0). Estas regiones de aceptación coinciden con los intervalos de 

confianza para los parámetros sobre los que se plantea el contraste con los niveles 

de confianza de 1- complemento de los de significación . 

2.3. TEST UNILATERAL Y BILATERAL 

Un test de cualquier hipótesis estadística, donde la alternativa es unilateral, 

tal como: H o : o 

H 1 : o 

ó bien 

H : 

H: 

0 0 

1 0 

recibe el nombre de test de una cola, ya que 

la región crítica cae en la cola derecha de la distribución del estadístico de prueba, o 

en la cola izquierda, respectivamente. 

Un test de cualquier hipótesis estadística donde la alternativa es bilateral, tal 

como: Ho : o recibe el nombre de test de dos colas, ya que la región crítica se 

H1 : o divide en dos partes, generalmente con iguales probabilidades en cada cola de la 

distribución del estadístico de prueba. 

Para probar hipótesis en las cuales el estadístico de prueba es discreto, 

puede escogerse la región crítica arbitrariamente y luego determinar su tamaño. Si 

es demasiado grande, puede reducirse haciendo un ajuste en el valor crítico. 

Un valor p es el nivel más bajo (de significación) en el cuál el valor observado 

del estadístico de prueba es significativo. 

Los procedimientos para el test de hipótesis, pueden resumirse, supuesto que 

la hipótesis es H o : o : 

1. Establecer la hipótesis nula H o de que o . 


8


2. Seleccionar una hipótesis alternativa apropiada H 1 de una de las alternativas 

o , o ó o . 

3. Elegir un nivel de significación y el tamaño de la muestra n. 

4. Seleccionar el estadístico de prueba apropiado, y establecer la región crítica 

(si la decisión se va a basar en un valor p, no es necesario establecer la 

región crítica). 

5. Calcular el valor del estadístico de prueba de los datos muestrales. 

6. Decidir: rechazar H o si el estadístico de prueba tiene un valor en la región 

crítica (o si el valor calculado de p es menor o igual que el nivel de 

significación deseado ); de otra forma, no rechazar H o . 

2.4. TEST RELACIONADOS CON UNA SÓLA MEDIA (VARIANZA CONOCIDA): 

Presentamos los test de hipótesis acerca de una sóla media de población. Se 

deben, en primer lugar, describir las suposiciones sobre las cuales se basa el 

experimento. El modelo para la situación fundamental se centra alrededor de un 

experimento X 1 , X 2 ,...,X n que representa una muestra aleatoria de una distribución 

con media y varianza 2 . Considérese primero la hipótesis: 

H o: o 

H 1 : o 

El estadístico de prueba apropiado deberá basarse en la variable aleatoria X 

.Ya sabemos, según el Teorema Central del Límite, que, al margen de la distribución 

de X, la v.a. tiene una distribución aproximadamente Normal con media y 

desviación típica 

X 

. Puede, entonces, determinarse una región crítica con base en 

n 

el promedio muestral calculado, X 

. Hasta este momento, habrá una región crítica de 

dos colas para la prueba. 

Conviene normalizar la v.a. X: Z 

X 

n . 


9


Se sabe que bajo H o ; es decir, si o , entonces X o 

n 


tiene una 

distribución N (0,1), y de aquí que la expresión p z 

2 X o n z 

 

 

1 puede 

 

2 

utilizarse para escribir una región crítica apropiada. Formalmente, la región crítica se 

crea para controlar , la probabilidad de error tipo I. 

Se necesita una señal de evidencia de dos colas para respaldar H 1 . Así, dado 

un valor calculado X , la prueba formal implica rechazar H si el estadístico de 

0 

prueba calculado: 

X 

Z z 

/ n 

 

2 

ó z z 2 . Si z 2 z z 2 no se rechaza H o . 

El rechazo de implica la aceptación de la hipótesis alternativa o . 

H o 

Con esta definición de la región crítica, existirá la probabilidad de rechazar 

H o (al caer en la región crítica) cuando, en realidad o . 

O bien, calculando el p-valor=2P(Z>z) y comparándolo con : 

p> se acepta la hipótesis nula, y por lo tanto o 

p< se rechaza la hipótesis nula, y por lo tanto o 

10

Estos son los valores críticos más usados: 


Grado de confianza Valor crítico z/2 

90% 0,10 1,645 

95% 0,05 1,96 

99% 0,01 2,575 

Las pruebas de hipótesis unilaterales acerca de la media, comprenden el 

mismo estadístico que el descrito para el caso bilateral. Aquí la región crítica es de 

una sóla cola de la distribución normal. 

Para H1 : o , el rechazo (región crítica) resulta cuando z z. Para H1 : o , la región crítica está dada por z z. 2.1 Ejemplo: 

Se supone que un topógrafo realiza como mínimo 42 mediciones diarias. Ante 

la duda se hace una comprobación observando las mediciones durante 10 días 

seleccionados al azar, observándose una media de 40. Suponiendo normalidad con 

varianza 16 en la distribución de las mediciones diarias con un nivel de significación 

de 0,05 la suposición inicial. Realizar el contraste para la media. 

Solución: 

Estamos ante un caso de contraste unilateral para la media de una población normal 

con varianza conocida. 

H 0 : 0 42 H: 42 1 0 

X 0 

Sabemos que: Z N(0,1) 

/ n 

El valor del estadístico Z bajo la hipótesis nula es: 

X 0 

40 42 

Z -1.581138830 

/ n 4/ 10 

Para =0,05 en la N(0,1) tenemos que: 

 

 

P Z z P Z z 0,05 z 1,64 

0,05 0,05 


11


Como el valor de nuestro estadístico Z bajo la hipótesis nula cae dentro de la región 

de aceptación (-1,64


Los intervalos de confianza tienen la ventaja frente a los contrastes de 

hipótesis de que siempre nos dan una idea de la zona en la que se va a encontrar el 

verdadero valor del parámetro poblacional, mientras que en el caso de los test, 

cuando se rechaza una hipótesis nula, no se conoce el valor del parámetro en 

cuestión. Todo lo que se sabe es que es más verosímil que el valor del parámetro 

sea mayor o menor que un valor concreto. 

2.6. TEST SOBRE UNA SÓLA MEDIA (VARIANZA DESCONOCIDA): 

La aplicación de la t de Student tanto en intervalos de confianza como en test 

de hipótesis, se desarrolla bajo las siguientes suposiciones: las v.a. X 1 ,...,X n 

representan una muestra aleatoria de una distribución con y 2 desconocidos. 

Entonces la v.a. 

X 

s n tiene una distribución t de Student con n-1 grados de libertad. 

La estructura de la prueba es idéntica que para el caso de conocida, con la 

salvedad de que el valor de 

en el estadístico de prueba se reemplaza por la 

estimación calculada s, y la distribución normal se reemplaza por una distribución t. 

Es decir, para la hipótesis bilateral: 

H o: o 

H 1 : o 

el rechazo de H o , con un nivel de significación , resulta cuando 

una estadística t calculada: t x o s n excede a ,n 1 

t ó es menor que t ,n1 2 

2 

O bien, calculando el p-valor=2P(tn-1>t) y comparándolo con : 

p> se acepta la hipótesis nula, y por lo tanto o 

p< se rechaza la hipótesis nula, y por lo tanto o 

Para H1 : o , el rechazo resulta cuando t t,n1. Para H1: o, la región crítica está dada por t t,n1. Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M. 

. 

13


Se conserva la equivalencia de la prueba t de Student de doble cola para una 

sola media, y el cálculo de un intervalo de confianza para , reemplazando por s. 

Para muestras pequeñas (n

Datos: 


S S 

I xt /2,n1 ,xt/2,n1 n n 

2 

n 5; x 998 ; S 19,6; 10.95; t0,025;4 2,776 

4.43 4.43 

I0.25 998 2.776 ,998 2.776 

992.48,1003.51 

5 5 

Obviamente se cumple que la media 1000 992.48,1003.51 2.7. TEST SOBRE DOS MEDIAS 

2.7.1. Varianzas conocidas 

 

Los test referidos a dos medias representan un conjunto de herramientas 

analíticas muy importantes para científicos e ingenieros. 

Dos muestras aleatorias independientes de tamaños n 1 y n 2 , 

respectivamente, se obtienen de dos poblaciones con medias y varianzas 

respectivas 1 , 2 y 1 2 ,2 2 . Se sabe que la v.a. Z X 1 X 2 

distribución N(0,1). 

12 2 2 

1 n1 2 n2 


 

1 2 

Si 1 2 , el estadístico anterior se reduce a: Z X 1 X 2 

1 n1 1 n2 tiene una 

 

Estos dos estadísticos sirven como base para el desarrollo de los 

procedimientos de prueba sobre dos medias. 

La hipótesis nula sobre dos medias puede escribirse: H o : 1 2 d o . 

La alternativa puede ser unilateral o bilateral. De nuevo, la distribución 

utilizada es la distribución del estadístico de prueba H o . Se calculan los valores 

x 1 y x 2 , y para 1 y 2 , el estadístico de prueba es: 

. 

15


z 

 

x x d 

1 2 0 

n 

n 

2 2 

1 1 2 2 

con una región crítica de dos colas en el caso de una alternativa de dos lados. Es decir, el 

rechazo de H o en favor de H 1 : 1 2 d o si z z 2 ó z z 2 . Las regiones críticas de 

una cola se utilizan en el caso de las alternativas unilaterales. 

2.3 Ejemplo 

90 teodolitos son llevados a reparar a dos talleres distintos. 50 de ellos al taller A 

donde los repararon en un tiempo medio de 150 días con una desviación típica de 30 días. Los 

40 restantes al taller B, siendo reparados en un tiempo medio de 160 días con una desviación 

típica de 25 días. Suponiendo que las varianzas son conocidas, ¿se puede considerar que el 

taller A es más adecuado que el B para conseguir una reparación más rápida? 

Solución: 

Queremos comparar las medias de dos poblaciones normales de varianzas conocidas. 

El estadístico de prueba es: 

x x 

 

 

n n 

A B 

2 2 

A B 

A B 

H : 

H: 

z 

0 A B 

1 A B 

 

sustituyendo los valores 


150 160 

1.72 

y 

2 2 

30 25 

 

50 40 

para a -1,72) 

=1-DISTR.NORM.ESTAND(-1,72) 0,95728378 > α 

Se acepta la hipótesis nula para cualquier valor de α

2.7.2. Varianzas desconocidas 


Lo más frecuente es que se desconozcan las varianzas. 

Si el científico está dispuesto a asumir que ambas distribuciones son normales, y que 

1 2 , puede utilizarse la prueba t combinada (prueba t de dos muestras). El estadístico 

de prueba es: 

t 

x1x2do sp 1 n1 1 n2 s 2 2 n2 1 

2 

2 s1 n1 1 

, siendo s p 

n1 n2 2 

 

Se incluye la distribución t y la hipótesis bilateral no se rechaza cuando: 

t 2 ,n 1 n 2 2 t t 2 ,n 1 n 2 2 

Las alternativas unilaterales sugieren regiones críticas unilaterales. 

2.4 Ejemplo: 

Se utilizan dos teodolitos para hacer ciertas determinaciones, pretendiendo averiguar si 

la media de los errores cometidos con uno y otro es idéntica para un nivel de significación del 

5%. Se hacen 20 determinaciones con el teodolito A y se obtiene una media 0,4 errores y una 

desviación típica de 0,2 y otras 20 determinaciones con el B obteniendo una media de 0,5 y 

una desviación de 0,3. Suponemos que las variables error son normales y con la misma 

varianza. Comparar los dos teodolitos. 

Solución: 

Queremos comparar las medias de dos poblaciones normales de varianzas desconocidas pero 

iguales y muestras pequeñas. 


H : 

H: 

0 A B 

1 A B 

xAxB 1 1 

S 

n n 

A B 

t 

 

,nAnB2 2 

siendo 


17

A B 


2 2 2 2 

2 (n A 1)S A (nB 1)SB 190.2 190.3 S 0.065 

con lo cual 

(n 1) (n 1) 19 19 

xAxB 0.40.5 1.24 

y para a=0.05, t0.025,38=2 

1 1 1 1 

S 0.065 

n n 20 20 

A B 

DERIVE: 

#1: NSOLVE(STUDENT(x, 38) = 0.975, x, Real) 

#2: x = 2.024394161 

EXCEL: 

=DISTR.T.INV(0,05;38) 2,02439415 

SPSS: 

IDF.T(0.975,38) 2.02 

Como 1.24 < 2 admitimos la hipótesis de igualdad de medias. 

Calculamos el p-valor = 2P(T>1,24) 

=DISTR.T(1,24;38;2) 0,22257815 > α 

2.8. PRUEBAS RELACIONADAS CON VARIANZAS 

Contemplamos primero el problema de probar la hipótesis nula H o de que la varianza 

poblacional 2 2 

es igual a un valor especificado o en contraposición a las alternativas 

usuales 2 o 2 , 2 o 2 ó 2 o 2 . El estadístico apropiado sobre el que se basa la decisión 

es el estadístico ji-cuadrado utilizado para determinar un intervalo de confianza para 2 . Por 

tanto, si suponemos que la distribución de la población que está siendo muestreada es normal, 

el valor ji-cuadrado para probar 2 2 

o está dado por: 

2 n1s2 2 o donde n es el tamaño de la muestra, s 2 2 2 

es la varianza muestral y o es el valor de dado 

por la hipótesis nula. Si H o es verdadera, 2 es un valor de la distribución ji-cuadrado con n - 

1 grados de libertad. De aquí que, para una prueba de dos colas con un nivel de significación 

2 

, la región crítica es y 

1 

/2 

. 

2 

/2 

 

2 2 

O bien, calculando el p-valor = 2 mín P n1,P n1 y comparándolo con a: 


18


p>a se acepta la hipótesis nula, y por lo tanto 2 o 2 

p


siendo 13,5 menor que 14,57 RECHAZAMOS la hipótesis nula de que la varianza del grosor 

de los filamentos es 4 milímetros. 

EXCEL: = PRUEBA.CHI.INV(0,025;27) 43,19 


SPSS: IDF.CHISQ(0.975,27) 43,19 

SPSS: IDF.CHISQ(0.025,27) 

Calculamos el p-valor 

14,75 

=2*(1-DISTR.CHI(13,5;27) 0,02865106 < 0,05 = α 

Al rechazar la hipótesis nula, aceptamos la hipótesis alternativa de que la varianza no es 

4; pero podemos plantearnos si es menor que 4 o mayor que 4. 

Solución: 

Ahora se trata de realizar un contraste unilateral para la varianza poblacional con media 

desconocida suponiendo normalidad. 

Sabemos que: 

(n 1)S 

 

2 

0 

2 

 

2 

n1 El valor crítico para a=0,05 y n=28 

Para = 0,05 

H : 4 

H: 4 

2 2 

0 0 

2 2 

1 0 

2 

(n 1)S272 13,5 

2 

0 4 

1 ,n1 0.95,27 

P( ) 0.95 16.25 

2 

27 0.95 0.95 

siendo 13,5 menor que 16,25 ACEPTAMOS la hipótesis nula de que la varianza del grosor 

de los filamentos es menor de 4 milímetros. 


SPSS: IDF.CHISQ(0.95,27) 16,25 


=DISTR.CHI(13,5;27) 

0,9856745 < 0,05 = α 


20


HOMOCEDASTICIDAD 

Considérese ahora el problema de probar la igualdad de varianzas 1 2 y 2 2 , de dos 

poblaciones. Esto es, debe probarse la hipótesis nula H o de que 1 2 2 2 en contraposición 

a una de las alternativas usuales 1 2 2 2 , 1 2 2 2 ó 1 2 2 2 . 

Para muestras aleatorias independientes de tamaños respectivos n 1 y n 2 , de las dos 

poblaciones, el valor f para probar 1 2 2 2 es la razón f s 1 2 


s 2 2 donde s 1 2 y s 2 2 son las 

varianzas calculadas a partir de las dos muestras. Si las dos poblaciones tienen distribuciones 

aproximadamente normales, y la hipótesis nula es verdadera, de acuerdo en resultados 

obtenidos, la relación f es un valor de la distribución F de Snedecor con n1-1 y n2-1 grados 

de libertad. Por tanto, las regiones críticas, con nivel de significación correspondientes a 

las alternativas unilaterales 1 2 2 2 y 1 2 2 2 son respectivamente, 

. 

f F,n11,n21 f F . 

Para la alternativa bilateral 1 2 2 2 , la región crítica es 

,n11,n21 2 

f F1 ,n11,n21 y 

f F y 

1 ,n11,n21 2 

2.6 Ejemplo: 

Se pretende comparar dos métodos de eliminación de observaciones. Se seleccionan 

una muestra de 50 series con observaciones aberrantes y a 25 de ellas se le aplica el método A 

y a las otras 25 el B. Los resultados obtenidos son los siguientes: 

Método A : xA 4,3; SA 1,4 

Método B : xB 3,6; SB 1,1 

Suponiendo la variable normal, contrastar la hipótesis de igualdad de medias a un nivel de 

significación a=0,05. 

Solución: 

Debemos en primer lugar contrastar la hipótesis de igualdad de varianzas 

21

2 2 

A 

2 2 

B 


S 

S 

H : 

H: 

2 2 

0 A B 

2 2 

1 A B 

 

 

 

2 

A F 2 ,F 

1 ,nA1,nB1 ,nA1,nB1 B 2 2 

S 1.4 

1.62 F ,F 0.44,2.27 

S 1.1 

0.975,24,24 0.025,24,24 

DERIVE: 

#1: NSOLVE(F_DISTRIBUTION(x, 24, 24) = 0.975, x, 0, 1) 

#2: x = 0.4405911279 

#3: NSOLVE(F_DISTRIBUTION(x, 24, 24) = 0.025, x, 0, 5) 

#4: x = 2.269129557 

EXCEL: 

=DISTR.F.INV(0,975;24;24) 0,44066972 

=DISTR.F.INV(0,025;24;24) 

SPSS: 

2,26927455 

IDF.F(0.975,24,24) .44 

IDF.F(0.025,24,24) 2.27 

0,44 < 1,62 < 2,27 y por tanto aceptamos la hipótesis de varianzas iguales. 

Contrastamos ahora la igualdad de medias de dos poblaciones normales de varianzas 

desconocidas pero iguales y muestras pequeñas. 


A B 

H : 

H: 

0 A B 

1 A B 

xAxB 1 1 

S 

n n 

A B 

t 

 

,nAnB2 2 

siendo 

2 2 2 2 

2 (n A 1)S A (nB 1)SB 241.4 241.1 S 1.585 

con lo cual 

(n 1) (n 1) 2424 xAxB 4.3 3.6 

1.966 

y para a=0.05, t0.025,48=2 

1 1 1 1 

S 1.585 

n n 25 25 

A B 

DERIVE: 

#1: NSOLVE(STUDENT(x, 48) = 0.975, x, Real) 


22

#2: x = 2.010634765 

EXCEL: 


=DISTR.T.INV(0,05;48) 

SPSS: 

2,01063472 

IDF.T(0.975,48) 2.01 

Como 1.93 < 2 admitimos la hipótesis de igualdad de medias. 


=DISTR.T(1,966;48;2) 0,05509702 > α 

2.9. TEST DE BONDAD DE AJUSTE. 

Hasta ahora, hemos estudiado aspectos o planteamientos, de un problema que, de 

forma general, trata de tomar decisiones sobre alguna característica de la población, a partir 

del estudio de una muestra de dicha población. 

El problema que vamos a tratar es el de la conformidad de una distribución 

experimental y una distribución teórica; esto es, sustituir la distribución experimental 

(distribución de la muestra de la población), el histograma, o la distribución de frecuencias, 

por una distribución teórica conocida. 

Se trata ahora de ajustar una distribución experimental a una distribución teórica; es 

decir, ver si de los resultados obtenidos en una muestra de una población, podemos suponer 

que la población sigue una determinada distribución. 

Según sea el histograma o la tabla de frecuencias de la muestra, hacemos una 

hipótesis sobre la distribución de la población, que estudiaremos en un test de ajuste que 

mide la bondad de ajuste. 

Sea n el tamaño de la muestra y agrupamos en k clases, y sea ni la frecuencia absoluta 

observada de la clase i. A partir de la muestra estimamos los parámetros de la población 

teórica, y una vez obtenidos éstos, calculamos la probabilidad pi que le corresponde a cada 

intervalo i. Las correspondientes frecuencias absolutas teóricas (esperadas) serán npi. 


23

Sean: 

n = tamaño de la muestra 

k = número de clases 

ni = frecuencia absoluta de la clase i 


pi = probabilidad de cada clase según la distribución teórica 

npi = frecuencia absoluta de cada clase según la distribución teórica 

h = número de parámetros estimados a partir de la muestra 

= número de grados de libertad 

Las frecuencias observadas en la distribución de una muestra, se emplean para poner a 

prueba, la hipótesis de que la población de la cual se ha obtenido la muestra, no difiere en 

distribución, de la de alguna distribución conocida. 

Si la hipótesis fuese cierta, las discrepancias entre las frecuencias absolutas 

observadas ni y las frecuencias absolutas esperadas npi, no deben ser grandes. 

Supuesta conocida la distribución de Y. La hipótesis H 0 tiene la forma: la población X 

de la cual se obtuvo la muestra tiene la misma distribución que la población Y, formulamos la 

hipótesis alternativa H 1 las poblaciones X e Y no tienen la misma distribución. 

Una medida de las discrepancias en este sentido, fue estudiada por Pearson 

k 

2 

( ni 

npi 

) 

construyendo el siguiente estadístico: D , y demostró que, para 

1 

np 

2 

n 30 y npi 

5 

D kh1 

i i 

, esto es, la variable D sigue una distribución ji-cuadrado con 

= k - h - 1 grados de libertad. 

Para aplicar correctamente el test, las frecuencias teóricas de las diferentes clases 

deben ser mayor o igual que cinco, por lo que en caso de que no lleguen, se agrupan 

previamente. 

La prueba de bondad ji-cuadrado es una herramienta muy importante, debido sobre 

todo a que muchos procedimientos estadísticos en la práctica dependen, en un sentido teórico, 


24


de la suposición de que los datos recogidos surgen de un tipo de distribución específica. La 

suposición de normalidad se hace con bastante frecuencia. 

Fijado un nivel de significación , buscamos un valor tal que 


2 

P 

Si D aceptamos la hipótesis H 0 de conformidad con el ajuste, siendo las 

diferencias i i 

n np debidas al azar. 

Si D rechazamos la hipótesis H0 , las diferencias i i 

por tanto, las distribuciones son distintas. 

Observaciones acerca de D. 

n np son significativas y 

1º El valor D es más grande a medida que la distribución experimental se separa más de la 

teórica. 

2º El número de intervalos se pueden fijar libremente siempre y cuando se verifique npi 5 . 

3º En general, D crece si crece el nº de intervalos, aunque la distribución teórica se ajuste 

bien. Puede darse el caso de rechazar H 0 para un nº de intervalos k, y aceptar para un nº 

menor de k intervalos. 

2.7 Ejemplo: 

De un experimento se ha obtenido la siguiente distribución de frecuencias: 

x < 1 1 a 2 2 a 3 3 a 4 4 a 5 5 a 6 6 a 7 7 a 8 8 a 9 > 9 

n 0 5 19 91 202 217 95 16 5 0 

i 

Ajustar a una distribución normal con un nivel de significación del 0.05. 

Solución: 

25

2 

ei1 e i xi ni nx i i nx i i 

Utilizando las fórmulas, ya conocidas: 

3256 

X 

650 

650 

S 1154 

649 

e e 

< 1 0 

1 - 2 1.5 5 7.5 11.25 

2 - 3 2.5 19 47.5 118.75 

3 - 4 3.5 91 318.5 1114.75 

4 - 5 4.5 202 909.0 4090.50 

5 - 6 5.5 217 1193.5 6564.25 

6 - 7 6.5 95 617.5 4013.75 

7 - 8 7.5 16 120.0 900.00 

8 - 9 8.5 5 42.5 361.25 

> 9 0 

650 3256.0 17174.5 

ii 1 

5 2 


17174 5 

 

650 

. 

 

 

3256 

650 


2 

 

133 . 1153 . 

 

. . resulta una distribución estimada: N( 5 , 1. 154) 

n i 

pi F(ei) F(ei1 ) ) 

np i 

2 

n np 

i i 

< 3 24 0.0415386 27.00 0.333333 

3 - 4 91 0.193093-0.0415386=0.1515544 98.51 0.572531 

4 - 5 202 0.5-0.1515544=0.306907 199.49 0.031581 

5 - 6 217 0.806907-0.5=0.306907 199.50 1.535087 

6 - 7 95 0.958461-0.806907=0.151554 98.50 0.124365 

> 7 21 1-0.958461=0.041539 27.00 1.333333 

650 1 650.00 D=3.930230 

Quedan 6 intervalos y hemos calculado 2 parámetros (media y varianza) luego 

= k - h - 1 = 6 – 2 – 1= 3 grados de libertad. 

240 

200 

160 

120 

80 

40 

0 

n 

Histograma de frecuencias 

0 2 4 6 8 10 

np 

i 

26

Para = 0,05 


P( ) 0.05 7.8147 siendo D = 3.9 menor que 

2 

3 0.05 0.05 

005 . aceptamos la hipótesis de ser el ajuste bueno. 


O bien, utilizando el p-valor: 

DERIVE: 1 - CHI_SQUARE(3.9,3)= 0.2691227489 > 0,05 = a 

EXCEL: = DISTR.CHI(3,9;3) 0,26912272 > 0,05 = a 

SPSS: 1 - CDF.CHISQ(3.9,3) .27> 0,05=a 

2.8 Ejemplo: 

Se puede admitir la distribución uniforme de valores angulares en una triangulación de primer 

orden de un país en la que se ha tomado una muestra de tamaño 100 y se han obtenido los 

siguientes resultados: 

x < 40 40-50 50-60 60-70 >70 

n 16 22 20 19 23 

i 

Solución: 

Según la ley de la distribución uniforme, la probabilidad teórica de cada clase es igual a la 

unidad dividida por el número de clase: 1/5=0,2 

Para = 0,05 

x < 40 40-50 50-60 60-70 >70 

n 16 22 20 19 23 

i 

pi 0,2 0,2 0,2 0,2 0,2 

npi 20 20 20 20 20 

2 

n np 

i i 

np 

i 

2 

16 20 2 

22 20 2 

20 20 2 

19 20 

20 

20 


20 

(n np ) 

np 

k 

2 

D i i 1,5 

 

i1 i 

2 

4 0.05 0.05 

20 

2 

23 20 

P( ) 0.05 9,49 siendo D = 1,5 menor que 

005 . aceptamos la hipótesis de ser el ajuste bueno. La diferencia entre la distribución 

empírica y la ley de la distribución uniforme no es significativa. 


20 

27

O bien, utilizando el p-valor: 


DERIVE: 1 - CHI_SQUARE(1.5,4)= 0.8266414672> 0,05 = a 

EXCEL: = DISTR.CHI(1,5;4) 0,826641> 0,05 = a 

SPSS: 1 - CDF.CHISQ(1.5,4) .83> 0,05=a 

Directamente con SPSS creamos la variable v1 y en datos>>ponderar casos 

Reconoce la columna de frecuencias absolutas. 

Escogemos analizar>>pruebas no paramétricas>>chi cuadrado 

V1 

Observed Expected 

N N Residual 

35,0 16 20,0 -4,0 

45,0 22 20,0 2,0 

55,0 20 20,0 ,0 

65,0 19 20,0 -1,0 

75,0 23 20,0 3,0 

Total 100 

Chi- 

Square(a) 

V1 

1,500 

df 4 

Asymp. 

Sig. 

,827 

Test Statistics 

Test de independencia 

Aplicaciones de la Prueba chi-cuadrado: 

Se trata de contrastar si dos variables CUALITATIVAS son independientes (es decir, si existe 

relación entre ellas), o no. 

H0: X e Y son independientes 

H1: X e Y no son independientes 

Supongamos que de una población se han observado dos características X e Y, obteniéndose 

una muestra bidimensional (x ,y ), (x ,y ),…, (x ,y ). Se desea contrastar si X e Y son 

1 1 2 2 n n 

independientes o no. 

Para ello, se divide el conjunto de los posibles valores de X en r clases disjuntas, A1, A2,…, Ar 

y los de Y en k clases disjuntas, B1, B2 ,…, Bk, obteniendo k r clases con frecuencia n , dando 

ij 

lugar a una tabla de doble entrada (tabla de contingencia): 


28


Muestra A1 A2 ……. Ar Total 

B1 n11 n12 … n1r n1. 

B2 n21 n22 … n2r n2. 

… … … … … … 

Bk 

nk1 

nk2 … nkr nk. 

Total n.1 n.2 …. n.r n 

Buscamos las frecuencias esperadas de cada casilla (eij): 

n n 

pij PAjBiPAjPBi 

n n 

Sobre una muestra de tamaño n, será: 

.j i. 

n n n n 

.j i. i. .j 

eij npij n 

n n n 

Al Igual que para el test de Bondad el estadístico de contraste 

r k 

D 

2 

nn i. .j 

nij 

2 

Oij eij 

j1 i1 ij 

r k 

En nuestro caso: D 

 

 

j1 i1 

2.9 Ejemplo: 

n 

nn i. .j 

n 

 

con (k-1)(r-1) grados de libertad 

Hemos preguntado a un grupo de 100 hombres y 100 mujeres si fumaban o no. ¿Existen 

diferencias significativas entre ambos sexos? 


e 

Hombres Mujeres TOTAL: 

Fuma 25 35 60 

No fuma 75 65 140 

TOTAL: 100 100 200 

29

Solución: 

¿Qué debería salir, si fueran independientes? 

Fuma 


Hombres Mujeres TOTAL: 

25 (30) 35(30) 60 

No fuma 75(70) 65(70) 140 

TOTAL: 100 100 200 

H o : X e Y son independientes 

H 1 : X e Y no son independientes 

Comparamos frecuencias observadas (O i ) y esperadas (e i ) 

r k 

D 

La idea es RECHAZAR la hipótesis, si los valores observados difieren demasiado de los 

observados. 

Para ello, utilizamos la prueba de la chi-cuadrado con n=1 grado de libertad. 

El número de grados de libertad es igual al número de frecuencias de casillas que se pueden 

rellenar libremente conocidos los totales. 

En general, será el número de columnas menos 1 por el número de filas menos 1: (c-1)(f-1). 

Utilizando el p-valor: 

DERIVE: 1 - CHI_SQUARE(2.38,1)= 0.1228975482 

EXCEL: = DISTR.CHI(2,38;1) 0,1228975 

2 

Oij eij 

j1 i1 ij 

2 2 2 2 

(25 30) (35 30) (75 70) (65 70) 

D 2,38 

30 30 70 70 

p valor P( 2.38) 0,12289758 

2 

n1 Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M. 

e 

30

SPSS: 1 - CDF.CHISQ(2,38,1) .12 


2 

Para = 0,05 P( 1 0.05) 0.05 0.05 3.84 siendo D = 2.38 menor que 005 . 

aceptamos la hipótesis de independencia. 

EXCEL: = PRUEBA.CHI.INV(0,05;1) 3.841459 

Aplicaciones de la Prueba chi-cuadrado: 

Prueba de Homogeneidad 

Consiste en comprobar si varias muestras de un carácter cualitativo proceden de la misma 

población o que las distribuciones de la variable observada es la misma en todas las 

poblaciones 

H0: m poblaciones homogéneas 

H1: al menos una población es heterogénea 

Supongamos que se dispone de m muestras aleatorias simples de otras tantas poblaciones 

cuyos tamaños son, respectivamente, n , n ,…, n . Se desea contrastar si los datos (todos 

1 2 m 

juntos) provienen de la misma población o, por el contrario, se trata de poblaciones 

heterogéneas con diferentes distribuciones. 

Para ello, se divide el conjunto de los posibles valores de A en r clases disjuntas y n , 

ij 

representa el número de observaciones de la muestra i que pertenece a la clase A según 

j 

vemos en una tabla de doble entrada (tabla de contingencia): 

Muestra A1 A2 ……. Ar Total 

1 n11 n12 … n1r n1 

2 n21 n22 … n2r n2 

… … … … … … 

m nm1 nm2 … nmr nm 

Total n.1 n.2 …. n.r n 

La hipótesis de que las m poblaciones son homogéneas, se traduce en que cada conjunto Aj 

debe tener una probabilidad teórica pj, desconocida, pero que no varía de la población i a la 

población i’ 

n.j 

eij nipjni n 

Al Igual que para el test de Bondad el estadístico de contraste 


31

En nuestro caso: 

j1 i1 


r m 

D 

i .j 

2 

Oij eij 

j1 i1 ij 

2 

nn i .j 

n 

r m ij 

n 

 

D 

 

con (m-1)(r-1) grados de libertad 

nn 

n 

2.10 Ejemplo: 

Queremos saber si las dos muestras obtenidas proceden de la misma población con 

probabilidad del 95%. 

Solución: 


e 

A B C D 

1ª muestra 56 60 62 59 

2ª muestra 44 40 38 41 

H : p = p11 = p12 = p13 = p14 

o 

H : pij distinto de p para algún grupo 

1 

Se calculan las frecuencias esperadas 

n.j 237 

e1j n1pjn1 100 59,25 5 

n 400 

Que coinciden para los cuatro grupos por ser el mismo tamaño muestral n1 = 100 

n.j 163 

e2j n1pjn2 100 40,75 5 

n 400 

Calculamos el valor del estadístico 

32

2 


nn i .j 

r m nij 

2 2 2 

n 

56 59,25 6059,25 62 59,25 

D 

 

 

 

nn j1 i1 i .j 59,25 59,25 59,25 

n 

59 59,25 4440,75 40 40,75 3840,75 4140,75 2 2 2 2 2 

 

59,25 

 

40,75 

 

40,75 

 

40,75 

 

40,75 

 

0,7765784 

Ajustamos a una distribución de Pearson con 3 grados de libertad 

En general, será el número de columnas menos 1 por el número de filas menos 1: (c-1)(f-1). 

2 n3 

p valor P 0,7765784 0,85506 

Utilizando el p-valor: 

DERIVE: 1 - CHI_SQUARE(0.7765784,3)= 0.8550605738 

EXCEL: = DISTR.CHI(0.7765784;3) 0,8555061 

SPSS: 1 - CDF.CHISQ(0.7765784,3) .86 

P( ) 0.05 7.81472776 siendo D = 0,7765784 menor 

Para = 0,05 

2 

1 0.05 0.05 

que 005 . aceptamos la hipótesis y las muestras proceden de la misma población. 

EXCEL: = PRUEBA.CHI.INV(0,05;3) 7.81472776 


33

Contraste de Hipótesis - E.T.S.I.T.G.C.

Create successful ePaper yourself

Delete template?

Save as template?