resumen-contrastes-hipotesis

Resumen de clases: Contrastes de hipótesis 

1 Contraste de hipótesis. 

Una hipótesis estadística es una a…rmación que se hace sobre una o más características de 

una población (decir que la vida media son tantos años, que un determinado pienso produce 

aumento de peso... ). 

Los contrastes pueden ser de tipo paramétrico o no paramétrico, según se re…eran o no 

a parámetros de una población. 

Una hipótesis paramétrica es una a…rmación sobre una o más características (parámetros) 

de una población. Le llamaremos hipótesis nula H0. 

Si la hipótesis especi…ca un único valor para el parámetro le llamaremos hipótesis simple. 

Ejemplo: = 5 

Si se especi…can varios valores para el parámetro le llamaremos hipótesis compuesta. Ejem- 

plo: 5 

Ejemplos de una hipótesis no paramétrica: 

- H0 : X sigue una distribución normal 

- H0 : Un dado está "cargado" en un número (la variable X="resultado" no sigue una 

distribución uniforme entre 1 y 6) 

La realización de un contraste implica la existencia de dos hipótesis: 

- Hipótesis nula H0, que se asume como correcta. 

- Hipótesis alternativa H1; la que pretendemos contrastar frente a la hipótesis nula. 

La hipótesis nula es la que el investigador asume como correcta. La aceptación de H0 no 

implica que ésta haya sido probada al 100 por 100, sino que los datos no han proporcionado 

evidencia su…ciente como para refutarla. Es decir, se trabaja con el principio de "todo hombre 

1

es inocente mientras no se demuestre lo contrario". Esto es, la hipótesis nula es cierta mientras 

no se pruebe lo contrario. Salvo que los datos demuestren su falsedad, la mantendremos y, en 

este sentido, la consideraremos neutra pero nunca totalmente probada. 

En general, para contrastar una hipótesis, lo que se hace es seleccionar una muestra de la 

población, y ver si los resultados son coherentes con esa a…rmación. 

Procedimiento para realizar un contraste de hipótesis paramétrico. 

H0 : = cte: 

H1 : 6= cte: 

Se elige una muestra aleatoria simple de la población (x1:x2; :::; xn) y se estima por medio 

de algun estimador ^ : Se elige alguna medida de discrepancia d (o estadístico del con- 

traste) entre y ^ : Esta medida de discrepancia ha de ser una variable aleatoria con distribución 

conocida, para saber si la discrepancia es grande o no: 

Ejemplo: Si suponemos que la media = 5, calculamos x y vemos si son muy diferentes 

calculando d = d( ; x): 

Si d es “pequeña”, no hay razones para sospechar que H0 sea falsa, y se acepta H0: 

Si d es “grande”admite dos interpretaciones: 

a) H0 es cierta, pero el azar ha producido una muestra poco representativa. 

b) La hipótesis H0 realmente no es cierta. 

Para ayudarnos a tomar una decisión sobre el caso a) hay que calcular el Nivel crítico 

o p valor: es la probabilidad de tener un valor del estadístico igual o mayor al 

observado cuando H0 es cierta. 

Cuando estamos realizando un contraste puede suceder 

contraste. 

REALIDAD 

H0 

RECHAZO H0 Error tipo I Decisión correcta 

H1 

H1 Decisión correcta Error tipo II 

=P(rechazar H0 siendo cierta)=P(Error tipo I) se llama nivel de signi…cación del 

=P(aceptar H0 siendo falsa)=P(Error tipo II). 

1- = P (rechazar H0 siendo falsa) se llama Potencia del contraste (Mide la probabilidad de 

acertar). 

2

Se debería minimizar la probabilidad de ambos errores, pero ocurre que al disminuir la 

probabilidad de uno aumenta la del otro, y viceversa. 

Ejemplos: 

* En un hospital, ante la sospecha de un virus en un enfermo 

H0 : enfermo frente a H1 : no enfermo 

P(Error tipo I)=P(rechazar H0 siendo cierta)=P(admitir que no esta enfermo, estándolo) 

P(Error tipo II)=P(aceptar H0 siendo falsa)=P(admitir que está enfermo, no estándolo) 

El Error tipo I es más importante que el Error tipo II en este caso. 

Como disminuir el Error de tipo I: ingresar a la mínima sospecha-> aumenta Error tipo II 

Como disminuir el Error de tipo II: no ingresar a nadie salvo que esté casi muerto-> aumenta 

error tipo I 

* En un juicio 

H0 : inocente frente a H1 : culpable 

En la práctica, se plantea el contraste de manera que el error más importante 

sea el de tipo I. 

Etapas básicas a seguir cuando se realiza un contraste de hipótesis. 

1.-) Especi…car las hipótesis nula y alternativa. 

2.-) Elegir un estadístico de contraste apropiado d. 

3.-) Tomar la muestra (x1:x2; :::; xn) y evaluar el estadístico de contraste bajo H0, es decir 

^d = d(x1:x2; :::; xn; H0): 

4.-) Concluir si la diferencia ^ d es estadísticamente signi…cativa (se rechaza H0 o no), según 

el p-valor del estadístico ^ d. Para ello podemos …jar un nivel de con…anza 1 determinado y 

tomar una decisión en base al mismo. 

Ejemplo 1 

Se realiza una serie de ocho análisis de sangre sobre un determinado paciente a lo largo de 

varios días. La variable considerada es X = nivel total de proteínas. X 2 N( ; ) 

El promedio total de proteínas en sangre en un adulto sano es de 0 = 7.25 g/dl. A la vista 

de los siguientes datos, 

7.23 7.25 7.28 7.29 7.32 7.26 7.27 7.24 

¿podemos a…rmar, con un nivel de signi…cación = 0.2 que el paciente tiene un nivel medio 

de proteínas diferente al normal? 

1.-) Se trata de contrastar H0 : 0 = 7:25 frente a H1 : 0 6= 7:25 

3

2.-) El estadístico del contraste es 

d = x 0 

^s 

p n 

d es una variable aleatoria que sigue una distribución t de Student con n 1 grados de 

libertad cuando H0 es cierta, y 

x = x1 + ::: + xn 

n 

(media muestral); ^s = 

s Pn 

i=1 (xi x) 2 

n 1 

3.-) En esta muestra particular, x = 7:2675; ^s = 0:029: 

^d = 

7:2675 7:25 

0:029 

p 8 

= 1:7068 

(cuasi-desviación típica muestral) 

4.-) Calculamos el p-valor: es la probabilidad de obtener una discrepancia mayor o igual 

que ^ d cuando H0 es cierta (Ejemplo Figura 1). 

Figura 1: p-valor (probabilidad de valores más grandes que 1.706 ó más pequeños que -1.706). 

En el SPSS haríamos el contraste mediante: Analizar/Comparar medias/Prueba T para una 

muestra e introducimos como Valor de prueba 7,25 (ahora con COMA) (Figura 2). 

El resultado que nos interesa es: 

Sig. (bilateral)=0,133 (esto es el p-valor). 

4

Figura 2: Cuadro de diálogo para la prueba T de una muestra 

En este caso concreto, se preguntaba ¿podemos a…rmar, con un nivel de signi…cación = 0:2 

que el paciente tiene un nivel medio de proteínas diferente al normal? Como el p-valor=0.133 

es menor que 0.2, rechazaríamos H0: 

Ejemplo 2 

Una marca de arroz vende al por mayor sacos de media 10 kilos. Se selecciona una muestra 

de 7 sacos y se pesan: 9.8, 10.2, 10.4, 9.8, 10.2, 10.2, 8.6. ¿Es cierta la a…rmación del fabricante? 

Una opción sería la siguiente: Calculamos un intervalo de con…anza al 95% para la media de 

los sacos (suponemos que el peso sigue una distribución normal). Hemos visto que el Intervalo 

de con…anza para la media es 

En este caso, x = 9:88; ^s = 0:609. 

x t =2;n 1 

^s 

^s 

p ; x + t =2;n 1 p 

n n 

Con…anza (1 ) t =2;n 1 Intervalo Longitud (b-a) 

0:9 (90%) 0:1 1: 943 2 (9:43; 10:33) 0:9 

0:95 (95%) 0:05 2: 446 9 (9:32; 10:44) 1:12 

0:99 (99%) 0:01 3: 707 4 (9:03; 10:73) 1:7 

Si planteamos el contraste H0 : = 10 frente a H1 : 6= 10; debido a que dicho valor 

aparece en los intervalos de con…anza, aceptariamos H0: 

5

Ahora bien, si, por ejemplo, la empresa dijera que los sacos tienen peso medio 11 kilos, no 

lo aceptariamos en ningún caso. 

Si dijeran que los sacos tienen peso medio 10.5 kilos? 

H0 : = 10:5 frente a H1 : 6= 10:5 

Calculamos el estadístico del contraste para esta muestra: 

^d = x 0 

^s 

p n 

= 9:88 10:5 

0:609 

p 7 

= j 2:6935j = 2:6935: 

En el SPSS haríamos el contraste mediante: Analizar/Comparar medias/Prueba T para una 

muestra e introducimos como Valor de prueba 10,5 

El resultado que nos interesa es: Sig. (bilateral)=0,037 (esto es el p-valor) 

Hasta ahora hemos estado realizando contrastes bilaterales: 

H0 : = 0 frente a H1 : 6= 0 

También podemos realizar contrastes unilaterales: 

H0 : = 0 frente a H1 : < 0 o H0 : = 0 frente a H1 : > 0 

ó 

H0 : 0 frente a H1 : < 0 o H0 : 0 frente a H1 : > 0 

Se resuelven de la misma forma, pero con la siguiente regla. 

Caso a) H0 : = 0 (o 0) frente a H1 : < 0 

Realizar el contraste y mirar el valor de T que proporciona el SPSS. 

Si T < 0 entonces el p-valor = (sig.bilateral)/2 

Si T > 0 entonces el p-valor = 1- ((sig.bilateral)/2) 

Caso b) H0 : = 0 (o 0) frente a H1 : > 0 

Realizar el contraste y mirar el valor de T que proporciona el SPSS. 

Si T > 0 entonces el p-valor = (sig.bilateral)/2 

Si T < 0 entonces el p-valor = 1- ((sig.bilateral)/2) 

En muchas ocasiones, los problemas de test o contraste de hipótesis se plantean para un 

nivel o con…anza 1 determinado de antemano. Entonces lo único que hay que hacer es 

calcular el p-valor y se acepta o rechaza según: 

Si p-valor > aceptamos H0 

Si p-valor rechazamos H0 

6

Recordemos que = P (Error tipo I) =P(rechazar H0 siendo cierta). Con la regla anterior, 

nosotros …jamos el mayor valor para la probabilidad del error tipo I que estamos dispuestos a 

admitir, es decir estamos dispuestos a rechazar la hipotesis nula siendo cierto con un máximo 

de probabilidad de equivocarnos igual a : 

Ejemplo: 

Se realiza un experimento orientado a comprobar la efectividad de un nuevo tipo de tratamiento 

para el dolor de piernas, a través de una máquina de dar calambres, comprada en “Timo a dis- 

tancia TV”. Se seleccionaron 12 pensionistas, y el grado de dolor, según la escala de Dolores 

(nueva ministra de Sanidad) fue de la forma 0.6, 0.8, -1.1, 3.4, 5.6, 0.8, 1.2, 1.5, -0.2, 3.2, 2.7, 

1.6 (positivo mejora, negativo empeora) Veri…car si a la seguridad social le interesa comprar la 

nueva máquina. 

Si la máquina fuera buena, el nivel medio aumentaria: la variable X ="grado de la mejoría" 

2 N( ; ) sería tal que > 0: 

Entonces tenemos que contrastar H0 : = 0 ( 0) frente a H1 : > 0 

De la muestra obtenemos n = 12; x = 1:675; ^sn 1 = 1:80712 

El valor del estadístico 

d = x o 

^Sn 1= p n 2 tn 1 

^d = x o 

^Sn 1= p n 

= 1:67 0 

1:8 

p 12 

= 3:211 

El p valor es 0.008 (bilateral). Como nos situamos en el Caso b), comprobamos si ^ d /(T 

en el SPSS) es mayor que cero (en efecto, es 3.211). Luego el p-valor es 0.008/2=0.004. En 

consecuencia, se rechazaría la hipótesis nula (se aceptaría la hipótesis alternativa). Diriamos 

que, con esta muestra aceptaríamos que el grado medio aumenta. 

1.1 Caso de dos muestras: relacionadas (apareadas) e independi- 

entes. 

Supongamos ahora que tenemos 2 variables X e Y 

X 2 N( X; X); Y 2 N( Y ; Y ): 

Nos interesa hacer estimaciones o inferencias (o contrastes) sobre X Y : 

Ejemplos: Diferencia entre estaturas (pesos, notas, cocientes intelectuales, nivel de osteo- 

porosis) medias en 2 grupos. 

7

De la variable X se escogerá una muestra (x1; x2; : : : ; xn) y de Y otra muestra (y1; y2; : : : ; ym). 

1.-) Si X e Y son dependientes, se llaman muestras apareadas. En este caso tendremos que 

n = m; simplemente se consideraría la variable D = Y X o X Y y se trabaja como hemos 

visto para el caso de una muestra. 

Ejemplo: Para estudiar el efecto del ejercicio físico sobre el nivel de triglicérido, se ha 

realizado el siguiente experimento con 11 individuos: previo al ejercicio, se tomaron muestras 

de sangre para determinar el nivel de triglicérido por 100 mililitros de sangre, de cada sujeto. 

Después los individuos fueron sometidos a un programa de sexo agotador. Al …nal del periodo 

de ejercicios, se tomaron nuevamente muestras de sangre y se obtuvo una segunda lectura del 

nivel de triglicérido. De este modo, se dispone de dos conjuntos de observaciones del nivel de 

triglicérido por 100 mililitros de sangre de los sujetos: (suponer normalidad) 

Sujeto 1 2 3 4 5 6 7 8 9 10 11 

Previo 68 77 94 73 37 131 77 24 99 629 116 

Posterior 95 90 86 58 47 121 136 65 131 630 104 

¿Hay pruebas su…cientes para a…rmar que el sexo duro produce cambios en el nivel de 

triglicérido?. 

X = "nivel previo", Y ="nivel posterior". X e Y son dependientes porque corresponden a 

medidas en los mismos individuos. 

Se contrasta H0 : X = Y (ó X Y = 0) frente a H1 : X 6= Y : 

En este caso las muestras son dependientes (muestras relacionadas o pareadas). Hay que 

calcular las diferencias entre los datos de una muestra y la otra: D = (D1 = x1 y1; :::; Dn = 

xn yn): 

Contrastamos H0 : D = 0 frente a H1 : D 6= 0: 

1. El estadístico es 

^d = D D 

^Sn 1= p n 

Tenemos que D = 12:54; ^ Sn 1 = 24:46 y o = 0 bajo H0: 

^w = 12:54 

24:46 

p 11 

= j 1: 7003j = 1:7003: 

8

3). 

En SPSS vamos a Analizar/Comparar Medias/Prueba T para muestras relacionadas ( Figura 

Figura 3: Cuadro de diálogo del SPSS para la prueba de muestras relacionadas o apareadas 

El p-valor (sig.bilateral)= 0:12; con lo que, en principio (con los niveles habituales), no 

rechazamos la hipótesis nula, luego con esta muestra no podemos decir que el sexo agotador 

afecte al nivel de triglicérido. 

2.-) Si X e Y son independientes, hay que diferenciar si las varianzas (o desviaciones 

típicas) de las variables son iguales o no. En cualquier caso, el SPSS hace todo en un mismo 

cuadro de diálogo. 

Analizar/Comparar Medias/Prueba T para muestras independientes. 

La diferencia con los análisis anteriores es que debemos meter las 2 muestras que tengamos 

en una misma variable, e indicar la pertenencia a X o Y en otra variable. 

Ejemplo. 

Una compañía contrata 10 inmigrantes subsaharianos y otros tantos supersaharianos. Las 

duraciones de vida (en minutos) observadas tras un trabajo sin paga ni descanso han sido: 

A: 1614, 1094, 1293, 1643, 1466, 1270, 1340, 1380, 1028, 1497. 

B: 1383, 1138, 1092, 1143, 1027, 1061, 1627, 1021, 1711, 1065. 

Calcular un intervalo de con…anza para la diferencia de medias, y decidir si pueden consid- 

erarse iguales. 

X = "duración de vida en inmigrantes subsharianos (A)", Y = "duración de vida en 

inmigrantes supersaharianos (B)" 

9

1. Queremos calcular un intervalo de con…anza para X Y y luego contrastar H0 : X = 

Y (ó X Y = 0) frente a H1 : X 6= Y (ó X Y 6= 0): 

Grupo A: n = 10; x = 1362:5; ^ Sn 1 = 202:46: 

Grupo B: m = 10; y = 1221:7; ^ Sm 1 = 260:87: 

1.-) Si se suponen varianzas o desviaciones típicas iguales, el intervalo de con…anza para 

X Y es 

= 

0 

@(x y) tn+m 2; =2 

(x y) tn+m 2; =2 ^ ST 

r ! 

1 1 

+ = 

n m 

s 

(n 1) ^ S 2 n 1 + (m 1) ^ S 2 m 1 

n + m 2 

r 

1 

1 1 

+ A 

n m 

2.-) Si no se pueden considerar las varianzas iguales, el intervalo tiene la fórmula 

0 

s 

1 

siendo el entero más próximo a 

@(x y) tn+m 2 ; =2 

^S 2 n 1 

(m 1) ^ S2 n 1 (n 1) n ^ S2 m 1 

m 

(m 1) 

^S 2 n 1 

n 

2 

+ (n 1) 

n + ^ S2 m 1 

m 

En el SPSS crearíamos 2 variables. Una por ejemplo "datos", con los datos numéricos, y 

otra al lado (por ejemplo "tipo", con formato cadena) indicando "a" o "b". Luego vamos 

a Analizar/Comparar Medias/Prueba T para muestras independientes (Figura 4): 

En la primera línea de los resultados (Figura 5)., el programa realiza el contraste: H0 : 

X = Y frente a H1 : X 6= Y : 

Como el p-valor (Sig.) es 0.373, se aceptaría que las varianzas son iguales. 

Entonces, el intervalo de con…anza que elegiríamos sería el de dicha línea ( 80:93; 352:33). 

Para contrastar ahora H0 : X = Y (o X Y = 0) frente a H1 : X 6= Y el p-valor que 

se obtiene es Sig.(bilateral) =.205. Para los niveles habituales se aceptaría que las medias 

son iguales. 

10 

2 

^S 2 m 1 

m 

2 

A ;

Figura 4: Cuadro de diálogo del SPSS para la prueba de muestras independientes 

Figura 5: Resultado del SPSS para la prueba de muestras independientes 

11

resumen-contrastes-hipotesis

Create successful ePaper yourself

Delete template?

Save as template?