Pruebas de Hipótesis
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
<strong>Pruebas</strong> <strong>de</strong><br />
<strong>Hipótesis</strong>
<strong>Pruebas</strong> <strong>de</strong> <strong>Hipótesis</strong><br />
Otra manera <strong>de</strong> hacer inferencia es haciendo una<br />
afirmación acerca <strong>de</strong>l valor que el parámetro <strong>de</strong> la<br />
población bajo estudio pue<strong>de</strong> tomar. Esta<br />
afirmación pue<strong>de</strong> estar basada en alguna creencia<br />
o experiencia pasada que será contrastada con la<br />
evi<strong>de</strong>ncia que nosotros obtengamos a través <strong>de</strong> la<br />
información contenida en la muestra. Esto es a lo<br />
que llamamos Prueba <strong>de</strong> <strong>Hipótesis</strong><br />
v.rohen
Una prueba <strong>de</strong> hipótesis compren<strong>de</strong> cuatro<br />
componentes principales:<br />
-<strong>Hipótesis</strong> Nula<br />
-<strong>Hipótesis</strong> Alternativa<br />
-Estadística <strong>de</strong> Prueba<br />
-Región <strong>de</strong> Rechazo<br />
v.rohen
La <strong>Hipótesis</strong> Nula, <strong>de</strong>notada como H 0 siempre<br />
especifica un solo valor <strong>de</strong>l parámetro <strong>de</strong> la<br />
población si la hipótesis es simple o un conjunto <strong>de</strong><br />
valores si es compuesta (es lo que queremos<br />
<strong>de</strong>sacreditar)<br />
H 0<br />
: µ " µ 0<br />
H 0<br />
: µ " µ 0<br />
!<br />
H 0<br />
: µ = µ 0<br />
La <strong>Hipótesis</strong> Alternativa, <strong>de</strong>notada como H 1 es la<br />
que respon<strong>de</strong> nuestra pregunta, la que se establece<br />
en base a la ! evi<strong>de</strong>ncia que tenemos. ! Pue<strong>de</strong> tener<br />
cuatro formas:<br />
H1<br />
: µ = µ<br />
1<br />
H1<br />
: µ > µ<br />
0<br />
H1<br />
: µ < µ<br />
0<br />
H1<br />
: µ ! µ<br />
0<br />
v.rohen
Como las conclusiones a las que lleguemos se<br />
basan en una muestra, hay posibilida<strong>de</strong>s <strong>de</strong><br />
que nos equivoquemos.<br />
Dos <strong>de</strong>cisiones correctas son posibles:<br />
Rechazar H 0 cuando es falsa<br />
No Rechazar H 0 cuando es verda<strong>de</strong>ra.<br />
Dos <strong>de</strong>cisiones incorrectas son posibles:<br />
Rechazar H 0 cuando es verda<strong>de</strong>ra<br />
No Rechazar H 0 cuando es falsa.<br />
v.rohen
Tamaño <strong>de</strong> los errores al tomar una <strong>de</strong>cisión<br />
incorrecta en una Prueba <strong>de</strong> <strong>Hipótesis</strong><br />
H<br />
0 Verda<strong>de</strong>ra<br />
H 0 Falsa<br />
Rechazamos H<br />
0<br />
Error Tipo I<br />
P(error Tipo I) = α<br />
Decisión Correcta<br />
No Rechazamos H<br />
0<br />
Decisión Correcta<br />
Error Tipo II<br />
P(error Tipo II) = β<br />
v.rohen
La Probabilidad <strong>de</strong> cometer un error Tipo I se<br />
conoce como Nivel <strong>de</strong> Significancia, se <strong>de</strong>nota<br />
como α y es el tamaño <strong>de</strong> la región <strong>de</strong> rechazo<br />
El complemento <strong>de</strong> la región <strong>de</strong> rechazo es 1−α<br />
y es conocido como el Coeficiente <strong>de</strong> Confianza<br />
En una prueba <strong>de</strong> <strong>Hipótesis</strong> <strong>de</strong> dos colas la<br />
región <strong>de</strong> no rechazo correspon<strong>de</strong> a un<br />
intervalo <strong>de</strong> confianza para el parámetro en<br />
cuestión<br />
v.rohen
La Región <strong>de</strong> Rechazo es el conjunto <strong>de</strong> valores<br />
tales que si la prueba estadística cae <strong>de</strong>ntro <strong>de</strong><br />
este rango, <strong>de</strong>cidimos rechazar la <strong>Hipótesis</strong> Nula<br />
Su localización <strong>de</strong>pen<strong>de</strong> <strong>de</strong> la forma <strong>de</strong> la<br />
<strong>Hipótesis</strong> Alternativa:<br />
Si H1 : µ > µ 0<br />
entonces la región se encuentra en<br />
la cola <strong>de</strong>recha <strong>de</strong> la distribución <strong>de</strong> la<br />
estadística <strong>de</strong> prueba.<br />
v.rohen
Si H entonces la región se encuentra en<br />
1<br />
: µ < µ<br />
0<br />
la cola izquierda <strong>de</strong> la distribución <strong>de</strong> la<br />
estadística <strong>de</strong> prueba<br />
Si H : µ ! µ 1 0 entonces la región se divi<strong>de</strong> en dos<br />
partes, una parte estará en la cola <strong>de</strong>recha <strong>de</strong> la<br />
distribución <strong>de</strong> la estadística <strong>de</strong> prueba y la otra<br />
en la cola izquierda <strong>de</strong> la distribución <strong>de</strong> la<br />
estadística <strong>de</strong> prueba.<br />
v.rohen
Conclusiones <strong>de</strong> una Prueba <strong>de</strong> <strong>Hipótesis</strong><br />
Si rechazamos la <strong>Hipótesis</strong> Nula, concluimos<br />
que “hay suficiente evi<strong>de</strong>ncia estadística para<br />
inferir que la hipótesis nula es falsa”<br />
Si no rechazamos la <strong>Hipótesis</strong> Nula, concluimos<br />
que “no hay suficiente evi<strong>de</strong>ncia estadística<br />
para inferir que la hipótesis nula es falsa”<br />
v.rohen
H1 : µ > µ 0<br />
v.rohen
H : µ ! µ 1 0<br />
v.rohen
La Estadística <strong>de</strong> Prueba es una estadística que se<br />
<strong>de</strong>riva <strong>de</strong>l estimador puntual <strong>de</strong>l parámetro que<br />
estemos probando y en ella basamos nuestra<br />
<strong>de</strong>cisión acerca <strong>de</strong> si rechazar o no rechazar la<br />
<strong>Hipótesis</strong> Nula<br />
Ejemplo:<br />
Z = ˆ µ " µ 0<br />
#<br />
n<br />
Siempre se calcula consi<strong>de</strong>rando la <strong>Hipótesis</strong><br />
Nula como si fuera verda<strong>de</strong>ra.<br />
!<br />
v.rohen
Para el caso específico <strong>de</strong> la media poblacional µ,<br />
2<br />
el estimador es µˆ = X cuya varianza es ! n .<br />
Supondremos que conocemos la varianza<br />
2<br />
poblacional !<br />
<strong>Hipótesis</strong><br />
Nula<br />
: µ = µ 0 0<br />
Alternativa<br />
Estadística<br />
<strong>de</strong> Prueba<br />
R. Rechazo<br />
H H<br />
1<br />
: µ < µ 0<br />
H1 : µ > µ<br />
0 H<br />
1<br />
: µ ! µ<br />
0<br />
Z<br />
µ " µ<br />
0<br />
= ˆ<br />
!<br />
{ }<br />
{ }<br />
{ Z : Z < Z " } Z : Z > Z 1"# Z : Z > Z 1"# / 2<br />
X<br />
v.rohen
Si nuestro propósito está en la proporción <strong>de</strong> éxitos p,<br />
el estimador será p ˆ = X que tiene distribución<br />
n<br />
aproximada normal con media p y varianza p(1-p)/n,<br />
don<strong>de</strong> p toma el valor propuesto por la hipótesis nula.<br />
<strong>Hipótesis</strong> !<br />
Nula<br />
Alternativa<br />
Estadística<br />
<strong>de</strong> Prueba<br />
R. Rechazo<br />
H : p = p 0 0<br />
H : p < p 1 0<br />
H<br />
1<br />
: p > p H : p ! p<br />
0 1 0<br />
p<br />
Z = ˆ " p 0<br />
# p ˆ<br />
{ }<br />
{ Z : Z < Z " } Z : Z > Z 1"# Z : Z > Z 1"# / 2<br />
{ }<br />
!<br />
v.rohen
Cuando la varianza poblacional no es conocida,<br />
sabemos que la po<strong>de</strong>mos estimar con la varianza<br />
muestral, siendo la distribución <strong>de</strong> la estadística <strong>de</strong><br />
prueba una t - Stu<strong>de</strong>nt con n-1 grados <strong>de</strong> libertad.<br />
<strong>Hipótesis</strong><br />
Nula<br />
: µ = µ 0 0<br />
Alternativa<br />
Estadística<br />
<strong>de</strong> Prueba<br />
R. Rechazo<br />
H H : µ < µ 1 0<br />
H1 : µ > µ H : µ ! µ<br />
0 1 0<br />
{ T : T < t n"1,# }<br />
!<br />
T = ˆ µ " µ 0<br />
S n<br />
{ T : T > t n"1,1"# } { T : T > t n"1,1"# / 2 }<br />
v.rohen
!<br />
Para el caso <strong>de</strong> comparar las medias <strong>de</strong> dos<br />
poblaciones in<strong>de</strong>pendientes (tamaño <strong>de</strong> muestras<br />
gran<strong>de</strong>), y las varianzas son conocidas, la prueba se<br />
realiza <strong>de</strong> la siguiente manera:<br />
<strong>Hipótesis</strong><br />
Nula<br />
: µ = µ<br />
0 1 2<br />
Alternativa<br />
Estadística<br />
<strong>de</strong> Prueba<br />
R. Rechazo<br />
H H1 : µ<br />
1<br />
< µ<br />
2<br />
H1 : µ<br />
1<br />
> µ<br />
2<br />
H1 : µ<br />
1<br />
! µ<br />
2<br />
Z = X 1 " X 2<br />
# + #<br />
{ Z : Z < Z " } { Z : Z > Z 1"# } { Z : Z > Z 1"# / 2 }<br />
X1<br />
X 2<br />
!<br />
v.rohen
!<br />
Si la comparación es <strong>de</strong> proporciones <strong>de</strong> dos<br />
poblaciones in<strong>de</strong>pendientes, la prueba será<br />
<strong>Hipótesis</strong><br />
Nula<br />
Alternativa<br />
Estadística<br />
<strong>de</strong> Prueba<br />
H : p = p<br />
0 1 2<br />
H : p < p<br />
1 1 2<br />
H<br />
1<br />
: p1<br />
> p H : p ! p<br />
2 1 1 2<br />
Z =<br />
p ˆ 1<br />
" p ˆ 2<br />
( )<br />
p ˆ (1" p ˆ ) 1 n 1<br />
+ 1 n 2<br />
R. Rechazo<br />
X<br />
1 2<br />
don<strong>de</strong> ˆ .<br />
p<br />
=<br />
n<br />
1<br />
+<br />
X<br />
+ n<br />
2<br />
Recor<strong>de</strong>mos<br />
!<br />
que para usar<br />
!<br />
la aproximación normal es necesario que<br />
, don<strong>de</strong> n<br />
!<br />
es el tamaño <strong>de</strong> la muestra i (i=1,2)<br />
n i<br />
p > 5<br />
{ }<br />
Z : Z < Z "<br />
!<br />
i<br />
{ Z : Z > Z 1"# }<br />
{ Z : Z > Z 1"# / 2 }<br />
v.rohen
Para la diferencia <strong>de</strong> medias po<strong>de</strong>mos suponer que las<br />
varianzas poblacionales son iguales (este hecho se tiene que<br />
probar como se muestra mas a<strong>de</strong>lante).<br />
<strong>Hipótesis</strong><br />
Nula<br />
Alternativa<br />
Estadística<br />
<strong>de</strong> Prueba<br />
H<br />
0<br />
: µ<br />
1=<br />
µ<br />
2<br />
H H : µ > µ<br />
1<br />
: µ<br />
1<br />
< µ<br />
2<br />
H<br />
1 1 2<br />
1<br />
: µ<br />
1<br />
! µ<br />
2<br />
T = X 1 " X 2<br />
S p<br />
1<br />
n 1<br />
+ 1 n 2<br />
R. Rechazo<br />
2 ! 2<br />
2 ( n1<br />
! 1) S1<br />
+ ( n2<br />
1) S<br />
2<br />
Don<strong>de</strong> S =<br />
es el estimador <strong>de</strong> varianza mínima para σ 2 p<br />
.<br />
n + n ! 2<br />
!<br />
{ }<br />
T : T < t n"1,#<br />
1<br />
2<br />
!<br />
{ T : T > t n"1,1"# }<br />
La prueba se basa en una t con n 1 -n 2 -2 grados <strong>de</strong> libertad.<br />
!<br />
{ T : T > t n"1,1"# / 2 }<br />
v.rohen
Para la diferencia <strong>de</strong> medias cuando nuestras muestras están<br />
pareadas (misma medición, misma unidad experimental,<br />
circunstancias diferentes) po<strong>de</strong>mos usar la prueba <strong>de</strong><br />
diferencia <strong>de</strong> medias. Sin embargo <strong>de</strong>bemos notar que la<br />
varianza <strong>de</strong> la diferencia <strong>de</strong> medias lleva implícita la<br />
2 2 2<br />
covarianza entre los estimadores<br />
<strong>Hipótesis</strong><br />
Nula<br />
Alternativa<br />
Estadística <strong>de</strong><br />
Prueba<br />
R. Rechazo<br />
H<br />
0<br />
X1 y X 2<br />
( )<br />
: µ µ !"<br />
H : µ = 0 µ = µ ! µ<br />
1<br />
= 2<br />
0 D<br />
D<br />
H<br />
1<br />
: µ<br />
D<br />
< 0 H<br />
1<br />
: µ D<br />
> 0 H<br />
1<br />
: µ D<br />
! 0<br />
{ T : T < t n"1,# }<br />
T =<br />
S D<br />
D<br />
n<br />
(! = ! + ! # 2 "! ! )<br />
D<br />
{ T : T > t n"1,1"# } { T : T > t n"1,1"# / 2 }<br />
1<br />
1<br />
2<br />
2<br />
1<br />
2<br />
!<br />
v.rohen
Con frecuencia nuestro interés está en el parámetro <strong>de</strong><br />
variabilidad, en cuyo caso po<strong>de</strong>mos hacer las pruebas<br />
sobre un valor específico <strong>de</strong> la varianza poblacional.<br />
Para ello nos basamos en el estimador <strong>de</strong>l estimador <strong>de</strong><br />
σ 2 que es una χ 2 con n-1 grados <strong>de</strong> libertad.<br />
<strong>Hipótesis</strong><br />
Nula<br />
Alternativa<br />
H<br />
2 2<br />
1<br />
:! < !<br />
0<br />
H :! 2<br />
= ! 2<br />
0 0<br />
H :! 2<br />
> ! 2<br />
1 0<br />
H<br />
2 2<br />
1<br />
:! " !<br />
0<br />
Estadística<br />
<strong>de</strong> Prueba<br />
X 2 =<br />
(n " 1)S<br />
2<br />
# 0<br />
2<br />
R. Rechazo<br />
!<br />
X 2 : X 2 2<br />
{ < " n#1,$ }<br />
!<br />
!<br />
X 2 : X 2 2<br />
{ > " n#1,1#$ }<br />
!<br />
%'<br />
&<br />
('<br />
X 2 : X 2 2<br />
< " n#1,$ / 2<br />
X 2 : X 2 2<br />
> " n#1,1#$ / 2<br />
ó<br />
)'<br />
*<br />
+ '<br />
v.rohen
El supuesto <strong>de</strong> varianzas iguales que se ha hecho al comparar<br />
las medias <strong>de</strong> dos poblaciones, <strong>de</strong>berá ahora probarse<br />
mediante la estadística F<br />
<strong>Hipótesis</strong><br />
Nula<br />
Alternativa<br />
Estadística<br />
<strong>de</strong> Prueba<br />
R. Rechazo<br />
!<br />
H<br />
2 2<br />
1<br />
:! 1<br />
< !<br />
2<br />
H :! 2<br />
= ! 2<br />
0 1 2<br />
2 2<br />
1<br />
:! 1<br />
> !<br />
2<br />
H<br />
{ }<br />
{ }<br />
F = max S 2 2<br />
1<br />
,S 2<br />
min S 2 2<br />
1<br />
,S 2<br />
{ F : F > F n1 "1,n 2 "1,1"#}<br />
!<br />
!<br />
H<br />
2 2<br />
1<br />
:! 1<br />
" !<br />
2<br />
{ F : F > F n1 "1,n 2 "1,1"# / 2}<br />
v.rohen
valor-p es el nivel <strong>de</strong> significancia alcanzado.<br />
El nivel <strong>de</strong> significancia más pequeño al cual los<br />
datos observados indican que la hipótesis nula<br />
<strong>de</strong>be ser rechazada.<br />
Si W es una estadística <strong>de</strong> prueba y w 0 es el<br />
valor observado, el valor-p nos indica la<br />
probabilidad <strong>de</strong> que w 0 sea un valor extremo:<br />
( ! w cuando H es cierta)<br />
valor " p = P W 0,<br />
0<br />
( ! w cuando H es cierta)<br />
valor " p = P W , 0 0<br />
v.rohen
Prueba acerca <strong>de</strong>l Coeficiente <strong>de</strong> Correlación<br />
Si queremos ver si realmente existe una medida <strong>de</strong><br />
relación lineal entre dos variables X y Y en una<br />
población que tiene una distribución bivariada normal,<br />
la hipótesis será H o<br />
: " = 0 .<br />
Usamos la estadística <strong>de</strong> prueba<br />
!<br />
que tiene una distribución t-Stu<strong>de</strong>nt con n-2 grados <strong>de</strong><br />
libertad.<br />
!<br />
T = r<br />
n " 2<br />
1" r 2<br />
v.rohen
Si la población bivariada está lejos <strong>de</strong> una normal,<br />
po<strong>de</strong>mos usar los rangos <strong>de</strong> las medidas <strong>de</strong> cada variable<br />
y calcular la medida <strong>de</strong> relación conocida como coeficiente<br />
<strong>de</strong> correlación rangos <strong>de</strong> Spearman<br />
d 2<br />
i<br />
r s<br />
=1" 6<br />
n<br />
#<br />
i=1<br />
n 3 " n<br />
don<strong>de</strong> d i es la diferencia entre los rangos <strong>de</strong> X y los <strong>de</strong> Y.<br />
El valor crítico se busca en tablas <strong>de</strong> Coeficiente <strong>de</strong><br />
Correlación ! <strong>de</strong> Rangos <strong>de</strong> Spearman<br />
(Cf. J.H.Zar.- Biostatistical Analysis)<br />
v.rohen
Referencias<br />
http://ftp.medprev.uma.es/libro/html.htm<br />
http://www.hrc.es/bioest/M_docente.html<br />
http://ocw.jhsph.edu/Topics.cfmtopic_id=33<br />
http://www.ncbi.nlm.nih.gov/pmc/articles/PMC1199583/tool=pubmed<br />
Zar, Jerrold H.- Biostatistical Analysis.- 4rd ed.- Prentice Hall, Inc