01.02.2015 Views

Pruebas de Hipótesis

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Pruebas</strong> <strong>de</strong><br />

<strong>Hipótesis</strong>


<strong>Pruebas</strong> <strong>de</strong> <strong>Hipótesis</strong><br />

Otra manera <strong>de</strong> hacer inferencia es haciendo una<br />

afirmación acerca <strong>de</strong>l valor que el parámetro <strong>de</strong> la<br />

población bajo estudio pue<strong>de</strong> tomar. Esta<br />

afirmación pue<strong>de</strong> estar basada en alguna creencia<br />

o experiencia pasada que será contrastada con la<br />

evi<strong>de</strong>ncia que nosotros obtengamos a través <strong>de</strong> la<br />

información contenida en la muestra. Esto es a lo<br />

que llamamos Prueba <strong>de</strong> <strong>Hipótesis</strong><br />

v.rohen


Una prueba <strong>de</strong> hipótesis compren<strong>de</strong> cuatro<br />

componentes principales:<br />

-<strong>Hipótesis</strong> Nula<br />

-<strong>Hipótesis</strong> Alternativa<br />

-Estadística <strong>de</strong> Prueba<br />

-Región <strong>de</strong> Rechazo<br />

v.rohen


La <strong>Hipótesis</strong> Nula, <strong>de</strong>notada como H 0 siempre<br />

especifica un solo valor <strong>de</strong>l parámetro <strong>de</strong> la<br />

población si la hipótesis es simple o un conjunto <strong>de</strong><br />

valores si es compuesta (es lo que queremos<br />

<strong>de</strong>sacreditar)<br />

H 0<br />

: µ " µ 0<br />

H 0<br />

: µ " µ 0<br />

!<br />

H 0<br />

: µ = µ 0<br />

La <strong>Hipótesis</strong> Alternativa, <strong>de</strong>notada como H 1 es la<br />

que respon<strong>de</strong> nuestra pregunta, la que se establece<br />

en base a la ! evi<strong>de</strong>ncia que tenemos. ! Pue<strong>de</strong> tener<br />

cuatro formas:<br />

H1<br />

: µ = µ<br />

1<br />

H1<br />

: µ > µ<br />

0<br />

H1<br />

: µ < µ<br />

0<br />

H1<br />

: µ ! µ<br />

0<br />

v.rohen


Como las conclusiones a las que lleguemos se<br />

basan en una muestra, hay posibilida<strong>de</strong>s <strong>de</strong><br />

que nos equivoquemos.<br />

Dos <strong>de</strong>cisiones correctas son posibles:<br />

Rechazar H 0 cuando es falsa<br />

No Rechazar H 0 cuando es verda<strong>de</strong>ra.<br />

Dos <strong>de</strong>cisiones incorrectas son posibles:<br />

Rechazar H 0 cuando es verda<strong>de</strong>ra<br />

No Rechazar H 0 cuando es falsa.<br />

v.rohen


Tamaño <strong>de</strong> los errores al tomar una <strong>de</strong>cisión<br />

incorrecta en una Prueba <strong>de</strong> <strong>Hipótesis</strong><br />

H<br />

0 Verda<strong>de</strong>ra<br />

H 0 Falsa<br />

Rechazamos H<br />

0<br />

Error Tipo I<br />

P(error Tipo I) = α<br />

Decisión Correcta<br />

No Rechazamos H<br />

0<br />

Decisión Correcta<br />

Error Tipo II<br />

P(error Tipo II) = β<br />

v.rohen


La Probabilidad <strong>de</strong> cometer un error Tipo I se<br />

conoce como Nivel <strong>de</strong> Significancia, se <strong>de</strong>nota<br />

como α y es el tamaño <strong>de</strong> la región <strong>de</strong> rechazo<br />

El complemento <strong>de</strong> la región <strong>de</strong> rechazo es 1−α<br />

y es conocido como el Coeficiente <strong>de</strong> Confianza<br />

En una prueba <strong>de</strong> <strong>Hipótesis</strong> <strong>de</strong> dos colas la<br />

región <strong>de</strong> no rechazo correspon<strong>de</strong> a un<br />

intervalo <strong>de</strong> confianza para el parámetro en<br />

cuestión<br />

v.rohen


La Región <strong>de</strong> Rechazo es el conjunto <strong>de</strong> valores<br />

tales que si la prueba estadística cae <strong>de</strong>ntro <strong>de</strong><br />

este rango, <strong>de</strong>cidimos rechazar la <strong>Hipótesis</strong> Nula<br />

Su localización <strong>de</strong>pen<strong>de</strong> <strong>de</strong> la forma <strong>de</strong> la<br />

<strong>Hipótesis</strong> Alternativa:<br />

Si H1 : µ > µ 0<br />

entonces la región se encuentra en<br />

la cola <strong>de</strong>recha <strong>de</strong> la distribución <strong>de</strong> la<br />

estadística <strong>de</strong> prueba.<br />

v.rohen


Si H entonces la región se encuentra en<br />

1<br />

: µ < µ<br />

0<br />

la cola izquierda <strong>de</strong> la distribución <strong>de</strong> la<br />

estadística <strong>de</strong> prueba<br />

Si H : µ ! µ 1 0 entonces la región se divi<strong>de</strong> en dos<br />

partes, una parte estará en la cola <strong>de</strong>recha <strong>de</strong> la<br />

distribución <strong>de</strong> la estadística <strong>de</strong> prueba y la otra<br />

en la cola izquierda <strong>de</strong> la distribución <strong>de</strong> la<br />

estadística <strong>de</strong> prueba.<br />

v.rohen


Conclusiones <strong>de</strong> una Prueba <strong>de</strong> <strong>Hipótesis</strong><br />

Si rechazamos la <strong>Hipótesis</strong> Nula, concluimos<br />

que “hay suficiente evi<strong>de</strong>ncia estadística para<br />

inferir que la hipótesis nula es falsa”<br />

Si no rechazamos la <strong>Hipótesis</strong> Nula, concluimos<br />

que “no hay suficiente evi<strong>de</strong>ncia estadística<br />

para inferir que la hipótesis nula es falsa”<br />

v.rohen


H1 : µ > µ 0<br />

v.rohen


H : µ ! µ 1 0<br />

v.rohen


La Estadística <strong>de</strong> Prueba es una estadística que se<br />

<strong>de</strong>riva <strong>de</strong>l estimador puntual <strong>de</strong>l parámetro que<br />

estemos probando y en ella basamos nuestra<br />

<strong>de</strong>cisión acerca <strong>de</strong> si rechazar o no rechazar la<br />

<strong>Hipótesis</strong> Nula<br />

Ejemplo:<br />

Z = ˆ µ " µ 0<br />

#<br />

n<br />

Siempre se calcula consi<strong>de</strong>rando la <strong>Hipótesis</strong><br />

Nula como si fuera verda<strong>de</strong>ra.<br />

!<br />

v.rohen


Para el caso específico <strong>de</strong> la media poblacional µ,<br />

2<br />

el estimador es µˆ = X cuya varianza es ! n .<br />

Supondremos que conocemos la varianza<br />

2<br />

poblacional !<br />

<strong>Hipótesis</strong><br />

Nula<br />

: µ = µ 0 0<br />

Alternativa<br />

Estadística<br />

<strong>de</strong> Prueba<br />

R. Rechazo<br />

H H<br />

1<br />

: µ < µ 0<br />

H1 : µ > µ<br />

0 H<br />

1<br />

: µ ! µ<br />

0<br />

Z<br />

µ " µ<br />

0<br />

= ˆ<br />

!<br />

{ }<br />

{ }<br />

{ Z : Z < Z " } Z : Z > Z 1"# Z : Z > Z 1"# / 2<br />

X<br />

v.rohen


Si nuestro propósito está en la proporción <strong>de</strong> éxitos p,<br />

el estimador será p ˆ = X que tiene distribución<br />

n<br />

aproximada normal con media p y varianza p(1-p)/n,<br />

don<strong>de</strong> p toma el valor propuesto por la hipótesis nula.<br />

<strong>Hipótesis</strong> !<br />

Nula<br />

Alternativa<br />

Estadística<br />

<strong>de</strong> Prueba<br />

R. Rechazo<br />

H : p = p 0 0<br />

H : p < p 1 0<br />

H<br />

1<br />

: p > p H : p ! p<br />

0 1 0<br />

p<br />

Z = ˆ " p 0<br />

# p ˆ<br />

{ }<br />

{ Z : Z < Z " } Z : Z > Z 1"# Z : Z > Z 1"# / 2<br />

{ }<br />

!<br />

v.rohen


Cuando la varianza poblacional no es conocida,<br />

sabemos que la po<strong>de</strong>mos estimar con la varianza<br />

muestral, siendo la distribución <strong>de</strong> la estadística <strong>de</strong><br />

prueba una t - Stu<strong>de</strong>nt con n-1 grados <strong>de</strong> libertad.<br />

<strong>Hipótesis</strong><br />

Nula<br />

: µ = µ 0 0<br />

Alternativa<br />

Estadística<br />

<strong>de</strong> Prueba<br />

R. Rechazo<br />

H H : µ < µ 1 0<br />

H1 : µ > µ H : µ ! µ<br />

0 1 0<br />

{ T : T < t n"1,# }<br />

!<br />

T = ˆ µ " µ 0<br />

S n<br />

{ T : T > t n"1,1"# } { T : T > t n"1,1"# / 2 }<br />

v.rohen


!<br />

Para el caso <strong>de</strong> comparar las medias <strong>de</strong> dos<br />

poblaciones in<strong>de</strong>pendientes (tamaño <strong>de</strong> muestras<br />

gran<strong>de</strong>), y las varianzas son conocidas, la prueba se<br />

realiza <strong>de</strong> la siguiente manera:<br />

<strong>Hipótesis</strong><br />

Nula<br />

: µ = µ<br />

0 1 2<br />

Alternativa<br />

Estadística<br />

<strong>de</strong> Prueba<br />

R. Rechazo<br />

H H1 : µ<br />

1<br />

< µ<br />

2<br />

H1 : µ<br />

1<br />

> µ<br />

2<br />

H1 : µ<br />

1<br />

! µ<br />

2<br />

Z = X 1 " X 2<br />

# + #<br />

{ Z : Z < Z " } { Z : Z > Z 1"# } { Z : Z > Z 1"# / 2 }<br />

X1<br />

X 2<br />

!<br />

v.rohen


!<br />

Si la comparación es <strong>de</strong> proporciones <strong>de</strong> dos<br />

poblaciones in<strong>de</strong>pendientes, la prueba será<br />

<strong>Hipótesis</strong><br />

Nula<br />

Alternativa<br />

Estadística<br />

<strong>de</strong> Prueba<br />

H : p = p<br />

0 1 2<br />

H : p < p<br />

1 1 2<br />

H<br />

1<br />

: p1<br />

> p H : p ! p<br />

2 1 1 2<br />

Z =<br />

p ˆ 1<br />

" p ˆ 2<br />

( )<br />

p ˆ (1" p ˆ ) 1 n 1<br />

+ 1 n 2<br />

R. Rechazo<br />

X<br />

1 2<br />

don<strong>de</strong> ˆ .<br />

p<br />

=<br />

n<br />

1<br />

+<br />

X<br />

+ n<br />

2<br />

Recor<strong>de</strong>mos<br />

!<br />

que para usar<br />

!<br />

la aproximación normal es necesario que<br />

, don<strong>de</strong> n<br />

!<br />

es el tamaño <strong>de</strong> la muestra i (i=1,2)<br />

n i<br />

p > 5<br />

{ }<br />

Z : Z < Z "<br />

!<br />

i<br />

{ Z : Z > Z 1"# }<br />

{ Z : Z > Z 1"# / 2 }<br />

v.rohen


Para la diferencia <strong>de</strong> medias po<strong>de</strong>mos suponer que las<br />

varianzas poblacionales son iguales (este hecho se tiene que<br />

probar como se muestra mas a<strong>de</strong>lante).<br />

<strong>Hipótesis</strong><br />

Nula<br />

Alternativa<br />

Estadística<br />

<strong>de</strong> Prueba<br />

H<br />

0<br />

: µ<br />

1=<br />

µ<br />

2<br />

H H : µ > µ<br />

1<br />

: µ<br />

1<br />

< µ<br />

2<br />

H<br />

1 1 2<br />

1<br />

: µ<br />

1<br />

! µ<br />

2<br />

T = X 1 " X 2<br />

S p<br />

1<br />

n 1<br />

+ 1 n 2<br />

R. Rechazo<br />

2 ! 2<br />

2 ( n1<br />

! 1) S1<br />

+ ( n2<br />

1) S<br />

2<br />

Don<strong>de</strong> S =<br />

es el estimador <strong>de</strong> varianza mínima para σ 2 p<br />

.<br />

n + n ! 2<br />

!<br />

{ }<br />

T : T < t n"1,#<br />

1<br />

2<br />

!<br />

{ T : T > t n"1,1"# }<br />

La prueba se basa en una t con n 1 -n 2 -2 grados <strong>de</strong> libertad.<br />

!<br />

{ T : T > t n"1,1"# / 2 }<br />

v.rohen


Para la diferencia <strong>de</strong> medias cuando nuestras muestras están<br />

pareadas (misma medición, misma unidad experimental,<br />

circunstancias diferentes) po<strong>de</strong>mos usar la prueba <strong>de</strong><br />

diferencia <strong>de</strong> medias. Sin embargo <strong>de</strong>bemos notar que la<br />

varianza <strong>de</strong> la diferencia <strong>de</strong> medias lleva implícita la<br />

2 2 2<br />

covarianza entre los estimadores<br />

<strong>Hipótesis</strong><br />

Nula<br />

Alternativa<br />

Estadística <strong>de</strong><br />

Prueba<br />

R. Rechazo<br />

H<br />

0<br />

X1 y X 2<br />

( )<br />

: µ µ !"<br />

H : µ = 0 µ = µ ! µ<br />

1<br />

= 2<br />

0 D<br />

D<br />

H<br />

1<br />

: µ<br />

D<br />

< 0 H<br />

1<br />

: µ D<br />

> 0 H<br />

1<br />

: µ D<br />

! 0<br />

{ T : T < t n"1,# }<br />

T =<br />

S D<br />

D<br />

n<br />

(! = ! + ! # 2 "! ! )<br />

D<br />

{ T : T > t n"1,1"# } { T : T > t n"1,1"# / 2 }<br />

1<br />

1<br />

2<br />

2<br />

1<br />

2<br />

!<br />

v.rohen


Con frecuencia nuestro interés está en el parámetro <strong>de</strong><br />

variabilidad, en cuyo caso po<strong>de</strong>mos hacer las pruebas<br />

sobre un valor específico <strong>de</strong> la varianza poblacional.<br />

Para ello nos basamos en el estimador <strong>de</strong>l estimador <strong>de</strong><br />

σ 2 que es una χ 2 con n-1 grados <strong>de</strong> libertad.<br />

<strong>Hipótesis</strong><br />

Nula<br />

Alternativa<br />

H<br />

2 2<br />

1<br />

:! < !<br />

0<br />

H :! 2<br />

= ! 2<br />

0 0<br />

H :! 2<br />

> ! 2<br />

1 0<br />

H<br />

2 2<br />

1<br />

:! " !<br />

0<br />

Estadística<br />

<strong>de</strong> Prueba<br />

X 2 =<br />

(n " 1)S<br />

2<br />

# 0<br />

2<br />

R. Rechazo<br />

!<br />

X 2 : X 2 2<br />

{ < " n#1,$ }<br />

!<br />

!<br />

X 2 : X 2 2<br />

{ > " n#1,1#$ }<br />

!<br />

%'<br />

&<br />

('<br />

X 2 : X 2 2<br />

< " n#1,$ / 2<br />

X 2 : X 2 2<br />

> " n#1,1#$ / 2<br />

ó<br />

)'<br />

*<br />

+ '<br />

v.rohen


El supuesto <strong>de</strong> varianzas iguales que se ha hecho al comparar<br />

las medias <strong>de</strong> dos poblaciones, <strong>de</strong>berá ahora probarse<br />

mediante la estadística F<br />

<strong>Hipótesis</strong><br />

Nula<br />

Alternativa<br />

Estadística<br />

<strong>de</strong> Prueba<br />

R. Rechazo<br />

!<br />

H<br />

2 2<br />

1<br />

:! 1<br />

< !<br />

2<br />

H :! 2<br />

= ! 2<br />

0 1 2<br />

2 2<br />

1<br />

:! 1<br />

> !<br />

2<br />

H<br />

{ }<br />

{ }<br />

F = max S 2 2<br />

1<br />

,S 2<br />

min S 2 2<br />

1<br />

,S 2<br />

{ F : F > F n1 "1,n 2 "1,1"#}<br />

!<br />

!<br />

H<br />

2 2<br />

1<br />

:! 1<br />

" !<br />

2<br />

{ F : F > F n1 "1,n 2 "1,1"# / 2}<br />

v.rohen


valor-p es el nivel <strong>de</strong> significancia alcanzado.<br />

El nivel <strong>de</strong> significancia más pequeño al cual los<br />

datos observados indican que la hipótesis nula<br />

<strong>de</strong>be ser rechazada.<br />

Si W es una estadística <strong>de</strong> prueba y w 0 es el<br />

valor observado, el valor-p nos indica la<br />

probabilidad <strong>de</strong> que w 0 sea un valor extremo:<br />

( ! w cuando H es cierta)<br />

valor " p = P W 0,<br />

0<br />

( ! w cuando H es cierta)<br />

valor " p = P W , 0 0<br />

v.rohen


Prueba acerca <strong>de</strong>l Coeficiente <strong>de</strong> Correlación<br />

Si queremos ver si realmente existe una medida <strong>de</strong><br />

relación lineal entre dos variables X y Y en una<br />

población que tiene una distribución bivariada normal,<br />

la hipótesis será H o<br />

: " = 0 .<br />

Usamos la estadística <strong>de</strong> prueba<br />

!<br />

que tiene una distribución t-Stu<strong>de</strong>nt con n-2 grados <strong>de</strong><br />

libertad.<br />

!<br />

T = r<br />

n " 2<br />

1" r 2<br />

v.rohen


Si la población bivariada está lejos <strong>de</strong> una normal,<br />

po<strong>de</strong>mos usar los rangos <strong>de</strong> las medidas <strong>de</strong> cada variable<br />

y calcular la medida <strong>de</strong> relación conocida como coeficiente<br />

<strong>de</strong> correlación rangos <strong>de</strong> Spearman<br />

d 2<br />

i<br />

r s<br />

=1" 6<br />

n<br />

#<br />

i=1<br />

n 3 " n<br />

don<strong>de</strong> d i es la diferencia entre los rangos <strong>de</strong> X y los <strong>de</strong> Y.<br />

El valor crítico se busca en tablas <strong>de</strong> Coeficiente <strong>de</strong><br />

Correlación ! <strong>de</strong> Rangos <strong>de</strong> Spearman<br />

(Cf. J.H.Zar.- Biostatistical Analysis)<br />

v.rohen


Referencias<br />

http://ftp.medprev.uma.es/libro/html.htm<br />

http://www.hrc.es/bioest/M_docente.html<br />

http://ocw.jhsph.edu/Topics.cfmtopic_id=33<br />

http://www.ncbi.nlm.nih.gov/pmc/articles/PMC1199583/tool=pubmed<br />

Zar, Jerrold H.- Biostatistical Analysis.- 4rd ed.- Prentice Hall, Inc

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!