12.07.2015 Views

Pruebas de hipótesis

Pruebas de hipótesis

Pruebas de hipótesis

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Pruebas</strong> <strong>de</strong> hipótesisI. Introducción........................................................................................................ 1A. Premisas e hipótesis ............................................................................................... 1B. Incertidumbre en las <strong>de</strong>cisiones.............................................................................. 1C. Hipótesis nula y alternativa ..................................................................................... 2D. Tipos <strong>de</strong> error y po<strong>de</strong>r <strong>de</strong> la prueba........................................................................ 3E. <strong>Pruebas</strong> <strong>de</strong> hipótesis para la media poblacional ..................................................... 5F. Valor p ..................................................................................................................... 9G. Po<strong>de</strong>r <strong>de</strong> la prueba ................................................................................................. 9© 2005-07 Pedro Juan Rodríguez Esquerdo PhD, JDDepartamento <strong>de</strong> MatemáticasUniversidad <strong>de</strong> Puerto RicoRecinto <strong>de</strong> Río PiedrasPO Box 23355SJ, PR, 00931pirodriguez@uprrp.edu


I. IntroducciónA. Premisas e hipótesisUna persona es arrestada y se le acusa <strong>de</strong> cometer algún crimen. Inicialmente, estapersona es consi<strong>de</strong>rada inocente. Usando los datos o evi<strong>de</strong>ncia disponible el fiscal <strong>de</strong>be<strong>de</strong>mostrar que sin duda razonable, la persona en efecto cometió el crimen. En el sistemajudicial, como lo ilustra este ejemplo, se parte <strong>de</strong> unas premisas, se examinan los datos y conbase en esos datos, se toma una <strong>de</strong>cisión, la <strong>de</strong> encontrar la persona culpable o no. Esapremisa inicial, la que se supone cierta hasta que no se <strong>de</strong>muestre lo contrario se conoce comola hipótesis nula.Las hipótesis proveen una indicación sobre el tipo <strong>de</strong> comportamiento quegeneralmente se <strong>de</strong>be esperar en toda la población. Es <strong>de</strong>cir, se plantean las hipótesis sobreel comportamiento general <strong>de</strong>l todo, <strong>de</strong> la población, y mientras lo que se observa seaconsistente con la premisa, no surge razón para cuestionarlas. En estadísticas es <strong>de</strong> interésestablecer y comprobar hipótesis sobre aquellos parámetros poblacionales que <strong>de</strong>terminan oinfluyen el comportamiento <strong>de</strong> lo que observamos. Las hipótesis estadísticas se establecenentonces para tomar <strong>de</strong>cisiones sobre el valor <strong>de</strong> algún parámetro poblacional.En el diario vivir usualmente no se hacen explícitas estas premisas. En muchasocasiones se actúa <strong>de</strong> una manera consistente ante situaciones similares sin pensar en larazón o premisa por la cual actuamos así. Para <strong>de</strong>scubrir estas premisas es necesario hacersela pregunta ¿Por qué actuamos así? ¿Por qué actuamos con sospecha cuando estamos <strong>de</strong>madrugada en algún lugar remoto y oscuro y se nos acerca un individuo? ¿Por qué insistenalgunas tiendas y lugares comerciales en cotejar el recibo <strong>de</strong> compra <strong>de</strong> los clientes cuandosalen <strong>de</strong> la tienda?Formular premisas, que luego se expresan en reglas concretas que guían nuestrasacciones, es necesario para funcionar a<strong>de</strong>cuadamente en la sociedad e incluso para preservarla vida. En la ciencia social o natural estas premisas forman parte <strong>de</strong> la metodología <strong>de</strong> estudio<strong>de</strong> algún problema. Algunos ejemplos <strong>de</strong> premisas son:• un maestro parte <strong>de</strong> la premisa <strong>de</strong> que el estudiante asiste al curso con el <strong>de</strong>seo <strong>de</strong>apren<strong>de</strong>r;• un electricista <strong>de</strong>be partir <strong>de</strong> la premisa <strong>de</strong> que la conexión eléctrica que va a revisarestá viva con corriente eléctrica;• la sociedad parte <strong>de</strong> la premisa <strong>de</strong> que una persona es inocente hasta tanto sepruebe lo contrario mas allá <strong>de</strong> duda razonable;• <strong>de</strong>pendiendo <strong>de</strong>l lugar don<strong>de</strong> vivamos, po<strong>de</strong>mos partir <strong>de</strong> la premisa <strong>de</strong> que lapersona que maneja el otro vehículo en la intersección respetará la señal <strong>de</strong> Pare oAlto;• un médico investigador parte <strong>de</strong> la premisa <strong>de</strong> que el nuevo medicamento no surtiráefecto alguno;• un sicólogo parte <strong>de</strong> la premisa <strong>de</strong> que dos grupos <strong>de</strong> individuos sometidos atratamientos distintos no mostrarán diferencias en su comportamiento.B. Incertidumbre en las <strong>de</strong>cisionesAl partir <strong>de</strong> la premisa <strong>de</strong> que la conexión eléctrica está viva, el electricista tomará las<strong>de</strong>bidas precauciones para preservar su vida. Este usará una prueba sencilla para <strong>de</strong>terminar<strong>de</strong> forma inequívoca si en efecto la conexión está viva. Luego <strong>de</strong> hacer esta <strong>de</strong>terminaciónpodrá trabajar con seguridad en la conexión.


<strong>Pruebas</strong> <strong>de</strong> Hipótesis página 2El tomar una <strong>de</strong>cisión sobre la efectividad <strong>de</strong>l medicamento o sobre las diferencias <strong>de</strong>comportamiento <strong>de</strong> dos grupos es una tarea un tanto más compleja. Es poco común obtenerevi<strong>de</strong>ncia inequívoca <strong>de</strong> efectividad o <strong>de</strong> diferencias. Esto se <strong>de</strong>be a la presencia natural <strong>de</strong>variabilidad en todo lo que observamos o medimos. Aún medidas <strong>de</strong> peso, volumen, área,concentración, tiempo y otras mostrarán variabilidad cuando el mismo objeto se somete amedidas repetidas con el mismo instrumento. Esto se <strong>de</strong>be a que las respuestas <strong>de</strong> losindividuos a los tratamientos y las medidas con instrumentos contienen elementos <strong>de</strong> variación.Primero, un individuo pue<strong>de</strong> reaccionar <strong>de</strong> forma distinta en distintas ocasiones, aún ante elmismo estímulo. Segundo, aunque las reacciones pue<strong>de</strong>n ser similares, dos individuosdistintos no reaccionan <strong>de</strong> forma idéntica ante el mismo estímulo. Tercero, los instrumentostienen una precisión limitada. Finalmente, los individuos u objetos que participan <strong>de</strong>l estudioson sólo una muestra <strong>de</strong> la población <strong>de</strong> todos los posibles individuos que podríanpotencialmente participar, lo cual aña<strong>de</strong> variación <strong>de</strong>bido al muestreo.En la mayoría <strong>de</strong> las ocasiones, cuando hay variabilidad presente, no observaremosevi<strong>de</strong>ncia inequívoca sobre el problema que intentamos resolver. La evi<strong>de</strong>ncia que se presentepue<strong>de</strong> tener alguna gradación <strong>de</strong> fortaleza en contra <strong>de</strong> la premisa inicial o hipótesis nula.Debemos entonces quedar satisfechos con <strong>de</strong>cisiones que necesariamente contendrán unaprobabilidad pequeña o controlada <strong>de</strong> ser erróneas, pero que tienen una probabilidad gran<strong>de</strong><strong>de</strong> ser correctas.C. Hipótesis nula y alternativaLa premisa <strong>de</strong> la cual se parte sobre el comportamiento <strong>de</strong> la población se conoce comola hipótesis nula. Se le llama nula pues la misma generalmente indica, por ejemplo, que lamedia poblacional es cero; que no hay diferencia entre los parámetros asociados a grupos enla población; o que el medicamento no es efectivo en la población <strong>de</strong> pacientes. La hipótesisnula se <strong>de</strong>nota usualmente en símbolos por H 0 . El cero nos recuerda que se parte <strong>de</strong> lapremisa <strong>de</strong> que el efecto es nulo o que las diferencias entre los grupos es cero.Al hacer investigaciones es usual pensar en una hipótesis <strong>de</strong> investigación, tal como:<strong>de</strong>mostrar que el medicamento es efectivo; <strong>de</strong>mostrar que hay una diferencia significativa en laejecución en una prueba entre individuos que durmieron toda la noche e individuos que nodurmieron, o que unas plantas tratadas con hormonas crecen más que el grupo control. Estahipótesis, lo que el investigador <strong>de</strong>sea <strong>de</strong>mostrar sobre la población, se conoce como lahipótesis alternativa y se <strong>de</strong>nota por H a .H 0 : premisa <strong>de</strong> cual la partimos sobre lapoblaciónH a : lo que <strong>de</strong>seamos <strong>de</strong>mostrar sobre lapoblaciónLo que el investigador <strong>de</strong>sea <strong>de</strong>mostrar es parte <strong>de</strong> la hipótesis alternativa y no <strong>de</strong> lanula por varias razones. Una razón es que partir <strong>de</strong> una premisa contraria a lo que <strong>de</strong>seamos<strong>de</strong>mostrar, y luego encontrar evi<strong>de</strong>ncia concreta que nos lleve a rechazarla es un argumentomás contun<strong>de</strong>nte que presumir que lo queremos <strong>de</strong>mostrar es cierto para luego encontrarevi<strong>de</strong>ncia que apoya nuestro reclamo. En este último caso pue<strong>de</strong> reclamarse que observamosesos resultados sencillamente porque <strong>de</strong> acuerdo con nuestra premisa, esperábamos que asífuera. Otra razón es que <strong>de</strong> esta manera po<strong>de</strong>mos controlar matemáticamente la probabilidad<strong>de</strong> cometer algunos tipos <strong>de</strong> error.La última razón requiere un poco <strong>de</strong> razonamiento lógico. La hipótesis <strong>de</strong> investigaciónpodría plantearse <strong>de</strong> la forma: Si H 0 : es cierta entonces ocurre B. El observar B no <strong>de</strong>muestra© 2004-2007 PJ Rodríguez Esquerdo


<strong>Pruebas</strong> <strong>de</strong> Hipótesis página 4observados, es posible que los datos lleven a que se rechace la hipótesis nula aún siendocierta. En esta situación los datos obtenidos no reflejan el comportamiento <strong>de</strong> la población, lamuestra usada no es representativa <strong>de</strong> la población.Este tipo <strong>de</strong> error, el <strong>de</strong> obtener datos que llevan a rechazar la hipótesis nula cuando escierta, se conoce como error tipo I. La probabilidad <strong>de</strong> cometer error tipo I se pue<strong>de</strong> controlary reducir, pero sólo se pue<strong>de</strong> eliminar si nunca tomamos la <strong>de</strong>cisión <strong>de</strong> rechazar la hipótesisnula. Esta última situación no es <strong>de</strong>seable ya que nos llevaría a nunca <strong>de</strong>scartar premisaalguna, no importa cuan irracional sea la misma o cuánto los datos obtenidos contradigan esapremisa. La probabilidad <strong>de</strong> cometer error tipo I se conoce también como la significancia <strong>de</strong>la prueba y se <strong>de</strong>nota usualmente por la letra griega alfa α. La probabilidad <strong>de</strong> cometer errortipo I se escribe por medio <strong>de</strong> una probabilidad condicional <strong>de</strong> la siguiente manera:α = P( Rechazar H 0 | H 0 es cierta).Los valores para la significancia <strong>de</strong> una prueba <strong>de</strong> uso más común en la literaturacientífica son .01, .05 y .10. La significancia es en ocasiones presentada como un por ciento,tal como 1%, 5% o 10%. Esto quiere <strong>de</strong>cir que el investigador está dispuesto a permitir unaprobabilidad <strong>de</strong> .01, .05, o .10 <strong>de</strong> cometer un error tipo I: rechazar la hipótesis nula cuando escierta.El valor <strong>de</strong> la significancia es seleccionado en una <strong>de</strong> varias formas antes <strong>de</strong> comenzara hacer el experimento o estudio. El valor <strong>de</strong> α pue<strong>de</strong> estar dictado por el uso y costumbre <strong>de</strong>la disciplina, por ejemplo, <strong>de</strong> los artículos que se publican en revistas científicas. Otra forma <strong>de</strong>seleccionarlo es que sencillamente sea impuesto por la persona o compañía para la cualtrabajamos y que pagan nuestro salario. Finalmente, pue<strong>de</strong> ser seleccionado tomando encuenta el costo <strong>de</strong> cometer un error tipo I. Mientras más alto el costo <strong>de</strong> este tipo <strong>de</strong> error, máspequeña <strong>de</strong>be ser la probabilidad α <strong>de</strong> cometer error tipo I. El valor usual <strong>de</strong> α en las cienciasnaturales y sociales es <strong>de</strong> .05.I<strong>de</strong>almente se <strong>de</strong>searía que la probabilidad <strong>de</strong> error tipo I fuera igual a cero. Sinembargo, si se <strong>de</strong>sea α = 0, nunca se podría tomar la <strong>de</strong>cisión <strong>de</strong> rechazar la hipótesis nula.Siempre que se tome la <strong>de</strong>cisión <strong>de</strong> rechazar la hipótesis nula, ya que la <strong>de</strong>cisión se basa enuna muestra y no en la población, existe la posibilidad <strong>de</strong> cometer un error tipo I.Como ilustración se pue<strong>de</strong> pensar en la situación en que un individuo es acusado <strong>de</strong> uncrimen. La hipótesis nula en este caso es H 0 : inocente, la hipótesis alternativa es H a : culpable.Un error tipo I sería el concluir que el individuo es culpable cuando es realmente inocente. Lasociedad entien<strong>de</strong> que esta situación es insostenible y aunque no se cuantifica, la probabilidad<strong>de</strong> error tipo I <strong>de</strong>be ser muy pequeña, ya que no se <strong>de</strong>sea enviar personas inocentes a prisión.Esta es una <strong>de</strong> las razones por la cual a un acusado, al igual que a todos nosotros, nos asistenmuchos <strong>de</strong>rechos.La única forma en que se pue<strong>de</strong> eliminar toda posibilidad <strong>de</strong> enviar una personainocente a la cárcel es nunca rechazando la hipótesis nula, es <strong>de</strong>cir, no importa la calidad ycantidad <strong>de</strong> la evi<strong>de</strong>ncia en contra, nunca se <strong>de</strong>scarta la inocencia <strong>de</strong> la persona. En estasituación nadie iría a la cárcel, no importa lo que hubiera hecho. Esto tendría algunosbeneficios para la sociedad, especialmente económicos. Por ejemplo, no habría que pagarpara mantener cárceles, pues estas no existirían. Tampoco serían necesarios jueces, fiscales,y otro personal <strong>de</strong> los tribunales y prisiones, y los legisladores no tendrían que ocupar parte <strong>de</strong>© 2004-2007 PJ Rodríguez Esquerdo


<strong>Pruebas</strong> <strong>de</strong> Hipótesis página 5su tiempo en revisar o redactar un código penal, la policía se usaría para otras funciones. Peronunca encontrar culpable a persona alguna tiene un costo que pue<strong>de</strong> ser mucho más alto quelos beneficios. Las personas podrían cometer cualquier tipo <strong>de</strong> fechoría impunemente.En el caso en que la hipótesis nula no sea cierta, en algunos casos los datos pue<strong>de</strong>nllevarnos a no rechazarla, llevándonos a cometer entonces un error tipo II. Usualmente nocontrolamos este tipo <strong>de</strong> error directamente. El lema <strong>de</strong> Neyman-Pearson 1 dice que una vez<strong>de</strong>cidimos el nivel <strong>de</strong> error tipo I aceptable para nuestro problema, la probabilidad <strong>de</strong> cometererror tipo II asume su valor mínimo al usar las pruebas estadísticas que estudiamos aquí. Estevalor mínimo no es cero e incluso pue<strong>de</strong> ser consi<strong>de</strong>rado muy alto por algunos. Es usual<strong>de</strong>notar la probabilidad <strong>de</strong> error tipo II por la letra griega β. También se representa por medio<strong>de</strong> una probabilidad condicional:β = P( No rechazar H 0 | H 0 es falsa).Tabla I-1 Resumen <strong>de</strong> los tipos <strong>de</strong> error estadísticoEstado <strong>de</strong> la realidadH 0 es ciertaH 0 es falsaDecisión Rechazar H 0 Error tipo I: α Decisión correctatomada No rechazar H 0 Decisión correcta Error tipo II: βLa cantidad 1 - β se conoce como el po<strong>de</strong>r <strong>de</strong> la prueba, es la probabilidad <strong>de</strong> rechazarH 0 cuando es falsa, cuando en realidad <strong>de</strong>be ser rechazada. I<strong>de</strong>almente se quiere tenerpruebas cuyo po<strong>de</strong>r sea alto. Así el po<strong>de</strong>r <strong>de</strong> la prueba se escribe:Π = 1 - β = P( Rechazar H 0 | H 0 es falsa).E. <strong>Pruebas</strong> <strong>de</strong> hipótesis para una media poblacionalUn estudio publicado en una revista profesional indica que la media <strong>de</strong>l largo <strong>de</strong> lashojas adultas <strong>de</strong>l árbol <strong>de</strong> Jobos es <strong>de</strong> 10 centímetros. El estudio también indica que lavarianza <strong>de</strong>l largo <strong>de</strong> esas hojas es <strong>de</strong> 1 centímetro. Un biólogo sospecha que por condiciones<strong>de</strong> clima y terreno particulares, las hojas <strong>de</strong>l árbol <strong>de</strong> Jobos que crece en un bosque húmedocercano son mas largas en promedio que lo indicado en el estudio. Sin embargo, el biólogo notiene razón para creer que la variabilidad <strong>de</strong>l largo sea distinta a la indicada en el estudio, por loque supone que aún para los árboles que <strong>de</strong>sea estudiar, la varianza poblacional σ 2 esconocida e igual a 1 cm., igual que en el estudio publicado.Ya que no cuenta con evi<strong>de</strong>ncia al contrario, el biólogo parte <strong>de</strong> la premisa <strong>de</strong> que lamedia poblacional <strong>de</strong> las hojas <strong>de</strong> los árboles que <strong>de</strong>sea estudiar es idéntica al valor publicadoen el estudio, µ = 10. Lo que <strong>de</strong>sea <strong>de</strong>mostrar el biólogo es que las hojas <strong>de</strong>l árbol <strong>de</strong> Jobosen el bosque que estudia tienen una media <strong>de</strong>l largo mayor a la <strong>de</strong>l estudio publicado. Así<strong>de</strong>sea comprobar las siguientes hipótesis:H 0 : µ = 10 cm. contra la hipótesis alternativa H a : µ > 10 cm.Para llevar a cabo este análisis el biólogo selecciona 100 hojas <strong>de</strong> estos árboles en lamisma manera en que se seleccionaron para el estudio publicado. Luego mi<strong>de</strong> su largo y1 Referencia© 2004-2007 PJ Rodríguez Esquerdo


<strong>Pruebas</strong> <strong>de</strong> Hipótesis página 6calcula la media X¯ <strong>de</strong> esa muestra <strong>de</strong> largos. Ya que la media muestral X¯ es un excelenteestimador <strong>de</strong> la media poblacional µ <strong>de</strong>l largo <strong>de</strong> las hojas <strong>de</strong> los árboles que le interesan y esla única información que posee, <strong>de</strong>be comparar esa media obtenida <strong>de</strong> la muestra, X¯ , con lamedia poblacional presumida µ 0 <strong>de</strong> 10 centímetros. En realidad el biólogo <strong>de</strong>sea rechazar suhipótesis nula a favor <strong>de</strong> la alternativa, lo cual <strong>de</strong>mostrará su sospecha. Pero esta <strong>de</strong>cisión<strong>de</strong>pen<strong>de</strong>rá exclusivamente <strong>de</strong> los datos que obtuvo.Si la hipótesis nula H 0 es cierta, la media muestral X¯ tendrá un valor cercano a µ = 10,aunque por la variabilidad natural <strong>de</strong> la naturaleza, por contar con una muestra y porque losinstrumentos tienen una precisión fija, este valor calculado <strong>de</strong> sus datos pue<strong>de</strong> ser un pocomayor <strong>de</strong> 10 o incluso menor <strong>de</strong> 10. Un valor observado <strong>de</strong> la media muestral mayor <strong>de</strong> 10centímetros le dará alguna evi<strong>de</strong>ncia, que pue<strong>de</strong> ser no muy contun<strong>de</strong>nte, para concluir que lamedia poblacional <strong>de</strong>l largo <strong>de</strong> las hojas en ese lugar es mayor <strong>de</strong> 10 cm. En el caso en que lamedia muestral resulte ser menor <strong>de</strong> 10 cm. nunca podrá <strong>de</strong>scartar la hipótesis nula, ya que laalternativa sólo incluye la posibilidad <strong>de</strong> que la media <strong>de</strong>l largo <strong>de</strong> las hojas <strong>de</strong> la población <strong>de</strong>árboles en el bosque húmedo sea mayor <strong>de</strong> 10 cm.Ahora, ¿cuánto mayor <strong>de</strong> 10 <strong>de</strong>be ser el valor <strong>de</strong> la media muestral para concluir que lamedia poblacional <strong>de</strong>l largo <strong>de</strong> la hojas en ese lugar es mayor <strong>de</strong> 10 cm.? Si presume que ellargo <strong>de</strong> las hojas tiene una distribución normal, tal como en el estudio, y si la mediapoblacional µ es realmente 10, ya que la distribución normal es simétrica alre<strong>de</strong>dor <strong>de</strong> sumedia, la mitad <strong>de</strong> las veces observará valores <strong>de</strong> la media <strong>de</strong> la muestra que son mayores <strong>de</strong>10. Es <strong>de</strong>cir, aún si la hipótesis nula es cierta, es muy común observar datos con una media X¯mayor <strong>de</strong> 10. El biólogo sólo rechazará la hipótesis nula en el caso que el valor calculado <strong>de</strong> X¯sea suficientemente mayor <strong>de</strong> 10 cm.Equivalentemente, para rechazar la hipótesis nula, X¯ <strong>de</strong>be ser mayor que un número wque a su vez es suficientemente mayor <strong>de</strong> 10. Así el biólogo rechazará H 0 si <strong>de</strong> sus datos,encuentra que X¯ > w > 10. Para encontrar el valor <strong>de</strong> w, el biólogo <strong>de</strong>berá seleccionar lasignificancia <strong>de</strong> la prueba, la probabilidad <strong>de</strong> error tipo I que es aceptable para su trabajo yutilizar una tabla <strong>de</strong> la distribución estadística apropiada, en este caso, la distribución normal.El biólogo lleva a cabo el estudio y obtiene un valor <strong>de</strong> la media muestral X¯ para ellargo <strong>de</strong> las 100 hojas igual a 10.2 cm. Una diferencia <strong>de</strong> 2 décimas <strong>de</strong> 1 centímetro en el largopromedio <strong>de</strong> las hojas parece ser muy pequeña, lo que posiblemente nos inclinaría inicialmentea no rechazar H 0 . Pero no <strong>de</strong>bemos a<strong>de</strong>lantarnos, pues la comparación tiene que tomar encuenta la variabilidad <strong>de</strong> los datos. Por ejemplo, si la varianza fuera muy pequeña y lahipótesis nula cierta, todas las hojas tendrían esencialmente el mismo largo por lo que seríaextremadamente raro observar hojas que tuvieran un largo mucho mayor que 10 cm. En elcaso <strong>de</strong> una diferencia <strong>de</strong> .2 cm., y si hay poca variabilidad, lo más seguro es querechazaríamos la hipótesis nula <strong>de</strong> que el largo promedio <strong>de</strong> las hojas es 10 cm. a favor <strong>de</strong> laalternativa <strong>de</strong> que el largo promedio es mayor <strong>de</strong> 10 cm.SI la varianza <strong>de</strong> los datos fuera muy gran<strong>de</strong> y la hipótesis nula fuera cierta, podríamosobservar hojas con una gran variedad <strong>de</strong> largos, por lo que obtener una media para el largo <strong>de</strong>100 hojas mayor o igual a 10.2 sería un evento muy común. En esta situación norechazaríamos la hipótesis nula. La Gráfica I-1 muestra el significado que tiene el observar unvalor <strong>de</strong> X¯ igual a 10.2 cm., aún cuando ambas distribuciones tienen la misma media© 2004-2007 PJ Rodríguez Esquerdo


<strong>Pruebas</strong> <strong>de</strong> Hipótesis página 7poblacional según la hipótesis nula, µ = 10 y según las premisas o información previas sobre lavarianza poblacional. La distribución N(10, sqrt(.01)) muestra poca variabilidad, por lo queobservar un valor <strong>de</strong> X¯ igual o mayor a 10.2 cm. es un evento muy raro. El área bajo esa curva<strong>de</strong> <strong>de</strong>nsidad a la <strong>de</strong>recha <strong>de</strong> 10.2 es muy pequeña en comparación con el área bajo la otracurva <strong>de</strong> <strong>de</strong>nsidad. Esta última, la distribución N(10, sqrt(.04)) refleja un área mucho mayorbajo esa curva a la <strong>de</strong>recha <strong>de</strong> 10.2, por lo que la probabilidad <strong>de</strong> observar valores mayoresque 10.2 es mucho más alta en esta distribución.Gráfica I-1 Comparación <strong>de</strong> dos distribuciones normales con distinta varianza<strong>de</strong>nsidad f(x)4.54.03.53.02.52.01.51.00.50.0Densidad <strong>de</strong> distribuciones N(10, sqrt(.04)) yN(10,sqrt(.01))Densidad N(10,sqrt(.01))Áreas <strong>de</strong> interésDensidad N(10,sqrt(.04))9.0 9.2 9.4 9.6 9.8 10.0 10.2 10.4 10.6 10.8 11.0µxPara tomar en cuenta la varianza es necesario estandarizar el valor <strong>de</strong> X¯ . Asíobtenemos un valor estándar, que a su vez representa un múltiplo <strong>de</strong>l error estándar. Alestandarizar no es necesario comparar el valor obtenido <strong>de</strong> X¯ con w, sino el valorestandarizado <strong>de</strong> X¯ con el valor z α obtenido <strong>de</strong> la tabla <strong>de</strong> la distribución normal estándar parael nivel <strong>de</strong> significancia <strong>de</strong>seado.La <strong>de</strong>finición <strong>de</strong> probabilidad <strong>de</strong> error tipo I es utilizada para obtener una estadísticaprueba que permitirá efectuar esta prueba <strong>de</strong> hipótesis con el nivel <strong>de</strong> significancia <strong>de</strong>seado:α = P( Rechazar H 0 | H 0 es cierta) = P( X¯ > w | µ = 10).Se estandariza la media muestral X¯ para obtener© 2004-2007 PJ Rodríguez Esquerdo


<strong>Pruebas</strong> <strong>de</strong> Hipótesis página 8α = P(X> w | µ = 10)= P(X −10> w −10)X −10w −10= P(> )⎛ ⎞⎛ σ ⎞ ⎜ σ ⎟⎜ ⎟ ⎜ ⎟⎜ ⎟⎝ n ⎠ ⎝ n ⎠= P(Z > z ).αEl valor z α es obtenido <strong>de</strong> la tabla <strong>de</strong> la distribución normal y es un número tal que si Zes una variable aleatoria con distribución estándar normal, Z~N(0,1), entonces P (Z > z α ) = α.La estadística prueba que permite comprobar estas hipótesis, llamada prueba Z, esZ =X⎛⎜⎝−10 .⎞⎟n ⎠σSe toma la <strong>de</strong>cisión <strong>de</strong> rechazar la hipótesis nula H 0 al nivel <strong>de</strong> significancia α si Z > z α .El conjunto <strong>de</strong> valores <strong>de</strong> Z mayores que z α , es <strong>de</strong>cir { Z ; Z > z α }, se conoce como la zona <strong>de</strong>rechazo o región crítica <strong>de</strong> la prueba. La zona <strong>de</strong> rechazo <strong>de</strong>pen<strong>de</strong> directamente <strong>de</strong> lahipótesis alternativa.En el estudio realizado por el biólogo, los valores que se <strong>de</strong>be usar son:µ = 10, σ 2 = 2, n = 20, α = .05 y x¯ = 10.2.Se sustituye esos valores obtenidos en la estadística prueba y se obtiene queX −1010.2 −10.2z = = = = .63.⎛ σ ⎞ ⎛ 2 ⎞ .32⎜ ⎟⎜⎟⎝ n ⎠ ⎝ 20 ⎠Este resultado quiere <strong>de</strong>cir que la media obtenida en la muestra se encuentra a .632errores estándar a la <strong>de</strong>recha <strong>de</strong> µ = 10. Aún se <strong>de</strong>be comparar el valor obtenido <strong>de</strong> z con z αcon el fin <strong>de</strong> tomar la <strong>de</strong>cisión. Como la hipótesis alternativa es H a : µ > 10, se rechaza lahipótesis nula H 0 si x¯ es suficientemente mayor que µ = 10; o equivalentemente, si z esgran<strong>de</strong>, mayor que z α .De la tabla <strong>de</strong> la distribución normal estándar se obtiene que z .05 = 1.645. Por lo tanto,al nivel <strong>de</strong> significancia <strong>de</strong>l .05, o <strong>de</strong>l 5%, se rechaza la hipótesis nula H 0 :µ = 10 cm. a favor <strong>de</strong>la hipótesis alternativa H a : µ > 10 cm. si el valor estandarizado <strong>de</strong> x¯ se encuentra a más <strong>de</strong>1.645 errores estándar <strong>de</strong> µ = 10. En este caso, como la hipótesis alternativa es que la media<strong>de</strong> la población <strong>de</strong> hojas <strong>de</strong> los árboles en el bosque húmedo es mayor que 10, se rechaza H 0a favor <strong>de</strong> la alternativa H a si el valor obtenido para x¯ es suficientemente mayor que 10.Como en esta situación z = .632 es menor que z .05 = 1.645, no se rechaza la hipótesisnula al nivel <strong>de</strong> significancia <strong>de</strong>l 5%. A pesar <strong>de</strong> que x¯ = 10.2 es mayor que 10, se concluye© 2004-2007 PJ Rodríguez Esquerdo


<strong>Pruebas</strong> <strong>de</strong> Hipótesis página 9que x¯ no es significativamente mayor que 10 al nivel <strong>de</strong> significancia <strong>de</strong>l 5%. Del estudio no seobtuvo evi<strong>de</strong>ncia suficientemente contun<strong>de</strong>nte en contra <strong>de</strong> la hipótesis nula, por lo cual estano se pue<strong>de</strong> <strong>de</strong>scartar.F. Valor pHay otra manera <strong>de</strong> efectuar esta prueba estadística, la cual es usada cada vez conmás frecuencia en la literatura científica. Partiendo <strong>de</strong> la premisa que H 0 es cierta, el biólogopue<strong>de</strong> tomar la <strong>de</strong>cisión <strong>de</strong> rechazar o no la hipótesis nula H 0 examinando si valores tanextremos <strong>de</strong> X¯ como el observado ocurren con una probabilidad muy pequeña. Si la hipótesisnula se presume cierta, mientras más pequeña sea esa probabilidad, más raro <strong>de</strong>be ser elobtener valores <strong>de</strong> x¯ como el obtenido y más sólida será la evi<strong>de</strong>ncia para rechazar la hipótesisnula. En otras palabras, si se parte <strong>de</strong> la premisa que la hipótesis nula es cierta, observar unvalor muy distinto a lo que se esperaría observar es evi<strong>de</strong>ncia en contra <strong>de</strong> esa hipótesis nula.Esta probabilidad se conoce como el valor p <strong>de</strong> la prueba.El valor p <strong>de</strong>pen<strong>de</strong> directamente <strong>de</strong> la hipótesis alternativa. En el ejemplo <strong>de</strong>l largopromedio <strong>de</strong> las hojas, la hipótesis alternativa es H a : µ > 10. Por lo tanto, el valor p en estecaso se encuentra al obtener la probabilidad <strong>de</strong> que si se hiciera el estudio nuevamente seobtendría un valor <strong>de</strong> la estadística prueba Z mayor que el observado originalmente <strong>de</strong> z = .63,Valor p = P ( Z > z observado ) = P ( Z > .63 ) = .2643.Este resultado quiere <strong>de</strong>cir que si la hipótesis nula es cierta, se observaría un valor <strong>de</strong> Ztan gran<strong>de</strong> o más como el obtenido cerca <strong>de</strong>l 26% <strong>de</strong> las veces que se repitiera el estudio.Partiendo <strong>de</strong> la premisa <strong>de</strong> que la hipótesis nula es cierta, este evento ocurre muy comúnmentey es consistente con la hipótesis nula, por lo cual no sería evi<strong>de</strong>ncia en contra y no serechazaría. ¿Cuán pequeño <strong>de</strong>be ser el valor p para que se <strong>de</strong>cida rechazar la hipótesis nula?En este caso es necesario comparar el valor p con una significancia seleccionada para laprueba.Se rechaza H 0 si al suponer que es cierta, el evento que observamos es losuficientemente raro. Así se rechaza H 0 cuando <strong>de</strong> los datos se obtiene valores pequeños <strong>de</strong>lvalor p. Por otro lado la significancia α es la probabilidad <strong>de</strong> error tipo I más pequeña que seestá dispuesto a permitir. Esto quiere <strong>de</strong>cir que se rechaza la hipótesis nula si el valor p esmenor que la significancia α <strong>de</strong>seada.G. Po<strong>de</strong>r <strong>de</strong> la prueba8. Resumen© 2004-2007 PJ Rodríguez Esquerdo

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!