12.04.2013 Views

Estadística Descriptiva e Inferencial 2 fasículo 4 - Portal Educativo ...

Estadística Descriptiva e Inferencial 2 fasículo 4 - Portal Educativo ...

Estadística Descriptiva e Inferencial 2 fasículo 4 - Portal Educativo ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

COLEGIO DE BACHILLERES<br />

ESTADÍSTICA DESCRIPTIVA<br />

E INFERENCIAL II<br />

FASCÍCULO 4. INTRODUCCIÓN A LA INFERENCIA<br />

ESTADÍSTICA Y APLICACIÓN EN EL<br />

CONTROL ESTADÍSTICO<br />

Autor: Guadalupe Floiran Martínez<br />

1


COLEGIO DE<br />

BACHILLERES<br />

Colaboradores<br />

Asesoría Pedagógica<br />

Olivia Hernández Romero<br />

Revisión de Contenido<br />

Armando Martínez Cruz<br />

Diseño Editorial<br />

Leonel Bello Cuevas<br />

Javier Darío Cruz Ortiz<br />

2


INTRODUCCIÓN<br />

PROPÓSITO<br />

CUESTIONAMIENTO GUÍA<br />

CAPÍTULO 1. INTRODUCCIÓN A LA INFERENCIA<br />

ESTADÍSTICA Y APLICACIONES<br />

EN EL CONTROL ESTADÍSTICO<br />

RECAPITULACIÓN<br />

1.1 INFERENCIA ESTADÍSTICA 11<br />

1.1.1 Etapas Básicas en Pruebas de Hipótesis 17<br />

1.1.2 Prueba de un Valor Hipotético de la Media<br />

Utilizando la Distribución Normal<br />

1.1.3 Error de Tipo I y II en Pruebas de Hipótesis 22<br />

1.2 ESTIMACIÓN 25<br />

1.2.1 Estimación Puntual de un Parámetro 26<br />

1.2.2 Estimación por Intervalo 27<br />

1.2.3 Nivel de Confianza 1− α 27<br />

1.2.4 Intervalo de Confianza 27<br />

1.2.5 Error de Estimación Máximo E 29<br />

ACTIVIDADES DE CONSOLIDACIÓN<br />

AUTOEVALUCIÓN<br />

Í N D I C E<br />

BIBLIOGRAFÍA CONSULTADA<br />

3<br />

5<br />

7<br />

9<br />

11<br />

19<br />

35<br />

36<br />

37<br />

38


Í N T R O D U C C I Ó N<br />

Seguramente te habrás topado repetidas veces con informaciones de tipo estadístico.<br />

Quizá habrás leído, en el transcurso de tus estudios, artículos que incluyen tratamiento<br />

estadístico de datos, te habrás dado cuenta entonces que, en los últimos tiempos, la<br />

<strong>Estadística</strong> ocupa un lugar cada vez más importante en periódicos, revistas, libros,<br />

programas de radio y televisión, esta penetración es cada vez más presente en nuestras<br />

vidas, y aún cuando creamos estar alejados de esta disciplina, solemos estar<br />

involucrados en ella, un ejemplo de ello son los censos.<br />

Es hora pues, de preguntarte que es en realidad la <strong>Estadística</strong>, cómo funciona, o que<br />

hace con los datos para llegar a ciertas conclusiones. En este fascículo hablaremos de la<br />

Inferencia <strong>Estadística</strong> y sus aplicaciones, para que conozcas la aportación tan útil que<br />

nos da este método estadístico, para generalizar informaciones de Investigación o<br />

deducir conclusiones relacionadas con poblaciones a partir de las muestras extraídas de<br />

éstas. También, podrás realizar controles estadísticos de calidad que te ayudarán a<br />

tomar decisiones, con el transcurso de tus estudios o tal vez en el trabajo que<br />

desempeñes.<br />

Como podrás ver, este fascículo te ayudará a conocer otra parte más de esta ciencia tan<br />

fascinante como lo es la <strong>Estadística</strong> <strong>Inferencial</strong>.<br />

5


P R O P Ó S I T O<br />

El propósito de este fascículo, es el de iniciarte en el estudio de la <strong>Estadística</strong> <strong>Inferencial</strong>,<br />

ya que ella te permite obtener conclusiones, que te ayudarán a tomar decisiones sobre<br />

investigaciones que realices.<br />

La <strong>Estadística</strong> <strong>Inferencial</strong>, está basada en los estudios que realizaste en el semestre<br />

anterior, pues a través de las medidas de tendencia central y descriptivas, podemos<br />

establecer ciertas características de alguna situación problemática, y con la <strong>Estadística</strong><br />

<strong>Inferencial</strong>, estudiamos más detalladamente esas características.<br />

Con las actividades que desempeñes a lo largo del estudio de la <strong>Estadística</strong> <strong>Inferencial</strong>,<br />

te darás cuenta de la utilidad que representa el conocerla, y de lo importante que es,<br />

para poder obtener documentos de investigación confiables.<br />

A través de la aplicación de la <strong>Estadística</strong> <strong>Inferencial</strong>, se pueden desarrollar<br />

investigaciones científicas y obtener datos confiables; dichas investigaciones pueden ser<br />

retomadas en diferentes momentos y por diferentes personas para esclarecer algunos<br />

aspectos específicos y que se relacionan con la investigación.<br />

7


SENTIDO COMÚN Y ESTADÍSTICA<br />

CUESTIONAMIENTO GUÍA<br />

Cuando el estadista norteamericano Henry Clay (1777-1850), acuñó las palabras “las<br />

estadísticas no son un sustituto del sentido común” quizá no hacía referencia a la<br />

conclusión de una prueba de hipótesis pero sus palabras encierran una gran verdad. La<br />

prueba estadística de una hipótesis es sólo un modelo, con frecuencia muy simplificado,<br />

de la realidad. El problema real debe trasladarse en algún modelo matemático, y la<br />

conclusión que ofrece el modelo debe interpretarse a la luz de la realidad y, además, en<br />

conjunción con factores que no se encuentran incluidos en el modelo.<br />

Supón que una persona desea pintar su recámara. Efectúa un cálculo con el propósito<br />

de conocer la superficie total a pintar: 67m. cuadrados. Entonces lee la etiqueta de una<br />

lata de pintura: “El contenido de esta lata alcanza para pintar una superficie de 32.51m.<br />

cuadrados”. Al ser un genio en matemáticas, dicha persona calcula que necesitará 2.06<br />

latas. Ahora, ¿Cuántas latas de pintura deberá comprar?, ¿Dos o tres? El modelo<br />

matemático del problema real proporciona una respuesta exacta, 2.06 latas, (siempre y<br />

cuando, no esté rebajada la pintura) Pero, con toda claridad, quizá no sean suficientes<br />

dos latas; así que deberán comprarse tres.<br />

Pero el mundo real impone otros aspectos: ¿Está a la venta la pintura?, ¿La tienda se<br />

localiza cerca de la esquina o a 12km. del camino?, ¿Es un pintor pulcro o descuidado?,<br />

¿Es pesimista u optimista?, ¿Cree que el número de está en la etiqueta (67m.<br />

cuadrados) es un promedio o un mínimo?, ¿Le satisfaría que los últimos 1.98m.<br />

cuadrados se cubrieran sólo con una capa delgada? ¿Se va a pintar con un color oscuro<br />

una superficie que tiene un color claro o viceversa?<br />

El modelo matemático proporciona lineamientos para tomar la última decisión, pero se<br />

deben considerar los riesgos al tomar una decisión equivocada. Si sólo se compran dos<br />

botes de pintura, es posible que se tenga que volver a la tienda; quizá ya no tengan el<br />

mismo color de pintura o el precio haya aumentado. Si se compran tres botes quizá se<br />

tenga que volver a la tienda a devolver uno y es posible que en está no se acepten<br />

devoluciones.<br />

En la misma forma, la prueba estadística de una hipótesis es sólo un modelo de una<br />

9


situación real. Así que la respuesta que puede darse es: “La persona tiene una<br />

respuesta; quizá sea correcta. Considera las consecuencias de todos los posibles<br />

errores que se encontraría detrás de una decisión equivocada”.<br />

Como te darás cuenta, la prueba de hipótesis, hace referencia a una serie de<br />

cuestionamientos, los cuales conllevan a tomar una decisión. ¿Tú qué decisión tomarías<br />

si fueras a pintar tu casa?<br />

Quizá no tengas tampoco una decisión firme, pero conforme estudies este fascículo, irás<br />

adquiriendo las herramientas necesarias de conocimientos para llegar a tomar<br />

decisiones claras y precisas.<br />

10


CAPÍTULO 1<br />

INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA Y<br />

APLICACIONES EN EL CONTROL ESTADÍSTICO<br />

DE LA CALIDAD<br />

1.1 INFERENCIA ESTADÍSTICA<br />

Supongamos que eres un psicólogo que hace investigaciones con ratas, y que te sientes<br />

atraído por saber la relación que existe entre el hambre y el aprendizaje.<br />

Específicamente, ¿Cuáles serán los efectos de la fuerza del hambre sobre el número de<br />

recorridos que realizan las ratas en un laberinto en forma de T para comer?<br />

Imagínate ahora que eres el líder de un equipo de fútbol, y con el objeto de planear la<br />

adhesión de nuevos miembros te es necesario conocer el número de adultos de tu<br />

localidad, cuyo deseo de pertenecer al equipo sea manifiesto. ¿Cómo le harías para<br />

obtener esta información?<br />

Piensa ahora que eres un sociólogo y quieres conocer las diferencias de la educación<br />

entre niños delincuentes y niños que no son delincuentes.<br />

Imagínate que eres un investigador de mercados y quieres conocer el número de<br />

individuos que prefieren colores distintos y combinaciones diferentes en los automóviles.<br />

Imagínate que eres el encargado de una pista de patinaje y quieres determinar cuando la<br />

capa de hielo está suficientemente gruesa como para permitir el patinaje sin peligro.<br />

11


¿Qué tienen todos estos problemas en común?<br />

Seguramente, te habrás dado cuenta que estamos determinando características<br />

cuantitativas, en base a diferentes variables de una población dada, para las cuales,<br />

pretendemos generalizar algunas respuestas.<br />

La Inferencia <strong>Estadística</strong> se encarga de utilizar los números para proporcionar<br />

información con respecto a grupos más grandes que aquellos a partir de los cuales se<br />

obtuvieron los datos originales.<br />

Las siguientes situaciones son ejemplos de Inferencia <strong>Estadística</strong>.<br />

A partir de muestras adecuadas, es posible inferir que:<br />

1. Entre el 20% y el 25% de todos los estudiantes de las Universidades de la<br />

República Mexicana son casados.<br />

2. Existe una relación entre el nivel del colesterol y las enfermedades cardiacas.<br />

3. El 25% de los niños de una determinada colonia del D.F., padecen de caries<br />

dental.<br />

Con frecuencia es imposible estudiar todos los miembros de una población dada, ya sea<br />

porque la población, tal como ha sido definida, tiene un número infinito de miembros, o<br />

porque es tanta que imposibilita un estudio exhaustivo.<br />

Puesto que raras veces se pueden estudiar exhaustivamente las poblaciones, debemos<br />

depender de las muestras como base para llegar a hipótesis concernientes a varias<br />

características, de la población.<br />

Cuando queremos muestrear, podemos utilizar muestras aleatorias y muestras<br />

representativas principalmente. Las muestras aleatorias las podemos obtener con<br />

elementos seleccionados por casualidad. El muestreo representativo es aquel cuyos<br />

elementos son seleccionados de acuerdo con criterios de representatividad.<br />

Existen otros tipos de diseño de muestra, como son el muestreo sistemático,<br />

estratificado y por conglomerado los cuales establecen criterios para poder muestrear de<br />

tal manera que facilite la elección de la muestra deseada.<br />

Así, si queremos saber por cuál partido político votará la población completa de electores<br />

de la Delegación Cuauhtémoc, nos llevaría mucho tiempo y esfuerzo el cuestionar a<br />

todos, así que solo preguntaremos a unos cuantos (muestreo) y así podremos conocer<br />

aproximadamente que partido es el de más agrado en esta Delegación.<br />

12


Casi toda investigación utiliza la observación y la medida de un número limitado de<br />

individuos o sucesos. Se supone que estas medidas nos proporcionarán alguna<br />

información sobre la población. Para poder comprender cómo podemos ser capaces de<br />

establecer inferencias sobre una población a partir de una muestra, tenemos que<br />

conocer la distribución de probabilidad teórica de todos los valores posibles de algunos<br />

estadísticos de las muestras que ocurrirían, si fuera posible obtener todas las muestras<br />

del mismo tamaño a partir de esa población dada.<br />

Por ejemplo, ¿Recuerdas todas tus calificaciones desde que ingresaste a estudiar?<br />

Probablemente sean ya bastantes y las puedas considerar como una población de<br />

calificaciones.<br />

Decides obtener muestras de tres calificaciones por año escolar, (tal vez desde la<br />

primaria) y calcular la media y la desviación estándar de cada muestra. Si tuvieras que<br />

obtener todas las muestras posibles en las cuales N = 3, y las representaras en una<br />

gráfica las medias y las desviaciones estándar resultantes, obtendrías dos distribuciones<br />

de muestra: una para las medias y otra para las desviaciones estándar.<br />

Te invitamos a que realices las tablas de frecuencia y te des cuenta cuánto has<br />

evolucionado o involucionado en tus estudios a través del tiempo que llevas estudiando.<br />

¿Porqué es tan importante el concepto de distribución de muestras?. La respuesta es<br />

simple. Cuando quieras que se considere un parámetro de población a partir de una<br />

muestra, nos haremos preguntas tales como: “¿Qué tan buena es la estimación<br />

obtenida?”, ¿Puedo llegar a la conclusión de que el parámetro de población es idéntico<br />

al estadístico de la muestra? o, ¿Es probable que exista algún error? Si es así, ¿Qué tan<br />

grande es este error?<br />

Para responder cada una de estas preguntas, compararemos los resultados obtenidos a<br />

partir de las muestras con los resultados “esperados”.<br />

La muestra debe ser representativa de la población, para que los resultados que se<br />

obtengan puedan utilizarse también para generalizar el comportamiento de la población;<br />

su tamaño debe ser adecuado de acuerdo con criterios de representatividad, pudiendo<br />

variar de un 10 a un 15%, dependiendo del tipo de investigación que se realice.<br />

Una muestra es importante en la Inferencia <strong>Estadística</strong>, ya que te ayuda a establecer<br />

decisiones que serán consideradas dentro de una población.<br />

Cuando analizamos la muestra obtenida de una población, la prueba de hipótesis<br />

constituye el proceso relacionado con aceptar o rechazar declaraciones en base a la<br />

muestra establecida.<br />

13


Seguramente la palabra hipótesis te “suene” conocida, ya que en tus clases de Física y<br />

Métodos de Investigación la utilizaste con frecuencia. Bueno, pues ahora en <strong>Estadística</strong><br />

<strong>Inferencial</strong> la recordarás de nuevo, aunque tal vez no en el mismo sentido que la<br />

utilizaste anteriormente.<br />

En muchas ocasiones, las estadísticas tratan preguntas mediante la formulación de dos<br />

proposiciones opuestas que reciben el nombre de HIPÓTESIS.<br />

Por ejemplo:<br />

1. ¿Qué porcentaje de los alumnos del C.B. continúan el nivel superior?<br />

2. ¿Qué tan eficaz es la receta A con relación a B?<br />

3. ¿Es cierto qué el 30% de las personas compra su marca favorita de pasta para<br />

dientes sin importarle el precio de ésta?<br />

Estas preguntas son de dos tipos. Las preguntas 1 y 2 piden una respuesta numérica. La<br />

última requiere una respuesta de si o no.<br />

Una hipótesis estadística es una afirmación acerca de una población. Una persona<br />

intenta afirmar o negar una pregunta “más allá de toda duda razonable”.<br />

La Inferencia <strong>Estadística</strong> utiliza Hipótesis <strong>Estadística</strong>s, las cuales dan declaración o<br />

afirmación tentativa acerca del valor de un parámetro o parámetros de una población (las<br />

medidas de dispersión y la medida poblacional, son parámetros de población.) Las<br />

pruebas de hipótesis pueden mostrar si una declaración tentativa se ve apoyada o<br />

rechazada por la evidencia de la muestra.<br />

Los ejecutivos de negocios, científicos, estrategas militares, políticos, educadores y<br />

muchas otras personas toman decisiones relativas a parámetros de la población.<br />

Para que una hipótesis sea digna de tomarse en cuenta en cualquier investigación,<br />

principalmente de tipo científico, debe reunir ciertos requisitos:<br />

1. Hay que analizar al establecer nuestras hipótesis si son las adecuadas para el<br />

estudio que vayamos a realizar y si es posible tener acceso a ellas<br />

(reconfirmamos el contexto, buscamos otro o ajustamos las hipótesis.)<br />

2. Los términos (variables) de las hipótesis tienen que ser comprensibles, precisos<br />

y los más concretos posible.<br />

Por ejemplo: “Globalización de la Economía”, “Sinergia Organizacional”, son<br />

conceptos imprecisos y generales, que deben sustituirse por otros más específicos y<br />

concretos.<br />

3. La relación propuesta entre variables por una hipótesis debe ser clara y<br />

14


verdadera (lógica) Por ejemplo, una hipótesis como: “La disminución del<br />

consumo del petróleo en los Estados Unidos está relacionada con el grado de<br />

aprendizaje del álgebra por parte de niños que asisten a escuelas públicas en<br />

Buenos Aires”, será inverosímil, no podemos considerarla.<br />

4. Los términos de la hipótesis y la relación planteada entre ellos, deben poder ser<br />

observados y medidos, o sea tener referentes a la realidad. Por ejemplo, “Los<br />

hombres más felices van al cielo” o “La libertad de espíritu está relacionada con<br />

la voluntad creadora”, contienen conceptos o relaciones que no poseen<br />

referentes empíricos; por lo tanto, no son útiles como hipótesis para investigar<br />

estadísticamente ni se pueden someter a prueba en la realidad.<br />

5. Las hipótesis deben estar relacionadas con técnicas disponibles para probarlas.<br />

Para ello, debemos tener técnicas o herramientas de la investigación (instrumentos para<br />

recolectar datos, diseños, análisis estadísticos o cualitativos, etc.), para poder verificarla<br />

si es posible, desarrollarlas, y si se encuentran a nuestro alcance.<br />

Alguien podría pretender probar hipótesis referentes a la desviación presupuestal en el<br />

gasto público de un país latinoamericano o la red de narcotraficantes en la ciudad de<br />

Miami, pero no disponer de formas realistas de obtener sus datos. Entonces su hipótesis,<br />

aunque teóricamente puede ser muy valiosa, no se puede probar en la realidad.<br />

Existen diversas formas de clasificar las hipótesis, las cuales son:<br />

1) Hipótesis de investigación.<br />

2) Hipótesis nulas.<br />

3) Hipótesis alternativas.<br />

4) Hipótesis estadísticas.<br />

En este fascículo, te daremos a conocer la Hipótesis <strong>Estadística</strong>, que es la que<br />

transforma las hipótesis de investigación, nulas y alternativas en símbolos estadísticos.<br />

Pero, te preguntarás ¿Qué son estas hipótesis?<br />

A continuación, te daremos una pequeña explicación:<br />

Hipótesis Nulas<br />

Constituyen proposiciones acerca de la relación entre variables, solamente que sirven<br />

para refutar o negar lo que afirma la hipótesis de investigación. Por ejemplo, si la<br />

hipótesis de investigación propone: “Los adolescentes le atribuyen más importancia al<br />

atractivo físico en sus relaciones heterosexuales que las mujeres”, la nula postularía:<br />

“Los adolescentes NO le atribuyen más importancia al atractivo físico en sus relaciones<br />

heterosexuales que las mujeres”.<br />

Debido a que este tipo de hipótesis resulta la contrapartida de la hipótesis de<br />

15


investigación, hay prácticamente tantas clases de hipótesis nulas como de investigación.<br />

Es decir, la clasificación de hipótesis nulas es similar a la tipología de la hipótesis de<br />

investigación: hipótesis nulas descriptivas de una variable que se va a observar en un<br />

contexto, hipótesis que niegan o contradicen la relación entre dos o más variables,<br />

hipótesis que niegan que haya diferencia entre grupos que se comparan, (es decir,<br />

afirmar que los grupos son iguales) e hipótesis que niegan la relación de casualidad<br />

entre dos o más variables, (en todas sus formas.). Las hipótesis nulas se simbolizan<br />

como Ho.<br />

Te damos algunos ejemplos de hipótesis nulas, que corresponden a ejemplos de<br />

hipótesis de investigación que fueron mencionados;<br />

Ejemplos:<br />

Ho: “La expectativa de ingreso mensual de los trabajadores de la corporación TEAQ no<br />

oscila entre $1,000.00 y $2,500.00”.<br />

Ho:”No hay relación entre la autoestima y el temor de logro”.<br />

Ho: “La percepción de la similitud en religión, valores y creencias no provoca mayor<br />

atracción física”.<br />

Hipótesis Alternativas<br />

Como su nombre lo indica, son posibilidades “alternativas” ante las hipótesis de<br />

investigación y nula. Ofrecen otra descripción o explicación distinta a la que proporciona<br />

este tipo de hipótesis. Por ejemplo, si la hipótesis de investigación establece: “Esta silla<br />

es roja”, la nula afirmará “Esta silla no es roja”, y podrían formularse una o más hipótesis<br />

alternativas: “Esta silla es azul”, “Esta silla es verde”, “Esta silla es amarilla”, etc. Cada<br />

una constituye una descripción distinta a las que proporcionan las hipótesis de<br />

investigación y nula.<br />

Las hipótesis alternativas se simbolizan como Ha y sólo pueden formularse cuando<br />

efectivamente hay otras posibilidades adicionales a las hipótesis de investigación y nula.<br />

De ser así, no pueden existir.<br />

Ejemplos:<br />

Hi: “El candidato ‘A’ obtendrá en la elección para la presidencia del consejo escolar entre<br />

un 50 y un 60% de la votación total”.<br />

Ho: “El candidato ‘A’ no obtendrá en la elección para la presidencia del consejo escolar<br />

entre un 50 y 60% de la votación total”.<br />

Ha: “El candidato ‘A’ obtendrá en la elección para la presidencia del consejo escolar más<br />

del 60% de la población total”.<br />

Si se desea llevar a cabo una prueba estadística, pero no se sabe cuáles son las<br />

16


proporciones que se esperan, es posible ESTIMAR el valor de éstas obteniendo una<br />

muestra aleatoria. Por ejemplo, si se desea conocer el número de clientes que son<br />

mujeres de una cafetería, se puede tomar una muestra aleatoria de toda la clientela. Si la<br />

muestra tiene 80 personas, y 60 de éstas son mujeres, entonces la mejor estimación del<br />

porcentaje de clientes que son mujeres será 60/80 = 75%.<br />

En este caso no se afirma que la probabilidad de seleccionar a una mujer sea, de<br />

manera exacta, 0.75, sino más bien que esta cantidad es una estimación razonable del<br />

verdadero valor basada en los datos que se obtuvieron.<br />

Como podrás ver, la hipótesis y la Inferencia <strong>Estadística</strong> necesitan determinadas<br />

“herramientas” para poder llegar a tomar decisiones, las cuales necesitan ahora<br />

probarse; para esto, la Inferencia <strong>Estadística</strong> utiliza lo que se llama PRUEBAS DE<br />

HIPÓTESIS, las cuales constituyen el proceso relacionado con aceptar o rechazar<br />

declaraciones en base a los parámetros de la población, así como también utiliza la<br />

ESTIMACIÓN, que se ocupa precisamente de estimar los valores de los parámetros de<br />

la población.<br />

A continuación empezaremos a hablar acerca del proceso de las pruebas de hipótesis y<br />

puedas aprender a utilizarla para tomar decisiones.<br />

PRUEBAS DE HIPÓTESIS.<br />

1.1.1 Etapas Básicas en Pruebas de Hipótesis<br />

En la prueba de hipótesis iniciamos con un valor supuesto (hipotético) de un parámetro<br />

de población. Después de recoger una muestra aleatoria, comparamos la estadística de<br />

la muestra, tal como la medida de la muestra (X) con el parámetro hipotético, tal como la<br />

media de la población hipotética (µ). Luego aceptamos o rechazamos el valor hipotético.<br />

Este valor hipotético se rechaza sólo si es claramente improbable que ocurra el resultado<br />

de la muestra cuando la hipótesis es verdadera.<br />

PRIMER PASO.<br />

FORMULAR LA HIPÓTESIS NULA Y LA HIPÓTESIS ALTERNATIVA.<br />

La hipótesis nula (Ho) es el valor hipotético del parámetro que se compara con el<br />

resultado de la muestra. Se rechaza solamente si no es probable que ocurra el resultado<br />

de la muestra dada. La hipótesis alternativa (Ha) se acepta si se rechaza la hipótesis<br />

nula. Por ejemplo:<br />

Un auditor quiere probar la suposición de que el valor medio de todas las cuentas por<br />

cobrar en una firma dada es $260.00 tomando una muestra de n = 36. El auditor desea<br />

17


echazar el valor supuesto de $260.00, sólo si se contradice al valor medio establecido.<br />

La muestra y, de esta manera, al valor hipotético debe dársele el “beneficio de la duda”<br />

en el procedimiento de prueba. Las hipótesis nula y alternativa para esta prueba son:<br />

Ho: µ = $260.00 y Hi: µ ≠ $260.00<br />

SEGUNDO PASO.<br />

ESPECIFICAR EL NIVEL DE SIGNIFICACIÓN QUE SE VA A UTILIZAR.<br />

El nivel de significación es el estándar estadístico que se específica determinado en<br />

porcentaje, para rechazar la hipótesis nula. Si se especifica un nivel de significación del 5<br />

por ciento, entonces se rechaza la hipótesis nula, sólo si el resultado obtenido con la<br />

muestra es tan diferente del valor hipotético que una diferencia de dicha cantidad<br />

ocurriría con una probabilidad de 0.05. Esto se denomina error de tipo uno (I).<br />

Observa que si se utiliza el nivel de significación del 5 por ciento, hay una probabilidad<br />

de 0.05 por ciento de rechazar la hipótesis nula.<br />

La probabilidad del error de tipo I es siempre igual al nivel de significación que se utiliza<br />

como el estándar para rechazar la hipótesis nula; se designa con la letra minúscula<br />

griega α (alfa); así pues, α también representa el nivel de significación. Los niveles más<br />

comúnmente empleados en la prueba de hipótesis son los niveles del 5% y del 1%.<br />

Un error de tipo II ocurre si se acepta la hipótesis nula cuando es falsa.<br />

TERCER PASO.<br />

SELECCIONAR LA ESTADÍSTICA DE PRUEBA.<br />

La estadística de prueba será la estadística de la muestra, o una versión transformada<br />

de la estadística de la muestra. Por ejemplo, para probar un valor hipotético de la media<br />

de la población, la media de una muestra aleatoria tomada de dicha población podría<br />

servir como estadística de la prueba. Sin embargo, si la distribución de muestreo de la<br />

media es normal, entonces el valor de la media de la muestra se transforma típicamente<br />

en un valor Z.<br />

CUARTO PASO.<br />

ESTABLECER EL VALOR O LOS VALORES CRÍTICOS DE LA ESTADÍSTICA DE<br />

PRUEBA.<br />

Habiendo especificado la hipótesis nula, el nivel de significación y la estadística de<br />

prueba que se van a utilizar, podemos establecer el valor o los valores críticos de la<br />

estadística de prueba. Puede haber uno o dos valores críticos según se efectúe una<br />

prueba de una cola o de dos colas. En el fascículo anterior, te explicamos este tipo de<br />

pruebas. En cualquier caso, un valor crítico identifica el valor de la estadística de prueba<br />

requerido para rechazar la hipótesis nula.<br />

CONSECUENCIAS DE DECISIONES EN LA PRUEBA DE HIPÓTESIS.<br />

18


Decisiones posibles<br />

Aceptación de hipótesis nula.<br />

Rechazo de hipótesis nula<br />

ESTADOS POSIBLES<br />

Hipótesis nula<br />

Hipótesis nula falsa<br />

verdadera<br />

Correctamente<br />

aceptada<br />

Error de tipo I<br />

19<br />

Error de tipo II<br />

Correctamente<br />

rechazada<br />

En esta tabla podemos apreciar los tipos de decisiones, y los estados posibles, de<br />

acuerdo al segundo paso de las etapas básicas.<br />

QUINTO PASO.<br />

DETERMINAR EL VALOR REAL DE LA ESTADÍSTICA DE PRUEBA.<br />

Por ejemplo, al probar un valor hipotético de la media de la población se toma una<br />

muestra aleatoria y se determina el valor de la media de la muestra. Si el valor crítico se<br />

estableció como un valor Z, entonces la media de la muestra se convierte a un valor Z.<br />

SEXTO PASO.<br />

TOMAR LA DECISIÓN.<br />

El valor observado de la estadística de la muestra se compara con el valor o los valores<br />

críticos de la estadística de la muestra. Entonces, la hipótesis nula se acepta o se<br />

rechaza. Si la hipótesis nula se rechaza, se acepta la hipótesis alternativa. A su vez, esta<br />

decisión será aplicable a otras decisiones que deban tomar los gerentes de operación,<br />

por ejemplo, si se mantiene un patrón de operación, o ¿Cuál de dos estrategias de<br />

mercadeo debe emplearse? o ¿Qué factores intervendrán si se hacen cambios en la<br />

producción? Si serán humanos, o materiales o ambos.<br />

1.1.2 Prueba de un Valor Hipotético de la Media Utilizando la Distribución Normal.<br />

La distribución de probabilidad normal se puede utilizar para probar un valor hipotético<br />

de la media de la población (1) cuando n ≥ 30, o (2) cuando n < 30 y sabemos que la<br />

población está normalmente distribuida y se conoce σ.


Se utiliza una prueba de dos colas cuando estamos interesados en una desviación<br />

posible en cualquier dirección del valor hipotético de la media. La fórmula empleada para<br />

establecer los valores críticos de la media de la muestra es semejante a la fórmula para<br />

determinar los límites de confianza para estimar la media de la población, excepto que el<br />

valor hipotético de la media de la población, µ o , es el punto de referencia y no la media<br />

de la muestra. Los valores críticos de la media de la muestra para una prueba de dos<br />

colas, según se conozca no son:<br />

Ejemplo:<br />

µ o ± σ x ó o x<br />

z<br />

Para la hipótesis nula formada en el ejemplo del auditor, el cual quiere probar la<br />

suposición de que el valor medio de todas las cuentas por cobrar en una firma dada es<br />

de $260.00, tomando una muestra de n = 36, determina los valores críticos de la media<br />

de la muestra para probar la hipótesis a un nivel de significación del 5 por ciento.<br />

Dado que la desviación estándar de las cantidades de las cuentas por cobrar es<br />

σ = $43.00, los valores críticos son:<br />

Hipótesis: Ho: µ = $260.00 ; Ha: µ ≠ $260.00<br />

Nivel de significación: α = 0.05<br />

<strong>Estadística</strong> de prueba:<br />

x basado en una muestra de n = 36 y con σ = 43.00<br />

x CR = valor crítico de la media de la muestra.<br />

=<br />

µ<br />

± z σ<br />

x CR o x<br />

=<br />

=<br />

260.<br />

00<br />

260.<br />

00<br />

=<br />

260.<br />

00<br />

⎛ 43 ⎞<br />

+ 1.96<br />

⎜<br />

⎟ =<br />

⎝ 36 ⎠<br />

⎛ 43 ⎞<br />

− 1.96<br />

⎜<br />

⎟ =<br />

⎝ 36 ⎠<br />

⎛ σ ⎞<br />

± 1.96 ⎜<br />

⎟<br />

⎝ n ⎠<br />

$ 245.<br />

95<br />

$ 274.<br />

05<br />

Por lo tanto, para rechazar la hipótesis nula media de la muestra se debe tener un valor<br />

que sea menor que $245.95 o mayor que $274.05. De esta manera, existen dos regiones<br />

de rechazo en el caso de una prueba de dos colas.<br />

20<br />

µ<br />

±<br />

z<br />

S


f( x )<br />

Y<br />

Región de<br />

rechazo<br />

Los valores z de ± 1.96 se utilizan para establecer los límites críticos porque para la<br />

distribución normal estándar, una porción de 0.05 del área corresponde a las dos colas,<br />

lo que corresponde a la especificación de α = 0.05.<br />

En vez de establecer los valores críticos en términos de la media de la muestra como tal,<br />

los valores críticos en la prueba de hipótesis se especifican típicamente en términos de<br />

valores z. Para el nivel de significación del 5 por ciento, los valores críticos z para una<br />

prueba de dos colas son –1.96 y +1.96, por ejemplo. Cuando se determina el valor de la<br />

media de la muestra, se transforma en valor z para poderlo comparar con los valores<br />

críticos de z. La fórmula de transformación, según se conozca o no σ, es:<br />

x − µ o<br />

z = ó<br />

σ x<br />

21<br />

x − µ<br />

z =<br />

S x<br />

Una prueba de una cola es apropiada cuando se está interesado en las posibles<br />

desviaciones en una sola dirección desde el valor hipotético de la media. El auditor que<br />

quiere probar la suposición de que el valor medio de todas las cuentas por cobrar en una<br />

firma dada es $260.00, tomando una muestra de n = 36, puede no estar interesado en<br />

que el promedio verdadero de todas las cuentas por cobrar exceda $260.00, sino en que<br />

pueda ser menor de $260.00, la hipótesis nula y la hipótesis alternativa son:<br />

Ho: µ ≥ $260.00 y Ha: µ < $260.00<br />

región de aceptación<br />

Sólo hay una región de rechazo para una prueba de una cola, la cual está siempre en la<br />

cola que representa el apoyo de la hipótesis alternativa. Como en el caso anterior, para<br />

una prueba de dos colas, el valor crítico puede determinarse para la media como tal o en<br />

términos de un valor z. Sin embargo, los valores críticos para pruebas de una cola<br />

difieren de los de las pruebas de dos colas porque la porción de área dada está toda en<br />

una cola de la distribución. La siguiente tabla representa los valores de z necesarios para<br />

pruebas de una cola y de dos colas.<br />

o<br />

Región de<br />

rechazo<br />

245.93 260.00 274.05<br />

X


VALORES CRÍTICOS DE Z EN UNA PRUEBA DE HIPÓTESIS<br />

TIPO DE PRUEBA<br />

Nivel de significación Una cola Dos colas<br />

5% ± 1.65 ± 1.96<br />

1% ± 2.33 ± 2.58<br />

La fórmula general para establecer el valor crítico de la media de la muestra para una<br />

prueba de una cola según se conozca (alex) o no es:<br />

µ o + σ x ó o x<br />

z<br />

En estas fórmulas z, puede ser negativo, dando como resultado una resta del segundo<br />

término en cada fórmula<br />

1.1.3 Errores de Tipo I y de Tipo II en Pruebas de Hipótesis<br />

En este fascículo, las pruebas de tipo I y de tipo II, se presentan totalmente con respecto<br />

a las pruebas de una cola para una media hipotética. La probabilidad del error de tipo I<br />

es siempre igual al nivel de significación utilizado al probar la hipótesis nula. Esto es<br />

porque por definición la porción de área en la región de rechazo es igual a la proporción<br />

de los resultados de la muestra que ocurriría en aquella región si la hipótesis nula es<br />

verdadera.<br />

La probabilidad del error de tipo II se designa generalmente con la letra β (“beta”.) Se<br />

puede determinar solamente respecto de un valor específico incluido en el rango de la<br />

hipótesis alternativa.<br />

Ejemplo:<br />

En el ejemplo del auditor, la hipótesis nula que se va a probar es que la media de todas<br />

las cuentas por cobrar es por lo menos $260.00 y esta prueba se va a llevar a cabo a un<br />

nivel de significación de 5%.<br />

El auditor indica que consideraría una media real de $260.00 (o menos) como una<br />

diferencia importante y material del valor hipotético de la media. Como antes σ = $43.00<br />

y el tamaño de la muestra es n = 36 cuentas. La determinación de la probabilidad del<br />

error de tipo II requiere:<br />

22<br />

µ<br />

+<br />

z<br />

S


(1) Formular las hipótesis nula y alternativa para esta situación de prueba,<br />

(2) Determinar el valor crítico de la media de la muestra que se utilizará al probar la<br />

hipótesis nula a un nivel de significación del 5%,<br />

(3) Identificar la probabilidad del error de tipo I asociado con el uso del valor crítico<br />

calculado anteriormente como base para la regla de decisión,<br />

(4) Identificar la probabilidad del error de tipo II asociado con la regla de decisión<br />

dado el valor específico de la media alternativa de $240.00<br />

La solución completa es:<br />

(1) Ho: µ ≥ 260.00 ; Ha: µ < 260.00<br />

(2) x = µ o ± z σx<br />

= 260.<br />

00 + ( −165)<br />

( 7.<br />

17)<br />

= $ 248.<br />

17<br />

CR<br />

⎛ σ ⎞ 43.<br />

00 43<br />

donde σ x =<br />

⎜<br />

⎟ = = = 7.<br />

17<br />

⎝ n ⎠ 36 6<br />

(3) La probabilidad del error de tipo I es igual a 0.05 (el nivel de significación utilizado<br />

para probar la hipótesis nula.)<br />

(4) Identificar la probabilidad del error de tipo II asociado con la regla de decisión, dado<br />

el valor específico de la media alternativa de $240.00.<br />

z<br />

x − µ o<br />

=<br />

σ x<br />

=<br />

248.<br />

17 −<br />

7.<br />

17<br />

240<br />

=<br />

8.<br />

17<br />

7.<br />

17<br />

±<br />

1.<br />

14<br />

P (error de tipo II) = P (z ≥ + 1.14) = 0.5000 − 3.729 = 0.1271 ≈ 0.13<br />

La siguiente figura ilustra el procedimiento seguido en el ejemplo anterior. En general, el<br />

valor crítico de la media determinado con respecto a la hipótesis nula se “reduce” y se<br />

utiliza como el valor crítico respecto de la hipótesis alternativa específica.<br />

f( x )<br />

f( x)<br />

región de rechazo<br />

(error tipo I)<br />

rechazo correcto<br />

hipótesis nula<br />

0.05<br />

248.17<br />

0.13<br />

248.17<br />

región de aceptación<br />

23<br />

260.00<br />

aceptación incorrecta de la<br />

hipótesis nula (error de tipo II)<br />

x<br />

x


Cuando el nivel de significación y el tamaño de la muestra se mantienen constantes, la<br />

probabilidad del error de tipo II disminuye a medida que el valor específico de la<br />

alternativa de la media se coloca más lejos del valor de la hipótesis nula. Una curva<br />

característica de operación (CO) describe gráficamente la probabilidad de aceptación de<br />

la hipótesis nula dados varios valores alternativos de la media verdadera.<br />

La siguiente figura muestra la curva CO aplicable a cualquier prueba de este tipo, porque<br />

los valores sobre el eje horizontal se presentan en unidades del error estándar de la<br />

media. Para todos los valores a la izquierda de µ o , la probabilidad de aceptación indica<br />

la probabilidad del error de tipo II. A la derecha de µ o las probabilidades indican la<br />

aceptación correcta de la hipótesis nula.<br />

1.00<br />

0.80<br />

0.60<br />

0.40<br />

0.20<br />

En la prueba de hipótesis, el concepto de potencia se refiere a la probabilidad de<br />

rechazar una hipótesis nula dado un valor alternativo específico del parámetro (en<br />

nuestros ejemplos, la media de la población). Al designar la probabilidad del error del tipo<br />

II como β, se tiene que la potencia de la prueba es siempre 1 − β.<br />

De acuerdo con la figura anterior, observa que la potencia para valores alternativos de la<br />

media es la diferencia entre el valor indicado por la curva CO y 1.0, y de esta manera se<br />

puede obtener “por sustracción” utilizando la curva CO. Una gráfica construida para<br />

presentar los varios niveles de potencia, dados los valores alternativos de la media, se<br />

denomina curva de potencia.<br />

Ejemplo:<br />

− 50 x − 40 x − 30 x − 20 x −10 x +10 x<br />

De acuerdo con el ejemplo que hemos estado analizando, podemos determinar la<br />

potencia de la prueba dado un valor alternativo específico, de la media de $240.00, de la<br />

siguiente manera:<br />

24<br />

POSICIÓN POSIBLE<br />

DE LA VERDADERA µ


Puesto que β = P(error de tipo II) = 0.13.<br />

Potencia = 1 − β = 1.00 – 0.13 = 0.87<br />

Nota. Esta es la probabilidad de rechazar correctamente la hipótesis nula cuando<br />

µ = $240.00.<br />

25


1.2 ESTIMACIÓN<br />

El segundo tipo de inferencia estadística es la estimación. Este procedimiento utiliza<br />

cuando se responde a una pregunta que pide el valor de una parámetro poblacional. Por<br />

ejemplo, ¿Cuál es la distancia media en un solo sentido que deben viajar los estudiantes<br />

que asisten a cualquier plantel del Colegio de Bachilleres?<br />

Para contestar esta pregunta, hay que tomar una muestra de la población y calcular la<br />

media muestral x.<br />

Imagina que eliges una muestra aleatoria de 100 distancias en un solo sentido y que<br />

resulta una media de 16 Km ¿Cuál es la estimación del valor medio de la población?<br />

Si se toma la media muestral como dicha estimación, se estará efectuando una<br />

estimación puntual.<br />

1.2.1 Estimación Puntual de un Parámetro<br />

Se considera como el valor de estadística muestral correspondiente, es decir, la<br />

muestral, X = 16 Km., es la mejor estimación puntual para la distancia media en un<br />

sentido para esta población. En otras palabras, se ha estimado que la distancia media en<br />

un solo sentido recorrida por todos los estudiantes es igual a 16 Km.<br />

Ello no requiere decir que la media poblacional µ sea exactamente igual a 16 Km., sino<br />

que se interpreta esta estimación como “µ está próxima a 16 Km.” ¿Qué quiere decir<br />

“está próxima?<br />

El término de proximidad es relativo, pero quizá en este caso, “próximo” debe ser<br />

definido arbitrariamente como estar “dentro de un kilómetro” de µ. Si un kilómetro<br />

satisface la idea intuitiva de proximidad, entonces decir “µ está próxima a 16 Km.”es<br />

comparable a decir “µ está entre 15 (16−1) y 17 (16+1) kilómetros”.<br />

Esto indica que se deben hacer estimaciones utilizando intervalos. Este tipo de<br />

estimación utiliza el concepto de intervalo y asigna una medida a la confiabilidad de éste<br />

en la estimación del parámetro en cuestión.<br />

26


1.2.2 Estimación por Intervalo<br />

Un intervalo acotado por dos números se emplea para estimar el valor de un parámetro<br />

poblacional. Los valores que limitan este intervalo son estadísticas calculadas a partir de<br />

la muestra que están sirviendo como base para la estimación.<br />

1.2.3 nivel de confianza 1 – α<br />

Es la probabilidad de que la muestra por seleccionarse produzca valores límite que se<br />

localicen en lados opuestos del parámetro que se estima. Algunas veces el nivel de<br />

confianza se llama coeficiente de confianza.<br />

1.2.4 Intervalo de Confianza<br />

Se considera como la estimación por intervalo con un nivel de confianza específico. El<br />

teorema central de límite es la fuente de información necesaria para obtener<br />

estimaciones por intervalos de confianza. La media X = 16 es un miembro de la<br />

distribución muestral de las medias.<br />

La siguiente figura muestra la distribución de muestreo de las medias a la que pertenece<br />

la media muestral x = 16 (n = 100), suponiendo que σ = 6,<br />

µ (desconocida)<br />

27<br />

σ / n = 6.0 / 100 = 0.6<br />

X


Cuando se selecciona aleatoriamente una muestra de tamaño 100 de una población<br />

cuya medida es µ y cuya desviación estándar es 6, ¿Cuál es la probabilidad de que la<br />

media muestral diste de µ menos de una unidad?.En otras palabras, ¿Cuál es<br />

P ( µ − 1 < x < µ + 1)<br />

?<br />

Esta probabilidad la puedes encontrar determinando la distribución de probabilidad<br />

normal de la siguiente manera:<br />

x − µ<br />

z =<br />

σ n<br />

( µ − 1)<br />

− µ −1.<br />

0<br />

Si x = µ − 1 , entonces: z =<br />

= = − 1.<br />

67<br />

0.<br />

6 0.<br />

6<br />

( µ + 1)<br />

− µ 1.<br />

0<br />

Si x = µ + 1 , entonces: z =<br />

= = + 1.<br />

67<br />

0.<br />

6 0.<br />

6<br />

En consecuencia:<br />

P (µ – 1 < X < µ + 1) = P(−1.67 < Z < + 1.67)<br />

= 2⋅P(0 < Z < 1.67)<br />

= 2 (0.4525) = 0.9050<br />

La probabilidad de que la media de una muestra aleatoria esté dentro de una unidad de<br />

esta media poblacional es 0.9050. Así, la probabilidad de que la media poblacional se<br />

halle dentro de una unidad desde la media de una muestra es también igual a 0.9050.<br />

Por lo tanto, el intervalo 15 a 17 es una estimación por intervalo, con un nivel de<br />

confianza de 0.9050 para la distancia media en un solo sentido recorrida por los<br />

estudiantes del C.B.<br />

28<br />

σ / n = 0.6<br />

µ − 1.0 µ µ + 1.0<br />

x


1.2.5 Error de Estimación Máximo, E<br />

Es la mitad de la anchura del intervalo de confianza. En general, E es un múltiplo del<br />

error estándar.<br />

La ilustración precedente comenzó con la asignación de 1 Km. como valor del error<br />

máximo. Típicamente, se determina el error de estimación máximo por el nivel de<br />

confianza que se quiera que tenga el intervalo de confianza. Es decir, 1 − α determinará<br />

el error máximo. El nivel de confianza se dividirá de tal manera que la mitad de 1 − α<br />

este por arriba de la media, y la otra mitad por debajo, como se muestra en la figura:<br />

α/2<br />

CADA COLA CONTIENE α/2<br />

α/2<br />

1 − α<br />

1<br />

(1 − α)<br />

2<br />

Esto determinará la probabilidad α /2 en cada una de las dos colas de la distribución. El<br />

valor Z que limita al intervalo de confianza será Z (α/2). Recuerda que α/2 es la<br />

probabilidad (ó área) bajo la curva a la derecha de este punto. La Z es un número de<br />

desviaciones estándares. En consecuencia, el error, de estimación máximo E es:<br />

29<br />

n<br />

α/2<br />

σ (ERROR ESTÁNDAR DE LA MEDIA<br />

α/2<br />

−Z (α/2) 0 Z (α/2)<br />

E, error E, error<br />

máximo máximoi


E<br />

= Z ( α / 2)<br />

⋅<br />

σ<br />

n<br />

σ<br />

n<br />

σ X = (ERROR ESTÁNDAR DE LA MEDIA)<br />

El intervalo de confianza 1 − α para µ es<br />

σ<br />

X − Z ( α / 2)<br />

⋅ para<br />

n<br />

X + Z ( α /<br />

2)<br />

⋅<br />

σ<br />

n<br />

X − Z ( α / 2)<br />

⋅<br />

σ<br />

se llama límite de confianza inferior (LCI), Y X + Z ( α / 2)<br />

⋅<br />

n<br />

σ<br />

, límite de<br />

n<br />

confianza superior (LCS), del intervalo de confianza.<br />

En la práctica nos vemos obligados con frecuencia a tomar decisiones relativas a una<br />

población sobre la base de información proveniente de muestras. Tales decisiones se<br />

llaman decisiones estadísticas. Por ejemplo, podemos querer decir, basados en datos<br />

muestrales, si un método pedagógico es mejor que otro o si una moneda es falsa o no.<br />

Al intentar obtener una decisión, es útil hacer hipótesis (o conjeturas) sobre la población<br />

implicada. Tales hipótesis, que pueden ser o no ciertas, se llaman hipótesis estadísticas.<br />

Son, en general, enunciados acerca de las distribuciones de probabilidad de las<br />

poblaciones, que seguramente estudiaste en temas anteriores del curso de <strong>Estadística</strong>.<br />

En muchos casos realizamos hipótesis estadísticas con el único propósito de rechazarla<br />

o invalidarla. Así, si queremos decidir si una moneda es falsa, hacemos la hipótesis de<br />

que la moneda es buena (o sea, p = 0.5, donde p es la probabilidad de cara).<br />

Análogamente, si deseamos decidir si un procedimiento es mejor que otro, formulamos<br />

la hipótesis de que no hay diferencia entre ellos (o sea, que cualquier diferencia<br />

observada se debe simplemente a fluctuaciones en el muestreo de la misma población).<br />

Tales hipótesis, como recordarás, son las hipótesis nulas y se representa por Ho.<br />

Toda hipótesis que difiere se llama hipótesis alternativas. Por ejemplo: si una hipótesis<br />

es p = 0.5, las hipótesis alternativas podrían ser:<br />

p = 0.7, p ≠ 0.5 ó p > 0.5. Una hipótesis alternativa a la hipótesis nula se representará<br />

por Ha.<br />

30


Si suponemos que una hipótesis particular es cierta pero vemos que los resultados<br />

hallados en una muestra aleatoria difieren notablemente de los esperados bajo tal<br />

hipótesis, entonces diremos que las diferencias observadas son significativas y nos<br />

veríamos inclinados a rechazar la hipótesis (o al menos a no aceptarla ante la evidencia<br />

obtenida). Así, si en 20 tiradas de una moneda salen 16 caras, estaríamos inclinados a<br />

rechazar la hipótesis de que la moneda es buena, aunque cabe la posibilidad de<br />

equivocarnos.<br />

Los procedimientos que nos capacitan para determinar si las muestras observadas<br />

difieren significativamente de los resultados esperados, y por tanto nos ayudan a decidir<br />

si aceptamos o rechazamos la hipótesis, se llaman contrastes (o test) de hipótesis o de<br />

significación o reglas de decisión.<br />

Si rechazamos una hipótesis cuando debiera ser aceptada, diremos que se ha cometido<br />

un error de tipo I. Por otra parte, si aceptamos una hipótesis que debiera ser rechazada,<br />

diremos que se ha obtenido un error de tipo II. En ambos casos se ha producido un caso<br />

erróneo.<br />

Para que las reglas de decisión (o contrastes de hipótesis) sean buenas, deben<br />

diseñarse de modo que minimicen los errores de la decisión. Y no es una cuestión<br />

sencilla, porque para cualquier tamaño de la muestra, un intento de disminuir un tipo de<br />

error puede ser más grave que el otro, y debe alcanzarse un compromiso que disminuya<br />

el error más grave, La única forma de disminuir ambos a la vez es aumentar el tamaño<br />

de la muestra, que no siempre es posible.<br />

Al contrastar una cierta hipótesis, la máxima probabilidad con la que estamos dispuestos<br />

a correr riesgo de cometer un error de tipo I se llama nivel de significación de contraste.<br />

Esta probabilidad, denotada a menudo por α, se suele especificar antes de tomar la<br />

muestra, de manera que los resultados obtenidos no influyan en nuestra elección.<br />

En la práctica, es frecuente un nivel de significación de 0.05 ó 0.01, si bien se usan otros<br />

valores, Si, por ejemplo, se escoge el nivel de significación 0.05 (ó 5%) al diseñar una<br />

regla de decisión, entonces hay unas 5 oportunidades entre 100 de rechazar las<br />

hipótesis cuando debiera haberse aceptado; es decir, tenemos un 95% de confianza de<br />

que hemos adoptado la decisión correcta. En tal caso decimos que la hipótesis ha sido<br />

rechazada al nivel de significación 0.05, lo cual quiere decir que la hipótesis tiene una<br />

probabilidad 0.05 de ser falsa.<br />

Para ilustrar lo explicado anteriormente, suponemos que bajo cierta hipótesis la<br />

distribución de muestreo de un estadístico S es una distribución normal con media µs y<br />

desviación típica σS. Así pues, la distribución de la variable tipificada z dada por z = (S –<br />

µs)/σS, es la distribución normal canónica (media 0, varianza1), como indica la siguiente<br />

figura:<br />

31


REGIÓN CRÍTICA REGIÓN CRÍTICA<br />

0.025<br />

Z = 1.96 Z = 1.96<br />

Como se ve en la figura, podemos tener 95% de confianza de que si la hipótesis es<br />

verdadera, entonces el valor de z para un estadístico muestral S estará entre –1.96 y<br />

1.96 (porque el área bajo la curva normal entre esos valores es 0.95). Sin embargo, si al<br />

escoger una sola muestra al azar hallamos que el valor de z de su estadístico está fuera<br />

de ese rango, debemos concluir que tal suceso podría ocurrir con una probabilidad de<br />

sólo 0.05 (el área total sombreada en la figura) si la hipótesis dada fuera cierta. Diremos<br />

entonces que esta Z difiere de forma significativa de lo que sería de esperar bajo la<br />

hipótesis, y nos veríamos empujados a rechazar la hipótesis.<br />

El área total sombreada 0.05 es el nivel de significación del contraste. Representa la<br />

probabilidad de equivocarnos al rechazar la hipótesis (o sea, la probabilidad de un error<br />

de tipo I), Así pues, decimos que la hipótesis se rechaza a un nivel de significación 0.056<br />

o que el valor de z del estadístico muestral dado es significativo al nivel 0.05.<br />

El conjunto de Z fuera del rango –1.96 a 1.96 se llama la región crítica de la hipótesis,<br />

región de rechazo de la hipótesis, o región de significación. El conjunto de Z en el rango<br />

–1.96 a 1.96 se conoce como región de aceptación de la hipótesis o región de no<br />

significación.<br />

Basados en las anteriores observaciones, podemos formular la siguiente regla de<br />

decisión (o contrate de hipótesis o significación):<br />

Rechazar la hipótesis al nivel de significación 0.05 si el valor de Z para el estadístico S<br />

está fuera del rango –1.96 a 1.96 (o sea, si z > 1.96 ó z < 1.96). Esto equivale a decir<br />

que el estadístico muestral observado es significativo al nivel 0.05.<br />

Aceptar la hipótesis en caso contrario (o, si se desea, no tomar decisión alguna).<br />

Dado que z juega tan importante papel en el contraste de hipótesis, se le llama un<br />

estadístico de contraste.<br />

Hay que hacer notar que se utilizan también otro nivel de significación. Por ejemplo, si se<br />

usa el nivel 0.01, debe sustituirse el 1.96 de antes por 2.58. (observa la siguiente tabla):<br />

32<br />

0.025


NIVEL DE SIGNIFICACIÓN, α 0.10 0.05 0.01 0.005 0.002<br />

Valores críticos de z para test −1.28 −1.645 −2.33 −2.58 −2.88<br />

unilaterales<br />

ó 1.28 ó 1.645 ó 2.33 ó 2.58 ó 2.88<br />

Valores críticos de z para test −1.645 −1.96 −2.58 −2.81 −3.08<br />

bilaterales<br />

y 1.645 y 1.96 y 2.58 y 2.81 y 3.08<br />

La suma de los niveles de significación y de confianza es 100%.<br />

En el test precedente estábamos interesados en los valores extremos del estadístico S o<br />

en su correspondiente valor z a ambos lados de la media (o sea, en las dos colas de la<br />

distribución). Tales test se llaman contrastes de dos colas o bilaterales.<br />

Con frecuencia, no obstante, estaremos interesados tan sólo en valores extremos a un<br />

lado de la media (o sea, en una de las colas de distribución), tal como sucede cuando se<br />

contrasta la hipótesis de que un proceso es mejor que otro (lo cual no es lo mismo que<br />

contrastar si un proceso es mejor o peor que el otro). Tales contrastes se llaman<br />

unilaterales, o de una cola. En tales situaciones, la región crítica es una región situada a<br />

un lado de la distribución, con área igual al nivel de significación.<br />

La tabla anterior, que da valores críticos de z para contrastes de una o dos colas en<br />

varios niveles de significación, será útil como referencia posterior. Los valores críticos de<br />

z para otros niveles de significación se hallan a partir de la tabla de áreas de la curva<br />

normal que a continuación se muestra:<br />

A menudo adquiere importancia práctica saber cuándo un proceso ha variado tanto que<br />

deben adoptarse medidas para remediar la situación.<br />

Tales problemas aparecen, por ejemplo, en el control de calidad. Los supervisores del<br />

control de calidad han de decidir frecuentemente si los cambios observados se deben<br />

simplemente a fluctuaciones de azar o a cambios reales en un proceso de producción<br />

por deterioro de la maquinaria, descuidos de los empleados, etc. Los gráficos de control<br />

ponen a nuestra disposición un método sencillo y eficaz para enfrentarnos a esa clase de<br />

problemas, por ejemplo:<br />

Se construye una máquina para fabricar bolas de rodamiento con diámetro medio de<br />

0.574 cm. y desviación típica de 0.008 cm. Para determinar si funciona correctamente,<br />

se toma una muestra de 6 bolas cada dos horas y se halla para cada una de las<br />

muestras el diámetro medio.<br />

a) Diseñar una regla de decisión con la que se esté muy seguro de que la calidad<br />

del producto cumple los propósitos exigidos.<br />

b) Ilustrar gráficamente la regla de decisión de (a).<br />

33


SOLUCIÓN:<br />

a) Con el 99.73% de confianza podemos decir que la media muestral x debe estar entre<br />

µX − 3σX y µX + 3σX o sea µ − 3σ N a µ + 3σ N .<br />

Como µ = 0.574 σ = 0.008 N = 6<br />

Se sigue que con el 99.73% de confianza, la media muestral debería estar entre<br />

0. 574 − 0.<br />

024 6 y 0 . 574 + 0.<br />

024 6 , o entre 0.564 y 0.584 cm. Luego nuestra regla<br />

de decisión es como sigue:<br />

Si una media muestral cae dentro del rango de 0.564 a 0.584, aceptamos que la<br />

máquina funciona bien: Si no, concluimos que no funciona bien e investigamos la razón.<br />

b) Se pueden anotar las observaciones en un gráfico como en la siguiente figura,<br />

llamado un gráfico de control de calidad. Cada vez que se toma una muestra, se<br />

representa por un punto concreto. En tanto que los puntos están entre el límite inferior<br />

(0.564 cm.) y el superior (0.584 cm.), el proceso está bajo control. Cuando un punto<br />

se sale de esos límites de control (como sucede en la tercera muestra tomado el<br />

jueves), existe la posibilidad de que algo falle, y se hace preciso investigarlo.<br />

0.584<br />

0.574<br />

0.564<br />

Lunes Martes Miércoles Jueves Viernes<br />

34


RECAPITULACIÓN<br />

A continuación te proporcionamos una síntesis de los conceptos más relevantes que<br />

estudiaste en este fascículo:<br />

INFERENCIA ESTADÍSTICA<br />

PRUEBAS DE HIPÓTESIS<br />

PRUEBA DE UN VALOR<br />

HIPOTÉTICO DE LA MEDIA<br />

UTILIZANDO LA<br />

DISTRIBUCIÓN NORMAL<br />

ERRORES DE TIPO I y II<br />

ESTIMACIÓN<br />

NIVEL DE CONFIANZA<br />

ERROR DE ESTIMACIÓN<br />

MÁXIMO E<br />

Cada una de las partes que conforman el esquema anterior, se relacionan con la<br />

Inferencia <strong>Estadística</strong>. Con base en el, elabora una síntesis de cada aspecto,<br />

especificando cómo se interrelacionan.<br />

35<br />

ETAPAS BÁSICAS<br />

PUNTUAL DE UN<br />

PARÁMETRO<br />

POR INTERVALO<br />

INTERVALO DE<br />

CONFIANZA


De acuerdo a lo que has estudiado en el fascículo, te invitamos a que realices los<br />

siguientes ejercicios que te ayudarán a conocer qué tanto aprendiste de la <strong>Estadística</strong><br />

<strong>Inferencial</strong>.<br />

ACTIVIDAD 1<br />

Los Jefes de Manzana de cierta colonia, investigan el ingreso mensual familiar para<br />

crear un centro comercial en la colonia, que es de $2,000.00. Imagina que para el tipo de<br />

colonia en cuestión, el ingreso familiar está distribuido más o menos normalmente y que<br />

la desviación estándar se puede aceptar como igual a σ = $2,000.00, de acuerdo a la<br />

investigación de los jefes de manzana.<br />

Para una muestra aleatoria de n = 15 familias, se ha encontrado que el ingreso medio<br />

por familia es x = $1,500.00. Prueba la hipótesis nula de que µ = $1,500.00,<br />

estableciendo los límites críticos de la media de la muestra en $, utilizando un nivel de<br />

significación del 5%.<br />

ACTIVIDAD 2<br />

En la fábrica de autos Ford, se contempla la compra de un nuevo equipo de diseño de<br />

partes para automóvil, El equipo no debe exigir en promedio más de 10 min. de tiempo<br />

de preparación por cada hora de operación. El agente de compra visita una compañía<br />

donde está instalado el equipo. Por la información que en ella recoge comprueba que 40<br />

horas de operación seleccionadas aleatoriamente incluyen un total de 7 horas y 30<br />

minutos, de tiempo de preparación y que la desviación estándar del tiempo de<br />

preparación por hora fue 3.0 min. Basado en este resultado de la muestra ¿Puede<br />

rechazarse la suposición de que el equipo posee las especificaciones sobre tiempo de<br />

preparación al nivel de significación del 1%.<br />

ACTIVIDAD 3<br />

ACTIVIDADES DE CONSOLIDACIÓN<br />

De 100 estudiantes de tercero y cuarto semestre de un plantel del CB, una muestra<br />

aleatoria de n = 12 estudiantes tiene una calificación promedio de 2.7 (donde aprob. =<br />

4.0), con una desviación estándar de S = -0.4. Se supone que las calificaciones<br />

promedio están normalmente distribuidas. Prueba la hipótesis de que el promedio total<br />

de calificaciones para todos los estudiantes del plantel del C.B. es por lo menos 3.0<br />

utilizando un nivel de significación del 1%.<br />

36


AUTOEVALUACIÓN<br />

1.- Ya que la media de la muestra de X=$1,500.00 está en la región de aceptación de la<br />

hipótesis nula, la información de los jefes de manzana no se puede rechazar a un nivel<br />

de significación del 5%.<br />

2.- Se rechaza la hipótesis nula al nivel de significación del 1% y se acepta la hipótesis<br />

alternativa de que el tiempo promedio de preparación para este equipo es mayor de<br />

10min. por hora de operación.<br />

3.- La Hipótesis nula se rechaza al nivel de significación del 1%. Si se hubiera ignorado<br />

la utilización del factor de corrección finito, el valor calculado t, sería –2.59, y se<br />

aceptaría inapropiadamente la hipótesis nula.<br />

37


BIBLIOGRAFÍA CONSULTADA<br />

HABER/Ronyon. <strong>Estadística</strong> General. Ed. Addison/Wesley, México, 1990<br />

HERNÁNDEZ Santieri, Roberto. Metodología de la Investigación. Ed. Mc Graw-Hill,<br />

México, 1990.<br />

KAZMIER Leonard J. <strong>Estadística</strong> Aplicada a la Administración y la Economía. Ed. Mc<br />

Graw-Hill, México 1982.<br />

SPIEGEL, <strong>Estadística</strong>, Ed. Mc Graw-Hill, 2ª. Edición, México 1993.<br />

38

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!