Estadística Descriptiva e Inferencial 2 fasículo 4 - Portal Educativo ...
Estadística Descriptiva e Inferencial 2 fasículo 4 - Portal Educativo ...
Estadística Descriptiva e Inferencial 2 fasículo 4 - Portal Educativo ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
COLEGIO DE BACHILLERES<br />
ESTADÍSTICA DESCRIPTIVA<br />
E INFERENCIAL II<br />
FASCÍCULO 4. INTRODUCCIÓN A LA INFERENCIA<br />
ESTADÍSTICA Y APLICACIÓN EN EL<br />
CONTROL ESTADÍSTICO<br />
Autor: Guadalupe Floiran Martínez<br />
1
COLEGIO DE<br />
BACHILLERES<br />
Colaboradores<br />
Asesoría Pedagógica<br />
Olivia Hernández Romero<br />
Revisión de Contenido<br />
Armando Martínez Cruz<br />
Diseño Editorial<br />
Leonel Bello Cuevas<br />
Javier Darío Cruz Ortiz<br />
2
INTRODUCCIÓN<br />
PROPÓSITO<br />
CUESTIONAMIENTO GUÍA<br />
CAPÍTULO 1. INTRODUCCIÓN A LA INFERENCIA<br />
ESTADÍSTICA Y APLICACIONES<br />
EN EL CONTROL ESTADÍSTICO<br />
RECAPITULACIÓN<br />
1.1 INFERENCIA ESTADÍSTICA 11<br />
1.1.1 Etapas Básicas en Pruebas de Hipótesis 17<br />
1.1.2 Prueba de un Valor Hipotético de la Media<br />
Utilizando la Distribución Normal<br />
1.1.3 Error de Tipo I y II en Pruebas de Hipótesis 22<br />
1.2 ESTIMACIÓN 25<br />
1.2.1 Estimación Puntual de un Parámetro 26<br />
1.2.2 Estimación por Intervalo 27<br />
1.2.3 Nivel de Confianza 1− α 27<br />
1.2.4 Intervalo de Confianza 27<br />
1.2.5 Error de Estimación Máximo E 29<br />
ACTIVIDADES DE CONSOLIDACIÓN<br />
AUTOEVALUCIÓN<br />
Í N D I C E<br />
BIBLIOGRAFÍA CONSULTADA<br />
3<br />
5<br />
7<br />
9<br />
11<br />
19<br />
35<br />
36<br />
37<br />
38
Í N T R O D U C C I Ó N<br />
Seguramente te habrás topado repetidas veces con informaciones de tipo estadístico.<br />
Quizá habrás leído, en el transcurso de tus estudios, artículos que incluyen tratamiento<br />
estadístico de datos, te habrás dado cuenta entonces que, en los últimos tiempos, la<br />
<strong>Estadística</strong> ocupa un lugar cada vez más importante en periódicos, revistas, libros,<br />
programas de radio y televisión, esta penetración es cada vez más presente en nuestras<br />
vidas, y aún cuando creamos estar alejados de esta disciplina, solemos estar<br />
involucrados en ella, un ejemplo de ello son los censos.<br />
Es hora pues, de preguntarte que es en realidad la <strong>Estadística</strong>, cómo funciona, o que<br />
hace con los datos para llegar a ciertas conclusiones. En este fascículo hablaremos de la<br />
Inferencia <strong>Estadística</strong> y sus aplicaciones, para que conozcas la aportación tan útil que<br />
nos da este método estadístico, para generalizar informaciones de Investigación o<br />
deducir conclusiones relacionadas con poblaciones a partir de las muestras extraídas de<br />
éstas. También, podrás realizar controles estadísticos de calidad que te ayudarán a<br />
tomar decisiones, con el transcurso de tus estudios o tal vez en el trabajo que<br />
desempeñes.<br />
Como podrás ver, este fascículo te ayudará a conocer otra parte más de esta ciencia tan<br />
fascinante como lo es la <strong>Estadística</strong> <strong>Inferencial</strong>.<br />
5
P R O P Ó S I T O<br />
El propósito de este fascículo, es el de iniciarte en el estudio de la <strong>Estadística</strong> <strong>Inferencial</strong>,<br />
ya que ella te permite obtener conclusiones, que te ayudarán a tomar decisiones sobre<br />
investigaciones que realices.<br />
La <strong>Estadística</strong> <strong>Inferencial</strong>, está basada en los estudios que realizaste en el semestre<br />
anterior, pues a través de las medidas de tendencia central y descriptivas, podemos<br />
establecer ciertas características de alguna situación problemática, y con la <strong>Estadística</strong><br />
<strong>Inferencial</strong>, estudiamos más detalladamente esas características.<br />
Con las actividades que desempeñes a lo largo del estudio de la <strong>Estadística</strong> <strong>Inferencial</strong>,<br />
te darás cuenta de la utilidad que representa el conocerla, y de lo importante que es,<br />
para poder obtener documentos de investigación confiables.<br />
A través de la aplicación de la <strong>Estadística</strong> <strong>Inferencial</strong>, se pueden desarrollar<br />
investigaciones científicas y obtener datos confiables; dichas investigaciones pueden ser<br />
retomadas en diferentes momentos y por diferentes personas para esclarecer algunos<br />
aspectos específicos y que se relacionan con la investigación.<br />
7
SENTIDO COMÚN Y ESTADÍSTICA<br />
CUESTIONAMIENTO GUÍA<br />
Cuando el estadista norteamericano Henry Clay (1777-1850), acuñó las palabras “las<br />
estadísticas no son un sustituto del sentido común” quizá no hacía referencia a la<br />
conclusión de una prueba de hipótesis pero sus palabras encierran una gran verdad. La<br />
prueba estadística de una hipótesis es sólo un modelo, con frecuencia muy simplificado,<br />
de la realidad. El problema real debe trasladarse en algún modelo matemático, y la<br />
conclusión que ofrece el modelo debe interpretarse a la luz de la realidad y, además, en<br />
conjunción con factores que no se encuentran incluidos en el modelo.<br />
Supón que una persona desea pintar su recámara. Efectúa un cálculo con el propósito<br />
de conocer la superficie total a pintar: 67m. cuadrados. Entonces lee la etiqueta de una<br />
lata de pintura: “El contenido de esta lata alcanza para pintar una superficie de 32.51m.<br />
cuadrados”. Al ser un genio en matemáticas, dicha persona calcula que necesitará 2.06<br />
latas. Ahora, ¿Cuántas latas de pintura deberá comprar?, ¿Dos o tres? El modelo<br />
matemático del problema real proporciona una respuesta exacta, 2.06 latas, (siempre y<br />
cuando, no esté rebajada la pintura) Pero, con toda claridad, quizá no sean suficientes<br />
dos latas; así que deberán comprarse tres.<br />
Pero el mundo real impone otros aspectos: ¿Está a la venta la pintura?, ¿La tienda se<br />
localiza cerca de la esquina o a 12km. del camino?, ¿Es un pintor pulcro o descuidado?,<br />
¿Es pesimista u optimista?, ¿Cree que el número de está en la etiqueta (67m.<br />
cuadrados) es un promedio o un mínimo?, ¿Le satisfaría que los últimos 1.98m.<br />
cuadrados se cubrieran sólo con una capa delgada? ¿Se va a pintar con un color oscuro<br />
una superficie que tiene un color claro o viceversa?<br />
El modelo matemático proporciona lineamientos para tomar la última decisión, pero se<br />
deben considerar los riesgos al tomar una decisión equivocada. Si sólo se compran dos<br />
botes de pintura, es posible que se tenga que volver a la tienda; quizá ya no tengan el<br />
mismo color de pintura o el precio haya aumentado. Si se compran tres botes quizá se<br />
tenga que volver a la tienda a devolver uno y es posible que en está no se acepten<br />
devoluciones.<br />
En la misma forma, la prueba estadística de una hipótesis es sólo un modelo de una<br />
9
situación real. Así que la respuesta que puede darse es: “La persona tiene una<br />
respuesta; quizá sea correcta. Considera las consecuencias de todos los posibles<br />
errores que se encontraría detrás de una decisión equivocada”.<br />
Como te darás cuenta, la prueba de hipótesis, hace referencia a una serie de<br />
cuestionamientos, los cuales conllevan a tomar una decisión. ¿Tú qué decisión tomarías<br />
si fueras a pintar tu casa?<br />
Quizá no tengas tampoco una decisión firme, pero conforme estudies este fascículo, irás<br />
adquiriendo las herramientas necesarias de conocimientos para llegar a tomar<br />
decisiones claras y precisas.<br />
10
CAPÍTULO 1<br />
INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA Y<br />
APLICACIONES EN EL CONTROL ESTADÍSTICO<br />
DE LA CALIDAD<br />
1.1 INFERENCIA ESTADÍSTICA<br />
Supongamos que eres un psicólogo que hace investigaciones con ratas, y que te sientes<br />
atraído por saber la relación que existe entre el hambre y el aprendizaje.<br />
Específicamente, ¿Cuáles serán los efectos de la fuerza del hambre sobre el número de<br />
recorridos que realizan las ratas en un laberinto en forma de T para comer?<br />
Imagínate ahora que eres el líder de un equipo de fútbol, y con el objeto de planear la<br />
adhesión de nuevos miembros te es necesario conocer el número de adultos de tu<br />
localidad, cuyo deseo de pertenecer al equipo sea manifiesto. ¿Cómo le harías para<br />
obtener esta información?<br />
Piensa ahora que eres un sociólogo y quieres conocer las diferencias de la educación<br />
entre niños delincuentes y niños que no son delincuentes.<br />
Imagínate que eres un investigador de mercados y quieres conocer el número de<br />
individuos que prefieren colores distintos y combinaciones diferentes en los automóviles.<br />
Imagínate que eres el encargado de una pista de patinaje y quieres determinar cuando la<br />
capa de hielo está suficientemente gruesa como para permitir el patinaje sin peligro.<br />
11
¿Qué tienen todos estos problemas en común?<br />
Seguramente, te habrás dado cuenta que estamos determinando características<br />
cuantitativas, en base a diferentes variables de una población dada, para las cuales,<br />
pretendemos generalizar algunas respuestas.<br />
La Inferencia <strong>Estadística</strong> se encarga de utilizar los números para proporcionar<br />
información con respecto a grupos más grandes que aquellos a partir de los cuales se<br />
obtuvieron los datos originales.<br />
Las siguientes situaciones son ejemplos de Inferencia <strong>Estadística</strong>.<br />
A partir de muestras adecuadas, es posible inferir que:<br />
1. Entre el 20% y el 25% de todos los estudiantes de las Universidades de la<br />
República Mexicana son casados.<br />
2. Existe una relación entre el nivel del colesterol y las enfermedades cardiacas.<br />
3. El 25% de los niños de una determinada colonia del D.F., padecen de caries<br />
dental.<br />
Con frecuencia es imposible estudiar todos los miembros de una población dada, ya sea<br />
porque la población, tal como ha sido definida, tiene un número infinito de miembros, o<br />
porque es tanta que imposibilita un estudio exhaustivo.<br />
Puesto que raras veces se pueden estudiar exhaustivamente las poblaciones, debemos<br />
depender de las muestras como base para llegar a hipótesis concernientes a varias<br />
características, de la población.<br />
Cuando queremos muestrear, podemos utilizar muestras aleatorias y muestras<br />
representativas principalmente. Las muestras aleatorias las podemos obtener con<br />
elementos seleccionados por casualidad. El muestreo representativo es aquel cuyos<br />
elementos son seleccionados de acuerdo con criterios de representatividad.<br />
Existen otros tipos de diseño de muestra, como son el muestreo sistemático,<br />
estratificado y por conglomerado los cuales establecen criterios para poder muestrear de<br />
tal manera que facilite la elección de la muestra deseada.<br />
Así, si queremos saber por cuál partido político votará la población completa de electores<br />
de la Delegación Cuauhtémoc, nos llevaría mucho tiempo y esfuerzo el cuestionar a<br />
todos, así que solo preguntaremos a unos cuantos (muestreo) y así podremos conocer<br />
aproximadamente que partido es el de más agrado en esta Delegación.<br />
12
Casi toda investigación utiliza la observación y la medida de un número limitado de<br />
individuos o sucesos. Se supone que estas medidas nos proporcionarán alguna<br />
información sobre la población. Para poder comprender cómo podemos ser capaces de<br />
establecer inferencias sobre una población a partir de una muestra, tenemos que<br />
conocer la distribución de probabilidad teórica de todos los valores posibles de algunos<br />
estadísticos de las muestras que ocurrirían, si fuera posible obtener todas las muestras<br />
del mismo tamaño a partir de esa población dada.<br />
Por ejemplo, ¿Recuerdas todas tus calificaciones desde que ingresaste a estudiar?<br />
Probablemente sean ya bastantes y las puedas considerar como una población de<br />
calificaciones.<br />
Decides obtener muestras de tres calificaciones por año escolar, (tal vez desde la<br />
primaria) y calcular la media y la desviación estándar de cada muestra. Si tuvieras que<br />
obtener todas las muestras posibles en las cuales N = 3, y las representaras en una<br />
gráfica las medias y las desviaciones estándar resultantes, obtendrías dos distribuciones<br />
de muestra: una para las medias y otra para las desviaciones estándar.<br />
Te invitamos a que realices las tablas de frecuencia y te des cuenta cuánto has<br />
evolucionado o involucionado en tus estudios a través del tiempo que llevas estudiando.<br />
¿Porqué es tan importante el concepto de distribución de muestras?. La respuesta es<br />
simple. Cuando quieras que se considere un parámetro de población a partir de una<br />
muestra, nos haremos preguntas tales como: “¿Qué tan buena es la estimación<br />
obtenida?”, ¿Puedo llegar a la conclusión de que el parámetro de población es idéntico<br />
al estadístico de la muestra? o, ¿Es probable que exista algún error? Si es así, ¿Qué tan<br />
grande es este error?<br />
Para responder cada una de estas preguntas, compararemos los resultados obtenidos a<br />
partir de las muestras con los resultados “esperados”.<br />
La muestra debe ser representativa de la población, para que los resultados que se<br />
obtengan puedan utilizarse también para generalizar el comportamiento de la población;<br />
su tamaño debe ser adecuado de acuerdo con criterios de representatividad, pudiendo<br />
variar de un 10 a un 15%, dependiendo del tipo de investigación que se realice.<br />
Una muestra es importante en la Inferencia <strong>Estadística</strong>, ya que te ayuda a establecer<br />
decisiones que serán consideradas dentro de una población.<br />
Cuando analizamos la muestra obtenida de una población, la prueba de hipótesis<br />
constituye el proceso relacionado con aceptar o rechazar declaraciones en base a la<br />
muestra establecida.<br />
13
Seguramente la palabra hipótesis te “suene” conocida, ya que en tus clases de Física y<br />
Métodos de Investigación la utilizaste con frecuencia. Bueno, pues ahora en <strong>Estadística</strong><br />
<strong>Inferencial</strong> la recordarás de nuevo, aunque tal vez no en el mismo sentido que la<br />
utilizaste anteriormente.<br />
En muchas ocasiones, las estadísticas tratan preguntas mediante la formulación de dos<br />
proposiciones opuestas que reciben el nombre de HIPÓTESIS.<br />
Por ejemplo:<br />
1. ¿Qué porcentaje de los alumnos del C.B. continúan el nivel superior?<br />
2. ¿Qué tan eficaz es la receta A con relación a B?<br />
3. ¿Es cierto qué el 30% de las personas compra su marca favorita de pasta para<br />
dientes sin importarle el precio de ésta?<br />
Estas preguntas son de dos tipos. Las preguntas 1 y 2 piden una respuesta numérica. La<br />
última requiere una respuesta de si o no.<br />
Una hipótesis estadística es una afirmación acerca de una población. Una persona<br />
intenta afirmar o negar una pregunta “más allá de toda duda razonable”.<br />
La Inferencia <strong>Estadística</strong> utiliza Hipótesis <strong>Estadística</strong>s, las cuales dan declaración o<br />
afirmación tentativa acerca del valor de un parámetro o parámetros de una población (las<br />
medidas de dispersión y la medida poblacional, son parámetros de población.) Las<br />
pruebas de hipótesis pueden mostrar si una declaración tentativa se ve apoyada o<br />
rechazada por la evidencia de la muestra.<br />
Los ejecutivos de negocios, científicos, estrategas militares, políticos, educadores y<br />
muchas otras personas toman decisiones relativas a parámetros de la población.<br />
Para que una hipótesis sea digna de tomarse en cuenta en cualquier investigación,<br />
principalmente de tipo científico, debe reunir ciertos requisitos:<br />
1. Hay que analizar al establecer nuestras hipótesis si son las adecuadas para el<br />
estudio que vayamos a realizar y si es posible tener acceso a ellas<br />
(reconfirmamos el contexto, buscamos otro o ajustamos las hipótesis.)<br />
2. Los términos (variables) de las hipótesis tienen que ser comprensibles, precisos<br />
y los más concretos posible.<br />
Por ejemplo: “Globalización de la Economía”, “Sinergia Organizacional”, son<br />
conceptos imprecisos y generales, que deben sustituirse por otros más específicos y<br />
concretos.<br />
3. La relación propuesta entre variables por una hipótesis debe ser clara y<br />
14
verdadera (lógica) Por ejemplo, una hipótesis como: “La disminución del<br />
consumo del petróleo en los Estados Unidos está relacionada con el grado de<br />
aprendizaje del álgebra por parte de niños que asisten a escuelas públicas en<br />
Buenos Aires”, será inverosímil, no podemos considerarla.<br />
4. Los términos de la hipótesis y la relación planteada entre ellos, deben poder ser<br />
observados y medidos, o sea tener referentes a la realidad. Por ejemplo, “Los<br />
hombres más felices van al cielo” o “La libertad de espíritu está relacionada con<br />
la voluntad creadora”, contienen conceptos o relaciones que no poseen<br />
referentes empíricos; por lo tanto, no son útiles como hipótesis para investigar<br />
estadísticamente ni se pueden someter a prueba en la realidad.<br />
5. Las hipótesis deben estar relacionadas con técnicas disponibles para probarlas.<br />
Para ello, debemos tener técnicas o herramientas de la investigación (instrumentos para<br />
recolectar datos, diseños, análisis estadísticos o cualitativos, etc.), para poder verificarla<br />
si es posible, desarrollarlas, y si se encuentran a nuestro alcance.<br />
Alguien podría pretender probar hipótesis referentes a la desviación presupuestal en el<br />
gasto público de un país latinoamericano o la red de narcotraficantes en la ciudad de<br />
Miami, pero no disponer de formas realistas de obtener sus datos. Entonces su hipótesis,<br />
aunque teóricamente puede ser muy valiosa, no se puede probar en la realidad.<br />
Existen diversas formas de clasificar las hipótesis, las cuales son:<br />
1) Hipótesis de investigación.<br />
2) Hipótesis nulas.<br />
3) Hipótesis alternativas.<br />
4) Hipótesis estadísticas.<br />
En este fascículo, te daremos a conocer la Hipótesis <strong>Estadística</strong>, que es la que<br />
transforma las hipótesis de investigación, nulas y alternativas en símbolos estadísticos.<br />
Pero, te preguntarás ¿Qué son estas hipótesis?<br />
A continuación, te daremos una pequeña explicación:<br />
Hipótesis Nulas<br />
Constituyen proposiciones acerca de la relación entre variables, solamente que sirven<br />
para refutar o negar lo que afirma la hipótesis de investigación. Por ejemplo, si la<br />
hipótesis de investigación propone: “Los adolescentes le atribuyen más importancia al<br />
atractivo físico en sus relaciones heterosexuales que las mujeres”, la nula postularía:<br />
“Los adolescentes NO le atribuyen más importancia al atractivo físico en sus relaciones<br />
heterosexuales que las mujeres”.<br />
Debido a que este tipo de hipótesis resulta la contrapartida de la hipótesis de<br />
15
investigación, hay prácticamente tantas clases de hipótesis nulas como de investigación.<br />
Es decir, la clasificación de hipótesis nulas es similar a la tipología de la hipótesis de<br />
investigación: hipótesis nulas descriptivas de una variable que se va a observar en un<br />
contexto, hipótesis que niegan o contradicen la relación entre dos o más variables,<br />
hipótesis que niegan que haya diferencia entre grupos que se comparan, (es decir,<br />
afirmar que los grupos son iguales) e hipótesis que niegan la relación de casualidad<br />
entre dos o más variables, (en todas sus formas.). Las hipótesis nulas se simbolizan<br />
como Ho.<br />
Te damos algunos ejemplos de hipótesis nulas, que corresponden a ejemplos de<br />
hipótesis de investigación que fueron mencionados;<br />
Ejemplos:<br />
Ho: “La expectativa de ingreso mensual de los trabajadores de la corporación TEAQ no<br />
oscila entre $1,000.00 y $2,500.00”.<br />
Ho:”No hay relación entre la autoestima y el temor de logro”.<br />
Ho: “La percepción de la similitud en religión, valores y creencias no provoca mayor<br />
atracción física”.<br />
Hipótesis Alternativas<br />
Como su nombre lo indica, son posibilidades “alternativas” ante las hipótesis de<br />
investigación y nula. Ofrecen otra descripción o explicación distinta a la que proporciona<br />
este tipo de hipótesis. Por ejemplo, si la hipótesis de investigación establece: “Esta silla<br />
es roja”, la nula afirmará “Esta silla no es roja”, y podrían formularse una o más hipótesis<br />
alternativas: “Esta silla es azul”, “Esta silla es verde”, “Esta silla es amarilla”, etc. Cada<br />
una constituye una descripción distinta a las que proporcionan las hipótesis de<br />
investigación y nula.<br />
Las hipótesis alternativas se simbolizan como Ha y sólo pueden formularse cuando<br />
efectivamente hay otras posibilidades adicionales a las hipótesis de investigación y nula.<br />
De ser así, no pueden existir.<br />
Ejemplos:<br />
Hi: “El candidato ‘A’ obtendrá en la elección para la presidencia del consejo escolar entre<br />
un 50 y un 60% de la votación total”.<br />
Ho: “El candidato ‘A’ no obtendrá en la elección para la presidencia del consejo escolar<br />
entre un 50 y 60% de la votación total”.<br />
Ha: “El candidato ‘A’ obtendrá en la elección para la presidencia del consejo escolar más<br />
del 60% de la población total”.<br />
Si se desea llevar a cabo una prueba estadística, pero no se sabe cuáles son las<br />
16
proporciones que se esperan, es posible ESTIMAR el valor de éstas obteniendo una<br />
muestra aleatoria. Por ejemplo, si se desea conocer el número de clientes que son<br />
mujeres de una cafetería, se puede tomar una muestra aleatoria de toda la clientela. Si la<br />
muestra tiene 80 personas, y 60 de éstas son mujeres, entonces la mejor estimación del<br />
porcentaje de clientes que son mujeres será 60/80 = 75%.<br />
En este caso no se afirma que la probabilidad de seleccionar a una mujer sea, de<br />
manera exacta, 0.75, sino más bien que esta cantidad es una estimación razonable del<br />
verdadero valor basada en los datos que se obtuvieron.<br />
Como podrás ver, la hipótesis y la Inferencia <strong>Estadística</strong> necesitan determinadas<br />
“herramientas” para poder llegar a tomar decisiones, las cuales necesitan ahora<br />
probarse; para esto, la Inferencia <strong>Estadística</strong> utiliza lo que se llama PRUEBAS DE<br />
HIPÓTESIS, las cuales constituyen el proceso relacionado con aceptar o rechazar<br />
declaraciones en base a los parámetros de la población, así como también utiliza la<br />
ESTIMACIÓN, que se ocupa precisamente de estimar los valores de los parámetros de<br />
la población.<br />
A continuación empezaremos a hablar acerca del proceso de las pruebas de hipótesis y<br />
puedas aprender a utilizarla para tomar decisiones.<br />
PRUEBAS DE HIPÓTESIS.<br />
1.1.1 Etapas Básicas en Pruebas de Hipótesis<br />
En la prueba de hipótesis iniciamos con un valor supuesto (hipotético) de un parámetro<br />
de población. Después de recoger una muestra aleatoria, comparamos la estadística de<br />
la muestra, tal como la medida de la muestra (X) con el parámetro hipotético, tal como la<br />
media de la población hipotética (µ). Luego aceptamos o rechazamos el valor hipotético.<br />
Este valor hipotético se rechaza sólo si es claramente improbable que ocurra el resultado<br />
de la muestra cuando la hipótesis es verdadera.<br />
PRIMER PASO.<br />
FORMULAR LA HIPÓTESIS NULA Y LA HIPÓTESIS ALTERNATIVA.<br />
La hipótesis nula (Ho) es el valor hipotético del parámetro que se compara con el<br />
resultado de la muestra. Se rechaza solamente si no es probable que ocurra el resultado<br />
de la muestra dada. La hipótesis alternativa (Ha) se acepta si se rechaza la hipótesis<br />
nula. Por ejemplo:<br />
Un auditor quiere probar la suposición de que el valor medio de todas las cuentas por<br />
cobrar en una firma dada es $260.00 tomando una muestra de n = 36. El auditor desea<br />
17
echazar el valor supuesto de $260.00, sólo si se contradice al valor medio establecido.<br />
La muestra y, de esta manera, al valor hipotético debe dársele el “beneficio de la duda”<br />
en el procedimiento de prueba. Las hipótesis nula y alternativa para esta prueba son:<br />
Ho: µ = $260.00 y Hi: µ ≠ $260.00<br />
SEGUNDO PASO.<br />
ESPECIFICAR EL NIVEL DE SIGNIFICACIÓN QUE SE VA A UTILIZAR.<br />
El nivel de significación es el estándar estadístico que se específica determinado en<br />
porcentaje, para rechazar la hipótesis nula. Si se especifica un nivel de significación del 5<br />
por ciento, entonces se rechaza la hipótesis nula, sólo si el resultado obtenido con la<br />
muestra es tan diferente del valor hipotético que una diferencia de dicha cantidad<br />
ocurriría con una probabilidad de 0.05. Esto se denomina error de tipo uno (I).<br />
Observa que si se utiliza el nivel de significación del 5 por ciento, hay una probabilidad<br />
de 0.05 por ciento de rechazar la hipótesis nula.<br />
La probabilidad del error de tipo I es siempre igual al nivel de significación que se utiliza<br />
como el estándar para rechazar la hipótesis nula; se designa con la letra minúscula<br />
griega α (alfa); así pues, α también representa el nivel de significación. Los niveles más<br />
comúnmente empleados en la prueba de hipótesis son los niveles del 5% y del 1%.<br />
Un error de tipo II ocurre si se acepta la hipótesis nula cuando es falsa.<br />
TERCER PASO.<br />
SELECCIONAR LA ESTADÍSTICA DE PRUEBA.<br />
La estadística de prueba será la estadística de la muestra, o una versión transformada<br />
de la estadística de la muestra. Por ejemplo, para probar un valor hipotético de la media<br />
de la población, la media de una muestra aleatoria tomada de dicha población podría<br />
servir como estadística de la prueba. Sin embargo, si la distribución de muestreo de la<br />
media es normal, entonces el valor de la media de la muestra se transforma típicamente<br />
en un valor Z.<br />
CUARTO PASO.<br />
ESTABLECER EL VALOR O LOS VALORES CRÍTICOS DE LA ESTADÍSTICA DE<br />
PRUEBA.<br />
Habiendo especificado la hipótesis nula, el nivel de significación y la estadística de<br />
prueba que se van a utilizar, podemos establecer el valor o los valores críticos de la<br />
estadística de prueba. Puede haber uno o dos valores críticos según se efectúe una<br />
prueba de una cola o de dos colas. En el fascículo anterior, te explicamos este tipo de<br />
pruebas. En cualquier caso, un valor crítico identifica el valor de la estadística de prueba<br />
requerido para rechazar la hipótesis nula.<br />
CONSECUENCIAS DE DECISIONES EN LA PRUEBA DE HIPÓTESIS.<br />
18
Decisiones posibles<br />
Aceptación de hipótesis nula.<br />
Rechazo de hipótesis nula<br />
ESTADOS POSIBLES<br />
Hipótesis nula<br />
Hipótesis nula falsa<br />
verdadera<br />
Correctamente<br />
aceptada<br />
Error de tipo I<br />
19<br />
Error de tipo II<br />
Correctamente<br />
rechazada<br />
En esta tabla podemos apreciar los tipos de decisiones, y los estados posibles, de<br />
acuerdo al segundo paso de las etapas básicas.<br />
QUINTO PASO.<br />
DETERMINAR EL VALOR REAL DE LA ESTADÍSTICA DE PRUEBA.<br />
Por ejemplo, al probar un valor hipotético de la media de la población se toma una<br />
muestra aleatoria y se determina el valor de la media de la muestra. Si el valor crítico se<br />
estableció como un valor Z, entonces la media de la muestra se convierte a un valor Z.<br />
SEXTO PASO.<br />
TOMAR LA DECISIÓN.<br />
El valor observado de la estadística de la muestra se compara con el valor o los valores<br />
críticos de la estadística de la muestra. Entonces, la hipótesis nula se acepta o se<br />
rechaza. Si la hipótesis nula se rechaza, se acepta la hipótesis alternativa. A su vez, esta<br />
decisión será aplicable a otras decisiones que deban tomar los gerentes de operación,<br />
por ejemplo, si se mantiene un patrón de operación, o ¿Cuál de dos estrategias de<br />
mercadeo debe emplearse? o ¿Qué factores intervendrán si se hacen cambios en la<br />
producción? Si serán humanos, o materiales o ambos.<br />
1.1.2 Prueba de un Valor Hipotético de la Media Utilizando la Distribución Normal.<br />
La distribución de probabilidad normal se puede utilizar para probar un valor hipotético<br />
de la media de la población (1) cuando n ≥ 30, o (2) cuando n < 30 y sabemos que la<br />
población está normalmente distribuida y se conoce σ.
Se utiliza una prueba de dos colas cuando estamos interesados en una desviación<br />
posible en cualquier dirección del valor hipotético de la media. La fórmula empleada para<br />
establecer los valores críticos de la media de la muestra es semejante a la fórmula para<br />
determinar los límites de confianza para estimar la media de la población, excepto que el<br />
valor hipotético de la media de la población, µ o , es el punto de referencia y no la media<br />
de la muestra. Los valores críticos de la media de la muestra para una prueba de dos<br />
colas, según se conozca no son:<br />
Ejemplo:<br />
µ o ± σ x ó o x<br />
z<br />
Para la hipótesis nula formada en el ejemplo del auditor, el cual quiere probar la<br />
suposición de que el valor medio de todas las cuentas por cobrar en una firma dada es<br />
de $260.00, tomando una muestra de n = 36, determina los valores críticos de la media<br />
de la muestra para probar la hipótesis a un nivel de significación del 5 por ciento.<br />
Dado que la desviación estándar de las cantidades de las cuentas por cobrar es<br />
σ = $43.00, los valores críticos son:<br />
Hipótesis: Ho: µ = $260.00 ; Ha: µ ≠ $260.00<br />
Nivel de significación: α = 0.05<br />
<strong>Estadística</strong> de prueba:<br />
x basado en una muestra de n = 36 y con σ = 43.00<br />
x CR = valor crítico de la media de la muestra.<br />
=<br />
µ<br />
± z σ<br />
x CR o x<br />
=<br />
=<br />
260.<br />
00<br />
260.<br />
00<br />
=<br />
260.<br />
00<br />
⎛ 43 ⎞<br />
+ 1.96<br />
⎜<br />
⎟ =<br />
⎝ 36 ⎠<br />
⎛ 43 ⎞<br />
− 1.96<br />
⎜<br />
⎟ =<br />
⎝ 36 ⎠<br />
⎛ σ ⎞<br />
± 1.96 ⎜<br />
⎟<br />
⎝ n ⎠<br />
$ 245.<br />
95<br />
$ 274.<br />
05<br />
Por lo tanto, para rechazar la hipótesis nula media de la muestra se debe tener un valor<br />
que sea menor que $245.95 o mayor que $274.05. De esta manera, existen dos regiones<br />
de rechazo en el caso de una prueba de dos colas.<br />
20<br />
µ<br />
±<br />
z<br />
S
f( x )<br />
Y<br />
Región de<br />
rechazo<br />
Los valores z de ± 1.96 se utilizan para establecer los límites críticos porque para la<br />
distribución normal estándar, una porción de 0.05 del área corresponde a las dos colas,<br />
lo que corresponde a la especificación de α = 0.05.<br />
En vez de establecer los valores críticos en términos de la media de la muestra como tal,<br />
los valores críticos en la prueba de hipótesis se especifican típicamente en términos de<br />
valores z. Para el nivel de significación del 5 por ciento, los valores críticos z para una<br />
prueba de dos colas son –1.96 y +1.96, por ejemplo. Cuando se determina el valor de la<br />
media de la muestra, se transforma en valor z para poderlo comparar con los valores<br />
críticos de z. La fórmula de transformación, según se conozca o no σ, es:<br />
x − µ o<br />
z = ó<br />
σ x<br />
21<br />
x − µ<br />
z =<br />
S x<br />
Una prueba de una cola es apropiada cuando se está interesado en las posibles<br />
desviaciones en una sola dirección desde el valor hipotético de la media. El auditor que<br />
quiere probar la suposición de que el valor medio de todas las cuentas por cobrar en una<br />
firma dada es $260.00, tomando una muestra de n = 36, puede no estar interesado en<br />
que el promedio verdadero de todas las cuentas por cobrar exceda $260.00, sino en que<br />
pueda ser menor de $260.00, la hipótesis nula y la hipótesis alternativa son:<br />
Ho: µ ≥ $260.00 y Ha: µ < $260.00<br />
región de aceptación<br />
Sólo hay una región de rechazo para una prueba de una cola, la cual está siempre en la<br />
cola que representa el apoyo de la hipótesis alternativa. Como en el caso anterior, para<br />
una prueba de dos colas, el valor crítico puede determinarse para la media como tal o en<br />
términos de un valor z. Sin embargo, los valores críticos para pruebas de una cola<br />
difieren de los de las pruebas de dos colas porque la porción de área dada está toda en<br />
una cola de la distribución. La siguiente tabla representa los valores de z necesarios para<br />
pruebas de una cola y de dos colas.<br />
o<br />
Región de<br />
rechazo<br />
245.93 260.00 274.05<br />
X
VALORES CRÍTICOS DE Z EN UNA PRUEBA DE HIPÓTESIS<br />
TIPO DE PRUEBA<br />
Nivel de significación Una cola Dos colas<br />
5% ± 1.65 ± 1.96<br />
1% ± 2.33 ± 2.58<br />
La fórmula general para establecer el valor crítico de la media de la muestra para una<br />
prueba de una cola según se conozca (alex) o no es:<br />
µ o + σ x ó o x<br />
z<br />
En estas fórmulas z, puede ser negativo, dando como resultado una resta del segundo<br />
término en cada fórmula<br />
1.1.3 Errores de Tipo I y de Tipo II en Pruebas de Hipótesis<br />
En este fascículo, las pruebas de tipo I y de tipo II, se presentan totalmente con respecto<br />
a las pruebas de una cola para una media hipotética. La probabilidad del error de tipo I<br />
es siempre igual al nivel de significación utilizado al probar la hipótesis nula. Esto es<br />
porque por definición la porción de área en la región de rechazo es igual a la proporción<br />
de los resultados de la muestra que ocurriría en aquella región si la hipótesis nula es<br />
verdadera.<br />
La probabilidad del error de tipo II se designa generalmente con la letra β (“beta”.) Se<br />
puede determinar solamente respecto de un valor específico incluido en el rango de la<br />
hipótesis alternativa.<br />
Ejemplo:<br />
En el ejemplo del auditor, la hipótesis nula que se va a probar es que la media de todas<br />
las cuentas por cobrar es por lo menos $260.00 y esta prueba se va a llevar a cabo a un<br />
nivel de significación de 5%.<br />
El auditor indica que consideraría una media real de $260.00 (o menos) como una<br />
diferencia importante y material del valor hipotético de la media. Como antes σ = $43.00<br />
y el tamaño de la muestra es n = 36 cuentas. La determinación de la probabilidad del<br />
error de tipo II requiere:<br />
22<br />
µ<br />
+<br />
z<br />
S
(1) Formular las hipótesis nula y alternativa para esta situación de prueba,<br />
(2) Determinar el valor crítico de la media de la muestra que se utilizará al probar la<br />
hipótesis nula a un nivel de significación del 5%,<br />
(3) Identificar la probabilidad del error de tipo I asociado con el uso del valor crítico<br />
calculado anteriormente como base para la regla de decisión,<br />
(4) Identificar la probabilidad del error de tipo II asociado con la regla de decisión<br />
dado el valor específico de la media alternativa de $240.00<br />
La solución completa es:<br />
(1) Ho: µ ≥ 260.00 ; Ha: µ < 260.00<br />
(2) x = µ o ± z σx<br />
= 260.<br />
00 + ( −165)<br />
( 7.<br />
17)<br />
= $ 248.<br />
17<br />
CR<br />
⎛ σ ⎞ 43.<br />
00 43<br />
donde σ x =<br />
⎜<br />
⎟ = = = 7.<br />
17<br />
⎝ n ⎠ 36 6<br />
(3) La probabilidad del error de tipo I es igual a 0.05 (el nivel de significación utilizado<br />
para probar la hipótesis nula.)<br />
(4) Identificar la probabilidad del error de tipo II asociado con la regla de decisión, dado<br />
el valor específico de la media alternativa de $240.00.<br />
z<br />
x − µ o<br />
=<br />
σ x<br />
=<br />
248.<br />
17 −<br />
7.<br />
17<br />
240<br />
=<br />
8.<br />
17<br />
7.<br />
17<br />
±<br />
1.<br />
14<br />
P (error de tipo II) = P (z ≥ + 1.14) = 0.5000 − 3.729 = 0.1271 ≈ 0.13<br />
La siguiente figura ilustra el procedimiento seguido en el ejemplo anterior. En general, el<br />
valor crítico de la media determinado con respecto a la hipótesis nula se “reduce” y se<br />
utiliza como el valor crítico respecto de la hipótesis alternativa específica.<br />
f( x )<br />
f( x)<br />
región de rechazo<br />
(error tipo I)<br />
rechazo correcto<br />
hipótesis nula<br />
0.05<br />
248.17<br />
0.13<br />
248.17<br />
región de aceptación<br />
23<br />
260.00<br />
aceptación incorrecta de la<br />
hipótesis nula (error de tipo II)<br />
x<br />
x
Cuando el nivel de significación y el tamaño de la muestra se mantienen constantes, la<br />
probabilidad del error de tipo II disminuye a medida que el valor específico de la<br />
alternativa de la media se coloca más lejos del valor de la hipótesis nula. Una curva<br />
característica de operación (CO) describe gráficamente la probabilidad de aceptación de<br />
la hipótesis nula dados varios valores alternativos de la media verdadera.<br />
La siguiente figura muestra la curva CO aplicable a cualquier prueba de este tipo, porque<br />
los valores sobre el eje horizontal se presentan en unidades del error estándar de la<br />
media. Para todos los valores a la izquierda de µ o , la probabilidad de aceptación indica<br />
la probabilidad del error de tipo II. A la derecha de µ o las probabilidades indican la<br />
aceptación correcta de la hipótesis nula.<br />
1.00<br />
0.80<br />
0.60<br />
0.40<br />
0.20<br />
En la prueba de hipótesis, el concepto de potencia se refiere a la probabilidad de<br />
rechazar una hipótesis nula dado un valor alternativo específico del parámetro (en<br />
nuestros ejemplos, la media de la población). Al designar la probabilidad del error del tipo<br />
II como β, se tiene que la potencia de la prueba es siempre 1 − β.<br />
De acuerdo con la figura anterior, observa que la potencia para valores alternativos de la<br />
media es la diferencia entre el valor indicado por la curva CO y 1.0, y de esta manera se<br />
puede obtener “por sustracción” utilizando la curva CO. Una gráfica construida para<br />
presentar los varios niveles de potencia, dados los valores alternativos de la media, se<br />
denomina curva de potencia.<br />
Ejemplo:<br />
− 50 x − 40 x − 30 x − 20 x −10 x +10 x<br />
De acuerdo con el ejemplo que hemos estado analizando, podemos determinar la<br />
potencia de la prueba dado un valor alternativo específico, de la media de $240.00, de la<br />
siguiente manera:<br />
24<br />
POSICIÓN POSIBLE<br />
DE LA VERDADERA µ
Puesto que β = P(error de tipo II) = 0.13.<br />
Potencia = 1 − β = 1.00 – 0.13 = 0.87<br />
Nota. Esta es la probabilidad de rechazar correctamente la hipótesis nula cuando<br />
µ = $240.00.<br />
25
1.2 ESTIMACIÓN<br />
El segundo tipo de inferencia estadística es la estimación. Este procedimiento utiliza<br />
cuando se responde a una pregunta que pide el valor de una parámetro poblacional. Por<br />
ejemplo, ¿Cuál es la distancia media en un solo sentido que deben viajar los estudiantes<br />
que asisten a cualquier plantel del Colegio de Bachilleres?<br />
Para contestar esta pregunta, hay que tomar una muestra de la población y calcular la<br />
media muestral x.<br />
Imagina que eliges una muestra aleatoria de 100 distancias en un solo sentido y que<br />
resulta una media de 16 Km ¿Cuál es la estimación del valor medio de la población?<br />
Si se toma la media muestral como dicha estimación, se estará efectuando una<br />
estimación puntual.<br />
1.2.1 Estimación Puntual de un Parámetro<br />
Se considera como el valor de estadística muestral correspondiente, es decir, la<br />
muestral, X = 16 Km., es la mejor estimación puntual para la distancia media en un<br />
sentido para esta población. En otras palabras, se ha estimado que la distancia media en<br />
un solo sentido recorrida por todos los estudiantes es igual a 16 Km.<br />
Ello no requiere decir que la media poblacional µ sea exactamente igual a 16 Km., sino<br />
que se interpreta esta estimación como “µ está próxima a 16 Km.” ¿Qué quiere decir<br />
“está próxima?<br />
El término de proximidad es relativo, pero quizá en este caso, “próximo” debe ser<br />
definido arbitrariamente como estar “dentro de un kilómetro” de µ. Si un kilómetro<br />
satisface la idea intuitiva de proximidad, entonces decir “µ está próxima a 16 Km.”es<br />
comparable a decir “µ está entre 15 (16−1) y 17 (16+1) kilómetros”.<br />
Esto indica que se deben hacer estimaciones utilizando intervalos. Este tipo de<br />
estimación utiliza el concepto de intervalo y asigna una medida a la confiabilidad de éste<br />
en la estimación del parámetro en cuestión.<br />
26
1.2.2 Estimación por Intervalo<br />
Un intervalo acotado por dos números se emplea para estimar el valor de un parámetro<br />
poblacional. Los valores que limitan este intervalo son estadísticas calculadas a partir de<br />
la muestra que están sirviendo como base para la estimación.<br />
1.2.3 nivel de confianza 1 – α<br />
Es la probabilidad de que la muestra por seleccionarse produzca valores límite que se<br />
localicen en lados opuestos del parámetro que se estima. Algunas veces el nivel de<br />
confianza se llama coeficiente de confianza.<br />
1.2.4 Intervalo de Confianza<br />
Se considera como la estimación por intervalo con un nivel de confianza específico. El<br />
teorema central de límite es la fuente de información necesaria para obtener<br />
estimaciones por intervalos de confianza. La media X = 16 es un miembro de la<br />
distribución muestral de las medias.<br />
La siguiente figura muestra la distribución de muestreo de las medias a la que pertenece<br />
la media muestral x = 16 (n = 100), suponiendo que σ = 6,<br />
µ (desconocida)<br />
27<br />
σ / n = 6.0 / 100 = 0.6<br />
X
Cuando se selecciona aleatoriamente una muestra de tamaño 100 de una población<br />
cuya medida es µ y cuya desviación estándar es 6, ¿Cuál es la probabilidad de que la<br />
media muestral diste de µ menos de una unidad?.En otras palabras, ¿Cuál es<br />
P ( µ − 1 < x < µ + 1)<br />
?<br />
Esta probabilidad la puedes encontrar determinando la distribución de probabilidad<br />
normal de la siguiente manera:<br />
x − µ<br />
z =<br />
σ n<br />
( µ − 1)<br />
− µ −1.<br />
0<br />
Si x = µ − 1 , entonces: z =<br />
= = − 1.<br />
67<br />
0.<br />
6 0.<br />
6<br />
( µ + 1)<br />
− µ 1.<br />
0<br />
Si x = µ + 1 , entonces: z =<br />
= = + 1.<br />
67<br />
0.<br />
6 0.<br />
6<br />
En consecuencia:<br />
P (µ – 1 < X < µ + 1) = P(−1.67 < Z < + 1.67)<br />
= 2⋅P(0 < Z < 1.67)<br />
= 2 (0.4525) = 0.9050<br />
La probabilidad de que la media de una muestra aleatoria esté dentro de una unidad de<br />
esta media poblacional es 0.9050. Así, la probabilidad de que la media poblacional se<br />
halle dentro de una unidad desde la media de una muestra es también igual a 0.9050.<br />
Por lo tanto, el intervalo 15 a 17 es una estimación por intervalo, con un nivel de<br />
confianza de 0.9050 para la distancia media en un solo sentido recorrida por los<br />
estudiantes del C.B.<br />
28<br />
σ / n = 0.6<br />
µ − 1.0 µ µ + 1.0<br />
x
1.2.5 Error de Estimación Máximo, E<br />
Es la mitad de la anchura del intervalo de confianza. En general, E es un múltiplo del<br />
error estándar.<br />
La ilustración precedente comenzó con la asignación de 1 Km. como valor del error<br />
máximo. Típicamente, se determina el error de estimación máximo por el nivel de<br />
confianza que se quiera que tenga el intervalo de confianza. Es decir, 1 − α determinará<br />
el error máximo. El nivel de confianza se dividirá de tal manera que la mitad de 1 − α<br />
este por arriba de la media, y la otra mitad por debajo, como se muestra en la figura:<br />
α/2<br />
CADA COLA CONTIENE α/2<br />
α/2<br />
1 − α<br />
1<br />
(1 − α)<br />
2<br />
Esto determinará la probabilidad α /2 en cada una de las dos colas de la distribución. El<br />
valor Z que limita al intervalo de confianza será Z (α/2). Recuerda que α/2 es la<br />
probabilidad (ó área) bajo la curva a la derecha de este punto. La Z es un número de<br />
desviaciones estándares. En consecuencia, el error, de estimación máximo E es:<br />
29<br />
n<br />
α/2<br />
σ (ERROR ESTÁNDAR DE LA MEDIA<br />
α/2<br />
−Z (α/2) 0 Z (α/2)<br />
E, error E, error<br />
máximo máximoi
E<br />
= Z ( α / 2)<br />
⋅<br />
σ<br />
n<br />
σ<br />
n<br />
σ X = (ERROR ESTÁNDAR DE LA MEDIA)<br />
El intervalo de confianza 1 − α para µ es<br />
σ<br />
X − Z ( α / 2)<br />
⋅ para<br />
n<br />
X + Z ( α /<br />
2)<br />
⋅<br />
σ<br />
n<br />
X − Z ( α / 2)<br />
⋅<br />
σ<br />
se llama límite de confianza inferior (LCI), Y X + Z ( α / 2)<br />
⋅<br />
n<br />
σ<br />
, límite de<br />
n<br />
confianza superior (LCS), del intervalo de confianza.<br />
En la práctica nos vemos obligados con frecuencia a tomar decisiones relativas a una<br />
población sobre la base de información proveniente de muestras. Tales decisiones se<br />
llaman decisiones estadísticas. Por ejemplo, podemos querer decir, basados en datos<br />
muestrales, si un método pedagógico es mejor que otro o si una moneda es falsa o no.<br />
Al intentar obtener una decisión, es útil hacer hipótesis (o conjeturas) sobre la población<br />
implicada. Tales hipótesis, que pueden ser o no ciertas, se llaman hipótesis estadísticas.<br />
Son, en general, enunciados acerca de las distribuciones de probabilidad de las<br />
poblaciones, que seguramente estudiaste en temas anteriores del curso de <strong>Estadística</strong>.<br />
En muchos casos realizamos hipótesis estadísticas con el único propósito de rechazarla<br />
o invalidarla. Así, si queremos decidir si una moneda es falsa, hacemos la hipótesis de<br />
que la moneda es buena (o sea, p = 0.5, donde p es la probabilidad de cara).<br />
Análogamente, si deseamos decidir si un procedimiento es mejor que otro, formulamos<br />
la hipótesis de que no hay diferencia entre ellos (o sea, que cualquier diferencia<br />
observada se debe simplemente a fluctuaciones en el muestreo de la misma población).<br />
Tales hipótesis, como recordarás, son las hipótesis nulas y se representa por Ho.<br />
Toda hipótesis que difiere se llama hipótesis alternativas. Por ejemplo: si una hipótesis<br />
es p = 0.5, las hipótesis alternativas podrían ser:<br />
p = 0.7, p ≠ 0.5 ó p > 0.5. Una hipótesis alternativa a la hipótesis nula se representará<br />
por Ha.<br />
30
Si suponemos que una hipótesis particular es cierta pero vemos que los resultados<br />
hallados en una muestra aleatoria difieren notablemente de los esperados bajo tal<br />
hipótesis, entonces diremos que las diferencias observadas son significativas y nos<br />
veríamos inclinados a rechazar la hipótesis (o al menos a no aceptarla ante la evidencia<br />
obtenida). Así, si en 20 tiradas de una moneda salen 16 caras, estaríamos inclinados a<br />
rechazar la hipótesis de que la moneda es buena, aunque cabe la posibilidad de<br />
equivocarnos.<br />
Los procedimientos que nos capacitan para determinar si las muestras observadas<br />
difieren significativamente de los resultados esperados, y por tanto nos ayudan a decidir<br />
si aceptamos o rechazamos la hipótesis, se llaman contrastes (o test) de hipótesis o de<br />
significación o reglas de decisión.<br />
Si rechazamos una hipótesis cuando debiera ser aceptada, diremos que se ha cometido<br />
un error de tipo I. Por otra parte, si aceptamos una hipótesis que debiera ser rechazada,<br />
diremos que se ha obtenido un error de tipo II. En ambos casos se ha producido un caso<br />
erróneo.<br />
Para que las reglas de decisión (o contrastes de hipótesis) sean buenas, deben<br />
diseñarse de modo que minimicen los errores de la decisión. Y no es una cuestión<br />
sencilla, porque para cualquier tamaño de la muestra, un intento de disminuir un tipo de<br />
error puede ser más grave que el otro, y debe alcanzarse un compromiso que disminuya<br />
el error más grave, La única forma de disminuir ambos a la vez es aumentar el tamaño<br />
de la muestra, que no siempre es posible.<br />
Al contrastar una cierta hipótesis, la máxima probabilidad con la que estamos dispuestos<br />
a correr riesgo de cometer un error de tipo I se llama nivel de significación de contraste.<br />
Esta probabilidad, denotada a menudo por α, se suele especificar antes de tomar la<br />
muestra, de manera que los resultados obtenidos no influyan en nuestra elección.<br />
En la práctica, es frecuente un nivel de significación de 0.05 ó 0.01, si bien se usan otros<br />
valores, Si, por ejemplo, se escoge el nivel de significación 0.05 (ó 5%) al diseñar una<br />
regla de decisión, entonces hay unas 5 oportunidades entre 100 de rechazar las<br />
hipótesis cuando debiera haberse aceptado; es decir, tenemos un 95% de confianza de<br />
que hemos adoptado la decisión correcta. En tal caso decimos que la hipótesis ha sido<br />
rechazada al nivel de significación 0.05, lo cual quiere decir que la hipótesis tiene una<br />
probabilidad 0.05 de ser falsa.<br />
Para ilustrar lo explicado anteriormente, suponemos que bajo cierta hipótesis la<br />
distribución de muestreo de un estadístico S es una distribución normal con media µs y<br />
desviación típica σS. Así pues, la distribución de la variable tipificada z dada por z = (S –<br />
µs)/σS, es la distribución normal canónica (media 0, varianza1), como indica la siguiente<br />
figura:<br />
31
REGIÓN CRÍTICA REGIÓN CRÍTICA<br />
0.025<br />
Z = 1.96 Z = 1.96<br />
Como se ve en la figura, podemos tener 95% de confianza de que si la hipótesis es<br />
verdadera, entonces el valor de z para un estadístico muestral S estará entre –1.96 y<br />
1.96 (porque el área bajo la curva normal entre esos valores es 0.95). Sin embargo, si al<br />
escoger una sola muestra al azar hallamos que el valor de z de su estadístico está fuera<br />
de ese rango, debemos concluir que tal suceso podría ocurrir con una probabilidad de<br />
sólo 0.05 (el área total sombreada en la figura) si la hipótesis dada fuera cierta. Diremos<br />
entonces que esta Z difiere de forma significativa de lo que sería de esperar bajo la<br />
hipótesis, y nos veríamos empujados a rechazar la hipótesis.<br />
El área total sombreada 0.05 es el nivel de significación del contraste. Representa la<br />
probabilidad de equivocarnos al rechazar la hipótesis (o sea, la probabilidad de un error<br />
de tipo I), Así pues, decimos que la hipótesis se rechaza a un nivel de significación 0.056<br />
o que el valor de z del estadístico muestral dado es significativo al nivel 0.05.<br />
El conjunto de Z fuera del rango –1.96 a 1.96 se llama la región crítica de la hipótesis,<br />
región de rechazo de la hipótesis, o región de significación. El conjunto de Z en el rango<br />
–1.96 a 1.96 se conoce como región de aceptación de la hipótesis o región de no<br />
significación.<br />
Basados en las anteriores observaciones, podemos formular la siguiente regla de<br />
decisión (o contrate de hipótesis o significación):<br />
Rechazar la hipótesis al nivel de significación 0.05 si el valor de Z para el estadístico S<br />
está fuera del rango –1.96 a 1.96 (o sea, si z > 1.96 ó z < 1.96). Esto equivale a decir<br />
que el estadístico muestral observado es significativo al nivel 0.05.<br />
Aceptar la hipótesis en caso contrario (o, si se desea, no tomar decisión alguna).<br />
Dado que z juega tan importante papel en el contraste de hipótesis, se le llama un<br />
estadístico de contraste.<br />
Hay que hacer notar que se utilizan también otro nivel de significación. Por ejemplo, si se<br />
usa el nivel 0.01, debe sustituirse el 1.96 de antes por 2.58. (observa la siguiente tabla):<br />
32<br />
0.025
NIVEL DE SIGNIFICACIÓN, α 0.10 0.05 0.01 0.005 0.002<br />
Valores críticos de z para test −1.28 −1.645 −2.33 −2.58 −2.88<br />
unilaterales<br />
ó 1.28 ó 1.645 ó 2.33 ó 2.58 ó 2.88<br />
Valores críticos de z para test −1.645 −1.96 −2.58 −2.81 −3.08<br />
bilaterales<br />
y 1.645 y 1.96 y 2.58 y 2.81 y 3.08<br />
La suma de los niveles de significación y de confianza es 100%.<br />
En el test precedente estábamos interesados en los valores extremos del estadístico S o<br />
en su correspondiente valor z a ambos lados de la media (o sea, en las dos colas de la<br />
distribución). Tales test se llaman contrastes de dos colas o bilaterales.<br />
Con frecuencia, no obstante, estaremos interesados tan sólo en valores extremos a un<br />
lado de la media (o sea, en una de las colas de distribución), tal como sucede cuando se<br />
contrasta la hipótesis de que un proceso es mejor que otro (lo cual no es lo mismo que<br />
contrastar si un proceso es mejor o peor que el otro). Tales contrastes se llaman<br />
unilaterales, o de una cola. En tales situaciones, la región crítica es una región situada a<br />
un lado de la distribución, con área igual al nivel de significación.<br />
La tabla anterior, que da valores críticos de z para contrastes de una o dos colas en<br />
varios niveles de significación, será útil como referencia posterior. Los valores críticos de<br />
z para otros niveles de significación se hallan a partir de la tabla de áreas de la curva<br />
normal que a continuación se muestra:<br />
A menudo adquiere importancia práctica saber cuándo un proceso ha variado tanto que<br />
deben adoptarse medidas para remediar la situación.<br />
Tales problemas aparecen, por ejemplo, en el control de calidad. Los supervisores del<br />
control de calidad han de decidir frecuentemente si los cambios observados se deben<br />
simplemente a fluctuaciones de azar o a cambios reales en un proceso de producción<br />
por deterioro de la maquinaria, descuidos de los empleados, etc. Los gráficos de control<br />
ponen a nuestra disposición un método sencillo y eficaz para enfrentarnos a esa clase de<br />
problemas, por ejemplo:<br />
Se construye una máquina para fabricar bolas de rodamiento con diámetro medio de<br />
0.574 cm. y desviación típica de 0.008 cm. Para determinar si funciona correctamente,<br />
se toma una muestra de 6 bolas cada dos horas y se halla para cada una de las<br />
muestras el diámetro medio.<br />
a) Diseñar una regla de decisión con la que se esté muy seguro de que la calidad<br />
del producto cumple los propósitos exigidos.<br />
b) Ilustrar gráficamente la regla de decisión de (a).<br />
33
SOLUCIÓN:<br />
a) Con el 99.73% de confianza podemos decir que la media muestral x debe estar entre<br />
µX − 3σX y µX + 3σX o sea µ − 3σ N a µ + 3σ N .<br />
Como µ = 0.574 σ = 0.008 N = 6<br />
Se sigue que con el 99.73% de confianza, la media muestral debería estar entre<br />
0. 574 − 0.<br />
024 6 y 0 . 574 + 0.<br />
024 6 , o entre 0.564 y 0.584 cm. Luego nuestra regla<br />
de decisión es como sigue:<br />
Si una media muestral cae dentro del rango de 0.564 a 0.584, aceptamos que la<br />
máquina funciona bien: Si no, concluimos que no funciona bien e investigamos la razón.<br />
b) Se pueden anotar las observaciones en un gráfico como en la siguiente figura,<br />
llamado un gráfico de control de calidad. Cada vez que se toma una muestra, se<br />
representa por un punto concreto. En tanto que los puntos están entre el límite inferior<br />
(0.564 cm.) y el superior (0.584 cm.), el proceso está bajo control. Cuando un punto<br />
se sale de esos límites de control (como sucede en la tercera muestra tomado el<br />
jueves), existe la posibilidad de que algo falle, y se hace preciso investigarlo.<br />
0.584<br />
0.574<br />
0.564<br />
Lunes Martes Miércoles Jueves Viernes<br />
34
RECAPITULACIÓN<br />
A continuación te proporcionamos una síntesis de los conceptos más relevantes que<br />
estudiaste en este fascículo:<br />
INFERENCIA ESTADÍSTICA<br />
PRUEBAS DE HIPÓTESIS<br />
PRUEBA DE UN VALOR<br />
HIPOTÉTICO DE LA MEDIA<br />
UTILIZANDO LA<br />
DISTRIBUCIÓN NORMAL<br />
ERRORES DE TIPO I y II<br />
ESTIMACIÓN<br />
NIVEL DE CONFIANZA<br />
ERROR DE ESTIMACIÓN<br />
MÁXIMO E<br />
Cada una de las partes que conforman el esquema anterior, se relacionan con la<br />
Inferencia <strong>Estadística</strong>. Con base en el, elabora una síntesis de cada aspecto,<br />
especificando cómo se interrelacionan.<br />
35<br />
ETAPAS BÁSICAS<br />
PUNTUAL DE UN<br />
PARÁMETRO<br />
POR INTERVALO<br />
INTERVALO DE<br />
CONFIANZA
De acuerdo a lo que has estudiado en el fascículo, te invitamos a que realices los<br />
siguientes ejercicios que te ayudarán a conocer qué tanto aprendiste de la <strong>Estadística</strong><br />
<strong>Inferencial</strong>.<br />
ACTIVIDAD 1<br />
Los Jefes de Manzana de cierta colonia, investigan el ingreso mensual familiar para<br />
crear un centro comercial en la colonia, que es de $2,000.00. Imagina que para el tipo de<br />
colonia en cuestión, el ingreso familiar está distribuido más o menos normalmente y que<br />
la desviación estándar se puede aceptar como igual a σ = $2,000.00, de acuerdo a la<br />
investigación de los jefes de manzana.<br />
Para una muestra aleatoria de n = 15 familias, se ha encontrado que el ingreso medio<br />
por familia es x = $1,500.00. Prueba la hipótesis nula de que µ = $1,500.00,<br />
estableciendo los límites críticos de la media de la muestra en $, utilizando un nivel de<br />
significación del 5%.<br />
ACTIVIDAD 2<br />
En la fábrica de autos Ford, se contempla la compra de un nuevo equipo de diseño de<br />
partes para automóvil, El equipo no debe exigir en promedio más de 10 min. de tiempo<br />
de preparación por cada hora de operación. El agente de compra visita una compañía<br />
donde está instalado el equipo. Por la información que en ella recoge comprueba que 40<br />
horas de operación seleccionadas aleatoriamente incluyen un total de 7 horas y 30<br />
minutos, de tiempo de preparación y que la desviación estándar del tiempo de<br />
preparación por hora fue 3.0 min. Basado en este resultado de la muestra ¿Puede<br />
rechazarse la suposición de que el equipo posee las especificaciones sobre tiempo de<br />
preparación al nivel de significación del 1%.<br />
ACTIVIDAD 3<br />
ACTIVIDADES DE CONSOLIDACIÓN<br />
De 100 estudiantes de tercero y cuarto semestre de un plantel del CB, una muestra<br />
aleatoria de n = 12 estudiantes tiene una calificación promedio de 2.7 (donde aprob. =<br />
4.0), con una desviación estándar de S = -0.4. Se supone que las calificaciones<br />
promedio están normalmente distribuidas. Prueba la hipótesis de que el promedio total<br />
de calificaciones para todos los estudiantes del plantel del C.B. es por lo menos 3.0<br />
utilizando un nivel de significación del 1%.<br />
36
AUTOEVALUACIÓN<br />
1.- Ya que la media de la muestra de X=$1,500.00 está en la región de aceptación de la<br />
hipótesis nula, la información de los jefes de manzana no se puede rechazar a un nivel<br />
de significación del 5%.<br />
2.- Se rechaza la hipótesis nula al nivel de significación del 1% y se acepta la hipótesis<br />
alternativa de que el tiempo promedio de preparación para este equipo es mayor de<br />
10min. por hora de operación.<br />
3.- La Hipótesis nula se rechaza al nivel de significación del 1%. Si se hubiera ignorado<br />
la utilización del factor de corrección finito, el valor calculado t, sería –2.59, y se<br />
aceptaría inapropiadamente la hipótesis nula.<br />
37
BIBLIOGRAFÍA CONSULTADA<br />
HABER/Ronyon. <strong>Estadística</strong> General. Ed. Addison/Wesley, México, 1990<br />
HERNÁNDEZ Santieri, Roberto. Metodología de la Investigación. Ed. Mc Graw-Hill,<br />
México, 1990.<br />
KAZMIER Leonard J. <strong>Estadística</strong> Aplicada a la Administración y la Economía. Ed. Mc<br />
Graw-Hill, México 1982.<br />
SPIEGEL, <strong>Estadística</strong>, Ed. Mc Graw-Hill, 2ª. Edición, México 1993.<br />
38