You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
ESTADÍSTICA APLICADA<br />
I. <strong>Introducción</strong> a <strong>la</strong> <strong>Inferencia</strong> <strong>Estadística</strong>.<br />
1.1 Importancia de <strong>la</strong> inferencia estadística en <strong>la</strong>s ciencias sociales.<br />
La importancia que <strong>la</strong> estadística ha alcanzado en nuestros días, tanto como cultura básica, como en<br />
el trabajo profesional y en <strong>la</strong> investigación, es innegable. Ello es debido a <strong>la</strong> abundancia de información<br />
con <strong>la</strong> que el ciudadano debe enfrentarse en su trabajo diario. La mayor parte de <strong>la</strong>s veces estas<br />
informaciones vienen expresadas en forma de tab<strong>la</strong>s o gráficos estadísticos, por lo que un conocimiento<br />
básico de esta ciencia es necesario para <strong>la</strong> correcta interpretación de los mismos.<br />
Así, es frecuente hab<strong>la</strong>r de estadísticas de empleo, de emigración, de producción, de mortalidad, etc.<br />
El hombre no vive ais<strong>la</strong>do: vivimos en sociedad; <strong>la</strong> familia, <strong>la</strong> escue<strong>la</strong>, el trabajo, el ocio están llenos<br />
de situaciones en <strong>la</strong>s que predomina <strong>la</strong> incertidumbre: El número de hijos de <strong>la</strong> familia, <strong>la</strong> edad de los<br />
padres al contraer matrimonio, el tipo de trabajo, <strong>la</strong>s creencias o aficiones de los miembros varían de<br />
una familia a otra.<br />
En <strong>la</strong> escue<strong>la</strong>, ¿podemos prever <strong>la</strong>s preguntas del próximo examen?; ¿quién ganará el próximo<br />
partido? Para desp<strong>la</strong>zarnos de casa a <strong>la</strong> escue<strong>la</strong>, o para ir de vacaciones, dependemos del transporte<br />
público que puede sufrir retrasos. ¿Cuantos viajeros usarán el autobús? ¿Cuantos clientes habrá en <strong>la</strong><br />
caja del supermercado el viernes a <strong>la</strong>s 7 de <strong>la</strong> tarde?<br />
En nuestros ratos de ocio practicamos juegos de azar tales como quinie<strong>la</strong>s o loterías. Acudimos a<br />
encuentros deportivos cuyos resultados son inciertos y en los que tendremos que hacer co<strong>la</strong> para<br />
conseguir <strong>la</strong>s entradas.<br />
Cuando hacemos una póliza de seguros no sabemos si <strong>la</strong> cobraremos o por el contrario perderemos<br />
el dinero pagado; cuando compramos acciones en bolsa estamos expuestos a <strong>la</strong> variación en <strong>la</strong>s<br />
cotizaciones,...<br />
Información acerca de una o varias variables en una pob<strong>la</strong>ción determinada.<br />
Aunque a veces es posible estudiar toda <strong>la</strong> pob<strong>la</strong>ción completa mediante un censo, otras veces es<br />
preciso contentarse con una muestra de <strong>la</strong> misma. La idea es obtener información de <strong>la</strong> pob<strong>la</strong>ción<br />
estudiando sólo una parte de <strong>la</strong> misma (<strong>la</strong> muestra). El proceso de generalizar los resultados obtenidos<br />
en <strong>la</strong> muestra a toda <strong>la</strong> pob<strong>la</strong>ción recibe el nombre de inferencia estadística. Hay dos características<br />
importantes en <strong>la</strong>s muestras, que son:<br />
• Variabilidad muestral: No todas <strong>la</strong>s muestras son iguales. Los elementos de distintas muestras<br />
pueden ser diferentes, y, por tanto, los resultados de una muestra a otra pueden variar.<br />
• Representatividad: Si elegimos una muestra adecuadamente, puede representar a <strong>la</strong> pob<strong>la</strong>ción, en<br />
el sentido de que los resultados en <strong>la</strong> muestra pueden servir para estimar los resultados en <strong>la</strong><br />
pob<strong>la</strong>ción.<br />
Los motivos que hacen necesario el uso de estas técnicas pueden ser económicos, ya que es más<br />
costoso y lleva más tiempo obtener información de toda <strong>la</strong> pob<strong>la</strong>ción. También puede darse el caso de<br />
que el experimento que debe realizarse tenga carácter destructivo, como ocurre en algunos ensayos de<br />
fiabilidad.<br />
Otras veces <strong>la</strong> pob<strong>la</strong>ción está constituida por entes potenciales, como es el caso de los ensayos<br />
médicos en que se consideran los posibles enfermos con una dolencia; o bien se trata de una pob<strong>la</strong>ción<br />
infinita. Por último, <strong>la</strong> gran homogeneidad de algunas pob<strong>la</strong>ciones hace innecesario el estudio de <strong>la</strong><br />
totalidad de <strong>la</strong> misma, como ocurre al efectuar, por ejemplo, un análisis de sangre, con objeto de<br />
efectuar el recuento de personas con cierta enfermedad.<br />
1
1.2 Comparación entre estadística descriptiva y estadística inferencial.<br />
En los temas anteriores hemos estudiado, por un <strong>la</strong>do, <strong>la</strong> <strong>Estadística</strong> Descriptiva, cuyo objeto es<br />
describir los datos obtenidos de observaciones u experimentos. Estos datos son usualmente<br />
representados por una o varias variables estadísticas, cuya distribución de frecuencias y demás<br />
características son obtenidas a partir de los datos, que en <strong>la</strong> mayor parte de los casos constituyen una<br />
muestra particu<strong>la</strong>r de <strong>la</strong> pob<strong>la</strong>ción. Por otro <strong>la</strong>do, mediante el Cálculo de Probabilidades, introducimos el<br />
concepto de variable aleatoria, al considerar que aumentamos indefinidamente <strong>la</strong>s observaciones y<br />
representar todos los posibles valores que puede tomar un carácter en una pob<strong>la</strong>ción, o todos los<br />
posibles valores que pueden surgir como consecuencia de <strong>la</strong> realización de un cierto experimento.<br />
Sin embargo, <strong>la</strong> mayoría de los problemas de interés, implican, bien pob<strong>la</strong>ciones infinitas, o<br />
pob<strong>la</strong>ciones finitas que son difíciles, costosas o imposibles de inspeccionar. Esto obliga a tener que<br />
seleccionar, por procedimientos adecuados, un subconjunto de n elementos de <strong>la</strong> pob<strong>la</strong>ción, que<br />
constituyen una muestra de tamaño n, examinar <strong>la</strong> característica que interesa y después generalizar<br />
estos resultados a <strong>la</strong> pob<strong>la</strong>ción. Esta generalización a <strong>la</strong> pob<strong>la</strong>ción se realiza por medio de <strong>la</strong> parte de <strong>la</strong><br />
estadística que se conoce con el nombre de inferencia estadística. Para que estas conclusiones<br />
ofrezcan <strong>la</strong>s debidas garantías es preciso comprobar que se cumple el requisito básico de que <strong>la</strong><br />
muestra sea representativa.<br />
1.3 Variables y esca<strong>la</strong>s de medición.<br />
Al observar valores o características, desarrol<strong>la</strong>mos un proceso de medición, es decir que<br />
comparamos <strong>la</strong>s variables y establecemos esca<strong>la</strong>s de valores.<br />
Como resultado de nuestras medidas sobre individuos o unidades experimentales de <strong>la</strong> pob<strong>la</strong>ción<br />
bajo estudio, obtenemos un conjunto de datos, o resultados del experimento estadístico. Para facilitar el<br />
análisis asignaremos unos valores a cada unidad experimental de acuerdo con ciertas reg<strong>la</strong>s; así,<br />
podemos asignar el número 0 a los varones y el 1 a <strong>la</strong>s mujeres o viceversa, o bien los símbolos "V" y<br />
"H".<br />
TIPOS DE DATOS Y ESCALAS DE MEDIDA<br />
Pueden observarse muchas características diferentes para un mismo individuo. Estas características,<br />
dependiendo del tipo de valores que originan, pueden medirse con cuatro tipos distintos de esca<strong>la</strong>s de<br />
medida: esca<strong>la</strong> nominal, ordinal, de intervalo y de razón. Vamos a analizar <strong>la</strong>s características de cada<br />
una.<br />
Esca<strong>la</strong> nominal<br />
La forma más simple de observación es <strong>la</strong> c<strong>la</strong>sificación de individuos en c<strong>la</strong>ses que simplemente<br />
pueden distinguirse entre si pero no compararse ni realizar entre el<strong>la</strong>s operaciones aritméticas. En este<br />
tipo se incluyen características tales como <strong>la</strong> profesión, nacionalidad o grupo sanguíneo. Este tipo de<br />
esca<strong>la</strong> emplea los números so<strong>la</strong>mente como nombres de c<strong>la</strong>ses de objetos, este sería el caso de usar 0<br />
para el sexo femenino y 1 para masculino (o viceversa) o usar números diferentes para <strong>la</strong>s personas<br />
que escogen distintos tipos de cereal: 1 para los de corn f<strong>la</strong>kes, 2 para choco crispis, 3 para frutlups<br />
, etc.<br />
Esca<strong>la</strong> ordinal<br />
Este tipo de esca<strong>la</strong> asigna los números de acuerdo con <strong>la</strong> propiedad ordinal del sistema numérico: los<br />
valores están ordenados de menos a más, pero no hay una idea de igualdad en <strong>la</strong>s distancias entre los<br />
números. Por ejemplo, en una esca<strong>la</strong> de actitudes podemos asignar números: 1, 2, 3,…, a los valores<br />
de una actitud. Si decimos: “indique usted el aprecio que tiene por el presidente de <strong>la</strong> República: 1.<br />
Ninguna; 2. Poco; 3. Regu<strong>la</strong>r, y 4 mucho”, en esta esca<strong>la</strong> no podemos decir que <strong>la</strong> distancia en aprecio<br />
entre el que responde 1 y el que responde 2 es igual a <strong>la</strong> que hay entre 3 y 4, pero si apreciar que 4 es<br />
mayor que 3 en esa dimensión.<br />
A veces, <strong>la</strong>s categorías obtenidas pueden ser ordenadas, aunque diferencias numéricas iguales a lo<br />
<strong>la</strong>rgo de <strong>la</strong> esca<strong>la</strong> numérica utilizada para medir dichas c<strong>la</strong>ses no correspondan a incrementos iguales<br />
2
en <strong>la</strong> propiedad que se mide. Por ejemplo, puede asignarse un número de orden de nacimiento a un<br />
grupo de hermanos, sin que <strong>la</strong> diferencia de edad entre el 1º y el 2º de ellos sea <strong>la</strong> misma que <strong>la</strong> del 2º<br />
al 3º.<br />
Esca<strong>la</strong> de intervalo<br />
Este tipo de esca<strong>la</strong> no sólo se usa en el ordenamiento, sino que establece que a distancias iguales<br />
entre dos puntos en cualquier parte de el<strong>la</strong>s corresponden siempre a diferencias iguales entre los<br />
valores que el<strong>la</strong>s miden. Por ejemplo, <strong>la</strong>s temperaturas tomadas con termómetro nos permiten aseverar<br />
que <strong>la</strong> cantidad de incremento de temperatura es igual para distancias iguales en <strong>la</strong> esca<strong>la</strong>. Por<br />
ejemplo, un incremento de 5 0 C es igual, ya sea cuando se pasa de 0 a 5 0 C o cuando se pasa de 10 a<br />
15 0 C.<br />
Se usa el nombre de “medición por intervalos” porque este tipo de esca<strong>la</strong> se refiere principalmente a<br />
<strong>la</strong> distancia entre los objetos, o sea, al “intervalo” existente entre ellos.<br />
En esta esca<strong>la</strong> se pueden efectuar operaciones aritméticas.<br />
Esta esca<strong>la</strong>, además de c<strong>la</strong>sificar y ordenar a los individuos, cuantifica <strong>la</strong> diferencia entre dos c<strong>la</strong>ses,<br />
es decir, puede indicar cuanto más significa una categoría que otra. Para ello es necesario que se<br />
defina una unidad de medida y un origen (0), que es por su naturaleza arbitrario o re<strong>la</strong>tivo y no<br />
predeterminado. A modo de ejemplo, dos niños, Pedro y Juan, deciden determinar cuántos centímetros<br />
es uno más alto que el otro. Uno de ellos consigue una reg<strong>la</strong> graduada de 50 cm; Pedro traza una raya<br />
y hace coincidir con el<strong>la</strong> el cero de <strong>la</strong> reg<strong>la</strong> y anota <strong>la</strong>s distancias 20 cm hasta <strong>la</strong> raya de Juan y 40<br />
hasta <strong>la</strong> raya de Pedro. Establece <strong>la</strong> diferencia 40 – 20 = 20 y dice a Juan “Soy 20 cm más alto que tú”.<br />
Pedro comprende que <strong>la</strong>s medidas anotadas no le autorizan para formar <strong>la</strong> razón 40:20 = 2, y decir<br />
que mide el doble que su amigo Juan.<br />
Otras variables que se miden en <strong>la</strong> esca<strong>la</strong> de intervalo son <strong>la</strong> temperatura y el tiempo.<br />
Esca<strong>la</strong> de razón<br />
El tipo de medida de nivel más elevado es el representado por <strong>la</strong> esca<strong>la</strong> de razones o de cocientes<br />
que tiene todas <strong>la</strong>s propiedades de una esca<strong>la</strong> de intervalo y, además, un origen natural (cero absoluto<br />
(real)). El hecho de fijar el origen (punto cero) permite hacer comparaciones no sólo de los intervalos<br />
entre objetos, sino también de los valores de los números asignados a estos objetos. Es así que en este<br />
tipo de esca<strong>la</strong> tiene sentido <strong>la</strong>s “razones”, y puede decirse, por ejemplo, que “el valor x es el doble que<br />
el de y”<br />
Las cantidades medidas con esca<strong>la</strong>s de razón se pueden comparar estableciendo proporcionalidades.<br />
En nuestro ejemplo anterior, si <strong>la</strong> raya de 0 arbitraria trazada por Pedro está a 80 cm del suelo,<br />
entonces con este 0 real <strong>la</strong>s alturas son: Pedro 80 + 40 = 120 cm de estatura; Juan, 80 + 20 = 100 cm<br />
de estatura; como estas medidas se obtuvieron con esca<strong>la</strong>s de razón, podemos establecer que:<br />
(estatura de Pedro):(estatura de Juan) = 120:100 = 6:5<br />
De donde se desprende que:<br />
Estatura de Juan = 5 6<br />
de <strong>la</strong> estatura de Pedro.<br />
En el apartado anterior hemos incluido el caso del tiempo, ya que no puede medirse con una esca<strong>la</strong> de<br />
razón. En efecto, si consideramos <strong>la</strong>s fechas 2000 DC y 1000 DC, aunque 2000 es el doble que 1000<br />
no quiere decirse que el tiempo desde el origen del hombre sea el doble en un caso que en otro, pues<br />
hasta el año 0 DC han transcurrido un número de años desconocido. Ejemplos de características que<br />
pueden ser medidas a nivel de razón son el cociente intelectual, grado de depresión o puntuación en un<br />
cuestionario.<br />
El peso, <strong>la</strong> longitud y el valor de <strong>la</strong>s cosas o de los ingresos se miden en una esca<strong>la</strong> de razones.<br />
3
El nivel elegido para medir una característica condiciona el resto del análisis estadístico, pues <strong>la</strong>s<br />
técnicas utilizadas deben tener en cuenta <strong>la</strong> esca<strong>la</strong> que se ha empleado. En general cuanto mayor sea<br />
el nivel utilizado, mayor número de técnicas podrán aplicarse y mayor precisión se logrará, por lo que se<br />
recomienda usar <strong>la</strong> esca<strong>la</strong> de intervalo o <strong>la</strong> de razón siempre que sea posible.<br />
El uso de <strong>la</strong> estadística se ve limitado por el tipo de medidas que usamos. Por ejemplo, <strong>la</strong>s de razón y<br />
de intervalo utilizan los modelos más poderosos, l<strong>la</strong>mados paramétricos, que emplean <strong>la</strong> teoría de <strong>la</strong><br />
curva normal de distribución. Este modelo nos permite llegar a conclusiones más validas y precisas.<br />
Existen otros modelos que se aplican a los casos de <strong>la</strong>s medidas ordinales y nominales y se les<br />
denomina no paramétricos. Hay modelos que usan <strong>la</strong>s propiedades de orden como Kolmogorov-<br />
Smirnov o <strong>la</strong> U de Mann-Whitney y otras como <strong>la</strong> χ (ji) cuadrada, que se utilizan para analizar términos<br />
de <strong>la</strong> probabilidad de c<strong>la</strong>ses de eventos. Estos modelos se verán más ade<strong>la</strong>nte con más detalle: lo<br />
importante es percatarse que el tipo de medida que usamos determinan el tipo de estadística.<br />
4
Tarea de Esca<strong>la</strong>s de medición.<br />
1. ¿Qué tipo de esca<strong>la</strong> se utilizó en cada una de <strong>la</strong>s siguientes respuestas?<br />
a) 45 Kg. c) piso 16 e) calle 14 g) 30 alumnos del curso 5.<br />
b) modelo 03 d) código 302-425 f) 432 alumnos<br />
2. Hemos realizado una encuesta a un grupo de alumnos. C<strong>la</strong>sifica <strong>la</strong>s siguientes características,<br />
según su esca<strong>la</strong> de medida y tipo de variable:<br />
a) Peso<br />
b) religión<br />
c) número de hermanos<br />
d) orden de nacimiento respecto a sus hermanos<br />
e) tiempo que tarda en completar <strong>la</strong> encuesta<br />
f) deporte preferido.<br />
3. Se contó el total de estudiantes y se encontró 130 alumnos y 164 alumnas. ¿Qué esca<strong>la</strong> se utilizó?<br />
4. Se analizó una muestra de trigo y el resultado fue: híbrido 30%, centeno 10%, corriente 60%. ¿Qué<br />
esca<strong>la</strong> se utilizó?<br />
5. En el ejemplo anterior explique qué miden los porcentajes.<br />
6. En una carrera de caballos, Pimienta llegó primero, Sal segundo y Ron, tercero. ¿Puede usted<br />
encontrar <strong>la</strong> distancia entre los caballos? Justifique su respuesta.<br />
7. ¿Por qué no podemos decir que una temperatura de 100 grados Fahrenheit indica doble<br />
calor que una temperatura de 50 grados Fahrenheit?<br />
8. a) Agrupamos a los niños de <strong>la</strong> c<strong>la</strong>se en altos, medianos y bajos. ¿Qué tipo de esca<strong>la</strong> de medida<br />
usamos?<br />
b) ¿Y si los ordenamos por estatura?<br />
9. ¿Cuál es <strong>la</strong> esca<strong>la</strong> de medida de cada una de <strong>la</strong>s variables de los proyectos:<br />
a) Diferencias demográficas(Tasa de natalidad, Tasa de mortalidad, Mortalidad infantil,<br />
Producto Nacional Bruto per cápita en dó<strong>la</strong>res (USA), C<strong>la</strong>sificación de países en función de <strong>la</strong><br />
zona geográfica, situación económica) en países desarrol<strong>la</strong>dos y en vías de desarrollo<br />
b) Actitudes hacia <strong>la</strong> estadística (Uso a menudo <strong>la</strong> información estadística para formar mis<br />
opiniones o tomar decisiones, Es necesario conocer algo de estadística para ser un consumidor<br />
inteligente, debes ser bueno en matemáticas para comprender los conceptos básicos de<br />
estadística, …) utilizando <strong>la</strong> esca<strong>la</strong> 1: Fuertemente en desacuerdo, 2: No estoy de acuerdo, 3:<br />
Indiferente, 4: De acuerdo, 5: Fuertemente de acuerdo?<br />
5
Soluciones:<br />
1. a) De razón. c) Ordinal e) Nominal g) De razón<br />
b) Nominal d) De razón f) Nominal<br />
2. a) De razón. c) Nominal e) De intervalo o de razón<br />
b) Nominal d) Ordinal f) Ordinal<br />
3. De razón.<br />
4. De razón.<br />
5. Son comparaciones de proporcionalidad.<br />
6. No, por ser <strong>la</strong>s variables ordinales.<br />
7.<br />
8. a) Ordinal b) De intervalo o de razón<br />
9. a) Ordinal o de razón b) Ordinal<br />
6
1.4 Parámetros y Estadísticos.<br />
Definiciones:<br />
• Variable aleatoria es <strong>la</strong> variable que surge de un experimento aleatorio, consistente en<br />
considerar todos los posibles valores de una variable en una pob<strong>la</strong>ción. La variable aleatoria<br />
se describe mediante su distribución de probabilidad. Si <strong>la</strong> variable aleatoria es cuantitativa y<br />
continua, viene descrita por su función de densidad.<br />
• La variable estadística surge de un experimento estadístico, consistente en tomar datos de<br />
una variable aleatoria sólo en una muestra de <strong>la</strong> pob<strong>la</strong>ción. Describimos <strong>la</strong> variable estadística<br />
mediante <strong>la</strong> distribución de frecuencias y si es cuantitativa y continua <strong>la</strong> representamos<br />
gráficamente por medio del histograma.<br />
En el tema anterior hemos estudiado <strong>la</strong> distribución normal. Una distribución normal queda<br />
determinada por su media µ , y su desviación típica σ y <strong>la</strong> representamos por N( µ , σ ). La media y<br />
desviación típica de <strong>la</strong> distribución normal determinan completamente <strong>la</strong> función de densidad. Por ello<br />
decimos que <strong>la</strong> media y <strong>la</strong> desviación típica son los parámetros de <strong>la</strong> distribución normal.<br />
Si al realizar un estudio estadístico sospechamos que <strong>la</strong> variable de interés podría ser aproximada<br />
adecuadamente mediante una distribución normal, nuestro interés se centrará en hal<strong>la</strong>r el valor<br />
aproximado de estos parámetros (media y desviación típica), porque conocidos estos valores,<br />
habremos determinado <strong>la</strong> función de densidad de <strong>la</strong> variable y podremos calcu<strong>la</strong>r cualquier probabilidad<br />
re<strong>la</strong>cionada con el<strong>la</strong>.<br />
• L<strong>la</strong>mamos parámetros a <strong>la</strong>s medidas de posición central, dispersión y, en general cualquier<br />
resumen calcu<strong>la</strong>do en <strong>la</strong> variable aleatoria, es decir, en toda <strong>la</strong> pob<strong>la</strong>ción.<br />
• L<strong>la</strong>mamos estadísticos a <strong>la</strong>s mismas medidas cuando se refieren a <strong>la</strong> variable estadística, es decir,<br />
cuando se calcu<strong>la</strong>n sólo a partir de una muestra tomada de <strong>la</strong> pob<strong>la</strong>ción.<br />
Ejemplo 6.2. Una cadena de televisión quiere estudiar los índices de audiencia de uno de sus<br />
programas, medido por <strong>la</strong> proporción de personas que ven el programa una determinada semana.<br />
Para ello diseñan un proceso de muestreo y eligen 1000 familias en forma que <strong>la</strong> muestra sea<br />
representativa de <strong>la</strong> pob<strong>la</strong>ción.<br />
En cada familia recogerán datos del número de personas de <strong>la</strong> familia que vio el programa esa<br />
semana y el total de personas que componen <strong>la</strong> familia:<br />
• La proporción de personas que vio el programa esa semana en todo el país es un parámetro. Es un<br />
valor constante, pero no lo conocemos.<br />
• La proporción de personas que vio el programa en <strong>la</strong> muestra es un estadístico.<br />
Supongamos que se obtuvo una proporción del 15% de audiencia en <strong>la</strong> muestra. En otra<br />
muestra de personas esta proporción podría variar, aunque si <strong>la</strong>s muestras están bien<br />
elegidas esperamos que los valores se acerquen a <strong>la</strong> proporción (parámetro) en <strong>la</strong> pob<strong>la</strong>ción.<br />
7
Nota: En los temas siguientes se utilizará los términos parámetro y estadístico. El término<br />
parámetro se usará para referirse a <strong>la</strong>s medidas de tendencia central y de variabilidad de una pob<strong>la</strong>ción,<br />
por lo cual, µ , σ 2 y σ son parámetros. El término estadístico se usará para referirse a <strong>la</strong>s medidas de<br />
tendencia central y de variabilidad de <strong>la</strong> muestra, por lo cual, x , S 2 y S son estadísticos.<br />
Parámetro y Estadístico<br />
Un parámetro es un número representativo que se obtiene a partir de los datos de una pob<strong>la</strong>ción.<br />
Un estadístico es un número representativo que se obtiene a partir de los datos de una muestra.<br />
Los parámetros o estadísticos sirven para sintetizar <strong>la</strong> información del conjunto de datos en<br />
cuestión, al igual como lo haría una tab<strong>la</strong> de distribución o una gráfica.<br />
Hay tres tipos parámetros o estadísticos:<br />
• De centralización.<br />
• De posición.<br />
• De dispersión.<br />
Medidas de centralización<br />
Nos indican en torno a qué valor (centro) se distribuyen los datos.<br />
La medidas de centralización más comunes son:<br />
• Media aritmética: valor promedio de <strong>la</strong> distribución.<br />
• Mediana: puntación de <strong>la</strong> esca<strong>la</strong> que separa <strong>la</strong> mitad superior de <strong>la</strong> distribución y <strong>la</strong> inferior, es decir<br />
divide <strong>la</strong> serie de datos en dos partes iguales.<br />
• Moda: valor que más se repite en una distribución.<br />
Medidas de posición<br />
Las medidas de posición dividen un conjunto de datos en grupos con el mismo número o<br />
porcentaje de individuos.<br />
Para calcu<strong>la</strong>r <strong>la</strong>s medidas de posición es necesario que los datos estén ordenados de menor a mayor.<br />
La medidas de posición son:<br />
• Cuartiles: dividen <strong>la</strong> serie de datos en cuatro partes iguales.<br />
• Deciles: dividen <strong>la</strong> serie de datos en diez partes iguales.<br />
• Percentiles: dividen <strong>la</strong> serie de datos en cien partes iguales.<br />
8
Medidas de dispersión<br />
Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de <strong>la</strong><br />
distribución.<br />
Las medidas de dispersión son:<br />
• Rango o recorrido<br />
El rango es <strong>la</strong> diferencia entre el mayor y el menor de los datos de una distribución estadística.<br />
• Desviación media<br />
La desviación media es <strong>la</strong> media aritmética de los valores absolutos de <strong>la</strong>s desviaciones respecto<br />
a <strong>la</strong> media.<br />
• Varianza<br />
La varianza es <strong>la</strong> media aritmética del cuadrado de <strong>la</strong>s desviaciones respecto a <strong>la</strong> media.<br />
• Desviación típica<br />
La desviación típica es <strong>la</strong> raíz cuadrada de <strong>la</strong> varianza.<br />
Tarea de Estadístico y Parámetro.<br />
En los siguientes enunciados identifica si los valores mencionados se refieren a un parámetro o a un<br />
estadístico y <strong>la</strong> pob<strong>la</strong>ción de interés a <strong>la</strong> que se refiere:<br />
a) La proporción de todos los estudiantes de <strong>la</strong> facultad que han viajado al extranjero;<br />
b) La proporción de estudiantes que han viajado al extranjero entre 100 estudiantes de <strong>la</strong> Universidad<br />
elegidos al azar;<br />
c) La proporción de los mexicanos que votaron por el PAN en <strong>la</strong>s últimas elecciones;<br />
d) La proporción de "águi<strong>la</strong>s" en 100 <strong>la</strong>nzamientos de una moneda;<br />
e) El peso medio de 20 bolsas de papas fritas de una cierta marca;<br />
f) La proporción de personas que dec<strong>la</strong>raron votar por el PAN en una encuesta realizada después de<br />
<strong>la</strong>s elecciones;<br />
g) El peso medio de <strong>la</strong>s personas mexicanas de 18 años;<br />
h) El peso medio de 10 personas mexicanas.<br />
9
1.5 Pob<strong>la</strong>ción y muestra.<br />
En los temas anteriores hemos estudiado, por un <strong>la</strong>do, <strong>la</strong> <strong>Estadística</strong> Descriptiva, cuyo objeto<br />
es describir los datos obtenidos en observaciones u experimentos. Estos datos son usualmente<br />
representados por una o varias variables estadísticas, cuya distribución de frecuencias y demás<br />
características son obtenidas a partir de los datos, que en <strong>la</strong> mayor parte de los casos<br />
constituyen una muestra particu<strong>la</strong>r de <strong>la</strong> pob<strong>la</strong>ción. Por otro <strong>la</strong>do, mediante el Cálculo de<br />
Probabilidades, introducimos el concepto de variable aleatoria, al considerar que aumentamos<br />
indefinidamente <strong>la</strong>s observaciones y representar todos los posibles valores que puede tomar un<br />
carácter en una pob<strong>la</strong>ción, o todos los posibles valores que pueden surgir como consecuencia de <strong>la</strong><br />
realización de un cierto experimento.<br />
10
1.6 Diferentes tipos de muestreo aleatorio y no aleatorio.<br />
Hay muchas formas diferentes de elegir <strong>la</strong>s muestras. Por ejemplo, si queremos hacer un<br />
estudio de los alumnos de <strong>la</strong> Facultad de Ciencias de <strong>la</strong> Educación, podríamos formar una<br />
muestra con alumnos voluntarios. Sin embargo, si queremos que nuestros resultados sean<br />
generalizables, hay que p<strong>la</strong>nificar <strong>la</strong> elección de <strong>la</strong> muestra, siguiendo unos requisitos, que aseguren<br />
que <strong>la</strong> muestra ha sido elegida aleatoriamente de <strong>la</strong> pob<strong>la</strong>ción. Los métodos de inferencia<br />
estadística están basados en <strong>la</strong> utilización de unos métodos de muestreo probabilístico. El<br />
muestreo se dice probabilístico cuando puede calcu<strong>la</strong>rse de antemano <strong>la</strong> probabilidad de obtener<br />
cada una de <strong>la</strong>s muestras que sea posible seleccionar. Para ello, es necesario que el proceso de<br />
selección pueda considerarse como un experimento aleatorio. Algunos tipos de muestreo<br />
probabilístico son:<br />
• Muestreo aleatorio simple: Cuando los elementos de <strong>la</strong> muestra se eligen al azar de <strong>la</strong> pob<strong>la</strong>ción<br />
y cada elemento tiene <strong>la</strong> misma probabilidad de ser elegido. Puede realizarse con<br />
reemp<strong>la</strong>zamiento (una vez elegido un elemento para formar parte de <strong>la</strong> muestra se puede<br />
volver a elegir de nuevo) o sin reemp<strong>la</strong>zamiento.<br />
• Muestreo estratificado: Primero dividimos <strong>la</strong> pob<strong>la</strong>ción en grupos de individuos homogéneos,<br />
l<strong>la</strong>mados estratos. De cada estrato se toma una muestra aleatoria. El tamaño de <strong>la</strong><br />
muestra global se divide proporcionalmente al tamaño de cada estrato.<br />
• Muestreo sistemático: Se supone que los elementos de <strong>la</strong> pob<strong>la</strong>ción están ordenados. Si<br />
queremos tomar en <strong>la</strong> muestra uno de cada n elementos de <strong>la</strong> pob<strong>la</strong>ción, elegimos al azar un<br />
elemento entre los n primeros. A continuación sistemáticamente elegimos uno de cada n elementos.<br />
• Muestreo por conglomerados: Se divide <strong>la</strong> pob<strong>la</strong>ción en unidades representativas de<br />
<strong>la</strong> misma (y por tanto heterogéneas) y se extrae aleatoriamente un grupo de éstas sobre<br />
<strong>la</strong>s cuales se efectúa <strong>la</strong> medición. Por ejemplo, para realizar una encuesta sobre presupuestos<br />
familiares, <strong>la</strong> ciudad puede dividirse en manzanas de viviendas, y se toman al azar, varias de estas<br />
manzanas en <strong>la</strong>s cuales se efectúa <strong>la</strong> encuesta a todos los vecinos de <strong>la</strong> misma.<br />
• Puede realizarse un muestreo en dos o más etapas, cuando cada una de <strong>la</strong>s unidades tomadas<br />
para el muestreo puede a su vez ser muestreada. En el ejemplo anterior, una vez elegida<br />
una manzana de viviendas para formar parte en <strong>la</strong> muestra, se sortea entre todas <strong>la</strong>s viviendas<br />
que <strong>la</strong> componen para decidir cuales serán encuestadas.<br />
• También puede realizarse un muestreo opinático o intencional. En este caso, <strong>la</strong> persona que<br />
selecciona <strong>la</strong> muestra es <strong>la</strong> que decide los elementos que <strong>la</strong> constituirán, procurando que<br />
ésta sea representativa de <strong>la</strong> pob<strong>la</strong>ción. Sin embargo, <strong>la</strong> representatividad real dependerá de <strong>la</strong>s<br />
preferencias u opinión de esta persona y, por tanto, este tipo de muestreo carece de base<br />
teórica suficiente.<br />
• Por último, en el muestreo sin norma, se toma <strong>la</strong> muestra de cualquier manera y se obtiene<br />
así una parte de <strong>la</strong> pob<strong>la</strong>ción. Si esta es homogénea, <strong>la</strong> representatividad de <strong>la</strong> muestra puede ser<br />
satisfactoria. Este tipo de muestreo se emplea a menudo en <strong>la</strong> vida diaria (así, se prueba un trozo de<br />
queso o un sorbo de vino, etc, y se juzga el resto por el resultado).<br />
11
1.7 Determinación del tamaño de <strong>la</strong> muestra (Pendiente).<br />
II.<br />
Variabilidad Muestral.<br />
2.0.1 Muestreo con o sin reemp<strong>la</strong>zo de una pob<strong>la</strong>ción finita.<br />
El hecho de regresar o no un elemento muestreado a <strong>la</strong> pob<strong>la</strong>ción antes de extraer otro elemento<br />
de esa misma pob<strong>la</strong>ción determina si el muestreo es con o sin reemp<strong>la</strong>zo. El muestreo es con<br />
reemp<strong>la</strong>zo si en una extracción el elemento extraído sigue participando en otra u otras extracciones<br />
posteriores; el muestreo es sin reemp<strong>la</strong>zo si el elemento extraído ya no participa en otra u otras<br />
extracciones posteriores. Si <strong>la</strong> pob<strong>la</strong>ción es muy grande, al extraer varios elementos, uno por uno, el<br />
tipo de muestreo es irrelevante. De hecho, al reemp<strong>la</strong>zar el primer elemento antes de extraer el<br />
segundo, <strong>la</strong>s observaciones en <strong>la</strong> primera y en <strong>la</strong> segunda extracción serían totalmente independientes.<br />
No obstante, si no se reemp<strong>la</strong>za el primer elemento, el segundo resultado de <strong>la</strong> extracción afectará<br />
ligeramente <strong>la</strong> segunda extracción. En pob<strong>la</strong>ciones pequeñas el efecto si es relevante.<br />
El desarrollo matemático es más sencillo si <strong>la</strong>s observaciones son independientes. A lo <strong>la</strong>rgo del<br />
muestreo se va a suponer el muestreo aleatorio con reemp<strong>la</strong>zo, el cual también suele l<strong>la</strong>mársele<br />
muestreo aleatorio simple.<br />
Nota:<br />
El número de elementos de <strong>la</strong> pob<strong>la</strong>ción, l<strong>la</strong>mado tamaño de <strong>la</strong> pob<strong>la</strong>ción, lo representaremos con <strong>la</strong><br />
letra N.<br />
El número de elementos de <strong>la</strong> muestra, l<strong>la</strong>mado tamaño de <strong>la</strong> muestra, lo representaremos con <strong>la</strong> letra<br />
n.<br />
El cálculo del número de muestras posibles de tamaño n, extraídas de una pob<strong>la</strong>ción de tamaño N,<br />
cuando el muestreo es con reemp<strong>la</strong>zo, se determina mediante <strong>la</strong> siguiente expresión:<br />
n<br />
N<br />
Por otro <strong>la</strong>do, cuando el muestreo es sin reemp<strong>la</strong>zo, el número de muestras posibles que se pueden<br />
obtener es:<br />
⎛ N⎞<br />
⎜ ⎟ =<br />
⎝ n ⎠<br />
N !<br />
n! ( N − n)!<br />
12
Ejemplo:<br />
Consideremos una pob<strong>la</strong>ción que consta de 30 elementos. Si de esta pob<strong>la</strong>ción se desean obtener<br />
muestras de tamaño 5, ¿cuántas muestras distintas hay, si el muestreo se hace:<br />
a) con reemp<strong>la</strong>zo? b) sin reemp<strong>la</strong>zo?<br />
Solución:<br />
13
2.0.2 Estimación puntual.<br />
La estimación es el proceso que permite inferir sobre los posibles valores de los parámetros que<br />
describen <strong>la</strong> pob<strong>la</strong>ción.<br />
Es muy probable que los valores de los parámetros que representan a una pob<strong>la</strong>ción, sean<br />
desconocidos. En estos casos se recurre a <strong>la</strong> información proporcionada en <strong>la</strong> muestra para contar con<br />
una idea de los valores de los parámetros. Si se logra determinar un descriptor numérico para <strong>la</strong><br />
muestra, este estadístico, l<strong>la</strong>mado estimación puntual, se puede usar para estimar <strong>la</strong> media<br />
correspondiente a <strong>la</strong> pob<strong>la</strong>ción.<br />
Ejemplo.<br />
Consideremos el siguiente conjunto de datos, correspondientes a una pob<strong>la</strong>ción:<br />
a) Determinar <strong>la</strong> media y <strong>la</strong> desviación estándar de este conjunto.<br />
b) Determinar una muestra aleatoria de tamaño 4 y calcu<strong>la</strong>r su media y su desviación estándar.<br />
c) ¿Cuáles son los estimadores puntuales de µ y σ ? ¿Qué tan buenos son estos estimadores?<br />
Solución:<br />
2 4 5 7 10 11 15 16 18 20<br />
a) Con nuestra calcu<strong>la</strong>dora, obtenemos que:<br />
µ = 10.8, σ ≈ 5.946<br />
b) Para esto, utilizaremos el software “del libro P y E”, siguiendo <strong>la</strong> siguiente secuencia:<br />
1. Asignar un número a cada elemento de <strong>la</strong> muestra<br />
Etiqueta Asignada 1 2 3 4 5 6 7 8 9 10<br />
Datos de <strong>la</strong> pob<strong>la</strong>ción 2 4 5 7 10 11 15 16 18 20<br />
2. Ejecutar el programa y abrir <strong>la</strong> opción “EXTRAS” del menú inicio.<br />
3. Seleccionar <strong>la</strong> opción “Generador de números” y llenar <strong>la</strong>s siguientes opciones:<br />
• Intervalo: Valor máximo = 11 (un número más que el valor de <strong>la</strong> etiqueta más grande)<br />
Valor mínimo = 1 (correspondientes al valor más pequeño de <strong>la</strong>s etiquetas asignadas).<br />
• Resolución = 1 (para nuestro caso particu<strong>la</strong>r), números de uno o dos dígitos menores a 11.<br />
= 10, números de dos o tres dígitos menores al valor de <strong>la</strong> etiqueta más grande).<br />
etc.<br />
• Número de datos (tamaño de <strong>la</strong> muestra) = 4 (para nuestro ejemplo particu<strong>la</strong>r)<br />
14
• Número de variables = 1 (para nuestro ejemplo particu<strong>la</strong>r)<br />
• Dar clic en <strong>la</strong> opción “generar” y listo. En mi caso se generó <strong>la</strong> muestra (de <strong>la</strong>s etiquetas):<br />
9 8 10 4<br />
Qué corresponden a los valores:<br />
18 16 20 7<br />
La media y <strong>la</strong> desviación estándar de esta muestra son:<br />
x = 15.25, S ≈ 5.737<br />
Donde observamos que existe una discrepancia, por ejemplo, de <strong>la</strong> media real con <strong>la</strong> media de <strong>la</strong><br />
muestra, con un valor de µ − x = 10.8 − 15.25 = − 4.45 = 4.45 .<br />
c) x = 15.25 es un estimador puntual del valor de <strong>la</strong> media pob<strong>la</strong>cional µ .<br />
Simi<strong>la</strong>rmente, S ≈ 5.737 es un estimador puntual del valor de <strong>la</strong> desviación estándar pob<strong>la</strong>cional σ .<br />
Estos estimadores se considerarán como buenos, si <strong>la</strong> discrepancia surgida al comparar el<br />
parámetro con el estadístico es pequeña.<br />
Tarea (de Estimación puntual)<br />
Consideremos el siguiente conjunto de datos, correspondientes a una pob<strong>la</strong>ción:<br />
2 4 5 7 10 11 15 16 18 20<br />
a) Utilice un paquete estadístico para seleccionar aleatoriamente cuatro muestras distintas de tamaño<br />
n = 3. En su reporte copie y pegue <strong>la</strong>s muestras generadas por el paquete.<br />
b) Determinar <strong>la</strong> media de cada una de <strong>la</strong>s muestras obtenidas en el inciso (a).<br />
c) Determine <strong>la</strong> discrepancia existente entre <strong>la</strong> media de cada muestra con respecto a <strong>la</strong> media<br />
pob<strong>la</strong>cional µ .<br />
d) Utilice un paquete estadístico para seleccionar aleatoriamente cuatro muestras distintas de tamaño<br />
n = 5, y hacer lo mismo que en los incisos (b), y (c).<br />
e) ¿Qué diferencias observas en <strong>la</strong>s discrepancias x − µ obtenidas en <strong>la</strong>s distintas muestras de<br />
tamaño n = 3 y n = 5.<br />
15
Solución:<br />
a)<br />
Etiqueta Asignada 1 2 3 4 5 6 7 8 9 10<br />
Datos de <strong>la</strong> pob<strong>la</strong>ción 2 4 5 7 10 11 15 16 18 20<br />
Cuyas muestras respectivas son:<br />
Muestra 1 Muestra 2 Muestra 3 Muestra 4<br />
16 16 11 10<br />
18 15 16 11<br />
5 20 7 7<br />
b)<br />
Muestra 1 Muestra 2 Muestra 3 Muestra 4<br />
x<br />
1<br />
= 13 x<br />
2<br />
= 17 x<br />
3<br />
= 11.333 x<br />
4<br />
= 28<br />
c) Como µ = 10.8 , entonces:<br />
x<br />
1<br />
− µ x<br />
2<br />
− µ x<br />
3<br />
− µ x<br />
4<br />
− µ<br />
2.2 4 0.533 17.2<br />
d)<br />
16
Cuyas muestras respectivas son:<br />
Muestra 1 Muestra 2 Muestra 3 Muestra 4<br />
5 11 7 5<br />
20 10 15 18<br />
7 18 4 7<br />
4 20 16 10<br />
16 10 20 16<br />
Muestra 1 Muestra 2 Muestra 3 Muestra 4<br />
x<br />
1<br />
= 10.4 x<br />
2<br />
= 13.8 x<br />
3<br />
= 12.4 x<br />
4<br />
= 11.2<br />
Como µ = 10.8 , entonces:<br />
x<br />
1<br />
− µ x<br />
2<br />
− µ x<br />
3<br />
− µ x<br />
4<br />
− µ<br />
0.4 3 1.6 0.4<br />
e) Observemos, que en general, <strong>la</strong> discrepancia entre <strong>la</strong> media muestral x y <strong>la</strong> media pob<strong>la</strong>cional µ<br />
es menor cuando <strong>la</strong> muestra es de mayor tamaño. ¿Qué piensas que ocurriría si se aumenta el<br />
tamaño de <strong>la</strong> muestra? ¿Por qué?<br />
17
2.1 Distribuciones muestrales de <strong>la</strong> media.<br />
De acuerdo a lo observado en el ejemplo y tarea anterior, el valor de <strong>la</strong> media muestral x varía de<br />
una muestra a otra. Por lo cual x , además de ser un estimador, es una variable aleatoria. De esta<br />
forma, x cuenta con una media, una desviación estándar y una distribución de probabilidad.<br />
Definición (Distribución muestral de <strong>la</strong> medias)<br />
Una Distribución muestral de medias es una distribución probabilística que consta de una lista de<br />
todas <strong>la</strong>s medias de <strong>la</strong>s posibles muestras extraídas de una pob<strong>la</strong>ción, obtenidas de un muestreo con o<br />
sin reemp<strong>la</strong>zo y de un tamaño especifico, y esta lista acompañada de <strong>la</strong> probabilidad de ocurrencia asociada<br />
con cada media muestral.<br />
En este caso, <strong>la</strong> media de <strong>la</strong>s medias muestrales (media esperada) es ahora <strong>la</strong> media de todos los<br />
posibles valores de x y se denota por:<br />
µ<br />
x<br />
Esta corresponde al parámetro de <strong>la</strong> distribución de x . La desviación estándar es <strong>la</strong> desviación<br />
estándar de los valores de x y se denota por:<br />
σ<br />
x<br />
Esta corresponde al parámetro para <strong>la</strong> desviación estándar de <strong>la</strong> distribución de x .<br />
Para ilustrar el concepto de <strong>la</strong> distribución muestral de medias muestrales, consideremos los<br />
siguientes:<br />
Ejemplo 1.<br />
Consideremos una pob<strong>la</strong>ción de sólo tres valores: x 1 = 1 , x 2 = 2 y x 3 = 3, cuya media y<br />
desviación estándar pob<strong>la</strong>cional son µ = 2 y σ ≈ 0.8165 .<br />
a) Obtener todas <strong>la</strong>s posibles muestras de tamaño 2, con reposición, que se pueden extraer a partir de<br />
<strong>la</strong> pob<strong>la</strong>ción dada:<br />
b) Hacer <strong>la</strong> gráfica de <strong>la</strong> distribución de medias muestrales e indique lo que observa.<br />
c) Calcu<strong>la</strong>r µ<br />
x<br />
, σ<br />
x<br />
e indique lo que observe.<br />
18
Solución:<br />
a) El número de todas <strong>la</strong>s muestras posibles de tamaño 2, con reposición, que se pueden extraer de<br />
dicha pob<strong>la</strong>ción son 3 2 = 9, y explícitamente estas son <strong>la</strong>s siguientes:<br />
muestra x<br />
de cada<br />
muestra<br />
m 1 = 1, 1 1.0<br />
m 2 = 1, 2 1.5<br />
m 3 = 1, 3 2.0<br />
m 4 = 2, 1 1.5<br />
m 5 = 2, 2 2.0<br />
m 6 = 2, 3 2.5<br />
m 7 = 3, 1 2.0<br />
m 8 = 3, 2 2.5<br />
m 9 = 3, 3 3.0<br />
Σ = 18<br />
La distribución muestral de medias para este ejemplo es:<br />
x f ( x )<br />
1.0 1 / 9<br />
1.5 2 / 9<br />
2.0 3 / 9<br />
2.5 2 / 9<br />
3.0 1 / 9<br />
Σ = 1.0<br />
Observemos que <strong>la</strong> mayoría de los valores de <strong>la</strong>s medias muéstrales individuales difiere del valor de <strong>la</strong> media<br />
pob<strong>la</strong>cional. En general se puede afirmar que sin importar de <strong>la</strong> pob<strong>la</strong>ción que se tenga, <strong>la</strong>s medias muestrales<br />
tenderán a estar cerca de <strong>la</strong> media pob<strong>la</strong>cional y rara vez tendrán el mismo valor.<br />
b)<br />
f ( x )<br />
3/9<br />
2/9<br />
x<br />
Observemos que <strong>la</strong> gráfica es simétrica, con distribución normal.<br />
c) µ<br />
x<br />
= 2 y σ<br />
x<br />
≈ 0.57735<br />
Con lo cual observamos que <strong>la</strong> media de medias muestrales es igual al valor de <strong>la</strong> media<br />
pob<strong>la</strong>cional: µ = µ<br />
x<br />
Lo cual no ocurre con <strong>la</strong> desviación estándar de medias muestrales:<br />
σ<br />
x<br />
≠ σ .<br />
19
Ejemplo 2 (Tarea).<br />
Repetir el ejemplo (1), para el caso en que <strong>la</strong> muestra sea sin reposición.<br />
Solución:<br />
Todas <strong>la</strong>s posibles muestras de tamaño 2, son:<br />
1, 2 ; 1, 3 y 2, 3<br />
Y <strong>la</strong> distribución de probabilidad de <strong>la</strong>s medias muestrales es:<br />
muestra x f ( x)<br />
m 1 = 1, 2 1.5 1/3<br />
m 2 = 1, 3 2.0 1/3<br />
m 3 = 2, 3 2.5 1/3<br />
Esta distribución también es simétrica.<br />
Además, µ<br />
x<br />
= 2 y σ<br />
x<br />
≈ 0.40825<br />
Con lo cual observamos nuevamente que <strong>la</strong> media de medias muestrales es igual al valor de <strong>la</strong><br />
media pob<strong>la</strong>cional: µ = µ<br />
x<br />
Lo cual no ocurre con <strong>la</strong> desviación estándar de medias muestrales:<br />
σ<br />
x<br />
≠ σ .<br />
20
2.2 Error Estándar de una distribución muestral.<br />
Concepto de error estándar.<br />
En vez de usar “<strong>la</strong> desviación estándar de <strong>la</strong> distribución de <strong>la</strong>s medias muéstrales” para describir una<br />
distribución de <strong>la</strong>s medias muéstrales, los estadísticos hab<strong>la</strong>n del error estándar de <strong>la</strong> media.<br />
error estándar de <strong>la</strong> media =<br />
σ<br />
x<br />
La desviación estándar de <strong>la</strong> distribución de <strong>la</strong>s medias muéstrales mide el grado en que esperamos<br />
que <strong>la</strong>s medias de <strong>la</strong>s diferentes muestras varíen por este error accidental en el proceso de muestreo.<br />
Por consiguiente, <strong>la</strong> desviación estándar de <strong>la</strong> distribución de un estadístico muestral recibe el<br />
nombre de error estándar del estadístico.<br />
El error estándar indica no sólo el tamaño del error accidental que se ha cometido, sino además <strong>la</strong><br />
exactitud que seguramente alcanzaremos si usamos un estadístico muestral para estimar un parámetro<br />
de <strong>la</strong> pob<strong>la</strong>ción. Una distribución de medias muéstrales que está menos dispersa (o sea que tiene un<br />
error estándar pequeño) resulta ser un mejor estimador de <strong>la</strong> media de <strong>la</strong> pob<strong>la</strong>ción que una distribución<br />
de medias muéstrales que tenga una gran dispersión y un gran error estándar.<br />
Como hicimos notar anteriormente, sin importar si el muestreo es con o sin reemp<strong>la</strong>zo,<br />
Mediante métodos matemáticos, se puede demostrar que <strong>la</strong> re<strong>la</strong>ción que guardan <strong>la</strong> desviación estándar<br />
de <strong>la</strong> pob<strong>la</strong>ción y el error estándar, cuando el muestreo es con reemp<strong>la</strong>zo, es <strong>la</strong> siguiente:<br />
σ<br />
x<br />
≠ σ .<br />
σ =<br />
x<br />
σ<br />
n<br />
En <strong>la</strong> expresión anterior se observa que el error estándar disminuye en <strong>la</strong> medida en que el tamaño de<br />
<strong>la</strong> muestra crece.<br />
En el ejemplo (1) anterior, el error estándar de <strong>la</strong> distribución de medias muestrales es:<br />
σ 0.8165<br />
σ<br />
x<br />
= = = 0.57735<br />
n 2<br />
el cual coincide con el valor calcu<strong>la</strong>do directamente con <strong>la</strong> calcu<strong>la</strong>dora, a partir de <strong>la</strong> pob<strong>la</strong>ción de <strong>la</strong>s<br />
medias muestrales.<br />
21
Ejemplo<br />
Supongamos que en determinada pob<strong>la</strong>ción se ha seleccionado una muestra de tamaño n = 10 con<br />
σ<br />
x<br />
= 9 . ¿Cuántas observaciones más necesitamos para reducir el valor de σ<br />
x<br />
a:<br />
a) 4.5 b) 3 c) 1<br />
Solución:<br />
Tomando en cuenta que<br />
σ<br />
σ<br />
x<br />
= , despejando σ , obtenemos:<br />
n<br />
σ = σ x<br />
⋅ n = 9⋅ 10 ≈ 28.46<br />
Por otro <strong>la</strong>do, despejando n de <strong>la</strong> fórmu<strong>la</strong> del error estándar, obtenemos:<br />
2<br />
σ<br />
n =<br />
σ<br />
2<br />
x<br />
a) si σ<br />
x<br />
= 4.5,<br />
( 28.46)<br />
2<br />
( 4.5)<br />
n = ≈ 40<br />
2<br />
Por lo tanto, para reducir σ<br />
x<br />
de 9 a 4.5, el tamaño inicial de <strong>la</strong> muestra se debe aumentar en 30<br />
unidades.<br />
b) si σ<br />
x<br />
= 3,<br />
( 28.46)<br />
2<br />
( 3)<br />
n = ≈ 90<br />
2<br />
Por lo tanto, para reducir σ<br />
x<br />
de 9 a 3, el tamaño inicial de <strong>la</strong> muestra se debe aumentar en 80<br />
unidades.<br />
c) si σ<br />
x<br />
= 1,<br />
( 28.46)<br />
2<br />
( 1)<br />
n = ≈ 810<br />
2<br />
Por lo tanto, para reducir<br />
unidades.<br />
σ<br />
x<br />
de 9 a 4.5, el tamaño inicial de <strong>la</strong> muestra se debe aumentar en 800<br />
Nota:<br />
En lo sucesivo, diremos que una muestra es una muestra pequeña si el tamaño de esta es menor que<br />
30:<br />
n < 30<br />
Por otro <strong>la</strong>do, diremos que una muestra es una muestra grande si el tamaño de esta es mayor o igual<br />
que 30:<br />
n ≥ 30 .<br />
22
2.3 El Teorema del Límite Central.<br />
Los resultados vistos anteriormente, respecto a una distribución de medias muestrales, se encuentran<br />
resumidos en el siguiente teorema:<br />
Teorema (del Límite central)<br />
Consideremos una pob<strong>la</strong>ción de datos, con media µ y desviación estándar σ. Si de esta pob<strong>la</strong>ción<br />
se extraen todas <strong>la</strong>s diferentes muestras de tamaño n , entonces <strong>la</strong> distribución muestral de medias:<br />
1. Tendrá una media esperada µ x = µ sin importar el tipo de muestreo ni el tipo de pob<strong>la</strong>ción que<br />
se esté trabajando.<br />
2. Tendrá un error estándar (desviación estándar) expresado por medio de <strong>la</strong> fórmu<strong>la</strong>:<br />
σ<br />
a) σ x = si el muestreo se hace con reemp<strong>la</strong>zo.<br />
n<br />
b) σ<br />
x<br />
σ N − n<br />
= •<br />
si el muestreo se hace sin reemp<strong>la</strong>zo. En este caso, el factor<br />
n N −1<br />
l<strong>la</strong>ma factor de corrección para pob<strong>la</strong>ción finita.<br />
N − n<br />
N −1<br />
se<br />
3. a) Tendrá una distribución Normal, siempre y cuando <strong>la</strong> pob<strong>la</strong>ción original de datos tenga una<br />
distribución Normal.<br />
b) Tendrá una distribución aproximadamente Normal, siempre y cuando <strong>la</strong>s muestras<br />
seleccionadas sean de tamaño mayor o igual a 30 para el caso en que <strong>la</strong> pob<strong>la</strong>ción original de<br />
datos no tenga una distribución Normal.<br />
Nota :<br />
a) Cuando en los problemas no sea c<strong>la</strong>ro que tipo de fórmu<strong>la</strong> se debe utilizar para determinar el valor<br />
de σ x , se puede utilizar el siguiente criterio:<br />
Si<br />
n<br />
N < 0. 05 , entonces utilizar σ σ<br />
x = . En caso contrario, utilizar σ x =<br />
n<br />
σ N − n<br />
•<br />
n N −1 .<br />
b) Si no se hace especifico que el muestreo es sin reposición, entonces para determinar el valor del<br />
σ<br />
error estándar, utilizar <strong>la</strong> fórmu<strong>la</strong> σ x = .<br />
n<br />
23
2.4 Aplicaciones del Teorema del Límite Central.<br />
1. Supóngase que de 6 estudiantes (elementos de toda una pob<strong>la</strong>ción), el primer estudiante tiene $1,<br />
el segundo $2 y así sucesivamente hasta el sexto estudiante que tiene $6.<br />
a) Calcu<strong>la</strong>r <strong>la</strong> media y <strong>la</strong> desviación estándar de <strong>la</strong> pob<strong>la</strong>ción.<br />
b) Si se consideran todas <strong>la</strong>s muestras posibles (sin reposición) de tamaño 2 extraídas a partir de<br />
<strong>la</strong> pob<strong>la</strong>ción dada, calcu<strong>la</strong>r el valor de µ x y de σ x .<br />
Solución:<br />
2. La media aritmética de <strong>la</strong>s estaturas de 42 000 estudiantes de secundaria de una ciudad es de 1.58<br />
m y <strong>la</strong> desviación estándar es de 0.08 m. Si se toman 50 muestras de 40 alumnos en cada muestra,<br />
ha<strong>la</strong>r <strong>la</strong> media esperada de <strong>la</strong> distribución muestral y su error estándar.<br />
Solución:<br />
Por hipótesis, N = 42 000, n = 40, µ = 1.58, σ = 0.08 .<br />
Por lo tanto, µ = µ = 1.58 .<br />
x<br />
σ 0.08<br />
σ x = = ≈ 0.01265 .<br />
n 40<br />
24
III.<br />
Estimación.<br />
3.1 Estimación por intervalo.<br />
25