30.07.2014 Views

I. Introducción a la Inferencia Estadística.

Introducción al muestreo

Introducción al muestreo

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

ESTADÍSTICA APLICADA<br />

I. <strong>Introducción</strong> a <strong>la</strong> <strong>Inferencia</strong> <strong>Estadística</strong>.<br />

1.1 Importancia de <strong>la</strong> inferencia estadística en <strong>la</strong>s ciencias sociales.<br />

La importancia que <strong>la</strong> estadística ha alcanzado en nuestros días, tanto como cultura básica, como en<br />

el trabajo profesional y en <strong>la</strong> investigación, es innegable. Ello es debido a <strong>la</strong> abundancia de información<br />

con <strong>la</strong> que el ciudadano debe enfrentarse en su trabajo diario. La mayor parte de <strong>la</strong>s veces estas<br />

informaciones vienen expresadas en forma de tab<strong>la</strong>s o gráficos estadísticos, por lo que un conocimiento<br />

básico de esta ciencia es necesario para <strong>la</strong> correcta interpretación de los mismos.<br />

Así, es frecuente hab<strong>la</strong>r de estadísticas de empleo, de emigración, de producción, de mortalidad, etc.<br />

El hombre no vive ais<strong>la</strong>do: vivimos en sociedad; <strong>la</strong> familia, <strong>la</strong> escue<strong>la</strong>, el trabajo, el ocio están llenos<br />

de situaciones en <strong>la</strong>s que predomina <strong>la</strong> incertidumbre: El número de hijos de <strong>la</strong> familia, <strong>la</strong> edad de los<br />

padres al contraer matrimonio, el tipo de trabajo, <strong>la</strong>s creencias o aficiones de los miembros varían de<br />

una familia a otra.<br />

En <strong>la</strong> escue<strong>la</strong>, ¿podemos prever <strong>la</strong>s preguntas del próximo examen?; ¿quién ganará el próximo<br />

partido? Para desp<strong>la</strong>zarnos de casa a <strong>la</strong> escue<strong>la</strong>, o para ir de vacaciones, dependemos del transporte<br />

público que puede sufrir retrasos. ¿Cuantos viajeros usarán el autobús? ¿Cuantos clientes habrá en <strong>la</strong><br />

caja del supermercado el viernes a <strong>la</strong>s 7 de <strong>la</strong> tarde?<br />

En nuestros ratos de ocio practicamos juegos de azar tales como quinie<strong>la</strong>s o loterías. Acudimos a<br />

encuentros deportivos cuyos resultados son inciertos y en los que tendremos que hacer co<strong>la</strong> para<br />

conseguir <strong>la</strong>s entradas.<br />

Cuando hacemos una póliza de seguros no sabemos si <strong>la</strong> cobraremos o por el contrario perderemos<br />

el dinero pagado; cuando compramos acciones en bolsa estamos expuestos a <strong>la</strong> variación en <strong>la</strong>s<br />

cotizaciones,...<br />

Información acerca de una o varias variables en una pob<strong>la</strong>ción determinada.<br />

Aunque a veces es posible estudiar toda <strong>la</strong> pob<strong>la</strong>ción completa mediante un censo, otras veces es<br />

preciso contentarse con una muestra de <strong>la</strong> misma. La idea es obtener información de <strong>la</strong> pob<strong>la</strong>ción<br />

estudiando sólo una parte de <strong>la</strong> misma (<strong>la</strong> muestra). El proceso de generalizar los resultados obtenidos<br />

en <strong>la</strong> muestra a toda <strong>la</strong> pob<strong>la</strong>ción recibe el nombre de inferencia estadística. Hay dos características<br />

importantes en <strong>la</strong>s muestras, que son:<br />

• Variabilidad muestral: No todas <strong>la</strong>s muestras son iguales. Los elementos de distintas muestras<br />

pueden ser diferentes, y, por tanto, los resultados de una muestra a otra pueden variar.<br />

• Representatividad: Si elegimos una muestra adecuadamente, puede representar a <strong>la</strong> pob<strong>la</strong>ción, en<br />

el sentido de que los resultados en <strong>la</strong> muestra pueden servir para estimar los resultados en <strong>la</strong><br />

pob<strong>la</strong>ción.<br />

Los motivos que hacen necesario el uso de estas técnicas pueden ser económicos, ya que es más<br />

costoso y lleva más tiempo obtener información de toda <strong>la</strong> pob<strong>la</strong>ción. También puede darse el caso de<br />

que el experimento que debe realizarse tenga carácter destructivo, como ocurre en algunos ensayos de<br />

fiabilidad.<br />

Otras veces <strong>la</strong> pob<strong>la</strong>ción está constituida por entes potenciales, como es el caso de los ensayos<br />

médicos en que se consideran los posibles enfermos con una dolencia; o bien se trata de una pob<strong>la</strong>ción<br />

infinita. Por último, <strong>la</strong> gran homogeneidad de algunas pob<strong>la</strong>ciones hace innecesario el estudio de <strong>la</strong><br />

totalidad de <strong>la</strong> misma, como ocurre al efectuar, por ejemplo, un análisis de sangre, con objeto de<br />

efectuar el recuento de personas con cierta enfermedad.<br />

1


1.2 Comparación entre estadística descriptiva y estadística inferencial.<br />

En los temas anteriores hemos estudiado, por un <strong>la</strong>do, <strong>la</strong> <strong>Estadística</strong> Descriptiva, cuyo objeto es<br />

describir los datos obtenidos de observaciones u experimentos. Estos datos son usualmente<br />

representados por una o varias variables estadísticas, cuya distribución de frecuencias y demás<br />

características son obtenidas a partir de los datos, que en <strong>la</strong> mayor parte de los casos constituyen una<br />

muestra particu<strong>la</strong>r de <strong>la</strong> pob<strong>la</strong>ción. Por otro <strong>la</strong>do, mediante el Cálculo de Probabilidades, introducimos el<br />

concepto de variable aleatoria, al considerar que aumentamos indefinidamente <strong>la</strong>s observaciones y<br />

representar todos los posibles valores que puede tomar un carácter en una pob<strong>la</strong>ción, o todos los<br />

posibles valores que pueden surgir como consecuencia de <strong>la</strong> realización de un cierto experimento.<br />

Sin embargo, <strong>la</strong> mayoría de los problemas de interés, implican, bien pob<strong>la</strong>ciones infinitas, o<br />

pob<strong>la</strong>ciones finitas que son difíciles, costosas o imposibles de inspeccionar. Esto obliga a tener que<br />

seleccionar, por procedimientos adecuados, un subconjunto de n elementos de <strong>la</strong> pob<strong>la</strong>ción, que<br />

constituyen una muestra de tamaño n, examinar <strong>la</strong> característica que interesa y después generalizar<br />

estos resultados a <strong>la</strong> pob<strong>la</strong>ción. Esta generalización a <strong>la</strong> pob<strong>la</strong>ción se realiza por medio de <strong>la</strong> parte de <strong>la</strong><br />

estadística que se conoce con el nombre de inferencia estadística. Para que estas conclusiones<br />

ofrezcan <strong>la</strong>s debidas garantías es preciso comprobar que se cumple el requisito básico de que <strong>la</strong><br />

muestra sea representativa.<br />

1.3 Variables y esca<strong>la</strong>s de medición.<br />

Al observar valores o características, desarrol<strong>la</strong>mos un proceso de medición, es decir que<br />

comparamos <strong>la</strong>s variables y establecemos esca<strong>la</strong>s de valores.<br />

Como resultado de nuestras medidas sobre individuos o unidades experimentales de <strong>la</strong> pob<strong>la</strong>ción<br />

bajo estudio, obtenemos un conjunto de datos, o resultados del experimento estadístico. Para facilitar el<br />

análisis asignaremos unos valores a cada unidad experimental de acuerdo con ciertas reg<strong>la</strong>s; así,<br />

podemos asignar el número 0 a los varones y el 1 a <strong>la</strong>s mujeres o viceversa, o bien los símbolos "V" y<br />

"H".<br />

TIPOS DE DATOS Y ESCALAS DE MEDIDA<br />

Pueden observarse muchas características diferentes para un mismo individuo. Estas características,<br />

dependiendo del tipo de valores que originan, pueden medirse con cuatro tipos distintos de esca<strong>la</strong>s de<br />

medida: esca<strong>la</strong> nominal, ordinal, de intervalo y de razón. Vamos a analizar <strong>la</strong>s características de cada<br />

una.<br />

Esca<strong>la</strong> nominal<br />

La forma más simple de observación es <strong>la</strong> c<strong>la</strong>sificación de individuos en c<strong>la</strong>ses que simplemente<br />

pueden distinguirse entre si pero no compararse ni realizar entre el<strong>la</strong>s operaciones aritméticas. En este<br />

tipo se incluyen características tales como <strong>la</strong> profesión, nacionalidad o grupo sanguíneo. Este tipo de<br />

esca<strong>la</strong> emplea los números so<strong>la</strong>mente como nombres de c<strong>la</strong>ses de objetos, este sería el caso de usar 0<br />

para el sexo femenino y 1 para masculino (o viceversa) o usar números diferentes para <strong>la</strong>s personas<br />

que escogen distintos tipos de cereal: 1 para los de corn f<strong>la</strong>kes, 2 para choco crispis, 3 para frutlups<br />

, etc.<br />

Esca<strong>la</strong> ordinal<br />

Este tipo de esca<strong>la</strong> asigna los números de acuerdo con <strong>la</strong> propiedad ordinal del sistema numérico: los<br />

valores están ordenados de menos a más, pero no hay una idea de igualdad en <strong>la</strong>s distancias entre los<br />

números. Por ejemplo, en una esca<strong>la</strong> de actitudes podemos asignar números: 1, 2, 3,…, a los valores<br />

de una actitud. Si decimos: “indique usted el aprecio que tiene por el presidente de <strong>la</strong> República: 1.<br />

Ninguna; 2. Poco; 3. Regu<strong>la</strong>r, y 4 mucho”, en esta esca<strong>la</strong> no podemos decir que <strong>la</strong> distancia en aprecio<br />

entre el que responde 1 y el que responde 2 es igual a <strong>la</strong> que hay entre 3 y 4, pero si apreciar que 4 es<br />

mayor que 3 en esa dimensión.<br />

A veces, <strong>la</strong>s categorías obtenidas pueden ser ordenadas, aunque diferencias numéricas iguales a lo<br />

<strong>la</strong>rgo de <strong>la</strong> esca<strong>la</strong> numérica utilizada para medir dichas c<strong>la</strong>ses no correspondan a incrementos iguales<br />

2


en <strong>la</strong> propiedad que se mide. Por ejemplo, puede asignarse un número de orden de nacimiento a un<br />

grupo de hermanos, sin que <strong>la</strong> diferencia de edad entre el 1º y el 2º de ellos sea <strong>la</strong> misma que <strong>la</strong> del 2º<br />

al 3º.<br />

Esca<strong>la</strong> de intervalo<br />

Este tipo de esca<strong>la</strong> no sólo se usa en el ordenamiento, sino que establece que a distancias iguales<br />

entre dos puntos en cualquier parte de el<strong>la</strong>s corresponden siempre a diferencias iguales entre los<br />

valores que el<strong>la</strong>s miden. Por ejemplo, <strong>la</strong>s temperaturas tomadas con termómetro nos permiten aseverar<br />

que <strong>la</strong> cantidad de incremento de temperatura es igual para distancias iguales en <strong>la</strong> esca<strong>la</strong>. Por<br />

ejemplo, un incremento de 5 0 C es igual, ya sea cuando se pasa de 0 a 5 0 C o cuando se pasa de 10 a<br />

15 0 C.<br />

Se usa el nombre de “medición por intervalos” porque este tipo de esca<strong>la</strong> se refiere principalmente a<br />

<strong>la</strong> distancia entre los objetos, o sea, al “intervalo” existente entre ellos.<br />

En esta esca<strong>la</strong> se pueden efectuar operaciones aritméticas.<br />

Esta esca<strong>la</strong>, además de c<strong>la</strong>sificar y ordenar a los individuos, cuantifica <strong>la</strong> diferencia entre dos c<strong>la</strong>ses,<br />

es decir, puede indicar cuanto más significa una categoría que otra. Para ello es necesario que se<br />

defina una unidad de medida y un origen (0), que es por su naturaleza arbitrario o re<strong>la</strong>tivo y no<br />

predeterminado. A modo de ejemplo, dos niños, Pedro y Juan, deciden determinar cuántos centímetros<br />

es uno más alto que el otro. Uno de ellos consigue una reg<strong>la</strong> graduada de 50 cm; Pedro traza una raya<br />

y hace coincidir con el<strong>la</strong> el cero de <strong>la</strong> reg<strong>la</strong> y anota <strong>la</strong>s distancias 20 cm hasta <strong>la</strong> raya de Juan y 40<br />

hasta <strong>la</strong> raya de Pedro. Establece <strong>la</strong> diferencia 40 – 20 = 20 y dice a Juan “Soy 20 cm más alto que tú”.<br />

Pedro comprende que <strong>la</strong>s medidas anotadas no le autorizan para formar <strong>la</strong> razón 40:20 = 2, y decir<br />

que mide el doble que su amigo Juan.<br />

Otras variables que se miden en <strong>la</strong> esca<strong>la</strong> de intervalo son <strong>la</strong> temperatura y el tiempo.<br />

Esca<strong>la</strong> de razón<br />

El tipo de medida de nivel más elevado es el representado por <strong>la</strong> esca<strong>la</strong> de razones o de cocientes<br />

que tiene todas <strong>la</strong>s propiedades de una esca<strong>la</strong> de intervalo y, además, un origen natural (cero absoluto<br />

(real)). El hecho de fijar el origen (punto cero) permite hacer comparaciones no sólo de los intervalos<br />

entre objetos, sino también de los valores de los números asignados a estos objetos. Es así que en este<br />

tipo de esca<strong>la</strong> tiene sentido <strong>la</strong>s “razones”, y puede decirse, por ejemplo, que “el valor x es el doble que<br />

el de y”<br />

Las cantidades medidas con esca<strong>la</strong>s de razón se pueden comparar estableciendo proporcionalidades.<br />

En nuestro ejemplo anterior, si <strong>la</strong> raya de 0 arbitraria trazada por Pedro está a 80 cm del suelo,<br />

entonces con este 0 real <strong>la</strong>s alturas son: Pedro 80 + 40 = 120 cm de estatura; Juan, 80 + 20 = 100 cm<br />

de estatura; como estas medidas se obtuvieron con esca<strong>la</strong>s de razón, podemos establecer que:<br />

(estatura de Pedro):(estatura de Juan) = 120:100 = 6:5<br />

De donde se desprende que:<br />

Estatura de Juan = 5 6<br />

de <strong>la</strong> estatura de Pedro.<br />

En el apartado anterior hemos incluido el caso del tiempo, ya que no puede medirse con una esca<strong>la</strong> de<br />

razón. En efecto, si consideramos <strong>la</strong>s fechas 2000 DC y 1000 DC, aunque 2000 es el doble que 1000<br />

no quiere decirse que el tiempo desde el origen del hombre sea el doble en un caso que en otro, pues<br />

hasta el año 0 DC han transcurrido un número de años desconocido. Ejemplos de características que<br />

pueden ser medidas a nivel de razón son el cociente intelectual, grado de depresión o puntuación en un<br />

cuestionario.<br />

El peso, <strong>la</strong> longitud y el valor de <strong>la</strong>s cosas o de los ingresos se miden en una esca<strong>la</strong> de razones.<br />

3


El nivel elegido para medir una característica condiciona el resto del análisis estadístico, pues <strong>la</strong>s<br />

técnicas utilizadas deben tener en cuenta <strong>la</strong> esca<strong>la</strong> que se ha empleado. En general cuanto mayor sea<br />

el nivel utilizado, mayor número de técnicas podrán aplicarse y mayor precisión se logrará, por lo que se<br />

recomienda usar <strong>la</strong> esca<strong>la</strong> de intervalo o <strong>la</strong> de razón siempre que sea posible.<br />

El uso de <strong>la</strong> estadística se ve limitado por el tipo de medidas que usamos. Por ejemplo, <strong>la</strong>s de razón y<br />

de intervalo utilizan los modelos más poderosos, l<strong>la</strong>mados paramétricos, que emplean <strong>la</strong> teoría de <strong>la</strong><br />

curva normal de distribución. Este modelo nos permite llegar a conclusiones más validas y precisas.<br />

Existen otros modelos que se aplican a los casos de <strong>la</strong>s medidas ordinales y nominales y se les<br />

denomina no paramétricos. Hay modelos que usan <strong>la</strong>s propiedades de orden como Kolmogorov-<br />

Smirnov o <strong>la</strong> U de Mann-Whitney y otras como <strong>la</strong> χ (ji) cuadrada, que se utilizan para analizar términos<br />

de <strong>la</strong> probabilidad de c<strong>la</strong>ses de eventos. Estos modelos se verán más ade<strong>la</strong>nte con más detalle: lo<br />

importante es percatarse que el tipo de medida que usamos determinan el tipo de estadística.<br />

4


Tarea de Esca<strong>la</strong>s de medición.<br />

1. ¿Qué tipo de esca<strong>la</strong> se utilizó en cada una de <strong>la</strong>s siguientes respuestas?<br />

a) 45 Kg. c) piso 16 e) calle 14 g) 30 alumnos del curso 5.<br />

b) modelo 03 d) código 302-425 f) 432 alumnos<br />

2. Hemos realizado una encuesta a un grupo de alumnos. C<strong>la</strong>sifica <strong>la</strong>s siguientes características,<br />

según su esca<strong>la</strong> de medida y tipo de variable:<br />

a) Peso<br />

b) religión<br />

c) número de hermanos<br />

d) orden de nacimiento respecto a sus hermanos<br />

e) tiempo que tarda en completar <strong>la</strong> encuesta<br />

f) deporte preferido.<br />

3. Se contó el total de estudiantes y se encontró 130 alumnos y 164 alumnas. ¿Qué esca<strong>la</strong> se utilizó?<br />

4. Se analizó una muestra de trigo y el resultado fue: híbrido 30%, centeno 10%, corriente 60%. ¿Qué<br />

esca<strong>la</strong> se utilizó?<br />

5. En el ejemplo anterior explique qué miden los porcentajes.<br />

6. En una carrera de caballos, Pimienta llegó primero, Sal segundo y Ron, tercero. ¿Puede usted<br />

encontrar <strong>la</strong> distancia entre los caballos? Justifique su respuesta.<br />

7. ¿Por qué no podemos decir que una temperatura de 100 grados Fahrenheit indica doble<br />

calor que una temperatura de 50 grados Fahrenheit?<br />

8. a) Agrupamos a los niños de <strong>la</strong> c<strong>la</strong>se en altos, medianos y bajos. ¿Qué tipo de esca<strong>la</strong> de medida<br />

usamos?<br />

b) ¿Y si los ordenamos por estatura?<br />

9. ¿Cuál es <strong>la</strong> esca<strong>la</strong> de medida de cada una de <strong>la</strong>s variables de los proyectos:<br />

a) Diferencias demográficas(Tasa de natalidad, Tasa de mortalidad, Mortalidad infantil,<br />

Producto Nacional Bruto per cápita en dó<strong>la</strong>res (USA), C<strong>la</strong>sificación de países en función de <strong>la</strong><br />

zona geográfica, situación económica) en países desarrol<strong>la</strong>dos y en vías de desarrollo<br />

b) Actitudes hacia <strong>la</strong> estadística (Uso a menudo <strong>la</strong> información estadística para formar mis<br />

opiniones o tomar decisiones, Es necesario conocer algo de estadística para ser un consumidor<br />

inteligente, debes ser bueno en matemáticas para comprender los conceptos básicos de<br />

estadística, …) utilizando <strong>la</strong> esca<strong>la</strong> 1: Fuertemente en desacuerdo, 2: No estoy de acuerdo, 3:<br />

Indiferente, 4: De acuerdo, 5: Fuertemente de acuerdo?<br />

5


Soluciones:<br />

1. a) De razón. c) Ordinal e) Nominal g) De razón<br />

b) Nominal d) De razón f) Nominal<br />

2. a) De razón. c) Nominal e) De intervalo o de razón<br />

b) Nominal d) Ordinal f) Ordinal<br />

3. De razón.<br />

4. De razón.<br />

5. Son comparaciones de proporcionalidad.<br />

6. No, por ser <strong>la</strong>s variables ordinales.<br />

7.<br />

8. a) Ordinal b) De intervalo o de razón<br />

9. a) Ordinal o de razón b) Ordinal<br />

6


1.4 Parámetros y Estadísticos.<br />

Definiciones:<br />

• Variable aleatoria es <strong>la</strong> variable que surge de un experimento aleatorio, consistente en<br />

considerar todos los posibles valores de una variable en una pob<strong>la</strong>ción. La variable aleatoria<br />

se describe mediante su distribución de probabilidad. Si <strong>la</strong> variable aleatoria es cuantitativa y<br />

continua, viene descrita por su función de densidad.<br />

• La variable estadística surge de un experimento estadístico, consistente en tomar datos de<br />

una variable aleatoria sólo en una muestra de <strong>la</strong> pob<strong>la</strong>ción. Describimos <strong>la</strong> variable estadística<br />

mediante <strong>la</strong> distribución de frecuencias y si es cuantitativa y continua <strong>la</strong> representamos<br />

gráficamente por medio del histograma.<br />

En el tema anterior hemos estudiado <strong>la</strong> distribución normal. Una distribución normal queda<br />

determinada por su media µ , y su desviación típica σ y <strong>la</strong> representamos por N( µ , σ ). La media y<br />

desviación típica de <strong>la</strong> distribución normal determinan completamente <strong>la</strong> función de densidad. Por ello<br />

decimos que <strong>la</strong> media y <strong>la</strong> desviación típica son los parámetros de <strong>la</strong> distribución normal.<br />

Si al realizar un estudio estadístico sospechamos que <strong>la</strong> variable de interés podría ser aproximada<br />

adecuadamente mediante una distribución normal, nuestro interés se centrará en hal<strong>la</strong>r el valor<br />

aproximado de estos parámetros (media y desviación típica), porque conocidos estos valores,<br />

habremos determinado <strong>la</strong> función de densidad de <strong>la</strong> variable y podremos calcu<strong>la</strong>r cualquier probabilidad<br />

re<strong>la</strong>cionada con el<strong>la</strong>.<br />

• L<strong>la</strong>mamos parámetros a <strong>la</strong>s medidas de posición central, dispersión y, en general cualquier<br />

resumen calcu<strong>la</strong>do en <strong>la</strong> variable aleatoria, es decir, en toda <strong>la</strong> pob<strong>la</strong>ción.<br />

• L<strong>la</strong>mamos estadísticos a <strong>la</strong>s mismas medidas cuando se refieren a <strong>la</strong> variable estadística, es decir,<br />

cuando se calcu<strong>la</strong>n sólo a partir de una muestra tomada de <strong>la</strong> pob<strong>la</strong>ción.<br />

Ejemplo 6.2. Una cadena de televisión quiere estudiar los índices de audiencia de uno de sus<br />

programas, medido por <strong>la</strong> proporción de personas que ven el programa una determinada semana.<br />

Para ello diseñan un proceso de muestreo y eligen 1000 familias en forma que <strong>la</strong> muestra sea<br />

representativa de <strong>la</strong> pob<strong>la</strong>ción.<br />

En cada familia recogerán datos del número de personas de <strong>la</strong> familia que vio el programa esa<br />

semana y el total de personas que componen <strong>la</strong> familia:<br />

• La proporción de personas que vio el programa esa semana en todo el país es un parámetro. Es un<br />

valor constante, pero no lo conocemos.<br />

• La proporción de personas que vio el programa en <strong>la</strong> muestra es un estadístico.<br />

Supongamos que se obtuvo una proporción del 15% de audiencia en <strong>la</strong> muestra. En otra<br />

muestra de personas esta proporción podría variar, aunque si <strong>la</strong>s muestras están bien<br />

elegidas esperamos que los valores se acerquen a <strong>la</strong> proporción (parámetro) en <strong>la</strong> pob<strong>la</strong>ción.<br />

7


Nota: En los temas siguientes se utilizará los términos parámetro y estadístico. El término<br />

parámetro se usará para referirse a <strong>la</strong>s medidas de tendencia central y de variabilidad de una pob<strong>la</strong>ción,<br />

por lo cual, µ , σ 2 y σ son parámetros. El término estadístico se usará para referirse a <strong>la</strong>s medidas de<br />

tendencia central y de variabilidad de <strong>la</strong> muestra, por lo cual, x , S 2 y S son estadísticos.<br />

Parámetro y Estadístico<br />

Un parámetro es un número representativo que se obtiene a partir de los datos de una pob<strong>la</strong>ción.<br />

Un estadístico es un número representativo que se obtiene a partir de los datos de una muestra.<br />

Los parámetros o estadísticos sirven para sintetizar <strong>la</strong> información del conjunto de datos en<br />

cuestión, al igual como lo haría una tab<strong>la</strong> de distribución o una gráfica.<br />

Hay tres tipos parámetros o estadísticos:<br />

• De centralización.<br />

• De posición.<br />

• De dispersión.<br />

Medidas de centralización<br />

Nos indican en torno a qué valor (centro) se distribuyen los datos.<br />

La medidas de centralización más comunes son:<br />

• Media aritmética: valor promedio de <strong>la</strong> distribución.<br />

• Mediana: puntación de <strong>la</strong> esca<strong>la</strong> que separa <strong>la</strong> mitad superior de <strong>la</strong> distribución y <strong>la</strong> inferior, es decir<br />

divide <strong>la</strong> serie de datos en dos partes iguales.<br />

• Moda: valor que más se repite en una distribución.<br />

Medidas de posición<br />

Las medidas de posición dividen un conjunto de datos en grupos con el mismo número o<br />

porcentaje de individuos.<br />

Para calcu<strong>la</strong>r <strong>la</strong>s medidas de posición es necesario que los datos estén ordenados de menor a mayor.<br />

La medidas de posición son:<br />

• Cuartiles: dividen <strong>la</strong> serie de datos en cuatro partes iguales.<br />

• Deciles: dividen <strong>la</strong> serie de datos en diez partes iguales.<br />

• Percentiles: dividen <strong>la</strong> serie de datos en cien partes iguales.<br />

8


Medidas de dispersión<br />

Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de <strong>la</strong><br />

distribución.<br />

Las medidas de dispersión son:<br />

• Rango o recorrido<br />

El rango es <strong>la</strong> diferencia entre el mayor y el menor de los datos de una distribución estadística.<br />

• Desviación media<br />

La desviación media es <strong>la</strong> media aritmética de los valores absolutos de <strong>la</strong>s desviaciones respecto<br />

a <strong>la</strong> media.<br />

• Varianza<br />

La varianza es <strong>la</strong> media aritmética del cuadrado de <strong>la</strong>s desviaciones respecto a <strong>la</strong> media.<br />

• Desviación típica<br />

La desviación típica es <strong>la</strong> raíz cuadrada de <strong>la</strong> varianza.<br />

Tarea de Estadístico y Parámetro.<br />

En los siguientes enunciados identifica si los valores mencionados se refieren a un parámetro o a un<br />

estadístico y <strong>la</strong> pob<strong>la</strong>ción de interés a <strong>la</strong> que se refiere:<br />

a) La proporción de todos los estudiantes de <strong>la</strong> facultad que han viajado al extranjero;<br />

b) La proporción de estudiantes que han viajado al extranjero entre 100 estudiantes de <strong>la</strong> Universidad<br />

elegidos al azar;<br />

c) La proporción de los mexicanos que votaron por el PAN en <strong>la</strong>s últimas elecciones;<br />

d) La proporción de "águi<strong>la</strong>s" en 100 <strong>la</strong>nzamientos de una moneda;<br />

e) El peso medio de 20 bolsas de papas fritas de una cierta marca;<br />

f) La proporción de personas que dec<strong>la</strong>raron votar por el PAN en una encuesta realizada después de<br />

<strong>la</strong>s elecciones;<br />

g) El peso medio de <strong>la</strong>s personas mexicanas de 18 años;<br />

h) El peso medio de 10 personas mexicanas.<br />

9


1.5 Pob<strong>la</strong>ción y muestra.<br />

En los temas anteriores hemos estudiado, por un <strong>la</strong>do, <strong>la</strong> <strong>Estadística</strong> Descriptiva, cuyo objeto<br />

es describir los datos obtenidos en observaciones u experimentos. Estos datos son usualmente<br />

representados por una o varias variables estadísticas, cuya distribución de frecuencias y demás<br />

características son obtenidas a partir de los datos, que en <strong>la</strong> mayor parte de los casos<br />

constituyen una muestra particu<strong>la</strong>r de <strong>la</strong> pob<strong>la</strong>ción. Por otro <strong>la</strong>do, mediante el Cálculo de<br />

Probabilidades, introducimos el concepto de variable aleatoria, al considerar que aumentamos<br />

indefinidamente <strong>la</strong>s observaciones y representar todos los posibles valores que puede tomar un<br />

carácter en una pob<strong>la</strong>ción, o todos los posibles valores que pueden surgir como consecuencia de <strong>la</strong><br />

realización de un cierto experimento.<br />

10


1.6 Diferentes tipos de muestreo aleatorio y no aleatorio.<br />

Hay muchas formas diferentes de elegir <strong>la</strong>s muestras. Por ejemplo, si queremos hacer un<br />

estudio de los alumnos de <strong>la</strong> Facultad de Ciencias de <strong>la</strong> Educación, podríamos formar una<br />

muestra con alumnos voluntarios. Sin embargo, si queremos que nuestros resultados sean<br />

generalizables, hay que p<strong>la</strong>nificar <strong>la</strong> elección de <strong>la</strong> muestra, siguiendo unos requisitos, que aseguren<br />

que <strong>la</strong> muestra ha sido elegida aleatoriamente de <strong>la</strong> pob<strong>la</strong>ción. Los métodos de inferencia<br />

estadística están basados en <strong>la</strong> utilización de unos métodos de muestreo probabilístico. El<br />

muestreo se dice probabilístico cuando puede calcu<strong>la</strong>rse de antemano <strong>la</strong> probabilidad de obtener<br />

cada una de <strong>la</strong>s muestras que sea posible seleccionar. Para ello, es necesario que el proceso de<br />

selección pueda considerarse como un experimento aleatorio. Algunos tipos de muestreo<br />

probabilístico son:<br />

• Muestreo aleatorio simple: Cuando los elementos de <strong>la</strong> muestra se eligen al azar de <strong>la</strong> pob<strong>la</strong>ción<br />

y cada elemento tiene <strong>la</strong> misma probabilidad de ser elegido. Puede realizarse con<br />

reemp<strong>la</strong>zamiento (una vez elegido un elemento para formar parte de <strong>la</strong> muestra se puede<br />

volver a elegir de nuevo) o sin reemp<strong>la</strong>zamiento.<br />

• Muestreo estratificado: Primero dividimos <strong>la</strong> pob<strong>la</strong>ción en grupos de individuos homogéneos,<br />

l<strong>la</strong>mados estratos. De cada estrato se toma una muestra aleatoria. El tamaño de <strong>la</strong><br />

muestra global se divide proporcionalmente al tamaño de cada estrato.<br />

• Muestreo sistemático: Se supone que los elementos de <strong>la</strong> pob<strong>la</strong>ción están ordenados. Si<br />

queremos tomar en <strong>la</strong> muestra uno de cada n elementos de <strong>la</strong> pob<strong>la</strong>ción, elegimos al azar un<br />

elemento entre los n primeros. A continuación sistemáticamente elegimos uno de cada n elementos.<br />

• Muestreo por conglomerados: Se divide <strong>la</strong> pob<strong>la</strong>ción en unidades representativas de<br />

<strong>la</strong> misma (y por tanto heterogéneas) y se extrae aleatoriamente un grupo de éstas sobre<br />

<strong>la</strong>s cuales se efectúa <strong>la</strong> medición. Por ejemplo, para realizar una encuesta sobre presupuestos<br />

familiares, <strong>la</strong> ciudad puede dividirse en manzanas de viviendas, y se toman al azar, varias de estas<br />

manzanas en <strong>la</strong>s cuales se efectúa <strong>la</strong> encuesta a todos los vecinos de <strong>la</strong> misma.<br />

• Puede realizarse un muestreo en dos o más etapas, cuando cada una de <strong>la</strong>s unidades tomadas<br />

para el muestreo puede a su vez ser muestreada. En el ejemplo anterior, una vez elegida<br />

una manzana de viviendas para formar parte en <strong>la</strong> muestra, se sortea entre todas <strong>la</strong>s viviendas<br />

que <strong>la</strong> componen para decidir cuales serán encuestadas.<br />

• También puede realizarse un muestreo opinático o intencional. En este caso, <strong>la</strong> persona que<br />

selecciona <strong>la</strong> muestra es <strong>la</strong> que decide los elementos que <strong>la</strong> constituirán, procurando que<br />

ésta sea representativa de <strong>la</strong> pob<strong>la</strong>ción. Sin embargo, <strong>la</strong> representatividad real dependerá de <strong>la</strong>s<br />

preferencias u opinión de esta persona y, por tanto, este tipo de muestreo carece de base<br />

teórica suficiente.<br />

• Por último, en el muestreo sin norma, se toma <strong>la</strong> muestra de cualquier manera y se obtiene<br />

así una parte de <strong>la</strong> pob<strong>la</strong>ción. Si esta es homogénea, <strong>la</strong> representatividad de <strong>la</strong> muestra puede ser<br />

satisfactoria. Este tipo de muestreo se emplea a menudo en <strong>la</strong> vida diaria (así, se prueba un trozo de<br />

queso o un sorbo de vino, etc, y se juzga el resto por el resultado).<br />

11


1.7 Determinación del tamaño de <strong>la</strong> muestra (Pendiente).<br />

II.<br />

Variabilidad Muestral.<br />

2.0.1 Muestreo con o sin reemp<strong>la</strong>zo de una pob<strong>la</strong>ción finita.<br />

El hecho de regresar o no un elemento muestreado a <strong>la</strong> pob<strong>la</strong>ción antes de extraer otro elemento<br />

de esa misma pob<strong>la</strong>ción determina si el muestreo es con o sin reemp<strong>la</strong>zo. El muestreo es con<br />

reemp<strong>la</strong>zo si en una extracción el elemento extraído sigue participando en otra u otras extracciones<br />

posteriores; el muestreo es sin reemp<strong>la</strong>zo si el elemento extraído ya no participa en otra u otras<br />

extracciones posteriores. Si <strong>la</strong> pob<strong>la</strong>ción es muy grande, al extraer varios elementos, uno por uno, el<br />

tipo de muestreo es irrelevante. De hecho, al reemp<strong>la</strong>zar el primer elemento antes de extraer el<br />

segundo, <strong>la</strong>s observaciones en <strong>la</strong> primera y en <strong>la</strong> segunda extracción serían totalmente independientes.<br />

No obstante, si no se reemp<strong>la</strong>za el primer elemento, el segundo resultado de <strong>la</strong> extracción afectará<br />

ligeramente <strong>la</strong> segunda extracción. En pob<strong>la</strong>ciones pequeñas el efecto si es relevante.<br />

El desarrollo matemático es más sencillo si <strong>la</strong>s observaciones son independientes. A lo <strong>la</strong>rgo del<br />

muestreo se va a suponer el muestreo aleatorio con reemp<strong>la</strong>zo, el cual también suele l<strong>la</strong>mársele<br />

muestreo aleatorio simple.<br />

Nota:<br />

El número de elementos de <strong>la</strong> pob<strong>la</strong>ción, l<strong>la</strong>mado tamaño de <strong>la</strong> pob<strong>la</strong>ción, lo representaremos con <strong>la</strong><br />

letra N.<br />

El número de elementos de <strong>la</strong> muestra, l<strong>la</strong>mado tamaño de <strong>la</strong> muestra, lo representaremos con <strong>la</strong> letra<br />

n.<br />

El cálculo del número de muestras posibles de tamaño n, extraídas de una pob<strong>la</strong>ción de tamaño N,<br />

cuando el muestreo es con reemp<strong>la</strong>zo, se determina mediante <strong>la</strong> siguiente expresión:<br />

n<br />

N<br />

Por otro <strong>la</strong>do, cuando el muestreo es sin reemp<strong>la</strong>zo, el número de muestras posibles que se pueden<br />

obtener es:<br />

⎛ N⎞<br />

⎜ ⎟ =<br />

⎝ n ⎠<br />

N !<br />

n! ( N − n)!<br />

12


Ejemplo:<br />

Consideremos una pob<strong>la</strong>ción que consta de 30 elementos. Si de esta pob<strong>la</strong>ción se desean obtener<br />

muestras de tamaño 5, ¿cuántas muestras distintas hay, si el muestreo se hace:<br />

a) con reemp<strong>la</strong>zo? b) sin reemp<strong>la</strong>zo?<br />

Solución:<br />

13


2.0.2 Estimación puntual.<br />

La estimación es el proceso que permite inferir sobre los posibles valores de los parámetros que<br />

describen <strong>la</strong> pob<strong>la</strong>ción.<br />

Es muy probable que los valores de los parámetros que representan a una pob<strong>la</strong>ción, sean<br />

desconocidos. En estos casos se recurre a <strong>la</strong> información proporcionada en <strong>la</strong> muestra para contar con<br />

una idea de los valores de los parámetros. Si se logra determinar un descriptor numérico para <strong>la</strong><br />

muestra, este estadístico, l<strong>la</strong>mado estimación puntual, se puede usar para estimar <strong>la</strong> media<br />

correspondiente a <strong>la</strong> pob<strong>la</strong>ción.<br />

Ejemplo.<br />

Consideremos el siguiente conjunto de datos, correspondientes a una pob<strong>la</strong>ción:<br />

a) Determinar <strong>la</strong> media y <strong>la</strong> desviación estándar de este conjunto.<br />

b) Determinar una muestra aleatoria de tamaño 4 y calcu<strong>la</strong>r su media y su desviación estándar.<br />

c) ¿Cuáles son los estimadores puntuales de µ y σ ? ¿Qué tan buenos son estos estimadores?<br />

Solución:<br />

2 4 5 7 10 11 15 16 18 20<br />

a) Con nuestra calcu<strong>la</strong>dora, obtenemos que:<br />

µ = 10.8, σ ≈ 5.946<br />

b) Para esto, utilizaremos el software “del libro P y E”, siguiendo <strong>la</strong> siguiente secuencia:<br />

1. Asignar un número a cada elemento de <strong>la</strong> muestra<br />

Etiqueta Asignada 1 2 3 4 5 6 7 8 9 10<br />

Datos de <strong>la</strong> pob<strong>la</strong>ción 2 4 5 7 10 11 15 16 18 20<br />

2. Ejecutar el programa y abrir <strong>la</strong> opción “EXTRAS” del menú inicio.<br />

3. Seleccionar <strong>la</strong> opción “Generador de números” y llenar <strong>la</strong>s siguientes opciones:<br />

• Intervalo: Valor máximo = 11 (un número más que el valor de <strong>la</strong> etiqueta más grande)<br />

Valor mínimo = 1 (correspondientes al valor más pequeño de <strong>la</strong>s etiquetas asignadas).<br />

• Resolución = 1 (para nuestro caso particu<strong>la</strong>r), números de uno o dos dígitos menores a 11.<br />

= 10, números de dos o tres dígitos menores al valor de <strong>la</strong> etiqueta más grande).<br />

etc.<br />

• Número de datos (tamaño de <strong>la</strong> muestra) = 4 (para nuestro ejemplo particu<strong>la</strong>r)<br />

14


• Número de variables = 1 (para nuestro ejemplo particu<strong>la</strong>r)<br />

• Dar clic en <strong>la</strong> opción “generar” y listo. En mi caso se generó <strong>la</strong> muestra (de <strong>la</strong>s etiquetas):<br />

9 8 10 4<br />

Qué corresponden a los valores:<br />

18 16 20 7<br />

La media y <strong>la</strong> desviación estándar de esta muestra son:<br />

x = 15.25, S ≈ 5.737<br />

Donde observamos que existe una discrepancia, por ejemplo, de <strong>la</strong> media real con <strong>la</strong> media de <strong>la</strong><br />

muestra, con un valor de µ − x = 10.8 − 15.25 = − 4.45 = 4.45 .<br />

c) x = 15.25 es un estimador puntual del valor de <strong>la</strong> media pob<strong>la</strong>cional µ .<br />

Simi<strong>la</strong>rmente, S ≈ 5.737 es un estimador puntual del valor de <strong>la</strong> desviación estándar pob<strong>la</strong>cional σ .<br />

Estos estimadores se considerarán como buenos, si <strong>la</strong> discrepancia surgida al comparar el<br />

parámetro con el estadístico es pequeña.<br />

Tarea (de Estimación puntual)<br />

Consideremos el siguiente conjunto de datos, correspondientes a una pob<strong>la</strong>ción:<br />

2 4 5 7 10 11 15 16 18 20<br />

a) Utilice un paquete estadístico para seleccionar aleatoriamente cuatro muestras distintas de tamaño<br />

n = 3. En su reporte copie y pegue <strong>la</strong>s muestras generadas por el paquete.<br />

b) Determinar <strong>la</strong> media de cada una de <strong>la</strong>s muestras obtenidas en el inciso (a).<br />

c) Determine <strong>la</strong> discrepancia existente entre <strong>la</strong> media de cada muestra con respecto a <strong>la</strong> media<br />

pob<strong>la</strong>cional µ .<br />

d) Utilice un paquete estadístico para seleccionar aleatoriamente cuatro muestras distintas de tamaño<br />

n = 5, y hacer lo mismo que en los incisos (b), y (c).<br />

e) ¿Qué diferencias observas en <strong>la</strong>s discrepancias x − µ obtenidas en <strong>la</strong>s distintas muestras de<br />

tamaño n = 3 y n = 5.<br />

15


Solución:<br />

a)<br />

Etiqueta Asignada 1 2 3 4 5 6 7 8 9 10<br />

Datos de <strong>la</strong> pob<strong>la</strong>ción 2 4 5 7 10 11 15 16 18 20<br />

Cuyas muestras respectivas son:<br />

Muestra 1 Muestra 2 Muestra 3 Muestra 4<br />

16 16 11 10<br />

18 15 16 11<br />

5 20 7 7<br />

b)<br />

Muestra 1 Muestra 2 Muestra 3 Muestra 4<br />

x<br />

1<br />

= 13 x<br />

2<br />

= 17 x<br />

3<br />

= 11.333 x<br />

4<br />

= 28<br />

c) Como µ = 10.8 , entonces:<br />

x<br />

1<br />

− µ x<br />

2<br />

− µ x<br />

3<br />

− µ x<br />

4<br />

− µ<br />

2.2 4 0.533 17.2<br />

d)<br />

16


Cuyas muestras respectivas son:<br />

Muestra 1 Muestra 2 Muestra 3 Muestra 4<br />

5 11 7 5<br />

20 10 15 18<br />

7 18 4 7<br />

4 20 16 10<br />

16 10 20 16<br />

Muestra 1 Muestra 2 Muestra 3 Muestra 4<br />

x<br />

1<br />

= 10.4 x<br />

2<br />

= 13.8 x<br />

3<br />

= 12.4 x<br />

4<br />

= 11.2<br />

Como µ = 10.8 , entonces:<br />

x<br />

1<br />

− µ x<br />

2<br />

− µ x<br />

3<br />

− µ x<br />

4<br />

− µ<br />

0.4 3 1.6 0.4<br />

e) Observemos, que en general, <strong>la</strong> discrepancia entre <strong>la</strong> media muestral x y <strong>la</strong> media pob<strong>la</strong>cional µ<br />

es menor cuando <strong>la</strong> muestra es de mayor tamaño. ¿Qué piensas que ocurriría si se aumenta el<br />

tamaño de <strong>la</strong> muestra? ¿Por qué?<br />

17


2.1 Distribuciones muestrales de <strong>la</strong> media.<br />

De acuerdo a lo observado en el ejemplo y tarea anterior, el valor de <strong>la</strong> media muestral x varía de<br />

una muestra a otra. Por lo cual x , además de ser un estimador, es una variable aleatoria. De esta<br />

forma, x cuenta con una media, una desviación estándar y una distribución de probabilidad.<br />

Definición (Distribución muestral de <strong>la</strong> medias)<br />

Una Distribución muestral de medias es una distribución probabilística que consta de una lista de<br />

todas <strong>la</strong>s medias de <strong>la</strong>s posibles muestras extraídas de una pob<strong>la</strong>ción, obtenidas de un muestreo con o<br />

sin reemp<strong>la</strong>zo y de un tamaño especifico, y esta lista acompañada de <strong>la</strong> probabilidad de ocurrencia asociada<br />

con cada media muestral.<br />

En este caso, <strong>la</strong> media de <strong>la</strong>s medias muestrales (media esperada) es ahora <strong>la</strong> media de todos los<br />

posibles valores de x y se denota por:<br />

µ<br />

x<br />

Esta corresponde al parámetro de <strong>la</strong> distribución de x . La desviación estándar es <strong>la</strong> desviación<br />

estándar de los valores de x y se denota por:<br />

σ<br />

x<br />

Esta corresponde al parámetro para <strong>la</strong> desviación estándar de <strong>la</strong> distribución de x .<br />

Para ilustrar el concepto de <strong>la</strong> distribución muestral de medias muestrales, consideremos los<br />

siguientes:<br />

Ejemplo 1.<br />

Consideremos una pob<strong>la</strong>ción de sólo tres valores: x 1 = 1 , x 2 = 2 y x 3 = 3, cuya media y<br />

desviación estándar pob<strong>la</strong>cional son µ = 2 y σ ≈ 0.8165 .<br />

a) Obtener todas <strong>la</strong>s posibles muestras de tamaño 2, con reposición, que se pueden extraer a partir de<br />

<strong>la</strong> pob<strong>la</strong>ción dada:<br />

b) Hacer <strong>la</strong> gráfica de <strong>la</strong> distribución de medias muestrales e indique lo que observa.<br />

c) Calcu<strong>la</strong>r µ<br />

x<br />

, σ<br />

x<br />

e indique lo que observe.<br />

18


Solución:<br />

a) El número de todas <strong>la</strong>s muestras posibles de tamaño 2, con reposición, que se pueden extraer de<br />

dicha pob<strong>la</strong>ción son 3 2 = 9, y explícitamente estas son <strong>la</strong>s siguientes:<br />

muestra x<br />

de cada<br />

muestra<br />

m 1 = 1, 1 1.0<br />

m 2 = 1, 2 1.5<br />

m 3 = 1, 3 2.0<br />

m 4 = 2, 1 1.5<br />

m 5 = 2, 2 2.0<br />

m 6 = 2, 3 2.5<br />

m 7 = 3, 1 2.0<br />

m 8 = 3, 2 2.5<br />

m 9 = 3, 3 3.0<br />

Σ = 18<br />

La distribución muestral de medias para este ejemplo es:<br />

x f ( x )<br />

1.0 1 / 9<br />

1.5 2 / 9<br />

2.0 3 / 9<br />

2.5 2 / 9<br />

3.0 1 / 9<br />

Σ = 1.0<br />

Observemos que <strong>la</strong> mayoría de los valores de <strong>la</strong>s medias muéstrales individuales difiere del valor de <strong>la</strong> media<br />

pob<strong>la</strong>cional. En general se puede afirmar que sin importar de <strong>la</strong> pob<strong>la</strong>ción que se tenga, <strong>la</strong>s medias muestrales<br />

tenderán a estar cerca de <strong>la</strong> media pob<strong>la</strong>cional y rara vez tendrán el mismo valor.<br />

b)<br />

f ( x )<br />

3/9<br />

2/9<br />

x<br />

Observemos que <strong>la</strong> gráfica es simétrica, con distribución normal.<br />

c) µ<br />

x<br />

= 2 y σ<br />

x<br />

≈ 0.57735<br />

Con lo cual observamos que <strong>la</strong> media de medias muestrales es igual al valor de <strong>la</strong> media<br />

pob<strong>la</strong>cional: µ = µ<br />

x<br />

Lo cual no ocurre con <strong>la</strong> desviación estándar de medias muestrales:<br />

σ<br />

x<br />

≠ σ .<br />

19


Ejemplo 2 (Tarea).<br />

Repetir el ejemplo (1), para el caso en que <strong>la</strong> muestra sea sin reposición.<br />

Solución:<br />

Todas <strong>la</strong>s posibles muestras de tamaño 2, son:<br />

1, 2 ; 1, 3 y 2, 3<br />

Y <strong>la</strong> distribución de probabilidad de <strong>la</strong>s medias muestrales es:<br />

muestra x f ( x)<br />

m 1 = 1, 2 1.5 1/3<br />

m 2 = 1, 3 2.0 1/3<br />

m 3 = 2, 3 2.5 1/3<br />

Esta distribución también es simétrica.<br />

Además, µ<br />

x<br />

= 2 y σ<br />

x<br />

≈ 0.40825<br />

Con lo cual observamos nuevamente que <strong>la</strong> media de medias muestrales es igual al valor de <strong>la</strong><br />

media pob<strong>la</strong>cional: µ = µ<br />

x<br />

Lo cual no ocurre con <strong>la</strong> desviación estándar de medias muestrales:<br />

σ<br />

x<br />

≠ σ .<br />

20


2.2 Error Estándar de una distribución muestral.<br />

Concepto de error estándar.<br />

En vez de usar “<strong>la</strong> desviación estándar de <strong>la</strong> distribución de <strong>la</strong>s medias muéstrales” para describir una<br />

distribución de <strong>la</strong>s medias muéstrales, los estadísticos hab<strong>la</strong>n del error estándar de <strong>la</strong> media.<br />

error estándar de <strong>la</strong> media =<br />

σ<br />

x<br />

La desviación estándar de <strong>la</strong> distribución de <strong>la</strong>s medias muéstrales mide el grado en que esperamos<br />

que <strong>la</strong>s medias de <strong>la</strong>s diferentes muestras varíen por este error accidental en el proceso de muestreo.<br />

Por consiguiente, <strong>la</strong> desviación estándar de <strong>la</strong> distribución de un estadístico muestral recibe el<br />

nombre de error estándar del estadístico.<br />

El error estándar indica no sólo el tamaño del error accidental que se ha cometido, sino además <strong>la</strong><br />

exactitud que seguramente alcanzaremos si usamos un estadístico muestral para estimar un parámetro<br />

de <strong>la</strong> pob<strong>la</strong>ción. Una distribución de medias muéstrales que está menos dispersa (o sea que tiene un<br />

error estándar pequeño) resulta ser un mejor estimador de <strong>la</strong> media de <strong>la</strong> pob<strong>la</strong>ción que una distribución<br />

de medias muéstrales que tenga una gran dispersión y un gran error estándar.<br />

Como hicimos notar anteriormente, sin importar si el muestreo es con o sin reemp<strong>la</strong>zo,<br />

Mediante métodos matemáticos, se puede demostrar que <strong>la</strong> re<strong>la</strong>ción que guardan <strong>la</strong> desviación estándar<br />

de <strong>la</strong> pob<strong>la</strong>ción y el error estándar, cuando el muestreo es con reemp<strong>la</strong>zo, es <strong>la</strong> siguiente:<br />

σ<br />

x<br />

≠ σ .<br />

σ =<br />

x<br />

σ<br />

n<br />

En <strong>la</strong> expresión anterior se observa que el error estándar disminuye en <strong>la</strong> medida en que el tamaño de<br />

<strong>la</strong> muestra crece.<br />

En el ejemplo (1) anterior, el error estándar de <strong>la</strong> distribución de medias muestrales es:<br />

σ 0.8165<br />

σ<br />

x<br />

= = = 0.57735<br />

n 2<br />

el cual coincide con el valor calcu<strong>la</strong>do directamente con <strong>la</strong> calcu<strong>la</strong>dora, a partir de <strong>la</strong> pob<strong>la</strong>ción de <strong>la</strong>s<br />

medias muestrales.<br />

21


Ejemplo<br />

Supongamos que en determinada pob<strong>la</strong>ción se ha seleccionado una muestra de tamaño n = 10 con<br />

σ<br />

x<br />

= 9 . ¿Cuántas observaciones más necesitamos para reducir el valor de σ<br />

x<br />

a:<br />

a) 4.5 b) 3 c) 1<br />

Solución:<br />

Tomando en cuenta que<br />

σ<br />

σ<br />

x<br />

= , despejando σ , obtenemos:<br />

n<br />

σ = σ x<br />

⋅ n = 9⋅ 10 ≈ 28.46<br />

Por otro <strong>la</strong>do, despejando n de <strong>la</strong> fórmu<strong>la</strong> del error estándar, obtenemos:<br />

2<br />

σ<br />

n =<br />

σ<br />

2<br />

x<br />

a) si σ<br />

x<br />

= 4.5,<br />

( 28.46)<br />

2<br />

( 4.5)<br />

n = ≈ 40<br />

2<br />

Por lo tanto, para reducir σ<br />

x<br />

de 9 a 4.5, el tamaño inicial de <strong>la</strong> muestra se debe aumentar en 30<br />

unidades.<br />

b) si σ<br />

x<br />

= 3,<br />

( 28.46)<br />

2<br />

( 3)<br />

n = ≈ 90<br />

2<br />

Por lo tanto, para reducir σ<br />

x<br />

de 9 a 3, el tamaño inicial de <strong>la</strong> muestra se debe aumentar en 80<br />

unidades.<br />

c) si σ<br />

x<br />

= 1,<br />

( 28.46)<br />

2<br />

( 1)<br />

n = ≈ 810<br />

2<br />

Por lo tanto, para reducir<br />

unidades.<br />

σ<br />

x<br />

de 9 a 4.5, el tamaño inicial de <strong>la</strong> muestra se debe aumentar en 800<br />

Nota:<br />

En lo sucesivo, diremos que una muestra es una muestra pequeña si el tamaño de esta es menor que<br />

30:<br />

n < 30<br />

Por otro <strong>la</strong>do, diremos que una muestra es una muestra grande si el tamaño de esta es mayor o igual<br />

que 30:<br />

n ≥ 30 .<br />

22


2.3 El Teorema del Límite Central.<br />

Los resultados vistos anteriormente, respecto a una distribución de medias muestrales, se encuentran<br />

resumidos en el siguiente teorema:<br />

Teorema (del Límite central)<br />

Consideremos una pob<strong>la</strong>ción de datos, con media µ y desviación estándar σ. Si de esta pob<strong>la</strong>ción<br />

se extraen todas <strong>la</strong>s diferentes muestras de tamaño n , entonces <strong>la</strong> distribución muestral de medias:<br />

1. Tendrá una media esperada µ x = µ sin importar el tipo de muestreo ni el tipo de pob<strong>la</strong>ción que<br />

se esté trabajando.<br />

2. Tendrá un error estándar (desviación estándar) expresado por medio de <strong>la</strong> fórmu<strong>la</strong>:<br />

σ<br />

a) σ x = si el muestreo se hace con reemp<strong>la</strong>zo.<br />

n<br />

b) σ<br />

x<br />

σ N − n<br />

= •<br />

si el muestreo se hace sin reemp<strong>la</strong>zo. En este caso, el factor<br />

n N −1<br />

l<strong>la</strong>ma factor de corrección para pob<strong>la</strong>ción finita.<br />

N − n<br />

N −1<br />

se<br />

3. a) Tendrá una distribución Normal, siempre y cuando <strong>la</strong> pob<strong>la</strong>ción original de datos tenga una<br />

distribución Normal.<br />

b) Tendrá una distribución aproximadamente Normal, siempre y cuando <strong>la</strong>s muestras<br />

seleccionadas sean de tamaño mayor o igual a 30 para el caso en que <strong>la</strong> pob<strong>la</strong>ción original de<br />

datos no tenga una distribución Normal.<br />

Nota :<br />

a) Cuando en los problemas no sea c<strong>la</strong>ro que tipo de fórmu<strong>la</strong> se debe utilizar para determinar el valor<br />

de σ x , se puede utilizar el siguiente criterio:<br />

Si<br />

n<br />

N < 0. 05 , entonces utilizar σ σ<br />

x = . En caso contrario, utilizar σ x =<br />

n<br />

σ N − n<br />

•<br />

n N −1 .<br />

b) Si no se hace especifico que el muestreo es sin reposición, entonces para determinar el valor del<br />

σ<br />

error estándar, utilizar <strong>la</strong> fórmu<strong>la</strong> σ x = .<br />

n<br />

23


2.4 Aplicaciones del Teorema del Límite Central.<br />

1. Supóngase que de 6 estudiantes (elementos de toda una pob<strong>la</strong>ción), el primer estudiante tiene $1,<br />

el segundo $2 y así sucesivamente hasta el sexto estudiante que tiene $6.<br />

a) Calcu<strong>la</strong>r <strong>la</strong> media y <strong>la</strong> desviación estándar de <strong>la</strong> pob<strong>la</strong>ción.<br />

b) Si se consideran todas <strong>la</strong>s muestras posibles (sin reposición) de tamaño 2 extraídas a partir de<br />

<strong>la</strong> pob<strong>la</strong>ción dada, calcu<strong>la</strong>r el valor de µ x y de σ x .<br />

Solución:<br />

2. La media aritmética de <strong>la</strong>s estaturas de 42 000 estudiantes de secundaria de una ciudad es de 1.58<br />

m y <strong>la</strong> desviación estándar es de 0.08 m. Si se toman 50 muestras de 40 alumnos en cada muestra,<br />

ha<strong>la</strong>r <strong>la</strong> media esperada de <strong>la</strong> distribución muestral y su error estándar.<br />

Solución:<br />

Por hipótesis, N = 42 000, n = 40, µ = 1.58, σ = 0.08 .<br />

Por lo tanto, µ = µ = 1.58 .<br />

x<br />

σ 0.08<br />

σ x = = ≈ 0.01265 .<br />

n 40<br />

24


III.<br />

Estimación.<br />

3.1 Estimación por intervalo.<br />

25

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!