I. Introducción a la Inferencia Estadística.

ESTADÍSTICA APLICADA 

I. Introducción a la Inferencia Estadística. 

1.1 Importancia de la inferencia estadística en las ciencias sociales. 

La importancia que la estadística ha alcanzado en nuestros días, tanto como cultura básica, como en 

el trabajo profesional y en la investigación, es innegable. Ello es debido a la abundancia de información 

con la que el ciudadano debe enfrentarse en su trabajo diario. La mayor parte de las veces estas 

informaciones vienen expresadas en forma de tablas o gráficos estadísticos, por lo que un conocimiento 

básico de esta ciencia es necesario para la correcta interpretación de los mismos. 

Así, es frecuente hablar de estadísticas de empleo, de emigración, de producción, de mortalidad, etc. 

El hombre no vive aislado: vivimos en sociedad; la familia, la escuela, el trabajo, el ocio están llenos 

de situaciones en las que predomina la incertidumbre: El número de hijos de la familia, la edad de los 

padres al contraer matrimonio, el tipo de trabajo, las creencias o aficiones de los miembros varían de 

una familia a otra. 

En la escuela, ¿podemos prever las preguntas del próximo examen?; ¿quién ganará el próximo 

partido? Para desplazarnos de casa a la escuela, o para ir de vacaciones, dependemos del transporte 

público que puede sufrir retrasos. ¿Cuantos viajeros usarán el autobús? ¿Cuantos clientes habrá en la 

caja del supermercado el viernes a las 7 de la tarde? 

En nuestros ratos de ocio practicamos juegos de azar tales como quinielas o loterías. Acudimos a 

encuentros deportivos cuyos resultados son inciertos y en los que tendremos que hacer cola para 

conseguir las entradas. 

Cuando hacemos una póliza de seguros no sabemos si la cobraremos o por el contrario perderemos 

el dinero pagado; cuando compramos acciones en bolsa estamos expuestos a la variación en las 

cotizaciones,... 

Información acerca de una o varias variables en una población determinada. 

Aunque a veces es posible estudiar toda la población completa mediante un censo, otras veces es 

preciso contentarse con una muestra de la misma. La idea es obtener información de la población 

estudiando sólo una parte de la misma (la muestra). El proceso de generalizar los resultados obtenidos 

en la muestra a toda la población recibe el nombre de inferencia estadística. Hay dos características 

importantes en las muestras, que son: 

• Variabilidad muestral: No todas las muestras son iguales. Los elementos de distintas muestras 

pueden ser diferentes, y, por tanto, los resultados de una muestra a otra pueden variar. 

• Representatividad: Si elegimos una muestra adecuadamente, puede representar a la población, en 

el sentido de que los resultados en la muestra pueden servir para estimar los resultados en la 

población. 

Los motivos que hacen necesario el uso de estas técnicas pueden ser económicos, ya que es más 

costoso y lleva más tiempo obtener información de toda la población. También puede darse el caso de 

que el experimento que debe realizarse tenga carácter destructivo, como ocurre en algunos ensayos de 

fiabilidad. 

Otras veces la población está constituida por entes potenciales, como es el caso de los ensayos 

médicos en que se consideran los posibles enfermos con una dolencia; o bien se trata de una población 

infinita. Por último, la gran homogeneidad de algunas poblaciones hace innecesario el estudio de la 

totalidad de la misma, como ocurre al efectuar, por ejemplo, un análisis de sangre, con objeto de 

efectuar el recuento de personas con cierta enfermedad. 

1

1.2 Comparación entre estadística descriptiva y estadística inferencial. 

En los temas anteriores hemos estudiado, por un lado, la Estadística Descriptiva, cuyo objeto es 

describir los datos obtenidos de observaciones u experimentos. Estos datos son usualmente 

representados por una o varias variables estadísticas, cuya distribución de frecuencias y demás 

características son obtenidas a partir de los datos, que en la mayor parte de los casos constituyen una 

muestra particular de la población. Por otro lado, mediante el Cálculo de Probabilidades, introducimos el 

concepto de variable aleatoria, al considerar que aumentamos indefinidamente las observaciones y 

representar todos los posibles valores que puede tomar un carácter en una población, o todos los 

posibles valores que pueden surgir como consecuencia de la realización de un cierto experimento. 

Sin embargo, la mayoría de los problemas de interés, implican, bien poblaciones infinitas, o 

poblaciones finitas que son difíciles, costosas o imposibles de inspeccionar. Esto obliga a tener que 

seleccionar, por procedimientos adecuados, un subconjunto de n elementos de la población, que 

constituyen una muestra de tamaño n, examinar la característica que interesa y después generalizar 

estos resultados a la población. Esta generalización a la población se realiza por medio de la parte de la 

estadística que se conoce con el nombre de inferencia estadística. Para que estas conclusiones 

ofrezcan las debidas garantías es preciso comprobar que se cumple el requisito básico de que la 

muestra sea representativa. 

1.3 Variables y escalas de medición. 

Al observar valores o características, desarrollamos un proceso de medición, es decir que 

comparamos las variables y establecemos escalas de valores. 

Como resultado de nuestras medidas sobre individuos o unidades experimentales de la población 

bajo estudio, obtenemos un conjunto de datos, o resultados del experimento estadístico. Para facilitar el 

análisis asignaremos unos valores a cada unidad experimental de acuerdo con ciertas reglas; así, 

podemos asignar el número 0 a los varones y el 1 a las mujeres o viceversa, o bien los símbolos "V" y 

"H". 

TIPOS DE DATOS Y ESCALAS DE MEDIDA 

Pueden observarse muchas características diferentes para un mismo individuo. Estas características, 

dependiendo del tipo de valores que originan, pueden medirse con cuatro tipos distintos de escalas de 

medida: escala nominal, ordinal, de intervalo y de razón. Vamos a analizar las características de cada 

una. 

Escala nominal 

La forma más simple de observación es la clasificación de individuos en clases que simplemente 

pueden distinguirse entre si pero no compararse ni realizar entre ellas operaciones aritméticas. En este 

tipo se incluyen características tales como la profesión, nacionalidad o grupo sanguíneo. Este tipo de 

escala emplea los números solamente como nombres de clases de objetos, este sería el caso de usar 0 

para el sexo femenino y 1 para masculino (o viceversa) o usar números diferentes para las personas 

que escogen distintos tipos de cereal: 1 para los de corn flakes, 2 para choco crispis, 3 para frutlups 

, etc. 

Escala ordinal 

Este tipo de escala asigna los números de acuerdo con la propiedad ordinal del sistema numérico: los 

valores están ordenados de menos a más, pero no hay una idea de igualdad en las distancias entre los 

números. Por ejemplo, en una escala de actitudes podemos asignar números: 1, 2, 3,…, a los valores 

de una actitud. Si decimos: “indique usted el aprecio que tiene por el presidente de la República: 1. 

Ninguna; 2. Poco; 3. Regular, y 4 mucho”, en esta escala no podemos decir que la distancia en aprecio 

entre el que responde 1 y el que responde 2 es igual a la que hay entre 3 y 4, pero si apreciar que 4 es 

mayor que 3 en esa dimensión. 

A veces, las categorías obtenidas pueden ser ordenadas, aunque diferencias numéricas iguales a lo 

largo de la escala numérica utilizada para medir dichas clases no correspondan a incrementos iguales 

2

en la propiedad que se mide. Por ejemplo, puede asignarse un número de orden de nacimiento a un 

grupo de hermanos, sin que la diferencia de edad entre el 1º y el 2º de ellos sea la misma que la del 2º 

al 3º. 

Escala de intervalo 

Este tipo de escala no sólo se usa en el ordenamiento, sino que establece que a distancias iguales 

entre dos puntos en cualquier parte de ellas corresponden siempre a diferencias iguales entre los 

valores que ellas miden. Por ejemplo, las temperaturas tomadas con termómetro nos permiten aseverar 

que la cantidad de incremento de temperatura es igual para distancias iguales en la escala. Por 

ejemplo, un incremento de 5 0 C es igual, ya sea cuando se pasa de 0 a 5 0 C o cuando se pasa de 10 a 

15 0 C. 

Se usa el nombre de “medición por intervalos” porque este tipo de escala se refiere principalmente a 

la distancia entre los objetos, o sea, al “intervalo” existente entre ellos. 

En esta escala se pueden efectuar operaciones aritméticas. 

Esta escala, además de clasificar y ordenar a los individuos, cuantifica la diferencia entre dos clases, 

es decir, puede indicar cuanto más significa una categoría que otra. Para ello es necesario que se 

defina una unidad de medida y un origen (0), que es por su naturaleza arbitrario o relativo y no 

predeterminado. A modo de ejemplo, dos niños, Pedro y Juan, deciden determinar cuántos centímetros 

es uno más alto que el otro. Uno de ellos consigue una regla graduada de 50 cm; Pedro traza una raya 

y hace coincidir con ella el cero de la regla y anota las distancias 20 cm hasta la raya de Juan y 40 

hasta la raya de Pedro. Establece la diferencia 40 – 20 = 20 y dice a Juan “Soy 20 cm más alto que tú”. 

Pedro comprende que las medidas anotadas no le autorizan para formar la razón 40:20 = 2, y decir 

que mide el doble que su amigo Juan. 

Otras variables que se miden en la escala de intervalo son la temperatura y el tiempo. 

Escala de razón 

El tipo de medida de nivel más elevado es el representado por la escala de razones o de cocientes 

que tiene todas las propiedades de una escala de intervalo y, además, un origen natural (cero absoluto 

(real)). El hecho de fijar el origen (punto cero) permite hacer comparaciones no sólo de los intervalos 

entre objetos, sino también de los valores de los números asignados a estos objetos. Es así que en este 

tipo de escala tiene sentido las “razones”, y puede decirse, por ejemplo, que “el valor x es el doble que 

el de y” 

Las cantidades medidas con escalas de razón se pueden comparar estableciendo proporcionalidades. 

En nuestro ejemplo anterior, si la raya de 0 arbitraria trazada por Pedro está a 80 cm del suelo, 

entonces con este 0 real las alturas son: Pedro 80 + 40 = 120 cm de estatura; Juan, 80 + 20 = 100 cm 

de estatura; como estas medidas se obtuvieron con escalas de razón, podemos establecer que: 

(estatura de Pedro):(estatura de Juan) = 120:100 = 6:5 

De donde se desprende que: 

Estatura de Juan = 5 6 

de la estatura de Pedro. 

En el apartado anterior hemos incluido el caso del tiempo, ya que no puede medirse con una escala de 

razón. En efecto, si consideramos las fechas 2000 DC y 1000 DC, aunque 2000 es el doble que 1000 

no quiere decirse que el tiempo desde el origen del hombre sea el doble en un caso que en otro, pues 

hasta el año 0 DC han transcurrido un número de años desconocido. Ejemplos de características que 

pueden ser medidas a nivel de razón son el cociente intelectual, grado de depresión o puntuación en un 

cuestionario. 

El peso, la longitud y el valor de las cosas o de los ingresos se miden en una escala de razones. 

3

El nivel elegido para medir una característica condiciona el resto del análisis estadístico, pues las 

técnicas utilizadas deben tener en cuenta la escala que se ha empleado. En general cuanto mayor sea 

el nivel utilizado, mayor número de técnicas podrán aplicarse y mayor precisión se logrará, por lo que se 

recomienda usar la escala de intervalo o la de razón siempre que sea posible. 

El uso de la estadística se ve limitado por el tipo de medidas que usamos. Por ejemplo, las de razón y 

de intervalo utilizan los modelos más poderosos, llamados paramétricos, que emplean la teoría de la 

curva normal de distribución. Este modelo nos permite llegar a conclusiones más validas y precisas. 

Existen otros modelos que se aplican a los casos de las medidas ordinales y nominales y se les 

denomina no paramétricos. Hay modelos que usan las propiedades de orden como Kolmogorov- 

Smirnov o la U de Mann-Whitney y otras como la χ (ji) cuadrada, que se utilizan para analizar términos 

de la probabilidad de clases de eventos. Estos modelos se verán más adelante con más detalle: lo 

importante es percatarse que el tipo de medida que usamos determinan el tipo de estadística. 

4

Tarea de Escalas de medición. 

1. ¿Qué tipo de escala se utilizó en cada una de las siguientes respuestas? 

a) 45 Kg. c) piso 16 e) calle 14 g) 30 alumnos del curso 5. 

b) modelo 03 d) código 302-425 f) 432 alumnos 

2. Hemos realizado una encuesta a un grupo de alumnos. Clasifica las siguientes características, 

según su escala de medida y tipo de variable: 

a) Peso 

b) religión 

c) número de hermanos 

d) orden de nacimiento respecto a sus hermanos 

e) tiempo que tarda en completar la encuesta 

f) deporte preferido. 

3. Se contó el total de estudiantes y se encontró 130 alumnos y 164 alumnas. ¿Qué escala se utilizó? 

4. Se analizó una muestra de trigo y el resultado fue: híbrido 30%, centeno 10%, corriente 60%. ¿Qué 

escala se utilizó? 

5. En el ejemplo anterior explique qué miden los porcentajes. 

6. En una carrera de caballos, Pimienta llegó primero, Sal segundo y Ron, tercero. ¿Puede usted 

encontrar la distancia entre los caballos? Justifique su respuesta. 

7. ¿Por qué no podemos decir que una temperatura de 100 grados Fahrenheit indica doble 

calor que una temperatura de 50 grados Fahrenheit? 

8. a) Agrupamos a los niños de la clase en altos, medianos y bajos. ¿Qué tipo de escala de medida 

usamos? 

b) ¿Y si los ordenamos por estatura? 

9. ¿Cuál es la escala de medida de cada una de las variables de los proyectos: 

a) Diferencias demográficas(Tasa de natalidad, Tasa de mortalidad, Mortalidad infantil, 

Producto Nacional Bruto per cápita en dólares (USA), Clasificación de países en función de la 

zona geográfica, situación económica) en países desarrollados y en vías de desarrollo 

b) Actitudes hacia la estadística (Uso a menudo la información estadística para formar mis 

opiniones o tomar decisiones, Es necesario conocer algo de estadística para ser un consumidor 

inteligente, debes ser bueno en matemáticas para comprender los conceptos básicos de 

estadística, …) utilizando la escala 1: Fuertemente en desacuerdo, 2: No estoy de acuerdo, 3: 

Indiferente, 4: De acuerdo, 5: Fuertemente de acuerdo? 

5

Soluciones: 

1. a) De razón. c) Ordinal e) Nominal g) De razón 

b) Nominal d) De razón f) Nominal 

2. a) De razón. c) Nominal e) De intervalo o de razón 

b) Nominal d) Ordinal f) Ordinal 

3. De razón. 

4. De razón. 

5. Son comparaciones de proporcionalidad. 

6. No, por ser las variables ordinales. 

7. 

8. a) Ordinal b) De intervalo o de razón 

9. a) Ordinal o de razón b) Ordinal 

6

1.4 Parámetros y Estadísticos. 

Definiciones: 

• Variable aleatoria es la variable que surge de un experimento aleatorio, consistente en 

considerar todos los posibles valores de una variable en una población. La variable aleatoria 

se describe mediante su distribución de probabilidad. Si la variable aleatoria es cuantitativa y 

continua, viene descrita por su función de densidad. 

• La variable estadística surge de un experimento estadístico, consistente en tomar datos de 

una variable aleatoria sólo en una muestra de la población. Describimos la variable estadística 

mediante la distribución de frecuencias y si es cuantitativa y continua la representamos 

gráficamente por medio del histograma. 

En el tema anterior hemos estudiado la distribución normal. Una distribución normal queda 

determinada por su media µ , y su desviación típica σ y la representamos por N( µ , σ ). La media y 

desviación típica de la distribución normal determinan completamente la función de densidad. Por ello 

decimos que la media y la desviación típica son los parámetros de la distribución normal. 

Si al realizar un estudio estadístico sospechamos que la variable de interés podría ser aproximada 

adecuadamente mediante una distribución normal, nuestro interés se centrará en hallar el valor 

aproximado de estos parámetros (media y desviación típica), porque conocidos estos valores, 

habremos determinado la función de densidad de la variable y podremos calcular cualquier probabilidad 

relacionada con ella. 

• Llamamos parámetros a las medidas de posición central, dispersión y, en general cualquier 

resumen calculado en la variable aleatoria, es decir, en toda la población. 

• Llamamos estadísticos a las mismas medidas cuando se refieren a la variable estadística, es decir, 

cuando se calculan sólo a partir de una muestra tomada de la población. 

Ejemplo 6.2. Una cadena de televisión quiere estudiar los índices de audiencia de uno de sus 

programas, medido por la proporción de personas que ven el programa una determinada semana. 

Para ello diseñan un proceso de muestreo y eligen 1000 familias en forma que la muestra sea 

representativa de la población. 

En cada familia recogerán datos del número de personas de la familia que vio el programa esa 

semana y el total de personas que componen la familia: 

• La proporción de personas que vio el programa esa semana en todo el país es un parámetro. Es un 

valor constante, pero no lo conocemos. 

• La proporción de personas que vio el programa en la muestra es un estadístico. 

Supongamos que se obtuvo una proporción del 15% de audiencia en la muestra. En otra 

muestra de personas esta proporción podría variar, aunque si las muestras están bien 

elegidas esperamos que los valores se acerquen a la proporción (parámetro) en la población. 

7

Nota: En los temas siguientes se utilizará los términos parámetro y estadístico. El término 

parámetro se usará para referirse a las medidas de tendencia central y de variabilidad de una población, 

por lo cual, µ , σ 2 y σ son parámetros. El término estadístico se usará para referirse a las medidas de 

tendencia central y de variabilidad de la muestra, por lo cual, x , S 2 y S son estadísticos. 

Parámetro y Estadístico 

Un parámetro es un número representativo que se obtiene a partir de los datos de una población. 

Un estadístico es un número representativo que se obtiene a partir de los datos de una muestra. 

Los parámetros o estadísticos sirven para sintetizar la información del conjunto de datos en 

cuestión, al igual como lo haría una tabla de distribución o una gráfica. 

Hay tres tipos parámetros o estadísticos: 

• De centralización. 

• De posición. 

• De dispersión. 

Medidas de centralización 

Nos indican en torno a qué valor (centro) se distribuyen los datos. 

La medidas de centralización más comunes son: 

• Media aritmética: valor promedio de la distribución. 

• Mediana: puntación de la escala que separa la mitad superior de la distribución y la inferior, es decir 

divide la serie de datos en dos partes iguales. 

• Moda: valor que más se repite en una distribución. 

Medidas de posición 

Las medidas de posición dividen un conjunto de datos en grupos con el mismo número o 

porcentaje de individuos. 

Para calcular las medidas de posición es necesario que los datos estén ordenados de menor a mayor. 

La medidas de posición son: 

• Cuartiles: dividen la serie de datos en cuatro partes iguales. 

• Deciles: dividen la serie de datos en diez partes iguales. 

• Percentiles: dividen la serie de datos en cien partes iguales. 

8

Medidas de dispersión 

Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la 

distribución. 

Las medidas de dispersión son: 

• Rango o recorrido 

El rango es la diferencia entre el mayor y el menor de los datos de una distribución estadística. 

• Desviación media 

La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto 

a la media. 

• Varianza 

La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media. 

• Desviación típica 

La desviación típica es la raíz cuadrada de la varianza. 

Tarea de Estadístico y Parámetro. 

En los siguientes enunciados identifica si los valores mencionados se refieren a un parámetro o a un 

estadístico y la población de interés a la que se refiere: 

a) La proporción de todos los estudiantes de la facultad que han viajado al extranjero; 

b) La proporción de estudiantes que han viajado al extranjero entre 100 estudiantes de la Universidad 

elegidos al azar; 

c) La proporción de los mexicanos que votaron por el PAN en las últimas elecciones; 

d) La proporción de "águilas" en 100 lanzamientos de una moneda; 

e) El peso medio de 20 bolsas de papas fritas de una cierta marca; 

f) La proporción de personas que declararon votar por el PAN en una encuesta realizada después de 

las elecciones; 

g) El peso medio de las personas mexicanas de 18 años; 

h) El peso medio de 10 personas mexicanas. 

9

1.5 Población y muestra. 

En los temas anteriores hemos estudiado, por un lado, la Estadística Descriptiva, cuyo objeto 

es describir los datos obtenidos en observaciones u experimentos. Estos datos son usualmente 

representados por una o varias variables estadísticas, cuya distribución de frecuencias y demás 

características son obtenidas a partir de los datos, que en la mayor parte de los casos 

constituyen una muestra particular de la población. Por otro lado, mediante el Cálculo de 

Probabilidades, introducimos el concepto de variable aleatoria, al considerar que aumentamos 

indefinidamente las observaciones y representar todos los posibles valores que puede tomar un 

carácter en una población, o todos los posibles valores que pueden surgir como consecuencia de la 

realización de un cierto experimento. 

10

1.6 Diferentes tipos de muestreo aleatorio y no aleatorio. 

Hay muchas formas diferentes de elegir las muestras. Por ejemplo, si queremos hacer un 

estudio de los alumnos de la Facultad de Ciencias de la Educación, podríamos formar una 

muestra con alumnos voluntarios. Sin embargo, si queremos que nuestros resultados sean 

generalizables, hay que planificar la elección de la muestra, siguiendo unos requisitos, que aseguren 

que la muestra ha sido elegida aleatoriamente de la población. Los métodos de inferencia 

estadística están basados en la utilización de unos métodos de muestreo probabilístico. El 

muestreo se dice probabilístico cuando puede calcularse de antemano la probabilidad de obtener 

cada una de las muestras que sea posible seleccionar. Para ello, es necesario que el proceso de 

selección pueda considerarse como un experimento aleatorio. Algunos tipos de muestreo 

probabilístico son: 

• Muestreo aleatorio simple: Cuando los elementos de la muestra se eligen al azar de la población 

y cada elemento tiene la misma probabilidad de ser elegido. Puede realizarse con 

reemplazamiento (una vez elegido un elemento para formar parte de la muestra se puede 

volver a elegir de nuevo) o sin reemplazamiento. 

• Muestreo estratificado: Primero dividimos la población en grupos de individuos homogéneos, 

llamados estratos. De cada estrato se toma una muestra aleatoria. El tamaño de la 

muestra global se divide proporcionalmente al tamaño de cada estrato. 

• Muestreo sistemático: Se supone que los elementos de la población están ordenados. Si 

queremos tomar en la muestra uno de cada n elementos de la población, elegimos al azar un 

elemento entre los n primeros. A continuación sistemáticamente elegimos uno de cada n elementos. 

• Muestreo por conglomerados: Se divide la población en unidades representativas de 

la misma (y por tanto heterogéneas) y se extrae aleatoriamente un grupo de éstas sobre 

las cuales se efectúa la medición. Por ejemplo, para realizar una encuesta sobre presupuestos 

familiares, la ciudad puede dividirse en manzanas de viviendas, y se toman al azar, varias de estas 

manzanas en las cuales se efectúa la encuesta a todos los vecinos de la misma. 

• Puede realizarse un muestreo en dos o más etapas, cuando cada una de las unidades tomadas 

para el muestreo puede a su vez ser muestreada. En el ejemplo anterior, una vez elegida 

una manzana de viviendas para formar parte en la muestra, se sortea entre todas las viviendas 

que la componen para decidir cuales serán encuestadas. 

• También puede realizarse un muestreo opinático o intencional. En este caso, la persona que 

selecciona la muestra es la que decide los elementos que la constituirán, procurando que 

ésta sea representativa de la población. Sin embargo, la representatividad real dependerá de las 

preferencias u opinión de esta persona y, por tanto, este tipo de muestreo carece de base 

teórica suficiente. 

• Por último, en el muestreo sin norma, se toma la muestra de cualquier manera y se obtiene 

así una parte de la población. Si esta es homogénea, la representatividad de la muestra puede ser 

satisfactoria. Este tipo de muestreo se emplea a menudo en la vida diaria (así, se prueba un trozo de 

queso o un sorbo de vino, etc, y se juzga el resto por el resultado). 

11

1.7 Determinación del tamaño de la muestra (Pendiente). 

II. 

Variabilidad Muestral. 

2.0.1 Muestreo con o sin reemplazo de una población finita. 

El hecho de regresar o no un elemento muestreado a la población antes de extraer otro elemento 

de esa misma población determina si el muestreo es con o sin reemplazo. El muestreo es con 

reemplazo si en una extracción el elemento extraído sigue participando en otra u otras extracciones 

posteriores; el muestreo es sin reemplazo si el elemento extraído ya no participa en otra u otras 

extracciones posteriores. Si la población es muy grande, al extraer varios elementos, uno por uno, el 

tipo de muestreo es irrelevante. De hecho, al reemplazar el primer elemento antes de extraer el 

segundo, las observaciones en la primera y en la segunda extracción serían totalmente independientes. 

No obstante, si no se reemplaza el primer elemento, el segundo resultado de la extracción afectará 

ligeramente la segunda extracción. En poblaciones pequeñas el efecto si es relevante. 

El desarrollo matemático es más sencillo si las observaciones son independientes. A lo largo del 

muestreo se va a suponer el muestreo aleatorio con reemplazo, el cual también suele llamársele 

muestreo aleatorio simple. 

Nota: 

El número de elementos de la población, llamado tamaño de la población, lo representaremos con la 

letra N. 

El número de elementos de la muestra, llamado tamaño de la muestra, lo representaremos con la letra 

n. 

El cálculo del número de muestras posibles de tamaño n, extraídas de una población de tamaño N, 

cuando el muestreo es con reemplazo, se determina mediante la siguiente expresión: 

n 

N 

Por otro lado, cuando el muestreo es sin reemplazo, el número de muestras posibles que se pueden 

obtener es: 

⎛ N⎞ 

⎜ ⎟ = 

⎝ n ⎠ 

N ! 

n! ( N − n)! 

12

Ejemplo: 

Consideremos una población que consta de 30 elementos. Si de esta población se desean obtener 

muestras de tamaño 5, ¿cuántas muestras distintas hay, si el muestreo se hace: 

a) con reemplazo? b) sin reemplazo? 

Solución: 

13

2.0.2 Estimación puntual. 

La estimación es el proceso que permite inferir sobre los posibles valores de los parámetros que 

describen la población. 

Es muy probable que los valores de los parámetros que representan a una población, sean 

desconocidos. En estos casos se recurre a la información proporcionada en la muestra para contar con 

una idea de los valores de los parámetros. Si se logra determinar un descriptor numérico para la 

muestra, este estadístico, llamado estimación puntual, se puede usar para estimar la media 

correspondiente a la población. 

Ejemplo. 

Consideremos el siguiente conjunto de datos, correspondientes a una población: 

a) Determinar la media y la desviación estándar de este conjunto. 

b) Determinar una muestra aleatoria de tamaño 4 y calcular su media y su desviación estándar. 

c) ¿Cuáles son los estimadores puntuales de µ y σ ? ¿Qué tan buenos son estos estimadores? 

Solución: 

2 4 5 7 10 11 15 16 18 20 

a) Con nuestra calculadora, obtenemos que: 

µ = 10.8, σ ≈ 5.946 

b) Para esto, utilizaremos el software “del libro P y E”, siguiendo la siguiente secuencia: 

1. Asignar un número a cada elemento de la muestra 

Etiqueta Asignada 1 2 3 4 5 6 7 8 9 10 

Datos de la población 2 4 5 7 10 11 15 16 18 20 

2. Ejecutar el programa y abrir la opción “EXTRAS” del menú inicio. 

3. Seleccionar la opción “Generador de números” y llenar las siguientes opciones: 

• Intervalo: Valor máximo = 11 (un número más que el valor de la etiqueta más grande) 

Valor mínimo = 1 (correspondientes al valor más pequeño de las etiquetas asignadas). 

• Resolución = 1 (para nuestro caso particular), números de uno o dos dígitos menores a 11. 

= 10, números de dos o tres dígitos menores al valor de la etiqueta más grande). 

etc. 

• Número de datos (tamaño de la muestra) = 4 (para nuestro ejemplo particular) 

14

• Número de variables = 1 (para nuestro ejemplo particular) 

• Dar clic en la opción “generar” y listo. En mi caso se generó la muestra (de las etiquetas): 

9 8 10 4 

Qué corresponden a los valores: 

18 16 20 7 

La media y la desviación estándar de esta muestra son: 

x = 15.25, S ≈ 5.737 

Donde observamos que existe una discrepancia, por ejemplo, de la media real con la media de la 

muestra, con un valor de µ − x = 10.8 − 15.25 = − 4.45 = 4.45 . 

c) x = 15.25 es un estimador puntual del valor de la media poblacional µ . 

Similarmente, S ≈ 5.737 es un estimador puntual del valor de la desviación estándar poblacional σ . 

Estos estimadores se considerarán como buenos, si la discrepancia surgida al comparar el 

parámetro con el estadístico es pequeña. 

Tarea (de Estimación puntual) 

Consideremos el siguiente conjunto de datos, correspondientes a una población: 

2 4 5 7 10 11 15 16 18 20 

a) Utilice un paquete estadístico para seleccionar aleatoriamente cuatro muestras distintas de tamaño 

n = 3. En su reporte copie y pegue las muestras generadas por el paquete. 

b) Determinar la media de cada una de las muestras obtenidas en el inciso (a). 

c) Determine la discrepancia existente entre la media de cada muestra con respecto a la media 

poblacional µ . 

d) Utilice un paquete estadístico para seleccionar aleatoriamente cuatro muestras distintas de tamaño 

n = 5, y hacer lo mismo que en los incisos (b), y (c). 

e) ¿Qué diferencias observas en las discrepancias x − µ obtenidas en las distintas muestras de 

tamaño n = 3 y n = 5. 

15

Solución: 

a) 

Etiqueta Asignada 1 2 3 4 5 6 7 8 9 10 

Datos de la población 2 4 5 7 10 11 15 16 18 20 

Cuyas muestras respectivas son: 

Muestra 1 Muestra 2 Muestra 3 Muestra 4 

16 16 11 10 

18 15 16 11 

5 20 7 7 

b) 


x 

1 

= 13 x 

2 

= 17 x 

3 

= 11.333 x 

4 

= 28 

c) Como µ = 10.8 , entonces: 

x 

1 

− µ x 

2 

− µ x 

3 

− µ x 

4 

− µ 

2.2 4 0.533 17.2 

d) 

16

Cuyas muestras respectivas son: 


5 11 7 5 

20 10 15 18 

7 18 4 7 

4 20 16 10 

16 10 20 16 


x 

1 

= 10.4 x 

2 

= 13.8 x 

3 

= 12.4 x 

4 

= 11.2 

Como µ = 10.8 , entonces: 

x 

1 

− µ x 

2 

− µ x 

3 

− µ x 

4 

− µ 

0.4 3 1.6 0.4 

e) Observemos, que en general, la discrepancia entre la media muestral x y la media poblacional µ 

es menor cuando la muestra es de mayor tamaño. ¿Qué piensas que ocurriría si se aumenta el 

tamaño de la muestra? ¿Por qué? 

17

2.1 Distribuciones muestrales de la media. 

De acuerdo a lo observado en el ejemplo y tarea anterior, el valor de la media muestral x varía de 

una muestra a otra. Por lo cual x , además de ser un estimador, es una variable aleatoria. De esta 

forma, x cuenta con una media, una desviación estándar y una distribución de probabilidad. 

Definición (Distribución muestral de la medias) 

Una Distribución muestral de medias es una distribución probabilística que consta de una lista de 

todas las medias de las posibles muestras extraídas de una población, obtenidas de un muestreo con o 

sin reemplazo y de un tamaño especifico, y esta lista acompañada de la probabilidad de ocurrencia asociada 

con cada media muestral. 

En este caso, la media de las medias muestrales (media esperada) es ahora la media de todos los 

posibles valores de x y se denota por: 

µ 

x 

Esta corresponde al parámetro de la distribución de x . La desviación estándar es la desviación 

estándar de los valores de x y se denota por: 

σ 

x 

Esta corresponde al parámetro para la desviación estándar de la distribución de x . 

Para ilustrar el concepto de la distribución muestral de medias muestrales, consideremos los 

siguientes: 

Ejemplo 1. 

Consideremos una población de sólo tres valores: x 1 = 1 , x 2 = 2 y x 3 = 3, cuya media y 

desviación estándar poblacional son µ = 2 y σ ≈ 0.8165 . 

a) Obtener todas las posibles muestras de tamaño 2, con reposición, que se pueden extraer a partir de 

la población dada: 

b) Hacer la gráfica de la distribución de medias muestrales e indique lo que observa. 

c) Calcular µ 

x 

, σ 

x 

e indique lo que observe. 

18

Solución: 

a) El número de todas las muestras posibles de tamaño 2, con reposición, que se pueden extraer de 

dicha población son 3 2 = 9, y explícitamente estas son las siguientes: 

muestra x 

de cada 

muestra 

m 1 = 1, 1 1.0 

m 2 = 1, 2 1.5 

m 3 = 1, 3 2.0 

m 4 = 2, 1 1.5 

m 5 = 2, 2 2.0 

m 6 = 2, 3 2.5 

m 7 = 3, 1 2.0 

m 8 = 3, 2 2.5 

m 9 = 3, 3 3.0 

Σ = 18 

La distribución muestral de medias para este ejemplo es: 

x f ( x ) 

1.0 1 / 9 

1.5 2 / 9 

2.0 3 / 9 

2.5 2 / 9 

3.0 1 / 9 

Σ = 1.0 

Observemos que la mayoría de los valores de las medias muéstrales individuales difiere del valor de la media 

poblacional. En general se puede afirmar que sin importar de la población que se tenga, las medias muestrales 

tenderán a estar cerca de la media poblacional y rara vez tendrán el mismo valor. 

b) 

f ( x ) 

3/9 

2/9 

x 

Observemos que la gráfica es simétrica, con distribución normal. 

c) µ 

x 

= 2 y σ 

x 

≈ 0.57735 

Con lo cual observamos que la media de medias muestrales es igual al valor de la media 

poblacional: µ = µ 

x 

Lo cual no ocurre con la desviación estándar de medias muestrales: 

σ 

x 

≠ σ . 

19

Ejemplo 2 (Tarea). 

Repetir el ejemplo (1), para el caso en que la muestra sea sin reposición. 

Solución: 

Todas las posibles muestras de tamaño 2, son: 

1, 2 ; 1, 3 y 2, 3 

Y la distribución de probabilidad de las medias muestrales es: 

muestra x f ( x) 

m 1 = 1, 2 1.5 1/3 

m 2 = 1, 3 2.0 1/3 

m 3 = 2, 3 2.5 1/3 

Esta distribución también es simétrica. 

Además, µ 

x 

= 2 y σ 

x 

≈ 0.40825 

Con lo cual observamos nuevamente que la media de medias muestrales es igual al valor de la 

media poblacional: µ = µ 

x 

Lo cual no ocurre con la desviación estándar de medias muestrales: 

σ 

x 

≠ σ . 

20

2.2 Error Estándar de una distribución muestral. 

Concepto de error estándar. 

En vez de usar “la desviación estándar de la distribución de las medias muéstrales” para describir una 

distribución de las medias muéstrales, los estadísticos hablan del error estándar de la media. 

error estándar de la media = 

σ 

x 

La desviación estándar de la distribución de las medias muéstrales mide el grado en que esperamos 

que las medias de las diferentes muestras varíen por este error accidental en el proceso de muestreo. 

Por consiguiente, la desviación estándar de la distribución de un estadístico muestral recibe el 

nombre de error estándar del estadístico. 

El error estándar indica no sólo el tamaño del error accidental que se ha cometido, sino además la 

exactitud que seguramente alcanzaremos si usamos un estadístico muestral para estimar un parámetro 

de la población. Una distribución de medias muéstrales que está menos dispersa (o sea que tiene un 

error estándar pequeño) resulta ser un mejor estimador de la media de la población que una distribución 

de medias muéstrales que tenga una gran dispersión y un gran error estándar. 

Como hicimos notar anteriormente, sin importar si el muestreo es con o sin reemplazo, 

Mediante métodos matemáticos, se puede demostrar que la relación que guardan la desviación estándar 

de la población y el error estándar, cuando el muestreo es con reemplazo, es la siguiente: 

σ 

x 

≠ σ . 

σ = 

x 

σ 

n 

En la expresión anterior se observa que el error estándar disminuye en la medida en que el tamaño de 

la muestra crece. 

En el ejemplo (1) anterior, el error estándar de la distribución de medias muestrales es: 

σ 0.8165 

σ 

x 

= = = 0.57735 

n 2 

el cual coincide con el valor calculado directamente con la calculadora, a partir de la población de las 

medias muestrales. 

21

Ejemplo 

Supongamos que en determinada población se ha seleccionado una muestra de tamaño n = 10 con 

σ 

x 

= 9 . ¿Cuántas observaciones más necesitamos para reducir el valor de σ 

x 

a: 

a) 4.5 b) 3 c) 1 

Solución: 

Tomando en cuenta que 

σ 

σ 

x 

= , despejando σ , obtenemos: 

n 

σ = σ x 

⋅ n = 9⋅ 10 ≈ 28.46 

Por otro lado, despejando n de la fórmula del error estándar, obtenemos: 

2 

σ 

n = 

σ 

2 

x 

a) si σ 

x 

= 4.5, 

( 28.46) 

2 

( 4.5) 

n = ≈ 40 

2 

Por lo tanto, para reducir σ 

x 

de 9 a 4.5, el tamaño inicial de la muestra se debe aumentar en 30 

unidades. 

b) si σ 

x 

= 3, 

( 28.46) 

2 

( 3) 

n = ≈ 90 

2 

Por lo tanto, para reducir σ 

x 

de 9 a 3, el tamaño inicial de la muestra se debe aumentar en 80 

unidades. 

c) si σ 

x 

= 1, 

( 28.46) 

2 

( 1) 

n = ≈ 810 

2 

Por lo tanto, para reducir 

unidades. 

σ 

x 

de 9 a 4.5, el tamaño inicial de la muestra se debe aumentar en 800 

Nota: 

En lo sucesivo, diremos que una muestra es una muestra pequeña si el tamaño de esta es menor que 

30: 

n < 30 

Por otro lado, diremos que una muestra es una muestra grande si el tamaño de esta es mayor o igual 

que 30: 

n ≥ 30 . 

22

2.3 El Teorema del Límite Central. 

Los resultados vistos anteriormente, respecto a una distribución de medias muestrales, se encuentran 

resumidos en el siguiente teorema: 

Teorema (del Límite central) 

Consideremos una población de datos, con media µ y desviación estándar σ. Si de esta población 

se extraen todas las diferentes muestras de tamaño n , entonces la distribución muestral de medias: 

1. Tendrá una media esperada µ x = µ sin importar el tipo de muestreo ni el tipo de población que 

se esté trabajando. 

2. Tendrá un error estándar (desviación estándar) expresado por medio de la fórmula: 

σ 

a) σ x = si el muestreo se hace con reemplazo. 

n 

b) σ 

x 

σ N − n 

= • 

si el muestreo se hace sin reemplazo. En este caso, el factor 

n N −1 

llama factor de corrección para población finita. 

N − n 

N −1 

se 

3. a) Tendrá una distribución Normal, siempre y cuando la población original de datos tenga una 

distribución Normal. 

b) Tendrá una distribución aproximadamente Normal, siempre y cuando las muestras 

seleccionadas sean de tamaño mayor o igual a 30 para el caso en que la población original de 

datos no tenga una distribución Normal. 

Nota : 

a) Cuando en los problemas no sea claro que tipo de fórmula se debe utilizar para determinar el valor 

de σ x , se puede utilizar el siguiente criterio: 

Si 

n 

N < 0. 05 , entonces utilizar σ σ 

x = . En caso contrario, utilizar σ x = 

n 

σ N − n 

• 

n N −1 . 

b) Si no se hace especifico que el muestreo es sin reposición, entonces para determinar el valor del 

σ 

error estándar, utilizar la fórmula σ x = . 

n 

23

2.4 Aplicaciones del Teorema del Límite Central. 

1. Supóngase que de 6 estudiantes (elementos de toda una población), el primer estudiante tiene $1, 

el segundo $2 y así sucesivamente hasta el sexto estudiante que tiene $6. 

a) Calcular la media y la desviación estándar de la población. 

b) Si se consideran todas las muestras posibles (sin reposición) de tamaño 2 extraídas a partir de 

la población dada, calcular el valor de µ x y de σ x . 

Solución: 

2. La media aritmética de las estaturas de 42 000 estudiantes de secundaria de una ciudad es de 1.58 

m y la desviación estándar es de 0.08 m. Si se toman 50 muestras de 40 alumnos en cada muestra, 

halar la media esperada de la distribución muestral y su error estándar. 

Solución: 

Por hipótesis, N = 42 000, n = 40, µ = 1.58, σ = 0.08 . 

Por lo tanto, µ = µ = 1.58 . 

x 

σ 0.08 

σ x = = ≈ 0.01265 . 

n 40 

24

III. 

Estimación. 

3.1 Estimación por intervalo. 

25

I. Introducción a la Inferencia Estadística.

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?