apuntes completos

[2016] 

Apuntes de Víctor Herrera Bautista 

Víctor Herrera Bautista 

[Fecha]

Elaborado por Víctor Herrera Bautista 

INTRODUCCIÓN A LA ESTADÍSTICA 

todos los elementos que permiten 

bosquejar a un problema. 

La Estadística es una ciencia que nos 

proporciona un método importante para 

la toma de decisiones y resolver 

problemas en forma sistemática y 

reproducible, a diferencia de otros 

métodos que difícilmente pueden ser 

explicados o reproducidos hasta por la 

misma persona que lo ejecuta. Por lo 

anterior es importante analizar 

detenidamente cada uno de los 

conceptos en los que se fundamenta 

ésta para lograr acercarnos 

profundamente a su conocimiento. 

Dado que la estadística nace con la 

idea de resolver problemas 

comenzaremos diciendo que un 

problema es la diferencia entre lo real 

y lo deseado, es decir, que nosotros 

normalmente al tener injerencia en la 

toma de decisiones podamos 

escenificar perfectamente la realidad 

que nos rodea y con ello empatar 

nuestras necesidades o deseos. De tal 

forma, que la estadística, entonces 

juegue el papel de agente 

caracterizador de una población. 

Entendiendo a esta (Población) como 

una realidad concreta que comprende 

Por lo tanto una muestra será aquel 

subconjunto propio obtenido de la 

población, es decir, cuenta con algunos 

elementos y no todos los de la 

población. 

Las medidas que se obtienen en una 

población son llamadas parámetros y 

las obtenidas en una muestra reciben 

el nombre de estadísticos. Es 

importante aclarar que las poblaciones 

y las muestras están determinadas por 

el problema ya que en diferentes 

situaciones una muestra puede jugar el 

papel de población dependiendo del 

problema y viceversa. 

Por ejemplo una gota de sangre es una 

muestra si el problema es estudiar la 

salud de una persona, pero es una 

población si me interesa determinar el 

volumen de eritrocitos y leucocitos que 

hay en ella. Así en los negocios 

también es importante delimitar el 

problema ya que las ventas de un día 

resultan ser una muestra cuando 

estemos interesados en analizar las 

ventas promedio anuales, y por otro 

lado resulta ser la población cuando 

analizamos las ventas por empleado en 

ese día. 

RAMAS DE LA ESTADÍSTICA


La estadística se separa, solamente en 

forma didáctica, en dos partes; la 

estadística descriptiva y la 

inferencial, ya que en la realidad se 

utilizan ambas sin distinciones. La 

descriptiva nos permite caracterizar 

una realidad mediante la medición de 

una población, es decir, que cuando el 

tamaño de la población y las medidas 

que se deben obtener no la afectan 

entonces se realiza la investigación 

sobre toda la población. La inferencial 

será aquella realizada en una muestra 

para obtener información, de forma 

inductiva, de la población, es decir, que 

existen situaciones en las que el 

estudio de la población es imposible ya 

sea por el tamaño de la misma o 

porque al obtener alguna medida 

destruyamos a sus elementos, como en 

el caso de querer estimar la calidad de 

un producto que producimos 

continuamente no se puede detener 

esta producción y mucho menos 

estudiar toda la producción, de ahí que 

nos vemos en la necesidad de estudiar 

una pequeña parte de esta población 

(muestra) y las medidas que 

obtenemos las consideramos como 

representativas de esta. 

TIPOS DE VARIABLES 

Para poder realizar una estadística 

también es necesario identificar la 

naturaleza de los datos que conforman 

a la población, con el objeto de 

establecer las variables que se deben 

manejar, pudiendo encontrarnos con 

datos cuantitativos y datos 

cualitativos. Los datos cuantitativos 

son aquellos que resultan de una 

medida o de un conteo por lo que los 

podemos diferenciar en continuos y en 

discretos respectivamente, es decir, 

que se pueden obtener datos 

cuantitativos que debido a un 

instrumento podemos especificar 

valores enteros y decimales de tal 

forma que sus diferencias serán 

establecidas dependiendo de la 

exactitud del instrumento al medir 

distancias, volúmenes, superficies, etc. 

y otros datos que solo se puedan 

contar, como es el caso del número de 

automóviles en circulación en cierta 

ciudad, número de empleados en una 

empresa, etc. Los datos cualitativos 

resultan de aquellas poblaciones en las 

que sus elementos no pueden ser 

medidos debido a su naturaleza y que 

por lo tanto solo se les pueden 

observar atributos y diferencias. 

ESCALAS DE MEDICIÓN 

En cuanto a las escalas de medición la 

estadística cuenta con las siguientes: 

Nominal; la cual se utiliza 

principalmente en los datos 

cualitativos y nos permite manejar la 

información por su nombre, como en 

los casos de marcas de diferentes 

productos, 

enfermedades, 

preferencias, etc. 

Ordinal; aquella que utilizamos 

cuando necesitamos establecer 

orden entre las diferencias de la 

población y sus datos son 

cualitativos, por ejemplo, escalas de 

calidad (mala, regular, buena, muy 

buena), escalas de gusto (muy 

sabrosa, sabrosa, agradable, 

desagradable, muy desagradable), 

etc.


Intervalo; Se utiliza principalmente 

en datos cuantitativos y es una 

escala que no cuenta con un cero 

absoluto o con un instrumento 

estandarizado, por ejemplo, la 

temperatura se puede medir en 

grados centígrados, Fahrenheit y 

kelvin dentro de las cuales los 

grados centígrados no cuentan con 

un cero absoluto debido a que se 

basan en el punto de ebullición del 

agua, el cuál es variable en 

diferentes altitudes, los Fahrenheit 

que tampoco cuentan con un cero 

absoluto, ya que este también 

cambia con las altitudes con 

respecto al nivel del mar, debido a 

que se sustenta en el punto de 

congelación del agua y los kelvin 

que si cuentan con un cero absoluto 

ya que queda establecido al vacío 

fuera de las diferencias provocadas 

por la altitud, otro ejemplo sería el 

utilizar una cuerda con nudos para 

determinar una Distancia o un 

volumen con vasija de barro, ya que 

al intentar comprobar esta distancia 

o este volumen debemos contar con 

la misma cuerda o con la misma 

vasija. 

Razón; Básicamente utilizada en 

datos cuantitativos que pueden ser 

medidos con instrumentos 

estandarizados o con un cero 

absoluto como por ejemplo una 

distancia medida en kilómetros, un 

volumen medido en centímetros 

cúbicos, ventas medidas en pesos, 

etc. 

Cuando ya se han identificado el 

problema que deseamos resolver, la 

población, el tipo de datos y las 

variables con las que nos acercaremos 

a la información entonces será 

necesario especificar si es necesario 

trabajar solo con la población o con una 

muestra así como la forma en la que 

obtendremos los datos. 

Por lo anterior se describirán las 

diferentes formas de obtener una 

muestra: 

Dentro de la estadística se pueden 

obtener muestras que resultan 

probabilísticas y las no probabilísticas, 

diferenciándose en el método de su 

consecución, es decir, cuando 

utilizamos un método que nos garantice 

que todos los elementos de una 

población tienen la misma probabilidad 

de ser elegidos estamos trabajando 

con un muestreo probabilístico y 

cuando la obtención de una muestra 

resulte de criterios, juicios, preferencias 

o cualquier elemento subjetivo (o en 

otras palabras, que no podamos 

garantizar que contemos con 

elementos equiprobables) entonces 

estaremos trabajando con un 

muestreo no probabilístico. 

De ahí que nos enfocáremos más a los 

primeros; subdividiéndolos en: 

Aleatorio Simple; el cual requiere del 

tamaño de la población “N”, el tamaño 

de la muestra “n”, de una tabla de 

números aleatorios, especificar si se 

realizará con reemplazo o sin él, así 

como, de una regla de uso (no debe 

ser la misma en todos los casos) y 

determinar el número de dígitos que se 

utilizarán. Por ejemplo; si me intereso 

en determinar el nivel socioeconómico 

de las personas que se encuentran 

trabajando dentro de una empresa y 

deseo que todos sus integrantes 

tengan la misma probabilidad de ser 

elegidos entonces realizo lo siguiente: 

determino el número total de


empleados (N=200), el número de 

personas que integrarán la muestra 

(n=10), selecciono una regla para 

utilizar mi tabla de números aleatorios 

(lanzaré mi lápiz y donde caiga leeré de 

3 en 3 dígitos sobre la misma columna 

hacia abajo hasta terminarla y cuando 

esto suceda continuare leyendo en la 

siguiente columna hasta terminar de 

obtener los diez datos). Supongamos 

que la tabla es la siguiente 

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 

1 2 3 1 2 1 0 8 7 6 5 9 7 8 1 0 0 3 4 9 8 0 0 9 7 1 

2 5 5 6 3 8 9 0 9 6 7 5 9 0 7 6 4 2 3 1 6 5 6 3 3 2 

3 9 6 4 1 2 3 0 0 4 6 1 7 9 2 1 4 3 9 1 5 2 3 9 0 8 

4 3 2 8 9 2 9 3 4 6 5 9 4 7 7 2 6 2 1 5 9 0 7 1 9 9 

5 3 6 1 0 0 4 0 7 0 5 1 5 3 9 1 0 1 2 1 8 5 9 4 4 6 

6 5 3 3 4 7 1 9 5 4 5 2 4 6 4 2 9 6 5 4 3 9 4 2 1 7 

7 4 3 1 0 3 3 7 8 7 3 7 5 3 5 0 2 6 4 1 1 0 2 7 0 2 

8 2 2 8 6 5 6 7 2 7 1 6 4 1 8 6 5 4 3 7 1 2 6 6 1 0 

9 0 4 1 6 5 7 6 4 2 0 3 4 5 2 1 5 9 6 8 7 6 0 5 6 4 

10 9 1 7 0 3 6 6 7 3 1 2 2 8 4 6 8 3 8 9 9 7 3 5 8 0 

11 6 0 6 7 7 0 6 8 7 7 1 2 4 3 4 3 3 3 4 4 0 9 7 8 1 

12 8 2 7 3 2 9 2 8 3 8 2 1 0 7 1 2 7 7 5 7 1 3 8 5 9 

13 6 0 6 7 4 5 8 9 6 0 9 4 9 5 1 5 1 0 7 2 0 5 5 0 6 

14 7 8 0 2 4 8 1 5 8 2 8 5 5 5 2 1 2 4 8 4 8 8 9 3 5 

y que al arrojar el lápiz cayó en el 

renglón 5 columna 7, entonces, las 

personas que debemos seleccionar 

serán 097,766, 628,179, 047, 582, 478, 

895, 664, 604, 772, 373, 685, 765, 553, 

101, 780, 295, 191, 276, 321, 298, 797, 

454, 544, 221, 458, 097,363, 158, 409, 

517, 279, 458, 243, 755, 061, 212, 

061, 641, 112, tomando en cuenta que 

es un muestreo con reemplazo. 

Sistemático; Este muestreo permite 

obtener los elementos de cada k - 

ésima unidad de la población, y para 

ello se requiere conocer el tamaño de 

la población (N), el de la muestra (n) y 

obtener el valor de k, de tal forma que 

al tener estos datos escojamos al 

primer dato por medio de aleatorio 

simple y de ahí de k en k. Por ejemplo; 

si tenemos la necesidad de extraer una 

muestra de 20 artículos de 1000 

unidades producidas entonces 

deberemos dividir 1000/20 obteniendo 

50 por lo que el primer número lo 

seleccionamos de nuestra tabla de 

números aleatorios obteniendo el 

número 12, por lo que, los siguientes 

números deberán ser 12+k, 12+2k, 

etc., es decir, 12, 62,112, 162, 212, 

262, 312, 362, 412, 462, 512, etc. 

87 65 78 87 60 87 34 31 43 87 

78 90 65 68 62 70 80 61 62 72 

95 64 80 90 68 80 30 35 40 75 

59 68 65 92 70 78 95 33 72 65 

70 95 50 75 31 60 43 78 70 60 

65 60 30 90 40 80 59 27 92 65 

Estratificado; Este tipo de muestreo 

requiere tener una población bien 

clasificada en varios grupos llamados 

estratos, que a su interior se 

mantengan bastante homogéneos, 

para construir la muestra normalmente 

se toma una cantidad de elementos del 

mismo tamaño de cada uno de los 

estratos, este debe ser mediante el 

muestreo aleatorio simple (m.a.s.); 

aunque en algunos casos cuando las 

proporciones de los estratos son 

distintas se toman en cuenta. 

Por conglomerados; En este caso la 

muestra nos presenta gran dificultad 

para establecer sus diferencias, por lo 

que iniciamos seleccionando en forma 

aleatoria una muestra de 

conglomerados, ya que, cada uno de 

ellos podría representar una muestra, 

posteriormente se deberá elaborar un 

censo para poder establecer las 

proporciones de las diferentes 

categorías que se encuentren 

presentes en nuestra muestra. 

Ahora bien, después de determinar qué 

tipo de variables utilizaremos, de que 

formas las vamos a medir y si 

será necesario obtener una 

muestra nuestra siguiente 

decisión a tomar dentro del 

método estadístico será el de 

especificar si usaremos los datos en 

forma agrupada o no agrupada. 

Para el caso de querer agrupar los 

datos, entonces deberemos crear una 

tabla de distribución de frecuencias 

y para ello los pasos que debemos 

seguir son los siguientes: 

Se debe conocer el número total de 

datos (N). 

K 

 

N 

n


Se elaborará el Diagrama de Tallo y 

Hojas, buscando la cifra que haga más 

evidente el cambio para formar el tallo 

y los demás valores formarán las hojas; 

por ejemplo: 

Supongamos que tenemos los 

siguientes datos: 

Un restaurante establece, sobre la 

base de sus registros, que el número 

de comensales que hicieron uso de su 

servicio día con día, durante los últimos 

dos meses a la hora de la comida, son 

los que se presentan a continuación: 

Nos podemos percatar que en este 

caso las cifras significativas son las que 

representan a las decenas por lo que el 

diagrama quedará compuesto de la 

siguiente forma: 

2 7 

3 0 0 1 1 3 4 5 

4 0 0 3 3 

5 0 9 9 

6 0 0 0 0 1 2 2 4 5 5 5 5 5 5 8 8 8 

7 0 0 0 0 2 2 5 5 8 8 8 

8 0 0 0 0 7 7 7 7 8 

9 0 0 0 2 2 5 5 5 

Nótese que este diagrama nos sirve 

para encontrar los valores mínimos y 

máximos de forma más rápida, también 

nos permitió ordenar a los datos en 

forma más sencilla y por último nos 

muestra al menos el comportamiento 

de la forma en el conjunto de datos. 

El siguiente paso es obtener el Rango 

mediante la siguiente relación, en la 

que nos debemos cuestionar su 

Rango = dato mayor - dato menor 

significado, ya que, no representa una 

diferencia simplemente sino que, más 

bien es nuestra primer medida 

estadística que representa la máxima 

dispersión que vamos a encontrar en 

nuestro conjunto de datos, así 

tendremos: 95-27 = 68 

1) Obtenemos la raíz de N y el 

resultado redondeado siempre a valor 

entero nos dará en número de 

renglones (en nuestro ejemplo 

tendremos 60 77459666 . 8 ) 

2) Seleccionar de una tabla, el número 

de renglones representados por K y el 

número que más se aproxime al 

número de datos en la columna 

denominada con la letra N por ejemplo 

en nuestro problema tenemos 60 datos, 

por lo que, la tabla nos sugiere utilizar 5 

intervalos para poderlos agrupar 

adecuadamente. 

Número de Intervalos: No debe 

ser menor de 6 ni mayor de 15. 

Se puede establecer: 

- al gusto del investigador 

- n redondeado al siguiente 

entero 

- utilizando la tabla 

- mediante la expresión 

2 

k n 

3) Escoger el número de renglones o 

intervalos a juicio del investigador, 

tomando en cuenta que si no se tiene 

experiencia en este tipo de problemas 

el diagrama de tallo y hojas puede 

proporcionarnos una buena cantidad de 

renglones para nuestro objetivo, en 

nuestro ejemplo el diagrama sugiere 8 

renglones. 

El paso siguiente para elaborar la tabla 

de distribución de frecuencias es 

calcular el tamaño de intervalo, 

rango 

i 

K 

Tamaño de 

intervalo 

Número de 

renglones 

Posteriormente debemos determinar la 

cantidad de intervalos o clases 

deseamos utilizar para clasificar o 

agrupar nuestra información y para ello 

contamos con tres procedimientos al 

menos:


f en nuestro caso resultará de 9, 

después 8 de haber redondeado hacia 

arriba, 4 por lo que procederemos a 

calcular 1 los límites de los intervalos, 

comenzando 9 

con los límites inferiores 

sumándole 14 al número más pequeño el 

tamaño 11 del intervalo (i) “K” veces, en 

nuestro 5 ejemplo tendríamos: 

8 

Nótese que al dato menor se le 

ha sumado el tamaño de 

intervalo que es 9 

resultándonos el siguiente y así 

sucesivamente hasta sumarle el 

tamaño del intervalo 8 veces 

(que es el número de renglones 

que hemos escogido). 

LI 

27 

36 

45 

54 

63 

72 

81 

90 

99 

Posteriormente debemos 

calcular los límites superiores y 

para ello debemos considerar 

que los intervalos que nos encontramos 

construyendo son intervalos cerrados, 

es decir, intervalos que incluyen a sus 

extremos, de esta manera observamos 

que los números que deben estar en el 

primer intervalo son 27, 28, 29, 30, 31, 

32, 33, 34 y 35, o sea, nuestro límite 

superior es 35 en lugar de 36 que es el 

resultado de sumar 27+9, por lo que 

debemos disminuir el resultado una 

unidad. (Por lo anterior los límites 

superiores que nos quedan en nuestro 

ejemplo son tomados de los inferiores 

pero con una unidad menos). 

El siguiente paso será determinar la 

frecuencia ( f ) o número de datos que 

caen dentro de los intervalos que 

hemos generado por lo que debemos 

contestar a la pregunta de ¿cuántos 

datos se encuentran entre tal valor y tal 

otro?, es decir, en nuestro ejemplo 

li + ls lri + lrs 

x = = 

2 2 

vemos que debemos preguntarnos 

¿cuántos datos hay entre los valores 

de 27 y 35?, pudiendo observar en el 

diagrama de tallo y hojas que contamos 

con 8 datos, y así sucesivamente hasta 

terminar de preguntarnos los demás 

intervalos teniendo: 

De esta manera ahora ya contamos 

con una tabla de distribución de 

frecuencias la cual nos permitiera crear 

nuevas columnas que nos facilitarán la 

tarea de describir una 

realidad y con ello 

resolver un problema 

mediante 

importantes. 

decisiones 

Una de las columnas 8 128 

que podemos generar etc. etc. 

puede ser la que representa a la 

frecuencia acumulada ( fa 

K N 

4 8 

5 16 

6 32 

7 64 

i 

i 

f 

j 

), 

j1 

es decir, la que nos responderá a la 

pregunta de ¿cuántos datos se fueron 

presentando desde el primer intervalo 

hasta el último?, Dé esta forma 

tendremos: 

Así, con esta columna podemos decir 

que 8 días tuvimos entre 25 y 37 

comensales, 12 días entre 25 y 44, 

etc. 

fa 

8 

12 

13 

22 

36 

47 

52 

60 

Después debemos encontrar 

un número que representa a 

todo el intervalo, ya que, es 

más sencillo hablar de un solo 

dato a un intervalo. 

Este número se llama marca de 

clase o punto medio el cual 

quedará representado por una “x” 

y se calcula utilizando los límites o los 

límites reales o verdaderos, mediante 

la siguiente relación: 

En donde “li” representa al límite 

inferior “ls” al límite superior y “lri”, “lrs” 

a los límites reales. 

Nótese que la marca de clase puede 

obtenerse con los límites que habíamos 

obtenido o con los límites reales, los 

cuales resultan de las siguientes 

acciones. 

Es importante lograr establecer un 

intervalo continuo para poder hacer 

análisis estadístico de todo el conjunto 

de datos y que a la vez no nos limite 

este mismo conjunto. 

Para obtener un límite real debemos 

tomar los valores de los límites que 

LS 

35 

44 

53 

62 

71 

80 

89 

98


presentan un “hito” de información 

(como es el caso de 44 y 45 en nuestro 

ejemplo) y encontrar un punto que 

represente ese intervalo con la fórmula 

que hemos utilizado con las marcas de 

clase. 

Ahora procederemos a calcular la 

frecuencia relativa ( fr ) la cual nos 

representa la proporción que le 

corresponde a cada intervalo con 

respecto al total de datos mediante la 

fórmula: 

fr = 

f 

N 

Al tener la frecuencia relativa entonces 

también nos podemos preguntar cuál 

es la proporción acumulada 

( fra 

x 100 

i 

fr j 

j1 

i 

Es la 

frecuencia de 

cada renglón 

Es el número total 

de datos o en otras 

palabras la suma 

de “f” 

) por renglón de la misma 

forma que lo hicimos para la 

frecuencia. 

fr fra Como estas columnas 

13 13 representan 

la 

7 20 proporción que le 

2 

15 

23 

18 

22 

37 

60 

78 

corresponde a cada una 

de las frecuencias en 

cada renglón entonces 

también podríamos crear 

8 87 una columna que 

13 100 representara los grados 

dentro de una 

circunferencia con el objetivo de crear 

una gráfica de pastel o de pay también 

llamada gráfica de sectores. 

cualitativos o cuantitativos. Un círculo 

se divide en sectores que representan, 

proporcionalmente, cada clase. No es 

recomendable representar más de 6 

clases. 

Se suelen ordenar los sectores para 

hacer más evidente sus diferencias. 

A partir de la frecuencia relativa, se 

obtienen los grados: 

grados fr 360 O grados % 3.6 

i 

Gráfica de Barras: 

Puede representar datos cualitativos o 

cuantitativos. Consiste en barras que 

representan a las clases. La altura de 

cada barra es igual a la frecuencia o 

frecuencia relativa de la clase. El eje 

horizontal no es la recta numérica por 

lo que las barras se presentan 

separadas 

Histogramas: 

i 

i 

i 

Gráfica de Pastel (Pie, Circular o de 

Sectores): Puede representar datos


Permite comparar visualmente las 

proporciones o magnitudes de las 

clases. 

Solo representa datos cuantitativos. 

Muy semejante a la gráfica de barras. 

Se representa sobre el eje cartesiano, 

donde el eje horizontal representa las 

fronteras o las marcas de clase. El área 

de las barras representa 

proporcionalmente cada clase. 

Polígono: Hace evidente la forma de la 

distribución de frecuencias de los 

datos. Solo representa datos 

cuantitativos. Es una gráfica de puntos 

y líneas. Relaciona las marcas de clase 

con sus frecuencias o frecuencias 

relativas. Como el área total de las 

barras del histograma debe 

mantenerse igual al área debajo del 

polígono, el polígono empieza en una 

marca de clase anterior y termina en 

una marca de clase posterior a las de 

la tabla de frecuencias. 

Ojiva: 

2) Ojiva "O más": "¿cuántas 

observaciones hay iguales o mayores a 

esta fronteras?". Es una curva 

decreciente que empieza en el total de 

observaciones y termina en cero. 

FUENTES DE DATOS. 

Ahora nos interesa describir la forma 

en que la estadística se hace llegar la 

información para poder trabajarla. En 

principio podemos decir que hay dos 

tipos de estudios estadísticos; aquellos 

que involucran la toma de decisiones 

respecto a una población y/o sus 

características, es decir, el estudio 

enumerativo y el segundo llamado 

estudio analítico que involucra realizar 

actividad sobre un proceso para 

mejorar el desempeño en el futuro. 

Después de haber decidido qué tipo de 

estudio se debe realizar entonces 

podremos encontrar la información en 

tres tipos de fuentes: 

1) La bibliográfica 

Equivalen a los polígonos de frecuencia 

acumulada. Relacionan las fronteras 

inferiores con los valores acumulados 

de frecuencia. Su aplicación se 

concreta a responder preguntas como: 

¿qué proporción acumulada le 

corresponde a este dato?, ¿Qué dato 

corresponde a esta proporción 

acumulada? Hay dos criterios para 

construir ojivas: 

1) Ojiva "Menor que": "¿cuántas 

observaciones son menores que esta 

frontera?". Es una curva creciente que 

empieza en frecuencia cero y termina 

en el total de observaciones. 

2) La experimentación 

3) La entrevista. 

Dentro 

de la 

informaci 

ón 

bibliográf 

ica


podemos decir que está representada 

por la información impresa y quedan 

incluidas las nuevas fuentes tales como 

la información obtenida en Internet, 

discos compactos, y cualquier otro 

medio digital que permita obtener 

información almacenada. Las ventajas 

de este tipo de datos quedan 

manifiestas por la velocidad de 

obtención de la información, ya que, tal 

vez pueda estar clasificada y ordenada, 

además de evitarnos la pérdida de 

tiempo para recopilar esta información. 

La desventaja es que muchas veces la 

información no es actualizada o que la 

información no se apegue exactamente 

a nuestro problema. 

La experimentación en forma contraria 

a la bibliográfica tiene como ventaja 

que la información obtenida es 

exactamente de nuestro problema, 

pero esto implica que se requiera de un 

grupo de investigadores, de 

presupuesto, así como de todos los 

insumos para su funcionamiento. 

c) Directa. 

Cada una de ellas tiene sus ventajas y 

sus desventajas pero también son 

utilizadas en la actualidad, así como, 

una serie de versiones que mezclan 

estos tres tipos, por ejemplo en los 

noticieros televisivos hacen una 

pregunta y dan dos diferentes teléfonos 

o tres para recibir las respuestas. 

En cuanto a la entrevista podemos 

decir que contamos al menos con tres 

tipos diferentes: 

a) Por correo 

b) Por teléfono


NOTACIÓN SUMA. 

En la operación de adición o suma, se presenta con frecuencia en la estadística el 

símbolo (sigma) para denotar “tomar la suma de”. A continuación se presenta un 

ejemplo donde se tiene un conjunto de valores n para alguna variable X. 

n 

X i 

i 1 

, esta 

expresión indica que estos n valores deben sumarse. Por consiguiente: 

n 

 

i 1 

X 

i 

X 

1 

X 

2 

X 

3 

... 

X 

n 

Ejemplo Se encuentran cinco observaciones para la variable 

X X 2, X 0, X 1, 

X 5 y X 7 .Por lo tanto: 

5 

 

i1 

: 

1 2 

3 

4 

5 

 

X 

i 

X 

1 

X 

2 

X 

3 

X 

4 

X 

5 

2 0 ( 1) 

5 7 13 

En estadística nos vemos involucrados muy a menudo con la suma de los valores al 

cuadrado de una variable. Por lo tanto. 

n 

 

i 1 

X 

2 

i 

X 

2 

1 

X 

2 

2 

X 

2 

3 

2 

... X 

n 

Y en nuestro ejemplo, tenemos: 

5 

 

i1 

2 

X 

2 

2 

i 

0 

X 

2 

2 

1 

X 

( 1) 

5 

4 0 1 

25 

49 

79 

2 

2 

2 

X 

2 

2 

3 

7 

X 

2 

2 

4 

X 

2 

5


n 

X i 

i1 

Se debe observar, aquí que 

a 

n 

X 

i1 

I 

2 

 

 

 

, el cuadrado de la suma, esto es 

2 , la sumatoria de los cuadrados no es igual 

n 

 

i1 

X 

2 

i 

 

 

 

n 

 

i1 

2 

 

X 

i 

 

En nuestro ejemplo, la sumatoria de los cuadrados es igual a 79. Esto no es igual al 

cuadrado de la suma, cuyo resultado es 13 2 169 

Otra operación que se utiliza con frecuencia implica la sumatoria del producto. Esto es, 

suponiendo que tenemos dos variables, X y Y, cada una con n observaciones. 

Entonces, 

n 

 

i 1 

X Y 

i 

i 

X Y X Y 

1 

1 

2 

2 

X 

3 

Y 

3 

... X 

n 

Y 

n 

Continuando con el ejemplo anterior, suponiendo que también se tiene una segunda 

variable Y cuyos valores son Y , Y 3, Y 2, 

Y 4 y Y 3 Entonces, 

5 

 

i 1 

(2)(1) (0)(3) ( 1)( 

2) 

(5)(4) (7)(3) 

2 0 2 20 21 

45 

X Y 

i 

i 

X Y 

1 

n 

i1 

1 

X Y 

2 

2 

X Y 

3 

1 

1 

2 3 

4 

5 

 

3 

X Y 

4 

4 

X Y 

Al calcular X i 

Yi 

debemos tomar en cuenta que el primer valor de X por el primer 

valor de Y más el segundo valor de X por el segundo de Y, y así sucesivamente. Estos 

productos cruzados luego se suman con el propósito de obtener el resultado deseado. 

Sin embargo, debemos observar en este punto que la sumatoria de productos 

cruzados no es igual al producto de las sumas individuales, es decir; 

n 

n n 

 

 

 

i1 

X 

iYi 

 

 

 

i1 

X 

i 

 

 

 

i1 

Yi 

 

 

5 

 

En nuestro ejemplo, X 13 y Y 1 

3 ( 2) 

4 3 9 de modo 

i 1 

i 

5 

5 

 

i 1 

5 5 

n 

 

 

que 

X 

i 

Yi 

(13)(9) 117. Esto no es lo mismo que X i 

Yi 

, que es igual a 

i1 

 

i1 

 

i1 

45. 

Antes de estudiar las cuatro reglas básicas para efectuar operaciones con notación 

sigma, será de ayuda presentar los valores de cada una de las cinco observaciones de 

X y de Y en forma de tabla: 

5 

i 

Observación X i 

Y i


1 

2 

3 

4 

5 

2 

0 

-1 

5 

7 

1 

3 

-2 

4 

3 

5 

 

i1 

X 13 

Y 9 

i 

5 

 

i1 

i 

Regla 1: La sumatoria de los valores de dos variables es igual a la suma de los 

valores de cada variable sumada. 

n 

 

i1 

X 

i 

Yi 

X 

i 

 

n 

i1 

En nuestro ejemplo: 

5 

 

i 1 

 

n 

i1 

3 3 ( 3) 

9 10 22 

5 

 

i 1 

X 

X 

i 

i 

Y 

 

5 

i 

 

i 1 

Y 

Y 

13 9 22 

i 

(2 1) (0 3) ( 1 

( 2)) 

(5 4) (7 3) 

i 

Regla 2: La sumatoria de una diferencia entre los valores de dos variables es igual a 

la diferencia entre los valores sumados de las variables. 

n 

 

i1 

( X 

i 

Y 

) 

i 

n 

 

i1 

X 

i 

 

n 

 

i1 

Por consiguiente, en nuestro ejemplo, 

5 

 

i1 

 

X 

1 

( 3) 

11 

4 

4 

i 

Y 

5 

 

i1 

i 

X 

 

i 

Y 

i 

(2 1) 

(0 3) ( 1 

( 2)) 

(5 4) (7 3) 

 

5 

 

i1 

Y 13 

9 4 

i 

Regla 3: La sumatoria de una constante por una variable es igual a la constante que 

multiplica a la sumatoria de los valores de la variable. 

n 

 

i1 

cX 

i 

c 

n 

 

i1 

X 

i 

En la que c es una constante. 

Por tanto, en nuestro ejemplo, c =2 

5 

 

i 1 

4 0 ( 2) 

10 

14 

26 

2 

cX 

5 

 

i 1 

X 

i 

i 

 

5 

 

i 1 

2X 

(2)(13) 

26 

i 

(2)(2) (2)(0) (2)( 1) 

(2)(5) (2)(7)


Regla 4: Una constante sumada n veces será igual a n veces al valor de la constante. 

n 

 

i 1 

c nc 

En la que c es una constante. Así pues, si la constante c =2 se suma cinco veces 

tendremos: 

5 

 

i 1 

c 2 2 2 2 2 10 

(5)(2) 10 

En el caso de que i 1 entonces n = (valor final - valor inicial)+ 1 

7 

 

i 2 

c 2 2 2 2 2 2 12 

((7 2) 1) * (2) 12 

Para ilustrar cómo se utilizan las reglas de la sumatoria, podemos mostrar una de las 

propiedades matemáticas pertenecientes al promedio o media aritmética. 

n 

X 

X i 

i1 

0 

Esta propiedad establece que la sumatoria de las diferencias entre cada observación y 

la media aritmética es cero. Esto se puede probar matemáticamente de la siguiente 

manera: 

1.- De la ecuación (4.1), 

n 

 

X 

i 

i 

x 1 

n 

Así pues, utilizando la regla 2 de la sumatoria, tenemos: 

n 

n n 

X 

i 

X X 

i 

 

i 1 

i 1 

i 1 

X 

2.- Puesto que, para cualquier conjunto fijo de datos, X Puede ser considerada como 

una constante, de la regla 4 de la sumatoria tenemos: 

n 

 

i 1 

X nX 

Por consiguiente, 

n 

n 

Xi 

X Xi 

nX 

i 1 

i 1 

3.- Sin embargo, de la ecuación (4.1), puesto que 

n 

 

Xi 

n 

i 

X 1 Después n X 

n 

Por consiguiente, 

n 

n n 

X 

i 

X X 

i 

 

i1 

i1 

i1 

X 

i 

X i 

i 1 

De esta manera se ha demostrado que:


n 

X 

i 

X 0 

i1 

PROBLEMA para ejercitar 

Suponiendo que se tienen seis observaciones de las variables X y Y tales que 

X , X 1, X 5, X 3, 

X 1, X 2yY 

4, Y 0, Y 1, 

Y 2, Y 7, Y 

1 

2 

2 3 4 

5 6 

1 2 3 4 5 6 

 

Calcule cada una de las siguientes sumatorias. 

3 

6 

a) X 

i1 

6 

c) X 

i1 

6 

i 

2 

i 

e) X i 

Yi 

i1 

6 

b)Y 

i 

i1 

6 

d)Y 

i 

i1 

6 

 

2 

f) X 

 

i1 

i 

Y i 

6 

 

g) 

i1 

6 

 

6 

2 

X 

i 

Y i 

h) X 

i 

3Y 

i 

2X 

i 

 

i) cX 

i 

, 

c 1 

j) X 

3Y 

c, 

c 3 

i1 

i1 

6 

 

i1 

i 

i


MEDIDAS DE CENTRALIZACIÓN 

El objetivo principal de las medidas de tendencia central es poder representar por 

medio de un solo número al conjunto de datos, es decir, dan valores representativos 

de la distribución de frecuencias, situados en algún lugar intermedio, alrededor del 

cual, se encuentran los otros valores. Nos indican dónde tienden a concentrarse los 

valores. 

Existen tres medidas de tendencia central generales, que son, la Media aritmética, la 

Mediana y la Moda; así como otras que se utilizan en casos particulares como la 

Media ponderada, la Media Armónica, la Media Geométrica, la Media Cuadrática. 

MEDIDAS DE TENDENCIA CENTRAL GENERALES. 

, 

x 

Media Aritmética: Es el promedio de los datos, y su objetivo principal 

es encontrar el valor que debería de estar en el centro. Su ventaja 

principal es que es la única medida en la que x 

x 0 , su 

inconveniente es que se ve influida por valores extremos. 

Datos No Agrupados: 

 

x 

= 

n 

X 

i 1 

i 

n 

X= cualquier dato 

Número total de datos 

Ejemplo: Calcular la media aritmética de los números 10, 12, 36, 25,58 

1012 

36 

25 

58 121 

x 

24.2 

5 

5


Datos Agrupados: 

x = 

k 

 

i1 

f 

i 

*X 

n 

i 

Frecuencia por la marca de clase de cualquier renglón 

Número total de datos 

Dónde: k = última clase 

Nota: La media muestral se denota X, la media poblacional se conoce como . 

Ejemplo: calcular el salario promedio de: 

Salario 

(X) 

No. De emp. 

(F) 

$15,000 18 

$20,000 35 

$25,000 29 

Como f 82 n sustituimos en la formula y se 

Obtiene: 

x 

15000*18 20000*35 25000* 29 

82 

1695000 

$20,670.70 

82 

Mediana x ~ : Es el valor central, el que delimita al 50% de los datos, es decir, es el 

valor que se encuentra exactamente en la mitad de los datos. 

Datos No agrupados: En los datos ordenados se aplica la siguiente relación, 

para encontrar la posición de los datos. 

posición n 1 ; En donde n = número total de datos 

2 

Entonces podemos tener sólo dos alternativas 

a) El valor de la posición puede ser entero y lo único que debemos hacer es contar el 

número de lugares que nos indica esta fórmula. 

b) El valor de la posición nos da un valor decimal (.5) y entonces debemos: sumar los 

valores involucrados y dividirlos entre 2. Por ejemplo; si tenemos los valores 5, 7, 

8, 13 entonces la posición nos da 2.5 por que tendremos que seleccionar a los 

números 7 y 8 para luego sumarlos (15) y dividirlos entre 2 (7.5) 


Se localiza la clase o renglón que contiene a la mediana, con la siguiente condición


n +1 

fa , es decir debemos encontrar la primera frecuencia acumulada que 

2 

sea mayor o igual a la posición, para posteriormente aplicar la siguiente 

fa 

formula: X ~ posición 

 

= FI + 

anterior * 

i donde: 

f 

FI Fa F i 

Frecuencia Frecuencia 

acumulada del renglón de 

anterior al la mediana 

renglón de la 

mediana 

Frontera o 

límite 

verdadero 

inferior del 


mediana 

Tamaño de 

intervalo en el 


mediana 

Nota: Si la posición, en los datos no agrupados, es decimal (.5), se toma el promedio 

del dato anterior y el siguiente. 

Ejemplo: Calcular el sueldo mediano de: 

Fronteras($) Salario 

(X) 

12,500- $15,00 

17,500 0 

17,500- $20,00 

22,500 0 

22,500- $25,00 

27,500 0 

No. De emp. 

(F) 

18 

35 

29 

Primero se obtiene la posición: 

posición 

821 

41.5 

2 

Entonces buscamos el renglón de la mediana buscando la fa igual o más grande de 

41.5, como 18+35 = 53, entonces decimos que es el segundo renglón o clase donde 

se encuentra la mediana y aplicamos la fórmula: 

fa 

41.5-18 

X ~ posición 

 

= FI + 

anterior 

 

*i 

17500 

*5000 

$20,857.14 

f 

35 

Moda Xˆ : Es el valor más frecuente, el que se observa mayor número de veces. 

Datos No Agrupados: Después de ordenar los datos buscamos el valor que más se 

repite.


Ejemplo: Encontrar la moda de; 47, 48, 49, 49, 49, 51, 51, 52. Podemos observar que 

el número que más se repite es el 49. Si ningún valor se repite, no existe moda 


Se localiza la clase modal buscando la frecuencia más alta y después se aplica la 

siguiente fórmula: 

1 

 

Xˆ = FI + 

 

*i 

1 

 

2 

donde : f f 

 

1 

2 

f f 

anterior 

posterior 

Nota: La distribución puede ser: amodal, unimodal, bimodal, trimodal,...., polimodal. 

Ejemplo: Calcular el salario que más se repite en: 

Fronteras($) Salario 

(X) 

12,500- $15,00 

17,500 0 

17,500- $20,00 

22,500 0 

22,500- $25,00 

27,500 0 

No. De emp. 

(F) 

18 

35 

29 

Observamos las frecuencias (No. de empleados) y decimos que la clase modal es la 

segunda, porque 35 es la frecuencia más grande y aplicamos: 

1 

Xˆ = FI + 

 

1 

 

donde : f f 

 

1 

2 

2 

f f 

 

17 

*i 17500 

*5000 $21,195.65 

 

17 

6 

3518 

17 

anterior 

posterior 

35 

29 6 

Relación entre Media Aritmética, Mediana y Moda: 

Para distribuciones unimodales que sean poco asimétricas: 

X Xˆ 3 X X ~ 

 

 

Sus posiciones relativas, según la simetría de la distribución de frecuencias son: 

Relación 

Simetría 

X 

X = X Simétrica 

X < X < X Sesgo positivo


X 

X > X Sesgo negativo 

Nótese que en nuestros ejemplos tenemos: 

Xˆ 

X ~ 

> X esdecir 21195.65 

20857.14 

20670.7 

MEDIDAS DE TENDENCIA CENTRAL PARA CASOS ESPECIALES 

Media Aritmética Ponderada X 

p : Es el promedio de los datos en donde se le da un 

peso o importancia específica a cada observación. Se calcula: 

X 

w 

= 

n 

 

W*X 

i 

i1 

n 

 

i1 

W 

i 

i 

Producto de cada uno de los datos por su ponderación 

Suma de las ponderaciones 

Ejemplo: 

Se desea obtener el precio promedio de: 

Precio del 

Producto 

Cantidad 

en Kg. 

$ 17.80 75 

$ 35.90 56 

$ 79.45 19 

Aplicamos la fórmula: 

X 

w 

= 

n 

 

W*X 

i 

i1 

n 

 

i1 

W 

i 

i 

(17.8*75) (35.9*56) (79.45*19) 

 

75 

5619 

 

4854.95 

$32.37 

150 

Media Geométrica (G): Con cierto tipo de datos, la media aritmética no da el valor 

promedio correcto. La media geométrica sirve para promediar los crecimientos 

geométricos de una variable. 

Si suponemos que Y representa el factor de crecimiento geométrico de la variable X, 

Xi 

es decir: Yi 

entonces el factor de crecimiento geométrico promedio de la 

Xi 

1 

variable X será:



G 

n 

Y 

1 

* Y2 

* * 

Yn 

Ejemplo: 

Si los precios de la acción “Anáhuac” en los últimos cuatro días fueron; 4.75, 5.23, 

4.78 y 6.32 calculan el factor de crecimiento promedio y el crecimiento porcentual 

promedio. 

Existen dos formas de resolverlo: 

a) De la forma más ortodoxa, es decir: 

5.23 4.78 6.32 

n Y *Y * *Y 3 

1 2 

 

n 

* * 1.330526316 

1.099869493 

4.75 5.23 4.78 

G 

3 

Lo que acabamos de obtener es factor de crecimiento promedio y para obtener el 

crecimiento se aplica la siguiente formula: 

crecimient o 

( 1 

G) *100 (1 1.099869493) *100 9.9869% 

6.32 

b) Otra forma es G 

último número de datos -1 3 

3 1.330526316 

1. 099869493 

primero 4.75 


G 

n 

Y 

f 

1 

1 2 

Y k 

* Y * * 

f 

2 

f 

k 


Nota: Se puede demostrar que X G. 

También puede calcularse la media geométrica ponderada. 

Ejemplo: 

Supóngase que se cuenta con la información diaria de los incrementos porcentuales 

de una acción y que se representan en la siguiente tabla: 

Crecimiento 

porcentual 

(%) 

Frecuencias 

en días 

10 14 

20 15 

30 48 

a) Calcular los factores de crecimiento.


 

y 1 

 

 

crecimiento porcentual 

 

100 

b) Calcular el factor de crecimiento promedio 

G 

n f1 f2 

fk 

77 14 15 48 

Y * Y * * Y 1.10 *1.20 *1.30 1.2415965 

1 

2 

k 

Media Armónica (H): Cuando los datos a promediarse están medidos en unidades 

expresadas en forma de cocientes (km./hr., $/lt, etc.), lo más adecuado es utilizar la 

media armónica, ya que la media aritmética nos llevará a un promedio equivocado. 


H 

n 

 

n 

1 

i 1 X i 

Ejemplo: 

Si un vehículo se mueve de la ciudad A a la B a 65 Km./hr y regresa de B a A a 98 

Km./Hr a qué promedio se desplazó. 

H 

n 

 

i1 

n 

1 

X 

i 

 

1 

65 

2 

 

1 

98 

78.1595 


H 

k 

 

i1 

n 

fi 

X 

i 


Nota: Se puede demostrar que X G H. 

También puede calcularse la media armónica ponderada. 

Ejemplo: 

Supóngase que una flotilla de vehículos muestra la siguiente información: 

Velocidad 

promedio 

en km/hr 

Número 

de 

vehículos 

50 15 

60 28 

75 31


La respuesta es: 

H 

k 

 

i1 

n 

fi 

X 

i 

 

74 

62.711864 

15 28 31 

 

50 60 75 

Media Cuadrática (MC): 

La media cuadrática nació con el objetivo de poder obtener el promedio de valores 

positivos y negativos al mismo tiempo, esta medida será la que nos permita generar a 

las medidas de dispersión (ver medidas de dispersión). 

Datos no agrupados: 

MC 

n 

 

i1 

 

n 

x 

2 

i 

Ejemplo: 

Supóngase que se obtienen las ganancias y pérdidas del precio de una acción durante 

una semana; - 4.00, - 3.50, 2.35, 6.20, 3.25 Calcular el promedio: 

MC 

n 

 

i1 

n 

x 

2 

i 

 

( 4.0) 

2 

( 3.5) 

2 

2.35 

5 

2 

6.2 

2 

3.25 

2 

 

50.775 

3.186691 

5 

Datos agrupados: 

MC 

k 

 

i1 

 

f x 

n 

2 

i i 

Ejemplo: 

Ahora deseamos obtener el promedio de una tabla de distribución de frecuencias pero 

con datos positivos y negativos. 

Ganancias y 

pérdidas del 

precio de 

una acción 

(x) 

No. De 

días 

(f) 

-7.25 25 

2.75 14 

12.75 2


MC 

n 

 

i1 

f 

n 

x 

2 

i i 

 

25*( 7.25) 

2 

14* 2.75 

41 

2 

2*12.75 

2 

6.5239


MEDIDAS DE POSICIÓN 

Ayudan a localizar el valor de la variable que acumula cierto porcentaje específico de 

datos. 

Cuartiles (Q): Encuentran el valor acumulado al 25%, 50% y 75% respectivamente. 

Deciles (D): Representan el 10%, 20%,..., 90% de los datos acumulados 

respectivamente. 

Percentiles (P): Representan el 1%, 2%,..., 99% de los datos acumulados 

respectivamente. 

Cada cuantil delimita dos regiones: 

- el p% de datos de menor valor (acumulados a la izquierda del cuantil C) 

- el (1-p) % de datos de mayor valor (acumulados a la derecha del cuantil C). 


En los datos ordenados: se debe calcular la posición mediante la fórmula: 

j *( n 1) 

Posición 

r 

donde: 

j Número de cuantil que sedesea obtener 

r puede ser 4,10o100depende del cuantil 

que se deseeobtener 

n número de datos


Después de calcular la posición se utiliza la siguiente fórmula para encontrar el cuantil 

deseado: 

dato menor (dato mayor - dato menor)*fracción de la posición 

Ejemplo: 

Dados los números 3, 5, 7, 36, 45; obtener el número que represente al 75% de los 

datos. 

Solución: 

Primero obtienes la posición 

N = 5 

J = 75 

R = 100 

75*(5 1) 

100 

4.5 

2. Identificamos que números están en la cuarta y quinta posición, es decir el 36 y el 

45 

3. Aplicamos la fórmula: 

36 

(45 

36) * 0.5 40.5 

Es decir, el número que representa al 75% de los datos es el 40.5 


Primero calculamos la posición como en los datos no agrupados, después buscamos 

la primer fa posición, y aplicamos la siguiente formula: 

Posición de la mediana 

. 

 

 

C = FI+ 

 

 

 

j * 

 

 

n 1 

 

fa 

r 

f 

anterior 

 

 

* i 

 

 

 

Frontera inferior 

Frecuencia acumulada anterior al 

renglón seleccionado 

Tamaño de intervalo del renglón seleccionado 

Frecuencia del renglón seleccionado


Ejemplo 

Encontrar el cuartil 3 de la siguiente tabla 

Fronteras Frecuencia Fa 

100 - 200 389 389 

200- 300 258 647 

300 - 400 452 1099 

C = FI + 

 

j* n 1 

 

fa 

r 

f 

 

 

 

anterior 

3*(10991) 

 

 

647 

 

4 

*i 300 

 

 

*100 339.3805 

452


MEDIDAS DE DISPERSIÓN 

Rango (o Intervalo): 

Es la distancia que existe entre el 

menor y el mayor valor de los datos. 


rango max min 


rango LS k 

LI 1 

Donde k = última clase 

Rango Semi-Inter Cuartil (Q): (o 

Desviación Cuartil) 

Mide el rango promedio de una cuarta 

parte de los datos (evita los valores extremos) 

Q 

Q 

Q 

2 

3 

 

1 

Desviación Media Absoluta (DM): (o Desviación Absoluta Promedio) 

Es la distancia promedio de los datos a su media. 


DM = 

n 

 

i1 

X X 

n 

i 


DM = 

k 

 

i1 

f 

i 

X X 

n 

i 

Varianza: 

Poblacional ( 2 ) es el promedio cuadrático de la distancia de los datos a su media



Las varianzas se calcularan con: 

N 

 

2 i1 

= 

 

2 

 

 

 

 

N 

 

i1 

X 

X 

N 

i 

N 

 

i 

2 

 

2 

 

 

 

 

2 

 

Y la desviación estándar se podrá obtener con: 

= 

 

N 

 

i1 

 

 

 

 

 

N 

 

i1 

X 

X 

N 

i 

 

N 

i 

2 

 

2 

 

 

 

 

2 

 

varianza simplificada 

desviación estándar simplificada 


k 

 

2 i1 

= 

 

2 

 

 

 

k 

 

i1 

f i 

La desviación estándar 

f 

 

i 

N 

X 

N 

X 

i 

i 

 

2 

 

 

 

 

 

2 

2 

 

varianza 

simplificada


= 

k 

 

i1 

f i 

 

X 

i 

N 

 

 

2 

 

 

 

 

 

k 

 

i1 

f 

i 

N 

X 

i 

2 

 

 

 

 

2 

 

desviación 

estándar simplificada 

Muestral (S 2 ) la suma de las distancias al cuadrado se divide entre en número de 

datos menos uno: 


s 

s 

2 

2 

= 

N 

 

i1 

 

x 

n -1 

 

N 2 

x i 

i1 

 

n -1 

 


s 

s 

= 

 

N 

 

i1 

 

x 

i 

x 

n -1 

i 

 

N 2 

x i 

i1 

 

n -1 

 

x 

2 

 

 

 

2 

 

 

 

2 

nx 

 

n 1 

2 

nx 

 

n 1 

varianza 

desviación 

simplificada 



 

da 

s 

2 

= 

k 

 

i1 

f 

i 

x 

i 

n -1 

x 

2 

s 

2 

 

 

 

 

 

k 

 

i1 

f 

i 

x 

i 

n -1 

2 

2 

 

nx 

 

n 1 

 

varianza 

simplifica



s 

s 

= 

 

k 

 

i1 

 

 

 

 

k 

f 

 

i1 

i 

f 

 

x 

n -1 

i 

x 

i 

n -1 

i 

x 

2 

 

2 

2 

 

nx 

 

n 1 

 

desviación 


Nota: S 2 para muestras "chicas". Para muestras grandes S 2 o 2 prácticamente no 

difieren. 

Desviación Estándar: 

Mide la variación de los datos en términos absolutos. Es la raíz cuadrada positiva de la 

varianza. 

2 

Poblacional: 

Muestral: S = S 2 

La desviación estándar se interpreta construyendo intervalos alrededor del promedio: 

Ejemplo: 

Nota: Estos ejemplos pretender enseñarte el uso de las fórmulas, por lo que, no se 

utilizarán todas las de dispersión, ya que, todas funcionan para el mismo fin. 

Supóngase que se tiene la información siguiente: 

No. de horas 

que estudia 

un alumno 

No. De 

alumnos X F*X X- x F*(X- x ) 2 

10 - 20 25 15 375 -8.267 1708.44 

20 - 30 38 25 950 1.733 114.17 

30 - 40 12 35 420 11.733 1652.05 

a) Debemos obtener la media aritmética. Sumando (f * x)/n = 1745/75=23.2667 

b) Después calculamos X- x . Es decir cada una de las marcas de clase menos 

la media aritmética. 

c) Obtenemos la columna F*(X- x ) 2 y la sumamos (3474.67) 

d) Por último aplicamos la fórmula de la desviación estándar:


= 

N 

i1 

 

i 

N 

 

X 

2 

 

3474.67 

75 

6.8065 

Intervalo de confianza: 

a) Teorema de Chebyshev. El teorema dice que no importa la forma que tenga la 

distribución podemos calcular el porcentaje de valores que se encuentran dentro 

de K desviaciones estándar mediante la siguiente formula: 

1 

% 1 *100 

2 

k 

De ésta forma tenemos que: 

- al menos el 75% de los valores cae dentro de 2 desviaciones estándar alrededor de 

la media: X 2S 

- al menos el 89% de los valores caen dentro de 3 desviaciones estándar alrededor de 

la media: X 3S 

b) Regla Empírica. 

Si la distribución es una curva acampanada, unimodal y simétrica: 

- aproximadamente el 68% de los datos (población) se encuentran a una desviación 

estándar alrededor de la media: X S 

- aproximadamente el 95% de los datos (población) se encuentran a 2 desviaciones 

estándar alrededor de la media: X 2S 

- aproximadamente el 99% de los datos (población) se encuentran a 3 desviaciones 

estándar alrededor de la media: X 3S


Coeficiente de Variación (CV): Mide la variación relativa de la variable con respecto a 

su promedio. Mide la magnitud de la desviación estándar en relación con la magnitud 

de la media. Se expresa en por cientos. 

CV = S X 100


MEDIDAS DE FORMA 

Proporcionan un valor numérico para saber hacia qué lado de la distribución hay 

mayor acumulación de frecuencias y si la concentración central de frecuencias es 

mayor que en los extremos o viceversa sin tener que graficar los datos. 

Momento Respecto de la Media: El r-ésimo momento respecto a la media aritmética 

es: 


m 

r 

 

n 

 

i1 

x x 

i 

n 

r 

 


m 

r 

 

n 

 

f 

i 

i1 

 

n 

r 

 

x x 

i 

El primer momento respecto a la media (r=1) siempre es igual a cero. 

El segundo momento respecto a la media (r=2) es la varianza poblacional. 

Coeficiente 

momento 

de sesgo 

a 3 

= 0 

a 3 

> 0 

a 3 

< 0 

Sesgo 

No hay sesgo. La 

distribución es 

insesgada 

La distribución tiene 

sesgo positivo o a la 

derecha. 

La distribución tiene 

sesgo negativo o a la 

izquierda. 

Sesgo: Es el grado de asimetría que tiene la distribución o en otras palabras es el 

análisis del comportamiento de los datos con respecto al eje de las “X”. La distribución 

puede ser: 

Insesgada: (sin sesgo). Si tiene forma de campana y el área acumulada del centro de 

la distribución a la derecha es igual a la que se acumula a la izquierda.


Con sesgo positivo o a la derecha: Si tiene la mayor acumulación de frecuencias a 

la izquierda y una cola larga a la derecha. 

Con sesgo negativo o a la izquierda: Si la mayor acumulación está a la derecha y 

tiene una cola larga a la izquierda. 

Coeficiente Momento de Sesgo (a 3 

): también conocido como coeficiente de 

asimetría se calcula dividiendo el tercer momento respecto a la media entre la 

desviación estándar al cubo: 


a 

3 

 

m 

S 

3 

3 

 

n 

 

i1 

 

x 

i 

ns 

 

3 

x 

 

3 

Número total de datos = n y 

s = desviación estándar


En el caso de calcularlo con Excel la fórmula es distinta: 

sesgo 

 

n 

(n-1) * (n- 2) 

 

* 

 

n 

 

i 1 

x 

i 

x 

s 

3 

 

 

 

 

 

 

Ejemplo: 

Al efectuarse la subasta de Cetes la semana pasada se pudo observar la siguiente 

información: 

Postura Monto 

(millones de pesos) 

Tasa 

% 

A 200 8.75 

B 225 8.40 

C 140 8.65 

D 190 8.50 

E 170 8.90 

F 120 8.80 

G 160 8.65 

H 150 8.70 

Con esta información determine: 

a) El sesgo de los montos de todas las 

posturas. 

Para lograrlo se requiere obtener la media 

aritmética y la desviación estándar por lo 

que procedemos a hacer una tabla: 

montos x- med (x - med)^2 (x - med)^3 

200 30.625 937.890625 28722.90039 

225 55.625 3094.140625 172111.5723 

140 -29.375 862.890625 -25347.4121 

190 20.625 425.390625 8773.681641 

170 0.625 0.390625 0.244140625 

120 -49.375 2437.890625 -120370.85 

160 -9.375 87.890625 -823.974609 

150 -19.375 375.390625 -7273.19336 

sumas 1355 8221.875 55792.96875 

Con estos resultados obtenemos: 

X = 

n 

 

i1 

n 

X 

i 

 

1355 

8 

169.375 

s 

2 

( x ) 

 

n 1 

2 

8221.875 

 

8 1 

1174.55357 

Si le sacamos la raíz cuadrada obtenemos la desviación estándar: 

s 

( x ) 

n 1 

2 

 

8221.875 

8 1 

34.2717


m 

 

S 

n 

 

ns 

 

3 

xi 

x 

3 i1 

a3 

 

3 

3 

3 

55792.9687 5 

 

8 * 34.2717 

0.173253 

El sesgo no dio como resultado 0.17 por lo que afirmamos que es positivo y 

seguramente tendrá una figura como: 


a 

3 

m 

 

S 

3 

3 

 

k 

 

i1 

f 

i 

 

i 

ns 

3 

 

x x 

3 

EJEMPLO: 

Después de encuestar a varios clientes de un banco con respecto a la cantidad de 

fotocopias que había solicitado ese mismo día, se nos muestra la siguiente tabla: 

a) Obtener la media aritmética. 

b) Obtener la desviación estándar. 

c) Obtener el sesgo. 

Respuestas: 

No. de No. de 

Copias clientes 

0 - 10 15 

10 - 20 6 

20 - 30 10 

30 - 40 5 

40 - 50 1


No. 

Copias 

de 

0 - 10 15 

10 a 20 6 

No. de 

clientes 

marca de 

f * (x - f * (x - 

clase (x) X * f x - med med)^2 med)^3 

- 

5 75 12.1621622 2218.772827 -26985.07492 

- 

15 90 2.16216216 28.04967129 -60.64793793 

20 - 30 10 25 250 7.83783784 614.3170197 4814.917182 

30 - 40 5 35 175 17.8378378 1590.942294 28378.97064 

40 - 50 1 45 45 27.8378378 774.9452155 21572.79924 

Sumas 37 635 5227.027027 27720.96421 

n 

 

fiXi 

i1 

635 

a) = 17. 162 

n 37 

b) 

 

f ( x ) 

n 

2 

 

5227.02702 7 

37 

11.8857 

c) 

k 

3 

fixi 

 

i1 

a3 

 

3 

m3 

 

3 

 

3 

n 

27720.96421 

 

37 * 11.8857 

0.4462 

Por lo que podemos concluir que es una curva sesgada a la derecha ya que el 

resultado del sesgo es mayor a cero. 

Curtosis: Mide qué tan puntiaguda es una distribución, con respecto a la Normal, es 

decir, analiza el comportamiento de los datos con respecto al eje de las “Y”. 

La distribución puede ser: 

1. Mesocúrtica: solo la distribución Normal (es el término medio). 

2. Leptocúrticas: Las distribuciones más puntiagudas que la Normal, ya que su 

desviación estándar es muy pequeña. 

3. Platocúrticas: Las distribuciones menos puntiagudas que la Normal, debido a 

que presenta una desviación estándar muy grande con respecto a la 

distribución normal.


Coeficiente momento de curtosis (a 4 

): se calcula dividiendo el cuarto momento 

respecto a la media entre la varianza al cuadrado (o la desviación estándar a la 

cuarta). 

Coeficiente 

momento 

de curtosis 

a 4 

= 3 

a 4 

> 3 

a 4 

< 3 

Curtosis 

La distribución es 

Mesocúrtica. 


Leptocúrtica. 


Platocúrtica. 


a 

4 

 

m 

S 

4 

4 

 

n 

 

i1 

x 

i 

ns 

x 

4 

 

4 

Ejemplo: 

Al efectuarse la subasta de Cetes la semana pasada se pudo observar la siguiente 

información: 

Postura Monto 

(millones de pesos) 

Tasa 

% 

A 200 8.75 

B 225 8.40 

C 140 8.65 

D 190 8.50 

E 170 8.90 

F 120 8.80 

G 160 8.65 

H 150 8.70 

Con esta información determine: 

a) La curtosis de los montos de todas 

las posturas. 

Para lograrlo se requiere obtener la media 

aritmética y la desviación estándar por lo 

que procedemos a hacer una tabla: 

(x - 

montos x- med (x - med)^2 (x - med)^3 med)^4 

200 30.625 937.890625 28722.90039 879638.824 

225 55.625 3094.140625 172111.5723 9573706.21 

140 -29.375 862.890625 -25347.4121 744580.231 

190 20.625 425.390625 8773.681641 180957.184 

170 0.625 0.390625 0.244140625 0.15258789 

120 -49.375 2437.890625 -120370.85 5943310.7 

160 -9.375 87.890625 -823.974609 7724.76196 

150 -19.375 375.390625 -7273.19336 140918.121 

sumas 1355 8221.875 55792.96875 17470836.2 

Con estos resultados obtenemos:


X = 

n 

 

i1 

n 

X 

i 

 

1355 

8 

169.375 

s 

2 

( x ) 

 

n 1 

2 

8221.875 

 

8 1 

1174.55357 

Si le sacamos la raíz cuadrada obtenemos la desviación estándar: 

s 

( x ) 

n 1 

2 

 

8221.875 

8 1 

34.2717 

m 

S 

n 

 

4 

xi 

x 

4 i1 

a4 

 

 

4 

4 

4 

ns 

 

17470836.2 

8 * 34.2717 

1.583 

Por lo que podemos afirmar que nuestra curva es una PLATICURTICA ya que al 

compararla con el número 3 resulta ser menor 


a 

4 

m 

 

S 

4 

4 

Ejemplo: 

 

k 

 

i 

i1 

 

i 

ns 

4 

 

f x x 

4 

Después de encuestar a varios clientes de un banco con respecto a la cantidad de 

fotocopias que había solicitado ese mismo día, se nos muestra la siguiente tabla: 

No. de No. de 

Copias clientes 

0 - 10 15 

10 - 20 6 

20 - 30 10 

30 - 40 5 

40 - 50 1 

d) Obtener la media aritmética. 

e) Obtener la desviación estándar. 

f) Obtener el sesgo. 

Respuestas:


No. 

Copias 

de 

0 – 10 15 

10 a 20 6 

No. de 

clientes 

marca 

de 

clase 

(x) X * f x - med f * (x - med)^2 f * (x - med)^3 f * (x - med)^4 

- 

5 75 

12.1621622 2218.772827 -26985.07492 328196.8572 

- 

2.16216216 28.04967129 -60.64793793 131.1306766 

15 90 

20 - 30 10 25 250 7.83783784 614.3170197 4814.917182 37738.54007 

30 - 40 5 35 175 17.8378378 1590.942294 28378.97064 506219.4763 

40 - 50 1 45 45 27.8378378 774.9452155 21572.79924 600540.087 

Sumas 37 635 5227.027027 27720.96421 1472826.091 

n 

 

fiXi 

i1 

635 

d) = 17. 162 

n 37 

e) 

 

f ( x ) 

n 

2 

 

5227.02702 7 

37 

11.8857 

f) 

k 

4 

fixi 

 

i1 

a4 

 

4 

m4 

 

4 

 

4 

n 

1472826 .09 

 

37 * 11.8857 

1.9946 

Por lo que podemos concluir que es una PLATICÚRTICA ya que el resultado de 

la curtosis es menor al número 3.


MEDIDAS DE CONCENTRACIÓN 

En una distribución, ni la media ni la varianza son explicativas de la mayor o menor 

igualdad en el reparto; para esto usamos las medidas de concentración. 

Consideremos que la variable en cuestión es el salario. Una distribución muy 

concentrada indica que pocos individuos reciben la mayor parte del total, mientras que 

poca concentración supone que todos los individuos tienen un reparto igualitario. 

Índice de Gini: 

Ig 

k1 

 

i 

i1 

 

k1 

Donde: 

p q 

 

i1 

p 

i 

i 

 

k = número de clases o categorías 

f 

p 

i 

= la proporción acumulada de individuos = i 

100 = fra x 100 

n 

q 

i 

= la proporción acumulada del total del producto de f i*x i 

0 Ig 1 

Si Ig=0, la variable está menos concentrada (mejor repartida). 

Si Ig=1, la variable está más concentrada (peor repartida). 

Curva de Lorenz: 

Se grafican los valores de la proporción acumulada de individuos (p) y la proporción 

acumulada del total de la variable (q). 

La función identidad representa la igualdad absoluta, es decir, a la variable cuando no 

está concentrada (la recta a 45 grados). La desigualdad absoluta o máxima 

concentración de la variable indicaría que un solo individuo tenga el total de la variable 

(el triángulo inferior). 

Cuanto más se acerque la Curva de Lorenz a la diagonal, más igualitario será el 

reparto (Ig = 0). Cuanto más se acerque la Curva de Lorenz al triángulo inferior, más 

concentrada esta la variable (Ig = 1).


El Índice de Gini calcula el área entre la diagonal y la Curva de Lorenz, como un 

porcentaje del área del triángulo inferior de la gráfica (mide la desigualdad relativa). 

EJEMPLO: 

Si deseamos obtener la concentración del problema de las copias que sacan los 

clientes de un banco tendríamos: 

Se obtiene 

Se obtiene 

acumulando dividiendo: 

en cada 

x * f 

renglón a fr 

( x * f ) 

No. de No. de marca 

Copias clientes de 

clase 

(x) X * f fr en % P H Q P-Q 

0 - 10 15 5 75 40.5405405 40.54054054 11.81102362 11.81102362 28.72951692 

10 a 6 

20 

15 90 16.2162162 56.75675676 14.17322835 25.98425197 30.77250479 

20 - 30 10 25 250 27.027027 83.78378378 39.37007874 65.35433071 18.42945308 

30 - 40 5 35 175 13.5135135 97.2972973 27.55905512 92.91338583 4.383911471 

40 - 50 1 45 45 2.7027027 100 7.086614173 100 0 

Sumas 37 635 278.3783784 Se obtiene 82.31538625 

k 1 

 

pi 

qi 

i1 

Ig 

k 1 

p 

 

i1 

i 

 

 

82.3153 

278.378 

0.2956 

acumulando 

en cada 

renglón a H 

Como es un valor muy cercano a cero se dice que el conjunto de datos está poco 

concentrado.


Números Índices. 

Los números índices nos permiten describir el comportamiento de una cantidad (o 

varias) a través del tiempo; las circunstancias empresariales fluctúan dentro de 

márgenes muy amplios y cuesta mucho trabajo explicarlas, por ello, los números 

índices pueden disminuir significativamente estas dificultades. Es decir, relaciona un 

valor de un período determinado llamado período base, con otro valor de un período 

diferente, que se denomina período corriente. 

Los números índices se pueden clasificar de la siguiente manera: 

Pc 

Simple I * 100 

P 

b 

Sin 

ponderación 

Donde: 

P preciocorriente 

c 

P preciobase 

b 

P 

i 1 

De precios agregados I * 100 

n 

n 

P 

i 1 

c 

b 

i 

i 

Compuestos 

Ponderados 

 

* Q 

De ponderación fija i1 

I 

* 100 

n 

n 

 

P 

c 

P 

bi 

i1 

n 

 

i 

* Q 

De Laspeyres i1 

I 

* 100 

L 

n 

 

i1 

n 

 

P 

c 

P 

b 

i 

i 

f 

f 

i 

i 

* Q 

b 

* Q 

De Paasche i1 

I 

* 100 

De Fisher 

P 

n 

 

i1 

P 

c 

P 

b 

I I * I 

F 

L 

i 

i 

b 

* Q 

c 

* Q 

P 

c 

i 

i 

i 

i 

El período base puede ser establecido por decreto (en el caso de México), o 

dependiendo de las necesidades del investigador, pero en pocas palabras será el valor 

o precio con el que se harán las comparaciones. 

El período corriente será aquella cantidad o precio que se desea comparar con la 

base.


Los índices simples nos van a servir para describir el comportamiento del precio de 

un bien a través del tiempo, por ejemplo; Si compramos una casa en un millón de 

pesos y dos años después un avalúo nos informa que el nuevo precio de esa casa es 

de un millón quinientos mil pesos entonces tendremos: 

Es decir; que lo adquirido por cada 

I 

Año 

 

P c 

P 

b 

1,500,000 

* 100 

* 100 150.0 

1,000,000 

Precio 

(P) 

$ 

Cebolla Jitomate Frijol carne 

Cantidad 

Cantidad 

Cantidad 

(Q) Kg 

(Q) Kg 

(Q) Kg 

Precio 

(P) 

$ 

$100.00 ahora se podrá adquirir por 

$150.00, o en otras palabras que lo 

que antes de dos años nos costó 

$100.00 ahora nos cuesta $50.00 más. 

Como se puede observar el índice simple resulta muy obvio ya que las cantidades que 

manejamos son individuales y podemos inferir el resultado. 

Los índices compuestos aumentan su importancia, porque nos permiten explorar el 

comportamiento de un grupo de precios de diferentes bienes, es decir, que en forma 

individual cada precio puede subir o bajar sin verse influido por los otros precios, en 

otras palabras, los precios son independientes y excluyentes del comportamiento de 

los otros. De esta forma, no será tan fácil observar el comportamiento global, es decir, 

no podremos percatarnos del crecimiento global o decremento de los bienes en 

conjunto. Por ejemplo. En México existe el análisis de la canasta básica, la cual, 

contiene varios productos que se encuentran controlados por el Estado y otros 

productos (o bienes) que están sujetos al comportamiento del mercado. Además nos 

dan otra ventaja, puesto que, nos permiten relacionar precios con cantidades, ya sean, 

de consumo o de producción. 

Supongamos que tenemos los precios y cantidades de algunos bienes: 

Precio 

(P) 

$ 

Precio 

(P) 

$ 

Cantidad 

(Q) Kg 

1997 2.7 125 10.0 158 15.5 236 22.0 85 

1998 3.0 132 8.0 257 15.9 259 27.0 88 

1999 3.0 135 12.0 159 15.9 289 32.0 95 

2000 3.5 140 17.0 138 16.0 297 34.0 99 

2001 4.0 144 10.0 156 16.0 358 45.0 99 

Si queremos calcular los números índices compuestos tendremos lo siguiente: 

1. Para él cálculo del índice compuesto sin ponderar tendremos que calcular dos 

sumatorias, la que corresponda al año base y la del año corriente. Supóngase que 

el índice que nos interesa es el de 1999, teniendo como base el año 1997. 

5 

P 3.0 12.0 

15.9 

32.0 62.9 , P 

2.7 10.0 

15.5 

22.0 50. 2 

i 1 

c i 

5 

i 1 

b i 

Después de ello las sustituimos en la fórmula: 

n 

Pc 

i 

i 1 

I 

n 

P 

i 1 

b 

i 

* 100 

62.9 

* 100 125.2988 

50.2 

Esto significa que de 1997 a 1999 los precios en conjunto han subido un 25.2988%.


2. Si deseamos obtener el índice compuesto de ponderación fija para el año 1999 

teniendo como base el año 1997 y año de ponderación el año 1998, los pasos a 

seguir son: 

Primero tendremos que calcular las sumatorias que corresponden a la fórmula, 

n 

P i 

* Q 

i 1 

c 

f 

i 

(3.0 *132.0) (12.0 * 257.0) (15.9 * 259.0) (32.0 * 88) 10414.1 

n 

P i 

* Q 

i 1 

b 

f 

i 

(2.7 *132.0) (10.0 * 257.0) (15.5 * 259.0) (22.0 * 88.0) 8876.9 

Como podemos observar en este índice se multiplican los precios ya sea del año 

corriente o de la base por la cantidad fija, que en este caso es la del año 1997. 

Segundo paso aplicamos la fórmula: 

I 

 

n 

P 

i 1 

n 

P 

i 1 

c 

b 

i 

i 

* Q 

f 

* Q 

f 

i 

i 

* 100 

10414.1 

* 100 

8876.9 

117.3168 

Podemos concluir que los precios del año 1999 han crecido el 17.3168% con respecto 

a 1997 y tomando la producción fija de 1998. 

3. Ahora calcularemos el índice de Laspeyres para el año 1999 base 1997 y para ello 

tendremos que calcular las siguientes sumatorias. 

n 

P 

i 1 

n 

i 1 

ci 

P 

bi 

* Q 

bi 

* Q 

bi 

(3.0 *125.0) (12.0 *158.0) (15.9 *236.0) (32.0 * 85.0) 8743.4 

(2.7 *125.0) (10.0 *158.0) (15.5 * 236.0) (22.0 * 85) 7445.5 

Y después utilizaremos la fórmula del índice Laspeyres. 

I 

L 

 

n 

P 

i 1 

n 

P 

i 1 

c 

b 

i 

i 

* Q 

* Q 

b 

b 

i 

i 

* 100 

 

8743.4 

7445.5 

* 100 

117.4320 

Nótese que el resultado nos indica que el año 1999 ha crecido 17.4320 % con 

respecto al año 1997 tomando en cuenta el consumo (cantidad) de 1997. Además de 

que casi no cambia el resultado con respecto al índice de ponderación fija, ya que, los 

consumos de los años 1997 y 1998 son muy semejantes pero si hubiera diferencias 

significativas, estos valores serían diferentes. 

4. En el caso de que deseáramos calcular el índice de Paasche del año 1999 base 

1997 los pasos serán:


n 

P i 

* Q 

i 1 

n 

c 

c 

P i 

* Q 

i 1 

b 

c 

i 

i 

(3.0 *135) (12.0 *159.0) (15.9 * 289.0) (32.0 * 95) 9948.1 

(2.7 *135.0) (10.0 *159.0) (15.5 * 289.0) (22.0 * 95.0) 8524.0 

Y sustituyendo en la fórmula: 

I 

P 

 

n 

P 

i 1 

n 

P 

i 1 

c 

b 

i 

i 

* Q 

* Q 

c 

c 

i 

i 

* 100 

 

9948.1 

8524.0 

* 100 

116.7069 

Ahora observamos que el crecimiento del año 1999 con respecto a 1997 tomando 

como ponderación el año 1999 es de 16.7069% es decir, menor que el índice de 

Laspeyres debido a que la ponderación es distinta. 

5. Por lo anterior será conveniente calcular el promedio geométrico de los índices de 

Laspeyres y de Paasche para encontrar el valor más representativo del 

crecimiento del año 1999 base 1997 de los productos antes mencionados: 

I 

F 

 

I 

L 

* I 117.4320 *116.7069 117.0689 

P 

En Economía y negocios debe tomarse en cuenta que cuando los costos permanecen 

constantes y el precio muestra cambios en el tiempo entonces podemos hablar de 

inflación para el caso en el que el precio aumente y deflación para el caso en el que 

el precio se vea disminuido. 

Muchas veces se desea cambiar el año base y para ello se debe utilizar la siguiente 

fórmula: 

I 

In 

 

I 

c 

b 

*100 

Es decir, sólo tenemos que dividir el índice que desea tener como valor corriente 

entre el índice que deseamos sea el año base.


CORRELACIÓN. 

La correlación es la forma numérica en la que la estadística ha podido evaluar la 

relación de dos o más variables, es decir, mide la dependencia de una variable con 

respecto de otra variable independiente. 

Para poder entender esta relación tendremos que analizarlo en forma gráfica: 

edad peso 

15 60 

30 75 

18 67 

42 80 

28 60 

19 65 

31 92 

represente la tendencia de los datos, que en otras 

palabras podría decirse que se observa que a 

mayor edad mayor peso. 

Si tenemos los datos que se presentan en la tabla y 

consideramos que la edad determina el peso de las 

personas entonces podremos observar la siguiente 

gráfica: 

50 

0 

1698 47 

2045 15 

1348 100 

1268 120 

demanda 

Donde los puntos representan cada uno de los pares 

ordenados y la 

150 

línea podría ser 100 

una recta que 

1000 1500 2000 

La correlación se puede explicar con la pendiente 

de esa recta estimada y de esta forma nos 

podemos dar cuenta que también existe el caso en 

el que al crecer la variable independiente decrezca 

la variable dependiente. En aquellas rectas estimadas cuya pendiente sea cero 

entonces podremos decir que no existe correlación. 

Así en estadística podremos calcular la correlación para datos no agrupados con la 

siguiente formula. 

Ejemplo: 

r 

 

n 

 

n 

 

i1 

x 

2 

i 

n 

n 

 

 

 

 

x y 

 

i1 

 

 

 

 

 

 

n 

 

 

 

i1 

 

i i i 

i1 i1 

i1 

n 

x 

i 

2 

n 

x 

n 

* 

y 

n 

2 

i 

y 

i 

 

 

 

n 

 

i1 

y 

2 

 

 

 

i 

 

 

 

En donde: 

R = coeficiente de 

correlación 

N = número de pares 

ordenados 

X = variable independiente 

Y = variable independiente 

Edad (x) Peso (y) X 2 Y 2 X* Y 

15 60 225 3600 900 

30 75 900 5625 2250 

18 67 324 4489 1206 

42 80 1764 6400 3360 

28 60 784 3600 1680 

19 65 361 4225 1235 

31 92 961 8464 2852 

183 499 5319 36403 13483 

Supóngase que deseamos obtener la correlación de los datos de la tabla anterior: 

Ahora podemos observar que:


r 

n n n 

n x y x * y 

i 1 

i i 

i 1 

i 

i 1 

i 

7 *13483 (183 * 499) 

 

0.65638606 

 

2 

2 

7 * 5319 (183) 

2 7 * 36403 (499) 

2 

n 

 

 

2 

2 

 

 

 

n n 

 

n 

n x x n y y 

i 1 

i 

i 

1 

i 

 

i 1 

i 

i 

1 

i 

 

 

 

 

Se debe aclarar que el coeficiente de correlación sólo puede variar de la siguiente 

manera: 1 r 1 y que para entenderlo mejor se debe obtener el coeficiente de 

determinación que se obtiene con “r “cuadrada, ya que este representa el porcentaje 

que se explica “y” mediante los datos de “x”. 

En nuestro ejemplo decimos que la correlación es casi perfecta, ya que, está muy 

cerca de 1 y que el porcentaje de datos que explican a “y “es (0.65638606) 2 = 

0.430842 o sea el 43.08 % 

En el caso de que fueran datos agrupados tendremos lo siguiente: 

Primero tendremos que pensar que se genera una matriz, ya que, ahora estamos 

juntando dos tablas de distribución de frecuencias y por ello nuestros cálculos serán 

más laboriosos, por lo que les recomiendo el uso de una hoja de cálculo o al menos 

una calculadora con regresión para datos agrupados. 

De cualquier forma aquí también estamos evaluando numéricamente si existe relación 

entre dos variables y lo haremos con la siguiente ecuación. 

k l 

l 

k 

En donde podemos 

n 

f 

xi 

y 

i 

fx 

xi 

* fy 

y 

i 

encontrar k como el 

j 1 

i 1 i 1 

i 1 

r 

número de clases para la 

2 

2 

l 

l 

2 

k 

k 

 

 

 

 

variable "y" y l para el 

2 

n fx 

xi 

fx 

xi 

n fy 

y 

i fy 

y 

i número de clases de "x". 

i 1 

i 1 

i 1 

 

i 1 

También podemos 

observar que hay varios 

tipos de "f" es decir, la que se encuentra sola (sin subíndice) que nos habla de las 

frecuencias celdares (cada una de las frecuencias que se encuentran en la 

intersección entre una columna y un renglón) y las "f" con subíndices que representan 

las frecuencias de cada una de las variables. 

Para entender el uso de esta fórmula usaremos un ejemplo: 

Los resultados que se presentan en la siguiente tabla representan los pesos y las 

estaturas de 48 alumnos entrevistados el "día Anáhuac" 

Microsoft Excel 

97-2003 Worksheet 

Dar doble clic para ver un ejemplo 

resuelto 

La sustitución de la fórmula es la siguiente:


r 

k 

l 

l 

n f xiyi 

fxxi 

* fyyi 

j 1 

i 1 i 1 

i 1 

 

2 

2 

l 

l 

2 

k 

k 

2 

 

 

n 

f 

 

xxi 

fxxi 

n fyyi 

fyyi 

 

i 1 

1 

1 

1 

i i 

 

i 

k 

48 * 5380.77 - (82.06 * 3116) 

((48 *140.8982) - 82.06 

2 

) * ((48 * 212072) - 3116 

2 

0.695 

) 

Debe notarse que la doble sumatoria queda calculada con una matriz que debe 

explicarse en clase pero en el caso de la hoja de cálculo que se te proporciona sólo te 

da el resultado. 

Al interpretar nuestro resultado podemos concluir que si existe relación entre el peso y 

la estatura, es decir, que a mayor estatura mayor peso. 

En muchas ocasiones el resultado de la correlación es negativo y lo que debemos 

pensar es que la relación de las variables involucradas en el cálculo es inverso es 

decir que en la medida que crece la variable independiente la variable dependiente 

decrece: 

demanda 

150 

100 

50 

0 

1000 1500 2000 

Existen otras formas de calcular la correlación entre dos variables, mediante: 

a) Covarianza. 

b) Por rangos de Spearman. 

c) Por mínimos cuadrados. 

Para efecto de este curso sólo daremos las fórmulas del método de covarianza. 

Para datos no agrupados: 

n 

 

( xi 

x)*( 

yi 

y) 

xi 

* yi 

i1 i1 

covxy 

x* 

y 

n 

n 

En donde: 

x = cualquier valor de la variable independiente 

y = el valor correspondiente de la variable dependiente 

x = media aritmética de la variable independiente 

y = media aritmética de la variable dependiente 

n


Para datos agrupados: 

fxy 

covxy x * y 

n 

En donde: 

 

x = cualquier marca de clase de la variable independiente 

y = la marca de clase correspondiente de la variable dependiente 

x = media aritmética de la variable independiente 

y = media aritmética de la variable dependiente 

f = frecuencia celdar (ver atrás) 

Debemos recordar que como esta fórmula es semejante a la de la varianza tendremos 

que tomar en cuenta que si son menos de 30 datos tendremos que utilizar como 

denominador “n-1” 

Para obtener la correlación aplicaremos la siguiente fórmula: 

covxy 

r 

s * s 

x 

y 

En donde: 

S x = Desviación estándar de la variable independiente 

S y = Desviación estándar de la variable dependiente 

Técnicas de conteo.


En muchas ocasiones es necesario saber cuántos son los casos posibles y los casos 

favorables para hacer el cálculo de probabilidades, por lo que es necesario desarrollar 

algunas técnicas para determinar sin enumeración directa estos resultados. 

Principio fundamental del conteo. 

Cuando un evento puede realizarse de n 1 formas diferentes y otro evento puede 

realizarse de n 2 maneras diferentes y así sucesivamente, entonces el número de 

maneras en que los eventos pueden realizarse en el orden indicado es el producto de: 

n 1 *n 2 *n 3 *………*n k 

Ejemplo: Si llegáramos a un restaurante y nos dijeran que podemos escoger de 4 

sopas, 6 guisados, 2 postres y 4 bebidas el número de comidas completas diferentes 

que podríamos organizar sería: 4 * 6 * 2 * 4 = 192 formas diferentes 

Aquí debemos aclarar que si deseamos saber cuántos platillos nos han ofrecido lo que 

se debe hacer es sumarlos, es decir, 4 + 6 + 2 + 4 = 16 

Ordenaciones con repetición 

Este es un caso particular del principio fundamental, ya que, ahora el problema es 

calcular las ordenaciones de un conjunto que no cambia. Por ejemplo: Si tenemos 9 

cajetillas de cigarros cuántos arreglos podemos obtener si deseamos 4 y existe la 

posibilidad de repetición. 

n 1 *n 2 *n 3 *………*n k = n r 

en donde r es el número de veces. 

Sustituyendo la información del problema n r = 9 4 = 6561 

Ordenaciones sin repetición 

Notación factorial. 

Este caso sirve para un conjunto de datos que se desean seleccionar uno a uno hasta 

agotarlos y el orden es importante. Por ello tendremos que calcular el producto de los 

enteros positivos desde 1 hasta n inclusive. Se denota con un símbolo especial n! (n 

factorial). 

n! = 1 * 2 * 3 *…. (n - 2) * (n - 1) * n 

Cuando estemos haciendo operaciones con números factoriales nos podemos 

encontrar con las siguientes situaciones que por definición quedan resueltas. 

0! = 1; 1! = 1 

Ejemplo: 

¿Si debemos ordenar 5 libros de Estadística en un librero cuantas formas diferentes 

tenemos? 

5! = 5 * 4 * 3 * 2 * 1 = 120 

Permutaciones.


Este tipo de operaciones lo utilizamos cuando estamos en la misma condición que en 

la notación factorial pero ahora no agotamos todos los elementos, es decir, buscamos 

una ordenación de un conjunto de n objetos, tomados de r en r. Consideremos que r 

n . Su fórmula es: 

P r n 

n! 

 

( n r )! 

Ejemplo: 

¿De cuántas formas diferentes puedo seleccionar a un representante de la sociedad 

de alumnos de la escuela de Mercadotecnia, a un secretario y un tesorero de diez 

candidatos? 

Del problema anterior sabemos que n = 10 y r = 3, por lo que la sustitución sería: 

n! 

10! 10 * 9 * 8 * 7! 

n 

P r 

 

10 * 9 * 8 720 

( n r )! (10 3)! 7! 

Formas diferentes de 

elegir a tres personas. 

Permutaciones con repetición. 

Este caso es muy especial, pero no por ello difícil de encontrar, y es precisamente 

cuando el evento cuenta con objetos iguales, es decir, no se pueden diferenciar uno 

del otro, pero nos interesa el orden en el que los colocamos. Su fórmula es: 

Pr 

 

n !* n 

n! 

!*........* n 

1 2 

r 

Esto quiere decir, el número de n objetos de los cuales n 1 son iguales, n 2 son 

iguales,……., n r son iguales. 

Ejemplo: Si queremos encontrar el número de mensajes distintos que podemos con 4 

banderas rojas, 2 verdes y 5 azules entonces tendremos que aplicar la fórmula de 

permutaciones con repetición: 

! 

P 

r 

 

n !* n 

1 

2 

n! 

 

!*........* n ! 

r 

11! 

4!*2!*5! 

6930 

Combinaciones. 

Cuando no nos interesa el orden de los datos y sólo queremos ver cuánto arreglos 

podemos formar entonces debemos calcular las combinaciones de n objetos tomados 

de r en r. 

n 

 

r 

 

n 

C 

r 

n! 

 

r!*( 

n r )! 

Ejemplo.


Si tenemos las letras a, b, c y d cuántas combinaciones podemos tener si queremos 

formar palabras de dos letras, aunque no tengan ningún significado. 

n 

 

r 

 

n 

C 

r 

n! 

4! 

 

r!*( 

n r )! 2!*(4 2)! 

4! 

2!*2! 

6 

6 formas diferentes de combinar las letras sin tomar en cuenta el orden, nótese que si 

nos interesa el orden entonces tendríamos que: 

P r n 

n! 

4! 

12 

( n r )! (4 2)! 

Nota: Tú puedes hacer el diagrama de árbol que demuestre lo que acabamos de 

demostrar numéricamente.


Probabilidad 

Para estudiar probabilidad se requiere tener conocimientos de la Teoría de conjuntos a 

continuación recordaremos los conceptos más importantes. Por otra parte, si el 

usuario no tiene aún bien definida la idea de lo que son los conjuntos, lo más 

recomendable será estudiar los temas con mayor profundidad en un libro. 

Conjuntos 

La teoría de los conjuntos constituye un lenguaje apropiado que nos facilita los 

estudios de algunos conceptos importantes de la Teoría de Probabilidad. Un Conjunto 

es una colección bien definida de elementos. Los conjuntos se representan por: A, B, 

C. Los elementos se representan por: a, b, c… etc. Para indicar que un elemento 

pertenece a un conjunto A se representa como: a A y para indicar lo contrario 

a A 

Los conceptos de orden, conteo y cardinalidad 

Ordenar es, en esencia, arreglar las cosas o elementos de una manera no ambigua, 

es decir, una vez definido cual elemento es el inicial, para el resto de ellos siempre se 

podrá decir cual le precede. Cuando los elementos de un conjunto son mediciones al 

menos en una escala ordinal, son susceptibles de ordenarse conforme a algún criterio 

de ordenación previamente establecido, generando así lo que se conoce como 

"conjunto ordenado", denotándose dicho conjunto con el nombre del anterior pero con 

el subíndice "ord". Así, si un conjunto X contiene valores numéricos, el conjunto de 

dichos valores, pero ordenados, se llamará X ord. 

Se conoce como par ordenado a una pareja de valores en la que el orden de sus 

componentes es de suma importancia, denominándose al primer valor como "primera 

componente" del par, y al segundo valor como "segunda componente" del par. 

Ejemplo: Las coordenadas de un punto en el plano son un par ordenado, ya que son 

de la forma (x,y). 

Contar los elementos de un conjunto es efectuar una correspondencia ordenada 1 a 1, 

entre dichos elementos y el conjunto ordenado de los enteros positivos cuyo primer 

elemento sea el 1.


La cardinalidad de un conjunto es el número de elementos que lo constituyen. Esto es, 

para conocer cuántos elementos tiene un conjunto será necesario contarlos, y su 

cardinalidad será el último número correspondido en el conjunto ordenado de los 

enteros positivos, al efectuar el proceso de contar. Lo anterior presenta dificultades 

cuando el conjunto que se pretende contar es un continuo, pues conjuntos de este tipo 

no son "contables". Por lo anterior, se puede concluir que existen conjuntos contables 

y conjuntos no contables. Un conjunto será contable si es susceptible de ordenarse y, 

si no lo es, será no contable. Generalmente esta dificultad se soluciona diciendo que 

los conjuntos no contables tienen cardinalidad infinita. 

El conjunto de los cardinales = C, es de las cardinalidades posibles, las cuales serán 

siempre números enteros no negativos, ya que nunca se podrá hablar de una 

cardinalidad negativa o fraccionaria; es decir, es el conjunto ordenado de los naturales 

con el cero = {0, 1, 2,...}. 

Clasificación de los conjuntos 

Se dice que un conjunto es finito si es contable o numerable. Esta clasificación está en 

función de su propiedad de ser contable y no en función de su cardinalidad, por lo que 

puede darse el caso de conjuntos finitos, pero de cardinalidad infinita, como, por 

ejemplo, el conjunto de los cardinales. 

Se dice que un conjunto es infinito si no es contable. Generalmente su cardinalidad 

también es infinita. 

Operaciones entre conjuntos 

Si se tienen dos conjuntos, digamos A y B, la unión de ellos, denotada por A U B, será 

un conjunto que contenga a todos los elementos de A y a todos los elementos de B 

que no estén contenidos en A. Es fácil observar que es indistinto decir A U B que B U 

A, por lo que este tipo de relación es simétrica. 

Ejemplo: Sean A = {3, 2, 5} y B = {2, 6, 1, 8} 

A U B = {3, 2, 5, 6, 1, 8} = B U A 

Si se tienen dos conjuntos, digamos A y B, la intersección de ellos, denotada por A ∩ 

B, será el conjunto que contenga a aquellos elementos de A que también sean 

elementos de B. Este tipo de relación también es simétrica, pues el conjunto A 

intersección B contiene los mismos elementos del conjunto B intersección A. Cuando 

dos conjuntos no tienen ningún elemento en común, se dice que son conjuntos 

disjuntos o excluyentes, y su intersección será el conjunto vacío. 

Ejemplo: Sean A = {3, 2,5} y B = {2, 6, 1,8} 

A ∩ B = {2} = B ∩ A 

Debemos aclarar que cuando queremos obtener la unión de conjuntos que sí 

presentan intersección es la suma de sus elementos menos la intersección: 

Ejemplo: Sean A = {3,2,5} y B = {2,6,1,8} A ∩ B = {2} y su unión será A U B = A + B 

- (A ∩ B) = {3,2,5} + {2,6,1,8} - {2} = {1,2,3,5,6,8} 

El producto cartesiano es el conjunto de todos los pares ordenados posibles cuya 

primera componente sean los elementos del conjunto que esté primero y que la 

segunda componente de los pares sean los elementos del conjunto que esté en 

segundo lugar. Se denota, suponiendo que los conjuntos sean A y B, como A X B. 

Ejemplo: Sean A = {1, 2, 3} y B = {a, b} 

(3, b)} 

A X B = {(1, a), (1, b), (2, a), (2, b), (3, a),


NOTA: Este tipo de relación no es simétrica, pues generaría a otro tipo de pares 

ordenados. 

La diferencia de dos conjuntos, (A - B) es un conjunto que contiene a los elementos de 

A pero que no están en B. 

Ejemplo: Sean A = {3, 2,5} y B = {2, 6, 1,8} A - B = {3,5} 

Representación de conjuntos y sus operaciones. 

Diagramas de Venn. Este tipo de representación se utiliza fundamentalmente para 

representar a los conjuntos dentro de su universo, y para representar las operaciones 

de unión de los conjuntos, así como la intersección de los mismos. Generalmente 

consiste en un rectángulo que representa al universo, y en círculos interiores para 

representar a los conjuntos de un problema. 

U=Universo 

A = {1, 3, 7, 4} 

B = {8, 5, 3} 

U = {x | x sea un dígito} 

DIAGRAMA DE VENN PARA A Y B 

DIAGRAMA DE VENN DE A ∩B


Arreglo o red. Este tipo de representación gráfica se utiliza para representar al 

conjunto producto cartesiano entre dos conjuntos, notándose que el primer conjunto se 

fija en el eje horizontal, o eje de las abscisas de los ejes cartesianos, y el segundo, en 

el eje vertical o eje de las ordenadas; una vez hecho esto, se pintan los puntos 

correspondientes a todos los posibles pares ordenados generado por el producto 

cartesiano. Si los dos conjuntos son discretos, se generará una colección aislada de 

puntos en el plano; si uno de ellos es discreto, pero el otro continuo, se generarán una 

serie de líneas; si los dos son continuos, se generará un área; véanse las figuras V, VI 

A = {1, 2, 3} 

B = {4, 5} 

Arreglo o red que representa a AXB 

A = {5, 6, 8} 

B = {x | 1 < x < 2} 


A = {x | 2 < x < 4}


B = {x | 1 < x < 2} 


Gráfica arborescente: Ésta es otro tipo de representar al producto cartesiano de dos 

conjuntos, sólo que está restringido a conjuntos discretos. Consiste en poner a los 

elementos del primer conjunto en forma de columna, y a los elementos del segundo 

conjunto combinados también en columna, pero para cada elemento del primer 

conjunto; véase la figura. 

A x B 

1 

2 

3 

4 

5 

a 

b 

c 

d 

a 

b 

c 

d 

a 

b 

c 

d 

a 

b 

c 

d 

a 

b 

c 

d 

(1,a) 

(1,b) 

(1,c) 

(1,d) 

(2,a) 

(2,b) 

(2,c) 

(2,d) 

(3,a) 

(3,b) 

(3,c) 

(3,d) 

(4,a) 

(4,b) 

(4,c) 

(4,d) 

(5,a) 

(5,b) 

(5,c) 

(5,d) 

A = {1, 2, 3, 4, 5} 

B = {a, b, c, d} 

Gráfica arborescente que representa a AXB 

Subconjuntos posibles de un conjunto finito. 

Algunas veces es útil o inclusive necesario, conocer cuántos subconjuntos puede tener 

un conjunto, particularmente si éste tiene cardinalidad finita. Si llamamos "n" a su 

cardinalidad, es posible demostrar mediante el uso del concepto de combinaciones, y 

aceptando al conjunto vacío como un subconjunto, que existen (2) n . 

Definición clásica de probabilidad. 

Si un suceso puede ocurrir de N (casos posibles) maneras mutuamente exclusivas e 

igualmente verosímiles, y si M (casos favorables) de ellas poseen una característica o 

atributo A (el conjunto de todas ellas será el espacio eventual "S", y el conjunto de las


que poseen el atributo será el evento "A"), entonces la probabilidad de A, denotada por 

f M casos favorables 

p(A) = M/N, es decir, p ( A) 

fr 

N N casos posibles 

A esta definición se le conoce también con el nombre de definición a priori de 

probabilidad, pues no requiere de hacer antes alguna prueba experimental, sino que 

excluye la necesidad de ella. 

Cuando se dice que dos sucesos son mutuamente exclusivos, quiere decir que la 

ocurrencia de uno de ellos excluye automáticamente la posibilidad de la ocurrencia del 

otro, y cuando se dice que son igualmente verosímiles, se sobreentiende que ambos 

tienen la misma posibilidad de ocurrir, es decir, los dos eventos unitarios que los 

contengan, tendrán la misma probabilidad. 

Ejemplo: Supóngase un salón de clase de 20 alumnos, de los cuales algunos son 

mexicanos y otros no lo son. ¿Cuál es la probabilidad de que si se toma uno de ellos al 

azar sea mexicano? Véase que el espacio muestral tendrá cardinalidad igual a 20 (el 

suceso puede ocurrir de 20 maneras, N = 20), y suponiendo que hubiera 16 

mexicanos, el evento "que sea mexicano" tendrá a los 16 (M = 16); además, todos los 

sucesos son mutuamente exclusivos, pues cada alumno es un individuo plenamente 

diferenciable, y la ocurrencia de alguno implica la no ocurrencia de los otros 19, así 

como el hecho de que la extracción será al azar garantiza la igual verosimilitud para 

todos. Dado todo lo anterior, se puede aplicar la definición clásica de la probabilidad: 

p (salga un mexicano) = 16/20 = 0.8 

Definición empírica de probabilidad. 

Si un suceso puede ocurrir de diversas maneras mutuamente exclusivas (pero no 

necesariamente iguales verosímiles), y algunas de estas maneras poseen un atributo 

A, entonces la p(A) será igual al límite de su frecuencia relativa, es decir: 

n 

p( 

A) 

Lim 

N 

N 

n número de veces en que se ha cumplido A en las N repeticiones. 

N Número de repeticiones 

Lím = esto indica que la precisión en la estimación del valor verdadero de p(A) se va 

incrementando a medida que N crece, y que se llega al máximo cuando se llega al 

infinito. 

Si se evalúa la frecuencia relativa de la ocurrencia de un evento en un experimento 

que se va repitiendo, se puede observar que al principio las frecuencias relativas 

varían proporcionalmente mucho de una a otra repetición, es decir, si el experimento 

se repite digamos 10 veces, y se evalúa la f r, y se repite una vez más (la 11-ava vez), 

y se evalúa nuevamente la f r, la variación que presente el nuevo cálculo con respecto 

al anterior, será proporcionalmente mayor que si se compara con la variación de la 20- 

ava repetición a la 21-ava, y así sucesivamente, a medida que la N crece y se hace 

constante en el infinito. Esto se puede observar en forma esquematizada en la figura 

X.


FIG. X VARIACIONES EN LOS VALORES DE LA FRECUENCIA RELATIVA DE UN 

EVENTO AL REPETIRSE EN FORMA CRECIENTE UN EXPERIMENTO 

A la definición empírica de probabilidad también se le denomina como definición a 

posteriori de probabilidad, pues requiere de un previo experimento para poder evaluar 

la probabilidad de un evento. 

Definición axiomática de probabilidad. 

Cada evento posible de un espacio muestral dado, tiene un y sólo un valor de 

probabilidad, el cual es asociado a dicho evento mediante una regla, por lo que la 

probabilidad es realmente una función cuyo dominio es el conjunto de los eventos 

posibles de un espacio muestral, y cuyo contra dominio es el conjunto de los números 

reales, siempre que cumpla con los siguientes axiomas: 

1. Si A S, p (A) ≠ 0 

2. P(S) = 1 

3. Si A 1, A 2,..., A n es una secuencia de eventos del espacio muestral, mutuamente 

exclusivos, entonces la probabilidad de la unión de todos ellos es igual a la suma 

de las probabilidades de cada uno. 

Observando estos axiomas y analizándolos, en realidad lo que cada uno dice es lo 

siguiente: el primero dice que para todo evento de un espacio muestral, siempre su 

probabilidad será no negativa. Esto es obvio, ya que no importa en qué caso nos 

encontremos, es decir, en el caso de fenómenos insesgados en los cuales podamos 

aplicar la definición clásica de probabilidad, vemos que al dividir M entre N, ambos 

será siempre números enteros positivos que no pueden dar una respuesta negativa, o 

si nos encontramos en algún caso de fenómenos sesgados, en los cuales no se puede 

aplicar la definición clásica y tengamos que aplicar la empírica, también vemos que la 

respuesta no puede salir negativa, ya que no puede existir una frecuencia relativa 

negativa. 

El segundo axioma nos dice que la probabilidad del espacio muestral mismo es igual a 

uno; esto es también obvio, pues esto sería lo mismo que decir: ¿cuál es la 

probabilidad de que al efectuar un cierto experimento, nos dé como resultado alguno 

de los resultados posibles (alguno de los elementos de S)?, claro que la p(S) = 1. 

Probablemente el tercer axioma sea más difícil de entender, o mejor dicho, de 

interpretar, pero también es muy fácil. Lo que dice es que si se tiene una serie de 

eventos disjuntos (es decir, que la intersección de cualesquiera dos de ellos sea 

vacía), y cada evento tiene un valor de probabilidad, la probabilidad de la unión es 

claro que será la suma de las probabilidades parciales de cada evento, ya que la unión 

incluiría a todos los elementos de todos los eventos dados.


De los axiomas anteriores se desprende lo siguiente: 

1) 0 p 1 

2) P ( ) 1 y P( ) 

0 

3) Si A A c , entonces P(A c ) 1 P(A) 

NOTAS: Si la probabilidad es siempre un valor entre 0 y 1, entonces el rango de la 

función de probabilidad será un subconjunto del intervalo cerrado entre dichos valores. 

Se entiende por intervalo, digamos el intervalo (2, 7), como el conjunto de todos los 

valores comprendidos entre el 2 y el 7. Hay dos tipos de intervalos (y uno mixto o 

derivado de ambos): el intervalo abierto y el intervalo cerrado. En el caso del intervalo 

abierto (2, 7) los valores de los límites no quedan incluidos en el conjunto, sino 

únicamente a todos los valores intermedios. En el caso del intervalo [2,7], los límites sí 

son elementos del conjunto. El intervalo mixto es aquel que es cerrado por un lado y 

abierto por el otro. 

Cuando se tiene una secuencia de eventos mutuamente exclusivos que agoten u 

ocupen a todo el espacio (esto se puede generalizar a subconjuntos de un conjunto 

cualquiera), esto es, que la unión de todos sea el espacio muestral completo, se dice 

que se tiene una partición. Así, una partición es un conjunto de subconjuntos disjuntos 

tales que la unión de todos sea el conjunto parental. 

Probabilidad subjetiva. 

Este tipo de probabilidad es asignada por un experto y no se puede comprobar, es 

decir, en muchas ocasiones no se dispone de datos históricos, y debemos tomar una 

conjetura informada, también se utiliza para estimar la probabilidad de un evento que 

nunca ha sucedido. 

Por ejemplo: para calcular la probabilidad del número de accidentes en determinado 

lugar le preguntamos a un policía que vigile en la zona. 

Reglas de probabilidad. 

En la economía y los negocios es importante aclarar dos condiciones para utilizar la 

probabilidad: 

a) el caso en que un evento u otro se presente. 

b) La situación en que dos o más eventos se presenten al mismo tiempo. 

Por ejemplo: para el primer caso nos preguntaríamos. ¿Cuál es la probabilidad de que 

la demanda de hoy exceda nuestros inventarios? Y la segunda podríamos preguntar 

¿¿cuál es la probabilidad de que la demanda de hoy exceda nuestro inventario y que 

el 10% de nuestra fuerza laboral no se presente a trabajar? 

Para dar respuesta a éstas y muchas más preguntas tendremos que aclarar algunos 

conceptos de la probabilidad. 

Probabilidad marginal. 

Es la probabilidad de un evento conocido (sencillo) y que sólo éste puede llevarse a 

cabo también se le conoce como probabilidad incondicional. Se representa por:


P(A) = la probabilidad del evento A 

Regla de la adición para eventos mutuamente excluyentes. 

Esta regla se aplica cuando deseamos conocer la probabilidad de un evento u otro 

sucedan. Si son mutuamente excluyentes podremos obtenerla de la siguiente manera: 

P(A o B) = P(A) + P (B) 

U 

A 

B 

En el diagrama observamos que para conocer la unión sólo debemos juntar sus 

probabilidades. 

Existe un caso especial para cualquier evento A, tenemos que este sucede o no 

sucede. De modo que los eventos A y no A son mutuamente excluyentes y a su vez 

exhaustivos (es decir, con ellos juntos ya no habrá más elementos) tendremos: 

P(A) + P (no A) = 1 o de manera equivalente: P(A) = 1- P (no A) 

Regla de la adición para eventos no mutuamente excluyentes. 

Si dos eventos no son mutuamente excluyentes, es posible que ambos se presenten al 

mismo tiempo y por ello debemos modificar la regla de adición para obtener: 

P(A o B) = P(A) + P (B) - P(A y B) = P(A) + P (B) - P(A B) 

P(A) 

P(AB) 

P (B) 

Probabilidades bajo condiciones de independencia estadística. 

Existe la posibilidad de que al estar calculando la probabilidad de un evento tengamos 

que revisar si éste no es resultado que haya sucedido otro evento previo, debido a que 

ahora examinaremos él cálculo de probabilidad de eventos que son estadísticamente 

independientes, es decir, la presentación de uno de ellos no tiene efecto sobre la


probabilidad de presentación de cualquier otro evento. Por ejemplo supongamos que 

contamos con una urna en donde hemos depositado papelitos con los 10 nombres de 

los candidatos a dos becas otorgadas por el CONACYT para realizar estudios de 

postgrado en el extranjero. Si extraemos un papelito para seleccionar al primer 

candidato nuestra probabilidad es de P(A) = 10 

1 , pero si no lo regresamos hemos 

modificado la probabilidad de seleccionar a otro candidato, ya que ahora sólo hay 9 

papelitos, para no alterar esta probabilidad habrá que regresar el primer papelito 

extraído. Es importante aclarar que en estas condiciones tendremos tres casos 

diferentes de probabilidad bajo independencia estadística: 

1. MARGINAL P(A) 

2. CONJUNTA P(A y B) 

3. CONDICIONAL P(B\A) 

Probabilidades bajo condiciones de dependencia estadística. 

En este caso las probabilidades que deseamos calcular dependen de que haya 

sucedido otro evento, también tenemos tres tipos diferentes de probabilidades, 

marginal, conjunta, condicional y aunque se llaman igual se calculan de forma distinta. 

En el cuadro siguiente podemos observar las fórmulas que nos servirán para calcular 

los diferentes tipos de probabilidad: 

Bajo independencia 

Bajo dependencia 

Tipo de Símbolo Fórmula Tipo de Símbolo Fórmula 

probabilidad 

probabilidad 

Marginal P(A) a Marginal P(A) Suma de 

P( 

A) 

 

probabilidad 

n 

es de los 

eventos en 

los que A se 

presenta 

Conjunta P(AB) P(A)*P(B) Conjunta P(AB) P(A\B)* P(B) 

P(BA) P(B\A)*P(A) 

Condicional P(B\A) P(B) Condicional P(B\A) 

P(A\B) 

P( 

B A) 

P( 

A) 

P( 

A B) 

P( 

B)


Supongamos que conocemos la probabilidad de que al seleccionar una muestra de 

alumnos de la carrera de Negocios internacionales de la escuela de Economía y 

Negocios, que sea hombre. P (H) = 0.35. También sabemos que la probabilidad de 

que un hombre salga reprobado en Estadística es de 37%, mientras que de las 

mujeres el 30% reprobarán la materia. 

a) Generar el diagrama de árbol para explicar este problema. 

b) Crear un cuadro de información para mostrar las probabilidades marginales y 

conjuntas 

c) Calcular la probabilidad de que al seleccionar un alumno sea reprobado dado que 

es mujer. 

d) Calcular la probabilidad de seleccionar un hombre dado que está aprobado en 

Estadística 

Respuesta de a) 

Alumnos 

0.35 

1 – 0.35 

0.37 

Hombres 

1 – 0.37 

0.30 

Mujeres 

1 – 0.30 

Reprobado 

Aprobado 

Reprobado 

Aprobado 

Respuesta b) 

Hombre Mujer Total 

marginal 

Reprobado 0.1295 0.195 0.3245 

Aprobado 0.2205 0.455 0.6755 

Total 

marginal 

0.35 0.65 1.00 

Respuesta c) 

Este inciso lo podemos resolver de dos formas dependiendo del diagrama que 

utilicemos, si utilizamos el diagrama de árbol tendremos: 

P( 

R M ) 0.30*0.65 

P ( R / M ) 0.30 

P( 

M ) 0.65 

La otra opción es tomar la información de la tabla del inciso b) 

P( 

R M ) 0.195 

P ( R / M ) 0.30 

P( 

M ) 0.65 

Respuesta d) 

También tenemos dos formas de responder pero es importante lo que va a pasar 

ahora en el diagrama de árbol.


P( 

H A) 

0.35*0.67 

P ( H / A) 

 

0.326424 

P( 

A) 

(0.35*0.67) (0.65*0.70) 

Es decir descubrimos que para poder calcular la probabilidad marginal de “aprobado” 

tuvimos que sumar las probabilidades en donde estuvo presente el evento. 

Mientras que si ya hicimos la tabla las cosas serán más fáciles. 

P( 

H A) 

0.2205 

P ( H / A) 

0.326424 

P( 

A) 

0.6755 

A este caso en particular se le denomina Teorema de Bayes y su fórmula general es: 

P( 

B A) 

P( 

B / A)* 

P( 

A) 

P A/ 

B) 

 

P( 

B) 

( P( 

B / A)* 

P( 

A)) 

( P( 

B / A) 

( 

C 

C 

* P( 

A) 

)


Distribuciones de Probabilidad. 

La distribución de probabilidad es muy interesante, ya que, nos proporciona una forma 

sencilla de calcular probabilidades para eventos que son repetitivos o muy comunes y 

para ello debemos recordar que en estadística hay dos tipos de variables aleatorias 

las discretas y las continuas. Las discretas normalmente provienen de un conteo, 

por ejemplo; número de hijos, número de veces que compra el mismo producto en un 

mes, numero de faltas durante un semestre, etc. Y su gráfica quedara representada 

por puros puntos en el plano cartesiano. Mientras que las continuas son aquellas que 

se encuentran dentro de un intervalo con un valor mínimo y uno máximo y se 

representan gráficamente con una línea dentro del plano cartesiano, estas son tales 

como la estatura de las personas, el tipo de cambio, el precio de una acción, etc. 

Lo primero que analizaremos es la Esperanza matemática para cada uno de los tipos 

de variables: 

Esperanza para variables discretas. 

Para que no te olvides de este tema, debes recordar las fórmulas de datos agrupados 

de la estadística descriptiva por ejemplo: 

x = 

k 

 

i1 

f 

i 

*X 

n 

i 

o 

= 

k 

 

i1 

f i 

 

X 

i 

N 

 

2 

o 

k 

 

i1 

f 

i 

 

x 

i 

3 

n 

 

 

3 

La primera de la media aritmética, la segunda para la desviación estándar y la tercera 

para el sesgo todas ellas en datos agrupados, es decir, que se encuentran en una 

tabla de distribución de frecuencias. 

La esperanza matemática de variables discretas se puede calcular con estas fórmulas 

considerando que 

n 

f 

puede ser la probabilidad de cada suceso en la distribución así 

tendríamos: 

Se podría representar como 

E(x) 

 

μ= 

k 

 

i1 

P(x 

i 

)* x 

i 

K 

= P( 

x i 

)*( x i 

) 

i1 

2


k 

 

i1 

p( 

x i 

)* 

 

3 

 

x i 

 

 

3 

En las variables continuas no es posible sumar al total de los datos porque estan dentro de un 

intervalo y es infinito el número de casos posibles por lo que sera necesario utilizar integrales 

definidas para obtener el área bajo la curva. Y en la esperanza matemáticas se debera definir 

la funcion de densidad que nos servirá para obtener las probabilidades. Esta función deberá 

cumplir con los axiomas de la probabilidad para poder ser trabajada. 

P ( a x b) 

f ( x) 

dx 

Por lo anterior las formulas de la esperanza matemática para variables continuas quedarían: 

b 

E(x) μ= f ( x) 

* x 

a 

idx 

b 

2 

= f ( x)*( 

x ) 

dx 

a i 

Para la media aritmética, desviación estándar y sesgo respectivamente. 

 

 

b 

p( x)* 

x i 

 

a 

3 

 

b 

a 

 

3


Ejemplo de variable discreta: 

Si se obtiene la probabilidad de que se cancelen cuentas de nuestros clientes por semana, la 

información se reporta en la siguiente tabla: 

Probabilidad 

No de de que 

cuentas suceda en 

canceladas cualquier 

semana 

xi * p(xi) xi - media p(xi) * (xi - media) 2 p(xi) * (xi - media) 3 

Xi 

= 

K 

P( 

x i 

)*( x i 

) 

i1 

p(xi) 

0 0.021 0.000 -2.22 0.1034964 -0.229762008 

1 0.325 0.325 -1.22 0.4837300 -0.590150600 

2 0.258 0.516 -0.22 0.0124872 -0.002747184 

3 0.205 0.615 0.78 0.1247220 0.097283160 

4 0.191 0.764 1.78 0.6051644 1.077192632 

Sumas 1 2.220 1.3296000 0.351816000 

k 

E(x) μ= P(x 

i1 

i 

)* x 0*0.0211*0.325 

2*0.258 3*0.205 4*0.191 2.22 

i 

2 

1.3296 1.15308 

 

sesgo 

k 

i 1 

p( 

x i 

)* 

 

3 

 

x 

i 

 

 

3 

0.351816 

0.22947 

3 

1.15308 

La primer suma de 2.22 nos indica la cantidad de cuentas canceladas que debemos esperar en 

cada semana. Luego obtuvimos la desviación estándar de 1.15308 y posteriormente el sesgo 

de 0.22947 con lo que podemos decir que: un intervalo de confianza al 68% de confianza para 

el número de cuentas canceladas será (1.067, 3.373) y su sesgo positivo.


En el caso de las variables continuas: 

Un profesor de la Anáhuac nunca termina su clase antes del término de la hora, mas nunca se 

pasa de 2 minutos de ésta. Sea X: el tiempo que transcurre entre el término de la hora y el 

término efectivo de la clase. Suponga que la función de densidad viene dada por: 

f ( x) 

2 

kx 

0 x 2 

 

0 

para cualquier otro 

a) Encuentre el valor de k. 

b) ¿Cuál es la probabilidad de que la clase termine a menos de un minuto después del 

término de la hora? 

c) ¿Cuál es la probabilidad de que la clase continúe entre 60 y 90 segundos después del 

término de la hora? 

d) ¿Cuál es la probabilidad de que la clase continúe por lo menos 90 segundos después 

del término de la hora?


e) Encuentre la media esperada de tiempo que se tarda el profesor y la desviación 

estándar. 

E(x) 

 

μ= 

 

b 

a 

f 

( x)* 

x dx 

i 

 

2 8 

2 

x * xdx 10.667 

0 

3 

 

= 

2 

b f ( x)*( 

x ) 

dx 

a i 

 

598.640988 

 

24.47 

Lo que nos lleva a concluir que se espera que el profesor salga entre 0 y 35.13 segundos tarde 

de su clase con un nivel de confianza del 68%. 

Una aplicación de la esperanza matemática adecuada para economía y negocio muy útil para 

estimar los costos que se pueden esperar al abrir por primera vez. Por ejemplo: 

El gerente de personal de una Compañía está planeando cuanto personal ocupará en las 

instalaciones del taller del negocio. A partir de información proporcionada por el fabricante y por 

otros negocios cercanos, ha estimado el número de horas de mecánica anuales que es 

probable que requiera su taller. 

El gerente planea pagar a cada mecánico $9.00 por hora y cargar a su cliente $16.00 por hora. 

Los mecánicos trabajarán una semana de 40 horas y tendrán vacaciones anuales de dos 

semanas. 

Horas 10000 12000 14000 16000 

Probabilidad 0.2 0.3 0.4 0.1 

Determine cuantos mecánicos deberá contratar el gerente. 

datos 

empleados 5 6 7 8 

Horas 10000 12000 14000 16000 

Probabilidad 0.2 0.3 0.4 0.1


c/he 9 

i/h 16 

52 sem 50 

250 300 350 400 

5 6 7 8 

ganancia 7 

trabajo de un 

emp 2000 

tabla de ganancias esperadas 

ofrecen 

5 6 7 8 p(x) 5 6 7 8 

Demandan 

5 70000 52000 34000 16000 0.2 14000 10400 6800 3200 

6 56000 84000 66000 48000 0.3 16800 25200 19800 14400 

7 42000 70000 98000 80000 0.4 16800 28000 39200 32000 

8 28000 56000 84000 112000 0.1 2800 5600 8400 11200 

50400 69200 74200 60800 

ofrecen 

tabla de pérdidas esperadas 

Demandan 

5 6 7 8 p(x) 5 6 7 8 

5 0 18000 36000 54000 0.2 0 3600 7200 10800 

6 14000 0 18000 36000 0.3 4200 0 5400 10800 

7 28000 14000 0 18000 0.4 11200 5600 0 7200 

8 42000 28000 14000 0 0.1 4200 2800 1400 0 

19600 12000 14000 28800 

Como se puede observar se determinó primero cuántos empleados deben cubrir las horas de 

trabajo, luego se calculó la ganancia, el ingreso y las perdidas con cada contratación, por 

ejemplo; el 84,000 de la tabla de ganancias, que se encuentra al ofrecer 6 empleados y se le 

haya demandado el trabajo para 6 empleados se obtuvo multiplicando 12,000 horas por 7 

pesos de ganancia pero es importante observar que a los datos que no se encuentran en la 

diagonal principal se les descontó ya sea costo real o costo de oportunidad como en el caso de 

56,000 que se encuentra al ofrecer 5 empleados y que se le soliciten las horas para 6 

empleados entonces se ganaría lo de 5 empleados 70,000 menos (2000*7) = 14,000 por no 

tener al otro empleado. El 34,000 de la tabla de ganancias que se encuentra al ofrecer 7 

empleados y se le requieran las horas para ser cubiertas por 5 empleados se gana lo de los 5 

empleados pero se pierde en salario de 2 más 70000 – (4000*9). 

Después se obtienen las ganancias esperadas por cada una de las opciones de oferta y se 

selecciona el de mayor ganancia posible (marcada con verde). Para las pérdidas se realiza el 

mismo trabajo y se puede observar en la otra tabla.

DISTRIBUCION CARACTERISTICAS FORMULA MINITAB ESPERANZA. VARIANZA 

Binomial 

(n y p) 

N fijo 

2 resultados (éxito y 

fracaso) 

Encontrar el nº exacto de éxitos P(x=k) 

Al menos o por lo menos K; P(xprob.dist - 

>binomial- 

>prob-> 

Calc- 

>prob.dist - 

>binomial- 

>cum. Prob 

E(x)=np 

2 

 

npq 

Multinomial 

(varias x, varias p) 

Geométrica 

(se desea un lugar 

específico y un solo 

acierto) 

Binomial negativa 

(un éxito al final y otros 

éxitos) 

Hipergeométrica 

(no hay “p”) 

Poisson 

(el único dato es un 

promedio) 

P es constante e 

independiente 

Se puede repetir el 

experimento. Varias 

veces 

N fijo 

K resultados 

K probabilidades 

independientes 

N es fijo 

Dada la probabilidad obtener x 

El resultado de cada exp puede clasif. En k 

categ. 

Deben haber k probabilidades 

Cada exp. Es indep. 

El exp se realiza n veces 

2 resultados Se desea calcular la probabilidad de lograr 

un éxito al último de x repeticiones 

P es cte. e 

independiente 

N variable 

2 resultados 

P constante e 

independiente 

N fijo 

2 resultados 

P no constante no 

hay independencia 

Se desea obtener la prob. R éxitos donde 

el último éxito está en la última repetición 

N=tamaño de población, n=tamaño de la 

muestra, m=éxitos en la población, 

X=éxitos en muestra. 

x !* x 

1 

2 

n 

!*....* 

! x1 

x2 

p1 

* p2 

xk 

*....* p 

x k 

k 

Calc- 

>prob.dist - 

>binomial- 

>inv. Cum. 

Pro. 

1 

P(x x) p 

1 

q 

x 1 

E( x) 

 

p 

P(x) 

P( 

x x) 

 

P( 

X 

E( 

x) 

 

r xr 

 

x1 Cr 

1 

p q 

p 

m 

Cx 

* 

C 

N m 

Éxitos o fracasos que ocurren en un intervalo de tiempo o región de 

espacio x! 

N 

e 

x) 

 

 

n 

x 

 

C 

nx 

Calc- 

>prob.dist - 

>hipergeome 

tric 

Calc- 

>prob.dist - 

>poisson 

r 

2 

 

2 

 

q 

 

2 

p 

rq 

 

2 

p 

m 2 N n 

E( x) 

n* 

np 

npq 

 

N 

N 1 

 

E (x) 

2

apuntes completos

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?