Distribuciones de probabilidad - Estadística
Distribuciones de probabilidad - Estadística
Distribuciones de probabilidad - Estadística
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
3 Tercera<br />
Unidad Didáctica<br />
"DISTRIBUCIONES DE PROBABILIDAD<br />
DISCRETAS"<br />
3.1 Parte básica<br />
143
3.1.1 Variables aleatorias<br />
En cualquier experimento aleatorio tenemos resultados cualitativos o<br />
cuantitativos. Con el objeto <strong>de</strong> facilitar el estudio matemático, a cada uno <strong>de</strong> estos<br />
resultados le hacemos correspon<strong>de</strong>r un número real.<br />
Por ejemplo, el resultado <strong>de</strong> tomar un español al azar y medir su estatura es un<br />
número; el resultado <strong>de</strong> tomar una familia al azar y anotar el número <strong>de</strong> hijos es un<br />
número; el resultado <strong>de</strong> aplicar un tratamiento a un enfermo y observar si se cura o no,<br />
es un dato cualitativo, que pue<strong>de</strong> convertirse en cuantitativo asignando un "1" al<br />
enfermo que se cura y un "0" al enfermo que no se cura.<br />
En realidad lo que estamos haciendo es asignar a cada suceso <strong>de</strong>l espacio muestral<br />
un número, pero esta asignación no tiene por qué ser única.<br />
Pongamos un ejemplo: lanzamos dos dados al aire y a cada suceso elemental le<br />
po<strong>de</strong>mos asignar la suma, el producto, etc., <strong>de</strong> los números que aparecen en las caras<br />
superiores.<br />
Al igual que los resultados <strong>de</strong> un fenómeno aleatorio no son pre<strong>de</strong>cibles, los<br />
resultados <strong>de</strong> una variable aleatoria tampoco lo son, pero po<strong>de</strong>mos calcular la<br />
<strong>probabilidad</strong> <strong>de</strong> que ocurra un <strong>de</strong>terminado suceso.<br />
A veces pue<strong>de</strong> ocurrir que los valores que toma la variable aleatoria son los<br />
mismos, pero no ocurre lo mismo con las probabilida<strong>de</strong>s. Pongamos un ejemplo.<br />
Se dispone <strong>de</strong> dos fármacos A y B distintos para curar una misma enfermedad; los<br />
resultados <strong>de</strong> la variable aleatoria solamente pue<strong>de</strong>n ser 1 ó 0 y uno <strong>de</strong> ellos pue<strong>de</strong><br />
curar el 20% <strong>de</strong> los casos y el otro el 70%.<br />
Para tener i<strong>de</strong>ntificada una variable aleatoria no basta con indicar los valores que<br />
pueda tomar, hay que indicar también sus probabilida<strong>de</strong>s.<br />
Una variable aleatoria X es toda función que toma diversos valores<br />
numéricos (<strong>de</strong>pendientes <strong>de</strong>l resultado <strong>de</strong> un fenómeno aleatorio) con<br />
distintas probabilida<strong>de</strong>s.<br />
144
Cuando la variable aleatoria toma un número finito o infinito numerable * <strong>de</strong><br />
valores, diremos que es una "variable aleatoria discreta".<br />
Veamos ejemplos:<br />
En el caso <strong>de</strong>l lanzamiento <strong>de</strong> un dado perfecto, la variable aleatoria X= "número<br />
que sale en la cara superior" pue<strong>de</strong> tomar los valores X={1, 2, 3, 4, 5, 6} con<br />
probabilida<strong>de</strong>s P(X)={1/6, 1/6, 1/6, 1/6, 1/6, 1/6}.<br />
Si consi<strong>de</strong>ramos la variable aleatoria X= "número <strong>de</strong> varones en una familia <strong>de</strong><br />
dos hijos", X={0, 1, 2} y P(X)={1/4, 1/2, 1/4}.<br />
(Observar el espacio muestral <strong>de</strong>l experimento aleatorio).<br />
En general diremos, que una variable aleatoria discreta estará i<strong>de</strong>ntificada si<br />
conocemos sus posibles valores X = {x 1,x 2 ,...,x n} y sus respectivas<br />
probabilida<strong>de</strong>s P(X = x i ) = P i<br />
Observemos que la suma <strong>de</strong> las probabilida<strong>de</strong>s es 1: ! Pi = 1<br />
i<br />
A toda regla que permita asociar a cada valor xi <strong>de</strong> la variable aleatoria su<br />
<strong>probabilidad</strong> Pi, la llamaremos "función <strong>de</strong> <strong>probabilidad</strong>".<br />
Tal función <strong>de</strong> <strong>probabilidad</strong> pue<strong>de</strong> venir dada por una tabla:<br />
o bien por una fórmula matemática.<br />
X 0 1 2<br />
P(X) 1/4 1/2 1/4<br />
También po<strong>de</strong>mos <strong>de</strong>finir la variable aleatoria a través <strong>de</strong> la "función <strong>de</strong><br />
distribución".<br />
F(X) = P(X ! x)<br />
* Un conjunto infinito A se dice que es numerable si se pue<strong>de</strong> establecer una aplicación<br />
biyectiva f entre el conjunto <strong>de</strong> los naturales y A.<br />
145
F(X) no es más que la <strong>probabilidad</strong> <strong>de</strong> que la variable X tome valores menores o<br />
iguales que x.<br />
En el ejemplo anterior:<br />
F(0) = P(X ! 0) = P(X = 0)<br />
F(1) = P(X !1) = P(X = 0) + P(X = 1)<br />
F(2) = P(X ! 2) = P(X = 0) + P(X = 1) + P(X = 2)<br />
De un modo general, a toda tabla, gráfica o expresión matemática que<br />
indique los valores que pue<strong>de</strong> tomar una variable aleatoria y las<br />
probabilida<strong>de</strong>s con que los toma, se llamará "distribución <strong>de</strong> <strong>probabilidad</strong><br />
<strong>de</strong> dicha variable aleatoria".<br />
El concepto <strong>de</strong> variable aleatoria proporciona un medio para relacionar cualquier<br />
resultado con una medida cuantitativa.<br />
3.1.2 Esperanza, varianza y <strong>de</strong>sviación<br />
típica <strong>de</strong> una variable aleatoria<br />
Se llama esperanza <strong>de</strong> la variable aleatoria discreta X, al número:<br />
E X<br />
[ ] = x 1p 1 + x 2p 2 +...+x np n<br />
x 1 , x 2 ,. .., x n son los valores <strong>de</strong> la variable aleatoria y p 1 , p 2 , ..., p n las<br />
probabilida<strong>de</strong>s respectivas.<br />
La esperanza <strong>de</strong> una variable aleatoria X también se representa por µ, y se llama<br />
media <strong>de</strong> la distribución. Por tanto, "esperanza <strong>de</strong> la variable aleatoria" y "media <strong>de</strong> la<br />
distribución" son expresiones equivalentes.<br />
n<br />
µ = ! pix i = E X<br />
i=1<br />
El conocimiento <strong>de</strong> la media <strong>de</strong> la distribución no es suficiente para caracterizar la<br />
distribución, ya que hay distribuciones con la misma media y distintas unas <strong>de</strong> otras.<br />
[ ]<br />
146
Para medir la dispersión <strong>de</strong> los valores <strong>de</strong> una variable aleatoria X respecto <strong>de</strong> su<br />
media µ , se <strong>de</strong>fine el siguiente estadístico llamado varianza:<br />
Es <strong>de</strong>cir:<br />
( ) 2 [ ]<br />
V[ X]<br />
= E x ! µ<br />
V[ X]<br />
= ( x1 ! µ ) 2 p1 + ( x2 ! µ ) 2 p2 +...+ ( xn ! µ ) 2 pn Puesto que la varianza no podría medirse en las mismas unida<strong>de</strong>s que la variable,<br />
utilizamos la raíz cuadrada <strong>de</strong> la varianza y a este número la llamamos <strong>de</strong>sviación<br />
típica.<br />
hijos.<br />
1/2.<br />
EJEMPLO 3.1:<br />
Desv[ X]<br />
= V[ X]<br />
Desv[ X]<br />
= ( x1 ! µ ) 2 p1 + ( x2 ! µ ) 2 p2 +...+ ( xn ! µ ) 2 pn Calcular la media y la varianza <strong>de</strong>l número <strong>de</strong> hijos varones <strong>de</strong> una familia con dos<br />
Solución:<br />
E={VV, VH, HV, HH}<br />
X={0, 1, 2}= "número <strong>de</strong> hijos varones <strong>de</strong> una familia con dos hijos"<br />
P1 = P(X = 0) = 1/ 4 !<br />
#<br />
P 2 = P(X =1) = 2 / 4 =1 / 2"<br />
1 / 4 +1 / 2 + 1/ 4 =1<br />
P3 = P(X = 2) = 1/ 4 $<br />
#<br />
En promedio, una familia con dos hijos tiene un hijo varón con una varianza <strong>de</strong><br />
147
EJEMPLO 3.2:<br />
Tras una intervención quirúrgica <strong>de</strong> un tipo <strong>de</strong>terminado, el equipo médico<br />
mantuvo en el hospital a unos pacientes cinco días y a otros ocho. De éstos últimos no<br />
regresó ninguno al hospital y el coste <strong>de</strong> cada uno ascendió a 90.000 pts., mientras que<br />
<strong>de</strong> los dados <strong>de</strong> alta a los cinco días, las dos terceras partes no regresaron al hospital y el<br />
coste por cada individuo fue <strong>de</strong> 50.000 pts. El otro tercio restante tuvo que regresar al<br />
hospital ocasionando unos gastos totales por individuo <strong>de</strong> 150.000 pts.<br />
En términos puramente económicos, ¿es preferible dar <strong>de</strong> alta a los enfermos a los<br />
cinco o a los ocho días?.<br />
Solución:<br />
Se trata <strong>de</strong> calcular el coste promedio en ambos casos. En el supuesto <strong>de</strong> que los<br />
pacientes estén ingresados 8 días, el coste promedio es <strong>de</strong> 90.000 pts., y en el supuesto<br />
<strong>de</strong> que los pacientes estén 5 días, la variable aleatoria se distribuye <strong>de</strong> la siguiente<br />
forma:<br />
El coste promedio en este caso será:<br />
X 50.000 150.000<br />
P(X) 2/3 1/3<br />
E[X] = 50.000 2 1<br />
+150.000 = 83.330pts.<br />
3 3<br />
Puesto que 83.333 < 90.000, esto indica que es preferible, <strong>de</strong>s<strong>de</strong> el punto <strong>de</strong> vista<br />
económico, tener ingresados a los pacientes cinco días.<br />
La varianza la calculamos <strong>de</strong> la siguiente forma:<br />
V[X] = (50.000 ! 83.000) 2 2<br />
3 + (150.000 ! 83.330)2 1<br />
= 2, 2 109<br />
3<br />
148
3.1.3 Distribución Binomial<br />
Hay muchas situaciones en las que sólo interesa conocer si un <strong>de</strong>terminado suceso<br />
se produce o no se produce.<br />
Si el suceso ocurre, diremos que hemos obtenido un éxito y lo simbolizamos por E<br />
y si no ocurre diremos que hemos obtenido un fracaso y lo simbolizamos por F.<br />
Lógicamente p+q=1<br />
La <strong>probabilidad</strong> <strong>de</strong> éxito la llamamos p<br />
La <strong>probabilidad</strong> <strong>de</strong> fracaso la llamamos q<br />
Se trata <strong>de</strong> un experimento aleatorio que no tiene más que dos resultados posibles<br />
E y F tales que P(E)=p y P(F)=q<br />
Es interesante el caso en el que se repitan pruebas in<strong>de</strong>pendientes <strong>de</strong>l mismo<br />
experimento y la <strong>probabilidad</strong> <strong>de</strong> éxito se mantenga constante en todas ellas.<br />
Supongamos que el número <strong>de</strong> pruebas es cinco (n=5). Un posible resultado sería:<br />
EFFEE<br />
Si queremos calcular la <strong>probabilidad</strong>, teniendo en cuenta que las pruebas son<br />
in<strong>de</strong>pendientes:<br />
P(EFFEE) = P(E) P(F) P(F) P(E) P(E) = p q q p p = p 3 q 2<br />
Respon<strong>de</strong>n a este mo<strong>de</strong>lo experimentos como los siguientes:<br />
- Lanzar una moneda varias veces consi<strong>de</strong>rando éxito la obtención <strong>de</strong> cara.<br />
Entonces p=q=1/2<br />
- Lanzar un dado varias veces, consi<strong>de</strong>rando éxito que salga el 6 y fracaso que no<br />
salga el 6. En este caso p=1/6 y q=5/6.<br />
149
- La clasificación <strong>de</strong> las piezas fabricadas por una máquina, consi<strong>de</strong>rando éxito las<br />
piezas aceptables y fracaso las piezas <strong>de</strong>fectuosas. En este caso p y q se asignan<br />
haciendo un estudio <strong>de</strong> gran número <strong>de</strong> piezas.<br />
Diremos que un experimento sigue un mo<strong>de</strong>lo binomial si, en cada<br />
ejecución, sólo hay dos posibles resultados (E y F), las pruebas son<br />
in<strong>de</strong>pendientes y la <strong>probabilidad</strong> <strong>de</strong> éxito es constante.<br />
La i<strong>de</strong>a es la <strong>de</strong> construir un mo<strong>de</strong>lo <strong>de</strong> asignación <strong>de</strong> probabilida<strong>de</strong>s <strong>de</strong> estas<br />
características.<br />
Llamaremos variable aleatoria binomial a:<br />
X = "número <strong>de</strong> éxitos en n pruebas"<br />
Se pue<strong>de</strong>n asignar probabilida<strong>de</strong>s mediante un diagrama en árbol:<br />
COMIENZO 1ª PRUEBA 2ª PRUEBA 3ª PRUEBA RESUL. PROB.<br />
p<br />
q<br />
E<br />
F<br />
p<br />
q<br />
p<br />
q<br />
E<br />
F<br />
E<br />
F<br />
p<br />
q<br />
p<br />
q<br />
p<br />
q<br />
p<br />
q<br />
E<br />
F<br />
E<br />
F<br />
E<br />
F<br />
E<br />
F<br />
EEE<br />
EEF<br />
E FE<br />
EF F<br />
FEE<br />
FEF F FE<br />
F F F<br />
p 3<br />
p 2q<br />
p 2q<br />
pq 2<br />
p 2q<br />
pq 2<br />
pq 2<br />
q 3<br />
150
Construir el árbol pue<strong>de</strong> ser una tarea larga y conviene buscar una fórmula general<br />
para un experimento binomial.<br />
Convengamos en i<strong>de</strong>ntificar todos aquellos resultados que tienen el mismo<br />
número <strong>de</strong> éxitos. Tras n pruebas nos encontraríamos con:<br />
por lo que:<br />
EE...E ! " p n<br />
EE...EF ! " np n#1 q<br />
EE...EFF! ! " n( n #1)p<br />
n#2 q 2<br />
.............................................<br />
EF...F ! " npq n#1<br />
FF... F! ! " q n<br />
Las distintas probabilida<strong>de</strong>s son los sumandos <strong>de</strong>l <strong>de</strong>sarrollo <strong>de</strong>l binomio (p+q) n ,<br />
( ) = n !<br />
P X = r<br />
# $<br />
" r % prq Convenimos en <strong>de</strong>signar al experimento binomial con n pruebas, siendo p la<br />
<strong>probabilidad</strong> <strong>de</strong> éxito, como B(n,p).<br />
EJEMPLO 3.3:<br />
Se lanza un dado 7 veces. Calcular la <strong>probabilidad</strong> <strong>de</strong> obtener 3 seises.<br />
p = P(E) = 1/6 n=7<br />
q = P(F) =5/6 K=3<br />
Solución:<br />
n& r<br />
X = "número <strong>de</strong> seises que aparecen al lanzar un dado 7 veces".<br />
3 5<br />
P(X = 3) = 7 !<br />
#<br />
" 3<br />
$<br />
% 1 !<br />
" 6<br />
$ !<br />
% " 6<br />
$<br />
%<br />
4<br />
= 0' 08<br />
151
EJEMPLO 3.4:<br />
Calcular la <strong>probabilidad</strong> <strong>de</strong> obtener al menos una cara, al lanzar una moneda<br />
cinco veces.<br />
Solución:<br />
X = "número <strong>de</strong> caras que se obtienen al lanzar una moneda cinco veces"<br />
Utilizando el suceso contrario:<br />
EJEMPLO 3.5:<br />
P(x>1) = P(x=2)+P(x=3)+P(x=4)+P(x=5)<br />
P(x>1) = 1-P(x≤1) = 1-(P(x=0)+P(x=1)) =<br />
= 1 - 1/2 1/2 1/2 1/2 1/2 - 1/2 1/2 1/2 1/2 1/2<br />
Supongamos que en un <strong>de</strong>partamento <strong>de</strong> control <strong>de</strong> calidad se examinan lotes <strong>de</strong><br />
cuatro artículos y se sabe que la <strong>probabilidad</strong> <strong>de</strong> que un artículo sea <strong>de</strong>fectuoso es<br />
P(D)=1/10 (por lo que la <strong>probabilidad</strong> <strong>de</strong> que sea aceptable es P(A)=1-P(D)=9/10).<br />
Definimos la variable aleatoria <strong>de</strong> manera que a cada elemento <strong>de</strong>l espacio<br />
muestral, le asociamos el número <strong>de</strong> piezas <strong>de</strong>fectuosas. x={0,1,2,3,4}. Calcular la<br />
<strong>probabilidad</strong> asociada a cada valor <strong>de</strong> la variable.<br />
Solución:<br />
Calculamos sus probabilida<strong>de</strong>s:<br />
P(x = 0) =<br />
9 !<br />
" 4<br />
#<br />
4<br />
= 0, 6561<br />
$<br />
P(x =1) = 1 9<br />
3<br />
! # !<br />
%<br />
4<br />
10 " 10$<br />
" 1<br />
#<br />
$ = 0, 2961<br />
Incluimos el número combinatorio<br />
posibilida<strong>de</strong>s.<br />
!<br />
#<br />
4$<br />
" 1%<br />
porque se pue<strong>de</strong>n dar cuatro<br />
DAAA, ADAA, AADA, AAAD<br />
152
EJEMPLO 3.6:<br />
P(x = 2) =<br />
1 ! #<br />
" 10$<br />
P(x = 3) =<br />
1 ! #<br />
" 10$<br />
P(x = 4) =<br />
1 ! #<br />
" 10$<br />
2 9<br />
3 9<br />
4<br />
! #<br />
" 10$<br />
2 4<br />
!<br />
%<br />
" 2<br />
#<br />
$ = 0, 0486<br />
!<br />
%<br />
4<br />
10 " 3<br />
#<br />
$ = 0, 0036<br />
= 0, 0001<br />
Hallar las probabilida<strong>de</strong>s <strong>de</strong>l experimento binomial B(4,1/3).<br />
Solución:<br />
EJEMPLO 3.7:<br />
P(x = 0) = 4 ! # $ ! 1<br />
" 0%<br />
" 3<br />
$<br />
0<br />
! 2<br />
% " 3<br />
$<br />
4<br />
= 0,1975<br />
%<br />
P(x =1) = 4 !<br />
#<br />
" 1<br />
$ ! 1<br />
% " 3<br />
$<br />
1<br />
! 2<br />
% " 3<br />
$<br />
3<br />
= 0, 3951<br />
%<br />
P(x = 2) = 4 !<br />
#<br />
" 2<br />
$ ! 1<br />
% " 3<br />
$<br />
2<br />
! 2<br />
% " 3<br />
$<br />
2<br />
%<br />
= 0, 2963<br />
P(x = 3) = 4 !<br />
#<br />
" 3<br />
$ ! 1<br />
% " 3<br />
$<br />
3<br />
2<br />
%<br />
= 0, 0988<br />
3<br />
P(x = 4) = 4 !<br />
#<br />
" 4<br />
$ ! 1<br />
% " 3<br />
$<br />
4<br />
%<br />
= 0, 0123<br />
En una empresa <strong>de</strong> fabricación <strong>de</strong> automóviles se ha observado que el 2%<br />
presenta algún <strong>de</strong>fecto. Calcular la <strong>probabilidad</strong> <strong>de</strong> que en una muestra aleatoria <strong>de</strong> 5<br />
automóviles se encuentren a lo sumo dos <strong>de</strong>fectuosos.<br />
Solución:<br />
La variable X = "número <strong>de</strong> automóviles <strong>de</strong>fectuosos", sigue una B(50,0'02).<br />
P( X ! 2)<br />
= P( X = 0 ) + P( X =1)<br />
+ P( X = 2)<br />
=<br />
"<br />
$<br />
50%<br />
0, 02<br />
# 0 & ( )0 0, 98<br />
( ) 50 + 50 "<br />
$ %<br />
( 0, 02)<br />
0, 98<br />
# 1 & ( )49 + 50 "<br />
$ %<br />
0, 02<br />
# 2 & ( )2 0, 98<br />
( ) 48<br />
153
P(X ! 2) = 0' 9216<br />
A medida que aumenta el valor <strong>de</strong> n se complican los cálculos y es conveniente<br />
utilizar tablas.<br />
3.1.3.1 Manejo <strong>de</strong> tablas<br />
Las tablas están elaboradas con la siguiente estructura (figura 3.1):<br />
n r p 0.01 0.05 ... 0.50<br />
2 0<br />
1<br />
2<br />
3 0<br />
1<br />
2<br />
3<br />
... ... ... ... ... ...<br />
10 0<br />
1<br />
...<br />
10<br />
Figura 3.1: Estructura <strong>de</strong> la tabla <strong>de</strong> la Distribución Binomial<br />
Si estamos en una B(5,0'45), buscaremos el 5 en la columna <strong>de</strong> n y si nos pi<strong>de</strong>n<br />
P(X=4), <strong>de</strong>ntro <strong>de</strong>l grupo n=5, buscamos r=4. En la fila <strong>de</strong> p buscamos 0'45 y en la<br />
confluencia <strong>de</strong> la horizontal y la vertical, tendremos el valor <strong>de</strong> la <strong>probabilidad</strong>.<br />
Po<strong>de</strong>mos encontrarnos con un problema en el caso <strong>de</strong> ser p>0'5, pues no pue<strong>de</strong><br />
emplearse la tabla directamente, sino que tendremos que tener en cuenta la siguiente<br />
propiedad:<br />
éxitos.<br />
( ) = n !<br />
P X = r<br />
# $<br />
" r % prq n& r ! n<br />
= # $<br />
" n & r%<br />
pn& r q r<br />
Función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> una variable aleatoria que siga una B(n,p) con n-r<br />
P(X=r) en una B(n,p) = P(X=n-r) en una B(n,q)<br />
154
3.1.3.2 Media y <strong>de</strong>sviación típica <strong>de</strong> una variable<br />
Binomial<br />
MEDIA:<br />
VARIANZA:<br />
DESVIACIÓN TÍPICA:<br />
EJEMPLO 3.8:<br />
µ = E[ x]<br />
= x0p0 + x1p1 +... +x npn =<br />
= 0 n !<br />
#<br />
" 0<br />
$<br />
% qn + 1 n !<br />
#<br />
" 1<br />
$<br />
% pqn&1 +...+n n !<br />
#<br />
" n<br />
$<br />
% pn = np<br />
! 2 = V x<br />
n<br />
[ ] = ( x " µ ) 2<br />
# p i = npq<br />
i=1<br />
! = npq<br />
Supongamos que tenemos cinco instrumentos y que sabemos que en promedio un<br />
<strong>de</strong>terminado instrumento está averiado uno <strong>de</strong> cada diez días. ¿Cuál es la <strong>probabilidad</strong><br />
<strong>de</strong> que en un día más <strong>de</strong> tres instrumentos estén averiados?. ¿Cuál es el número<br />
esperado <strong>de</strong> instrumentos averiados al día?.<br />
Solución:<br />
Nuestra variable será:<br />
X = "número <strong>de</strong> instrumento averiados en un día"<br />
Sólo hay dos posibles sucesos:<br />
La función <strong>de</strong> <strong>de</strong>nsidad será:<br />
E: Estar averiado<br />
F: No estar averiado.<br />
X ~ B(n=5, p=0'1)<br />
155
( ) = 5 !<br />
P x = r<br />
# $<br />
" r%<br />
prq 5&r = 5 !<br />
# $<br />
" r%<br />
0,1r0, 9<br />
P( x > 3)<br />
= P( x = 4 ) + P( x = 5)<br />
= 4<br />
=<br />
5 !<br />
# $<br />
" 4%<br />
p4q + 5 !<br />
# $<br />
" 5<br />
E[ x]<br />
= np = 5 0,1 = 0, 5<br />
Se avería un instrumento cada dos días.<br />
EJEMPLO 3.9:<br />
% 0,15 0, 9 0 = 4, 6 10 &4<br />
La <strong>probabilidad</strong> <strong>de</strong> que un estudiante obtenga el título <strong>de</strong> Licenciado en Biología<br />
es 0'3. Hallar la <strong>probabilidad</strong> <strong>de</strong> que <strong>de</strong> un grupo <strong>de</strong> 7 estudiantes matriculados en<br />
primer curso:<br />
a) Ninguno <strong>de</strong> los siete finalice la carrera.<br />
b) La finalicen todos.<br />
c) Al menos dos acaben la carrera.<br />
Asimismo, hallar la media y la <strong>de</strong>sviación típica <strong>de</strong>l número <strong>de</strong> alumnos que<br />
acaban la carrera.<br />
Solución:<br />
Los sucesos son:<br />
E(éxito): acabar la carrera P(E) = p = 0'3<br />
F(fracaso): no acabar la carrera P(F) = q = 0'7<br />
El número <strong>de</strong> pruebas es siete n = 7<br />
Las pruebas son in<strong>de</strong>pendientes, porque lo que ocurra con un alumno no tiene<br />
nada que ver con lo que le ocurra a otro.<br />
a)<br />
( ) = n !<br />
P X = r<br />
# $<br />
" r % prq n& r<br />
5& r<br />
156
)<br />
c)<br />
Parámetros:<br />
EJEMPLO 3.10:<br />
P(x = 0) = n !<br />
#<br />
" 0<br />
$<br />
% p0q n = 7 !<br />
#<br />
" 0<br />
$<br />
% q7 = 0, 7 7 = 0, 0824<br />
P(x = 7) =<br />
7 !<br />
#<br />
" 7<br />
$<br />
% 0, 37q 0 = 0, 0002 Imposible<br />
P( X ! 2)<br />
= P( X = 2)<br />
+ P( X = 3)+...+P<br />
( X = 7)<br />
=<br />
1 " P(X # 1) =1 " ( P(r = 0) + P(r =1) ) =<br />
= 1 " 0, 0824 " 0, 2471 = 0, 6705<br />
E[ x]<br />
= np = 7 0, 3 = 2,1<br />
V[ x]<br />
= npq = 2, 1 0, 7 =1, 47<br />
! = 1, 47<br />
En recientes estudios realizados sobre pacientes portadores <strong>de</strong> SIDA, se ha<br />
podido <strong>de</strong>terminar que el 70% consume algún tipo <strong>de</strong> droga. En la sala <strong>de</strong> espera <strong>de</strong><br />
una consulta especializada en esta enfermedad se encuentran en un <strong>de</strong>terminado<br />
momento seis personas. ¿Cuál es la <strong>probabilidad</strong> <strong>de</strong> que ninguno haya consumido<br />
droga?.<br />
Solución:<br />
E: "No consumir droga" P(E) = 0'3 = p<br />
F: "Consumir droga" P(F) = 0'7 = q<br />
Cada paciente es un caso distinto n=6<br />
EJEMPLO 3.11:<br />
( ) = 6 !<br />
P x = 0<br />
# $<br />
" 0%<br />
p0q 6 = 0, 1176<br />
Una población <strong>de</strong> 20 animales insectívoros se introduce en una zona don<strong>de</strong> el<br />
14% <strong>de</strong> los insectos que le sirven <strong>de</strong> alimento son venenosos. Cada animal <strong>de</strong>vora al<br />
día 5 insectos.<br />
mitad.<br />
Calcular la <strong>probabilidad</strong> <strong>de</strong> que al cabo <strong>de</strong> una semana que<strong>de</strong>n, como mínimo, la<br />
157
Solución:<br />
Suponiendo in<strong>de</strong>pen<strong>de</strong>ncia se tiene:<br />
P(no comer insecto venenoso) = 1-0'14 = 0'86<br />
P(un animal no se envenene en un día) = P(comer 5 insectos no venenosos) =<br />
= (0'86) 5 = 0'47042<br />
P(un animal no se envenene en 7 días) = (0,47042) 7 =0,005<br />
P(un animal se envenene en 7 días) = 1-0'005 = 0'995<br />
Sea X: "número <strong>de</strong> animales envenenados en una semana.<br />
P( x !10)<br />
=<br />
"<br />
$<br />
20%<br />
# k &<br />
X ~ B(20,0'995)<br />
10<br />
' 0, 995<br />
k =0<br />
k 0, 005 10( k = 2, 08975 10 (18<br />
3.1.4 Distribución <strong>de</strong> Poisson<br />
En este caso la variable aleatoria representa el número <strong>de</strong> sucesos in<strong>de</strong>pendientes<br />
que ocurren, a una velocidad constante, en el tiempo o en el espacio.<br />
Su nombre lo <strong>de</strong>be al francés Simeón Denis Poisson, que fue el primero en<br />
<strong>de</strong>scribirla en el Siglo XIX.<br />
Veamos algunos ejemplos típicos <strong>de</strong> esta distribución:<br />
• El número <strong>de</strong> personas que llega a una tienda <strong>de</strong> autoservicio en un<br />
tiempo <strong>de</strong>terminado.<br />
• El número <strong>de</strong> solicitu<strong>de</strong>s <strong>de</strong> seguro procesadas por una compañía en<br />
un período específico.<br />
• El número <strong>de</strong> bacterias en un cultivo.<br />
La distribución <strong>de</strong> Poisson es el mo<strong>de</strong>lo <strong>de</strong> <strong>probabilidad</strong> que más se utiliza para<br />
analizar problemas <strong>de</strong> listas <strong>de</strong> espera.<br />
Po<strong>de</strong>mos hablar <strong>de</strong> las siguientes características <strong>de</strong> una distribución <strong>de</strong> Poisson:<br />
158
1- Debemos tener un fenómeno dicotómico (ocurrencia o no <strong>de</strong> un<br />
<strong>de</strong>terminado suceso).<br />
2- Las pruebas que se realicen han <strong>de</strong> ser in<strong>de</strong>pendientes y la<br />
<strong>probabilidad</strong> <strong>de</strong> éxito se ha <strong>de</strong> mantener constante en todas ellas.<br />
3- Los sucesos han <strong>de</strong> ser poco comunes, por eso se le conoce como<br />
"Ley <strong>de</strong> los sucesos raros".<br />
4- Puesto que la <strong>probabilidad</strong> <strong>de</strong> éxito ha <strong>de</strong> ser pequeña, enten<strong>de</strong>mos<br />
que p100.<br />
5- Los sucesos ocurren en un intervalo <strong>de</strong> tiempo.<br />
6- Se caracteriza por un parámetro ! , que es el número medio <strong>de</strong><br />
ocurrencia <strong>de</strong>l suceso aleatorio por unidad <strong>de</strong> tiempo.<br />
7- Siempre que la media y la varianza sean similares, po<strong>de</strong>mos pensar<br />
en un mo<strong>de</strong>lo <strong>de</strong> Poisson.<br />
Media: E[ x]<br />
= np = !<br />
Varianza: V[ x]<br />
= ! = E[ x]<br />
Es importante el hecho <strong>de</strong> que una distribución binomial en la que n es gran<strong>de</strong> y<br />
p pequeño tiene una aproximación excelente con la distribución <strong>de</strong> Poisson. La función<br />
<strong>de</strong> <strong>probabilidad</strong> será el límite <strong>de</strong> la función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> la binomial cuando<br />
n ! ", p ! 0 y np ! "<br />
Teniendo en cuenta que p = !<br />
n<br />
$<br />
lim &<br />
n<br />
n!" % r<br />
p!0<br />
np!#<br />
'<br />
( prq n)r $<br />
= lim &<br />
n<br />
n!" % r<br />
p!0<br />
'<br />
( lim<br />
p!0 pr lim q<br />
n!" n)r<br />
159
n! % $<br />
lim<br />
n!" r!(n # r)! & n<br />
'<br />
r<br />
n#r<br />
% $<br />
lim 1 #<br />
'<br />
=<br />
( n!" & n (<br />
n(n #1)...(n # r +1)<br />
= lim<br />
n!" r!<br />
= $r<br />
r! lim<br />
n(n # 1)...(n # r + 1)<br />
n!" n r<br />
Calculamos cada uno <strong>de</strong> estos límites:<br />
n<br />
lim<br />
n!" n<br />
lim<br />
n!"<br />
lim<br />
n!"<br />
n # 1<br />
n<br />
% $<br />
1 #<br />
'<br />
& n(<br />
1 # $ % '<br />
& n(<br />
n<br />
r<br />
... n # r +1<br />
n<br />
! lim<br />
!1<br />
Sustituyendo en [1] tenemos:<br />
n!"<br />
P(!) = !r<br />
r!<br />
$r<br />
1 #<br />
r lim<br />
n n!"<br />
$<br />
n<br />
% '<br />
& n (<br />
1 # $<br />
r<br />
% '<br />
& n (<br />
! 1<br />
+<br />
%<br />
-<br />
'<br />
) 1<br />
- 1 + *<br />
) n *<br />
- & #$ (<br />
,<br />
e" !<br />
n<br />
% $<br />
lim 1 #<br />
'<br />
n!" & n (<br />
r<br />
% $<br />
lim 1 #<br />
'<br />
n!" & n (<br />
# n<br />
$<br />
Es la función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> la distribución <strong>de</strong> Poisson.<br />
EJEMPLO 3.12:<br />
.<br />
0<br />
0<br />
0<br />
/<br />
#$<br />
! e #$<br />
Un comprador <strong>de</strong> gran<strong>de</strong>s cantida<strong>de</strong>s <strong>de</strong> circuitos integrados ha adoptado un<br />
plan para aceptar un envío <strong>de</strong> éstos, que consiste en inspeccionar una muestra <strong>de</strong> 100<br />
circuitos provenientes <strong>de</strong>l lote. Si el comprador encuentra no más <strong>de</strong> dos circuitos<br />
<strong>de</strong>fectuosos en la muestra, acepta el lote; <strong>de</strong> otra forma, lo rechaza. Si se envía al<br />
comprador un lote que contiene el 1% <strong>de</strong> circuitos <strong>de</strong>fectuosos, ¿cuál es la<br />
<strong>probabilidad</strong> <strong>de</strong> que sea aceptado el lote?.<br />
Solución:<br />
[1]<br />
160
Nuestra variable es:<br />
X: "número <strong>de</strong> circuitos <strong>de</strong>fectuosos en la muestra".<br />
X~B(n=100, p=0'01) np=1<br />
Si n≥50 y p≤0,1 se comporta aproximadamente como una Poisson.<br />
P(aceptar el lote) = P( x ! 2)<br />
= P( x = 0)<br />
+ P( x =1)<br />
+ P( x = 2)<br />
=<br />
= e "1 1 0 1 2<br />
+ e"11 + e"11<br />
0!<br />
EJEMPLO 3.13:<br />
1!<br />
= 0, 9197<br />
2!<br />
P(aceptar el lote) = 90%<br />
Es conocido el hecho <strong>de</strong> que cierto tipo <strong>de</strong> bacterias poseen, a<strong>de</strong>más <strong>de</strong> sus<br />
cromosomas, otras estructuras <strong>de</strong> ADN llamadas factores <strong>de</strong> resistencia. Estos factores<br />
confieren a la bacteria resistencia a uno o varios antibióticos. En un <strong>de</strong>terminado<br />
medio el 0,06% <strong>de</strong> las bacterias no poseen dicha propiedad. Sobre una población <strong>de</strong><br />
10.000 se <strong>de</strong>sea saber:<br />
a) La <strong>probabilidad</strong> <strong>de</strong> que el número <strong>de</strong> bacterias no poseyendo dicha resistencia<br />
sea superior a 6, pero inferior a 15.<br />
b) La <strong>probabilidad</strong> <strong>de</strong> que haya exactamente 5 sin resistencia antibiótica.<br />
Solución:<br />
Sea X el "número <strong>de</strong> bacterias que no poseen resistencia a los antibióticos".<br />
X~B(n=10.000, p=0'0006)~P(! =np=6)<br />
a)P(6 < x
<strong>de</strong>terminada composición que puedan observarse al analizar un conjunto <strong>de</strong> proteínas<br />
sigue una distribución <strong>de</strong> Poisson, que por otras investigaciones sabemos que tiene<br />
parámetro ! =0,4.<br />
Si <strong>de</strong>nominamos como X el número <strong>de</strong> dipéptidos observados en una composición<br />
<strong>de</strong>terminada:<br />
a) Calcular la <strong>probabilidad</strong> <strong>de</strong> no encontrar ninguno <strong>de</strong> tales dipéptidos en dicha<br />
composición.<br />
Solución:<br />
b) Probabilidad <strong>de</strong> encontrar dos o más.<br />
a)<br />
b)<br />
EJEMPLO 3.15:<br />
P( x = 0)<br />
= e !" " 0<br />
= e!0,4<br />
0!<br />
P(x ! 2) = 1" P( x
Ocurre un <strong>de</strong>terminado suceso en un intervalo <strong>de</strong> tiempo .<br />
Cumple las condiciones <strong>de</strong> Poisson.<br />
P( x = r)<br />
= !r<br />
r! e"!<br />
! es el número medio <strong>de</strong> veces que se da el suceso <strong>de</strong> <strong>probabilidad</strong> p.<br />
! = 210<br />
60<br />
= 3, 5<br />
La estación no podrá aten<strong>de</strong>r si llegan más <strong>de</strong> 10 automóviles por minuto.<br />
EJEMPLO 3.16:<br />
( ) = P( x = r )<br />
P X >10<br />
!<br />
" = 1 # " P x = r =<br />
r =11<br />
= 1 # 3,50<br />
0! e#3,5 +... + 3,510<br />
$<br />
%<br />
&<br />
10! e#3,5<br />
10<br />
r =0<br />
( )<br />
'<br />
(<br />
) =1 # 0, 9991 = 0, 0009<br />
El número <strong>de</strong> clientes que llega a un banco es una variable <strong>de</strong> Poisson. Si el<br />
número promedio es <strong>de</strong> 120 por hora, ¿cuál es la <strong>probabilidad</strong> <strong>de</strong> que en un minuto<br />
lleguen por lo menos tres clientes?.<br />
Solución:<br />
X: "número <strong>de</strong> clientes que llega a un banco en un minuto".<br />
E[x]=120 clientes por hora.<br />
E[X] = 120<br />
60<br />
= 2 = !<br />
P( X ! 3)<br />
= 1" P( X < 3)<br />
= 1 " P( x = 0)<br />
+ P( x =1)<br />
+ P( x = 2)<br />
= 1 " 0,1353 " 0, 2707 " 0, 2707 = 0, 3233<br />
La <strong>probabilidad</strong> es <strong>de</strong> un 33% aproximadamente.<br />
[ ] =<br />
163
EJEMPLO 3.17:<br />
Del volumen <strong>de</strong> producción diario en dos plantas diferentes <strong>de</strong> una fábrica, se<br />
sabe que la <strong>probabilidad</strong> <strong>de</strong> que resulten r unida<strong>de</strong>s <strong>de</strong>fectuosa es:<br />
fábrica.<br />
- en la 1 a planta: 4r<br />
r! e!4 para r = 0, 1, 2, ...<br />
- en la 2 a planta: 6r<br />
r! e!6 para r = 0, 1, 2, ...<br />
Determinar la <strong>probabilidad</strong> <strong>de</strong> que, en un día <strong>de</strong>terminado:<br />
a) resulten cinco o más unida<strong>de</strong>s <strong>de</strong>fectuosas en la 1 a planta.<br />
b) resulten cuatro o menos unida<strong>de</strong>s <strong>de</strong>fectuosas en la 2 a planta.<br />
c) resulten ocho o más unida<strong>de</strong>s <strong>de</strong>fectuosas <strong>de</strong>l total <strong>de</strong> la producción <strong>de</strong> la<br />
Solución:<br />
a) X1: "número <strong>de</strong> unida<strong>de</strong>s <strong>de</strong>fectuosas en la 1 a planta". ! P(4)<br />
P( X1 ! 5)<br />
= 1" P( X1 < 5)<br />
=1 " P x1 = 0<br />
P( X1 ! 5)<br />
= 0, 3711<br />
[ ( )+...+P ( x1 = 4)<br />
]<br />
b) X2: "número <strong>de</strong> unida<strong>de</strong>s <strong>de</strong>fectuosas en la 2 a planta". ! P(6)<br />
P( X2 ! 4)<br />
= P( x2 = 0)+...+P<br />
( x2 = 4)<br />
= 0, 2851<br />
c) X3: "número <strong>de</strong> unida<strong>de</strong>s <strong>de</strong>fectuosas <strong>de</strong>l total <strong>de</strong> la producción."<br />
P( X3 ! 8)<br />
= 1" P( x3 < 8)<br />
= 0, 7797<br />
Da la impresión <strong>de</strong> que la empresa <strong>de</strong>bería revisar su producción.<br />
3.1.5 Distribución Hipergeométrica<br />
En la distribución binomial siempre aseguramos la in<strong>de</strong>pen<strong>de</strong>ncia, es <strong>de</strong>cir, el<br />
muestreo se realiza con reemplazamiento y la <strong>probabilidad</strong> <strong>de</strong> éxito es constante en cada<br />
164
una <strong>de</strong> las pruebas. Supongamos que esto no ocurre, no hay reemplazamiento y la<br />
variable aleatoria sigue otro tipo <strong>de</strong> distribución. Veamos un ejemplo:<br />
Sea N el número <strong>de</strong> profesores <strong>de</strong> un Centro <strong>de</strong> Enseñanza Secundaria que <strong>de</strong>ben<br />
elegir Director entre dos candidatos A y B. Sea n el número <strong>de</strong> profesores que apoyan al<br />
candidato A y N-n el número <strong>de</strong> profesores que apoyan al candidato B. Supongamos<br />
que queremos hacer un son<strong>de</strong>o antes <strong>de</strong> la votación final, tomamos una muestra con K<br />
profesores y le preguntamos el candidato al que piensan votar. Supongamos que X es la<br />
variable aleatoria que nos mi<strong>de</strong> el número <strong>de</strong> profesores <strong>de</strong> la muestra que piensan votar<br />
al candidato A. El interés está en calcular la <strong>probabilidad</strong> <strong>de</strong> que X=r, es <strong>de</strong>cir, que en la<br />
muestra haya r personas que piensan votar al candidato A.<br />
Deduciremos la fórmula utilizando la Ley <strong>de</strong> Laplace.<br />
¿De cuántas maneras puedo elegir muestras <strong>de</strong> tamaño n entre N elementos que<br />
tiene la población?.<br />
!<br />
#<br />
N$<br />
" n % casos posibles<br />
De éstos, ¿cuáles serán favorables a nuestro suceso?. Aquellas que tengan r éxitos<br />
y N-r fracasos.<br />
(r veces) (n! r veces )<br />
EE ! # " ... # $ E FF ! # " ... # $ F<br />
Np Nq<br />
Es preciso conocer la <strong>probabilidad</strong> <strong>de</strong> éxito y la <strong>probabilidad</strong> <strong>de</strong> fracaso en la<br />
población. El número <strong>de</strong> casos favorables será:<br />
!<br />
#<br />
Np$<br />
!<br />
#<br />
Nq $<br />
" r % " n & r%<br />
Por consiguiente:<br />
!<br />
#<br />
Np$<br />
!<br />
#<br />
Nq $<br />
" r % " n & r%<br />
P( X = r ) =<br />
; r = 0,1,2,..., n<br />
! #<br />
N$<br />
" n%<br />
Media: E[ x]<br />
= np<br />
165
N ! n<br />
Varianza: V[ x]<br />
= npq<br />
N !1<br />
Cuando n<br />
! 0, 05, la distribución hipergeométrica se aproxima a la binomial.<br />
N<br />
EJEMPLO 3.18:<br />
Un fabricante asegura que sólo el 1% <strong>de</strong> su producción total se encuentra<br />
<strong>de</strong>fectuosa. Supóngase que se or<strong>de</strong>nan 1000 artículos y se seleccionan 25 al azar para<br />
inspeccionarlos. Si el fabricante se encuentra en lo correcto, ¿cuál es la <strong>probabilidad</strong><br />
<strong>de</strong> observar dos o más artículos <strong>de</strong>fectuosos en la muestra?.<br />
Solución:<br />
Tenemos una población <strong>de</strong> tamaño N=1000<br />
P(éxito)=0,0 l<br />
X: "número <strong>de</strong> artículos <strong>de</strong>fectuosos en la muestra".<br />
Tamaño <strong>de</strong> la muestra n=25<br />
Si inspeccionamos uno <strong>de</strong> los 25, ese no lo volvemos a inspeccionar, luego no hay<br />
reemplazamiento, la p <strong>de</strong> las distintas pruebas no se mantiene constante. Se trata <strong>de</strong> una<br />
distribución hipergeométrica.<br />
[ ]<br />
P( x ! 2)<br />
= l " P( x < 2)<br />
= l " P( x = 0)<br />
+ P( x = 1)<br />
! 1000 0, 01<br />
# $ ! 1000 0, 99<br />
# $ &<br />
" 0 % " 25 % (<br />
P( X = 0 ) =<br />
= 0, 7754<br />
! 1000<br />
# $<br />
(<br />
" 25 %<br />
(<br />
' P( X * 2)<br />
= 0, 0239<br />
! 10<br />
# $ ! 990<br />
# $<br />
(<br />
" 1 % " 24 %<br />
P( X =1)<br />
=<br />
= 0, 2007<br />
(<br />
! 1000<br />
# $<br />
(<br />
" 25 %<br />
)<br />
166
Puesto que n 25<br />
= = 0, 025 < 0, 05<br />
N 1000<br />
Po<strong>de</strong>mos aproximar por una binomial:<br />
EJEMPLO 3.19:<br />
[ ] =<br />
P( x ! 2)<br />
= l " P( x = 0)<br />
+ P( x =1)<br />
= 1 " 25 #<br />
% &<br />
$ 0 ' 0, 010 0, 99 25 " 25 #<br />
% &<br />
$ 1 ' 0, 011 0, 99 24 =<br />
1 " 0, 7778 " 0,1964 = 0, 0258<br />
Supóngase que se tienen 50 representantes <strong>de</strong> cierto estado, en una convención<br />
política nacional, <strong>de</strong> los cuales 30 apoyan al candidato A y 20 al candidato B.<br />
Si se seleccionan aleatoriamente 5 representantes, ¿cuál es la <strong>probabilidad</strong> <strong>de</strong><br />
que, entre estos cinco, por lo menos dos apoyen al candidato A?.<br />
<strong>de</strong>l 92%.<br />
Solución:<br />
X: "número <strong>de</strong> personas <strong>de</strong> la muestra que apoyan al candidato A.<br />
N = 50<br />
n = 5<br />
p = 3<br />
!<br />
#<br />
" X % H 50, 5,<br />
#<br />
5 $<br />
3 & (<br />
' 5)<br />
P( x ! 2)<br />
= l " P( x < 2)<br />
=1 " P( x = 0)<br />
+ P( x = 1)<br />
[ ]<br />
50<br />
P( X = 0)<br />
=<br />
3 # &<br />
% 5(<br />
$ 0 '<br />
50 2 # &<br />
% 5(<br />
$ 5 '<br />
#<br />
%<br />
50&<br />
$ 5 '<br />
50<br />
P( X = 1)<br />
=<br />
3 # &<br />
% 5(<br />
$ 1 '<br />
50 2<br />
)<br />
+<br />
+<br />
+<br />
#<br />
* P( X ! 2)<br />
= 0, 9241<br />
&<br />
% 5(<br />
+<br />
$ 4 ' +<br />
#<br />
%<br />
50&<br />
+<br />
$ 5 ' ,<br />
+<br />
No hay duda <strong>de</strong> que al menos dos apoyarán al candidato A. con una <strong>probabilidad</strong><br />
167
EJEMPLO 3.20:<br />
En una clase en la que hay 20 estudiantes, 15 están insatisfechos con el texto que<br />
se utiliza. Si se le pregunta acerca <strong>de</strong>l texto a cuatro estudiantes tomados al azar,<br />
<strong>de</strong>termine la <strong>probabilidad</strong> <strong>de</strong> que:<br />
a) exactamente tres estén insatisfechos con el texto.<br />
b) cuando menos tres estén insatisfechos.<br />
Solución:<br />
Hay dos sucesos mutuamente excluyentes:<br />
P(estar satisfechos) = 5/20 = 1/4<br />
P(no estar satisfecho) = 15/20 = 3/4<br />
Las pruebas son sin reemplazamiento, no tiene sentido volver a preguntar al<br />
mismo estudiante que se le preguntó antes.<br />
a)<br />
b)<br />
X: "número <strong>de</strong> alumnos que están insatisfechos con el texto".<br />
Es una H 20;4, 3 ! #<br />
" 4$<br />
EJEMPLO 3.21:<br />
!<br />
#<br />
Np$<br />
!<br />
#<br />
Nq $ !<br />
#<br />
15$<br />
!<br />
#<br />
5<br />
" r<br />
P( X = 3)<br />
=<br />
% " n & r%<br />
" 3 % " 1<br />
=<br />
! #<br />
N$<br />
" n%<br />
$<br />
%<br />
= 0, 469<br />
! #<br />
20$<br />
" 4 %<br />
P( X ! 3)<br />
= P( x = 3)<br />
+ P( x = 4)<br />
= 0, 75<br />
Un equipo <strong>de</strong>partamental incluye cinco biólogos especialistas en microbiología y<br />
nueve médicos. Si se eligen al azar cinco personas y se les asigna un proyecto, ¿cuál es<br />
la <strong>probabilidad</strong> <strong>de</strong> que el equipo <strong>de</strong>l proyecto incluya exactamente a dos biólogos?.<br />
168
Solución:<br />
X: "número <strong>de</strong> biólogos incluidos en el proyecto".<br />
P(biólogo) = 5/14<br />
P(médico) = 9/14<br />
EJEMPLO 3.22:<br />
X ! H 14;5, 5 " $<br />
# 14%<br />
P( X = 2 ) =<br />
!<br />
#<br />
5$<br />
!<br />
#<br />
9$<br />
" 2%<br />
" 3%<br />
= 0, 42<br />
! #<br />
14$<br />
" 5 %<br />
Considérese un fabricante <strong>de</strong> or<strong>de</strong>nadores que compra los microprocesadores a<br />
una compañía don<strong>de</strong> se fabrican bajo estrictas especificaciones. El fabricante recibe un<br />
lote <strong>de</strong> 40 microprocesadores. Su plan para aceptar el lote consiste en seleccionar 8, <strong>de</strong><br />
manera aleatoria y someterlos a prueba. Si encuentra que ninguno <strong>de</strong> los<br />
microprocesadores presenta serios <strong>de</strong>fectos, el fabricante acepta el lote; <strong>de</strong> otra forma<br />
lo rechaza. Suponiendo que el lote contenga dos microprocesadores con serios<br />
<strong>de</strong>fectos, ¿cuál es la <strong>probabilidad</strong> <strong>de</strong> que sea aceptado?<br />
Solución:<br />
X: "número <strong>de</strong> microprocesadores <strong>de</strong>fectuosos en la muestra".<br />
X ! H 40;8, 20 " $<br />
# 40 % p = 1<br />
P( X = 0)<br />
=<br />
20<br />
q = 19<br />
20<br />
" &<br />
2$<br />
" &<br />
38$<br />
# 0%<br />
# 8 %<br />
= 0, 6359<br />
"<br />
&<br />
40$<br />
# 8 %<br />
Si la persona que ven<strong>de</strong> sabe que le controlarán el producto, procurará que la<br />
empresa efectúe un control <strong>de</strong> calidad antes <strong>de</strong> iniciar las ventas. Aumentará la calidad<br />
<strong>de</strong>l producto.<br />
169
EJEMPLO 3.23:<br />
Una compañía <strong>de</strong>dicada a la producción <strong>de</strong> artículos electrónicos, utiliza un esquema<br />
para la aceptación <strong>de</strong> artículos, para su ensamblaje, antes <strong>de</strong> ser embarcados, que<br />
consiste en lo siguiente:<br />
Los artículos están embalados en cajas <strong>de</strong> 25 unida<strong>de</strong>s y un técnico <strong>de</strong> la compañía<br />
selecciona aleatoriamente tres artículos, <strong>de</strong> tal manera que si no encuentra ningún<br />
artículo <strong>de</strong>fectuoso, la caja se embarca.<br />
a) ¿Cuál es la <strong>probabilidad</strong> <strong>de</strong> que se embarque una caja que contiene tres artículos<br />
<strong>de</strong>fectuosos'?.<br />
b) ¿Cuál es la <strong>probabilidad</strong> <strong>de</strong> que una caja que contiene sólo un artículo <strong>de</strong>fectuoso<br />
regrese para su verificación?.<br />
Solución:<br />
X: "número <strong>de</strong> artículos <strong>de</strong>fectuosos en la muestra".<br />
a) Si la caja contiene tres artículos <strong>de</strong>fectuosos, la distribución es:<br />
N = 25 N1 = 3 N2 = 22 p = 3 22<br />
q =<br />
25 25<br />
!<br />
#<br />
Np$<br />
!<br />
#<br />
Nq $ ! #<br />
3$<br />
! #<br />
22 $<br />
" xi % " n & xi % " 0%<br />
" 3 & 0%<br />
P( X = 0 ) =<br />
=<br />
= 0, 6696<br />
!<br />
#<br />
N$<br />
!<br />
#<br />
25$<br />
" n % " 3 %<br />
Hay una <strong>probabilidad</strong> <strong>de</strong>l 67% <strong>de</strong> que se embarque la caja.<br />
b) La caja sólo contiene un articulo <strong>de</strong>fectuoso.<br />
N = 25 p = 1<br />
25<br />
25 1 ! $ !<br />
# 25&<br />
#<br />
P( X = 0 ) =<br />
"<br />
q = 24<br />
25<br />
24<br />
25<br />
$<br />
25&<br />
0 % " 3 %<br />
= 0, 88<br />
!<br />
#<br />
25$<br />
" 3 %<br />
Lógicamente la <strong>probabilidad</strong> <strong>de</strong> que no embarque es: 1-0,88 = 0,12<br />
Lo más probable es que las cajas que tengan un artículo <strong>de</strong>fectuoso sean<br />
embarcadas.<br />
170
esquema.<br />
EJEMPLO 3.24:<br />
Supongamos que una compañía hace el estudio <strong>de</strong> la calidad conforme a otro<br />
Se toma un artículo, se inspecciona y se <strong>de</strong>vuelve a la caja; lo mismo ocurre con<br />
un 2º y un 3 er artículo.<br />
La caja no se embarca si cualquiera <strong>de</strong> los tres artículos es <strong>de</strong>fectuoso.<br />
Solución:<br />
a) B 3, 3 ! #<br />
" 25$<br />
b) B 3, 1 ! #<br />
" 25$<br />
( ) = 3 !<br />
P x = 0<br />
( ) = 3 !<br />
P x = 0<br />
# $ ! 3 $<br />
" 0%<br />
" 25%<br />
#<br />
" 0<br />
$ ! 1 $<br />
% " 25%<br />
0 22<br />
! $<br />
" 25%<br />
0 24<br />
! $<br />
" 25%<br />
3<br />
3<br />
= 0, 6815<br />
= 0, 8847<br />
La <strong>probabilidad</strong> <strong>de</strong> no embarcar sería: 1 - 0,8847 = 0,1153<br />
EJEMPLO 3.25:<br />
Considérese un fabricante <strong>de</strong> automóviles que compra los motores a una<br />
compañía don<strong>de</strong> se fabrican bajo estrictas especificaciones. El fabricante recibe un<br />
lote <strong>de</strong> 40 motores. Su plan para aceptar el lote consiste en seleccionar 8, <strong>de</strong> manera<br />
aleatoria, y someterlos a prueba. Si encuentra que ninguno <strong>de</strong> los motores presenta<br />
serios <strong>de</strong>fectos, el fabricante acepta el lote; contiene dos motores con serios <strong>de</strong>fectos,<br />
¿cuál es la <strong>probabilidad</strong> <strong>de</strong> que sea aceptado?.<br />
Solución:<br />
X: "número <strong>de</strong> motores <strong>de</strong>fectuosos en la muestra".<br />
171
N = 40 n = 8 p = 2<br />
40<br />
P( X = 0)<br />
=<br />
! 1<br />
H 40;8,<br />
#<br />
" 20$<br />
! %<br />
2#<br />
! %<br />
38#<br />
" 0$<br />
" 8 $<br />
= 0, 6359<br />
!<br />
%<br />
40#<br />
" 8 $<br />
172
"DISTRIBUCIONES DE PROBABILIDAD<br />
CONTINUAS"<br />
3.2 Parte básica<br />
173
3.2.1 Distribución normal.<br />
3.2.1.1 Introducción<br />
La distribución Normal es la distribución continua más importante <strong>de</strong>l Cálculo <strong>de</strong><br />
Probabilida<strong>de</strong>s y <strong>de</strong> la <strong>Estadística</strong>. Aparece por primera vez en 1733 en los trabajos <strong>de</strong><br />
DE MOIVRE relativos al cálculo <strong>de</strong> la distribución límite <strong>de</strong> una variable binomial.<br />
Posteriormente, en 1809, GAUSS y más tar<strong>de</strong>, en 1812, LAPLACE la estudiaron en<br />
relación con la teoría <strong>de</strong> errores <strong>de</strong> datos experimentales, al tratar <strong>de</strong> hallar el valor<br />
correcto más probable entre una serie <strong>de</strong> medidas. Primero, GAUSS, pensó que la<br />
media aritmética <strong>de</strong> los valores sería el valor correcto. Más tar<strong>de</strong>, al dibujar la<br />
distribución <strong>de</strong> frecuencias, observaron cómo los valores extremos eran incorrectos y<br />
cada vez las medidas se hacen más iguales y más numerosas, hasta concentrarse en un<br />
valor medio que es el valor más frecuente. Por esto, la distribución normal se conoce<br />
también con el nombre <strong>de</strong> distribución <strong>de</strong> GAUSS-LAPLACE.<br />
Una primera aproximación <strong>de</strong> la distribución normal pue<strong>de</strong> observarse con el<br />
experimento que realizó SIR FRANCIS GALTON, que construyó un ingenioso aparato,<br />
formado por un tablero inclinado, en el que se distribuyen regularmente un sistema <strong>de</strong><br />
clavos, para acabar finalmente en compartimentos estrechos. Al <strong>de</strong>slizar muchas bolas<br />
<strong>de</strong>s<strong>de</strong> un <strong>de</strong>pósito superior, estas chocan con los clavos, y se alejan más o menos <strong>de</strong> la<br />
línea central <strong>de</strong> caída. Las alturas alcanzadas por las bolas en los compartimentos<br />
estrechos da una i<strong>de</strong>a <strong>de</strong> la curva <strong>de</strong> la distribución normal (ver figura 3.2).<br />
Figura 3.2: Dispositivo <strong>de</strong> Galton<br />
174
El nombre <strong>de</strong> distribución normal se <strong>de</strong>be al hecho <strong>de</strong> que una mayoría <strong>de</strong> las<br />
variables aleatorias <strong>de</strong> la Naturaleza siguen esta distribución, lo que hizo pensar que<br />
todas las variables continuas <strong>de</strong> la Naturaleza eran normales, llamando a las <strong>de</strong>más<br />
distribuciones "anormales". No obstante, hoy en día, ya no se piensa <strong>de</strong> la misma<br />
manera, ya que ningún estadístico dice que una distribución que no sea normal, es<br />
anormal. No obstante, la distribución normal es la más importante por sus propieda<strong>de</strong>s<br />
sencillas, porque aparece frecuentemente en la Naturaleza, (fenómenos relacionados con<br />
psicología, biología, etc. ), y por una propiedad <strong>de</strong> algunos fenómenos que se aproximan<br />
asintóticamente a la distribución normal (Teorema Central <strong>de</strong>l Límite).<br />
3.2.1.2 Definición<br />
De modo riguroso, se dice que una variable aleatoria sigue una distribución<br />
normal <strong>de</strong> media µ, y <strong>de</strong>sviación típica σ, y se <strong>de</strong>signará por N(µ, σ), si se cumplen las<br />
siguientes condiciones:<br />
La variable recorre toda la recta real, y la función <strong>de</strong> <strong>de</strong>nsidad es <strong>de</strong> la forma:<br />
f(x) =<br />
1<br />
! 2" e# 1 x# µ<br />
2 ( ! )2<br />
don<strong>de</strong> e = 2.71828; π= 3.14159; µ es la media <strong>de</strong> la distribución y σ es la <strong>de</strong>sviación<br />
típica.<br />
Esta función <strong>de</strong> <strong>de</strong>nsidad que parece en principio con una expresión matemática<br />
aparentemente complicada, tiene la siguiente representación (figura 3.3):<br />
µ 0<br />
Figura 3.3: Representación gráfica da la campana <strong>de</strong> Gauss<br />
conocida como campana <strong>de</strong> Gauss, y con las siguientes propieda<strong>de</strong>s:<br />
175
1.- La curva tiene forma campaniforme y es simétrica respecto a la recta vertical x = µ.<br />
ya que el valor <strong>de</strong> la <strong>de</strong>nsidad es idéntico en µ + c y en µ - c, para todo valor <strong>de</strong> c, pues:<br />
f(µ + c) =<br />
f(µ # c) =<br />
2.- La or<strong>de</strong>nada es máxima en x = µ.<br />
(µ +c # µ)2<br />
1<br />
e# 2!<br />
! 2" 2<br />
(µ #c # µ)2<br />
1<br />
2! e#<br />
! 2" 2<br />
La <strong>de</strong>rivada <strong>de</strong> la función <strong>de</strong> <strong>de</strong>nsidad es:<br />
f' (x) =<br />
1<br />
! 2"<br />
e# (x# µ)2<br />
=<br />
=<br />
c2<br />
1<br />
e# 2!<br />
! 2" 2<br />
c2<br />
1 2! e#<br />
! 2" 2<br />
2! 2 # 1 $<br />
'<br />
2 (x # µ)<br />
%<br />
&<br />
2! (<br />
) = #<br />
1<br />
! 3 2"<br />
como la exponencial es siempre distinta <strong>de</strong> cero, se verifica que:<br />
como la <strong>de</strong>rivada segunda es:<br />
1<br />
f'' (x) = !<br />
" 3 2#<br />
como se verifica que :<br />
f' (x) = 0 ! (x " µ) = 0 ! x = µ<br />
2" 2 1<br />
+ !<br />
" 3 $<br />
'<br />
(x ! µ)<br />
% & 2# ( ) ! 2(x ! µ) $<br />
&<br />
%<br />
e! (x! µ)2<br />
1<br />
= !<br />
" 3 2#<br />
!µ)2<br />
e!(x<br />
2" 2<br />
$<br />
1 !<br />
%<br />
&<br />
(x ! µ)2<br />
" 2<br />
e# (x# µ)2<br />
2! 2 (x # µ)<br />
2" 2<br />
1<br />
f'' (µ) = !<br />
" 3 2# e0 1<br />
(1 ! 0) = !<br />
" 3 < 0<br />
2#<br />
luego en x = µ la función <strong>de</strong> <strong>de</strong>nsidad presenta un máximo <strong>de</strong> valor<br />
f(µ) =<br />
1<br />
! 2"<br />
'<br />
(<br />
)<br />
e<br />
! (x! µ)2<br />
2" 2<br />
'<br />
)<br />
(<br />
=<br />
176
3.- El área <strong>de</strong>l recinto encerrado bajo la campana y el eje x es igual a la unidad.<br />
Por tratarse <strong>de</strong> una función <strong>de</strong> <strong>de</strong>nsidad. Y al ser simétrica, <strong>de</strong>ja igual área, 0,5, a<br />
la izquierda y a la <strong>de</strong>recha <strong>de</strong> la recta x = µ. Esto se verifica porque:<br />
+"<br />
# f(x) =<br />
!"<br />
haciendo el cambio <strong>de</strong> variable<br />
=<br />
%<br />
+$<br />
#$<br />
1<br />
! 2"<br />
#<br />
x ! µ<br />
" = y , entonces dx = σ dy, y por lo tanto<br />
+"<br />
!"<br />
e# y2<br />
2 !dy =<br />
1<br />
$ 2%<br />
!µ)2<br />
2$<br />
e!(x 2<br />
dx =<br />
1<br />
2"<br />
%<br />
+$<br />
#$<br />
y2<br />
# 2 e dy =<br />
1<br />
2"<br />
2" =1<br />
ya que la última integral, conocida como la integral <strong>de</strong> Gauss vale 2! , ya que:<br />
+" y2 !<br />
+"<br />
2 I = e dy = 2 e # !" # 0<br />
! y2<br />
2 dy = 2I1 y al multiplicar I1 por sí misma, y mediante métodos <strong>de</strong> integración doble, resulta su<br />
cuadrado igual a π/2.<br />
4.- Presenta puntos <strong>de</strong> inflexión en los puntos <strong>de</strong> abscisas µ + σ y µ - σ, don<strong>de</strong> cambia<br />
<strong>de</strong> concavidad (lo que <strong>de</strong>termina que cuánto mayor sea σ , más achatada sea la curva).<br />
El punto <strong>de</strong> inflexión se obtiene al igualar a cero la <strong>de</strong>rivada segunda, por lo tanto:<br />
(x " µ)2<br />
f'' (x) = 0 ! 1 "<br />
# 2<br />
= 0 !<br />
x " µ<br />
# = ±1! x = µ ± #<br />
Así, pues, presenta puntos <strong>de</strong> inflexión en los puntos x = µ + σ y en x = µ - σ,<br />
don<strong>de</strong> las coor<strong>de</strong>nadas <strong>de</strong> los puntos son: en x = µ + σ<br />
f(µ + !) =<br />
y en el punto x = µ - σ<br />
(µ +! #µ )2<br />
1<br />
2!<br />
e#<br />
! 2" 2<br />
=<br />
!2<br />
1 2!<br />
e#<br />
! 2" 2<br />
=<br />
1<br />
! 2" e# 1 2 =<br />
1<br />
! 2"e<br />
177
f(µ ! ") =<br />
(µ !" ! µ )2<br />
1<br />
2" e!<br />
" 2# 2<br />
5.- Es asintótica al eje <strong>de</strong> abscisas.<br />
=<br />
"2<br />
1 2" e!<br />
" 2# 2<br />
=<br />
1<br />
" 2# e! 1 2 =<br />
Pues como e x tien<strong>de</strong> a 0 cuando x tien<strong>de</strong> a infinito, entonces:<br />
lim f(x) = lim<br />
x!+" x!+"<br />
(x% µ)2<br />
1 2# e%<br />
# 2$ 2<br />
1<br />
" 2#e<br />
es <strong>de</strong>cir, el eje OX es una asíntota horizontal, e igual para x tendiendo a -∞.<br />
En la figura 3.4 pue<strong>de</strong> observarse que para σ fijo, el variar µ tiene el efecto <strong>de</strong><br />
<strong>de</strong>splazar la curva hacia la <strong>de</strong>recha o la izquierda; manteniendo µ constante, el cambio<br />
<strong>de</strong> σ tiene por efecto acercar o alargar <strong>de</strong>l valor medio µ los puntos <strong>de</strong> inflexión, es<br />
<strong>de</strong>cir, un apuntamiento o aplastamiento <strong>de</strong> la curva (ver figura 3.5).<br />
µ-a<br />
µ µ+a<br />
= 0<br />
Figura 3.4: Efecto <strong>de</strong> la variación <strong>de</strong> µ en la distribución normal<br />
178
Figura 3.5: Efecto <strong>de</strong> la variación <strong>de</strong> σ manteniendo µ constante<br />
3.2.1.3 La distribución normal estándar N(0,1)<br />
En las familias representadas por las distribuciones normales ocupa un lugar<br />
especial la distribución que tiene <strong>de</strong> media cero (µ = 0) y por <strong>de</strong>sviación típica la unidad<br />
(σ = 1). Esta distribución se llama la distribución normal estándar, o reducida.<br />
Su función <strong>de</strong> <strong>de</strong>nsidad es:<br />
y su función <strong>de</strong> distribución es la siguiente:<br />
f(x) = 1 x2<br />
2 e" x #("$,+$)<br />
2!<br />
F(x) = P(! " x) = 1<br />
2#<br />
y cuyas representaciones aparecen en las figura 3.6:<br />
x<br />
&<br />
$%<br />
e $ x2 2 dx<br />
179
1,2<br />
1<br />
,8<br />
,6<br />
,4<br />
,2<br />
0<br />
-,2<br />
1<br />
2 !<br />
-4 -3 -2 -1 0 1 2 3 4<br />
Figura 3.6: Representación <strong>de</strong> las funciones <strong>de</strong> <strong>de</strong>nsidad y distribución <strong>de</strong> la N(0,1).<br />
La función <strong>de</strong> distribución <strong>de</strong> la ley normal estándar proporciona el área <strong>de</strong>l<br />
recinto que encierra la función <strong>de</strong> <strong>de</strong>nsidad, hasta el punto x, y con el fin <strong>de</strong> facilitar el<br />
cálculo <strong>de</strong> ésta superficie, y no tener que utilizar en todo momento el cálculo integral, se<br />
han elaborado unas tablas <strong>de</strong> fácil uso, entre las que se encuentran las que aparecen a<br />
continuación:<br />
x 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09<br />
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359<br />
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753<br />
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141<br />
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517<br />
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879<br />
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224<br />
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549<br />
0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852<br />
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133<br />
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389<br />
1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621<br />
1.1 0.8643 0.8655 0.8686 0.8708 0.8729 0.8749 0.8870 0.8790 0.8810 0.8830<br />
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015<br />
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177<br />
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319<br />
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441<br />
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545<br />
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633<br />
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706<br />
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767<br />
2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817<br />
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857<br />
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890<br />
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916<br />
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936<br />
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952<br />
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964<br />
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974<br />
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981<br />
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986<br />
Tablas <strong>de</strong> la distribución normal estándar<br />
180
3.2.1.4 Manejo <strong>de</strong> las tablas <strong>de</strong> la normal estándar<br />
Las tablas anteriores nos proporcionan directamente la función <strong>de</strong> distribución <strong>de</strong><br />
la variable normal estándar, por lo que ellas nos darán directamente la <strong>probabilidad</strong> <strong>de</strong><br />
que la variable tome valores menores o iguales que un <strong>de</strong>terminado valor (P(ξ ≤ x)).<br />
Veamos su utilización con un ejemplo sencillo. Si Z es una variable que sigue una<br />
distribución N(0,1), calcularemos la <strong>probabilidad</strong> <strong>de</strong> que la variable Z tome valores<br />
menores o iguales a 1.37.<br />
La <strong>probabilidad</strong> pedida es el área sombreada <strong>de</strong> la figura 3.7.<br />
Figura 3.7: Área hasta el valor 1.37<br />
y se encuentra directamente en la tabla sin más que buscar 1.3 en la primera columna, y<br />
0.07 en la primera fila; su intersección nos da la <strong>probabilidad</strong>:<br />
Es <strong>de</strong>cir:<br />
P(Z ≤ 1.37) = 0.9147<br />
que quiere <strong>de</strong>cir que el 91.47% <strong>de</strong> las observaciones se encuentran distribuidas entre -∞<br />
y 1.37.<br />
181
Existen a<strong>de</strong>más <strong>de</strong> las tablas anteriores otros tipos <strong>de</strong> tablas publicadas <strong>de</strong> la<br />
distribución normal estándar. Quizá las más importantes sean las siguientes:<br />
1.- Tabla <strong>de</strong> dos colas :<br />
Esta tabla da las áreas <strong>de</strong> las dos colas <strong>de</strong> la distribución, es <strong>de</strong>cir, da la siguiente<br />
<strong>probabilidad</strong><br />
2.- Tabla <strong>de</strong> una cola :<br />
P( |Z| ≥ a ) = P( -∞ < Z ≤ -a ) + P( a ≤ Z < +∞ )<br />
-a<br />
0<br />
Figura 3.8: Área <strong>de</strong> la tabla <strong>de</strong> dos colas<br />
Nos da el área <strong>de</strong> la cola <strong>de</strong>recha <strong>de</strong> la distribución, es <strong>de</strong>cir, la siguiente<br />
<strong>probabilidad</strong><br />
3.- Tabla <strong>de</strong> valores :<br />
P( Z ≥ a )<br />
Que contiene todos los valores entre 0 e infinito.<br />
a<br />
182
4.- Tabla <strong>de</strong> áreas acumuladas :<br />
Nos da la <strong>probabilidad</strong> <strong>de</strong> que un valor esté comprendido entre -∞ y a, es <strong>de</strong>cir, la<br />
siguiente <strong>probabilidad</strong><br />
P( -∞ < Z ≤ -a )<br />
Este último tipo <strong>de</strong> tablas es el que hemos utilizado anteriormente, pues nos<br />
proporciona la función <strong>de</strong> distribución <strong>de</strong> la variable.<br />
3.2.1.5 Tipificación <strong>de</strong> la variable<br />
Hemos indicado anteriormente que la distribución normal estándar N(0,1) se<br />
encuentra tabulada, lo que nos permite un cálculo rápido <strong>de</strong> las probabilida<strong>de</strong>s asociadas<br />
a ésta distribución. Pero no existen tablas para el cálculo <strong>de</strong> las probabilida<strong>de</strong>s <strong>de</strong> otras<br />
distribuciones normales, a<strong>de</strong>más <strong>de</strong> que tendrían que existir infinitas tablas (una para<br />
cada posible par <strong>de</strong> combinaciones <strong>de</strong> media y <strong>de</strong>sviación típica). Aprovechando que el<br />
comportamiento <strong>de</strong> las curva <strong>de</strong> las distribuciones normales es siempre el mismo, nos<br />
hace pensar que podría existir una distribución normal que permanezca invariable, sea<br />
cuál sea la variable. Esta es la distribución normal estándar, y el proceso <strong>de</strong> pasar <strong>de</strong> una<br />
distribución normal cualquiera a una distribución normal estándar se <strong>de</strong>nomina<br />
tipificación <strong>de</strong> la variable, que equivale a cambiar la escala <strong>de</strong> partida <strong>de</strong> los valores <strong>de</strong><br />
X en una nueva escala patrón. Esto se lleva a cabo en dos pasos:<br />
1º Centrar, es <strong>de</strong>cir, trasladar la media <strong>de</strong> la distribución al origen <strong>de</strong><br />
coor<strong>de</strong>nadas, lo que equivale a hacer µ = 0.<br />
2º Reducir la <strong>de</strong>sviación típica a 1, que equivale a dilatar o contraer la gráfica<br />
<strong>de</strong> la distribución hasta que coincida con la gráfica <strong>de</strong> la función normal<br />
estándar.<br />
Esto se consigue mediante el cambio <strong>de</strong> variable siguiente:<br />
Z =<br />
X ! µ<br />
"<br />
que produce la siguiente transformación <strong>de</strong> escala <strong>de</strong> medidas:<br />
183
µ -2! µ -! µ µ +! µ +2!<br />
-2<br />
-1<br />
0 1 2<br />
Valores <strong>de</strong> X<br />
Valores <strong>de</strong> Z<br />
3.2.1.6 Propieda<strong>de</strong>s <strong>de</strong> la distribución normal<br />
SUMA O RESTA DE VARIABLES NORMALES<br />
Si X1 es una variable que se distribuye normalmente N(µ1, σ1), y X2 es otra<br />
variable que se distribuye normalmente N(µ2, σ2). Entonces la variable X = X1 ± X2<br />
sigue también una distribución normal con media µ = µ1 ± µ2, y cuya varianza es σ 2 =<br />
σ1 2 + σ2 2 . Es <strong>de</strong>cir, la variable X sigue una distribución<br />
TEOREMA DE DE MOIVRE<br />
2 2<br />
N(µ 1 ± µ 2 , ! 1 + ! 2 )<br />
Si X es una variable binomial <strong>de</strong> parámetros n y p; entonces si n es gran<strong>de</strong> y p, ni<br />
pequeño ni gran<strong>de</strong>, (o sea, ni p ni q próximos a cero) po<strong>de</strong>mos consi<strong>de</strong>rar que esa<br />
variable X sigue una ley normal <strong>de</strong> media np y varianza npq, y por lo tanto, la variable<br />
sigue una distribución normal N(0,1).<br />
Z =<br />
X ! np<br />
npq<br />
En este caso hemos <strong>de</strong> tener en cuenta que X era una variable aleatoria discreta y<br />
queremos tratarle cómo continua, por lo que es preciso hacer una corrección para<br />
continuidad. Así se verifica que:<br />
P(X = 3) = P(2.5 < X ≤ 3.5)<br />
P(X ≤ 3) = P(X ≤ 3.5)<br />
P(X < 3) = P(X ≤ 2.5)<br />
184
Obviamente éstas no son igualda<strong>de</strong>s ciertas, pero permiten tratar la variable<br />
discreta como continua.<br />
Si en lugar <strong>de</strong> trabajar con una variable aleatoria binomial partiésemos <strong>de</strong> una<br />
variable <strong>de</strong> Poisson o una Hipergeométrica, la aproximación sería absolutamente<br />
similar.<br />
TEOREMA CENTRAL DEL LÍMITE<br />
Si X es una variable aleatoria (no importa como se distribuya) con media µ y<br />
varianza σ 2 , y tomamos una muestra <strong>de</strong> n elementos, entonces la distribución muestral<br />
<strong>de</strong> la media aritmética <strong>de</strong> la muestra es aproximadamente normal con media µ y<br />
varianza σ 2 /n, siendo mejor la aproximación a medida que aumenta el tamaño <strong>de</strong> la<br />
muestra.<br />
Lógicamente, si X es una variable que se distribuye normalmente, la media<br />
muestral se distribuye exactamente como una distribución normal.<br />
Este teorema es importante en posteriores unida<strong>de</strong>s, ya que nos dará pie a<br />
resultados fundamentales <strong>de</strong> la Inferencia <strong>Estadística</strong>.<br />
185
3.2.2 Mo<strong>de</strong>lo Chi-cuadrado (<strong>de</strong> Pearson)<br />
3.2.2.1 Definición<br />
Es otra distribución <strong>de</strong> gran importancia en <strong>Estadística</strong>, que fue <strong>de</strong>scubierta por<br />
HELMET (1876), pero cayó en el olvido hasta que en 1900 fue <strong>de</strong>scubierta <strong>de</strong> nuevo<br />
por PEARSON.<br />
Es una variable obtenida al sumar los cuadrados <strong>de</strong> n variables aleatorias normales<br />
estándar, in<strong>de</strong>pendientes entre sí. Recibe el nombre <strong>de</strong> χ 2 n <strong>de</strong> PEARSON, con n grados<br />
<strong>de</strong> libertad, o sea,<br />
χ 2 n = Z1 2 + Z2 2 + ..... + Zn 2<br />
siendo cada Zi una variable normal N(0,1), e in<strong>de</strong>pendientes.<br />
Esta variable <strong>de</strong>pen<strong>de</strong>, pues, <strong>de</strong>l número <strong>de</strong> sumandos que la forman, llamado<br />
"grados <strong>de</strong> libertad", y el rango es el semieje real positivo (ya que es una suma <strong>de</strong><br />
cuadrados).<br />
La función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> una variable χ 2 n es la siguiente:<br />
$<br />
f(x) = %<br />
&<br />
1<br />
2 n 2 !( n 2 ) e"x 2 x n 2 "1<br />
si x # 0<br />
0 si x < 0<br />
Para cada valor <strong>de</strong> n se tiene una curva distinta, como representación <strong>de</strong> su<br />
función <strong>de</strong> <strong>de</strong>nsidad. La figura 3.9 representa las funciones <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> variables<br />
Chi-cuadrado para diferentes valores <strong>de</strong> n.<br />
#<br />
*<br />
n"1 "x<br />
Γ(n) es la función gamma, que <strong>de</strong>nota la siguiente integral: !( n) = x e dx<br />
0<br />
si n en entero Γ(n) = (n-1)! ; a<strong>de</strong>más Γ(n/2) = √π.<br />
*<br />
$ que verifica, que<br />
186
Figura 3.9: Comparación entre las funciones <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> la variable<br />
chi-cuadrado para distintos valores <strong>de</strong> n.<br />
3.2.2.2 Propieda<strong>de</strong>s <strong>de</strong> la distribución chi-cuadrado<br />
1.- La variable solo pue<strong>de</strong> tomar valores positivos.<br />
2.- Es asimétrica.<br />
3.- Depen<strong>de</strong> <strong>de</strong>l parámetro n (grados <strong>de</strong> libertad).<br />
4.- Su esperanza matemática es n, y su varianza, 2n.<br />
5.- Propiedad aditiva o reproductiva :Si χ2 n y χ2 m son dos variables Chi-<br />
cuadrado con n y m grados <strong>de</strong> libertad respectivamente, in<strong>de</strong>pendientes<br />
entre sí, entonces la suma <strong>de</strong> las dos variables es una variable Chi-cuadrado<br />
con n+m grados <strong>de</strong> libertad. Esto se pue<strong>de</strong> generalizar a la suma <strong>de</strong><br />
cualquier número <strong>de</strong> variables Chi-cuadrado, in<strong>de</strong>pendientes.<br />
6.- Al aumentar el número <strong>de</strong> grados <strong>de</strong> libertad, la distribución Chi-<br />
cuadrado se aproxima asintóticamente a una distribución normal.<br />
Esta aproximación es <strong>de</strong> la siguiente forma:<br />
2<br />
para n > 30, la variable 2! n se aproxima asintóticamente a una variable<br />
N( 2n !1,1).<br />
7.- En una variable aleatoria normal N(µ, σ), si tomamos una muestra <strong>de</strong><br />
tamaño n se verifica que<br />
187
( n !1)ˆ<br />
s 2<br />
siendo ˆ<br />
s 2 la cuasivarianza muestral.<br />
" 2 es aproximadamente χ2 n-1<br />
3.2.2.3 Manejo <strong>de</strong> las tablas <strong>de</strong> la chi-cuadrado<br />
A continuación aparecen las tablas en las que figuran tabuladas las distribuciones<br />
Chi-cuadrado.<br />
Dentro <strong>de</strong> la tabla figura el valor <strong>de</strong> la variable que en una distribución Chi-<br />
cuadrado con los grados <strong>de</strong> libertad que vienen indicados en la primera columna, <strong>de</strong>ja<br />
un área α, indicado en la primera fila, a su <strong>de</strong>recha.<br />
188
g.l \α 0.9950 0.9750 0.950 0.900 0.200 0.10 0.050 0.025 0.010 0.001<br />
1 0.0000393 0.000982 0.00393 0.0158 1.642 2.706 3.841 5.024 6.631 10.828<br />
2 0.0100 0.0506 0.103 0.211 3.219 4.605 5.g91 2.378 9.210 13.816<br />
3 0.0717 0.216 0.352 0.584 4.642 6.251 7.851 9.348 11.345 16.266<br />
4 0.207 0.484 0.711 1.064 5.989 7.779 9.488 11.143 13.277 18.467<br />
5 0.412 0.831 1.]45 1.610 7.289 9.236 11.070 12.833 15.086 20.515<br />
6 0.676 1.237 1.635 2.204 8.558 10.645 17.592 14.449 16.812 22.458<br />
7 0.989 1.690 2.167 2.833 9.803 17.017 14.067 16.013 18.475 74.327<br />
8 1.344 2.180 2.733 3.490 11.030 13.362 15.507 17.535 20.090 26.124<br />
9 1.735 2.700 3.325 4.168 17.242 14.684 16.919 19.023 21.666 77.877<br />
10 2.156 3.247 3.940 4.865 13.442 15.987 18.307 20.483 23.209 29.588<br />
11 2.603 3.816 4.575 5.578 14.631 17.275 19.675 21.920 24.725 31.264<br />
12 3.074 4.404 5.226 6.304 15.812 18.549 21.026 23.337 26.217 32.909<br />
13 3.565 5.009 5.897 7.047 16.985 19.812 22.362 24.736 27.588 34.528<br />
14 4.075 5.629 6.571 7.790 18.151 21.064 23.685 26.119 29.141 36.173<br />
15 4.601 6.262 7.261 8.547 19.311 22.307 24.996 27.488 30.578 37.697<br />
16 5.142 6.908 7.962 9.312 20.465 23.452 26.296 28.845 32.000 39.752<br />
17 5.697 7.564 8.672 10.085 21.615 24.769 27.587 30.191 33.409 40.790<br />
18 6.265 8.231 9.390 10.865 22.760 25.989 28.869 31.526 34.805 42.312<br />
19 6.844 8.907 10.117 11.651 23.900 27.204 30.144 32.857 36.191 43.820<br />
20 7.434 9.591 10.851 12.443 25.038 28.412 31.410 34.170 37.566 45.315<br />
21 8.034 10.283 11.591 13.240 26.171 29.615 32.671 35.479 38.932 46.797<br />
22 8.643 10.982 12.338 14.041 27.301 30.813 33.924 36.781 40.289 48.268<br />
23 9.260 11.689 13.091 14.848 28.429 32.007 35.172 38.076 41.638 49.728<br />
24 9.886 12.401 13.848 15.659 29.553 33.196 36.415 39.364 42.980 51.179<br />
25 10.520 13.120 14.611 16.473 30.675 34.382 37.652 40.646 44.314 57.620<br />
26 11.160 13.844 15.379 17.292 31.795 35.563 38.885 41.923 45.642 54.052<br />
27 11.808 14.573 16.151 18.114 32.912 36.741 40.113 43.195 46.963 55.476<br />
28 12.461 15.308 16.928 18.939 34.027 37.916 41.337 44.461 48.278 56.892<br />
29 13.121 16.047 17.708 19.769 35.139 39.087 42.557 45.722 49.588 58.301<br />
30 13.787 16.791 18.493 20.599 36.250 40.256 43.773 46.979 50.892 59.703<br />
EJEMPLO 3.26:<br />
Tabla <strong>de</strong> la distribución Chi-cuadrado<br />
Si X sigue una distribución Chi-cuadrado con 12 grados <strong>de</strong> libertad.<br />
¿Cuál es el valor <strong>de</strong> la variable que <strong>de</strong>ja a su <strong>de</strong>recha un área <strong>de</strong> 0.05?<br />
Solución:<br />
Buscando en la tabla: 21.026<br />
189
3.2.3 Distribución t <strong>de</strong> Stu<strong>de</strong>nt<br />
3.2.3.1 Definición<br />
La distribución "t" es sumamente importante en Inferencia <strong>Estadística</strong>; fue<br />
<strong>de</strong>scubierta por GOSSET (1908). El nombre <strong>de</strong> STUDENT es el seudónimo con el que<br />
firmó sus publicaciones estadísticas, y pue<strong>de</strong> pensarse <strong>de</strong> él que es el fundador <strong>de</strong> la<br />
inferencia estadística exacta, pues hasta 1908 era corriente tratar a la variable<br />
como una variable normal.<br />
(x ! µ)<br />
s n<br />
En su <strong>de</strong>finición matemática, sean (η, η1, η2, ....., ηn) n+1 variables aleatorias<br />
normales N(0,1) e in<strong>de</strong>pendientes<br />
Se <strong>de</strong>fine la variable "t" <strong>de</strong> STUDENT con n grados <strong>de</strong> libertad como<br />
t n =<br />
!<br />
2 2 2<br />
! 1 + !2 +!+! n<br />
n<br />
También pue<strong>de</strong> <strong>de</strong>finirse a través <strong>de</strong> una variable Z normal estándar N(0,1), y una<br />
variable χ2 que siga una distribución Chi-cuadrado con n grados <strong>de</strong> libertad; se <strong>de</strong>fine<br />
entonces la variable "t" <strong>de</strong> STUDENT con n grados <strong>de</strong> libertad como<br />
t n = Z<br />
La función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> esta variable es:<br />
f(x) =<br />
! n 2<br />
n<br />
!(n+1<br />
2 )<br />
n"!( n # x2<br />
% 1 +<br />
2<br />
) $ n<br />
&<br />
(<br />
'<br />
) n +1<br />
2<br />
190
3.2.3.2 Propieda<strong>de</strong>s <strong>de</strong> la distribución "t"<br />
1.- Depen<strong>de</strong> <strong>de</strong> un único parámetro, el número <strong>de</strong> grados <strong>de</strong> libertad.<br />
2.- El rango <strong>de</strong> la variable es todo el eje real (-∞, +∞).<br />
3.- Su gráfica es simétrica respecto al eje <strong>de</strong> or<strong>de</strong>nadas OY.<br />
4.- El valor x = 0 es la media, mediana y moda <strong>de</strong> la distribución.<br />
5.- Al aumentar n, se va haciendo cada vez más apuntada la gráfica <strong>de</strong> su<br />
función <strong>de</strong> <strong>de</strong>nsidad, siendo el límite para n !∞ la curva normal tipificada.<br />
0<br />
Distr. Normal<br />
Distr. t <strong>de</strong> Stu<strong>de</strong>nt<br />
Figura 3.10: Función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> la distribución normal y <strong>de</strong> la "t".<br />
6.- En el muestreo <strong>de</strong> una población normal N(µ, σ), si tomamos una<br />
muestra <strong>de</strong> tamaño n <strong>de</strong> media x y varianza S 2 , la variable<br />
t n!1 =<br />
(x ! µ)<br />
s n !1<br />
sigue una distribución "t" <strong>de</strong> STUDENT con n-1 grados <strong>de</strong> libertad.<br />
Esta propiedad es muy utilizada en la estimación y el contraste <strong>de</strong> hipótesis sobre<br />
la media <strong>de</strong> la población.<br />
191
3.2.3.3 Manejo <strong>de</strong> las tablas <strong>de</strong> la distribución "t"<br />
Existen diferentes tipos <strong>de</strong> tablas <strong>de</strong> la distribución "t", siendo las más utilizadas<br />
las <strong>de</strong> una cola, y las <strong>de</strong> dos colas.<br />
Nosotros expondremos la utilización <strong>de</strong> las tablas <strong>de</strong> dos colas que aparecen a<br />
continuación:<br />
gl 0.50 0.40 0.30 0.20 0.10 0.05 0.02 0.01 0.001<br />
1 1.000 1.376 1.963 3.078 6.314 12.706 31.821 63.657 636.619<br />
2 0.816 1.061 1.386 1.886 2.920 4.303 6.965 9.925 31.598<br />
3 0.765 0.978 1.250 1.638 2.353 3.182 4.541 5.841 12.929<br />
4 0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604 8.610<br />
5 1.727 0.920 1.156 1.476 2.015 2.571 3.365 4.032 6.869<br />
6 0.718 0.906 1.134 1.440 1.943 2.447 3.143 3.707 5.959<br />
7 0.711 0.896 1.119 1.415 1.895 2.365 2.998 3.499 5.408<br />
8 0.706 0.889 1.108 1.397 1.860 2.306 2.896 3.355 5.041<br />
9 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250 4.781<br />
10 0.700 0.879 1.093 1.372 1.812 2.228 2.764 3.169 4.587<br />
11 0.697 0.876 1.088 1.363 1.796 2.201 2.718 3.106 4.437<br />
12 0.695 0.873 1.083 1.356 1.782 2.179 2.681 3.055 4.318<br />
13 0.694 0.870 1.07~ 1.350 1.771 2.160 2.650 3.012 4.221<br />
14 0.692 0.868 1.076 1.345 1.761 2.145 2.624 2.977 4.140<br />
15 0.691 0.866 1.074 1.341 1.753 2.131 2.602 2.947 4.073<br />
16 0.690 0.865 1.071 1.337 1.746 2.120 2.583 2.921 4.015<br />
17 0.689 0.863 1.069 1.333 1.740 2.110 2.567 2.898 3.965<br />
18 0.688 0.862 1.067 1.330 1.734 2.101 2.552 2.878 3.922<br />
19 0.688 0.861 1.066 1.328 1.729 2.093 2.539 2.861 3.883<br />
20 0.687 0.860 1.064 1.325 1.725 2.086 2.528 2.845 3.850<br />
21 0.686 0.859 1.063 1.323 1.721 2.080 2.518 2.831 3.819<br />
22 0.686 0.858 1.061 1.321 1.717 2.074 2.508 2.819 3.792<br />
23 0.685 0.858 1.060 1.319 1.714 2.069 2.500 2.807 3.767<br />
24 0.685 0.857 1.059 1.318 1.711 2.064 2.492 2.797 3.745<br />
25 0.684 0.856 1.058 1.316 1.708 2.060 2.485 2.787 3.725<br />
26 0.684 0.856 1.058 1.315 1.706 2.056 2.479 2.779 3.707<br />
27 0.684 0.855 1.057 1.314 1.703 2.052 2.473 2.771 3.690<br />
28 0.683 0.855 1.056 1.313 1.701 2.048 2.467 2.763 3.674<br />
29 0.683 0.854 1.055 1.311 1.699 2.045 2.462 2.756 3.659<br />
30 0.683 0.854 1.055 1.310 1.697 2.042 2.457 2.750 3.646<br />
35 0.682 0.852 1.052 1.306 1.690 2.030 2.438 2.724 3.592<br />
40 0.681 0.851 1.050 1.303 1.684 2.021 2.423 2.705 3.551<br />
45 0.680 0.850 1.049 1.301 1.679 2.014 2.412 2.690 3.521<br />
50 0.679 0.849 1.047 1.299 1.676 2.009 2.403 2.678 3.497<br />
60 0.679 0.848 1.046 1.296 1.671 2.000 2.390 2.660 3.461<br />
80 0.678 0.846 1.043 1.292 1.664 1.990 2.374 2.639 3.417<br />
100 0.677 0.845 1.042 1.290 1.660 1.984 2.364 2.626 3.391<br />
∞ 0.674 0.842 1.036 1.282 1.645 1.960 2.326 2.576 3.291<br />
Tabla <strong>de</strong> la distribución t <strong>de</strong> Stu<strong>de</strong>nt<br />
en ellas aparece el valor <strong>de</strong> la variable que para los grados <strong>de</strong> libertad indicados en la<br />
primera columna, <strong>de</strong>ja un área en las dos colas <strong>de</strong> valor α indicado en la primera fila.<br />
EJEMPLO 3.27:<br />
Si X es una distribución que sigue una distribución "t" con 10 grados <strong>de</strong><br />
libertad, calcular el valor <strong>de</strong> la variable, tal que a la izquierda <strong>de</strong> -2.228 y a la<br />
<strong>de</strong>recha <strong>de</strong> 2.228 <strong>de</strong>ja un área total <strong>de</strong> 0.05.<br />
192
Solución:<br />
193
3.2.4 Distribución "F" <strong>de</strong> Fisher-<br />
Sne<strong>de</strong>cor<br />
3.2.4.1 Definición<br />
Supongamos que X e Y sean dos variables aleatorias in<strong>de</strong>pendientes, que siguen<br />
distribuciones Chi-cuadrado con n y m grados <strong>de</strong> libertad respectivamente, y tales que<br />
n<br />
!<br />
i=1<br />
e Y = Yj 2<br />
m<br />
!<br />
j=1<br />
X = X i 2<br />
siendo las variables Xi e Yj que siguen distribuciones normal estándar.<br />
Se <strong>de</strong>fine la variable F <strong>de</strong> Sne<strong>de</strong>cor (o <strong>de</strong> Fisher-Sne<strong>de</strong>cor), la <strong>de</strong>finida por<br />
X<br />
F =<br />
n<br />
Y<br />
m<br />
<strong>de</strong>nominada distribución F <strong>de</strong> Fisher-Sne<strong>de</strong>cor con n y m grados <strong>de</strong> libertad.<br />
Su función <strong>de</strong> <strong>de</strong>nsidad está <strong>de</strong>finida por la función:<br />
!( n + m<br />
2<br />
fn,m (x) =<br />
)( n m ) n 2<br />
!( n 2 )!(m 2 )<br />
x<br />
"<br />
n 2#1<br />
(1 + n<br />
m x)(n+ m) %<br />
'<br />
si x > 0<br />
&<br />
2<br />
(<br />
'<br />
0 si x $ 0<br />
Su representación gráfica es <strong>de</strong> la siguiente forma:<br />
Figura 3.11: Representación <strong>de</strong> la función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> la distribución F <strong>de</strong> Sne<strong>de</strong>cor<br />
194
3.2.4.2 Propieda<strong>de</strong>s <strong>de</strong> la distribución F <strong>de</strong> Sne<strong>de</strong>cor<br />
1.- El recorrido <strong>de</strong> la variable F es el intervalo (0,∞).<br />
2.- Depen<strong>de</strong> <strong>de</strong> dos parámetros, los grados <strong>de</strong> libertad n y m.<br />
3.- Presenta asimetría positiva, con un grado que <strong>de</strong>pen<strong>de</strong> conjuntamente <strong>de</strong><br />
los grados <strong>de</strong> libertad <strong>de</strong>l numerador y <strong>de</strong>l <strong>de</strong>nominador.<br />
4.- El cociente ˆ s 1 2<br />
ˆ s<br />
2 sigue una distribución con n1-1 y n2-1 grados <strong>de</strong><br />
2<br />
libertad, siendo ˆ<br />
s 1 2 y ˆ<br />
s 2 2 las cuasivarianza muestrales <strong>de</strong> dos muestras <strong>de</strong><br />
tamaños n1 y n2 respectivamente, provenientes <strong>de</strong> dos poblaciones normales<br />
N(µ1, σ1) y N(µ2, σ2) respectivamente.<br />
Esto es consecuencia <strong>de</strong> que el teorema <strong>de</strong> Fisher indica que la variable<br />
( n1 !1)ˆ<br />
" 2<br />
sigue una distribución Chi-cuadrado con n1-1 grados <strong>de</strong> libertad, y<br />
análogamente, la variable<br />
2 ( n2 !1)ˆ<br />
s 2<br />
" 2<br />
sigue una distribución Chi-cuadrado con n2-1 grados <strong>de</strong> libertad. Entonces,<br />
el cociente<br />
s 1 2<br />
2<br />
( n1 !1)ˆ<br />
s 1<br />
( n1 !1)"<br />
2<br />
2<br />
( n2 !1)ˆ<br />
s 2<br />
( n2 !1)"<br />
2<br />
sigue una distribución F <strong>de</strong> Sne<strong>de</strong>cor con n1-1 y n2-1 grados <strong>de</strong> libertad, y si<br />
las varianzas poblacionales son iguales, se verifica entonces el resultado<br />
indicado.<br />
195
5.- La distribución F juega un papel importante en el análisis <strong>de</strong> la varianza<br />
(ANOVA) y en el análisis <strong>de</strong> la regresión.<br />
3.2.4.3 Utilización <strong>de</strong> las tablas <strong>de</strong> la distribución F<br />
<strong>de</strong> Sne<strong>de</strong>cor<br />
Las tablas <strong>de</strong> la distribución F <strong>de</strong> Sne<strong>de</strong>cor contienen los valores Fα tales que<br />
P(F>Fα ) = α, para n y m grados <strong>de</strong> libertad, y para cada nivel <strong>de</strong> significación en cada<br />
una <strong>de</strong> las tablas.<br />
n 2\n 1 1 2 3 4 5 6 7 8 9 10 20 30 40 60 120 ∞<br />
1 161.4 199.5 215.7 224.6 230.2 234.0 236.8 238.9 240.5 241.9 248.0 250.1 251.1 252.2 253.3 254.3<br />
2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 19.45 19.46 19.47 19.48 19.49 19.50<br />
3 10.13 9.55 9.28 9.12 9.01 8.94 6.89 8.85 8.81 8.79 8.66 8.62 8.59 8.57 8.55 8.53<br />
4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.97 5.80 5.74 5.72 5.69 5.66 5.63<br />
5 6.61 5~79 5.41 5.19 5.05 4.95 4.88 4.82. 4.77 4.73 4.56 4.50 4.46 4.43 4.40 4.36<br />
6 S~99 5.14 4.76 4~53 4.39 4.28 4.21 4.15 4.10 4.06 3.87 3.81 3.77 3.74 3.70 3.67<br />
7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.44 3.38 3.34 3.31 3.27 3.23<br />
8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.15 3.08 3.04 3.00 2.97 2.93<br />
9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 2.94 2.86 2.83 2.79 2.75 2.71<br />
10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.77 2.70 2.66 2.62 2.58 2.54<br />
11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.85 2.65 2.57 2.53 2.49 2.45 2.40<br />
12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75 2.54 2.47 2.43 2.38 2.34 2.30<br />
13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 2.67 2.46 2.38 2.34 2.30 2.25 2.21<br />
14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 2.39 2.31 2.27 2.22 2.18 2.13<br />
15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54 2.33 2.25 2.20 2.16 2.11 2.07<br />
16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49 2.28 2.19 2.15 2.11 2.06 2.01<br />
17 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49 2.45 2.23 2.15 2.10 2.06 2.01 1.96<br />
18 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41 2.19 2.11 2.06 2.02 1.97 1.92<br />
19 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42 2.38 2.16 2.07 2.03 1.98 1.93 1.88<br />
20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35 2.12 2.04 1.99 1.95 1.90 1.84<br />
21 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37 2.32 2.10 2.01 1.96 1.92 1.87 1.81<br />
22 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34 2.30 2.07 1.98 1.94 1.89 1.84 1.78<br />
23 4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37 2.32 2.27 2.05 1.96 1.91 1.86 1.81 1.76<br />
24 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30 2.25 2.03 1.94 1.89 1.84 1.79 1.73<br />
25 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28 2.24 2.01 1.92 1.87 1.82 1.77 1.71<br />
26 4.23 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27 2.22 1.99 1.90 1.85 1.80 1.75 1.69<br />
27 4.21 3.35 2.96 2.73 2.57 2.46 2.37 2.31 2.25 2.20 1.97 1.88 1.84 1.79 1.73 1.67<br />
28 4.20 3.34 2.95 2.71 2.56 2.45 2.36 2.29 2.24 2.19 1.96 1.87 1.82 1.77 1.71 1.65<br />
29 4.18 3.33 2.93 2.70 2.55 2.43 2.35 2.28 2.22 2.18 1.94 1.85 1.81 1.75 1.70 1.64<br />
30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 2.16 1.93 1.84 1.79 1.74 1.68 1.62<br />
40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.08 1.84 1.74 1.69 1.64 1.58 1.51<br />
60 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04 1.99 1.75 1.65 1.59 1.53 1.47 1.39<br />
120 3.92 3.07 2.68 2.45 2.29 2.18 2.09 2.02 1.96 1.91 1.66 1.55 1.50 1.43 1.35 1.25<br />
∞ 3.84 3.00 2.60 2.37 2.21 2.10 2.01 1.94 1.88 1.83 1.57 1.46 1.39 1.32 1.22 1.00<br />
EJEMPLO 3.28:<br />
Tabla <strong>de</strong> la distribución F <strong>de</strong> Fisher-Sne<strong>de</strong>cor al nivel <strong>de</strong>l 5%<br />
Calcular Fα para α=0.05, y n=5; m=15 grados <strong>de</strong> libertad.<br />
Solución:<br />
Se busca en la tabla correspondiente al nivel <strong>de</strong>l 5%, en la primera fila, los<br />
grados <strong>de</strong> libertad <strong>de</strong>l numerador (5), y en la primera columna los grados <strong>de</strong> libertad<br />
<strong>de</strong>l <strong>de</strong>nominador (15), apareciendo el valor <strong>de</strong> Fα en la confluencia <strong>de</strong> dicha fila y<br />
columna:<br />
196
Así, se verifica que:<br />
EJEMPLO 3.29:<br />
F0.05; 5, 15 = 2.90<br />
Calcular Fα para α=0.95, y n=15; m=5 grados <strong>de</strong> libertad.<br />
Solución:<br />
Teniendo en cuenta la siguiente propiedad<br />
se verifica que<br />
F !;n,m =<br />
1<br />
F 1"!;m,n<br />
1 1<br />
F0.95;15,5 =<br />
=<br />
F1!0.95;5,15 F0.05;5,15 = 1<br />
= 0.345<br />
2.90<br />
197
"DISTRIBUCIÓN NORMAL"<br />
3.3 Ampliación<br />
198
Obviamente al profesor le bastaría con tener en cuenta que la representación<br />
gráfica <strong>de</strong> la función <strong>de</strong> <strong>de</strong>nsidad es una curva simétrica y que el área bajo la curva es<br />
la unidad, pero enten<strong>de</strong>mos que pue<strong>de</strong> resultarle cómodo disponer <strong>de</strong> un juego <strong>de</strong><br />
ejercicios que contemplen distintos casos <strong>de</strong> uso frecuente.<br />
El siguiente apartado está redactado <strong>de</strong> acuerdo a esta i<strong>de</strong>a.<br />
3.3.1 Algunos casos <strong>de</strong> interés en el<br />
manejo <strong>de</strong> tablas <strong>de</strong> la normal<br />
Dada la importancia y el gran uso <strong>de</strong> la distribución normal, vamos a analizar en<br />
<strong>de</strong>talle distintos casos que se suelen presentar a la hora <strong>de</strong> trabajar con esta distribución.<br />
PRIMER CASO<br />
Supondremos como primer caso, el más trivial: calcular la <strong>probabilidad</strong> <strong>de</strong> que la<br />
variable aleatoria Z, que sigue una distribución normal estándar, sea menor o igual que<br />
un valor positivo a.<br />
Basta con buscar en la tabla directamente el valor <strong>de</strong> a, teniendo en cuenta que en<br />
la primera columna <strong>de</strong> la tabla aparecen las unida<strong>de</strong>s y las décimas <strong>de</strong>l valor a y en la<br />
primera fila el valor <strong>de</strong> las centésimas.<br />
Como intersección <strong>de</strong> la fila y la columna correspondiente aparece el valor<br />
P( Z ! a)<br />
199
0<br />
Figura 3.12: Representación gráfica <strong>de</strong> la información que nos suministra <strong>de</strong> manera directa<br />
la tabla <strong>de</strong> la normal con la que vamos a trabajar: P Z ! a<br />
( )<br />
SEGUNDO CASO: En una distribución N(0,1) calcular P( Z ! "a)<br />
.<br />
Como segundo caso consi<strong>de</strong>raremos, por ejemplo, calcular la <strong>probabilidad</strong> <strong>de</strong> que<br />
la variable aleatoria Z tome valores menores o iguales que una cierta cantidad a<br />
negativa, o sea P Z ! "a<br />
( )<br />
La tabla no distingue entre <strong>de</strong>sviaciones positivas y negativas; es <strong>de</strong>cir, en la tabla<br />
sólo aparecen valores positivos. Analicemos, pues, geométricamente la situación.<br />
Figura 3.13.a: El área rayada <strong>de</strong> la curva representa Figura 3.13.b: El área rayada <strong>de</strong> la curva<br />
representa P( Z ! " a)<br />
P( Z ! a)<br />
La <strong>probabilidad</strong> pedida se correspon<strong>de</strong> con el área rayada en la figura 3.13a. El área<br />
rayada en la figura <strong>de</strong> la izquierda (figura 3.13a) es igual al área rayada en la figura <strong>de</strong><br />
la <strong>de</strong>recha (figura 3.13b). A su vez, ese área es igual al área total, que vale 1, menos el<br />
área no rayada. El área <strong>de</strong> la superficie no rayada en la gráfica <strong>de</strong> la <strong>de</strong>recha es la que<br />
viene en la tabla.<br />
Por tanto:<br />
a<br />
200
EJEMPLO 3.30:<br />
Calcular P(Z≤-2)<br />
Solución:<br />
P( Z ! "a)=1<br />
"P( Z ! a)<br />
P( Z ! "2)=<br />
P( Z # 2)=<br />
1 "P( Z < 2)<br />
= 0.9772<br />
TERCER CASO: En una distribución N ( µ,! ) , calcular P( Z ! a)<br />
Como tercer caso consi<strong>de</strong>raremos la misma situación que en el caso primero pero<br />
suponiendo ahora, que la variable aleatoria sigue una distribución normal no estándar,<br />
<strong>de</strong> parámetros µ, σ.<br />
En este caso, hemos <strong>de</strong> cambiar previamente <strong>de</strong> escala <strong>de</strong> medida; es <strong>de</strong>cir, es<br />
x ! µ<br />
preciso tipificar primero la variable. El cambio a<strong>de</strong>cuado es z =<br />
" y por tanto:<br />
$<br />
P( X ! a)<br />
=P<br />
%<br />
x " µ<br />
# ! a " µ<br />
#<br />
& $ a " µ<br />
'<br />
=P z !<br />
&<br />
% # '<br />
encontrándonos, una vez efectuado el cambio, en la misma situación <strong>de</strong>l primer caso.<br />
EJEMPLO 3.31:<br />
Calcular en una N(2,3) la P(X ≤ 2.14):<br />
Solución:<br />
#<br />
P( X ! 2.14)<br />
=P<br />
$<br />
x " 2<br />
3<br />
! 2.14 " 2<br />
3<br />
%<br />
&<br />
=P ( z ! 0.05)<br />
= 0.519<br />
Valor que se obtiene directamente <strong>de</strong> las tablas, como en el caso anterior.<br />
201
CUARTO CASO: En una distribución N ( µ,! ) , obtener P( Z ! "a)<br />
.<br />
Se trata, lo mismo que en el caso anterior <strong>de</strong> dar solución a uno <strong>de</strong> los supuestos<br />
ya vistos, en concreto al supuesto segundo, pero consi<strong>de</strong>rando ahora que trabajamos con<br />
una normal no estándar.<br />
Lo primero que tenemos que hacer es tipificar ya que si no, la igualdad anterior no<br />
se verifica, por tanto:<br />
$<br />
P( X ! "a ) =P<br />
%<br />
EJEMPLO 3.32:<br />
x " µ<br />
# ! "a " µ<br />
#<br />
En una N(5,3) calcular P( X ! "8)<br />
Solución:<br />
#<br />
P( X ! "8)<br />
=P<br />
$<br />
x " 5<br />
3<br />
& $ a " µ<br />
'<br />
=P z ! "<br />
& $ a " µ<br />
% # '<br />
= 1" P z <<br />
&<br />
% # '<br />
"8 " 5<br />
!<br />
% #<br />
3 &<br />
=P z ! "13<br />
% # 13<br />
$ 3 &<br />
= 1 " P z <<br />
%<br />
$ 3 & =<br />
= 1 ! P( z " 4.33)=<br />
1 ! 0.9999 = 0.0001<br />
QUINTO CASO: En una distribución N (0,1) calcular P( Z ! a)<br />
Figura 3.14: El área rayada <strong>de</strong> la curva representa P( Z ! a)<br />
Obviamente P( Z ! a)<br />
=1 " P( Z < a).<br />
202
SEXTO CASO: En una distribución N ( µ,! ) Obtener P( X ! a)<br />
:<br />
$<br />
P( X ! a)<br />
=P<br />
%<br />
x " µ<br />
# ! a " µ<br />
#<br />
& $ a " µ<br />
'<br />
= 1" P z <<br />
&<br />
% # '<br />
SÉPTIMO CASO: En una distribución N(0,1) calcular P( a ! Z ! b)<br />
Figura 3.15. El área rayada <strong>de</strong> la curva representa P( a ! Z ! b)<br />
Observando el gráfico <strong>de</strong> la figura 3.15 y teniendo en cuenta las propieda<strong>de</strong>s <strong>de</strong> la<br />
Normal, tenemos:<br />
P( a ! Z ! b)=P<br />
( Z ! b)"<br />
P( Z < a)<br />
OCTAVO CASO: En una N ( µ,! ) obtener P( a ! X ! b)<br />
Si en lugar <strong>de</strong> trabajar con una N(0,1) trabajásemos con una N ( µ,! ) sería preciso,<br />
como en casos anteriores, tipificar. Es <strong>de</strong>cir:<br />
a " µ<br />
P( a ! X ! b)<br />
= P<br />
# ! x " µ<br />
$<br />
%<br />
# ! b " µ<br />
#<br />
& $ b " µ<br />
'<br />
= P z !<br />
& $ a " µ<br />
% # '<br />
" P z <<br />
&<br />
% # '<br />
203
EJEMPLO 3.33:<br />
En una N(0,1) calcular P( 1! X !1.85)<br />
Solución:<br />
P( 1! X !1.85)=P<br />
( X !1.85)<br />
" P( X < 1)<br />
= 0.9678 " 0.8413 = 0.1265<br />
NOVENO CASO: En una N(0,1) calcular P ( !a " Z " !b)<br />
Figura 3.16. El área rayada <strong>de</strong> la curva representa P ( ! a " Z " ! b)<br />
P ( !a " Z " !b)<br />
=P( Z " !b)<br />
! P( Z < !a)<br />
Tal como ya sabemos esto se pue<strong>de</strong> escribir:<br />
EJEMPLO 3.34:<br />
[ ] =<br />
P( Z ! "b)<br />
" P( Z < "a)<br />
= 1" P( Z < b)<br />
" 1 " P( Z ! a)<br />
= 1 " P( Z < b)<br />
"1 + P( Z ! a)<br />
= P( Z ! a)<br />
" P( Z < b)<br />
En una N(0,1) calcular P ( !2.3 " Z " !1.8)<br />
Solución:<br />
P ( !2.3 " Z " !1.8)<br />
=P( Z " !1.8)<br />
! P( Z < !2.3)<br />
=<br />
=1! P( Z < 1.8)<br />
!1 + P( Z " 2.3)<br />
= P( Z " 2.3)<br />
! P( Z
Si en lugar <strong>de</strong> estar en una N(0,1) estuviésemos en una N ( µ,! ) , hubiésemos<br />
seguido el mismo razonamiento pero <strong>de</strong>spués <strong>de</strong> tipificar.<br />
DÉCIMO CASO: Cálculo <strong>de</strong>l percentil correspondiente a una <strong>probabilidad</strong> dada.<br />
Pue<strong>de</strong> ocurrir que conocida la <strong>probabilidad</strong> p, se nos pregunte qué valor <strong>de</strong> a<br />
verifica que P X ! a<br />
( ) = p<br />
Po<strong>de</strong>mos distinguir dos casos:<br />
a) La variable aleatoria sigue una N(0,1):<br />
En este caso, basta buscar en el interior <strong>de</strong> la tabla el valor más aproximado a p y<br />
anotar cual es el correspondiente valor <strong>de</strong> a (en las filas y columnas exteriores <strong>de</strong> la<br />
tabla)<br />
EJEMPLO 3.35:<br />
¿Cuál es el valor <strong>de</strong> a para el que P( Z ! a)<br />
= 0.9251 ?<br />
Solución:<br />
Buscamos <strong>de</strong>ntro <strong>de</strong> la tabla el valor 0.9251 y vemos que el correspondiente valor<br />
<strong>de</strong> a es 1.44.<br />
b) La variable aleatoria sigue una normal <strong>de</strong> parámetros N ( µ,! )<br />
En este caso, hemos <strong>de</strong> tipificar previamente; es <strong>de</strong>cir, expresar a en la escala<br />
correspondiente a una N(0,1)<br />
N(5,3)<br />
EJEMPLO 3.36:<br />
Obtener el valor <strong>de</strong> a que verifica que P( X ! a)<br />
= 0.8413 en una distribución<br />
205
Solución:<br />
#<br />
P( X ! a)<br />
= P<br />
$<br />
Z !<br />
a " 5<br />
3<br />
%<br />
&<br />
= 0.8413<br />
Buscando esa <strong>probabilidad</strong> en las tablas obtenemos el valor 1.0; es <strong>de</strong>cir:<br />
a ! 5<br />
3<br />
= 1" a = 3 + 5 = 8<br />
206
"DISTRIBUCIÓN NORMAL"<br />
3.4 Trabajo <strong>de</strong> investigación<br />
207
3.4.1 Aplicación <strong>de</strong>l manejo <strong>de</strong> tablas<br />
<strong>de</strong> la normal a un ejemplo <strong>de</strong><br />
investigación<br />
Se sabe que el diámetro <strong>de</strong> los hematíes <strong>de</strong> individuos<br />
normales sigue un mo<strong>de</strong>lo N(7.5, 0.2) y que el diámetro <strong>de</strong> los<br />
hematíes <strong>de</strong> individuos cirróticos sigue un mo<strong>de</strong>lo N(8.5 , 0.6).<br />
Supongamos que estamos interesados en clasificar a un<br />
individuo en uno <strong>de</strong> dos grupos: normal ó cirrótico en base a una<br />
cierta variable: diámetro <strong>de</strong> los hematíes.<br />
En trabajos reales el estudio se lleva a cabo no sólo consi<strong>de</strong>rando la información<br />
<strong>de</strong> una variable sino <strong>de</strong> varias, y la solución se obtiene a través <strong>de</strong> un análisis<br />
multivariante, pero esto exce<strong>de</strong> el nivel <strong>de</strong> este trabajo.<br />
Para clasificar correctamente a los individuos necesitaríamos conocer cuál es el<br />
máximo valor <strong>de</strong>l diámetro <strong>de</strong> los hematíes en individuos normales.<br />
Obviamente ese valor no es conocido ya que sólo disponemos <strong>de</strong> la información<br />
<strong>de</strong> que el valor <strong>de</strong>l diámetro es una cantidad aleatoria que se ajusta a una normal <strong>de</strong><br />
parámetros <strong>de</strong>terminados.<br />
Debemos fijar, pues, el valor M para el diámetro como valor máximo <strong>de</strong><br />
forma que los individuos con diámetro menor serán clasificados como normales y<br />
aquéllos que tengan diámetro mayor serán clasificados como patológicos<br />
Fijaremos esta cantidad <strong>de</strong> forma que el 95%, por ejemplo, <strong>de</strong> los individuos<br />
sanos que<strong>de</strong> correctamente clasificado, es <strong>de</strong>cir, <strong>de</strong> forma que sólo un 5% <strong>de</strong> los<br />
individuos sanos tenga un diámetro mayor <strong>de</strong> esa cantidad M.<br />
208
3.17):<br />
La situación podría representarse gráficamente <strong>de</strong> la siguiente manera (figura<br />
NORMALES N(7.5; 0.2)<br />
0<br />
6.5 7 7.5 8 8.5 9 9.5 10<br />
M = ?<br />
CIRROTICOS N(8.5; 0.6)<br />
Figura 3.17. Representación gráfica <strong>de</strong> la distribución <strong>de</strong>l diámetro <strong>de</strong> los hematíes<br />
en individuos sanos y en individuos cirróticos. M será el punto <strong>de</strong> corte a partir <strong>de</strong>l cual<br />
el individuo será clasificado en una o en otra categoría.<br />
La cantidad M se calcula <strong>de</strong> forma que se verifique que P( X ! M)<br />
= 0. 95<br />
teniendo en cuenta que la variable X sigue una ley Normal <strong>de</strong> media 7.5 y <strong>de</strong>sviación<br />
típica 0.2.<br />
El cálculo es inmediato:<br />
M / P(X
Debemos tener en cuenta que, según este convenio <strong>de</strong> clasificación, el 5% <strong>de</strong> los<br />
individuos sanos serán <strong>de</strong>clarados patológicos erróneamente, es <strong>de</strong>cir, el<br />
procedimiento propuesto proporciona un 5% <strong>de</strong> "falsos positivos". Llamaremos a este<br />
error, por ejemplo error ! .<br />
Teniendo en cuenta que el diámetro <strong>de</strong> los hematíes en individuos cirróticos se<br />
ajusta a una ley Normal <strong>de</strong> media 8.5 y <strong>de</strong>sviación 0.6 es evi<strong>de</strong>nte que, con este criterio,<br />
algún individuo enfermo pue<strong>de</strong> ser <strong>de</strong>clarado erróneamente normal. Llamaremos<br />
a este error β , que nos indica el porcentaje <strong>de</strong> "falsos negativos." Hemos <strong>de</strong> <strong>de</strong>terminar<br />
qué error β cometemos cuando fijamos un riesgo ! <strong>de</strong>l 5%, es <strong>de</strong>cir, cuando<br />
consi<strong>de</strong>ramos que el punto <strong>de</strong> corte para <strong>de</strong>cidirnos en <strong>de</strong>clarar a los individuos en<br />
sanos o en patológicos es <strong>de</strong> 7.829.<br />
Para obtener el porcentaje <strong>de</strong> personas que <strong>de</strong>clararemos como sanas cuando en<br />
realidad son cirróticas basta con <strong>de</strong>terminar en una N (8.5, 0.6) (la <strong>de</strong> los individuos<br />
cirróticos) la <strong>probabilidad</strong> <strong>de</strong> que la variable aleatoria tome valores menores al valor<br />
prefijado como cota.<br />
Es <strong>de</strong>cir:<br />
P(X < 7.829) en una normal N(8.5, 0.6)<br />
P(X < 7.829) = P(Z < (7.829 - 8.5)/0.6) =<br />
P(Z < -1.12) = P(Z> 1.12) = 1 - P(Z
0<br />
6.5<br />
" = 0.1314<br />
NORMALES N(7.5; 0.2)<br />
7 7.5 8 8.5 9 9.5 10<br />
M = 7.8 29<br />
! = 0.05(fijado)<br />
CIRROTICOS N(8.5; 0.6)<br />
Figura 3.18: Representación gráfica <strong>de</strong> la distribución <strong>de</strong>l diámetro <strong>de</strong> hematíes en las dos poblaciones.<br />
Prefijado α queda <strong>de</strong>limitado el valor <strong>de</strong> M y el valor <strong>de</strong> β<br />
Al observar esta situación podríamos pensar en ser más restrictivos y prefijar un<br />
error α más pequeño, por qué no un 1% por ejemplo.<br />
¿Por qué habríamos <strong>de</strong> arriesgarnos en <strong>de</strong>clarar enfermos a un 5% <strong>de</strong> los sanos, lo<br />
que socialmente podría tener connotaciones negativas (<strong>de</strong>claramos cirróticos a<br />
individuos que no lo son), si po<strong>de</strong>mos prefijar este error tan pequeño como queramos.?<br />
Desafortunadamente disminuir el α trae consigo aumentar el β.<br />
Observemos qué ocurriría si quisiéramos disminuir cualquiera <strong>de</strong> los errores, por<br />
ejemplo ¿qué ocurriría si disminuyésemos α?:<br />
En efecto:<br />
Si α disminuye, β aumenta<br />
Si ! disminuye, por ejemplo ! = 1% , M aumenta.<br />
Veamos como esta afirmación es cierta. Realizar este cálculo es idéntico al caso<br />
anterior sólo que ahora la regla <strong>de</strong> <strong>de</strong>cisión es distinta:<br />
211
Buscamos un M' (diámetro <strong>de</strong> las hematíes) que sólo lo superan un 1% <strong>de</strong><br />
individuos normales. Se trata <strong>de</strong> localizar en una N(7.5, 0.2) un valor <strong>de</strong> la variable que<br />
verifique que el 1% es mayor que él, o lo que es lo mismo un 99% <strong>de</strong> los individuos<br />
tenga el diámetro <strong>de</strong> los hematíes menor que dicho valor.<br />
Sea M’ / P(X