Diseño completamente al azar - Departamento de Probabilidad y ...
Diseño completamente al azar - Departamento de Probabilidad y ...
Diseño completamente al azar - Departamento de Probabilidad y ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong><br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 1/112
Ejemplo<br />
Suponga que tenemos 4 dietas diferentes que queremos<br />
comparar. Las dietas están etiquetadas A,B,C y D.<br />
Estamos interesados en estudiar si las dietas afectan la tasa<br />
<strong>de</strong> coagulación en conejos. La tasa <strong>de</strong> coagulación es el<br />
tiempo en segundos que tarda una cortada en <strong>de</strong>jar <strong>de</strong><br />
sangrar.<br />
Tenemos 16 conejos para el experimento, por lo que usaremos<br />
4 en cada dieta.<br />
Los conejos están en una jaula gran<strong>de</strong> hasta que se inicie el<br />
experimento, momento en que se transferirán a otras jaulas.<br />
Cómo asignamos los conejos a los cuatro grupos<br />
tratamiento?<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 2/112
Método 1<br />
Supongamos que los conejos se atrapan "<strong>al</strong> <strong>azar</strong>". Atrapamos<br />
cuatro conejos y los asignamos a la dieta A. Atrapamos otros<br />
cuatro y los asignamos a la dieta B y así sucesivamente.<br />
Dado que los conejos fueron "atrapados <strong>al</strong> <strong>azar</strong>", esto<br />
producirá un diseño <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 3/112
Método 1<br />
No es necesariamente cierto.<br />
Los primeros cuatro conejos atrapados pue<strong>de</strong>n ser los más<br />
lentos y débiles, aquellos menos capaces <strong>de</strong> escapar. Esto<br />
pue<strong>de</strong> sesgar los resultados.<br />
Si los resultados <strong>de</strong>l experimento dan <strong>de</strong>sventaja a la dieta A,<br />
no habrá forma <strong>de</strong> <strong>de</strong>terminar si los resultados son a<br />
consecuencia <strong>de</strong> la dieta A o <strong>de</strong>l hecho <strong>de</strong> haber asignado los<br />
conejos más débiles a esa dieta por nuestro "proceso <strong>de</strong><br />
<strong>al</strong>eatorización".<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 4/112
Método 2<br />
Atrape a todos los conejos y etiquételos <strong>de</strong>l 1 <strong>al</strong> 16.<br />
Seleccione cuatro números <strong>al</strong>eatorios (sin reemplazo) <strong>de</strong>l 1 <strong>al</strong><br />
16 y ponga los conejos con esa etiqueta en una jaula que<br />
recibirá la dieta A.<br />
Entonces, seleccione otros cuatro números <strong>al</strong>eatorios y ponga<br />
los conejos correspondientes en otra jaula que recibirá la dieta<br />
B.<br />
Así sucesivamente hasta tener cuatro jaulas con cuatro<br />
conejos en cada una.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 5/112
Método 2<br />
No hay repeticiones.<br />
El diseño es un diseño <strong>completamente</strong> <strong>al</strong> <strong>azar</strong> pero no tiene<br />
repeticiones.<br />
Hay 16 conejos, pero los conejos en cada jaula no son<br />
in<strong>de</strong>pendientes. Si un conejo come mucho, los otros en la<br />
jaula tienen menos para comer.<br />
La unidad experiment<strong>al</strong> es la menor unidad <strong>de</strong> materi<strong>al</strong><br />
experiment<strong>al</strong> a la cu<strong>al</strong> se le aplica un tratamiento en forma<br />
in<strong>de</strong>pendiente. En este caso, las jaulas son las unida<strong>de</strong>s<br />
experiment<strong>al</strong>es. Para un diseño <strong>completamente</strong> <strong>al</strong> <strong>azar</strong> con<br />
repeticiones, cada conejo <strong>de</strong>be estar en su propia jaula.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 6/112
Método 3<br />
En una urna ponga las letras A,B,C y D en pedazos <strong>de</strong> papel<br />
separados.<br />
Atrape un conejo, saque un pedazo <strong>de</strong> papel <strong>al</strong> <strong>azar</strong> <strong>de</strong> la urna<br />
y asigne el conejo a la dieta que indique el papel. No<br />
reemplace el papel. Atrape el segundo conejo y seleccione <strong>al</strong><br />
<strong>azar</strong> otro pedazo <strong>de</strong> papel <strong>de</strong> la urna <strong>de</strong> los tres que quedan.<br />
Asigne el conejo a la dieta correspondiente.<br />
Continue hasta que los primeros cuatro conejos sean<br />
asignados a una <strong>de</strong> las cuatro dietas. De esta manera, todos<br />
los conejos lentos tienen diferentes dietas.<br />
Coloque otra vez los cuatro pedazos <strong>de</strong> papel en la urna y<br />
repita el procedimiento hasta que los 16 conejos estén<br />
asignados a una dieta.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 7/112
Método 3<br />
Este no es un diseño <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>.<br />
Ya que se seleccionaron los conejos en bloques <strong>de</strong> 4, y cada<br />
uno asignado a una <strong>de</strong> las dietas, el diseño es el bloques <strong>al</strong><br />
<strong>azar</strong>.<br />
El tratamiento es Dieta pero se ha bloqueado a través <strong>de</strong>l<br />
grado <strong>de</strong> "atrapabilidad".<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 8/112
Método 4<br />
Atrape a todos los conejos y márquelos <strong>de</strong>l 1 <strong>al</strong> 16. Ponga 16<br />
piezas <strong>de</strong> papel en una urna, con las letras A, B, C y D<br />
repetidas cuatro veces cada una.<br />
Ponga otros 16 pedazos <strong>de</strong> papel numerados <strong>de</strong>l 1 <strong>al</strong> 16 en<br />
otra urna. Tome un pedazo <strong>de</strong> papel <strong>de</strong> cada urna. El conejo<br />
con el número seleccionado es asignado a la dieta<br />
seleccionada.<br />
Para hacer más fácil <strong>de</strong> recordar cuál conejo tiene cuál dieta,<br />
las jaulas se acomodan como se muestra abajo:<br />
A A A A<br />
B B B B<br />
C C C C<br />
D D D D<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 9/112
Método 4<br />
El método 4 tiene <strong>al</strong>gunas <strong>de</strong>ficiencias. La asignación <strong>de</strong> los<br />
conejos a los tratamientos es un diseño <strong>completamente</strong> <strong>al</strong><br />
<strong>azar</strong>. Sin embargo, el arreglo <strong>de</strong> las jaulas crea un sesgo en<br />
los resultados.<br />
Pue<strong>de</strong> haber cambios climáticos y <strong>de</strong> luz que afecten <strong>de</strong> forma<br />
diferenci<strong>al</strong> a los tratamientos, <strong>de</strong> t<strong>al</strong> manera que, cu<strong>al</strong>quier<br />
diferencia observada no pue<strong>de</strong> ser atribuida a la dieta, sino<br />
que podría ser resultado <strong>de</strong> la posición <strong>de</strong> la jaula.<br />
La posición <strong>de</strong> la jaula no es parte <strong>de</strong>l tratamiento, pero <strong>de</strong>be<br />
ser consi<strong>de</strong>rada. En un diseño <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, todos<br />
los conejos tienen la misma probabilidad <strong>de</strong> recibir cu<strong>al</strong>quier<br />
dieta y en cu<strong>al</strong>quier posición <strong>de</strong> la jaula.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 10/112
Método 5<br />
Marque las jaulas <strong>de</strong>l 1 <strong>al</strong> 16.<br />
1 5 9 13<br />
2 6 10 14<br />
3 7 11 15<br />
4 8 12 16<br />
Ponga 16 pedazos <strong>de</strong> papel en una urna, numerados <strong>de</strong>l 1 <strong>al</strong><br />
16. En otra urna ponga 16 pedazos <strong>de</strong> papel, marcados con<br />
las letras A, B C y D.<br />
Atrape un conejo. Seleccione un número y una letra <strong>de</strong> cada<br />
urna. Ponga el conejo en la jaula indicada por el número<br />
escogido y asígnelo a la dieta indicada por la letra.<br />
Repita sin reemplazo hasta que todos los conejos hayan sido<br />
asignados a una dieta y una jaula.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 11/112
Método 5<br />
Si, por ejemplo, el primer número seleccionado fué 7 y la<br />
primera letra B, entonces el primer conejo se pone en la jaula<br />
7 y se <strong>al</strong>imenta con la dieta B.<br />
1 5 9 13<br />
2 6 10 14<br />
3 7 B 11 15<br />
4 8 12 16<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 12/112
Método 5<br />
Un ejemplo <strong>de</strong> asignación completa es el siguiente:<br />
1 C 5 A 9 B 13 D<br />
2 D 6 B 10 D 14 C<br />
3 C 7 B 11 A 15 D<br />
4 A 8 A 12 C 16 B<br />
Note que el diseño <strong>completamente</strong> <strong>al</strong> <strong>azar</strong> no toma en cuenta<br />
las diferencias en la <strong>al</strong>tura <strong>de</strong> las jaulas. Es solamente una<br />
asignación <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>.<br />
En este ejemplo vemos que la mayoría <strong>de</strong> los conejos con la<br />
dieta A están en jaulas <strong>de</strong> la parte <strong>de</strong> abajo y los <strong>de</strong> la dieta D<br />
están en la parte superior. Un diseño <strong>completamente</strong> <strong>al</strong> <strong>azar</strong><br />
supone que estas posiciones no producen una diferencia<br />
sistemática en la respuesta (tiempo <strong>de</strong> coagulación).<br />
Si creemos que la posición afecta la respuesta, <strong>de</strong>beríamos<br />
usar un diseño <strong>de</strong> bloques <strong>al</strong> <strong>azar</strong>.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 13/112
<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />
Ejemplo: Disminución <strong>de</strong>l crecimiento <strong>de</strong> bacterias en carne<br />
<strong>al</strong>macenada.<br />
La vida en estante <strong>de</strong> carne <strong>al</strong>macenada es el tiempo en que<br />
el corte empacado se mantiene bien, nutritivo y vendible.<br />
El empaque estándar con aire <strong>de</strong>l medio ambiente tiene una<br />
vida <strong>de</strong> 48 horas. Después se <strong>de</strong>teriora por contaminación<br />
bacteri<strong>al</strong>, <strong>de</strong>gradación <strong>de</strong>l color y encogimiento.<br />
El empaque <strong>al</strong> vacío <strong>de</strong>tiene el crecimiento bacteri<strong>al</strong>, sin<br />
embargo, se pier<strong>de</strong> c<strong>al</strong>idad.<br />
Estudios recientes sugieren que <strong>al</strong> controlar ciertos gases <strong>de</strong><br />
la atmósfera se <strong>al</strong>arga la vida en estante.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 14/112
<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />
Hipótesis <strong>de</strong> investigación: Algunas formas <strong>de</strong> gases<br />
controlados pue<strong>de</strong>n mejorar la efectividad <strong>de</strong>l<br />
empacamiento para carne.<br />
<strong>Diseño</strong> <strong>de</strong> tratamientos: Un factor con 4 niveles:<br />
1. Aire ambient<strong>al</strong> con envoltura plástica<br />
2. Empacado <strong>al</strong> vacío<br />
3. Mezcla <strong>de</strong> gases:<br />
■ 1% CO (monóxido <strong>de</strong> carbono)<br />
■ 40% O2 (oxígeno)<br />
■ 59% N (nitrógeno)<br />
4. 100% CO2 (bióxido <strong>de</strong> carbono)<br />
<strong>Diseño</strong> experiment<strong>al</strong>: Completamente <strong>al</strong> <strong>azar</strong>.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 15/112
<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />
Tres bisteces <strong>de</strong> res, aproximadamente <strong>de</strong>l mismo tamaño (75<br />
grs.) se asignaron <strong>al</strong>eatoriamente a cada tratamiento. Cada<br />
bistec se empaca separadamente con su condición asignada.<br />
Variable <strong>de</strong> respuesta: Se mi<strong>de</strong> el número <strong>de</strong><br />
bacterias psichnotropicas en la carne <strong>de</strong>spués <strong>de</strong> 9<br />
días <strong>de</strong> <strong>al</strong>macenamiento a 4 ◦ C.<br />
Estas bacterias se encuentran en la superficie <strong>de</strong> la<br />
carne y aparecen cuando la carne se echó a per<strong>de</strong>r.<br />
La medición fué el logaritmo <strong>de</strong>l número <strong>de</strong><br />
bacterias por cm 2 .<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 16/112
<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />
Cómo <strong>al</strong>eatorizar?<br />
Se obtiene una permutación <strong>al</strong>eatoria <strong>de</strong> los números 1 a 12. Para esto se<br />
toma una secuencia <strong>de</strong> números <strong>de</strong> 2 dígitos <strong>de</strong> una tabla <strong>de</strong> números<br />
<strong>al</strong>eatorios y se les asigna el rango que les corresponda.<br />
Por ejemplo:<br />
# <strong>al</strong>eatorio 52 56 20 99 44 34 62 60 31 57 40 78<br />
rango 6 7 1 12 5 3 10 9 2 8 4 11<br />
trat 1 1 1 2 2 2 3 3 3 4 4 4<br />
u.e. 1 2 3 4 5 6 7 8 9 10 11 12<br />
trat 1 3 2 4 2 1 1 4 3 3 4 2<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 17/112
<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />
Mo<strong>de</strong>lo estadístico para el experimento<br />
El mo<strong>de</strong>lo estadístico para estudios comparativos supone que<br />
hay una población <strong>de</strong> referencia <strong>de</strong> u.e. En muchos casos la<br />
población es conceptu<strong>al</strong>. En el ejemplo, es posible imaginar<br />
una población <strong>de</strong> carne empacada.<br />
Cada unidad <strong>de</strong> la población tiene un v<strong>al</strong>or <strong>de</strong> la variable <strong>de</strong><br />
respuesta, y, la cu<strong>al</strong> tiene media µ y varianza σ 2 .<br />
Se supone una población <strong>de</strong> referencia para cada tratamiento<br />
consi<strong>de</strong>rado en el estudio, y las variables en el experimento se<br />
suponen seleccionadas <strong>al</strong>eatoriamente <strong>de</strong> dicha población <strong>de</strong><br />
referencia, como resultado <strong>de</strong> la <strong>al</strong>eatorización.<br />
Nota. Para estudios observacion<strong>al</strong>es, suponemos que las<br />
unida<strong>de</strong>s observadas se seleccionaron <strong>al</strong>eatoriamente <strong>de</strong><br />
cada una <strong>de</strong> las poblaciones.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 18/112
<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 19/112
<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />
Mo<strong>de</strong>lo estadístico line<strong>al</strong> para un diseño <strong>completamente</strong> <strong>al</strong><br />
<strong>azar</strong>.<br />
don<strong>de</strong><br />
Mo<strong>de</strong>lo <strong>de</strong> medias:<br />
yij = µi + ǫij i = 1, 2, . . .,t j = 1, 2, . . .,r<br />
yij es la observación <strong>de</strong> la j-ésima u.e. <strong>de</strong>l i-ésimo tratamiento,<br />
µi es la media <strong>de</strong>l i-ésimo tratamiento,<br />
ǫij es el error experiment<strong>al</strong> <strong>de</strong> la unidad ij.<br />
Suponemos que hay t tratamientos y r repeticiones en cada<br />
uno.<br />
En el ejemplo <strong>de</strong> la carne empacada, tenemos:<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 20/112
<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />
bistec trata obser log yij Mo<strong>de</strong>lo<br />
miento vación (conteo/cm 2 )<br />
6 1 1 7.66 y11 µ1 + ǫ11<br />
7 1 2 6.98 y12 µ1 + ǫ12<br />
1 1 3 7.80 y13 µ1 + ǫ13<br />
12 2 1 5.26 y21 µ2 + ǫ21<br />
5 2 2 5.44 y22 µ2 + ǫ22<br />
3 2 3 5.80 y23 µ2 + ǫ23<br />
10 3 1 7.41 y31 µ3 + ǫ31<br />
9 3 2 7.33 y32 µ3 + ǫ32<br />
2 3 3 7.04 y33 µ3 + ǫ33<br />
8 4 1 3.51 y41 µ4 + ǫ41<br />
4 4 2 2.91 y42 µ4 + ǫ42<br />
11 4 3 3.66 y43 µ4 + ǫ43<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 21/112
<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />
El mo<strong>de</strong>lo:<br />
yij = µi + ǫij<br />
lo llamaremos mo<strong>de</strong>lo completo ya que incluye una media<br />
separada para cada una <strong>de</strong> las poblaciones <strong>de</strong>finidas por los<br />
tratamientos.<br />
Si no hay diferencia entre las medias <strong>de</strong> las poblaciones, es<br />
<strong>de</strong>cir,<br />
µ1 = µ2 = µ3 = µ4 = µ<br />
se genera el mo<strong>de</strong>lo reducido<br />
yij = µ + ǫij<br />
que establece que las observaciones provienen <strong>de</strong> la misma<br />
población con media µ.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 22/112
<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />
El mo<strong>de</strong>lo reducido representa la hipótesis <strong>de</strong> no diferencia<br />
entre las medias<br />
H0 : µ1 = µ2 = µ3 = µ4 = µ<br />
El mo<strong>de</strong>lo completo representa la hipótesis <strong>al</strong>ternativa:<br />
Ha : µi = µk i = k<br />
El investigador <strong>de</strong>be <strong>de</strong>terminar cuál <strong>de</strong> los dos mo<strong>de</strong>los<br />
<strong>de</strong>scribe mejor a los datos en el experimento.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 23/112
<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />
yij = µ + ǫij<br />
yij = µi + ǫij<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 24/112
<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />
Pregunta <strong>de</strong> investigación: Hay más crecimiento bacteri<strong>al</strong><br />
con <strong>al</strong>gunos métodos <strong>de</strong> empacado que con otros?<br />
Pregunta estadística: Cuál mo<strong>de</strong>lo <strong>de</strong>scribe mejor los<br />
resultados <strong>de</strong>l experimento?<br />
Se requiere un método para estimar los parámetros <strong>de</strong> los dos<br />
mo<strong>de</strong>los y con base en <strong>al</strong>gun criterio objetivo <strong>de</strong>terminar cuál<br />
mo<strong>de</strong>lo o hipótesis estadística se ajusta mejor a los datos <strong>de</strong>l<br />
experimento.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 25/112
<strong>Diseño</strong> <strong>completamente</strong> el <strong>azar</strong>, un factor<br />
Los estimadores <strong>de</strong> mínimos cuadrados son aquellos que<br />
resultan <strong>de</strong> minimizar la suma <strong>de</strong> cuadrados <strong>de</strong> los errores<br />
experiment<strong>al</strong>es.<br />
Si los errores experiment<strong>al</strong>es son in<strong>de</strong>pendientes con media<br />
cero y varianzas homogéneas, los estimadores <strong>de</strong> mínimos<br />
cuadrados son insesgados y tienen varianza mínima.<br />
Nota. El muestreo <strong>al</strong>eatorio en los estudios observacion<strong>al</strong>es y<br />
la <strong>al</strong>eatorización en los experiment<strong>al</strong>es aseguran la suposición<br />
<strong>de</strong> in<strong>de</strong>pen<strong>de</strong>ncia.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 26/112
Estimadores para el mo<strong>de</strong>lo completo<br />
yij = µi + ǫij i = 1, . . .,t j = 1, . . .,r<br />
ǫij = yij − µi<br />
SSEc =<br />
t r<br />
ǫ 2 ij =<br />
i=1<br />
j=1<br />
t<br />
i=1<br />
r<br />
(yij − µi) 2<br />
La SSEc es una medida <strong>de</strong> qué tan bien se ajusta el mo<strong>de</strong>lo a<br />
los datos.<br />
j=1<br />
Queremos <strong>de</strong>terminar los estimadores ˆµi t<strong>al</strong>es que se<br />
minimice esta SSEc.<br />
Vamos a tener t ecuaciones norm<strong>al</strong>es, una para cada<br />
tratamiento, encontradas a partir <strong>de</strong> <strong>de</strong>rivar la SSEc con<br />
respecto a cada µi e igu<strong>al</strong>arlas a cero.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 27/112
Estimadores para el mo<strong>de</strong>lo completo<br />
Para una i:<br />
∂<br />
∂µi<br />
r<br />
(yij − µi) 2 = −2<br />
j=1<br />
igu<strong>al</strong>ando a cero<br />
r<br />
−2 (yij − ˆµi) = 0<br />
j=1<br />
r<br />
yij − r ˆµi = 0<br />
j=1<br />
ˆµi =<br />
r<br />
(yij − µi)<br />
j=1<br />
r<br />
j=1 yij<br />
r<br />
= ¯yi.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 28/112
Estimadores para el mo<strong>de</strong>lo completo<br />
Por lo tanto,<br />
Entonces,<br />
SSEc =<br />
ˆµi = ¯yi i = 1, . . .,t<br />
=<br />
=<br />
t<br />
i=1<br />
t<br />
i=1<br />
r<br />
(yij − ˆµi) 2<br />
j=1<br />
r<br />
j=1<br />
⎡<br />
t<br />
⎣<br />
i=1<br />
(yij − ¯yi.) 2<br />
r<br />
j=1<br />
(yij − ¯yi.) 2<br />
⎤<br />
⎦<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 29/112
Estimadores para el mo<strong>de</strong>lo completo<br />
La varianza muestr<strong>al</strong> <strong>de</strong>l i-ésimo tratamiento es:<br />
S 2 r j=1<br />
i =<br />
(yij − ¯yi.) 2<br />
r − 1<br />
es una estimador <strong>de</strong> σ 2 <strong>de</strong> los datos <strong>de</strong>l i-ésimo grupo.<br />
S 2 =<br />
<br />
t r<br />
i=1 j=1 (yij − ¯yi.) 2<br />
t(r − 1)<br />
= SSEc<br />
t(r − 1)<br />
es un estimador combinado (pooled) <strong>de</strong> σ 2 <strong>de</strong> todos los<br />
datos <strong>de</strong>l experimento.<br />
Es un buen estimador si po<strong>de</strong>mos hacer la suposición <strong>de</strong> que<br />
σ 2 es homogénea en todos los grupos.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 30/112
Estimadores para el mo<strong>de</strong>lo completo<br />
Para los datos <strong>de</strong>l ejemplo:<br />
tratamiento comerci<strong>al</strong> vacío mezcla CO2<br />
7.66 5.26 7.41 3.51<br />
6.98 5.44 7.33 2.91<br />
7.80 5.80 7.04 3.66<br />
ˆµi = ¯yi. 7.48 5.50 7.26 3.36<br />
r j=1 (yij − ¯yi.) 2<br />
0.3848 0.1512 0.0758 0.3150<br />
SSEc = 0.3848 + 0.1512 + 0.0758 + 0.3150 = 0.9268<br />
S 2 = SSEc<br />
t(r − 1)<br />
= 0.9268<br />
4(2)<br />
= 0.11585<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 31/112
Estimadores para el mo<strong>de</strong>lo reducido<br />
∂<br />
∂µ<br />
yij = µ + ǫij<br />
ǫij = yij − µ<br />
SSEr =<br />
t r<br />
t<br />
i=1<br />
i=1<br />
j=1<br />
ǫ 2 ij =<br />
t<br />
i=1<br />
r<br />
(yij − µ) 2 = −2<br />
j=1<br />
igu<strong>al</strong>ando a cero<br />
t r<br />
ˆµ =<br />
i=1<br />
j=1<br />
t<br />
i=1<br />
rtµ = y..<br />
ˆµ = y..<br />
rt<br />
r<br />
(yij − µ) 2<br />
j=1<br />
t<br />
i=1<br />
r<br />
j=1<br />
= ¯y..<br />
r<br />
(yij − µ)<br />
j=1<br />
yij<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 32/112
Estimadores para el mo<strong>de</strong>lo reducido<br />
Entonces,<br />
SSEr =<br />
Para el ejemplo,<br />
t<br />
i=1<br />
r<br />
(yij − ˆµ) 2 =<br />
j=1<br />
ˆµ = ¯y.. = 70.80<br />
12<br />
t<br />
i=1<br />
r<br />
j=1<br />
= 5.90<br />
(yij − ¯y..) 2<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 33/112
Mo<strong>de</strong>lo reducido Mo<strong>de</strong>lo completo<br />
yij = µ + ǫij yij = µi + ǫij<br />
Observado Estimado Diferencia Estimado Diferencia<br />
Tratamiento y ˆµ (yij − ˆµ) ˆµi (yij − ˆµi)<br />
Comerci<strong>al</strong> 7.66 5.90 1.76 7.48 0.18<br />
6.98 5.90 1.08 7.48 -0.50<br />
7.80 5.90 1.90 7.48 0.32<br />
Vacío 5.26 5.90 -0.64 5.50 -0.24<br />
5.44 5.90 -0.46 5.50 -0.06<br />
5.80 5.90 -0.10 5.50 0.30<br />
Mezcla 7.41 5.90 1.51 7.26 0.15<br />
7.33 5.90 1.43 7.26 0.07<br />
7.04 5.90 1.14 7.26 -0.22<br />
CO2 3.51 5.90 -2.39 3.36 0.15<br />
2.91 5.90 -2.99 3.36 -0.45<br />
3.66 5.90 -2.24 3.36 0.30<br />
SSEr = 33.7996 SSEc = 0.9268<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 34/112
<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />
Siguiendo con el ejemplo:<br />
Mo<strong>de</strong>lo completo yij = µi + ǫij SSEc = <br />
i<br />
Mo<strong>de</strong>lo reducido yij = µ + ǫij SSEr = <br />
i<br />
Diferencia:<br />
SSEr − SSEc = <br />
(yij − ¯y..) 2 − <br />
haciendo álgebra<br />
En el ejemplo: SSEr − SSEc = 32.8728<br />
i<br />
j<br />
i<br />
<br />
j (yij − ¯yi.) 2 = 0.9268<br />
<br />
j (yij − ¯y..) 2 = 33.7996<br />
j<br />
(yij − ¯yi.) 2<br />
= <br />
(¯yi. − ¯y..) 2 = r <br />
(¯yi. − ¯y..) 2<br />
i<br />
j<br />
i<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 35/112
<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />
SSEr − SSEc = SSt suma <strong>de</strong> cuadrados <strong>de</strong> tratamientos.<br />
Representa la reducción en SSE <strong>al</strong> haber incluido<br />
tratamientos en el mo<strong>de</strong>lo, también se le conoce como<br />
reducción en suma <strong>de</strong> cuadrados <strong>de</strong>bida a tratamientos.<br />
Llamaremos SStot<strong>al</strong> = SSEr ya que es la suma <strong>de</strong> cuadrados<br />
<strong>de</strong> las diferencias <strong>de</strong> cada observación y la media gener<strong>al</strong> ¯y..<br />
Entonces, tenemos la partición:<br />
SStot<strong>al</strong> = SSt + SSEc<br />
<br />
(yij − ¯y..) 2 = <br />
(¯yi. − ¯y..) 2 + <br />
i<br />
j<br />
i<br />
j<br />
i<br />
j<br />
(yij − ¯yi.) 2<br />
<strong>de</strong>sviación <strong>de</strong> la <strong>de</strong>sviación <strong>de</strong> la <strong>de</strong>sviación <strong>de</strong> la<br />
observación ij media <strong>de</strong>l grupo observación ij<br />
con respecto a con respecto a con respecto a<br />
la media gener<strong>al</strong> la media gener<strong>al</strong> la media <strong>de</strong> su grupo<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 36/112
<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />
<br />
(yij − ¯y..) 2 = <br />
[(yij − ¯yi.) + (¯yi. − ¯y..)] 2<br />
i<br />
j<br />
i<br />
j<br />
= <br />
(yij − ¯yi.) 2 + <br />
(¯yi. − ¯y..) 2<br />
i<br />
j<br />
−2 <br />
(yij − ¯yi.)(¯yi. − ¯y..)<br />
<br />
(yij − ¯yi.)(¯yi. − ¯y..) = <br />
(¯yi. − ¯y..) <br />
i<br />
j<br />
i<br />
j<br />
i<br />
i<br />
j<br />
j<br />
(yij − ¯yi.)<br />
= <br />
(¯yi. − ¯y..)(yi. − r¯yi.) = 0<br />
i<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 37/112
<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />
Grados <strong>de</strong> libertad. Representan el número <strong>de</strong> piezas <strong>de</strong><br />
información in<strong>de</strong>pendientes en las sumas <strong>de</strong> cuadrados.<br />
En gener<strong>al</strong>, es el número <strong>de</strong> observaciones menos el número<br />
<strong>de</strong> parámetros estimados <strong>de</strong> los datos.<br />
Sea n = rt, el tamaño <strong>de</strong> muestra tot<strong>al</strong>.<br />
Así, SStot<strong>al</strong> = t i<br />
µ, tiene n − 1 g.l.<br />
SSE = t<br />
i<br />
r<br />
j (yij − ¯y..) 2 don<strong>de</strong> ¯y.. es el estimador <strong>de</strong><br />
r<br />
j (yij − ¯yi.) 2 se estimaron t parámetros<br />
(µ1, µ2, . . .,µt) por lo tanto tiene n − t g.l.<br />
SSt = SStot<strong>al</strong> − SSE = (n − 1) − (n − t) = t − 1 g.l.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 38/112
Tabla <strong>de</strong> Análisis <strong>de</strong> Varianza<br />
ANOVA<br />
F.V. g.l. SS CM<br />
Tratamientos t − 1 SSt CMt = SSt/t − 1<br />
Error n − t SSE CME = SSE/n − t = ˆσ 2<br />
Tot<strong>al</strong> n − 1 SStot<strong>al</strong><br />
Se pue<strong>de</strong> <strong>de</strong>mostrar que:<br />
E (CME) = σ 2<br />
E (CMt) = σ 2 + 1<br />
t − 1<br />
t<br />
r(µi − ¯µ) 2 ; ¯µ = <br />
µi/t<br />
i=1<br />
i<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 39/112
Tabla <strong>de</strong> Análisis <strong>de</strong> Varianza<br />
Si suponemos ǫij ∼ NID(0, σ 2 ) i = 1, . . .,t j = 1, . . .,r<br />
en el mo<strong>de</strong>lo completo yij = µi + ǫij<br />
Entonces, yij ∼ NID(µi, σ 2 ).<br />
Se pue<strong>de</strong> <strong>de</strong>mostrar que:<br />
SStot<strong>al</strong><br />
σ 2<br />
SSE<br />
σ 2<br />
=<br />
=<br />
<br />
i<br />
<br />
j (yij − ¯y..) 2<br />
σ 2<br />
<br />
i j (yij − ¯yi.) 2<br />
σ2 ∼ χ 2 n−1<br />
∼ χ 2 n−t<br />
Cuando H0 : µ1 = µ2 = . . . = µt es cierta<br />
SSt<br />
=<br />
σ2 <br />
i r(¯yi. − ¯y..) 2<br />
σ 2<br />
∼ χ 2 t−1<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 40/112
Tabla <strong>de</strong> Análisis <strong>de</strong> Varianza<br />
Por el Teorema <strong>de</strong> Cochran (Montgomery, 2001, pág. 69), SSt<br />
y SSE son in<strong>de</strong>pendientes, por lo tanto cuando H0 es cierta,<br />
F0 = SSt/σ 2 (t − 1)<br />
SSE/σ 2 (n − t)<br />
= CMt<br />
CME<br />
∼ Ft−1,n−t<br />
A<strong>de</strong>más, E (CMt) = σ 2 + θ 2 t = σ 2 cuando θ 2 t = 0 que es<br />
cuando H0 es cierta. Es <strong>de</strong>cir,<br />
E (CMt) = E (CME) cuando H0 es cierta<br />
E (CMt) > E (CME) cuando H0 no es cierta<br />
Entonces, si CMt > CME, o sea, v<strong>al</strong>ores gran<strong>de</strong>s <strong>de</strong> F0<br />
llevan a rech<strong>azar</strong> la hipótesis nula H0 : µ1 = µ2 = . . . = µt.<br />
Por lo tanto, la región <strong>de</strong> rechazo es:<br />
F0 > F α t−1,n−t<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 41/112
Tabla <strong>de</strong> Análisis <strong>de</strong> Varianza<br />
ANOVA<br />
F.V. g.l. SS CM F E(CM)<br />
Tratamientos t − 1 SSt CMt = SSt<br />
t−1<br />
Error n − t SSE CME = SSE<br />
n−t<br />
Tot<strong>al</strong> n − 1 SStot<strong>al</strong><br />
SSt =<br />
SSE =<br />
SStot<strong>al</strong> =<br />
t<br />
r (¯yi. − ¯y..) 2<br />
i=1<br />
t<br />
i=1<br />
t<br />
i=1<br />
r<br />
j=1<br />
r<br />
j=1<br />
(yij − ¯yi.) 2<br />
(yij − ¯y..) 2<br />
CMt<br />
CME σ 2 + θ 2 t<br />
σ 2<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 42/112
Tabla <strong>de</strong> Análisis <strong>de</strong> Varianza<br />
En el ejemplo <strong>de</strong> empacado <strong>de</strong> carne:<br />
F.V. g.l. SS CM F Pr > F<br />
trat 3 32.8728 10.958 94.55 0.000<br />
error 8 0.9268 0.1159<br />
tot<strong>al</strong> 11 33.7996<br />
Por lo tanto, se rechaza la hipótesis H0 : µ1 = µ2 = . . . = µ4,<br />
es <strong>de</strong>cir, hay <strong>al</strong>gún método <strong>de</strong> empaque que tiene diferente<br />
comportamiento en promedio.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 43/112
<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />
Se quieren comparar t niveles <strong>de</strong> un factor, lo que implica t<br />
tratamientos y se dispone <strong>de</strong> ni u.e. para el tratamiento i,<br />
i = 1, . . .,t. Hay dos situaciones:<br />
1. Los t tratamientos son escogidos específicamente por el<br />
investigador. En esta situación <strong>de</strong>seamos probar hipótesis<br />
acerca <strong>de</strong> las medias <strong>de</strong> los tratamientos y nuestras<br />
conclusiones se aplicarán solamente a los niveles <strong>de</strong>l<br />
factor consi<strong>de</strong>rados en el análisis. Las conclusiones no se<br />
pue<strong>de</strong>n exten<strong>de</strong>r a tratamientos similares que no fueron<br />
explícitamente consi<strong>de</strong>rados. Este es el mo<strong>de</strong>lo <strong>de</strong><br />
efectos fijos.<br />
2. Los t tratamientos son una muestra <strong>al</strong>eatoria <strong>de</strong> una<br />
población <strong>de</strong> tratamientos. En esta situación nos gustaría<br />
po<strong>de</strong>r exten<strong>de</strong>r las conclusiones (las cu<strong>al</strong>es están basadas<br />
en la muestra <strong>de</strong> tratamientos consi<strong>de</strong>rada) a todos los<br />
tratamientos <strong>de</strong> la población. Este es el mo<strong>de</strong>lo <strong>de</strong><br />
efectos <strong>al</strong>eatorios.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 44/112
<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />
A las cantida<strong>de</strong>s n1, n2, . . .,nt se les llama repeticiones <strong>de</strong><br />
cada tratamiento.<br />
Si ni = r ∀i se dice que el diseño es b<strong>al</strong>anceado.<br />
yij es la respuesta <strong>de</strong> la u.e. j <strong>de</strong>l tratamiento i,<br />
i = 1, . . .,t j = 1, . . .,ni.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 45/112
<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong><br />
Estructura <strong>de</strong> los datos.<br />
tratamientos<br />
1 2 3 ... t<br />
y11 y21 y31 ... yt1<br />
y12 y22 y32 ... yt2<br />
y13 y23 y33 ... yt3<br />
. . . ... .<br />
. . . ... .<br />
. . . ... .<br />
y1n1 y2n2 y3n3 ... ytnt<br />
y1. y2. y3. ... yt. tot<strong>al</strong>es<br />
¯y1. ¯y2. ¯y3. ... ¯yt. medias<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 46/112
<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong><br />
n =<br />
yi. =<br />
¯yi. =<br />
y.. =<br />
t<br />
i=1<br />
ni <br />
ni<br />
yij i = 1, . . .,t tot<strong>al</strong> tratamiento i<br />
j=1<br />
ni j=1 yij<br />
t<br />
i=1<br />
¯y.. = y..<br />
n<br />
ni<br />
ni <br />
j=1<br />
yij =<br />
i = 1, . . .,t media tratamiento i<br />
t<br />
yi. tot<strong>al</strong> <strong>de</strong> las observaciones<br />
i=1<br />
media gener<strong>al</strong><br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 47/112
<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong><br />
Se tienen t muestras <strong>al</strong>eatorias in<strong>de</strong>pendientes <strong>de</strong> tamaños<br />
n1, n2, . . .,nt respectivamente.<br />
y11, y12, . . .,y1n1 es una muestra <strong>al</strong>eatoria <strong>de</strong> N(µ1, σ 2 )<br />
y21, y22, . . .,y2n2 es una muestra <strong>al</strong>eatoria <strong>de</strong> N(µ2, σ 2 )<br />
yt1, yt2, . . .,ytnt es una muestra <strong>al</strong>eatoria <strong>de</strong> N(µt, σ 2 )<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 48/112
<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong><br />
Las observaciones en cada una <strong>de</strong> estas muestras se pue<strong>de</strong>n<br />
representar por el mo<strong>de</strong>lo line<strong>al</strong> simple<br />
yij = µi + ǫij i = 1, . . .,t j = 1, . . .,ni<br />
con ǫij error experiment<strong>al</strong> en la observación j-ésima <strong>de</strong>l<br />
tratamiento i-ésimo.<br />
Estamos suponiendo in<strong>de</strong>pen<strong>de</strong>ncia entre y <strong>de</strong>ntro <strong>de</strong> las<br />
muestras, es <strong>de</strong>cir, ǫij son in<strong>de</strong>pendientes y ǫij ∼ N(0, σ 2 ).<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 49/112
<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong><br />
Otra forma <strong>de</strong> verlo<br />
Como suponemos que las u.e. son homogéneas, es <strong>de</strong>cir, el<br />
promedio <strong>de</strong> respuesta <strong>de</strong> todas las u.e. es el mismo (µ) antes<br />
<strong>de</strong> aplicar los tratamientos, y si se observan en condiciones<br />
similares, las respuestas las po<strong>de</strong>mos mo<strong>de</strong>lar como<br />
yij = µ + ǫij<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 50/112
Mo<strong>de</strong>lo <strong>de</strong> efectos<br />
Entonces <strong>al</strong> aplicar el tratamiento i-ésimo a un grupo (<strong>de</strong><br />
tamaño ni) <strong>de</strong> u.e. se introduce un efecto (τi) <strong>de</strong> ese<br />
tratamiento en las variables por observar.<br />
El mo<strong>de</strong>lo se pue<strong>de</strong> escribir como:<br />
don<strong>de</strong><br />
Mo<strong>de</strong>lo <strong>de</strong> efectos<br />
yij = µ + τi + ǫij i = 1, . . .,t j = 1, . . .,ni<br />
µ es la media gener<strong>al</strong>, común a todas las u.e.<br />
τi es el efecto <strong>de</strong>l tratamiento i-ésimo<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 51/112
Mo<strong>de</strong>lo <strong>de</strong> efectos<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 52/112
Mo<strong>de</strong>lo <strong>de</strong> efectos<br />
El mo<strong>de</strong>lo <strong>de</strong> efectos implica que se empieza el experimento<br />
con u.e. con la misma capacidad <strong>de</strong> respuesta (µ) y con la<br />
misma varianza (σ 2 ).<br />
La aplicación <strong>de</strong> los tratamientos tiene el efecto <strong>de</strong> <strong>al</strong>terar las<br />
medias, que ahora son µi = µ + τi, pero supone que no se<br />
modifican las varianzas.<br />
En este caso, la hipótesis a probar es:<br />
H0 : τ1 = τ2 = . . . = τt = 0<br />
Ha : τi = 0 para <strong>al</strong> menos una i<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 53/112
Mo<strong>de</strong>lo <strong>de</strong> efectos<br />
Estimadores <strong>de</strong> mínimos cuadrados:<br />
∂<br />
∂µ<br />
∂<br />
∂τi<br />
yij = µ + τi + ǫij i = 1, . . .,t j = 1, . . .,ni<br />
SSE =<br />
t<br />
i=1<br />
ni <br />
j=1<br />
ǫ 2 ij =<br />
t ni <br />
(yij − µ − τi) 2<br />
i=1<br />
t ni <br />
(yij − µ − τi) 2 = −2<br />
i=1<br />
j=1<br />
t ni <br />
(yij − µ − τi) 2 = −2<br />
i=1<br />
j=1<br />
j=1<br />
t<br />
i=1<br />
ni <br />
j=1<br />
ni <br />
j=1<br />
(yij − µ − τi)<br />
(yij − µ − τi) i = 1, . . .,t<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 54/112
Mo<strong>de</strong>lo <strong>de</strong> efectos<br />
Igu<strong>al</strong>ando a cero:<br />
t<br />
i=1<br />
ni <br />
j=1<br />
n1 <br />
j=1<br />
n2 <br />
j=1<br />
nt <br />
j=1<br />
yij = nˆµ +<br />
t<br />
niˆτi<br />
i=1<br />
y1j = n1ˆµ + n1ˆτ1<br />
y2j = n2ˆµ + n2ˆτ2<br />
. . . . . .<br />
ytj = ntˆµ + ntˆτt<br />
Las ecuaciones norm<strong>al</strong>es no son line<strong>al</strong>mente in<strong>de</strong>pendientes,<br />
por lo tanto no hay una solución única. Esto ocurre porque el<br />
mo<strong>de</strong>lo <strong>de</strong> efectos está sobreparametrizado.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 55/112
Mo<strong>de</strong>lo <strong>de</strong> efectos<br />
Se aña<strong>de</strong> una ecuación line<strong>al</strong>mente in<strong>de</strong>pendiente:<br />
a) t<br />
i=1 ˆτi = 0<br />
b) ˆµ = 0<br />
c) ˆτ1 = 0<br />
ˆµ = ¯y..<br />
ˆτi = ¯yi. − ¯y.. i = 1, . . .,t<br />
ˆµ = 0<br />
ˆτi = ¯yi. i = 1, . . .,t<br />
ˆµ = ¯y1.<br />
ˆτi = ¯yi. − ¯y1. i = 2, . . .,t<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 56/112
Mo<strong>de</strong>lo <strong>de</strong> efectos<br />
Hay un número infinito <strong>de</strong> posibles restricciones que se<br />
pue<strong>de</strong>n usar para resolver las ecuaciones norm<strong>al</strong>es. Entonces<br />
Cuál usar?<br />
No importa ya que en cu<strong>al</strong>quier caso<br />
µ + τi = ¯yi.<br />
Aunque no po<strong>de</strong>mos obtener estimadores únicos <strong>de</strong> los<br />
parámetros <strong>de</strong>l mo<strong>de</strong>lo <strong>de</strong> efectos, po<strong>de</strong>mos obtener<br />
estimadores únicos <strong>de</strong> funciones <strong>de</strong> estos parámetros.<br />
A estas funciones se les llama funciones line<strong>al</strong>es<br />
line<strong>al</strong>mente estimables.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 57/112
<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, Tabla <strong>de</strong> ANOVA<br />
F.V. g.l. SS CM F E(CM)<br />
Tratamientos t − 1 SSt CMt = SSt<br />
t−1<br />
Error n − t SSE CME = SSE<br />
n−t<br />
Tot<strong>al</strong> n − 1 SStot<strong>al</strong><br />
SSt =<br />
SSE =<br />
SStot<strong>al</strong> =<br />
t<br />
ni (¯yi. − ¯y..) 2 =<br />
i=1<br />
t<br />
i=1<br />
t<br />
i=1<br />
ni <br />
j=1<br />
ni <br />
j=1<br />
(yij − ¯yi.) 2 =<br />
(yij − ¯y..) 2 =<br />
n =<br />
t<br />
i=1<br />
t<br />
i=1<br />
t<br />
i=1<br />
t<br />
i=1<br />
CMt<br />
CME σ2 +<br />
y 2 i.<br />
ni<br />
ni <br />
j=1<br />
ni <br />
j=1<br />
ni<br />
− y2 ..<br />
n<br />
y 2 ij −<br />
σ 2<br />
t<br />
i=1<br />
y 2 ij − y2 ..<br />
n<br />
2<br />
i ni(τi−¯τ)<br />
t−1<br />
y 2 i.<br />
ni<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 58/112
Interv<strong>al</strong>os <strong>de</strong> confianza<br />
ˆµi = ¯yi. S 2 ¯yi.<br />
= S2<br />
ni<br />
Como suponemos que<br />
entonces<br />
como estimamos la varianza:<br />
con S 2 = CME = ˆσ 2 S¯yi. =<br />
yij ∼ N µi, σ 2<br />
¯yi. ∼ N µi, σ 2 <br />
/ni<br />
¯yi. − µi<br />
S¯yi.<br />
∼ tn−t<br />
CME<br />
Por lo tanto, un interv<strong>al</strong>o <strong>de</strong>l (1 − α)100% <strong>de</strong> confianza para µi<br />
es<br />
¯yi. ± t 1−α/2<br />
n−t (S¯yi. )<br />
ni<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 59/112
Contrastes<br />
En el ejemplo <strong>de</strong>l empacado <strong>de</strong> carne teníamos:<br />
Comerci<strong>al</strong> Al vacío CO,O2,N CO2<br />
ˆµi = ¯yi. 7.48 5.50 7.26 3.36<br />
S 2 = CME = 0.116 con 8 g.l.<br />
Una vez que rechazamos la hipótesis H0 : µ1 = µ2 = µ3 = µ4<br />
Qué sigue?<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 60/112
Contrastes<br />
Se podrían contestar preguntas como:<br />
■ Es más efectiva la creación <strong>de</strong> una atmósfera artifici<strong>al</strong> que el<br />
aire ambiente con plástico para reducir el crecimiento <strong>de</strong><br />
bacterias?<br />
■ Son más efectivos los gases que el vacío?<br />
■ Es más efectivo el tratamiento <strong>de</strong> CO2 puro que la mezcla<br />
CO,O2 y N?<br />
Un contraste es una función line<strong>al</strong> <strong>de</strong> los parámetros µi<br />
<strong>de</strong>finido como<br />
C =<br />
t<br />
kiµi = k1µ1 + k2µ2 + . . . + ktµt<br />
i=1<br />
don<strong>de</strong> t<br />
i=1 ki = 0.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 61/112
Contrastes<br />
Los contrastes para las preguntas anteriores son:<br />
■ comerci<strong>al</strong> vs. atmósfera artifici<strong>al</strong><br />
■ vacío vs. gases<br />
C1 = µ1 − 1<br />
3 (µ2 + µ3 + µ4)<br />
C2 = µ2 − 1<br />
2 (µ3 + µ4)<br />
■ mezcla <strong>de</strong> gases vs. CO2 puro<br />
C3 = µ3 − µ4<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 62/112
Contrastes<br />
El estimador <strong>de</strong>l contraste<br />
C =<br />
t<br />
kiµi es Ĉ =<br />
i=1<br />
Si suponemos que<br />
entonces<br />
Por lo tanto,<br />
Ĉ =<br />
t<br />
kiˆµi =<br />
i=1<br />
yij ∼ N µi, σ 2<br />
¯yi. ∼ N µi, σ 2 <br />
/ni<br />
t<br />
<br />
t<br />
ki¯yi. ∼ N kiµi, σ 2<br />
i=1<br />
i=1<br />
t<br />
i=1<br />
t<br />
i=1<br />
ki<br />
ni<br />
ki¯yi.<br />
<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 63/112
Contrastes<br />
Ya que:<br />
V<br />
t<br />
i=1<br />
E<br />
ki¯yi.<br />
t<br />
<br />
ˆV<br />
i=1<br />
ki¯yi.<br />
=<br />
<br />
m.in<strong>de</strong>p<br />
<br />
Ĉ<br />
<br />
=<br />
t<br />
kiE (¯yi.) =<br />
i=1<br />
t<br />
k 2 i V (¯yi.) =<br />
i=1<br />
= ˆσ 2<br />
t<br />
i=1<br />
k 2 i<br />
ni<br />
t<br />
i=1<br />
= CME<br />
t<br />
i=1<br />
k 2 i<br />
t<br />
i=1<br />
σ 2<br />
ni<br />
kiµi<br />
k 2 i<br />
ni<br />
= σ 2<br />
t<br />
i=1<br />
k 2 i<br />
ni<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 64/112
Contrastes<br />
Entonces,<br />
t<br />
i=1 ki¯yi. − t<br />
i=1 kiµi<br />
<br />
CME t<br />
i=1 k2 i /ni<br />
∼ tg.l.error<br />
De aquí un interv<strong>al</strong>o <strong>de</strong>l 100(1 − α)% <strong>de</strong> confianza para el<br />
contraste C es:<br />
Ĉ ± t 1−α/2<br />
<br />
<br />
t<br />
CME g.l.error<br />
i=1<br />
k 2 i /ni<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 65/112
Contrastes<br />
A<strong>de</strong>más,<br />
Ĉ − C<br />
<br />
σ2 t i=1 k2 i /ni<br />
∼ N (0, 1)<br />
Si H0 : t<br />
i=1 kiµi = 0, es <strong>de</strong>cir, H0 : C = 0 es cierta, entonces,<br />
Sea<br />
entonces<br />
Ĉ 2<br />
σ 2 t<br />
i=1 k2 i /ni<br />
SSc =<br />
Ĉ 2<br />
∼ χ 2 1<br />
t<br />
i=1 k2 i /ni<br />
SSc/σ2 SSE/σ2 (n − t) = Ĉ2 / t i=1 k2 i /ni<br />
CME<br />
∼ F1,n−t<br />
Por lo tanto, para probar H0 : C = 0 se rechaza si Fc > F α 1,n−t<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 66/112
Contrastes<br />
El número <strong>de</strong> contrastes que se pue<strong>de</strong>n hacer es muy gran<strong>de</strong>,<br />
sin embargo, esta técnica tiene su mayor utilidad cuando se<br />
aplica a comparaciones planeadas antes <strong>de</strong> re<strong>al</strong>izar el<br />
experimento.<br />
Una clase <strong>de</strong> contrastes, conocida como Contrastes<br />
ortogon<strong>al</strong>es (como son los <strong>de</strong>l ejemplo anterior) tienen<br />
propieda<strong>de</strong>s especi<strong>al</strong>es con respecto a la partición <strong>de</strong> sumas<br />
<strong>de</strong> cuadrados y grados <strong>de</strong> libertad y con respecto a su relación<br />
entre ellos. La ortogon<strong>al</strong>idad implica que un contraste no<br />
aporta información acerca <strong>de</strong> otro.<br />
Dos contrastes, con coeficientes {ki}, {li} son ortogon<strong>al</strong>es si<br />
t<br />
i=1<br />
kili<br />
ni<br />
= 0<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 67/112
Contrastes<br />
Para t tratamientos existe un conjunto <strong>de</strong> t − 1 contrastes<br />
ortogon<strong>al</strong>es, los cu<strong>al</strong>es hacen una partición <strong>de</strong> la suma <strong>de</strong><br />
cuadrados <strong>de</strong> tratamientos en t − 1 componentes<br />
in<strong>de</strong>pendientes, cada uno con 1 g.l. Por lo tanto las pruebas<br />
re<strong>al</strong>izadas con contrastes ortogon<strong>al</strong>es son in<strong>de</strong>pendientes.<br />
En el ejemplo anterior, los contrastes son ortogon<strong>al</strong>es.<br />
k1 k2 k3 k4<br />
C1 1 -1/3 -1/3 -1/3<br />
C2 0 1 -1/2 -1/2<br />
C3 0 0 1 -1<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 68/112
ANOVA<br />
La tabla <strong>de</strong> ANOVA incorporando las pruebas <strong>de</strong> hipótesis <strong>de</strong><br />
los 3 contrastes es:<br />
F.V. g.l. SS CM F Pr > F<br />
trat 3 32.8728 10.958 94.55 0.000<br />
C1 1 10.01 10.01 86.29 0.000<br />
C2 1 0.07 0.07 0.62 0.453<br />
C3 1 22.82 22.82 196.94 0.000<br />
error 8 0.9268 0.1159<br />
tot<strong>al</strong> 11 33.7996<br />
Se rechaza H0 : µ1 = µ2 = µ3 = µ4<br />
Se rechaza H01 : µ1 = 1<br />
3 (µ2 + µ3 + µ4)<br />
No se rechaza H02 : µ2 = 1<br />
2 (µ3 + µ4)<br />
Se rechaza H03 : µ3 = µ4<br />
SSC1 =<br />
1<br />
r<br />
2<br />
Ĉ1<br />
4 i=1 k2 i<br />
=<br />
(2.11) 2<br />
1 2 +3(−1/3) 2<br />
3<br />
= 4.4521<br />
0.4444<br />
= 10.01<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 69/112
Otro ejemplo<br />
En un experimento se van a comparar los % <strong>de</strong> carbohidratos<br />
en cuatro marcas <strong>de</strong> pan, para lo cu<strong>al</strong> se van a hacer 18<br />
<strong>de</strong>terminaciones: 5 en la marca A, 3 en la B, 4 en la C y 6 en<br />
la D.<br />
En este caso, cada marca <strong>de</strong> pan es un tratamiento (t = 4) y<br />
se tienen n1 = 5, n2 = 3, n3 = 4, n4 = 6. Para obtener las<br />
respuestas se tomarán muestras <strong>al</strong>eatorias <strong>de</strong> los tamaños ni<br />
especificados <strong>de</strong> cada marca y se harán <strong>de</strong>terminaciones <strong>de</strong><br />
los porcentajes mediante un procedimiento (hasta don<strong>de</strong> sea<br />
posible) idéntico en las 18 u.e.<br />
Note que en este ejemplo no estamos en libertad <strong>de</strong> asignar<br />
las u.e. a los tratamientos, ya que las poblaciones (las 4<br />
marcas) existen in<strong>de</strong>pendientemente <strong>de</strong> la acción <strong>de</strong>l<br />
experimentador. No obstante lo anterior, basta que las<br />
muestras <strong>al</strong>eatorias <strong>de</strong> las 4 poblaciones sean in<strong>de</strong>pendientes<br />
para que el análisis bajo el mo<strong>de</strong>lo que se propone sea válido.<br />
Este es un estudio observacion<strong>al</strong>, no experiment<strong>al</strong>.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 70/112
Otro ejemplo<br />
Tratamiento (marca)<br />
A B C D<br />
63 60 59 70<br />
68 65 66 69<br />
71 61 58 62<br />
70 59 71<br />
69 70<br />
66<br />
ni 5 3 4 6<br />
yi. 341 186 242 408<br />
¯yi. 68.2 62.0 60.5 68.0<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 71/112
Otro ejemplo<br />
Pruebe la hipótesis <strong>de</strong> igu<strong>al</strong>dad <strong>de</strong> medias<br />
H0 : µ1 = µ2 = µ3 = µ4.<br />
Conteste las siguientes preguntas:<br />
■ Son diferentes en promedio los porcentajes <strong>de</strong><br />
carbohidratos en las marcas B y C?<br />
■ Es diferente el porcentaje <strong>de</strong> carbohidratos <strong>de</strong> la marca A <strong>al</strong><br />
promedio <strong>de</strong> las marcas C y D?<br />
■ Suponga que las marcas A y B están hechas con harina<br />
integr<strong>al</strong> y las marcas C y D con harina blanca. El promedio<br />
<strong>de</strong>l porcentaje <strong>de</strong> carbohidratos <strong>de</strong> las marcas A y B es igu<strong>al</strong><br />
<strong>al</strong> promedio <strong>de</strong> C y D?<br />
Hacerlo con SPSS, JMP, STATA<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 72/112
Comparaciones múltiples<br />
En muchas situaciones prácticas, se <strong>de</strong>sea comparar pares <strong>de</strong><br />
medias. Po<strong>de</strong>mos <strong>de</strong>terminar cuáles medias difieren probando<br />
las diferencias entre todos los pares <strong>de</strong> medias <strong>de</strong><br />
tratamientos.<br />
Es <strong>de</strong>cir, estamos interesados en contrastes <strong>de</strong> la forma<br />
Γ = µi − µj ∀i = j<br />
Lo primero que se nos viene a la mente es hacer una prueba t<br />
para cada par <strong>de</strong> medias, es <strong>de</strong>cir, probar<br />
H0 : µi = µj<br />
Ha : µi = µj ∀i = j<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 73/112
Comparaciones múltiples<br />
Si suponemos varianzas igu<strong>al</strong>es, se tiene la estadística <strong>de</strong><br />
prueba<br />
tc = ¯yi. − ¯yj.<br />
sp<br />
1<br />
ni<br />
+ 1<br />
nj<br />
y se rechaza H0 <strong>al</strong> nivel <strong>de</strong> significancia α si<br />
tc ≤ t α/2<br />
ni+nj−2 ó tc ≥ t 1−α/2<br />
ni+nj−2<br />
Esto es equiv<strong>al</strong>ente a <strong>de</strong>cir que se rechaza H0 si<br />
o equiv<strong>al</strong>ente a<br />
|tc| = |¯yi. − ¯yj.|<br />
sp<br />
1<br />
ni<br />
+ 1<br />
nj<br />
|¯yi. − ¯yj.| > t 1−α/2<br />
ni+nj−2 sp<br />
> t 1−α/2<br />
ni+nj−2<br />
<br />
1<br />
ni<br />
+ 1<br />
nj<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 74/112
Comparaciones múltiples<br />
Esta prueba conocida como Diferencia Mínima Significativa<br />
(DMS ó LSD) en el contexto <strong>de</strong> ANOVA, lo que hace es<br />
comparar el v<strong>al</strong>or absoluto <strong>de</strong> la diferencia <strong>de</strong> cada par <strong>de</strong><br />
medias con DMS:<br />
Si<br />
|¯yi. − ¯yj.| > DMS = t 1−α/2<br />
glerror<br />
se rechaza H0 : µi = µj.<br />
<br />
CME<br />
1<br />
ni<br />
+ 1<br />
<br />
nj<br />
CME es el cuadrado medio <strong>de</strong>l error que es una estimación<br />
pon<strong>de</strong>rada <strong>de</strong> la varianza basada en t estimaciones <strong>de</strong> la<br />
varianza.<br />
El utilizar este procedimiento no es conveniente por que el<br />
nivel <strong>de</strong> significancia glob<strong>al</strong>, es <strong>de</strong>cir, para el conjunto <strong>de</strong> todas<br />
las pruebas, resulta muy superior <strong>al</strong> nivel <strong>de</strong> significancia (α)<br />
planeado.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 75/112
Comparaciones múltiples<br />
Por ejemplo, si se tienen 4 medias <strong>de</strong> tratamientos, entonces<br />
se tienen <br />
4<br />
2<br />
= 4!<br />
2!2!<br />
= 6<br />
pares a comparar, es <strong>de</strong>cir, 6 pruebas <strong>de</strong> hipótesis a re<strong>al</strong>izar,<br />
con lo que se pue<strong>de</strong>n cometer 0, 1, 2, 3, 4, 5, ó 6 errores Tipo I,<br />
si todas las medias son igu<strong>al</strong>es.<br />
Se <strong>de</strong>fine otra forma <strong>de</strong> error tipo I basado en los riesgos<br />
acumulados asociados a la familia <strong>de</strong> pruebas bajo<br />
consi<strong>de</strong>ración.<br />
Este es el error tipo I <strong>de</strong>l experimento αE que es el riesgo <strong>de</strong><br />
cometer el error tipo I <strong>al</strong> menos una vez.<br />
La probabilidad <strong>de</strong> error tipo I <strong>de</strong>l experimento pue<strong>de</strong><br />
ev<strong>al</strong>uarse para una familia <strong>de</strong> pruebas in<strong>de</strong>pendientes.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 76/112
Comparaciones múltiples<br />
Sin embargo, todas las pruebas a pares usando la DMS no<br />
son in<strong>de</strong>pendientes, puesto que el CME es el mismo en cada<br />
una <strong>de</strong> las estadísticas <strong>de</strong> prueba y el numerador contiene las<br />
mismas medias en varias <strong>de</strong> las estadísticas <strong>de</strong> prueba.<br />
Aún así, se pue<strong>de</strong> ev<strong>al</strong>uar el límite superior <strong>de</strong> la probabilidad<br />
<strong>de</strong> error tipo I <strong>de</strong>l experimento, suponiendo n pruebas<br />
in<strong>de</strong>pendientes.<br />
Suponga que la H0 es cierta para cada una <strong>de</strong> las n = t<br />
2<br />
pruebas y que son in<strong>de</strong>pendientes.<br />
Sea αc = P(error tipo I) en una sola prueba (comparación)<br />
con (1 − αc) = P(<strong>de</strong>cisión correcta).<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 77/112
Comparaciones múltiples<br />
La probabilidad <strong>de</strong> cometer x errores tipo I está dada por la<br />
distribución binomi<strong>al</strong> como:<br />
P(X = x) =<br />
<br />
n<br />
α<br />
x<br />
x c(1 − αc) n−x<br />
P(X = x) =<br />
n!<br />
(n − x)!x! αx c(1 − αc) n−x x = 0, 1, 2, . . .,n<br />
La probabilidad <strong>de</strong> no cometer ningún error tipo I es<br />
P(X = 0) = (1 − αc) n<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 78/112
Comparaciones múltiples<br />
La probabilidad <strong>de</strong> cometer <strong>al</strong> menos 1 error tipo I es<br />
P(X ≥ 1) = 1 − P(X = 0) = 1 − (1 − αc) n<br />
es <strong>de</strong>cir, la máxima probabilidad <strong>de</strong> cometer <strong>al</strong> menos un error<br />
tipo I entre las n comparaciones es:<br />
αE = 1 − (1 − αc) n<br />
αc = 1 − (1 − αE) 1/n<br />
<strong>de</strong> aquí<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 79/112
Comparaciones múltiples<br />
# <strong>de</strong> pruebas αE cuando αc cuando<br />
in<strong>de</strong>p. n αc = 0.05 αE = 0.05<br />
1 0.05 0.05<br />
2 0.098 0.025<br />
3 0.143 0.017<br />
4 0.185 0.013<br />
5 0.226 0.010<br />
10 0.401 0.005<br />
Por el razonamiento anterior es que han surgido una serie <strong>de</strong><br />
pruebas <strong>de</strong> diferentes autores para hacer comparaciones<br />
múltiples tratando <strong>de</strong> mantener la<br />
P(error tipo I <strong>de</strong>l experimento) = α<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 80/112
Bonferroni<br />
αE ≤ nαc<br />
n comparaciones, la igu<strong>al</strong>dad se dá cuando las pruebas son<br />
in<strong>de</strong>pendientes.<br />
Entonces,<br />
αc = αE/n<br />
Si queremos αE = 0.05 entonces, αc = 0.05/n y se hacen las<br />
pruebas t para los pares <strong>de</strong> medias con un nivel <strong>de</strong><br />
significancia αc en cada una <strong>de</strong> ellas.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 81/112
Tukey<br />
Conocida como la prueba <strong>de</strong> la Diferencia Mínima Significativa<br />
Honesta (DMSH)<br />
DMSH = q α <br />
CME<br />
t,glerror<br />
si ni = r ∀i<br />
r<br />
DMSH = q α <br />
CME 1<br />
t,glerror +<br />
2 ni<br />
1<br />
<br />
nj<br />
Si |¯yi. − ¯yj.| > DMSH se rechaza H0 : µi = µj.<br />
q α ν1,ν2<br />
se obtiene <strong>de</strong> las "tablas <strong>de</strong> rangos estu<strong>de</strong>ntizados".<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 82/112
Tukey<br />
Para el ejemplo <strong>de</strong>l empaque <strong>de</strong> carne:<br />
Comerci<strong>al</strong> Al vacío CO,O2,N CO2<br />
¯yi. 7.48 5.50 7.26 3.36<br />
S 2 = CME = 0.116 con 8g.l. t = 4, r = 3<br />
DMSH = q 0.05<br />
4,8<br />
0.116<br />
3<br />
|¯y1. − ¯y2.| = 1.98 ∗∗<br />
|¯y1. − ¯y3.| = 0.22<br />
|¯y1. − ¯y4.| = 4.12 ∗∗<br />
|¯y2. − ¯y3.| = 1.76 ∗∗<br />
|¯y2. − ¯y4.| = 2.14 ∗∗<br />
|¯y3. − ¯y4.| = 3.90 ∗∗<br />
= (4.53)(0.197) = 0.891<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 83/112
Stu<strong>de</strong>nt-Newman-Keuls (SNK)<br />
Se c<strong>al</strong>cula un conjunto <strong>de</strong> v<strong>al</strong>ores críticos<br />
don<strong>de</strong> q α p,f<br />
kp = q α p,fS¯yi.<br />
p = 2, 3, . . .,t<br />
es el percentil 1 − α <strong>de</strong> la distribución <strong>de</strong>l rango<br />
estu<strong>de</strong>ntizado para el número p <strong>de</strong> medias involucradas en la<br />
comparación y f g.l. <strong>de</strong>l error, y S¯yi. =<br />
Para el ejemplo <strong>de</strong> la carne empacada:<br />
CME<br />
r<br />
p 2 3 4<br />
q .05<br />
p,8 3.26 4.04 4.53<br />
kp 0.642 0.796 0.892<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 84/112
Stu<strong>de</strong>nt-Newman-Keuls (SNK)<br />
Comerci<strong>al</strong> Al vacío CO,O2,N CO2<br />
¯yi. 7.48 5.50 7.26 3.36<br />
Medias or<strong>de</strong>nadas:<br />
¯y4. = 3.36 ¯y2. = 5.50 ¯y3. = 7.26 ¯y1. = 7.48<br />
|¯y4. − ¯y1.| = 4.12 > k ∗∗<br />
4<br />
|¯y4. − ¯y3.| = 3.90 > k ∗∗<br />
3<br />
|¯y4. − ¯y2.| = 2.14 > k ∗∗<br />
2<br />
|¯y2. − ¯y1.| = 1.98 > k ∗∗<br />
3<br />
|¯y2. − ¯y3.| = 1.76 > k ∗∗<br />
2<br />
|¯y3. − ¯y1.| = 0.22 < K2(N.S.)<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 85/112
Duncan<br />
Es similar a la <strong>de</strong> SNK. Los promedios <strong>de</strong> los t tratamientos se<br />
or<strong>de</strong>nan en forma ascen<strong>de</strong>nte y el error estándar <strong>de</strong> cada<br />
promedio se <strong>de</strong>termina con<br />
S¯yi. =<br />
<br />
CME<br />
si ni = r ∀i<br />
r<br />
Para muestras <strong>de</strong> diferente tamaño, se reemplaza la r por la<br />
media armónica (nh) <strong>de</strong> los {ni}<br />
nh =<br />
t<br />
t<br />
i=1<br />
1<br />
ni<br />
<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 86/112
Duncan<br />
De las tablas <strong>de</strong> Duncan <strong>de</strong> rangos significativos se obtienen<br />
los v<strong>al</strong>ores <strong>de</strong> rα p,f para p = 2, 3, . . .,t.<br />
p es el número <strong>de</strong> medias involucradas en la comparación, α<br />
es el nivel <strong>de</strong> significancia y f los grados <strong>de</strong> libertad <strong>de</strong>l error.<br />
Se c<strong>al</strong>culan<br />
Rp = r α p,fS¯yi.<br />
p = 2, 3, . . .,t<br />
Para el ejemplo <strong>de</strong> la carne empacada:<br />
p 2 3 4<br />
r .05<br />
p,8 3.26 3.39 3.47<br />
Rp 0.642 0.668 0.684<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 87/112
Duncan<br />
Comerci<strong>al</strong> Al vacío CO,O2,N CO2<br />
¯yi. 7.48 5.50 7.26 3.36<br />
Medias or<strong>de</strong>nadas:<br />
¯y4. = 3.36 ¯y2. = 5.50 ¯y3. = 7.26 ¯y1. = 7.48<br />
|¯y4. − ¯y1.| = 4.12 > R ∗∗<br />
4<br />
|¯y4. − ¯y3.| = 3.90 > R ∗∗<br />
3<br />
|¯y4. − ¯y2.| = 2.14 > R ∗∗<br />
2<br />
|¯y2. − ¯y1.| = 1.98 > R ∗∗<br />
3<br />
|¯y2. − ¯y3.| = 1.76 > R ∗∗<br />
2<br />
|¯y3. − ¯y1.| = 0.22 < R2(N.S.)<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 88/112
Dunnett<br />
Para comparar las medias <strong>de</strong> los tratamientos con la media <strong>de</strong>l<br />
tratamiento control.<br />
Suponga que el tratamiento t es el control, queremos probar<br />
las hipótesis<br />
H0 : µi = µt<br />
H0 : µi = µt se rechaza si<br />
Ha : µi = µt i = 1, 2, . . .,t − 1<br />
|¯yi. − ¯yt.| > D = dα(t − 1, glerror)<br />
CME<br />
con dα(k, ν) es el percentil 1 − α <strong>de</strong> las tablas <strong>de</strong> Dunnett.<br />
Para el ejemplo <strong>de</strong> la carne empacada, el tratamiento 1 es el<br />
control.<br />
Comerci<strong>al</strong> Al vacío CO,O2,N CO2<br />
¯yi. 7.48 5.50 7.26 3.36<br />
r<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 89/112
Dunnett<br />
d0.05,3,8 = 2.42<br />
<br />
CME<br />
D = 2.42 = 0.477<br />
r<br />
|¯y2. − ¯y1.| = 1.98 > D ∗∗<br />
|¯y3. − ¯y1.| = 0.22 < D(N.S.)<br />
|¯y4. − ¯y1.| = 4.12 > D ∗∗<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 90/112
Scheffé<br />
Scheffé (1953) propuso un método para probar todos los<br />
posibles contrastes.<br />
Consi<strong>de</strong>re cu<strong>al</strong>quier contraste<br />
C =<br />
t<br />
kiµi estimado con Ĉ =<br />
i=1<br />
con error estándar<br />
SC =<br />
<br />
<br />
t<br />
CME i=1<br />
t<br />
i=1<br />
ki¯yi.<br />
La hipótesis nula pra el contraste H0 : C = 0 se rechaza si<br />
don<strong>de</strong><br />
S(αE) = SC<br />
|C| > S(αE)<br />
k 2 i<br />
ni<br />
<br />
<br />
(t − 1)F αE<br />
t−1,g.l.error<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 91/112
Análisis <strong>de</strong> residu<strong>al</strong>es<br />
Tenemos el mo<strong>de</strong>lo<br />
Suposiciones:<br />
■ errores norm<strong>al</strong>es<br />
■ in<strong>de</strong>pendientes<br />
■ varianza constante<br />
yij = µi + ǫij ó yij = µ + τi + ǫij<br />
ǫij ∼ NID 0, σ 2<br />
La prueba F <strong>de</strong>l análisis <strong>de</strong> varianza es robusta a f<strong>al</strong>ta <strong>de</strong><br />
norm<strong>al</strong>idad.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 92/112
Análisis <strong>de</strong> residu<strong>al</strong>es<br />
Si los errores experiment<strong>al</strong>es están correlacionados, el error<br />
estándar estará m<strong>al</strong> estimado. La in<strong>de</strong>pen<strong>de</strong>ncia se justifica<br />
<strong>al</strong>eatorizando las u.e. a los tratamientos en experimentos y<br />
seleccionando muestras <strong>al</strong>eatorias en estudios<br />
observacion<strong>al</strong>es.<br />
Si no hay homogeneidad <strong>de</strong> varianzas el estimador <strong>de</strong> σ 2 es<br />
m<strong>al</strong>o, aunque se ha visto en estudios que si el diseño es<br />
b<strong>al</strong>anceado no efecta mucho. También si los tamaños <strong>de</strong><br />
muestra mayores correspon<strong>de</strong>n a las poblaciones con mayor<br />
varianza.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 93/112
Análisis <strong>de</strong> residu<strong>al</strong>es, Norm<strong>al</strong>idad<br />
Residu<strong>al</strong>es<br />
eij = yij − ˆyij<br />
ˆyij = µ + τi = ˆµi = ¯yi.<br />
eij = yij − ¯yi.<br />
■ Prueba no parámetrica ( Kolmogorov-Smirnov )<br />
■ Histograma (muestras gran<strong>de</strong>s)<br />
■ gráfica en papel norm<strong>al</strong><br />
■ análisis <strong>de</strong> residu<strong>al</strong>es estandarizados para <strong>de</strong>tectar outliers.<br />
Si ǫij ∼ N(0, σ2 ) entonces ǫij−0<br />
∼ N(0, 1). Sean<br />
σ<br />
dij = eij<br />
√ , esperamos que:<br />
CME<br />
68% <strong>de</strong> los residu<strong>al</strong>es estandarizados estén entre -1 y 1<br />
95 % estén entre -2 y 2<br />
Virtu<strong>al</strong>mente todos estén entre -3 y 3.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 94/112
Análisis <strong>de</strong> residu<strong>al</strong>es, Homogeneidad <strong>de</strong> varianzas<br />
Prueba <strong>de</strong> Bartlett<br />
Estadística <strong>de</strong> Prueba:<br />
U = 1<br />
C<br />
H0 : σ 2 1 = σ 2 2 = . . . = σ 2 t<br />
Ha : no H0<br />
<br />
don<strong>de</strong> ˆσ 2 = <br />
C = 1 +<br />
(n − t)ln(ˆσ 2 ) − <br />
i<br />
(ni − 1)ˆσ 2 i<br />
n − t<br />
1<br />
3(t − 1)<br />
<br />
i<br />
i<br />
(ni − 1)ln(ˆσ 2 i )<br />
ˆσ 2 i = <br />
1<br />
ni − 1<br />
j<br />
− 1<br />
n − t<br />
<br />
(yij − ¯yi.) 2<br />
ni − 1<br />
H0 se rechaza si U > χ 2 α,t−1 (prueba sensible a f<strong>al</strong>ta <strong>de</strong><br />
norm<strong>al</strong>idad)<br />
<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 95/112
Análisis <strong>de</strong> residu<strong>al</strong>es, Homogeneidad <strong>de</strong> varianzas<br />
Prueba <strong>de</strong> Levene<br />
Se c<strong>al</strong>cula<br />
dij = |yij − ˜yi.| i = 1, . . .,t j = 1, . . .,ni<br />
don<strong>de</strong> ˜yi. es la mediana <strong>de</strong> las observaciones en el<br />
tratamiento i.<br />
Se ev<strong>al</strong>úa si el promedio <strong>de</strong> estas observaciones dij es igu<strong>al</strong><br />
para todos los tratamientos, es <strong>de</strong>cir, se hace un ANOVA para<br />
probar igu<strong>al</strong>dad <strong>de</strong> medias <strong>de</strong> dij.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 96/112
Prueba <strong>de</strong> Welch<br />
La prueba F usu<strong>al</strong> es robusta ante heteroscedasticidad<br />
(varianzas diferentes) si los tamaños <strong>de</strong> muestra son muy<br />
parecidos o, si los tamaños <strong>de</strong> muestra más gran<strong>de</strong>s<br />
correspon<strong>de</strong>n a las poblaciones con varianzas más gran<strong>de</strong>s.<br />
Sin embargo, se han construído <strong>al</strong>gunas procedimientos <strong>de</strong><br />
prueba <strong>de</strong> igu<strong>al</strong>dad <strong>de</strong> medias (H0 : µ1 = µ2 = . . . = µt) como<br />
por ejemplo el <strong>de</strong>sarrollado por Welch, conocido como la<br />
prueba <strong>de</strong> Welch.<br />
Sean Wi = ni/ˆσ 2 i ¯y ∗ = <br />
i<br />
Wi¯yi./<br />
i Wi y<br />
don<strong>de</strong> W. = <br />
i Wi.<br />
Λ = <br />
i<br />
(1 − Wi/W.) 2<br />
ni − 1<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 97/112
Prueba <strong>de</strong> Welch<br />
Entonces<br />
Fc =<br />
<br />
i Wi (¯yi.−¯y ∗ ) 2<br />
t−1<br />
1 + 2(t − 2)Λ/(t 2 − 1)<br />
tiene aproximadamente una distribución F con<br />
ν1 = t − 1 y ν2 = (t 2 − 1)/3Λ grados <strong>de</strong> libertad.<br />
H0 : µ1 = µ2 = . . . = µt se rechaza <strong>al</strong> nivel <strong>de</strong> significancia α si<br />
Fc > F α ν1,ν2 .<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 98/112
Transformaciones<br />
Se utilizan las transformaciones para cambiar la esc<strong>al</strong>a <strong>de</strong> las<br />
observaciones para que se cumplan las suposiciones <strong>de</strong>l<br />
mo<strong>de</strong>lo line<strong>al</strong> y dar inferencias válidas <strong>de</strong>l análisis <strong>de</strong> varianza.<br />
Cuando las transformaciones son necesarias, se hace el<br />
análisis y se hacen las inferencias en la esc<strong>al</strong>a transformada<br />
pero se presentan tablas <strong>de</strong> medias en la esc<strong>al</strong>a <strong>de</strong> medición<br />
origin<strong>al</strong>.<br />
1. Distribución Poisson. Mediciones que son conteos<br />
(número <strong>de</strong> plantas en cierta área, insectos en plantas,<br />
acci<strong>de</strong>ntes por unidad <strong>de</strong> tiempo) tienen distribución Poisson.<br />
La transformación x = √ y + a, a ∈ ℜ es la a<strong>de</strong>cuada.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 99/112
Transformaciones<br />
2. Distribución binomi<strong>al</strong>. Observaciones <strong>de</strong>l número <strong>de</strong><br />
éxitos en n ensayos in<strong>de</strong>pendientes tiene distribución binomi<strong>al</strong><br />
(proporción <strong>de</strong> semillas germinadas, proporción <strong>de</strong> plantas<br />
con flores en un transecto). ˆπ = y/n<br />
La transformación x = sin −1√ ˆπ es la a<strong>de</strong>cuada.<br />
Las transformaciones <strong>de</strong>l tipo potencia <strong>al</strong>teran la simetría o<br />
asimetría <strong>de</strong> las distribuciones <strong>de</strong> las observaciones.<br />
Si suponemos que la <strong>de</strong>sviación estándar <strong>de</strong> y es proporcion<strong>al</strong><br />
a <strong>al</strong>guna potencia <strong>de</strong> la media, es <strong>de</strong>cir,<br />
σy ∝ µ β<br />
Una transformación <strong>de</strong> las observaciones, <strong>de</strong>l estilo:<br />
x = y p<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 100/112
Transformaciones<br />
Da una relación<br />
σx ∝ µ p+β−1<br />
Si p = 1 − β entonces la <strong>de</strong>sviación estándar <strong>de</strong> la variable<br />
transformada x será constante, ya que p + β − 1 = 0 y σx ∝ µ 0 .<br />
La transformación <strong>de</strong> Box-Cox<br />
x = (y p − 1)/p p = 1<br />
x = logey p = 1<br />
El estimador <strong>de</strong> p se encuentra maximizando<br />
L(p) = − 1<br />
2 loge [CME(p)]<br />
don<strong>de</strong> CME(p) es el cuadrado medio <strong>de</strong>l error <strong>de</strong>l análisis <strong>de</strong><br />
varianza usando la transformación x = (y p − 1)/p para el v<strong>al</strong>or<br />
dado p.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 101/112
Transformaciones<br />
Se <strong>de</strong>termina CME(p) para un conjunto <strong>de</strong> v<strong>al</strong>ores <strong>de</strong> p, se<br />
grafica CME(p) vs. p y se toma el v<strong>al</strong>or <strong>de</strong> p que correspon<strong>de</strong><br />
<strong>al</strong> v<strong>al</strong>or mínimo <strong>de</strong> CME(p).<br />
JMP c<strong>al</strong>cula la transformación <strong>de</strong> Box-Cox, da una gráfica <strong>de</strong> p<br />
vs. CME y da la opción <strong>de</strong> guardar los datos transformados<br />
en el archivo.<br />
La dificultad <strong>de</strong> utilizar esta transformación es la interpretación.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 102/112
Ejemplo<br />
Los siguientes datos son el número <strong>de</strong> errores en un examen<br />
<strong>de</strong> sujetos bajo la influencia <strong>de</strong> dos drogas. El grupo 1 es un<br />
grupo control (sin droga), a los sujetos <strong>de</strong>l grupo 2 se les dió la<br />
droga 1, a los <strong>de</strong>l grupo 3 la droga 2 y a los <strong>de</strong>l grupo 4 las dos<br />
drogas.<br />
Grupo 1 Grupo 2 Grupo 3 Grupo 4<br />
(sin droga) (droga 1) (droga 2) (dos drogas)<br />
1 12 12 13<br />
8 10 4 14<br />
9 13 11 14<br />
9 13 7 17<br />
4 12 8 11<br />
1 10 10 14<br />
1 12 13<br />
5 14<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 103/112
Ejemplo<br />
Correr el ejemplo con SPSS y JMP.<br />
1. Probar homogeneidad <strong>de</strong> varianzas. (Bartlett y Levene)<br />
2. Hacer prueba <strong>de</strong> Welch<br />
3. Probar con <strong>al</strong>gunas transformaciones, checando<br />
norm<strong>al</strong>idad y homogeneidad <strong>de</strong> varianzas<br />
ej2_1_messy.sav<br />
ej2_1_messy.jmp<br />
ej2_1_messy.txt<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 104/112
Relación entre Regresión y ANOVA<br />
Cu<strong>al</strong>quier mo<strong>de</strong>lo <strong>de</strong> ANOVA se pue<strong>de</strong> escribir como un<br />
mo<strong>de</strong>lo <strong>de</strong> regresión line<strong>al</strong>.<br />
Suponga el ejemplo <strong>de</strong> la carne empacada<br />
tratamiento comerci<strong>al</strong> vacío mezcla CO2<br />
7.66 5.26 7.41 3.51<br />
6.98 5.44 7.33 2.91<br />
7.80 5.80 7.04 3.66<br />
Un diseño <strong>completamente</strong> <strong>al</strong> <strong>azar</strong> con un solo factor (método<br />
<strong>de</strong> empacado) con 4 niveles (4 tratamientos) y 3 repeticiones<br />
en cada tratamiento (diseño b<strong>al</strong>anceado).<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 105/112
Relación entre Regresión y ANOVA<br />
Mo<strong>de</strong>lo ANOVA <strong>completamente</strong> <strong>al</strong> <strong>azar</strong> un solo factor<br />
b<strong>al</strong>anceado:<br />
yij = µi + ǫij = µ + τi + ǫij<br />
El mo<strong>de</strong>lo <strong>de</strong> regresión equiv<strong>al</strong>ente es:<br />
yij = β0 + β1x1j + β2x2j + β3x3j + ǫij<br />
<br />
i = 1, 2, 3, 4<br />
j = 1, 2, 3<br />
<br />
i = 1, 2, 3, 4<br />
j = 1, 2, 3<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 106/112
Relación entre Regresión y ANOVA<br />
Don<strong>de</strong> las variables x1j, x2j, x3j están <strong>de</strong>finidas como:<br />
x1j =<br />
x2j =<br />
x3j =<br />
<br />
<br />
<br />
1 si la observación j es <strong>de</strong>l tratamiento 1<br />
0 en otro caso<br />
1 si la observación j es <strong>de</strong>l tratamiento 2<br />
0 en otro caso<br />
1 si la observación j es <strong>de</strong>l tratamiento 3<br />
0 en otro caso<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 107/112
Relación entre Regresión y ANOVA<br />
La relación entre los parámetros <strong>de</strong>l mo<strong>de</strong>lo ANOVA y el<br />
mo<strong>de</strong>lo <strong>de</strong> regresión es:<br />
Si la observación viene <strong>de</strong>l tratamiento 1, entonces<br />
x1j = 1, x2j = 0, x3j = 0 y el mo<strong>de</strong>lo <strong>de</strong> regresión es<br />
y1j = β0 + β1(1) + β2(0) + β3(0) + ǫ1j<br />
y el mo<strong>de</strong>lo ANOVA es:<br />
Por lo tanto:<br />
= β0 + β1 + ǫ1j<br />
y1j = µ1 + ǫ1j = µ + τ1 + ǫ1j<br />
β0 + β1 = µ1 = µ + τ1<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 108/112
Relación entre Regresión y ANOVA<br />
Similarmente, para las observaciones <strong>de</strong>l tratamiento 2<br />
y2j = β0 + β1(0) + β2(1) + β3(0) + ǫ2j<br />
= β0 + β2 + ǫ2j<br />
y la relación entre los parámetros es:<br />
βo + β2 = µ2 = µ + τ2<br />
Lo mismo para las observaciones <strong>de</strong>l tratamiento 3<br />
y3j = β0 + β1(0) + β2(0) + β3(1) + ǫ3j<br />
= β0 + β3 + ǫ3j<br />
y la relación entre los parámetros es:<br />
βo + β3 = µ3 = µ + τ3<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 109/112
Relación entre Regresión y ANOVA<br />
Fin<strong>al</strong>mente, consi<strong>de</strong>re las observaciones <strong>de</strong>l tratamiento 4,<br />
para las cu<strong>al</strong>es el mo<strong>de</strong>lo <strong>de</strong> regresión es:<br />
y4j = β0 + β1(0) + β2(0) + β3(0) + ǫ4j<br />
= β0 + ǫ4j<br />
entonces β0 = µ4 = µ + τ4<br />
Por lo tanto,<br />
β0 = µ4<br />
β1 = µ1 − µ4<br />
β2 = µ2 − µ4<br />
β3 = µ3 − µ4<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 110/112
Relación entre Regresión y ANOVA<br />
Entonces, para probar la hipótesis H0 : µ1 = µ2 = µ3 = µ4<br />
tendríamos que probar H0 : β1 = β2 = β3 = 0, lo cu<strong>al</strong> se pue<strong>de</strong><br />
hacer con cu<strong>al</strong>quier paquete <strong>de</strong> cómputo estadístico.<br />
Para el ejemplo <strong>de</strong> la carne empacada:<br />
tratamiento y x1 x2 x3<br />
1 7.66 1 0 0<br />
1 6.98 1 0 0<br />
1 7.80 1 0 0<br />
2 5.26 0 1 0<br />
2 5.44 0 1 0<br />
2 5.80 0 1 0<br />
3 7.41 0 0 1<br />
3 7.33 0 0 1<br />
3 7.04 0 0 1<br />
4 3.51 0 0 0<br />
4 2.91 0 0 0<br />
4 3.66 0 0 0<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 111/112
Relación entre Regresión y ANOVA<br />
Si pedimos una regresión y = β0 + β1x1 + β2x2 + β3x3 + ǫ y<br />
pedimos una tabla <strong>de</strong> análisis <strong>de</strong> varianza <strong>de</strong>l mo<strong>de</strong>lo<br />
yij = µ + τi + ǫij las dos tablas ANOVA son idénticas.<br />
<strong>Diseño</strong> <strong>de</strong> experimentos – p. 112/112