08.05.2013 Views

Diseño completamente al azar - Departamento de Probabilidad y ...

Diseño completamente al azar - Departamento de Probabilidad y ...

Diseño completamente al azar - Departamento de Probabilidad y ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong><br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 1/112


Ejemplo<br />

Suponga que tenemos 4 dietas diferentes que queremos<br />

comparar. Las dietas están etiquetadas A,B,C y D.<br />

Estamos interesados en estudiar si las dietas afectan la tasa<br />

<strong>de</strong> coagulación en conejos. La tasa <strong>de</strong> coagulación es el<br />

tiempo en segundos que tarda una cortada en <strong>de</strong>jar <strong>de</strong><br />

sangrar.<br />

Tenemos 16 conejos para el experimento, por lo que usaremos<br />

4 en cada dieta.<br />

Los conejos están en una jaula gran<strong>de</strong> hasta que se inicie el<br />

experimento, momento en que se transferirán a otras jaulas.<br />

Cómo asignamos los conejos a los cuatro grupos<br />

tratamiento?<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 2/112


Método 1<br />

Supongamos que los conejos se atrapan "<strong>al</strong> <strong>azar</strong>". Atrapamos<br />

cuatro conejos y los asignamos a la dieta A. Atrapamos otros<br />

cuatro y los asignamos a la dieta B y así sucesivamente.<br />

Dado que los conejos fueron "atrapados <strong>al</strong> <strong>azar</strong>", esto<br />

producirá un diseño <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 3/112


Método 1<br />

No es necesariamente cierto.<br />

Los primeros cuatro conejos atrapados pue<strong>de</strong>n ser los más<br />

lentos y débiles, aquellos menos capaces <strong>de</strong> escapar. Esto<br />

pue<strong>de</strong> sesgar los resultados.<br />

Si los resultados <strong>de</strong>l experimento dan <strong>de</strong>sventaja a la dieta A,<br />

no habrá forma <strong>de</strong> <strong>de</strong>terminar si los resultados son a<br />

consecuencia <strong>de</strong> la dieta A o <strong>de</strong>l hecho <strong>de</strong> haber asignado los<br />

conejos más débiles a esa dieta por nuestro "proceso <strong>de</strong><br />

<strong>al</strong>eatorización".<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 4/112


Método 2<br />

Atrape a todos los conejos y etiquételos <strong>de</strong>l 1 <strong>al</strong> 16.<br />

Seleccione cuatro números <strong>al</strong>eatorios (sin reemplazo) <strong>de</strong>l 1 <strong>al</strong><br />

16 y ponga los conejos con esa etiqueta en una jaula que<br />

recibirá la dieta A.<br />

Entonces, seleccione otros cuatro números <strong>al</strong>eatorios y ponga<br />

los conejos correspondientes en otra jaula que recibirá la dieta<br />

B.<br />

Así sucesivamente hasta tener cuatro jaulas con cuatro<br />

conejos en cada una.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 5/112


Método 2<br />

No hay repeticiones.<br />

El diseño es un diseño <strong>completamente</strong> <strong>al</strong> <strong>azar</strong> pero no tiene<br />

repeticiones.<br />

Hay 16 conejos, pero los conejos en cada jaula no son<br />

in<strong>de</strong>pendientes. Si un conejo come mucho, los otros en la<br />

jaula tienen menos para comer.<br />

La unidad experiment<strong>al</strong> es la menor unidad <strong>de</strong> materi<strong>al</strong><br />

experiment<strong>al</strong> a la cu<strong>al</strong> se le aplica un tratamiento en forma<br />

in<strong>de</strong>pendiente. En este caso, las jaulas son las unida<strong>de</strong>s<br />

experiment<strong>al</strong>es. Para un diseño <strong>completamente</strong> <strong>al</strong> <strong>azar</strong> con<br />

repeticiones, cada conejo <strong>de</strong>be estar en su propia jaula.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 6/112


Método 3<br />

En una urna ponga las letras A,B,C y D en pedazos <strong>de</strong> papel<br />

separados.<br />

Atrape un conejo, saque un pedazo <strong>de</strong> papel <strong>al</strong> <strong>azar</strong> <strong>de</strong> la urna<br />

y asigne el conejo a la dieta que indique el papel. No<br />

reemplace el papel. Atrape el segundo conejo y seleccione <strong>al</strong><br />

<strong>azar</strong> otro pedazo <strong>de</strong> papel <strong>de</strong> la urna <strong>de</strong> los tres que quedan.<br />

Asigne el conejo a la dieta correspondiente.<br />

Continue hasta que los primeros cuatro conejos sean<br />

asignados a una <strong>de</strong> las cuatro dietas. De esta manera, todos<br />

los conejos lentos tienen diferentes dietas.<br />

Coloque otra vez los cuatro pedazos <strong>de</strong> papel en la urna y<br />

repita el procedimiento hasta que los 16 conejos estén<br />

asignados a una dieta.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 7/112


Método 3<br />

Este no es un diseño <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>.<br />

Ya que se seleccionaron los conejos en bloques <strong>de</strong> 4, y cada<br />

uno asignado a una <strong>de</strong> las dietas, el diseño es el bloques <strong>al</strong><br />

<strong>azar</strong>.<br />

El tratamiento es Dieta pero se ha bloqueado a través <strong>de</strong>l<br />

grado <strong>de</strong> "atrapabilidad".<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 8/112


Método 4<br />

Atrape a todos los conejos y márquelos <strong>de</strong>l 1 <strong>al</strong> 16. Ponga 16<br />

piezas <strong>de</strong> papel en una urna, con las letras A, B, C y D<br />

repetidas cuatro veces cada una.<br />

Ponga otros 16 pedazos <strong>de</strong> papel numerados <strong>de</strong>l 1 <strong>al</strong> 16 en<br />

otra urna. Tome un pedazo <strong>de</strong> papel <strong>de</strong> cada urna. El conejo<br />

con el número seleccionado es asignado a la dieta<br />

seleccionada.<br />

Para hacer más fácil <strong>de</strong> recordar cuál conejo tiene cuál dieta,<br />

las jaulas se acomodan como se muestra abajo:<br />

A A A A<br />

B B B B<br />

C C C C<br />

D D D D<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 9/112


Método 4<br />

El método 4 tiene <strong>al</strong>gunas <strong>de</strong>ficiencias. La asignación <strong>de</strong> los<br />

conejos a los tratamientos es un diseño <strong>completamente</strong> <strong>al</strong><br />

<strong>azar</strong>. Sin embargo, el arreglo <strong>de</strong> las jaulas crea un sesgo en<br />

los resultados.<br />

Pue<strong>de</strong> haber cambios climáticos y <strong>de</strong> luz que afecten <strong>de</strong> forma<br />

diferenci<strong>al</strong> a los tratamientos, <strong>de</strong> t<strong>al</strong> manera que, cu<strong>al</strong>quier<br />

diferencia observada no pue<strong>de</strong> ser atribuida a la dieta, sino<br />

que podría ser resultado <strong>de</strong> la posición <strong>de</strong> la jaula.<br />

La posición <strong>de</strong> la jaula no es parte <strong>de</strong>l tratamiento, pero <strong>de</strong>be<br />

ser consi<strong>de</strong>rada. En un diseño <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, todos<br />

los conejos tienen la misma probabilidad <strong>de</strong> recibir cu<strong>al</strong>quier<br />

dieta y en cu<strong>al</strong>quier posición <strong>de</strong> la jaula.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 10/112


Método 5<br />

Marque las jaulas <strong>de</strong>l 1 <strong>al</strong> 16.<br />

1 5 9 13<br />

2 6 10 14<br />

3 7 11 15<br />

4 8 12 16<br />

Ponga 16 pedazos <strong>de</strong> papel en una urna, numerados <strong>de</strong>l 1 <strong>al</strong><br />

16. En otra urna ponga 16 pedazos <strong>de</strong> papel, marcados con<br />

las letras A, B C y D.<br />

Atrape un conejo. Seleccione un número y una letra <strong>de</strong> cada<br />

urna. Ponga el conejo en la jaula indicada por el número<br />

escogido y asígnelo a la dieta indicada por la letra.<br />

Repita sin reemplazo hasta que todos los conejos hayan sido<br />

asignados a una dieta y una jaula.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 11/112


Método 5<br />

Si, por ejemplo, el primer número seleccionado fué 7 y la<br />

primera letra B, entonces el primer conejo se pone en la jaula<br />

7 y se <strong>al</strong>imenta con la dieta B.<br />

1 5 9 13<br />

2 6 10 14<br />

3 7 B 11 15<br />

4 8 12 16<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 12/112


Método 5<br />

Un ejemplo <strong>de</strong> asignación completa es el siguiente:<br />

1 C 5 A 9 B 13 D<br />

2 D 6 B 10 D 14 C<br />

3 C 7 B 11 A 15 D<br />

4 A 8 A 12 C 16 B<br />

Note que el diseño <strong>completamente</strong> <strong>al</strong> <strong>azar</strong> no toma en cuenta<br />

las diferencias en la <strong>al</strong>tura <strong>de</strong> las jaulas. Es solamente una<br />

asignación <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>.<br />

En este ejemplo vemos que la mayoría <strong>de</strong> los conejos con la<br />

dieta A están en jaulas <strong>de</strong> la parte <strong>de</strong> abajo y los <strong>de</strong> la dieta D<br />

están en la parte superior. Un diseño <strong>completamente</strong> <strong>al</strong> <strong>azar</strong><br />

supone que estas posiciones no producen una diferencia<br />

sistemática en la respuesta (tiempo <strong>de</strong> coagulación).<br />

Si creemos que la posición afecta la respuesta, <strong>de</strong>beríamos<br />

usar un diseño <strong>de</strong> bloques <strong>al</strong> <strong>azar</strong>.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 13/112


<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />

Ejemplo: Disminución <strong>de</strong>l crecimiento <strong>de</strong> bacterias en carne<br />

<strong>al</strong>macenada.<br />

La vida en estante <strong>de</strong> carne <strong>al</strong>macenada es el tiempo en que<br />

el corte empacado se mantiene bien, nutritivo y vendible.<br />

El empaque estándar con aire <strong>de</strong>l medio ambiente tiene una<br />

vida <strong>de</strong> 48 horas. Después se <strong>de</strong>teriora por contaminación<br />

bacteri<strong>al</strong>, <strong>de</strong>gradación <strong>de</strong>l color y encogimiento.<br />

El empaque <strong>al</strong> vacío <strong>de</strong>tiene el crecimiento bacteri<strong>al</strong>, sin<br />

embargo, se pier<strong>de</strong> c<strong>al</strong>idad.<br />

Estudios recientes sugieren que <strong>al</strong> controlar ciertos gases <strong>de</strong><br />

la atmósfera se <strong>al</strong>arga la vida en estante.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 14/112


<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />

Hipótesis <strong>de</strong> investigación: Algunas formas <strong>de</strong> gases<br />

controlados pue<strong>de</strong>n mejorar la efectividad <strong>de</strong>l<br />

empacamiento para carne.<br />

<strong>Diseño</strong> <strong>de</strong> tratamientos: Un factor con 4 niveles:<br />

1. Aire ambient<strong>al</strong> con envoltura plástica<br />

2. Empacado <strong>al</strong> vacío<br />

3. Mezcla <strong>de</strong> gases:<br />

■ 1% CO (monóxido <strong>de</strong> carbono)<br />

■ 40% O2 (oxígeno)<br />

■ 59% N (nitrógeno)<br />

4. 100% CO2 (bióxido <strong>de</strong> carbono)<br />

<strong>Diseño</strong> experiment<strong>al</strong>: Completamente <strong>al</strong> <strong>azar</strong>.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 15/112


<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />

Tres bisteces <strong>de</strong> res, aproximadamente <strong>de</strong>l mismo tamaño (75<br />

grs.) se asignaron <strong>al</strong>eatoriamente a cada tratamiento. Cada<br />

bistec se empaca separadamente con su condición asignada.<br />

Variable <strong>de</strong> respuesta: Se mi<strong>de</strong> el número <strong>de</strong><br />

bacterias psichnotropicas en la carne <strong>de</strong>spués <strong>de</strong> 9<br />

días <strong>de</strong> <strong>al</strong>macenamiento a 4 ◦ C.<br />

Estas bacterias se encuentran en la superficie <strong>de</strong> la<br />

carne y aparecen cuando la carne se echó a per<strong>de</strong>r.<br />

La medición fué el logaritmo <strong>de</strong>l número <strong>de</strong><br />

bacterias por cm 2 .<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 16/112


<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />

Cómo <strong>al</strong>eatorizar?<br />

Se obtiene una permutación <strong>al</strong>eatoria <strong>de</strong> los números 1 a 12. Para esto se<br />

toma una secuencia <strong>de</strong> números <strong>de</strong> 2 dígitos <strong>de</strong> una tabla <strong>de</strong> números<br />

<strong>al</strong>eatorios y se les asigna el rango que les corresponda.<br />

Por ejemplo:<br />

# <strong>al</strong>eatorio 52 56 20 99 44 34 62 60 31 57 40 78<br />

rango 6 7 1 12 5 3 10 9 2 8 4 11<br />

trat 1 1 1 2 2 2 3 3 3 4 4 4<br />

u.e. 1 2 3 4 5 6 7 8 9 10 11 12<br />

trat 1 3 2 4 2 1 1 4 3 3 4 2<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 17/112


<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />

Mo<strong>de</strong>lo estadístico para el experimento<br />

El mo<strong>de</strong>lo estadístico para estudios comparativos supone que<br />

hay una población <strong>de</strong> referencia <strong>de</strong> u.e. En muchos casos la<br />

población es conceptu<strong>al</strong>. En el ejemplo, es posible imaginar<br />

una población <strong>de</strong> carne empacada.<br />

Cada unidad <strong>de</strong> la población tiene un v<strong>al</strong>or <strong>de</strong> la variable <strong>de</strong><br />

respuesta, y, la cu<strong>al</strong> tiene media µ y varianza σ 2 .<br />

Se supone una población <strong>de</strong> referencia para cada tratamiento<br />

consi<strong>de</strong>rado en el estudio, y las variables en el experimento se<br />

suponen seleccionadas <strong>al</strong>eatoriamente <strong>de</strong> dicha población <strong>de</strong><br />

referencia, como resultado <strong>de</strong> la <strong>al</strong>eatorización.<br />

Nota. Para estudios observacion<strong>al</strong>es, suponemos que las<br />

unida<strong>de</strong>s observadas se seleccionaron <strong>al</strong>eatoriamente <strong>de</strong><br />

cada una <strong>de</strong> las poblaciones.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 18/112


<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 19/112


<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />

Mo<strong>de</strong>lo estadístico line<strong>al</strong> para un diseño <strong>completamente</strong> <strong>al</strong><br />

<strong>azar</strong>.<br />

don<strong>de</strong><br />

Mo<strong>de</strong>lo <strong>de</strong> medias:<br />

yij = µi + ǫij i = 1, 2, . . .,t j = 1, 2, . . .,r<br />

yij es la observación <strong>de</strong> la j-ésima u.e. <strong>de</strong>l i-ésimo tratamiento,<br />

µi es la media <strong>de</strong>l i-ésimo tratamiento,<br />

ǫij es el error experiment<strong>al</strong> <strong>de</strong> la unidad ij.<br />

Suponemos que hay t tratamientos y r repeticiones en cada<br />

uno.<br />

En el ejemplo <strong>de</strong> la carne empacada, tenemos:<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 20/112


<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />

bistec trata obser log yij Mo<strong>de</strong>lo<br />

miento vación (conteo/cm 2 )<br />

6 1 1 7.66 y11 µ1 + ǫ11<br />

7 1 2 6.98 y12 µ1 + ǫ12<br />

1 1 3 7.80 y13 µ1 + ǫ13<br />

12 2 1 5.26 y21 µ2 + ǫ21<br />

5 2 2 5.44 y22 µ2 + ǫ22<br />

3 2 3 5.80 y23 µ2 + ǫ23<br />

10 3 1 7.41 y31 µ3 + ǫ31<br />

9 3 2 7.33 y32 µ3 + ǫ32<br />

2 3 3 7.04 y33 µ3 + ǫ33<br />

8 4 1 3.51 y41 µ4 + ǫ41<br />

4 4 2 2.91 y42 µ4 + ǫ42<br />

11 4 3 3.66 y43 µ4 + ǫ43<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 21/112


<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />

El mo<strong>de</strong>lo:<br />

yij = µi + ǫij<br />

lo llamaremos mo<strong>de</strong>lo completo ya que incluye una media<br />

separada para cada una <strong>de</strong> las poblaciones <strong>de</strong>finidas por los<br />

tratamientos.<br />

Si no hay diferencia entre las medias <strong>de</strong> las poblaciones, es<br />

<strong>de</strong>cir,<br />

µ1 = µ2 = µ3 = µ4 = µ<br />

se genera el mo<strong>de</strong>lo reducido<br />

yij = µ + ǫij<br />

que establece que las observaciones provienen <strong>de</strong> la misma<br />

población con media µ.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 22/112


<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />

El mo<strong>de</strong>lo reducido representa la hipótesis <strong>de</strong> no diferencia<br />

entre las medias<br />

H0 : µ1 = µ2 = µ3 = µ4 = µ<br />

El mo<strong>de</strong>lo completo representa la hipótesis <strong>al</strong>ternativa:<br />

Ha : µi = µk i = k<br />

El investigador <strong>de</strong>be <strong>de</strong>terminar cuál <strong>de</strong> los dos mo<strong>de</strong>los<br />

<strong>de</strong>scribe mejor a los datos en el experimento.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 23/112


<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />

yij = µ + ǫij<br />

yij = µi + ǫij<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 24/112


<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />

Pregunta <strong>de</strong> investigación: Hay más crecimiento bacteri<strong>al</strong><br />

con <strong>al</strong>gunos métodos <strong>de</strong> empacado que con otros?<br />

Pregunta estadística: Cuál mo<strong>de</strong>lo <strong>de</strong>scribe mejor los<br />

resultados <strong>de</strong>l experimento?<br />

Se requiere un método para estimar los parámetros <strong>de</strong> los dos<br />

mo<strong>de</strong>los y con base en <strong>al</strong>gun criterio objetivo <strong>de</strong>terminar cuál<br />

mo<strong>de</strong>lo o hipótesis estadística se ajusta mejor a los datos <strong>de</strong>l<br />

experimento.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 25/112


<strong>Diseño</strong> <strong>completamente</strong> el <strong>azar</strong>, un factor<br />

Los estimadores <strong>de</strong> mínimos cuadrados son aquellos que<br />

resultan <strong>de</strong> minimizar la suma <strong>de</strong> cuadrados <strong>de</strong> los errores<br />

experiment<strong>al</strong>es.<br />

Si los errores experiment<strong>al</strong>es son in<strong>de</strong>pendientes con media<br />

cero y varianzas homogéneas, los estimadores <strong>de</strong> mínimos<br />

cuadrados son insesgados y tienen varianza mínima.<br />

Nota. El muestreo <strong>al</strong>eatorio en los estudios observacion<strong>al</strong>es y<br />

la <strong>al</strong>eatorización en los experiment<strong>al</strong>es aseguran la suposición<br />

<strong>de</strong> in<strong>de</strong>pen<strong>de</strong>ncia.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 26/112


Estimadores para el mo<strong>de</strong>lo completo<br />

yij = µi + ǫij i = 1, . . .,t j = 1, . . .,r<br />

ǫij = yij − µi<br />

SSEc =<br />

t r<br />

ǫ 2 ij =<br />

i=1<br />

j=1<br />

t<br />

i=1<br />

r<br />

(yij − µi) 2<br />

La SSEc es una medida <strong>de</strong> qué tan bien se ajusta el mo<strong>de</strong>lo a<br />

los datos.<br />

j=1<br />

Queremos <strong>de</strong>terminar los estimadores ˆµi t<strong>al</strong>es que se<br />

minimice esta SSEc.<br />

Vamos a tener t ecuaciones norm<strong>al</strong>es, una para cada<br />

tratamiento, encontradas a partir <strong>de</strong> <strong>de</strong>rivar la SSEc con<br />

respecto a cada µi e igu<strong>al</strong>arlas a cero.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 27/112


Estimadores para el mo<strong>de</strong>lo completo<br />

Para una i:<br />

∂<br />

∂µi<br />

r<br />

(yij − µi) 2 = −2<br />

j=1<br />

igu<strong>al</strong>ando a cero<br />

r<br />

−2 (yij − ˆµi) = 0<br />

j=1<br />

r<br />

yij − r ˆµi = 0<br />

j=1<br />

ˆµi =<br />

r<br />

(yij − µi)<br />

j=1<br />

r<br />

j=1 yij<br />

r<br />

= ¯yi.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 28/112


Estimadores para el mo<strong>de</strong>lo completo<br />

Por lo tanto,<br />

Entonces,<br />

SSEc =<br />

ˆµi = ¯yi i = 1, . . .,t<br />

=<br />

=<br />

t<br />

i=1<br />

t<br />

i=1<br />

r<br />

(yij − ˆµi) 2<br />

j=1<br />

r<br />

j=1<br />

⎡<br />

t<br />

⎣<br />

i=1<br />

(yij − ¯yi.) 2<br />

r<br />

j=1<br />

(yij − ¯yi.) 2<br />

⎤<br />

⎦<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 29/112


Estimadores para el mo<strong>de</strong>lo completo<br />

La varianza muestr<strong>al</strong> <strong>de</strong>l i-ésimo tratamiento es:<br />

S 2 r j=1<br />

i =<br />

(yij − ¯yi.) 2<br />

r − 1<br />

es una estimador <strong>de</strong> σ 2 <strong>de</strong> los datos <strong>de</strong>l i-ésimo grupo.<br />

S 2 =<br />

<br />

t r<br />

i=1 j=1 (yij − ¯yi.) 2<br />

t(r − 1)<br />

= SSEc<br />

t(r − 1)<br />

es un estimador combinado (pooled) <strong>de</strong> σ 2 <strong>de</strong> todos los<br />

datos <strong>de</strong>l experimento.<br />

Es un buen estimador si po<strong>de</strong>mos hacer la suposición <strong>de</strong> que<br />

σ 2 es homogénea en todos los grupos.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 30/112


Estimadores para el mo<strong>de</strong>lo completo<br />

Para los datos <strong>de</strong>l ejemplo:<br />

tratamiento comerci<strong>al</strong> vacío mezcla CO2<br />

7.66 5.26 7.41 3.51<br />

6.98 5.44 7.33 2.91<br />

7.80 5.80 7.04 3.66<br />

ˆµi = ¯yi. 7.48 5.50 7.26 3.36<br />

r j=1 (yij − ¯yi.) 2<br />

0.3848 0.1512 0.0758 0.3150<br />

SSEc = 0.3848 + 0.1512 + 0.0758 + 0.3150 = 0.9268<br />

S 2 = SSEc<br />

t(r − 1)<br />

= 0.9268<br />

4(2)<br />

= 0.11585<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 31/112


Estimadores para el mo<strong>de</strong>lo reducido<br />

∂<br />

∂µ<br />

yij = µ + ǫij<br />

ǫij = yij − µ<br />

SSEr =<br />

t r<br />

t<br />

i=1<br />

i=1<br />

j=1<br />

ǫ 2 ij =<br />

t<br />

i=1<br />

r<br />

(yij − µ) 2 = −2<br />

j=1<br />

igu<strong>al</strong>ando a cero<br />

t r<br />

ˆµ =<br />

i=1<br />

j=1<br />

t<br />

i=1<br />

rtµ = y..<br />

ˆµ = y..<br />

rt<br />

r<br />

(yij − µ) 2<br />

j=1<br />

t<br />

i=1<br />

r<br />

j=1<br />

= ¯y..<br />

r<br />

(yij − µ)<br />

j=1<br />

yij<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 32/112


Estimadores para el mo<strong>de</strong>lo reducido<br />

Entonces,<br />

SSEr =<br />

Para el ejemplo,<br />

t<br />

i=1<br />

r<br />

(yij − ˆµ) 2 =<br />

j=1<br />

ˆµ = ¯y.. = 70.80<br />

12<br />

t<br />

i=1<br />

r<br />

j=1<br />

= 5.90<br />

(yij − ¯y..) 2<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 33/112


Mo<strong>de</strong>lo reducido Mo<strong>de</strong>lo completo<br />

yij = µ + ǫij yij = µi + ǫij<br />

Observado Estimado Diferencia Estimado Diferencia<br />

Tratamiento y ˆµ (yij − ˆµ) ˆµi (yij − ˆµi)<br />

Comerci<strong>al</strong> 7.66 5.90 1.76 7.48 0.18<br />

6.98 5.90 1.08 7.48 -0.50<br />

7.80 5.90 1.90 7.48 0.32<br />

Vacío 5.26 5.90 -0.64 5.50 -0.24<br />

5.44 5.90 -0.46 5.50 -0.06<br />

5.80 5.90 -0.10 5.50 0.30<br />

Mezcla 7.41 5.90 1.51 7.26 0.15<br />

7.33 5.90 1.43 7.26 0.07<br />

7.04 5.90 1.14 7.26 -0.22<br />

CO2 3.51 5.90 -2.39 3.36 0.15<br />

2.91 5.90 -2.99 3.36 -0.45<br />

3.66 5.90 -2.24 3.36 0.30<br />

SSEr = 33.7996 SSEc = 0.9268<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 34/112


<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />

Siguiendo con el ejemplo:<br />

Mo<strong>de</strong>lo completo yij = µi + ǫij SSEc = <br />

i<br />

Mo<strong>de</strong>lo reducido yij = µ + ǫij SSEr = <br />

i<br />

Diferencia:<br />

SSEr − SSEc = <br />

(yij − ¯y..) 2 − <br />

haciendo álgebra<br />

En el ejemplo: SSEr − SSEc = 32.8728<br />

i<br />

j<br />

i<br />

<br />

j (yij − ¯yi.) 2 = 0.9268<br />

<br />

j (yij − ¯y..) 2 = 33.7996<br />

j<br />

(yij − ¯yi.) 2<br />

= <br />

(¯yi. − ¯y..) 2 = r <br />

(¯yi. − ¯y..) 2<br />

i<br />

j<br />

i<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 35/112


<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />

SSEr − SSEc = SSt suma <strong>de</strong> cuadrados <strong>de</strong> tratamientos.<br />

Representa la reducción en SSE <strong>al</strong> haber incluido<br />

tratamientos en el mo<strong>de</strong>lo, también se le conoce como<br />

reducción en suma <strong>de</strong> cuadrados <strong>de</strong>bida a tratamientos.<br />

Llamaremos SStot<strong>al</strong> = SSEr ya que es la suma <strong>de</strong> cuadrados<br />

<strong>de</strong> las diferencias <strong>de</strong> cada observación y la media gener<strong>al</strong> ¯y..<br />

Entonces, tenemos la partición:<br />

SStot<strong>al</strong> = SSt + SSEc<br />

<br />

(yij − ¯y..) 2 = <br />

(¯yi. − ¯y..) 2 + <br />

i<br />

j<br />

i<br />

j<br />

i<br />

j<br />

(yij − ¯yi.) 2<br />

<strong>de</strong>sviación <strong>de</strong> la <strong>de</strong>sviación <strong>de</strong> la <strong>de</strong>sviación <strong>de</strong> la<br />

observación ij media <strong>de</strong>l grupo observación ij<br />

con respecto a con respecto a con respecto a<br />

la media gener<strong>al</strong> la media gener<strong>al</strong> la media <strong>de</strong> su grupo<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 36/112


<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />

<br />

(yij − ¯y..) 2 = <br />

[(yij − ¯yi.) + (¯yi. − ¯y..)] 2<br />

i<br />

j<br />

i<br />

j<br />

= <br />

(yij − ¯yi.) 2 + <br />

(¯yi. − ¯y..) 2<br />

i<br />

j<br />

−2 <br />

(yij − ¯yi.)(¯yi. − ¯y..)<br />

<br />

(yij − ¯yi.)(¯yi. − ¯y..) = <br />

(¯yi. − ¯y..) <br />

i<br />

j<br />

i<br />

j<br />

i<br />

i<br />

j<br />

j<br />

(yij − ¯yi.)<br />

= <br />

(¯yi. − ¯y..)(yi. − r¯yi.) = 0<br />

i<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 37/112


<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />

Grados <strong>de</strong> libertad. Representan el número <strong>de</strong> piezas <strong>de</strong><br />

información in<strong>de</strong>pendientes en las sumas <strong>de</strong> cuadrados.<br />

En gener<strong>al</strong>, es el número <strong>de</strong> observaciones menos el número<br />

<strong>de</strong> parámetros estimados <strong>de</strong> los datos.<br />

Sea n = rt, el tamaño <strong>de</strong> muestra tot<strong>al</strong>.<br />

Así, SStot<strong>al</strong> = t i<br />

µ, tiene n − 1 g.l.<br />

SSE = t<br />

i<br />

r<br />

j (yij − ¯y..) 2 don<strong>de</strong> ¯y.. es el estimador <strong>de</strong><br />

r<br />

j (yij − ¯yi.) 2 se estimaron t parámetros<br />

(µ1, µ2, . . .,µt) por lo tanto tiene n − t g.l.<br />

SSt = SStot<strong>al</strong> − SSE = (n − 1) − (n − t) = t − 1 g.l.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 38/112


Tabla <strong>de</strong> Análisis <strong>de</strong> Varianza<br />

ANOVA<br />

F.V. g.l. SS CM<br />

Tratamientos t − 1 SSt CMt = SSt/t − 1<br />

Error n − t SSE CME = SSE/n − t = ˆσ 2<br />

Tot<strong>al</strong> n − 1 SStot<strong>al</strong><br />

Se pue<strong>de</strong> <strong>de</strong>mostrar que:<br />

E (CME) = σ 2<br />

E (CMt) = σ 2 + 1<br />

t − 1<br />

t<br />

r(µi − ¯µ) 2 ; ¯µ = <br />

µi/t<br />

i=1<br />

i<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 39/112


Tabla <strong>de</strong> Análisis <strong>de</strong> Varianza<br />

Si suponemos ǫij ∼ NID(0, σ 2 ) i = 1, . . .,t j = 1, . . .,r<br />

en el mo<strong>de</strong>lo completo yij = µi + ǫij<br />

Entonces, yij ∼ NID(µi, σ 2 ).<br />

Se pue<strong>de</strong> <strong>de</strong>mostrar que:<br />

SStot<strong>al</strong><br />

σ 2<br />

SSE<br />

σ 2<br />

=<br />

=<br />

<br />

i<br />

<br />

j (yij − ¯y..) 2<br />

σ 2<br />

<br />

i j (yij − ¯yi.) 2<br />

σ2 ∼ χ 2 n−1<br />

∼ χ 2 n−t<br />

Cuando H0 : µ1 = µ2 = . . . = µt es cierta<br />

SSt<br />

=<br />

σ2 <br />

i r(¯yi. − ¯y..) 2<br />

σ 2<br />

∼ χ 2 t−1<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 40/112


Tabla <strong>de</strong> Análisis <strong>de</strong> Varianza<br />

Por el Teorema <strong>de</strong> Cochran (Montgomery, 2001, pág. 69), SSt<br />

y SSE son in<strong>de</strong>pendientes, por lo tanto cuando H0 es cierta,<br />

F0 = SSt/σ 2 (t − 1)<br />

SSE/σ 2 (n − t)<br />

= CMt<br />

CME<br />

∼ Ft−1,n−t<br />

A<strong>de</strong>más, E (CMt) = σ 2 + θ 2 t = σ 2 cuando θ 2 t = 0 que es<br />

cuando H0 es cierta. Es <strong>de</strong>cir,<br />

E (CMt) = E (CME) cuando H0 es cierta<br />

E (CMt) > E (CME) cuando H0 no es cierta<br />

Entonces, si CMt > CME, o sea, v<strong>al</strong>ores gran<strong>de</strong>s <strong>de</strong> F0<br />

llevan a rech<strong>azar</strong> la hipótesis nula H0 : µ1 = µ2 = . . . = µt.<br />

Por lo tanto, la región <strong>de</strong> rechazo es:<br />

F0 > F α t−1,n−t<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 41/112


Tabla <strong>de</strong> Análisis <strong>de</strong> Varianza<br />

ANOVA<br />

F.V. g.l. SS CM F E(CM)<br />

Tratamientos t − 1 SSt CMt = SSt<br />

t−1<br />

Error n − t SSE CME = SSE<br />

n−t<br />

Tot<strong>al</strong> n − 1 SStot<strong>al</strong><br />

SSt =<br />

SSE =<br />

SStot<strong>al</strong> =<br />

t<br />

r (¯yi. − ¯y..) 2<br />

i=1<br />

t<br />

i=1<br />

t<br />

i=1<br />

r<br />

j=1<br />

r<br />

j=1<br />

(yij − ¯yi.) 2<br />

(yij − ¯y..) 2<br />

CMt<br />

CME σ 2 + θ 2 t<br />

σ 2<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 42/112


Tabla <strong>de</strong> Análisis <strong>de</strong> Varianza<br />

En el ejemplo <strong>de</strong> empacado <strong>de</strong> carne:<br />

F.V. g.l. SS CM F Pr > F<br />

trat 3 32.8728 10.958 94.55 0.000<br />

error 8 0.9268 0.1159<br />

tot<strong>al</strong> 11 33.7996<br />

Por lo tanto, se rechaza la hipótesis H0 : µ1 = µ2 = . . . = µ4,<br />

es <strong>de</strong>cir, hay <strong>al</strong>gún método <strong>de</strong> empaque que tiene diferente<br />

comportamiento en promedio.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 43/112


<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />

Se quieren comparar t niveles <strong>de</strong> un factor, lo que implica t<br />

tratamientos y se dispone <strong>de</strong> ni u.e. para el tratamiento i,<br />

i = 1, . . .,t. Hay dos situaciones:<br />

1. Los t tratamientos son escogidos específicamente por el<br />

investigador. En esta situación <strong>de</strong>seamos probar hipótesis<br />

acerca <strong>de</strong> las medias <strong>de</strong> los tratamientos y nuestras<br />

conclusiones se aplicarán solamente a los niveles <strong>de</strong>l<br />

factor consi<strong>de</strong>rados en el análisis. Las conclusiones no se<br />

pue<strong>de</strong>n exten<strong>de</strong>r a tratamientos similares que no fueron<br />

explícitamente consi<strong>de</strong>rados. Este es el mo<strong>de</strong>lo <strong>de</strong><br />

efectos fijos.<br />

2. Los t tratamientos son una muestra <strong>al</strong>eatoria <strong>de</strong> una<br />

población <strong>de</strong> tratamientos. En esta situación nos gustaría<br />

po<strong>de</strong>r exten<strong>de</strong>r las conclusiones (las cu<strong>al</strong>es están basadas<br />

en la muestra <strong>de</strong> tratamientos consi<strong>de</strong>rada) a todos los<br />

tratamientos <strong>de</strong> la población. Este es el mo<strong>de</strong>lo <strong>de</strong><br />

efectos <strong>al</strong>eatorios.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 44/112


<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, un factor<br />

A las cantida<strong>de</strong>s n1, n2, . . .,nt se les llama repeticiones <strong>de</strong><br />

cada tratamiento.<br />

Si ni = r ∀i se dice que el diseño es b<strong>al</strong>anceado.<br />

yij es la respuesta <strong>de</strong> la u.e. j <strong>de</strong>l tratamiento i,<br />

i = 1, . . .,t j = 1, . . .,ni.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 45/112


<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong><br />

Estructura <strong>de</strong> los datos.<br />

tratamientos<br />

1 2 3 ... t<br />

y11 y21 y31 ... yt1<br />

y12 y22 y32 ... yt2<br />

y13 y23 y33 ... yt3<br />

. . . ... .<br />

. . . ... .<br />

. . . ... .<br />

y1n1 y2n2 y3n3 ... ytnt<br />

y1. y2. y3. ... yt. tot<strong>al</strong>es<br />

¯y1. ¯y2. ¯y3. ... ¯yt. medias<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 46/112


<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong><br />

n =<br />

yi. =<br />

¯yi. =<br />

y.. =<br />

t<br />

i=1<br />

ni <br />

ni<br />

yij i = 1, . . .,t tot<strong>al</strong> tratamiento i<br />

j=1<br />

ni j=1 yij<br />

t<br />

i=1<br />

¯y.. = y..<br />

n<br />

ni<br />

ni <br />

j=1<br />

yij =<br />

i = 1, . . .,t media tratamiento i<br />

t<br />

yi. tot<strong>al</strong> <strong>de</strong> las observaciones<br />

i=1<br />

media gener<strong>al</strong><br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 47/112


<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong><br />

Se tienen t muestras <strong>al</strong>eatorias in<strong>de</strong>pendientes <strong>de</strong> tamaños<br />

n1, n2, . . .,nt respectivamente.<br />

y11, y12, . . .,y1n1 es una muestra <strong>al</strong>eatoria <strong>de</strong> N(µ1, σ 2 )<br />

y21, y22, . . .,y2n2 es una muestra <strong>al</strong>eatoria <strong>de</strong> N(µ2, σ 2 )<br />

yt1, yt2, . . .,ytnt es una muestra <strong>al</strong>eatoria <strong>de</strong> N(µt, σ 2 )<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 48/112


<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong><br />

Las observaciones en cada una <strong>de</strong> estas muestras se pue<strong>de</strong>n<br />

representar por el mo<strong>de</strong>lo line<strong>al</strong> simple<br />

yij = µi + ǫij i = 1, . . .,t j = 1, . . .,ni<br />

con ǫij error experiment<strong>al</strong> en la observación j-ésima <strong>de</strong>l<br />

tratamiento i-ésimo.<br />

Estamos suponiendo in<strong>de</strong>pen<strong>de</strong>ncia entre y <strong>de</strong>ntro <strong>de</strong> las<br />

muestras, es <strong>de</strong>cir, ǫij son in<strong>de</strong>pendientes y ǫij ∼ N(0, σ 2 ).<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 49/112


<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong><br />

Otra forma <strong>de</strong> verlo<br />

Como suponemos que las u.e. son homogéneas, es <strong>de</strong>cir, el<br />

promedio <strong>de</strong> respuesta <strong>de</strong> todas las u.e. es el mismo (µ) antes<br />

<strong>de</strong> aplicar los tratamientos, y si se observan en condiciones<br />

similares, las respuestas las po<strong>de</strong>mos mo<strong>de</strong>lar como<br />

yij = µ + ǫij<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 50/112


Mo<strong>de</strong>lo <strong>de</strong> efectos<br />

Entonces <strong>al</strong> aplicar el tratamiento i-ésimo a un grupo (<strong>de</strong><br />

tamaño ni) <strong>de</strong> u.e. se introduce un efecto (τi) <strong>de</strong> ese<br />

tratamiento en las variables por observar.<br />

El mo<strong>de</strong>lo se pue<strong>de</strong> escribir como:<br />

don<strong>de</strong><br />

Mo<strong>de</strong>lo <strong>de</strong> efectos<br />

yij = µ + τi + ǫij i = 1, . . .,t j = 1, . . .,ni<br />

µ es la media gener<strong>al</strong>, común a todas las u.e.<br />

τi es el efecto <strong>de</strong>l tratamiento i-ésimo<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 51/112


Mo<strong>de</strong>lo <strong>de</strong> efectos<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 52/112


Mo<strong>de</strong>lo <strong>de</strong> efectos<br />

El mo<strong>de</strong>lo <strong>de</strong> efectos implica que se empieza el experimento<br />

con u.e. con la misma capacidad <strong>de</strong> respuesta (µ) y con la<br />

misma varianza (σ 2 ).<br />

La aplicación <strong>de</strong> los tratamientos tiene el efecto <strong>de</strong> <strong>al</strong>terar las<br />

medias, que ahora son µi = µ + τi, pero supone que no se<br />

modifican las varianzas.<br />

En este caso, la hipótesis a probar es:<br />

H0 : τ1 = τ2 = . . . = τt = 0<br />

Ha : τi = 0 para <strong>al</strong> menos una i<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 53/112


Mo<strong>de</strong>lo <strong>de</strong> efectos<br />

Estimadores <strong>de</strong> mínimos cuadrados:<br />

∂<br />

∂µ<br />

∂<br />

∂τi<br />

yij = µ + τi + ǫij i = 1, . . .,t j = 1, . . .,ni<br />

SSE =<br />

t<br />

i=1<br />

ni <br />

j=1<br />

ǫ 2 ij =<br />

t ni <br />

(yij − µ − τi) 2<br />

i=1<br />

t ni <br />

(yij − µ − τi) 2 = −2<br />

i=1<br />

j=1<br />

t ni <br />

(yij − µ − τi) 2 = −2<br />

i=1<br />

j=1<br />

j=1<br />

t<br />

i=1<br />

ni <br />

j=1<br />

ni <br />

j=1<br />

(yij − µ − τi)<br />

(yij − µ − τi) i = 1, . . .,t<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 54/112


Mo<strong>de</strong>lo <strong>de</strong> efectos<br />

Igu<strong>al</strong>ando a cero:<br />

t<br />

i=1<br />

ni <br />

j=1<br />

n1 <br />

j=1<br />

n2 <br />

j=1<br />

nt <br />

j=1<br />

yij = nˆµ +<br />

t<br />

niˆτi<br />

i=1<br />

y1j = n1ˆµ + n1ˆτ1<br />

y2j = n2ˆµ + n2ˆτ2<br />

. . . . . .<br />

ytj = ntˆµ + ntˆτt<br />

Las ecuaciones norm<strong>al</strong>es no son line<strong>al</strong>mente in<strong>de</strong>pendientes,<br />

por lo tanto no hay una solución única. Esto ocurre porque el<br />

mo<strong>de</strong>lo <strong>de</strong> efectos está sobreparametrizado.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 55/112


Mo<strong>de</strong>lo <strong>de</strong> efectos<br />

Se aña<strong>de</strong> una ecuación line<strong>al</strong>mente in<strong>de</strong>pendiente:<br />

a) t<br />

i=1 ˆτi = 0<br />

b) ˆµ = 0<br />

c) ˆτ1 = 0<br />

ˆµ = ¯y..<br />

ˆτi = ¯yi. − ¯y.. i = 1, . . .,t<br />

ˆµ = 0<br />

ˆτi = ¯yi. i = 1, . . .,t<br />

ˆµ = ¯y1.<br />

ˆτi = ¯yi. − ¯y1. i = 2, . . .,t<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 56/112


Mo<strong>de</strong>lo <strong>de</strong> efectos<br />

Hay un número infinito <strong>de</strong> posibles restricciones que se<br />

pue<strong>de</strong>n usar para resolver las ecuaciones norm<strong>al</strong>es. Entonces<br />

Cuál usar?<br />

No importa ya que en cu<strong>al</strong>quier caso<br />

µ + τi = ¯yi.<br />

Aunque no po<strong>de</strong>mos obtener estimadores únicos <strong>de</strong> los<br />

parámetros <strong>de</strong>l mo<strong>de</strong>lo <strong>de</strong> efectos, po<strong>de</strong>mos obtener<br />

estimadores únicos <strong>de</strong> funciones <strong>de</strong> estos parámetros.<br />

A estas funciones se les llama funciones line<strong>al</strong>es<br />

line<strong>al</strong>mente estimables.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 57/112


<strong>Diseño</strong> <strong>completamente</strong> <strong>al</strong> <strong>azar</strong>, Tabla <strong>de</strong> ANOVA<br />

F.V. g.l. SS CM F E(CM)<br />

Tratamientos t − 1 SSt CMt = SSt<br />

t−1<br />

Error n − t SSE CME = SSE<br />

n−t<br />

Tot<strong>al</strong> n − 1 SStot<strong>al</strong><br />

SSt =<br />

SSE =<br />

SStot<strong>al</strong> =<br />

t<br />

ni (¯yi. − ¯y..) 2 =<br />

i=1<br />

t<br />

i=1<br />

t<br />

i=1<br />

ni <br />

j=1<br />

ni <br />

j=1<br />

(yij − ¯yi.) 2 =<br />

(yij − ¯y..) 2 =<br />

n =<br />

t<br />

i=1<br />

t<br />

i=1<br />

t<br />

i=1<br />

t<br />

i=1<br />

CMt<br />

CME σ2 +<br />

y 2 i.<br />

ni<br />

ni <br />

j=1<br />

ni <br />

j=1<br />

ni<br />

− y2 ..<br />

n<br />

y 2 ij −<br />

σ 2<br />

t<br />

i=1<br />

y 2 ij − y2 ..<br />

n<br />

2<br />

i ni(τi−¯τ)<br />

t−1<br />

y 2 i.<br />

ni<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 58/112


Interv<strong>al</strong>os <strong>de</strong> confianza<br />

ˆµi = ¯yi. S 2 ¯yi.<br />

= S2<br />

ni<br />

Como suponemos que<br />

entonces<br />

como estimamos la varianza:<br />

con S 2 = CME = ˆσ 2 S¯yi. =<br />

yij ∼ N µi, σ 2<br />

¯yi. ∼ N µi, σ 2 <br />

/ni<br />

¯yi. − µi<br />

S¯yi.<br />

∼ tn−t<br />

CME<br />

Por lo tanto, un interv<strong>al</strong>o <strong>de</strong>l (1 − α)100% <strong>de</strong> confianza para µi<br />

es<br />

¯yi. ± t 1−α/2<br />

n−t (S¯yi. )<br />

ni<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 59/112


Contrastes<br />

En el ejemplo <strong>de</strong>l empacado <strong>de</strong> carne teníamos:<br />

Comerci<strong>al</strong> Al vacío CO,O2,N CO2<br />

ˆµi = ¯yi. 7.48 5.50 7.26 3.36<br />

S 2 = CME = 0.116 con 8 g.l.<br />

Una vez que rechazamos la hipótesis H0 : µ1 = µ2 = µ3 = µ4<br />

Qué sigue?<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 60/112


Contrastes<br />

Se podrían contestar preguntas como:<br />

■ Es más efectiva la creación <strong>de</strong> una atmósfera artifici<strong>al</strong> que el<br />

aire ambiente con plástico para reducir el crecimiento <strong>de</strong><br />

bacterias?<br />

■ Son más efectivos los gases que el vacío?<br />

■ Es más efectivo el tratamiento <strong>de</strong> CO2 puro que la mezcla<br />

CO,O2 y N?<br />

Un contraste es una función line<strong>al</strong> <strong>de</strong> los parámetros µi<br />

<strong>de</strong>finido como<br />

C =<br />

t<br />

kiµi = k1µ1 + k2µ2 + . . . + ktµt<br />

i=1<br />

don<strong>de</strong> t<br />

i=1 ki = 0.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 61/112


Contrastes<br />

Los contrastes para las preguntas anteriores son:<br />

■ comerci<strong>al</strong> vs. atmósfera artifici<strong>al</strong><br />

■ vacío vs. gases<br />

C1 = µ1 − 1<br />

3 (µ2 + µ3 + µ4)<br />

C2 = µ2 − 1<br />

2 (µ3 + µ4)<br />

■ mezcla <strong>de</strong> gases vs. CO2 puro<br />

C3 = µ3 − µ4<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 62/112


Contrastes<br />

El estimador <strong>de</strong>l contraste<br />

C =<br />

t<br />

kiµi es Ĉ =<br />

i=1<br />

Si suponemos que<br />

entonces<br />

Por lo tanto,<br />

Ĉ =<br />

t<br />

kiˆµi =<br />

i=1<br />

yij ∼ N µi, σ 2<br />

¯yi. ∼ N µi, σ 2 <br />

/ni<br />

t<br />

<br />

t<br />

ki¯yi. ∼ N kiµi, σ 2<br />

i=1<br />

i=1<br />

t<br />

i=1<br />

t<br />

i=1<br />

ki<br />

ni<br />

ki¯yi.<br />

<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 63/112


Contrastes<br />

Ya que:<br />

V<br />

t<br />

i=1<br />

E<br />

ki¯yi.<br />

t<br />

<br />

ˆV<br />

i=1<br />

ki¯yi.<br />

=<br />

<br />

m.in<strong>de</strong>p<br />

<br />

Ĉ<br />

<br />

=<br />

t<br />

kiE (¯yi.) =<br />

i=1<br />

t<br />

k 2 i V (¯yi.) =<br />

i=1<br />

= ˆσ 2<br />

t<br />

i=1<br />

k 2 i<br />

ni<br />

t<br />

i=1<br />

= CME<br />

t<br />

i=1<br />

k 2 i<br />

t<br />

i=1<br />

σ 2<br />

ni<br />

kiµi<br />

k 2 i<br />

ni<br />

= σ 2<br />

t<br />

i=1<br />

k 2 i<br />

ni<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 64/112


Contrastes<br />

Entonces,<br />

t<br />

i=1 ki¯yi. − t<br />

i=1 kiµi<br />

<br />

CME t<br />

i=1 k2 i /ni<br />

∼ tg.l.error<br />

De aquí un interv<strong>al</strong>o <strong>de</strong>l 100(1 − α)% <strong>de</strong> confianza para el<br />

contraste C es:<br />

Ĉ ± t 1−α/2<br />

<br />

<br />

t<br />

CME g.l.error<br />

i=1<br />

k 2 i /ni<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 65/112


Contrastes<br />

A<strong>de</strong>más,<br />

Ĉ − C<br />

<br />

σ2 t i=1 k2 i /ni<br />

∼ N (0, 1)<br />

Si H0 : t<br />

i=1 kiµi = 0, es <strong>de</strong>cir, H0 : C = 0 es cierta, entonces,<br />

Sea<br />

entonces<br />

Ĉ 2<br />

σ 2 t<br />

i=1 k2 i /ni<br />

SSc =<br />

Ĉ 2<br />

∼ χ 2 1<br />

t<br />

i=1 k2 i /ni<br />

SSc/σ2 SSE/σ2 (n − t) = Ĉ2 / t i=1 k2 i /ni<br />

CME<br />

∼ F1,n−t<br />

Por lo tanto, para probar H0 : C = 0 se rechaza si Fc > F α 1,n−t<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 66/112


Contrastes<br />

El número <strong>de</strong> contrastes que se pue<strong>de</strong>n hacer es muy gran<strong>de</strong>,<br />

sin embargo, esta técnica tiene su mayor utilidad cuando se<br />

aplica a comparaciones planeadas antes <strong>de</strong> re<strong>al</strong>izar el<br />

experimento.<br />

Una clase <strong>de</strong> contrastes, conocida como Contrastes<br />

ortogon<strong>al</strong>es (como son los <strong>de</strong>l ejemplo anterior) tienen<br />

propieda<strong>de</strong>s especi<strong>al</strong>es con respecto a la partición <strong>de</strong> sumas<br />

<strong>de</strong> cuadrados y grados <strong>de</strong> libertad y con respecto a su relación<br />

entre ellos. La ortogon<strong>al</strong>idad implica que un contraste no<br />

aporta información acerca <strong>de</strong> otro.<br />

Dos contrastes, con coeficientes {ki}, {li} son ortogon<strong>al</strong>es si<br />

t<br />

i=1<br />

kili<br />

ni<br />

= 0<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 67/112


Contrastes<br />

Para t tratamientos existe un conjunto <strong>de</strong> t − 1 contrastes<br />

ortogon<strong>al</strong>es, los cu<strong>al</strong>es hacen una partición <strong>de</strong> la suma <strong>de</strong><br />

cuadrados <strong>de</strong> tratamientos en t − 1 componentes<br />

in<strong>de</strong>pendientes, cada uno con 1 g.l. Por lo tanto las pruebas<br />

re<strong>al</strong>izadas con contrastes ortogon<strong>al</strong>es son in<strong>de</strong>pendientes.<br />

En el ejemplo anterior, los contrastes son ortogon<strong>al</strong>es.<br />

k1 k2 k3 k4<br />

C1 1 -1/3 -1/3 -1/3<br />

C2 0 1 -1/2 -1/2<br />

C3 0 0 1 -1<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 68/112


ANOVA<br />

La tabla <strong>de</strong> ANOVA incorporando las pruebas <strong>de</strong> hipótesis <strong>de</strong><br />

los 3 contrastes es:<br />

F.V. g.l. SS CM F Pr > F<br />

trat 3 32.8728 10.958 94.55 0.000<br />

C1 1 10.01 10.01 86.29 0.000<br />

C2 1 0.07 0.07 0.62 0.453<br />

C3 1 22.82 22.82 196.94 0.000<br />

error 8 0.9268 0.1159<br />

tot<strong>al</strong> 11 33.7996<br />

Se rechaza H0 : µ1 = µ2 = µ3 = µ4<br />

Se rechaza H01 : µ1 = 1<br />

3 (µ2 + µ3 + µ4)<br />

No se rechaza H02 : µ2 = 1<br />

2 (µ3 + µ4)<br />

Se rechaza H03 : µ3 = µ4<br />

SSC1 =<br />

1<br />

r<br />

2<br />

Ĉ1<br />

4 i=1 k2 i<br />

=<br />

(2.11) 2<br />

1 2 +3(−1/3) 2<br />

3<br />

= 4.4521<br />

0.4444<br />

= 10.01<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 69/112


Otro ejemplo<br />

En un experimento se van a comparar los % <strong>de</strong> carbohidratos<br />

en cuatro marcas <strong>de</strong> pan, para lo cu<strong>al</strong> se van a hacer 18<br />

<strong>de</strong>terminaciones: 5 en la marca A, 3 en la B, 4 en la C y 6 en<br />

la D.<br />

En este caso, cada marca <strong>de</strong> pan es un tratamiento (t = 4) y<br />

se tienen n1 = 5, n2 = 3, n3 = 4, n4 = 6. Para obtener las<br />

respuestas se tomarán muestras <strong>al</strong>eatorias <strong>de</strong> los tamaños ni<br />

especificados <strong>de</strong> cada marca y se harán <strong>de</strong>terminaciones <strong>de</strong><br />

los porcentajes mediante un procedimiento (hasta don<strong>de</strong> sea<br />

posible) idéntico en las 18 u.e.<br />

Note que en este ejemplo no estamos en libertad <strong>de</strong> asignar<br />

las u.e. a los tratamientos, ya que las poblaciones (las 4<br />

marcas) existen in<strong>de</strong>pendientemente <strong>de</strong> la acción <strong>de</strong>l<br />

experimentador. No obstante lo anterior, basta que las<br />

muestras <strong>al</strong>eatorias <strong>de</strong> las 4 poblaciones sean in<strong>de</strong>pendientes<br />

para que el análisis bajo el mo<strong>de</strong>lo que se propone sea válido.<br />

Este es un estudio observacion<strong>al</strong>, no experiment<strong>al</strong>.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 70/112


Otro ejemplo<br />

Tratamiento (marca)<br />

A B C D<br />

63 60 59 70<br />

68 65 66 69<br />

71 61 58 62<br />

70 59 71<br />

69 70<br />

66<br />

ni 5 3 4 6<br />

yi. 341 186 242 408<br />

¯yi. 68.2 62.0 60.5 68.0<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 71/112


Otro ejemplo<br />

Pruebe la hipótesis <strong>de</strong> igu<strong>al</strong>dad <strong>de</strong> medias<br />

H0 : µ1 = µ2 = µ3 = µ4.<br />

Conteste las siguientes preguntas:<br />

■ Son diferentes en promedio los porcentajes <strong>de</strong><br />

carbohidratos en las marcas B y C?<br />

■ Es diferente el porcentaje <strong>de</strong> carbohidratos <strong>de</strong> la marca A <strong>al</strong><br />

promedio <strong>de</strong> las marcas C y D?<br />

■ Suponga que las marcas A y B están hechas con harina<br />

integr<strong>al</strong> y las marcas C y D con harina blanca. El promedio<br />

<strong>de</strong>l porcentaje <strong>de</strong> carbohidratos <strong>de</strong> las marcas A y B es igu<strong>al</strong><br />

<strong>al</strong> promedio <strong>de</strong> C y D?<br />

Hacerlo con SPSS, JMP, STATA<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 72/112


Comparaciones múltiples<br />

En muchas situaciones prácticas, se <strong>de</strong>sea comparar pares <strong>de</strong><br />

medias. Po<strong>de</strong>mos <strong>de</strong>terminar cuáles medias difieren probando<br />

las diferencias entre todos los pares <strong>de</strong> medias <strong>de</strong><br />

tratamientos.<br />

Es <strong>de</strong>cir, estamos interesados en contrastes <strong>de</strong> la forma<br />

Γ = µi − µj ∀i = j<br />

Lo primero que se nos viene a la mente es hacer una prueba t<br />

para cada par <strong>de</strong> medias, es <strong>de</strong>cir, probar<br />

H0 : µi = µj<br />

Ha : µi = µj ∀i = j<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 73/112


Comparaciones múltiples<br />

Si suponemos varianzas igu<strong>al</strong>es, se tiene la estadística <strong>de</strong><br />

prueba<br />

tc = ¯yi. − ¯yj.<br />

sp<br />

1<br />

ni<br />

+ 1<br />

nj<br />

y se rechaza H0 <strong>al</strong> nivel <strong>de</strong> significancia α si<br />

tc ≤ t α/2<br />

ni+nj−2 ó tc ≥ t 1−α/2<br />

ni+nj−2<br />

Esto es equiv<strong>al</strong>ente a <strong>de</strong>cir que se rechaza H0 si<br />

o equiv<strong>al</strong>ente a<br />

|tc| = |¯yi. − ¯yj.|<br />

sp<br />

1<br />

ni<br />

+ 1<br />

nj<br />

|¯yi. − ¯yj.| > t 1−α/2<br />

ni+nj−2 sp<br />

> t 1−α/2<br />

ni+nj−2<br />

<br />

1<br />

ni<br />

+ 1<br />

nj<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 74/112


Comparaciones múltiples<br />

Esta prueba conocida como Diferencia Mínima Significativa<br />

(DMS ó LSD) en el contexto <strong>de</strong> ANOVA, lo que hace es<br />

comparar el v<strong>al</strong>or absoluto <strong>de</strong> la diferencia <strong>de</strong> cada par <strong>de</strong><br />

medias con DMS:<br />

Si<br />

|¯yi. − ¯yj.| > DMS = t 1−α/2<br />

glerror<br />

se rechaza H0 : µi = µj.<br />

<br />

CME<br />

1<br />

ni<br />

+ 1<br />

<br />

nj<br />

CME es el cuadrado medio <strong>de</strong>l error que es una estimación<br />

pon<strong>de</strong>rada <strong>de</strong> la varianza basada en t estimaciones <strong>de</strong> la<br />

varianza.<br />

El utilizar este procedimiento no es conveniente por que el<br />

nivel <strong>de</strong> significancia glob<strong>al</strong>, es <strong>de</strong>cir, para el conjunto <strong>de</strong> todas<br />

las pruebas, resulta muy superior <strong>al</strong> nivel <strong>de</strong> significancia (α)<br />

planeado.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 75/112


Comparaciones múltiples<br />

Por ejemplo, si se tienen 4 medias <strong>de</strong> tratamientos, entonces<br />

se tienen <br />

4<br />

2<br />

= 4!<br />

2!2!<br />

= 6<br />

pares a comparar, es <strong>de</strong>cir, 6 pruebas <strong>de</strong> hipótesis a re<strong>al</strong>izar,<br />

con lo que se pue<strong>de</strong>n cometer 0, 1, 2, 3, 4, 5, ó 6 errores Tipo I,<br />

si todas las medias son igu<strong>al</strong>es.<br />

Se <strong>de</strong>fine otra forma <strong>de</strong> error tipo I basado en los riesgos<br />

acumulados asociados a la familia <strong>de</strong> pruebas bajo<br />

consi<strong>de</strong>ración.<br />

Este es el error tipo I <strong>de</strong>l experimento αE que es el riesgo <strong>de</strong><br />

cometer el error tipo I <strong>al</strong> menos una vez.<br />

La probabilidad <strong>de</strong> error tipo I <strong>de</strong>l experimento pue<strong>de</strong><br />

ev<strong>al</strong>uarse para una familia <strong>de</strong> pruebas in<strong>de</strong>pendientes.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 76/112


Comparaciones múltiples<br />

Sin embargo, todas las pruebas a pares usando la DMS no<br />

son in<strong>de</strong>pendientes, puesto que el CME es el mismo en cada<br />

una <strong>de</strong> las estadísticas <strong>de</strong> prueba y el numerador contiene las<br />

mismas medias en varias <strong>de</strong> las estadísticas <strong>de</strong> prueba.<br />

Aún así, se pue<strong>de</strong> ev<strong>al</strong>uar el límite superior <strong>de</strong> la probabilidad<br />

<strong>de</strong> error tipo I <strong>de</strong>l experimento, suponiendo n pruebas<br />

in<strong>de</strong>pendientes.<br />

Suponga que la H0 es cierta para cada una <strong>de</strong> las n = t<br />

2<br />

pruebas y que son in<strong>de</strong>pendientes.<br />

Sea αc = P(error tipo I) en una sola prueba (comparación)<br />

con (1 − αc) = P(<strong>de</strong>cisión correcta).<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 77/112


Comparaciones múltiples<br />

La probabilidad <strong>de</strong> cometer x errores tipo I está dada por la<br />

distribución binomi<strong>al</strong> como:<br />

P(X = x) =<br />

<br />

n<br />

α<br />

x<br />

x c(1 − αc) n−x<br />

P(X = x) =<br />

n!<br />

(n − x)!x! αx c(1 − αc) n−x x = 0, 1, 2, . . .,n<br />

La probabilidad <strong>de</strong> no cometer ningún error tipo I es<br />

P(X = 0) = (1 − αc) n<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 78/112


Comparaciones múltiples<br />

La probabilidad <strong>de</strong> cometer <strong>al</strong> menos 1 error tipo I es<br />

P(X ≥ 1) = 1 − P(X = 0) = 1 − (1 − αc) n<br />

es <strong>de</strong>cir, la máxima probabilidad <strong>de</strong> cometer <strong>al</strong> menos un error<br />

tipo I entre las n comparaciones es:<br />

αE = 1 − (1 − αc) n<br />

αc = 1 − (1 − αE) 1/n<br />

<strong>de</strong> aquí<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 79/112


Comparaciones múltiples<br />

# <strong>de</strong> pruebas αE cuando αc cuando<br />

in<strong>de</strong>p. n αc = 0.05 αE = 0.05<br />

1 0.05 0.05<br />

2 0.098 0.025<br />

3 0.143 0.017<br />

4 0.185 0.013<br />

5 0.226 0.010<br />

10 0.401 0.005<br />

Por el razonamiento anterior es que han surgido una serie <strong>de</strong><br />

pruebas <strong>de</strong> diferentes autores para hacer comparaciones<br />

múltiples tratando <strong>de</strong> mantener la<br />

P(error tipo I <strong>de</strong>l experimento) = α<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 80/112


Bonferroni<br />

αE ≤ nαc<br />

n comparaciones, la igu<strong>al</strong>dad se dá cuando las pruebas son<br />

in<strong>de</strong>pendientes.<br />

Entonces,<br />

αc = αE/n<br />

Si queremos αE = 0.05 entonces, αc = 0.05/n y se hacen las<br />

pruebas t para los pares <strong>de</strong> medias con un nivel <strong>de</strong><br />

significancia αc en cada una <strong>de</strong> ellas.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 81/112


Tukey<br />

Conocida como la prueba <strong>de</strong> la Diferencia Mínima Significativa<br />

Honesta (DMSH)<br />

DMSH = q α <br />

CME<br />

t,glerror<br />

si ni = r ∀i<br />

r<br />

DMSH = q α <br />

CME 1<br />

t,glerror +<br />

2 ni<br />

1<br />

<br />

nj<br />

Si |¯yi. − ¯yj.| > DMSH se rechaza H0 : µi = µj.<br />

q α ν1,ν2<br />

se obtiene <strong>de</strong> las "tablas <strong>de</strong> rangos estu<strong>de</strong>ntizados".<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 82/112


Tukey<br />

Para el ejemplo <strong>de</strong>l empaque <strong>de</strong> carne:<br />

Comerci<strong>al</strong> Al vacío CO,O2,N CO2<br />

¯yi. 7.48 5.50 7.26 3.36<br />

S 2 = CME = 0.116 con 8g.l. t = 4, r = 3<br />

DMSH = q 0.05<br />

4,8<br />

0.116<br />

3<br />

|¯y1. − ¯y2.| = 1.98 ∗∗<br />

|¯y1. − ¯y3.| = 0.22<br />

|¯y1. − ¯y4.| = 4.12 ∗∗<br />

|¯y2. − ¯y3.| = 1.76 ∗∗<br />

|¯y2. − ¯y4.| = 2.14 ∗∗<br />

|¯y3. − ¯y4.| = 3.90 ∗∗<br />

= (4.53)(0.197) = 0.891<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 83/112


Stu<strong>de</strong>nt-Newman-Keuls (SNK)<br />

Se c<strong>al</strong>cula un conjunto <strong>de</strong> v<strong>al</strong>ores críticos<br />

don<strong>de</strong> q α p,f<br />

kp = q α p,fS¯yi.<br />

p = 2, 3, . . .,t<br />

es el percentil 1 − α <strong>de</strong> la distribución <strong>de</strong>l rango<br />

estu<strong>de</strong>ntizado para el número p <strong>de</strong> medias involucradas en la<br />

comparación y f g.l. <strong>de</strong>l error, y S¯yi. =<br />

Para el ejemplo <strong>de</strong> la carne empacada:<br />

CME<br />

r<br />

p 2 3 4<br />

q .05<br />

p,8 3.26 4.04 4.53<br />

kp 0.642 0.796 0.892<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 84/112


Stu<strong>de</strong>nt-Newman-Keuls (SNK)<br />

Comerci<strong>al</strong> Al vacío CO,O2,N CO2<br />

¯yi. 7.48 5.50 7.26 3.36<br />

Medias or<strong>de</strong>nadas:<br />

¯y4. = 3.36 ¯y2. = 5.50 ¯y3. = 7.26 ¯y1. = 7.48<br />

|¯y4. − ¯y1.| = 4.12 > k ∗∗<br />

4<br />

|¯y4. − ¯y3.| = 3.90 > k ∗∗<br />

3<br />

|¯y4. − ¯y2.| = 2.14 > k ∗∗<br />

2<br />

|¯y2. − ¯y1.| = 1.98 > k ∗∗<br />

3<br />

|¯y2. − ¯y3.| = 1.76 > k ∗∗<br />

2<br />

|¯y3. − ¯y1.| = 0.22 < K2(N.S.)<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 85/112


Duncan<br />

Es similar a la <strong>de</strong> SNK. Los promedios <strong>de</strong> los t tratamientos se<br />

or<strong>de</strong>nan en forma ascen<strong>de</strong>nte y el error estándar <strong>de</strong> cada<br />

promedio se <strong>de</strong>termina con<br />

S¯yi. =<br />

<br />

CME<br />

si ni = r ∀i<br />

r<br />

Para muestras <strong>de</strong> diferente tamaño, se reemplaza la r por la<br />

media armónica (nh) <strong>de</strong> los {ni}<br />

nh =<br />

t<br />

t<br />

i=1<br />

1<br />

ni<br />

<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 86/112


Duncan<br />

De las tablas <strong>de</strong> Duncan <strong>de</strong> rangos significativos se obtienen<br />

los v<strong>al</strong>ores <strong>de</strong> rα p,f para p = 2, 3, . . .,t.<br />

p es el número <strong>de</strong> medias involucradas en la comparación, α<br />

es el nivel <strong>de</strong> significancia y f los grados <strong>de</strong> libertad <strong>de</strong>l error.<br />

Se c<strong>al</strong>culan<br />

Rp = r α p,fS¯yi.<br />

p = 2, 3, . . .,t<br />

Para el ejemplo <strong>de</strong> la carne empacada:<br />

p 2 3 4<br />

r .05<br />

p,8 3.26 3.39 3.47<br />

Rp 0.642 0.668 0.684<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 87/112


Duncan<br />

Comerci<strong>al</strong> Al vacío CO,O2,N CO2<br />

¯yi. 7.48 5.50 7.26 3.36<br />

Medias or<strong>de</strong>nadas:<br />

¯y4. = 3.36 ¯y2. = 5.50 ¯y3. = 7.26 ¯y1. = 7.48<br />

|¯y4. − ¯y1.| = 4.12 > R ∗∗<br />

4<br />

|¯y4. − ¯y3.| = 3.90 > R ∗∗<br />

3<br />

|¯y4. − ¯y2.| = 2.14 > R ∗∗<br />

2<br />

|¯y2. − ¯y1.| = 1.98 > R ∗∗<br />

3<br />

|¯y2. − ¯y3.| = 1.76 > R ∗∗<br />

2<br />

|¯y3. − ¯y1.| = 0.22 < R2(N.S.)<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 88/112


Dunnett<br />

Para comparar las medias <strong>de</strong> los tratamientos con la media <strong>de</strong>l<br />

tratamiento control.<br />

Suponga que el tratamiento t es el control, queremos probar<br />

las hipótesis<br />

H0 : µi = µt<br />

H0 : µi = µt se rechaza si<br />

Ha : µi = µt i = 1, 2, . . .,t − 1<br />

|¯yi. − ¯yt.| > D = dα(t − 1, glerror)<br />

CME<br />

con dα(k, ν) es el percentil 1 − α <strong>de</strong> las tablas <strong>de</strong> Dunnett.<br />

Para el ejemplo <strong>de</strong> la carne empacada, el tratamiento 1 es el<br />

control.<br />

Comerci<strong>al</strong> Al vacío CO,O2,N CO2<br />

¯yi. 7.48 5.50 7.26 3.36<br />

r<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 89/112


Dunnett<br />

d0.05,3,8 = 2.42<br />

<br />

CME<br />

D = 2.42 = 0.477<br />

r<br />

|¯y2. − ¯y1.| = 1.98 > D ∗∗<br />

|¯y3. − ¯y1.| = 0.22 < D(N.S.)<br />

|¯y4. − ¯y1.| = 4.12 > D ∗∗<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 90/112


Scheffé<br />

Scheffé (1953) propuso un método para probar todos los<br />

posibles contrastes.<br />

Consi<strong>de</strong>re cu<strong>al</strong>quier contraste<br />

C =<br />

t<br />

kiµi estimado con Ĉ =<br />

i=1<br />

con error estándar<br />

SC =<br />

<br />

<br />

t<br />

CME i=1<br />

t<br />

i=1<br />

ki¯yi.<br />

La hipótesis nula pra el contraste H0 : C = 0 se rechaza si<br />

don<strong>de</strong><br />

S(αE) = SC<br />

|C| > S(αE)<br />

k 2 i<br />

ni<br />

<br />

<br />

(t − 1)F αE<br />

t−1,g.l.error<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 91/112


Análisis <strong>de</strong> residu<strong>al</strong>es<br />

Tenemos el mo<strong>de</strong>lo<br />

Suposiciones:<br />

■ errores norm<strong>al</strong>es<br />

■ in<strong>de</strong>pendientes<br />

■ varianza constante<br />

yij = µi + ǫij ó yij = µ + τi + ǫij<br />

ǫij ∼ NID 0, σ 2<br />

La prueba F <strong>de</strong>l análisis <strong>de</strong> varianza es robusta a f<strong>al</strong>ta <strong>de</strong><br />

norm<strong>al</strong>idad.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 92/112


Análisis <strong>de</strong> residu<strong>al</strong>es<br />

Si los errores experiment<strong>al</strong>es están correlacionados, el error<br />

estándar estará m<strong>al</strong> estimado. La in<strong>de</strong>pen<strong>de</strong>ncia se justifica<br />

<strong>al</strong>eatorizando las u.e. a los tratamientos en experimentos y<br />

seleccionando muestras <strong>al</strong>eatorias en estudios<br />

observacion<strong>al</strong>es.<br />

Si no hay homogeneidad <strong>de</strong> varianzas el estimador <strong>de</strong> σ 2 es<br />

m<strong>al</strong>o, aunque se ha visto en estudios que si el diseño es<br />

b<strong>al</strong>anceado no efecta mucho. También si los tamaños <strong>de</strong><br />

muestra mayores correspon<strong>de</strong>n a las poblaciones con mayor<br />

varianza.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 93/112


Análisis <strong>de</strong> residu<strong>al</strong>es, Norm<strong>al</strong>idad<br />

Residu<strong>al</strong>es<br />

eij = yij − ˆyij<br />

ˆyij = µ + τi = ˆµi = ¯yi.<br />

eij = yij − ¯yi.<br />

■ Prueba no parámetrica ( Kolmogorov-Smirnov )<br />

■ Histograma (muestras gran<strong>de</strong>s)<br />

■ gráfica en papel norm<strong>al</strong><br />

■ análisis <strong>de</strong> residu<strong>al</strong>es estandarizados para <strong>de</strong>tectar outliers.<br />

Si ǫij ∼ N(0, σ2 ) entonces ǫij−0<br />

∼ N(0, 1). Sean<br />

σ<br />

dij = eij<br />

√ , esperamos que:<br />

CME<br />

68% <strong>de</strong> los residu<strong>al</strong>es estandarizados estén entre -1 y 1<br />

95 % estén entre -2 y 2<br />

Virtu<strong>al</strong>mente todos estén entre -3 y 3.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 94/112


Análisis <strong>de</strong> residu<strong>al</strong>es, Homogeneidad <strong>de</strong> varianzas<br />

Prueba <strong>de</strong> Bartlett<br />

Estadística <strong>de</strong> Prueba:<br />

U = 1<br />

C<br />

H0 : σ 2 1 = σ 2 2 = . . . = σ 2 t<br />

Ha : no H0<br />

<br />

don<strong>de</strong> ˆσ 2 = <br />

C = 1 +<br />

(n − t)ln(ˆσ 2 ) − <br />

i<br />

(ni − 1)ˆσ 2 i<br />

n − t<br />

1<br />

3(t − 1)<br />

<br />

i<br />

i<br />

(ni − 1)ln(ˆσ 2 i )<br />

ˆσ 2 i = <br />

1<br />

ni − 1<br />

j<br />

− 1<br />

n − t<br />

<br />

(yij − ¯yi.) 2<br />

ni − 1<br />

H0 se rechaza si U > χ 2 α,t−1 (prueba sensible a f<strong>al</strong>ta <strong>de</strong><br />

norm<strong>al</strong>idad)<br />

<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 95/112


Análisis <strong>de</strong> residu<strong>al</strong>es, Homogeneidad <strong>de</strong> varianzas<br />

Prueba <strong>de</strong> Levene<br />

Se c<strong>al</strong>cula<br />

dij = |yij − ˜yi.| i = 1, . . .,t j = 1, . . .,ni<br />

don<strong>de</strong> ˜yi. es la mediana <strong>de</strong> las observaciones en el<br />

tratamiento i.<br />

Se ev<strong>al</strong>úa si el promedio <strong>de</strong> estas observaciones dij es igu<strong>al</strong><br />

para todos los tratamientos, es <strong>de</strong>cir, se hace un ANOVA para<br />

probar igu<strong>al</strong>dad <strong>de</strong> medias <strong>de</strong> dij.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 96/112


Prueba <strong>de</strong> Welch<br />

La prueba F usu<strong>al</strong> es robusta ante heteroscedasticidad<br />

(varianzas diferentes) si los tamaños <strong>de</strong> muestra son muy<br />

parecidos o, si los tamaños <strong>de</strong> muestra más gran<strong>de</strong>s<br />

correspon<strong>de</strong>n a las poblaciones con varianzas más gran<strong>de</strong>s.<br />

Sin embargo, se han construído <strong>al</strong>gunas procedimientos <strong>de</strong><br />

prueba <strong>de</strong> igu<strong>al</strong>dad <strong>de</strong> medias (H0 : µ1 = µ2 = . . . = µt) como<br />

por ejemplo el <strong>de</strong>sarrollado por Welch, conocido como la<br />

prueba <strong>de</strong> Welch.<br />

Sean Wi = ni/ˆσ 2 i ¯y ∗ = <br />

i<br />

Wi¯yi./<br />

i Wi y<br />

don<strong>de</strong> W. = <br />

i Wi.<br />

Λ = <br />

i<br />

(1 − Wi/W.) 2<br />

ni − 1<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 97/112


Prueba <strong>de</strong> Welch<br />

Entonces<br />

Fc =<br />

<br />

i Wi (¯yi.−¯y ∗ ) 2<br />

t−1<br />

1 + 2(t − 2)Λ/(t 2 − 1)<br />

tiene aproximadamente una distribución F con<br />

ν1 = t − 1 y ν2 = (t 2 − 1)/3Λ grados <strong>de</strong> libertad.<br />

H0 : µ1 = µ2 = . . . = µt se rechaza <strong>al</strong> nivel <strong>de</strong> significancia α si<br />

Fc > F α ν1,ν2 .<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 98/112


Transformaciones<br />

Se utilizan las transformaciones para cambiar la esc<strong>al</strong>a <strong>de</strong> las<br />

observaciones para que se cumplan las suposiciones <strong>de</strong>l<br />

mo<strong>de</strong>lo line<strong>al</strong> y dar inferencias válidas <strong>de</strong>l análisis <strong>de</strong> varianza.<br />

Cuando las transformaciones son necesarias, se hace el<br />

análisis y se hacen las inferencias en la esc<strong>al</strong>a transformada<br />

pero se presentan tablas <strong>de</strong> medias en la esc<strong>al</strong>a <strong>de</strong> medición<br />

origin<strong>al</strong>.<br />

1. Distribución Poisson. Mediciones que son conteos<br />

(número <strong>de</strong> plantas en cierta área, insectos en plantas,<br />

acci<strong>de</strong>ntes por unidad <strong>de</strong> tiempo) tienen distribución Poisson.<br />

La transformación x = √ y + a, a ∈ ℜ es la a<strong>de</strong>cuada.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 99/112


Transformaciones<br />

2. Distribución binomi<strong>al</strong>. Observaciones <strong>de</strong>l número <strong>de</strong><br />

éxitos en n ensayos in<strong>de</strong>pendientes tiene distribución binomi<strong>al</strong><br />

(proporción <strong>de</strong> semillas germinadas, proporción <strong>de</strong> plantas<br />

con flores en un transecto). ˆπ = y/n<br />

La transformación x = sin −1√ ˆπ es la a<strong>de</strong>cuada.<br />

Las transformaciones <strong>de</strong>l tipo potencia <strong>al</strong>teran la simetría o<br />

asimetría <strong>de</strong> las distribuciones <strong>de</strong> las observaciones.<br />

Si suponemos que la <strong>de</strong>sviación estándar <strong>de</strong> y es proporcion<strong>al</strong><br />

a <strong>al</strong>guna potencia <strong>de</strong> la media, es <strong>de</strong>cir,<br />

σy ∝ µ β<br />

Una transformación <strong>de</strong> las observaciones, <strong>de</strong>l estilo:<br />

x = y p<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 100/112


Transformaciones<br />

Da una relación<br />

σx ∝ µ p+β−1<br />

Si p = 1 − β entonces la <strong>de</strong>sviación estándar <strong>de</strong> la variable<br />

transformada x será constante, ya que p + β − 1 = 0 y σx ∝ µ 0 .<br />

La transformación <strong>de</strong> Box-Cox<br />

x = (y p − 1)/p p = 1<br />

x = logey p = 1<br />

El estimador <strong>de</strong> p se encuentra maximizando<br />

L(p) = − 1<br />

2 loge [CME(p)]<br />

don<strong>de</strong> CME(p) es el cuadrado medio <strong>de</strong>l error <strong>de</strong>l análisis <strong>de</strong><br />

varianza usando la transformación x = (y p − 1)/p para el v<strong>al</strong>or<br />

dado p.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 101/112


Transformaciones<br />

Se <strong>de</strong>termina CME(p) para un conjunto <strong>de</strong> v<strong>al</strong>ores <strong>de</strong> p, se<br />

grafica CME(p) vs. p y se toma el v<strong>al</strong>or <strong>de</strong> p que correspon<strong>de</strong><br />

<strong>al</strong> v<strong>al</strong>or mínimo <strong>de</strong> CME(p).<br />

JMP c<strong>al</strong>cula la transformación <strong>de</strong> Box-Cox, da una gráfica <strong>de</strong> p<br />

vs. CME y da la opción <strong>de</strong> guardar los datos transformados<br />

en el archivo.<br />

La dificultad <strong>de</strong> utilizar esta transformación es la interpretación.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 102/112


Ejemplo<br />

Los siguientes datos son el número <strong>de</strong> errores en un examen<br />

<strong>de</strong> sujetos bajo la influencia <strong>de</strong> dos drogas. El grupo 1 es un<br />

grupo control (sin droga), a los sujetos <strong>de</strong>l grupo 2 se les dió la<br />

droga 1, a los <strong>de</strong>l grupo 3 la droga 2 y a los <strong>de</strong>l grupo 4 las dos<br />

drogas.<br />

Grupo 1 Grupo 2 Grupo 3 Grupo 4<br />

(sin droga) (droga 1) (droga 2) (dos drogas)<br />

1 12 12 13<br />

8 10 4 14<br />

9 13 11 14<br />

9 13 7 17<br />

4 12 8 11<br />

1 10 10 14<br />

1 12 13<br />

5 14<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 103/112


Ejemplo<br />

Correr el ejemplo con SPSS y JMP.<br />

1. Probar homogeneidad <strong>de</strong> varianzas. (Bartlett y Levene)<br />

2. Hacer prueba <strong>de</strong> Welch<br />

3. Probar con <strong>al</strong>gunas transformaciones, checando<br />

norm<strong>al</strong>idad y homogeneidad <strong>de</strong> varianzas<br />

ej2_1_messy.sav<br />

ej2_1_messy.jmp<br />

ej2_1_messy.txt<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 104/112


Relación entre Regresión y ANOVA<br />

Cu<strong>al</strong>quier mo<strong>de</strong>lo <strong>de</strong> ANOVA se pue<strong>de</strong> escribir como un<br />

mo<strong>de</strong>lo <strong>de</strong> regresión line<strong>al</strong>.<br />

Suponga el ejemplo <strong>de</strong> la carne empacada<br />

tratamiento comerci<strong>al</strong> vacío mezcla CO2<br />

7.66 5.26 7.41 3.51<br />

6.98 5.44 7.33 2.91<br />

7.80 5.80 7.04 3.66<br />

Un diseño <strong>completamente</strong> <strong>al</strong> <strong>azar</strong> con un solo factor (método<br />

<strong>de</strong> empacado) con 4 niveles (4 tratamientos) y 3 repeticiones<br />

en cada tratamiento (diseño b<strong>al</strong>anceado).<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 105/112


Relación entre Regresión y ANOVA<br />

Mo<strong>de</strong>lo ANOVA <strong>completamente</strong> <strong>al</strong> <strong>azar</strong> un solo factor<br />

b<strong>al</strong>anceado:<br />

yij = µi + ǫij = µ + τi + ǫij<br />

El mo<strong>de</strong>lo <strong>de</strong> regresión equiv<strong>al</strong>ente es:<br />

yij = β0 + β1x1j + β2x2j + β3x3j + ǫij<br />

<br />

i = 1, 2, 3, 4<br />

j = 1, 2, 3<br />

<br />

i = 1, 2, 3, 4<br />

j = 1, 2, 3<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 106/112


Relación entre Regresión y ANOVA<br />

Don<strong>de</strong> las variables x1j, x2j, x3j están <strong>de</strong>finidas como:<br />

x1j =<br />

x2j =<br />

x3j =<br />

<br />

<br />

<br />

1 si la observación j es <strong>de</strong>l tratamiento 1<br />

0 en otro caso<br />

1 si la observación j es <strong>de</strong>l tratamiento 2<br />

0 en otro caso<br />

1 si la observación j es <strong>de</strong>l tratamiento 3<br />

0 en otro caso<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 107/112


Relación entre Regresión y ANOVA<br />

La relación entre los parámetros <strong>de</strong>l mo<strong>de</strong>lo ANOVA y el<br />

mo<strong>de</strong>lo <strong>de</strong> regresión es:<br />

Si la observación viene <strong>de</strong>l tratamiento 1, entonces<br />

x1j = 1, x2j = 0, x3j = 0 y el mo<strong>de</strong>lo <strong>de</strong> regresión es<br />

y1j = β0 + β1(1) + β2(0) + β3(0) + ǫ1j<br />

y el mo<strong>de</strong>lo ANOVA es:<br />

Por lo tanto:<br />

= β0 + β1 + ǫ1j<br />

y1j = µ1 + ǫ1j = µ + τ1 + ǫ1j<br />

β0 + β1 = µ1 = µ + τ1<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 108/112


Relación entre Regresión y ANOVA<br />

Similarmente, para las observaciones <strong>de</strong>l tratamiento 2<br />

y2j = β0 + β1(0) + β2(1) + β3(0) + ǫ2j<br />

= β0 + β2 + ǫ2j<br />

y la relación entre los parámetros es:<br />

βo + β2 = µ2 = µ + τ2<br />

Lo mismo para las observaciones <strong>de</strong>l tratamiento 3<br />

y3j = β0 + β1(0) + β2(0) + β3(1) + ǫ3j<br />

= β0 + β3 + ǫ3j<br />

y la relación entre los parámetros es:<br />

βo + β3 = µ3 = µ + τ3<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 109/112


Relación entre Regresión y ANOVA<br />

Fin<strong>al</strong>mente, consi<strong>de</strong>re las observaciones <strong>de</strong>l tratamiento 4,<br />

para las cu<strong>al</strong>es el mo<strong>de</strong>lo <strong>de</strong> regresión es:<br />

y4j = β0 + β1(0) + β2(0) + β3(0) + ǫ4j<br />

= β0 + ǫ4j<br />

entonces β0 = µ4 = µ + τ4<br />

Por lo tanto,<br />

β0 = µ4<br />

β1 = µ1 − µ4<br />

β2 = µ2 − µ4<br />

β3 = µ3 − µ4<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 110/112


Relación entre Regresión y ANOVA<br />

Entonces, para probar la hipótesis H0 : µ1 = µ2 = µ3 = µ4<br />

tendríamos que probar H0 : β1 = β2 = β3 = 0, lo cu<strong>al</strong> se pue<strong>de</strong><br />

hacer con cu<strong>al</strong>quier paquete <strong>de</strong> cómputo estadístico.<br />

Para el ejemplo <strong>de</strong> la carne empacada:<br />

tratamiento y x1 x2 x3<br />

1 7.66 1 0 0<br />

1 6.98 1 0 0<br />

1 7.80 1 0 0<br />

2 5.26 0 1 0<br />

2 5.44 0 1 0<br />

2 5.80 0 1 0<br />

3 7.41 0 0 1<br />

3 7.33 0 0 1<br />

3 7.04 0 0 1<br />

4 3.51 0 0 0<br />

4 2.91 0 0 0<br />

4 3.66 0 0 0<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 111/112


Relación entre Regresión y ANOVA<br />

Si pedimos una regresión y = β0 + β1x1 + β2x2 + β3x3 + ǫ y<br />

pedimos una tabla <strong>de</strong> análisis <strong>de</strong> varianza <strong>de</strong>l mo<strong>de</strong>lo<br />

yij = µ + τi + ǫij las dos tablas ANOVA son idénticas.<br />

<strong>Diseño</strong> <strong>de</strong> experimentos – p. 112/112

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!