1 Sobre los modelos lineales mixtos Ejemplo: Recuperación de ...

Sobre los modelos lineales mixtos 

Ejemplo: Recuperación de infarto. Para estudiar las diferencias entre dos procedimientos 

diferentes de recuperación de pacientes de un infarto, se consideraron dos grupos 

experimentales en sendos hospitales, de 8 pacientes cada uno. La variable respuesta es el 

índice de Bartel, que varía entre 0 y 100, y que constituye una medida de la habilidad 

funcional con la que se valoran diferentes capacidades, de forma que valores más altos se 

corresponden con una mejor situación del paciente. De cada uno de los 16 pacientes se 

dispone de su respuesta cada semana a lo largo de 5 semanas consecutivas. Datos reducidos 

de Dobson… 

(Datos en recuperainfarto.txt y soluciones en recuperainfarto.pdf) 

Los valores de las respuesta son las puntuaciones que, de cada individuo, o cluster, obtenemos 

semanalmente durante cinco semanas consecutivas: 

Si introducimos como variable explicativa la semana, x, podríamos ajustar un modelo lineal de 

la forma: 

Considerados los cluster, individuos en el ejemplo, este modelo lineal podría ser expresado 

como sigue: 

Cluster 1: 

Cluster i-ésimo: 

equivalentemente, podríamos describirlo para cualquier observación en i, j, como: 

donde las g son variables indicadoras de pertenencia al correspondiente cluster. 

Matricialmente: 

Esta formulación, sencilla y adecuada en muchos contextos, puede ser inadecuada por 

diferentes razones: 

a) Las observaciones repetidas en cada grupo o cluster, no son necesariamente 

independientes. 

b) Con frecuencia, no solo se quieren tomar decisiones respecto de los grupos o cluster 

observados, sino que se quiere valorar el efecto de las variables explicativas en una 

población de la que los grupos son una muestra. 

c) Puede ser de interés valorar la variación del efecto de x de un grupo a otro. 

d) La estimación del efecto medio de las variables explicativas en cada grupo puede ser 

muy deficiente si no se recoge la posible variabilidad entre los grupos. 

Por estas razones puede ser muy conveniente la consideración del cluster o grupo como una 

variable aleatoria, o la introducción en el modelo de efectos aleatorios. 

1

Un modelo lineal mixto sencillo es un modelo con intercept aleatorio: 

El modelo de regresión lineal (recta de regresión) presenta ahora un intercept aleatorio 

normal, centrado en el antiguo intercept fijo. El intercept aleatorio toma un valor diferente en 

cada cluster. El nuevo modelo de “efectos mixtos” incorpora un nuevo parámetro fijo: la 

varianza del efecto aleatorio. La varianza del efecto aleatorio recoge la variabilidad entre los 

diferentes individuos, mientras que la varianza del error recoge la variabilidad dentro de cada 

individuo no explicada por el modelo. Si la varianza del efecto aleatorio fuera nula, el modelo 

coincidiría con el modelo de efectos fijos o de regresión lineal. 

Una mayor complejidad, pero mejor ajuste a nuestras observaciones, pueden venir dados por 

un modelo en el que intercept y pendiente sean aleatorios: 

Si intercept y pendiente aleatorios fueran incorrelados el modelo sería menos complejo, con 

solo cinco parámetros libres. 

Si utilizamos variables indicadoras de pertenencia a los clusters, podemos emplear la 

expresión siguiente: 

En forma matricial: 

En general: 

2

En un modelo mixto las observaciones del mismo cluster no son independientes. 

Supongamos un modelo de intercept aleatorio: 

Entonces: 

Si el modelo tiene intercept y pendiente aleatorios, 

Entonces: 

(llamada correlación intraclase) 

Nota: La formulación de los modelos de intercept aleatorio y de intercept y pendiente 

aleatorios de esta página, permite ver la flexibilidad del modelo mixto, utilizable en situaciones 

en las que podamos modelar los efectos fijos (o media marginal de la respuesta) mediante 

expresiones no lineales. 

3

Expresión general del modelo lineal mixto 

Un tipo de modelos mixtos generales admiten la siguiente expresión 

donde los efectos fijos, o media marginal de la respuesta, pueden corresponder a una función 

lineal de ciertos parámetros, o a otras relaciones no lineales, que recojan la pertenencia de 

dicha respuesta media marginal a cierto dominio del espacio. 

Supondremos que: 

Distribución condicional de la respuesta, dado el efecto aleatorio: 

Distribuciones marginales: 

En un modelo con intercept aleatorio: 

La covarianza marginal de la respuesta es la matriz de bloques V: 

donde 

Estimación de los parámetros del modelo lineal mixto 

Si la media marginal de la respuesta es lineal, entonces 

La estimación puede hacerse vía EMV, pero esto puede producir estimadores con un sesgo 

elevado. Una alternativa es la estimación REML (máximo verosímil restringida). 

Si la covarianza V fuera conocida, el EMV de los parámetros betas, sería el estimador de 

mínimos cuadrados generalizados: 

Pero, en general, V no es conocida. Su estimación puede llevarse a cabo mediante el método 

REML. Para ello se consideran un conjunto de contrasts C=HY con H ortogonal a X, de modo 

que 

4

Se considera entonces una “verosimilitud restringida” basada en C, que no depende de los 

parámetros beta. Un algoritmo tipo scoring permite estimar las componentes de la varianza, 

dando lugar de esa forma al estimador REML de V. “Enchufado” dicho estimador en la 

expresión anterior, se obtienen los estimadores REML de los beta, y su covarianza asintótica: 

A la hora de hacer inferencias sobre los beta, cabe señalar que en muchas ocasiones los 

errores estándar extraídos de los elementos diagonales de la matriz anterior son una 

subestimación de los verdaderos. Por ello se sugiere usar un estadístico t o F a la hora de 

valorar si algún efecto fijo es nulo o calcular un IC para alguno de los beta, lo cual se ve 

dificultado a su vez por la determinación de los gdl efectivos. 

Las inferencias sobre las componentes de la varianza asociadas a los efectos aleatorios, tipo 

wald, basadas en la normalidad asintótica de sus estimadores pueden ser muy deficientes. 

La comparación de modelos vía deviance (TRV) permite contrastar la nulidad de efectos 

aleatorios, en presencia de ciertos efectos fijos. Pero el problema radica en que nos 

encontramos en la frontera del espacio paramétrico cuando nos interesa contrastar si la 

varianza de cierto efecto aleatorio es cero. Esto cuestiona el uso de las distribuciones límite 

chi-cuadrado, con las que generalmente obtendríamos p-valores muy conservadores (mayores 

de lo que deberían ser). Una alternativa la proporcionan los tests bootstrap paramétricos. 

La comparación de dos modelos anidados que solo difieran en los efectos fijos debería llevarse 

a cabo después de ajustar ambos modelos mediante EMV (no REML). Si ajustamos REML 

estamos usando una verosimilitud de una “respuesta” transformada diferente en cada modelo, 

y eso dificulta la comparación. Pero la aproximación chi-cuadrado del correspondiente TRV es 

generalmente muy deficiente, siendo aplicable un test bootstrap paramétrico, para obtener 

una aproximación al p-valor. 

Predicción de los efectos aleatorios 

Además del interés en la estimación de los parámetros fijos del modelo, que incluye las 

componentes de la varianza, a menudo es también de interés la predicción de los efectos 

aleatorios o estimación de los “parámetros aleatorios”. 

La consideración del modelo mixto en dos niveles: 1) distribución condicional de la respuesta 

dado el efecto aleatorio y 2) distribución marginal del efecto aleatorio, permite definir una 

verosimilitud extendida conjunta, también llamada jerárquica, de los parámetros fijos y de los 

aleatorios. La maximización de esta verosimilitud jerárquica en los parámetros aleatorios, da 

lugar a la obtención de los estimadores BLUP, dependientes de los parámetros fijos del 

modelo. Si en los BLUP “enchufamos” estimadores de los parámetros fijos se tienen los 

predictores o estimadores empíricos EBLUP, que son los que generalmente se utilizan como 

predictores de los efectos aleatorios, y que permiten obtener los correspondientes EBLUP de 

las respuestas medias en cada cluster. 

Otra forma de obtener los BLUP consiste en considerar que, si bien los efectos aleatorios no 

son observables, pueden ser predichos a través de su valor esperado condicionado por lo 

observado, esto es, condicionado por la respuesta observada. Este método descansa en 

algunos resultados acerca de la normal multivariante. Veamos: 

Dado un vector aleatorio normal, no es difícil obtener la distribución condicional de una 

componente del vector por otra, tal y como se expone en los siguientes resultados: 

5

Supongamos que X es un vector aleatorio con covarianza d.p. 

entonces 

Si además la distribución conjunta es normal, esto es: 

entonces, 

independiente de X2. 

Como consecuencia, se tiene la siguiente distribución condicional: 

Aplicaremos este último resultado para obtener la media condicional de los efectos aleatorios 

por el valor observado de la respuesta. 

La distribución conjunta de respuesta y efectos aleatorios es normal: 

Con la notación empleada anteriormente, para las distribuciones condicionada y marginales, 

podemos identificar: 

Por consiguiente, 

Podemos ahora aplicar el resultado sobre la distribución condicional de dos elementos de la 

normal multivariente, de modo que: 

lo que constituye el mejor predictor lineal insesgado, BLUP, de los efectos aleatorios. 

6

La estimación de los parámetros, en general desconocidos, en el BLUP, nos proporciona el 

predictor empírico, EBLUP, de los efectos aleatorios: 

La predicción de la respuesta media condicionada por los efectos aleatorios viene dada 

entonces por: 

Se puede ver que cada componente es una combinación lineal convexa de la respuesta 

observada y del efecto fijo estimado. 

En el caso de un modelo con intercept aleatorio, el estimador BLUP del efecto aleatorio es: 

Se puede ver que el BLUP produce un “shrinkage” del efecto cluster hacia la media 0. 

La predicción de la respuesta media en cada cluster viene dada por la combinación lineal 

convexa siguiente: 

Si la varianza del efecto aleatorio es grande respecto de la varianza del error, esto es, si la 

información de los datos sobre la media en cada cluster es alta, entonces el coeficiente de la 

media muestral del cluster es alto y por tanto la respuesta media predicha por el modelo está 

próxima a la media muestral del cluster. 

7

1 Sobre los modelos lineales mixtos Ejemplo: Recuperación de ...

Create successful ePaper yourself

Delete template?

Save as template?