30.06.2013 Views

Les Modèles à Effets Aléatoires - Christophe Genolini

Les Modèles à Effets Aléatoires - Christophe Genolini

Les Modèles à Effets Aléatoires - Christophe Genolini

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

<strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong><br />

Une introduction<br />

Lionel RIOU FRANÇA<br />

INSERM U669<br />

Septembre <br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

1 Préliminaires<br />

<strong>Effets</strong> Fixes<br />

<strong>Effets</strong> <strong>Aléatoires</strong><br />

2 Essais multicentriques<br />

Analyse Classique<br />

<strong>Effets</strong> aléatoires<br />

Efficacité homogène<br />

Efficacité hétérogène<br />

Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

3 Aspects calculatoires<br />

Estimation du modèle<br />

Inférence<br />

4 Mesures répétées<br />

Beat the Blues<br />

Modèle <strong>à</strong> effets aléatoires<br />

Modèle marginal<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Le modèle de régression linéaire<br />

<strong>Effets</strong> Fixes<br />

<strong>Effets</strong> <strong>Aléatoires</strong><br />

Il s’agit d’étudier la liaison statistique entre une variable<br />

quantitative continue Y et des variables explicatives X non<br />

aléatoires. Soit yi la réponse de l’individu i et xi les valeurs prises<br />

par les variables explicatives pour cet individu.<br />

La relation entre Y et X peut s’écrire sous la forme :<br />

yi = α + βxi + ɛi<br />

où ɛi est une variable aléatoire distribuée selon une loi normale<br />

d’espérance nulle : ɛi ↩→ N 0, σ 2<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

<strong>Les</strong> hypothèses du modèle<br />

<strong>Effets</strong> Fixes<br />

<strong>Effets</strong> <strong>Aléatoires</strong><br />

Homogénéité de la variance : <strong>Les</strong> erreurs ont la même variance<br />

σ 2 ,<br />

Linéarité : La moyenne de chaque distribution de Y, E(yi|xi),<br />

se situe sur une droite,<br />

Indépendance : <strong>Les</strong> erreurs sont indépendantes,<br />

<strong>Les</strong> erreurs ɛi sont distribuées selon une loi normale.<br />

On notera que les erreurs du modèle linéaire sont supposées être<br />

i.i.d. (indépendantes et identiquement distribuées), de loi normale.<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Violation des hypothèses<br />

<strong>Effets</strong> Fixes<br />

<strong>Effets</strong> <strong>Aléatoires</strong><br />

Cas où les erreurs ɛ ne sont pas i.i.d. :<br />

Processus d’échantillonage :<br />

essais multicentriques,<br />

cluster trials,<br />

données structurées (modèles multiniveaux) – ex : des classes<br />

dans des écoles dans des villes,<br />

. . .<br />

Méta-analyses : l’individu statistique est l’essai, pas les<br />

patients le composant.<br />

Données Longitudinales : plusieurs mesures, pour un même<br />

individu, <strong>à</strong> différents temps.<br />

On peut alors supposer que les erreurs issues de la même unité<br />

d’échantillonnage seront corrélées entre elles.<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Le modèle <strong>à</strong> intercept aléatoire<br />

<strong>Effets</strong> Fixes<br />

<strong>Effets</strong> <strong>Aléatoires</strong><br />

L’idée est de décomposer la variance. Pour chaque individu<br />

statistique i dans le groupe j :<br />

yij = α + βxi + ɛij + uj<br />

uj est l’effet aléatoire. On a ɛij ↩→ N 0, σ2 <br />

ɛ et uj ↩→ N 0, σ2 <br />

u .<br />

Var (yij) = Var (ui + ɛij) = σ2 u + σ2 ɛ .<br />

La corrélation entre deux individus i et k du même groupe j est<br />

alors de :<br />

Cor (uj + ɛij, uj + ɛkj) =<br />

σ2 u<br />

σ 2 ɛ + σ 2 u<br />

Il s’agit d’un coefficient de corrélation intra classe (ICC), qui<br />

mesure la part de variation résiduelle qui est due <strong>à</strong> la variation<br />

entre les groupes.<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Exemple d’application (Agresti)<br />

Analyse Classique<br />

<strong>Effets</strong> aléatoires<br />

Soit un essai clinique sur 8 centres comparant une crème<br />

antiseptique <strong>à</strong> un Placebo. Le critère de jugement est la guérison<br />

d’une infection.<br />

Réponse<br />

Centre Traitement Succès Echec<br />

1 Crème 11 25<br />

Placebo 10 27<br />

2 Crème 16 4<br />

Placebo 22 10<br />

3 Crème 14 5<br />

Placebo 7 12<br />

4 Crème 2 14<br />

Placebo 1 16<br />

5 Crème 6 11<br />

Placebo 0 12<br />

6 Crème 1 10<br />

Placebo 0 10<br />

7 Crème 1 4<br />

Placebo 1 8<br />

8 Crème 4 2<br />

Placebo 6 1<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Analyse Classique<br />

<strong>Effets</strong> aléatoires<br />

Exemple d’application : <strong>Les</strong> données<br />

> Succès Echecs Multi rm(Succès,Echecs)<br />

> Multi[1:4,]<br />

Centre Traitement Succès Echecs<br />

1 1 Crème 11 25<br />

2 1 Placebo 10 27<br />

3 2 Crème 16 4<br />

4 2 Placebo 22 10<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Analyse Classique<br />

<strong>Effets</strong> aléatoires<br />

Exemple d’application : Analyse classique<br />

Dans la plupart des essais cliniques publiés, on ignore totalement<br />

l’effet centre. Le modèle est logit (Pi) = α + βxi, où X est le<br />

traitement et P la probabilité de succès.<br />

> fitCl round(summary(fitCl)$coefficients,digits=4)<br />

Estimate Std. Error z value Pr(>|z|)<br />

(Intercept) -0.7142 0.1780 -4.0118 0.0001<br />

TraitementCrème 0.4040 0.2514 1.6071 0.1080<br />

> (icOR


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Hypothèses sous-jacentes<br />

Analyse Classique<br />

<strong>Effets</strong> aléatoires<br />

En ignorant l’appartenance des patients aux centres (analyse<br />

poolée), nous faisons l’hypothèse de l’homogénéité entre les<br />

centres :<br />

de l’effet du traitement,<br />

de la probabilité de guérison.<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Analyse Classique<br />

<strong>Effets</strong> aléatoires<br />

Test de Cochran-Mantel-Haenszel : Indépendance<br />

conditionnelle I<br />

Ce test permet de juger de l’effet du traitement,<br />

conditionnellement aux centres. Il faut commencer par faire une<br />

table de 8 tableaux de contingence, un par centre :<br />

> Multi2 for (i in 1:8) {<br />

+ b


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Analyse Classique<br />

<strong>Effets</strong> aléatoires<br />

Test de Cochran-Mantel-Haenszel : Indépendance<br />

conditionnelle II<br />

, , Centre = 1<br />

Réponse<br />

Traitement Succès Echec<br />

Placebo 11 25<br />

Crème 10 27<br />

, , Centre = 2<br />

Réponse<br />

Traitement Succès Echec<br />

Placebo 16 4<br />

Crème 22 10<br />

On peut ensuite procéder au test :<br />

> mantelhaen.test(Multi2,correct=FALSE)<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Analyse Classique<br />

<strong>Effets</strong> aléatoires<br />

Test de Cochran-Mantel-Haenszel : Indépendance<br />

conditionnelle III<br />

Mantel-Haenszel chi-squared test without continuity correction<br />

data: Multi2<br />

Mantel-Haenszel X-squared = 6.3841, df = 1, p-value = 0.01151<br />

alternative hypothesis: true common odds ratio is not equal to 1<br />

95 percent confidence interval:<br />

1.177590 3.869174<br />

sample estimates:<br />

common odds ratio<br />

2.134549<br />

Il s’agit d’un test d’indépendance conditionnelle. En l’occurence, de<br />

l’indépendance entre le traitement et la réponse,<br />

conditionnellement au centre.<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Analyse Classique<br />

<strong>Effets</strong> aléatoires<br />

Test de Cochran-Mantel-Haenszel : Indépendance<br />

conditionnelle IV<br />

On rejette ici l’hypothèse d’indépendance conditionnelle (la<br />

réponse dépend du traitement, connaissant le centre) et on estime<br />

<strong>à</strong> 2.13 l’OR commun <strong>à</strong> tous les centres (<strong>à</strong> comparer avec<br />

l’estimation initiale de 1.50, obtenue en ignorant les centres).<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Analyse Classique<br />

<strong>Effets</strong> aléatoires<br />

Approche par régression logistique I<br />

On peut également intégrer directement l’effet centre dans la<br />

régression :<br />

> fitCl2 round(summary(fitCl2)$coefficients,digits=4)<br />

Estimate Std. Error z value Pr(>|z|)<br />

(Intercept) -1.3220 0.3165 -4.1775 0.0000<br />

TraitementCrème 0.7769 0.3067 2.5333 0.0113<br />

Centre2 2.0554 0.4201 4.8929 0.0000<br />

Centre3 1.1529 0.4246 2.7155 0.0066<br />

Centre4 -1.4185 0.6636 -2.1376 0.0326<br />

Centre5 -0.5199 0.5338 -0.9740 0.3301<br />

Centre6 -2.1469 1.0614 -2.0228 0.0431<br />

Centre7 -0.7977 0.8149 -0.9789 0.3276<br />

Centre8 2.2079 0.7195 3.0687 0.0022<br />

L’effet du traitement devient significatif, l’OR commun est estimé<br />

<strong>à</strong> 2.17.<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Analyse Classique<br />

<strong>Effets</strong> aléatoires<br />

Approche par régression logistique II<br />

> drop1(fitCl2,test="Chisq")<br />

Single term deletions<br />

Model:<br />

cbind(Succès, Echecs) ~ Traitement + Centre<br />

Df Deviance AIC LRT Pr(Chi)<br />

9.746 66.136<br />

Traitement 1 16.415 70.805 6.669 0.009811 **<br />

Centre 7 90.960 133.350 81.214 7.788e-15 ***<br />

---<br />

Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1<br />

L’effet centre est significatif également.<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Analyse Classique<br />

<strong>Effets</strong> aléatoires<br />

L’effet du traitement est-il homogène ?<br />

Il est possible de calculer l’OR du traitement pour chacun des<br />

centres :<br />

> OR for (i in 1:8) {<br />

+ b


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

<strong>Les</strong> OR sont-ils homogènes ? I<br />

Analyse Classique<br />

<strong>Effets</strong> aléatoires<br />

Le test de Cochran-Mantel-Haenszel part du principe que dans<br />

chaque centre, l’effet du traitement est de même sens. On peut<br />

alternativement tester l’effet du traitement, en admettant que<br />

celui-ci puisse varier d’une strate <strong>à</strong> l’autre.<br />

> fitCl0 fitCl3 anova(fitCl0,fitCl3,test="Chisq")<br />

Analysis of Deviance Table<br />

Model 1: cbind(Succès, Echecs) ~ Centre<br />

Model 2: cbind(Succès, Echecs) ~ Traitement + Centre + Traitement:Centre<br />

Resid. Df Resid. Dev Df Deviance P(>|Chi|)<br />

1 8 16.4151<br />

2 0 4.984e-10 8 16.4151 0.0368<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

<strong>Les</strong> OR sont-ils homogènes ? II<br />

Analyse Classique<br />

<strong>Effets</strong> aléatoires<br />

Même en autorisant l’effet du traitement <strong>à</strong> varier d’un centre <strong>à</strong><br />

l’autre, on est amenés <strong>à</strong> rejetter l’hypothèse d’indépendance entre<br />

le traitement et la guérison.<br />

On peut tester formellement l’hypothèse d’homogénéité des OR <strong>à</strong><br />

partir du test de Woolf :<br />

> library(vcd)<br />

> woolf_test(Multi2)<br />

Woolf-test on Homogeneity of Odds Ratios (no 3-Way assoc.)<br />

data: Multi2<br />

X-squared = 5.818, df = 7, p-value = 0.5612<br />

L’hypothèse d’homogénéité des OR n’est pas rejettée.<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Limites de l’approche<br />

Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Analyse Classique<br />

<strong>Effets</strong> aléatoires<br />

<strong>Les</strong> analyses classiques permettent, en introduisant les centres<br />

comme variables explicatives et en autorisant des intéractions, de<br />

taiter le cas des essais multicentriques. Cependant :<br />

Lorsque le nombre de centres devient important, les introduire<br />

dans le modèle devient problématique,<br />

Puisqu’un centre sert de centre de référence, on ne connait<br />

pas les écarts de chaque centre <strong>à</strong> la moyenne,<br />

Le plus souvent, les centres participant <strong>à</strong> l’essai ne sont qu’un<br />

échantillon d’une population plus large de centres<br />

administrant le traitement, et on peut souhaiter des<br />

prédictions pour un centre n’ayant pas participé <strong>à</strong> l’essai,<br />

On aimerait pouvoir disposer d’une mesure d’hétérogénéité<br />

entre les centres.<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Approche alternative<br />

Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Analyse Classique<br />

<strong>Effets</strong> aléatoires<br />

Une approche possible est de penser que l’effet du traitement dans<br />

un centre particulier provient d’une distribution N µ, σ 2 , où µ est<br />

l’effet du traitement dans la population. Un tel modèle permet <strong>à</strong> la<br />

fois d’estimer l’effet du traitement dans la population, et la<br />

variabilité de cet effet d’un centre <strong>à</strong> l’autre. De plus, il permet<br />

d’inférer sur l’effet du traitement dans n’importe quel centre, pas<br />

seulement ceux échantillonnés.<br />

On se place alors dans le cadre d’un modèle <strong>à</strong> effets aléatoires.<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Le modèle <strong>à</strong> intercept aléatoire<br />

Analyse Classique<br />

<strong>Effets</strong> aléatoires<br />

Dans le cas de données binaires, le plus classique est le modèle<br />

logistique-normal : on ajoute un effet aléatoire distribué<br />

normalement.<br />

et<br />

logit (Pij) = α + βxij + uj(+ɛij)<br />

uj ↩→ N 0, σ 2 u<br />

Dans ce modèle, on a toujours un effet du traitement (β)<br />

homogène entre les centres, mais par contre la probabilité de<br />

succès peut varier d’un centre <strong>à</strong> l’autre. σ 2 u mesure l’hétérogénéité<br />

entre les centres par rapport <strong>à</strong> la probabilité de succès.<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Analyse Classique<br />

<strong>Effets</strong> aléatoires<br />

Exemple d’application : Intercept aléatoire I<br />

Il existe plusieurs fonctions dans R pour les modèles <strong>à</strong> effets<br />

aléatoires, nous utiliserons la plus classique.<br />

> library(lme4)<br />

> fitIA summary(fitIA)<br />

Generalized linear mixed model fit by the Laplace approximation<br />

Formula: cbind(Succès, Echecs) ~ Traitement + (1 | Centre)<br />

Data: Multi<br />

AIC BIC logLik deviance<br />

41.81 44.13 -17.91 35.81<br />

Random effects:<br />

Groups Name Variance Std.Dev.<br />

Centre (Intercept) 1.9313 1.3897<br />

Number of obs: 16, groups: Centre, 8<br />

Fixed effects:<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Analyse Classique<br />

<strong>Effets</strong> aléatoires<br />

Exemple d’application : Intercept aléatoire II<br />

Estimate Std. Error z value Pr(>|z|)<br />

(Intercept) -1.1965 0.5471 -2.187 0.0287 *<br />

TraitementCrème 0.7382 0.2963 2.491 0.0127 *<br />

---<br />

Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1<br />

Correlation of Fixed Effects:<br />

(Intr)<br />

TratmntCrèm -0.283<br />

Dans cette analyse, l’OR du traitement est de 2.09. La crème est<br />

significativement plus efficace que le placebo.<br />

<strong>Les</strong> résultats sont <strong>à</strong> comparer avec les estimations SAS : l’effet du<br />

traitement est estimé <strong>à</strong> ˆ β = 0, 739,sa variance <strong>à</strong> 0,300.<br />

Il est possible d’accéder <strong>à</strong> la fois aux effets fixes et aux effets<br />

aléatoires du modèle :<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Analyse Classique<br />

<strong>Effets</strong> aléatoires<br />

Exemple d’application : Intercept aléatoire III<br />

> fixef(fitIA)<br />

(Intercept) TraitementCrème<br />

-1.1964829 0.7381853<br />

> ranef(fitIA)<br />

$Centre<br />

(Intercept)<br />

1 -0.09974443<br />

2 1.84772369<br />

3 0.98968944<br />

4 -1.29268734<br />

5 -0.55773975<br />

6 -1.59634708<br />

7 -0.70286263<br />

8 1.73186555<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Analyse Classique<br />

<strong>Effets</strong> aléatoires<br />

Exemple d’application : Intercept aléatoire IV<br />

On voit que l’effet du traitement est homogène pour tous les<br />

centres, mais que l’intercept (permettant de calculer la probabilité<br />

d’efficacité) varie d’un centre <strong>à</strong> l’autre autour de sa moyenne, de<br />

-1.20.<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Analyse Classique<br />

<strong>Effets</strong> aléatoires<br />

Le modèle <strong>à</strong> intercept et coefficient aléatoire<br />

Si l’on veut modéliser l’hétérogénéité des OR, on peut rajouter un<br />

effet aléatoire au log-OR β :<br />

et<br />

logit (Pij) = α + uj + (β + bj) xij(+ɛij)<br />

uj ↩→ N 0, σ 2 u<br />

bj ↩→ N 0, σ 2 b<br />

Le log-OR dans chaque centre et donc distribué selon N β, σ2 <br />

b . σb<br />

mesure l’hétérogénéité des effets du traitement entre les centres.<br />

Dans ce modèle, on estime donc quatre paramètres : α, β, σu et<br />

σb.<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Analyse Classique<br />

<strong>Effets</strong> aléatoires<br />

Exemple d’application : Intercept et coefficient aléatoire I<br />

> fitICA summary(fitICA)<br />

Generalized linear mixed model fit by the Laplace approximation<br />

Formula: cbind(Succès, Echecs) ~ Traitement + (Traitement | Centre)<br />

Data: Multi<br />

AIC BIC logLik deviance<br />

45.27 49.13 -17.64 35.27<br />

Random effects:<br />

Groups Name Variance Std.Dev. Corr<br />

Centre (Intercept) 2.63348 1.62280<br />

TraitementCrème 0.22187 0.47103 -0.821<br />

Number of obs: 16, groups: Centre, 8<br />

Fixed effects:<br />

Estimate Std. Error z value Pr(>|z|)<br />

(Intercept) -1.3238 0.6329 -2.091 0.0365 *<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Analyse Classique<br />

<strong>Effets</strong> aléatoires<br />

Exemple d’application : Intercept et coefficient aléatoire II<br />

TraitementCrème 0.8872 0.3549 2.500 0.0124 *<br />

---<br />

Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1<br />

Correlation of Fixed Effects:<br />

(Intr)<br />

TratmntCrèm -0.616<br />

Dans cette analyse, l’OR du traitement est de 2.43. La crème est<br />

significativement plus efficace que le placebo.<br />

<strong>Les</strong> résultats sont <strong>à</strong> comparer avec les estimations SAS : l’effet du<br />

traitement est estimé <strong>à</strong> ˆβ = 0, 746,sa variance <strong>à</strong> 0,325. Dans SAS,<br />

on a ˆσb = 0, 15. Dans R, ce paramètre est de 0.47.<br />

Il est possible d’accéder <strong>à</strong> la fois aux effets fixes et aux effets<br />

aléatoires du modèle :<br />

> fixef(fitICA)<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Analyse Classique<br />

<strong>Effets</strong> aléatoires<br />

Exemple d’application : Intercept et coefficient aléatoire III<br />

(Intercept) TraitementCrème<br />

-1.3238063 0.8872237<br />

> ranef(fitICA)<br />

$Centre<br />

(Intercept) TraitementCrème<br />

1 0.07658463 -0.18062609<br />

2 2.07198963 -0.44586469<br />

3 1.04967323 -0.09818885<br />

4 -1.44424841 0.29276054<br />

5 -0.80278837 0.28367134<br />

6 -1.88365702 0.41815718<br />

7 -0.72790944 0.14970977<br />

8 2.10228450 -0.53952878<br />

Cette fois, <strong>à</strong> la fois l’intercept et le log-OR varient d’un centre <strong>à</strong><br />

l’autre.<br />

On peut prédire les OR pour chacun des centres :<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Analyse Classique<br />

<strong>Effets</strong> aléatoires<br />

Exemple d’application : Intercept et coefficient aléatoire IV<br />

> OR colnames(OR) rownames(OR) round(OR,digits=2)<br />

Centre 1 Centre 2 Centre 3 Centre 4 Centre 5 Centre 6 Centre 7 Centre 8<br />

Brut 1.19 1.82 4.8 2.29 Inf Inf 2.00 0.33<br />

EA 2.03 1.55 2.2 3.25 3.22 3.69 2.82 1.42<br />

Plus σb est proche de 0, moins il y a d’hétérogénéité entre les<br />

centres.<br />

Si σb = 0, l’OR estimé pour tous les centres sera le même.<br />

Si σb = ∞, il y a hétérogénéité maximale entre les centres, l’OR<br />

estimé sera celui calculé sur les données brutes.<br />

Ici, σb est plutôt faible, et les OR estimés par le modèle sont<br />

proches de l’OR global.<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Estimation du modèle<br />

Inférence<br />

Au commencement était l’ANOVA (Faraway) I<br />

Nous voulons savoir si la brillance du papier dépend de la machine<br />

l’ayant produit.<br />

> data(pulp,package="faraway")<br />

> summary(pulp)<br />

bright operator<br />

Min. :59.80 a:5<br />

1st Qu.:60.00 b:5<br />

Median :60.50 c:5<br />

Mean :60.40 d:5<br />

3rd Qu.:60.73<br />

Max. :61.00<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Estimation du modèle<br />

Inférence<br />

Au commencement était l’ANOVA (Faraway) II<br />

Nous avons donc une mesure quantitative et une variable<br />

qualitative <strong>à</strong> 5 facteurs, d’effectifs équilibrés. Le modèle s’écrit<br />

donc :<br />

yij = µ + αj + ɛij<br />

j désigne les opérateurs (j = 1, · · · , 4) et i les individus.<br />

les α et les ɛ ont tous deux pour moyenne 0, pour écart-type σα et<br />

σɛ.<br />

Pour obtenir ce modèle dans R, il faut contraindre le codage des<br />

opérateurs, de manière <strong>à</strong> ce que la somme des contrastes soit<br />

nulle :<br />

> op lmod summary(lmod)<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Estimation du modèle<br />

Inférence<br />

Au commencement était l’ANOVA (Faraway) III<br />

Df Sum Sq Mean Sq F value Pr(>F)<br />

operator 3 1.34000 0.44667 4.2039 0.02261 *<br />

Residuals 16 1.70000 0.10625<br />

---<br />

Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1<br />

> coef(lmod)<br />

(Intercept) operator1 operator2 operator3<br />

60.40 -0.16 -0.34 0.22<br />

> options(op)<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Estimation du modèle<br />

Inférence<br />

Au commencement était l’ANOVA (Faraway) IV<br />

On a µ = 60.40, α1 = −0.16. L’effet du quatrième opérateur se<br />

calcule en sachant que αj = 0.<br />

La variance résiduelle est de σ 2 ɛ = 0.106. L’effet de l’opérateur est<br />

significatif (p=0.023).<br />

À partir de ces résultats d’ANOVA, il est possible d’estimer<br />

manuellement la valeur de σα. On a en effet la propriété :<br />

σ 2 α =<br />

MSA − MSE<br />

n<br />

= 0.447 − 0.106<br />

5<br />

= 0.0682<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Modèle <strong>à</strong> effets aléatoires I<br />

Estimation du modèle<br />

Inférence<br />

Nous pouvons estimer directement le modèle <strong>à</strong> effets aléatoires :<br />

> mmod summary(mmod)<br />

Linear mixed model fit by REML<br />

Formula: bright ~ 1 + (1 | operator)<br />

Data: pulp<br />

AIC BIC logLik deviance REMLdev<br />

24.63 27.61 -9.313 16.64 18.63<br />

Random effects:<br />

Groups Name Variance Std.Dev.<br />

operator (Intercept) 0.06808 0.26092<br />

Residual 0.10625 0.32596<br />

Number of obs: 20, groups: operator, 4<br />

Fixed effects:<br />

Estimate Std. Error t value<br />

(Intercept) 60.4000 0.1494 404.2<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Modèle <strong>à</strong> effets aléatoires II<br />

Estimation du modèle<br />

Inférence<br />

On retombe sur des résultats très proches du modèle ANOVA (car<br />

effectifs équilibrés).<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Modèle <strong>à</strong> effets aléatoires III<br />

Estimation du modèle<br />

Inférence<br />

Par défaut, la méthode d’estimation est la REML (Restricted<br />

Maximum Likelihood), parce que la méthode du maximum de<br />

vraisemblance produit des estimations biaisées des écarts-type. Il<br />

est possible d’utiliser tout de même cette méthode :<br />

> smod summary(smod)<br />

Linear mixed model fit by maximum likelihood<br />

Formula: bright ~ 1 + (1 | operator)<br />

Data: pulp<br />

AIC BIC logLik deviance REMLdev<br />

22.51 25.5 -8.256 16.51 18.74<br />

Random effects:<br />

Groups Name Variance Std.Dev.<br />

operator (Intercept) 0.04575 0.21389<br />

Residual 0.10625 0.32596<br />

Number of obs: 20, groups: operator, 4<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Modèle <strong>à</strong> effets aléatoires IV<br />

Fixed effects:<br />

Estimate Std. Error t value<br />

(Intercept) 60.4000 0.1294 466.7<br />

Estimation du modèle<br />

Inférence<br />

On voit que l’estimation de σ 2 α est plus basse. Le biais dépend de<br />

la taille n des opérateurs.<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Test des effets fixes I<br />

Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Estimation du modèle<br />

Inférence<br />

Il n’est pas possible de faire un test du maximum de vraisemblance<br />

pour comparer deux modèles imbriqués en estimant les effets<br />

aléatoires par REML : cette méthode estime les effets aléatoires<br />

indépendamment des effets fixes, et une modification des effets<br />

fixes fait que les vraisemblances des deux modèles ne seront pas<br />

directement comparables.<br />

Il faut donc utiliser la méthode du maximum de vraisemblance<br />

pour faire ensuite des tests du rapport de vraisemblance. Ces tests<br />

auront tendance <strong>à</strong> produire des p-values trop faibles, et <strong>à</strong><br />

surestimer l’effet des variables explicatives. Il est possible de<br />

contourner le problème en utilisant le bootstrap.<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Test des effets fixes II<br />

Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Estimation du modèle<br />

Inférence<br />

<strong>Les</strong> tests F et t se font eux conditionnellement aux effets<br />

aléatoires, et supposent ceux-ci connus, et non estimés également<br />

<strong>à</strong> partir des données.<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Test des effets aléatoires<br />

Estimation du modèle<br />

Inférence<br />

Il s’agit de tester H0 : σ 2 = 0.<br />

Le test du rapport de vraisemblance, basé sur une distribution du<br />

χ 2 asymptotique, n’est valable que lorsque la valeur du paramètre<br />

testé se trouve <strong>à</strong> l’intérieur de l’espace des paramètres. En testant<br />

la valeur 0 pour une variance, ces conditions sont violées. Le test<br />

sera trop conservateur et produira en général des p-values plus<br />

importantes qu’elles ne le devraient. Une fois encore, on peut avoir<br />

recours au bootstrap.<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Application I<br />

Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Estimation du modèle<br />

Inférence<br />

Nous avons vu dans l’ANOVA que l’effet opérateur était significatif.<br />

Comment conclure <strong>à</strong> partir d’un modèle <strong>à</strong> effets aléatoires ?<br />

Pour employer des tests du maximum de vraisemblance, il ne faut<br />

pas employer l’estimation par REML. Il faut donc commencer par<br />

estimer le modèle nul :<br />

> nullmod ( s pchisq(s,1,lower=FALSE)<br />

[1] 0.1090199<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Application II<br />

Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Estimation du modèle<br />

Inférence<br />

La p-value est cette fois bien au dessus du seuil de 5 %. Nous<br />

pouvons opter pour une approche de bootstrap paramétrique. Nous<br />

cherchons <strong>à</strong> estimer la probabilité, si le modèle nul est correct,<br />

d’observer un rapport de vraisemblance d’au moins 2.57.<br />

Nous estimons donc des valeurs tirées du modèle nul :<br />

> y B lrstat for (i in 1:B) {<br />

+ y


Application III<br />

Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Estimation du modèle<br />

Inférence<br />

On peut s’intéresser <strong>à</strong> la distribution des statistiques de test :<br />

> hist(lrstat,probability=TRUE,main="")<br />

> lines(seq(0,6,by=0.01),dchisq(seq(0,6,by=0.01),1))<br />

> abline(v=s,col="red")<br />

> text(s,0.8,paste("LRT =",round(s,digits=4)),col="red",pos=4)<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Application IV<br />

Density<br />

0.0 0.5 1.0 1.5<br />

Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

LRT = 2.5684<br />

lrstat<br />

Estimation du modèle<br />

Inférence<br />

0 2 4 6 8<br />

Une large proportion de statistiques de test sont proches de 0 :<br />

> mean(lrstat


Application V<br />

Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Estimation du modèle<br />

Inférence<br />

Nous n’avons clairement pas affaire <strong>à</strong> une distribution du χ 2 .<br />

La simulation nous permet d’obtenir une p-value estimée :<br />

> mean(lrstat>=s)<br />

[1] 0.018<br />

Avec suffisament de simulations, la p-value estimée tendrait vers<br />

celle issue de l’ANOVA.<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Beat the Blues<br />

Modèle <strong>à</strong> effets aléatoires<br />

Modèle marginal<br />

Beat the Blues (Everitt et Hothorn) I<br />

L’essai BtB a pour but d’évaluer un traitement sur ordinateur basé<br />

sur les thérapies comportementalistes au traitement courant de la<br />

dépression.<br />

Le critère de jugement est le score BDI (Beck depresion inventory),<br />

mesuré avant la randomisation, puis 2, 3, 5 et 8 mois après<br />

l’initiation du traitement. Deux variables d’ajustement sont<br />

mesurées : la prise ou non d’antidépresseurs, et la durée de la<br />

dépression.<br />

On peut se faire une idée des données <strong>à</strong> partir des 5 premiers<br />

patients :<br />

> data(BtheB,package="HSAUR")<br />

> BtheB[1:5,]<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Beat the Blues<br />

Modèle <strong>à</strong> effets aléatoires<br />

Modèle marginal<br />

Beat the Blues (Everitt et Hothorn) II<br />

drug length treatment bdi.pre bdi.2m bdi.4m bdi.6m bdi.8m<br />

1 No >6m TAU 29 2 2 NA NA<br />

2 Yes >6m BtheB 32 16 24 17 20<br />

3 Yes 6m BtheB 21 17 16 10 9<br />

5 Yes >6m BtheB 26 23 NA NA NA<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Beat the Blues<br />

Modèle <strong>à</strong> effets aléatoires<br />

Modèle marginal<br />

Caractéristiques des données longitudinales<br />

Dans les essais longitudinaux, les variables <strong>à</strong> expliquer ou<br />

explicatives peuvent être mesurées <strong>à</strong> différents temps pour chaque<br />

individu.<br />

L’objectif des analyses peut être de décrire l’évolution d’une<br />

variable, et d’identifier les variables les plus associées <strong>à</strong> cette<br />

évolution.<br />

Puisque plusieurs mesures sont faites sur le même individu, il faut<br />

s’attendre <strong>à</strong> observer une corrélation entre ces mesures.<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Le modèle<br />

Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Beat the Blues<br />

Modèle <strong>à</strong> effets aléatoires<br />

Modèle marginal<br />

Dans le cas de données longitudinales, il faut prendre le temps en<br />

compte. En notant i le patient et j l’observation :<br />

yij = α + βtj + ui + ɛij<br />

<strong>Les</strong> résidus sont ainsi décomposés en une partie, ui, qui est<br />

spécifique <strong>à</strong> l’individu et constante du temps, et une partie, ɛij,<br />

variant au cours du temps.<br />

ui ↩→ N 0, σ 2 u<br />

ɛij ↩→ N 0, σ 2 ɛ<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Estimation du modèle I<br />

Beat the Blues<br />

Modèle <strong>à</strong> effets aléatoires<br />

Modèle marginal<br />

Pour pouvoir faire les analyses, il faut changer de tableau de<br />

données :<br />

> BtheB$subject BtheBl BtheBl$time BtheBl[BtheBl$subject %in% c("1","2"),]<br />

drug length treatment bdi.pre subject time bdi<br />

1.2m No >6m TAU 29 1 2 2<br />

2.2m Yes >6m BtheB 32 2 2 16<br />

1.4m No >6m TAU 29 1 4 2<br />

2.4m Yes >6m BtheB 32 2 4 24<br />

1.6m No >6m TAU 29 1 6 NA<br />

2.6m Yes >6m BtheB 32 2 6 17<br />

1.8m No >6m TAU 29 1 8 NA<br />

2.8m Yes >6m BtheB 32 2 8 20<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Estimation du modèle II<br />

Beat the Blues<br />

Modèle <strong>à</strong> effets aléatoires<br />

Modèle marginal<br />

Une fois les données au bon format, on peut estimer le modèle :<br />

> fit1 summary(fit1)<br />

Linear mixed model fit by maximum likelihood<br />

Formula: bdi ~ bdi.pre + time + treatment + drug + length + (1 | subject)<br />

Data: BtheBl<br />

AIC BIC logLik deviance REMLdev<br />

1887 1916 -935.3 1871 1866<br />

Random effects:<br />

Groups Name Variance Std.Dev.<br />

subject (Intercept) 48.300 6.9498<br />

Residual 25.129 5.0128<br />

Number of obs: 280, groups: subject, 97<br />

Fixed effects:<br />

Estimate Std. Error t value<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Estimation du modèle III<br />

(Intercept) 5.94371 2.24915 2.643<br />

bdi.pre 0.63819 0.07759 8.225<br />

time -0.71703 0.14606 -4.909<br />

treatmentBtheB -2.37311 1.66369 -1.426<br />

drugYes -2.79786 1.71993 -1.627<br />

length>6m 0.25639 1.63213 0.157<br />

Beat the Blues<br />

Modèle <strong>à</strong> effets aléatoires<br />

Modèle marginal<br />

Correlation of Fixed Effects:<br />

(Intr) bdi.pr time trtmBB drugYs<br />

bdi.pre -0.678<br />

time -0.264 0.023<br />

tretmntBthB -0.389 0.121 0.022<br />

drugYes -0.071 -0.237 -0.025 -0.323<br />

length>6m -0.238 -0.242 -0.043 0.002 0.158<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Estimation du modèle IV<br />

Beat the Blues<br />

Modèle <strong>à</strong> effets aléatoires<br />

Modèle marginal<br />

En raison des difficultés d’interprétation des tests t, la fonction ne<br />

présente pas les p-values associées. On peut néanmoins conclure<br />

que l’effet du BDI pré-traitement et du temps est significatif, et<br />

que l’effet des trois autres variables ne l’est pas.<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Validation du modèle I<br />

Beat the Blues<br />

Modèle <strong>à</strong> effets aléatoires<br />

Modèle marginal<br />

Il faut vérifier la normalité des résidus et des effets aléatoires :<br />

> ui eij par(mfrow=c(1,2))<br />

> qqnorm(ui,ylab="Intercepts aléatoires",xlab="Quantiles théoriques",<br />

+ xlim=c(-3,3),ylim=c(-20,20))<br />

> qqline(ui)<br />

> qqnorm(eij,ylab="Résidus",xlab="Quantiles théoriques",<br />

+ xlim=c(-3,3),ylim=c(-20,20))<br />

> qqline(eij)<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Validation du modèle II<br />

Intercepts aléatoires<br />

−20 −10 0 10 20<br />

●<br />

● ●<br />

●<br />

Normal Q−Q Plot<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●●●<br />

● ●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

● ●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

−3 −2 −1 0 1 2 3<br />

Quantiles théoriques<br />

●<br />

●<br />

●<br />

●<br />

Résidus<br />

Beat the Blues<br />

Modèle <strong>à</strong> effets aléatoires<br />

Modèle marginal<br />

−20 −10 0 10 20<br />

●<br />

Normal Q−Q Plot<br />

●<br />

●<br />

●●<br />

●<br />

● ●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●● ●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

● ●<br />

●<br />

● ●●●<br />

● ●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

● ●●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

● ●●<br />

●<br />

●<br />

● ●<br />

● ●●<br />

●●<br />

●●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

● ●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●●<br />

●<br />

●<br />

●●<br />

● ●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

● ●●●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●●●<br />

●<br />

●<br />

●<br />

●<br />

● ●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●●<br />

●<br />

●<br />

●●<br />

● ●●<br />

●●<br />

●<br />

●<br />

●●<br />

●<br />

●<br />

●<br />

●●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

−3 −2 −1 0 1 2 3<br />

Quantiles théoriques<br />

L’examen des résidus et des intercepts aléatoires ne montre pas<br />

une violation forte de la normalité.<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Modélisation alternative<br />

Beat the Blues<br />

Modèle <strong>à</strong> effets aléatoires<br />

Modèle marginal<br />

<strong>Les</strong> Generalized Estimating Equations (GEE) dérivent des modèles<br />

linéaires généralisés (GLM). Ils permettent de traiter le cas de<br />

données corrélées en modélisant séparément la matrice de<br />

corrélations. Il existe plusieurs formes pour ces matrices de<br />

corrélations :<br />

Matrice identité. On considère alors les mesures répétées pour un même individu<br />

comme indépendantes.<br />

Exchangeable correlation. La corrélation entre deux mesures répétées est<br />

constante, quelles que soient les mesures (corrélations interchangeables).<br />

Autoregressive correlation. corr (yi , yk) = ϑ |k−j| . Si ϑ < 1, on modélise une<br />

situation où plus deux mesures sont éloignées dans le temps, plus leur<br />

corrélation est faible.<br />

Unstructured correlation. Chaque paire de mesures a sa propre corrélation. Ceci<br />

implique l’estimation d’un grand nombre de paramètres.<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Estimation du modèle I<br />

Beat the Blues<br />

Modèle <strong>à</strong> effets aléatoires<br />

Modèle marginal<br />

Il faut avant tout trier les données par sujet :<br />

> BtheBl library(gee)<br />

> fitG1 6m drugYes<br />

3.5686314 0.5818494 -3.2372285 1.4577182 -3.7412982<br />

> summary(fitG1)<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Estimation du modèle II<br />

Beat the Blues<br />

Modèle <strong>à</strong> effets aléatoires<br />

Modèle marginal<br />

GEE: GENERALIZED LINEAR MODELS FOR DEPENDENT DATA<br />

gee S-function, version 4.13 modified 98/01/27 (1998)<br />

Model:<br />

Link: Identity<br />

Variance to Mean Relation: Gaussian<br />

Correlation Structure: Independent<br />

Call:<br />

gee(formula = bdi ~ bdi.pre + treatment + length + drug, id = subject,<br />

data = BtheBl, family = gaussian, corstr = "independence")<br />

Summary of Residuals:<br />

Min 1Q Median 3Q Max<br />

-21.6497810 -5.8485100 0.1131663 5.5838383 28.1871039<br />

Coefficients:<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Estimation du modèle III<br />

Beat the Blues<br />

Modèle <strong>à</strong> effets aléatoires<br />

Modèle marginal<br />

Estimate Naive S.E. Naive z Robust S.E. Robust z<br />

(Intercept) 3.5686314 1.4833349 2.405816 2.26947617 1.5724472<br />

bdi.pre 0.5818494 0.0563904 10.318235 0.09156455 6.3545274<br />

treatmentBtheB -3.2372285 1.1295569 -2.865928 1.77459534 -1.8242066<br />

length>6m 1.4577182 1.1380277 1.280916 1.48255866 0.9832449<br />

drugYes -3.7412982 1.1766321 -3.179667 1.78271179 -2.0986557<br />

Estimated Scale Parameter: 79.25813<br />

Number of Iterations: 1<br />

Working Correlation<br />

[,1] [,2] [,3] [,4]<br />

[1,] 1 0 0 0<br />

[2,] 0 1 0 0<br />

[3,] 0 0 1 0<br />

[4,] 0 0 0 1<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Estimation du modèle IV<br />

Beat the Blues<br />

Modèle <strong>à</strong> effets aléatoires<br />

Modèle marginal<br />

L’écart-type robuste est calculé selon une méthode (Huber/White)<br />

qui permet de prendre en compte les écarts <strong>à</strong> l’indépendance des<br />

résidus dans un modèle de régression. La différence importante<br />

entre les écarts-types naifs et robustes dans ce modèle indique que<br />

l’hypothèse d’indépendance n’est pas raisonnable. On peut donc<br />

estimer le modèle GEE le plus simple :<br />

> fitG2 6m drugYes<br />

3.5686314 0.5818494 -3.2372285 1.4577182 -3.7412982<br />

> summary(fitG2)<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Estimation du modèle V<br />

Beat the Blues<br />

Modèle <strong>à</strong> effets aléatoires<br />

Modèle marginal<br />

GEE: GENERALIZED LINEAR MODELS FOR DEPENDENT DATA<br />

gee S-function, version 4.13 modified 98/01/27 (1998)<br />

Model:<br />

Link: Identity<br />

Variance to Mean Relation: Gaussian<br />

Correlation Structure: Exchangeable<br />

Call:<br />

gee(formula = bdi ~ bdi.pre + treatment + length + drug, id = subject,<br />

data = BtheBl, family = gaussian, corstr = "exchangeable")<br />

Summary of Residuals:<br />

Min 1Q Median 3Q Max<br />

-23.955980 -6.643864 -1.109741 4.257688 25.452310<br />

Coefficients:<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Estimation du modèle VI<br />

Beat the Blues<br />

Modèle <strong>à</strong> effets aléatoires<br />

Modèle marginal<br />

Estimate Naive S.E. Naive z Robust S.E. Robust z<br />

(Intercept) 3.0231602 2.30390185 1.31219140 2.23204410 1.3544357<br />

bdi.pre 0.6479276 0.08228567 7.87412417 0.08351405 7.7583066<br />

treatmentBtheB -2.1692863 1.76642861 -1.22806339 1.73614385 -1.2494854<br />

length>6m -0.1112910 1.73091679 -0.06429596 1.55092705 -0.0717577<br />

drugYes -2.9995608 1.82569913 -1.64296559 1.73155411 -1.7322940<br />

Estimated Scale Parameter: 81.7349<br />

Number of Iterations: 5<br />

Working Correlation<br />

[,1] [,2] [,3] [,4]<br />

[1,] 1.0000000 0.6757951 0.6757951 0.6757951<br />

[2,] 0.6757951 1.0000000 0.6757951 0.6757951<br />

[3,] 0.6757951 0.6757951 1.0000000 0.6757951<br />

[4,] 0.6757951 0.6757951 0.6757951 1.0000000<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Estimation du modèle VII<br />

Beat the Blues<br />

Modèle <strong>à</strong> effets aléatoires<br />

Modèle marginal<br />

Cette fois, les écarts-type naïfs (issus du modèle) et robustes sont<br />

proches, signe que le modèle est pertinent. <strong>Les</strong> coefficients estimés<br />

sont proches de ceux issus du modèle <strong>à</strong> effets aléatoires :<br />

> summary(fit1)<br />

Linear mixed model fit by maximum likelihood<br />

Formula: bdi ~ bdi.pre + time + treatment + drug + length + (1 | subject)<br />

Data: BtheBl<br />

AIC BIC logLik deviance REMLdev<br />

1887 1916 -935.3 1871 1866<br />

Random effects:<br />

Groups Name Variance Std.Dev.<br />

subject (Intercept) 48.300 6.9498<br />

Residual 25.129 5.0128<br />

Number of obs: 280, groups: subject, 97<br />

Fixed effects:<br />

Estimate Std. Error t value<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Estimation du modèle VIII<br />

(Intercept) 5.94371 2.24915 2.643<br />

bdi.pre 0.63819 0.07759 8.225<br />

time -0.71703 0.14606 -4.909<br />

treatmentBtheB -2.37311 1.66369 -1.426<br />

drugYes -2.79786 1.71993 -1.627<br />

length>6m 0.25639 1.63213 0.157<br />

Beat the Blues<br />

Modèle <strong>à</strong> effets aléatoires<br />

Modèle marginal<br />

Correlation of Fixed Effects:<br />

(Intr) bdi.pr time trtmBB drugYs<br />

bdi.pre -0.678<br />

time -0.264 0.023<br />

tretmntBthB -0.389 0.121 0.022<br />

drugYes -0.071 -0.237 -0.025 -0.323<br />

length>6m -0.238 -0.242 -0.043 0.002 0.158<br />

Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>


Sommaire<br />

Préliminaires<br />

Essais multicentriques<br />

Aspects calculatoires<br />

Mesures répétées<br />

Estimation du modèle IX<br />

Beat the Blues<br />

Modèle <strong>à</strong> effets aléatoires<br />

Modèle marginal<br />

Ceci parce que, implicitement, le modèle <strong>à</strong> effets aléatoires estime<br />

un écart-type unique pour l’intercept aléatoire, et est donc proche<br />

du modèle GEE estimé, qui fait la même hypothèse.<br />

La corrélation entre les observations dans le modèle GEE est<br />

estimée <strong>à</strong> 0.676. Cette estimation est très proche du coefficient de<br />

corrélation intra classe issu du modèle <strong>à</strong> effets aléatoires :<br />

ICC =<br />

σ2 u<br />

σ 2 u + σ 2 ɛ<br />

=<br />

6.9502 6.9502 = 0.658<br />

+ 5.0132 Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!