Les Modèles à Effets Aléatoires - Christophe Genolini
Les Modèles à Effets Aléatoires - Christophe Genolini
Les Modèles à Effets Aléatoires - Christophe Genolini
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
<strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong><br />
Une introduction<br />
Lionel RIOU FRANÇA<br />
INSERM U669<br />
Septembre <br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
1 Préliminaires<br />
<strong>Effets</strong> Fixes<br />
<strong>Effets</strong> <strong>Aléatoires</strong><br />
2 Essais multicentriques<br />
Analyse Classique<br />
<strong>Effets</strong> aléatoires<br />
Efficacité homogène<br />
Efficacité hétérogène<br />
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
3 Aspects calculatoires<br />
Estimation du modèle<br />
Inférence<br />
4 Mesures répétées<br />
Beat the Blues<br />
Modèle <strong>à</strong> effets aléatoires<br />
Modèle marginal<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Le modèle de régression linéaire<br />
<strong>Effets</strong> Fixes<br />
<strong>Effets</strong> <strong>Aléatoires</strong><br />
Il s’agit d’étudier la liaison statistique entre une variable<br />
quantitative continue Y et des variables explicatives X non<br />
aléatoires. Soit yi la réponse de l’individu i et xi les valeurs prises<br />
par les variables explicatives pour cet individu.<br />
La relation entre Y et X peut s’écrire sous la forme :<br />
yi = α + βxi + ɛi<br />
où ɛi est une variable aléatoire distribuée selon une loi normale<br />
d’espérance nulle : ɛi ↩→ N 0, σ 2<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
<strong>Les</strong> hypothèses du modèle<br />
<strong>Effets</strong> Fixes<br />
<strong>Effets</strong> <strong>Aléatoires</strong><br />
Homogénéité de la variance : <strong>Les</strong> erreurs ont la même variance<br />
σ 2 ,<br />
Linéarité : La moyenne de chaque distribution de Y, E(yi|xi),<br />
se situe sur une droite,<br />
Indépendance : <strong>Les</strong> erreurs sont indépendantes,<br />
<strong>Les</strong> erreurs ɛi sont distribuées selon une loi normale.<br />
On notera que les erreurs du modèle linéaire sont supposées être<br />
i.i.d. (indépendantes et identiquement distribuées), de loi normale.<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Violation des hypothèses<br />
<strong>Effets</strong> Fixes<br />
<strong>Effets</strong> <strong>Aléatoires</strong><br />
Cas où les erreurs ɛ ne sont pas i.i.d. :<br />
Processus d’échantillonage :<br />
essais multicentriques,<br />
cluster trials,<br />
données structurées (modèles multiniveaux) – ex : des classes<br />
dans des écoles dans des villes,<br />
. . .<br />
Méta-analyses : l’individu statistique est l’essai, pas les<br />
patients le composant.<br />
Données Longitudinales : plusieurs mesures, pour un même<br />
individu, <strong>à</strong> différents temps.<br />
On peut alors supposer que les erreurs issues de la même unité<br />
d’échantillonnage seront corrélées entre elles.<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Le modèle <strong>à</strong> intercept aléatoire<br />
<strong>Effets</strong> Fixes<br />
<strong>Effets</strong> <strong>Aléatoires</strong><br />
L’idée est de décomposer la variance. Pour chaque individu<br />
statistique i dans le groupe j :<br />
yij = α + βxi + ɛij + uj<br />
uj est l’effet aléatoire. On a ɛij ↩→ N 0, σ2 <br />
ɛ et uj ↩→ N 0, σ2 <br />
u .<br />
Var (yij) = Var (ui + ɛij) = σ2 u + σ2 ɛ .<br />
La corrélation entre deux individus i et k du même groupe j est<br />
alors de :<br />
Cor (uj + ɛij, uj + ɛkj) =<br />
σ2 u<br />
σ 2 ɛ + σ 2 u<br />
Il s’agit d’un coefficient de corrélation intra classe (ICC), qui<br />
mesure la part de variation résiduelle qui est due <strong>à</strong> la variation<br />
entre les groupes.<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Exemple d’application (Agresti)<br />
Analyse Classique<br />
<strong>Effets</strong> aléatoires<br />
Soit un essai clinique sur 8 centres comparant une crème<br />
antiseptique <strong>à</strong> un Placebo. Le critère de jugement est la guérison<br />
d’une infection.<br />
Réponse<br />
Centre Traitement Succès Echec<br />
1 Crème 11 25<br />
Placebo 10 27<br />
2 Crème 16 4<br />
Placebo 22 10<br />
3 Crème 14 5<br />
Placebo 7 12<br />
4 Crème 2 14<br />
Placebo 1 16<br />
5 Crème 6 11<br />
Placebo 0 12<br />
6 Crème 1 10<br />
Placebo 0 10<br />
7 Crème 1 4<br />
Placebo 1 8<br />
8 Crème 4 2<br />
Placebo 6 1<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Analyse Classique<br />
<strong>Effets</strong> aléatoires<br />
Exemple d’application : <strong>Les</strong> données<br />
> Succès Echecs Multi rm(Succès,Echecs)<br />
> Multi[1:4,]<br />
Centre Traitement Succès Echecs<br />
1 1 Crème 11 25<br />
2 1 Placebo 10 27<br />
3 2 Crème 16 4<br />
4 2 Placebo 22 10<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Analyse Classique<br />
<strong>Effets</strong> aléatoires<br />
Exemple d’application : Analyse classique<br />
Dans la plupart des essais cliniques publiés, on ignore totalement<br />
l’effet centre. Le modèle est logit (Pi) = α + βxi, où X est le<br />
traitement et P la probabilité de succès.<br />
> fitCl round(summary(fitCl)$coefficients,digits=4)<br />
Estimate Std. Error z value Pr(>|z|)<br />
(Intercept) -0.7142 0.1780 -4.0118 0.0001<br />
TraitementCrème 0.4040 0.2514 1.6071 0.1080<br />
> (icOR
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Hypothèses sous-jacentes<br />
Analyse Classique<br />
<strong>Effets</strong> aléatoires<br />
En ignorant l’appartenance des patients aux centres (analyse<br />
poolée), nous faisons l’hypothèse de l’homogénéité entre les<br />
centres :<br />
de l’effet du traitement,<br />
de la probabilité de guérison.<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Analyse Classique<br />
<strong>Effets</strong> aléatoires<br />
Test de Cochran-Mantel-Haenszel : Indépendance<br />
conditionnelle I<br />
Ce test permet de juger de l’effet du traitement,<br />
conditionnellement aux centres. Il faut commencer par faire une<br />
table de 8 tableaux de contingence, un par centre :<br />
> Multi2 for (i in 1:8) {<br />
+ b
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Analyse Classique<br />
<strong>Effets</strong> aléatoires<br />
Test de Cochran-Mantel-Haenszel : Indépendance<br />
conditionnelle II<br />
, , Centre = 1<br />
Réponse<br />
Traitement Succès Echec<br />
Placebo 11 25<br />
Crème 10 27<br />
, , Centre = 2<br />
Réponse<br />
Traitement Succès Echec<br />
Placebo 16 4<br />
Crème 22 10<br />
On peut ensuite procéder au test :<br />
> mantelhaen.test(Multi2,correct=FALSE)<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Analyse Classique<br />
<strong>Effets</strong> aléatoires<br />
Test de Cochran-Mantel-Haenszel : Indépendance<br />
conditionnelle III<br />
Mantel-Haenszel chi-squared test without continuity correction<br />
data: Multi2<br />
Mantel-Haenszel X-squared = 6.3841, df = 1, p-value = 0.01151<br />
alternative hypothesis: true common odds ratio is not equal to 1<br />
95 percent confidence interval:<br />
1.177590 3.869174<br />
sample estimates:<br />
common odds ratio<br />
2.134549<br />
Il s’agit d’un test d’indépendance conditionnelle. En l’occurence, de<br />
l’indépendance entre le traitement et la réponse,<br />
conditionnellement au centre.<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Analyse Classique<br />
<strong>Effets</strong> aléatoires<br />
Test de Cochran-Mantel-Haenszel : Indépendance<br />
conditionnelle IV<br />
On rejette ici l’hypothèse d’indépendance conditionnelle (la<br />
réponse dépend du traitement, connaissant le centre) et on estime<br />
<strong>à</strong> 2.13 l’OR commun <strong>à</strong> tous les centres (<strong>à</strong> comparer avec<br />
l’estimation initiale de 1.50, obtenue en ignorant les centres).<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Analyse Classique<br />
<strong>Effets</strong> aléatoires<br />
Approche par régression logistique I<br />
On peut également intégrer directement l’effet centre dans la<br />
régression :<br />
> fitCl2 round(summary(fitCl2)$coefficients,digits=4)<br />
Estimate Std. Error z value Pr(>|z|)<br />
(Intercept) -1.3220 0.3165 -4.1775 0.0000<br />
TraitementCrème 0.7769 0.3067 2.5333 0.0113<br />
Centre2 2.0554 0.4201 4.8929 0.0000<br />
Centre3 1.1529 0.4246 2.7155 0.0066<br />
Centre4 -1.4185 0.6636 -2.1376 0.0326<br />
Centre5 -0.5199 0.5338 -0.9740 0.3301<br />
Centre6 -2.1469 1.0614 -2.0228 0.0431<br />
Centre7 -0.7977 0.8149 -0.9789 0.3276<br />
Centre8 2.2079 0.7195 3.0687 0.0022<br />
L’effet du traitement devient significatif, l’OR commun est estimé<br />
<strong>à</strong> 2.17.<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Analyse Classique<br />
<strong>Effets</strong> aléatoires<br />
Approche par régression logistique II<br />
> drop1(fitCl2,test="Chisq")<br />
Single term deletions<br />
Model:<br />
cbind(Succès, Echecs) ~ Traitement + Centre<br />
Df Deviance AIC LRT Pr(Chi)<br />
9.746 66.136<br />
Traitement 1 16.415 70.805 6.669 0.009811 **<br />
Centre 7 90.960 133.350 81.214 7.788e-15 ***<br />
---<br />
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1<br />
L’effet centre est significatif également.<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Analyse Classique<br />
<strong>Effets</strong> aléatoires<br />
L’effet du traitement est-il homogène ?<br />
Il est possible de calculer l’OR du traitement pour chacun des<br />
centres :<br />
> OR for (i in 1:8) {<br />
+ b
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
<strong>Les</strong> OR sont-ils homogènes ? I<br />
Analyse Classique<br />
<strong>Effets</strong> aléatoires<br />
Le test de Cochran-Mantel-Haenszel part du principe que dans<br />
chaque centre, l’effet du traitement est de même sens. On peut<br />
alternativement tester l’effet du traitement, en admettant que<br />
celui-ci puisse varier d’une strate <strong>à</strong> l’autre.<br />
> fitCl0 fitCl3 anova(fitCl0,fitCl3,test="Chisq")<br />
Analysis of Deviance Table<br />
Model 1: cbind(Succès, Echecs) ~ Centre<br />
Model 2: cbind(Succès, Echecs) ~ Traitement + Centre + Traitement:Centre<br />
Resid. Df Resid. Dev Df Deviance P(>|Chi|)<br />
1 8 16.4151<br />
2 0 4.984e-10 8 16.4151 0.0368<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
<strong>Les</strong> OR sont-ils homogènes ? II<br />
Analyse Classique<br />
<strong>Effets</strong> aléatoires<br />
Même en autorisant l’effet du traitement <strong>à</strong> varier d’un centre <strong>à</strong><br />
l’autre, on est amenés <strong>à</strong> rejetter l’hypothèse d’indépendance entre<br />
le traitement et la guérison.<br />
On peut tester formellement l’hypothèse d’homogénéité des OR <strong>à</strong><br />
partir du test de Woolf :<br />
> library(vcd)<br />
> woolf_test(Multi2)<br />
Woolf-test on Homogeneity of Odds Ratios (no 3-Way assoc.)<br />
data: Multi2<br />
X-squared = 5.818, df = 7, p-value = 0.5612<br />
L’hypothèse d’homogénéité des OR n’est pas rejettée.<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Limites de l’approche<br />
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Analyse Classique<br />
<strong>Effets</strong> aléatoires<br />
<strong>Les</strong> analyses classiques permettent, en introduisant les centres<br />
comme variables explicatives et en autorisant des intéractions, de<br />
taiter le cas des essais multicentriques. Cependant :<br />
Lorsque le nombre de centres devient important, les introduire<br />
dans le modèle devient problématique,<br />
Puisqu’un centre sert de centre de référence, on ne connait<br />
pas les écarts de chaque centre <strong>à</strong> la moyenne,<br />
Le plus souvent, les centres participant <strong>à</strong> l’essai ne sont qu’un<br />
échantillon d’une population plus large de centres<br />
administrant le traitement, et on peut souhaiter des<br />
prédictions pour un centre n’ayant pas participé <strong>à</strong> l’essai,<br />
On aimerait pouvoir disposer d’une mesure d’hétérogénéité<br />
entre les centres.<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Approche alternative<br />
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Analyse Classique<br />
<strong>Effets</strong> aléatoires<br />
Une approche possible est de penser que l’effet du traitement dans<br />
un centre particulier provient d’une distribution N µ, σ 2 , où µ est<br />
l’effet du traitement dans la population. Un tel modèle permet <strong>à</strong> la<br />
fois d’estimer l’effet du traitement dans la population, et la<br />
variabilité de cet effet d’un centre <strong>à</strong> l’autre. De plus, il permet<br />
d’inférer sur l’effet du traitement dans n’importe quel centre, pas<br />
seulement ceux échantillonnés.<br />
On se place alors dans le cadre d’un modèle <strong>à</strong> effets aléatoires.<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Le modèle <strong>à</strong> intercept aléatoire<br />
Analyse Classique<br />
<strong>Effets</strong> aléatoires<br />
Dans le cas de données binaires, le plus classique est le modèle<br />
logistique-normal : on ajoute un effet aléatoire distribué<br />
normalement.<br />
et<br />
logit (Pij) = α + βxij + uj(+ɛij)<br />
uj ↩→ N 0, σ 2 u<br />
Dans ce modèle, on a toujours un effet du traitement (β)<br />
homogène entre les centres, mais par contre la probabilité de<br />
succès peut varier d’un centre <strong>à</strong> l’autre. σ 2 u mesure l’hétérogénéité<br />
entre les centres par rapport <strong>à</strong> la probabilité de succès.<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Analyse Classique<br />
<strong>Effets</strong> aléatoires<br />
Exemple d’application : Intercept aléatoire I<br />
Il existe plusieurs fonctions dans R pour les modèles <strong>à</strong> effets<br />
aléatoires, nous utiliserons la plus classique.<br />
> library(lme4)<br />
> fitIA summary(fitIA)<br />
Generalized linear mixed model fit by the Laplace approximation<br />
Formula: cbind(Succès, Echecs) ~ Traitement + (1 | Centre)<br />
Data: Multi<br />
AIC BIC logLik deviance<br />
41.81 44.13 -17.91 35.81<br />
Random effects:<br />
Groups Name Variance Std.Dev.<br />
Centre (Intercept) 1.9313 1.3897<br />
Number of obs: 16, groups: Centre, 8<br />
Fixed effects:<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Analyse Classique<br />
<strong>Effets</strong> aléatoires<br />
Exemple d’application : Intercept aléatoire II<br />
Estimate Std. Error z value Pr(>|z|)<br />
(Intercept) -1.1965 0.5471 -2.187 0.0287 *<br />
TraitementCrème 0.7382 0.2963 2.491 0.0127 *<br />
---<br />
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1<br />
Correlation of Fixed Effects:<br />
(Intr)<br />
TratmntCrèm -0.283<br />
Dans cette analyse, l’OR du traitement est de 2.09. La crème est<br />
significativement plus efficace que le placebo.<br />
<strong>Les</strong> résultats sont <strong>à</strong> comparer avec les estimations SAS : l’effet du<br />
traitement est estimé <strong>à</strong> ˆ β = 0, 739,sa variance <strong>à</strong> 0,300.<br />
Il est possible d’accéder <strong>à</strong> la fois aux effets fixes et aux effets<br />
aléatoires du modèle :<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Analyse Classique<br />
<strong>Effets</strong> aléatoires<br />
Exemple d’application : Intercept aléatoire III<br />
> fixef(fitIA)<br />
(Intercept) TraitementCrème<br />
-1.1964829 0.7381853<br />
> ranef(fitIA)<br />
$Centre<br />
(Intercept)<br />
1 -0.09974443<br />
2 1.84772369<br />
3 0.98968944<br />
4 -1.29268734<br />
5 -0.55773975<br />
6 -1.59634708<br />
7 -0.70286263<br />
8 1.73186555<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Analyse Classique<br />
<strong>Effets</strong> aléatoires<br />
Exemple d’application : Intercept aléatoire IV<br />
On voit que l’effet du traitement est homogène pour tous les<br />
centres, mais que l’intercept (permettant de calculer la probabilité<br />
d’efficacité) varie d’un centre <strong>à</strong> l’autre autour de sa moyenne, de<br />
-1.20.<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Analyse Classique<br />
<strong>Effets</strong> aléatoires<br />
Le modèle <strong>à</strong> intercept et coefficient aléatoire<br />
Si l’on veut modéliser l’hétérogénéité des OR, on peut rajouter un<br />
effet aléatoire au log-OR β :<br />
et<br />
logit (Pij) = α + uj + (β + bj) xij(+ɛij)<br />
uj ↩→ N 0, σ 2 u<br />
bj ↩→ N 0, σ 2 b<br />
Le log-OR dans chaque centre et donc distribué selon N β, σ2 <br />
b . σb<br />
mesure l’hétérogénéité des effets du traitement entre les centres.<br />
Dans ce modèle, on estime donc quatre paramètres : α, β, σu et<br />
σb.<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Analyse Classique<br />
<strong>Effets</strong> aléatoires<br />
Exemple d’application : Intercept et coefficient aléatoire I<br />
> fitICA summary(fitICA)<br />
Generalized linear mixed model fit by the Laplace approximation<br />
Formula: cbind(Succès, Echecs) ~ Traitement + (Traitement | Centre)<br />
Data: Multi<br />
AIC BIC logLik deviance<br />
45.27 49.13 -17.64 35.27<br />
Random effects:<br />
Groups Name Variance Std.Dev. Corr<br />
Centre (Intercept) 2.63348 1.62280<br />
TraitementCrème 0.22187 0.47103 -0.821<br />
Number of obs: 16, groups: Centre, 8<br />
Fixed effects:<br />
Estimate Std. Error z value Pr(>|z|)<br />
(Intercept) -1.3238 0.6329 -2.091 0.0365 *<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Analyse Classique<br />
<strong>Effets</strong> aléatoires<br />
Exemple d’application : Intercept et coefficient aléatoire II<br />
TraitementCrème 0.8872 0.3549 2.500 0.0124 *<br />
---<br />
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1<br />
Correlation of Fixed Effects:<br />
(Intr)<br />
TratmntCrèm -0.616<br />
Dans cette analyse, l’OR du traitement est de 2.43. La crème est<br />
significativement plus efficace que le placebo.<br />
<strong>Les</strong> résultats sont <strong>à</strong> comparer avec les estimations SAS : l’effet du<br />
traitement est estimé <strong>à</strong> ˆβ = 0, 746,sa variance <strong>à</strong> 0,325. Dans SAS,<br />
on a ˆσb = 0, 15. Dans R, ce paramètre est de 0.47.<br />
Il est possible d’accéder <strong>à</strong> la fois aux effets fixes et aux effets<br />
aléatoires du modèle :<br />
> fixef(fitICA)<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Analyse Classique<br />
<strong>Effets</strong> aléatoires<br />
Exemple d’application : Intercept et coefficient aléatoire III<br />
(Intercept) TraitementCrème<br />
-1.3238063 0.8872237<br />
> ranef(fitICA)<br />
$Centre<br />
(Intercept) TraitementCrème<br />
1 0.07658463 -0.18062609<br />
2 2.07198963 -0.44586469<br />
3 1.04967323 -0.09818885<br />
4 -1.44424841 0.29276054<br />
5 -0.80278837 0.28367134<br />
6 -1.88365702 0.41815718<br />
7 -0.72790944 0.14970977<br />
8 2.10228450 -0.53952878<br />
Cette fois, <strong>à</strong> la fois l’intercept et le log-OR varient d’un centre <strong>à</strong><br />
l’autre.<br />
On peut prédire les OR pour chacun des centres :<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Analyse Classique<br />
<strong>Effets</strong> aléatoires<br />
Exemple d’application : Intercept et coefficient aléatoire IV<br />
> OR colnames(OR) rownames(OR) round(OR,digits=2)<br />
Centre 1 Centre 2 Centre 3 Centre 4 Centre 5 Centre 6 Centre 7 Centre 8<br />
Brut 1.19 1.82 4.8 2.29 Inf Inf 2.00 0.33<br />
EA 2.03 1.55 2.2 3.25 3.22 3.69 2.82 1.42<br />
Plus σb est proche de 0, moins il y a d’hétérogénéité entre les<br />
centres.<br />
Si σb = 0, l’OR estimé pour tous les centres sera le même.<br />
Si σb = ∞, il y a hétérogénéité maximale entre les centres, l’OR<br />
estimé sera celui calculé sur les données brutes.<br />
Ici, σb est plutôt faible, et les OR estimés par le modèle sont<br />
proches de l’OR global.<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Estimation du modèle<br />
Inférence<br />
Au commencement était l’ANOVA (Faraway) I<br />
Nous voulons savoir si la brillance du papier dépend de la machine<br />
l’ayant produit.<br />
> data(pulp,package="faraway")<br />
> summary(pulp)<br />
bright operator<br />
Min. :59.80 a:5<br />
1st Qu.:60.00 b:5<br />
Median :60.50 c:5<br />
Mean :60.40 d:5<br />
3rd Qu.:60.73<br />
Max. :61.00<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Estimation du modèle<br />
Inférence<br />
Au commencement était l’ANOVA (Faraway) II<br />
Nous avons donc une mesure quantitative et une variable<br />
qualitative <strong>à</strong> 5 facteurs, d’effectifs équilibrés. Le modèle s’écrit<br />
donc :<br />
yij = µ + αj + ɛij<br />
j désigne les opérateurs (j = 1, · · · , 4) et i les individus.<br />
les α et les ɛ ont tous deux pour moyenne 0, pour écart-type σα et<br />
σɛ.<br />
Pour obtenir ce modèle dans R, il faut contraindre le codage des<br />
opérateurs, de manière <strong>à</strong> ce que la somme des contrastes soit<br />
nulle :<br />
> op lmod summary(lmod)<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Estimation du modèle<br />
Inférence<br />
Au commencement était l’ANOVA (Faraway) III<br />
Df Sum Sq Mean Sq F value Pr(>F)<br />
operator 3 1.34000 0.44667 4.2039 0.02261 *<br />
Residuals 16 1.70000 0.10625<br />
---<br />
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1<br />
> coef(lmod)<br />
(Intercept) operator1 operator2 operator3<br />
60.40 -0.16 -0.34 0.22<br />
> options(op)<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Estimation du modèle<br />
Inférence<br />
Au commencement était l’ANOVA (Faraway) IV<br />
On a µ = 60.40, α1 = −0.16. L’effet du quatrième opérateur se<br />
calcule en sachant que αj = 0.<br />
La variance résiduelle est de σ 2 ɛ = 0.106. L’effet de l’opérateur est<br />
significatif (p=0.023).<br />
À partir de ces résultats d’ANOVA, il est possible d’estimer<br />
manuellement la valeur de σα. On a en effet la propriété :<br />
σ 2 α =<br />
MSA − MSE<br />
n<br />
= 0.447 − 0.106<br />
5<br />
= 0.0682<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Modèle <strong>à</strong> effets aléatoires I<br />
Estimation du modèle<br />
Inférence<br />
Nous pouvons estimer directement le modèle <strong>à</strong> effets aléatoires :<br />
> mmod summary(mmod)<br />
Linear mixed model fit by REML<br />
Formula: bright ~ 1 + (1 | operator)<br />
Data: pulp<br />
AIC BIC logLik deviance REMLdev<br />
24.63 27.61 -9.313 16.64 18.63<br />
Random effects:<br />
Groups Name Variance Std.Dev.<br />
operator (Intercept) 0.06808 0.26092<br />
Residual 0.10625 0.32596<br />
Number of obs: 20, groups: operator, 4<br />
Fixed effects:<br />
Estimate Std. Error t value<br />
(Intercept) 60.4000 0.1494 404.2<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Modèle <strong>à</strong> effets aléatoires II<br />
Estimation du modèle<br />
Inférence<br />
On retombe sur des résultats très proches du modèle ANOVA (car<br />
effectifs équilibrés).<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Modèle <strong>à</strong> effets aléatoires III<br />
Estimation du modèle<br />
Inférence<br />
Par défaut, la méthode d’estimation est la REML (Restricted<br />
Maximum Likelihood), parce que la méthode du maximum de<br />
vraisemblance produit des estimations biaisées des écarts-type. Il<br />
est possible d’utiliser tout de même cette méthode :<br />
> smod summary(smod)<br />
Linear mixed model fit by maximum likelihood<br />
Formula: bright ~ 1 + (1 | operator)<br />
Data: pulp<br />
AIC BIC logLik deviance REMLdev<br />
22.51 25.5 -8.256 16.51 18.74<br />
Random effects:<br />
Groups Name Variance Std.Dev.<br />
operator (Intercept) 0.04575 0.21389<br />
Residual 0.10625 0.32596<br />
Number of obs: 20, groups: operator, 4<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Modèle <strong>à</strong> effets aléatoires IV<br />
Fixed effects:<br />
Estimate Std. Error t value<br />
(Intercept) 60.4000 0.1294 466.7<br />
Estimation du modèle<br />
Inférence<br />
On voit que l’estimation de σ 2 α est plus basse. Le biais dépend de<br />
la taille n des opérateurs.<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Test des effets fixes I<br />
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Estimation du modèle<br />
Inférence<br />
Il n’est pas possible de faire un test du maximum de vraisemblance<br />
pour comparer deux modèles imbriqués en estimant les effets<br />
aléatoires par REML : cette méthode estime les effets aléatoires<br />
indépendamment des effets fixes, et une modification des effets<br />
fixes fait que les vraisemblances des deux modèles ne seront pas<br />
directement comparables.<br />
Il faut donc utiliser la méthode du maximum de vraisemblance<br />
pour faire ensuite des tests du rapport de vraisemblance. Ces tests<br />
auront tendance <strong>à</strong> produire des p-values trop faibles, et <strong>à</strong><br />
surestimer l’effet des variables explicatives. Il est possible de<br />
contourner le problème en utilisant le bootstrap.<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Test des effets fixes II<br />
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Estimation du modèle<br />
Inférence<br />
<strong>Les</strong> tests F et t se font eux conditionnellement aux effets<br />
aléatoires, et supposent ceux-ci connus, et non estimés également<br />
<strong>à</strong> partir des données.<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Test des effets aléatoires<br />
Estimation du modèle<br />
Inférence<br />
Il s’agit de tester H0 : σ 2 = 0.<br />
Le test du rapport de vraisemblance, basé sur une distribution du<br />
χ 2 asymptotique, n’est valable que lorsque la valeur du paramètre<br />
testé se trouve <strong>à</strong> l’intérieur de l’espace des paramètres. En testant<br />
la valeur 0 pour une variance, ces conditions sont violées. Le test<br />
sera trop conservateur et produira en général des p-values plus<br />
importantes qu’elles ne le devraient. Une fois encore, on peut avoir<br />
recours au bootstrap.<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Application I<br />
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Estimation du modèle<br />
Inférence<br />
Nous avons vu dans l’ANOVA que l’effet opérateur était significatif.<br />
Comment conclure <strong>à</strong> partir d’un modèle <strong>à</strong> effets aléatoires ?<br />
Pour employer des tests du maximum de vraisemblance, il ne faut<br />
pas employer l’estimation par REML. Il faut donc commencer par<br />
estimer le modèle nul :<br />
> nullmod ( s pchisq(s,1,lower=FALSE)<br />
[1] 0.1090199<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Application II<br />
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Estimation du modèle<br />
Inférence<br />
La p-value est cette fois bien au dessus du seuil de 5 %. Nous<br />
pouvons opter pour une approche de bootstrap paramétrique. Nous<br />
cherchons <strong>à</strong> estimer la probabilité, si le modèle nul est correct,<br />
d’observer un rapport de vraisemblance d’au moins 2.57.<br />
Nous estimons donc des valeurs tirées du modèle nul :<br />
> y B lrstat for (i in 1:B) {<br />
+ y
Application III<br />
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Estimation du modèle<br />
Inférence<br />
On peut s’intéresser <strong>à</strong> la distribution des statistiques de test :<br />
> hist(lrstat,probability=TRUE,main="")<br />
> lines(seq(0,6,by=0.01),dchisq(seq(0,6,by=0.01),1))<br />
> abline(v=s,col="red")<br />
> text(s,0.8,paste("LRT =",round(s,digits=4)),col="red",pos=4)<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Application IV<br />
Density<br />
0.0 0.5 1.0 1.5<br />
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
LRT = 2.5684<br />
lrstat<br />
Estimation du modèle<br />
Inférence<br />
0 2 4 6 8<br />
Une large proportion de statistiques de test sont proches de 0 :<br />
> mean(lrstat
Application V<br />
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Estimation du modèle<br />
Inférence<br />
Nous n’avons clairement pas affaire <strong>à</strong> une distribution du χ 2 .<br />
La simulation nous permet d’obtenir une p-value estimée :<br />
> mean(lrstat>=s)<br />
[1] 0.018<br />
Avec suffisament de simulations, la p-value estimée tendrait vers<br />
celle issue de l’ANOVA.<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Beat the Blues<br />
Modèle <strong>à</strong> effets aléatoires<br />
Modèle marginal<br />
Beat the Blues (Everitt et Hothorn) I<br />
L’essai BtB a pour but d’évaluer un traitement sur ordinateur basé<br />
sur les thérapies comportementalistes au traitement courant de la<br />
dépression.<br />
Le critère de jugement est le score BDI (Beck depresion inventory),<br />
mesuré avant la randomisation, puis 2, 3, 5 et 8 mois après<br />
l’initiation du traitement. Deux variables d’ajustement sont<br />
mesurées : la prise ou non d’antidépresseurs, et la durée de la<br />
dépression.<br />
On peut se faire une idée des données <strong>à</strong> partir des 5 premiers<br />
patients :<br />
> data(BtheB,package="HSAUR")<br />
> BtheB[1:5,]<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Beat the Blues<br />
Modèle <strong>à</strong> effets aléatoires<br />
Modèle marginal<br />
Beat the Blues (Everitt et Hothorn) II<br />
drug length treatment bdi.pre bdi.2m bdi.4m bdi.6m bdi.8m<br />
1 No >6m TAU 29 2 2 NA NA<br />
2 Yes >6m BtheB 32 16 24 17 20<br />
3 Yes 6m BtheB 21 17 16 10 9<br />
5 Yes >6m BtheB 26 23 NA NA NA<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Beat the Blues<br />
Modèle <strong>à</strong> effets aléatoires<br />
Modèle marginal<br />
Caractéristiques des données longitudinales<br />
Dans les essais longitudinaux, les variables <strong>à</strong> expliquer ou<br />
explicatives peuvent être mesurées <strong>à</strong> différents temps pour chaque<br />
individu.<br />
L’objectif des analyses peut être de décrire l’évolution d’une<br />
variable, et d’identifier les variables les plus associées <strong>à</strong> cette<br />
évolution.<br />
Puisque plusieurs mesures sont faites sur le même individu, il faut<br />
s’attendre <strong>à</strong> observer une corrélation entre ces mesures.<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Le modèle<br />
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Beat the Blues<br />
Modèle <strong>à</strong> effets aléatoires<br />
Modèle marginal<br />
Dans le cas de données longitudinales, il faut prendre le temps en<br />
compte. En notant i le patient et j l’observation :<br />
yij = α + βtj + ui + ɛij<br />
<strong>Les</strong> résidus sont ainsi décomposés en une partie, ui, qui est<br />
spécifique <strong>à</strong> l’individu et constante du temps, et une partie, ɛij,<br />
variant au cours du temps.<br />
ui ↩→ N 0, σ 2 u<br />
ɛij ↩→ N 0, σ 2 ɛ<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Estimation du modèle I<br />
Beat the Blues<br />
Modèle <strong>à</strong> effets aléatoires<br />
Modèle marginal<br />
Pour pouvoir faire les analyses, il faut changer de tableau de<br />
données :<br />
> BtheB$subject BtheBl BtheBl$time BtheBl[BtheBl$subject %in% c("1","2"),]<br />
drug length treatment bdi.pre subject time bdi<br />
1.2m No >6m TAU 29 1 2 2<br />
2.2m Yes >6m BtheB 32 2 2 16<br />
1.4m No >6m TAU 29 1 4 2<br />
2.4m Yes >6m BtheB 32 2 4 24<br />
1.6m No >6m TAU 29 1 6 NA<br />
2.6m Yes >6m BtheB 32 2 6 17<br />
1.8m No >6m TAU 29 1 8 NA<br />
2.8m Yes >6m BtheB 32 2 8 20<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Estimation du modèle II<br />
Beat the Blues<br />
Modèle <strong>à</strong> effets aléatoires<br />
Modèle marginal<br />
Une fois les données au bon format, on peut estimer le modèle :<br />
> fit1 summary(fit1)<br />
Linear mixed model fit by maximum likelihood<br />
Formula: bdi ~ bdi.pre + time + treatment + drug + length + (1 | subject)<br />
Data: BtheBl<br />
AIC BIC logLik deviance REMLdev<br />
1887 1916 -935.3 1871 1866<br />
Random effects:<br />
Groups Name Variance Std.Dev.<br />
subject (Intercept) 48.300 6.9498<br />
Residual 25.129 5.0128<br />
Number of obs: 280, groups: subject, 97<br />
Fixed effects:<br />
Estimate Std. Error t value<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Estimation du modèle III<br />
(Intercept) 5.94371 2.24915 2.643<br />
bdi.pre 0.63819 0.07759 8.225<br />
time -0.71703 0.14606 -4.909<br />
treatmentBtheB -2.37311 1.66369 -1.426<br />
drugYes -2.79786 1.71993 -1.627<br />
length>6m 0.25639 1.63213 0.157<br />
Beat the Blues<br />
Modèle <strong>à</strong> effets aléatoires<br />
Modèle marginal<br />
Correlation of Fixed Effects:<br />
(Intr) bdi.pr time trtmBB drugYs<br />
bdi.pre -0.678<br />
time -0.264 0.023<br />
tretmntBthB -0.389 0.121 0.022<br />
drugYes -0.071 -0.237 -0.025 -0.323<br />
length>6m -0.238 -0.242 -0.043 0.002 0.158<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Estimation du modèle IV<br />
Beat the Blues<br />
Modèle <strong>à</strong> effets aléatoires<br />
Modèle marginal<br />
En raison des difficultés d’interprétation des tests t, la fonction ne<br />
présente pas les p-values associées. On peut néanmoins conclure<br />
que l’effet du BDI pré-traitement et du temps est significatif, et<br />
que l’effet des trois autres variables ne l’est pas.<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Validation du modèle I<br />
Beat the Blues<br />
Modèle <strong>à</strong> effets aléatoires<br />
Modèle marginal<br />
Il faut vérifier la normalité des résidus et des effets aléatoires :<br />
> ui eij par(mfrow=c(1,2))<br />
> qqnorm(ui,ylab="Intercepts aléatoires",xlab="Quantiles théoriques",<br />
+ xlim=c(-3,3),ylim=c(-20,20))<br />
> qqline(ui)<br />
> qqnorm(eij,ylab="Résidus",xlab="Quantiles théoriques",<br />
+ xlim=c(-3,3),ylim=c(-20,20))<br />
> qqline(eij)<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Validation du modèle II<br />
Intercepts aléatoires<br />
−20 −10 0 10 20<br />
●<br />
● ●<br />
●<br />
Normal Q−Q Plot<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●●●<br />
● ●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
● ●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
−3 −2 −1 0 1 2 3<br />
Quantiles théoriques<br />
●<br />
●<br />
●<br />
●<br />
Résidus<br />
Beat the Blues<br />
Modèle <strong>à</strong> effets aléatoires<br />
Modèle marginal<br />
−20 −10 0 10 20<br />
●<br />
Normal Q−Q Plot<br />
●<br />
●<br />
●●<br />
●<br />
● ●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●● ●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
● ●<br />
●<br />
● ●●●<br />
● ●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
● ●●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
● ●●<br />
●<br />
●<br />
● ●<br />
● ●●<br />
●●<br />
●●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
● ●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●●<br />
●<br />
●<br />
●●<br />
● ●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
● ●●●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●●●<br />
●<br />
●<br />
●<br />
●<br />
● ●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●●<br />
●<br />
●<br />
●●<br />
● ●●<br />
●●<br />
●<br />
●<br />
●●<br />
●<br />
●<br />
●<br />
●●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
−3 −2 −1 0 1 2 3<br />
Quantiles théoriques<br />
L’examen des résidus et des intercepts aléatoires ne montre pas<br />
une violation forte de la normalité.<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Modélisation alternative<br />
Beat the Blues<br />
Modèle <strong>à</strong> effets aléatoires<br />
Modèle marginal<br />
<strong>Les</strong> Generalized Estimating Equations (GEE) dérivent des modèles<br />
linéaires généralisés (GLM). Ils permettent de traiter le cas de<br />
données corrélées en modélisant séparément la matrice de<br />
corrélations. Il existe plusieurs formes pour ces matrices de<br />
corrélations :<br />
Matrice identité. On considère alors les mesures répétées pour un même individu<br />
comme indépendantes.<br />
Exchangeable correlation. La corrélation entre deux mesures répétées est<br />
constante, quelles que soient les mesures (corrélations interchangeables).<br />
Autoregressive correlation. corr (yi , yk) = ϑ |k−j| . Si ϑ < 1, on modélise une<br />
situation où plus deux mesures sont éloignées dans le temps, plus leur<br />
corrélation est faible.<br />
Unstructured correlation. Chaque paire de mesures a sa propre corrélation. Ceci<br />
implique l’estimation d’un grand nombre de paramètres.<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Estimation du modèle I<br />
Beat the Blues<br />
Modèle <strong>à</strong> effets aléatoires<br />
Modèle marginal<br />
Il faut avant tout trier les données par sujet :<br />
> BtheBl library(gee)<br />
> fitG1 6m drugYes<br />
3.5686314 0.5818494 -3.2372285 1.4577182 -3.7412982<br />
> summary(fitG1)<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Estimation du modèle II<br />
Beat the Blues<br />
Modèle <strong>à</strong> effets aléatoires<br />
Modèle marginal<br />
GEE: GENERALIZED LINEAR MODELS FOR DEPENDENT DATA<br />
gee S-function, version 4.13 modified 98/01/27 (1998)<br />
Model:<br />
Link: Identity<br />
Variance to Mean Relation: Gaussian<br />
Correlation Structure: Independent<br />
Call:<br />
gee(formula = bdi ~ bdi.pre + treatment + length + drug, id = subject,<br />
data = BtheBl, family = gaussian, corstr = "independence")<br />
Summary of Residuals:<br />
Min 1Q Median 3Q Max<br />
-21.6497810 -5.8485100 0.1131663 5.5838383 28.1871039<br />
Coefficients:<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Estimation du modèle III<br />
Beat the Blues<br />
Modèle <strong>à</strong> effets aléatoires<br />
Modèle marginal<br />
Estimate Naive S.E. Naive z Robust S.E. Robust z<br />
(Intercept) 3.5686314 1.4833349 2.405816 2.26947617 1.5724472<br />
bdi.pre 0.5818494 0.0563904 10.318235 0.09156455 6.3545274<br />
treatmentBtheB -3.2372285 1.1295569 -2.865928 1.77459534 -1.8242066<br />
length>6m 1.4577182 1.1380277 1.280916 1.48255866 0.9832449<br />
drugYes -3.7412982 1.1766321 -3.179667 1.78271179 -2.0986557<br />
Estimated Scale Parameter: 79.25813<br />
Number of Iterations: 1<br />
Working Correlation<br />
[,1] [,2] [,3] [,4]<br />
[1,] 1 0 0 0<br />
[2,] 0 1 0 0<br />
[3,] 0 0 1 0<br />
[4,] 0 0 0 1<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Estimation du modèle IV<br />
Beat the Blues<br />
Modèle <strong>à</strong> effets aléatoires<br />
Modèle marginal<br />
L’écart-type robuste est calculé selon une méthode (Huber/White)<br />
qui permet de prendre en compte les écarts <strong>à</strong> l’indépendance des<br />
résidus dans un modèle de régression. La différence importante<br />
entre les écarts-types naifs et robustes dans ce modèle indique que<br />
l’hypothèse d’indépendance n’est pas raisonnable. On peut donc<br />
estimer le modèle GEE le plus simple :<br />
> fitG2 6m drugYes<br />
3.5686314 0.5818494 -3.2372285 1.4577182 -3.7412982<br />
> summary(fitG2)<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Estimation du modèle V<br />
Beat the Blues<br />
Modèle <strong>à</strong> effets aléatoires<br />
Modèle marginal<br />
GEE: GENERALIZED LINEAR MODELS FOR DEPENDENT DATA<br />
gee S-function, version 4.13 modified 98/01/27 (1998)<br />
Model:<br />
Link: Identity<br />
Variance to Mean Relation: Gaussian<br />
Correlation Structure: Exchangeable<br />
Call:<br />
gee(formula = bdi ~ bdi.pre + treatment + length + drug, id = subject,<br />
data = BtheBl, family = gaussian, corstr = "exchangeable")<br />
Summary of Residuals:<br />
Min 1Q Median 3Q Max<br />
-23.955980 -6.643864 -1.109741 4.257688 25.452310<br />
Coefficients:<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Estimation du modèle VI<br />
Beat the Blues<br />
Modèle <strong>à</strong> effets aléatoires<br />
Modèle marginal<br />
Estimate Naive S.E. Naive z Robust S.E. Robust z<br />
(Intercept) 3.0231602 2.30390185 1.31219140 2.23204410 1.3544357<br />
bdi.pre 0.6479276 0.08228567 7.87412417 0.08351405 7.7583066<br />
treatmentBtheB -2.1692863 1.76642861 -1.22806339 1.73614385 -1.2494854<br />
length>6m -0.1112910 1.73091679 -0.06429596 1.55092705 -0.0717577<br />
drugYes -2.9995608 1.82569913 -1.64296559 1.73155411 -1.7322940<br />
Estimated Scale Parameter: 81.7349<br />
Number of Iterations: 5<br />
Working Correlation<br />
[,1] [,2] [,3] [,4]<br />
[1,] 1.0000000 0.6757951 0.6757951 0.6757951<br />
[2,] 0.6757951 1.0000000 0.6757951 0.6757951<br />
[3,] 0.6757951 0.6757951 1.0000000 0.6757951<br />
[4,] 0.6757951 0.6757951 0.6757951 1.0000000<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Estimation du modèle VII<br />
Beat the Blues<br />
Modèle <strong>à</strong> effets aléatoires<br />
Modèle marginal<br />
Cette fois, les écarts-type naïfs (issus du modèle) et robustes sont<br />
proches, signe que le modèle est pertinent. <strong>Les</strong> coefficients estimés<br />
sont proches de ceux issus du modèle <strong>à</strong> effets aléatoires :<br />
> summary(fit1)<br />
Linear mixed model fit by maximum likelihood<br />
Formula: bdi ~ bdi.pre + time + treatment + drug + length + (1 | subject)<br />
Data: BtheBl<br />
AIC BIC logLik deviance REMLdev<br />
1887 1916 -935.3 1871 1866<br />
Random effects:<br />
Groups Name Variance Std.Dev.<br />
subject (Intercept) 48.300 6.9498<br />
Residual 25.129 5.0128<br />
Number of obs: 280, groups: subject, 97<br />
Fixed effects:<br />
Estimate Std. Error t value<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Estimation du modèle VIII<br />
(Intercept) 5.94371 2.24915 2.643<br />
bdi.pre 0.63819 0.07759 8.225<br />
time -0.71703 0.14606 -4.909<br />
treatmentBtheB -2.37311 1.66369 -1.426<br />
drugYes -2.79786 1.71993 -1.627<br />
length>6m 0.25639 1.63213 0.157<br />
Beat the Blues<br />
Modèle <strong>à</strong> effets aléatoires<br />
Modèle marginal<br />
Correlation of Fixed Effects:<br />
(Intr) bdi.pr time trtmBB drugYs<br />
bdi.pre -0.678<br />
time -0.264 0.023<br />
tretmntBthB -0.389 0.121 0.022<br />
drugYes -0.071 -0.237 -0.025 -0.323<br />
length>6m -0.238 -0.242 -0.043 0.002 0.158<br />
Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>
Sommaire<br />
Préliminaires<br />
Essais multicentriques<br />
Aspects calculatoires<br />
Mesures répétées<br />
Estimation du modèle IX<br />
Beat the Blues<br />
Modèle <strong>à</strong> effets aléatoires<br />
Modèle marginal<br />
Ceci parce que, implicitement, le modèle <strong>à</strong> effets aléatoires estime<br />
un écart-type unique pour l’intercept aléatoire, et est donc proche<br />
du modèle GEE estimé, qui fait la même hypothèse.<br />
La corrélation entre les observations dans le modèle GEE est<br />
estimée <strong>à</strong> 0.676. Cette estimation est très proche du coefficient de<br />
corrélation intra classe issu du modèle <strong>à</strong> effets aléatoires :<br />
ICC =<br />
σ2 u<br />
σ 2 u + σ 2 ɛ<br />
=<br />
6.9502 6.9502 = 0.658<br />
+ 5.0132 Lionel RIOU FRANÇA <strong>Les</strong> <strong>Modèles</strong> <strong>à</strong> <strong>Effets</strong> <strong>Aléatoires</strong>