CORRECTION DES EXERCICES SUR LE MODÃLE ... - Biostat.envt.fr
CORRECTION DES EXERCICES SUR LE MODÃLE ... - Biostat.envt.fr
CORRECTION DES EXERCICES SUR LE MODÃLE ... - Biostat.envt.fr
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
<strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS<br />
MIXTES<br />
Voici une correction des exercices que vous aviez à rendre. Pour chaque question, les<br />
commandes et les sorties de R apparaîtront en police courrier. Les commentaires<br />
apparaissent après le symbole #.<br />
Exercice 1<br />
La feuille de calcul Excel nommée exo1 contient deux colonnes respectivement nommée<br />
CV et cortisol. La colonne CV contient un identicateur de cheval (son nom) alors que la<br />
colonne cortisol contient des concentrations en cortisol mesurées sur chaque cheval. Vous<br />
pouvez constater que trois concentrations ont été mesurées sur chaque cheval. On admettra<br />
que les écarts entre ces trois concentrations ne sont explicables que par des erreurs de<br />
dosage.<br />
Commençons par importer les données à partir d'un chier ASCII nommé exo1.txt.<br />
> exo1 library(nlme) # charge le package nlme en mémoire<br />
> attach(exo1) # chargement de exo1 en mémoire<br />
> names(exo1) # nom des variables de exo1<br />
[1] "CV" "Cortisol"<br />
> CV plot(Cortisol∼CV) # donne le graphique des concentrations par cheval<br />
Notons Y ij la jème concentration observée sur le ième cheval. Dans cet exercice, il y a 50<br />
chevaux (i = 1 . . . 50) et 10 observations par cheval (j = 1 . . . 10). La variable réponse<br />
est la concentration en cortisol et la seule source de variation est le facteur cheval qui<br />
est un facteur à eets aléatoires (on dispose d'un échantillon de chevaux). Le modèle à<br />
considérer est donc :<br />
(1) Y ij = µ + CV i + ε ij , i = 1 . . . 50, j = 1 . . . 10.<br />
Date: 6/10/2007.<br />
1
2 <strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES<br />
Cortisol<br />
80 90 100 110 120<br />
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49<br />
Figure 1. On observe une dispersion intra-individuelle faible (les box-plot<br />
par cheval ne sont pas large) et une forte variation inter-individuelle. Globalement,<br />
les concentrations semblent groupées autour de 100. Cependant,<br />
certains chevaux ont des concentrations qui s'éloignent de cette valeur.<br />
Pour terminer la description du modèle, nous devons faire des hypothèses sur les variables<br />
aléatoires impliquées dans le modèle. Nous vérierons plus tard si ces hypothèses<br />
sont réalistes ou si nous devons envisager d'autres analyses. Nous supposerons que<br />
CV i ∼ iid N (0, σCV 2 ), ε ij ∼ iid N (0, σ 2 ) et que les CV i sont indépendantes des ε ij . Nous<br />
pouvons maintenant estimer les paramètres de ce modèle.<br />
> ana1 ana1<br />
Linear mixed-effects model fit by REML<br />
Data: exo1<br />
Log-restricted-likelihood: -875.95<br />
Fixed: Cortisol 1<br />
(Intercept)<br />
99.91606<br />
Random effects:<br />
Formula: ∼ 1 | CV<br />
(Intercept) Residual<br />
StdDev: 10.50393 0.9848313<br />
CV
<strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES 3<br />
Number of Observations: 500<br />
Number of Groups: 50<br />
Avant d'aller plus loin, vérions que nos hypothèses sont raisonnables.<br />
> plot(ana1)# graphique des résidus en fonction des valeurs prédites du modèle<br />
> qqnorm(ana1,∼ resid(.))# droite de Henry des résidus<br />
> qqnorm(ana1,∼ ranef(.))# droite de Henry des effets aléatoires (ici CV i )<br />
(Intercept)<br />
2<br />
2<br />
2<br />
Standardized residuals<br />
1<br />
0<br />
−1<br />
Quantiles of standard normal<br />
0<br />
Quantiles of standard normal<br />
1<br />
0<br />
−1<br />
−2<br />
−2<br />
−2<br />
−3<br />
80 90 100 110 120<br />
Fitted values<br />
−3 −2 −1 0 1 2<br />
Residuals<br />
−20 −10 0 10 20<br />
Random effects<br />
Figure 2. Ces graphiques représentent respectivement les résidus et les<br />
droites de Henry des résidus et des eets aléatoires. Les résidus semblent<br />
bien centrés sur zéro et ils se situent dans une bande. On ne voit pas<br />
de modication d'amplitude des résidus en fonction des valeurs prédites<br />
par le modèle. Il semble donc que le modèle qui décrit la moyenne est<br />
raisonnable et que la variance des résidus de change pas avec les facteurs.<br />
Mis à part les eets de bords inévitables, les droites de Henry montrent<br />
des points globalement alignés. Les hypothèses de normalité semblent donc<br />
raisonnables. Globalement, les hypothèses que nous avons faites semblent<br />
réalistes.<br />
Nous pouvons maintenant répondre aux questions.<br />
(1) Donner une estimation de l'écart-type de l'erreur de dosage.<br />
Cet écart-type est celui des résidus du modèle. Il mesure la dispersion intraindividuelle<br />
; on lit directement sur la sortie de l'analyse : √ ̂σ2 = ̂σ = 0.9848313.<br />
(2) Donner un intervalle de prédiction à 95% des concentrations observables sur le<br />
cheval 1.<br />
Il s'agit d'un intervalle de prédiction conditionnel. Comme nous l'avons vu en<br />
cours, on cherche un intervalle [A, B] tel que P (A ≤ Y ≤ B|CV 1 ) = 0.95. Or,<br />
conditionnellement à CV 1 nous voyons que la concentration en cortisol Y suit une<br />
loi N (µ + CV 1 , σ 2 ) . On cherche donc un intervalle qui contient 95% des réalisations<br />
d'une loi normale. Nous savons que cet intervalle est approximativement de<br />
la forme [µ + CV 1 − 2σ; µ + CV 1 + 2σ]. Or aucun des éléments intervenant dans cet
4 <strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES<br />
intervalle n'est connu. En les remplaçant par leur estimation et en négligeant les incertitudes<br />
sur ces estimations nous obtenons l'intervalle [ˆµ+ĈV 1−2ˆσ; ˆµ+ĈV 1+2ˆσ].<br />
D'après l'analyse, ˆµ = 99.91606, ̂σ = 0.9848313 et il manque ĈV 1. ĈV 1 est la prédiction<br />
de l'eet aléatoire CV 1 que nous pouvons obtenir avec la commande<br />
> random.effects(ana1)# on peut aussi utiliser la commande ranef(ana1)<br />
(Intercept)<br />
1 -9.2928910<br />
2 -19.8725907<br />
3 0.4715255<br />
4 0.3566265 . . .<br />
D'où ĈV 1 = −9.2928910 à partir duquel nous pouvons déduire l'intervalle :<br />
[99.91606−9.2928910−2×0.9848313; 99.91606−9.2928910+2×0.9848313] = [88.65; 92.59].<br />
(3) Donner un intervalle de prédiction à 95% des concentrations observables dans la<br />
population des chevaux.<br />
Il s'agit d'un intervalle de prédiction marginal. Comme nous l'avons vu en cours,<br />
on cherche un intervalle [A, B] tel que P (A ≤ Y ≤ B) = 0.95. Or, d'après le modèle<br />
1 nous voyons que la concentration en cortisol Y suit une loi N (µ, σ 2 CV + σ2 ) .<br />
On cherche donc un intervalle qui contient 95% des réalisations d'une loi normale.<br />
Nous savons que cet intervalle est approximativement de la forme [µ −<br />
2 √ σ 2 CV + σ2 ; µ + 2 √ σ 2 CV + σ2 ]. L'analyse nous donne une estimation de σ 2 CV =<br />
10.50393 2 . En reprenant un raisonnement similaire à la question précédente nous<br />
déduisons l'intervalle :<br />
[99.91606−2 √ 10.50393 2 + 0.9848313 2 ; 99.91606+2 √ 10.50393 2 + 0.9848313 2 ] = [78.82; 121.02].<br />
Exercice 2<br />
Une étude à été réalisée an de comparer et de sélectionner le régime alimentaire<br />
qui donne la croissance la plus importante chez le porc. La feuille exo2 contient cinq<br />
colonnes qui correspondent respectivement à l'identication de l'individu (Ind), au sexe<br />
de l'individu (Sexe), aux croissances par jour obtenues avec les régimes R1, R2 et R3. Il<br />
est probable que vous aurez à structurer le chier de données autrement pour faire les<br />
analyses.<br />
Le chier exo2.txt n'est pas structuré avec une variable par colonne : la croissance<br />
obtenue sur chaque porc avec les régimes R1, R2, R3 est représentée sur 3 colonnes.<br />
Nous devons donc créer deux colonnes : une colonne GMQ qui contiendra les croissances
<strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES 5<br />
obtenue avec les 3 régimes et une colonne Régime qui donnera le numéro du régime correspondant.<br />
Enn, les autres variables du chier doivent être complétées en conséquence. Il<br />
existe plusieurs possibilités pour structurer le chier de données de cette façon. On peut<br />
par exemple utiliser les commandes "copier"-"coller" d'Excel ou encore créer directement<br />
les variables dans R. C'est cette dernière méthode que nous utiliserons. Commençons par<br />
importer les données à partir d'un chier ASCII nommé exo2.txt.<br />
> exo2 attach(exo2) # chargement de exo2 en mémoire<br />
> names(exo2) # nom des variables de exo2<br />
[1] "Ind" "Sexe" "R1" "R2" "R3"<br />
GMQ
6 <strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES<br />
GMQ reg sexe ind<br />
1 108.36 1 1 1<br />
2 109.94 1 1 2<br />
3 112.06 1 1 3<br />
4 94.79 1 1 4 . . .<br />
Le graphique 3 permet de bien voir les données et de répondre partiellement aux questions<br />
posées (il faut la couleur pour voir quelque chose).<br />
>plot(ex2)<br />
1 2 3<br />
sexe/ind<br />
2/60<br />
2/33<br />
2/47<br />
2/34<br />
2/32<br />
2/36<br />
2/54<br />
2/55<br />
2/50<br />
2/37<br />
2/52<br />
2/58<br />
2/56<br />
2/39<br />
2/51<br />
2/57<br />
2/49<br />
2/43<br />
2/42<br />
2/41<br />
2/45<br />
2/40<br />
2/46<br />
2/44<br />
2/59<br />
2/53<br />
2/35<br />
2/38<br />
2/48<br />
2/31<br />
1/24<br />
1/10<br />
1/23<br />
1/28<br />
1/29<br />
1/3<br />
1/1<br />
1/17<br />
1/12<br />
1/16<br />
1/2<br />
1/7<br />
1/11<br />
1/19<br />
1/15<br />
1/13<br />
1/26<br />
1/14<br />
1/9<br />
1/4<br />
1/22<br />
1/8<br />
1/20<br />
1/6<br />
1/5<br />
1/21<br />
1/27<br />
1/25<br />
1/30<br />
1/18<br />
60 80 100 120<br />
GMQ<br />
Figure 3. Le GMQ est représenté sur l'axe des abscisses et les individus<br />
classés par sexe sur l'axe des ordonnées. Pour chaque individu, on observe<br />
trois GMQ représentés avec des couleurs diérentes selon le régime utilisé.<br />
Pour les deux sexes, et même presque pour chaque individu, le GMQ obtenu<br />
avec le régime 1 semble inférieur à celui obtenu avec le régime 2 qui est lui<br />
même inférieur à celui obtenu avec le régime 3. Les écarts entre les GMQ<br />
des 3 régimes semblent plus faibles chez les mâles (sexe=1) que chez les<br />
femelles (sexe=2). Enn, pour le même régime, les mâles semblent avoir<br />
des GMQ supérieurs à ceux des femelles.<br />
Nous avons besoin d'un modèle pour pouvoir répondre aux questions posées. Commençons<br />
par noter Y ijk le GMQ (ie la croissance) obtenue avec le régime k du jème individu de sexe<br />
i. L'analyse de la structure que nous avons faite pour construire le jeu de données nous<br />
conduit au modèle :<br />
(2) Y ijk = µ + S i + R k + (S ∗ R) ik + Ind j /S i + ε ij , i = 1 . . . 2, j = 1 . . . 30, k = 1 . . . 3.
<strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES 7<br />
Faisons maintenant les hypothèses sur les variables aléatoires impliquées dans le modèle.<br />
Nous supposerons que pour chaque sexe, les individus sont indépendants ; c'est à dire<br />
pour i = 1 et i = 2, Ind j /S i ∼ iid N (0, σ 2 Ind ), ε ijk ∼ iid N (0, σ 2 ) et que les Ind j /S i sont<br />
indépendantes des ε ijk . Nous pouvons maintenant estimer les paramètres de ce modèle<br />
que nous devons déclarer dans R. Mises à part les ε ijk , les seules variables aléatoires à<br />
droite du signe = sont les individus Ind j /S i . La partie random du modèle sera donc<br />
random=∼ 1 | ind. Il ne faut pas mettre ici le sexe qui est un facteur à eets xes ! La<br />
partie xe du modèle µ + S i + R k + (S ∗ R) ik peut être codée 1+sexe+reg+sexe:reg ou<br />
plus simplement sexe*reg. Il ne faut pas mettre le facteur individu dans cette partie.<br />
Y ijk<br />
= µ + S i + R k + (S ∗ R) ik<br />
} {{ }<br />
partie fixe du modèle<br />
+ Ind j /S<br />
} {{ } i + ε ijk<br />
partie aléatoire du modèle<br />
GMQ ∼ { 1+sexe+reg+sexe:reg }} {<br />
, random { }} =∼ 1|ind {<br />
.<br />
,<br />
}{{}<br />
résidu<br />
On en déduit la commande :<br />
>contrasts(sexe) contrasts(reg)
8 <strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES<br />
Number of Groups: 60<br />
> anova(ana2) numDF denDF F-value p-value<br />
(Intercept) 1 116 4827.304 qqnorm(ana2,∼ ranef(.))# droite de Henry des effets aléatoires (ici Ind j /S i )<br />
3<br />
(Intercept)<br />
2<br />
2<br />
2<br />
Standardized residuals<br />
1<br />
0<br />
−1<br />
Quantiles of standard normal<br />
1<br />
0<br />
−1<br />
Quantiles of standard normal<br />
1<br />
0<br />
−1<br />
−2<br />
−2<br />
−2<br />
−3<br />
60 80 100 120<br />
Fitted values<br />
−10 −5 0 5 10<br />
Residuals<br />
−20 −10 0 10 20<br />
Random effects<br />
Figure 4. Ces graphiques représentent respectivement les résidus et les<br />
droites de Henry des résidus et des eets aléatoires. Globalement, les hypothèses<br />
que nous avons faites semblent réalistes.<br />
Remarque sur les contrastes : Comme nous l'avons vu en cours, l'écriture du modèle<br />
(2) n'est pas unique. Les eets diérentiels des facteurs et leurs interactions (ie les S i ,<br />
R k , (S ∗ R) ik ) peuvent se décomposer en prenant comme référence le premier niveau de<br />
chaque facteur (c'est l'option par défaut de R) ou en leur imposant d'avoir une somme<br />
nulle. C'est cette dernière option que j'ai choisie. Dans cette situation, µ est bien l'eet<br />
moyen général. Avec l'option par défaut, µ est la moyenne de population des individus<br />
de sexe 1 pour le régime 1. Mis à part pour le test sur µ, les valeurs de P de la table<br />
d'analyse de variance ne sont pas aectées par un choix particulier de contrastes.<br />
(1) Le sexe a t-il une inuence (signicative) sur la croissance ?<br />
Comme vous le savez, nous devons tout d'abord interpréter les interactions de<br />
plus grand ordre avant d'interpréter les eets simples. Le test sur l'interaction<br />
sexe:regime donne une valeur de P < 0.0001. Ce qui implique que les réponses
<strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES 9<br />
moyennes varient à la fois en fonction du sexe et du régime. Nous en déduisons<br />
que les croissances des mâles et des femelles ne sont pas identiques.<br />
(2) Les trois régimes donnent ils des croissances identiques ?<br />
En reprenant le même raisonnement que précédemment, nous pouvons armer<br />
que les croissances obtenues avec les trois régimes sont diérentes.<br />
(3) Est il nécessaire de choisir le régime en fonction du sexe ?<br />
Cette question impose une analyse plus approfondie de l'interaction sexe:reg.<br />
L'interaction signicative signale que les écarts entres les régimes diérent chez<br />
les mâles et les femelles. Cependant, deux situations peuvent être rencontrées :<br />
soit l'ordre des régimes est le même pour les deux sexes, ce qui signie que le<br />
meilleur régime pour les mâles est aussi le meilleur régime pour les femelles, soit<br />
l'ordre est diérent et dans ce cas, il est nécessaire de choisir le régime en fonction<br />
du sexe. Le graphique 3 suggère la réponse à cette question : le régime 3 donne<br />
de meilleurs résultats (GMQ plus grands) chez les mâles et les femelles même si<br />
l'augmentation de GMQ obtenu avec le régime 3 est plus faible chez les mâles que<br />
chez les femelles.<br />
Une solution brutale pour comparer les ordres est de faire une analyse par sexe<br />
et d'eectuer une comparaison multiple des régimes avec par exemple, un test de<br />
Tukey. Une solution plus élégante (qui requiert une bonne connaissance de R) est<br />
d'aller chercher les paramètres du modèle global et d'eectuer des tests sur ces<br />
paramètres. Par souci de simplicité, nous adopterons la première solution :<br />
>ana21 ana21<br />
Linear mixed-effects model fit by REML<br />
Data: ex2<br />
Subset: sexe == 1<br />
Log-restricted-likelihood: -301.4234<br />
Fixed: GMQ ∼ 1+ reg<br />
(Intercept) reg[S.1] reg[S.2]<br />
107.2506667 -4.1980000 0.3323333 # on voit ici que moy reg 3 > moy reg<br />
2 > moy reg 1. On verra avec le test de Tuckey si ces différence sont<br />
significatives<br />
Random effects:
10 <strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES<br />
Formula: ∼ 1 | ind<br />
(Intercept) Residual<br />
StdDev: 10.31774 4.502676<br />
Number of Observations: 90 Number of Groups: 30<br />
> TukeyHSD(aov(ana21),"reg") # test de Tukey pour sur les résultats de<br />
l'analyse ana1<br />
Tukey multiple comparisons of means<br />
95% family-wise confidence level<br />
Fit: aov(formula = ana21)<br />
$reg<br />
diff lwr upr p adj<br />
2-1 14.283167 8.1874379 20.37890 0.0000003 # moy reg2 > moy reg1<br />
3-1 20.985333 14.8896046 27.08106 0.0000000 # moy reg3 > moy reg1<br />
3-2 6.702167 0.6064379 12.79790 0.0272727 # moy reg3 > moy reg2<br />
>ana22 ana22<br />
Linear mixed-effects model fit by REML<br />
Data: ex2<br />
Subset: sexe == 2<br />
Log-restricted-likelihood: -306.0581<br />
Fixed: GMQ ∼ 1+ reg<br />
(Intercept) reg[S.1] reg[S.2]<br />
96.723333 -19.314333 4.721667 # on voit ici que moy reg 3 > moy reg 2<br />
> moy reg 1. On verra avec le test de Tuckey si ces différence sont<br />
significatives<br />
Random effects:<br />
Formula: ∼ 1 | ind<br />
(Intercept) Residual<br />
StdDev: 11.76228 4.581902<br />
Number of Observations: 90
<strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES 11<br />
Number of Groups: 30<br />
> TukeyHSD(aov(ana22),"reg") # test de Tukey pour sur les résultats de<br />
l'analyse ana2<br />
Tukey multiple comparisons of means<br />
95% family-wise confidence level<br />
Fit:<br />
aov(formula = ana22)<br />
$reg<br />
diff lwr upr p adj<br />
2-1 14.283167 8.1874379 20.37890 0.0000003 # moy reg2 > moy reg1<br />
3-1 20.985333 14.8896046 27.08106 0.0000000 # moy reg3 > moy reg1<br />
3-2 6.702167 0.6064379 12.79790 0.0272727 # moy reg3 > moy reg2<br />
Si nous faisons le bilan, nous voyons que pour les deux sexes, le régime 3 est celui<br />
qui donne signicativement des GMQ moyens plus élevés que les autres régimes.<br />
Il n'est donc pas nécessaire de choisir le régime en fonction du sexe.<br />
(4) Pour une femelle, quel est le régime qui permet d'obtenir la meilleure croissance ?<br />
On a déjà répondu à cette question à la question précédente. Le régime 3 est le<br />
meilleur et ceci quel que soit le sexe.<br />
Exercice 3<br />
Une étude à été réalisée an de comparer et de sélectionner le régime alimentaire qui<br />
donne la croissance la plus importante chez le porc. La feuille exo3 contient quatre<br />
colonnes qui correspondent respectivement à l'identication de l'individu (Ind), au régime<br />
donné à chaque individu (Regime), à l'âge en jour auquel une pesée a été réalisée (Age)<br />
et au poids correspondant (Poids).<br />
Comme pour les exercices précédents, on importe les données à partir d'un chier ASCII<br />
nommé exo3.txt.<br />
> exo3 library(nlme) # charge le package nlme en mémoire<br />
> attach(exo3) # chargement de exo3 en mémoire<br />
> names(exo3) # nom des variables de exo3<br />
[1] "Ind" "Regime" "Age" "Poids"<br />
> Ind
12 <strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES<br />
> Reg ex3 # le jeu de données est donc structuré comme suit :<br />
Grouped Data: Poids ∼ Age | Reg/Ind<br />
Poids Age Reg Ind<br />
1 42.91 1 1 1<br />
2 47.72 20 1 1<br />
3 46.14 30 1 1<br />
4 58.84 50 1 1<br />
5 66.42 90 1 1<br />
6 36.87 1 1 2. . .<br />
>plot(ex3) # représentation graphique du jeu de données<br />
Le graphique montre que pour chaque individu l'évolution du poids en fonction de l'âge<br />
varie à peu près linéairement. On en déduit que si Y ijk est le poids du jème individu à<br />
l'âge age ijk qui a reçu le régime i alors<br />
(3) Y ijk = A ij + B ij age ijk + ε ijk , i = 1 . . . 2, j = 1 . . . n i , k = 1 . . . 5,<br />
avec n 1 = 28 et n 2 = 36.<br />
Tel qu'il est écrit, ce modèle dit simplement que l'ordonnée à l'origine et la pente de<br />
la droite change avec l'individu et le régime. Il est nécessaire de décrire plus précisément<br />
comment ces paramètres individuels varient. Nous supposerons que le couple<br />
(A ij , B ij ) ∼ iid N ((a + α i , b + β i ), Σ) où encore que<br />
(4)<br />
{<br />
Aij = a + α i + η A ij<br />
B ij = b + β i + η B ij, et (η A ij, η B ij) ∼ iid N ((0, 0), Σ) .<br />
Seules les moyennes de population des ordonnées à l'origine et des pentes dépendent du<br />
régime. Au sein de chaque régime, la variation autour de ces moyennes ne sont donc que
<strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES 13<br />
Poids<br />
70<br />
60<br />
50<br />
40<br />
30<br />
70<br />
60<br />
50<br />
40<br />
30<br />
70<br />
60<br />
50<br />
40<br />
30<br />
70<br />
60<br />
50<br />
40<br />
30<br />
1/14 1/12 1/8 1/25 1/1 1/23 1/3 1/27 1/10 1/2 1/9<br />
2/54 2/31 2/63 1/7 1/17 1/16 1/19 1/18 1/26 1/15<br />
2/58 2/41 2/51 2/62 2/30 2/50 2/29 2/33 2/55 2/43 2/36<br />
2/45 2/59 2/49 2/60 2/35 2/47 2/38 2/44 2/39 2/40 2/57<br />
2/61 2/34 2/48 2/46 2/53 2/52 2/56 2/32 2/37 2/42 2/64<br />
0 4080<br />
0 4080<br />
0 4080<br />
0 4080<br />
0 4080<br />
0 4080<br />
Age<br />
0 4080<br />
0 4080<br />
1/24 1/13 1/11 1/22 1/4 1/21 1/28 1/6 1/20<br />
0 4080<br />
1/5<br />
0 4080<br />
70<br />
60<br />
50<br />
40<br />
30<br />
70<br />
60<br />
50<br />
40<br />
30<br />
Figure 5. Chaque petit graphique représente pour un individu l'évolution<br />
du poids en fonction de son âge. Les individus sont rangés par régime. Le<br />
premier chire en haut de chaque graphique donne le numéro de régime<br />
alors que le second précise le numéro de l'individu.<br />
des variations inter-individuelles. Il reste à préciser que nous supposerons que ε ijk ∼ iid<br />
N (0, σ 2 ) et que les (A ij , B ij ) sont indépendantes des ε ijk . En réécrivant le modèle (3) à<br />
l'aide de la décomposition (4) nous obtenons le nouveau modèle :<br />
(5) Y ijk = a + α i + b × age ijk + β i × age<br />
} {{ ijk<br />
}<br />
partie fixe du modèle<br />
+ ηij A + ηij B × age ijk<br />
} {{ }<br />
+ ε ijk<br />
partie aléatoire du modèle<br />
}{{}<br />
résidu<br />
Nous pouvons maintenant estimer les paramètres de ce modèle qui dans R se traduit<br />
terme à terme par<br />
Poids ∼ 1 + Reg + Age + Reg:Age, random =∼ 1 + Age|Ind<br />
} {{ }<br />
partie fixe du modèle<br />
} {{ }<br />
partie aléatoire du modèle<br />
Les commandes suivantes permettent d'estimer les paramètres du modèle.<br />
>ana3 ana3<br />
Linear mixed-effects model fit by REML<br />
Data: ex3<br />
Log-restricted-likelihood: -1002.480<br />
Fixed: Poids ∼ Reg * Age<br />
.<br />
.
14 <strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES<br />
(Intercept) Reg2 Age Reg2:Age<br />
40.31147234 -0.63741355 0.29099650 -0.07844144<br />
Random effects:<br />
Formula: ∼ 1 + Age | Ind<br />
Structure: General positive-definite, Log-Cholesky parametrization<br />
StdDev Corr<br />
(Intercept) 5.673468e-07 (Intr)<br />
Age 3.817842e-02 -0.312<br />
Number of Observations: 320<br />
Residual 5.214180e+00<br />
Number of Groups: 64<br />
> anova(ana3) numDF denDF F-value p-value<br />
(Intercept) 1 254 20228.381
(6)<br />
<strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES 15<br />
Comme a + α 1 + b × 40 + β 1 × 40 ne contient aucun terme aléatoire, sa variance est<br />
nulle et V (Y 40 ) se réduit donc au dernier terme de l'égalité précédente. Un petit<br />
calcul (que nous avons déjà fait en cours) montre que<br />
V ( η A + η B × 40 + ε ) = V(η A ) + V(η B ) × 40 2 + 2 × 40 × Cov(η A , η B ) + V(ε).<br />
Les estimations des paramètres du modèle (5) donnent â + α 1 = 40.31147234,<br />
̂b + β 1 = 0.29099650 et une estimation du poids moyen est donc 40.31147234 +<br />
0.29099650 × 40 = 51.95.<br />
De même, ̂V(ηA ) = (5.673468 × 10 −7 ) 2 , ̂V(ηB ) = (3.817842 × 10 −2 ) 2 , ̂V(ε) =<br />
(5.214180) 2 et enn ̂ Cov(ηA , η B ) = −0.312 × 5.673468 × 10 −7 × 3.817842 × 10 −2 =<br />
−6.758046 × 10 −9 et une estimation de V (Y 40 ) est donc<br />
̂V (Y 40 ) = (5.673468 × 10 −7 ) 2 + 40 2 × (3.817842 × 10 −2 ) 2<br />
+(5.214180) 2 + 2 × 40 × (−6.758046 × 10 −9 ) = 29.51982.<br />
Une estimation de la distribution du poids à 40 jours des individus qui reçoivent<br />
le régime 1 est donc : N (51.95; 29.52).<br />
(3) Les distributions des poids à la naissance des groupes de porcs qui reçoivent les<br />
régimes 1 et 2 sont elles comparables ? Les poids moyens à la naissance sont<br />
donnés par les ordonnées à l'origine moyennes. Le test qui compare les ordonnées<br />
à l'origine des deux groupes de régime est celui réalisé à la deuxième ligne de la<br />
table d'analyse de variance (test sur Reg) et il donne une valeur de P < .0001. Les<br />
poids moyens à la naissance des deux groupes de régime sont donc signicativement<br />
diérents.<br />
(4) On dénit le GMQ comme le gain de poids d'un animal en une journée. Donner<br />
la distribution des GMQ pour chaque régime. Les pentes des droites peuvent aussi<br />
être interprétées comme des GMQ. Nous avons supposé que les pentes des droites<br />
étaient normalement distribuées. Aussi sut-il de lire la sortie de notre analyse<br />
pour obtenir les estimations désirées : une estimation de la distribution des GMQ<br />
pour le régime 1 est N (0.29; (3.817842 × 10 −2 ) 2 ) alors que pour le régime 2 nous<br />
obtenons la distribution N (0.29 − 0.078; (3.817842 × 10 −2 ) 2 ).<br />
Exercice 4<br />
Remarques préliminaires : Cet dernier exercice est moins scolaire que les trois premiers<br />
et il se rapproche de problèmes que vous allez devoir traiter. N'oubliez pas qu'une<br />
bonne analyse descriptive avec beaucoup de graphiques est souvent gage de pertinence et<br />
d'ecacité. Soyez simple dans <strong>LE</strong> modèle que vous envisagez : il est possible de répondre<br />
à toute les questions en n'utilisant qu'un seul modèle. Ici, il n'est pas utile d'essayer de
16 <strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES<br />
construire un modèle avec des variations non linéaire au cours du temps. Attention, le<br />
chier de données n'est pas organisé de façon à permettre une analyse dans R.<br />
Les femmes enceintes ont des risques d'anémie pendant et après la grossesse. Un groupe<br />
de chercheurs s'est emparé du sujet et a cherché à documenter si une supplémentation<br />
en fer faire pouvait décroître les risques d'anémie pendant la grossesse. Cette étude avait<br />
plusieurs parties, en particulier, la concentration en fer dans le serum a été mesurée.<br />
Cette concentration est une mesure des réserves totales de l'organisme en fer et elle est<br />
directement liée au risque d'anémie. L'objet de l'analyse que vous allez conduire est de<br />
quantier l'inuence de la supplémentation en fer sur les concentrations de fer dans le<br />
sérum.<br />
Les chercheurs ont recruté 120 femmes enceintes de 2 mois. Ces femmes ont été assignées<br />
de façon aléatoire dans 3 groupes (40 femmes par groupe). A partir du quatrième mois de<br />
grossesse toutes les femmes incluses dans l'étude ont reçu une boite de pilules qu'elles<br />
devait prendre chaque jour. Les pilules des femmes du groupe 1 contenaient un placebo,<br />
celles des femmes du groupe 2 contenaient une dose faible de fer alors que celles du groupe<br />
3 étaient fortement dosées en fer. Tous les mois de l'étude, un prélèvement de sang a été<br />
réalisé sur chaque femme et la concentration de fer dans le sérum (en ng/ml) a été dosée.<br />
Au moment de l'inclusion, il a été demandé à ces femmes si elles avaient déjà eu une<br />
anémie, et si elles avaient des enfants. Il a été montré par d'autres études que pendant<br />
les 4 premiers mois de grossesse, c'est à dire pendant les mois 2, 3 et 4, il n'y a pas<br />
de variation importante de concentration en fer dans le sérum. Durant cette période, les<br />
concentrations oscillent autour d'un niveau de base qui mesure la concentration normale.<br />
Si des changements de concentrations doivent se produire, ils sont attendus à partir du<br />
5 ième mois.<br />
Les données de l'étude sont consignées dans la feuille nommée exo4 qui contient 11<br />
colonnes avec des informations sur :<br />
col A : l'identication de la femme,<br />
col B : d'autres enfants (oui/non),<br />
col C : des épisodes d'anémie antérieurs (oui/non),<br />
col D : le numéro du groupe de traitement auquel la femme a été assignée,<br />
col E-K : les concentrations en fer dans le sérum du deuxième au huitième mois de grossesse<br />
respectivement.<br />
Après avoir réorganisé le chier exo4.txt avec une colonne par variable, nous avons<br />
importé ces données, déclaré les facteurs et organisé les données dans un jeu de données
<strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES 17<br />
R. Voici la liste des commandes utilisées (sans détail, car vous êtes maintenant aguerris à<br />
cet exercice) :<br />
> exo4 attach(exo4)<br />
> names(exo4)<br />
[1] "Ind" "autres_enfants" "anemie" "Traitement"<br />
[5] "Temps" "Fer"<br />
> Ind autres_enfants anemie Traitement 4, la variable t_4 devient positive et des variations de<br />
concentrations en fer deviennent autorisées. La pente b mesure alors le sens et<br />
l'amplitude des variations linéaires du fer après 4 mois de grossesse. Pour créer<br />
cette variable, il sut de taper :<br />
> T_44)*(Temps-4)
18 <strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES<br />
f(t)<br />
36 38 40 42 44<br />
2 3 4 5 6 7 8<br />
Variable t<br />
Figure 6. Ce graphique montre la fonction f(t) = 40 + b(t − 4) + pour<br />
b = +1 en vert (c'est la courbe qui monte), b = 0 en rouge (c'est la courbe<br />
horizontale) et enn pour b = +1 en pointillé (courbe qui descend).<br />
Nous pouvons maintenant eectuer l'analyse de la structure de ces données. La<br />
table de contingence des facteurs autres_enfants, anemie et Traitement va nous<br />
aider à comprendre l'organisation de ces facteurs :<br />
> table(Traitement,anemie,autres_enfants)<br />
, , autres_enfants = non<br />
anemie<br />
Traitement non oui<br />
1 105 49<br />
2 84 70<br />
3 91 49<br />
, , autres_enfants = oui<br />
anemie<br />
Traitement non oui<br />
1 98 28<br />
2 77 49<br />
3 77 63<br />
Ces trois facteurs sont donc croisés et les eectifs représentés dans les cellules de ces<br />
tables de contingence représentent des individus. Chaque individu est donc niché à<br />
l'intérieur du croisement des facteurs autres_enfants, anemie et Traitement. Ces<br />
trois facteurs sont à eets xes, seul le facteur individu est à eets aléatoires.<br />
Par ailleurs, pour chaque individu on dispose d'une évolution des concentrations<br />
en fer avec le mois de grossesse. An de rendre le graphique lisible, nous nous<br />
restreindrons à représenter cette évolution en fonction du traitement.
<strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES 19<br />
> ex4 plot(ex4)<br />
Le graphique (1) nous indique de façon approximative le sens de variation des<br />
2468<br />
2468<br />
2468<br />
2468<br />
2468<br />
2468<br />
2468<br />
2468<br />
2468<br />
2468<br />
2468<br />
2468<br />
3/117 3/113/883/823/104<br />
3/108 3/102 3/833/92 3/1093/84 3/116 3/120 3/118 3/101 3/963/873/943/107<br />
3/903/95 3/110 3/105 3/106<br />
80<br />
60<br />
40<br />
20<br />
2/712/452/492/552/622/522/652/613/853/1193/893/1003/93/103 3/112 3/1143/973/1153/983/1113/863/993/913/81<br />
2/432/642/702/562/592/512/422/722/542/662/532/732/692/502/762/602/672/742/412/582/772/792/632/44<br />
80<br />
60<br />
40<br />
20<br />
Fer<br />
80<br />
60<br />
40<br />
20<br />
1/251/231/261/41/211/111/321/391/71/381/131/51/121/201/141/102/752/782/462/682/482/802/472/57<br />
1/271/1 1/91/191/301/221/171/151/291/361/351/371/241/401/331/341/281/181/3 1/81/161/61/311/2<br />
80<br />
60<br />
40<br />
20<br />
80<br />
60<br />
40<br />
20<br />
2468<br />
2468<br />
2468<br />
2468<br />
2468<br />
2468<br />
2468<br />
2468<br />
2468<br />
2468<br />
2468<br />
2468<br />
Temps<br />
Figure 7. Chaque petit graphique représente pour une femme l'évolution<br />
des concentration en fer en fonction de son mois de grossesse. Le premier<br />
chire en haut de chaque graphique donne le numéro du traitement alors<br />
que le second précise le numéro de l'individu. Les femmes qui prennent le<br />
traitement 3 ont des courbes qui montent, le traitement 2 semble conduire à<br />
des courbes qui montent un peu moins, enn le traitement 1 semble donner<br />
des courbes qui descendent.<br />
concentrations en fer avec le traitement. Comme nous savons que ces variations<br />
doivent commencer à partir du quatrième mois de grossesse, nous supposerons en<br />
première approximation que la forme générale de chaque courbe peut être décrite<br />
avec une fonction f(t). L'examen des résidus de ce modèle permettra d'inrmer
20 <strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES<br />
(ou de conrmer) cette approximation. Notons Y ijklm la concentration en fer de la<br />
femme l au mois de grossesse t m avec le Traitement i, le niveau j du facteur anemie<br />
et le niveau k du facteur autres_enfants. Nous pouvons alors écrire le modèle<br />
(7) Y ijklm = B ijkl + A ijkl (t m − 4) +<br />
+ ε ijklm .<br />
(8)<br />
(9)<br />
(10)<br />
Ici, B ijkl représente la concentration basale en fer et A ijkl mesure la croissance (ou<br />
la décroissance) de ces concentrations après t m = 4. Il reste à préciser comment ces<br />
paramètres" individuels varient en fonction des facteurs autres_enfants, anemie<br />
et Traitement et individu. Nous supposerons que<br />
(<br />
Aijkl<br />
B ijkl<br />
)<br />
∼ iid N<br />
(( m<br />
a<br />
ijk<br />
m b ijk<br />
)<br />
, Σ<br />
En d'autres termes, les facteurs n'agissent que sur les moyennes des sous-population<br />
déterminées par leurs croisements. Toute variation à l'intérieur de ces souspopulation<br />
est assimilée à de la variabilité inter-individuelle. Ceci n'est pas encore<br />
assez précis. En eet, nous n'avons pas encore dit comment les moyennes m a ijk<br />
et m b ijk varient en fonction des facteurs. On est ici dans une situation typique<br />
d'analyse de variance à trois facteurs croisés. Comme d'habitue, nous allons tout<br />
d'abord écrire le modèle complet (ie avec toutes les interactions). En reprenant<br />
les notations classiques d'analyse de la variance et en notant N l'eet du facteur<br />
anémie, E l'eet du facteur autres_enfants, T l'eet du facteur Traitement et<br />
en juxtaposant les noms des facteurs pour symboliser les interactions entre ces<br />
facteurs, nous obtenons :<br />
⎧<br />
⎪⎨<br />
⎪⎩<br />
A ijkl<br />
B ijkl<br />
( η<br />
a<br />
ijkl<br />
η b ijkl<br />
)<br />
)<br />
.<br />
= µ a + Ti a + Nj a + Ek a + T N ij a + T Eik a + NEa jk + T NEa ijk + ηa ijkl ,<br />
= µ b +<br />
((<br />
Ti b + N<br />
) j b +<br />
)<br />
Ek b + T N ij b + T Eik b + NEb jk + T NEb ijk + ηb ijkl ,<br />
0<br />
∼ iid N , Σ .<br />
0<br />
En insérant dans le modèle (7) les expressions de A et de B nous pouvons le réécrire<br />
après quelques réarrangements sous la forme<br />
Y ijklm<br />
= µ b + T b<br />
i + N b j + E b k + T N b ij + T E b ik + NEb jk + T NEb ijk<br />
+ ( µ a + T a<br />
i + N a j + E a k + T N a ij + T E a ik + NEa jk + T NEa ijk)<br />
× (tm − 4) +<br />
+η b ijkl + ηa ijkl × (t m − 4) +<br />
+ε ijklm .<br />
Les deux premières lignes à droite du signe = du modèle (10) contiennent les effets<br />
xes du modèle, la troisième ligne contient les eets aléatoires enn, le terme<br />
résiduel est sur la dernière ligne. L'opérateur ∗ va simplier l'écriture de ce modèle<br />
dans R. En eet, les deux premières lignes peuvent s'écrire :<br />
Fer ∼ Traitement*anemie*autres_enfants*T_4.
<strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES 21<br />
Nous en déduisons la commande R :<br />
>ana4 ana4<br />
Linear mixed-effects model fit by REML<br />
Data: exo4<br />
Log-restricted-likelihood: -2466.359<br />
Fixed: Fer ∼ Traitement * anemie * autres_enfants * T_4<br />
(Intercept) 45.1586061<br />
Traitement2 1.7897273<br />
Traitement3 -0.5467179<br />
anemieoui -4.9521126<br />
autres_enfantsoui -0.3598398<br />
T_4 -2.9890242<br />
Traitement2:anemieoui -4.3791299<br />
Traitement3:anemieoui 2.6284063<br />
Traitement2:autres_enfantsoui -1.8580803<br />
Traitement3:autres_enfantsoui -2.9946103<br />
anemieoui:autres_enfantsoui 4.0644827<br />
Traitement2:T_4 5.8656076<br />
Traitement3:T_4 8.2797795<br />
anemieoui:T_4 -0.3953784<br />
autres_enfantsoui:T_4 0.6213879<br />
Traitement2:anemieoui:autres_enfantsoui -0.8698872<br />
Traitement3:anemieoui:autres_enfantsoui -2.2371033<br />
Traitement2:anemieoui:T_4 -0.1163686<br />
Traitement3:anemieoui:T_4 1.4813244<br />
Traitement2:autres_enfantsoui:T_4 -1.8263514<br />
Traitement3:autres_enfantsoui:T_4 0.2921957<br />
anemieoui:autres_enfantsoui:T_4 -0.2332807<br />
Traitement2:anemieoui:autres_enfantsoui:T_4 2.3343429<br />
Traitement3:anemieoui:autres_enfantsoui:T_4 -1.3644486<br />
Random effects:<br />
Formula: ∼ 1 + T_4 | Ind<br />
Structure: General positive-definite, Log-Cholesky parametrization<br />
StdDev Corr<br />
(Intercept) 5.737072 (Intr)<br />
T_4 1.609082 0.092<br />
Residual 3.306515<br />
Number of Observations: 840<br />
Number of Groups: 120<br />
> anova(ana4)
22 <strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES<br />
numDF denDF F-value p-value<br />
(Intercept) 1 708 6205.109 qqnorm(ana4,∼ ranef(.))<br />
Il faudrait en outre s'assurer que la variance des eets aléatoires du modèle ne<br />
(Intercept)<br />
T_4<br />
3<br />
2<br />
2<br />
2<br />
Standardized residuals<br />
1<br />
0<br />
−1<br />
Quantiles of standard normal<br />
0<br />
Quantiles of standard normal<br />
1<br />
0<br />
−1<br />
−2<br />
−2<br />
−2<br />
20 40 60 80<br />
Fitted values<br />
−5 0 5 10<br />
Residuals<br />
−10 −5 0 5 10<br />
Random effects<br />
−2 0 2 4<br />
Figure 8. Ces graphiques représentent respectivement les résidus et les<br />
droites de Henry des résidus et des eets aléatoires. Globalement, les hypothèses<br />
que nous avons faites semblent réalistes.<br />
dépendent pas des facteurs. Des graphiques des eets aléatoires en fonction des<br />
niveaux des facteurs permettraient de s'assurer du bien-fondé de cette hypothèse.<br />
Nous pouvons maintenant répondre aux questions par une simple lecture et interprétation<br />
des sorties précédentes.<br />
(2) Le fait d'avoir eu des enfants a t-il une inuence sur le niveau de base de fer ?<br />
Rappelons les éléments de la table d'analyse de variance qui nous renseignent sur<br />
les variations du niveau de base en fer m b ijk :
<strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES 23<br />
numDF denDF F-value p-value<br />
(Intercept) 1 708 6205.109
24 <strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES<br />
Le seul facteur qui a un eet signicatif sur la pente est le facteur traitement. Grâce<br />
au tableau contenant les estimations des paramètres, on dispose d'une estimation<br />
de la pente moyenne pour chaque groupe de traitement. Ainsi, pour le traitement<br />
1 (placebo), la pente moyenne peut être estimée à −2.99. Sans traitement, la<br />
concentration en fer diminuerait donc de 3ng/ml tous les mois de grossesse.<br />
(7) Même question pour les femmes des groupes 2 et 3.<br />
En reprenant le même tableau, nous pouvons estimer la pente à −2.99 + 5.87 =<br />
2.88ng/ml/mois pour le traitement 2 (faible dose de fer) et à −2.99 + 8.28 =<br />
5.29ng/ml/mois pour le traitement 3. Ces estimations sont cohérentes avec les<br />
courbes représentées sur le graphique (1).<br />
(8) Ces variations dépendent-elles du fait que les femmes aient déjà des enfants ? Si<br />
oui, ces variations ont elles la même amplitude dans chaque groupe de traitement ?<br />
Tous les termes de la table d'analyse de variance qui contiennent T_4 et autres_enfants<br />
ont des valeurs de P > 0.05. Par conséquent, il n'y a pas d'eet signicatif du nombre<br />
d'enfants sur les variations de concentrations en fer après 4 mois de grossesse<br />
et il n'est pas utile d'ajuster les traitements selon ce facteur.<br />
(9) Ces variations dépendent-elles du fait que les femmes aient déjà des épisodes<br />
d'anémie antérieur ? Si oui, ces variations ont elles la même amplitude dans<br />
chaque groupe de traitement ? Tous les termes de la table d'analyse de variance<br />
qui contiennent T_4 et anemie ont des valeurs de P > 0.05. Aussi, comme pour<br />
la source de variation autres_enfants, le fait d'avoir eu des épisodes d'anémie antérieurs<br />
ne modie pas signicativement les variation de concentration en fer après<br />
4 mois.<br />
(10) Existe t-il une interaction entre anémie et autres_enfants sur les variations à<br />
partir du 5 ième mois ? Si oui, l'eet de cette interaction est elle même dans chaque<br />
groupe de traitement ?<br />
Non pour les mêmes raisons que précédemment.<br />
(11) La supplémentation en fer semble t-elle utile ? Pour répondre à cette dernière<br />
question utilisez la commande : anova(ana1) où ana1 est l'objet qui contient les<br />
résultats de l'analyse que vous avez eectuée.<br />
Oui, la supplémentation est utile dans le sens où elle permet d'augmenter sensiblement<br />
les concentrations en fer et cette étude permet de le montrer. En eet,<br />
dans cette étude, les groupes de traitements sont comparables jusqu'au 4 ième mois<br />
en d'autres termes, les trois groupes ne dièrent que par ce que nous cherchons à<br />
comparer : les traitements. Enn, aucun des autres facteurs pris en compte dans
<strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES 25<br />
cette analyse n'interagit avec le traitement. Par conséquent, cette étude suggère<br />
qu'il n'est pas utile de moduler les traitements en fonction des niveaux des autres<br />
facteurs : un fois le traitement choisi, les variations moyennes de concentrations<br />
en fer sont les mêmes que les femmes aient eu ou non des enfants et qu'elles aient<br />
été sujettes ou non à des épisodes d'anémie. On peut par ailleurs noter que pour<br />
un traitement donné, les femmes ont des réponses au traitement assez homogène :<br />
un écart-type de 1.60ng/ml/mois su la pente après le 4 ième mois de grossesse.