30.11.2014 Views

CORRECTION DES EXERCICES SUR LE MODÈLE ... - Biostat.envt.fr

CORRECTION DES EXERCICES SUR LE MODÈLE ... - Biostat.envt.fr

CORRECTION DES EXERCICES SUR LE MODÈLE ... - Biostat.envt.fr

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS<br />

MIXTES<br />

Voici une correction des exercices que vous aviez à rendre. Pour chaque question, les<br />

commandes et les sorties de R apparaîtront en police courrier. Les commentaires<br />

apparaissent après le symbole #.<br />

Exercice 1<br />

La feuille de calcul Excel nommée exo1 contient deux colonnes respectivement nommée<br />

CV et cortisol. La colonne CV contient un identicateur de cheval (son nom) alors que la<br />

colonne cortisol contient des concentrations en cortisol mesurées sur chaque cheval. Vous<br />

pouvez constater que trois concentrations ont été mesurées sur chaque cheval. On admettra<br />

que les écarts entre ces trois concentrations ne sont explicables que par des erreurs de<br />

dosage.<br />

Commençons par importer les données à partir d'un chier ASCII nommé exo1.txt.<br />

> exo1 library(nlme) # charge le package nlme en mémoire<br />

> attach(exo1) # chargement de exo1 en mémoire<br />

> names(exo1) # nom des variables de exo1<br />

[1] "CV" "Cortisol"<br />

> CV plot(Cortisol∼CV) # donne le graphique des concentrations par cheval<br />

Notons Y ij la jème concentration observée sur le ième cheval. Dans cet exercice, il y a 50<br />

chevaux (i = 1 . . . 50) et 10 observations par cheval (j = 1 . . . 10). La variable réponse<br />

est la concentration en cortisol et la seule source de variation est le facteur cheval qui<br />

est un facteur à eets aléatoires (on dispose d'un échantillon de chevaux). Le modèle à<br />

considérer est donc :<br />

(1) Y ij = µ + CV i + ε ij , i = 1 . . . 50, j = 1 . . . 10.<br />

Date: 6/10/2007.<br />

1


2 <strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES<br />

Cortisol<br />

80 90 100 110 120<br />

1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49<br />

Figure 1. On observe une dispersion intra-individuelle faible (les box-plot<br />

par cheval ne sont pas large) et une forte variation inter-individuelle. Globalement,<br />

les concentrations semblent groupées autour de 100. Cependant,<br />

certains chevaux ont des concentrations qui s'éloignent de cette valeur.<br />

Pour terminer la description du modèle, nous devons faire des hypothèses sur les variables<br />

aléatoires impliquées dans le modèle. Nous vérierons plus tard si ces hypothèses<br />

sont réalistes ou si nous devons envisager d'autres analyses. Nous supposerons que<br />

CV i ∼ iid N (0, σCV 2 ), ε ij ∼ iid N (0, σ 2 ) et que les CV i sont indépendantes des ε ij . Nous<br />

pouvons maintenant estimer les paramètres de ce modèle.<br />

> ana1 ana1<br />

Linear mixed-effects model fit by REML<br />

Data: exo1<br />

Log-restricted-likelihood: -875.95<br />

Fixed: Cortisol 1<br />

(Intercept)<br />

99.91606<br />

Random effects:<br />

Formula: ∼ 1 | CV<br />

(Intercept) Residual<br />

StdDev: 10.50393 0.9848313<br />

CV


<strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES 3<br />

Number of Observations: 500<br />

Number of Groups: 50<br />

Avant d'aller plus loin, vérions que nos hypothèses sont raisonnables.<br />

> plot(ana1)# graphique des résidus en fonction des valeurs prédites du modèle<br />

> qqnorm(ana1,∼ resid(.))# droite de Henry des résidus<br />

> qqnorm(ana1,∼ ranef(.))# droite de Henry des effets aléatoires (ici CV i )<br />

(Intercept)<br />

2<br />

2<br />

2<br />

Standardized residuals<br />

1<br />

0<br />

−1<br />

Quantiles of standard normal<br />

0<br />

Quantiles of standard normal<br />

1<br />

0<br />

−1<br />

−2<br />

−2<br />

−2<br />

−3<br />

80 90 100 110 120<br />

Fitted values<br />

−3 −2 −1 0 1 2<br />

Residuals<br />

−20 −10 0 10 20<br />

Random effects<br />

Figure 2. Ces graphiques représentent respectivement les résidus et les<br />

droites de Henry des résidus et des eets aléatoires. Les résidus semblent<br />

bien centrés sur zéro et ils se situent dans une bande. On ne voit pas<br />

de modication d'amplitude des résidus en fonction des valeurs prédites<br />

par le modèle. Il semble donc que le modèle qui décrit la moyenne est<br />

raisonnable et que la variance des résidus de change pas avec les facteurs.<br />

Mis à part les eets de bords inévitables, les droites de Henry montrent<br />

des points globalement alignés. Les hypothèses de normalité semblent donc<br />

raisonnables. Globalement, les hypothèses que nous avons faites semblent<br />

réalistes.<br />

Nous pouvons maintenant répondre aux questions.<br />

(1) Donner une estimation de l'écart-type de l'erreur de dosage.<br />

Cet écart-type est celui des résidus du modèle. Il mesure la dispersion intraindividuelle<br />

; on lit directement sur la sortie de l'analyse : √ ̂σ2 = ̂σ = 0.9848313.<br />

(2) Donner un intervalle de prédiction à 95% des concentrations observables sur le<br />

cheval 1.<br />

Il s'agit d'un intervalle de prédiction conditionnel. Comme nous l'avons vu en<br />

cours, on cherche un intervalle [A, B] tel que P (A ≤ Y ≤ B|CV 1 ) = 0.95. Or,<br />

conditionnellement à CV 1 nous voyons que la concentration en cortisol Y suit une<br />

loi N (µ + CV 1 , σ 2 ) . On cherche donc un intervalle qui contient 95% des réalisations<br />

d'une loi normale. Nous savons que cet intervalle est approximativement de<br />

la forme [µ + CV 1 − 2σ; µ + CV 1 + 2σ]. Or aucun des éléments intervenant dans cet


4 <strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES<br />

intervalle n'est connu. En les remplaçant par leur estimation et en négligeant les incertitudes<br />

sur ces estimations nous obtenons l'intervalle [ˆµ+ĈV 1−2ˆσ; ˆµ+ĈV 1+2ˆσ].<br />

D'après l'analyse, ˆµ = 99.91606, ̂σ = 0.9848313 et il manque ĈV 1. ĈV 1 est la prédiction<br />

de l'eet aléatoire CV 1 que nous pouvons obtenir avec la commande<br />

> random.effects(ana1)# on peut aussi utiliser la commande ranef(ana1)<br />

(Intercept)<br />

1 -9.2928910<br />

2 -19.8725907<br />

3 0.4715255<br />

4 0.3566265 . . .<br />

D'où ĈV 1 = −9.2928910 à partir duquel nous pouvons déduire l'intervalle :<br />

[99.91606−9.2928910−2×0.9848313; 99.91606−9.2928910+2×0.9848313] = [88.65; 92.59].<br />

(3) Donner un intervalle de prédiction à 95% des concentrations observables dans la<br />

population des chevaux.<br />

Il s'agit d'un intervalle de prédiction marginal. Comme nous l'avons vu en cours,<br />

on cherche un intervalle [A, B] tel que P (A ≤ Y ≤ B) = 0.95. Or, d'après le modèle<br />

1 nous voyons que la concentration en cortisol Y suit une loi N (µ, σ 2 CV + σ2 ) .<br />

On cherche donc un intervalle qui contient 95% des réalisations d'une loi normale.<br />

Nous savons que cet intervalle est approximativement de la forme [µ −<br />

2 √ σ 2 CV + σ2 ; µ + 2 √ σ 2 CV + σ2 ]. L'analyse nous donne une estimation de σ 2 CV =<br />

10.50393 2 . En reprenant un raisonnement similaire à la question précédente nous<br />

déduisons l'intervalle :<br />

[99.91606−2 √ 10.50393 2 + 0.9848313 2 ; 99.91606+2 √ 10.50393 2 + 0.9848313 2 ] = [78.82; 121.02].<br />

Exercice 2<br />

Une étude à été réalisée an de comparer et de sélectionner le régime alimentaire<br />

qui donne la croissance la plus importante chez le porc. La feuille exo2 contient cinq<br />

colonnes qui correspondent respectivement à l'identication de l'individu (Ind), au sexe<br />

de l'individu (Sexe), aux croissances par jour obtenues avec les régimes R1, R2 et R3. Il<br />

est probable que vous aurez à structurer le chier de données autrement pour faire les<br />

analyses.<br />

Le chier exo2.txt n'est pas structuré avec une variable par colonne : la croissance<br />

obtenue sur chaque porc avec les régimes R1, R2, R3 est représentée sur 3 colonnes.<br />

Nous devons donc créer deux colonnes : une colonne GMQ qui contiendra les croissances


<strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES 5<br />

obtenue avec les 3 régimes et une colonne Régime qui donnera le numéro du régime correspondant.<br />

Enn, les autres variables du chier doivent être complétées en conséquence. Il<br />

existe plusieurs possibilités pour structurer le chier de données de cette façon. On peut<br />

par exemple utiliser les commandes "copier"-"coller" d'Excel ou encore créer directement<br />

les variables dans R. C'est cette dernière méthode que nous utiliserons. Commençons par<br />

importer les données à partir d'un chier ASCII nommé exo2.txt.<br />

> exo2 attach(exo2) # chargement de exo2 en mémoire<br />

> names(exo2) # nom des variables de exo2<br />

[1] "Ind" "Sexe" "R1" "R2" "R3"<br />

GMQ


6 <strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES<br />

GMQ reg sexe ind<br />

1 108.36 1 1 1<br />

2 109.94 1 1 2<br />

3 112.06 1 1 3<br />

4 94.79 1 1 4 . . .<br />

Le graphique 3 permet de bien voir les données et de répondre partiellement aux questions<br />

posées (il faut la couleur pour voir quelque chose).<br />

>plot(ex2)<br />

1 2 3<br />

sexe/ind<br />

2/60<br />

2/33<br />

2/47<br />

2/34<br />

2/32<br />

2/36<br />

2/54<br />

2/55<br />

2/50<br />

2/37<br />

2/52<br />

2/58<br />

2/56<br />

2/39<br />

2/51<br />

2/57<br />

2/49<br />

2/43<br />

2/42<br />

2/41<br />

2/45<br />

2/40<br />

2/46<br />

2/44<br />

2/59<br />

2/53<br />

2/35<br />

2/38<br />

2/48<br />

2/31<br />

1/24<br />

1/10<br />

1/23<br />

1/28<br />

1/29<br />

1/3<br />

1/1<br />

1/17<br />

1/12<br />

1/16<br />

1/2<br />

1/7<br />

1/11<br />

1/19<br />

1/15<br />

1/13<br />

1/26<br />

1/14<br />

1/9<br />

1/4<br />

1/22<br />

1/8<br />

1/20<br />

1/6<br />

1/5<br />

1/21<br />

1/27<br />

1/25<br />

1/30<br />

1/18<br />

60 80 100 120<br />

GMQ<br />

Figure 3. Le GMQ est représenté sur l'axe des abscisses et les individus<br />

classés par sexe sur l'axe des ordonnées. Pour chaque individu, on observe<br />

trois GMQ représentés avec des couleurs diérentes selon le régime utilisé.<br />

Pour les deux sexes, et même presque pour chaque individu, le GMQ obtenu<br />

avec le régime 1 semble inférieur à celui obtenu avec le régime 2 qui est lui<br />

même inférieur à celui obtenu avec le régime 3. Les écarts entre les GMQ<br />

des 3 régimes semblent plus faibles chez les mâles (sexe=1) que chez les<br />

femelles (sexe=2). Enn, pour le même régime, les mâles semblent avoir<br />

des GMQ supérieurs à ceux des femelles.<br />

Nous avons besoin d'un modèle pour pouvoir répondre aux questions posées. Commençons<br />

par noter Y ijk le GMQ (ie la croissance) obtenue avec le régime k du jème individu de sexe<br />

i. L'analyse de la structure que nous avons faite pour construire le jeu de données nous<br />

conduit au modèle :<br />

(2) Y ijk = µ + S i + R k + (S ∗ R) ik + Ind j /S i + ε ij , i = 1 . . . 2, j = 1 . . . 30, k = 1 . . . 3.


<strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES 7<br />

Faisons maintenant les hypothèses sur les variables aléatoires impliquées dans le modèle.<br />

Nous supposerons que pour chaque sexe, les individus sont indépendants ; c'est à dire<br />

pour i = 1 et i = 2, Ind j /S i ∼ iid N (0, σ 2 Ind ), ε ijk ∼ iid N (0, σ 2 ) et que les Ind j /S i sont<br />

indépendantes des ε ijk . Nous pouvons maintenant estimer les paramètres de ce modèle<br />

que nous devons déclarer dans R. Mises à part les ε ijk , les seules variables aléatoires à<br />

droite du signe = sont les individus Ind j /S i . La partie random du modèle sera donc<br />

random=∼ 1 | ind. Il ne faut pas mettre ici le sexe qui est un facteur à eets xes ! La<br />

partie xe du modèle µ + S i + R k + (S ∗ R) ik peut être codée 1+sexe+reg+sexe:reg ou<br />

plus simplement sexe*reg. Il ne faut pas mettre le facteur individu dans cette partie.<br />

Y ijk<br />

= µ + S i + R k + (S ∗ R) ik<br />

} {{ }<br />

partie fixe du modèle<br />

+ Ind j /S<br />

} {{ } i + ε ijk<br />

partie aléatoire du modèle<br />

GMQ ∼ { 1+sexe+reg+sexe:reg }} {<br />

, random { }} =∼ 1|ind {<br />

.<br />

,<br />

}{{}<br />

résidu<br />

On en déduit la commande :<br />

>contrasts(sexe) contrasts(reg)


8 <strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES<br />

Number of Groups: 60<br />

> anova(ana2) numDF denDF F-value p-value<br />

(Intercept) 1 116 4827.304 qqnorm(ana2,∼ ranef(.))# droite de Henry des effets aléatoires (ici Ind j /S i )<br />

3<br />

(Intercept)<br />

2<br />

2<br />

2<br />

Standardized residuals<br />

1<br />

0<br />

−1<br />

Quantiles of standard normal<br />

1<br />

0<br />

−1<br />

Quantiles of standard normal<br />

1<br />

0<br />

−1<br />

−2<br />

−2<br />

−2<br />

−3<br />

60 80 100 120<br />

Fitted values<br />

−10 −5 0 5 10<br />

Residuals<br />

−20 −10 0 10 20<br />

Random effects<br />

Figure 4. Ces graphiques représentent respectivement les résidus et les<br />

droites de Henry des résidus et des eets aléatoires. Globalement, les hypothèses<br />

que nous avons faites semblent réalistes.<br />

Remarque sur les contrastes : Comme nous l'avons vu en cours, l'écriture du modèle<br />

(2) n'est pas unique. Les eets diérentiels des facteurs et leurs interactions (ie les S i ,<br />

R k , (S ∗ R) ik ) peuvent se décomposer en prenant comme référence le premier niveau de<br />

chaque facteur (c'est l'option par défaut de R) ou en leur imposant d'avoir une somme<br />

nulle. C'est cette dernière option que j'ai choisie. Dans cette situation, µ est bien l'eet<br />

moyen général. Avec l'option par défaut, µ est la moyenne de population des individus<br />

de sexe 1 pour le régime 1. Mis à part pour le test sur µ, les valeurs de P de la table<br />

d'analyse de variance ne sont pas aectées par un choix particulier de contrastes.<br />

(1) Le sexe a t-il une inuence (signicative) sur la croissance ?<br />

Comme vous le savez, nous devons tout d'abord interpréter les interactions de<br />

plus grand ordre avant d'interpréter les eets simples. Le test sur l'interaction<br />

sexe:regime donne une valeur de P < 0.0001. Ce qui implique que les réponses


<strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES 9<br />

moyennes varient à la fois en fonction du sexe et du régime. Nous en déduisons<br />

que les croissances des mâles et des femelles ne sont pas identiques.<br />

(2) Les trois régimes donnent ils des croissances identiques ?<br />

En reprenant le même raisonnement que précédemment, nous pouvons armer<br />

que les croissances obtenues avec les trois régimes sont diérentes.<br />

(3) Est il nécessaire de choisir le régime en fonction du sexe ?<br />

Cette question impose une analyse plus approfondie de l'interaction sexe:reg.<br />

L'interaction signicative signale que les écarts entres les régimes diérent chez<br />

les mâles et les femelles. Cependant, deux situations peuvent être rencontrées :<br />

soit l'ordre des régimes est le même pour les deux sexes, ce qui signie que le<br />

meilleur régime pour les mâles est aussi le meilleur régime pour les femelles, soit<br />

l'ordre est diérent et dans ce cas, il est nécessaire de choisir le régime en fonction<br />

du sexe. Le graphique 3 suggère la réponse à cette question : le régime 3 donne<br />

de meilleurs résultats (GMQ plus grands) chez les mâles et les femelles même si<br />

l'augmentation de GMQ obtenu avec le régime 3 est plus faible chez les mâles que<br />

chez les femelles.<br />

Une solution brutale pour comparer les ordres est de faire une analyse par sexe<br />

et d'eectuer une comparaison multiple des régimes avec par exemple, un test de<br />

Tukey. Une solution plus élégante (qui requiert une bonne connaissance de R) est<br />

d'aller chercher les paramètres du modèle global et d'eectuer des tests sur ces<br />

paramètres. Par souci de simplicité, nous adopterons la première solution :<br />

>ana21 ana21<br />

Linear mixed-effects model fit by REML<br />

Data: ex2<br />

Subset: sexe == 1<br />

Log-restricted-likelihood: -301.4234<br />

Fixed: GMQ ∼ 1+ reg<br />

(Intercept) reg[S.1] reg[S.2]<br />

107.2506667 -4.1980000 0.3323333 # on voit ici que moy reg 3 > moy reg<br />

2 > moy reg 1. On verra avec le test de Tuckey si ces différence sont<br />

significatives<br />

Random effects:


10 <strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES<br />

Formula: ∼ 1 | ind<br />

(Intercept) Residual<br />

StdDev: 10.31774 4.502676<br />

Number of Observations: 90 Number of Groups: 30<br />

> TukeyHSD(aov(ana21),"reg") # test de Tukey pour sur les résultats de<br />

l'analyse ana1<br />

Tukey multiple comparisons of means<br />

95% family-wise confidence level<br />

Fit: aov(formula = ana21)<br />

$reg<br />

diff lwr upr p adj<br />

2-1 14.283167 8.1874379 20.37890 0.0000003 # moy reg2 > moy reg1<br />

3-1 20.985333 14.8896046 27.08106 0.0000000 # moy reg3 > moy reg1<br />

3-2 6.702167 0.6064379 12.79790 0.0272727 # moy reg3 > moy reg2<br />

>ana22 ana22<br />

Linear mixed-effects model fit by REML<br />

Data: ex2<br />

Subset: sexe == 2<br />

Log-restricted-likelihood: -306.0581<br />

Fixed: GMQ ∼ 1+ reg<br />

(Intercept) reg[S.1] reg[S.2]<br />

96.723333 -19.314333 4.721667 # on voit ici que moy reg 3 > moy reg 2<br />

> moy reg 1. On verra avec le test de Tuckey si ces différence sont<br />

significatives<br />

Random effects:<br />

Formula: ∼ 1 | ind<br />

(Intercept) Residual<br />

StdDev: 11.76228 4.581902<br />

Number of Observations: 90


<strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES 11<br />

Number of Groups: 30<br />

> TukeyHSD(aov(ana22),"reg") # test de Tukey pour sur les résultats de<br />

l'analyse ana2<br />

Tukey multiple comparisons of means<br />

95% family-wise confidence level<br />

Fit:<br />

aov(formula = ana22)<br />

$reg<br />

diff lwr upr p adj<br />

2-1 14.283167 8.1874379 20.37890 0.0000003 # moy reg2 > moy reg1<br />

3-1 20.985333 14.8896046 27.08106 0.0000000 # moy reg3 > moy reg1<br />

3-2 6.702167 0.6064379 12.79790 0.0272727 # moy reg3 > moy reg2<br />

Si nous faisons le bilan, nous voyons que pour les deux sexes, le régime 3 est celui<br />

qui donne signicativement des GMQ moyens plus élevés que les autres régimes.<br />

Il n'est donc pas nécessaire de choisir le régime en fonction du sexe.<br />

(4) Pour une femelle, quel est le régime qui permet d'obtenir la meilleure croissance ?<br />

On a déjà répondu à cette question à la question précédente. Le régime 3 est le<br />

meilleur et ceci quel que soit le sexe.<br />

Exercice 3<br />

Une étude à été réalisée an de comparer et de sélectionner le régime alimentaire qui<br />

donne la croissance la plus importante chez le porc. La feuille exo3 contient quatre<br />

colonnes qui correspondent respectivement à l'identication de l'individu (Ind), au régime<br />

donné à chaque individu (Regime), à l'âge en jour auquel une pesée a été réalisée (Age)<br />

et au poids correspondant (Poids).<br />

Comme pour les exercices précédents, on importe les données à partir d'un chier ASCII<br />

nommé exo3.txt.<br />

> exo3 library(nlme) # charge le package nlme en mémoire<br />

> attach(exo3) # chargement de exo3 en mémoire<br />

> names(exo3) # nom des variables de exo3<br />

[1] "Ind" "Regime" "Age" "Poids"<br />

> Ind


12 <strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES<br />

> Reg ex3 # le jeu de données est donc structuré comme suit :<br />

Grouped Data: Poids ∼ Age | Reg/Ind<br />

Poids Age Reg Ind<br />

1 42.91 1 1 1<br />

2 47.72 20 1 1<br />

3 46.14 30 1 1<br />

4 58.84 50 1 1<br />

5 66.42 90 1 1<br />

6 36.87 1 1 2. . .<br />

>plot(ex3) # représentation graphique du jeu de données<br />

Le graphique montre que pour chaque individu l'évolution du poids en fonction de l'âge<br />

varie à peu près linéairement. On en déduit que si Y ijk est le poids du jème individu à<br />

l'âge age ijk qui a reçu le régime i alors<br />

(3) Y ijk = A ij + B ij age ijk + ε ijk , i = 1 . . . 2, j = 1 . . . n i , k = 1 . . . 5,<br />

avec n 1 = 28 et n 2 = 36.<br />

Tel qu'il est écrit, ce modèle dit simplement que l'ordonnée à l'origine et la pente de<br />

la droite change avec l'individu et le régime. Il est nécessaire de décrire plus précisément<br />

comment ces paramètres individuels varient. Nous supposerons que le couple<br />

(A ij , B ij ) ∼ iid N ((a + α i , b + β i ), Σ) où encore que<br />

(4)<br />

{<br />

Aij = a + α i + η A ij<br />

B ij = b + β i + η B ij, et (η A ij, η B ij) ∼ iid N ((0, 0), Σ) .<br />

Seules les moyennes de population des ordonnées à l'origine et des pentes dépendent du<br />

régime. Au sein de chaque régime, la variation autour de ces moyennes ne sont donc que


<strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES 13<br />

Poids<br />

70<br />

60<br />

50<br />

40<br />

30<br />

70<br />

60<br />

50<br />

40<br />

30<br />

70<br />

60<br />

50<br />

40<br />

30<br />

70<br />

60<br />

50<br />

40<br />

30<br />

1/14 1/12 1/8 1/25 1/1 1/23 1/3 1/27 1/10 1/2 1/9<br />

2/54 2/31 2/63 1/7 1/17 1/16 1/19 1/18 1/26 1/15<br />

2/58 2/41 2/51 2/62 2/30 2/50 2/29 2/33 2/55 2/43 2/36<br />

2/45 2/59 2/49 2/60 2/35 2/47 2/38 2/44 2/39 2/40 2/57<br />

2/61 2/34 2/48 2/46 2/53 2/52 2/56 2/32 2/37 2/42 2/64<br />

0 4080<br />

0 4080<br />

0 4080<br />

0 4080<br />

0 4080<br />

0 4080<br />

Age<br />

0 4080<br />

0 4080<br />

1/24 1/13 1/11 1/22 1/4 1/21 1/28 1/6 1/20<br />

0 4080<br />

1/5<br />

0 4080<br />

70<br />

60<br />

50<br />

40<br />

30<br />

70<br />

60<br />

50<br />

40<br />

30<br />

Figure 5. Chaque petit graphique représente pour un individu l'évolution<br />

du poids en fonction de son âge. Les individus sont rangés par régime. Le<br />

premier chire en haut de chaque graphique donne le numéro de régime<br />

alors que le second précise le numéro de l'individu.<br />

des variations inter-individuelles. Il reste à préciser que nous supposerons que ε ijk ∼ iid<br />

N (0, σ 2 ) et que les (A ij , B ij ) sont indépendantes des ε ijk . En réécrivant le modèle (3) à<br />

l'aide de la décomposition (4) nous obtenons le nouveau modèle :<br />

(5) Y ijk = a + α i + b × age ijk + β i × age<br />

} {{ ijk<br />

}<br />

partie fixe du modèle<br />

+ ηij A + ηij B × age ijk<br />

} {{ }<br />

+ ε ijk<br />

partie aléatoire du modèle<br />

}{{}<br />

résidu<br />

Nous pouvons maintenant estimer les paramètres de ce modèle qui dans R se traduit<br />

terme à terme par<br />

Poids ∼ 1 + Reg + Age + Reg:Age, random =∼ 1 + Age|Ind<br />

} {{ }<br />

partie fixe du modèle<br />

} {{ }<br />

partie aléatoire du modèle<br />

Les commandes suivantes permettent d'estimer les paramètres du modèle.<br />

>ana3 ana3<br />

Linear mixed-effects model fit by REML<br />

Data: ex3<br />

Log-restricted-likelihood: -1002.480<br />

Fixed: Poids ∼ Reg * Age<br />

.<br />

.


14 <strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES<br />

(Intercept) Reg2 Age Reg2:Age<br />

40.31147234 -0.63741355 0.29099650 -0.07844144<br />

Random effects:<br />

Formula: ∼ 1 + Age | Ind<br />

Structure: General positive-definite, Log-Cholesky parametrization<br />

StdDev Corr<br />

(Intercept) 5.673468e-07 (Intr)<br />

Age 3.817842e-02 -0.312<br />

Number of Observations: 320<br />

Residual 5.214180e+00<br />

Number of Groups: 64<br />

> anova(ana3) numDF denDF F-value p-value<br />

(Intercept) 1 254 20228.381


(6)<br />

<strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES 15<br />

Comme a + α 1 + b × 40 + β 1 × 40 ne contient aucun terme aléatoire, sa variance est<br />

nulle et V (Y 40 ) se réduit donc au dernier terme de l'égalité précédente. Un petit<br />

calcul (que nous avons déjà fait en cours) montre que<br />

V ( η A + η B × 40 + ε ) = V(η A ) + V(η B ) × 40 2 + 2 × 40 × Cov(η A , η B ) + V(ε).<br />

Les estimations des paramètres du modèle (5) donnent â + α 1 = 40.31147234,<br />

̂b + β 1 = 0.29099650 et une estimation du poids moyen est donc 40.31147234 +<br />

0.29099650 × 40 = 51.95.<br />

De même, ̂V(ηA ) = (5.673468 × 10 −7 ) 2 , ̂V(ηB ) = (3.817842 × 10 −2 ) 2 , ̂V(ε) =<br />

(5.214180) 2 et enn ̂ Cov(ηA , η B ) = −0.312 × 5.673468 × 10 −7 × 3.817842 × 10 −2 =<br />

−6.758046 × 10 −9 et une estimation de V (Y 40 ) est donc<br />

̂V (Y 40 ) = (5.673468 × 10 −7 ) 2 + 40 2 × (3.817842 × 10 −2 ) 2<br />

+(5.214180) 2 + 2 × 40 × (−6.758046 × 10 −9 ) = 29.51982.<br />

Une estimation de la distribution du poids à 40 jours des individus qui reçoivent<br />

le régime 1 est donc : N (51.95; 29.52).<br />

(3) Les distributions des poids à la naissance des groupes de porcs qui reçoivent les<br />

régimes 1 et 2 sont elles comparables ? Les poids moyens à la naissance sont<br />

donnés par les ordonnées à l'origine moyennes. Le test qui compare les ordonnées<br />

à l'origine des deux groupes de régime est celui réalisé à la deuxième ligne de la<br />

table d'analyse de variance (test sur Reg) et il donne une valeur de P < .0001. Les<br />

poids moyens à la naissance des deux groupes de régime sont donc signicativement<br />

diérents.<br />

(4) On dénit le GMQ comme le gain de poids d'un animal en une journée. Donner<br />

la distribution des GMQ pour chaque régime. Les pentes des droites peuvent aussi<br />

être interprétées comme des GMQ. Nous avons supposé que les pentes des droites<br />

étaient normalement distribuées. Aussi sut-il de lire la sortie de notre analyse<br />

pour obtenir les estimations désirées : une estimation de la distribution des GMQ<br />

pour le régime 1 est N (0.29; (3.817842 × 10 −2 ) 2 ) alors que pour le régime 2 nous<br />

obtenons la distribution N (0.29 − 0.078; (3.817842 × 10 −2 ) 2 ).<br />

Exercice 4<br />

Remarques préliminaires : Cet dernier exercice est moins scolaire que les trois premiers<br />

et il se rapproche de problèmes que vous allez devoir traiter. N'oubliez pas qu'une<br />

bonne analyse descriptive avec beaucoup de graphiques est souvent gage de pertinence et<br />

d'ecacité. Soyez simple dans <strong>LE</strong> modèle que vous envisagez : il est possible de répondre<br />

à toute les questions en n'utilisant qu'un seul modèle. Ici, il n'est pas utile d'essayer de


16 <strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES<br />

construire un modèle avec des variations non linéaire au cours du temps. Attention, le<br />

chier de données n'est pas organisé de façon à permettre une analyse dans R.<br />

Les femmes enceintes ont des risques d'anémie pendant et après la grossesse. Un groupe<br />

de chercheurs s'est emparé du sujet et a cherché à documenter si une supplémentation<br />

en fer faire pouvait décroître les risques d'anémie pendant la grossesse. Cette étude avait<br />

plusieurs parties, en particulier, la concentration en fer dans le serum a été mesurée.<br />

Cette concentration est une mesure des réserves totales de l'organisme en fer et elle est<br />

directement liée au risque d'anémie. L'objet de l'analyse que vous allez conduire est de<br />

quantier l'inuence de la supplémentation en fer sur les concentrations de fer dans le<br />

sérum.<br />

Les chercheurs ont recruté 120 femmes enceintes de 2 mois. Ces femmes ont été assignées<br />

de façon aléatoire dans 3 groupes (40 femmes par groupe). A partir du quatrième mois de<br />

grossesse toutes les femmes incluses dans l'étude ont reçu une boite de pilules qu'elles<br />

devait prendre chaque jour. Les pilules des femmes du groupe 1 contenaient un placebo,<br />

celles des femmes du groupe 2 contenaient une dose faible de fer alors que celles du groupe<br />

3 étaient fortement dosées en fer. Tous les mois de l'étude, un prélèvement de sang a été<br />

réalisé sur chaque femme et la concentration de fer dans le sérum (en ng/ml) a été dosée.<br />

Au moment de l'inclusion, il a été demandé à ces femmes si elles avaient déjà eu une<br />

anémie, et si elles avaient des enfants. Il a été montré par d'autres études que pendant<br />

les 4 premiers mois de grossesse, c'est à dire pendant les mois 2, 3 et 4, il n'y a pas<br />

de variation importante de concentration en fer dans le sérum. Durant cette période, les<br />

concentrations oscillent autour d'un niveau de base qui mesure la concentration normale.<br />

Si des changements de concentrations doivent se produire, ils sont attendus à partir du<br />

5 ième mois.<br />

Les données de l'étude sont consignées dans la feuille nommée exo4 qui contient 11<br />

colonnes avec des informations sur :<br />

col A : l'identication de la femme,<br />

col B : d'autres enfants (oui/non),<br />

col C : des épisodes d'anémie antérieurs (oui/non),<br />

col D : le numéro du groupe de traitement auquel la femme a été assignée,<br />

col E-K : les concentrations en fer dans le sérum du deuxième au huitième mois de grossesse<br />

respectivement.<br />

Après avoir réorganisé le chier exo4.txt avec une colonne par variable, nous avons<br />

importé ces données, déclaré les facteurs et organisé les données dans un jeu de données


<strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES 17<br />

R. Voici la liste des commandes utilisées (sans détail, car vous êtes maintenant aguerris à<br />

cet exercice) :<br />

> exo4 attach(exo4)<br />

> names(exo4)<br />

[1] "Ind" "autres_enfants" "anemie" "Traitement"<br />

[5] "Temps" "Fer"<br />

> Ind autres_enfants anemie Traitement 4, la variable t_4 devient positive et des variations de<br />

concentrations en fer deviennent autorisées. La pente b mesure alors le sens et<br />

l'amplitude des variations linéaires du fer après 4 mois de grossesse. Pour créer<br />

cette variable, il sut de taper :<br />

> T_44)*(Temps-4)


18 <strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES<br />

f(t)<br />

36 38 40 42 44<br />

2 3 4 5 6 7 8<br />

Variable t<br />

Figure 6. Ce graphique montre la fonction f(t) = 40 + b(t − 4) + pour<br />

b = +1 en vert (c'est la courbe qui monte), b = 0 en rouge (c'est la courbe<br />

horizontale) et enn pour b = +1 en pointillé (courbe qui descend).<br />

Nous pouvons maintenant eectuer l'analyse de la structure de ces données. La<br />

table de contingence des facteurs autres_enfants, anemie et Traitement va nous<br />

aider à comprendre l'organisation de ces facteurs :<br />

> table(Traitement,anemie,autres_enfants)<br />

, , autres_enfants = non<br />

anemie<br />

Traitement non oui<br />

1 105 49<br />

2 84 70<br />

3 91 49<br />

, , autres_enfants = oui<br />

anemie<br />

Traitement non oui<br />

1 98 28<br />

2 77 49<br />

3 77 63<br />

Ces trois facteurs sont donc croisés et les eectifs représentés dans les cellules de ces<br />

tables de contingence représentent des individus. Chaque individu est donc niché à<br />

l'intérieur du croisement des facteurs autres_enfants, anemie et Traitement. Ces<br />

trois facteurs sont à eets xes, seul le facteur individu est à eets aléatoires.<br />

Par ailleurs, pour chaque individu on dispose d'une évolution des concentrations<br />

en fer avec le mois de grossesse. An de rendre le graphique lisible, nous nous<br />

restreindrons à représenter cette évolution en fonction du traitement.


<strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES 19<br />

> ex4 plot(ex4)<br />

Le graphique (1) nous indique de façon approximative le sens de variation des<br />

2468<br />

2468<br />

2468<br />

2468<br />

2468<br />

2468<br />

2468<br />

2468<br />

2468<br />

2468<br />

2468<br />

2468<br />

3/117 3/113/883/823/104<br />

3/108 3/102 3/833/92 3/1093/84 3/116 3/120 3/118 3/101 3/963/873/943/107<br />

3/903/95 3/110 3/105 3/106<br />

80<br />

60<br />

40<br />

20<br />

2/712/452/492/552/622/522/652/613/853/1193/893/1003/93/103 3/112 3/1143/973/1153/983/1113/863/993/913/81<br />

2/432/642/702/562/592/512/422/722/542/662/532/732/692/502/762/602/672/742/412/582/772/792/632/44<br />

80<br />

60<br />

40<br />

20<br />

Fer<br />

80<br />

60<br />

40<br />

20<br />

1/251/231/261/41/211/111/321/391/71/381/131/51/121/201/141/102/752/782/462/682/482/802/472/57<br />

1/271/1 1/91/191/301/221/171/151/291/361/351/371/241/401/331/341/281/181/3 1/81/161/61/311/2<br />

80<br />

60<br />

40<br />

20<br />

80<br />

60<br />

40<br />

20<br />

2468<br />

2468<br />

2468<br />

2468<br />

2468<br />

2468<br />

2468<br />

2468<br />

2468<br />

2468<br />

2468<br />

2468<br />

Temps<br />

Figure 7. Chaque petit graphique représente pour une femme l'évolution<br />

des concentration en fer en fonction de son mois de grossesse. Le premier<br />

chire en haut de chaque graphique donne le numéro du traitement alors<br />

que le second précise le numéro de l'individu. Les femmes qui prennent le<br />

traitement 3 ont des courbes qui montent, le traitement 2 semble conduire à<br />

des courbes qui montent un peu moins, enn le traitement 1 semble donner<br />

des courbes qui descendent.<br />

concentrations en fer avec le traitement. Comme nous savons que ces variations<br />

doivent commencer à partir du quatrième mois de grossesse, nous supposerons en<br />

première approximation que la forme générale de chaque courbe peut être décrite<br />

avec une fonction f(t). L'examen des résidus de ce modèle permettra d'inrmer


20 <strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES<br />

(ou de conrmer) cette approximation. Notons Y ijklm la concentration en fer de la<br />

femme l au mois de grossesse t m avec le Traitement i, le niveau j du facteur anemie<br />

et le niveau k du facteur autres_enfants. Nous pouvons alors écrire le modèle<br />

(7) Y ijklm = B ijkl + A ijkl (t m − 4) +<br />

+ ε ijklm .<br />

(8)<br />

(9)<br />

(10)<br />

Ici, B ijkl représente la concentration basale en fer et A ijkl mesure la croissance (ou<br />

la décroissance) de ces concentrations après t m = 4. Il reste à préciser comment ces<br />

paramètres" individuels varient en fonction des facteurs autres_enfants, anemie<br />

et Traitement et individu. Nous supposerons que<br />

(<br />

Aijkl<br />

B ijkl<br />

)<br />

∼ iid N<br />

(( m<br />

a<br />

ijk<br />

m b ijk<br />

)<br />

, Σ<br />

En d'autres termes, les facteurs n'agissent que sur les moyennes des sous-population<br />

déterminées par leurs croisements. Toute variation à l'intérieur de ces souspopulation<br />

est assimilée à de la variabilité inter-individuelle. Ceci n'est pas encore<br />

assez précis. En eet, nous n'avons pas encore dit comment les moyennes m a ijk<br />

et m b ijk varient en fonction des facteurs. On est ici dans une situation typique<br />

d'analyse de variance à trois facteurs croisés. Comme d'habitue, nous allons tout<br />

d'abord écrire le modèle complet (ie avec toutes les interactions). En reprenant<br />

les notations classiques d'analyse de la variance et en notant N l'eet du facteur<br />

anémie, E l'eet du facteur autres_enfants, T l'eet du facteur Traitement et<br />

en juxtaposant les noms des facteurs pour symboliser les interactions entre ces<br />

facteurs, nous obtenons :<br />

⎧<br />

⎪⎨<br />

⎪⎩<br />

A ijkl<br />

B ijkl<br />

( η<br />

a<br />

ijkl<br />

η b ijkl<br />

)<br />

)<br />

.<br />

= µ a + Ti a + Nj a + Ek a + T N ij a + T Eik a + NEa jk + T NEa ijk + ηa ijkl ,<br />

= µ b +<br />

((<br />

Ti b + N<br />

) j b +<br />

)<br />

Ek b + T N ij b + T Eik b + NEb jk + T NEb ijk + ηb ijkl ,<br />

0<br />

∼ iid N , Σ .<br />

0<br />

En insérant dans le modèle (7) les expressions de A et de B nous pouvons le réécrire<br />

après quelques réarrangements sous la forme<br />

Y ijklm<br />

= µ b + T b<br />

i + N b j + E b k + T N b ij + T E b ik + NEb jk + T NEb ijk<br />

+ ( µ a + T a<br />

i + N a j + E a k + T N a ij + T E a ik + NEa jk + T NEa ijk)<br />

× (tm − 4) +<br />

+η b ijkl + ηa ijkl × (t m − 4) +<br />

+ε ijklm .<br />

Les deux premières lignes à droite du signe = du modèle (10) contiennent les effets<br />

xes du modèle, la troisième ligne contient les eets aléatoires enn, le terme<br />

résiduel est sur la dernière ligne. L'opérateur ∗ va simplier l'écriture de ce modèle<br />

dans R. En eet, les deux premières lignes peuvent s'écrire :<br />

Fer ∼ Traitement*anemie*autres_enfants*T_4.


<strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES 21<br />

Nous en déduisons la commande R :<br />

>ana4 ana4<br />

Linear mixed-effects model fit by REML<br />

Data: exo4<br />

Log-restricted-likelihood: -2466.359<br />

Fixed: Fer ∼ Traitement * anemie * autres_enfants * T_4<br />

(Intercept) 45.1586061<br />

Traitement2 1.7897273<br />

Traitement3 -0.5467179<br />

anemieoui -4.9521126<br />

autres_enfantsoui -0.3598398<br />

T_4 -2.9890242<br />

Traitement2:anemieoui -4.3791299<br />

Traitement3:anemieoui 2.6284063<br />

Traitement2:autres_enfantsoui -1.8580803<br />

Traitement3:autres_enfantsoui -2.9946103<br />

anemieoui:autres_enfantsoui 4.0644827<br />

Traitement2:T_4 5.8656076<br />

Traitement3:T_4 8.2797795<br />

anemieoui:T_4 -0.3953784<br />

autres_enfantsoui:T_4 0.6213879<br />

Traitement2:anemieoui:autres_enfantsoui -0.8698872<br />

Traitement3:anemieoui:autres_enfantsoui -2.2371033<br />

Traitement2:anemieoui:T_4 -0.1163686<br />

Traitement3:anemieoui:T_4 1.4813244<br />

Traitement2:autres_enfantsoui:T_4 -1.8263514<br />

Traitement3:autres_enfantsoui:T_4 0.2921957<br />

anemieoui:autres_enfantsoui:T_4 -0.2332807<br />

Traitement2:anemieoui:autres_enfantsoui:T_4 2.3343429<br />

Traitement3:anemieoui:autres_enfantsoui:T_4 -1.3644486<br />

Random effects:<br />

Formula: ∼ 1 + T_4 | Ind<br />

Structure: General positive-definite, Log-Cholesky parametrization<br />

StdDev Corr<br />

(Intercept) 5.737072 (Intr)<br />

T_4 1.609082 0.092<br />

Residual 3.306515<br />

Number of Observations: 840<br />

Number of Groups: 120<br />

> anova(ana4)


22 <strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES<br />

numDF denDF F-value p-value<br />

(Intercept) 1 708 6205.109 qqnorm(ana4,∼ ranef(.))<br />

Il faudrait en outre s'assurer que la variance des eets aléatoires du modèle ne<br />

(Intercept)<br />

T_4<br />

3<br />

2<br />

2<br />

2<br />

Standardized residuals<br />

1<br />

0<br />

−1<br />

Quantiles of standard normal<br />

0<br />

Quantiles of standard normal<br />

1<br />

0<br />

−1<br />

−2<br />

−2<br />

−2<br />

20 40 60 80<br />

Fitted values<br />

−5 0 5 10<br />

Residuals<br />

−10 −5 0 5 10<br />

Random effects<br />

−2 0 2 4<br />

Figure 8. Ces graphiques représentent respectivement les résidus et les<br />

droites de Henry des résidus et des eets aléatoires. Globalement, les hypothèses<br />

que nous avons faites semblent réalistes.<br />

dépendent pas des facteurs. Des graphiques des eets aléatoires en fonction des<br />

niveaux des facteurs permettraient de s'assurer du bien-fondé de cette hypothèse.<br />

Nous pouvons maintenant répondre aux questions par une simple lecture et interprétation<br />

des sorties précédentes.<br />

(2) Le fait d'avoir eu des enfants a t-il une inuence sur le niveau de base de fer ?<br />

Rappelons les éléments de la table d'analyse de variance qui nous renseignent sur<br />

les variations du niveau de base en fer m b ijk :


<strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES 23<br />

numDF denDF F-value p-value<br />

(Intercept) 1 708 6205.109


24 <strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES<br />

Le seul facteur qui a un eet signicatif sur la pente est le facteur traitement. Grâce<br />

au tableau contenant les estimations des paramètres, on dispose d'une estimation<br />

de la pente moyenne pour chaque groupe de traitement. Ainsi, pour le traitement<br />

1 (placebo), la pente moyenne peut être estimée à −2.99. Sans traitement, la<br />

concentration en fer diminuerait donc de 3ng/ml tous les mois de grossesse.<br />

(7) Même question pour les femmes des groupes 2 et 3.<br />

En reprenant le même tableau, nous pouvons estimer la pente à −2.99 + 5.87 =<br />

2.88ng/ml/mois pour le traitement 2 (faible dose de fer) et à −2.99 + 8.28 =<br />

5.29ng/ml/mois pour le traitement 3. Ces estimations sont cohérentes avec les<br />

courbes représentées sur le graphique (1).<br />

(8) Ces variations dépendent-elles du fait que les femmes aient déjà des enfants ? Si<br />

oui, ces variations ont elles la même amplitude dans chaque groupe de traitement ?<br />

Tous les termes de la table d'analyse de variance qui contiennent T_4 et autres_enfants<br />

ont des valeurs de P > 0.05. Par conséquent, il n'y a pas d'eet signicatif du nombre<br />

d'enfants sur les variations de concentrations en fer après 4 mois de grossesse<br />

et il n'est pas utile d'ajuster les traitements selon ce facteur.<br />

(9) Ces variations dépendent-elles du fait que les femmes aient déjà des épisodes<br />

d'anémie antérieur ? Si oui, ces variations ont elles la même amplitude dans<br />

chaque groupe de traitement ? Tous les termes de la table d'analyse de variance<br />

qui contiennent T_4 et anemie ont des valeurs de P > 0.05. Aussi, comme pour<br />

la source de variation autres_enfants, le fait d'avoir eu des épisodes d'anémie antérieurs<br />

ne modie pas signicativement les variation de concentration en fer après<br />

4 mois.<br />

(10) Existe t-il une interaction entre anémie et autres_enfants sur les variations à<br />

partir du 5 ième mois ? Si oui, l'eet de cette interaction est elle même dans chaque<br />

groupe de traitement ?<br />

Non pour les mêmes raisons que précédemment.<br />

(11) La supplémentation en fer semble t-elle utile ? Pour répondre à cette dernière<br />

question utilisez la commande : anova(ana1) où ana1 est l'objet qui contient les<br />

résultats de l'analyse que vous avez eectuée.<br />

Oui, la supplémentation est utile dans le sens où elle permet d'augmenter sensiblement<br />

les concentrations en fer et cette étude permet de le montrer. En eet,<br />

dans cette étude, les groupes de traitements sont comparables jusqu'au 4 ième mois<br />

en d'autres termes, les trois groupes ne dièrent que par ce que nous cherchons à<br />

comparer : les traitements. Enn, aucun des autres facteurs pris en compte dans


<strong>CORRECTION</strong> <strong>DES</strong> <strong>EXERCICES</strong> <strong>SUR</strong> <strong>LE</strong> MODÈ<strong>LE</strong> À EFFETS MIXTES 25<br />

cette analyse n'interagit avec le traitement. Par conséquent, cette étude suggère<br />

qu'il n'est pas utile de moduler les traitements en fonction des niveaux des autres<br />

facteurs : un fois le traitement choisi, les variations moyennes de concentrations<br />

en fer sont les mêmes que les femmes aient eu ou non des enfants et qu'elles aient<br />

été sujettes ou non à des épisodes d'anémie. On peut par ailleurs noter que pour<br />

un traitement donné, les femmes ont des réponses au traitement assez homogène :<br />

un écart-type de 1.60ng/ml/mois su la pente après le 4 ième mois de grossesse.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!