12.11.2014 Views

Les modèles non linéaires à effets mixtes - Isped

Les modèles non linéaires à effets mixtes - Isped

Les modèles non linéaires à effets mixtes - Isped

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Les</strong> modèles <strong>non</strong> linéaires à <strong>effets</strong> <strong>mixtes</strong>.<br />

Algorithmes et Applications<br />

Marc LAVIELLE<br />

Université René Descartes et Université Paris-Sud<br />

http://www.math.u-psud.fr/∼lavielle<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.1


<strong>Les</strong> modèles <strong>non</strong> linéaires à <strong>effets</strong> <strong>mixtes</strong>.<br />

Algorithmes et Applications<br />

Marc LAVIELLE<br />

Université René Descartes et Université Paris-Sud<br />

http://www.math.u-psud.fr/∼lavielle<br />

(en collaboration avec les membres du groupe MONOLIX)<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.1


A pharmacokinetics example : theophylline<br />

12 patients:<br />

12<br />

1<br />

10<br />

8<br />

6<br />

4<br />

2<br />

0<br />

0 5 10 15 20 25<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.2


A pharmacokinetics example : theophylline<br />

12 patients:<br />

12<br />

1<br />

10<br />

8<br />

6<br />

4<br />

2<br />

0<br />

0 5 10 15 20 25<br />

On aimerait construire un modèle qui permette de décrire chaque<br />

courbe individuelle par le même modèle paramétrique, en considérant<br />

que chaque courbe est paramétrée par ses propres paramètres<br />

individuels<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.2


One compartment model<br />

(oral administration, first-order absortion and elimination)<br />

D absortion (rate k a)<br />

−−−−−−−−−−−→<br />

DRUG AMOUNT Q(t)<br />

elimination (rate k e )<br />

−−−−−−−−−−−→<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.3


One compartment model<br />

(oral administration, first-order absortion and elimination)<br />

D absortion (rate k a)<br />

−−−−−−−−−−−→<br />

DRUG AMOUNT Q(t)<br />

elimination (rate k e )<br />

−−−−−−−−−−−→<br />

Q a (t): amount at absorption site.<br />

dQ<br />

dt (t) = k aQ a (t) − k e Q(t)<br />

dQ a<br />

dt (t) = −k aQ a (t)<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.3


One compartment model<br />

(oral administration, first-order absortion and elimination)<br />

D absortion (rate k a)<br />

−−−−−−−−−−−→<br />

DRUG AMOUNT Q(t)<br />

elimination (rate k e )<br />

−−−−−−−−−−−→<br />

Q a (t): amount at absorption site.<br />

C(t) = Q(t)<br />

V<br />

dQ<br />

dt (t) = k aQ a (t) − k e Q(t)<br />

dQ a<br />

dt (t) = −k aQ a (t)<br />

= D k ak e<br />

Cl(k a − k e )<br />

(e −k et − e −k at )<br />

Cl, k a et k e sont des paramètres physiologiques individuels.<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.3


oral administration, first-order absortion and elimination<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.4


Viral load decrease during anti-HIV treatment<br />

15 patients:<br />

6<br />

6<br />

6<br />

6<br />

6<br />

5<br />

5<br />

5<br />

5<br />

5<br />

4<br />

4<br />

4<br />

4<br />

4<br />

3<br />

3<br />

3<br />

3<br />

3<br />

2<br />

2<br />

2<br />

2<br />

2<br />

1<br />

1<br />

1<br />

1<br />

1<br />

0 50 100<br />

0 50 100<br />

0 50 100<br />

0 50 100<br />

0 50 100<br />

6<br />

6<br />

6<br />

6<br />

6<br />

5<br />

5<br />

5<br />

5<br />

5<br />

4<br />

4<br />

4<br />

4<br />

4<br />

3<br />

3<br />

3<br />

3<br />

3<br />

2<br />

2<br />

2<br />

2<br />

2<br />

1<br />

1<br />

1<br />

1<br />

1<br />

0 50 100<br />

0 50 100<br />

0 50 100<br />

0 50 100<br />

0 50 100<br />

6<br />

6<br />

6<br />

6<br />

6<br />

5<br />

5<br />

5<br />

5<br />

5<br />

4<br />

4<br />

4<br />

4<br />

4<br />

3<br />

3<br />

3<br />

3<br />

3<br />

2<br />

2<br />

2<br />

2<br />

2<br />

1<br />

1<br />

1<br />

1<br />

1<br />

0 50 100<br />

0 50 100<br />

0 50 100<br />

0 50 100<br />

0 50 100<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.5


Viral load decrease during anti-HIV treatment<br />

4<br />

3.5<br />

3<br />

log(CV) (cp/ml)<br />

2.5<br />

2<br />

1.5<br />

1<br />

0.5<br />

0 20 40 60 80 100 120<br />

time (weeks)<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.6


Viral load decrease during anti-HIV treatment<br />

4<br />

3.5<br />

3<br />

log(CV) (cp/ml)<br />

2.5<br />

2<br />

1.5<br />

1<br />

0.5<br />

0 20 40 60 80 100 120<br />

time (weeks)<br />

L(t) = A 1 e −λ 1t + A 2 e −λ 2t<br />

; (λ 1 > λ 2 )<br />

Initial rate constant of viral load decrease : λ 1<br />

Terminal rate constant of viral load decrease : λ 2<br />

A 1 , A 2 , λ 1 et λ 2 sont des paramètres physiologiques individuels.<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.6


Crop yield responses to applied fertilizer on 37 site-year<br />

12<br />

1<br />

11<br />

10<br />

9<br />

8<br />

7<br />

6<br />

5<br />

4<br />

3<br />

0 50 100 150 200 250 300 350<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.7


Evolution of the weight of 560 cows<br />

1200<br />

1<br />

1000<br />

800<br />

600<br />

400<br />

200<br />

0<br />

0 200 400 600 800 1000 1200 1400 1600 1800 2000<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.8


Le modèle mixte<br />

On aimerait construire un modèle qui permette de décrire chaque<br />

courbe individuelle par le même modèle paramétrique,<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.9


Le modèle mixte<br />

On aimerait construire un modèle qui permette de décrire chaque<br />

courbe individuelle par le même modèle paramétrique,<br />

en considérant que chaque courbe est paramétrée par ses propres<br />

paramètres individuels,<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.9


Le modèle mixte<br />

On aimerait construire un modèle qui permette de décrire chaque<br />

courbe individuelle par le même modèle paramétrique,<br />

en considérant que chaque courbe est paramétrée par ses propres<br />

paramètres individuels,<br />

en considérant que ces paramètres individuels fluctuent autour d’un<br />

paramètre moyen de population.<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.9


<strong>Les</strong> modèles à <strong>effets</strong> <strong>mixtes</strong><br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.10


The (<strong>non</strong>linear) mixed effects model<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.11


The (<strong>non</strong>linear) mixed effects model<br />

y ij = a(t ij , φ i ) + b(t ij , φ i )ε ij<br />

; 1 ≤ i ≤ n ; 1 ≤ j ≤ n i<br />

(y ij ) are the observations<br />

a et b are known regression functions.<br />

(t ij ) are the measurement times.<br />

(ε ij ) are intra-individual fluctuations.<br />

(φ i ) are the individual (random) parameters.<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.11


The (<strong>non</strong>linear) mixed effects model<br />

y ij = a(t ij , φ i ) + b(t ij , φ i )ε ij<br />

; 1 ≤ i ≤ n ; 1 ≤ j ≤ n i<br />

(y ij ) are the observations<br />

a et b are known regression functions.<br />

(t ij ) are the measurement times.<br />

(ε ij ) are intra-individual fluctuations.<br />

(φ i ) are the individual (random) parameters.<br />

φ i ∼ i.i.d. π<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.11


The (<strong>non</strong>linear) mixed effects model<br />

(model without covariate)<br />

y ij = a(t ij , φ i ) + b(t ij , φ i )ε ij<br />

; 1 ≤ i ≤ n ; 1 ≤ j ≤ n i<br />

φ i ∼ i.i.d. N (µ, Γ)<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.12


The (<strong>non</strong>linear) mixed effects model<br />

(model without covariate)<br />

y ij = a(t ij , φ i ) + b(t ij , φ i )ε ij<br />

; 1 ≤ i ≤ n ; 1 ≤ j ≤ n i<br />

Fixed effects : µ<br />

Random effects : (φ i − µ).<br />

φ i ∼ i.i.d. N (µ, Γ)<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.12


The (<strong>non</strong>linear) mixed effects model<br />

(model with covariate)<br />

y ij = a(t ij , φ i ) + b(t ij , φ i )ε ij<br />

; 1 ≤ i ≤ n ; 1 ≤ j ≤ n i<br />

φ i = A i µ + B i η i<br />

A i , B i : design matrix formed with covariates<br />

η i ∼ i.i.d. N (0, Γ)<br />

Fixed effects : µ<br />

Random effects : (η i )<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.13


The (<strong>non</strong>linear) mixed effects model<br />

(model with covariate)<br />

y ij = a(t ij , φ i ) + b(t ij , φ i )ε ij<br />

; 1 ≤ i ≤ n ; 1 ≤ j ≤ n i<br />

φ i = A i µ + B i η i<br />

A i , B i : design matrix formed with covariates<br />

η i ∼ i.i.d. N (0, Γ)<br />

Fixed effects : µ<br />

Random effects : (η i )<br />

ε ij ∼ i.i.d. N (0, σ 2 )<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.13


The (<strong>non</strong>linear) mixed effects model<br />

(model with covariate)<br />

y ij = a(t ij , φ i ) + b(t ij , φ i )ε ij<br />

; 1 ≤ i ≤ n ; 1 ≤ j ≤ n i<br />

φ i = A i µ + B i η i<br />

A i , B i : design matrix formed with covariates<br />

η i ∼ i.i.d. N (0, Γ)<br />

Fixed effects : µ<br />

Random effects : (η i )<br />

ε ij ∼ i.i.d. N (0, σ 2 )<br />

(Hyper)parameters of the model: θ = (µ, Γ, σ 2 ).<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.13


Objectifs<br />

Estimation<br />

Estimer l’ensemble des paramètres du modèle θ<br />

Calculer un intervalle de confiance<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.14


Objectifs<br />

Estimation<br />

Estimer l’ensemble des paramètres du modèle θ<br />

Calculer un intervalle de confiance<br />

Sélection de modèle<br />

Sélectionner le modèle de covariables<br />

Sélectionner le modèle de covariance des <strong>effets</strong> aléatoires<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.14


Objectifs<br />

Estimation<br />

Estimer l’ensemble des paramètres du modèle θ<br />

Calculer un intervalle de confiance<br />

Sélection de modèle<br />

Sélectionner le modèle de covariables<br />

Sélectionner le modèle de covariance des <strong>effets</strong> aléatoires<br />

Tests d’hypothèses<br />

Comparer deux traitements<br />

Tester si un effet est fixe ou aléatoire<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.14


Objectifs<br />

Estimation<br />

Estimer l’ensemble des paramètres du modèle θ<br />

Calculer un intervalle de confiance<br />

Sélection de modèle<br />

Sélectionner le modèle de covariables<br />

Sélectionner le modèle de covariance des <strong>effets</strong> aléatoires<br />

Tests d’hypothèses<br />

Comparer deux traitements<br />

Tester si un effet est fixe ou aléatoire<br />

Optimisation de plans d’expérience<br />

Determiner le design qui permet la meileure estimation du modèle<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.14


<strong>Les</strong> modèles <strong>mixtes</strong> en plein boom ...<br />

<strong>Les</strong> modèles (<strong>non</strong> linéaires) à <strong>effets</strong> <strong>mixtes</strong>, sont utilisés aujourd’hui<br />

dans de très nombreux domaines d’application:<br />

pharmacologie, oncologie, neurosciences, agronomie, génétique<br />

animale, climatologie, écologie . . .<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.15


<strong>Les</strong> modèles <strong>mixtes</strong> en plein boom ...<br />

<strong>Les</strong> modèles (<strong>non</strong> linéaires) à <strong>effets</strong> <strong>mixtes</strong>, sont utilisés aujourd’hui<br />

dans de très nombreux domaines d’application:<br />

pharmacologie, oncologie, neurosciences, agronomie, génétique<br />

animale, climatologie, écologie . . .<br />

Nombre d’articles référencés dans Medline avec le mot clé<br />

“mixed effects model” :<br />

40 entre 1980 et 1989<br />

303 entre 1990 et 1999<br />

523 depuis 2000<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.15


<strong>Les</strong> modèles <strong>mixtes</strong> en plein boom ...<br />

<strong>Les</strong> modèles (<strong>non</strong> linéaires) à <strong>effets</strong> <strong>mixtes</strong>, sont utilisés aujourd’hui<br />

dans de très nombreux domaines d’application:<br />

pharmacologie, oncologie, neurosciences, agronomie, génétique<br />

animale, climatologie, écologie . . .<br />

Nombre d’articles référencés dans Medline avec le mot clé<br />

“mixed effects model” :<br />

40 entre 1980 et 1989<br />

303 entre 1990 et 1999<br />

523 depuis 2000<br />

Développement récents en statistique :<br />

Modèles à données incomplètes<br />

Sélection de modèles<br />

Optimisation de protocoles<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.15


Le groupe de travail MONOLIX<br />

Groupe de travail pluridisciplinaire animé par France Mentré (Inserm et<br />

Université Paris 7) et Marc Lavielle depuis octobre 2003 et regoupant<br />

une vingtaine de participants (Inserm, INRA, INA-PG, CEMAGREF,<br />

Ecole Vétérinaire, Universités P5, P11, P13, Lyon 1)<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.16


Le groupe de travail MONOLIX<br />

Groupe de travail pluridisciplinaire animé par France Mentré (Inserm et<br />

Université Paris 7) et Marc Lavielle depuis octobre 2003 et regoupant<br />

une vingtaine de participants (Inserm, INRA, INA-PG, CEMAGREF,<br />

Ecole Vétérinaire, Universités P5, P11, P13, Lyon 1)<br />

des collaborations en statistique:<br />

Modèles avec ODE, SDE<br />

Modèles avec données manquantes ou censurées<br />

Estimation REML<br />

Algorithme PX-SAEM<br />

Sélection de modèles<br />

Tests de validité<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.16


Le groupe de travail MONOLIX<br />

Groupe de travail pluridisciplinaire animé par France Mentré (Inserm et<br />

Université Paris 7) et Marc Lavielle depuis octobre 2003 et regoupant<br />

une vingtaine de participants (Inserm, INRA, INA-PG, CEMAGREF,<br />

Ecole Vétérinaire, Universités P5, P11, P13, Lyon 1)<br />

des collaborations en statistique:<br />

Modèles avec ODE, SDE<br />

Modèles avec données manquantes ou censurées<br />

Estimation REML<br />

Algorithme PX-SAEM<br />

Sélection de modèles<br />

Tests de validité<br />

des applications en pharmacologie, en oncologie, en agronomie, en<br />

génétique animale,. . .<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.16


Le groupe de travail MONOLIX<br />

des thèses en co-direction :<br />

Cristian Meza : M. Lavielle (P11) et J.L. Foulley (INRA)<br />

Adeline Samson : M. Lavielle (P11) et F. Mentré (INSERM)<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.17


Le groupe de travail MONOLIX<br />

des thèses en co-direction :<br />

Cristian Meza : M. Lavielle (P11) et J.L. Foulley (INRA)<br />

Adeline Samson : M. Lavielle (P11) et F. Mentré (INSERM)<br />

des publications communes :<br />

soumis ou à paraître dans : Biostatistics, Statistics in Medecine, Genetics,<br />

Journal of Agricultural Biological and Environmental Statistics, Journal of Statistics<br />

and Planning Inference, Statistics and Computation, Computational Statistics and<br />

Data Analysis, Journal of PK/PD...<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.17


Le groupe de travail MONOLIX<br />

des thèses en co-direction :<br />

Cristian Meza : M. Lavielle (P11) et J.L. Foulley (INRA)<br />

Adeline Samson : M. Lavielle (P11) et F. Mentré (INSERM)<br />

des publications communes :<br />

soumis ou à paraître dans : Biostatistics, Statistics in Medecine, Genetics,<br />

Journal of Agricultural Biological and Environmental Statistics, Journal of Statistics<br />

and Planning Inference, Statistics and Computation, Computational Statistics and<br />

Data Analysis, Journal of PK/PD...<br />

des congrès:<br />

SMAI 2005 (organisation d’un mini-symposium),<br />

SFdS 2005 (organisation d’une session spéciale),<br />

PAGE (Population Approach Group in Europe) 2004 et 2005,<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.17


Le groupe de travail MONOLIX<br />

des thèses en co-direction :<br />

Cristian Meza : M. Lavielle (P11) et J.L. Foulley (INRA)<br />

Adeline Samson : M. Lavielle (P11) et F. Mentré (INSERM)<br />

des publications communes :<br />

soumis ou à paraître dans : Biostatistics, Statistics in Medecine, Genetics,<br />

Journal of Agricultural Biological and Environmental Statistics, Journal of Statistics<br />

and Planning Inference, Statistics and Computation, Computational Statistics and<br />

Data Analysis, Journal of PK/PD...<br />

des congrès:<br />

SMAI 2005 (organisation d’un mini-symposium),<br />

SFdS 2005 (organisation d’une session spéciale),<br />

PAGE (Population Approach Group in Europe) 2004 et 2005,<br />

le logiciel Monolix<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.17


Le groupe de travail MONOLIX<br />

des thèses en co-direction :<br />

Cristian Meza : M. Lavielle (P11) et J.L. Foulley (INRA)<br />

Adeline Samson : M. Lavielle (P11) et F. Mentré (INSERM)<br />

des publications communes :<br />

soumis ou à paraître dans : Biostatistics, Statistics in Medecine, Genetics,<br />

Journal of Agricultural Biological and Environmental Statistics, Journal of Statistics<br />

and Planning Inference, Statistics and Computation, Computational Statistics and<br />

Data Analysis, Journal of PK/PD...<br />

des congrès:<br />

SMAI 2005 (organisation d’un mini-symposium),<br />

SFdS 2005 (organisation d’une session spéciale),<br />

PAGE (Population Approach Group in Europe) 2004 et 2005,<br />

le logiciel Monolix<br />

un projet ANR (programme <strong>non</strong> thématique, CSD 5)<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.17


<strong>Les</strong> méthodes d’estimation<br />

existantes<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.18


Some existing methods<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.19


Some existing methods<br />

1. Methods based on individual estimates<br />

i) Estimate the individual parameters (φ i ),<br />

ii) Estimate θ using (̂φ i ).<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.19


Some existing methods<br />

1. Methods based on individual estimates<br />

i) Estimate the individual parameters (φ i ),<br />

ii) Estimate θ using (̂φ i ).<br />

=⇒ Requires a large number of observations per subject.<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.19


Some existing methods<br />

2. Methods based on approximations of the likelihood<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.20


Some existing methods<br />

2. Methods based on approximations of the likelihood<br />

First order methods (FO, Beal and Sheiner, 1982)<br />

φ i = µ + η i<br />

y ij ≈ a(t ij , µ) + da<br />

dt a(t ij, µ)η i + b(t ij , µ)ε ij<br />

i) NONMEM package (very popular in pharmacokinetics)<br />

ii) SAS proc NLMIXED (using the method=firo option)<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.20


Some existing methods<br />

2. Methods based on approximations of the likelihood<br />

First order methods (FO, Beal and Sheiner, 1982)<br />

φ i = µ + η i<br />

y ij ≈ a(t ij , µ) + da<br />

dt a(t ij, µ)η i + b(t ij , µ)ε ij<br />

i) NONMEM package (very popular in pharmacokinetics)<br />

ii) SAS proc NLMIXED (using the method=firo option)<br />

First order conditional methods (FOCE, Lindstrom and Bates, 1990)<br />

y ij ≈ a(t ij , ˆφ i ) + da<br />

dt a(t ij, ˆφ i )(φ i − ˆφ i ) + b(t ij , ˆφ i )ε ij<br />

ˆφ i maximizes the conditional distribution p(φ i |y i ; θ)<br />

i) NONMEM package (FOCE option)<br />

ii) SAS proc NLMIXED (using the method=eblup option)<br />

iii) Splus/R function NLME<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.20


Some existing methods<br />

3. Methods based on the exact likelihood<br />

EM algorithm (Dempster et al, 1977)<br />

MCEM algorithm (Walker, 1996)<br />

SPML algorithm (Concordet and Nunez, 2002)<br />

SAEM algorithm (Delyon, Lavielle and Moulines, 1999 ; Kuhn and Lavielle, 2003)<br />

MC-PEM algorithm (Bauer and Guzy, 2004)<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.21


The incomplete data model<br />

The complete likelihood f of (y, φ) belongs to a parametric family<br />

{f(y, φ; θ), θ ∈ Θ}.<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.22


The incomplete data model<br />

The complete likelihood f of (y, φ) belongs to a parametric family<br />

{f(y, φ; θ), θ ∈ Θ}.<br />

Objectives<br />

Compute the value θ ML that maximises the likelihood g(y; θ) of the<br />

observed data<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.22


The incomplete data model<br />

The complete likelihood f of (y, φ) belongs to a parametric family<br />

{f(y, φ; θ), θ ∈ Θ}.<br />

Objectives<br />

Compute the value θ ML that maximises the likelihood g(y; θ) of the<br />

observed data<br />

Estimate the likelihood of the observations g(y; θ ML ).<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.22


The incomplete data model<br />

The complete likelihood f of (y, φ) belongs to a parametric family<br />

{f(y, φ; θ), θ ∈ Θ}.<br />

Objectives<br />

Compute the value θ ML that maximises the likelihood g(y; θ) of the<br />

observed data<br />

Estimate the likelihood of the observations g(y; θ ML ).<br />

Estimate the Fisher information matrix −∂ 2 θ log g(y; θML ).<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.22


The EM algorithm (Expectation-Maximization)<br />

(Dempster, Laird et Rubin, 1977)<br />

Complete-data model: (y, φ) ∼ f(·, · ; θ) ; only y is observed.<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.23


The EM algorithm (Expectation-Maximization)<br />

(Dempster, Laird et Rubin, 1977)<br />

Complete-data model: (y, φ) ∼ f(·, · ; θ) ; only y is observed.<br />

Iteration k of the algorithm:<br />

step E : evaluate the quantity<br />

Q k (θ) = E[log f(y, φ; θ)|y; θ k−1 ]<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.23


The EM algorithm (Expectation-Maximization)<br />

(Dempster, Laird et Rubin, 1977)<br />

Complete-data model: (y, φ) ∼ f(·, · ; θ) ; only y is observed.<br />

Iteration k of the algorithm:<br />

step E : evaluate the quantity<br />

Q k (θ) = E[log f(y, φ; θ)|y; θ k−1 ]<br />

step M : update the estimation of θ:<br />

θ k = Argmax Q k (θ)<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.23


Convergence of EM<br />

Dempster et al. (1977), Wu (1983)<br />

Convergence of (θ k ) to a stationary point ̂θ g of the observed likelihood is<br />

ensured under some regularity conditions.<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.24


Convergence of EM<br />

Dempster et al. (1977), Wu (1983)<br />

Convergence of (θ k ) to a stationary point ̂θ g of the observed likelihood is<br />

ensured under some regularity conditions.<br />

Some practical drawbacks of EM:<br />

Nature of the limiting point.<br />

Convergence depends on the initial guess.<br />

Slow convergence of EM.<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.24


Convergence of EM<br />

Dempster et al. (1977), Wu (1983)<br />

Convergence of (θ k ) to a stationary point ̂θ g of the observed likelihood is<br />

ensured under some regularity conditions.<br />

Some practical drawbacks of EM:<br />

Nature of the limiting point.<br />

Convergence depends on the initial guess.<br />

Slow convergence of EM.<br />

Evaluation of Q k (θ) = E[log f(y, φ; θ)|y; θ k−1 ] during step E.<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.24


Convergence of EM<br />

Dempster et al. (1977), Wu (1983)<br />

Convergence of (θ k ) to a stationary point ̂θ g of the observed likelihood is<br />

ensured under some regularity conditions.<br />

Some practical drawbacks of EM:<br />

Nature of the limiting point.<br />

Convergence depends on the initial guess.<br />

Slow convergence of EM.<br />

Evaluation of Q k (θ) = E[log f(y, φ; θ)|y; θ k−1 ] during step E.<br />

=⇒ use a simulated sequence φ<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.24


A Stochastic Approximation<br />

version of EM<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.25


The SAEM algorithm (Stochastic Approximation of EM)<br />

Delyon, Lavielle and Moulines (1999)<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.26


The SAEM algorithm (Stochastic Approximation of EM)<br />

Delyon, Lavielle and Moulines (1999)<br />

Iteration k of the algorithm:<br />

draw the <strong>non</strong> observed data φ k with the conditional distribution<br />

p Φ|Y ( · |y; θ k−1 ).<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.26


The SAEM algorithm (Stochastic Approximation of EM)<br />

Delyon, Lavielle and Moulines (1999)<br />

Iteration k of the algorithm:<br />

draw the <strong>non</strong> observed data φ k with the conditional distribution<br />

p Φ|Y ( · |y; θ k−1 ).<br />

Stochastic approximation<br />

Q k (θ) = Q k−1 (θ) + γ k [log f(y, φ k ; θ) − Q k−1 (θ)]<br />

where (γ k ) is a decreasing sequence such that ∑ γ k = +∞ and<br />

∑ γ<br />

2<br />

k<br />

< +∞ .<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.26


The SAEM algorithm (Stochastic Approximation of EM)<br />

Delyon, Lavielle and Moulines (1999)<br />

Iteration k of the algorithm:<br />

draw the <strong>non</strong> observed data φ k with the conditional distribution<br />

p Φ|Y ( · |y; θ k−1 ).<br />

Stochastic approximation<br />

Q k (θ) = Q k−1 (θ) + γ k [log f(y, φ k ; θ) − Q k−1 (θ)]<br />

where (γ k ) is a decreasing sequence such that ∑ γ k = +∞ and<br />

∑ γ<br />

2<br />

k<br />

< +∞ .<br />

Maximization :<br />

θ k = Argmax Q k (θ)<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.26


Convergence of SAEM<br />

Delyon, Lavielle et Moulines (1999)<br />

For exponential models, the sequence (θ k ) converges almost surely<br />

toward a stationary point ̂θ g of the observed likelihood g under very<br />

general conditions.<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.27


Convergence of SAEM<br />

Delyon, Lavielle et Moulines (1999)<br />

For exponential models, the sequence (θ k ) converges almost surely<br />

toward a stationary point ̂θ g of the observed likelihood g under very<br />

general conditions.<br />

Some weak hypothesis ensure the convergence to a (local) maximum of<br />

the likelihood<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.27


Convergence of SAEM<br />

Delyon, Lavielle et Moulines (1999)<br />

For exponential models, the sequence (θ k ) converges almost surely<br />

toward a stationary point ̂θ g of the observed likelihood g under very<br />

general conditions.<br />

Some weak hypothesis ensure the convergence to a (local) maximum of<br />

the likelihood<br />

Practical drawbacks:<br />

Convergence depends on the initial guess.<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.27


Convergence of SAEM<br />

Delyon, Lavielle et Moulines (1999)<br />

For exponential models, the sequence (θ k ) converges almost surely<br />

toward a stationary point ̂θ g of the observed likelihood g under very<br />

general conditions.<br />

Some weak hypothesis ensure the convergence to a (local) maximum of<br />

the likelihood<br />

Practical drawbacks:<br />

Convergence depends on the initial guess.<br />

=⇒ use a simulated annealing version of SAEM<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.27


Convergence of SAEM<br />

Delyon, Lavielle et Moulines (1999)<br />

For exponential models, the sequence (θ k ) converges almost surely<br />

toward a stationary point ̂θ g of the observed likelihood g under very<br />

general conditions.<br />

Some weak hypothesis ensure the convergence to a (local) maximum of<br />

the likelihood<br />

Practical drawbacks:<br />

Convergence depends on the initial guess.<br />

=⇒ use a simulated annealing version of SAEM<br />

Exact simulation of φ with the conditional distribution not always<br />

possible.<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.27


Convergence of SAEM<br />

Delyon, Lavielle et Moulines (1999)<br />

For exponential models, the sequence (θ k ) converges almost surely<br />

toward a stationary point ̂θ g of the observed likelihood g under very<br />

general conditions.<br />

Some weak hypothesis ensure the convergence to a (local) maximum of<br />

the likelihood<br />

Practical drawbacks:<br />

Convergence depends on the initial guess.<br />

=⇒ use a simulated annealing version of SAEM<br />

Exact simulation of φ with the conditional distribution not always<br />

possible.<br />

=⇒ use a MCMC method.<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.27


A Simulated Annealing version of SAEM<br />

Conditional distribution of φ:<br />

p Φ|Y ( φ |y; θ) = C(y; θ)e −U(φ,y;θ)<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.28


A Simulated Annealing version of SAEM<br />

Conditional distribution of φ:<br />

Temperature parameter T :<br />

p Φ|Y ( φ |y; θ) = C(y; θ)e −U(φ,y;θ)<br />

p (T )<br />

Φ|Y ( φ |y; θ) = C T (y; θ)e − U(φ,y;θ)<br />

T<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.28


A Simulated Annealing version of SAEM<br />

Conditional distribution of φ:<br />

Temperature parameter T :<br />

p Φ|Y ( φ |y; θ) = C(y; θ)e −U(φ,y;θ)<br />

p (T )<br />

Φ|Y ( φ |y; θ) = C T (y; θ)e − U(φ,y;θ)<br />

T<br />

Choose a decreasing Temperature sequence (T k ) that converges to 1.<br />

Then, at iteration k of SAEM,<br />

Simulation: draw the <strong>non</strong> observed data φ k with the conditional<br />

distribution p (T k)<br />

Φ|Y ( · |y; θ k−1)<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.28


A Simulated Annealing version of SAEM<br />

Conditional distribution of φ:<br />

Temperature parameter T :<br />

p Φ|Y ( φ |y; θ) = C(y; θ)e −U(φ,y;θ)<br />

p (T )<br />

Φ|Y ( φ |y; θ) = C T (y; θ)e − U(φ,y;θ)<br />

T<br />

Choose a decreasing Temperature sequence (T k ) that converges to 1.<br />

Then, at iteration k of SAEM,<br />

Simulation: draw the <strong>non</strong> observed data φ k with the conditional<br />

distribution p (T k)<br />

Φ|Y ( · |y; θ k−1)<br />

Stochastic approximation<br />

Maximization<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.28


Coupling SAEM and MCMC<br />

(Kuhn and Lavielle)<br />

Let Π θ be the transition probability of an ergodic Markov Chain with<br />

limiting distribution p Φ|Y (·|y; θ).<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.29


Coupling SAEM and MCMC<br />

(Kuhn and Lavielle)<br />

Let Π θ be the transition probability of an ergodic Markov Chain with<br />

limiting distribution p Φ|Y (·|y; θ).<br />

Iteration k of the algorithm:<br />

step S : draw φ k according to the transition probability<br />

Π θk−1 (φ k−1 , ·).<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.29


Coupling SAEM and MCMC<br />

(Kuhn and Lavielle)<br />

Let Π θ be the transition probability of an ergodic Markov Chain with<br />

limiting distribution p Φ|Y (·|y; θ).<br />

Iteration k of the algorithm:<br />

step S : draw φ k according to the transition probability<br />

Π θk−1 (φ k−1 , ·).<br />

Stochastic approximation<br />

Q k (θ) = Q k−1 (θ) + γ k [log f(y, φ k ; θ) − Q k−1 (θ)]<br />

Maximization :<br />

θ k = Argmax Q k (θ)<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.29


Convergence of the algorithm<br />

(Kuhn and Lavielle)<br />

C1 The chain (φ k ) k≥0 takes its values in a compact subset E of R l .<br />

C2 For any compact subset V of Θ, there exists a real constant L such<br />

that for any (θ, θ ′ ) in V 2<br />

sup |Π θ (x, y) − Π θ ′(x, y)| ≤ L|θ − θ ′ |.<br />

(x,y)∈E 2<br />

C3 The transition probability Π θ generates a uniformly ergodic chain<br />

whose invariant probability is p(·|y; θ): there exists K θ ∈ R + and<br />

ρ θ ∈]0, 1[ such that<br />

∀φ ∈ E, ∀k ∈ N, ||Π k θ (φ, ·) − p(·|y; θ)|| T V ≤ K θ ρ k θ ,<br />

K sup<br />

θ<br />

K θ < +∞ and ρ sup<br />

θ<br />

ρ θ < 1.<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.30


Convergence of the algorithm<br />

(Kuhn and Lavielle)<br />

Theorem<br />

- Assume that the regularity conditions required for the convergence<br />

of EM are satisfied<br />

- Assume that assumptions C1-C3 hold<br />

- Assume that for any θ ∈ Θ, the sequence (Q k (θ)) k≥0 takes its<br />

values in a compact subset of S.<br />

Then, w.p. 1, lim k→+∞ d(θ k , L) = 0 where d(x, A) denotes the distance<br />

of x to the closed subset A and L = {θ ∈ Θ, ∂ θ g(y; θ) = 0} is the set of<br />

stationary points of g.<br />

(Some weak hypothesis ensure the convergence to a (local) maximum<br />

of the likelihood)<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.31


Estimation of the Fisher Information matrix<br />

An estimate of the asymptotic covariance matrix of ̂θ g is the inverse of<br />

the observed Fisher Information matrix :<br />

−∂ 2 θ log g(y; ̂θ g )<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.32


Estimation of the Fisher Information matrix<br />

An estimate of the asymptotic covariance matrix of ̂θ g is the inverse of<br />

the observed Fisher Information matrix :<br />

−∂ 2 θ log g(y; ̂θ g )<br />

Louis’s missing information principle (1982)<br />

∂θ 2 log g(y; θ) = E y;θ[∂θ 2 log f(y, φ; θ)] + Cov y;θ[∂ θ log f(y, φ; θ)]<br />

where<br />

Cov y;θ [∂ θ log f(y, φ; θ)] = E y;θ [ ( ∂ θ log f(y, φ; θ) )( ∂ θ log f(y, φ; θ) ) ′ ]<br />

− E y;θ [∂ θ log f(y, φ; θ)]E y;θ [∂ θ log f(y, φ; θ)] ′<br />

and<br />

∂ θ log g(y; θ) = E y;θ [∂ θ log f(y, φ; θ)]<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.32


Estimation of the Fisher Information matrix<br />

Stochastic approximation:<br />

∆ k = ∆ k−1 + γ k [∂ θ log f(y, φ k ; θ k ) − ∆ k−1 ]<br />

D k = D k−1 + γ k<br />

[<br />

∂<br />

2<br />

θ log f(y, φ k ; θ k ) − Dk − 1 ]<br />

G k = G k−1 + γ k<br />

[<br />

∂θ log f(y, φ k ; θ k )∂ θ log f(y, φ k ; θ k ) t − G k−1<br />

]<br />

H k = D k + G k − ∆ k ∆ t k<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.33


Estimation of the Fisher Information matrix<br />

Stochastic approximation:<br />

∆ k = ∆ k−1 + γ k [∂ θ log f(y, φ k ; θ k ) − ∆ k−1 ]<br />

D k = D k−1 + γ k<br />

[<br />

∂<br />

2<br />

θ log f(y, φ k ; θ k ) − Dk − 1 ]<br />

G k = G k−1 + γ k<br />

[<br />

∂θ log f(y, φ k ; θ k )∂ θ log f(y, φ k ; θ k ) t − G k−1<br />

]<br />

H k = D k + G k − ∆ k ∆ t k<br />

Under some regularity conditions, the sequence (H k ) converges<br />

almost surely to the Fisher Information matrix<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.33


Estimation of the likelihood<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.34


Estimation of the likelihood<br />

Importance sampling:<br />

g(y) =<br />

=<br />

=<br />

∫<br />

f(y, φ)dφ<br />

∫<br />

h(y|φ)π(φ)dφ<br />

∫ (<br />

h(y|φ) π(φ) )<br />

˜π(φ)<br />

˜π(φ)dφ<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.34


Estimation of the likelihood<br />

Importance sampling:<br />

g(y) =<br />

=<br />

=<br />

∫<br />

f(y, φ)dφ<br />

∫<br />

h(y|φ)π(φ)dφ<br />

∫ (<br />

h(y|φ) π(φ) )<br />

˜π(φ)<br />

˜π(φ)dφ<br />

1) Draw φ (1) , φ (2) , . . . , φ (N) with the distribution ˜π,<br />

2) Let<br />

ĝ N (y) = 1 N∑<br />

h(y|φ (j) ) π(φ(j) )<br />

N<br />

˜π(φ (j) )<br />

j=1<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.34


Estimation of the likelihood<br />

Importance sampling:<br />

ĝ N (y) = 1 N<br />

N∑<br />

j=1<br />

h(y|φ (j) ) π(φ(j) )<br />

˜π(φ (j) )<br />

Eĝ N (y) = g(y)<br />

Varĝ N (y) = O(1/N)<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.35


Estimation of the likelihood<br />

Importance sampling:<br />

ĝ N (y) = 1 N<br />

N∑<br />

j=1<br />

h(y|φ (j) ) π(φ(j) )<br />

˜π(φ (j) )<br />

Eĝ N (y) = g(y)<br />

Varĝ N (y) = O(1/N)<br />

Varĝ N (y) = 0 ⇐⇒ ˜π(φ) = p(φ|y)<br />

Then,<br />

1) Estimate the conditional mean and the conditional variance of φ<br />

(using MCMC)<br />

2) Use for ˜π a Gaussian distribution (or a mixture Gaussian/Cauchy)<br />

with these parameters<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.35


Le logiciel MONOLIX<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.36


Le logiciel MONOLIX<br />

A pharmacokinetics example : theophylline<br />

Twelve subjects were given oral doses of the anti-asthmatic drug<br />

theophylline, then serum concentrations (in mg/L) were measured at 11<br />

time points over the next 25 hours.<br />

Subject i receive an initial dose D i at time 0 and serum concentrations<br />

(y ij ) are measured at time (t ij ). Serum concentration is modeled by a<br />

first-order one compartment model. Then,<br />

where<br />

y ij =<br />

D i ka i ke i<br />

Cl i (ka i − ke i )<br />

ke i is the elimination rate of subject i,<br />

ka i is the absortion rate of subject i,<br />

Cl i is the clearance of subject i.<br />

(e −ke i t ij<br />

− e −ka i t ij<br />

)<br />

+ ε ij<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.37


Le logiciel MONOLIX<br />

A pharmacokinetics example : theophylline<br />

y ij =<br />

D i ka i ke i<br />

Cl i (ka i − ke i )<br />

(e −ke i t ij<br />

− e −ka i t ij<br />

)<br />

+ ε ij<br />

For subject i,<br />

the vector of regression (or design) variables is x ij = (D i , t ij ),<br />

the vector of individual parameters is<br />

φ i = (log(ke i ), log(ka i ), log(Cl i )),<br />

the only available covariate is the weight w i .<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.38


Modèle défini par un système<br />

d’équations différentielles<br />

ordinaires<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.39


Modèle défini par un système d’EDO<br />

(Sophie DONNET et Adeline SAMSON)<br />

Exemple de modèle de pharmacocinétique (modèle de Michaelis<br />

Menten) à un compartiment avec absorption du premier ordre:<br />

dC<br />

dt (t, φ) = k a·Dose<br />

e −kat − V m·C(t, φ)<br />

V<br />

k m + C(t, φ)<br />

C(t, φ) (g/L) concentration du médicament<br />

Dose quantité connue fixée<br />

φ = (k m , V m , k a , V )<br />

k m (g/L) constante d’élimination<br />

V m (g/L/h) volume maximal d’élimination<br />

k a (h −1 ) constante d’absorption de la molécule<br />

V (L) volume total de distribution de la molécule dans le corps<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.40


Modèle défini par un système d’EDO<br />

(Sophie DONNET et Adeline SAMSON)<br />

Exemple de modèle de pharmacocinétique (modèle de Michaelis<br />

Menten) à un compartiment avec absorption du premier ordre:<br />

dC<br />

dt (t, φ) = k a·Dose<br />

e −kat − V m·C(t, φ)<br />

V<br />

k m + C(t, φ)<br />

C(t, φ) (g/L) concentration du médicament<br />

Dose quantité connue fixée<br />

φ = (k m , V m , k a , V )<br />

k m (g/L) constante d’élimination<br />

V m (g/L/h) volume maximal d’élimination<br />

k a (h −1 ) constante d’absorption de la molécule<br />

V (L) volume total de distribution de la molécule dans le corps<br />

ODE sans solution analytique<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.40


Modèle mixte avec équation différentielle<br />

Modèle statistique <strong>non</strong> linéaire à <strong>effets</strong> <strong>mixtes</strong><br />

y ij = f(t ij , φ i ) + ε ij 1 ≤ j ≤ n i , 1 ≤ i ≤ N<br />

ε ij ∼ i.i.d N (0, σ 2 )<br />

φ i ∼ i.i.d. π φ (.; β)<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.41


Modèle mixte avec équation différentielle<br />

Modèle statistique <strong>non</strong> linéaire à <strong>effets</strong> <strong>mixtes</strong><br />

y ij = f(t ij , φ i ) + ε ij 1 ≤ j ≤ n i , 1 ≤ i ≤ N<br />

ε ij ∼ i.i.d N (0, σ 2 )<br />

φ i ∼ i.i.d. π φ (.; β)<br />

Fonction de régression f :<br />

∂f(t, φ)<br />

= F (f(t, φ), t, φ)<br />

∂t<br />

f(t 0 , φ) = f 0<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.41


Schéma numérique<br />

Utilisation d’un algorithme MCMC dans toutes les méthodes<br />

d’estimation:<br />

⇒ Besoin de calculer la quantité f(φ, t) à chaque itération de<br />

l’algorithme MCMC<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.42


Schéma numérique<br />

Utilisation d’un algorithme MCMC dans toutes les méthodes<br />

d’estimation:<br />

⇒ Besoin de calculer la quantité f(φ, t) à chaque itération de<br />

l’algorithme MCMC<br />

Introduction d’une méthode numérique de résolution d’ODE<br />

Runge-Kutta,<br />

Linearisation Locale,<br />

...<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.42


Schéma numérique<br />

Utilisation d’un algorithme MCMC dans toutes les méthodes<br />

d’estimation:<br />

⇒ Besoin de calculer la quantité f(φ, t) à chaque itération de<br />

l’algorithme MCMC<br />

Introduction d’une méthode numérique de résolution d’ODE<br />

Runge-Kutta,<br />

Linearisation Locale,<br />

...<br />

Estimation dans un modèle approché (modèle où la fonction de<br />

régression est approximée numériquement)<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.42


Utilisation d’un modèle approché<br />

Modèle M h<br />

y ij = f h (t ij , φ i ) + ε ij 1 ≤ j ≤ n i , 1 ≤ i ≤ N<br />

ε ij ∼ i.i.d N (0, σ 2 )<br />

φ i ∼ i.i.d. π φ (.; β)<br />

f h est l’évaluation de la solution de l’ODE par une méthode<br />

numérique d’ordre p et de pas h:<br />

sup<br />

t<br />

|f h (t, φ) − f(t, φ)| ≤ Ch p<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.43


Utilisation d’un modèle approché<br />

Modèle M h<br />

y ij = f h (t ij , φ i ) + ε ij 1 ≤ j ≤ n i , 1 ≤ i ≤ N<br />

ε ij ∼ i.i.d N (0, σ 2 )<br />

φ i ∼ i.i.d. π φ (.; β)<br />

f h est l’évaluation de la solution de l’ODE par une méthode<br />

numérique d’ordre p et de pas h:<br />

sup<br />

t<br />

|f h (t, φ) − f(t, φ)| ≤ Ch p<br />

On estime les paramètres du modèle M h<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.43


Utilisation d’un modèle approché<br />

Modèle M h<br />

y ij = f h (t ij , φ i ) + ε ij 1 ≤ j ≤ n i , 1 ≤ i ≤ N<br />

ε ij ∼ i.i.d N (0, σ 2 )<br />

φ i ∼ i.i.d. π φ (.; β)<br />

f h est l’évaluation de la solution de l’ODE par une méthode<br />

numérique d’ordre p et de pas h:<br />

sup<br />

t<br />

|f h (t, φ) − f(t, φ)| ≤ Ch p<br />

On estime les paramètres du modèle M h<br />

Quel contrôle a-t-on sur l’estimation des paramètres du modèle<br />

original ?<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.43


Quelques propriétés des algorithmes<br />

Propriétés de l’algorithme MCMC : sous certaines hypothèses,<br />

l’algorithme MCMC converge dans le modèle M h ,<br />

il existe une constante C telle que pour tout θ ∈ Θ et pour h petit,<br />

D(p φ|y (.; θ), p h,φ|y (.; θ)) ≤ Ch p<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.44


Quelques propriétés des algorithmes<br />

Propriétés de l’algorithme MCMC : sous certaines hypothèses,<br />

l’algorithme MCMC converge dans le modèle M h ,<br />

il existe une constante C telle que pour tout θ ∈ Θ et pour h petit,<br />

D(p φ|y (.; θ), p h,φ|y (.; θ)) ≤ Ch p<br />

Propriétés de l’algorithme SAEM : sous certaines hypothèses,<br />

la suite (θ k ) d’estimateurs fournie par l’algorithme SAEM sur le<br />

modèle M h converge presque sûrement vers un point θ ∞ ,<br />

maximum (local) de la fonction de vraisemblance g h<br />

il existe une constante C telle que<br />

sup |p(y; θ) − p h (y; θ)| ≤ Ch p<br />

θ∈Θ<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.44


Un schéma de linéarisation locale au sein d’un algo MCMC<br />

But : optimisation du temps de calcul pour le noyau marche alatoire<br />

dans l’algorithme MCMC<br />

Principe<br />

Évaluation de f(t, φ) pour φ dans un voisinage de φ 0 et avec<br />

f(t, φ 0 ) déjà évalué par LL<br />

Développement de Taylor en (t, φ 0 ) de l’ODE<br />

Pas de calculs d’exponentielles de matrices<br />

environ 7 fois plus rapide que LL<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.45


Un schéma de linéarisation locale au sein d’un algo MCMC<br />

But : optimisation du temps de calcul pour le noyau marche alatoire<br />

dans l’algorithme MCMC<br />

Principe<br />

Évaluation de f(t, φ) pour φ dans un voisinage de φ 0 et avec<br />

f(t, φ 0 ) déjà évalué par LL<br />

Développement de Taylor en (t, φ 0 ) de l’ODE<br />

Pas de calculs d’exponentielles de matrices<br />

environ 7 fois plus rapide que LL<br />

Convergence<br />

Sous certaines hypothèses et pour φ proche de φ 0 , on note f h,φ0<br />

la solution obtenue par cette procédure<br />

Il existe C 1 et C 2 indépendantes de φ telle que<br />

sup |f(t, φ) − f h,φ0 (t, φ)| ≤ max(C 1 h 2 , C 2 ‖φ − φ 0 ‖ 2 R<br />

) k<br />

t∈[t 0 ,T ]<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.45


Model defined by ordinary differential equations<br />

Michaelis Menten PK model with one compartment with first order<br />

absorption:<br />

Here, φ = (k m , V m , k a , V )<br />

dC<br />

dt (t, φ) = k a·Dose<br />

e −kat − V m·C(t, φ)<br />

V<br />

k m + C(t, φ)<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.46


Model defined by ordinary differential equations<br />

Michaelis Menten PK model with one compartment with first order<br />

absorption:<br />

Here, φ = (k m , V m , k a , V )<br />

ODE without analytic solution<br />

dC<br />

dt (t, φ) = k a·Dose<br />

e −kat − V m·C(t, φ)<br />

V<br />

k m + C(t, φ)<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.46


Exemple sur des données simulées<br />

Exemple de pharmacocinétique avec N=20 patients indépendants,<br />

π φ (.; β) = N (µ, Ω)<br />

1.8<br />

1.6<br />

1.4<br />

1.2<br />

Concentration (g/L)<br />

1<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

0<br />

0 2 4 6 8 10 12<br />

Temps (heure)<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.47


Résultats d’estimation<br />

Comparaison de SAEM avec NONMEM<br />

NONMEM ne converge pas<br />

SAEM estime correctement les paramètres<br />

k m V m k a V var km var Vm var ka var V σ 2<br />

pt init 0.50 0.100 5.00 5.0 0.400 0.400 0.400 0.400 0.1000<br />

valeur 0.37 0.082 2.72 12.2 0.040 0.040 0.040 0.040 0.0100<br />

SAEM 0.47 0.088 2.58 12.3 0.043 0.038 0.039 0.043 0.0084<br />

NONMEM 0.60 0.100 2.57 12.3 10 −8 0.062 0.068 0.036 0.0088<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.48


Modèle défini par un système<br />

d’équations différentielles<br />

stochastiques<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.49


Extension aux équations différentielles stochastiques<br />

Modèle M<br />

y ij = Z(t ij , φ i ) + ε ij 1 ≤ i ≤ N, 1 ≤ j ≤ n i ,<br />

ε ij ∼ i.i.d N (0, σ 2 )<br />

φ i ∼ i.i.d π(.; β)<br />

La fonction de régression Z du modèle est solution de<br />

dZ(t, φ) = F (Z(t, φ), t, φ)dt + γdW t , t ∈ [t 0 , T ]<br />

Z(t 0 , φ) = Z 0 (φ)<br />

où W t est un mouvement brownien<br />

Données complètes du modèle : (y, Z, φ)<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.50


Algorithme de Hastings-Metropolis<br />

Algorithme de H-M, à l’itération l<br />

1. Simulation de φ l sous p(.|Z (l−1) , y)<br />

2. Simulation de Z l sous p(.|φ l , y)<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.51


Algorithme de Hastings-Metropolis<br />

Algorithme de H-M, à l’itération l<br />

1. Simulation de φ l sous p(.|Z (l−1) , y)<br />

2. Simulation de Z l sous p(.|φ l , y)<br />

Calcul de p(Z|φ) dans chaque probabilité d’acceptation<br />

SDE linéaire : loi de la trajectoire connue<br />

SDE <strong>non</strong> linéaire : estimation par Monte-Carlo ou Importance<br />

Sampling (Pedersen 1995)<br />

⇒ Pont brownien ??<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.51


Application aux données de theophylline<br />

Modèle défini par une ODE :<br />

dZ(t, φ) =<br />

( Dose · ka<br />

V<br />

e −k at − C l<br />

V Z(t, φ) )<br />

dt<br />

y ij = Z(t ij , φ i ) + ε ij<br />

= Dose i ka i ke i<br />

Cl i (ka i − ke i )<br />

(e −ke i t ij<br />

− e −ka i t ij<br />

)<br />

+ ε ij<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.52


Application aux données de theophylline<br />

Modèle défini par une ODE :<br />

dZ(t, φ) =<br />

( Dose · ka<br />

V<br />

e −k at − C l<br />

V Z(t, φ) )<br />

dt<br />

y ij = Z(t ij , φ i ) + ε ij<br />

= Dose i ka i ke i<br />

Cl i (ka i − ke i )<br />

(e −ke i t ij<br />

− e −ka i t ij<br />

)<br />

+ ε ij<br />

Modèle défini par une SDE :<br />

dZ(t, φ) =<br />

( Dose · ka<br />

V<br />

e −k at − C l<br />

V Z(t, φ) )<br />

dt + γdW t<br />

y ij = Z(t ij , φ i ) + ε ij<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.52


Application aux données de theophylline<br />

1<br />

2<br />

3<br />

15<br />

10<br />

10<br />

10<br />

4<br />

10<br />

5<br />

5<br />

5<br />

5<br />

0<br />

0 10 20<br />

0<br />

0 10 20<br />

0<br />

0 10 20<br />

0<br />

0 10 20<br />

15<br />

5<br />

10<br />

6<br />

10<br />

7<br />

10<br />

8<br />

10<br />

5<br />

5<br />

5<br />

5<br />

0<br />

0 10 20<br />

0<br />

0 10 20<br />

0<br />

0 10 20<br />

0<br />

0 10 20<br />

10<br />

9<br />

15<br />

10<br />

10<br />

11<br />

10<br />

12<br />

10<br />

5<br />

5<br />

5<br />

5<br />

0<br />

0 10 20<br />

0<br />

0 10 20<br />

0<br />

0 10 20<br />

0<br />

0 10 20<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.53


Application aux données de theophylline<br />

15<br />

10<br />

5<br />

0<br />

0 10 20 30<br />

Time (hr)<br />

10<br />

5<br />

0<br />

−5<br />

0 10 20 30<br />

Time (hr)<br />

10<br />

5<br />

0<br />

−5<br />

0 10 20 30<br />

Time (hr)<br />

10<br />

5<br />

0<br />

−5<br />

0 10 20 30<br />

Time (hr)<br />

Concentration (mg/L)<br />

Concentration (mg/L)<br />

Concentration (mg/L)<br />

Concentration (mg/L)<br />

15<br />

10<br />

5<br />

0<br />

−5<br />

0 10 20 30<br />

Time (hr)<br />

8<br />

6<br />

4<br />

2<br />

0<br />

−2<br />

0 10 20 30<br />

Time (hr)<br />

8<br />

6<br />

4<br />

2<br />

0<br />

−2<br />

0 10 20 30<br />

Time (hr)<br />

8<br />

6<br />

4<br />

2<br />

0<br />

−2<br />

0 10 20 30<br />

Time (hr)<br />

Concentration (mg/L)<br />

Concentration (mg/L)<br />

Concentration (mg/L)<br />

Concentration (mg/L)<br />

10<br />

8<br />

6<br />

4<br />

2<br />

0<br />

0 10 20 30<br />

Time (hr)<br />

15<br />

10<br />

5<br />

0<br />

0 10 20 30<br />

Time (hr)<br />

8<br />

6<br />

4<br />

2<br />

0<br />

−2<br />

0 10 20 30<br />

Time (hr)<br />

10<br />

5<br />

0<br />

−5<br />

0 10 20 30<br />

Time (hr)<br />

Concentration (mg/L)<br />

Concentration (mg/L)<br />

Concentration (mg/L)<br />

Concentration (mg/L)<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.54


Conclusion<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.55


Conclusion<br />

<strong>Les</strong> modèles (<strong>non</strong> linéaires) à effet <strong>mixtes</strong> sont en plein essor et<br />

très utiles dans de nombreux domaines d’application<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.55


Conclusion<br />

<strong>Les</strong> modèles (<strong>non</strong> linéaires) à effet <strong>mixtes</strong> sont en plein essor et<br />

très utiles dans de nombreux domaines d’application<br />

De nouveaux outils statistiques et algorithmiques permettent<br />

d’aborder et traiter ces modèles<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.55


Conclusion<br />

<strong>Les</strong> modèles (<strong>non</strong> linéaires) à effet <strong>mixtes</strong> sont en plein essor et<br />

très utiles dans de nombreux domaines d’application<br />

De nouveaux outils statistiques et algorithmiques permettent<br />

d’aborder et traiter ces modèles<br />

<strong>Les</strong> méthodes MCMC sont des outils algorithmiques très<br />

performants, <strong>non</strong> seulement dans un cadre bayésien, mais plus<br />

généralement en inférence statistique.<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.55


Conclusion<br />

<strong>Les</strong> modèles (<strong>non</strong> linéaires) à effet <strong>mixtes</strong> sont en plein essor et<br />

très utiles dans de nombreux domaines d’application<br />

De nouveaux outils statistiques et algorithmiques permettent<br />

d’aborder et traiter ces modèles<br />

<strong>Les</strong> méthodes MCMC sont des outils algorithmiques très<br />

performants, <strong>non</strong> seulement dans un cadre bayésien, mais plus<br />

généralement en inférence statistique.<br />

La possibilité de considérer des modèles définis par des ODE et<br />

des SDE est très encourageante<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.55


Bibliographie<br />

MONOLIX, the Matlab software and the User’s guide,<br />

http://www.math.u-psud.fr/ lavielle/monolix/logiciels.html<br />

Kuhn E., Lavielle M., "Maximum likelihood estimation in <strong>non</strong>linear mixed<br />

effects models", Computational Statistics and Data Analysis (to appear),<br />

2005<br />

Kuhn E., Lavielle M., "Coupling a stochastic approximation version of EM<br />

with a MCMC procedure", ESAIM P&S, vol. 8, pp 115–131, 2004.<br />

Delyon B., Lavielle M., and Moulines E. , "Convergence of a stochastic<br />

approximation version of the EM algorithm", The Annals of Stat., vol. 27,<br />

no. 1, pp 94–128, 1999.<br />

Pinheiro J. C., Bates, D. M., "Mixed-Effects Models in S and S-PLUS",<br />

Springer, 2000.<br />

Davidian M., "Nonlinear Models for Repeated Measurement Data",<br />

Chapman and Hall, 1995.<br />

Sminaire ”Statistique et Sant Publique”, Bordeaux - 8 novembre 2005, p.56

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!