Fiche de travaux pratiques - ENS de Cachan - Antenne de Bretagne
Fiche de travaux pratiques - ENS de Cachan - Antenne de Bretagne
Fiche de travaux pratiques - ENS de Cachan - Antenne de Bretagne
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Journées <strong>de</strong> formation<br />
«Mathématiques et informatique<br />
pour les Sciences <strong>de</strong> la Vie et <strong>de</strong> la Terre »<br />
modèles déterministes et stochastiques<br />
<strong>Fiche</strong> <strong>de</strong> <strong>travaux</strong> <strong>pratiques</strong><br />
les 29 et 30 septembre 2010<br />
But du TP<br />
L’objectif <strong>de</strong> la séance <strong>de</strong> <strong>travaux</strong> <strong>pratiques</strong> est double. Il s’agit tout d’abord <strong>de</strong> manipuler<br />
<strong>de</strong>s modèles mathématiques dans le domaine <strong>de</strong> la biologie et d’en évaluer les limites. Par<br />
Présentation ailleurs, divers outils sont présentés pour l’utilisation <strong>de</strong> ces modèles, on pourra en apprécier la<br />
pertinence selon le but poursuivi. Les interfaces web offrent une gran<strong>de</strong> simplicité d’utilisation,<br />
Deux journées <strong>de</strong> formation spécifiquement conçues pour les Inspecteurs <strong>de</strong> mathématiques <strong>de</strong> l’Éducation<br />
mais l’emploi d’un logiciel <strong>de</strong> calcul scientifique permet <strong>de</strong> modifier, enrichir le modèle ou la<br />
nationale sont organisées par l’antenne <strong>de</strong> <strong>Bretagne</strong> <strong>de</strong> l’École normale supérieure <strong>de</strong> <strong>Cachan</strong>, sur le<br />
métho<strong>de</strong> numérique.<br />
thème :<br />
« Mathématiques et informatique pour les sciences <strong>de</strong> la vie et <strong>de</strong> la Terre »<br />
modèles déterministes et stochastiques<br />
Environnement informatique<br />
La séance a lieu dans la salle libre-service linux ; <strong>de</strong>s comptes « invités » ont été créés :<br />
Descriptif <strong>de</strong> la formation<br />
login :<br />
mot <strong>de</strong> passe :<br />
Cette formation se déroule pour la cinquième année consécutive sur le campus <strong>de</strong> Ker Lann. En 2006,<br />
elle était organisée par le département Informatique et télécommunications <strong>de</strong> l’<strong>ENS</strong> <strong>Cachan</strong> - <strong>Bretagne</strong><br />
1 Un modèle déterministe en épidémiologie<br />
(organisateur : Luc Bougé) et portait sur la théorie <strong>de</strong> l’information et les communications. En 2007,<br />
le département Mathématiques <strong>de</strong> l’<strong>ENS</strong> <strong>Cachan</strong> <strong>Bretagne</strong> et l’<strong>ENS</strong>AI (organisateurs : François Coquet,<br />
<strong>ENS</strong>AI et Michel Pierre, <strong>ENS</strong> <strong>Cachan</strong> - <strong>Bretagne</strong>) se sont associés pour proposer la formation sur le<br />
Le modèle SIR (SIMG)<br />
thème « Statistiques et applications multi-disciplinaires ». En 2008, <strong>de</strong>ux journées centrées autour<br />
<strong>de</strong> la « On modélisation note S(t), numérique I(t), M(t), G(t) <strong>de</strong> phénomènes les populations physiques d’individus » ont sains, été infectieux, organisées morts par et le guéris, département<br />
Mathématiques à l’instant (organisateurs t. Les paramètres : Virginie du modèle Bonnaillie-Noël sont le taux et Grégory <strong>de</strong> contagion Vial). r, L’an le taux <strong>de</strong>rnier, mortalité les départements a<br />
d’informatique et le taux et <strong>de</strong> guérison mathématique b. ont mis en place conjointement la formation «Algorithmique : une<br />
approche raisonnée » (organisateurs ⎧ : Luc Bougé et Grégory Vial).<br />
S ′ (t) = −rS(t)I(t)<br />
⎪⎨<br />
Cette année, la formation s’articule autour I ′ (t) <strong>de</strong> = l’utilisation rS(t)I(t) <strong>de</strong> − modèles (a + b)I(t) mathématiques dans les sciences<br />
<strong>de</strong> la vie et <strong>de</strong> la Terre. Deux cours M ′ d’introduction (t) = aI(t) sont prévus, portant sur les aspects déterministes<br />
et probabilistes <strong>de</strong> la modélisation ⎪⎩ en biologie. Une séance <strong>de</strong> <strong>travaux</strong> <strong>pratiques</strong> permettra d’illustrer<br />
G<br />
l’utilisation <strong>de</strong> l’outil informatique dans ′ (t) = bI(t)<br />
ce contexte. Enfin, plusieurs exposés traitant <strong>de</strong> sujets <strong>de</strong><br />
recherche actuelle permettront d’abor<strong>de</strong>r différents domaines d’application (dynamique <strong>de</strong>s populations,<br />
épidémilogie, 1.1 Utilisation modélisation d’une <strong>de</strong>s glaciers, Applet Java génomique) tout en développant une large palette d’outils<br />
mathématiques (équations aux dérivées partielles, processus stochastiques, métho<strong>de</strong>s statistiques,<br />
algorithmes<br />
Une<br />
bio-informatiques).<br />
interface Web est disponible à l’adresse suivante pour la résolution du modèle SIR :<br />
http://w3.bretagne.ens-cachan.fr/math/simulations/SIR/<br />
Elle a été utilisée dans le cadre d’une animation “À la découverte <strong>de</strong> la science” en classe <strong>de</strong><br />
Terminale, par J. Charrier et G. Vial. Les questions suivantes étaient posées aux élèves pour<br />
les faire utiliser la simulation.
Question 1. Observer les courbes obtenues dans les cas : “sans épidémie” et “avec épidémie”.<br />
Question 2. On se place dans le cas “avec épidémie”.<br />
– Combien <strong>de</strong> personnes sont mortes <strong>de</strong> la maladie au bout <strong>de</strong> 25 jours <br />
– Combien n’ont jamais été mala<strong>de</strong>s <br />
– Est-ce que la maladie s’est éteinte au bout <strong>de</strong> 10 jours 25 jours <br />
Question 3.<br />
On se place dans le cas “avec épidémie”. Faire varier T max progressivement jusqu’à la valeur T max =<br />
1000. Observations Suggestions <br />
Question 4. On se place dans le cas “sans épidémie”. Pour quelle(s) valeur(s) <strong>de</strong> r a-t-on épidémie <br />
Question 5. On se place dans le cas “sans épidémie”. Pour quelle(s) valeur(s) <strong>de</strong> a a-t-on épidémie <br />
Question 6. On se place dans le cas “sans épidémie”. Pour quelle(s) valeur(s) <strong>de</strong> b a-t-on épidémie <br />
Observer le nombre <strong>de</strong> morts au bout <strong>de</strong> 25 jours quand on augmente la valeur <strong>de</strong> b.<br />
1.2 Pour aller plus loin : utilisation <strong>de</strong> Scilab<br />
Télécharger le script<br />
http://w3.bretagne.ens-cachan.fr/math/simulations/SIR.sce<br />
L’exécuter dans Scilab, les courbes obtenues correspon<strong>de</strong>nt à celles déjà visualisées dans<br />
l’Applet Java. Il est possible <strong>de</strong> modifier les paramètres, comme plus haut, en éditant le<br />
fichier SIR.sce.
On peut aussi facilement modifier l’équation différentielle à résoudre. Par exemple, le modèle<br />
suivant prend en compte (assez naïvement) l’introduction d’un vaccin à l’instant τ (le taux<br />
<strong>de</strong> vaccination est noté c) :<br />
⎧<br />
⎪⎨<br />
⎪⎩<br />
S ′ (t) = −rS(t)I(t) − cS(t)I t≥τ<br />
I ′ (t) = rS(t)I(t) − (a + b)I(t)<br />
M ′ (t) = aI(t)<br />
G ′ (t) = bI(t) + cS(t)I t≥τ<br />
Modifier le fichier SIR.sce pour simuler ce modèle.<br />
2 Un modèle aléatoire en génétique<br />
Le modèle <strong>de</strong> Wright-Fisher<br />
On considère une population haploï<strong>de</strong> où un gène est présent sous <strong>de</strong>ux allèles seulement :<br />
A et B. Chaque individu possè<strong>de</strong> un seul exemplaire du gène, sous la forme A ou B. Si X n<br />
désigne le nombre d’allèles A dans la population au temps n, un modèle simple pour décrire<br />
l’évolution <strong>de</strong> la répartition <strong>de</strong>s allèles au cours <strong>de</strong>s générations s’écrit<br />
( N<br />
P(X n+1 = j | X n = i) =<br />
j<br />
)( i<br />
) j (<br />
1 − i ) N−j<br />
N N<br />
La donnée <strong>de</strong> la taille N <strong>de</strong> la population, et du nombre initial X 0 d’allèles A déterminent<br />
complètement le modèle.<br />
2.1 Utilisation <strong>de</strong> Javascript-Canvas<br />
Une petite interface Web est disponible à l’adresse<br />
http://w3.bretagne.ens-cachan.fr/math/simulations/WrightFisher<br />
Elle permet <strong>de</strong> simuler la variable aléatoire X n , et donc <strong>de</strong> visualiser la répartition <strong>de</strong>s allèles<br />
A et B dans les populations successives.<br />
2.2 Pour aller plus loin : utilisation <strong>de</strong> Scilab<br />
Télécharger le script<br />
http://w3.bretagne.ens-cachan.fr/math/simulations/WrightFisher.sce<br />
L’exécuter dans Scilab, les courbes obtenues correspon<strong>de</strong>nt à celles déjà visualisées dans<br />
l’interface Web. Le programme <strong>de</strong> travail qui suit est extrait d’un TP <strong>de</strong> préparation à<br />
l’agrégation <strong>de</strong> F. Malrieu. Il permet <strong>de</strong> retrouver par la simulation les probabilités et temps<br />
d’absorption théoriques, mais aussi <strong>de</strong> simuler les modèles avec sélection ou mutation, pour<br />
lesquels les calculs théoriques ne sont plus possibles.
I. Sans mutations, ni sélection<br />
On note X n le nombre d’allèles A dans une population <strong>de</strong> N gènes au temps n. Il y a N − X n<br />
allèles B. On suppose qu’il n’y a ni mutation ni sélection. La loi <strong>de</strong> X n+1 sachant que X n = i<br />
est la loi binomiale B(N, i/N).<br />
1. Représentez plusieurs trajectoires <strong>de</strong> cette chaîne <strong>de</strong> Markov pour N =10, 20, 100.<br />
2. Confrontez l’estimation numérique <strong>de</strong> la probabilité que la chaîne soit absorbée en 2N<br />
au résultat théorique pour N =10, 20, 100.<br />
3. Proposez une estimation <strong>de</strong> l’espérance du temps <strong>de</strong> d’absorption <strong>de</strong> la chaîne pour<br />
N =10, 20, 100. N’oubliez pas l’intervalle <strong>de</strong> confiance !<br />
II. Avec sélection mais sans mutations<br />
Nous supposerons que la sélection ne s’opère que sur le critère <strong>de</strong> viabilité : un individu porteur<br />
<strong>de</strong> l’allèle A a 1 + s fois plus <strong>de</strong> chances <strong>de</strong> survivre qu’un individu porteur <strong>de</strong> l’allèle B. Pour<br />
construire la population à la date n + 1, sachant que X n = i, tout se passe comme si on tirait<br />
<strong>de</strong>s allèles dans une urne qui contient une proportion (1 + s)i/((1 + s)i + N − i) d’allèles A.<br />
La loi <strong>de</strong> X n+1 sachant que X n = i est donc la loi binomiale <strong>de</strong> paramètres N et<br />
(1 + s)i<br />
(1 + s)i + N − i .<br />
Remarque. Le taux <strong>de</strong> mutation est très faible. On pourra choisir s <strong>de</strong> la forme α/N, avec α<br />
d’ordre 1.<br />
1. Estimer la probabilité <strong>de</strong> disparition <strong>de</strong> l’allèle B en fonction <strong>de</strong> du nombre d’allèles A<br />
initiaux.<br />
2. Pouvez-vous estimer le temps nécesssaire à la disparition d’un <strong>de</strong>s <strong>de</strong>ux allèles <br />
3. Comparer avec le cas précé<strong>de</strong>nt.<br />
III. Avec mutations mais sans sélection<br />
On suppose à présent qu’au cours <strong>de</strong> chaque transmission d’un gène celui-ci peut changer :<br />
<strong>de</strong> A en B avec probablité u et <strong>de</strong> B en A avec probabilité v. Si X n = i, la loi <strong>de</strong> X n+1 est<br />
donc la loi binomiale <strong>de</strong> paramètres N et<br />
(1 − u) i (<br />
N + v 1 − i )<br />
.<br />
N<br />
1. Y-a-t-il toujours absorption <br />
2. Que se passe-t-il en temps long <br />
3. Tracer la proportion <strong>de</strong> temps passé dans chaque état le long d’une gran<strong>de</strong> trajectoire.<br />
Celle-ci dépend-elle du point <strong>de</strong> départ Commenter. On choisira N = 10 et 20.