Evolution des techniques de séquençage
Evolution des techniques de séquençage
Evolution des techniques de séquençage
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Le <strong>séquençage</strong> du génome Humain :<br />
Comment a-t-il été séquencé?<br />
Que nous apprend la séquence?<br />
Et après ?<br />
D. Locker<br />
Professeur émérite Université d’Orléans<br />
Résumé<br />
L’ADN contenu dans nos 23 paires <strong>de</strong> chromosomes porte environ 3 milliards<br />
<strong>de</strong> paires <strong>de</strong> bases (A/T ou G/C). L'ordre <strong>de</strong> ces 4 bases ATGC constitue le stockage<br />
<strong>de</strong> l'information génétique dans la molécule d’ADN <strong>de</strong> chacun <strong>de</strong> nos chromosomes.<br />
Le projet <strong>de</strong> <strong>séquençage</strong> <strong>de</strong> l’ensemble du génome humain a débuté dans les années<br />
1990 et en février 2001 les résultats complets d’un brouillon <strong>de</strong> la séquence ont été<br />
publiés. C'est seulement en 2004 que le <strong>séquençage</strong> complet a été terminé. Celui-ci a<br />
coûté 300 millions <strong>de</strong> dollars et on estime qu’en 2020 le coût du <strong>séquençage</strong> du<br />
génome d’un individu ne sera plus que <strong>de</strong> 100 dollars. Cette baisse <strong><strong>de</strong>s</strong> coûts a<br />
contribué à une accélération <strong>de</strong> la découverte <strong><strong>de</strong>s</strong> gènes impliqués dans les maladies<br />
génétiques. Grâce au <strong>séquençage</strong> <strong><strong>de</strong>s</strong> génomes individuels nous rentrons dans l’ère<br />
<strong>de</strong> la mé<strong>de</strong>cine prédictive, ainsi dès la naissance, il sera possible <strong>de</strong> déterminer les<br />
probabilités <strong>de</strong> développer différentes maladies. L’industrie du génome s’est<br />
développée <strong>de</strong> façon spectaculaire ces <strong>de</strong>rnières années, notamment grâce à<br />
l’apparition <strong>de</strong> nouvelles <strong>techniques</strong> automatisées <strong>de</strong> <strong>séquençage</strong>. Ces avancées ne<br />
seront pas sans créer <strong><strong>de</strong>s</strong> problèmes éthiques considérables.<br />
Avant <strong>de</strong> répondre à ces questions, il nous faut définir le génome. D'après le<br />
dictionnaire Robert, c'est l'ensemble <strong><strong>de</strong>s</strong> gènes propres à une espèce ; on peut<br />
considérer que cette définition ancienne est caduque. En effet, la découverte que<br />
l'ADN est le support du message génétique dans tous les systèmes vivants permet<br />
d'établir une équivalence entre les termes <strong>de</strong> génome, d'ADN et d'information<br />
génétique. En clair, séquencer le génome humain revient à séquencer l'ADN présent<br />
dans nos chromosomes et nos mitochondries. L'objectif ultime <strong>de</strong> ce <strong>séquençage</strong> est <strong>de</strong><br />
comprendre le « programme génétique » mis en œuvre pour arriver à un organisme<br />
spécifique et unique à partir d'un œuf. Notre génome comporte 23 paires <strong>de</strong><br />
chromosomes classés suivant un certain nombre <strong>de</strong> critères (taille, position du<br />
centromère, série <strong>de</strong> ban<strong><strong>de</strong>s</strong> et d'inter-ban<strong><strong>de</strong>s</strong> obtenues après coloration) en paires <strong>de</strong><br />
chromosomes homologues (Cf. Fig. 1).<br />
1
Chaque chromosome métaphasique contient <strong>de</strong>ux molécules d'ADN ; toutes ces<br />
molécules mises bout à bout formeraient un filament d’environ 2 mètres <strong>de</strong> longueur.<br />
La molécule d'ADN est une double hélice caractérisée par un squelette ose phosphate<br />
et la présence <strong>de</strong> bases azotées appariées d'une façon toujours i<strong>de</strong>ntique Adénine avec<br />
Thymine et Guanine avec Cytosine (Cf. Fig. 2). L'ordre <strong>de</strong> ces 4 bases ou nucléoti<strong><strong>de</strong>s</strong><br />
ATGC constitue le stockage <strong>de</strong> l'information génétique dans les chromosomes ; elle<br />
est présente dans le noyau <strong>de</strong> toutes nos cellules. L'information contenue dans l'ADN<br />
<strong>de</strong> nos chromosomes sert essentiellement à synthétiser les molécules du vivant, les<br />
protéines, et ceci en <strong>de</strong>ux étapes. La première correspond à la transcription du message<br />
c'est-à-dire au passage <strong>de</strong> l'ADN vers l'ARN (l'ensemble <strong><strong>de</strong>s</strong> ARN d'une cellule<br />
s'appelle le transcriptome) et la secon<strong>de</strong> à la traduction du message génétique c'est-à-<br />
dire au passage <strong><strong>de</strong>s</strong> ARN vers les protéines (l'ensemble <strong><strong>de</strong>s</strong> protéines d'une cellule<br />
s'appelle le protéome). Notre ADN contient environ 3 milliards <strong>de</strong> paires <strong>de</strong> bases<br />
(A/T ou G/C) réparties dans nos 23 paires <strong>de</strong> chromosomes. Pour donner une idée <strong>de</strong><br />
la quantité <strong>de</strong> travail que nécessite le <strong>séquençage</strong> complet du génome humain, si l'on<br />
assimile les bases azotées aux caractères d'un livre, l'ensemble du génome tiendrait<br />
dans 3000 romans <strong>de</strong> 500 pages posés sur 60 mètres <strong>de</strong> rayonnage.<br />
Historique du projet <strong>de</strong> <strong>séquençage</strong> du génome humain<br />
Le projet <strong>de</strong> <strong>séquençage</strong> du génome humain est mis en place en 1988 sous<br />
l'impulsion d'un petit groupe <strong>de</strong> chercheurs américains. Devant l'ampleur <strong>de</strong> la tâche, il<br />
soulève quelques réticences <strong><strong>de</strong>s</strong> chercheurs du type :"pourquoi séquencer tout l'ADN<br />
sachant que 95% ne co<strong>de</strong>nt pas au sens strict <strong><strong>de</strong>s</strong> protéines ou <strong><strong>de</strong>s</strong> ARN". La réponse<br />
<strong><strong>de</strong>s</strong> partisans du <strong>séquençage</strong> sera :"Ce n'est pas parce que l'on n'a pas encore découvert<br />
le sens <strong>de</strong> toute l'information génétique qu'il ne faut pas se lancer dans l'aventure". Des<br />
laboratoires publics en majorité américains se regroupent pour mener à bien ce projet.<br />
Il comprendra 3 phases : établissement <strong>de</strong> la carte génétique, <strong>de</strong> la carte physique et<br />
enfin le <strong>séquençage</strong>. Cette stratégie permet d'obtenir <strong><strong>de</strong>s</strong> séquences ordonnées prêtes<br />
pour le <strong>séquençage</strong>.<br />
En 1999 un groupe privé, la firme Celera-Genomics, dirigée par un ancien<br />
chercheur du consortium public C. Venter annonce qu'elle utilisera, pour séquencer le<br />
génome humain, la technique dite du "<strong>séquençage</strong> à la mitraillette" qui consiste à<br />
2
découper et séquencer les fragments d'ADN sans les ordonner (Cf. Fig. 3). Cette<br />
stratégie nécessite un gros support informatique pour assembler les séquences et <strong><strong>de</strong>s</strong><br />
moyens importants en <strong>séquençage</strong>. Dans un premier temps, la société Celera-<br />
Genomics rachète la société Perkin Elmer spécialiste <strong><strong>de</strong>s</strong> appareils <strong>de</strong> <strong>séquençage</strong> se<br />
dotant ainsi d'un parc important <strong>de</strong> séquenceurs. La société Celera-Genomics se<br />
réserve également, en temps que firme privée, le droit <strong>de</strong> gar<strong>de</strong>r secrets ses résultats<br />
afin <strong>de</strong> breveter ultérieurement les séquences les plus intéressantes ; ceci soulève un<br />
tollé général dans la recherche publique. Il faut tout <strong>de</strong> même signaler que<br />
l'intervention d'une concurrence public/privé, associée à la baisse du coût du<br />
<strong>séquençage</strong>, a permis une accélération <strong>de</strong> l'obtention <strong><strong>de</strong>s</strong> résultats.<br />
En mars 2000 on assiste, d'une part, à l'annonce d'un brouillon du <strong>séquençage</strong><br />
complet du génome humain par le consortium public dirigé par F. Collins et par la<br />
société Celera-Genomics représenté par C. Venter et, d'autre part, à la réconciliation<br />
entre ces 2 groupes, tout ceci à la Maison Blanche sous la houlette <strong>de</strong> Bill Clinton. En<br />
février 2001, les résultats complets du <strong>séquençage</strong> du génome humain sont publiés<br />
simultanément dans <strong>de</strong>ux revues scientifiques prestigieuses, Nature 1 pour le<br />
consortium public et Science 2 pour la firme Celera-Genomics. Le coût total <strong>de</strong> ce<br />
projet pour le consortium public a été <strong>de</strong> 300 millions <strong>de</strong> dollars.<br />
Qu'en est-il exactement <strong>de</strong> ces résultats?<br />
En fait nous n'avons qu'un brouillon <strong>de</strong> séquence avec <strong>de</strong> nombreux trous et<br />
c'est seulement en 2004 que le <strong>séquençage</strong> complet du génome humain sera terminé 3 .<br />
De plus cette séquence est une suite <strong>de</strong> 3 milliards <strong>de</strong> paires <strong>de</strong> bases ; il faut l'annoter,<br />
c'est à dire trouver les gènes et ensuite chercher le rôle <strong>de</strong> ces gènes (il faut trouver les<br />
mots et leur signification). Pour cela on peut se servir <strong><strong>de</strong>s</strong> génomes déjà séquencés et<br />
procé<strong>de</strong>r par analogie. En se basant sur les caractéristiques <strong><strong>de</strong>s</strong> gènes (structure<br />
exon/intron, phase <strong>de</strong> lecture ouverte, signaux <strong>de</strong> transcription et traduction, etc.) on<br />
doit rechercher, avec <strong><strong>de</strong>s</strong> programmes informatiques, <strong><strong>de</strong>s</strong> gènes possibles ou présumés,<br />
1<br />
International Human Genome Sequencing Consortium Initial sequencing and analysis of the human genome.<br />
(2009) Nature 409 : 860-921.<br />
2<br />
Venter, J. C. et al. The Sequence of the Human Genome. (2009) Science 291: 1304-1351.<br />
3<br />
International Human Genome Sequencing Consortium (2004) Finishing the euchromatic sequence of the human<br />
genome. Nature 431 : 931-945<br />
3
dont il faudra par la suite déterminer le rôle. Les conclusions provisoires <strong>de</strong><br />
l’annotation du génome humain sont les suivantes :<br />
*Seulement 1% du génome co<strong>de</strong> <strong><strong>de</strong>s</strong> protéines<br />
*Il y a <strong>de</strong> 23 à 28 000 gènes dans le génome humain<br />
*Les exons représentent ∼5% <strong>de</strong> chacun <strong><strong>de</strong>s</strong> gènes<br />
*Les gènes (exons+introns) représentent ∼25% du génome humain<br />
*∼60% <strong><strong>de</strong>s</strong> gènes présentent une possibilité d’épissage alternatif. De ce fait les gènes<br />
humains peuvent permettre <strong>de</strong> produire chacun <strong>de</strong> nombreuses protéines différentes<br />
*La plupart <strong><strong>de</strong>s</strong> gènes spécifiques <strong><strong>de</strong>s</strong> vertébrés sont impliqués dans les systèmes<br />
immunitaires ou nerveux<br />
*Les séquences répétées constituent plus <strong>de</strong> 50% <strong>de</strong> notre patrimoine génétique. Ce<br />
sont surtout <strong><strong>de</strong>s</strong> transposons non fonctionnels<br />
*Il existe <strong>de</strong> nombreuses duplications <strong>de</strong> gran<strong><strong>de</strong>s</strong> régions <strong><strong>de</strong>s</strong> chromosomes<br />
Que faire maintenant avec cette masse d'information?<br />
On peut s’attendre à une accélération <strong>de</strong> la découverte <strong><strong>de</strong>s</strong> gènes impliqués dans<br />
les maladies monogéniques (5 à 6000). On <strong>de</strong>vrait également déterminer les gènes<br />
impliqués dans les terrains génétiques favorables au développement <strong>de</strong> certaines<br />
maladies. Les résultats obtenus permettront <strong>de</strong> mieux comprendre ces maladies et<br />
d'envisager <strong>de</strong> nouvelles thérapies. Pour la recherche <strong>de</strong> ces gènes, il faut se servir du<br />
polymorphisme <strong>de</strong> l'ADN (séquences <strong>de</strong> l'ADN présentant <strong><strong>de</strong>s</strong> variations d'un individu<br />
à l'autre, et expliquant que nous soyons tous différents).<br />
De nouveaux marqueurs très intéressants du fait <strong>de</strong> leur nombre (plusieurs<br />
millions) dans le génome humain sont apparus avec le <strong>séquençage</strong>, ce sont les SNP 4<br />
(polymorphisme d'un seul nucléoti<strong>de</strong>). Une fois localisés très précisément sur les<br />
chromosomes humains en fonction <strong><strong>de</strong>s</strong> données du <strong>séquençage</strong>, ces marqueurs<br />
pourront être comparés chez les mala<strong><strong>de</strong>s</strong> et non mala<strong><strong>de</strong>s</strong>. Cela va conduire à une<br />
cartographie beaucoup plus rapi<strong>de</strong> <strong><strong>de</strong>s</strong> gènes impliqués dans certaines maladies. Une<br />
fois ces gènes ou terrains génétiques déterminés, on pourra proposer <strong><strong>de</strong>s</strong> diagnostics<br />
rapi<strong><strong>de</strong>s</strong> <strong>de</strong> prédispositions à certaines maladies. La mé<strong>de</strong>cine <strong>de</strong>viendra <strong>de</strong> plus en<br />
4 http://www.ncbi.nlm.nih.gov/About/primer/snps.html<br />
4
plus prédictive. On peut donner comme exemple les résultats obtenus par un<br />
consortium <strong>de</strong> laboratoires 5 qui a utilisé 500 000 SNP pour localiser sur nos<br />
chromosomes 7 gènes impliqués dans <strong><strong>de</strong>s</strong> maladies comme la maladie <strong>de</strong> Crohn,<br />
l’hypertension ou le diabète (type 1 et 2). Mais pour aller plus loin dans ce type<br />
d’analyse, il sera nécessaire <strong>de</strong> réduire le coût <strong>de</strong> la technique <strong>de</strong> <strong>séquençage</strong> pour<br />
analyser non plus <strong><strong>de</strong>s</strong> marqueurs mais l’ensemble du génome <strong><strong>de</strong>s</strong> individus.<br />
Les améliorations <strong>de</strong> la technique <strong>de</strong> <strong>séquençage</strong><br />
Depuis l’article <strong>de</strong> Nature paru en 1953 <strong>de</strong> J. Watson et FH Crick proposant une<br />
structure <strong>de</strong> l’ADN 6 jusqu’à nos jours, la biologie dite moléculaire a connu une suite<br />
<strong>de</strong> remarquables progrès technologiques dont le <strong>séquençage</strong> constitue l’un <strong><strong>de</strong>s</strong><br />
évènements clés. En ce début <strong>de</strong> troisième millénaire déjà riche en nouvelles<br />
technologies, nous assistons à une nouvelle révolution dans le domaine du <strong>séquençage</strong>.<br />
Le <strong>séquençage</strong><br />
Le <strong>séquençage</strong> <strong>de</strong> l’ADN est une métho<strong>de</strong> dont le but est <strong>de</strong> déterminer la<br />
succession linéaire <strong><strong>de</strong>s</strong> bases A, C, G et T prenant part à la structure <strong>de</strong> l’ADN. La<br />
lecture <strong>de</strong> cette séquence permet d’étudier l’information biologique contenue par celle-<br />
ci. Une <strong><strong>de</strong>s</strong> <strong>de</strong>ux <strong>techniques</strong> initiales largement employé a été décrite par Sanger. Elle<br />
consiste à jouer sur le recopiage <strong>de</strong> l’ADN et l’arrêt <strong>de</strong> celui-ci par incorporation <strong>de</strong><br />
nucléoti<strong><strong>de</strong>s</strong> sans 3’OH. Elle comprendra, pour simplifier, quatre étapes :<br />
1) obtention <strong><strong>de</strong>s</strong> ADN à séquencer sous la forme <strong>de</strong> simple brin<br />
2) hybridation <strong>de</strong> courte séquence d’ADN (amorces) sur les simples brins<br />
3) recopiage par l’ADN polymérase <strong>de</strong> l’ADN en 4 réactions qui contiennent<br />
toutes les 4 nucléoti<strong><strong>de</strong>s</strong> triphosphates mais également un <strong><strong>de</strong>s</strong> quatre sous la<br />
forme d’un didéoxynucléoti<strong>de</strong>. L’ADN polymérase a le choix d’incorporer soit<br />
un dXTP soit un ddXTP pendant la synthèse.<br />
4) détermination <strong>de</strong> la taille <strong><strong>de</strong>s</strong> fragments d’ADN synthétisés dans chacune <strong><strong>de</strong>s</strong> 4<br />
réactions.<br />
5 The Wellcome Trust Case Control Consortium (2007) Genome-wi<strong>de</strong> association study of 14,000 cases of<br />
seven common diseases and 3,000 shared controls. Nature 447 : 661-683<br />
6 Watson, J.D. and Crick, F.H.C. (1953) A Structure for Deoxyribose Nucleic Acid. Nature 171: 737-738<br />
5
Le protocole simple du <strong>séquençage</strong> a valu à son créateur, F. Sanger, le prix Nobel<br />
en 1980 7 . Jusqu’en 2000 les améliorations viendront du <strong>séquençage</strong> par PCR<br />
(Polymérase Chain Reaction) et <strong>de</strong> la détermination <strong>de</strong> la taille <strong><strong>de</strong>s</strong> fragments d’ADN<br />
synthétisés non plus par électrophorèse en gel <strong>de</strong> polyacrylami<strong>de</strong> mais par<br />
l’électrophorèse capillaire (Cf. Fig. 4).<br />
Les innovations dans la technique <strong>de</strong> <strong>séquençage</strong> 8<br />
De nouvelles innovations, dans la technique <strong>de</strong> <strong>séquençage</strong>, permettent<br />
d’abaisser d’une façon drastique le coût du <strong>séquençage</strong>, le faisant actuellement passer<br />
du prix d’un voyage Terre Lune à celui d’une voiture haut <strong>de</strong> gamme. On peut<br />
facilement envisager que celui-ci sera <strong>de</strong> quelques centaines <strong>de</strong> dollars dans une<br />
dizaine d’années (Cf. Fig. 5). Donnons quelques exemples :<br />
* le Pyro<strong>séquençage</strong><br />
Une première nouveauté importante apparaît dans le début <strong><strong>de</strong>s</strong> années 2000 et<br />
permet le <strong>séquençage</strong> en masse, il s’agit du pyro<strong>séquençage</strong>. Le principe est toujours<br />
basé sur le recopiage <strong>de</strong> l’ADN : chaque fois qu’un nucléoti<strong>de</strong> est incorporé dans la<br />
nouvelle chaîne d’ADN, il y a libération d’un phosphate inorganique qui est<br />
« transformé » en lumière. On ajoute les nucléoti<strong><strong>de</strong>s</strong> un par un et dans un premier<br />
temps on mesure la quantité <strong>de</strong> lumière libérée. Dans un <strong>de</strong>uxième temps on élimine<br />
les nucléoti<strong><strong>de</strong>s</strong> non incorporés puis on recommence le cycle. Ce système parfaitement<br />
automatisé a permis <strong>de</strong> déterminer la séquence complète <strong><strong>de</strong>s</strong> premiers génomes<br />
individuels comme celui <strong>de</strong> C. Venter.<br />
Le <strong>séquençage</strong> par synthèse ou cyclic reversible termination (CRT)<br />
Dans cette approche, en parallèle et <strong>de</strong> manière cyclique, chaque molécule<br />
d’ADN est séquencée par addition du nucléoti<strong>de</strong> complémentaire (fluorescent)<br />
catalysée par une enzyme. La réaction est suivie en temps réel par une caméra. Chaque<br />
nucléoti<strong>de</strong> intégré possè<strong>de</strong> un groupe protecteur qui arrête la synthèse <strong>de</strong> l’ADN. Le<br />
fluorophore est ensuite éliminé ainsi que le groupe protecteur par une autre enzyme.<br />
Le cycle peut redémarrer. Cette technique proposée par la société Helicos a permis <strong>de</strong><br />
7 http://nobelprize.org/nobel_prizes/chemistry/laureates/1980/<br />
8 Metzker, M. L. Sequencing technologies the next generation. (2010) Nature Reviews Genetics 11 : 31-46<br />
6
séquencer en 2009 le génome d’un chercheur, S. Quake, pour un coût <strong>de</strong> 50 000<br />
dollars avec seulement trois personnes pour effectuer le travail.<br />
Les <strong>techniques</strong> <strong>de</strong> l’avenir<br />
Technique <strong>de</strong> détection par son<strong>de</strong> atomique (scanning probe)<br />
Peut être la technique la plus simple, elle utilise comme instrument le<br />
microscope par force atomique. La son<strong>de</strong> <strong>de</strong> ce <strong>de</strong>rnier reconnaît chaque base d’ADN<br />
pour en déduire la séquence.<br />
Le <strong>séquençage</strong> par exonucléase<br />
Après recopiage d’un ADN et incorporation <strong>de</strong> nucléoti<strong><strong>de</strong>s</strong> fluorescents à l’ai<strong>de</strong><br />
d’une ADN polymérase, chaque molécule d’ADN est fixée sur un support (bille, par<br />
exemple), puis circule dans un microcapillaire où elle est digérée par une exonucléase.<br />
Cette enzyme libère séquentiellement chaque nucléoti<strong>de</strong> fluorescent dont la lecture se<br />
fait en temps réel dans un canal microfluidique.<br />
Le <strong>séquençage</strong> après traversée <strong>de</strong> nanopores<br />
Une molécule d’ADN traverse un nanopore, le passage <strong>de</strong> chaque nucléoti<strong>de</strong> à<br />
travers un nanopore soumis à un courant électrique provoque une variation <strong>de</strong> ce<br />
courant nucléoti<strong>de</strong>-dépendant au cours <strong>de</strong> la traversée du nanopore.<br />
Notons que l’utilisation <strong>de</strong> l’ensemble <strong>de</strong> ces nouvelles <strong>techniques</strong> est<br />
généralement génératrice <strong>de</strong> nombreuses erreurs. En attente <strong>de</strong> la technique simple,<br />
fidèle, peu coûteuse et rapi<strong>de</strong>, les chercheurs préfèrent le <strong>séquençage</strong> unique du 1% du<br />
génome codant <strong><strong>de</strong>s</strong> protéines, notamment dans le cas <strong>de</strong> la recherche <strong>de</strong> gènes<br />
impliqués dans <strong><strong>de</strong>s</strong> maladies.<br />
Les apports du <strong>séquençage</strong> <strong><strong>de</strong>s</strong> génomes individuels.<br />
Détermination du risque <strong>de</strong> développer différentes maladies<br />
On peut dès maintenant déterminer les allèles qui augmentent le risque <strong>de</strong><br />
développer <strong><strong>de</strong>s</strong> maladies complexes (Cf. Fig. 6). Ces résultats présentés lors du<br />
<strong>séquençage</strong> <strong><strong>de</strong>s</strong> 6 génomes individuels actuellement réalisés 9 posent <strong>de</strong> nombreux<br />
problèmes éthiques liés à la mé<strong>de</strong>cine prédictive.<br />
9 Levy, S. et al. The Diploid Genome Sequence of an Individual Human. (2007) PLoS Biology 5: 2113-2144;<br />
Wheeler, D. A. et al. The complete genome of an individual by massively parallel DNA sequencing. (2008)<br />
Nature 452 : 872-877; Jong-I, K. Highly annotated whole-genome sequence of a Korean individual. (2009)<br />
Nature 460: 1011-1016; Pushkarev1, D. et al. Single-molecule sequencing of an individual human genome.<br />
7
Développement <strong>de</strong> la pharmacogénétique<br />
La pharmacogénétique propose d’administrer le médicament le plus efficace en<br />
fonction du génotype du mala<strong>de</strong>. Elle propose également <strong>de</strong> réduire les effets<br />
secondaires possibles <strong><strong>de</strong>s</strong> médicaments. On a déjà pu déterminer les médicaments les<br />
mieux adaptés pour différents individus en comparant les cartes <strong><strong>de</strong>s</strong> marqueurs ADN<br />
<strong>de</strong> personnes répondant correctement à un traitement avec celles <strong>de</strong> personnes ne<br />
répondant pas ou répondant mal.<br />
Découverte <strong>de</strong> nouveaux gènes impliqués dans <strong><strong>de</strong>s</strong> maladies<br />
On assiste également à une meilleure compréhension <strong>de</strong> certaines maladies<br />
comme le cancer. Par exemple, en étudiant et en comparant le génome <strong>de</strong> cellules<br />
leucémiques et <strong>de</strong> cellules normales d’un même individu 10 Ley a découvert 8<br />
nouveaux gènes impliqués dans ce type <strong>de</strong> cancer (Cf. Fig. 7).<br />
On peut prendre un autre exemple, celui du syndrome <strong>de</strong> Miller caractérisé par<br />
un tonus musculaire diminué, <strong><strong>de</strong>s</strong> troubles <strong>de</strong> la coordination, <strong><strong>de</strong>s</strong> anomalies <strong>de</strong> la face<br />
et <strong><strong>de</strong>s</strong> membres. Cette maladie génétique orpheline présente un mo<strong>de</strong> <strong>de</strong> transmission<br />
autosomal mais on ne savait pas s’il était récessif ou dominant. Très récemment, on a<br />
montré en séquençant le génome <strong>de</strong> plusieurs mala<strong><strong>de</strong>s</strong> que la transmission s’effectuait<br />
sur le mo<strong>de</strong> récessif. Le gène présumé en cause dans cette maladie est impliqué dans le<br />
métabolisme <strong><strong>de</strong>s</strong> bases pyrimidiques 11 . Ce résultat très positif démontre la puissance<br />
<strong>de</strong> ce type d'outil et permet d’envisager une possibilité <strong>de</strong> traitement si on détecte tôt la<br />
maladie.<br />
En conclusion<br />
Dans cette ère <strong>de</strong> la post-génomique, tout reste à faire. Il se pose actuellement<br />
<strong><strong>de</strong>s</strong> problèmes très complexes à résoudre, par exemple celui <strong><strong>de</strong>s</strong> réseaux d'expression<br />
<strong><strong>de</strong>s</strong> gènes et <strong><strong>de</strong>s</strong> interactions entre les produits finaux d'expression <strong><strong>de</strong>s</strong> différents<br />
gènes. Les outils indispensables à leur résolution sont à créer. Comprendre les<br />
relations entre les gènes et le fonctionnement du système nerveux est un <strong><strong>de</strong>s</strong> défis<br />
(2009) Nature Biotechnology 27, 847-850; Wang, J. et al. The diploid genome sequence of an Asian individual.<br />
(2008) Nature 456: 60-66; Bentley, D. R. Accurate whole human genome sequencing using reversible<br />
terminator chemistry. (2008) Nature 456 : 53-59<br />
10<br />
Ley, T. J. DNA sequencing of a cytogenetically normal acute myeloid leukaemia genome. (2008) Nature 456 :<br />
66-72<br />
11<br />
Ng, S. B. et al. Exome sequencing i<strong>de</strong>ntifies the cause of a men<strong>de</strong>lian disor<strong>de</strong>r. (2010) Nature Genetics, 13-14<br />
8
essentiels du 21 e siècle. Depuis 30 ans, la génétique a progressé très rapi<strong>de</strong>ment avec<br />
<strong><strong>de</strong>s</strong> technologies <strong>de</strong> plus en plus poussées. Il faut maintenant déterminer <strong>de</strong> nouveaux<br />
concepts afin d'expliquer <strong><strong>de</strong>s</strong> paradoxes évi<strong>de</strong>nts comme celui <strong>de</strong> la complexité <strong>de</strong><br />
l’organisme humain malgré son faible nombre <strong>de</strong> gènes.<br />
Par ailleurs, les recherches sur le polymorphisme humain déboucheront sur le<br />
typage génétique <strong>de</strong> plus en plus précis <strong><strong>de</strong>s</strong> individus. On peut alors craindre, d'une<br />
part, l’utilisation d'informations concernant une prédisposition à telle ou telle maladie<br />
dans les domaines <strong>de</strong> l’embauche, <strong><strong>de</strong>s</strong> assurances, <strong><strong>de</strong>s</strong> prêts bancaires et, d'autre part, à<br />
plus ou moins long terme, <strong><strong>de</strong>s</strong> dérives eugénistes. En clair, dans ce domaine, le citoyen<br />
aura un rôle important à jouer et <strong>de</strong>vra rester vigilant.<br />
Figure 1 Caryotype <strong>de</strong> C. Venter (PLoS Biology 2007, 5, 10 )<br />
9
Figure 2 Double hélice d'ADN avec son squelette phosphate/sucre (P et S) et l'appariement <strong><strong>de</strong>s</strong> bases azotées<br />
(A,T,G,C). http://www.futura-sciences.com/uploads/tx_oxcsfutura/Adn_l_03.jpg<br />
Séquençage consortium public Séquençage CeleraGenomic<br />
Figure 3 Les <strong>de</strong>ux stratégies <strong>de</strong> <strong>séquençage</strong> du génome humain.<br />
10
Figure 4 Séquençage d’après Sanger et observation <strong><strong>de</strong>s</strong> résultats du <strong>séquençage</strong> en électrophorèse capillaire.<br />
http://images.the-scientist.com/content/figures/0890-3670-040927-44-1-1.jpg<br />
année Coût estimé Technologie utilisée personnel<br />
2001 300 000 000 $ Sanger (ABI) 251<br />
2001 100 000 000 $ Sanger (ABI) 274<br />
2007 10 000 000 $ Sanger (ABI) 31<br />
2008 2 000 000 $ Roche (454) 27<br />
2008 1 000 000 $ Illumina 48<br />
2008 500 000 $ Illumina 77<br />
2008 250 000 $ Illumina 196<br />
2009 48 000 $ Helicos 3<br />
Figure 5 <strong>Evolution</strong> du coût estimé du <strong>séquençage</strong> du génome humain ces dix <strong>de</strong>rnières années d’après D.<br />
Pushkarev et al. Nature Biotechnology (2009) 27 : 847-850<br />
11
Figure 6 Facteurs <strong>de</strong> risque pour différentes maladies d’un individu Coréen (Nature 456, 6, 2008)<br />
Figure 7 Mutations trouvées dans <strong><strong>de</strong>s</strong> cellules leucémiques absentes <strong><strong>de</strong>s</strong> cellules normales d’un individu (Nature<br />
456,6 2008)<br />
12