16.07.2014 Views

Introduction au RNA-seq - Institut de Mathématiques de Toulouse

Introduction au RNA-seq - Institut de Mathématiques de Toulouse

Introduction au RNA-seq - Institut de Mathématiques de Toulouse

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>RNA</strong>-<strong>seq</strong><br />

Olivier Bouchez<br />

Nathalie Mars<strong>au</strong>d<br />

http://get.genotoul.fr<br />

Mercredi http://get.genotoul.fr<br />

28 mars 2012


Plateforme GeT : Génome et Transcriptome<br />

Deux plateformes IBiSA et 3 plate<strong>au</strong>x<br />

techniques regroupés <strong>de</strong>puis 2010<br />

Responsable scientifique<br />

Denis Milan<br />

• Coordination <strong>de</strong>s nouve<strong>au</strong>x investissements<br />

• Interaction dans la mise en place <strong>de</strong><br />

nouvelles technologies<br />

• Partage <strong>de</strong> l’expertise <strong>de</strong> chacune <strong>de</strong>s<br />

structures<br />

• Animation d’une commun<strong>au</strong>té plus large<br />

http://get.genotoul.fr


GeT-PlaGe<br />

• Certification ISO 9001:2008<br />

Expertise et mise à disposition d’une plateforme technologique<br />

en génomique :<br />

• Séquençage / Génotypage<br />

• Analyse d’expression<br />

• PCR temps réel<br />

Auzeville (INRA)<br />

• Un partenariat fort et historique avec la PF Bioinformatique<br />

• Plateforme stratégique INRA : 147 k€ dotation 2011<br />

• Gestion financière et RH <strong>de</strong>s non titulaires par le SAIC <strong>de</strong> l'INP<br />

http://get.genotoul.fr


GeT-PlaGe<br />

: Ressources Humaines<br />

David<br />

L<strong>au</strong>re Johanna<br />

Clémence<br />

• 17 personnes: 4 permanents INRA (dont Denis), 1 CDD<br />

TH, 3 permanents <strong>Institut</strong>s ou lb labo (100% GA, 100%<br />

CNRS LIPM, 30% INSERM), 9 CDD sur activité<br />

• 4 départs en2011<br />

• Renforcement <strong>de</strong> la partie administrative<br />

• Renforcement <strong>de</strong> l’équipe technique<br />

• Renforcement <strong>de</strong> l’équipe info/Bioinfo<br />

• Partenariat étroit avecla plateforme Bioinfoi<br />

http://get.genotoul.fr


Le partenariat avec la PF Bioinformatique<br />

• L’équipe technique PlaGe prend le relais <strong>de</strong> la<br />

plateforme bioinfo sur l’analyse qualitative <strong>de</strong>s<br />

données<br />

• Le développement en collaboration du pipeline <strong>de</strong><br />

traitement <strong>de</strong>s données et du site NG6<br />

• Des investissements <strong>de</strong> concert (CDD IBiSA 2008,<br />

CPER, France Génomique).<br />

http://get.genotoul.fr


France FanceGénomiq Génomique<br />

• Les objectifs <strong>de</strong> France Génomique :<br />

• Un rése<strong>au</strong> national intégrant CNS/CNG & 7 PF IBiSA<br />

• Un portail unique pour les utilisateurs<br />

• Des développements (bio & bioinfo) et une veille mis en commun<br />

• Du matériel complété en fonction <strong>de</strong>s besoins<br />

• Pour GeT-PlaGe & PF Bioinfo sur les années 1&2 :<br />

• Un nouvel Hi<strong>seq</strong> 2000<br />

• Une contribution à l’<strong>au</strong>tomatisation <strong>de</strong> la préparation <strong>de</strong>s librairies<br />

• 1 CDD Biologiste + 2 CDD Bioinfo sur 2 ans + 1 CDD coordination<br />

bioinfo nationale<br />

• 300 k€ d’infrastructure informatique<br />

http://get.genotoul.fr


Qu’est-cequele<strong>RNA</strong><br />

cequele<strong>RNA</strong>-<strong>seq</strong><br />

?<br />

http://get.genotoul.fr


<strong>Introduction</strong><br />

‣ Quelques définitions<br />

Séquençage : déterminer la succession linéaire<strong>de</strong>sbasesA,C,G,T<strong>de</strong>l’ADN,lalecture<strong>de</strong><br />

cette séquence permet d’étudierd l’information biologique contenue par celle-ci<br />

Séquençage Nouvelle Génération (NGS, Next Generation Sequencing) : Séquençage à très<br />

h<strong>au</strong>t débit, génération d’un très grand nombre <strong>de</strong> séquences simultanément<br />

<strong>RNA</strong>-<strong>seq</strong> : transcriptome <strong>seq</strong>uencing. Informations sur les ARN via le séquençage <strong>de</strong> l’ADN lADN<br />

complémentaire (cDNA)<br />

Re-séquencage : séquençage d’un dunfragment d’ADN et comparaison du résultat obtenu avec<br />

une séquence <strong>de</strong> référence connue<br />

Séquencage <strong>de</strong> novo :séquençage d’un génome pour lequell il n’existe pas <strong>de</strong> séquence <strong>de</strong><br />

référence, détermination d’une séquence inconnue<br />

http://get.genotoul.fr


Pourquoi oi faire du <strong>RNA</strong>-<strong>seq</strong><br />

?<br />

‣ L’accès <strong>au</strong>x séquences <strong>de</strong>s ARN permet <strong>de</strong> :<br />

Annoter un génome<br />

Réaliser un catalogue <strong>de</strong> gènes exprimés<br />

I<strong>de</strong>ntifier <strong>de</strong>s nouve<strong>au</strong>x gènes<br />

I<strong>de</strong>ntifier <strong>de</strong>s transcrits alternatifs<br />

Quantifier l’expression <strong>de</strong> gènes (comparaisons entre différentes conditions expérimentales)<br />

I<strong>de</strong>ntifier <strong>de</strong>s petits ARNs<br />

I<strong>de</strong>ntifier <strong>de</strong>s « starts » <strong>de</strong> transcription<br />

….<br />

http://get.genotoul.fr


<strong>Introduction</strong><br />

<br />

Lecture singleread (SR) et paired end (PE)<br />

<br />

PE : facilite l’alignement <strong>de</strong>s séquences<br />

sur le génome <strong>de</strong> référence et/ou<br />

l’assemblage<br />

http://get.genotoul.fr


Séquenceurs NGS PlaGe<br />

Illumina HiSeq 2000 x 2<br />

Séquençage par synthèse<br />

2 flowcells<br />

Longueur : 2 x 100 pb<br />

Débit : 240-300 GB/flowcell<br />

Temps <strong>de</strong> run : 15 jours<br />

Multiplex 24<br />

Illumina MiSeq<br />

Séquençage par synthèse<br />

Longueur : 2 x 150 pb<br />

Débit : >1 GB<br />

Temps <strong>de</strong> run : 27 h<br />

Multiplex 24<br />

GS FLX 454 XL+<br />

Pyroséquençage<br />

Longueur : 400-700 pb<br />

Débit : 1 million <strong>de</strong><br />

séquences, ~400-700 MB<br />

Temps <strong>de</strong> run :10h<br />

http://get.genotoul.fr


Spécificités<br />

Machine Roche GS FLX HiSeq 2000 v3 MiSeq PacBioRS Ion Torrent Life Tech Oxford<br />

Nanopore<br />

Type PCR billes PCR Cluster PCR cluster Simple PCR Billes Simple<br />

molécule<br />

Molécule<br />

Taille<br />

Fragments<br />

Nb<br />

fragments /<br />

run<br />

Simple<br />

Molécule<br />

500 1000 100 150 150 1000 100-200 5 000 à 100kb<br />

10 000<br />

1 Million 6 Milliards 13 Millions 50 000 100 000 40 000 8 000<br />

Mb / run 700 Mb 600 000 Mb 3 400 Mb 50 Mb 10 Mb 40 Mb 10 000 Mb<br />

(durée) (8h) (14j) (27h) (15 min) (2h) (2h) (24h)<br />

Cout 12 € / Mb 0.1 € / Mb 1 € / Mb 10-200 € / 5-10 € / 5 € / Mb ?<br />

marginal<br />

Mb Mb<br />

2008 2010 2011 2012 2011 2012 2012<br />

http://get.genotoul.fr


Présentation d’un séquenceur NGS : Illumina<br />

HiSeq2000<br />

<br />

<br />

Spécifications :<br />

600 Gb (2 flowcell <strong>de</strong> 8 lanes)<br />

Paired end (2x100 bp): ~360 millions <strong>de</strong> séquences/lane<br />

1 flowcell = une lame = 8 lignes<br />

http://get.genotoul.fr


Worflow<br />

http://get.genotoul.fr


Contrôles qualité <strong>de</strong>s ARN<br />

‣ Dosage <strong>au</strong> Nanodrop<br />

<br />

Concentration <strong>de</strong> l’ARN en ng/µL (<strong>au</strong> moins 100 ng/µL)<br />

Ratio 260/280: contamination par les protéines; doit être > 1.8<br />

Ratio 260/230: contamination par les sels (résidus <strong>de</strong> l’extraction); doit être > 1.8<br />

Peut engendrer une diminution du ren<strong>de</strong>ment <strong>de</strong> la Rétrotanscription<br />

‣ Evaluation <strong>de</strong> l’état <strong>de</strong> dégradation <strong>de</strong> l’ARN par un dosage <strong>au</strong> Bioanalyser (Agilent)<br />

RIN (<strong>RNA</strong> Integrity Number) : compris entre 0 et 10 ; doit être > 8.5<br />

28S/18S : doit être > 1.8<br />

15<br />

http://get.genotoul.fr


Préparation ation <strong>de</strong>s librairies<br />

ies<br />

Kits Illumina TruSeq<br />

4µg ARN total<br />

Adénylation <strong>de</strong>s<br />

extrémités 3’<br />

Purification et fragmentation a <strong>de</strong>s<br />

ARNm<br />

Ligation <strong>de</strong>s<br />

adaptateurs<br />

Synthèse du cDNA<br />

double brin<br />

Amplification par PCR<br />

Réparation <strong>de</strong>s<br />

extrémités<br />

Vérification <strong>de</strong>s<br />

librairies<br />

http://get.genotoul.fr


Préparation ation <strong>de</strong>s librairies<br />

ies<br />

<br />

Purification <strong>de</strong>s ARNm sur billes magnétiques poly-T (s<strong>au</strong>f pour les bactéries)<br />

Liaison billes poly-T Séparation Lavages/élution<br />

Echantillon<br />

non traité<br />

Echantillon traité<br />

Pourcentage d'élimination i i <strong>de</strong>s ARNr<br />

90% 98% 99% 99,90%<br />

ARNr 98% 83% 50% 33% 5%<br />

Autres 2% 17% 50% 67% 95%<br />

Kits Illumina TruSeq<br />

<br />

Fragmentation chimique <strong>de</strong> l’ARN (tampon alcalin)<br />

http://get.genotoul.fr


Préparation ation <strong>de</strong>s librairies<br />

ies<br />

<br />

Rétrotranscription <strong>de</strong> l’ARN en cDNA double brin<br />

<br />

Réparation et phosphorylation <strong>de</strong>s extrémités pour avoir <strong>de</strong>s bouts francs<br />

Adénylation en 3’<br />

http://get.genotoul.fr


Préparation ation <strong>de</strong>s librairies<br />

ies<br />

<br />

Ligation <strong>de</strong>s adaptateurs (contiennent l’in<strong>de</strong>x)<br />

• P5 et P7: Fixation sur la flowcell<br />

• SP 1 et 2: primers <strong>de</strong> séquençage<br />

• Tag: in<strong>de</strong>x (6 bases): multiplexage par 24<br />

Enrichissement par PCR <strong>de</strong>s fragments+adaptateurs (Primers spécifiques <strong>de</strong> P5 et P7)<br />

<br />

Purification sur gel<br />

<br />

Contrôles qualités <strong>de</strong>s librairies : Bioanalyser, qPCR<br />

http://get.genotoul.fr


Génération <strong>de</strong>s clusters<br />

s<br />

‣ cBot<br />

Transfert <strong>de</strong> la librairie sur la flowcell<br />

Amplification <strong>de</strong> la librairie : formation <strong>de</strong>s clusters<br />

Flowcell<br />

Librairies<br />

‣ Génération <strong>de</strong> clusters : environ 5h<br />

http://get.genotoul.fr


Génération <strong>de</strong>s clusters<br />

s<br />

Design <strong>de</strong> la flowcell<br />

http://get.genotoul.fr


Génération <strong>de</strong>s clusters<br />

s<br />

<br />

<br />

<br />

Hybridation <strong>de</strong>s librairies grâce <strong>au</strong>x adaptateurs à l’intérieur <strong>de</strong> la flowcell<br />

Synthèse du brin complémentaire<br />

Dénaturation<br />

http://get.genotoul.fr


Génération <strong>de</strong>s clusters<br />

s<br />

<br />

<br />

<br />

Formation d’un pont<br />

Synthèse du brin complémentaire<br />

Dénaturation<br />

http://get.genotoul.fr


Génération <strong>de</strong>s clusters<br />

s<br />

‣ Formation <strong>de</strong> 750 000-850 000 clusters / mm²<br />

http://get.genotoul.fr


Principe du séquençage par synthèse<br />

‣ Déroulement d’un cycle:<br />

<br />

Incorporation <strong>de</strong>s 4 nucléoti<strong>de</strong>s fluorescents<br />

en même temps<br />

<br />

Acquisition <strong>de</strong> l’image (50 min/cycle)<br />

<br />

Temps <strong>de</strong> run : 2 x100 bp : environ 15 jours<br />

<br />

Déprotection du nucléoti<strong>de</strong> incorporé<br />

Rq: 1 seul jeu <strong>de</strong> caméras pour 2 flowcell<br />

http://get.genotoul.fr


Principe du séquençage par synthèse<br />

‣ Base calling:<br />

<br />

A chaque cycle, une base est incorporée<br />

Détection <strong>de</strong> l’émission <strong>de</strong> fluorescence<br />

Chaque cluster est caractérisé par une position (X ; Y)<br />

<br />

A chaque cycle : une couleur détectée = une base<br />

<br />

Base calling= correspondance entre la fluorescence et la base<br />

pour un cluster<br />

http://get.genotoul.fr


Informations importantes<br />

Kits Illumina TruSeq : le séquençage n’est pas orienté<br />

Séquençage du brin codant ou du brin non codant<br />

RT réalisée avec <strong>de</strong>s random primers<br />

Il existe d’<strong>au</strong>tres kits permettant un séquençage orienté<br />

Principe <strong>de</strong> ligation directe orientée d’un adaptateur sur l’ARN<br />

Détection <strong>de</strong>s « starts » <strong>de</strong> transcription<br />

I<strong>de</strong>ntification d f du brin codant<br />

Possibilité <strong>de</strong> séquencer <strong>de</strong>s petits ARN<br />

http://get.genotoul.fr


Analyses qualitatives <strong>de</strong>s données<br />

Images<br />

Fichiers Bcl<br />

Séquences/qualité<br />

CASAVA<br />

Démultiplexage<br />

Séquences/qualité<br />

Base calling HCS/RTA<br />

FastQ Illumina filter<br />

FastQC<br />

Affichage NG6<br />

http://get.genotoul.fr


Analyses qualitatives <strong>de</strong>s données : NG6<br />

NG6 : un site <strong>de</strong> mise à disposition <strong>de</strong>s données analysées : http://ng6.toulouse.inra.fr/<br />

http://get.genotoul.fr


Analyses qualitatives <strong>de</strong>s données : NG6<br />

http://get.genotoul.fr


Analyses qualitatives <strong>de</strong>s données : NG6<br />

Q10 : 1 base sur 10 est incorrecte<br />

Q20 : 1 base sur 100 est incorrecte<br />

Ligne rouge : médiane (doit être > 20)<br />

Very good quality calls<br />

Reasonable quality<br />

Poor quality<br />

http://get.genotoul.fr


Critères <strong>de</strong> qualité<br />

‣ Critères <strong>de</strong> qualité<br />

Le nombre <strong>de</strong> reads produites correspondant <strong>au</strong> nombre attendu<br />

Pas <strong>de</strong> contamination<br />

Longueur <strong>de</strong>s reads correcte (100pb)<br />

Bonne qualité, mais ce n'est pas un critère rédhibitoire<br />

Bon alignement (re-séquençage avec génome <strong>de</strong> référence « propre p ») : peu <strong>de</strong><br />

reads non alignées<br />

http://get.genotoul.fr


Que faire ensuite ?<br />

‣ Différentes approches d'alignement <strong>de</strong>s séquences:<br />

<br />

De novo : pas <strong>de</strong> génome <strong>de</strong> référence, transcriptome non disponible, très coûteux en<br />

terme calculs, résultats très variables<br />

<br />

Transcriptome <strong>de</strong> référence (en cours <strong>de</strong> développement) : la plupart sont incomplets<br />

<br />

Génome <strong>de</strong> référence (en cours <strong>de</strong> développement) : le plus utilisé, permet<br />

l'alignement <strong>de</strong> reads sur <strong>de</strong>s parties non annotées, nécessite un « spliced aligner »<br />

pour eucaryotes<br />

→ Etu<strong>de</strong> à différents nive<strong>au</strong>x : gènes, transcripts, spécificité allèlique<br />

→ Découvertes <strong>de</strong> nouve<strong>au</strong>x transcripts, nouve<strong>au</strong>x isoformes, nouvelles<br />

structures <strong>de</strong> gènes (fusion)<br />

‣ IMPORTANT : Discuter <strong>de</strong> la question biologique et du plan expérimental avec <strong>de</strong>s<br />

Bioinformaticiens et Biostatisticiens AVANT <strong>de</strong> mettre en place l’expérience<br />

http://get.genotoul.fr


Pourquoi oi ?<br />

Multiplexage <strong>de</strong>s échantillons possible sur différentes lignes<br />

1 2 3 4<br />

4 librairies séquençées sur 4<br />

lignes, 1 librairie par ligne<br />

1<br />

2<br />

3<br />

4<br />

1<br />

2<br />

3<br />

4<br />

1<br />

2<br />

3<br />

4<br />

1<br />

2<br />

3<br />

4<br />

4 4 4 4<br />

4 librairies séquençées sur 4<br />

lignes, 4 librairies par ligne<br />

Mêmes informations ?<br />

http://get.genotoul.fr


Exemples <strong>de</strong> biais connus du <strong>RNA</strong>-<strong>seq</strong><br />

http://get.genotoul.fr


Préparation ation <strong>de</strong>s librairies<br />

ies<br />

‣ Influence <strong>de</strong> la préparation <strong>de</strong>s librairies<br />

Synthèse du cDNA avec <strong>de</strong>s randoms primers:<br />

la couverture du transcript n’est pas réellement aléatoire<br />

• Spécificité <strong>de</strong> séquence <strong>de</strong> la polymérase?<br />

• Réparation <strong>de</strong>s extrémités?<br />

• %GC ?<br />

<br />

Amplification par PCR<br />

Idée: supprimer totalement la PCR : actuellement, on réduit le nombre <strong>de</strong> cycles<br />

(10 cycles <strong>au</strong> lieu <strong>de</strong> 15)<br />

http://get.genotoul.fr


Longueur du transcrit<br />

‣ Influence <strong>de</strong> la longueur du transcrit:<br />

• Nombre total <strong>de</strong> reads d’un transcrit : Exemple <strong>de</strong> calcul utilisé : RPKM (Read Per Kb per Million reads mapped)<br />

reads alignés sur gène d’intérêt<br />

nombre total <strong>de</strong> read alignés x longueur du transcrit (kb)<br />

• A un même nive<strong>au</strong> d’expression, les transcrits longs <strong>au</strong>ront plus <strong>de</strong> reads que les transcrits courts, donc l’expression<br />

différentielle <strong>de</strong>s longs transcrits sera plus facilement i<strong>de</strong>ntifiée (dépend <strong>de</strong> la profon<strong>de</strong>ur <strong>de</strong> séquençage)<br />

http://get.genotoul.fr


Autres esbiais<br />

‣ Couverture non aléatoire le long du transcrit<br />

‣ Biais selon une spécificité <strong>de</strong> position et <strong>de</strong> séquence :<br />

Robert et al. Genome Biology, 2011,12:R22<br />

‣ Biais selon l'aligneur utilisé<br />

‣ Alignement multiple <strong>de</strong> certaines reads<br />

http://get.genotoul.fr


Questions<br />

<br />

Combien <strong>de</strong> réplicats?<br />

• Le maximum, à discuter avec les biostatisticiens….<br />

<br />

Combien <strong>de</strong> reads pour chaque échantillon?<br />

• Entre 30M et 100M (dépendant <strong>de</strong> l’étu<strong>de</strong>, (catalogue<br />

ou quantification?), et <strong>de</strong>s € €)<br />

<br />

Quelle est la longueur idéale pour les reads?<br />

• Plus les reads sont longs, plus l’alignement se fait facilement; 2X100 bp actuellement mais passage à 2X150 bp bientôt<br />

<br />

Single read ou paired-end? end?<br />

• Paired end facilite l’alignement <strong>de</strong>s séquences, permet <strong>de</strong> détecter plus facilement les insertions/délétions et les jonctions<br />

entre les exons<br />

<br />

Déplétion <strong>de</strong>s ARN ribosom<strong>au</strong>x?<br />

<br />

Séquençage <strong>de</strong>s ARNs poly-A : forte sensibilité et forte précision pour l’étu<strong>de</strong> du profil d’expression<br />

MAIS : Pas <strong>de</strong> vision complète du génome<br />

Séquençage <strong>de</strong>s ARN tot<strong>au</strong>x déplétés en ARN ribosom<strong>au</strong>x : visibilité <strong>de</strong>s ARNs non-codants et non-polyA<br />

MAIS : Il f<strong>au</strong>t <strong>au</strong>gmenter la profon<strong>de</strong>ur pour avoir une bonne sensibilité <strong>de</strong> détection<br />

http://get.genotoul.fr


Comparaisons Microarrays/NGS<br />

http://get.genotoul.fr


Exemples<br />

Microarray<br />

-Pas <strong>de</strong> détection d’épissage alternatifs<br />

<strong>de</strong>s transcrits s<strong>au</strong>f pour l’humain<br />

-Matériel moins coûteux que le<br />

séquenceur<br />

<strong>RNA</strong><strong>seq</strong><br />

- A comparer avec les Tiling array (son<strong>de</strong>s sur toute la longueur<br />

du génome)<br />

- Séquençage du cDNA double brin donc perte <strong>de</strong> l’information<br />

brin spécifique (<strong>RNA</strong> directionnel)<br />

- Hétérogénéité dans le recouvrement <strong>de</strong> certaines zones<br />

d’expression quand on fait du séquençage<br />

- Etu<strong>de</strong> <strong>de</strong>s transcrits faiblement exprimés<br />

Conclusion : les données issues <strong>de</strong> microarrays et séquençage sont globalement similaires, pour les transcrits présents en<br />

gran<strong>de</strong> quantité<br />

http://get.genotoul.fr


Exemples<br />

<br />

Résultats: comparaison du nombre <strong>de</strong> gènes différentiellement<br />

exprimés dans les 2 technologies:<br />

• Parmi les gènes retrouvés dans une ou l’<strong>au</strong>tre <strong>de</strong>s technos,<br />

en qPCR:<br />

4/5 confirmés pour NGS (le 5 ème est un f<strong>au</strong>x-positif)<br />

<br />

2/6 confirmés pour microarray<br />

Donc, cela favorise les résultats NGS<br />

<br />

Conclusion:<br />

• Séquençage: très reproductible, i<strong>de</strong>ntification <strong>de</strong> 40% <strong>de</strong><br />

gènes différentiellement exprimés en plus par rapport <strong>au</strong>x<br />

microarrays<br />

• Puce U133: les son<strong>de</strong>s ne couvrent qu’une une petite partie du<br />

gène, donc pas <strong>de</strong> découverte <strong>de</strong> nouve<strong>au</strong>x transcrits ou<br />

d’épissages alternatifs<br />

http://get.genotoul.fr


Exemples<br />

<br />

Résultats:<br />

• Bonne concordance entre NGS et microarrays<br />

• MAIS: NGS est plus précis et plus sensible permet <strong>de</strong> faire plus <strong>de</strong><br />

découvertes<br />

• Microarrays sont assez bon marché et facile à utiliser; obtention <strong>de</strong>s<br />

résultats assez rapi<strong>de</strong>ment<br />

• Ces 2 techniques sont complémentaires<br />

http://get.genotoul.fr


Bilan <strong>de</strong> la comparaison<br />

aison<br />

Microarrays<br />

Séquençage<br />

Génome <strong>de</strong> référence<br />

OUI<br />

Pour <strong>de</strong>ssiner les oligonucléoti<strong>de</strong>s<br />

NON<br />

OUI pour l’alignement<br />

Technique Hybridation avec les son<strong>de</strong>s Accès direct à la séquence<br />

Système <strong>de</strong> détection<br />

Lecture <strong>de</strong> la fluorescence par un scanner: problème<br />

<strong>de</strong> détection dans les faibles et les fortes intensités<br />

Précision <strong>de</strong> la lecture à une base donc étu<strong>de</strong> <strong>de</strong> SNP<br />

possible<br />

Coût + +++<br />

Reproductibilité +++ +++<br />

Obtention <strong>de</strong>s résultats<br />

Rapi<strong>de</strong><br />

environ 4 jours<br />

Assez long<br />

environ 3 semaines<br />

Quantité <strong>de</strong> données générées é é + +++<br />

Outils d’analyses statistiques Bien définis Encore en développement<br />

Analyses Etu<strong>de</strong> <strong>de</strong> gènes différentiellement exprimés Épissage alternatif, découverte <strong>de</strong> nouve<strong>au</strong>x exons,<br />

quantification <strong>de</strong> transcrits<br />

http://get.genotoul.fr


Pour plus d’informations…<br />

http://enco<strong>de</strong>project.org/ENCODE/protocols/dataStandards/<br />

/ / / /<br />

Infos sur :<br />

Réplicats<br />

t<br />

Nature du matériel<br />

Stats<br />

Etc…<br />

http://get.genotoul.fr


NGS 3<br />

ème génération… lavenir?<br />

l’avenir?<br />

http://get.genotoul.fr


Pacific BioSciences<br />

PacBio RS<br />

+ Séquençage molécule unique<br />

+ Pas d’étape <strong>de</strong> PCR<br />

+ Taille <strong>de</strong>s séquences<br />

- Be<strong>au</strong>coup d’erreur pour l’instant (>10%)<br />

Déjà disponible<br />

http://www.pacificbiosciences.com<br />

http://get.genotoul.fr


Oxford dNanopo Nanopore<br />

MinION<br />

GridION<br />

+ Séquençage molécule unique<br />

+ Pas d’étape <strong>de</strong> PCR<br />

+ Taille <strong>de</strong>s séquences<br />

- Be<strong>au</strong>coup d’erreur pour l’instant (>5%)<br />

http://www.nanoporetech.com<br />

? Prix…<br />

? Débit<br />

? Date <strong>de</strong> sortie<br />

http://get.genotoul.fr


Merci !<br />

http://get.genotoul.fr

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!