27.07.2013 Views

Sébastien TERRAT - CNRS

Sébastien TERRAT - CNRS

Sébastien TERRAT - CNRS

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Apport des nouvelles générations de<br />

séquençage pour accéder à la diversité et<br />

la richesse des communautés microbiennes<br />

de sols issus d'échantillonnage de grande<br />

ampleur<br />

S. Terrat 1 , S. Dequiedt 1 , R. Christen 3 , D. Bachar 3 , M. Lelièvre 1 , T. Regnier 2 , V. Nowak 2 , P. Plassart 2 ,<br />

P. Wincker 4 , P. Lemanceau 2 , P.A. Maron 1,2 , C. Mougel 1,2 et L. Ranjard 1,2<br />

1 – UMR Agroécologie 1347 – Plateforme GenoSol, INRA – Dijon<br />

2 – UMR Agroécologie 1347 – Pôle EcolDur, INRA – Dijon<br />

3 – UMR <strong>CNRS</strong> 6543 – Laboratoire de Biologie Virtuelle, Nice<br />

4 – CEA, Institut de Génomique (IG), Genoscope, Evry.


Caractéristiques des sols<br />

Le sol est un environnement naturel assurant de multiples fonctions<br />

Production d’aliments et<br />

de biomasse<br />

Source : A. Richer de Forges (CA 45)<br />

Source : Infosol (INRA Orléans)<br />

Source de matières<br />

premières<br />

Source : J. Moulin (CA 36)<br />

Habitat et patrimoine<br />

génétique<br />

Source : Infosol (INRA Orléans)<br />

Les microorganismes des sols sont très abondants, avec une forte<br />

diversité<br />

1g de sol<br />

Bactéries<br />

Champignons<br />

10 6 - 10 9 individus<br />

10 3 - 10 6 individus<br />

10 3 - 10 6 espèces<br />

Variable


Objectifs<br />

Caractérisation des communautés microbiennes des sols via l’exploitation des<br />

données issues du pyroséquençage d’amplicons 16S et 18S.<br />

Inventaire exhaustif de la diversité microbienne tellurique,<br />

Evaluer sa distribution temporelle et spatiale,<br />

Mieux comprendre la régulation des communautés microbiennes du sol,<br />

Relier cette diversité en fonctionnement biologique du sol et en services<br />

écosystémiques.<br />

(Ranjard et al., 2003, Ranjard et al., 2009, Dequiedt et al. 2011)


Inventaire de la diversité microbienne à l’échelle de la France<br />

RMQS : Réseau de Mesure de la Qualité des Sols, mis en place en 2002 (INRA INFOSOL,<br />

Orléans), grille d’échantillonnage des sols français : 16 km x 16km sur toute la France<br />

2206 points.<br />

ICP Forest niveau 1<br />

1/3 sites agricoles<br />

1/3 sites forestiers<br />

1/3 sites prairies<br />

Cartographie de la qualité des sols basée uniquement sur les paramètres physico-chimiques :<br />

- texture, pH, Corg tot, Norg, Ca, Na, Mg, ETM, …


DNA<br />

1<br />

Métagenome<br />

Abondance<br />

Diversité<br />

L’écologie moléculaire microbienne<br />

RNA<br />

2<br />

Métatranscriptome<br />

Fonctionnalité<br />

Protein<br />

3<br />

Métaproteome<br />

MétaTaxogénomique (16S/18S)<br />

Substrats<br />

Produits<br />

4<br />

Métabolome<br />

Activité<br />

Services<br />

(Maron et al. 2007)


Le pyroséquençage<br />

L’expansion des nouvelles générations de séquençage permet<br />

maintenant d’acquérir un grand nombre de séquences.<br />

GS-FLX 454 (Roche) Titanium :<br />

• 1,000,000 reads (~400 bases)<br />

• 400,000,000 bases en 10 heures<br />

Limitation : production massive de données à traiter et à gérer.<br />

Nécessité d’utiliser un pipeline d’analyse bioinformatique<br />

optimisé et répondant à nos besoins.


Pipelines bioinformatique existants<br />

PLUS MOINS<br />

▲ Multiplateformes,<br />

▲ MAJ (V 1.24.1),<br />

▲ Nombreux outils dispo,<br />

▲ Communauté active.<br />

▲ Pas d’installation,<br />

▲ Interface web conviviale,<br />

▲ Outil de référence.<br />

▲ MAJ (V 1.4.0),<br />

▲ Analyse rapide,<br />

▲ Production de<br />

graphiques de qualité.<br />

Développement pipeline dédié (16S/18S)<br />

▼ Lignes de commande,<br />

▼ Difficultés sur gros jeux<br />

de données,<br />

▼ Complexe à paramétrer.<br />

▼ Volume des données,<br />

▼ Peu évolutif,<br />

▼ Téléchargements<br />

fichiers à chaque étape.<br />

▼ Confidentialité données.<br />

▼ Linux ou Mac OS,<br />

▼ Lignes de commande,<br />

▼ Certains outils intégrés<br />

engendreraient des<br />

erreurs.<br />

(Schloss, 2010 – Barriuso et al., 2011 – White et al., 2010)


Raw reads<br />

(454, Illumina,<br />

etc…)<br />

Pipeline bioinformatique de traitement : vue globale<br />

Prétraitement<br />

Harmonisation<br />

Taxonomie<br />

Analyses<br />

CLUSTERING 3.0% (INDICES DE DIVERSITE)<br />

Sample Nb_seqs Nb_clusters Shannon var(Shannon) Evenness Simpson 1/Simpson<br />

Zone A 1770 62 1.91 0.00139537 0.462716 0.25854 3.868<br />

Zone A 2739 100 2.242 0.00104185 0.486905 0.206566 4.841<br />

Témoin Zone B 5163 76 1.37 0.000603875 0.316427 0.496192 2.015<br />

Zone B 20159 310 3.235 0.000142737 0.563985 0.0867775 11.524<br />

Zone B 10274 183 2.489 0.00037131 0.477824 0.231748 4.315<br />

Alignement<br />

Données exploitables<br />

Clustering Filtres<br />

Statistiques


Séquences<br />

brutes<br />

Clustering basé sur l’alignement multiple INFERNAL<br />

Clustering des données à K différences (PERL).<br />

S’appuie sur des données organisées (diminution nombre d’étapes).<br />

S’appuie sur les séquences les plus « vraies ».<br />

Calcul de similarité entre 2 séquences (distance d’édition de Levenshtein).<br />

Ignore les erreurs d’homopolymères.<br />

(Terrat et al., 2012 - Shahbazkia & Christen, in preparation)<br />

Prétraitement Alignement Clustering Filtres Taxonomie Analyses Statistiques


Séquences<br />

brutes<br />

Filtre des reads<br />

Limitations :<br />

Peu de recul sur taux d’erreur lié au pyroséquençage,<br />

Existence des chimères, des single-singletons.<br />

Clustering<br />

(Terrat et al., 2012 - Shahbazkia & Christen, in preparation)<br />

Prétraitement Alignement Clustering Filtres Taxonomie Analyses Statistiques


Séquences<br />

brutes<br />

Filtre des reads<br />

(Terrat et al., 2012 - Shahbazkia & Christen, in preparation)<br />

Prétraitement Alignement Clustering Filtres Taxonomie Analyses Statistiques


Séquences<br />

brutes<br />

Filtre des reads<br />

Elimination des single-singletons<br />

Assignation<br />

taxonomique<br />

Si OK : réinjection,<br />

Sinon : élimination.<br />

Elimination suffisante, trop stringente ?<br />

Filtre supplémentaire pour chimères ?<br />

(Terrat et al., 2012 - Shahbazkia & Christen, in preparation)<br />

Prétraitement Alignement Clustering Filtres Taxonomie Analyses Statistiques


Séquences<br />

brutes<br />

Assignation taxonomique<br />

Limitations :<br />

Peu de recul sur qualité des bases disponibles,<br />

Approches d’assignation différentes.<br />

16S 18S<br />

RDP<br />

multiclassifier BLAST<br />

???<br />

BLAST<br />

Couplage<br />

résultats<br />

Autres bases ?<br />

Autres approches ?<br />

Prétraitement Alignement Clustering Filtres Taxonomie Analyses Statistiques<br />

???<br />

Couplage<br />

résultats


Développements techniques en cours<br />

Mise au point d’une interface graphique multiplateforme :<br />

• Interface graphique conviviale en cours de développement pour interagir<br />

avec serveur de calcul dédié.<br />

Développement d’une interface Web :<br />

• Interface Web pour accéder au pipeline développé par la plateforme<br />

GenoSol et pour nos différents collaborateurs.


Assignation taxonomique :<br />

• Mise au point de bases épurées et d’une nouvelle approche<br />

d’assignation appelée AffilGood.<br />

Optimisation du pipeline :<br />

Développements techniques en cours<br />

Collaboration avec P. PEYRET et E. PEYRETAILLADE<br />

Université d’Auvergne (ERT-CIDAM)<br />

• Collaboration sur l’analyse de données et la mise au point ou<br />

l’amélioration de programmes intégrés au pipeline.<br />

Collaboration avec R. CHRISTEN<br />

UMR <strong>CNRS</strong> 6543 – Laboratoire de Biologie Virtuelle


Influence des procédures d’extraction (standardisation) :<br />

1 er paramètre à prendre en compte dans les inventaires taxonomiques<br />

de la microflore tellurique.<br />

Abondance relative (%)<br />

MOBIO<br />

5<br />

4<br />

3<br />

2<br />

1<br />

0<br />

0 1 2 3 4 5<br />

GnS-GII<br />

Développements techniques en cours<br />

Partenariat scientifique avec P. WINCKER (initiation projet Taxomic-RMQS)<br />

Institut de Génomique – Centre National de Séquençage – Genoscope<br />

(A) 5 (B)<br />

SY3<br />

Abondance relative (%)<br />

4<br />

3<br />

2<br />

1<br />

0<br />

0 1 2 3 4 5<br />

GnS-GII<br />

Gemmatimonadetes<br />

Nitrospira<br />

Crenarchaeota<br />

Firmicutes<br />

TM7<br />

WS3<br />

OP10<br />

Sols sous culture : ; forêt à feuilles<br />

caduques : ; forêt de conifères : ;<br />

prairies : et vignes : . (A)<br />

Comparaison de GnS-GII avec MOBIO,<br />

et (B) de GnS-GII avec SY3.<br />

(Terrat et al., 2012)


Lionel Ranjard<br />

Remerciements<br />

Pierre-Alain Maron<br />

Christophe Mougel<br />

Samuel Dequiedt<br />

Mélanie Lelièvre<br />

Fabien Morin<br />

Philippe Lemanceau<br />

Richard Christen Patrick Wincker


Merci de votre attention !


INRA de Dijon – UMR Agroécologie<br />

Equipe rattachée au pôle EcolDur<br />

Axe 1 : Distribution spatiale (temporelle) et régulation de la diversité<br />

microbienne des sols<br />

Axe 2 : Traduction de la diversité microbienne en fonctionnement<br />

biologique (turnover des matières organiques des sols – cycle du C)<br />

Carte de diversité<br />

microbienne des<br />

sols<br />

Traduction<br />

Carte d’aptitude<br />

des sols à stocker<br />

et déstocker du<br />

Carbone<br />

Programme Carbomic-RMQS


Appui logistique<br />

Centre de Ressources Génétiques :<br />

conservatoire de sols et ADNs de sites expérimentaux,<br />

réseaux de surveillance et observatoire (RMQS, OREs, Réseau<br />

PIC, Sites ateliers, sites de l’ADEME, ANDRA, OSV, LTO européens,…)<br />

Plateforme Technique : caractérisation de la<br />

diversité microbienne (qPCR, Fingerprint, Metaprotéomique,<br />

Pyroséquençage,…)<br />

Système d’Information Environnementale<br />

(S.I.E.) : base de données (gestion et traçabilité, confrontation<br />

données environnementales - microbiennes…) et outils<br />

mathématiques adéquats (statistiques, géostatistiques, pipeline<br />

bioinformatique,…)<br />

Démarche qualité, veille technologique et formation<br />

Mise à la disposition de la communauté scientifique<br />

Référentiel de la caractérisation microbienne des sols


Diagramme Organisationnel de GenoSol

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!