22.06.2013 Views

Les mondes darwiniens

Les mondes darwiniens

Les mondes darwiniens

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

232 / 1576<br />

[les mon des <strong>darwiniens</strong>]<br />

Si l’évolution a procédé seulement par le biais de substitutions, les séquences<br />

ont la même longueur et l’alignement est une étape triviale. Mais l’évolution<br />

d’une séquence est le fruit des mécanismes de substitutions, d’insertions<br />

et de délétions de nucléotides, ce qui conduit à des séquences de longueurs<br />

variables. Dans ce cas, si les séquences ont des longueurs différentes, on doit<br />

considérer les événements du type indel et donc introduire des « espaces »,<br />

des « trous » encore appelés « gaps » dans les séquences pour préserver l’homologie<br />

de position. L’alignement, qui consiste à localiser les parties communes<br />

entre des séquences de manière à mettre en évidence des régions<br />

homologues (qui se situent alors dans une même colonne), devient dans ce<br />

cas l’étape cruciale de l’analyse phylogénétique puisqu’il pose les hypothèses<br />

d’homologies primaires, des alignements différents pouvant conduire à des<br />

phylogénies différentes.<br />

Considérons la séquence du gène X pour trois taxons A, B et C :<br />

Taxon A : AATCGGTATGCATGTAAGGC<br />

Taxon B : AATCGGTATACATTTTCAGTTAGGC<br />

Taxon C : AATTGGATATGCATTTCCAGTTAGGC<br />

Ces trois séquences diffèrent à la fois par leur composition en nucléotides<br />

(les états de caractères) et par leur longueur, 20, 25 et 26 nucléotides respectivement<br />

(le nombre de caractères). La comparaison de ces trois séquences<br />

dans une perspective phylogénétique implique des transformations d’états<br />

de caractère correspondant à la fois à des événements mutationnels du type<br />

substitutions, mais pas seulement. La différence de longueur observée entre<br />

les séquences implique que des nucléotides aient été perdus ou gagnés et rend<br />

nécessaire l’introduction de gap (souvent représenté par le symbole « - ») lors<br />

de l’étape d’alignement. Le gap est un nouvel état de caractère, un 5 e état, qui<br />

correspond a posteriori sur le cladogramme à un événement mutationnel du<br />

type indel, à l’instar des substitutions (transitions, transversions).<br />

Pour aligner ces trois séquences brutes et réaliser ainsi la matrice taxonscaractères,<br />

il convient de rechercher les sites homologues. <strong>Les</strong> séquences<br />

étant de longueurs variables, la matrice comporte au minimum 26 caractères<br />

(colonnes). Un alignement possible est le suivant :<br />

Taxon A : AATCGG-TATGCAT-----GTAAGGC<br />

Taxon B : AATCGG-TATACATTTTCAGTTAGGC<br />

Taxon C : AATTGGATATGCATTTCCAGTTAGGC<br />

Actuellement, il existe plusieurs stratégies pour réaliser des alignements<br />

multiples, mais l’usage des logiciels d’alignement automatique de séquences

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!