22.06.2013 Views

Les mondes darwiniens

Les mondes darwiniens

Les mondes darwiniens

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

233 / 1576<br />

[véron iqu e bar r i e l / caractèr e]<br />

s’est particulièrement développé ces dernières années. Ils impliquent tous<br />

l’estimation du coût d’un alignement (le score) qui est fonction du nombre<br />

d’indels et des pénalités associées, notamment les pénalité d’ouverture et<br />

les pénalités d’extension des gaps. Mais, quels sont les critères utilisés pour<br />

définir les pénalités ? Ce point reste obscur, rarement discuté, et les utilisateurs<br />

semblent généralement confiants dans les paramètres définis par défaut.<br />

L’alignement obtenu de manière automatique est souvent « amélioré » à « la<br />

main » (ou à « l’œil ») en tenant compte d’éléments ad hoc comme les structures<br />

secondaires dans le cas des gènes ribosomiques ou les triplets dans le<br />

cas de gènes codant pour des protéines par exemple. On ne discutera pas<br />

ici des avantages et inconvénients de telle ou telle stratégie, mais il est clair<br />

que l’alignement de séquences requiert des règles explicites et objectives 35<br />

rarement présentées.<br />

Une fois l’alignement réalisé, comment établir la matrice de caractères ? La<br />

pratique la plus courante consiste à exclure de l’analyse les zones difficiles à<br />

aligner ! Mais qu’est-ce qu’une zone difficile à aligner ? Il est certain que lorsque<br />

les séquences de différents taxons varient de longueur, il peut être difficile<br />

d’identifier la position homologue, le caractère, surtout quand il existe une<br />

grande divergence entre les taxons et donc un manque d’identité de nucléotides<br />

pouvant servir de points de repère. <strong>Les</strong> régions difficiles à aligner sont<br />

celles qui contiennent les événements du type indel et donc une information<br />

phylogénétique non négligeable pouvant même se révéler essentielle.<br />

Cependant, ce point n’est que très peu discuté. La difficulté à aligner des<br />

séquences est donc très subjective. Cette subjectivité et l’appréciation personnelle<br />

de la difficulté peuvent conduire deux biologistes à élaborer des<br />

matrices ayant un nombre variable de caractères à partir d’un même jeu de<br />

séquences.<br />

De plus, lors de l’analyse, différentes stratégies de traitement des gaps<br />

peuvent être appliquées. La pratique la plus courante, malgré la perte d’une<br />

partie de l’information phylogénétique, reste l’exclusion des indels ou plus<br />

précisément des zones contenant les gaps correspondant aux zones difficiles<br />

à aligner ! Dans certains cas, ces zones sont conservées lors de l’analyse, mais<br />

35. Barriel (1994a), <strong>Les</strong> relations de parenté au sein des Hominoidea et la place de Pan<br />

paniscus. Comparaison et analyse méthodologique des phylogénies morphologique<br />

et moléculaire, thèse de doctorat de l’université P. et M. Curie (Paris VI), n° 9401 ;<br />

idem (1994b), « Phylogénies moléculaires et insertions-délétions de nucléotides »,<br />

CRAS Paris, Série III (Sciences de la vie), 317.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!