Evolucao Molecular.pdf - Instituto de Biologia da UFRJ
Evolucao Molecular.pdf - Instituto de Biologia da UFRJ
Evolucao Molecular.pdf - Instituto de Biologia da UFRJ
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Evolução <strong>Molecular</strong>
Dobzhansky, 1973<br />
Na<strong>da</strong> em <strong>Biologia</strong> faz sentido senão à luz <strong>da</strong> Evolução
Dobzhansky, 1973<br />
<strong>Molecular</strong><br />
<strong>Molecular</strong><br />
Na<strong>da</strong> em <strong>Biologia</strong> faz sentido senão à luz <strong>da</strong> Evolução
Evolução molecular<br />
• Origem <strong>da</strong> Vi<strong>da</strong>: transição <strong>da</strong> matéria não viva para<br />
viva, síntese <strong>de</strong> moléculas orgânicas a partir <strong>de</strong><br />
inorgânicas espontaneamente (Stanley & Miller 1953)<br />
• Evolução <strong>de</strong> Macromoléculas: como as moléculas<br />
evoluem (Watson & Crick, 1953)<br />
• Filogenia <strong>Molecular</strong>: quais são as relações<br />
filogenéticas entre organismos, quando <strong>de</strong>termina<strong>da</strong><br />
linhagem passou a evoluir in<strong>de</strong>pen<strong>de</strong>ntemente,<br />
relógio molecular (Zuckerkandl & Pauling, 1962)
Os organismos possuem padrões
Reconstrução dos padrões <strong>de</strong><br />
especiação = Filogenia
Moléculas também possuem<br />
padrões<br />
•Platyrrhini CTAATTTCCCATCAACTAAATCACCTTCACCCCATAAAACCACCCCAAACCACCCCAAACCACCCCAAACTGA<br />
•Catarrhini<br />
•Tarsii<br />
•Strepsirhini<br />
CAAATTTCCCATCAACTAAATCTACTTTACCTCATAAAACCACCCCAAACCACCCCAAACCACCCCAAACTGA<br />
CTAACTCTCCCTCCATTAAACACTCCCTCCCACATAAAACAACCCCAAACCACCCCAAACCACCCCAAACTGA<br />
CTAACCCCCCTATCAATAAATCATCTAAACACACTAAAACAAACCACCCCAAACCACCCCAAACCCCTCCTGA
Evolução molecular<br />
• Filogenia <strong>Molecular</strong>: quais são as relações<br />
filogenéticas entre organismos, quando <strong>de</strong>termina<strong>da</strong><br />
linhagem passou a evoluir in<strong>de</strong>pen<strong>de</strong>ntemente,<br />
relógio molecular (Zuckerkandl & Pauling, 1962)<br />
• Evolução <strong>de</strong> Macromoléculas: como as moléculas<br />
evoluem (Watson & Crick, 1953)<br />
• Origem <strong>da</strong> Vi<strong>da</strong>: transição <strong>da</strong> matéria não viva para<br />
viva, síntese <strong>de</strong> moléculas orgânicas a partir <strong>de</strong><br />
inorgânicas espontaneamente (Stanley & Miller 1953)
Vamos especificar melhor...<br />
• <strong>Molecular</strong> = DNA, proteínas. Não lipí<strong>de</strong>os,<br />
carbohidratos.<br />
• Níveis hierárquicos acima (proteínas, células,<br />
organismos) que a seqüência <strong>de</strong> DNA possuem<br />
menos informação, enquanto níveis abaixo<br />
(estrutura <strong>de</strong> nucleotí<strong>de</strong>os) não adicionam<br />
informação útil.
O que é publicado em Evol Mol<br />
• Descrição <strong>da</strong> variabili<strong>da</strong><strong>de</strong> num nível molecular<br />
• Desenvolvimento <strong>de</strong> mo<strong>de</strong>los para os padrões<br />
observados<br />
• Inferência <strong>de</strong> processos evolutivos a partir <strong>de</strong><br />
padrões <strong>de</strong> diversi<strong>da</strong><strong>de</strong><br />
• Relacionar nível molecular ao resto <strong>da</strong> biologia<br />
• Aplicações: <strong>de</strong>senvolvimento <strong>de</strong> drogas
Mu<strong>da</strong>nça <strong>de</strong> focus<br />
• Gene para genoma<br />
• Retorno ao fenótipo<br />
• Mu<strong>da</strong>nça <strong>de</strong> habili<strong>da</strong><strong>de</strong>s:<br />
manual para computacional
Dificul<strong>da</strong><strong>de</strong>s <strong>da</strong> Morfologia no<br />
Estudo <strong>de</strong> Evolução<br />
• Variabili<strong>da</strong><strong>de</strong><br />
intraespecífica e<br />
interespecífica<br />
• Estudo populacional<br />
para <strong>de</strong>tecção <strong>de</strong><br />
características<br />
diagnósticas <strong>de</strong> uma<br />
espécie
Dificul<strong>da</strong><strong>de</strong>s <strong>da</strong> Morfologia<br />
• Diferenciação <strong>de</strong><br />
características<br />
ambientais e<br />
diagnósticas
Dificul<strong>da</strong><strong>de</strong>s <strong>da</strong> Morfologia<br />
• Como estu<strong>da</strong>r<br />
organismos tão<br />
diferentes
O que todos eles têm<br />
em comum<br />
• Todos eles tem<br />
que sintetizar<br />
proteínas,<br />
então po<strong>de</strong>mos<br />
usar genes<br />
ribossomais<br />
para fazer<br />
filogenias
Replicação do DNA
DNA<br />
Proteína<br />
DNA
In<strong>de</strong>ls
Árvore <strong>de</strong> spp x Árvore <strong>de</strong> genes
Outros problemas: contaminação<br />
• Xenoturbella não tem<br />
celoma, nem estômago,<br />
gôna<strong>da</strong>s organiza<strong>da</strong>s<br />
Xenoturbella sp.<br />
• Em 1997, era molusco<br />
por filogenia molecular<br />
• “Seqüência” <strong>de</strong><br />
Xenoturbella = 97,2 %<br />
similar a Nucula<br />
(molusco), enquanto<br />
duas spp. <strong>de</strong> Nucula são<br />
similares em 75%!<br />
Nucula sp.<br />
Bourlat et al. 2003 Nature
O que aconteceu<br />
• Mas a árvore ao lado<br />
mostra ML com SSU<br />
rRNA = <strong>de</strong>uterostomo<br />
Xenoturbella sp.<br />
• Contaminação, pois<br />
Xenoturbella se<br />
alimenta <strong>de</strong> moluscos<br />
Nucula!!!
Posição filogenética<br />
•A, monfilia <strong>de</strong> <strong>de</strong>uterostomos<br />
(incluindo Xenoturbella) suportado<br />
pela or<strong>de</strong>m <strong>de</strong> genes mitocondriais<br />
•B, monofilia <strong>de</strong> Ambulacraria<br />
(hemichor<strong>da</strong>dos + equino<strong>de</strong>rmos)<br />
excluindo Xenoturbella suportado<br />
por uma mu<strong>da</strong>nça no código<br />
genético<br />
•C, monofilia <strong>de</strong> crown group <strong>de</strong><br />
equino<strong>de</strong>rmas suportado por uma<br />
mu<strong>da</strong>nça no código genética e uma<br />
mu<strong>da</strong>nça na or<strong>de</strong>m <strong>de</strong> genes.
Filogenia <strong>Molecular</strong><br />
• Uso <strong>de</strong> macromoléculas para reconstrução<br />
filogenética<br />
• Como fazer
Metodologia mais comum...<br />
Apertar o enter várias vezes até aparecer<br />
uma árvore na tela
...mas existe outra maneira<br />
1) Alinhamento – estabelecimento <strong>de</strong> homologias<br />
2) Estimativa <strong>da</strong> árvore – reconhecimento <strong>de</strong><br />
padrões entre seqüências<br />
3) Interpretação <strong>da</strong> árvore – interpretação <strong>da</strong>s<br />
relações filogenéticas entre organismos
Alinhamento, mas para quê<br />
#Ppaniscus AACTAATACTAGTATTTCAGACGCCCAGGA<br />
#Ptroglodytes AACTAATACTAGTATTTCAGACGCCCAGGA<br />
#Homo<br />
AACTAATACTAACATCTCAGACGCTCAGGA<br />
#Gorilla AACTAACAACAACATCTCAGACGCCCAAGA<br />
#Pongo CACCAACACTAACATCTCAGATGCCCAAGA<br />
#Pongoabelli CACCAACACCAGCATCTCAGACGCCCAAGA<br />
#Hylobates AACCAACACTAACATTACGGATGCCCAAGA<br />
#Papio AACCAACACTAACATCACGGACGCCCAAGA<br />
#Ateles AACTCATACCAGTACTATAAATGCCCAAGA<br />
#Lagothrix AACCCACACCAGTACCATAAATGCTCAAGA<br />
#Alouatta AACTCATACCAGCACAATAAATGCCCAAGA<br />
#Brachyteles CACCCACACCAGTACCATGAACGCCCAAGA<br />
#Daubentonia TACCCATACAAACACCATAAACGCCCAAGA<br />
#Microcebus CACTCATACAAGCACCATAGACGCTCAAGA<br />
#Hapalemur AATACATACAAATACCATAGACGCCCAAGA<br />
#Varecia CACACATACAAGCACTATAGATGCTCAAGA<br />
#Eulemur TATCCATACAAGTACTATAGATGCTCAAGA<br />
#Propithecus CATACACACCAGCACCATGGACGCACAAGA<br />
#Xenopus AACTAATACAAACCTAATGGACGCACAAGA<br />
#Falco ATCC---TCCAACACTGTAGATGCACAAGA
Quando<br />
Schrago & Russo, 2003 MBE
Alinhamento<br />
• Estabelece as posições homólogas entre<br />
as seqüências<br />
• Homologia po<strong>de</strong> ser confiavelmente<br />
inferi<strong>da</strong> a partir <strong>de</strong> alta similari<strong>da</strong><strong>de</strong><br />
• Se o alinhamento estiver ruim, to<strong>da</strong> a<br />
análise proveniente <strong>de</strong>le também o será
Homologia= similari<strong>da</strong><strong>de</strong> com<br />
origem comum
Alinhamento ruim (sem<br />
homologia)<br />
Aythya americana GACACAACCTCA-ACTAGCGG-------ATAAATCCAACCACCAACCTTA<br />
Guira guira<br />
TACTAAGCCTAG-GCCTACTCT----CTATAATCCTAGTCAT-AATCCAA<br />
Neomorphus geoffroyi TATATATCCTGACACTAATACTAA--TAGAAAAATTATCCTCAAACACAG<br />
Ortalis vetula CATCTACCTCCACATTGGTCGCGGT-TTTTACTATGGCTCAT-ACCTCTA<br />
Rhea americana CAATCGCTGAGTCACCAATCGCTTC-TCCACCCTCCAATCATGATTCCTT<br />
Gallus gallus CTTTCATTACTTAGCAGGTGTTTCCTCCATTCTAGGAGCCATCAACTTTA<br />
*
Alinhamento ruim (região<br />
codificadora)<br />
Z68025HO AGG AGA AAT AAT A-G GAA ATA TAA GAC AAG CAC ATT GTA ACA TTA<br />
U00407RJ TGG GGA AAT AAT A-G GAA ATA TAA GAC AAG CAC ATT GTA ACC TTA<br />
U00402RJ AGG AGA AAT TCT A-G GAG ATA TAA GAC AAG CAG CTT GT- --- ---<br />
U00424SP AGG AGA AAT AAT A-G GAG ATA TAA GAC GAG CAC ATT GTA ACC TTA<br />
L20963BA AGG AGA AAT AAT A-G GAG CTA TAA GAC --- --- --- --- --- ---<br />
U66418UR AGA AGG AAT AAA A-G GAA CTA TAA GAC AAG CAC ATT GTA ACC TTA<br />
U00406RJ -GG AGA CAT AAT A-G GAG ATA TAA GAC AAG CAT ATT G-- --- ---<br />
AF025918MG AGG AGA CAT AAT A-G GAG ATA TAA G-- --- --- --- --- --- ---<br />
AF025926MG A-- --- --- --- --- --- --- --- --- --- --- --- --- --- ---<br />
Alinhamento <strong>de</strong> env <strong>de</strong> HIV
Alinhamento ruim (perfeito<br />
<strong>de</strong>mais)<br />
Guzmania monostachya ATG GAA GAA TTA CAA GGA TAT TTA GAA AAA GAT AGA<br />
Vriesea malzinei ... ... ... ... ... ... ... ..W .R. ... .G. W..<br />
Hechtia glabra ... ... ... ... ... ... ... ... ... ... ... ...<br />
Hechtia lindmanioi<strong>de</strong>s ... ... ... ... ... ... ... ... ... ... ... ...<br />
Hechtia glomerata ... ... ... ... ... ... ... ... ... ... ... ...<br />
Hechtia guatemalensis ... ... ... ... ... ... ... ... ... ... ... ...<br />
Brocchinia acuminata ... ... ... ... ... .A. ... ... ... ... ... ...<br />
Brocchinia micrantha ... ... ... ... ... .A. ... ... ... ... ... ...<br />
Cottendorfia flori<strong>da</strong> ... ... ... ... ... ... ... ... ... ... ... ...<br />
Navia phelpsiae ... ... ... ... ... ... ... ... ... ... ... ...<br />
Pepinia beachiae ... ... ... ... ... ... ... ... ... ... ... ...<br />
Pitcairnia rubronigriflora ... ... ... ... ... ... ... ... ... ... ... ...<br />
Pepinia corallina ... ... ... ... ... ... ... ... ... ... ... ...<br />
Pepinia sprucei ... ... ... ... ... ... ... ... ... ... ... ...<br />
Pitcairnia smithiorum ... ... ... ... ... ... ... ... ... ... ... ...<br />
Pitcairnia orchidifolia ... ... ... ... ... ... ... ... ... ... ... ...<br />
Pitcairnia recurvata ... ... ... ... ... ... ... ... ... ... ... ...<br />
Pitcairnia squarrosa ... ... ... ... ... ... ... ... ... ... ... ...<br />
Navia igneosicola ... ... ... ... ... ... ... ... ... ... ... ...<br />
Deuterocohnia longipetala ... ... ... ... ... ... ... ... ... ... ... ...<br />
Deuterocohnia sp. ... ... ... ... ... ... ... ... ... ... ... ...<br />
Deuterocohnia lotteae ... ... ... ... ... ... ... ... ... ... ... ...<br />
Pitcairnia heterophylla ... ... ... ... ... ... ... ... ... ... ... ...<br />
Bromeliaceas gene MatK cloroplasto
Escolha do Gen<br />
• O segmento <strong>de</strong>ve ter variabili<strong>da</strong><strong>de</strong> compatível<br />
com problema filogenético, cheque GenBank<br />
• Seja criativo, use amino ácidos, terceiras<br />
posições, primeiras e segun<strong>da</strong>s, to<strong>da</strong>s elas<br />
• Cheque seu alinhamento
Cheque seu alinhamento<br />
S.salar<br />
AAGAGGTCCCGCCTGCCCTGTGACTATGGGTTTAACGGCC--GCGGT-ATTTTGACCGTG<br />
O.mykiss<br />
--------CCGCCTGCCCTGTGACTATGGGTTTAACGGCC--GCGGT-ATTTTGACCGTG<br />
E.lucius<br />
AAGAGGTCCCGCCTGCCCTGTGACTATACGTTTAACGGCC--GCGGT-ATTTTAACCGTG<br />
Tilapia sp -AGAGGTCCCGCCTGCCCTGTGACTATAAGTTTAACGGCC--GCGGT-ATTTTGACCGTG<br />
H.bimac<br />
-AGAGGTCCCGCCTGCCCTGTGAC-ACATGTTTAACGGCC--GCGGT-ATTTTGACCGTG<br />
C.amazonarum -AGAGGTCCCGCCTGCCCAGTGACTATAAGTTCAACGGCC--GCGGT-ATTTTGACCGTG<br />
G.morhua<br />
AAGAGGTCCCGCCTGCCCTGTGACTATAAGTTTAACGGCC--GCGGT-ATTTTGACCGTG<br />
C.carpio<br />
--GAGGTCCAGCCTGCCCAGTGACTACAAGTTCAACGGCCCGGCGGTTATTTTGACCGTG<br />
L.chalumnae --GAGGTCCCGCCTGCCCAGTGACAAGA--TTTAACGGCC--GCGGT-ATCCTGACCGTG<br />
S.canicula AAGAGGTCCCGCCTGCCCTGTGACAATG--TTCAACGGCC--GCGGT-ATTTTGACCGTG<br />
P.marinus<br />
------------------------------------GGCC--GCGGT-ACTTTGACCGTG<br />
**** ***** * * ******
Alinhamentos (quase) infinitos<br />
ATTGC<br />
ATGCT<br />
TGCAT<br />
GACTG<br />
CATGA<br />
10 18 possibili<strong>da</strong><strong>de</strong>s!
Opções<br />
1. Reduzir mismatches :<br />
TCAG-ACG-ATTG<br />
|| | | | | |<br />
TC-GGA-GC-T-G<br />
0 mis 7 mat 6 gaps<br />
3. Opção 3 :<br />
TCAG-ACGATTG<br />
|| | | | |<br />
TC-GGA-GCTG-<br />
2 mis 6 mat 4 gaps<br />
2. Reduzir gaps :<br />
TCAGACGATTG<br />
|| ||<br />
TCGGAGCTG–-<br />
5 mis 4 mat 2 gaps<br />
4. Opção 4:<br />
TCAG-ACGATTG<br />
|| | | | | |<br />
TC-GGA-GCT-G<br />
1 mis 7 mat 4 gaps
www.ebi.ac.uk/clustalw
Alinhando
Número <strong>de</strong> bases ou aa
Algorítmo <strong>de</strong> alinhamento<br />
1) Dot matriz <strong>de</strong> id seqüências par a par<br />
2) Seleção <strong>de</strong> melhores diagonais<br />
3) Max. score pp, com melhores diagonais<br />
4) Construção <strong>da</strong> matriz <strong>de</strong> melhores sc pp<br />
5) Construção do Dendrograma<br />
6) Maximização do score múltiplo<br />
7) Alinhamento múltiplo final
Alinhamento par a par
Dot Matrix<br />
A T G A G C A A T<br />
A<br />
C<br />
G<br />
A<br />
C<br />
T<br />
A<br />
T<br />
. . . .<br />
.<br />
. .<br />
. . . .<br />
.<br />
. .<br />
. . . .<br />
. .
Parâmetros do alinhamento par a<br />
par<br />
• KTUP – Tamanho <strong>da</strong> palavra procura<strong>da</strong><br />
• Window – Tamanho <strong>da</strong> janela (para fora <strong>da</strong> diagonal<br />
procura<strong>da</strong>)<br />
• SCORE – Score mínimo para ser levado em consi<strong>de</strong>ração<br />
• TOPDIAG – Número <strong>de</strong> gran<strong>de</strong>s diagonais<br />
• PAIRGAP – Penali<strong>da</strong><strong>de</strong> <strong>de</strong> intervalo<br />
(mu<strong>de</strong> as opções apenas para tornar alinhamento mais rápido)
Alinhamento múltiplo
Parâmetros do alinhamento<br />
múltiplo<br />
• GAPOPEN (<strong>de</strong>fault 10),<br />
• GAPEND,<br />
• GAPEXT (0,05),<br />
• GAPDIST (8)<br />
• Matrizes<br />
Blosum* – muitos <strong>da</strong>dos sem in<strong>de</strong>l;<br />
PAM – poucos <strong>da</strong>dos com in<strong>de</strong>ls;<br />
Gonnet – muitos <strong>da</strong>dos com in<strong>de</strong>ls;<br />
id – idêntico = 10 e diferente = 0
Alinhamento
Matriz PAM250<br />
= 250 subst. em 100<br />
% dif/ PAM<br />
•1 •1<br />
•10 •11<br />
•20 •23<br />
•30 •38<br />
•40 •56<br />
•50 •80<br />
•60 •112<br />
•70 •159<br />
•80 •246
Matriz Blosom 62
Pressuposições<br />
• To<strong>da</strong>s as seqüências são homólogas,<br />
• Todos os sítios são homólogos,<br />
• Nenhuma transferência horizontal<br />
• Monofiletismo dos taxa terminais<br />
• Posições evoluem in<strong>de</strong>pen<strong>de</strong>ntemente
Dois processos complicadores
Paralogia<br />
Bone Morphogenetic Protein
Tempo <strong>de</strong> duplicação<br />
Vertebrados:<br />
Mioglobina + globina<br />
Mandibulados: Mioglobina + 1<br />
α globina + 1 β globina<br />
Mamíferos: Mioglobina X α<br />
globina + Y β globina<br />
Primatas: possuem também<br />
δ + β<br />
Diferenças no<br />
<strong>de</strong>senvolvimento
Globinas em Humanos
Superfamília <strong>da</strong>s Globinas<br />
Type<br />
alphalike<br />
betalike<br />
Hb<br />
embryonic<br />
Hb<br />
zeta epsilon zzee<br />
fetal Hb alpha gamma aagg<br />
adult Hb alpha beta aabb
Para estudos <strong>de</strong>:<br />
• Famílias gênicas<br />
• Filogenia <strong>de</strong> espécies<br />
• Use cópias parálogas<br />
dos genes em<br />
diferentes espécies<br />
• Use a mesma cópia<br />
ortóloga nas espécies<br />
<strong>da</strong> filogenia
Como saber<br />
• Xenopus tem centenas <strong>de</strong> cópias <strong>de</strong> 18S<br />
• Muitos genes em múltiplas cópias<br />
• Quem são parálogos Quem são<br />
ortólogos
Evolução em concerto
Mecanismo <strong>de</strong> evolução<br />
em concerto<br />
• Crossing over <strong>de</strong>sigual – mu<strong>da</strong> o tamanho<br />
dos fragmentos<br />
• Conversão gênica – não mu<strong>da</strong> o tamanho
Duplicações gênicas<br />
• Evento comum<br />
• Geram genes novos<br />
• Cópia backup do<br />
gene<br />
• Novas funções para o<br />
gene<br />
• Pseudogenes
Como estu<strong>da</strong>r evolução <strong>de</strong><br />
função<br />
• Reconstrução por<br />
probabili<strong>da</strong><strong>de</strong> <strong>de</strong><br />
seqüências ancestrais<br />
• Estu<strong>da</strong>r a biologia do<br />
organismo ancestral<br />
Função<br />
Gen<br />
Proteína<br />
• Induzir mutações através<br />
<strong>de</strong> mutagênese<br />
Estrutura
Evolução <strong>da</strong> enzima rubisco<br />
Delwiche et al. 1996 MBE 13:873
Paralogias não são apenas<br />
complicadores
Atpase<br />
Archea<br />
Catalítica<br />
Eukarya<br />
Bacteria<br />
Archea<br />
Não catalítica<br />
Oto & Honjo 1981<br />
Eukarya<br />
Bacteria
Origem do X<br />
Clark 2003 PNAS
Visão colori<strong>da</strong><br />
• Anfíbios, aves, vêem UV<br />
• Usam para caça, seleção<br />
<strong>de</strong> parceiros, etc.<br />
• Portanto, todos humanos<br />
são <strong>da</strong>ltônicos!<br />
Zhang 2003 PNAS
Visão colori<strong>da</strong><br />
•Os símbolos em preto<br />
significam visão UV<br />
•Os símbolos em azul<br />
indicam visão violeta<br />
•E símbolos abertos<br />
indicam SWS1 gens<br />
não funcionais<br />
•A seta mostra a raiz <strong>da</strong><br />
árvore e o ancestral<br />
comum <strong>de</strong> vertebrados.<br />
• A visão UV/violeta<br />
dos ancestrais foi<br />
inferi<strong>da</strong> por Shi and<br />
Yokoyama<br />
Zhang 2003 PNAS
Filogenia no tribunal<br />
• Médico é processado<br />
por antiga namora<strong>da</strong><br />
por tê-la contaminado<br />
com HIV <strong>de</strong> paciente<br />
• Seqüências do<br />
paciente em roxo<br />
• Seqüências <strong>da</strong> vítima<br />
em rosa<br />
Metzker et al 2002 PNAS
Ilhas Galápagos e filogenias<br />
• Baixa diversi<strong>da</strong><strong>de</strong> <strong>de</strong><br />
tartarugas em uma ilha<br />
(com mesma i<strong>da</strong><strong>de</strong> <strong>de</strong><br />
outras ilhas) do<br />
arquipélago<br />
• Bottleneck que extinguiu<br />
a maior parte <strong>da</strong>s<br />
linhagens <strong>da</strong> época há 88<br />
mil anos<br />
Beheregaray et al. 2003 Science