Filogenia (1) Homología: Correspondencias en biología comparada
Filogenia (1) Homología: Correspondencias en biología comparada
Filogenia (1) Homología: Correspondencias en biología comparada
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Linneo 1735 <strong>Filog<strong>en</strong>ia</strong> (1)<br />
Viernes 9 de mayo, 2008<br />
<strong>Homología</strong>:<br />
<strong>Correspond<strong>en</strong>cias</strong> <strong>en</strong><br />
<strong>biología</strong> <strong>comparada</strong><br />
Criterios de homología<br />
Tres criterios principales de la anatomía <strong>comparada</strong> clásica<br />
Remane, 1952 (Cuvier, … Olivier Rieppel, Rolf Sattler)<br />
1. Posición y topología respecto de otras estructuras<br />
2. Composición interna, detalles estructurales de construcción<br />
3. Formas intermedias <strong>en</strong> otros taxones<br />
Curso de Evolución, UBA – FCEyN, 2007<br />
Martín J. Ramírez<br />
CONICET – Museo Arg<strong>en</strong>tino de Ci<strong>en</strong>cias Naturales<br />
<strong>Homología</strong><br />
Biología <strong>comparada</strong><br />
Las relaciones de homología defin<strong>en</strong> qué se compara con qué<br />
1. Posición y topología<br />
Belon 1555<br />
AAC-G-ACATT<br />
AACTGTATATT<br />
Posición, topología y relaciones espaciales/temporales respecto de<br />
otras estructuras<br />
Posición y topología<br />
interno, externo, anterior, posterior, dorsal, v<strong>en</strong>tral, bilateral, adyac<strong>en</strong>te, fusionado, …<br />
Conexiones con otras estructuras<br />
inervación, irrigación, traqueación, inserciones musculares, …<br />
Relaciones temporales: Ontog<strong>en</strong>ia<br />
desarrollo a partir de, antes que, regulado por g<strong>en</strong>, …
(234) Desarrollo: secu<strong>en</strong>cia temporal y ‘eje primario’<br />
Burke & Feduccia 1997 (Shubin & Alberch 1986)<br />
2. Composición<br />
Cocodrilo (Alligator)<br />
Tortuga (Chelydra)<br />
Pollo (Gallus)<br />
= avestruz, pato, …<br />
Composición interna, detalles estructurales de construcción<br />
Arquitectura, posición y topología de compon<strong>en</strong>tes internos<br />
Histología (tipos celulares, tejidos, matriz extracelular, …)<br />
Órganos y estructuras (pelos, poros, glándulas, ductos, …)<br />
Todos estos detalles son a su vez homólogos. La homología es<br />
usualm<strong>en</strong>te anidada, recursiva: partes, de partes, de partes…<br />
(123) Formas intermedias<br />
<strong>Homología</strong> <strong>en</strong>tre dígitos de la mano de aves y otros tetrápodos (123)<br />
2-3-4-1-0<br />
Herrerasaurus<br />
2-3-4-3-2<br />
Heterodontosaurus<br />
2-3-4-2-3<br />
Aligator<br />
2-3-4-1-x<br />
Coelophysis<br />
Chatterjee 1998 (Ser<strong>en</strong>o 1999, Xu & Norell 2004, …)<br />
Theropoda<br />
2-3-4-x-x<br />
Allosaurus<br />
2-3-4-x-x<br />
Deinonychus<br />
2-3-4-x-x<br />
Archaeopteryx<br />
Aves<br />
1-2-1-x-x<br />
Gallus<br />
(234) Desarrollo: cond<strong>en</strong>saciones pre-condrogénicas<br />
Pollo (Gallus)<br />
Cond<strong>en</strong>saciones de células<br />
mes<strong>en</strong>quimáticas<br />
Patrón p<strong>en</strong>tadáctilo.<br />
Larsson <strong>en</strong> Wagner 2005<br />
Kundrát 2001 (tinta china, regresión de capilares)<br />
Larsson & Wagner 2002 (aglutinina, marcador de células <strong>en</strong> cond<strong>en</strong>sación)<br />
Welt<strong>en</strong> et al 2005 (hibridización in situ, factor de transcripción Sox9, se expresa <strong>en</strong><br />
cond<strong>en</strong>saciones pre-condrogénicas)<br />
3. Formas intermedias<br />
Formas intermedias <strong>en</strong> otros taxones<br />
Welt<strong>en</strong> et al. 2005<br />
Este criterio es un poco distinto: refiere más explícitam<strong>en</strong>te a información filog<strong>en</strong>ética<br />
previa<br />
Las formas intermedias pued<strong>en</strong> estar tanto <strong>en</strong> especies fósiles como actuales<br />
Formas intermedias fósiles<br />
Deinonychosauria<br />
Microraptor<br />
Fotos Diego Pol<br />
Archaeopteryx<br />
Aves<br />
Confuciusornis
Intermedios filog<strong>en</strong>éticam<strong>en</strong>te plausibles<br />
Alligator Chelydra<br />
Gallus<br />
Este NO es un intermedio plausible<br />
Secu<strong>en</strong>cias: Inserciones y deleciones<br />
Crocuta_crocuta GTAAATGCT<br />
Galidia_elegans GTAAATGCT<br />
Profelis_aurata GTAAATGCT<br />
Pardofelis_badia GTAAATGCT<br />
Prionailurus_b<strong>en</strong>gal<strong>en</strong>sis GTAAGCATGCT<br />
Lynx_canad<strong>en</strong>sis GTAAATGCT<br />
Caracal_caracal GTAAATGCT<br />
Tortugas<br />
‘Lagartos’,<br />
ofidios<br />
Mamíferos<br />
Cocodrilos<br />
Dinosaurios,<br />
Aves<br />
Crocuta_crocuta GTAA--ATGCT<br />
Galidia_elegans GTAA--ATGCT<br />
Profelis_aurata GTAA--ATGCT<br />
Pardofelis_badia GTAA--ATGCT<br />
Prionailurus_b<strong>en</strong>gal<strong>en</strong>sis GTAAGCATGCT<br />
Lynx_canad<strong>en</strong>sis GTAA--ATGCT<br />
Caracal_caracal GTAA--ATGCT<br />
Conflicto <strong>en</strong>tre ‘criterios’ de homología<br />
Puede haber conflictos d<strong>en</strong>tro de cada criterio, cuando distintos<br />
elem<strong>en</strong>tos sugier<strong>en</strong> homologías difer<strong>en</strong>tes. Por ejemplo,<br />
irrigación vs. inervación<br />
inserción de un músculo vs. de otro músculo<br />
orig<strong>en</strong> embrionario vs. anatomía del adulto<br />
orig<strong>en</strong> embrionario vs. g<strong>en</strong>es reguladores<br />
g<strong>en</strong>es reguladores vs. otros g<strong>en</strong>es reguladores<br />
Conflictos <strong>en</strong>tre criterios<br />
posición vs. estructura interna<br />
orig<strong>en</strong> embrionario vs. estructura interna<br />
intermedios vs. desarrollo<br />
(Aunque <strong>en</strong> realidad los criterios no están perfectam<strong>en</strong>te delimitados uno de otro)<br />
Pregunta: Conoc<strong>en</strong> ev<strong>en</strong>tos evolutivos que provoqu<strong>en</strong> incongru<strong>en</strong>cias <strong>en</strong>tre posición y<br />
composición?<br />
<strong>Homología</strong> serial y homeosis<br />
<strong>Homología</strong> serial<br />
Estructuras repetidas (segm<strong>en</strong>tos, módulos, dedos, di<strong>en</strong>tes, …)<br />
Moldeadas por programas de desarrollo con elem<strong>en</strong>tos<br />
repetidos (patterning, gradi<strong>en</strong>tes, umbrales, …)<br />
Homeosis: Expresión ectópica (viola el criterio posicional)<br />
Los casos de homeosis ocurr<strong>en</strong> <strong>en</strong> estructuras seriales o modulares<br />
(dedos, di<strong>en</strong>tes, somitos, apéndices, hojas, flores, …)<br />
La <strong>en</strong>orme mayoría de las homologías no requier<strong>en</strong> invocar cambios<br />
homeóticos (y se necesitan muchos experim<strong>en</strong>tos para demostrarlos)<br />
Halterios <strong>en</strong> Strepsiptera y Diptera Un caso de morfogénesis e individuación indep<strong>en</strong>di<strong>en</strong>tes<br />
Burke et al. 1995<br />
1ro: Morfogénesis, patrón de distribución (patterning)<br />
2do: Individuación por grupos de g<strong>en</strong>es Hox (<strong>en</strong> color)
123 sobre 234: hipótesis de desplazami<strong>en</strong>to de marco<br />
Mano de ratón<br />
Pie de pollo<br />
Dedo 1: HoxD13<br />
día 7 día 8<br />
Vargas & Fallon 2005; Wagner & Gauthier 1999<br />
Dedos 2-5: HoxD13 + HoxD12<br />
Mano de pollo<br />
<strong>Correspond<strong>en</strong>cias</strong> y ancestros hipotéticos<br />
Alligator Gallus<br />
<strong>Homología</strong> primaria y secundaria<br />
A<br />
Crocuta_crocuta GTA A AAA-T-GCTTTTATATT-CAA-GTAGGACGACAAGAC<br />
Galidia_elegans GTA A AAA-T-TCTTTTTTTTTAAAA-AAAAGACGATAAGAC<br />
Profelis_aurata GTA A AAA-T-ACTTTTCAATC-TCA-GAGGGACGACAAGAC<br />
Pardofelis_badia GTA T AAA-G-ACTTTTATAAA-AAA-GAAAGACGACAAGAC<br />
Prionailurus_b<strong>en</strong>gal<strong>en</strong>sis GTA T AAA-G-GCTACTATCGC-AAG-GA-AGACGACAAGAC<br />
Lynx_canad<strong>en</strong>sis GTA T AAA-G-GCTTATATAAC-CCG-GATGGACGACAAGAC<br />
A<br />
A T<br />
T<br />
T<br />
T<br />
A<br />
A<br />
T<br />
T<br />
T<br />
T A<br />
A<br />
HoxD13 + HoxD12<br />
HoxD13<br />
2<br />
1 3 4 5<br />
1ro. patterning, 2do. individuación<br />
Estas A parecían homólogas, pero el árbol que obt<strong>en</strong>emos<br />
nos dice que son converg<strong>en</strong>tes<br />
De Pinna 1991<br />
<strong>Homología</strong> primaria o pot<strong>en</strong>cial: Misma posición, misma<br />
estructura. Es un dato para filog<strong>en</strong>ia<br />
<strong>Homología</strong> secundaria: Mismo orig<strong>en</strong>. Es una explicación<br />
de la similitud, provista por la hipótesis filog<strong>en</strong>ética<br />
1<br />
2<br />
3<br />
<strong>Homología</strong> explicada:<br />
ancestralidad<br />
<strong>Homología</strong> sobre un árbol<br />
AAA T ATGTT AAA A CCATT<br />
AAA T ATATT<br />
AAA T ATATT<br />
Caracteres<br />
AAATA ATATT<br />
AAA T ATATT<br />
AAA T ATATT<br />
AAATGTATATT AAATATATACT<br />
AAATATATATT<br />
AAATA ATATT<br />
AAA-T-ATATT<br />
|||||||||||<br />
AAA-T-ATGTT<br />
|||||||||||<br />
AAA-A-CCATT<br />
|||||||||||<br />
AAATA-ATATT<br />
|||||||||||<br />
AAATGTATATT<br />
|||||||||||<br />
AAATATATACT
Caracteres y estados<br />
Carácter: Hipótesis de transformación evolutiva. Ejemplos,<br />
Morfológico “Plumas: Aus<strong>en</strong>tes o Pres<strong>en</strong>tes”<br />
Molecular “COI, sitio 124: A, C, G, o T”<br />
Comportam<strong>en</strong>tal “Canto nupcial: Bajo o agudo”<br />
carácter: estados<br />
Un carácter expresa una transformación evolutiva, aunque no se sepa cuándo<br />
ocurrió, ni cuántas veces, ni <strong>en</strong> qué s<strong>en</strong>tido<br />
Transformación evolutiva – <strong>en</strong>tre condiciones de estructuras homólogas:<br />
carácter homólogo <strong>en</strong> tanto que<br />
Plumas (vs. escamas, pelos): estructuras tegum<strong>en</strong>tarias<br />
COI, sitio 124: sitio 124 alineado<br />
Canto nupcial: vocalización específica durante el apareami<strong>en</strong>to<br />
Notación usual<br />
Estados numerados<br />
Plumas: (0) Aus<strong>en</strong>tes; (1) Pres<strong>en</strong>tes<br />
En la matriz de datos:<br />
Bufo 0<br />
Alligator 0<br />
Microrraptor 1<br />
Gallus 1<br />
Secu<strong>en</strong>cias Morfología<br />
Morfología<br />
Ser<strong>en</strong>o 1999<br />
Theropoda<br />
Aves<br />
Se suele utilizar “0” para el estado primitivo (cuando se sabe cuál es).<br />
Los símbolos (0, 1, …) son arbitrarios, pero esta conv<strong>en</strong>ción suele ayudar a leer /<br />
mant<strong>en</strong>er / corregir la matriz<br />
Morfología<br />
Uña inferior<br />
0. Pres<strong>en</strong>te<br />
1. Vestigial o aus<strong>en</strong>te
Morfología<br />
Fúsulas piriformes<br />
0. Pequeñas, finas<br />
1. Muy grandes, aplanadas<br />
Morfología (ultraestructura), ...<br />
Uniones gap: 0. Aus<strong>en</strong>te. 1. Pres<strong>en</strong>te<br />
Uniones tight: 0. Aus<strong>en</strong>te. 1. Pres<strong>en</strong>te<br />
Desmosomas: 0. Aus<strong>en</strong>te. 1. Pres<strong>en</strong>te<br />
Colág<strong>en</strong>o: 0. Aus<strong>en</strong>te. 1. Pres<strong>en</strong>te<br />
G<strong>en</strong>oma mitocondrial: 0. Circular. 1. Lineal<br />
Rutas metabólicas<br />
Patrones de desarrollo<br />
Tejidos<br />
…<br />
Comportami<strong>en</strong>to<br />
Movimi<strong>en</strong>tos estereotipados de peinado de seda<br />
0. Tipo I (apoyando sobre pata III)<br />
1. Tipo II (apoyando sobre pata IV, se muev<strong>en</strong> <strong>en</strong> conjunto)<br />
Caracteres de hileras de arañas<br />
Comportami<strong>en</strong>to<br />
Comportami<strong>en</strong>to
Comportami<strong>en</strong>to<br />
Coddington 1986<br />
Todo lo que haya<br />
Secu<strong>en</strong>cias y morfología<br />
Sistemática Filog<strong>en</strong>ética Sinapomorfías<br />
H<strong>en</strong>nig 1950<br />
1.Clasificación filog<strong>en</strong>ética<br />
Los grupos taxonómicos reflejan<br />
el árbol filog<strong>en</strong>ético<br />
Reconstrucción de<br />
filog<strong>en</strong>ias<br />
“Plumas: (0) Aus<strong>en</strong>tes; (1) Pres<strong>en</strong>tes”<br />
La pres<strong>en</strong>cia de plumas, apoya la monofilia de las aves?<br />
La aus<strong>en</strong>cia de plumas, apoya la monofilia de los reptiles?<br />
2. Solam<strong>en</strong>te las similitudes <strong>en</strong> estados derivados (apomorfías) son evid<strong>en</strong>cia de<br />
par<strong>en</strong>tesco<br />
Un árbol con aves monofiléticas permite explicar la pres<strong>en</strong>cia de plumas <strong>en</strong> todas las aves<br />
como heredadas de un ancestro común.<br />
El grupo monofilético Aves explica la distribución de plumas ↔ las plumas son evid<strong>en</strong>cia<br />
<strong>en</strong> favor del grupo Aves. Son una sinapomorfía (= apomorfía compartida).<br />
Cualquier otro árbol obliga a p<strong>en</strong>sar que las plumas aparecieron más de una vez<br />
(converg<strong>en</strong>cia), o que aparecieron y luego se perdieron (reversión). Impone<br />
homoplasia.<br />
Cómo se explica la aus<strong>en</strong>cia de plumas <strong>en</strong> ‘reptiles’?<br />
Es una plesiomorfía (= condición primitiva), heredada del ancestro común de ‘reptiles’ +<br />
Aves + … No necesita un grupo monofilético ‘reptiles’ para ser explicada.
Grupos monofiléticos<br />
Grupos monofiléticos<br />
Un ancestro y todos sus desc<strong>en</strong>di<strong>en</strong>tes.<br />
Definidos por sinapomorfías<br />
Grupos naturales (reflejan un proceso natural: la evolución)<br />
Grupos polifiléticos<br />
Grupos polifiléticos<br />
Ti<strong>en</strong><strong>en</strong> ancestros separados<br />
Definidos por converg<strong>en</strong>cias<br />
Ejemplos<br />
‘Homeotermos’ (aves + mamíferos)<br />
Árboles y matrices<br />
filog<strong>en</strong>éticas<br />
A B C D E F<br />
A B C D E F<br />
Grupos parafiléticos<br />
Grupos parafiléticos<br />
Un ancestro, pero no todos sus desc<strong>en</strong>di<strong>en</strong>tes.<br />
Usualm<strong>en</strong>te definidos por plesiomorfías<br />
Ejemplos<br />
‘Reptiles’<br />
‘Invertebrados’<br />
‘Criptógamas’<br />
‘Protozoos’<br />
‘Apterygota’ (insectos ápteros)<br />
Curiosidad histórica<br />
Davis 1938<br />
Árboles filog<strong>en</strong>éticos: Cuándo ti<strong>en</strong>e s<strong>en</strong>tido<br />
Características heredables<br />
Estructuras homólogas<br />
Historia única<br />
Transfer<strong>en</strong>cia vertical<br />
Sin reticulación<br />
A B C D E F
Árboles filog<strong>en</strong>éticos: Cuándo no ti<strong>en</strong>e s<strong>en</strong>tido<br />
A. Características no heredables<br />
B. No hay un árbol único<br />
Coevolución / Biogeografía histórica / Parásitos <strong>en</strong> hospedadores<br />
Transfer<strong>en</strong>cia horizontal<br />
Hibridación<br />
G<strong>en</strong>es parálogos<br />
Este tipo de datos no ortodoxos puede integrarse <strong>en</strong> un análisis filog<strong>en</strong>ético, pero<br />
requiere trabajo adicional<br />
• Mapeando sobre filog<strong>en</strong>ias, etc.<br />
• Con algoritmos especiales que tom<strong>en</strong> <strong>en</strong> cu<strong>en</strong>ta los ev<strong>en</strong>tos específicos (de<br />
hibridación, duplicación, extinción, transfer<strong>en</strong>cia horizontal, etc.)<br />
Terminología: grupos hermanos<br />
A B C D E F<br />
A B C D E F<br />
Grupos que se originan <strong>en</strong> un mismo nodo<br />
A grupo hermano de (BCDEF)<br />
(BC) grupo hermano de (DEF)<br />
B grupo hermano de C<br />
Terminología: Matriz de datos<br />
Arbol dicotómico o totalm<strong>en</strong>te resuelto: Todos los<br />
nodos dan orig<strong>en</strong> a dos desc<strong>en</strong>di<strong>en</strong>tes<br />
Politomía: Un nodo da orig<strong>en</strong> a más de dos<br />
desc<strong>en</strong>di<strong>en</strong>tes (= rama interna de largo cero; = nodos<br />
internos colapsados)<br />
Hypochilus 000-0-000000000000001000000000000000<br />
Gradungula 000-0-0010000011000000000---01000100<br />
Thaida 000-0-001000011101000000010101000100<br />
Hickmania 000-0-001000010000000000010101000100<br />
Filistata 010-1-000200000000000000020000000000<br />
Kukulcania 010-1-000200000000000000020000000000<br />
Ariadna 000-0-0102000000001000000---00000000<br />
Polistes fuscatus CCTGAGAAACGGCTACCACATCTAAGGAAGGCAGCAGGCGCGC<br />
Monobia quadrid<strong>en</strong>s CCTGAGAAACGGCTACCACATCTAAGGAAGGCAGCAGGCGCGC<br />
Apoica sp. CCTGAGAAACGGCTACCACATCTAAGGAAGGCAGCAGGCGCGC<br />
Dasymutilla gloriosa CCTGAGAAACGGCTACCACATCCAAGGAAGGCAGCAGGCGCGC<br />
Priocnemus oregana CCTGAGAAACGGCTACCACATCCAAGGAAGGCAGCAGGCGCGC<br />
Epyris sepulchralis CCTGAGAAACGGCTACCACATCCAAGGAAGGCAGCAGGCGCGC<br />
Ca<strong>en</strong>ochrysis doriae CCTGAGAAACGGCTACCACATCCAAGGAAGGCAGCAGGCGCGC<br />
Terminales<br />
Caracteres<br />
Los terminales son usualm<strong>en</strong>te especies: repres<strong>en</strong>tantes más reales, mejor<br />
docum<strong>en</strong>tados.<br />
Cada vez más raro <strong>en</strong>contrar terminales compuestos (o bauplans; géneros, familias, …).<br />
Pregunta: Si un terminal compuesto fuera internam<strong>en</strong>te variable, cómo codificarían sus<br />
caracteres?<br />
Terminología: nodos, raíz y terminales<br />
nodos<br />
(= ancestros hipotéticos)<br />
nodo raíz<br />
A<br />
C<br />
A<br />
T<br />
G<br />
T<br />
Terminología: árboles y redes<br />
raíz<br />
Árbol <strong>en</strong>raizado<br />
A<br />
C<br />
A<br />
T<br />
G<br />
T<br />
Parsimonia<br />
terminales (= observaciones)<br />
Para n terminales,<br />
Con raíz<br />
n – 1 nodos internos<br />
Sin raíz<br />
n – 2 nodos internos<br />
A<br />
C<br />
A<br />
T<br />
G<br />
T<br />
A<br />
A<br />
T<br />
C<br />
T<br />
C<br />
A<br />
T<br />
G<br />
A<br />
T<br />
G<br />
Árbol no <strong>en</strong>raizado (red, network)<br />
A<br />
C<br />
A<br />
T<br />
G<br />
T
Parsimonia: Estados y ev<strong>en</strong>tos sobre árboles<br />
Crocuta_crocuta GTA A AAA-T-GCTTTTATATT-CAA-GTAGGACGACAAGAC<br />
Galidia_elegans GTA A AAA-T-TCTTTTTTTTTAAAA-AAAAGACGATAAGAC<br />
Profelis_aurata GTA A AAA-T-ACTTTTCAATC-TCA-GAGGGACGACAAGAC<br />
Pardofelis_badia GTA T AAA-G-ACTTTTATAAA-AAA-GAAAGACGACAAGAC<br />
Prionailurus_b<strong>en</strong>gal<strong>en</strong>sis GTA T AAA-G-GCTACTATCGC-AAG-GA-AGACGACAAGAC<br />
Lynx_canad<strong>en</strong>sis GTA T AAA-G-GCTTATATAAC-CCG-GATGGACGACAAGAC<br />
árbol candidato 1 árbol candidato 2<br />
A<br />
A<br />
A A<br />
A<br />
A<br />
A<br />
A T<br />
T<br />
T<br />
A<br />
T<br />
T<br />
T<br />
A<br />
A<br />
A<br />
T<br />
T<br />
T<br />
T<br />
T<br />
A<br />
T<br />
T<br />
T<br />
A<br />
largo 1 = 1<br />
largo 2 = 2<br />
árbol candidato 3<br />
A<br />
A<br />
A<br />
A<br />
A T<br />
T<br />
T<br />
A T<br />
T<br />
T T<br />
T A<br />
A<br />
largo 3 = 3<br />
Requerimi<strong>en</strong>tos (o asunciones) <strong>en</strong> un análisis bajo<br />
parsimonia<br />
1. Los caracteres son heredables<br />
2. La transfer<strong>en</strong>cia es estrictam<strong>en</strong>te vertical<br />
3. La homología está resuelta a priori<br />
4. Los caracteres son indep<strong>en</strong>di<strong>en</strong>tes<br />
5. Los costos de transformación están resueltos a priori<br />
Dos problemas peliagudos<br />
1. Optimización: Para cada carácter, contar los pasos sobre un<br />
árbol dado (reconstrucción óptima)<br />
2. Búsqueda: Entre todos los árboles posibles, <strong>en</strong>contrar el de<br />
m<strong>en</strong>or costo (árbol óptimo)<br />
Costo del árbol<br />
Crocuta_crocuta GTA A AAA-T-GCTTTTATATT-CAA-GTAGGACGACAAGAC<br />
Galidia_elegans GTA A AAA-T-TCTTTTTTTTTAAAA-AAAAGACGATAAGAC<br />
Profelis_aurata GTA A AAA-T-ACTTTTCAATC-TCA-GAGGGACGACAAGAC<br />
Pardofelis_badia GTA T AAA-G-ACTTTTATAAA-AAA-GAAAGACGACAAGAC<br />
Prionailurus_b<strong>en</strong>gal<strong>en</strong>sis GTA T AAA-G-GCTACTATCGC-AAG-GA-AGACGACAAGAC<br />
Lynx_canad<strong>en</strong>sis GTA T AAA-G-GCTTATATAAC-CCG-GATGGACGACAAGAC<br />
1 n<br />
Costo o largo del árbol = suma de pasos sobre todos los caracteres<br />
L =<br />
La idea es <strong>en</strong>contrar el árbol de m<strong>en</strong>or costo (mejor ajuste)<br />
l i<br />
La idea de parsimonia es maximizar la similitud explicada como homología. Lo hace de<br />
manera indirecta, minimizando intancias de homoplasia (converg<strong>en</strong>cias y reversiones)<br />
Cosas que no son caracteres<br />
No heredables<br />
Caracteres determinados por el ambi<strong>en</strong>te<br />
No homólogos<br />
Similitud superficial<br />
No indep<strong>en</strong>di<strong>en</strong>tes<br />
Dep<strong>en</strong>d<strong>en</strong>cia lógica (estados alternativos expresados como pres / aus)<br />
Dep<strong>en</strong>d<strong>en</strong>cia funcional estricta (cad<strong>en</strong>as complem<strong>en</strong>tarias de ADN)<br />
Características extrínsecas<br />
Distribución geográfica<br />
Parásitos y otras asociaciones<br />
Estratigrafía<br />
Estos datos no ortodoxos podrían ser utilizados, pero necesitan<br />
tratami<strong>en</strong>to especial (y costos definidos)<br />
Optimización
Reconstrucciones ancestrales<br />
Reconstrucción 1<br />
A<br />
Reconstrucción 2<br />
A<br />
Reconstrucción 3<br />
A<br />
C<br />
C<br />
C<br />
A A<br />
C A<br />
C A<br />
A<br />
A<br />
T<br />
T<br />
T<br />
G<br />
T<br />
C<br />
C<br />
T<br />
T<br />
T<br />
G<br />
T<br />
A<br />
C<br />
T<br />
G<br />
T<br />
G<br />
T<br />
L = 3 L = 4 L = 5<br />
Optimización: Asignar estados ancestrales <strong>en</strong> los nodos, con la<br />
m<strong>en</strong>or cantidad posible de transformaciones (= m<strong>en</strong>or costo)<br />
Para cuatro estados y (n–2) nodos,<br />
4 (n–2) reconstrucciones posibles<br />
Matrices de costos<br />
desde<br />
0<br />
1<br />
hacia<br />
0 1<br />
0 1<br />
1<br />
0<br />
Binaria<br />
Optimización de Fitch (1971)<br />
Optimización de Fitch<br />
desde<br />
Sin <strong>en</strong>trar <strong>en</strong> los detalles del algoritmo!<br />
hacia<br />
0 1 2 3<br />
0 0 1 1 1<br />
1 1 0 1 1<br />
2 1 1 0 1<br />
3 1 1 1 0<br />
Multiestado no<br />
ord<strong>en</strong>ada<br />
Para caracteres no ord<strong>en</strong>ados (dos o más estados)<br />
1. Pasada hacia abajo<br />
Estados preliminares<br />
{SD1 } {SD2 }<br />
Si hay estados <strong>en</strong> común: Intersección<br />
Si no: Unión (+ 1 paso)<br />
Nodo raíz queda con estados definitivos<br />
2. Pasada hacia arriba<br />
{SN }<br />
Estados definitivos. La regla es un poco más compleja, pero de todos modos veloz.<br />
Pasada hacia arriba (N, nodo a evaluar, S estado preliminar, S’ final, D desc<strong>en</strong>di<strong>en</strong>te,<br />
A ancestro ):<br />
si SA ∩ SN = SA ⇒ S’ N = SA si no<br />
si SD1 ∩ SD2 = 0 ⇒ S’ N = SN ∪ SA si no<br />
{SD1 } {SD2 }<br />
{SN }<br />
S’ N = SN ∪ [SA ∩ (SD1 ∪ SD2 )]<br />
{SA }<br />
Matriz de costos: Cuánto cuesta cada ev<strong>en</strong>to<br />
desde<br />
2.5<br />
A<br />
C<br />
2.5<br />
A<br />
1<br />
1<br />
2.5<br />
C<br />
G<br />
T<br />
hacia<br />
2.5<br />
G<br />
T<br />
A 0 2.5 1 2.5<br />
C 2.5 0 2.5 1<br />
G 1 2.5 0 2.5<br />
T 2.5 1 2.5 0<br />
Matrices de costos<br />
desde<br />
desde<br />
A<br />
C<br />
G<br />
T<br />
A<br />
hacia<br />
C G<br />
T<br />
0 5 2 5<br />
0 5 2<br />
0 5<br />
0<br />
Se especifican todos los cambios<br />
posibles, y se les asigna un costo<br />
=<br />
desde<br />
desde<br />
hacia<br />
A C G T<br />
A 0 5 2 5<br />
C 5 0 5 2<br />
G 2 5 0 5<br />
T 5 2 5 0<br />
hacia<br />
A C G T<br />
0 5.1 2.3 6.4<br />
0 8.1 1.5<br />
0 4<br />
0<br />
tv : tr = 5 : 2 6 parámetros<br />
A C G T -<br />
A 0 2 1 2 2<br />
C 0 2 1 2<br />
G<br />
0 2 2<br />
T<br />
0 2 tv : tr : indel = 2 : 1 : 2<br />
-<br />
0<br />
Optimización de Fitch<br />
A B C D E F<br />
Sin <strong>en</strong>trar <strong>en</strong> los detalles del algoritmo, el problema global se descompone <strong>en</strong> una<br />
serie de pequeños problemas locales.<br />
Logra una solución lineal para un problema expon<strong>en</strong>cial:<br />
2n – 3 cálculos (hacia abajo: n-1 + hacia arriba: n-2)<br />
A<br />
C<br />
G<br />
T
Grupos externos y<br />
<strong>en</strong>raizami<strong>en</strong>to<br />
‘Ingroup’ / ‘outgroup’ (‘grupo externo’ / ‘interno’)<br />
Cocodrilo<br />
Ave 1<br />
Cocodrilo<br />
Ave 1<br />
Ave 2<br />
Ave 3<br />
…<br />
Matriz de datos<br />
Ave 2<br />
Ave 3<br />
Ave n<br />
…<br />
Ave n<br />
¿Este resultado apoya la monofilia de las aves?<br />
Múltiples grupos externos<br />
0<br />
‘outgroups’ ‘ingroup’<br />
100 200 300<br />
400 500 600 675<br />
Enraizami<strong>en</strong>to<br />
tiempo<br />
A<br />
A<br />
A T<br />
A<br />
A T<br />
A<br />
T T<br />
A<br />
T T<br />
T<br />
A<br />
A<br />
A<br />
T<br />
T<br />
T<br />
A<br />
A<br />
A<br />
T<br />
T<br />
T<br />
Re<strong>en</strong>raizar un árbol no cambia<br />
• Las asignaciones ancestrales<br />
• Ni el largo del árbol<br />
• Ni los cambios sobre las ramas<br />
• – Cambia el s<strong>en</strong>tido de algunas<br />
transformaciones<br />
La posición de la raíz es información<br />
filog<strong>en</strong>ética que se justifica fuera del análisis<br />
Excepción<br />
Caracteres con costos asimétricos<br />
Diseño del análisis: grupos externos<br />
Múltiples grupos externos<br />
Al m<strong>en</strong>os uno sufici<strong>en</strong>tem<strong>en</strong>te alejado como para garantizar que esté fuera del<br />
grupo de interés<br />
Algunos sufici<strong>en</strong>tem<strong>en</strong>te cercanos como para poner <strong>en</strong> duda la monofilia del<br />
grupo de interés<br />
Muestreo de repres<strong>en</strong>tantes<br />
Diversidad taxonómica<br />
Diversidad <strong>en</strong> los caracteres bajo estudio<br />
T<br />
A<br />
T<br />
T<br />
T<br />
A<br />
A<br />
A<br />
Pragmático: Taxones de interés especial, disponibilidad de especím<strong>en</strong>es, …<br />
Clasificación
Linneo 1735<br />
Una clasificación<br />
jerárquica<br />
Wilkins 1668<br />
“Una clasificación de<br />
toda clase de cosas y<br />
nociones”<br />
El árbol de Porfirio<br />
No solam<strong>en</strong>te para seres<br />
vivos…<br />
No necesariam<strong>en</strong>te jerárquicas…
Darwin 1859<br />
Explicación de<br />
similitudes y jerarquías<br />
mediante una teoría de<br />
modificación y<br />
transmisión<br />
Méritos que pued<strong>en</strong> t<strong>en</strong>er las clasificaciones<br />
Naturales<br />
Que reflej<strong>en</strong> un proceso natural.<br />
Sistemática filog<strong>en</strong>ética: Evolución.<br />
Árbol evolutivo: Sistema jerárquico.<br />
Predictivas<br />
Que sean útiles para la infer<strong>en</strong>cia de nuevos conocimi<strong>en</strong>tos<br />
Pert<strong>en</strong><strong>en</strong>cia a un grupo taxonómico hace esperar muchas características (heredadas del<br />
ancestro común)<br />
Compactas, efici<strong>en</strong>tes<br />
Que minimic<strong>en</strong> la redundancia<br />
Diagnosis efici<strong>en</strong>te: Unas pocas características bastan para detectar pert<strong>en</strong><strong>en</strong>cia a grupos<br />
Que los grupos taxonómicos sirvan para transmitir el máximo de información<br />
Parsimonia: Minimización de hipótesis ad-hoc<br />
Haeckel 1866<br />
(Estables)<br />
Las hipótesis ci<strong>en</strong>tíficas cambian a medida que avanza el conocimi<strong>en</strong>to, pero uno espera<br />
que la acumulación de datos contribuya progresivam<strong>en</strong>te a la estabilidad de las hipótesis.<br />
Docum<strong>en</strong>tadas<br />
Materiales claram<strong>en</strong>te id<strong>en</strong>tificados y públicam<strong>en</strong>te accesibles<br />
Códigos Internacionales de Nom<strong>en</strong>clatura (Zoológica, Botánica, Bacterias, Virus)<br />
Especím<strong>en</strong>es de refer<strong>en</strong>cia: Tipos<br />
Literatura y autoridad: Descripciones, diagnosis, actos nom<strong>en</strong>clatoriales<br />
Docum<strong>en</strong>tación de análisis filog<strong>en</strong>éticos<br />
Ilustraciones, descripciones<br />
Vouchers, metadatos<br />
Repositorios internacionales: G<strong>en</strong>Bank, MorphBank<br />
Docum<strong>en</strong>tación Para qué se usan los árboles filog<strong>en</strong>éticos?
Taxonomía Taxonomía<br />
Orig<strong>en</strong> y evolución de morfología, … Orig<strong>en</strong> y evolución de morfología, moléculas, …<br />
Orig<strong>en</strong> y evolución de morfología, moléculas, … Comportami<strong>en</strong>to, …
G<strong>en</strong>omas, … Ecología, …<br />
Biogeografía, … Biogeografía, …<br />
Desarrollo, … Desarrollo, …<br />
Burke & Feduccia 1997 (Shubin & Alberch 1986)<br />
Cocodrilo (Alligator)<br />
Tortuga (Chelydra)<br />
Pollo (Gallus)<br />
= avestruz, pato, …
Dimorfismo sexual, … Coevolución, …<br />
Tiempo, …<br />
1. Optimización: Para cada carácter, contar los pasos sobre un<br />
árbol dado (reconstrucción óptima)<br />
2. Búsqueda: Entre todos los árboles posibles, <strong>en</strong>contrar el de<br />
m<strong>en</strong>or costo (árbol óptimo)<br />
<strong>Filog<strong>en</strong>ia</strong> (2)<br />
Miércoles 14 de mayo, 2008<br />
2. Búsquedas<br />
n terminales<br />
árboles<br />
n Número de árboles<br />
3 3<br />
4 15<br />
5 105<br />
6 945<br />
7 10,395<br />
8 135,135<br />
9 2,027,025<br />
10 34,459,425<br />
11 654,729,075<br />
12 13,749,310,575<br />
13 316,234,143,225<br />
14 7,905,853,580,625<br />
15 213,458,046,676,875<br />
16 6,190,283,353,629,370<br />
17 191,898,783,962,511,000<br />
18 6,332,659,870,762,850,000<br />
19 221,643,095,476,700,000,000<br />
20 8,200,794,532,637,890,000,000<br />
21 319,830,986,772,878,000,000,000<br />
22 13,113,070,457,688,000,000,000,000<br />
23 563,862,029,680,583,000,000,000,000<br />
24 25,373,791,335,626,300,000,000,000,000<br />
25 1,192,568,192,774,430,000,000,000,000,000<br />
26 58,435,841,445,947,300,000,000,000,000,000<br />
27 2,980,227,913,743,310,000,000,000,000,000,000<br />
28 157,952,079,428,395,000,000,000,000,000,000,000<br />
29 8,687,364,368,561,750,000,000,000,000,000,000,000<br />
30 495,179,769,008,020,000,000,000,000,000,000,000,000<br />
31 29,215,606,371,473,200,000,000,000,000,000,000,000,000<br />
32 1,782,151,988,659,860,000,000,000,000,000,000,000,000,000<br />
33 112,275,575,285,571,000,000,000,000,000,000,000,000,000,000<br />
34 7,297,912,393,562,140,000,000,000,000,000,000,000,000,000,000<br />
35 488,960,130,368,663,000,000,000,000,000,000,000,000,000,000,000<br />
36 33,738,248,995,437,800,000,000,000,000,000,000,000,000,000,000,000<br />
37 2,395,415,678,676,080,000,000,000,000,000,000,000,000,000,000,000,000<br />
38 174,865,344,543,354,000,000,000,000,000,000,000,000,000,000,000,000,000<br />
39 13,114,900,840,751,500,000,000,000,000,000,000,000,000,000,000,000,000,000<br />
40 1,009,847,364,737,870,000,000,000,000,000,000,000,000,000,000,000,000,000,000<br />
41 79,777,941,814,291,700,000,000,000,000,000,000,000,000,000,000,000,000,000,000<br />
42 6,462,013,286,957,630,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000<br />
43 536,347,102,817,483,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000<br />
44 45,589,503,739,486,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000<br />
45 3,966,286,825,335,290,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000<br />
46 352,999,527,454,840,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000<br />
47 32,122,956,998,390,500,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000<br />
48 2,987,435,000,850,310,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000<br />
49 283,806,325,080,780,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000<br />
50 27,529,213,532,835,600,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000<br />
n<br />
árboles<br />
50 10 76<br />
100 10 184<br />
150 10 304
Complejidad<br />
Número de árboles <strong>en</strong>raizados (T r ) para n terminales<br />
T r = (2n-3)! / (2 n-2 (n-2)!)<br />
El número de soluciones posibles es factorial (es peor que expon<strong>en</strong>cial): <strong>en</strong> escala<br />
logarítmica, crece más que linealm<strong>en</strong>te.<br />
Problema NP-hard (NP: Non-deterministic Polinomial time)<br />
No se conoc<strong>en</strong> soluciones polinomiales (p. ej., “4n 3 + 6n 2 + 2n + 1”).<br />
Una solución expon<strong>en</strong>cial (“e n ”), con n sufici<strong>en</strong>tem<strong>en</strong>te grande será peor que una polinomial.<br />
Pero, mediante algoritmos refinados, podríamos hacer que e sea muy pequeño!<br />
Tiempo de procesami<strong>en</strong>to peor que expon<strong>en</strong>cial <strong>en</strong> número de terminales<br />
Para n más que modestos, las búsquedas son heurísticas<br />
Pregunta<br />
¿Cómo será el tiempo de procesami<strong>en</strong>to <strong>en</strong> función del número de caracteres?<br />
Estrategias heurísticas<br />
de búsqueda<br />
1. Múltiples puntos de partida indep<strong>en</strong>di<strong>en</strong>tes<br />
óptimo global<br />
óptimo global<br />
2. Aceptar algunos reacomodami<strong>en</strong>tos subóptimos<br />
(Se aceptan o g<strong>en</strong>eran ciertos subóptimos muy específicos)<br />
Goloboff 1999<br />
Nuevos algoritmos<br />
Goloboff, Farris & Nixon 2003–2007<br />
programa TNT<br />
Goloboff & Pol<br />
Paralelización <strong>en</strong> TNT<br />
Atracción de ramas largas<br />
P, Q: probabilidad de que los estados sean distintos<br />
<strong>en</strong>tre nodo y nodo (caso binario)<br />
A (el máximo es 0. 5) C<br />
A C<br />
B<br />
A<br />
B<br />
Q<br />
0.1<br />
P<br />
0.1<br />
Q<br />
0.1<br />
P<br />
0.1<br />
Q<br />
0.1<br />
Fels<strong>en</strong>stein 1978<br />
D<br />
C<br />
D<br />
0.45<br />
0.1<br />
A B D C<br />
B<br />
0.1 0.1<br />
0.45<br />
D<br />
Búsquedas heurísticas<br />
Pequeñas modificaciones topológicas a un árbol inicial<br />
Si el árbol mejora, se reti<strong>en</strong>e<br />
Si no, queda como estaba y se prueba otro reacomodami<strong>en</strong>to<br />
Hasta obt<strong>en</strong>er una solución estable<br />
La idea es subir una cuesta de optimalidad<br />
óptimo global<br />
Problema: Óptimos locales<br />
Espacio imaginario de árboles<br />
óptimo local<br />
Maximum Likelihood<br />
(máxima verosimilitud)<br />
Inconsist<strong>en</strong>cia<br />
p converg<strong>en</strong>cia <strong>en</strong>tre A y C ≈ P 2<br />
p sinapomorfía <strong>en</strong> rama interna ≈ Q<br />
Inconsist<strong>en</strong>cia<br />
El problema empeora cuantos más caracteres hay<br />
binarios<br />
A<br />
B<br />
Q<br />
P<br />
Q<br />
nucleótidos<br />
P<br />
Q<br />
D<br />
C
Un <strong>en</strong>foque probabilístico<br />
desde<br />
β<br />
A<br />
C<br />
A C<br />
C<br />
β<br />
α<br />
α<br />
β<br />
C<br />
G<br />
T<br />
β<br />
C C G<br />
C<br />
• Si hay un modelo de cambios estocásticos<br />
• Podríamos calcular las probabilidades de los<br />
ev<strong>en</strong>tos<br />
• Podríamos asignar valores de probabilidad a<br />
los árboles candidato<br />
• Y elegir el más probable!<br />
C A<br />
Las probabilidades de estos ev<strong>en</strong>tos<br />
son fácilm<strong>en</strong>te calculadas<br />
Tres problemas peliagudos<br />
A<br />
G<br />
A<br />
C C C<br />
1. Para cada carácter, sumar las probabilidades de todas las<br />
reconstrucciones posibles para un largo de ramas dado<br />
(likelihood)<br />
2. Para cada árbol, buscar el largo de ramas que maximice el<br />
likelihood<br />
3. Búsqueda: Entre todos los árboles posibles, <strong>en</strong>contrar el de<br />
mayor likelihood<br />
Modelos de complejidad creci<strong>en</strong>te<br />
A<br />
α<br />
G A<br />
α<br />
G<br />
α<br />
α β<br />
β<br />
C<br />
α<br />
T C<br />
α<br />
T<br />
Jukes-Cantor<br />
hacia<br />
Kimura<br />
A C G T A C G T<br />
A α α α A β α β A<br />
C<br />
α α C<br />
β α C<br />
G<br />
α G<br />
β G<br />
T<br />
T<br />
T<br />
α<br />
α<br />
β<br />
β<br />
¿Cómo serán los likelihood de<br />
modelos de complejidad<br />
creci<strong>en</strong>te?<br />
GTR<br />
C<br />
Likelihood ratio test,<br />
Indice de Akaike…<br />
A C G T<br />
α β γ<br />
δ ε<br />
η<br />
C<br />
GTR + gamma …<br />
Probabilidades posteriores<br />
La idea es buscar el árbol de máximo likelihood (máxima verosimilitud)<br />
ACGT<br />
A C<br />
y<br />
x<br />
C C G<br />
w<br />
ACGT<br />
z<br />
ACGT<br />
ACGT<br />
Tres problemas peliagudos + 1<br />
Todas las combinaciones posibles,<br />
implem<strong>en</strong>tado para el largo de ramas<br />
óptimo<br />
1. Para cada carácter, sumar las probabilidades de todas las reconstrucciones<br />
posibles para un largo de ramas dado (likelihood)<br />
Hay maneras bastante efici<strong>en</strong>tes<br />
2. Para cada árbol, buscar el largo de ramas que maximice el likelihood<br />
Los largos de rama se ajustan de a uno iterativam<strong>en</strong>te hasta llegar a un<br />
óptimo estable. Esta es la peor parte.<br />
3. Búsqueda: Entre todos los árboles posibles, <strong>en</strong>contrar el de mayor likelihood<br />
Igual que para parsimonia<br />
4. Hay que <strong>en</strong>contrar el modelo de evolución<br />
Requerimi<strong>en</strong>tos (o asunciones) <strong>en</strong> un análisis bajo<br />
likelihood<br />
1. Los caracteres son heredables<br />
2. La transfer<strong>en</strong>cia es estrictam<strong>en</strong>te vertical<br />
3. La homología está resuelta a priori<br />
4. Los caracteres son indep<strong>en</strong>di<strong>en</strong>tes<br />
5. Los datos sigu<strong>en</strong> el modelo de evolución especificado<br />
(para parsimonia habíamos dicho “Los costos de<br />
transformación están resueltos a priori”)
Algunos trabajos <strong>en</strong> Arg<strong>en</strong>tina<br />
Pol & Siddall (2001)<br />
Simulaciones con 10 terminales<br />
Goloboff (2003)<br />
Modelos alternativos<br />
Goloboff & Pol (2005)<br />
Problemas con estimación bayesiana<br />
(Es improbable que se puedan <strong>en</strong>contrar secu<strong>en</strong>cias muy<br />
largas evolucionando bajo un modelo uniforme)<br />
Distancias (métodos f<strong>en</strong>éticos)<br />
1. Convertir los datos a distancias <strong>en</strong>tre pares de terminales<br />
2. Buscar un árbol que se ajuste bi<strong>en</strong> a esas distancias<br />
Interpretación de distancias sobre el árbol<br />
B<br />
A<br />
D AB = 8<br />
C<br />
D AC = 5<br />
La idea es producir un árbol<br />
que acomode bi<strong>en</strong> las<br />
distancias observadas<br />
Métodos de Distancias<br />
Matriz de distancias<br />
A<br />
B<br />
C<br />
Crocuta_crocuta GTAA AAA-T-GCTTTTATATT-CAA-GTAGGACGACAAGAC CCTATC-GAAC-T--T--T--A-CCAATGTTAAGCTGG GGC-GGC<br />
Galidia_elegans GTAA AAA-T-TCTTTTTTTTTAAAA-AAAAGACGATAAGAC CCTAAA-GAAC-T--T--A--A-CTACAGTTAAGCTGG GGC-GGC<br />
Profelis_aurata GTAA AAA-T-ACTTTTCAATC-TCA-GAGGGACGACAAGAC CCTATC-GAAC-T--T--A--A-CACAAGTTTAGCTGG GGC-GGC<br />
Pardofelis_badia GTAA AAA-G-ACTTTTATAAA-AAA-GAAAGACGACAAGAC CC--T--GAC--A--A--A--C-TAAACTTTTAGCTGG GGC-GGC<br />
Prionailurus_b<strong>en</strong>gal<strong>en</strong>sis GTAA AAA-G-GCTACTATCGC-AAG-GA-AGACGACAAGAC CCTATC-AACT-T--A--A--T-TTTAAATTACGCTGG GGC-GGC<br />
Lynx_canad<strong>en</strong>sis GTAA AAA-G-GCTTATATAAC-CCG-GATGGACGACAAGAC CCTATCAAACT-TCAA--A--T-TAAAAATTTTGCTGG GGC-GGC<br />
Caracal_caracal GTAA AAA-A-GCTTTTATATA-AAA-GAAGGACAACAAGAC CCTGAC-GAGC-T--T--A--A-AAATTATTTGGCTGG GGC-AGC<br />
Felis_chaus ATAA AAA-G-ATATTTATTAT-TAA-GAAAGACGATAAGAC CCTATT-GAAC-T--T--T--A-CTTTAGTTTAGCTGG GGCAGCT<br />
Lynchailurus_colocolo GTAA -AA-A-TTCTGAATTTT-ACA-GAAAGACGACAAGAC CCTATT-GAAC-T--T--T--A-CTTTAGTTAAGCTGG GGCAGCT<br />
Puma_concolor ATAA AAA-A-ATTCTTATTTT-TTA-AAAAGACGACAAGAC CCTGTC-AAAC-T--T--T--A-CTTAAGTTAAGCTGG GGCAGCT<br />
Leopardus_geoffroyi GTAA AAATACATTTATACACT-TAA-CAAAGACGACAAGAC CCTATT-GAAC-T--T--A--A-CCAACGTTAAACTGG GACAGTT<br />
AAC-G-ACATTAAC-G-ACATT<br />
AACTGTATACTAACTGTATACT<br />
A AAC-G-ACATTAAC-G-ACATT<br />
ACC-T-ACAGGAAC-G-AAATT<br />
D AB = 8<br />
D AC = 5<br />
Corrección por cambios múltiples<br />
C<br />
B<br />
C<br />
C<br />
T<br />
T<br />
C<br />
G<br />
D BC = 1<br />
Difer<strong>en</strong>cias por sitio<br />
0.75<br />
0.5<br />
A<br />
A<br />
B 8<br />
C 5<br />
D 10<br />
…<br />
u/3<br />
0.8<br />
A<br />
C<br />
u/3<br />
B<br />
0 8 5<br />
u/3<br />
u/3<br />
0<br />
7<br />
9<br />
u/3<br />
G<br />
T<br />
C<br />
7<br />
0<br />
6<br />
u/3<br />
Modelo Jukes-Cantor<br />
Largo de ramas<br />
…
UPGMA UPGMA<br />
Ultrametricidad (reloj molecular)<br />
Problemas con distancias<br />
La misma distancia <strong>en</strong>tre<br />
la raíz y cada uno de los<br />
terminales<br />
• La complejidad de los datos se degrada al repres<strong>en</strong>tarse por unos<br />
pocos números<br />
• Las distancias suel<strong>en</strong> ser no-métricas (violan la desigualdad del<br />
triángulo). Árboles con ramas de largo negativo<br />
• La conexión con ev<strong>en</strong>tos evolutivos es m<strong>en</strong>os directa que <strong>en</strong> otros<br />
métodos<br />
• No provee transformaciones de caracteres<br />
¿Por qué usar un método de distancias?<br />
• Casos donde los datos ya vi<strong>en</strong><strong>en</strong> como distancias (hibridización de<br />
ADN, distancias inmunológicas)<br />
• Es muy rápido (servidor web, DNA Barcoding)<br />
• Para comparar con resultados previos<br />
• (Hay tantos métodos y son tan complicados…)<br />
Neighbor-joining<br />
Arbol no ultramétrico.<br />
Caso más g<strong>en</strong>eral.<br />
Métodos con y sin criterio de optimalidad<br />
Sin criterio de optimalidad<br />
Se sigue una serie de pasos que determinan un árbol<br />
No hay manera de evaluar otro árbol hipotético (limita puesta a prueba)<br />
Distancias: UPGMA, Neighbor-joining<br />
Con criterio de optimalidad<br />
Dado un árbol cualquiera, es posible calcular un valor de optimalidad<br />
Se trata de llegar al árbol óptimo<br />
Cualquier algoritmo para llegar es válido<br />
Distancias: Mínima evolución, Mínimos cuadrados<br />
Parsimonia: Simple y ponderada<br />
Máxima verosimilitud (maximum likelihood): Diversos modelos
Comparando métodos<br />
Comparando métodos de clasificación: F<strong>en</strong>ética, ‘Evolucionista’, Filog<strong>en</strong>ética. Esta<br />
discusión ya no ti<strong>en</strong>e la importancia que se le daba antes. Farris 1979<br />
Comparando métodos de reconstrucción de filog<strong>en</strong>ias<br />
p.ej., Neighbor-joining, Parsimonia, Likelihood<br />
1. <strong>Filog<strong>en</strong>ia</strong>s experim<strong>en</strong>tales<br />
Bacteriófago T7 (Hillis et al.1992); ciclos de PCR (Sanson et al 2002)<br />
2. Simulaciones<br />
G<strong>en</strong>erar filog<strong>en</strong>ias bajo modelos estipulados, y comparar:<br />
• Qué métodos reconstruy<strong>en</strong> mejor el árbol, los largos de ramas, los ancestros, …<br />
• Id., con modelo simulación ≠ modelo reconstrucción<br />
•…<br />
3. Congru<strong>en</strong>cia <strong>en</strong>tre diversas fu<strong>en</strong>tes de datos<br />
Qué métodos produc<strong>en</strong> resultados más congru<strong>en</strong>tes,<br />
• <strong>en</strong>tre particiones de datos: Distintos g<strong>en</strong>es. G<strong>en</strong>es y morfología. …<br />
• con la acumulación progresiva de datos<br />
Medidas de soporte<br />
1. En todo análisis habrá grupos bi<strong>en</strong> apoyados por los datos, y<br />
otros que no tanto<br />
2. Es esperable que haya algunos grupos espurios<br />
Las medidas de apoyo dan una idea de<br />
Grupos que necesitan estudio<br />
Grupos más o m<strong>en</strong>os confiables<br />
Principales medidas<br />
Soporte de Bremer<br />
Frecu<strong>en</strong>cias de Bootstrapping<br />
Están <strong>en</strong>focadas a cada uno de los grupos del árbol (no al árbol <strong>en</strong> g<strong>en</strong>eral)<br />
Soporte de Bremer<br />
Bremer<br />
Bootstrap<br />
A 0 0000 00<br />
B 1 0000 00<br />
C 1 1111 00<br />
D 1 1111 11<br />
E 1 1111 11<br />
A<br />
4<br />
B<br />
C<br />
D<br />
2 E<br />
A<br />
B<br />
100<br />
C<br />
99<br />
91<br />
D<br />
E<br />
A 0 0000 00 0<br />
B 1 0000 00 0<br />
C 1 1111 00 1<br />
D 1 1111 11 1<br />
E 1 1111 11 0<br />
A<br />
4<br />
B<br />
C<br />
D<br />
1 E<br />
A<br />
B<br />
100<br />
C<br />
99<br />
61<br />
Las distintas medidas de apoyo están bastante correlacionadas <strong>en</strong>tre sí<br />
D<br />
E<br />
Medidas de Soporte<br />
A un análisis filog<strong>en</strong>ético, se le agregan / quitan<br />
Caracteres<br />
Terminales<br />
Se analizan otros g<strong>en</strong>es por separado …<br />
Prácticam<strong>en</strong>te siempre da algo un poco difer<strong>en</strong>te cada vez<br />
G<strong>en</strong>eramos una matriz de datos al azar …<br />
Obt<strong>en</strong>emos un árbol totalm<strong>en</strong>te resuelto<br />
Soporte de Bremer<br />
A<br />
B C<br />
L = Largo óptimo = 32<br />
¿Cuánto cuesta no t<strong>en</strong>er el grupo ABC?<br />
5<br />
BS ABC = L’ –L = 37 – 32 = 5<br />
Búsqueda del mejor árbol donde<br />
ABC no sea monofilético<br />
A<br />
B C<br />
L’ = Largo no ABC = 37<br />
El soporte de Bremer de un grupo es el costo adicional que se g<strong>en</strong>era al contradecirlo<br />
Cuanto más soporte de Bremer, más apoyado está el grupo<br />
Bremer 1988<br />
Medidas de remuestreo: Bootstrapping<br />
¿Qué pasaría con el grupo ABC si se obtuvieran nuevas muestras de<br />
datos con la misma distribución?<br />
Fels<strong>en</strong>stein 1985<br />
A B C<br />
Muchas veces (100+)<br />
Matriz original<br />
B = frecu<strong>en</strong>cia del grupo ABC <strong>en</strong> las matrices remuestreadas<br />
Matriz<br />
remuestreada<br />
Mismo tamaño, con reposición<br />
Algunos caracteres no estarán<br />
Otros estarán más de una vez<br />
Los grupos bi<strong>en</strong> apoyados serán robustos ante el remuestreo y t<strong>en</strong>drán frecu<strong>en</strong>cias<br />
de Bootstrap altas<br />
Goloboff, Farris, Källersjö, Oxelman, Ramírez y Szumik 2003<br />
Ramírez 2005<br />
Corrección de sesgos y artefactos
Medidas de soporte y heterog<strong>en</strong>eidad metodológica<br />
Distintos métodos pued<strong>en</strong> resultar <strong>en</strong> distintos árboles, pero<br />
• Cuando hay muchos datos, los resultados suel<strong>en</strong> ser muy parecidos<br />
• Las difer<strong>en</strong>cias suel<strong>en</strong> ocurrir <strong>en</strong> grupos de bajo soporte<br />
Esto relativiza el efecto de la elección de métodos y parámetros