13.05.2013 Views

Filogenia (1) Homología: Correspondencias en biología comparada

Filogenia (1) Homología: Correspondencias en biología comparada

Filogenia (1) Homología: Correspondencias en biología comparada

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Linneo 1735 <strong>Filog<strong>en</strong>ia</strong> (1)<br />

Viernes 9 de mayo, 2008<br />

<strong>Homología</strong>:<br />

<strong>Correspond<strong>en</strong>cias</strong> <strong>en</strong><br />

<strong>biología</strong> <strong>comparada</strong><br />

Criterios de homología<br />

Tres criterios principales de la anatomía <strong>comparada</strong> clásica<br />

Remane, 1952 (Cuvier, … Olivier Rieppel, Rolf Sattler)<br />

1. Posición y topología respecto de otras estructuras<br />

2. Composición interna, detalles estructurales de construcción<br />

3. Formas intermedias <strong>en</strong> otros taxones<br />

Curso de Evolución, UBA – FCEyN, 2007<br />

Martín J. Ramírez<br />

CONICET – Museo Arg<strong>en</strong>tino de Ci<strong>en</strong>cias Naturales<br />

<strong>Homología</strong><br />

Biología <strong>comparada</strong><br />

Las relaciones de homología defin<strong>en</strong> qué se compara con qué<br />

1. Posición y topología<br />

Belon 1555<br />

AAC-G-ACATT<br />

AACTGTATATT<br />

Posición, topología y relaciones espaciales/temporales respecto de<br />

otras estructuras<br />

Posición y topología<br />

interno, externo, anterior, posterior, dorsal, v<strong>en</strong>tral, bilateral, adyac<strong>en</strong>te, fusionado, …<br />

Conexiones con otras estructuras<br />

inervación, irrigación, traqueación, inserciones musculares, …<br />

Relaciones temporales: Ontog<strong>en</strong>ia<br />

desarrollo a partir de, antes que, regulado por g<strong>en</strong>, …


(234) Desarrollo: secu<strong>en</strong>cia temporal y ‘eje primario’<br />

Burke & Feduccia 1997 (Shubin & Alberch 1986)<br />

2. Composición<br />

Cocodrilo (Alligator)<br />

Tortuga (Chelydra)<br />

Pollo (Gallus)<br />

= avestruz, pato, …<br />

Composición interna, detalles estructurales de construcción<br />

Arquitectura, posición y topología de compon<strong>en</strong>tes internos<br />

Histología (tipos celulares, tejidos, matriz extracelular, …)<br />

Órganos y estructuras (pelos, poros, glándulas, ductos, …)<br />

Todos estos detalles son a su vez homólogos. La homología es<br />

usualm<strong>en</strong>te anidada, recursiva: partes, de partes, de partes…<br />

(123) Formas intermedias<br />

<strong>Homología</strong> <strong>en</strong>tre dígitos de la mano de aves y otros tetrápodos (123)<br />

2-3-4-1-0<br />

Herrerasaurus<br />

2-3-4-3-2<br />

Heterodontosaurus<br />

2-3-4-2-3<br />

Aligator<br />

2-3-4-1-x<br />

Coelophysis<br />

Chatterjee 1998 (Ser<strong>en</strong>o 1999, Xu & Norell 2004, …)<br />

Theropoda<br />

2-3-4-x-x<br />

Allosaurus<br />

2-3-4-x-x<br />

Deinonychus<br />

2-3-4-x-x<br />

Archaeopteryx<br />

Aves<br />

1-2-1-x-x<br />

Gallus<br />

(234) Desarrollo: cond<strong>en</strong>saciones pre-condrogénicas<br />

Pollo (Gallus)<br />

Cond<strong>en</strong>saciones de células<br />

mes<strong>en</strong>quimáticas<br />

Patrón p<strong>en</strong>tadáctilo.<br />

Larsson <strong>en</strong> Wagner 2005<br />

Kundrát 2001 (tinta china, regresión de capilares)<br />

Larsson & Wagner 2002 (aglutinina, marcador de células <strong>en</strong> cond<strong>en</strong>sación)<br />

Welt<strong>en</strong> et al 2005 (hibridización in situ, factor de transcripción Sox9, se expresa <strong>en</strong><br />

cond<strong>en</strong>saciones pre-condrogénicas)<br />

3. Formas intermedias<br />

Formas intermedias <strong>en</strong> otros taxones<br />

Welt<strong>en</strong> et al. 2005<br />

Este criterio es un poco distinto: refiere más explícitam<strong>en</strong>te a información filog<strong>en</strong>ética<br />

previa<br />

Las formas intermedias pued<strong>en</strong> estar tanto <strong>en</strong> especies fósiles como actuales<br />

Formas intermedias fósiles<br />

Deinonychosauria<br />

Microraptor<br />

Fotos Diego Pol<br />

Archaeopteryx<br />

Aves<br />

Confuciusornis


Intermedios filog<strong>en</strong>éticam<strong>en</strong>te plausibles<br />

Alligator Chelydra<br />

Gallus<br />

Este NO es un intermedio plausible<br />

Secu<strong>en</strong>cias: Inserciones y deleciones<br />

Crocuta_crocuta GTAAATGCT<br />

Galidia_elegans GTAAATGCT<br />

Profelis_aurata GTAAATGCT<br />

Pardofelis_badia GTAAATGCT<br />

Prionailurus_b<strong>en</strong>gal<strong>en</strong>sis GTAAGCATGCT<br />

Lynx_canad<strong>en</strong>sis GTAAATGCT<br />

Caracal_caracal GTAAATGCT<br />

Tortugas<br />

‘Lagartos’,<br />

ofidios<br />

Mamíferos<br />

Cocodrilos<br />

Dinosaurios,<br />

Aves<br />

Crocuta_crocuta GTAA--ATGCT<br />

Galidia_elegans GTAA--ATGCT<br />

Profelis_aurata GTAA--ATGCT<br />

Pardofelis_badia GTAA--ATGCT<br />

Prionailurus_b<strong>en</strong>gal<strong>en</strong>sis GTAAGCATGCT<br />

Lynx_canad<strong>en</strong>sis GTAA--ATGCT<br />

Caracal_caracal GTAA--ATGCT<br />

Conflicto <strong>en</strong>tre ‘criterios’ de homología<br />

Puede haber conflictos d<strong>en</strong>tro de cada criterio, cuando distintos<br />

elem<strong>en</strong>tos sugier<strong>en</strong> homologías difer<strong>en</strong>tes. Por ejemplo,<br />

irrigación vs. inervación<br />

inserción de un músculo vs. de otro músculo<br />

orig<strong>en</strong> embrionario vs. anatomía del adulto<br />

orig<strong>en</strong> embrionario vs. g<strong>en</strong>es reguladores<br />

g<strong>en</strong>es reguladores vs. otros g<strong>en</strong>es reguladores<br />

Conflictos <strong>en</strong>tre criterios<br />

posición vs. estructura interna<br />

orig<strong>en</strong> embrionario vs. estructura interna<br />

intermedios vs. desarrollo<br />

(Aunque <strong>en</strong> realidad los criterios no están perfectam<strong>en</strong>te delimitados uno de otro)<br />

Pregunta: Conoc<strong>en</strong> ev<strong>en</strong>tos evolutivos que provoqu<strong>en</strong> incongru<strong>en</strong>cias <strong>en</strong>tre posición y<br />

composición?<br />

<strong>Homología</strong> serial y homeosis<br />

<strong>Homología</strong> serial<br />

Estructuras repetidas (segm<strong>en</strong>tos, módulos, dedos, di<strong>en</strong>tes, …)<br />

Moldeadas por programas de desarrollo con elem<strong>en</strong>tos<br />

repetidos (patterning, gradi<strong>en</strong>tes, umbrales, …)<br />

Homeosis: Expresión ectópica (viola el criterio posicional)<br />

Los casos de homeosis ocurr<strong>en</strong> <strong>en</strong> estructuras seriales o modulares<br />

(dedos, di<strong>en</strong>tes, somitos, apéndices, hojas, flores, …)<br />

La <strong>en</strong>orme mayoría de las homologías no requier<strong>en</strong> invocar cambios<br />

homeóticos (y se necesitan muchos experim<strong>en</strong>tos para demostrarlos)<br />

Halterios <strong>en</strong> Strepsiptera y Diptera Un caso de morfogénesis e individuación indep<strong>en</strong>di<strong>en</strong>tes<br />

Burke et al. 1995<br />

1ro: Morfogénesis, patrón de distribución (patterning)<br />

2do: Individuación por grupos de g<strong>en</strong>es Hox (<strong>en</strong> color)


123 sobre 234: hipótesis de desplazami<strong>en</strong>to de marco<br />

Mano de ratón<br />

Pie de pollo<br />

Dedo 1: HoxD13<br />

día 7 día 8<br />

Vargas & Fallon 2005; Wagner & Gauthier 1999<br />

Dedos 2-5: HoxD13 + HoxD12<br />

Mano de pollo<br />

<strong>Correspond<strong>en</strong>cias</strong> y ancestros hipotéticos<br />

Alligator Gallus<br />

<strong>Homología</strong> primaria y secundaria<br />

A<br />

Crocuta_crocuta GTA A AAA-T-GCTTTTATATT-CAA-GTAGGACGACAAGAC<br />

Galidia_elegans GTA A AAA-T-TCTTTTTTTTTAAAA-AAAAGACGATAAGAC<br />

Profelis_aurata GTA A AAA-T-ACTTTTCAATC-TCA-GAGGGACGACAAGAC<br />

Pardofelis_badia GTA T AAA-G-ACTTTTATAAA-AAA-GAAAGACGACAAGAC<br />

Prionailurus_b<strong>en</strong>gal<strong>en</strong>sis GTA T AAA-G-GCTACTATCGC-AAG-GA-AGACGACAAGAC<br />

Lynx_canad<strong>en</strong>sis GTA T AAA-G-GCTTATATAAC-CCG-GATGGACGACAAGAC<br />

A<br />

A T<br />

T<br />

T<br />

T<br />

A<br />

A<br />

T<br />

T<br />

T<br />

T A<br />

A<br />

HoxD13 + HoxD12<br />

HoxD13<br />

2<br />

1 3 4 5<br />

1ro. patterning, 2do. individuación<br />

Estas A parecían homólogas, pero el árbol que obt<strong>en</strong>emos<br />

nos dice que son converg<strong>en</strong>tes<br />

De Pinna 1991<br />

<strong>Homología</strong> primaria o pot<strong>en</strong>cial: Misma posición, misma<br />

estructura. Es un dato para filog<strong>en</strong>ia<br />

<strong>Homología</strong> secundaria: Mismo orig<strong>en</strong>. Es una explicación<br />

de la similitud, provista por la hipótesis filog<strong>en</strong>ética<br />

1<br />

2<br />

3<br />

<strong>Homología</strong> explicada:<br />

ancestralidad<br />

<strong>Homología</strong> sobre un árbol<br />

AAA T ATGTT AAA A CCATT<br />

AAA T ATATT<br />

AAA T ATATT<br />

Caracteres<br />

AAATA ATATT<br />

AAA T ATATT<br />

AAA T ATATT<br />

AAATGTATATT AAATATATACT<br />

AAATATATATT<br />

AAATA ATATT<br />

AAA-T-ATATT<br />

|||||||||||<br />

AAA-T-ATGTT<br />

|||||||||||<br />

AAA-A-CCATT<br />

|||||||||||<br />

AAATA-ATATT<br />

|||||||||||<br />

AAATGTATATT<br />

|||||||||||<br />

AAATATATACT


Caracteres y estados<br />

Carácter: Hipótesis de transformación evolutiva. Ejemplos,<br />

Morfológico “Plumas: Aus<strong>en</strong>tes o Pres<strong>en</strong>tes”<br />

Molecular “COI, sitio 124: A, C, G, o T”<br />

Comportam<strong>en</strong>tal “Canto nupcial: Bajo o agudo”<br />

carácter: estados<br />

Un carácter expresa una transformación evolutiva, aunque no se sepa cuándo<br />

ocurrió, ni cuántas veces, ni <strong>en</strong> qué s<strong>en</strong>tido<br />

Transformación evolutiva – <strong>en</strong>tre condiciones de estructuras homólogas:<br />

carácter homólogo <strong>en</strong> tanto que<br />

Plumas (vs. escamas, pelos): estructuras tegum<strong>en</strong>tarias<br />

COI, sitio 124: sitio 124 alineado<br />

Canto nupcial: vocalización específica durante el apareami<strong>en</strong>to<br />

Notación usual<br />

Estados numerados<br />

Plumas: (0) Aus<strong>en</strong>tes; (1) Pres<strong>en</strong>tes<br />

En la matriz de datos:<br />

Bufo 0<br />

Alligator 0<br />

Microrraptor 1<br />

Gallus 1<br />

Secu<strong>en</strong>cias Morfología<br />

Morfología<br />

Ser<strong>en</strong>o 1999<br />

Theropoda<br />

Aves<br />

Se suele utilizar “0” para el estado primitivo (cuando se sabe cuál es).<br />

Los símbolos (0, 1, …) son arbitrarios, pero esta conv<strong>en</strong>ción suele ayudar a leer /<br />

mant<strong>en</strong>er / corregir la matriz<br />

Morfología<br />

Uña inferior<br />

0. Pres<strong>en</strong>te<br />

1. Vestigial o aus<strong>en</strong>te


Morfología<br />

Fúsulas piriformes<br />

0. Pequeñas, finas<br />

1. Muy grandes, aplanadas<br />

Morfología (ultraestructura), ...<br />

Uniones gap: 0. Aus<strong>en</strong>te. 1. Pres<strong>en</strong>te<br />

Uniones tight: 0. Aus<strong>en</strong>te. 1. Pres<strong>en</strong>te<br />

Desmosomas: 0. Aus<strong>en</strong>te. 1. Pres<strong>en</strong>te<br />

Colág<strong>en</strong>o: 0. Aus<strong>en</strong>te. 1. Pres<strong>en</strong>te<br />

G<strong>en</strong>oma mitocondrial: 0. Circular. 1. Lineal<br />

Rutas metabólicas<br />

Patrones de desarrollo<br />

Tejidos<br />

…<br />

Comportami<strong>en</strong>to<br />

Movimi<strong>en</strong>tos estereotipados de peinado de seda<br />

0. Tipo I (apoyando sobre pata III)<br />

1. Tipo II (apoyando sobre pata IV, se muev<strong>en</strong> <strong>en</strong> conjunto)<br />

Caracteres de hileras de arañas<br />

Comportami<strong>en</strong>to<br />

Comportami<strong>en</strong>to


Comportami<strong>en</strong>to<br />

Coddington 1986<br />

Todo lo que haya<br />

Secu<strong>en</strong>cias y morfología<br />

Sistemática Filog<strong>en</strong>ética Sinapomorfías<br />

H<strong>en</strong>nig 1950<br />

1.Clasificación filog<strong>en</strong>ética<br />

Los grupos taxonómicos reflejan<br />

el árbol filog<strong>en</strong>ético<br />

Reconstrucción de<br />

filog<strong>en</strong>ias<br />

“Plumas: (0) Aus<strong>en</strong>tes; (1) Pres<strong>en</strong>tes”<br />

La pres<strong>en</strong>cia de plumas, apoya la monofilia de las aves?<br />

La aus<strong>en</strong>cia de plumas, apoya la monofilia de los reptiles?<br />

2. Solam<strong>en</strong>te las similitudes <strong>en</strong> estados derivados (apomorfías) son evid<strong>en</strong>cia de<br />

par<strong>en</strong>tesco<br />

Un árbol con aves monofiléticas permite explicar la pres<strong>en</strong>cia de plumas <strong>en</strong> todas las aves<br />

como heredadas de un ancestro común.<br />

El grupo monofilético Aves explica la distribución de plumas ↔ las plumas son evid<strong>en</strong>cia<br />

<strong>en</strong> favor del grupo Aves. Son una sinapomorfía (= apomorfía compartida).<br />

Cualquier otro árbol obliga a p<strong>en</strong>sar que las plumas aparecieron más de una vez<br />

(converg<strong>en</strong>cia), o que aparecieron y luego se perdieron (reversión). Impone<br />

homoplasia.<br />

Cómo se explica la aus<strong>en</strong>cia de plumas <strong>en</strong> ‘reptiles’?<br />

Es una plesiomorfía (= condición primitiva), heredada del ancestro común de ‘reptiles’ +<br />

Aves + … No necesita un grupo monofilético ‘reptiles’ para ser explicada.


Grupos monofiléticos<br />

Grupos monofiléticos<br />

Un ancestro y todos sus desc<strong>en</strong>di<strong>en</strong>tes.<br />

Definidos por sinapomorfías<br />

Grupos naturales (reflejan un proceso natural: la evolución)<br />

Grupos polifiléticos<br />

Grupos polifiléticos<br />

Ti<strong>en</strong><strong>en</strong> ancestros separados<br />

Definidos por converg<strong>en</strong>cias<br />

Ejemplos<br />

‘Homeotermos’ (aves + mamíferos)<br />

Árboles y matrices<br />

filog<strong>en</strong>éticas<br />

A B C D E F<br />

A B C D E F<br />

Grupos parafiléticos<br />

Grupos parafiléticos<br />

Un ancestro, pero no todos sus desc<strong>en</strong>di<strong>en</strong>tes.<br />

Usualm<strong>en</strong>te definidos por plesiomorfías<br />

Ejemplos<br />

‘Reptiles’<br />

‘Invertebrados’<br />

‘Criptógamas’<br />

‘Protozoos’<br />

‘Apterygota’ (insectos ápteros)<br />

Curiosidad histórica<br />

Davis 1938<br />

Árboles filog<strong>en</strong>éticos: Cuándo ti<strong>en</strong>e s<strong>en</strong>tido<br />

Características heredables<br />

Estructuras homólogas<br />

Historia única<br />

Transfer<strong>en</strong>cia vertical<br />

Sin reticulación<br />

A B C D E F


Árboles filog<strong>en</strong>éticos: Cuándo no ti<strong>en</strong>e s<strong>en</strong>tido<br />

A. Características no heredables<br />

B. No hay un árbol único<br />

Coevolución / Biogeografía histórica / Parásitos <strong>en</strong> hospedadores<br />

Transfer<strong>en</strong>cia horizontal<br />

Hibridación<br />

G<strong>en</strong>es parálogos<br />

Este tipo de datos no ortodoxos puede integrarse <strong>en</strong> un análisis filog<strong>en</strong>ético, pero<br />

requiere trabajo adicional<br />

• Mapeando sobre filog<strong>en</strong>ias, etc.<br />

• Con algoritmos especiales que tom<strong>en</strong> <strong>en</strong> cu<strong>en</strong>ta los ev<strong>en</strong>tos específicos (de<br />

hibridación, duplicación, extinción, transfer<strong>en</strong>cia horizontal, etc.)<br />

Terminología: grupos hermanos<br />

A B C D E F<br />

A B C D E F<br />

Grupos que se originan <strong>en</strong> un mismo nodo<br />

A grupo hermano de (BCDEF)<br />

(BC) grupo hermano de (DEF)<br />

B grupo hermano de C<br />

Terminología: Matriz de datos<br />

Arbol dicotómico o totalm<strong>en</strong>te resuelto: Todos los<br />

nodos dan orig<strong>en</strong> a dos desc<strong>en</strong>di<strong>en</strong>tes<br />

Politomía: Un nodo da orig<strong>en</strong> a más de dos<br />

desc<strong>en</strong>di<strong>en</strong>tes (= rama interna de largo cero; = nodos<br />

internos colapsados)<br />

Hypochilus 000-0-000000000000001000000000000000<br />

Gradungula 000-0-0010000011000000000---01000100<br />

Thaida 000-0-001000011101000000010101000100<br />

Hickmania 000-0-001000010000000000010101000100<br />

Filistata 010-1-000200000000000000020000000000<br />

Kukulcania 010-1-000200000000000000020000000000<br />

Ariadna 000-0-0102000000001000000---00000000<br />

Polistes fuscatus CCTGAGAAACGGCTACCACATCTAAGGAAGGCAGCAGGCGCGC<br />

Monobia quadrid<strong>en</strong>s CCTGAGAAACGGCTACCACATCTAAGGAAGGCAGCAGGCGCGC<br />

Apoica sp. CCTGAGAAACGGCTACCACATCTAAGGAAGGCAGCAGGCGCGC<br />

Dasymutilla gloriosa CCTGAGAAACGGCTACCACATCCAAGGAAGGCAGCAGGCGCGC<br />

Priocnemus oregana CCTGAGAAACGGCTACCACATCCAAGGAAGGCAGCAGGCGCGC<br />

Epyris sepulchralis CCTGAGAAACGGCTACCACATCCAAGGAAGGCAGCAGGCGCGC<br />

Ca<strong>en</strong>ochrysis doriae CCTGAGAAACGGCTACCACATCCAAGGAAGGCAGCAGGCGCGC<br />

Terminales<br />

Caracteres<br />

Los terminales son usualm<strong>en</strong>te especies: repres<strong>en</strong>tantes más reales, mejor<br />

docum<strong>en</strong>tados.<br />

Cada vez más raro <strong>en</strong>contrar terminales compuestos (o bauplans; géneros, familias, …).<br />

Pregunta: Si un terminal compuesto fuera internam<strong>en</strong>te variable, cómo codificarían sus<br />

caracteres?<br />

Terminología: nodos, raíz y terminales<br />

nodos<br />

(= ancestros hipotéticos)<br />

nodo raíz<br />

A<br />

C<br />

A<br />

T<br />

G<br />

T<br />

Terminología: árboles y redes<br />

raíz<br />

Árbol <strong>en</strong>raizado<br />

A<br />

C<br />

A<br />

T<br />

G<br />

T<br />

Parsimonia<br />

terminales (= observaciones)<br />

Para n terminales,<br />

Con raíz<br />

n – 1 nodos internos<br />

Sin raíz<br />

n – 2 nodos internos<br />

A<br />

C<br />

A<br />

T<br />

G<br />

T<br />

A<br />

A<br />

T<br />

C<br />

T<br />

C<br />

A<br />

T<br />

G<br />

A<br />

T<br />

G<br />

Árbol no <strong>en</strong>raizado (red, network)<br />

A<br />

C<br />

A<br />

T<br />

G<br />

T


Parsimonia: Estados y ev<strong>en</strong>tos sobre árboles<br />

Crocuta_crocuta GTA A AAA-T-GCTTTTATATT-CAA-GTAGGACGACAAGAC<br />

Galidia_elegans GTA A AAA-T-TCTTTTTTTTTAAAA-AAAAGACGATAAGAC<br />

Profelis_aurata GTA A AAA-T-ACTTTTCAATC-TCA-GAGGGACGACAAGAC<br />

Pardofelis_badia GTA T AAA-G-ACTTTTATAAA-AAA-GAAAGACGACAAGAC<br />

Prionailurus_b<strong>en</strong>gal<strong>en</strong>sis GTA T AAA-G-GCTACTATCGC-AAG-GA-AGACGACAAGAC<br />

Lynx_canad<strong>en</strong>sis GTA T AAA-G-GCTTATATAAC-CCG-GATGGACGACAAGAC<br />

árbol candidato 1 árbol candidato 2<br />

A<br />

A<br />

A A<br />

A<br />

A<br />

A<br />

A T<br />

T<br />

T<br />

A<br />

T<br />

T<br />

T<br />

A<br />

A<br />

A<br />

T<br />

T<br />

T<br />

T<br />

T<br />

A<br />

T<br />

T<br />

T<br />

A<br />

largo 1 = 1<br />

largo 2 = 2<br />

árbol candidato 3<br />

A<br />

A<br />

A<br />

A<br />

A T<br />

T<br />

T<br />

A T<br />

T<br />

T T<br />

T A<br />

A<br />

largo 3 = 3<br />

Requerimi<strong>en</strong>tos (o asunciones) <strong>en</strong> un análisis bajo<br />

parsimonia<br />

1. Los caracteres son heredables<br />

2. La transfer<strong>en</strong>cia es estrictam<strong>en</strong>te vertical<br />

3. La homología está resuelta a priori<br />

4. Los caracteres son indep<strong>en</strong>di<strong>en</strong>tes<br />

5. Los costos de transformación están resueltos a priori<br />

Dos problemas peliagudos<br />

1. Optimización: Para cada carácter, contar los pasos sobre un<br />

árbol dado (reconstrucción óptima)<br />

2. Búsqueda: Entre todos los árboles posibles, <strong>en</strong>contrar el de<br />

m<strong>en</strong>or costo (árbol óptimo)<br />

Costo del árbol<br />

Crocuta_crocuta GTA A AAA-T-GCTTTTATATT-CAA-GTAGGACGACAAGAC<br />

Galidia_elegans GTA A AAA-T-TCTTTTTTTTTAAAA-AAAAGACGATAAGAC<br />

Profelis_aurata GTA A AAA-T-ACTTTTCAATC-TCA-GAGGGACGACAAGAC<br />

Pardofelis_badia GTA T AAA-G-ACTTTTATAAA-AAA-GAAAGACGACAAGAC<br />

Prionailurus_b<strong>en</strong>gal<strong>en</strong>sis GTA T AAA-G-GCTACTATCGC-AAG-GA-AGACGACAAGAC<br />

Lynx_canad<strong>en</strong>sis GTA T AAA-G-GCTTATATAAC-CCG-GATGGACGACAAGAC<br />

1 n<br />

Costo o largo del árbol = suma de pasos sobre todos los caracteres<br />

L =<br />

La idea es <strong>en</strong>contrar el árbol de m<strong>en</strong>or costo (mejor ajuste)<br />

l i<br />

La idea de parsimonia es maximizar la similitud explicada como homología. Lo hace de<br />

manera indirecta, minimizando intancias de homoplasia (converg<strong>en</strong>cias y reversiones)<br />

Cosas que no son caracteres<br />

No heredables<br />

Caracteres determinados por el ambi<strong>en</strong>te<br />

No homólogos<br />

Similitud superficial<br />

No indep<strong>en</strong>di<strong>en</strong>tes<br />

Dep<strong>en</strong>d<strong>en</strong>cia lógica (estados alternativos expresados como pres / aus)<br />

Dep<strong>en</strong>d<strong>en</strong>cia funcional estricta (cad<strong>en</strong>as complem<strong>en</strong>tarias de ADN)<br />

Características extrínsecas<br />

Distribución geográfica<br />

Parásitos y otras asociaciones<br />

Estratigrafía<br />

Estos datos no ortodoxos podrían ser utilizados, pero necesitan<br />

tratami<strong>en</strong>to especial (y costos definidos)<br />

Optimización


Reconstrucciones ancestrales<br />

Reconstrucción 1<br />

A<br />

Reconstrucción 2<br />

A<br />

Reconstrucción 3<br />

A<br />

C<br />

C<br />

C<br />

A A<br />

C A<br />

C A<br />

A<br />

A<br />

T<br />

T<br />

T<br />

G<br />

T<br />

C<br />

C<br />

T<br />

T<br />

T<br />

G<br />

T<br />

A<br />

C<br />

T<br />

G<br />

T<br />

G<br />

T<br />

L = 3 L = 4 L = 5<br />

Optimización: Asignar estados ancestrales <strong>en</strong> los nodos, con la<br />

m<strong>en</strong>or cantidad posible de transformaciones (= m<strong>en</strong>or costo)<br />

Para cuatro estados y (n–2) nodos,<br />

4 (n–2) reconstrucciones posibles<br />

Matrices de costos<br />

desde<br />

0<br />

1<br />

hacia<br />

0 1<br />

0 1<br />

1<br />

0<br />

Binaria<br />

Optimización de Fitch (1971)<br />

Optimización de Fitch<br />

desde<br />

Sin <strong>en</strong>trar <strong>en</strong> los detalles del algoritmo!<br />

hacia<br />

0 1 2 3<br />

0 0 1 1 1<br />

1 1 0 1 1<br />

2 1 1 0 1<br />

3 1 1 1 0<br />

Multiestado no<br />

ord<strong>en</strong>ada<br />

Para caracteres no ord<strong>en</strong>ados (dos o más estados)<br />

1. Pasada hacia abajo<br />

Estados preliminares<br />

{SD1 } {SD2 }<br />

Si hay estados <strong>en</strong> común: Intersección<br />

Si no: Unión (+ 1 paso)<br />

Nodo raíz queda con estados definitivos<br />

2. Pasada hacia arriba<br />

{SN }<br />

Estados definitivos. La regla es un poco más compleja, pero de todos modos veloz.<br />

Pasada hacia arriba (N, nodo a evaluar, S estado preliminar, S’ final, D desc<strong>en</strong>di<strong>en</strong>te,<br />

A ancestro ):<br />

si SA ∩ SN = SA ⇒ S’ N = SA si no<br />

si SD1 ∩ SD2 = 0 ⇒ S’ N = SN ∪ SA si no<br />

{SD1 } {SD2 }<br />

{SN }<br />

S’ N = SN ∪ [SA ∩ (SD1 ∪ SD2 )]<br />

{SA }<br />

Matriz de costos: Cuánto cuesta cada ev<strong>en</strong>to<br />

desde<br />

2.5<br />

A<br />

C<br />

2.5<br />

A<br />

1<br />

1<br />

2.5<br />

C<br />

G<br />

T<br />

hacia<br />

2.5<br />

G<br />

T<br />

A 0 2.5 1 2.5<br />

C 2.5 0 2.5 1<br />

G 1 2.5 0 2.5<br />

T 2.5 1 2.5 0<br />

Matrices de costos<br />

desde<br />

desde<br />

A<br />

C<br />

G<br />

T<br />

A<br />

hacia<br />

C G<br />

T<br />

0 5 2 5<br />

0 5 2<br />

0 5<br />

0<br />

Se especifican todos los cambios<br />

posibles, y se les asigna un costo<br />

=<br />

desde<br />

desde<br />

hacia<br />

A C G T<br />

A 0 5 2 5<br />

C 5 0 5 2<br />

G 2 5 0 5<br />

T 5 2 5 0<br />

hacia<br />

A C G T<br />

0 5.1 2.3 6.4<br />

0 8.1 1.5<br />

0 4<br />

0<br />

tv : tr = 5 : 2 6 parámetros<br />

A C G T -<br />

A 0 2 1 2 2<br />

C 0 2 1 2<br />

G<br />

0 2 2<br />

T<br />

0 2 tv : tr : indel = 2 : 1 : 2<br />

-<br />

0<br />

Optimización de Fitch<br />

A B C D E F<br />

Sin <strong>en</strong>trar <strong>en</strong> los detalles del algoritmo, el problema global se descompone <strong>en</strong> una<br />

serie de pequeños problemas locales.<br />

Logra una solución lineal para un problema expon<strong>en</strong>cial:<br />

2n – 3 cálculos (hacia abajo: n-1 + hacia arriba: n-2)<br />

A<br />

C<br />

G<br />

T


Grupos externos y<br />

<strong>en</strong>raizami<strong>en</strong>to<br />

‘Ingroup’ / ‘outgroup’ (‘grupo externo’ / ‘interno’)<br />

Cocodrilo<br />

Ave 1<br />

Cocodrilo<br />

Ave 1<br />

Ave 2<br />

Ave 3<br />

…<br />

Matriz de datos<br />

Ave 2<br />

Ave 3<br />

Ave n<br />

…<br />

Ave n<br />

¿Este resultado apoya la monofilia de las aves?<br />

Múltiples grupos externos<br />

0<br />

‘outgroups’ ‘ingroup’<br />

100 200 300<br />

400 500 600 675<br />

Enraizami<strong>en</strong>to<br />

tiempo<br />

A<br />

A<br />

A T<br />

A<br />

A T<br />

A<br />

T T<br />

A<br />

T T<br />

T<br />

A<br />

A<br />

A<br />

T<br />

T<br />

T<br />

A<br />

A<br />

A<br />

T<br />

T<br />

T<br />

Re<strong>en</strong>raizar un árbol no cambia<br />

• Las asignaciones ancestrales<br />

• Ni el largo del árbol<br />

• Ni los cambios sobre las ramas<br />

• – Cambia el s<strong>en</strong>tido de algunas<br />

transformaciones<br />

La posición de la raíz es información<br />

filog<strong>en</strong>ética que se justifica fuera del análisis<br />

Excepción<br />

Caracteres con costos asimétricos<br />

Diseño del análisis: grupos externos<br />

Múltiples grupos externos<br />

Al m<strong>en</strong>os uno sufici<strong>en</strong>tem<strong>en</strong>te alejado como para garantizar que esté fuera del<br />

grupo de interés<br />

Algunos sufici<strong>en</strong>tem<strong>en</strong>te cercanos como para poner <strong>en</strong> duda la monofilia del<br />

grupo de interés<br />

Muestreo de repres<strong>en</strong>tantes<br />

Diversidad taxonómica<br />

Diversidad <strong>en</strong> los caracteres bajo estudio<br />

T<br />

A<br />

T<br />

T<br />

T<br />

A<br />

A<br />

A<br />

Pragmático: Taxones de interés especial, disponibilidad de especím<strong>en</strong>es, …<br />

Clasificación


Linneo 1735<br />

Una clasificación<br />

jerárquica<br />

Wilkins 1668<br />

“Una clasificación de<br />

toda clase de cosas y<br />

nociones”<br />

El árbol de Porfirio<br />

No solam<strong>en</strong>te para seres<br />

vivos…<br />

No necesariam<strong>en</strong>te jerárquicas…


Darwin 1859<br />

Explicación de<br />

similitudes y jerarquías<br />

mediante una teoría de<br />

modificación y<br />

transmisión<br />

Méritos que pued<strong>en</strong> t<strong>en</strong>er las clasificaciones<br />

Naturales<br />

Que reflej<strong>en</strong> un proceso natural.<br />

Sistemática filog<strong>en</strong>ética: Evolución.<br />

Árbol evolutivo: Sistema jerárquico.<br />

Predictivas<br />

Que sean útiles para la infer<strong>en</strong>cia de nuevos conocimi<strong>en</strong>tos<br />

Pert<strong>en</strong><strong>en</strong>cia a un grupo taxonómico hace esperar muchas características (heredadas del<br />

ancestro común)<br />

Compactas, efici<strong>en</strong>tes<br />

Que minimic<strong>en</strong> la redundancia<br />

Diagnosis efici<strong>en</strong>te: Unas pocas características bastan para detectar pert<strong>en</strong><strong>en</strong>cia a grupos<br />

Que los grupos taxonómicos sirvan para transmitir el máximo de información<br />

Parsimonia: Minimización de hipótesis ad-hoc<br />

Haeckel 1866<br />

(Estables)<br />

Las hipótesis ci<strong>en</strong>tíficas cambian a medida que avanza el conocimi<strong>en</strong>to, pero uno espera<br />

que la acumulación de datos contribuya progresivam<strong>en</strong>te a la estabilidad de las hipótesis.<br />

Docum<strong>en</strong>tadas<br />

Materiales claram<strong>en</strong>te id<strong>en</strong>tificados y públicam<strong>en</strong>te accesibles<br />

Códigos Internacionales de Nom<strong>en</strong>clatura (Zoológica, Botánica, Bacterias, Virus)<br />

Especím<strong>en</strong>es de refer<strong>en</strong>cia: Tipos<br />

Literatura y autoridad: Descripciones, diagnosis, actos nom<strong>en</strong>clatoriales<br />

Docum<strong>en</strong>tación de análisis filog<strong>en</strong>éticos<br />

Ilustraciones, descripciones<br />

Vouchers, metadatos<br />

Repositorios internacionales: G<strong>en</strong>Bank, MorphBank<br />

Docum<strong>en</strong>tación Para qué se usan los árboles filog<strong>en</strong>éticos?


Taxonomía Taxonomía<br />

Orig<strong>en</strong> y evolución de morfología, … Orig<strong>en</strong> y evolución de morfología, moléculas, …<br />

Orig<strong>en</strong> y evolución de morfología, moléculas, … Comportami<strong>en</strong>to, …


G<strong>en</strong>omas, … Ecología, …<br />

Biogeografía, … Biogeografía, …<br />

Desarrollo, … Desarrollo, …<br />

Burke & Feduccia 1997 (Shubin & Alberch 1986)<br />

Cocodrilo (Alligator)<br />

Tortuga (Chelydra)<br />

Pollo (Gallus)<br />

= avestruz, pato, …


Dimorfismo sexual, … Coevolución, …<br />

Tiempo, …<br />

1. Optimización: Para cada carácter, contar los pasos sobre un<br />

árbol dado (reconstrucción óptima)<br />

2. Búsqueda: Entre todos los árboles posibles, <strong>en</strong>contrar el de<br />

m<strong>en</strong>or costo (árbol óptimo)<br />

<strong>Filog<strong>en</strong>ia</strong> (2)<br />

Miércoles 14 de mayo, 2008<br />

2. Búsquedas<br />

n terminales<br />

árboles<br />

n Número de árboles<br />

3 3<br />

4 15<br />

5 105<br />

6 945<br />

7 10,395<br />

8 135,135<br />

9 2,027,025<br />

10 34,459,425<br />

11 654,729,075<br />

12 13,749,310,575<br />

13 316,234,143,225<br />

14 7,905,853,580,625<br />

15 213,458,046,676,875<br />

16 6,190,283,353,629,370<br />

17 191,898,783,962,511,000<br />

18 6,332,659,870,762,850,000<br />

19 221,643,095,476,700,000,000<br />

20 8,200,794,532,637,890,000,000<br />

21 319,830,986,772,878,000,000,000<br />

22 13,113,070,457,688,000,000,000,000<br />

23 563,862,029,680,583,000,000,000,000<br />

24 25,373,791,335,626,300,000,000,000,000<br />

25 1,192,568,192,774,430,000,000,000,000,000<br />

26 58,435,841,445,947,300,000,000,000,000,000<br />

27 2,980,227,913,743,310,000,000,000,000,000,000<br />

28 157,952,079,428,395,000,000,000,000,000,000,000<br />

29 8,687,364,368,561,750,000,000,000,000,000,000,000<br />

30 495,179,769,008,020,000,000,000,000,000,000,000,000<br />

31 29,215,606,371,473,200,000,000,000,000,000,000,000,000<br />

32 1,782,151,988,659,860,000,000,000,000,000,000,000,000,000<br />

33 112,275,575,285,571,000,000,000,000,000,000,000,000,000,000<br />

34 7,297,912,393,562,140,000,000,000,000,000,000,000,000,000,000<br />

35 488,960,130,368,663,000,000,000,000,000,000,000,000,000,000,000<br />

36 33,738,248,995,437,800,000,000,000,000,000,000,000,000,000,000,000<br />

37 2,395,415,678,676,080,000,000,000,000,000,000,000,000,000,000,000,000<br />

38 174,865,344,543,354,000,000,000,000,000,000,000,000,000,000,000,000,000<br />

39 13,114,900,840,751,500,000,000,000,000,000,000,000,000,000,000,000,000,000<br />

40 1,009,847,364,737,870,000,000,000,000,000,000,000,000,000,000,000,000,000,000<br />

41 79,777,941,814,291,700,000,000,000,000,000,000,000,000,000,000,000,000,000,000<br />

42 6,462,013,286,957,630,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000<br />

43 536,347,102,817,483,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000<br />

44 45,589,503,739,486,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000<br />

45 3,966,286,825,335,290,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000<br />

46 352,999,527,454,840,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000<br />

47 32,122,956,998,390,500,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000<br />

48 2,987,435,000,850,310,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000<br />

49 283,806,325,080,780,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000<br />

50 27,529,213,532,835,600,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000<br />

n<br />

árboles<br />

50 10 76<br />

100 10 184<br />

150 10 304


Complejidad<br />

Número de árboles <strong>en</strong>raizados (T r ) para n terminales<br />

T r = (2n-3)! / (2 n-2 (n-2)!)<br />

El número de soluciones posibles es factorial (es peor que expon<strong>en</strong>cial): <strong>en</strong> escala<br />

logarítmica, crece más que linealm<strong>en</strong>te.<br />

Problema NP-hard (NP: Non-deterministic Polinomial time)<br />

No se conoc<strong>en</strong> soluciones polinomiales (p. ej., “4n 3 + 6n 2 + 2n + 1”).<br />

Una solución expon<strong>en</strong>cial (“e n ”), con n sufici<strong>en</strong>tem<strong>en</strong>te grande será peor que una polinomial.<br />

Pero, mediante algoritmos refinados, podríamos hacer que e sea muy pequeño!<br />

Tiempo de procesami<strong>en</strong>to peor que expon<strong>en</strong>cial <strong>en</strong> número de terminales<br />

Para n más que modestos, las búsquedas son heurísticas<br />

Pregunta<br />

¿Cómo será el tiempo de procesami<strong>en</strong>to <strong>en</strong> función del número de caracteres?<br />

Estrategias heurísticas<br />

de búsqueda<br />

1. Múltiples puntos de partida indep<strong>en</strong>di<strong>en</strong>tes<br />

óptimo global<br />

óptimo global<br />

2. Aceptar algunos reacomodami<strong>en</strong>tos subóptimos<br />

(Se aceptan o g<strong>en</strong>eran ciertos subóptimos muy específicos)<br />

Goloboff 1999<br />

Nuevos algoritmos<br />

Goloboff, Farris & Nixon 2003–2007<br />

programa TNT<br />

Goloboff & Pol<br />

Paralelización <strong>en</strong> TNT<br />

Atracción de ramas largas<br />

P, Q: probabilidad de que los estados sean distintos<br />

<strong>en</strong>tre nodo y nodo (caso binario)<br />

A (el máximo es 0. 5) C<br />

A C<br />

B<br />

A<br />

B<br />

Q<br />

0.1<br />

P<br />

0.1<br />

Q<br />

0.1<br />

P<br />

0.1<br />

Q<br />

0.1<br />

Fels<strong>en</strong>stein 1978<br />

D<br />

C<br />

D<br />

0.45<br />

0.1<br />

A B D C<br />

B<br />

0.1 0.1<br />

0.45<br />

D<br />

Búsquedas heurísticas<br />

Pequeñas modificaciones topológicas a un árbol inicial<br />

Si el árbol mejora, se reti<strong>en</strong>e<br />

Si no, queda como estaba y se prueba otro reacomodami<strong>en</strong>to<br />

Hasta obt<strong>en</strong>er una solución estable<br />

La idea es subir una cuesta de optimalidad<br />

óptimo global<br />

Problema: Óptimos locales<br />

Espacio imaginario de árboles<br />

óptimo local<br />

Maximum Likelihood<br />

(máxima verosimilitud)<br />

Inconsist<strong>en</strong>cia<br />

p converg<strong>en</strong>cia <strong>en</strong>tre A y C ≈ P 2<br />

p sinapomorfía <strong>en</strong> rama interna ≈ Q<br />

Inconsist<strong>en</strong>cia<br />

El problema empeora cuantos más caracteres hay<br />

binarios<br />

A<br />

B<br />

Q<br />

P<br />

Q<br />

nucleótidos<br />

P<br />

Q<br />

D<br />

C


Un <strong>en</strong>foque probabilístico<br />

desde<br />

β<br />

A<br />

C<br />

A C<br />

C<br />

β<br />

α<br />

α<br />

β<br />

C<br />

G<br />

T<br />

β<br />

C C G<br />

C<br />

• Si hay un modelo de cambios estocásticos<br />

• Podríamos calcular las probabilidades de los<br />

ev<strong>en</strong>tos<br />

• Podríamos asignar valores de probabilidad a<br />

los árboles candidato<br />

• Y elegir el más probable!<br />

C A<br />

Las probabilidades de estos ev<strong>en</strong>tos<br />

son fácilm<strong>en</strong>te calculadas<br />

Tres problemas peliagudos<br />

A<br />

G<br />

A<br />

C C C<br />

1. Para cada carácter, sumar las probabilidades de todas las<br />

reconstrucciones posibles para un largo de ramas dado<br />

(likelihood)<br />

2. Para cada árbol, buscar el largo de ramas que maximice el<br />

likelihood<br />

3. Búsqueda: Entre todos los árboles posibles, <strong>en</strong>contrar el de<br />

mayor likelihood<br />

Modelos de complejidad creci<strong>en</strong>te<br />

A<br />

α<br />

G A<br />

α<br />

G<br />

α<br />

α β<br />

β<br />

C<br />

α<br />

T C<br />

α<br />

T<br />

Jukes-Cantor<br />

hacia<br />

Kimura<br />

A C G T A C G T<br />

A α α α A β α β A<br />

C<br />

α α C<br />

β α C<br />

G<br />

α G<br />

β G<br />

T<br />

T<br />

T<br />

α<br />

α<br />

β<br />

β<br />

¿Cómo serán los likelihood de<br />

modelos de complejidad<br />

creci<strong>en</strong>te?<br />

GTR<br />

C<br />

Likelihood ratio test,<br />

Indice de Akaike…<br />

A C G T<br />

α β γ<br />

δ ε<br />

η<br />

C<br />

GTR + gamma …<br />

Probabilidades posteriores<br />

La idea es buscar el árbol de máximo likelihood (máxima verosimilitud)<br />

ACGT<br />

A C<br />

y<br />

x<br />

C C G<br />

w<br />

ACGT<br />

z<br />

ACGT<br />

ACGT<br />

Tres problemas peliagudos + 1<br />

Todas las combinaciones posibles,<br />

implem<strong>en</strong>tado para el largo de ramas<br />

óptimo<br />

1. Para cada carácter, sumar las probabilidades de todas las reconstrucciones<br />

posibles para un largo de ramas dado (likelihood)<br />

Hay maneras bastante efici<strong>en</strong>tes<br />

2. Para cada árbol, buscar el largo de ramas que maximice el likelihood<br />

Los largos de rama se ajustan de a uno iterativam<strong>en</strong>te hasta llegar a un<br />

óptimo estable. Esta es la peor parte.<br />

3. Búsqueda: Entre todos los árboles posibles, <strong>en</strong>contrar el de mayor likelihood<br />

Igual que para parsimonia<br />

4. Hay que <strong>en</strong>contrar el modelo de evolución<br />

Requerimi<strong>en</strong>tos (o asunciones) <strong>en</strong> un análisis bajo<br />

likelihood<br />

1. Los caracteres son heredables<br />

2. La transfer<strong>en</strong>cia es estrictam<strong>en</strong>te vertical<br />

3. La homología está resuelta a priori<br />

4. Los caracteres son indep<strong>en</strong>di<strong>en</strong>tes<br />

5. Los datos sigu<strong>en</strong> el modelo de evolución especificado<br />

(para parsimonia habíamos dicho “Los costos de<br />

transformación están resueltos a priori”)


Algunos trabajos <strong>en</strong> Arg<strong>en</strong>tina<br />

Pol & Siddall (2001)<br />

Simulaciones con 10 terminales<br />

Goloboff (2003)<br />

Modelos alternativos<br />

Goloboff & Pol (2005)<br />

Problemas con estimación bayesiana<br />

(Es improbable que se puedan <strong>en</strong>contrar secu<strong>en</strong>cias muy<br />

largas evolucionando bajo un modelo uniforme)<br />

Distancias (métodos f<strong>en</strong>éticos)<br />

1. Convertir los datos a distancias <strong>en</strong>tre pares de terminales<br />

2. Buscar un árbol que se ajuste bi<strong>en</strong> a esas distancias<br />

Interpretación de distancias sobre el árbol<br />

B<br />

A<br />

D AB = 8<br />

C<br />

D AC = 5<br />

La idea es producir un árbol<br />

que acomode bi<strong>en</strong> las<br />

distancias observadas<br />

Métodos de Distancias<br />

Matriz de distancias<br />

A<br />

B<br />

C<br />

Crocuta_crocuta GTAA AAA-T-GCTTTTATATT-CAA-GTAGGACGACAAGAC CCTATC-GAAC-T--T--T--A-CCAATGTTAAGCTGG GGC-GGC<br />

Galidia_elegans GTAA AAA-T-TCTTTTTTTTTAAAA-AAAAGACGATAAGAC CCTAAA-GAAC-T--T--A--A-CTACAGTTAAGCTGG GGC-GGC<br />

Profelis_aurata GTAA AAA-T-ACTTTTCAATC-TCA-GAGGGACGACAAGAC CCTATC-GAAC-T--T--A--A-CACAAGTTTAGCTGG GGC-GGC<br />

Pardofelis_badia GTAA AAA-G-ACTTTTATAAA-AAA-GAAAGACGACAAGAC CC--T--GAC--A--A--A--C-TAAACTTTTAGCTGG GGC-GGC<br />

Prionailurus_b<strong>en</strong>gal<strong>en</strong>sis GTAA AAA-G-GCTACTATCGC-AAG-GA-AGACGACAAGAC CCTATC-AACT-T--A--A--T-TTTAAATTACGCTGG GGC-GGC<br />

Lynx_canad<strong>en</strong>sis GTAA AAA-G-GCTTATATAAC-CCG-GATGGACGACAAGAC CCTATCAAACT-TCAA--A--T-TAAAAATTTTGCTGG GGC-GGC<br />

Caracal_caracal GTAA AAA-A-GCTTTTATATA-AAA-GAAGGACAACAAGAC CCTGAC-GAGC-T--T--A--A-AAATTATTTGGCTGG GGC-AGC<br />

Felis_chaus ATAA AAA-G-ATATTTATTAT-TAA-GAAAGACGATAAGAC CCTATT-GAAC-T--T--T--A-CTTTAGTTTAGCTGG GGCAGCT<br />

Lynchailurus_colocolo GTAA -AA-A-TTCTGAATTTT-ACA-GAAAGACGACAAGAC CCTATT-GAAC-T--T--T--A-CTTTAGTTAAGCTGG GGCAGCT<br />

Puma_concolor ATAA AAA-A-ATTCTTATTTT-TTA-AAAAGACGACAAGAC CCTGTC-AAAC-T--T--T--A-CTTAAGTTAAGCTGG GGCAGCT<br />

Leopardus_geoffroyi GTAA AAATACATTTATACACT-TAA-CAAAGACGACAAGAC CCTATT-GAAC-T--T--A--A-CCAACGTTAAACTGG GACAGTT<br />

AAC-G-ACATTAAC-G-ACATT<br />

AACTGTATACTAACTGTATACT<br />

A AAC-G-ACATTAAC-G-ACATT<br />

ACC-T-ACAGGAAC-G-AAATT<br />

D AB = 8<br />

D AC = 5<br />

Corrección por cambios múltiples<br />

C<br />

B<br />

C<br />

C<br />

T<br />

T<br />

C<br />

G<br />

D BC = 1<br />

Difer<strong>en</strong>cias por sitio<br />

0.75<br />

0.5<br />

A<br />

A<br />

B 8<br />

C 5<br />

D 10<br />

…<br />

u/3<br />

0.8<br />

A<br />

C<br />

u/3<br />

B<br />

0 8 5<br />

u/3<br />

u/3<br />

0<br />

7<br />

9<br />

u/3<br />

G<br />

T<br />

C<br />

7<br />

0<br />

6<br />

u/3<br />

Modelo Jukes-Cantor<br />

Largo de ramas<br />


UPGMA UPGMA<br />

Ultrametricidad (reloj molecular)<br />

Problemas con distancias<br />

La misma distancia <strong>en</strong>tre<br />

la raíz y cada uno de los<br />

terminales<br />

• La complejidad de los datos se degrada al repres<strong>en</strong>tarse por unos<br />

pocos números<br />

• Las distancias suel<strong>en</strong> ser no-métricas (violan la desigualdad del<br />

triángulo). Árboles con ramas de largo negativo<br />

• La conexión con ev<strong>en</strong>tos evolutivos es m<strong>en</strong>os directa que <strong>en</strong> otros<br />

métodos<br />

• No provee transformaciones de caracteres<br />

¿Por qué usar un método de distancias?<br />

• Casos donde los datos ya vi<strong>en</strong><strong>en</strong> como distancias (hibridización de<br />

ADN, distancias inmunológicas)<br />

• Es muy rápido (servidor web, DNA Barcoding)<br />

• Para comparar con resultados previos<br />

• (Hay tantos métodos y son tan complicados…)<br />

Neighbor-joining<br />

Arbol no ultramétrico.<br />

Caso más g<strong>en</strong>eral.<br />

Métodos con y sin criterio de optimalidad<br />

Sin criterio de optimalidad<br />

Se sigue una serie de pasos que determinan un árbol<br />

No hay manera de evaluar otro árbol hipotético (limita puesta a prueba)<br />

Distancias: UPGMA, Neighbor-joining<br />

Con criterio de optimalidad<br />

Dado un árbol cualquiera, es posible calcular un valor de optimalidad<br />

Se trata de llegar al árbol óptimo<br />

Cualquier algoritmo para llegar es válido<br />

Distancias: Mínima evolución, Mínimos cuadrados<br />

Parsimonia: Simple y ponderada<br />

Máxima verosimilitud (maximum likelihood): Diversos modelos


Comparando métodos<br />

Comparando métodos de clasificación: F<strong>en</strong>ética, ‘Evolucionista’, Filog<strong>en</strong>ética. Esta<br />

discusión ya no ti<strong>en</strong>e la importancia que se le daba antes. Farris 1979<br />

Comparando métodos de reconstrucción de filog<strong>en</strong>ias<br />

p.ej., Neighbor-joining, Parsimonia, Likelihood<br />

1. <strong>Filog<strong>en</strong>ia</strong>s experim<strong>en</strong>tales<br />

Bacteriófago T7 (Hillis et al.1992); ciclos de PCR (Sanson et al 2002)<br />

2. Simulaciones<br />

G<strong>en</strong>erar filog<strong>en</strong>ias bajo modelos estipulados, y comparar:<br />

• Qué métodos reconstruy<strong>en</strong> mejor el árbol, los largos de ramas, los ancestros, …<br />

• Id., con modelo simulación ≠ modelo reconstrucción<br />

•…<br />

3. Congru<strong>en</strong>cia <strong>en</strong>tre diversas fu<strong>en</strong>tes de datos<br />

Qué métodos produc<strong>en</strong> resultados más congru<strong>en</strong>tes,<br />

• <strong>en</strong>tre particiones de datos: Distintos g<strong>en</strong>es. G<strong>en</strong>es y morfología. …<br />

• con la acumulación progresiva de datos<br />

Medidas de soporte<br />

1. En todo análisis habrá grupos bi<strong>en</strong> apoyados por los datos, y<br />

otros que no tanto<br />

2. Es esperable que haya algunos grupos espurios<br />

Las medidas de apoyo dan una idea de<br />

Grupos que necesitan estudio<br />

Grupos más o m<strong>en</strong>os confiables<br />

Principales medidas<br />

Soporte de Bremer<br />

Frecu<strong>en</strong>cias de Bootstrapping<br />

Están <strong>en</strong>focadas a cada uno de los grupos del árbol (no al árbol <strong>en</strong> g<strong>en</strong>eral)<br />

Soporte de Bremer<br />

Bremer<br />

Bootstrap<br />

A 0 0000 00<br />

B 1 0000 00<br />

C 1 1111 00<br />

D 1 1111 11<br />

E 1 1111 11<br />

A<br />

4<br />

B<br />

C<br />

D<br />

2 E<br />

A<br />

B<br />

100<br />

C<br />

99<br />

91<br />

D<br />

E<br />

A 0 0000 00 0<br />

B 1 0000 00 0<br />

C 1 1111 00 1<br />

D 1 1111 11 1<br />

E 1 1111 11 0<br />

A<br />

4<br />

B<br />

C<br />

D<br />

1 E<br />

A<br />

B<br />

100<br />

C<br />

99<br />

61<br />

Las distintas medidas de apoyo están bastante correlacionadas <strong>en</strong>tre sí<br />

D<br />

E<br />

Medidas de Soporte<br />

A un análisis filog<strong>en</strong>ético, se le agregan / quitan<br />

Caracteres<br />

Terminales<br />

Se analizan otros g<strong>en</strong>es por separado …<br />

Prácticam<strong>en</strong>te siempre da algo un poco difer<strong>en</strong>te cada vez<br />

G<strong>en</strong>eramos una matriz de datos al azar …<br />

Obt<strong>en</strong>emos un árbol totalm<strong>en</strong>te resuelto<br />

Soporte de Bremer<br />

A<br />

B C<br />

L = Largo óptimo = 32<br />

¿Cuánto cuesta no t<strong>en</strong>er el grupo ABC?<br />

5<br />

BS ABC = L’ –L = 37 – 32 = 5<br />

Búsqueda del mejor árbol donde<br />

ABC no sea monofilético<br />

A<br />

B C<br />

L’ = Largo no ABC = 37<br />

El soporte de Bremer de un grupo es el costo adicional que se g<strong>en</strong>era al contradecirlo<br />

Cuanto más soporte de Bremer, más apoyado está el grupo<br />

Bremer 1988<br />

Medidas de remuestreo: Bootstrapping<br />

¿Qué pasaría con el grupo ABC si se obtuvieran nuevas muestras de<br />

datos con la misma distribución?<br />

Fels<strong>en</strong>stein 1985<br />

A B C<br />

Muchas veces (100+)<br />

Matriz original<br />

B = frecu<strong>en</strong>cia del grupo ABC <strong>en</strong> las matrices remuestreadas<br />

Matriz<br />

remuestreada<br />

Mismo tamaño, con reposición<br />

Algunos caracteres no estarán<br />

Otros estarán más de una vez<br />

Los grupos bi<strong>en</strong> apoyados serán robustos ante el remuestreo y t<strong>en</strong>drán frecu<strong>en</strong>cias<br />

de Bootstrap altas<br />

Goloboff, Farris, Källersjö, Oxelman, Ramírez y Szumik 2003<br />

Ramírez 2005<br />

Corrección de sesgos y artefactos


Medidas de soporte y heterog<strong>en</strong>eidad metodológica<br />

Distintos métodos pued<strong>en</strong> resultar <strong>en</strong> distintos árboles, pero<br />

• Cuando hay muchos datos, los resultados suel<strong>en</strong> ser muy parecidos<br />

• Las difer<strong>en</strong>cias suel<strong>en</strong> ocurrir <strong>en</strong> grupos de bajo soporte<br />

Esto relativiza el efecto de la elección de métodos y parámetros

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!