Capítulo 5: Introducción a los alineamientos de secuencias
Capítulo 5: Introducción a los alineamientos de secuencias
Capítulo 5: Introducción a los alineamientos de secuencias
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
MUMmer fue <strong>de</strong>sarrollado en TIGR (The Institute of Genomic Research) y en la página web <strong>de</strong><br />
este instituto (http://www.tigr.org/) es posible encontrar otras herramientas adicionales <strong>de</strong><br />
comparación entre genomas.<br />
NCBI PopSet<br />
Página <strong>de</strong> inicio <strong>de</strong> PopSet:<br />
http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=PopSet<br />
Cuando un investigador está interesado en publicar un alineamiento <strong>de</strong> <strong>secuencias</strong> pue<strong>de</strong><br />
hacer un envío a GenBank <strong>de</strong> éste mediante la herramienta Sequin (ver capítulo 2,<br />
Practiejemplo 1C). De esta forma sólo tiene que referenciar el registro específico en el NCBI,<br />
<strong>de</strong> manera similar a citar una secuencia <strong>de</strong> ADN mediante el número <strong>de</strong> acceso o el GI.<br />
Algunos <strong>de</strong> estos <strong>alineamientos</strong> están pensados para proporcionar hipótesis evolutivas <strong>de</strong><br />
poblaciones. NCBI ha creado una base <strong>de</strong> datos especializada en este tipo <strong>de</strong> estudios y se<br />
conoce como PopSet. Esta es la <strong>de</strong>scripción <strong>de</strong> un PopSet en la página Web <strong>de</strong>l NCBI:<br />
“¿Qué es un PopSet?<br />
Un PopSet es un conjunto <strong>de</strong> <strong>secuencias</strong> <strong>de</strong> ADN que han sido recolectadas para analizar las<br />
relaciones evolutivas <strong>de</strong> una población. La población pudo originarse a partir <strong>de</strong> diferentes<br />
miembros <strong>de</strong> la misma especie, o por organismos <strong>de</strong> especies diferentes. Son enviados a<br />
GenBank mediante Sequin, usualmente en forma <strong>de</strong> alineamiento <strong>de</strong> <strong>secuencias</strong>.”<br />
Base <strong>de</strong> datos <strong>de</strong> COGs<br />
Pagina inicial <strong>de</strong> la base <strong>de</strong> datos <strong>de</strong> COGs:<br />
http://www.ncbi.nlm.nih.gov/COG/<br />
Cuando empezaron a surgir las <strong>secuencias</strong> completas <strong>de</strong> algunos organismos, varios grupos<br />
iniciaron la tarea <strong>de</strong> encontrar todos <strong>los</strong> genes potencialmente homólogos. Una iniciativa <strong>de</strong>l<br />
NCBI, conocida como base <strong>de</strong> datos <strong>de</strong> COGs, se ha aproximado a esta tarea:<br />
“La base <strong>de</strong> datos <strong>de</strong> clusters <strong>de</strong> grupos ortólogos <strong>de</strong> proteínas (COGs [Cluster of Orthologous<br />
Groups]) ha sido pensada como una clasificación filogenética <strong>de</strong> proteínas <strong>de</strong> genomas<br />
completos. Cada COG incluye proteínas que se cree son ortólogas, esto es, conectadas por<br />
<strong>de</strong>scen<strong>de</strong>ncia evolutiva vertical. [...] El propósito <strong>de</strong> la base <strong>de</strong> datos <strong>de</strong> COGs es servir como<br />
plataforma para la anotación funcional <strong>de</strong> genomas recientemente secuenciados y realizar<br />
estudios en evolución genómica.”<br />
(Roman L. et al., “The COG database: new <strong>de</strong>velopments in phylogenetic classification of<br />
proteins from complete genomes”, Nucleic Acids Res. 2001 Jan 1;29(1):22-8. PMID: 11125040)<br />
Varios <strong>de</strong> <strong>los</strong> genes presentes en HomoloGene surgen <strong>de</strong> esta base <strong>de</strong> datos. Se pue<strong>de</strong> <strong>de</strong>cir<br />
que la base <strong>de</strong> datos COG es a HomoloGene como GenBank es a NCBI Gene.<br />
This work is licensed un<strong>de</strong>r a Creative Commons Attribution-NonCommercial-ShareAlike 2.5<br />
License.<br />
24