Capítulo 5: Introducción a los alineamientos de secuencias

More documents

Recommendations

Info

7. Vuelva nuevamente al registro de HomoloGene y en el menú desplegable “Display” seleccione la opción “Multiple Alignment”. Puede detectar las regiones que más diferencian a los vertebrados de los otros organismos. 8. Ahora ingrese en la casilla de búsqueda superior el número 8634, asegúrese que todavía tiene seleccionado “HomoloGene” en el menú desplegable y haga clic en “Go”. Aparece como resultado el gen HEBP2: “Heme binding protein 2”. Ingrese a este registro. Entre las especies aparecen el humano, el ratón, la rata, el perro y el gallo y... ¡una planta (A. thaliana)! Recordemos que el grupo heme está presente en la hemoglobina (y otros compuestos), donde cumple un papel en el transporte de oxígeno en la sangre. En la planta, este grupo debe tener un papel diferente. ¿Podemos confiar que los genes de la planta y del humano son homólogos? ¿Es posible que la similitud en la secuencia se deba a evolución paralela? ¿Está presente el grupo heme en todos los eucariontes? La única evidencia de la que disponemos para respondernos estas preguntas es la similitud entre dos secuencias. Por tanto debemos tomar con precaución este resultado. Resaltando conceptos: Homología vs. Similitud HomoloGene se basa en la similitud de las secuencias para inferir posibles genes homólogos. Sin embargo, similitud no es sinónimo de homología. Es por eso que la homología de estos genes debe considerarse siempre como hipótesis. Recordemos: dos genes son homólogos si tienen el mismo origen evolutivo. Esto es probable si estudiamos proteínas como la actina, que hace parte del citoesqueleto en todos los eucariontes (organismos con sistema de membranas intracelular). Otros genes, por ejemplo los del sistema inmunológico humano, no presentan homólogos en las plantas. Puede ocurrir, sin embargo, que la secuencia de aminoácidos de uno de éstos sea similar a una proteína vegetal. Toda hipótesis en bioinformática debe estudiarse en un contexto biológico para poder hacer inferencias confiables. Siguiendo con el ejemplo, es necesario saber algo más de la actina y del sistema inmunológico es un complemento necesario para evaluar los resultados estadísticos de un alineamiento. ¿Qué ocurre si dos secuencias homólogas han acumulado tantas mutaciones entre sí, que un primer examen de similitud no logra detectar su origen común? En ese caso, HomoloGene probablemente no considere este par de secuencias como homólogas. Existen métodos más sensibles para evaluar la similitud entre secuencias (por ejemplo PSI- BLAST). En los siguientes capítulos exploraremos algunos de estos métodos. Ejercicio: Se ha encontrado un gen en ratones (llamado Mc3r) que está relacionado con el aumento de peso. Ratones que tienen mutado este gen engordan más a pesar de comer menos (en el siguiente tutorial se profundiza más en el tema: http://www.ncbi.nlm.nih.gov/books/bv.fcgi?rid=coffeebrk.chapter.26). Use HomoloGene para encontrar el gen homólogo en humanos. ¿Cuál es el porcentaje de identidad en la secuencia de aminoácidos entre el humano y el ratón? 20
Ejercicios Introducción Los ejercicios de este capítulo son una simulación de una rutina común en bioinformática: se aísla un pedazo de ADN, se obtiene la secuencia, y mediante ésta se pretende inferir la mayor cantidad de información posible usando de bases de datos. El ejemplo dista de representar una situación real en algunos casos (las secuencias del primer ejercicio, por ejemplo, no presentan errores de secuenciación y no tienen repeticiones que generen ambigüedad). Aún así, los conceptos que subyacen son los mismos. Primer ejercicio El resultado de un experimento de secuenciación es un electroferograma, en donde cada pico corresponde a un nucleótido específico en el ADN (ver un ejemplo en el siguiente vínculo: http://www.ncbi.nlm.nih.gov/Traces/trace.cgi?cmd=retrieve&size=479999&s=search&m=obtain &retrieve=Submit&val=1386897769&x_join=and&x_field=CENTER_NAME&x_cond=%3D&file=t race&gz=on&fasta=on&dopt=trace&dispmax=5&page=1) . La secuencia de ADN obtenida de un diagrama de este estilo tiene un tamaño de aproximadamente 700 nucleótidos, por lo que se requieren varias pasadas para secuenciar un gen completo. Estas secuencias deben ensamblarse, esto es, compararse entre sí para determinar una secuencia consenso de todo el gen. Además de que sólo es posible secuenciar pedazos cortos de ADN, muchos picos de los electroferogramas son ambiguos. Esto lleva a que dos secuencias – así pertenezcan a la misma región cromosómica – parezcan tener un orden diferente de nucleótidos. Si bien existen programas especializados en secuenciación (que van desde el análisis del electroferograma, pasando por la optimización de las secuencias para el alineamiento, hasta el análisis conjunto de varios experimentos de secuenciación para obtener una secuencia consenso), vamos a usar las herramientas de este capítulo para obtener un resultado aproximado. En la siguiente página Web hay tres secuencias que deben ensamblarse en un orden específico (esto significa, que una secuencia representa el inicio, otra el segmento medio y la tercera el extremo final): http://bioinformate.uniandes.edu.co/Secuencias/Ejer05_01_01.txt Sin embargo, no se sabe en qué orden deben ir. Usando Dotlet determine: ¿cuál es la secuencia inicial, cuál es la intermedia y cuál es la final? Pista: Las siguientes secuencias, pertenecientes a otro gen, están en orden (“Secuencia_1” es el segmento corriente arriba y “Secuencia_2” el segmento corriente abajo): http://bioinformate.uniandes.edu.co/Secuencias/Ejer05_01_02.txt Practiejemplos de repaso: 1A, 1B Segundo ejercicio (Depende del ejercicio anterior) 21
Page 1 and 2: Lope Andrés Flórez Weidinger http
Page 3 and 4: de las dos especies y los secuencia
Page 5 and 6: Por ejemplo, un alineamiento donde
Page 7 and 8: 8. Otro aspecto a resaltar son los
Page 9 and 10: El último menú desplegable permit
Page 11 and 12: Resaltando conceptos: Identidad Si
Page 13 and 14: En el siguiente capítulo aprendere
Page 15 and 16: 10. El 31 de julio de 2006 se obtuv
Page 17 and 18: 7. Con base en estos Scores, Clusta
Page 19: http://bioinformate.uniandes.edu.co
Page 23 and 24: Practiejemplos de repaso: 2A, 2B Se

Capítulo 5: Introducción a los alineamientos de secuencias

Create successful ePaper yourself

Delete template?

Save as template?