Capítulo 5: Introducción a los alineamientos de secuencias
Capítulo 5: Introducción a los alineamientos de secuencias
Capítulo 5: Introducción a los alineamientos de secuencias
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
<strong>de</strong> las dos especies y <strong>los</strong> secuenciamos (o extraemos esta información <strong>de</strong> bases <strong>de</strong> datos <strong>de</strong><br />
<strong>secuencias</strong> biológicas como GenBank), <strong>de</strong>bemos observar similitud entre las <strong>secuencias</strong>.<br />
Surge entonces la pregunta: ¿Cómo observamos que dos <strong>secuencias</strong> son similares?<br />
Los <strong>alineamientos</strong>, que son el tema <strong>de</strong> este capítulo, nos proporcionan una primera respuesta.<br />
Un alineamiento es “[...] la i<strong>de</strong>ntificación <strong>de</strong> correspon<strong>de</strong>ncias residuo-residuo. Cualquier<br />
asignación <strong>de</strong> correspon<strong>de</strong>ncias que preserve el or<strong>de</strong>n <strong>de</strong> <strong>los</strong> residuos <strong>de</strong>ntro <strong>de</strong> las<br />
<strong>secuencias</strong> es un alineamiento.” [2]<br />
Si <strong>los</strong> residuos <strong>de</strong> una secuencia tienen un alto grado <strong>de</strong> correspon<strong>de</strong>ncia con residuos <strong>de</strong> la<br />
otra secuencia, son similares y por tanto su cercanía evolutiva es probable.<br />
Hacer estas comparaciones a mano es dispendioso y poco práctico. Afortunadamente, el<br />
<strong>de</strong>sarrollo <strong>de</strong> <strong>los</strong> computadores – <strong>de</strong> manera indirecta – ha traído consigo la solución a este<br />
problema: La búsqueda en Internet, por ejemplo usando Google, requiere encontrar ca<strong>de</strong>nas<br />
<strong>de</strong> texto similares al término <strong>de</strong> interés y ya se han <strong>de</strong>sarrollado métodos <strong>de</strong> computador que<br />
permiten visualizar (gráficamente o por medio <strong>de</strong> la estadística) la similitud entre dos ca<strong>de</strong>nas<br />
<strong>de</strong> texto. Dado que el ADN se pue<strong>de</strong> escribir como una ca<strong>de</strong>na <strong>de</strong> texto en un alfabeto <strong>de</strong><br />
cuatro letras y las proteínas se pue<strong>de</strong>n codificar usando un alfabeto <strong>de</strong> 20 letras, es posible<br />
usar las mismas herramientas que han <strong>de</strong>sarrollado <strong>los</strong> ingenieros <strong>de</strong> sistemas y <strong>los</strong><br />
matemáticos, para fines biológicos.<br />
Este capítulo muestra varios métodos <strong>de</strong> alineamiento disponibles en línea y algunas<br />
aplicaciones comunes <strong>de</strong> éstos en la bioinformática. Saber escoger el método se vuelve <strong>de</strong><br />
suma importancia, pues cada uno parte <strong>de</strong> supuestos diferentes. Esto será <strong>de</strong>scrito con más<br />
<strong>de</strong>talle en la introducción <strong>de</strong>l siguiente capítulo. Por ahora basta recordar que si nuestros<br />
métodos son erróneos, nuestras conclusiones también lo son.<br />
[1] Futuyma, D., “Evolutionary Biology”, Tercera edición, Sinnauer Associates Inc., 1998, pág.<br />
30<br />
[2] Lesk, AM., “Bioinformatics”, Primera edición, Oxford University Press, 2002, pág. 161<br />
Conceptos importantes:<br />
Alineamientos<br />
“[...] la i<strong>de</strong>ntificación <strong>de</strong> correspon<strong>de</strong>ncias residuo-residuo. Cualquier asignación <strong>de</strong><br />
correspon<strong>de</strong>ncias que preserve el or<strong>de</strong>n <strong>de</strong> <strong>los</strong> residuos <strong>de</strong>ntro <strong>de</strong> las <strong>secuencias</strong> es un<br />
alineamiento.”<br />
Lesk, AM., “Bioinformatics”, Primera edición, Oxford University Press, 2002, pág. 161<br />
En términos coloquiales, alinear dos <strong>secuencias</strong> es poner una junto a la otra <strong>de</strong> forma que se<br />
resalten las diferencias y similitu<strong>de</strong>s, pero sin cambiar el or<strong>de</strong>n <strong>de</strong> <strong>los</strong> residuos.<br />
Hay varias maneras <strong>de</strong> hacer esto, aunque unas se prestan más a análisis que otras. Si<br />
queremos saber cuál <strong>de</strong> las dos <strong>secuencias</strong> es más larga, po<strong>de</strong>mos simplemente alinear el<br />
primer residuo <strong>de</strong> la primera ca<strong>de</strong>na con el primer residuo <strong>de</strong> la segunda y así sucesivamente<br />
para todos <strong>los</strong> residuos. El resultado es algo más o menos así:<br />
ESTOESUN<br />
ALINEAMIENTO<br />
De aquí se concluye rápidamente que la primera secuencia es más corta que la segunda.<br />
Sin embargo, usualmente nos interesa más saber si dos <strong>secuencias</strong> tienen sub<strong>secuencias</strong><br />
iguales en el mismo or<strong>de</strong>n. Por ejemplo, las palabras incrementado y cemento son muy<br />
similares en este sentido:<br />
3