07.05.2013 Views

Capítulo 5: Introducción a los alineamientos de secuencias

Capítulo 5: Introducción a los alineamientos de secuencias

Capítulo 5: Introducción a los alineamientos de secuencias

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>de</strong> las dos especies y <strong>los</strong> secuenciamos (o extraemos esta información <strong>de</strong> bases <strong>de</strong> datos <strong>de</strong><br />

<strong>secuencias</strong> biológicas como GenBank), <strong>de</strong>bemos observar similitud entre las <strong>secuencias</strong>.<br />

Surge entonces la pregunta: ¿Cómo observamos que dos <strong>secuencias</strong> son similares?<br />

Los <strong>alineamientos</strong>, que son el tema <strong>de</strong> este capítulo, nos proporcionan una primera respuesta.<br />

Un alineamiento es “[...] la i<strong>de</strong>ntificación <strong>de</strong> correspon<strong>de</strong>ncias residuo-residuo. Cualquier<br />

asignación <strong>de</strong> correspon<strong>de</strong>ncias que preserve el or<strong>de</strong>n <strong>de</strong> <strong>los</strong> residuos <strong>de</strong>ntro <strong>de</strong> las<br />

<strong>secuencias</strong> es un alineamiento.” [2]<br />

Si <strong>los</strong> residuos <strong>de</strong> una secuencia tienen un alto grado <strong>de</strong> correspon<strong>de</strong>ncia con residuos <strong>de</strong> la<br />

otra secuencia, son similares y por tanto su cercanía evolutiva es probable.<br />

Hacer estas comparaciones a mano es dispendioso y poco práctico. Afortunadamente, el<br />

<strong>de</strong>sarrollo <strong>de</strong> <strong>los</strong> computadores – <strong>de</strong> manera indirecta – ha traído consigo la solución a este<br />

problema: La búsqueda en Internet, por ejemplo usando Google, requiere encontrar ca<strong>de</strong>nas<br />

<strong>de</strong> texto similares al término <strong>de</strong> interés y ya se han <strong>de</strong>sarrollado métodos <strong>de</strong> computador que<br />

permiten visualizar (gráficamente o por medio <strong>de</strong> la estadística) la similitud entre dos ca<strong>de</strong>nas<br />

<strong>de</strong> texto. Dado que el ADN se pue<strong>de</strong> escribir como una ca<strong>de</strong>na <strong>de</strong> texto en un alfabeto <strong>de</strong><br />

cuatro letras y las proteínas se pue<strong>de</strong>n codificar usando un alfabeto <strong>de</strong> 20 letras, es posible<br />

usar las mismas herramientas que han <strong>de</strong>sarrollado <strong>los</strong> ingenieros <strong>de</strong> sistemas y <strong>los</strong><br />

matemáticos, para fines biológicos.<br />

Este capítulo muestra varios métodos <strong>de</strong> alineamiento disponibles en línea y algunas<br />

aplicaciones comunes <strong>de</strong> éstos en la bioinformática. Saber escoger el método se vuelve <strong>de</strong><br />

suma importancia, pues cada uno parte <strong>de</strong> supuestos diferentes. Esto será <strong>de</strong>scrito con más<br />

<strong>de</strong>talle en la introducción <strong>de</strong>l siguiente capítulo. Por ahora basta recordar que si nuestros<br />

métodos son erróneos, nuestras conclusiones también lo son.<br />

[1] Futuyma, D., “Evolutionary Biology”, Tercera edición, Sinnauer Associates Inc., 1998, pág.<br />

30<br />

[2] Lesk, AM., “Bioinformatics”, Primera edición, Oxford University Press, 2002, pág. 161<br />

Conceptos importantes:<br />

Alineamientos<br />

“[...] la i<strong>de</strong>ntificación <strong>de</strong> correspon<strong>de</strong>ncias residuo-residuo. Cualquier asignación <strong>de</strong><br />

correspon<strong>de</strong>ncias que preserve el or<strong>de</strong>n <strong>de</strong> <strong>los</strong> residuos <strong>de</strong>ntro <strong>de</strong> las <strong>secuencias</strong> es un<br />

alineamiento.”<br />

Lesk, AM., “Bioinformatics”, Primera edición, Oxford University Press, 2002, pág. 161<br />

En términos coloquiales, alinear dos <strong>secuencias</strong> es poner una junto a la otra <strong>de</strong> forma que se<br />

resalten las diferencias y similitu<strong>de</strong>s, pero sin cambiar el or<strong>de</strong>n <strong>de</strong> <strong>los</strong> residuos.<br />

Hay varias maneras <strong>de</strong> hacer esto, aunque unas se prestan más a análisis que otras. Si<br />

queremos saber cuál <strong>de</strong> las dos <strong>secuencias</strong> es más larga, po<strong>de</strong>mos simplemente alinear el<br />

primer residuo <strong>de</strong> la primera ca<strong>de</strong>na con el primer residuo <strong>de</strong> la segunda y así sucesivamente<br />

para todos <strong>los</strong> residuos. El resultado es algo más o menos así:<br />

ESTOESUN<br />

ALINEAMIENTO<br />

De aquí se concluye rápidamente que la primera secuencia es más corta que la segunda.<br />

Sin embargo, usualmente nos interesa más saber si dos <strong>secuencias</strong> tienen sub<strong>secuencias</strong><br />

iguales en el mismo or<strong>de</strong>n. Por ejemplo, las palabras incrementado y cemento son muy<br />

similares en este sentido:<br />

3

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!