Capítulo 5: Introducción a los alineamientos de secuencias
Capítulo 5: Introducción a los alineamientos de secuencias
Capítulo 5: Introducción a los alineamientos de secuencias
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
10. El 31 <strong>de</strong> julio <strong>de</strong> 2006 se obtuvieron 3 resultados. En la parte gráfica <strong>de</strong>l resultado <strong>de</strong><br />
BLAST aparecen tres líneas en color magenta. Cada una <strong>de</strong> ellas correspon<strong>de</strong> a un<br />
alineamiento.<br />
11. Dé clic sobre la primera línea magenta. Esto lo lleva al primer resultado. En mi caso, es<br />
una secuencia <strong>de</strong>l cromosoma 7 <strong>de</strong>l genoma humano. Después se menciona que en la<br />
dirección 5’ <strong>de</strong> mi secuencia en el genoma humano está la preproteína Sonic<br />
Hedgehog. Tenemos respuesta a nuestra inquietud: el factor <strong>de</strong> transcripción<br />
probablemente inducirá la expresión <strong>de</strong> este gen.<br />
12. Debajo aparecen unos datos estadísticos <strong>de</strong> este alineamiento en particular.<br />
Centrémonos en el e-value, que está <strong>de</strong>spués <strong>de</strong> “Expect”. ¿Nota que es un valor<br />
realmente bajo? Esto nos da un indicio <strong>de</strong> que el alineamiento es muy bueno.<br />
13. Observe otro resultado <strong>de</strong> esta página. En mi caso, el segundo resultado es también<br />
<strong>de</strong>l cromosoma 7, pero en este caso se tomó como referencia la secuencia obtenida<br />
por Celera Genomics (ver introducción al capítulo 2 para ver que significa esto).<br />
Lo importante <strong>de</strong> esto es notar que <strong>los</strong> tres <strong>alineamientos</strong> no son tres formas <strong>de</strong> alinear<br />
dos <strong>secuencias</strong> (como sí ocurre en LAlign), sino la mejor forma <strong>de</strong> alinear una<br />
secuencia con varias <strong>secuencias</strong> presentes en diferentes bases <strong>de</strong> datos. De esto se<br />
trata BLAST: hacer <strong>alineamientos</strong> locales con muchas <strong>secuencias</strong> en bases <strong>de</strong> datos<br />
diferentes para llegar a conclusiones basadas en similitud.<br />
En este ejemplo únicamente vimos uno <strong>de</strong> <strong>los</strong> usos que tiene BLAST. Si bien hay muchos usos<br />
diferentes (como por ejemplo, formular hipótesis <strong>de</strong> homología o <strong>de</strong> conservación <strong>de</strong><br />
estructura), todos se basan en el mismo principio.<br />
Ejercicio:<br />
En unas células cancerosas se aisló un mRNA que estaba expresado en cantida<strong>de</strong>s anormales<br />
y se secuenció. La secuencia obtenida está en:<br />
http://bioinformate.unian<strong>de</strong>s.edu.co/Secuencias/Blast02.txt<br />
¿Hay alguna razón para creer que el mRNA aislado esté vinculado con el hecho <strong>de</strong> que la<br />
célula sea cancerosa?<br />
Practiejemplo D – Alineamientos múltiples<br />
Hasta aquí nos hemos concentrado únicamente en la similitud entre pares <strong>de</strong> <strong>secuencias</strong>. Sin<br />
embargo, estudiar la similitud entre varias <strong>secuencias</strong> simultáneamente nos pue<strong>de</strong> dar mucha<br />
información, que no se encuentra con facilidad en <strong>alineamientos</strong> pareados.<br />
Una analogía que pue<strong>de</strong> servir para enten<strong>de</strong>r esto es comparar el clima en varios años<br />
consecutivos. Si compara un par <strong>de</strong> años entre sí podrá <strong>de</strong>cir que un año fue más caluroso que<br />
el otro en un mes particular, pero poco más que esto. En cambio, si analiza la ten<strong>de</strong>ncia año<br />
tras año (esto es, compara el mismo periodo <strong>de</strong> tiempo <strong>de</strong> todos <strong>los</strong> años simultáneamente),<br />
podrá percatarse que hay un calentamiento progresivo.<br />
En este ejemplo realizaremos un alineamiento múltiple para inferir relaciones evolutivas. La<br />
teoría subyacente es en esencia lo mismo que <strong>de</strong>l párrafo anterior, sólo que al revés:<br />
suponemos que con el paso <strong>de</strong>l tiempo las <strong>secuencias</strong> homólogas <strong>de</strong> <strong>los</strong> organismos<br />
adquieren diferencias o mutaciones (en el caso <strong>de</strong>l clima concluimos que la temperatura<br />
aumentaba) y a partir <strong>de</strong> ahí inferimos cuáles especies están relacionadas y cuáles son lejanas<br />
evolutivamente, a partir <strong>de</strong>l número <strong>de</strong> diferencias entre las <strong>secuencias</strong>.<br />
El programa que vamos a usar es ClustalW. Junto con BLAST, es una <strong>de</strong> las herramientas más<br />
usadas en bioinformática. En este ejemplo, apren<strong>de</strong>remos a ingresar <strong>secuencias</strong> y a reconocer<br />
<strong>los</strong> principales resultados.<br />
15