Capítulo 5: Introducción a los alineamientos de secuencias
Capítulo 5: Introducción a los alineamientos de secuencias
Capítulo 5: Introducción a los alineamientos de secuencias
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Ejercicios<br />
<strong>Introducción</strong><br />
Los ejercicios <strong>de</strong> este capítulo son una simulación <strong>de</strong> una rutina común en bioinformática: se<br />
aísla un pedazo <strong>de</strong> ADN, se obtiene la secuencia, y mediante ésta se preten<strong>de</strong> inferir la mayor<br />
cantidad <strong>de</strong> información posible usando <strong>de</strong> bases <strong>de</strong> datos.<br />
El ejemplo dista <strong>de</strong> representar una situación real en algunos casos (las <strong>secuencias</strong> <strong>de</strong>l primer<br />
ejercicio, por ejemplo, no presentan errores <strong>de</strong> secuenciación y no tienen repeticiones que<br />
generen ambigüedad). Aún así, <strong>los</strong> conceptos que subyacen son <strong>los</strong> mismos.<br />
Primer ejercicio<br />
El resultado <strong>de</strong> un experimento <strong>de</strong> secuenciación es un electroferograma, en don<strong>de</strong> cada pico<br />
correspon<strong>de</strong> a un nucleótido específico en el ADN (ver un ejemplo en el siguiente vínculo:<br />
http://www.ncbi.nlm.nih.gov/Traces/trace.cgi?cmd=retrieve&size=479999&s=search&m=obtain<br />
&retrieve=Submit&val=1386897769&x_join=and&x_field=CENTER_NAME&x_cond=%3D&file=t<br />
race&gz=on&fasta=on&dopt=trace&dispmax=5&page=1) . La secuencia <strong>de</strong> ADN obtenida <strong>de</strong><br />
un diagrama <strong>de</strong> este estilo tiene un tamaño <strong>de</strong> aproximadamente 700 nucleótidos, por lo que se<br />
requieren varias pasadas para secuenciar un gen completo. Estas <strong>secuencias</strong> <strong>de</strong>ben<br />
ensamblarse, esto es, compararse entre sí para <strong>de</strong>terminar una secuencia consenso <strong>de</strong> todo el<br />
gen.<br />
A<strong>de</strong>más <strong>de</strong> que sólo es posible secuenciar pedazos cortos <strong>de</strong> ADN, muchos picos <strong>de</strong> <strong>los</strong><br />
electroferogramas son ambiguos. Esto lleva a que dos <strong>secuencias</strong> – así pertenezcan a la<br />
misma región cromosómica – parezcan tener un or<strong>de</strong>n diferente <strong>de</strong> nucleótidos.<br />
Si bien existen programas especializados en secuenciación (que van <strong>de</strong>s<strong>de</strong> el análisis <strong>de</strong>l<br />
electroferograma, pasando por la optimización <strong>de</strong> las <strong>secuencias</strong> para el alineamiento, hasta el<br />
análisis conjunto <strong>de</strong> varios experimentos <strong>de</strong> secuenciación para obtener una secuencia<br />
consenso), vamos a usar las herramientas <strong>de</strong> este capítulo para obtener un resultado<br />
aproximado.<br />
En la siguiente página Web hay tres <strong>secuencias</strong> que <strong>de</strong>ben ensamblarse en un or<strong>de</strong>n<br />
específico (esto significa, que una secuencia representa el inicio, otra el segmento medio y la<br />
tercera el extremo final):<br />
http://bioinformate.unian<strong>de</strong>s.edu.co/Secuencias/Ejer05_01_01.txt<br />
Sin embargo, no se sabe en qué or<strong>de</strong>n <strong>de</strong>ben ir. Usando Dotlet <strong>de</strong>termine: ¿cuál es la<br />
secuencia inicial, cuál es la intermedia y cuál es la final?<br />
Pista: Las siguientes <strong>secuencias</strong>, pertenecientes a otro gen, están en or<strong>de</strong>n (“Secuencia_1” es<br />
el segmento corriente arriba y “Secuencia_2” el segmento corriente abajo):<br />
http://bioinformate.unian<strong>de</strong>s.edu.co/Secuencias/Ejer05_01_02.txt<br />
Practiejemp<strong>los</strong> <strong>de</strong> repaso:<br />
1A, 1B<br />
Segundo ejercicio<br />
(Depen<strong>de</strong> <strong>de</strong>l ejercicio anterior)<br />
21