18.05.2013 Views

secuenciación de ácidos nucleicos - Instituto de Biotecnología - UNAM

secuenciación de ácidos nucleicos - Instituto de Biotecnología - UNAM

secuenciación de ácidos nucleicos - Instituto de Biotecnología - UNAM

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

INSTITUTO DE BIOTECNOLOGÍA-<strong>UNAM</strong><br />

MÉTODOS FISICOQUÍMICOS EN BIOTECNOLOGÍA:<br />

SECUENCIACIÓN<br />

DE ÁCIDOS NUCLEICOS<br />

PROYECTO DE INVESTIGACIÓN:<br />

ROSALIA DE NECOCHEA CAMPION<br />

JUAN CARLOS CANUL TEC<br />

CUERNAVACA,MOR JUNIO 2004


INDICE<br />

Algunos acontecimientos relevantes al <strong>de</strong>sarrollo <strong>de</strong> los 3<br />

métodos <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong><br />

1.0 INTRODUCCIÓN 5<br />

1.1 Los orígenes <strong>de</strong> la investigación <strong>de</strong> los <strong>ácidos</strong> nucleícos 6<br />

1.2 La i<strong>de</strong>ntificación <strong>de</strong> los componentes 7<br />

1.3 El <strong>de</strong>scubrimiento <strong>de</strong> la estructura <strong>de</strong>l ADN 8<br />

2.0 FUNDAMENTOS TEÓRICOS 11<br />

2.1 Estructura <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong> 11<br />

2.2 Función biológica <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong> 12<br />

3.0 DESARROLLO HISTÓRICO 13<br />

3.1 Secuenciación <strong>de</strong> <strong>ácidos</strong> <strong>nucleicos</strong> 13<br />

3.2 El método <strong>de</strong> <strong>de</strong>gradación química 17<br />

3.2.1 Ventajas y <strong>de</strong>sventajas 19<br />

3.3 El método enzimático 20<br />

3.3.1 Limitaciones <strong>de</strong>l método enzimático 21<br />

4.0 MÉTODOS CONTEMPORÁNEOS EN LA SECUENCIACIÓN 22<br />

4.1 Automatización <strong>de</strong>l método <strong>de</strong> Sanger 22<br />

4.1.1 La técnica <strong>de</strong> PCR y su relevancia a la <strong>secuenciación</strong> 23<br />

4.1.2 Polimerasa Taq 24<br />

4.1.3 Marcado <strong>de</strong> la ca<strong>de</strong>na <strong>de</strong> ADN 25<br />

4.1.4 Incorporación <strong>de</strong>l marcaje a la ca<strong>de</strong>na <strong>de</strong> ADN 26<br />

4.1.5 Secuenciación automatizada 28<br />

4.1.6 El <strong>de</strong>sarrollo <strong>de</strong> maquinas <strong>de</strong> <strong>secuenciación</strong> 29<br />

4.2 Secuenciación <strong>de</strong> ARN 31<br />

4.2.1 Métodos indirectos 31<br />

4.2.2 Métodos directos 33<br />

4.3 Resumen <strong>de</strong> enzimas utilizadas en la <strong>secuenciación</strong> 34<br />

5.0 ESTRATEGIAS Y APLICACIONES DE LA SECUENCIACIÓN DE 35<br />

ÁCIDOS NUCLEICOS<br />

5.1 Proyecto <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong>l genoma humano 35<br />

5.2 Estrategias para la <strong>secuenciación</strong> <strong>de</strong> fragmentos gran<strong>de</strong>s 37<br />

5.2.1 “Chromosome Walking” 37<br />

5.2.2 “Shotgun Sequencing” 38<br />

5.3 Otras aplicaciones 40<br />

6.0 El FUTURO DE LA SECUENCIACION 41<br />

6.1 Secuenciación por hibridización 41<br />

6.2 Secuenciación a futuro sin fragmentación <strong>de</strong> ADN 41<br />

7.0 REFERENCIAS 43<br />

1


Figuras<br />

INDICE DE TABLAS Y FIGURAS<br />

Figura 1. Las bases presentes en los <strong>ácidos</strong> <strong>nucleicos</strong> 7<br />

Figura 2. Estructura química <strong>de</strong> los nucleótidos 8<br />

Figura 3. Estructura <strong>de</strong> la doble hélice <strong>de</strong>l ADN 11<br />

Figura 4. El método <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> Maxam y Gilbert 19<br />

Figura 5. Enzimas <strong>de</strong> restricción 20<br />

Figura 6. El método <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> Sanger 21<br />

Figura 7. La reacción <strong>de</strong> PCR 23<br />

Figura 8. Secuenciadora con <strong>de</strong>tección paralela para 96 caplilares 31<br />

Figura 9. La secuenciadora ABI PRISM 3700 32<br />

Figura 10. La estrategia <strong>de</strong> “chromosome walking” 38<br />

Figura 11. La estrategia <strong>de</strong> <strong>secuenciación</strong> “shotgun” 39<br />

Figura 12. Secuenciación por hibridización 41<br />

Tablas<br />

Tabla 1. 22<br />

Descubrimientos significativos que permitieron el <strong>de</strong>sarrollo <strong>de</strong> métodos<br />

automatizados <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong> <strong>nucleicos</strong><br />

Tabla 2. 35<br />

Algunas <strong>de</strong> las enzimas que han tenido un papel importante<br />

en el <strong>de</strong>sarrollo <strong>de</strong> los métodos <strong>de</strong> <strong>secuenciación</strong><br />

2


Algunos acontecimientos relevantes al <strong>de</strong>sarrollo <strong>de</strong> los métodos <strong>de</strong><br />

<strong>secuenciación</strong> <strong>de</strong> los <strong>ácidos</strong> nucleícos<br />

1871. Johann Meisher <strong>de</strong>scribe el ácido <strong>de</strong>soxirribonucleico (ADN) en el<br />

esperma <strong>de</strong> la trucha.<br />

1944. Oswald Avery, Colin McLeod y Macyln McCarthy <strong>de</strong>muestran que el ADN<br />

es la substancia en don<strong>de</strong> resi<strong>de</strong> la información genética.<br />

1950. Erwin Chargaff <strong>de</strong>termina que las cantida<strong>de</strong>s <strong>de</strong> a<strong>de</strong>nina y timina, y <strong>de</strong><br />

citosina y guanina, son las mismas en el ADN: “reglas <strong>de</strong> Chargaff”.<br />

1952. Rosalind Franklin y Maurice Wilkins llevan a cabo estudios <strong>de</strong><br />

cristalografía <strong>de</strong> rayos X <strong>de</strong>l ADN.<br />

1953. James Watson y Francis Crick proponen el mo<strong>de</strong>lo <strong>de</strong> la doble hélice <strong>de</strong>l<br />

ADN.<br />

1958. Matthew Meselson y Frank Stahl <strong>de</strong>muestran que la replicación <strong>de</strong>l ADN<br />

es semiconservativa.<br />

1960. Arthur Kornberg <strong>de</strong>scubre y aísla la enzima ADN polimerasa.<br />

1961. Marshall Niremberger y Severo Ochoa establecen el código genético<br />

universal.<br />

1968. Matthew Meselson y Robert Yuan aíslan la primera endonucleasa <strong>de</strong><br />

restricción.<br />

1977. Allan Maxam y Walter Gilbert, y Fre<strong>de</strong>rick Sanger et al., <strong>de</strong>sarrollan<br />

simultáneamente métodos para la <strong>de</strong>terminación <strong>de</strong> la secuencia <strong>de</strong><br />

nucleótidos <strong>de</strong>l ADN.<br />

1978. F. Sanger y su equipo reportan la secuencia genómica completa <strong>de</strong>l<br />

virus øX174.<br />

1981. Se reporta la secuencia <strong>de</strong>l genoma <strong>de</strong> la mitocondria humana.<br />

1983. Marvin Carruthers y Leroy Hood <strong>de</strong>sarrollan un método para secuenciar<br />

automáticamente fragmentos <strong>de</strong> ADN <strong>de</strong> 5 a 75 pares <strong>de</strong> bases.<br />

3


1986. Leroy Hood y Lloyd Smith <strong>de</strong>sarrollan el primer secuenciador automático,<br />

que usa un láser que reconoce marcadores <strong>de</strong> fluorescencia en el ADN.<br />

1987. Kary Mullis <strong>de</strong>sarrolla la técnica <strong>de</strong> PCR que permite amplificar millones<br />

<strong>de</strong> veces fragmentos específicos <strong>de</strong> ADN.<br />

1988. Por iniciativa <strong>de</strong> Watson, el <strong>Instituto</strong> Nacional <strong>de</strong> Salud en EUA,<br />

establece la Oficina para la Investigación <strong>de</strong>l Genoma Humano.<br />

1990. Tres grupos <strong>de</strong>sarrollan simultáneamente el método <strong>de</strong> electroforesis<br />

capilar, que optimiza la automatización <strong>de</strong> los métodos <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong>l<br />

ADN.<br />

Se inicia el Proyecto <strong>de</strong>l Genoma Humano.<br />

1995. Se reporta la primera secuencia completa <strong>de</strong>l genoma <strong>de</strong> un organismo<br />

vivo, el <strong>de</strong> la bacteria Haemophilus influenzae.<br />

1996. Se reporta la primera secuencia <strong>de</strong>l genoma <strong>de</strong> un eucarionte, el <strong>de</strong> la<br />

levadura Saccharomyces cerevisiae.<br />

1998. Se reporta la primera secuencia <strong>de</strong>l genoma <strong>de</strong> un animal; el <strong>de</strong><br />

Caenorhabditis elegans.<br />

1999. Se reporta la secuencia nucleotídica <strong>de</strong>l cromosoma humano 22.<br />

2000. Se reporta la primera secuencia <strong>de</strong>l genoma <strong>de</strong> una planta, el <strong>de</strong><br />

Arabidopsis thaliana.<br />

2001. Se reporta por dos grupos en forma simultánea, la secuencia<br />

nucleotídica <strong>de</strong>l genoma humano.<br />

2002. Se reportan las secuencias nucleotídicas <strong>de</strong> los genomás <strong>de</strong>l ratón (Mus<br />

musculus) y <strong>de</strong>l arroz (Oryza sativa).<br />

4


1.0 INTRODUCCIÓN.<br />

El lento y tortuoso progreso que acompañó los inicios <strong>de</strong> la investigación <strong>de</strong> los<br />

<strong>ácidos</strong> <strong>nucleicos</strong> es representativo <strong>de</strong> lo limitado <strong>de</strong> las técnicas y la falta <strong>de</strong><br />

facilida<strong>de</strong>s en los períodos tempranos <strong>de</strong> la bioquímica. Las dificulta<strong>de</strong>s<br />

encontradas por los investigadores fueron muchas. Era difícil asegurar la<br />

homogeneidad <strong>de</strong>l material <strong>de</strong> trabajo. No existían métodos establecidos para<br />

el estudio <strong>de</strong> macromoléculas, y tampoco pautas para el aislamiento <strong>de</strong><br />

unida<strong>de</strong>s estructurales. Afortunadamente, algunas substancias cercanamente<br />

relacionadas fueron sintetizadas por químicos orgánicos en experimentos que<br />

usualmente no estaban relacionados con los <strong>ácidos</strong> <strong>nucleicos</strong>. Si la<br />

investigación <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong> <strong>de</strong>be mucho a la química orgánica en su<br />

período inicial, el trabajo conjunto <strong>de</strong> la biología y la química han hecho <strong>de</strong> la<br />

investigación contemporánea <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong> una rica fuente <strong>de</strong><br />

<strong>de</strong>scubrimiento e invención que ha transformado y mejorado la condición<br />

humana.<br />

En general, los <strong>ácidos</strong> <strong>nucleicos</strong> son polímeros lineales <strong>de</strong> nucleótidos.<br />

Pue<strong>de</strong>n tener <strong>de</strong>s<strong>de</strong> 80 nucleótidos, como en el tARN, hasta más <strong>de</strong> 10 8 pares<br />

<strong>de</strong> nucleótidos en un cromosoma eucariótico. El cromosoma <strong>de</strong> Escherichia<br />

coli tiene 4 x 10 6 pares <strong>de</strong> bases, 4Mpb. El ADN genómico <strong>de</strong> una sola célula<br />

humana tiene 3,900 Mpb. A un laboratorio <strong>de</strong> la mitad <strong>de</strong> la década <strong>de</strong> los<br />

setentas le habría tomado dos meses secuenciar 150 nucleótidos.<br />

Actualmente, un laboratorio especializado es capaz <strong>de</strong> secuenciar varios<br />

millones <strong>de</strong> nucleótidos al día. Des<strong>de</strong> esta perspectiva, resulta notoria la<br />

capacidad <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong> <strong>nucleicos</strong> <strong>de</strong> las tecnologías disponibles<br />

actualmente. Y es principalmente, el <strong>de</strong>sarrollo y la automatización <strong>de</strong> los<br />

métodos fisicoquímicos <strong>de</strong> macromoléculas biológicas, en general, lo que ha<br />

permitido lograr estos avances en el conocimiento <strong>de</strong>l material genético.<br />

A finales <strong>de</strong>l siglo pasado, se secuenciaron los primeros genomás,<br />

correspondientes a las bacterias Haemophilus Influenzae y Mycobacterium<br />

genitalium. Esfuerzos más recientes han permitido la <strong>de</strong>terminación <strong>de</strong><br />

secuencias genómicas más complejas. El primer eucarionte secuenciado fue<br />

Saccharomyces cerevisiae. Posteriormente se reportaron las secuencias <strong>de</strong> los<br />

genomás <strong>de</strong> Caenorhabditis elegans, <strong>de</strong> Drosophila melanogaster y <strong>de</strong><br />

Arabidopsis thaliana. A principios <strong>de</strong>l año 2001, dos grupos, <strong>de</strong> manera<br />

simultánea e in<strong>de</strong>pendiente, reportaron la secuencia <strong>de</strong>l genoma humano, y a<br />

fines <strong>de</strong>l año 2002 se reportó el genoma <strong>de</strong>l ratón y <strong>de</strong>l arroz.<br />

5


Con la <strong>de</strong>terminación <strong>de</strong> la secuencia nucleotídica <strong>de</strong>l genoma humano y<br />

la <strong>de</strong> otros organismos nos hemos a<strong>de</strong>ntrado en el conocimiento <strong>de</strong> la célula.<br />

Conociendo la secuencia <strong>de</strong> todos los genes <strong>de</strong> un organismo, es posible<br />

<strong>de</strong>ducir su proteoma. Asimismo, con la información que se tiene, es posible<br />

empezar el estudio integral y global <strong>de</strong> las re<strong>de</strong>s metabólicas y conocer la<br />

manera en que una célula regula la expresión genética en diferentes<br />

condiciones metabólicas. Sin embargo, este nuevo conocimiento es preliminar.<br />

Si bien po<strong>de</strong>mos enlistar todos los genes <strong>de</strong> una célula, la <strong>de</strong>terminación <strong>de</strong> las<br />

posibles interacciones entre sus productos es una meta a largo plazo todavía.<br />

Hay, pues, mucho más que conocer para enten<strong>de</strong>r el proceso mismo <strong>de</strong> la<br />

vida.<br />

En este trabajo se expone una breve perspectiva histórica <strong>de</strong> algunos <strong>de</strong><br />

los hechos que han repercutido sensiblemente en el avance <strong>de</strong> las tecnologías<br />

para la <strong>secuenciación</strong> <strong>de</strong> los <strong>ácidos</strong> nucleícos. Des<strong>de</strong> el tortuoso camino que<br />

llevo a la elucidación <strong>de</strong> la estructura <strong>de</strong> la doble hélice, pasando por los<br />

esfuerzos iniciales para <strong>de</strong>sentrañar el lenguaje <strong>de</strong>l ADN (y <strong>de</strong> la vida) y los<br />

esfuerzos más recientes que inauguraron la era <strong>de</strong> la genómica. Una mirada<br />

hacia atrás siempre es importante, no sólo porque ayuda a consolidar los<br />

conceptos <strong>de</strong> una materia en particular, sino también porque se pue<strong>de</strong><br />

apren<strong>de</strong>r <strong>de</strong> las experiencias <strong>de</strong> otros. A<strong>de</strong>más, se presentan los fundamentos<br />

teóricos y físicos relacionados con la química <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong>.y su<br />

<strong>secuenciación</strong>. Finalmente, se citan algunas <strong>de</strong> las aplicaciones que han<br />

permitido profundizar en el conocimiento <strong>de</strong>l material genético <strong>de</strong> las células.<br />

1.1 Los orígenes <strong>de</strong> la investigación <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong>.<br />

La historia <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong> iniciando en 1869, con los estudios<br />

<strong>de</strong>l bioquímico sueco Friedrich Miescher. En Tuebingen, Miescher extrajo un<br />

material <strong>de</strong> una fracción nuclear <strong>de</strong> leucocitos presentes en pus obtenido <strong>de</strong><br />

vendajes quirúrgicos. El material extraído, al cual <strong>de</strong>nomino nucleína, era rico<br />

en fósforo. En 1870, Miescher se movió a Basel, don<strong>de</strong> encontró que el<br />

extracto <strong>de</strong> esperma <strong>de</strong> salmón era una gran fuente <strong>de</strong> nucleína. La nucleína<br />

era una substancia albuminoi<strong>de</strong> y fuertemente ácida, combinada con una base<br />

nitrogenada que Miescher cristalizó y llamo protamina. De hecho, la nucleína<br />

era en realidad una nucleoproteína. Richard Altmann (1889) obtuvo el primer<br />

material libre <strong>de</strong> proteína, al cual dio el nombre <strong>de</strong> ácido nucleico. Jules<br />

Piccard, compañero <strong>de</strong> Miescher en Basel, hizo más estudios con la nucleína y<br />

encontró que también contenía guanina e hipoxantina. Sin embargo, ni<br />

Meischer, ni sus colegas y sucesores se imaginaron que el ácido nucleico<br />

pudiera llevar mensajes complejos en patrones repetidos <strong>de</strong> componentes más<br />

pequeños (Levine y Suzuki, 2000). La botella con el inocente polvo blanco se<br />

6


quedó en el anaquel <strong>de</strong>l laboratorio. Tuvieron que pasar varias décadas para<br />

revelar que, <strong>de</strong> hecho, era una botella <strong>de</strong> genes.<br />

1.2 La i<strong>de</strong>ntificación <strong>de</strong> los componentes.<br />

Lentamente se fueron llevando a cabo estudios más exactos para la<br />

i<strong>de</strong>ntificación <strong>de</strong> los componentes <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong>. La guanina (G)<br />

había sido aislada <strong>de</strong>l guano; sin embargo, su relación con los <strong>ácidos</strong> <strong>nucleicos</strong><br />

se estableció hasta 1910, al compararla con el nucleósido que Phoebus<br />

Levene obtuvo <strong>de</strong>l ácido guanílico. Albrecht Kossel y A. Neumann aislaron la<br />

a<strong>de</strong>nina (A) y la timina (T) <strong>de</strong> la glándula <strong>de</strong>l timo. Ascoli y Steu<strong>de</strong>l<br />

<strong>de</strong>scubrieron la citosina (C) y el uracilo (U) (Schlenk, 1988).<br />

La ribosa y la <strong>de</strong>soxirribosa fueron aisladas por Levene en 1909 y 1930,<br />

respectivamente. En ambos casos, el aislamiento <strong>de</strong> los nucleósidos fue un<br />

requisito para proveer el material inicial. La hidrólisis con piridina <strong>de</strong>l ácido<br />

nucleico <strong>de</strong> levadura produjo fosfatos y los nucleósidos a<strong>de</strong>nosina, citosina,<br />

guanosina y uridina. Levene <strong>de</strong>terminó que en todos los nucleósidos la pentosa<br />

era una ribosa y nombró al ácido original como ácido ribonucleico (ARN). Los<br />

nucleósidos fueron i<strong>de</strong>ntificados como <strong>de</strong>rivados <strong>de</strong> las bases A, C, G y U<br />

(figura 1). En 1929, Levene i<strong>de</strong>ntificó la <strong>de</strong>soxirribosa <strong>de</strong>l ácido nucleico aislado<br />

<strong>de</strong>l tejido <strong>de</strong> la pantorrilla, al cual <strong>de</strong>nominó ácido <strong>de</strong>soxirribonucleico (ADN).<br />

Este ácido exhibía una mayor resistencia a la hidrólisis química que el ARN, y<br />

consiguió <strong>de</strong>gradarlo con enzimás, seguido <strong>de</strong> la hidrólisis ácida <strong>de</strong> sus<br />

<strong>de</strong>soxinucleótidos.<br />

En 1935, se <strong>de</strong>scubrió que el ADN podría ser cortado enzimáticamente<br />

en mononucleótidos, en presencia <strong>de</strong> arsenato. Usando este procedimiento,<br />

Klein y Thannhauser obtuvieron los <strong>de</strong>soxirribonucleótidos y establecieron que<br />

cada nucleótido está unido por un enlace fosfodiéster <strong>de</strong>l hidroxilo 5´ al<br />

hidroxilo 3´ <strong>de</strong> su otro vecino (figura 2).<br />

Figura 1. Las bases presentes en los<br />

<strong>ácidos</strong> <strong>nucleicos</strong>. Las bases guanina<br />

(G), a<strong>de</strong>nina (A) y citosina (C) existen<br />

en el ADN y el ARN. La timina (T) sólo<br />

se encuentra en el ADN y es<br />

substituida en el ARN por el uracilo<br />

(U). Estas bases están unidas<br />

covalentemente a los azúcares<br />

<strong>de</strong>soxirribosa y ribosa, para formar<br />

así los nucleótidos <strong>de</strong>l ADN y ARN,<br />

respectivamente (ver figura 3).<br />

7


De manera lenta y errática, las i<strong>de</strong>as provenientes <strong>de</strong> diversos campos<br />

empezaron a señalar al ADN como un participante <strong>de</strong> importancia en la vida <strong>de</strong><br />

la célula. El trabajo <strong>de</strong> Fred Griffith en 1928 y el <strong>de</strong> los investigadores Oswald<br />

Avery, Colin McLeod y Macyln McCarthy, en 1944, permitió <strong>de</strong>mostrar<br />

inequívocamente que la información genética resi<strong>de</strong> en el ADN. Esta<br />

contribución dio lugar a que un importante esfuerzo científico se enfocara en la<br />

<strong>de</strong>terminación <strong>de</strong> la composición y la estructura química <strong>de</strong> la molécula <strong>de</strong>l<br />

ADN. Pese a lo anterior, durante algún tiempo muchos bioquímicos insistieron<br />

en que el ADN era una molécula <strong>de</strong>másiado “tonta” como para llevar mucha<br />

información; los componentes <strong>de</strong>l ADN parecían muy simples y repetitivos<br />

como para ser portadores <strong>de</strong> información.<br />

Figura 2. Estructura<br />

química <strong>de</strong> los (a)<br />

ribonucleótidos y (b)<br />

<strong>de</strong>soxirribonucleótidos<br />

, constituyentes <strong>de</strong> los<br />

<strong>ácidos</strong> <strong>nucleicos</strong>. En el<br />

ARN, el C-1´ <strong>de</strong> la Dribosa<br />

está unido al N-<br />

9 <strong>de</strong> A o G, o al N-1 <strong>de</strong><br />

C o U. En el ADN, la 2´<strong>de</strong>soxi-D-ribosa<br />

está<br />

unida <strong>de</strong> la misma forma a las cuatro bases, pero la T toma el lugar <strong>de</strong>l U (los<br />

números con til<strong>de</strong> se refieren a los átomos <strong>de</strong> la pentosa; los números sin til<strong>de</strong> se<br />

refieren a los <strong>de</strong> la base nitrogenada). Los grupos fosfato pue<strong>de</strong>n estar unidos al<br />

C3´ o al C5´ <strong>de</strong> la pentosa. Si el grupo fosfato está ausente, el compuesto es un<br />

nucleósido. En todos los nucleótidos y nucleósidos naturales, el enlace Nglicosídico<br />

que une la base nitrogenada al C1´ <strong>de</strong>l azúcar es <strong>de</strong> configuración _<br />

(Voet & Voet, 1995).<br />

1.3 El <strong>de</strong>scubrimiento <strong>de</strong> la estructura <strong>de</strong>l ADN.<br />

A mediados <strong>de</strong>l siglo pasado, los investigadores no pudieron avanzar<br />

más en la elucidación <strong>de</strong> la estructura primaria <strong>de</strong>l ADN. Ninguno <strong>de</strong> los<br />

requerimientos claves para la <strong>de</strong>terminación <strong>de</strong> la secuencia estaba a la mano:<br />

no habían métodos para obtener muestras puras <strong>de</strong> ADN con una secuencia<br />

<strong>de</strong> bases homogénea, y tampoco estaban disponibles métodos para el corte <strong>de</strong><br />

ca<strong>de</strong>nas <strong>de</strong> ADN en una base específica. Consecuentemente, toda la atención<br />

se centró en la estructura secundaria.<br />

Dos experimentos in<strong>de</strong>pendientes <strong>de</strong>mostraron que el ADN poseía una<br />

estructura secundaria or<strong>de</strong>nada. Ambos <strong>de</strong>jaron información vital para sus<br />

8


sucesores, sin embargo, cada contribución tenía un error. En 1938, William<br />

Astbury obtuvo un patrón <strong>de</strong> difracción <strong>de</strong> rayos-x <strong>de</strong> fibras secas <strong>de</strong> ADN, y<br />

<strong>de</strong>dujo que el espacio <strong>de</strong> 3.34 Å a lo largo <strong>de</strong>l eje <strong>de</strong> la fibra correspondía al <strong>de</strong><br />

una sucesión cercana <strong>de</strong> nucleótidos planos. Éstos sobresalían<br />

perpendicularmente a lo largo <strong>de</strong>l eje <strong>de</strong> la molécula para formar una estructura<br />

relativamente rígida. Algunos años <strong>de</strong>spués, J. Gulland estudió la viscosidad y<br />

la birrefringencia <strong>de</strong> flujo <strong>de</strong>l ADN y postuló la presencia <strong>de</strong> puentes <strong>de</strong><br />

hidrógeno que unían a los grupos hidroxilo <strong>de</strong> la piridina y la purina y a algunos<br />

<strong>de</strong> los grupos aminos. Desafortunadamente, utilizó las formás tautoméricas<br />

enol para la timina y la guanina. La importancia <strong>de</strong> las formás tautoméricas<br />

correctas (ceto), se reconoció hasta 1953.<br />

Erwin Chargaff estudió la composición <strong>de</strong>l ADN <strong>de</strong> una amplia variedad<br />

<strong>de</strong> fuentes. Mediante cromatografía en papel separó los productos <strong>de</strong> la<br />

hidrólisis <strong>de</strong>l ADN y con espectroscopia ultravioleta cuantificó sus abundancias<br />

relativas. Sus datos mostraron que la proporción <strong>de</strong> purinas (A+G) siempre es<br />

igual a la proporción <strong>de</strong> pirimidinas (C-T) en el ADN <strong>de</strong> cualquier organismo.<br />

Aunque la proporción (G+C)/(A+T) varía <strong>de</strong> especie a especie, diferentes<br />

tejidos <strong>de</strong> una sola especie tienen la misma composición <strong>de</strong> ADN. Cualquier<br />

estructura propuesta para el ADN tenía que consi<strong>de</strong>rar este patrón (figura 3).<br />

Los patrones <strong>de</strong> difracción <strong>de</strong> rayos X realizados por Rosalind Franklin y<br />

Maurice Wilkins revelaron que el ADN podía tener dos estructuras secundarias<br />

posibles, cuya formación <strong>de</strong>pendía <strong>de</strong> la humedad relativa a la cual se<br />

obtuvieran los datos. La forma A <strong>de</strong>l ADN se obtuvo a baja humedad. En<br />

cambio, el patrón <strong>de</strong>l B-ADN prevalece a una humedad elevada. Éste patrón<br />

entrecruzado, representativo <strong>de</strong> las estructuras helicoidales, tiene una fuerte<br />

reflexión a 0.34 nm, que indica el espaciamiento entre los pares <strong>de</strong> bases<br />

adyacentes, y una reflexión a 3.4 nm que correspon<strong>de</strong> a un giro completo <strong>de</strong> la<br />

hélice. Franklin propuso que este comportamiento requería que los grupos<br />

fosfatos estuvieran expuestos al agua en el exterior <strong>de</strong> la hélice, con el<br />

corolario <strong>de</strong> que las bases estuvieran en el interior <strong>de</strong> la hélice.<br />

En 1953, James Watson y Francis Crick <strong>de</strong>scifraron la estructura <strong>de</strong>l<br />

ADN. Watson propuso que el número <strong>de</strong> nucleótidos en la célula unitaria<br />

cristalográfica favorecía una hélice <strong>de</strong> doble ca<strong>de</strong>na. Crick <strong>de</strong>dujo <strong>de</strong> los datos<br />

<strong>de</strong>l patrón <strong>de</strong> difracción que la estructura era una díada, es <strong>de</strong>cir, que tiene una<br />

asimetría tal que las ca<strong>de</strong>nas equivalentes son antiparalelas, es <strong>de</strong>cir, corren<br />

en direcciones opuestas a lo largo <strong>de</strong>l eje longitudinal. Sólo quedaba por<br />

resolver un problema: cómo construir el núcleo <strong>de</strong> la hélice, empacando las<br />

bases juntas en una estructura regular. A partir <strong>de</strong> las conclusiones <strong>de</strong> Gulland,<br />

Watson sabía que los puentes <strong>de</strong> hidrógeno unían las bases <strong>de</strong>l ADN. Esto lo<br />

9


convenció <strong>de</strong> que la esencia <strong>de</strong> la cuestión tenía que ser una regla que<br />

gobernara los puentes <strong>de</strong> hidrógeno entre las bases.<br />

Aconsejado por Jerry Donohue, Watson manipuló mo<strong>de</strong>los <strong>de</strong> las bases,<br />

en las formás tautoméricas ceto, apareando la A con la T y la G con la C.<br />

Encontró una relación simple y convincente que involucraba dos puentes <strong>de</strong><br />

hidrógeno para una pareja A·T y tres puentes <strong>de</strong> hidrógeno para una pareja<br />

G·C. La característica especial <strong>de</strong> este esquema <strong>de</strong> apareamiento <strong>de</strong> bases es<br />

que la geometría relativa <strong>de</strong> los enlaces uniendo las bases a las pentosas es<br />

virtualmente idéntico para los pares A·T y G·C. Resultó obvio que si una purina<br />

siempre se aparea con una pirimidina, entonces una secuencia irregular <strong>de</strong><br />

bases en una ca<strong>de</strong>na sencilla <strong>de</strong> ADN podría estar apareada regularmente en<br />

el centro <strong>de</strong> una doble hélice sin pérdida <strong>de</strong> simetría. Las reglas <strong>de</strong> Chargaff<br />

fueron reveladas directamente como una consecuencia obligatoria <strong>de</strong> una<br />

estructura <strong>de</strong> doble hélice para el ADN. Sobre todo, ya que la secuencia <strong>de</strong><br />

bases <strong>de</strong> una ca<strong>de</strong>na automáticamente <strong>de</strong>termina la <strong>de</strong> su pareja, Crick y<br />

Watson pudieron visualizar fácilmente cómo una ca<strong>de</strong>na sencilla podría ser el<br />

templado para la síntesis <strong>de</strong> una segunda ca<strong>de</strong>na <strong>de</strong> secuencia <strong>de</strong> bases<br />

complementaria (figura 3).<br />

El mo<strong>de</strong>lo <strong>de</strong> Watson y Crick <strong>de</strong> la estructura <strong>de</strong>l ADN fue aceptado<br />

rápidamente porque lograba dos cuestiones importantes. Primero, daba cuenta<br />

<strong>de</strong> toda la evi<strong>de</strong>ncia química y física disponible. Segundo, abría el camino para<br />

explicar, <strong>de</strong> manera más <strong>de</strong>tallada, como lleva a cabo el ADN las funciones<br />

necesarias para ser el portador <strong>de</strong> la información hereditaria. A partir <strong>de</strong> este<br />

momento, fue aparente que toda la información requerida para especificar la<br />

diversidad <strong>de</strong> las moléculas biológicas, necesaria para llevar a cabo las<br />

funciones <strong>de</strong> la célula, había que buscarla en la secuencia irregular <strong>de</strong> las<br />

bases nucleotídicas. Alexan<strong>de</strong>r Dounce, en 1950, postuló que el ARN era el<br />

templado que dirigía la síntesis <strong>de</strong> proteínas celulares y que una secuencia <strong>de</strong><br />

tres nucleótidos especificaba solo un aminoácido. El reconocimiento <strong>de</strong> varios<br />

tipos <strong>de</strong> ARN por Robert Holley no tardó en llegar. Más a<strong>de</strong>lante, Gobind<br />

Khorana sintetizó los 64 tri-ribonucleósidos difosfato y los poli-ribonucleótidos<br />

con secuencias repetidas <strong>de</strong> di-, tri- y tetranucleótidos que fueron usados como<br />

mARN para i<strong>de</strong>ntificar cada triplete <strong>de</strong>l código. Y el establecimiento <strong>de</strong>l código<br />

genético por Marshall Niremberg y Severo Ochoa fue el evento culminante.<br />

10


Figura 3. Representación esquemática <strong>de</strong> la estructura <strong>de</strong> la doble hélice <strong>de</strong>l ADN.<br />

En el texto se explica la configuración <strong>de</strong> la estructura.<br />

2.0 FUNDAMENTOS TEORICOS.<br />

2.1 Estructura <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong>.<br />

El ADN es una doble hélice. Cada una <strong>de</strong> las hélices es un polímero<br />

integrado por millones <strong>de</strong> nucleótidos que son los monómeros <strong>de</strong>l polímero.<br />

Cada nucleótido está formado por una <strong>de</strong>soxirribosa, una base púrica o<br />

pirimídica y un grupo fosfato. Las dos ca<strong>de</strong>nas <strong>de</strong> ADN son antiparalelas y se<br />

unen entre sí a través <strong>de</strong> puentes <strong>de</strong> hidrógeno que se forman entre las bases<br />

complementarias (A·T y G·C) <strong>de</strong> las dos hebras <strong>de</strong>l ADN. De esta manera, se<br />

obtiene una estructura tipo doble hélice, don<strong>de</strong> las bases <strong>de</strong> los nucleótidos se<br />

encuentran orientadas hacia el interior, mientras que los grupos fosfato y las<br />

<strong>de</strong>soxirribosas lo hacen hacia el exterior, formando los esqueletos fosfodiéster<br />

<strong>de</strong> cada hélice (figura 3). Los pares <strong>de</strong> nucleótidos se encuentran separados<br />

entre sí por 3.4 Å, cada diez pares <strong>de</strong> nucleótidos (34 Å) se alcanza una vuelta<br />

<strong>de</strong> la hélice. La diferencia fundamental entre todas las moléculas <strong>de</strong> ADN que<br />

forman el material genético <strong>de</strong> los seres vivos es la secuencia <strong>de</strong> los millones<br />

<strong>de</strong> estos cuatro tipos <strong>de</strong> nucleótidos con sus bases A, T, G y C en cada<br />

molécula <strong>de</strong> ADN.<br />

11


Al igual que en el ADN, los estudios <strong>de</strong> la estructura <strong>de</strong>l ARN empezaron<br />

con su estructura primaria. Esta búsqueda se logró en paralelo que la <strong>de</strong>l ADN,<br />

pero tuvo la complejidad extra <strong>de</strong>l grupo hidroxilo 2´ <strong>de</strong> los ribonucleótidos. A<br />

diferencia <strong>de</strong>l ADN, las moléculas <strong>de</strong> ARN constan generalmente <strong>de</strong> ca<strong>de</strong>nas<br />

únicas <strong>de</strong> polinucleótido, <strong>de</strong>bido a que se forman copiando la secuencia <strong>de</strong><br />

bases <strong>de</strong> una ca<strong>de</strong>na <strong>de</strong> ADN. El apareamiento <strong>de</strong> las bases <strong>de</strong> Watson-Crick<br />

en el ARN es normal, aunque el tARN es una rica fuente <strong>de</strong> pares <strong>de</strong> bases<br />

inusuales. Hoy se sabe que el ARN tiene una mayor versatilidad estructural<br />

que el ADN en la variedad <strong>de</strong> sus especies, en la diversidad <strong>de</strong> sus<br />

conformaciones, y en su reactividad química. Los ARNs naturales pue<strong>de</strong>n<br />

formar estructuras <strong>de</strong> doble ca<strong>de</strong>na o adoptar una forma globular compuesta<br />

por pequeños dominios dobles conectados por segmentos <strong>de</strong> ca<strong>de</strong>na sencilla.<br />

Las dobles hélices <strong>de</strong>l ARN sólo pue<strong>de</strong>n adoptar la forma A, ya que el hidroxilo<br />

2´ <strong>de</strong> la ribosa constituye un impedimento estérico.<br />

2.2 Función biológica <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong>.<br />

Las funciones <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong> son <strong>de</strong> almacenamiento,<br />

expresión y replicación <strong>de</strong> la información biológica. En términos generales,<br />

todas las moléculas <strong>de</strong> ADN tienen una configuración similar. Sin embargo, el<br />

ADN <strong>de</strong> una <strong>de</strong>terminada especie <strong>de</strong> organismos tiene una secuencia <strong>de</strong><br />

bases propia: su estructura primaria está agrupada en unida<strong>de</strong>s funcionales<br />

llamadas genes. La información que contiene esta secuencia <strong>de</strong>sempeña<br />

diversas funciones. Los genes estructurales codifican para enzimás, proteínas<br />

estructurales y proteínas reguladoras. Otros tipos <strong>de</strong> genes codifican moléculas<br />

<strong>de</strong> ARN que no especifican la estructura primaria <strong>de</strong> un polipéptido, i.e., tARNs.<br />

El primer paso en la síntesis <strong>de</strong> proteínas es la síntesis <strong>de</strong> una molécula<br />

<strong>de</strong> ARN usando como mol<strong>de</strong> un segmento <strong>de</strong> una <strong>de</strong> las ca<strong>de</strong>nas <strong>de</strong>l ADN. En<br />

la transcripción, el or<strong>de</strong>n <strong>de</strong> los <strong>de</strong>soxirribonucleótidos <strong>de</strong> uno o varios genes<br />

se transfiere uno por uno a una secuencia <strong>de</strong> ribonucleótidos complementaria.<br />

Este proceso está mediado por la enzima ARN polimerasa; y al igual que la<br />

replicación <strong>de</strong>l ADN, siempre ocurre en la dirección 5' a 3'.<br />

Como los procariontes no tienen membrana nuclear, las moléculas <strong>de</strong><br />

ARN que se transcriben <strong>de</strong> los genes son inmediatamente traducidas a nivel <strong>de</strong><br />

los ribosomás para sintetizar las proteínas. En el caso <strong>de</strong> los eucariontes, los<br />

ARN transcritos son transportados <strong>de</strong>l núcleo al citoplasma, a través <strong>de</strong> la<br />

membrana nuclear. A<strong>de</strong>más, los genes <strong>de</strong> los eucariontes contienen intrones,<br />

estructuras <strong>de</strong> ADN que interrumpen la región <strong>de</strong>l gen que codifica para la<br />

proteína (exón). Al transcribirse un gen en los núcleos <strong>de</strong> las células <strong>de</strong> los<br />

eucariontes, el ARN resultante incluye tanto las regiones <strong>de</strong> los intrones como<br />

12


las <strong>de</strong> los exones. Esta molécula <strong>de</strong> ARN se “procesa” para dar lugar al mARN<br />

maduro que se exporta <strong>de</strong>l núcleo <strong>de</strong> la célula al citoplasma, don<strong>de</strong> luego se<br />

traduce en proteína.<br />

La información genética contenida en cada molécula <strong>de</strong> mARN se<br />

traduce en proteínas a través <strong>de</strong> un proceso enzimático que se realiza en los<br />

ribosomás. En la traducción participan principalmente tres tipos distintos <strong>de</strong><br />

ARN: el ARN ribosomal (rARN), que junto con varias proteínas forman los<br />

ribosomás; el ARN mensajero (mARN), que acarrea la información genética<br />

contenida en genes específicos <strong>de</strong>l ADN y los ARNs <strong>de</strong> transferencia (tARN),<br />

que sirven como adaptadores específicos para cada aminoácido durante el<br />

or<strong>de</strong>namiento lineal <strong>de</strong> éstos en la síntesis <strong>de</strong> proteínas, conforme la secuencia<br />

<strong>de</strong>l mARN.<br />

La síntesis <strong>de</strong> proteínas, que <strong>de</strong> facto es la traducción <strong>de</strong> la secuencia<br />

<strong>de</strong> nucleótidos presentes en el mARN, se lleva a cabo mediante la<br />

polimerización <strong>de</strong> amino<strong>ácidos</strong> en proteínas, a nivel <strong>de</strong> los ribosomás en<br />

dirección 5' a 3'. La secuencia <strong>de</strong>l mARN realiza la codificación en forma <strong>de</strong><br />

tripletes <strong>de</strong> bases (codones) <strong>de</strong> acuerdo con el código genético, incorporando<br />

en cada paso <strong>de</strong> lectura un aminoácido <strong>de</strong> la proteína. Cada tARN tiene una<br />

secuencia complementaria o anticodón para el codón <strong>de</strong>l aminoácido, que le<br />

permite reconocer el codón correcto sobre el mARN.<br />

3.0 DESARROLLO HISTORICO<br />

3.1 Secuenciación <strong>de</strong> <strong>ácidos</strong> <strong>nucleicos</strong>.<br />

Inicialmente, se pensaba que la <strong>secuenciación</strong> <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong><br />

era mucho más difícil que la <strong>de</strong> las proteínas, y muy poco progreso se hizo<br />

hasta 1960. Esto se <strong>de</strong>bió, en parte, a la falta <strong>de</strong> substratos puros <strong>de</strong>l tamaño<br />

a<strong>de</strong>cuado, con los cuales <strong>de</strong>sarrollar los métodos y en parte, a la composición<br />

<strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong>. Se esperaba que la interpretación <strong>de</strong> los resultados <strong>de</strong><br />

la <strong>secuenciación</strong> <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong> (cuatro monómeros) fuera más difícil<br />

que el <strong>de</strong> las proteínas (20 amino<strong>ácidos</strong>), y se tendrían que aislar productos <strong>de</strong><br />

<strong>de</strong>gradación más gran<strong>de</strong>s para po<strong>de</strong>r traslaparlos y <strong>de</strong>ducir sus secuencias.<br />

Por otro lado, el hecho <strong>de</strong> tener cuatro componentes solamente, se pensaba,<br />

haría más fáciles los analices finales. Al inicio, la dificultad predominante fue la<br />

interpretación <strong>de</strong> los resultados, pero a medida que las técnicas se fueron<br />

mejorando y que se fueron estudiando moléculas más largas, la cuestión <strong>de</strong>l<br />

análisis empezó a ser más importante. Hoy, la <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong><br />

<strong>nucleicos</strong> es más rápida y simple que la <strong>secuenciación</strong> <strong>de</strong> proteínas.<br />

13


La estrategia básica <strong>de</strong> la <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong> <strong>nucleicos</strong> es idéntica<br />

a la que se utiliza en la <strong>secuenciación</strong> <strong>de</strong> proteínas. Ésta involucra:<br />

1.- La <strong>de</strong>gradación específica y el fraccionamiento <strong>de</strong> los polinucleótidos<br />

<strong>de</strong> interés a fragmentos suficientemente pequeños para ser secuenciados.<br />

2.- La <strong>secuenciación</strong> <strong>de</strong> los fragmentos pequeños.<br />

3.- El or<strong>de</strong>namiento <strong>de</strong> los fragmentos a través <strong>de</strong> la repetición <strong>de</strong> los<br />

pasos anteriores, usando un procedimiento <strong>de</strong> <strong>de</strong>gradación que produce una<br />

serie <strong>de</strong> fragmentos <strong>de</strong> polinucleótidos que traslapan el punto <strong>de</strong> corte en la<br />

primera serie.<br />

El primer ácido nucleico en ser secuenciado fue el tARN Ala <strong>de</strong> levadura.<br />

La secuencia <strong>de</strong> este nucleótido <strong>de</strong> 76 bases fue realizada por Holley y<br />

colaboradores en siete años (Stewart y Letham, 1977). Ellos usaron métodos<br />

<strong>de</strong> <strong>secuenciación</strong> similares a los que se usaban para secuenciar proteínas; la<br />

hidrólisis parcial con enzimás y el fraccionamiento <strong>de</strong> los productos en<br />

columnas <strong>de</strong> intercambio iónico. El grupo <strong>de</strong> Holley introdujo el uso <strong>de</strong> la<br />

ribonucleasa T1 (<strong>de</strong> Aspergillus oryzae), la cual corta ARN <strong>de</strong>spués <strong>de</strong> residuos<br />

<strong>de</strong> guanina y <strong>de</strong> la ribonucleasa pancreática A, que corta <strong>de</strong>spués <strong>de</strong> residuos<br />

pirimídinicos.<br />

Poco <strong>de</strong>spués, Fre<strong>de</strong>rick Sanger y sus colaboradores dirigieron sus<br />

esfuerzos para <strong>de</strong>sarrollar técnicas <strong>de</strong> fraccionamiento más rápidas y simples,<br />

las cuales permitieron la <strong>secuenciación</strong> <strong>de</strong> ARN y luego <strong>de</strong> ADN. El grupo <strong>de</strong><br />

Sanger marcó el ARN con 32 P, y pudo <strong>de</strong>tectarlo mediante autoradiografías.<br />

A<strong>de</strong>más, introdujeron un método más sencillo para fraccionar los<br />

oligonucleótidos. Una técnica <strong>de</strong> separación bidimensional, con electroforesis<br />

en acetato <strong>de</strong> celulosa, seguido <strong>de</strong> la electroforesis <strong>de</strong> intercambio iónico en<br />

papel. Siguiendo este enfoque general, el grupo <strong>de</strong> Sanger <strong>de</strong>sarrollo varios<br />

métodos para estudiar los nucleótidos aislados (Sanger, 1988).<br />

Uno <strong>de</strong> los métodos consistía en someter a los oligonucleótidos<br />

digeridos con la ribonucleasa T1, a una digestión parcial con una exonucleasa<br />

5´ y correr los productos en una electroforesis sobre papel <strong>de</strong> dietilaminoetil<br />

(DEAE)-celulosa a pH 1.9. La <strong>de</strong>gradación secuencial <strong>de</strong>l extremo 5´ da una<br />

mezcla <strong>de</strong> fragmentos, en don<strong>de</strong> todos tienen el mismo extremo 3´ pero<br />

difieren en sus extremos 5´. En la electroforesis los fragmentos se or<strong>de</strong>nan por<br />

tamaño, y <strong>de</strong> la posición relativa <strong>de</strong> dos bandas adyacentes es posible<br />

i<strong>de</strong>ntificar la naturaleza <strong>de</strong> los nucleótidos, por los cuales ellos difieren. Otro<br />

método exitoso fue la técnica “correría <strong>de</strong> puntos” (“wan<strong>de</strong>ring spot”). Se<br />

14


<strong>de</strong>sarrolló un sistema bidimensional en el que primero se digería con una<br />

exonucleasa y los fragmentos obtenidos se or<strong>de</strong>naban <strong>de</strong> acuerdo a su<br />

tamaño, <strong>de</strong> tal manera que cada punto difería <strong>de</strong>l punto siguiente por un<br />

nucleótido. El sistema fue arreglado para que las posiciones relativas <strong>de</strong> dos<br />

puntos vecinos <strong>de</strong>pendieran <strong>de</strong> los nucleótidos por los cuales diferían. El<br />

método fue extendido para usarse con digestiones más complejas, pero no fue<br />

posible distinguir la A <strong>de</strong> la G con absoluta certidumbre. Con estos métodos, se<br />

secuenció el ARN ribosomal 5S <strong>de</strong> 120 residuos (Sanger, 1988). El arte <strong>de</strong><br />

secuenciar ARN por estás técnicas alcanzó su cenit en 1976, con la<br />

<strong>secuenciación</strong> <strong>de</strong>l genoma <strong>de</strong> 3,569 nucleótidos <strong>de</strong>l bacteriofago MS2 por<br />

Walter Fiers.<br />

El principal problema con la <strong>secuenciación</strong> <strong>de</strong>l ADN era su talla muy<br />

larga; el ADN más pequeño que se encontraba disponible era el <strong>de</strong> genomas<br />

<strong>de</strong> bacteriófagos <strong>de</strong> ca<strong>de</strong>na simple, <strong>de</strong> cerca <strong>de</strong> 5000 nucleótidos, como el<br />

øX174. Y éstos eran muy largos para po<strong>de</strong>r secuenciarlos con los métodos que<br />

existían hasta ese momento. Otra dificultad era la falta <strong>de</strong> enzimas <strong>de</strong><br />

restricción a<strong>de</strong>cuadas. No existía una enzima con una especificidad análoga a<br />

la <strong>de</strong> la ribonucleasa T1 para el ADN.<br />

Alre<strong>de</strong>dor <strong>de</strong> 1973, se usaron técnicas similares a las empleadas con el<br />

ARN para secuenciar ADN, y se pudieron <strong>de</strong>terminar unas pocas secuencias<br />

<strong>de</strong> unos 50 residuos. Sin embargo, los métodos eran lentos y laboriosos, y<br />

resultó obvio que si se iban a atacar secuencias vastas <strong>de</strong> materiales<br />

genéticos, se necesitaba un nuevo enfoque. Una alternativa a la hidrólisis<br />

parcial fue usar técnicas <strong>de</strong> copiado enzimático para la <strong>secuenciación</strong>. C.<br />

Weissmann y sus colaboradores <strong>de</strong>scubrieron que el bacteriófago Q_ tiene una<br />

ARN polimerasa que copia su propio ARN y <strong>de</strong>sarrollaron técnicas para marcar<br />

el ARN y <strong>de</strong>ducir su secuencia. La enzima obvia para copiar el ADN fue la ADN<br />

polimerasa.<br />

Un enfoque elegante para conseguir la digestión específica <strong>de</strong>l ADN,<br />

que pudo ser combinado con un procedimiento <strong>de</strong> copiado, fue sugerido por C.<br />

Chamberlin en 1963. La técnica hace referencia a que en condiciones<br />

normales los substratos <strong>de</strong> la ADN polimerasa son los <strong>de</strong>soxirribonucleósidos<br />

trifosfatos, pero si se remplaza el magnesio por manganeso en el medio, se<br />

pue<strong>de</strong>n usar ribonucleósidos trifosfatos. Si la incubación se hace con un<br />

ribonucleósido trifosfato, por ejemplo, el rCTP y tres <strong>de</strong>soxirribonucleósidos<br />

trifosfatos, se pue<strong>de</strong> construir una ca<strong>de</strong>na <strong>de</strong> ADN con todos los dCs<br />

remplazados por rCs. Estos enlaces son lábiles en soluciones alcalinas o<br />

pue<strong>de</strong>n ser digeridos con una ribonucleasa. De esta manera, se pue<strong>de</strong><br />

15


preparar una digestión específica en C y otras digestiones similares para<br />

escindir los otros residuos.<br />

Por otra parte, la ADN polimerasa requiere un ADN <strong>de</strong> ca<strong>de</strong>na sencilla<br />

como templado y un iniciador o “primer”. Éste es un oligonucleótido que<br />

contiene un extremo 3´ libre que es complementario con una ca<strong>de</strong>na mol<strong>de</strong> <strong>de</strong><br />

ADN y funciona como punto <strong>de</strong> inicio para la adición <strong>de</strong> nucleótidos. Sanger y<br />

su grupo utilizaron como templado el ADN <strong>de</strong> ca<strong>de</strong>na sencilla <strong>de</strong>l bacteriófago<br />

f1 y sintetizaron el iniciador con base en el método <strong>de</strong>sarrollado por Khorana.<br />

Como iniciador usaron un <strong>de</strong>soxirribonucleótido con una secuencia predicha a<br />

partir <strong>de</strong> la secuencia <strong>de</strong> amino<strong>ácidos</strong>, ya conocida, <strong>de</strong> una proteína <strong>de</strong> la<br />

superficie <strong>de</strong>l bacteriófago. Con este método, pudieron <strong>de</strong>terminar la secuencia<br />

<strong>de</strong> 80 nucleótidos. Sin embargo, para po<strong>de</strong>r sintetizar otros 80 residuos,<br />

necesitaban hacer otro iniciador. Este procedimiento era todavía lento para<br />

analizar muchos fragmentos.<br />

Hasta el momento, Sanger y su grupo habían obtenido en sus<br />

experimentos ADN altamente marcado, usando el substrato radioactivo con<br />

una actividad específica alta y en bajas concentraciones. Ellos observaron que<br />

cuando usaban 32 P-ATP, los productos <strong>de</strong> ADN formados se terminaban antes<br />

<strong>de</strong> que se incorporara una A. Debido, presumiblemente, a que a la enzima le<br />

faltaba ATP. Esto les sugirió un nuevo enfoque para secuenciar ADN. Si uno<br />

pue<strong>de</strong> producir una mezcla <strong>de</strong> fragmentos con el mismo extremo 5´ (que<br />

correspon<strong>de</strong> al extremo 5´ <strong>de</strong>l iniciador) y terminarlos en posiciones 3´<br />

correspondientes a las A´s, la <strong>de</strong>terminación <strong>de</strong> los tamaños relativos <strong>de</strong> todos<br />

esos fragmentos <strong>de</strong>bería producir una medida <strong>de</strong> la posición relativa <strong>de</strong> las<br />

A´s. Esto, combinado con datos similares <strong>de</strong> los otros tres nucleótidos, es todo<br />

lo que uno necesita para la <strong>de</strong>terminación completa <strong>de</strong> una secuencia.<br />

Paralelamente, se estudiaron otros métodos <strong>de</strong> fraccionamiento, y la<br />

electroforesis en gel <strong>de</strong> acrilamida resulto ser la más eficiente. Con esta técnica<br />

se pudieron separar nucleótidos <strong>de</strong> hasta 250 residuos <strong>de</strong> acuerdo a su<br />

tamaño. En el gel, los fragmentos más pequeños migran más rápido que los<br />

más gran<strong>de</strong>s, y cada uno pue<strong>de</strong> ser separado <strong>de</strong> sus vecinos, los cuales<br />

difieren en tamaño sólo por un nucleótido. Después <strong>de</strong> introducir ligeras<br />

modificaciones, <strong>de</strong>sarrollaron el método <strong>de</strong>l “más y menos”, con el que se<br />

<strong>de</strong>terminó la mayoría <strong>de</strong> la secuencia <strong>de</strong>l bacteriofago øX174. Sin embargo, el<br />

grupo <strong>de</strong> Sanger no tardaría en <strong>de</strong>sarrollar un método más eficiente y<br />

confiable: el enzimático, que se discute más a<strong>de</strong>lante.<br />

16


Después <strong>de</strong> 1975, se realizó un progreso dramático en la tecnología <strong>de</strong><br />

la <strong>secuenciación</strong> <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong>. Tres avances hicieron esto posible:<br />

1.- El <strong>de</strong>scubrimiento <strong>de</strong> las endonucleasas <strong>de</strong> restricción, enzimás que<br />

cortan ADN <strong>de</strong> ca<strong>de</strong>na doble en secuencias específicas.<br />

2.- El <strong>de</strong>sarrollo <strong>de</strong> mejores técnicas <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> ADN.<br />

3.- El <strong>de</strong>sarrollo <strong>de</strong> técnicas <strong>de</strong> clonación que permitieron la adquisición<br />

<strong>de</strong> un segmento <strong>de</strong> ADN en las cantida<strong>de</strong>s necesarias para secuenciarlo.<br />

En 1977, se reportaron dos protocolos para la <strong>secuenciación</strong> <strong>de</strong> ADN. El<br />

primer método fue el <strong>de</strong> Maxam y Gilbert. Con este método, al igual que con el<br />

<strong>de</strong> Sanger, se obtiene una autoradiografía en don<strong>de</strong> pue<strong>de</strong> leerse una<br />

secuencia. Sin embargo, se <strong>de</strong>termina la secuencia <strong>de</strong> una molécula <strong>de</strong> ADN<br />

utilizando químicos que cortan en posiciones específicas fragmentos marcados<br />

en sus extremos 5´. El segundo método es el <strong>de</strong> Sanger. Éste utiliza un<br />

templado <strong>de</strong> ADN <strong>de</strong> ca<strong>de</strong>na sencilla para sintetizar la hebra complementaria,<br />

la cual se termina en posiciones específicas. En los dos casos, la secuencia <strong>de</strong><br />

la molécula se <strong>de</strong>termina por diferencias en los tamaños <strong>de</strong> los fragmentos<br />

generados.<br />

3.2 El método <strong>de</strong> <strong>de</strong>gradación química (Maxam and Gilbert, 1977).<br />

En este método, un fragmento <strong>de</strong> ADN <strong>de</strong> ca<strong>de</strong>na doble o sencilla se<br />

marca en los extremos 5´ o 3´ <strong>de</strong> una o ambas hebras con 32 P. Después,<br />

la muestra <strong>de</strong> ADN se divi<strong>de</strong> en cuatro alícuotas y se fragmenta en<br />

cuatro reacciones químicas distintas. Posteriormente, los fragmentos <strong>de</strong><br />

ADN generados pue<strong>de</strong>n ser separados por electroforesis en cuatro<br />

carriles distintos con base en su tamaño. Conociendo el nucleótido en el<br />

que se realizaron los cortes, se pue<strong>de</strong> inferir la secuencia <strong>de</strong> la molécula<br />

original (figura 4). Las reacciones químicas que se utilizan para<br />

fragmentar la molécula <strong>de</strong> ADN son las siguientes:<br />

1. Corte <strong>de</strong> las purinas. Las purinas a<strong>de</strong>nina y guanina se metilan<br />

con dimetil sulfato (DMS). Después, la reacción es tratada en<br />

condiciones alcalinas; la molécula <strong>de</strong> ADN se fragmenta en las<br />

purinas metiladas. Como resultado, se obtiene una serie <strong>de</strong><br />

bandas oscuras que correspon<strong>de</strong>n a las guaninas (las cuales se<br />

metilan 5 veces más rápido), y bandas claras que correspon<strong>de</strong>n a<br />

las a<strong>de</strong>ninas. Para interpretar fácilmente el patrón <strong>de</strong> bandas<br />

17


generadas, se pue<strong>de</strong> comparar contra un tratamiento que<br />

favorezca el corte <strong>de</strong> las a<strong>de</strong>ninas.<br />

2. Corte <strong>de</strong> a<strong>de</strong>ninas. Esta reacción es una variación <strong>de</strong> la anterior.<br />

Las purinas metiladas se tratan inicialmente con un ácido diluido.<br />

Esto favorece el corte <strong>de</strong> las a<strong>de</strong>ninas metiladas. Después <strong>de</strong> un<br />

tratamiento alcalino las guaninas también son cortadas. Este<br />

tratamiento genera una serie <strong>de</strong> bandas oscuras y claras que<br />

también correspon<strong>de</strong>n a las a<strong>de</strong>ninas, y las guaninas,<br />

respectivamente.<br />

3. Corte <strong>de</strong> pirimidinas. Esta reacción utiliza el reactivo hidracina,<br />

que corta las bases citosina y timina. Posteriormente, se trata con<br />

piperidina para completar la reacción.<br />

4. Corte <strong>de</strong> citosina. La presencia <strong>de</strong> NaCl 2M inhibe la reacción <strong>de</strong><br />

hidracina con tiamina, y el tratamiento posterior con piperidina,<br />

produce solamente fragmentos que terminan en citosina.<br />

Des<strong>de</strong> que se reporto este método, no se han encontrado reactivos<br />

químicos específicos que corten las bases A o T, por lo que se utiliza la<br />

estrategia <strong>de</strong> corte <strong>de</strong>scrita en la figura 4. Esta estrategia permite distinguir<br />

entre los nucleótidos que se encuentran al final <strong>de</strong> cada corte y <strong>de</strong>ducir la<br />

secuencia <strong>de</strong> ADN.<br />

18


1 2 3 4<br />

Figura 4. El método <strong>de</strong> Maxam y Gilbert para secuenciar ADN. Los números <strong>de</strong> los<br />

carriles en el gel correspon<strong>de</strong>n a los distintos tipos <strong>de</strong> corte que se <strong>de</strong>scriben en el<br />

texto.<br />

3.2.1 Ventajas y <strong>de</strong>sventajas <strong>de</strong>l método <strong>de</strong> <strong>de</strong>gradación química.<br />

La baja resolución obtenida cuando se reportó la técnica no se <strong>de</strong>bió a<br />

un factor inherente al método <strong>de</strong> Maxam-Gilbert, si no a una limitante <strong>de</strong> los<br />

geles <strong>de</strong> acrilamida. En un inicio, se consi<strong>de</strong>raba un logro po<strong>de</strong>r diferenciar el<br />

tamaño <strong>de</strong> 250 fragmentos y <strong>de</strong>terminar la secuencia <strong>de</strong> ese tamaño. El<br />

análisis <strong>de</strong> una secuencia en geles <strong>de</strong> acrilamida era complicado, ya que no se<br />

podía separar los fragmentos gran<strong>de</strong>s. Otro problema que comúnmente afecta<br />

la resolución <strong>de</strong> las bandas obtenidas en el gel es el ensanchamiento <strong>de</strong><br />

bandas cuyas secuencias favorecen la formación <strong>de</strong> estructuras secundarias.<br />

Para mejorar la resolución <strong>de</strong>l gel se ha reportado que el uso <strong>de</strong> geles <strong>de</strong><br />

acrilamida muy <strong>de</strong>lgados, en conjunto con un voltaje alto <strong>de</strong> corrimiento,<br />

produce bandas más <strong>de</strong>lgadas y mejor separadas (Sanger y Coulson, 1978).<br />

Otro aspecto <strong>de</strong>l método <strong>de</strong> Maxam-Gilbert que pue<strong>de</strong> ser un poco<br />

laborioso es la necesidad <strong>de</strong> separar y analizar individualmente las hebras <strong>de</strong>l<br />

ADN que se quiere secuenciar (Sanger et al., 1977). Esto se pue<strong>de</strong> realizar<br />

mediante enzimás <strong>de</strong> restricción (figura 5) que separen los extremos<br />

19


etiquetados para el análisis. Alternativamente, las dos hebras marcadas<br />

pue<strong>de</strong>n ser <strong>de</strong>snaturalizadas y separadas en un gel (Maxam y Gilbert, 1977).<br />

Hoy en día, el método más usado para la <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong><br />

<strong>nucleicos</strong> es el método <strong>de</strong> Sanger. Sin embargo, es justo <strong>de</strong>cir que el método<br />

<strong>de</strong> Maxam-Gilbert es el más a<strong>de</strong>cuado para <strong>de</strong>terminar la secuencia <strong>de</strong><br />

fragmentos cortos <strong>de</strong> ADN, <strong>de</strong>bido a que pue<strong>de</strong> <strong>de</strong>terminar la secuencia <strong>de</strong>s<strong>de</strong><br />

la primera base. En cambio, el método <strong>de</strong> Sanger sólo permite la lectura a<br />

partir <strong>de</strong> la base 10-20 (Tahara et al., 1990).<br />

Figura 5. Las enzimás <strong>de</strong> restricción reconocen secuencias<br />

específicas <strong>de</strong> ADN y pue<strong>de</strong>n ser utilizadas para separar las<br />

hebras etiquetadas antes <strong>de</strong> secuenciar por el método <strong>de</strong><br />

Maxam-Gilbert.<br />

3.3 El método enzimático (Sanger et al., 1977).<br />

El método <strong>de</strong> <strong>secuenciación</strong> enzimático salió casi al mismo tiempo que<br />

el <strong>de</strong> Maxam y Gilbert, pero ha sido más utilizado. Esto se <strong>de</strong>be, en gran<br />

parte, a que se han realizado gran<strong>de</strong>s avances en la automatización <strong>de</strong><br />

esta técnica, lo cual se discutirá más a<strong>de</strong>lante. El método <strong>de</strong> Sanger se<br />

basa en el uso <strong>de</strong> la ADN polimerasa para sintetizar ca<strong>de</strong>nas <strong>de</strong> ADN<br />

con una terminación específica. Con este método se generan<br />

fragmentos <strong>de</strong> ADN <strong>de</strong> todos los tamaños posibles que se puedan<br />

distinguir entre sí, por el tipo <strong>de</strong> marcaje que llevan o por la<br />

incorporación <strong>de</strong> un terminador específico. Las enzimás <strong>de</strong>l tipo <strong>de</strong> la<br />

ADN polimerasa requieren <strong>de</strong> un templado <strong>de</strong> ADN <strong>de</strong> ca<strong>de</strong>na sencilla, y<br />

realizan la síntesis <strong>de</strong> la hebra complementaria extendiéndola a partir <strong>de</strong><br />

un iniciador en dirección 5’ a 3’. Entre los componentes <strong>de</strong> la reacción se<br />

incluyen nucleótidos que no tienen un grupo hidroxilo en su extremo 3’<br />

(ddNTP), para po<strong>de</strong>r obtener una terminación especifica en las ca<strong>de</strong>nas.<br />

Una vez que el ddNTP se incorpora como el residuo terminal, evita que<br />

la ca<strong>de</strong>na <strong>de</strong> ADN sintetizada continúe extendiéndose. La incorporación<br />

<strong>de</strong> los ddNTPs es al azar, <strong>de</strong> tal forma que se obtienen fragmentos <strong>de</strong><br />

todos los tamaños posibles que terminan en un residuo especifico.<br />

En el método <strong>de</strong> Sanger (1977), la estrategia es hacer cuatro<br />

reacciones diferentes <strong>de</strong> síntesis <strong>de</strong> ADN, utilizando un ddNTP distinto<br />

en cada tubo. Con la mezcla <strong>de</strong>l nucleótido normal (dNTP) y su<br />

20


terminador (ddNTP), se pue<strong>de</strong>n generar fragmentos complementarios <strong>de</strong><br />

diferentes tamaños que terminan en el mismo nucleótido. Después,<br />

estos fragmentos se pue<strong>de</strong>n separar en un gel <strong>de</strong> electroforesis con<br />

cuatro carriles distintos, para <strong>de</strong>terminar la secuencia <strong>de</strong>l templado<br />

(figura 6).<br />

Figura 6. El método <strong>de</strong> Sanger. Cuatro reacciones con ddNTPs diferentes permiten<br />

la síntesis <strong>de</strong> distintos fragmentos con una terminación específica. Estos<br />

fragmentos se pue<strong>de</strong>n separar por electroforesis y comparando los tamaños, se<br />

pue<strong>de</strong> <strong>de</strong>terminar la secuencia <strong>de</strong>l templado.<br />

El método <strong>de</strong> Sanger tiene varias ventajas sobre el método <strong>de</strong> Maxam-<br />

Gilbert (Blackburn y Gait, 1996). Las reacciones <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong>l método<br />

enzimático se pue<strong>de</strong>n realizar en unas horas, en cambio las <strong>de</strong>l método <strong>de</strong><br />

Maxam-Gilbert tardan al menos un día. Las reacciones <strong>de</strong>l método <strong>de</strong> Sanger<br />

son más “puras”, con menos contaminantes que puedan afectar la resolución<br />

<strong>de</strong>l gel.<br />

3.3.1 Limitaciones <strong>de</strong>l método enzimático.<br />

Cuando se reportó este método para la <strong>secuenciación</strong> <strong>de</strong> ADN, se usaba<br />

el fragmento Klenow <strong>de</strong> la polimerasa I, y sólo un ciclo <strong>de</strong> síntesis (incubando a<br />

37 ºC) para obtener fragmentos <strong>de</strong> distintos tamaños. Todos los fragmentos<br />

tenían incorporados en sus ca<strong>de</strong>nas, nucleótidos marcados con<br />

21<br />

32 P. El grupo


<strong>de</strong> Sanger reportó que con esta técnica se podía <strong>de</strong>terminar una secuencia <strong>de</strong><br />

hasta 300 nucleótidos, a partir <strong>de</strong> 15 bases <strong>de</strong>l iniciador, aproximadamente. Al<br />

momento <strong>de</strong> publicar esta técnica, también reportaron que la mayor dificultad<br />

era que los ddGTPs no estaban disponibles comercialmente. Des<strong>de</strong> entonces<br />

se ha experimentado con variaciones <strong>de</strong>l protocolo original y se han realizado<br />

gran<strong>de</strong>s avances en la automatización <strong>de</strong> este método. En la tabla 1 se<br />

resumen algunos <strong>de</strong> los avances más importantes que han permitido el<br />

<strong>de</strong>sarrollo <strong>de</strong> métodos automatizados para la <strong>secuenciación</strong> <strong>de</strong> ADN.<br />

4.0 MÉTODOS CONTEMPORÁNEOS EN LA SECUENCIACIÓN<br />

4.1 Automatización <strong>de</strong>l método <strong>de</strong> Sanger<br />

En la tabla 1 se resumen algunos <strong>de</strong> los avances mas importantes que<br />

han permitido el <strong>de</strong>sarrollo <strong>de</strong> métodos automatizados para la <strong>secuenciación</strong><br />

<strong>de</strong> ADN (usando el método <strong>de</strong> Sanger).<br />

Tabla 1. Descubrimientos significativos que permitieron el <strong>de</strong>sarrollo <strong>de</strong> los<br />

métodos automatizados <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong> <strong>nucleicos</strong>.<br />

Avance Descripción Referencia<br />

Reacción en Técnica que permite la amplificación Mullis, 1990<br />

ca<strong>de</strong>na <strong>de</strong> la<br />

polimerasa<br />

(PCR)<br />

exponencial <strong>de</strong> un fragmento <strong>de</strong> ADN<br />

Polimerasa Taq Polimerasa termoestable que pue<strong>de</strong> Innis et al., 1988;<br />

utilizarse en el PCR<br />

Carballeira et al.,<br />

1990<br />

Marcaje <strong>de</strong>l El marcaje y el tipo <strong>de</strong> <strong>de</strong>tección utilizado Prober et al.,<br />

ADN para i<strong>de</strong>ntificar los fragmentos <strong>de</strong> ADN<br />

sintetizados<br />

1987; Igloi, 1998<br />

Secuenciadores Desarrollo <strong>de</strong> máquinas automatizadas Hunkapiller, et al.,<br />

automatizados con la capacidad <strong>de</strong>terminar la secuencia 1991; Lipshutz y<br />

<strong>de</strong> miles <strong>de</strong> pares <strong>de</strong> bases por día<br />

Fodor, 1994<br />

22


4.1.1 La técnica <strong>de</strong> PCR y su relevancia en la <strong>secuenciación</strong> <strong>de</strong> ADN.<br />

En 1985, el químico Kary Mullis <strong>de</strong>sarrolló la técnica <strong>de</strong> la reacción en<br />

ca<strong>de</strong>na <strong>de</strong> la polimerasa (PCR). Este método permite la amplificación<br />

exponencial <strong>de</strong> una molécula <strong>de</strong> ADN, generando millones <strong>de</strong> copias <strong>de</strong> un<br />

fragmento. Esto se lleva acabo con oligonucleótidos que contienen un grupo<br />

extremo 3´ libre, que es complementario con la ca<strong>de</strong>na mol<strong>de</strong> <strong>de</strong> ADN. Los<br />

“oligos” funcionan como punto <strong>de</strong> inicio para la adición <strong>de</strong> nucleótidos y para<br />

copiar la ca<strong>de</strong>na mol<strong>de</strong> en el PCR. Una vez que el oligonucleótido se une a su<br />

blanco, la polimerasa <strong>de</strong> ADN pue<strong>de</strong> seguir extendiendo la hebra<br />

complementaria. En una reacción típica <strong>de</strong> PCR se usan dos oligonucleótidos<br />

que flanquean la región <strong>de</strong> ADN que se <strong>de</strong>sea amplificar. El número <strong>de</strong> copias<br />

<strong>de</strong>l fragmento <strong>de</strong> ADN que se encuentra entre los dos oligonucleotidos se<br />

amplifica con varios ciclos <strong>de</strong> reacción.<br />

Cada ciclo <strong>de</strong> una reacción <strong>de</strong> PCR<br />

consta <strong>de</strong> tres pasos (figura 7):<br />

1) Desnaturalización <strong>de</strong> las hebras<br />

<strong>de</strong> ADN- El templado es el fragmento<br />

<strong>de</strong> ADN que se <strong>de</strong>sea amplificar, junto<br />

con la región que reconocen los<br />

oligonucleótidos. Para que el<br />

oligonucleótido se pueda unir, es<br />

necesario que el templado sea <strong>de</strong><br />

ca<strong>de</strong>na sencilla. Así que este paso <strong>de</strong>l<br />

PCR es para separar las ca<strong>de</strong>nas <strong>de</strong><br />

ADN, si el templado es <strong>de</strong> doble<br />

ca<strong>de</strong>na. A<strong>de</strong>más, en este paso se<br />

<strong>de</strong>shace cualquier tipo <strong>de</strong> estructura<br />

secundaria formada entre los<br />

segmentos complementarios <strong>de</strong> los<br />

oligonucleótidos y que pudiera<br />

interferir con su habilidad <strong>de</strong> unirse al<br />

templado. Típicamente, la<br />

<strong>de</strong>snaturalización <strong>de</strong>l ADN se hace<br />

con una incubación breve <strong>de</strong>l tubo <strong>de</strong><br />

reacción a una temperatura <strong>de</strong> 94 ºC.<br />

Figura 7. La reacción <strong>de</strong> PCR consiste en<br />

varios ciclos <strong>de</strong> 3 pasos. Las<br />

temperaturas y los tiempos indicados son<br />

ejemplos y varían <strong>de</strong>pendiendo <strong>de</strong> las<br />

características <strong>de</strong>l ADN que se <strong>de</strong>see<br />

amplificar.<br />

2) Temperatura <strong>de</strong> alineamiento - Esta temperatura se calcula con base en<br />

las características <strong>de</strong> los oligos que serán utilizados. La temperatura a la cual<br />

la mitad <strong>de</strong> los oligos están unidos a su blanco (Tm), se calcula tomando en<br />

cuenta el tamaño <strong>de</strong> los oligos y su contenido <strong>de</strong> GC (%GC). Después <strong>de</strong><br />

23


<strong>de</strong>snaturalizar las hebras <strong>de</strong> ADN, se incuba a una temperatura cercana a la<br />

Tm, para que los oligos puedan encontrar su región complementaria en el<br />

templado. y se unan a ella.<br />

3). Extensión <strong>de</strong> la ca<strong>de</strong>na <strong>de</strong> ADN - Este es el último paso <strong>de</strong> un ciclo <strong>de</strong><br />

reacción <strong>de</strong> PCR y normalmente se hace a 72 ºC, la temperatura óptima para<br />

la polimerasa <strong>de</strong> ADN. En este paso, la polimerasa extien<strong>de</strong> la ca<strong>de</strong>na<br />

complementaria <strong>de</strong>l templado. La síntesis <strong>de</strong> la ca<strong>de</strong>na complementaria tiene<br />

como punto <strong>de</strong> inicio el complejo oligonucleótido/templado. El tiempo <strong>de</strong><br />

incubación <strong>de</strong> este paso <strong>de</strong>pen<strong>de</strong> <strong>de</strong>l tamaño <strong>de</strong>l segmento que se <strong>de</strong>sea<br />

amplificar. Como regla general se consi<strong>de</strong>ra que la polimerasa pue<strong>de</strong> sintetizar<br />

1,000 bases por minuto. En la reacción <strong>de</strong> PCR, típicamente, se llevan acabo<br />

<strong>de</strong> 30 a 40 ciclos <strong>de</strong> estos tres pasos, para lograr la amplificación <strong>de</strong>seada.<br />

La técnica <strong>de</strong> PCR resultó relevante para la <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong><br />

<strong>nucleicos</strong> <strong>de</strong>bido a que se adaptó al método <strong>de</strong> Sanger, <strong>de</strong> tal forma que se<br />

pue<strong>de</strong> sintetizar un mayor número <strong>de</strong> copias <strong>de</strong> los fragmentos con una<br />

terminación específica. De esta forma, la señal <strong>de</strong>l marcaje que lleva cada<br />

fragmento aumenta, y es posible obtener lecturas más claras <strong>de</strong> los fragmentos<br />

gran<strong>de</strong>s, lo que a su vez, permite la lectura <strong>de</strong> secuencias más largas, una vez<br />

que se pueda superar el problema <strong>de</strong> la resolución <strong>de</strong> los geles.<br />

4.1.2 Polimerasa Taq.<br />

Cuando se <strong>de</strong>sarrolló el método <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> Sanger, se usó el<br />

fragmento Klenow <strong>de</strong> la polimerasa I <strong>de</strong> E. coli para hacer la síntesis <strong>de</strong> los<br />

fragmentos <strong>de</strong> ADN con una terminación específica (Sanger et al, 1977). En<br />

1957, se aisló la Polimerasa I y durante muchos años se pensó que era la<br />

única polimerasa que tenía E. coli (Brown, 1999). De hecho, su actividad es tan<br />

gran<strong>de</strong> que enmáscara la actividad <strong>de</strong> las otras polimerasas <strong>de</strong> esta bacteria, y<br />

hasta que se obtuvó una mutante que no producía la polimerasa I (polA), fue<br />

que se pudieron <strong>de</strong>tectar las otras enzimás (Lewin, 1997). El uso <strong>de</strong> esta<br />

enzima tiene algunas <strong>de</strong>sventajas, en comparación con las polimerasas que se<br />

aislaron <strong>de</strong> otros organismos, años <strong>de</strong>spués. La reacción <strong>de</strong> síntesis <strong>de</strong> ADN<br />

reportada por Sanger en 1977, es <strong>de</strong> un solo paso, y en esta se tienen que<br />

sintetizar todas las posibles combinaciones <strong>de</strong> fragmentos <strong>de</strong> ADN necesarios<br />

para <strong>de</strong>terminar la secuencia <strong>de</strong> un templado. La razón por la que la síntesis se<br />

realiza en un solo paso se <strong>de</strong>be a que la temperatura óptima para la actividad<br />

<strong>de</strong> Klenow es alre<strong>de</strong>dor <strong>de</strong> 37 ºC (temperatura óptima <strong>de</strong> crecimiento <strong>de</strong> E.<br />

coli). Por lo tanto, al elevar la temperatura para <strong>de</strong>snaturalizar los híbridos o<br />

estructuras secundarias <strong>de</strong>l ADN, se inactiva la Klenow, y es necesario añadir<br />

más enzima para hacer un segundo ciclo <strong>de</strong> síntesis <strong>de</strong> fragmentos <strong>de</strong> ADN.<br />

24


El uso <strong>de</strong> la Klenow para generar fragmentos <strong>de</strong> ADN en las reacciones<br />

<strong>de</strong> PCR y para síntetizarlo en la <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong> <strong>nucleicos</strong> se fue<br />

reemplazando con otras polimerasas más estables, aisladas <strong>de</strong> organismos<br />

termófilos. Una <strong>de</strong> las polimerasas más conocidas, fue aislada <strong>de</strong> Thermus<br />

aquaticus, y se le dio el nombre <strong>de</strong> Taq (Innis et al., 1988). Dedido a que esta<br />

enzima es resistente a altas temperaturas, fue posible automatizar la reacción<br />

<strong>de</strong> PCR, sin necesidad <strong>de</strong> añadir enzima nueva en cada ciclo <strong>de</strong> reacción. La<br />

temperatura <strong>de</strong> extensión <strong>de</strong> las ca<strong>de</strong>nas <strong>de</strong> ADN se realiza a 72 ºC, en lugar<br />

<strong>de</strong> 37 ºC. Al hacer el alineamiento <strong>de</strong> los oligos a una temperatura más<br />

elevada, se obtiene una mayor especificidad y homogeneidad en los<br />

fragmentos generados para la reacción.<br />

Las polimerasas termoestables que se caracterizaron a finales <strong>de</strong> los<br />

80s contribuyeron a optimizar el método <strong>de</strong> Sanger para secuenciar <strong>ácidos</strong><br />

<strong>nucleicos</strong>. En ese tiempo, se reportó la purificación <strong>de</strong> polimerasas que podían<br />

sintetizar hasta 1500 bases <strong>de</strong> ADN por minuto, y que mantenían su actividad<br />

en un intervalo amplio <strong>de</strong> temperaturas elevadas (70-80 ºC) (Carballeira et al.,<br />

1990). Con estas enzimás, por fin fue posible obtener fragmentos uniformes <strong>de</strong><br />

ADN <strong>de</strong> hasta 1000 bases y se pudo <strong>de</strong>terminar una secuencia <strong>de</strong> este tamaño<br />

(Innis et al., 1988).<br />

4.1.3 Marcado <strong>de</strong> la ca<strong>de</strong>na <strong>de</strong> ADN.<br />

Se han explorado distintas maneras <strong>de</strong> marcar la ca<strong>de</strong>na <strong>de</strong> <strong>ácidos</strong><br />

<strong>nucleicos</strong> sintetizados para la <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong> <strong>nucleicos</strong> por el método<br />

<strong>de</strong> Sanger. Originalmente, se utilizaron nucleótidos marcados con 32 P en la<br />

mezcla <strong>de</strong> síntesis y algunos <strong>de</strong> éstos se incorporaban en la ca<strong>de</strong>na (Sanger et<br />

al., 1977). Los nucleótidos incorporados al final <strong>de</strong> la ca<strong>de</strong>na (ddNTPs) no<br />

llevaban ningún marcaje ( 32 P), sólo carecían <strong>de</strong>l grupo hidroxilo 3’ para evitar<br />

que se siguiera extendiendo la ca<strong>de</strong>na. Para po<strong>de</strong>r resolver el or<strong>de</strong>n <strong>de</strong> los<br />

fragmentos sintetizados <strong>de</strong> esta forma, era necesario separarlos en un gel <strong>de</strong><br />

archilamida <strong>de</strong> cuatro carriles distintos y luego tomarle una radiografía para<br />

<strong>de</strong>tectar el marcaje ( 32 P). En los años siguientes, se exploraron otros tipos <strong>de</strong><br />

marcas que no fueran radioactivas para etiquetar estos fragmentos <strong>de</strong> ADN<br />

(Igloi, 1998). Eventualmente, los fluoróforos fueron remplazando a los isótopos<br />

radioactivos, como el método preferido <strong>de</strong> marcaje (Prober et al., 1987). La<br />

razón <strong>de</strong> esto, es que marcar moléculas <strong>de</strong> ADN con isótopos radioactivos es<br />

laborioso, tardado, peligroso y caro (Smith et al., 1985). A<strong>de</strong>más, las<br />

propieda<strong>de</strong>s <strong>de</strong> las moléculas fluorescentes han contribuido al <strong>de</strong>sarrollo <strong>de</strong><br />

técnicas automatizadas <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong> <strong>nucleicos</strong>. Por ejemplo, la<br />

posibilidad hacer todas las reacciones <strong>de</strong> terminación específica en un solo<br />

tubo (Prober et al., 1987).<br />

25


Existen muchas diferentes etiquetas para los fragmentos <strong>de</strong> ADN. Las<br />

moléculas fluorescentes tienen varias propieda<strong>de</strong>s que se adaptaron con cierta<br />

facilidad hacia el <strong>de</strong>sarrollo <strong>de</strong> métodos automatizados para la <strong>secuenciación</strong><br />

<strong>de</strong> <strong>ácidos</strong> <strong>nucleicos</strong>, y las limitaciones en su uso se han ido resolviendo. Por<br />

ejemplo, se observó que una inconsistencia en la intensidad <strong>de</strong> la señal <strong>de</strong> los<br />

distintos fragmentos, podía complicar la interpretación <strong>de</strong> la información que se<br />

obtenía <strong>de</strong>l <strong>de</strong>tector (Bennett, 2003). Experimentando con distintos fluoróforos,<br />

se han encontrado algunos que dan una señal constante y que se pue<strong>de</strong>n<br />

distinguir entre si con mayor facilidad (Rosenblum et al., 1997). También, se<br />

observó que la modificación <strong>de</strong> los di<strong>de</strong>oxynucleótidos (ddNTPs) con algún<br />

componente fluorescente, pue<strong>de</strong> causar que la migración <strong>de</strong>l fragmento <strong>de</strong><br />

ADN en un gel <strong>de</strong> acrilamida sea un poco distinta, y causar dificultad en la<br />

interpretación <strong>de</strong> la secuencia. Prober et al. (1987) encontraron que era posible<br />

usar cuatro etiquetas fluorescentes <strong>de</strong> la misma familia y que estaban<br />

estructuralmente relacionados, pero con distintos rangos <strong>de</strong> absorción. La<br />

similitud <strong>de</strong> estructura provoca que la influencia sobre la migración <strong>de</strong> los<br />

distintos fragmentos sea mínima y facilita la interpretación <strong>de</strong> la secuencia.<br />

A<strong>de</strong>más, se ha intentado variar la proporción <strong>de</strong> nucleótidos que están<br />

en la mezcla <strong>de</strong> reacción. Ansorge et al. (1990) encontraron que la polimerasa<br />

T7 tiene preferencia por algunos nucleótidos. Observaron que si se usa una<br />

proporción equimolar <strong>de</strong> cada ddNTP, marcado con una molécula fluorescente,<br />

la magnitud <strong>de</strong> la señal que se obtiene es distinta, y se incrementa en el or<strong>de</strong>n<br />

A


ADN y no existen muchas posibilida<strong>de</strong>s <strong>de</strong> que el marcaje interfiera con el<br />

proceso enzimático <strong>de</strong> la síntesis. Sin embargo, en la práctica esta región ha<br />

sido difícil <strong>de</strong> modificar enzimáticamente porque es muy inerte. Kempe et al.<br />

(1985) reportaron que <strong>de</strong>spués <strong>de</strong> una incubación <strong>de</strong> 96 horas con ARN ligasa,<br />

sólo pudieron modificar 20% <strong>de</strong>l iniciador en el extremo 5’ con un marcador <strong>de</strong><br />

biotina.<br />

2. Marcaje incorporado en la ca<strong>de</strong>na- Se pue<strong>de</strong>n incorporar nucleótidos<br />

marcados a la ca<strong>de</strong>na <strong>de</strong> ADN durante su síntesis, tal como lo hicieron Sanger<br />

et al.(1997). Es importante que el marcaje no interfiera con la actividad <strong>de</strong> la<br />

polimerasa que incorpora los nucleótidos a la ca<strong>de</strong>na. Igloi (1998) reportó que<br />

sólo dos <strong>de</strong> las polimerasas termoestables, utilizadas comúnmente en la<br />

<strong>secuenciación</strong>, aceptan dNTPs fluorescentes como sustratos. A pesar <strong>de</strong> que<br />

el marcaje <strong>de</strong> ADN fue el primero en reportarse, no se ha utilizado tan<br />

ampliamente porque no tiene ventajas claras sobre los otros métodos.<br />

3. Marcaje <strong>de</strong>l nucleótido terminal- Este método <strong>de</strong> marcaje, claramente,<br />

es el más sencillo y el mejor por varias razones. En este caso, el nucleótido<br />

responsable <strong>de</strong> la terminación (ddNTP), es el que lleva la marca. Esto asegura<br />

que todas las ca<strong>de</strong>nas sintetizadas a partir <strong>de</strong> un templado, lleven incorporado<br />

una sola marca en el mismo lugar (al final <strong>de</strong> la ca<strong>de</strong>na, en el extremo 3’). De<br />

esta manera, se obtienen fragmentos que producen bandas uniformes y cuyas<br />

secuencias se pue<strong>de</strong>n <strong>de</strong>terminar más fácilmente. Sin embargo, esta no ha<br />

sido la razón principal por la que este método ha sido el más popular. Una<br />

ventaja adicional <strong>de</strong> tener el nucleótido terminal marcado, es que se pue<strong>de</strong>n<br />

usar nucleótidos terminales que lleven cuatro tipos distintos <strong>de</strong> marcaje (uno<br />

diferente para cada nucleótido). Esto implica que las cuatro reacciones <strong>de</strong><br />

terminación específica (ddATP, ddCTP, ddGTP, y ddTTP) se pue<strong>de</strong>n llevar<br />

acabo en el mismo tubo, y ya no se tienen que hacer por separado (Prober et<br />

al., 1987). A<strong>de</strong>más, <strong>de</strong>bido a que se pue<strong>de</strong> <strong>de</strong>terminar cual es el nucleótido<br />

terminal <strong>de</strong> los fragmentos <strong>de</strong> ADN con base en su señal, es posible resolver la<br />

secuencia <strong>de</strong> un templado con sólo un carril. Las bandas que se ven, emiten<br />

una señal distinta, <strong>de</strong>pendiente <strong>de</strong>l nucleótido terminal incorporado. El hecho<br />

<strong>de</strong> que las bandas puedan ser diferenciadas con un carril, elimina la variación<br />

que pue<strong>de</strong> ocurrir entre carriles. A<strong>de</strong>más, si por alguna razón se produce<br />

terminación inespecífica (en un dNTP), no se <strong>de</strong>tecta el fragmento, porque no<br />

lleva un ddNTP marcado al final. Hoy en día, este es el método que más se<br />

utiliza para marcar las ca<strong>de</strong>nas <strong>de</strong> ADN. Kelley (1994) reportó que la<br />

información obtenida en las primeras 300 bases <strong>de</strong> la <strong>secuenciación</strong>, es más<br />

precisa (98% contra 95%) utilizando terminadores (ddNTPs) que llevan una<br />

marca fluorescente en lugar <strong>de</strong> iniciadores con una marca fluorescente.<br />

27


4.1.5 Secuenciación automatizada<br />

Los hallazgos <strong>de</strong> la década <strong>de</strong> los 80s (mejores polimerasas, PCR,<br />

marcas fluorescentes) contribuyeron al <strong>de</strong>sarrollo <strong>de</strong> máquinas automatizadas<br />

capaces <strong>de</strong> <strong>de</strong>terminar miles <strong>de</strong> bases <strong>de</strong> secuencia por día. Las primeras<br />

máquinas <strong>de</strong> <strong>secuenciación</strong> salieron a finales <strong>de</strong> los 80s. En 1986, Smith et al.<br />

reportaron una técnica <strong>de</strong> <strong>secuenciación</strong> automatizada, basada en la<br />

terminación específica con cuatro diferentes fluoróforos. La mezcla <strong>de</strong> síntesis<br />

se cargaba en un solo carril <strong>de</strong> gel, en tubo, y se usaba un <strong>de</strong>tector óptico para<br />

<strong>de</strong>terminar la absorción <strong>de</strong> cada banda, casi al final <strong>de</strong>l tubo. Esta información<br />

pasaba directamente a una computadora y permitía obtener información<br />

precisa <strong>de</strong> hasta 200 pares <strong>de</strong> bases (pb) <strong>de</strong> la secuencia. Sin embargo,<br />

habían varias áreas que podían ser optimizadas para aumentar la longitud <strong>de</strong><br />

la secuencia obtenida: (1) el tamaño, diámetro y composición <strong>de</strong>l gel<br />

electroforético, (2) los reactivos para la reacción <strong>de</strong> <strong>secuenciación</strong>, (3) las<br />

condiciones <strong>de</strong> electroforesis, (4) equipo óptico/electrónico <strong>de</strong> <strong>de</strong>tección, (5) los<br />

marcadores fluorescentes (Smith et al., 1986).<br />

Posteriormente, se experimentó con el uso <strong>de</strong> una máquina que tenía un<br />

<strong>de</strong>tector óptico capaz <strong>de</strong> leer la información <strong>de</strong> cuatro carriles (Ansorge et al.,<br />

1987). En este caso, se reportó que era posible obtener información precisa <strong>de</strong><br />

más <strong>de</strong> 400 pb, usando solo un marcador fluorescente y separando las cuatro<br />

reacciones. Sin embargo, se reportó que a pesar <strong>de</strong> las aparentes ventajas <strong>de</strong>l<br />

uso <strong>de</strong> marcadores distintos y un carril <strong>de</strong> <strong>de</strong>tección, era mejor separar las<br />

reacciones para que los resultados no se vieran afectados por las diferencias<br />

(causantes <strong>de</strong> variación en la migración electroforética) o similitu<strong>de</strong>s (espectros<br />

<strong>de</strong> absorción traslapados) entre los marcadores (Ansorge et al, 1987).<br />

Ansorge et al. (1988) reportaron el primer protocolo que usaba<br />

marcadores fluorescentes en lugar <strong>de</strong> isótopos radioactivos para el método <strong>de</strong><br />

<strong>secuenciación</strong> <strong>de</strong> Maxam-Gilbert. Utilizaron un marcador que no interfería con<br />

la <strong>de</strong>gradación <strong>de</strong> la molécula <strong>de</strong> ADN y lograron secuenciar 50<br />

oligonucleótidos <strong>de</strong> 20 bases cada uno, en un sólo gel. En este reporte, los<br />

autores <strong>de</strong>muestran que también es factible automatizar el método <strong>de</strong> Maxam-<br />

Gilbert usando fluoróforos. Sin embargo, en los años siguientes no hubo<br />

muchos avances en esta área, ya que el <strong>de</strong>sarrollo <strong>de</strong> las técnicas<br />

automatizadas <strong>de</strong> <strong>secuenciación</strong> se enfocó principalmente en mejorar el<br />

método <strong>de</strong> Sanger.<br />

En 1994, se reportó el uso <strong>de</strong> la polimerasa termoestable “SequiTherm”,<br />

que es capaz <strong>de</strong> sintetizar fragmentos gran<strong>de</strong>s con terminación específica.<br />

Esto permitió <strong>de</strong>terminar hasta 1000 bases <strong>de</strong> una secuencia por reacción<br />

28


(Zimmmerman et al., 1994). Esto fue un gran hallazgo, porque a pesar <strong>de</strong> los<br />

avances en la automatización <strong>de</strong> la <strong>secuenciación</strong> la información que se<br />

obtenía <strong>de</strong>spués <strong>de</strong> unas 400 bases <strong>de</strong> secuencia era difícil <strong>de</strong> interpretar y<br />

susceptible a error. La excepción eran reacciones <strong>de</strong> <strong>secuenciación</strong> utilizando<br />

la polimerasa T7, con la cual era posible obtener hasta 700 bases <strong>de</strong><br />

secuencia con 99% <strong>de</strong> precisión, pero esta tenia la <strong>de</strong>sventaja <strong>de</strong> no ser<br />

termoestable (Ansorge et al., 1990; Church et al., 1994).<br />

4.1.6 El <strong>de</strong>sarrollo <strong>de</strong> máquinas <strong>de</strong> <strong>secuenciación</strong><br />

Después <strong>de</strong> que Smith et al. (1986) reportaron el uso <strong>de</strong> la primera máquina<br />

automatizada que usaba un <strong>de</strong>tector óptico para obtener la información <strong>de</strong><br />

<strong>secuenciación</strong> (la cual pasaba directamente a una computadora). Se empezó a<br />

experimentar con otros equipos y variaciones <strong>de</strong> la técnica <strong>de</strong> <strong>secuenciación</strong><br />

con el objetivo <strong>de</strong> mejorar el rendimiento con estas máquinas.<br />

a) Secuenciadoras basadas en geles tipo “slab”--Estas secuenciadoras<br />

usan un gel vertical para separar los fragmentos generados durante la<br />

reacción <strong>de</strong> <strong>secuenciación</strong> y tienen distintos sistemas <strong>de</strong> <strong>de</strong>tección para<br />

leer el or<strong>de</strong>n <strong>de</strong> los marcadores fluorescentes. Meldrum (2000) hace una<br />

comparación <strong>de</strong> algunas propieda<strong>de</strong>s <strong>de</strong> las máquinas comerciales más<br />

comunes que salieron en los 1990s:<br />

ABI PRISM 377 _ Esta secuenciadora salió a finales <strong>de</strong> los 80s. Se<br />

basaba en el uso <strong>de</strong> un carril para <strong>de</strong>tectar cuatro marcadores<br />

fluorescentes distintos. Usa una cámara CCD y es capaz <strong>de</strong> leer hasta<br />

200 bases por muestra por hora. Se pue<strong>de</strong>n cargar hasta 96 muestras<br />

en un solo gel y éstos se <strong>de</strong>tectan simultáneamente.<br />

ASTRAL _ Esta máquina usa un láser <strong>de</strong> Argón para iluminar las<br />

muestras lateralmente. Pue<strong>de</strong> <strong>de</strong>tectar más <strong>de</strong> cuatro marcadores<br />

distintos por muestra y es capaz <strong>de</strong> acomodar hasta 96 muestras por<br />

gel. En un experimento típico se pue<strong>de</strong>n obtener 300 bases <strong>de</strong><br />

secuencia por muestra en un tiempo <strong>de</strong> 7-8 hrs.<br />

LI-COR Mo<strong>de</strong>lo 4200 _ Esta máquina salió en 1997 y tiene un sistema<br />

<strong>de</strong> análisis que <strong>de</strong>tecta una longitud <strong>de</strong> onda cercana al infrarrojo. Esta<br />

máquina es capaz <strong>de</strong> <strong>de</strong>tectar los productos <strong>de</strong> 2 reacciones <strong>de</strong><br />

<strong>secuenciación</strong> simultáneos y bidireccionales, produciendo 2 veces más<br />

información <strong>de</strong> cada reacción <strong>de</strong> <strong>secuenciación</strong>. Tiene 64 carriles y se<br />

producen secuencias <strong>de</strong> hasta 1000 bases <strong>de</strong> cada extremo <strong>de</strong>l<br />

templado con una precisión <strong>de</strong>l 99%.<br />

29


Había mucho interés en reducir el tiempo requerido para obtener los<br />

datos <strong>de</strong> <strong>secuenciación</strong>, dado que esto era uno <strong>de</strong> los pasos limitantes<br />

para completar proyectos <strong>de</strong> <strong>secuenciación</strong>. La compañía MJ Research,<br />

Inc. introdujo una máquina en 1998 que llamaron el sistema “HUGE”.<br />

Ésta se basaba en el uso <strong>de</strong> un gel horizontal <strong>de</strong> poliacrilamida ultra<strong>de</strong>lgado<br />

(75 µm); Tenía 96 carriles y podía leer 450 bases por carril en<br />

90 minutos (Meldrum, 2000) . Este aparato se superó en 1999, cuando<br />

se introdujo el secuenciador “Clipper”, <strong>de</strong>sarrollado por la compañía<br />

Visible Genetics, Inc. Éste era capaz <strong>de</strong> secuenciar 400 bases en 30<br />

minutos en un gel <strong>de</strong> poliacrilamida con un grosor <strong>de</strong> 50 µm, o 1000<br />

bases en menos <strong>de</strong> cuatro horas (Yager et al., 1999).<br />

b) Secuenciadoras basadas en electroforesis capilar- El segundo tipo <strong>de</strong><br />

secuenciadoras automáticas se basaba en un sistema capilar para hacer<br />

la separación <strong>de</strong> los fragmentos <strong>de</strong> distinto tamaños. Los capilares se<br />

caracterizan por tener un diámetro pequeño (≈200 µm) y permiten hacer<br />

una separación rápida <strong>de</strong> alta resolución sin calentar la muestra (Huang<br />

y Mathies, 1994). Por mucho tiempo, esta técnica <strong>de</strong> separación se vio<br />

limitada por el problema <strong>de</strong> cómo <strong>de</strong>tectar múltiples capilares sin tener<br />

que usar múltiples <strong>de</strong>tectores. Por lo tanto, a pesar <strong>de</strong>l beneficio <strong>de</strong> que<br />

la separación capilar es muy rápida (1-2 horas con excelente resolución),<br />

no podía competir con las secuenciadoras que separaban las muestras<br />

en un gel tipo “slab” (Huang y Mathies, 1994; Behr et al., 1999). En<br />

1994, Huang y Mathies reportaron el uso <strong>de</strong> un aparato con un sistema<br />

<strong>de</strong> <strong>de</strong>tección paralelo <strong>de</strong> dos fluoróforos que podía leer la información <strong>de</strong><br />

25 capilares simultáneamente. Esta máquina era aproximadamente 10<br />

veces más rápida que las secuenciadoras típicas <strong>de</strong> geles tipo “slab”.<br />

Pronto empezaron a salir otras secuenciadoras automáticas que usaban<br />

separación por electroforesis capilar, con sistemas <strong>de</strong> <strong>de</strong>tección<br />

paralelos (figura 8) para multiples capilares, por ejemplo:<br />

CEQ 2000 (Evans, 2000) _ Esta secuenciadora tiene ocho capilares con<br />

un <strong>de</strong>tector <strong>de</strong> cuatro colores. Los pasos para preparar el gel, i.e., la<br />

<strong>de</strong>snaturalización <strong>de</strong> la muestra y la carga, son automatizadas. Este<br />

sistema es capaz <strong>de</strong> <strong>de</strong>terminar 500 bases <strong>de</strong> secuencia <strong>de</strong> cada capilar<br />

en 2 horas, o leer hasta 96 muestras automáticamente en un día.<br />

Secuenciadora MCE (Behr et al., 1999) _ Esta secuenciadora se<br />

<strong>de</strong>sarrolló en el <strong>Instituto</strong> Max-Planck. Tiene una <strong>de</strong>tección paralela <strong>de</strong> 96<br />

capilares (Figura 8) y es capaz <strong>de</strong> procesar 15,000 muestras sin<br />

intervención humana.<br />

30


Figura 8. Esta secuenciadora tiene un <strong>de</strong>tector paralelo capaz <strong>de</strong> leer la información<br />

<strong>de</strong> 96 capilares simultáneamente. Luz <strong>de</strong> un láser <strong>de</strong> Argón se guía por una fibra<br />

óptica (Fi) hasta el generador (PI) que distribuye la luz <strong>de</strong> forma uniforme por todos<br />

los capilares.<br />

MegaBACE 1000 _ Esta máquina también tiene 96 capilares y es posible<br />

obtener secuencias hasta <strong>de</strong> 800 pares <strong>de</strong> bases por corrida (Meldrum, 2000)<br />

ABI PRISM 3700 _ Esta es la secuenciadora que se utiliza en el <strong>Instituto</strong> <strong>de</strong><br />

<strong>Biotecnología</strong> <strong>de</strong> la <strong>UNAM</strong> (figura 9). Pue<strong>de</strong> <strong>de</strong>tectar 5 marcadores<br />

fluorescentes distintos y correr 24 horas sin intervención humana. Cuenta con<br />

96 capilares (y 8 <strong>de</strong> reserva) y se pue<strong>de</strong> recargar hasta cuatro veces<br />

automáticamente. Se pue<strong>de</strong>n hacer hasta 500 corridas sin necesidad <strong>de</strong><br />

cambiar los capilares. Cada corrida dura aproximadamente 2.5 hrs y <strong>de</strong>tecta un<br />

promedio <strong>de</strong> 550 bases por reacción <strong>de</strong> <strong>secuenciación</strong> (Meldrum, 2000).<br />

31


Figura 9. La secuenciadora ABI PRISM 3700. Es el aparato que actualmente se tiene<br />

en el IBt-<strong>UNAM</strong>. Hay una segunda máquina en el Centro <strong>de</strong> Investigación sobre<br />

Fijación <strong>de</strong> Nitrogeno (CIFN-<strong>UNAM</strong>). Pue<strong>de</strong> correr 768 reacciones <strong>de</strong> secuencia sin<br />

atención técnica en 36 horas. La longitud <strong>de</strong> las lecturas obtenidas es <strong>de</strong> un<br />

promedio <strong>de</strong> 600-700 bases” (kinish.cifn.unam.mx/~retligen/infrastructura.htm).<br />

4.2 Secuenciación <strong>de</strong> ARN<br />

Paralelo al <strong>de</strong>sarrollo <strong>de</strong> los métodos <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> ADN, también<br />

se reportaron avances en la <strong>secuenciación</strong> <strong>de</strong> ARN. Des<strong>de</strong> que Holley<br />

secuenció un tARN para Alanina en 1965, se han <strong>de</strong>sarrollado métodos <strong>de</strong><br />

<strong>secuenciación</strong> <strong>de</strong> ARN similares a los utilizados para secuenciar ADN<br />

(Blackburn y Gait, 1996). Básicamente, los métodos <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> ARN<br />

se divi<strong>de</strong>n en 2 categorías.<br />

4.2.1 Métodos indirectos<br />

En este caso, el ARN se convierte primero a cADN con la enzima transcriptasa<br />

reversa y luego se usa el fragmento obtenido como templado para la reacción<br />

<strong>de</strong> <strong>secuenciación</strong>. En realidad, este método <strong>de</strong>termina la secuencia <strong>de</strong> una<br />

molécula <strong>de</strong> ADN a partir <strong>de</strong> la cual se infiere la secuencia <strong>de</strong> la molécula <strong>de</strong><br />

ARN. Este método indirecto es uno <strong>de</strong> los más comunes para la <strong>secuenciación</strong><br />

<strong>de</strong> ARN porque tiene todas las ventajas <strong>de</strong> la <strong>secuenciación</strong> <strong>de</strong> ADN.<br />

32


4.2.2 Métodos directos<br />

Estos métodos se utilizan para secuenciar la molécula <strong>de</strong> ARN cuando es<br />

complicado utilizar el método indirecto (Igloi, 1998). Esto suele suce<strong>de</strong>r con<br />

ARNs muy pequeños, o con estructuras secundarias extensas (ribosomales,<br />

transferencia). Todas estas técnicas requieren <strong>de</strong> que el ARN este en forma<br />

pura.<br />

a) Método enzimático-- En los primeros reportes se experimentó con una<br />

forma enzimática para secuenciar ARN directamente. En este caso,<br />

los autores Brownlee y Cartwright (1977) reportaron los resultados <strong>de</strong><br />

la <strong>secuenciación</strong> <strong>de</strong> una molécula <strong>de</strong> mARN <strong>de</strong> casi 200 pb.<br />

Utilizaron un iniciador marcado con 32 P y la transcriptasa reversa.<br />

Usando reacciones similares a las <strong>de</strong>l método <strong>de</strong> Sanger, los autores<br />

generaron fragmentos <strong>de</strong> cADN con una terminación específica dada<br />

por ddNTPs. Después, resolvieron el or<strong>de</strong>n <strong>de</strong> los fragmentos <strong>de</strong><br />

ADN generados en un gel <strong>de</strong> acrilamida. Se ha visto que la<br />

concentración <strong>de</strong>l ARN templado influye mucho en la resolución <strong>de</strong>l<br />

gel. Los autores Carpenter y Simon (1990) reportaron que cuanto<br />

mayor era la cantidad <strong>de</strong> ARN viral usado como templado, menor era<br />

la resolución obtenida en el gel <strong>de</strong> acrilamida <strong>de</strong>bido a que las<br />

bandas eran anchas, complicando la interpretación <strong>de</strong>l or<strong>de</strong>n. Ellos<br />

obtuvieron la mejor resolución utilizando 0.4 µg (0.75 pmol) <strong>de</strong> ARN<br />

como templado. En una reacción <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> rARN, Bakin y<br />

Ofengand (1992) obtuvieron la mejor resolución empleando 10 veces<br />

menos ARN, es <strong>de</strong>cir, solamente 0.13 pmol.<br />

A pesar <strong>de</strong> que se generan fragmentos <strong>de</strong> ADN, el método<br />

enzimático es un método directo porque el templado es una molécula<br />

<strong>de</strong> ARN. La marca se pue<strong>de</strong> incorporar a los fragmentos <strong>de</strong> ADN <strong>de</strong><br />

maneras alternativas a la usada por Brownlee y Cartwright en 1977.<br />

El uso <strong>de</strong> ddNTPs marcados tiene la ventaja <strong>de</strong> que los fragmentos<br />

que sufren una terminación prematura no se <strong>de</strong>tectan ni interfieren<br />

con la interpretación <strong>de</strong> la secuencia. La terminación prematura suele<br />

ser un problema más común en la <strong>secuenciación</strong> <strong>de</strong> ARN por la<br />

formación <strong>de</strong> estructuras secundarias que interfieren con la actividad<br />

<strong>de</strong> la transcriptasa reversa. A<strong>de</strong>más, la síntesis <strong>de</strong> fragmentos <strong>de</strong><br />

ADN a 37 ºC carece <strong>de</strong> las ventajas <strong>de</strong> las altas temperaturas que se<br />

pue<strong>de</strong>n usar con otras enzimas (polimerasa Taq).<br />

33


) Método químico-- En 1977 se presentó un método <strong>de</strong> ruptura química<br />

<strong>de</strong>l ARN similar al <strong>de</strong> Maxam y Gilbert (Donis-Keller et al., 1977). La<br />

molécula <strong>de</strong> ARN (en este caso ARN ribosomal) se marca con una<br />

molécula <strong>de</strong> 32 P en un extremo. Después se utilizaron nucleasas para<br />

hacer digestiones <strong>de</strong> la molécula <strong>de</strong> ARN marcado en distintos<br />

lugares. La RNAsa T1 corta las guaninas, la RNAsa U2 corta las<br />

a<strong>de</strong>ninas y una hidrólisis alcalina rompe todos los enlaces<br />

fosfodiéster (Donis-Keller et al., 1977). Se utiliza un gel <strong>de</strong> acrilamida<br />

para separar los fragmentos <strong>de</strong> estos tres tipos <strong>de</strong> ruptura, lo que<br />

permite <strong>de</strong>terminar el or<strong>de</strong>n <strong>de</strong> las guaninas, a<strong>de</strong>ninas y pirimidinas<br />

<strong>de</strong> una molécula <strong>de</strong> ARN ribosomal.<br />

A diferencia <strong>de</strong>l método enzimático, en el que se pue<strong>de</strong> usar un<br />

iniciador marcado para generar los fragmentos que serán<br />

secuenciados, el método químico requiere que la molécula <strong>de</strong> ARN<br />

sea marcada directamente. Esto se pue<strong>de</strong> hacer introduciendo una<br />

marca <strong>de</strong> 32 P en el extremo 5’ <strong>de</strong> la molécula con una cinasa T4, o en<br />

el extremo 3’ con una ligasa T4 (Blackburn and Gait, 1996).<br />

4.3 Resumen <strong>de</strong> enzimas usadas en la <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong><br />

<strong>nucleicos</strong>.<br />

En la tabla 2 se resumen algunas <strong>de</strong> las enzimas mas comunes utilizadas<br />

en la <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong> <strong>nucleicos</strong>. Estas enzimas eran entre las<br />

primeras herramientas en la biología molecular y se aprovecharon sus<br />

activida<strong>de</strong>s naturales en la <strong>secuenciación</strong> <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong>.<br />

34


Tabla 2- Algunas <strong>de</strong> las enzimas que han tenido un papel importante en el<br />

<strong>de</strong>sarrollo <strong>de</strong> los métodos <strong>de</strong> <strong>secuenciación</strong><br />

Enzima Función Referencia<br />

Fragmento Una polimerasa <strong>de</strong> ADN que utilizo Sanger en su reacción Sanger et<br />

Klenow <strong>de</strong> <strong>secuenciación</strong>. No es termoestable.<br />

al., 1977<br />

T7 Una polimerasa <strong>de</strong> ADN no termoestable que se utilizaba (Ansorge et<br />

frecuentemente en las reacciones <strong>de</strong> <strong>secuenciación</strong> con el<br />

Método Sanger. Se utilizaba frecuentemente para<br />

incorporar terminadores (ddNTPs) etiquetadas con un<br />

fluoroforo.<br />

al., 1990)<br />

Taq<br />

Una polimerasa termoestable aislada <strong>de</strong> T. aquaticus Innis et al.,<br />

polimerasa (termofilo). Fue una gran herramienta en el <strong>de</strong>sarrollo <strong>de</strong><br />

la técnica <strong>de</strong> PCR.<br />

1988<br />

Enzimas <strong>de</strong> El primero fue aislado <strong>de</strong> E. coli en 1968 por Matthew<br />

restricción Meselson y Robert Yuan. Son nucleasas que reconocen y<br />

cortan secuencias específicas <strong>de</strong> ADN (doble ca<strong>de</strong>na). Se<br />

utilizan en el método <strong>de</strong> <strong>de</strong>gradación química para aislar<br />

los fragmentos ( 32 Maxam y<br />

Gilbert,<br />

P) que serán secuenciados.<br />

1977<br />

Transcriptasa Una polimerasa <strong>de</strong> ADN que sintetiza una ca<strong>de</strong>na <strong>de</strong> ADN Brownlee y<br />

reversa utilizando una molécula <strong>de</strong> ARN como templado<br />

Cartwright,<br />

1977<br />

RNAsa T1 La RNAsa T1 corta las moléculas <strong>de</strong> ARN (ca<strong>de</strong>na sencilla) Donis-Keller<br />

en las guaninas.<br />

et al., 1977<br />

RNAsa U2 RNAsa U2 corta las moléculas <strong>de</strong> ARN (ca<strong>de</strong>na sencilla) Donis-Keller<br />

en las a<strong>de</strong>ninas.<br />

et al., 1977<br />

RNA ligasa Se utiliza para unir una marca radioactiva (<br />

32<br />

P) en el Blackburn y<br />

extremo 5’ <strong>de</strong> la molécula <strong>de</strong> ARN (ca<strong>de</strong>na sencilla). Gait, 1996<br />

Cinasa T4 Se utiliza para unir una marca radioactiva ( 32 P) en el Blackburn y<br />

extremo 3’ <strong>de</strong> la molécula <strong>de</strong> ARN (ca<strong>de</strong>na sencilla). Gait, 1996<br />

5.0 ESTRATEGIAS Y APLICACIONES DE LA SECUENCIACIÓN DE<br />

ÁCIDOS NUCLEICOS<br />

5.1 Proyecto <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong>l genoma humano<br />

Uno <strong>de</strong> los factores principales que motivó el <strong>de</strong>sarrollo <strong>de</strong> la tecnología<br />

<strong>de</strong> las secuenciadoras automáticas fue el proyecto <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong>l<br />

genoma humano. Tal vez ningún proyecto <strong>de</strong> <strong>secuenciación</strong> genómica ha<br />

recibido tanta atención como éste, concebido en Estados Unidos en 1988<br />

(Olson, 1993). En ese tiempo, la tecnología <strong>de</strong> <strong>secuenciación</strong> automatizada<br />

estaba en sus primeras etapas <strong>de</strong> <strong>de</strong>sarrollo, y era muy ambicioso intentar<br />

secuenciar un genoma <strong>de</strong> miles <strong>de</strong> millones <strong>de</strong> pb. Sin embargo, el comienzo<br />

35


<strong>de</strong> este proyecto se anunció oficialmente en 1990 por los <strong>de</strong>partamentos <strong>de</strong><br />

Salud y Energía con un presupuesto <strong>de</strong> 3 mil millones <strong>de</strong> dólares y la meta <strong>de</strong><br />

completar la secuencia en 15 años (Venter et al., 2001).<br />

¿De qué nos sirve la información <strong>de</strong> la secuencia <strong>de</strong> un genoma? De una<br />

forma muy general, los objetivos principales <strong>de</strong>l proyecto <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong>l<br />

genoma humano eran los siguientes (Olson, 1993):<br />

a) Mejorar la infraestructura <strong>de</strong> la investigación genética - La secuencia<br />

<strong>de</strong>l genoma humano permitiría la ampliación <strong>de</strong>l conocimiento<br />

genético <strong>de</strong> nuestro organismo. Se pue<strong>de</strong>n utilizar técnicas como el<br />

PCR para analizar <strong>de</strong>talladamente ciertos segmentos <strong>de</strong>l genoma.<br />

Conociendo su secuencia, se pue<strong>de</strong>n diseñar oligonucleótidos que<br />

reconocen y se unen a secuencias complementarias en el ADN.<br />

b) Comparar el papel <strong>de</strong> una secuencia <strong>de</strong> ADN en los humanos y en<br />

los organismos mo<strong>de</strong>lo – Se pue<strong>de</strong>n comparar las secuencias <strong>de</strong> los<br />

genes i<strong>de</strong>ntificados en el genoma humano con los genes <strong>de</strong> otros<br />

organismos y conocer el grado <strong>de</strong> similitud o diferencia que existe<br />

entre dos especies. También se pue<strong>de</strong> inferir la función <strong>de</strong> ciertos<br />

genes con base en los conocimientos <strong>de</strong> otro gen similar, i<strong>de</strong>ntificado<br />

en otro organismo.<br />

c) Mejorar la bioquímica analítica <strong>de</strong>l ADN - Este era el reto más gran<strong>de</strong><br />

cuando se anunció el inicio <strong>de</strong>l proyecto <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong>l<br />

genoma humano, ya que se refería a mejorar las herramientas para<br />

el análisis <strong>de</strong> ADN. Éste era un reto técnico, ya que para obtener la<br />

secuencia completa <strong>de</strong>l genoma humano en el tiempo propuesto era<br />

necesario <strong>de</strong>sarrollar la estrategia y las máquinas <strong>de</strong> <strong>secuenciación</strong><br />

con capacidad <strong>de</strong> secuenciar dos Mpb por año.<br />

La secuencia <strong>de</strong>l genoma humano se reportó en el 2001, cuatro años antes <strong>de</strong><br />

la fecha prevista (Venter et al., 2001). Esto se <strong>de</strong>be en parte a los esfuerzos <strong>de</strong><br />

más <strong>de</strong> 20 grupos internacionales que colaboraron para completar la<br />

secuencia, y a los avances en la tecnología <strong>de</strong> las secuenciadoras automaticas<br />

(la mayor parte <strong>de</strong> la secuencia se obtuvo con máquinas ABI PRISM 3700;<br />

figura 9). Pero la razón principal por la que se logró completar la secuencia fue<br />

un cambio en la estrategia <strong>de</strong> <strong>secuenciación</strong> (Internacional Human Genome<br />

Sequencing Consortium, 2001). La necesidad <strong>de</strong> tener una buena estrategia<br />

para secuenciar fragmentos gran<strong>de</strong>s <strong>de</strong> ADN (e.g, un cromosoma), fue<br />

evi<strong>de</strong>nte en el proyecto <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong>l genoma humano.<br />

36


5.2 Estrategias para la <strong>secuenciación</strong> <strong>de</strong> fragmentos gran<strong>de</strong>s <strong>de</strong> ADN.<br />

5.2.1 “Chromosome Walking”<br />

Hay dos estrategias generales para secuenciar fragmentos gran<strong>de</strong>s <strong>de</strong><br />

ADN. La primera se llama caminata cromosomal “chromosome walking”<br />

(Brown, 1999; figura 10) y consiste en lo siguiente: (1) la fragmentación parcial<br />

<strong>de</strong>l ADN para su inserción en un vector <strong>de</strong> clonación; (2) la obtención <strong>de</strong> un<br />

banco <strong>de</strong> clonas <strong>de</strong> fragmentos que contienen segmentos que se traslapan y;<br />

(3) la <strong>secuenciación</strong> <strong>de</strong> una clona y la i<strong>de</strong>ntificación <strong>de</strong> una segunda que posea<br />

la continuación <strong>de</strong>l segmento que se está secuenciando. Este proceso se<br />

repite hasta que se completa la secuencia <strong>de</strong> la molécula original <strong>de</strong> ADN (e.g.,<br />

un cromosoma).<br />

Esta estrategia se utilizó originalmente en el proyecto <strong>de</strong> <strong>secuenciación</strong><br />

<strong>de</strong>l genoma humano. Tiene la ventaja <strong>de</strong> que se asegura la obtención <strong>de</strong> la<br />

secuencia completa <strong>de</strong> la molécula original <strong>de</strong> ADN. En teoría, no se requiere<br />

hacer <strong>secuenciación</strong> redundante; sin embargo, tiene varias <strong>de</strong>sventajas que<br />

afectan el tiempo y el costo <strong>de</strong> un proyecto <strong>de</strong> <strong>secuenciación</strong>. Primero, cada<br />

clona se tiene que analizar individualmente y en serie. No se pue<strong>de</strong> secuenciar<br />

la siguiente clona hasta no conocer la primer secuencia. Segundo, se requiere<br />

la síntesis <strong>de</strong> un enorme número <strong>de</strong> iniciadores para continuar la<br />

<strong>secuenciación</strong>. Suponiendo que cada iniciador empleado es único y sirve para<br />

secuenciar sólo una parte <strong>de</strong> una clona particular, se requiere sintetizar <strong>de</strong> 5 a<br />

10% <strong>de</strong> la secuencia total (Cantor y Smith, 1999). Tomando esto en cuenta, no<br />

es sorpren<strong>de</strong>nte que hasta 1998 sólo se había secuenciado el 5% <strong>de</strong>l genoma<br />

humano (Venter et al., 2001). Era necesario un cambio <strong>de</strong> estrategia para<br />

completar la secuencia <strong>de</strong>l genoma humano en el tiempo previsto.<br />

37


Figura 10. La estrategia “chromosome walking” permite <strong>de</strong>terminar la secuencia <strong>de</strong><br />

un fragmento enorme <strong>de</strong> ADN ensamblando muchas secuencias pequeñas <strong>de</strong><br />

distintas clonas (www.bio.miami.edu/dana/250/25003_10.htm).<br />

5.2.2 “Shotgun Sequencing”<br />

La segunda estrategia general para la <strong>secuenciación</strong> <strong>de</strong> fragmentos gran<strong>de</strong>s<br />

<strong>de</strong> ADN, se llama <strong>secuenciación</strong> tipo “shotgun” (figura 11). La gran diferencia<br />

entre esta estrategia y la anterior es que en el “shotgun” la <strong>secuenciación</strong> se<br />

hace a partir <strong>de</strong> fragmentos al azar. Después, se utiliza un programa <strong>de</strong><br />

cómputo para encontrar las regiones que se traslapan entre las secuencias<br />

individuales. Así se va ensamblando la secuencia <strong>de</strong>l fragmento original<br />

(Brown, 1999). Esta estrategia <strong>de</strong> <strong>secuenciación</strong> tiene la ventaja <strong>de</strong> que es<br />

rápida, requiere la síntesis <strong>de</strong> pocos iniciadores, y tiene una eficiencia<br />

comprobada (Cantor y Smith, 1999). Una <strong>de</strong> las <strong>de</strong>sventajas <strong>de</strong> esta estrategia<br />

es que requiere la redundancia <strong>de</strong> las secuencias para asegurar la obtención<br />

<strong>de</strong> una muestra completa <strong>de</strong>l ADN original. Otra <strong>de</strong>sventaja es que se requiere<br />

mucha tecnología computacional para ensamblar la secuencia original y que a<br />

veces quedan “gaps” (regiones <strong>de</strong>l fragmento original que no se secuenciaron).<br />

Utilizando esta estrategia <strong>de</strong> <strong>secuenciación</strong>, es necesario secuenciar al menos<br />

5 veces el ADN original para po<strong>de</strong>r lograr un muestreo completo (Venter et al.,<br />

38


2001). Tal vez, esta razón es suficiente para explicar la resistencia durante<br />

tanto tiempo para la realización <strong>de</strong>l proyecto <strong>de</strong>l genoma humano,<br />

consi<strong>de</strong>rando que es un genoma al menos 25 veces más gran<strong>de</strong> que cualquier<br />

otro genoma ya secuenciado (Internacional Human Genome Sequencing<br />

Consortium, 2001). Aun cuando Weber y Myers (1997) presentaron un plan<br />

para terminar la <strong>secuenciación</strong> <strong>de</strong>l genoma humano con esta estrategia,<br />

<strong>de</strong>mostrando que sería más rápido y menos costoso, su propuesta no fue bien<br />

recibida.<br />

Figura 11. En la estrategia “shotgun” se secuencian fragmentos al azar y luego<br />

usando un programa computacional se encuentran las regiones que se traslapan<br />

para <strong>de</strong>terminar la secuencia <strong>de</strong>l fragmento original<br />

(http://www.bioteach.ubc.ca/Bioinformatics/GenomeProjects/shotgun%201.gif).<br />

En 1998 se fundó la compañía <strong>de</strong> biotecnología Celera Genomics, con el<br />

propósito <strong>de</strong> completar el proyecto <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong>l genoma humano<br />

utilizando la estrategia “shotgun” (Myers, 1999). La vali<strong>de</strong>z <strong>de</strong> esta estrategia<br />

fue establecida en el 2001 cuando Venter et al. (investigadores <strong>de</strong> Celera<br />

Genomics) reportaron que habían completado la <strong>secuenciación</strong> <strong>de</strong>l genoma<br />

humano en menos <strong>de</strong> un año.<br />

39


Al conocerse la secuencia <strong>de</strong>l genoma humano se hicieron varios hallazgos<br />

importantes (Venter et al., 2001; Internacional Human Genome Sequencing<br />

Consortium, 2001):<br />

a) El genoma está compuesto por 1% <strong>de</strong> exones, 24% <strong>de</strong> intrones y 75% <strong>de</strong><br />

regiones intergénicas.<br />

b) Hay entre 30,000 y 40,000 genes que codifican para proteínas.<br />

c) Se han i<strong>de</strong>ntificado más <strong>de</strong> 2.1 millones <strong>de</strong> polimorfismos <strong>de</strong> un solo<br />

nucleótido (SNPs) en el genoma. Éstos ocurren más o menos uno <strong>de</strong> cada<br />

1300 bases.<br />

Si se secuencia una región <strong>de</strong>l genoma <strong>de</strong> dos individuos, se encontrará que<br />

son 99.3% idénticos. En gran parte, las diferencias son cambios <strong>de</strong> una sola<br />

base conocidos como SNPs; se encontraran las dos alternativas en más <strong>de</strong> 1%<br />

<strong>de</strong> la población (Chiche et al., 2002). Dado que muchas enfermeda<strong>de</strong>s<br />

genéticas están asociadas a variaciones pequeñas como los SNPs, hay interés<br />

en utilizar la información <strong>de</strong>l proyecto <strong>de</strong>l genoma humano para i<strong>de</strong>ntificar los<br />

SNPs responsables <strong>de</strong> ciertas enfermeda<strong>de</strong>s (Tang et al., 2004).<br />

5.3 Otras aplicaciones<br />

El avance en la <strong>secuenciación</strong> <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong> ha sido una herramienta<br />

que ha generado muchos conocimientos en el campo <strong>de</strong> la genómica. Hasta el<br />

2001 se habían reportado los genomas completos <strong>de</strong> 599 virus, 185 organelos,<br />

31 eubacterias, 7 arqueobacterias, un hongo, dos animales y una planta<br />

(Internacional Human Genome Sequencing Consortium, 2001). Las<br />

ramificaciones <strong>de</strong> tener esta información son innumerables, y su valor<br />

incalculable. Entre otras cosas, nos ha permitido enten<strong>de</strong>r cómo se asocian las<br />

enfermeda<strong>de</strong>s con la variabilidad genética, la función <strong>de</strong> genes caracterizados<br />

en otros organismos, el patrón <strong>de</strong> expresión <strong>de</strong> genes nuevos, el aislamiento<br />

<strong>de</strong> genes específicos por PCR, la similitud o variación genética entre especies<br />

diferentes, la organización <strong>de</strong> la información genética, el origen <strong>de</strong> algunos<br />

genes, etc. Hay cientos <strong>de</strong> ejemplos <strong>de</strong> cada una <strong>de</strong> estas categorías. Tal vez,<br />

lo que sea más importante recordar es que no parece haber límite en las<br />

aplicaciones <strong>de</strong> la información que se obtiene <strong>de</strong> la <strong>secuenciación</strong> <strong>de</strong> los<br />

<strong>ácidos</strong> <strong>nucleicos</strong>. Gracias a esta información, se han logrado avances en la<br />

investigación <strong>de</strong> áreas como la medicina, la química, la biología molecular, la<br />

sistemática, la proteómica, y mucho más.<br />

40


6.0 El FUTURO DE LA SECUENCIACION<br />

6.1 Secuenciación por hibridización<br />

Entre otras cosas el conocimiento <strong>de</strong> la secuencia <strong>de</strong> los genomas o los<br />

genes <strong>de</strong> los organismos también ha permitido <strong>de</strong>sarrollar nuevos métodos <strong>de</strong><br />

<strong>secuenciación</strong>. Como reportan Isaksson y Lan<strong>de</strong>gren (1999) uno <strong>de</strong> estos es<br />

la <strong>secuenciación</strong> por hibridización. Una forma en la cual pue<strong>de</strong> funcionar este<br />

método es utilizando “microarrays”. Estos son soportes pequeños en los<br />

cuales se imobilian pequeños fragmentos <strong>de</strong> ADN en un or<strong>de</strong>n conocido.<br />

Después se pasa la muestra <strong>de</strong> ADN (con secuencia <strong>de</strong>sconocida) y se<br />

cuantifica el grado <strong>de</strong> hibridización, y por consecuencia el grado <strong>de</strong> i<strong>de</strong>ntidad<br />

con las secuencias fijas en el soporte (Cantor y Smith, 1999). Esto parece<br />

funcionar especialmente bien en la i<strong>de</strong>ntificación <strong>de</strong> SNPs. Wang et al. (1998)<br />

reportaron que es posible i<strong>de</strong>ntificar el genotipo <strong>de</strong> un individuo analizando 500<br />

SNPs a la vez en un experimento <strong>de</strong> hibridización con un “microarray” <strong>de</strong><br />

oligonucleotidos. Una posibilidad para la <strong>secuenciación</strong> <strong>de</strong> acidos <strong>nucleicos</strong> a<br />

futuro, que discuten los autores Cantor y Smith (1999) es el hacer hibridización<br />

contra oligonucleotidos que formen palabras <strong>de</strong> tal forma que se pueda ir<br />

<strong>de</strong>terminando la secuencia sobrelapando los fragmentos (<strong>de</strong> 6-8 nucleótidos)<br />

con los cuales híbrida el fragmento secuenciado (Figura 12).<br />

Figura 12. La forma en la cual se pue<strong>de</strong> utilizar hibridización para secuenciar. La<br />

molécula <strong>de</strong> ADN se hibridiza contra pequeños oligonucleotidos que son como<br />

“palabras”. Después, se <strong>de</strong>termina la secuencia.<br />

6.2 Secuenciación a futuro sin fragmentación <strong>de</strong> ADN<br />

Los autores Cantor y Smith (1999) presentan algunas posibilida<strong>de</strong>s <strong>de</strong> cómo<br />

puedan evolucionar los métodos en la <strong>secuenciación</strong> <strong>de</strong> acidos <strong>nucleicos</strong>. Las<br />

posibilida<strong>de</strong>s se discuten en función <strong>de</strong> que po<strong>de</strong>r secuenciar moléculas<br />

individuales <strong>de</strong> ADN sin fragmentarlos en segmentos. Por ejemplo, usar<br />

moléculas <strong>de</strong> ADN fijas a un soporte que se van <strong>de</strong>gradando con una<br />

exonucleasa y algún <strong>de</strong>tector que <strong>de</strong>termine cuales son los nucleótidos que se<br />

van liberando (Cantor y Smith, 1999). Una segunda posibilidad es utilizar<br />

microscopia electronica para <strong>de</strong>terminar la secuencia <strong>de</strong> acidos <strong>nucleicos</strong> en<br />

41


una molécula <strong>de</strong> ADN. Esto se podría hacer tal vez marcando las bases<br />

individuales con algún metal pesado.<br />

Ninguno <strong>de</strong> estos dos métodos se ha implementado por dificulta<strong>de</strong>s en<br />

los <strong>de</strong>talles (Cantor y Smith, 1999). En el primer caso hay dos complicaciones:<br />

como marcar cada base con alguna etiqueta como un fluoroforo, y tener un<br />

<strong>de</strong>tector suficientemente sensible que sea capaz <strong>de</strong> <strong>de</strong>tectar un solo nucleótido<br />

marcado. En el segundo caso (microscopia electronica), no se pudo marcar<br />

cada base con algún metal sin tener reacciones laterales no <strong>de</strong>seadas (con<br />

otras bases la molécula <strong>de</strong> ADN). Sin embargo, tal vez a futuro, se logren<br />

resolver estas dificulta<strong>de</strong>s, o se <strong>de</strong>scubran otras alternativas eficientes para<br />

hacer la <strong>secuenciación</strong> <strong>de</strong> moléculas individuales <strong>de</strong> ADN.<br />

42


7.0 REFERENCIAS<br />

Ansorge, W., B. Sproat, J. Stegemann, C. Schwager and M. Zenke (1987)<br />

AutomatedDNA sequencing: ultrasensitive <strong>de</strong>tection of fluorescent bands<br />

during electrophoresis. Nucleic Acids Res 15(11): 4593-4602<br />

Ansorge, W. A. Rosenthal, B. Sproat, C. schwager, J. Stegemann and H. Voss<br />

(1988) Non-radioactive automated sequencing of oligonucleoti<strong>de</strong>s by<br />

chemical <strong>de</strong>gradation. Nucleic Acids Res 16(5): 2203-2206<br />

Ansorge, W., J. Zimmerman, C. Schwager, J. Stegemann, H. Erfle, and H. Voss<br />

(1990) One label, one tube, Sanger DNA sequencing in one and two<br />

lanes on a gel. Nucleic Acids Res 18(11): 3419-3420<br />

Bakin, A. and J. Ofengand (1992) A high sensitivity method for sequencing<br />

RNA: application to ribosomal RNA. BioTechniques 13(5):682-683<br />

Behr, S., M. Matzig, A. Levin, H. Eickhoff, C. Heller, (1999) A fully automated<br />

multicapillary electrophoresis <strong>de</strong>vice for DNA analysis. Electrophoresis<br />

20: 1492-1507<br />

Bennet, P. (2003) DNA sequencing and the human genome Project. Molecular<br />

Biology In Cellular Pathology. John Wiley & Sons, Ltd pp. 308-328<br />

Blackburn, G. M. and M. Gait (1996), Nucleic Acids in Chemistry and Biology,<br />

2 nd Ed., Oxford, U. Pr., NY, EUA.<br />

Brown, T.A. (1999) Genomes. Bios Scientific Publishers, Ltd. John Wiley &<br />

Sons, Inc, New York, USA. pp. 59-82<br />

Brownlee, G. and E. Carterwright (1977) Rapid gel sequencing of RNA by<br />

primed synthesis with reverse transcriptase. J Mol Biol 114: 93-117<br />

Cantor, C. and C. Smith (1999) Genomics: The science and technology behind<br />

the human genome project. John Wiley & Sons, Inc.<br />

Carballeira, N., M. Nazabal, J. Brito, O. Garcia (1990)Purification of a<br />

thermostable DNA polimerase from Thermus thermophilus HB8, useful in<br />

the polymerase Chain reaction. BioTechniques 9(3): 276-281<br />

Carpenter, C. and A. Simon (1990) Simplified RNA sequencing using di<strong>de</strong>oxy<br />

chain termination. BioTechniques 8(1): 26-27<br />

43


Chiche, J., A. Cariou, J. Mira (2002) Bench-to-bedsi<strong>de</strong> review: Fulfilling<br />

promises of the human genome project. Critical Care 6(3): 212-215<br />

Church, G. G. Gryan, N. Lakey, S. Kieffer-Higgins, L. Mintz, M. Temple, M.<br />

Rubenfield, L. Jaehn, H. Ghaziza<strong>de</strong>h, K. Robison, and P. Richterich<br />

(1994) Automated multiplex sequencing. Chapt 2. Automated DNA<br />

sequencing and analysis. Edit. Adams, M. C. Fields, J. Venter. Aca<strong>de</strong>mic<br />

Press, Inc. SD, USA. Pp. 11-16<br />

Donis-Keller, H. A. Maxam, and W. Gilbert (1977) Mapping a<strong>de</strong>nines, guanines,<br />

and pyrimidines in RNA. Nucleic Acids Res 4(8): 2527-2538<br />

Evans, T. (2000) Engineering in genomics. Developing and commercializing a<br />

DNA sequencer. IEE EMB 19(4): 117-120<br />

Huang, X. and R. Mathies (1994) Application of capillary array electrophoresis<br />

to DNA sequencing. Chapt 3. Automated DNA sequencing and<br />

analysis. Edit. Adams, M. C. Fields, J. Venter. Aca<strong>de</strong>mic Press, Inc.<br />

SD, USA. Pp. 17-28<br />

Hunkapiller, T., R. Kaiser, B. Koop, and L. Hood (1991) Large-scale and<br />

automated DNA sequence <strong>de</strong>termination. Science 25: 59-67<br />

Igloi, G. (1998) Strategies for introducing non-radioactive labels during the<br />

automated Sequence analysis of nucleic acids. Elec J Biotech 1(1): 23<br />

30<br />

Innis, M., D. Myambo, D. Gelfand, and M. Brow (1988) DNA sequencing with<br />

Thermus aquaticus DNA polymerase and direct sequencing of<br />

polymerase Chain reaction-amplified DNA. Proc Natl Acad Sci, 85:9436<br />

9440<br />

International Human Genome Sequencing Consortium (2001) Initial sequencing<br />

and analysis of the human genome. Nature 409: 860-921<br />

Isaksson, A. and U. Lan<strong>de</strong>gren (1999) Accessing genomic information:<br />

alternatives to PCR. Curr Opin Biotechnology 10: 11-15<br />

Kelley, J. (1994) Automated Dye-terminator DNA sequencing. Chapt 26.<br />

Automated DNA sequencing and analysis. Edit. Adams, M. C. Fields, J.<br />

Venter. Aca<strong>de</strong>mic Press, Inc. SD, USA. Pp. 175-181<br />

44


Kempe, T., W. Sundquist, F. Chow, and L. Hu (1985) Chemical and enzymatic<br />

biotin-labeling of oligo<strong>de</strong>oxyribonucleoti<strong>de</strong>s. Nucleic Acids Res 13:45-57<br />

Levine, J., Suzuki, D. El secreto <strong>de</strong> la vida. Dirección General <strong>de</strong> Divulgación<br />

<strong>de</strong> la ciencia, <strong>UNAM</strong>, México (2000).<br />

Lewin, B. (1997) Genes. Oxford University Press, Inc. New York. Pp. 472-477<br />

Lipshutz, R. and S. Fodor (1994) Advanced DNA sequencing technologies.<br />

Curr Opin Struct Biol 4:376-380<br />

Maxam, A. and W. Gilbert (1977) A new method for sequencing DNA. Proc Natl<br />

Acad Sci 74(2): 560-564<br />

Meldrum, D. (2000) Automation for genomics, part two: sequencers,<br />

microarrays, and future trends. Genome Res 10: 1288-1303<br />

Mullis, K (1990) The unusual origin of the polymerase chain reaction. Sci Am<br />

262(4):56-65<br />

Myers, G. (1999) Whole-genome DNA sequencing. Computing in Science &<br />

Engineering. IEEE pp. 33-43<br />

Olson, M. (1993) The human genome project. Proc Natl Acad Sci, USA. 90:<br />

4338-4344<br />

Prober, J. et al., (1987) A system for rapid DNA sequencing with fluorescent<br />

chain-terminating di<strong>de</strong>oxynucleoti<strong>de</strong>s. Science. 238: 336-341<br />

Rosenblum, B., L. Lee, S. Spurgeon, S. Khan, S. Menchen, C Heiner, and S.<br />

Chen (1997) New dye-labeled terminators for improved DNA sequencing<br />

patterns. Nucleic Acids Res 25(22):4500-4504<br />

Sanger, F., S. Nicklen, and A.R. Coulson (1977) DNA sequencing with chain<br />

terminating inhibitors. Proc Natl Acad Sci 74(12): 5463-5467<br />

Sanger, F. and A.R. Coulson (1978) The use of thin acrylami<strong>de</strong> gels for DNA<br />

sequencing. FEBS Lett 87(1): 107-110<br />

Sanger, F. (1988) Early nucleic acid chemistry. Trends Biochem Sci 13: 67-69<br />

45


Schlenk, F., (1988).Early nucleic acid chemistry, Trends Biochem. Sci., 13:<br />

67-69<br />

Smith, L., S. Fung, M. Hunkapiller, T. Hunkapiller, and L Hood (1985) The<br />

synthesis of oligonucleoti<strong>de</strong>s containing an aliphatic amino group at the<br />

5’ terminus: synthesis of fluorescent DNA primers for use in DNA<br />

sequence analysis. Nucleic Acids Res. 13(7): 2399-2412<br />

Smith, L. J. Sandlers, R. Kaiser, P. Hughes, C. Dodd, C. Connell, C. Heiner, S.<br />

Kent, and L. Hood (1986) Fluorescence <strong>de</strong>tection in automated DNA<br />

sequence analysis. Nature 321: 64-69<br />

Stewart, P. R. and D. Letham (1977), The ribonucleic acids, 2 nd Ed., Springer<br />

Verlag, NY, EUA, pp. 374.<br />

Tabor, S. and C. Richardson (1995) A single residue in DNA polymerases of<br />

the Escherichia coli DNA polymerase I family is critical for distinguishing<br />

between <strong>de</strong>oxy and di<strong>de</strong>oxyribonucleoti<strong>de</strong>s. Proc Natl Acad Sci, USA 92:<br />

6339-6343<br />

Tahara, T., J. Kraus, and L. Rosenberg (1990) Direct DNA sequencing of PCR<br />

Amplified genomic DNA by the Maxam-Gilbert method. BioTechniques<br />

8(4): 366-367<br />

Tang, K., P. Oeth, S. Kammerer, M. Denissenko, J. Ekblom, C. Jurinke, D. van<br />

<strong>de</strong>n Boom, A. Braun, and C. Cantor. (2004) Minin Disease<br />

susceptibility genes through SNP analyses and expression profiling<br />

using MALDI-TOF máss spectrometry. J. Proteome Res 3(2): 218-227<br />

Venter, C. et al. (2001) The sequence of the human genome. Science 291:<br />

1304-1351<br />

Voet, D. and J. Voet, (1995) Biochemistry, 2 nd Ed. John Wiley and Sons, Inc.<br />

NY, EUA<br />

Wang, D. et al. (1998) Large-scale i<strong>de</strong>ntification, mapping, and genotyping of<br />

single nucleoti<strong>de</strong> polymorphisms in the human genome. Science 280:<br />

1077-1082<br />

Watson, J. and F. Crick.(1953) Molecular structure of nucleic acids: structure for<br />

<strong>de</strong>oxyribose nucleic acids. Nature, 171: 737-738<br />

46


Weber, J. and E. Myers (1997) Human Whole-genome shotgun sequencing.<br />

Genome Res 7: 401-409<br />

Yager, T., L. Baron, R. Batra, A. Bouevitch, D. Chan, K. Chan, S. Darasch, R.<br />

Gilchrist, A. Izmailov, J. Lacroix, K. Marchellata, J. Renfrew, D. Rushlow,<br />

E. Stinbach, C. Ton, P. Waterhouse, H. Zaleski, J. Dunn, and J. Stevens<br />

(1999) High performance DNA sequencing, and the <strong>de</strong>tection of<br />

mutations and polymorphisms on the Clipper sequencer. Electophoresis<br />

20: 1280-1300<br />

Zimmermann, J., S. Wirmann, H. Voss, C. Schwager, and W. Ansorge (1994)<br />

Improved fluorescent cycle sequencing protocol allows reading nearly<br />

1000 bases. BioTechniques 17(2): 302-305<br />

47

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!