Alberto Risueño Pérez - Gredos - Universidad de Salamanca
Alberto Risueño Pérez - Gredos - Universidad de Salamanca
Alberto Risueño Pérez - Gredos - Universidad de Salamanca
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Tesis Doctoral<br />
1.2.3. Algoritmo <strong>de</strong> alineamiento <strong>de</strong> secuencias: BLAST<br />
Para ubicar las sondas <strong>de</strong> los microarrays <strong>de</strong> Affymetrix se utilizó el algoritmo Basic Local<br />
Search Tool (BLAST) (Altschul et al., 1990). Este algoritmo <strong>de</strong> alineamiento compara <strong>de</strong> forma<br />
heurística una secuencia dada contra toda una librería <strong>de</strong> secuencias almacenadas en una base<br />
<strong>de</strong> datos, comprobando si existe alguna secuencia idéntica o similar en dicha librería,<br />
i<strong>de</strong>ntificando la posición <strong>de</strong> la secuencia o secuencias homólogas encontradas y realizando un<br />
alineamiento entre lo encontrado y la secuencia problema.<br />
Existen diversos programas que implementan el algoritmo BLAST, cada uno diseñado para<br />
manejar un tipo distinto <strong>de</strong> información (ver tabla 1.5). Estos programas han sido <strong>de</strong>scargados<br />
<strong>de</strong> la página gubernamental <strong>de</strong> estadouni<strong>de</strong>nse National Center for Biotechnology Information<br />
(NCBI) accesible <strong>de</strong>s<strong>de</strong> la dirección http://blast.ncbi.nlm.nih.gov.<br />
18<br />
Nombre <strong>de</strong>l<br />
programa<br />
Tipo <strong>de</strong> secuencia a buscar<br />
Tipo <strong>de</strong> base <strong>de</strong> datos<br />
en don<strong>de</strong> busca<br />
blastn nucleótidos nucleótidos<br />
blastp proteína proteína<br />
blastx traducción <strong>de</strong> nucleótidos proteína<br />
tblastn proteína traducción <strong>de</strong> nucleótidos<br />
tblastx traducción <strong>de</strong> nucleótidos traducción <strong>de</strong> nucleótidos<br />
Tabla 1.5. Tipos <strong>de</strong> programas <strong>de</strong> alineamiento BLAST accesibles <strong>de</strong>s<strong>de</strong> http://blast.ncbi.nlm.nih.gov.<br />
Para el trabajo <strong>de</strong> alineamiento realizado en GATExplorer se lanzó el programa BLASTN, que es<br />
la versión diseñada para trabajar con nucleótidos. En concreto, se lanzaron miles <strong>de</strong> BLASTN<br />
correspondientes a cada una <strong>de</strong> las secuencias <strong>de</strong> cada sonda <strong>de</strong> 25 nucleótidos <strong>de</strong> cada uno<br />
<strong>de</strong> los microarrays utilizando como librerías <strong>de</strong> búsqueda los ficheros FASTA <strong>de</strong> Ensembl con<br />
todos los cDNAs correspondientes a cada genoma (humano, ratón y rata). El programa se<br />
configuró para admitir únicamente alineamientos perfectos (es <strong>de</strong>cir, secuencias idénticas a la<br />
buscada) guardando el resultado en base <strong>de</strong> datos MySQL para su posterior proceso. El<br />
número <strong>de</strong> secuencias únicas para cada mo<strong>de</strong>lo <strong>de</strong> microarray se <strong>de</strong>talla en la tabla 1.6.<br />
Organismo Mo<strong>de</strong>lo <strong>de</strong> microarray Número <strong>de</strong> secuencias distintas<br />
Homo sapiens HC_G110 30294<br />
Homo sapiens HG_Focus 97810<br />
Homo sapiens HG_U133A 241898<br />
Homo sapiens HG_U133A_2 241837<br />
Homo sapiens HG_U133B 248525<br />
Homo sapiens HG_U133_Plus_2 594532<br />
Homo sapiens HG_U95A 197599<br />
Homo sapiens HG_U95Av2 197582<br />
Homo sapiens HG_U95B 199191<br />
Homo sapiens HG_U95C 200491<br />
Homo sapiens HG_U95D 201274<br />
Homo sapiens HG_U95E 201012<br />
Homo sapiens Human_Exon_1.0 5270588<br />
Homo sapiens Human_Gene_1.0 804372<br />
Homo sapiens U133_X3P 631714<br />
Mus musculus MG_U74A 200843