Alberto Risueño Pérez - Gredos - Universidad de Salamanca
Alberto Risueño Pérez - Gredos - Universidad de Salamanca
Alberto Risueño Pérez - Gredos - Universidad de Salamanca
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Capítulo 1<br />
Mus musculus MG_U74Av2 197037<br />
Mus musculus MG_U74B 201514<br />
Mus musculus MG_U74Bv2 196971<br />
Mus musculus MG_U74C 200299<br />
Mus musculus MG_U74Cv2 182488<br />
Mus musculus MOE430A 245487<br />
Mus musculus MOE430B 247199<br />
Mus musculus Mouse430A_2 245487<br />
Mus musculus Mouse430_2 490490<br />
Mus musculus Mouse_Exon_1.0 4625878<br />
Mus musculus Mouse_Gene_1.0 833688<br />
Mus musculus Mu11KsubA 131205<br />
Mus musculus Mu11KsubB 118591<br />
Rattus norvegicus RAE230A 174975<br />
Rattus norvegicus RAE230B 168505<br />
Rattus norvegicus Rat230_2 341442<br />
Rattus norvegicus Rat_Exon_1.0 3997586<br />
Rattus norvegicus Rat_Gene_1.0 793624<br />
Rattus norvegicus RG_U34A 140057<br />
Rattus norvegicus RG_U34B 140293<br />
Rattus norvegicus RG_U34C 140252<br />
Rattus norvegicus RN_U34 21300<br />
Rattus norvegicus RT_U34 20407<br />
Tabla 1.6. Número <strong>de</strong> secuencias distintas <strong>de</strong> los diferentes microarrays <strong>de</strong> expresión <strong>de</strong> Affymetrix para los<br />
organismos humano, ratón y rata.<br />
Tras realizar todos los alineamientos contra el repositorio <strong>de</strong> cDNAs <strong>de</strong> Ensembl quedan<br />
bastantes sondas <strong>de</strong> oligonucleótidos huérfanas para las que no se encuentra una secuencia<br />
idéntica en ningún locus génico codificante y por ello se procedió a lanzar todas estas sondas<br />
contra la base <strong>de</strong> datos <strong>de</strong> ncRNAs citada (Pang et al., 2007). Esto se realizó para las sondas <strong>de</strong><br />
los microarrays <strong>de</strong> humano y <strong>de</strong> ratón, ya que en RNAdb no hay datos <strong>de</strong> rata.<br />
El diseño original <strong>de</strong> las sondas <strong>de</strong> los microarrays <strong>de</strong> Affymetrix está basado en alineamientos<br />
consenso <strong>de</strong> ESTs (Expressed Sequence Tags), es <strong>de</strong>cir en datos transcriptómicos globales<br />
sobre RNAs <strong>de</strong>tectados en diversas muestras <strong>de</strong> la especie concreta para la cual se construyó<br />
el array. Esto supone que, como se ha comprobado luego, muchos <strong>de</strong> estos RNAs no<br />
correspon<strong>de</strong>n a secuencias <strong>de</strong> un gen codificante para proteína. De este modo, no es <strong>de</strong><br />
extrañar que haya multitud <strong>de</strong> sondas que no sean alineadas con transcritos codificantes<br />
cDNAs <strong>de</strong> Ensembl. En este trabajo se ha hecho un esfuerzo original para recuperar esas<br />
sondas huérfanas, tratando <strong>de</strong> asignarlas a nuevas entida<strong>de</strong>s transcriptómicas mediante su<br />
alineación contra secuencias <strong>de</strong> la base <strong>de</strong> datos RNAdb.<br />
1.2.4. Cambios <strong>de</strong> coor<strong>de</strong>nadas: <strong>de</strong> cDNA a DNA genómico<br />
Muchas <strong>de</strong> las secuencias <strong>de</strong> las sondas <strong>de</strong> los arrays que mapean sobre cDNAs quedan<br />
ubicadas cubriendo la unión <strong>de</strong> dos exones. El alineamiento <strong>de</strong> estas sondas sobre los ficheros<br />
FASTA <strong>de</strong> cDNA asegura po<strong>de</strong>r incluirlas en el mapeo. Sin embargo, a la hora <strong>de</strong> representar la<br />
información a nivel genómico, las secuencias <strong>de</strong> cDNA no son las más a<strong>de</strong>cuadas ya que los<br />
exones quedan separados por intrones en los locus génicos. En GATExplorer se ha buscado<br />
representar toda la información en su contexto genómico para permitir al usuario explorar<br />
19