Alberto Risueño Pérez - Gredos - Universidad de Salamanca
Alberto Risueño Pérez - Gredos - Universidad de Salamanca
Alberto Risueño Pérez - Gredos - Universidad de Salamanca
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Capítulo 1<br />
1.1.1. Bases <strong>de</strong> datos <strong>de</strong> ncRNAs como complemento <strong>de</strong> la información<br />
<strong>de</strong> Ensembl<br />
En estos últimos años también se han i<strong>de</strong>ntificado multitud <strong>de</strong> secuencias nuevas <strong>de</strong> RNA no<br />
codificante <strong>de</strong> proteína (ncRNA) suscitando un creciente interés en este tipo <strong>de</strong> transcritos.<br />
Numerosas investigaciones se han llevado a cabo tratando <strong>de</strong> catalogar estas secuencias y <strong>de</strong><br />
<strong>de</strong>scubrir qué función cumplen. Estos estudios aún están comenzando, pero ya presentan a la<br />
célula como una máquina transcripcional <strong>de</strong> increíble complejidad (Amaral et al., 2008). Varios<br />
trabajos han recopilado la información sobre ncRNA en bases <strong>de</strong> datos especializadas como<br />
RNAdb (Pang et al., 2007). Este tipo <strong>de</strong> bases <strong>de</strong> datos pue<strong>de</strong>n complementar a Ensembl en los<br />
estudios transcriptómicos para proporcionar una visión más global sobre los diferentes<br />
mecanismos moleculares <strong>de</strong> las distintas células que conforman un organismo.<br />
Es evi<strong>de</strong>nte que este aumento <strong>de</strong> conocimiento a nivel transcripcional ha terminado por<br />
cambiar el concepto clásico <strong>de</strong> "gen" originalmente asociado a un RNA mensajero (mRNA) y a<br />
proteína concreta, ya que cada "locus génico" <strong>de</strong> un genoma como el humano pue<strong>de</strong> dar lugar<br />
a muchos mensajeros diferentes y a su vez estos originar proteínas con pequeñas o gran<strong>de</strong>s<br />
variaciones (llamadas isoformas) <strong>de</strong>rivadas <strong>de</strong> procesos <strong>de</strong> transcripción y maduración<br />
diferencial que suelen suce<strong>de</strong>r en distintos tipos celulares. De este modo, cada "locus génico"<br />
<strong>de</strong>l genoma pue<strong>de</strong> incluir una gran complejidad y sufrir regulación a distintos niveles, <strong>de</strong> modo<br />
que la <strong>de</strong>finición <strong>de</strong> los genes humanos no es tan clara y <strong>de</strong>be ser estudiada y revisada<br />
constantemente.<br />
1.1.2. Microarrays <strong>de</strong> oligos <strong>de</strong> alta <strong>de</strong>nsidad para medir la expresión<br />
génica a escala genómica global<br />
A medida que el conocimiento <strong>de</strong>l transcriptoma avanza va ampliando el catálogo <strong>de</strong><br />
secuencias conocidas <strong>de</strong> RNA. Estudios posteriores se centran en compren<strong>de</strong>r la regulación y<br />
función <strong>de</strong> las distintas secuencias i<strong>de</strong>ntificadas. Una <strong>de</strong> las tecnologías más populares para<br />
hacer esto es la <strong>de</strong> microarrays <strong>de</strong> oligonucleótidos <strong>de</strong> alta <strong>de</strong>nsidad diseñados para medir la<br />
expresión <strong>de</strong> todos los genes <strong>de</strong> un genoma. Estos nano dispositivos <strong>de</strong> oligos –es <strong>de</strong>cir, <strong>de</strong><br />
secuencias cortas <strong>de</strong> DNA <strong>de</strong> ca<strong>de</strong>na simple– son plataformas <strong>de</strong> escala genómica (genome-‐<br />
wi<strong>de</strong> scale) que permiten medir la cantidad <strong>de</strong> miles <strong>de</strong> fragmentos <strong>de</strong> RNA a la vez. De este<br />
modo, en el microarray se incluyen cientos <strong>de</strong> miles <strong>de</strong> secuencias cortas <strong>de</strong> DNA sobre las que<br />
se pue<strong>de</strong>n testar miles <strong>de</strong> genes a la vez, es <strong>de</strong>cir, todos los transcritos presentes en un<br />
extracto celular concreto <strong>de</strong> estudio. La compañía americana Affymetrix, fundada en 1992, fue<br />
pionera en el diseño <strong>de</strong> estos dispositivos (Lipshutz et al., 1999; Lockhart et al., 1996;<br />
Wodicka et al., 1997) y es probablemente la empresa que con más éxito ha comercializado<br />
distintos mo<strong>de</strong>los <strong>de</strong> microarrays <strong>de</strong> expresión <strong>de</strong> escala genómica. El mo<strong>de</strong>lo <strong>de</strong> microarrays<br />
humanos que más éxito ha tenido es el llamado GeneChip Human Genome U133, que fue<br />
lanzado en 2001 y su diseño estaba basado en la información presente en librerías <strong>de</strong> cDNA<br />
humano <strong>de</strong> aquel momento (en concreto, librerías <strong>de</strong> la base <strong>de</strong> datos UniGene –build 133– <strong>de</strong><br />
abril <strong>de</strong> 2001). Estas librerías contienen colecciones <strong>de</strong> secuencias <strong>de</strong> RNA expresadas,<br />
<strong>de</strong>nominadas Expressed Sequence Tags (ESTs), que han sido i<strong>de</strong>ntificadas en humano a través<br />
<strong>de</strong> numerosos estudios experimentales sobre distintos tipos celulares y tejidos. A<strong>de</strong>más, estos<br />
primeros mo<strong>de</strong>los <strong>de</strong> microarrays <strong>de</strong> expresión se basaban en tecnología <strong>de</strong> secuenciación y<br />
copia por el extremo (mo<strong>de</strong>los <strong>de</strong> tipo IVT 3’), y los mo<strong>de</strong>los actualmente comercializados por<br />
Affymetrix siguen la tecnología Whole Transcript (WT) en la que el diseño está hecho en base a<br />
11