Alberto Risueño Pérez - Gredos - Universidad de Salamanca
Alberto Risueño Pérez - Gredos - Universidad de Salamanca
Alberto Risueño Pérez - Gredos - Universidad de Salamanca
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Tesis Doctoral<br />
Capítulo 1<br />
Diseño y construcción <strong>de</strong> un explorador<br />
genómico y transcriptómico con mapeo <strong>de</strong><br />
sondas <strong>de</strong> expresión a genes, transcritos,<br />
exones y ncRNAs: GATExplorer<br />
1.1. Introducción<br />
Des<strong>de</strong> que se presentó el primer borrador <strong>de</strong>l genoma humano en el año 2001 (Lan<strong>de</strong>r et al.,<br />
2001; Venter et al., 2001), las revisiones y actualizaciones <strong>de</strong> su secuencia consenso han sido<br />
continuas hasta hoy día. La versión GRCh37 <strong>de</strong> septiembre <strong>de</strong> 2009 incluye 33.868.498 pares<br />
<strong>de</strong> bases más que su pre<strong>de</strong>cesora NCBI36 lanzada en octubre <strong>de</strong> 2005 (3.286.906.305 y<br />
3.253.037.807 pares <strong>de</strong> bases respectivamente). Si en lugar <strong>de</strong> observar cambios en la<br />
secuencia genómica observamos la evolución en el conocimiento <strong>de</strong> los genes, es <strong>de</strong>cir, la<br />
parte funcional más conocida <strong>de</strong>l genoma, vemos que los cambios son notables. El número <strong>de</strong><br />
secuencias codificantes <strong>de</strong> RNA expresadas en las distintas células <strong>de</strong>l organismo humano se<br />
ha incrementado enormemente en los últimos años (Carninci et al., 2005; Kapranov et al.,<br />
2007). Este <strong>de</strong>scubrimiento <strong>de</strong> nuevas secuencias <strong>de</strong> RNA y su posterior alineamiento sobre el<br />
genoma no sólo i<strong>de</strong>ntifica nuevos genes, sino que pue<strong>de</strong> fusionar varios genes consi<strong>de</strong>rados<br />
anteriormente como distintos. Esto supone que el número <strong>de</strong> genes conocidos no aumenta<br />
necesariamente con el tiempo pudiendo incluso mostrar, <strong>de</strong> forma paradójica, una reducción<br />
<strong>de</strong> su número. De esta manera, el número <strong>de</strong> genes codificantes <strong>de</strong> proteína catalogados en<br />
2005 era aproximadamente 26.000 mientras que a inicios <strong>de</strong> 2012 el número es <strong>de</strong> poco más<br />
<strong>de</strong> 20.000 (www.ensembl.org). Sin embargo, el número <strong>de</strong> transcritos distintos para los genes<br />
humanos genes ha aumentado consi<strong>de</strong>rablemente lo que indica que los genes son<br />
consi<strong>de</strong>rablemente más complejos <strong>de</strong> lo estimado inicialmente. Todo esto significa que el<br />
conocimiento <strong>de</strong>l transcriptoma humano, y <strong>de</strong>l transcriptoma <strong>de</strong> metazoos en general, está<br />
aumentando dramáticamente en la última década. Las bases <strong>de</strong> datos como la <strong>de</strong>l proyecto<br />
Ensembl (Hubbard et al., 2009) recogen esta información actualizada y pue<strong>de</strong> ser utilizada<br />
para mejorar la precisión <strong>de</strong> los numerosos estudios transcriptómicos realizados con<br />
plataformas genómicas (genome-‐wi<strong>de</strong> platforms), como los microarrays <strong>de</strong> expresión. La<br />
interpretación <strong>de</strong> los datos <strong>de</strong> estas plataformas en base a versiones más actuales y completas<br />
<strong>de</strong>l genoma humano permite análisis más cercanos a la realidad biológica y mejor uso <strong>de</strong> los<br />
datos <strong>de</strong>rivados <strong>de</strong> estos estudios.<br />
10