Alberto Risueño Pérez - Gredos - Universidad de Salamanca

More documents

Recommendations

Info

Tesis Doctoral Capítulo 1 Diseño y construcción de un explorador genómico y transcriptómico con mapeo de sondas de expresión a genes, transcritos, exones y ncRNAs: GATExplorer 1.1. Introducción Desde que se presentó el primer borrador del genoma humano en el año 2001 (Lander et al., 2001; Venter et al., 2001), las revisiones y actualizaciones de su secuencia consenso han sido continuas hasta hoy día. La versión GRCh37 de septiembre de 2009 incluye 33.868.498 pares de bases más que su predecesora NCBI36 lanzada en octubre de 2005 (3.286.906.305 y 3.253.037.807 pares de bases respectivamente). Si en lugar de observar cambios en la secuencia genómica observamos la evolución en el conocimiento de los genes, es decir, la parte funcional más conocida del genoma, vemos que los cambios son notables. El número de secuencias codificantes de RNA expresadas en las distintas células del organismo humano se ha incrementado enormemente en los últimos años (Carninci et al., 2005; Kapranov et al., 2007). Este descubrimiento de nuevas secuencias de RNA y su posterior alineamiento sobre el genoma no sólo identifica nuevos genes, sino que puede fusionar varios genes considerados anteriormente como distintos. Esto supone que el número de genes conocidos no aumenta necesariamente con el tiempo pudiendo incluso mostrar, de forma paradójica, una reducción de su número. De esta manera, el número de genes codificantes de proteína catalogados en 2005 era aproximadamente 26.000 mientras que a inicios de 2012 el número es de poco más de 20.000 (www.ensembl.org). Sin embargo, el número de transcritos distintos para los genes humanos genes ha aumentado considerablemente lo que indica que los genes son considerablemente más complejos de lo estimado inicialmente. Todo esto significa que el conocimiento del transcriptoma humano, y del transcriptoma de metazoos en general, está aumentando dramáticamente en la última década. Las bases de datos como la del proyecto Ensembl (Hubbard et al., 2009) recogen esta información actualizada y puede ser utilizada para mejorar la precisión de los numerosos estudios transcriptómicos realizados con plataformas genómicas (genome-‐wide platforms), como los microarrays de expresión. La interpretación de los datos de estas plataformas en base a versiones más actuales y completas del genoma humano permite análisis más cercanos a la realidad biológica y mejor uso de los datos derivados de estos estudios. 10
Capítulo 1 1.1.1. Bases de datos de ncRNAs como complemento de la información de Ensembl En estos últimos años también se han identificado multitud de secuencias nuevas de RNA no codificante de proteína (ncRNA) suscitando un creciente interés en este tipo de transcritos. Numerosas investigaciones se han llevado a cabo tratando de catalogar estas secuencias y de descubrir qué función cumplen. Estos estudios aún están comenzando, pero ya presentan a la célula como una máquina transcripcional de increíble complejidad (Amaral et al., 2008). Varios trabajos han recopilado la información sobre ncRNA en bases de datos especializadas como RNAdb (Pang et al., 2007). Este tipo de bases de datos pueden complementar a Ensembl en los estudios transcriptómicos para proporcionar una visión más global sobre los diferentes mecanismos moleculares de las distintas células que conforman un organismo. Es evidente que este aumento de conocimiento a nivel transcripcional ha terminado por cambiar el concepto clásico de "gen" originalmente asociado a un RNA mensajero (mRNA) y a proteína concreta, ya que cada "locus génico" de un genoma como el humano puede dar lugar a muchos mensajeros diferentes y a su vez estos originar proteínas con pequeñas o grandes variaciones (llamadas isoformas) derivadas de procesos de transcripción y maduración diferencial que suelen suceder en distintos tipos celulares. De este modo, cada "locus génico" del genoma puede incluir una gran complejidad y sufrir regulación a distintos niveles, de modo que la definición de los genes humanos no es tan clara y debe ser estudiada y revisada constantemente. 1.1.2. Microarrays de oligos de alta densidad para medir la expresión génica a escala genómica global A medida que el conocimiento del transcriptoma avanza va ampliando el catálogo de secuencias conocidas de RNA. Estudios posteriores se centran en comprender la regulación y función de las distintas secuencias identificadas. Una de las tecnologías más populares para hacer esto es la de microarrays de oligonucleótidos de alta densidad diseñados para medir la expresión de todos los genes de un genoma. Estos nano dispositivos de oligos –es decir, de secuencias cortas de DNA de cadena simple– son plataformas de escala genómica (genome-‐ wide scale) que permiten medir la cantidad de miles de fragmentos de RNA a la vez. De este modo, en el microarray se incluyen cientos de miles de secuencias cortas de DNA sobre las que se pueden testar miles de genes a la vez, es decir, todos los transcritos presentes en un extracto celular concreto de estudio. La compañía americana Affymetrix, fundada en 1992, fue pionera en el diseño de estos dispositivos (Lipshutz et al., 1999; Lockhart et al., 1996; Wodicka et al., 1997) y es probablemente la empresa que con más éxito ha comercializado distintos modelos de microarrays de expresión de escala genómica. El modelo de microarrays humanos que más éxito ha tenido es el llamado GeneChip Human Genome U133, que fue lanzado en 2001 y su diseño estaba basado en la información presente en librerías de cDNA humano de aquel momento (en concreto, librerías de la base de datos UniGene –build 133– de abril de 2001). Estas librerías contienen colecciones de secuencias de RNA expresadas, denominadas Expressed Sequence Tags (ESTs), que han sido identificadas en humano a través de numerosos estudios experimentales sobre distintos tipos celulares y tejidos. Además, estos primeros modelos de microarrays de expresión se basaban en tecnología de secuenciación y copia por el extremo (modelos de tipo IVT 3’), y los modelos actualmente comercializados por Affymetrix siguen la tecnología Whole Transcript (WT) en la que el diseño está hecho en base a 11
Page 1: Bioinformática aplicada a estudios
Page 5 and 6: Índice INTRODUCCIÓN GENERAL .....
Page 7 and 8: Introducción general Bioinformáti
Page 9 and 10: Figura 2. Proceso de transcripción
Page 11 and 12: Introducción general caciones, las
Page 13: Objetivos Introducción general La
Page 17 and 18: Capítulo 1 sondas core y su inform
Page 19 and 20: caaatgacttgctattattgatggc 225 694 c
Page 21 and 22: presentes en el fichero. Capítulo
Page 23 and 24: Capítulo 1 Mus musculus MG_U74Av2
Page 25 and 26: Capítulo 1 Figura 1.5. Representac
Page 27 and 28: Capítulo 1 Paso 2 Descripción: As
Page 29 and 30: Capítulo 1 A la hora de escribir e
Page 31 and 32: Capítulo 1 en regiones no codifica
Page 33 and 34: Capítulo 1 Para optimizar la preci
Page 35 and 36: Figura 1.9a. Distribución del núm
Page 37 and 38: Capítulo 1 por contraste el númer
Page 39 and 40: Capítulo 1 (cromosoma, locus, exon
Page 41 and 42: Capítulo 1 figura 1.16). Además d
Page 43 and 44: Capítulo 1 exhaustivo en este ámb
Page 45 and 46: Capítulo 1 su presentación y deta
Page 47: Capítulo 1 adaptación para los mi
Page 50 and 51: Tesis Doctoral pueden agrupar en: t
Page 52 and 53: Tesis Doctoral enfermedad a través
Page 54 and 55: Tesis Doctoral los genes encontrado
Page 56 and 57: Tesis Doctoral real (RT-‐PCR).
Page 58 and 59: Tesis Doctoral muestras (ver figura
Page 60 and 61: Tesis Doctoral subtipo fueron: 0.97
Page 62 and 63: Tesis Doctoral En este trabajo se h
Page 64 and 65:
Tesis Doctoral permitiría, sin dud
Page 66 and 67:
Tesis Doctoral inclusión entre 0 y
Page 68 and 69:
Tesis Doctoral exacto del número d
Page 70 and 71:
Tesis Doctoral Los valores extremos
Page 72 and 73:
Tesis Doctoral dicho, la comparaci
Page 74 and 75:
Tesis Doctoral 70 Figura 3.6. Los d
Page 76 and 77:
Tesis Doctoral 3.8.b). Sin embargo
Page 78 and 79:
Tesis Doctoral Human Exon 1.0. La l
Page 80 and 81:
Tesis Doctoral 76 Figura 3.10. Curv
Page 82 and 83:
Tesis Doctoral 78 Figura 3.10 (cont
Page 84 and 85:
Tesis Doctoral del inicio del ranki
Page 87 and 88:
Capítulo 4 Análisis de coexpresi
Page 89 and 90:
Capítulo 4 los genes y la perspect
Page 91 and 92:
Capítulo 4 Utilizando el set de da
Page 93 and 94:
ENSG00000142541 RPL13A small nucleo
Page 95 and 96:
Capítulo 4 Para encontrar los gene
Page 97 and 98:
Capítulo 4 ENSG00000134287 ARF3 AD
Page 99 and 100:
Capítulo 4 Figura 4.3. Red de coex
Page 101 and 102:
Capítulo 4 Si analizamos los genes
Page 103 and 104:
Capítulo 4 se hizo comparando cont
Page 105:
4.4. Discusión y posible trabajo f
Page 108 and 109:
Tesis Doctoral exones, y diseñando
Page 110 and 111:
Tesis Doctoral expression and isofo
Page 112 and 113:
Tesis Doctoral 37, e107. Gardina, P
Page 114 and 115:
Tesis Doctoral and survival in chro
Page 116 and 117:
Tesis Doctoral Roth, R.B., Hevezi,
Page 118 and 119:
Tesis Doctoral Xi, L., Feber, A., G
Page 121 and 122:
Risueño et al. BMC Bioinformatics
Page 123 and 124:
Page 125 and 126:
Page 127 and 128:
Page 129 and 130:
Page 131 and 132:
Page 133 and 134:
ORIGINAL ARTICLE Deregulation of mi
Page 135 and 136:
Targets component of miRecords inte
Page 137 and 138:
log 10 2-ΔCt -2.00 -4.00 -6.00 -8.
Page 139 and 140:
Table 4 Potential microRNA (miRNA)-
Page 141 and 142:
myeloma pathogenesis. Proc Natl Aca
Page 143 and 144:
genetic subtypes of CLL show differ
Page 145 and 146:
Table 2. Cont. Up-regulated Down-re
Page 147 and 148:
206 underexpressed in the 13q-H gro
Page 149 and 150:
Table 3. Most significant target ge
Page 151 and 152:
Discussion 13q deletion (13q-) is t
Page 153 and 154:
patients with 17p and 11q deletions
Page 155 and 156:
Human Gene Coexpression Landscape:
Page 157 and 158:
The similarity and proximity of the
Page 159 and 160:
As described in Methods we use a co
Page 161 and 162:
all data points of coexpression pai
Page 163 and 164:
Table 1. This work (2008) Pathway N
Page 165 and 166:
In conclusion, the functional consi
Page 167 and 168:
a total set of 48 microarrays. The
Page 169 and 170:
original article Annals of Oncology
Page 171 and 172:
Annals of Oncology original article
Page 173 and 174:
Page 175 and 176:
show all

Alberto Risueño Pérez - Gredos - Universidad de Salamanca

Create successful ePaper yourself

Delete template?

Save as template?