Alberto Risueño Pérez - Gredos - Universidad de Salamanca

More documents

Recommendations

Info

Tesis Doctoral La tabla 1.7 muestra el número y porcentaje de genes codificante de proteína que son mapeados por las sondas de cada modelo de microarray de expresión de Affymetrix. En esta tabla se diferencia entre genes y transcritos, especificando cuántos de ellos son mapeados de forma única. Esta tabla muestra que la cobertura de genes conocidos (21281 para humano en la versión 57 de Ensembl) ha aumentado en con la llegada de cada modelo nuevo: HG-‐U133A 63,0%; HG-‐U133 Plus 2.0 89,0%; Human Gene 1.0 94,9%; Human Exon 1.0 98,7%. En el caso de los transcritos se ha considerado únicamente los transcritos pertenecientes a los genes codificante de proteína (100299 para humano en la versión 57 de Ensembl), obteniendo el mismo resultado de aumento de cobertura con la llegada de nuevos modelos de microarrays. La tabla 1.8 muestra el número y porcentaje de sondas que mapean sobre genes y transcritos para cada modelo de microarray, detallando cuántas de esas sondas son únicas y cuantas ambiguas (es decir, presentan hibridación cruzada). Estos datos reflejan que el modelo más eficiente sobre el organismo humano es el Human Gene 1.0 con un 91,22% de sondas. Por ejemplo, para el caso del modelo HG-‐U133A el 16,5% de las sondas no mapean en ningún gene de la citada versión de Ensembl. Si además sólo se considera el número de sondas únicas (192213 para el array HG-‐U133A) la eficiencia en el mapeo es solo del 79,5% para este modelo. Todo ello indica que una proporción considerable de sondas (16-‐21%) pueden producir ruido debido al mapeo incorrecto o ambiguo, especialmente si se calcula la expresión utilizando la agrupación original proporcionada por Affymetrix. Este problema está también presente en el nuevo microarray de exones que muestra la eficiencia más baja, con solo un 31% de las sondas mapeando sobre exones. Estos datos indican que estos microarrays están sujetos a un alto nivel de ruido, y esto debe ser tenido en cuenta a la hora de su utilización. 1.3.4. Distribuciones del número de sondas únicas no ambiguas y del número de genes mapeados En las estadísticas anteriores se determinó el número de sondas no ambiguas a nivel de gen, siendo por lo tanto las únicas que pueden utilizarse para los análisis de expresión génica ya que no presentan hibridación cruzada con más genes. En la figura 1.9a se muestra la distribución del número de sondas presentes por número de genes para dos modelos de arrays de distinto diseño: HG-‐U133A y Human Gene 1.0. Esta figura indica que la mayoría de las sondas detecta un único gen (en concordancia con la tabla 1.8) descendiendo rápidamente el número de sondas que detectan más de un gen. En la figura 1.9b se muestra el número de genes en función del número de sondas que los detectan. El diseño de las sondas de los antiguos modelos IVT 3’ –como es el HG-‐U133A– se diseñaron definiendo grupos de 11 sondas próximas en el transcriptoma (probesets). Algunos genes son detectados por más de un probeset y esto queda reflejado en la figura 1.9b en forma de picos múltiplos de 11 para el array HG-‐U133A (línea negra). En el caso del modelo Human Gene 1.0 la distribución es muy distinta mostrando un pico máximo en 25. Llama la atención el alto número de genes que son mapeados por una única sonda en ambos modelos. Esto podría ser explicado por la hibridación cruzada entre genes de la misma familia con secuencias similares (genes parálogos), o por la aparición en las bases de datos actuales de nuevos genes no conocidos en el momento del diseño de los chips. Muchos de estos genes nuevos son detectados por técnicas automáticas de análisis de secuencia y anotados como genes putativos (genes like L) o pseudo-‐genes, y su expresión muchas veces es dudosa. 30
Figura 1.9a. Distribución del número de sondas mapeadas a un número de genes único (1, exclusivas) o a varios genes (>1, ambiguas) para los microarrays HG-‐ U133A y Human Gene 1.0. 1.3.5. Expresión de transcritos no codificantes de proteína (ncRNAs) Capítulo 1 Figura 1.9b. Distribución del número de genes que son mapeados por un número concreto de sondas (11, 22, etc) para los microarrays HG-‐U133A y Human Gene 1.0. Una vez realizado el mapeo sobre ncRNA, cabe preguntarse si estas sondas situadas exclusivamente en regiones no codificantes de proteína muestran perfiles similares a las sondas que detectan genes codificantes. Según algunos estudios recientes los transcritos no codificantes muestran una expresión variable y regulada a través de distintos tejidos, lo que implica que son partes funcionales de la célula (Mercer et al., 2009; Nakaya et al., 2007). Para comprobar si las sondas de los microarrays pueden detectar realmente cambios en los transcritos no codificantes, se utilizó un set de datos de 353 microarrays de expresión en tejidos humanos (GEO ID GSE3526) (Roth et al., 2006), de los que se seleccionaron 15 tomando 3 réplicas de 5 tejidos de regiones corporales y fisiología muy diferente: hipotálamo (tejido nervioso central), corazón (tejido muscular cardiaco), médula ósea (tejido fuente de la hematopoyesis), hígado y bazo (órganos con funciones específicas). Como prueba inicial, se comprobó si la expresión de las sondas que detectan los genes de Ensembl, entre los que se incluyen también algunos genes no codificantes, agrupaba las réplicas biológicas correctamente en un test de agrupamiento (clustering) no supervisado. La figura 1.10a muestra cómo se agrupan de tres en tres las distintas muestras en función de su tipo biológico, indicando su semejanza en cuanto a expresión génica. Posteriormente se procedió de la misma manera pero utilizando únicamente las sondas ubicadas en transcritos procedentes de la base de datos RNAdb. El resultado (figura 10b) muestra que estas sondas también son capaces de agrupar correctamente los distintos tejidos, aunque de una forma no tan fuerte como en el caso anterior. Las figuras 10c y 10d muestran un resultado similar utilizando solo las sondas ubicadas en intrones y ubicadas en la hebra complementaria de genes respectivamente. A pesar de que las sondas intrónicas y las sondas complementarias de genes utilizadas en este test no han podido asignarse a ninguna entidad transcripcional conocida, muestran una regulación específica entre diferentes tejidos, con lo que puede inferirse que estas sondas están detectando señales biológicas y que realmente esas regiones del genoma tienen una función aún por determinar. 31
Page 1: Bioinformática aplicada a estudios
Page 5 and 6: Índice INTRODUCCIÓN GENERAL .....
Page 7 and 8: Introducción general Bioinformáti
Page 9 and 10: Figura 2. Proceso de transcripción
Page 11 and 12: Introducción general caciones, las
Page 13 and 14: Objetivos Introducción general La
Page 15 and 16: Capítulo 1 1.1.1. Bases de datos d
Page 17 and 18: Capítulo 1 sondas core y su inform
Page 19 and 20: caaatgacttgctattattgatggc 225 694 c
Page 21 and 22: presentes en el fichero. Capítulo
Page 23 and 24: Capítulo 1 Mus musculus MG_U74Av2
Page 25 and 26: Capítulo 1 Figura 1.5. Representac
Page 27 and 28: Capítulo 1 Paso 2 Descripción: As
Page 29 and 30: Capítulo 1 A la hora de escribir e
Page 31 and 32: Capítulo 1 en regiones no codifica
Page 33: Capítulo 1 Para optimizar la preci
Page 37 and 38: Capítulo 1 por contraste el númer
Page 39 and 40: Capítulo 1 (cromosoma, locus, exon
Page 41 and 42: Capítulo 1 figura 1.16). Además d
Page 43 and 44: Capítulo 1 exhaustivo en este ámb
Page 45 and 46: Capítulo 1 su presentación y deta
Page 47: Capítulo 1 adaptación para los mi
Page 50 and 51: Tesis Doctoral pueden agrupar en: t
Page 52 and 53: Tesis Doctoral enfermedad a través
Page 54 and 55: Tesis Doctoral los genes encontrado
Page 56 and 57: Tesis Doctoral real (RT-‐PCR).
Page 58 and 59: Tesis Doctoral muestras (ver figura
Page 60 and 61: Tesis Doctoral subtipo fueron: 0.97
Page 62 and 63: Tesis Doctoral En este trabajo se h
Page 64 and 65: Tesis Doctoral permitiría, sin dud
Page 66 and 67: Tesis Doctoral inclusión entre 0 y
Page 68 and 69: Tesis Doctoral exacto del número d
Page 70 and 71: Tesis Doctoral Los valores extremos
Page 72 and 73: Tesis Doctoral dicho, la comparaci
Page 74 and 75: Tesis Doctoral 70 Figura 3.6. Los d
Page 76 and 77: Tesis Doctoral 3.8.b). Sin embargo
Page 78 and 79: Tesis Doctoral Human Exon 1.0. La l
Page 80 and 81: Tesis Doctoral 76 Figura 3.10. Curv
Page 82 and 83: Tesis Doctoral 78 Figura 3.10 (cont
Page 84 and 85:
Tesis Doctoral del inicio del ranki
Page 87 and 88:
Capítulo 4 Análisis de coexpresi
Page 89 and 90:
Capítulo 4 los genes y la perspect
Page 91 and 92:
Capítulo 4 Utilizando el set de da
Page 93 and 94:
ENSG00000142541 RPL13A small nucleo
Page 95 and 96:
Capítulo 4 Para encontrar los gene
Page 97 and 98:
Capítulo 4 ENSG00000134287 ARF3 AD
Page 99 and 100:
Capítulo 4 Figura 4.3. Red de coex
Page 101 and 102:
Capítulo 4 Si analizamos los genes
Page 103 and 104:
Capítulo 4 se hizo comparando cont
Page 105:
4.4. Discusión y posible trabajo f
Page 108 and 109:
Tesis Doctoral exones, y diseñando
Page 110 and 111:
Tesis Doctoral expression and isofo
Page 112 and 113:
Tesis Doctoral 37, e107. Gardina, P
Page 114 and 115:
Tesis Doctoral and survival in chro
Page 116 and 117:
Tesis Doctoral Roth, R.B., Hevezi,
Page 118 and 119:
Tesis Doctoral Xi, L., Feber, A., G
Page 121 and 122:
Risueño et al. BMC Bioinformatics
Page 123 and 124:
Page 125 and 126:
Page 127 and 128:
Page 129 and 130:
Page 131 and 132:
Page 133 and 134:
ORIGINAL ARTICLE Deregulation of mi
Page 135 and 136:
Targets component of miRecords inte
Page 137 and 138:
log 10 2-ΔCt -2.00 -4.00 -6.00 -8.
Page 139 and 140:
Table 4 Potential microRNA (miRNA)-
Page 141 and 142:
myeloma pathogenesis. Proc Natl Aca
Page 143 and 144:
genetic subtypes of CLL show differ
Page 145 and 146:
Table 2. Cont. Up-regulated Down-re
Page 147 and 148:
206 underexpressed in the 13q-H gro
Page 149 and 150:
Table 3. Most significant target ge
Page 151 and 152:
Discussion 13q deletion (13q-) is t
Page 153 and 154:
patients with 17p and 11q deletions
Page 155 and 156:
Human Gene Coexpression Landscape:
Page 157 and 158:
The similarity and proximity of the
Page 159 and 160:
As described in Methods we use a co
Page 161 and 162:
all data points of coexpression pai
Page 163 and 164:
Table 1. This work (2008) Pathway N
Page 165 and 166:
In conclusion, the functional consi
Page 167 and 168:
a total set of 48 microarrays. The
Page 169 and 170:
original article Annals of Oncology
Page 171 and 172:
Annals of Oncology original article
Page 173 and 174:
Page 175 and 176:
show all

Alberto Risueño Pérez - Gredos - Universidad de Salamanca

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?