Alberto Risueño Pérez - Gredos - Universidad de Salamanca

More documents

Recommendations

Info

Tesis Doctoral del inicio del ranking por significación será considerada por el investigador. Esto significa que la información realmente útil es la proporcionada a tasas bajas de falsos positivos. Por este motivo hemos hecho un estudio de la cantidad de verdaderos positivos eligiendo un criterio fijo para todos los métodos y pares de tejidos, como es considerar únicamente los primeros n genes más significativos eligiendo un umbral arbitrario de 1000 genes. Los resultados fueron diferentes a los obtenidos con las curvas ROC. En este caso los métodos ESLiMc y ESLiMt mostraron un comportamiento bastante distinto entre si, encontrando 61 y 29 genes respectivamente. El orden entre FIRMA, ARH y COSIE también se alteró, mostrando COSIE mostró mejor resultado que los otros dos métodos (ver tabla 3.5 y figura 3.12). 80 ESLiMc ESLiMt FIRMA ARH COSIE BRE-‐CER 17 8 6 6 10 BRE-‐HEA 2 0 2 1 2 BRE-‐LIV 1 0 0 2 1 BRE-‐MUS 3 1 2 3 2 BRE-‐TES 1 1 0 0 0 CER-‐HEA 1 3 1 1 2 CER-‐LIV 1 1 1 0 1 CER-‐MUS 10 3 3 5 6 CER-‐TES 10 5 1 4 3 HEA-‐LIV 0 0 0 0 0 HEA-‐MUS 5 2 1 0 3 HEA-‐TES 4 3 3 1 4 LIV-‐MUS 1 0 0 0 1 LIV-‐TES 0 0 1 1 0 MUS-‐TES 5 2 3 6 5 Suma 61 29 24 30 40 Tabla 3.5. Número de genes con splicing validados en las distintas comparaciones entre tejido detectados en los 1000 genes más significativos. Se comparan 5 métodos de detección de splicing en 15 comparaciones binarias. Figura 3.12. Diagrama de barras indicando el número de genes con splicing validados en las distintas comparaciones entre tejido detectados en los 1000 genes más significativos. Se comparan 5 métodos de detección de splicing en 15 comparaciones.
3.4. Discusión y posible trabajo futuro Capítulo 3 El splicing alternativo es un proceso biológico fundamental para el entendimiento del funcionamiento de los genes en los distintos tipos celulares y de las distintas funciones que pueden tener las isoformas de genes y proteínas en un organismo. En el trabajo del capítulo 1 de la presente Tesis Doctoral, se trató de mejorar los análisis de microarrays de oligos de alta densidad con GATExplorer. En el capítulo 2, se analizaron datos de expresión génica y de miRNAs para obtener biomarcadores en distintos tipos de cáncer. Después de esto, en este capítulo 3, se ha intentado avanzar en los análisis de genómicos yendo más allá de medir la expresión global del gen y tratando de desarrollar un algoritmo aplicado a la detección de splicing alternativo a partir de datos de microarrays de exones. Al utilizar diversos algoritmos destinados a la detección de splicing basados en la tecnología de microarrays de exones, se identificó un problema no resuelto de forma satisfactoria por la mayoría de ellos. Las características propias de cada sonda de oligonucleótidos hacen que no pueda compararse directamente la expresión individual de cada exón con la expresión global del locus génico que lo contiene, produciendo falsos positivos. El nuevo método diseñado en este capítulo 3, ESLiM, utiliza la totalidad de las muestras para trazar una regresión lineal que enfrenta la expresión de cada exón con la de su gen, permitiendo calcular el comportamiento de la expresión del exón ante los cambios de expresión del gen. Al utilizar todas las muestras para el cálculo de residuales, se esperan resultados más fiables en un set de datos con un número alto de muestras y tipos biológicos diferentes. Además, la utilización del mapeo realizado en GATExplorer, asegura una selección de sondas biológicamente coherente para calcular la expresión de genes y exones. La comparativa entre algoritmos utilizando un conjunto de genes con splicing previamente validado determinó que el método ESLiM supera en precisión a las otras estrategias previamente publicadas. Las curvas ROC mostraron que las dos estrategias diseñadas (ESLiMc y ESLiMc) obtuvieron un promedio de AUC muy similar entre ellos y superior al de los otros algoritmos. Sin embargo al restringir el conjunto de genes a los de mayor significación estadística, en lugar de analizar su totalidad, los resultados fueron distintos. Esta vez ESLiMt se mostró inferior a ESLiMc, detectando aproximadamente la mitad de verdaderos positivos. El hecho de que ESLiMt sea un método muy restrictivo de selección de sondas, hace que no sea posible la detección de la expresión de multitud de genes. ESLiMc mapea aproximadamente el mismo número de genes que los otros algoritmos publicados, pero encuentra un número superior de verdaderos positivos entre los genes detectados a los que asigna mayor significación estadística. Esto es particularmente importante para el investigador, que habitualmente trabaja únicamente con los genes que muestran los mejores p-‐valores, y que tratará de validar experimentalmente los resultados. El trabajo futuro en este tema podría ir encaminado en la interpretación biológica del proceso de splicing medido a nivel genómico, tratando de identificar los procesos en donde el splicing alternativo es más relevante y viendo si el grado de splicing está uniformemente distribuido entre todos los genes. El análisis del spliceosoma mediante la correlación entre los exones que sufren splicing y la expresión de los genes regulatorios llamados splicing factors, puede ser también útil para profundizar en el entendimiento de este proceso. Finalmente, un análisis de las secuencias de los intrones regulados bajo un mismo gen, o conjunto de genes reguladores, podría identificar motivos conservados que funcionan como regiones de unión al DNA. 81
Page 1:
Bioinformática aplicada a estudios
Page 5 and 6:
Índice INTRODUCCIÓN GENERAL .....
Page 7 and 8:
Introducción general Bioinformáti
Page 9 and 10:
Figura 2. Proceso de transcripción
Page 11 and 12:
Introducción general caciones, las
Page 13 and 14:
Objetivos Introducción general La
Page 15 and 16:
Capítulo 1 1.1.1. Bases de datos d
Page 17 and 18:
Capítulo 1 sondas core y su inform
Page 19 and 20:
caaatgacttgctattattgatggc 225 694 c
Page 21 and 22:
presentes en el fichero. Capítulo
Page 23 and 24:
Capítulo 1 Mus musculus MG_U74Av2
Page 25 and 26:
Capítulo 1 Figura 1.5. Representac
Page 27 and 28:
Capítulo 1 Paso 2 Descripción: As
Page 29 and 30:
Capítulo 1 A la hora de escribir e
Page 31 and 32:
Capítulo 1 en regiones no codifica
Page 33 and 34: Capítulo 1 Para optimizar la preci
Page 35 and 36: Figura 1.9a. Distribución del núm
Page 37 and 38: Capítulo 1 por contraste el númer
Page 39 and 40: Capítulo 1 (cromosoma, locus, exon
Page 41 and 42: Capítulo 1 figura 1.16). Además d
Page 43 and 44: Capítulo 1 exhaustivo en este ámb
Page 45 and 46: Capítulo 1 su presentación y deta
Page 47: Capítulo 1 adaptación para los mi
Page 50 and 51: Tesis Doctoral pueden agrupar en: t
Page 52 and 53: Tesis Doctoral enfermedad a través
Page 54 and 55: Tesis Doctoral los genes encontrado
Page 56 and 57: Tesis Doctoral real (RT-‐PCR).
Page 58 and 59: Tesis Doctoral muestras (ver figura
Page 60 and 61: Tesis Doctoral subtipo fueron: 0.97
Page 62 and 63: Tesis Doctoral En este trabajo se h
Page 64 and 65: Tesis Doctoral permitiría, sin dud
Page 66 and 67: Tesis Doctoral inclusión entre 0 y
Page 68 and 69: Tesis Doctoral exacto del número d
Page 70 and 71: Tesis Doctoral Los valores extremos
Page 72 and 73: Tesis Doctoral dicho, la comparaci
Page 74 and 75: Tesis Doctoral 70 Figura 3.6. Los d
Page 76 and 77: Tesis Doctoral 3.8.b). Sin embargo
Page 78 and 79: Tesis Doctoral Human Exon 1.0. La l
Page 80 and 81: Tesis Doctoral 76 Figura 3.10. Curv
Page 82 and 83: Tesis Doctoral 78 Figura 3.10 (cont
Page 87 and 88: Capítulo 4 Análisis de coexpresi
Page 89 and 90: Capítulo 4 los genes y la perspect
Page 91 and 92: Capítulo 4 Utilizando el set de da
Page 93 and 94: ENSG00000142541 RPL13A small nucleo
Page 95 and 96: Capítulo 4 Para encontrar los gene
Page 97 and 98: Capítulo 4 ENSG00000134287 ARF3 AD
Page 99 and 100: Capítulo 4 Figura 4.3. Red de coex
Page 101 and 102: Capítulo 4 Si analizamos los genes
Page 103 and 104: Capítulo 4 se hizo comparando cont
Page 105: 4.4. Discusión y posible trabajo f
Page 108 and 109: Tesis Doctoral exones, y diseñando
Page 110 and 111: Tesis Doctoral expression and isofo
Page 112 and 113: Tesis Doctoral 37, e107. Gardina, P
Page 114 and 115: Tesis Doctoral and survival in chro
Page 116 and 117: Tesis Doctoral Roth, R.B., Hevezi,
Page 118 and 119: Tesis Doctoral Xi, L., Feber, A., G
Page 121 and 122: Risueño et al. BMC Bioinformatics
Page 133 and 134: ORIGINAL ARTICLE Deregulation of mi
Page 135 and 136:
Targets component of miRecords inte
Page 137 and 138:
log 10 2-ΔCt -2.00 -4.00 -6.00 -8.
Page 139 and 140:
Table 4 Potential microRNA (miRNA)-
Page 141 and 142:
myeloma pathogenesis. Proc Natl Aca
Page 143 and 144:
genetic subtypes of CLL show differ
Page 145 and 146:
Table 2. Cont. Up-regulated Down-re
Page 147 and 148:
206 underexpressed in the 13q-H gro
Page 149 and 150:
Table 3. Most significant target ge
Page 151 and 152:
Discussion 13q deletion (13q-) is t
Page 153 and 154:
patients with 17p and 11q deletions
Page 155 and 156:
Human Gene Coexpression Landscape:
Page 157 and 158:
The similarity and proximity of the
Page 159 and 160:
As described in Methods we use a co
Page 161 and 162:
all data points of coexpression pai
Page 163 and 164:
Table 1. This work (2008) Pathway N
Page 165 and 166:
In conclusion, the functional consi
Page 167 and 168:
a total set of 48 microarrays. The
Page 169 and 170:
original article Annals of Oncology
Page 171 and 172:
Annals of Oncology original article
Page 173 and 174:
Page 175 and 176:
show all

Alberto Risueño Pérez - Gredos - Universidad de Salamanca

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?