Alberto Risueño Pérez - Gredos - Universidad de Salamanca

More documents

Recommendations

Info

Tesis Doctoral inclusión entre 0 y 1 calculado mediante una aproximación bayesiana. La diferencia entre los valores de inclusión entre los dos tejidos es lo que da el nivel de confianza (score) de estar realmente ante un evento de splicing alternativo. Finalmente para nuestro estudio en esta Tesis Doctoral será considerado únicamente el conjunto de tejidos comunes a los dos sets de datos citados: el set de microarrays de Affymetrix y el trabajo de Wang et al. (ver tabla 3.1). El conjunto de tejidos comunes a ambos grupos corresponde con 6 tejidos distintos: mama, cerebelo, corazón, hígado, músculo y testículo. La combinación de estos 6 tejidos cuando se comparan de 2 en 2 proporciona un total de 15 pares distintos. El número total de pares (gen :: combinación de tejidos) suma 282, mientras que el número de genes distintos es de 270. El número de genes validados por cada par se describe en la tabla 3.2. breast cerebellum heart liver muscle testes breast – 75 11 5 8 16 cerebellum – 22 12 38 52 heart – 2 13 7 liver – 2 5 muscle – 14 testes – Tabla 3.2. Número de genes validados por Wang et al. (Wang et al., 2008) en cada una de las combinaciones de tejido. La suma total de genes es de 282 y el número de genes distintos es 270. 3.2.2 Descripción de algoritmos y métodos para análisis de splicing previamente publicados La estrategia común a todos los algoritmos de detección de splicing alternativo previamente publicados es la de comparar la expresión global del gen contra la expresión individual de cada uno de los exones. La hipótesis fundamental es que, en ausencia de splicing alternativo, un cambio de expresión del gen debe suponer un cambio de cada uno de sus exones en la misma proporción y sentido. En este punto, los genes que se desvían de esa norma se interpretan como splicing. El reto de los diferentes algoritmos es calcular con precisión la expresión de cada una de las partes (gen y exones) y medir sus variaciones asignado un valor de probabilidad. Los primeros métodos fueron propuestos por parte de la propia compañía que comercializa los chips. En un artículo llamado "Alternative Transcript Analysis Methods for Exon Arrays" de la documentación técnica publicada por Affymetrix (Affymetrix, 2005a), se describen 5 métodos entre los que figura el popular y sencillo Splicing Index. Una vez estos arrays entraron en el mercado y empezaron a usarse, distintos grupos de investigación desarrollaron sus propuestas. A continuación se revisan brevemente las más relevantes: 62 • Splicing Index (Affymetrix, 2005a): Es el método más simple. En un primer paso propone normalizar la expresión del exón dividiendo su señal por la expresión del gen. En un segundo paso se realiza la media de la expresión normalizada por cada grupo de estudio (p. ej. tejido sano y tumor) calculando su relación o ratio. • PAC (Affymetrix, 2005a): Se deriva de Splicing Index y asume que en ausencia de
Capítulo 3 splicing el ratio entre el exón y el gen permanece constante. De esta manera debe de existir una correlación entre la expresión del exón y la expresión del gen, en caso contrario se interpretaría que existe splicing alternativo. • MIDAS (Affymetrix, 2005a): Este algoritmo se basa en la misma idea de Splicing Index y PAC, con la diferencia de utilizar un análisis de varianza (ANOVA) para encontrar diferencias entre distintos grupos de estudio utilizando el ratio entre el exón y el gen añadiendo una constante para estabilizar la varianza. • ANOSVA (Affymetrix, 2005a; Cline et al., 2005): Método en donde se propone un modelo lineal cuya hipótesis nula es la no varianza entre genes y exones. La significación de los desvíos de los residuales entre grupos de muestras se calculan mediante un ANOVA. • DECONV (Affymetrix, 2005a; Wang et al., 2003): Se basa en la estructura del gen con sus diferentes exones para tratar de cuantificar la cantidad relativa de cada una de las isoformas mediante su deconvolución. Requiere conocer a priori el número y exones utilizados en de cada una de las isoformas. Es decir, requiere conocer los distintos transcritos alternativos que se pueden generar en un locus concreto. • FIRMA (Purdom et al., 2008): Extiende el modelo aditivo del algoritmo RMA introduciendo nuevos parámetros que representan el valor real del exón y sus discrepancia o desvío frente al valor esperado. Este método calcula este desvío para cada exón y muestra independientemente de las categorías biológicas predefinidas, lo cual permite hacer las comparaciones pertinentes de la manera más conveniente una vez realizados todos los cálculos (p. ej. análisis con muestras pareadas). • COSIE (Gaidatzis et al., 2009): Este trabajo aborda el problema del "efecto sonda", describiendo cómo se producen falsos positivos en ciertos métodos predictivos por asumir que las diferentes sondas se comportan todas de la misma manera. Para solucionar este problema proponen un método de corrección sonda a sonda en base a un entrenamiento previo con datos procedentes de repositorios públicos. Finalmente utilizan Splicing Index para mostrar la mejora introducida por dicha corrección. • ARH (Rasche and Herwig, 2010): En este algoritmo se utilizan los fundamentos de entropía para calcular la probabilidad de que un exón sufra splicing entre dos fenotipos distintos. Mide el desvío de cada exón respecto a la expresión global del gen tratando de determinar si la probabilidad es similar entre ellos, o por el contrario es dominada por uno, o unos pocos exones. • SPACE (Anton et al., 2010): Basado en una versión anterior para arrays con sodas "exon-‐junction" (Anton et al., 2008), el nuevo SPACE pretende mejorar su rendimiento mediante una adaptación a Human Exon Array. Este programa se basa en anotar las sondas a nivel de transcritos de Ensembl (ENSTs), para calcular su expresión mediante factorización de matrices no negativas. Algunos de estos métodos, en concreto los propuestos por Affymetrix, han sido claramente superado por los métodos publicados posteriormente, o incluso han ofrecido malos resultados desde su origen, como es el caso de ANOSVA, en donde el propio escrito original (Affymetrix, 2005a) lo critica fuertemente. Los métodos como DECONV y SPACE, basados en la estimación de la cantidad de cada uno de los transcritos expresados, requieren de un conocimiento previo 63
Page 1:
Bioinformática aplicada a estudios
Page 5 and 6:
Índice INTRODUCCIÓN GENERAL .....
Page 7 and 8:
Introducción general Bioinformáti
Page 9 and 10:
Figura 2. Proceso de transcripción
Page 11 and 12:
Introducción general caciones, las
Page 13 and 14:
Objetivos Introducción general La
Page 15 and 16: Capítulo 1 1.1.1. Bases de datos d
Page 17 and 18: Capítulo 1 sondas core y su inform
Page 19 and 20: caaatgacttgctattattgatggc 225 694 c
Page 21 and 22: presentes en el fichero. Capítulo
Page 23 and 24: Capítulo 1 Mus musculus MG_U74Av2
Page 25 and 26: Capítulo 1 Figura 1.5. Representac
Page 27 and 28: Capítulo 1 Paso 2 Descripción: As
Page 29 and 30: Capítulo 1 A la hora de escribir e
Page 31 and 32: Capítulo 1 en regiones no codifica
Page 33 and 34: Capítulo 1 Para optimizar la preci
Page 35 and 36: Figura 1.9a. Distribución del núm
Page 37 and 38: Capítulo 1 por contraste el númer
Page 39 and 40: Capítulo 1 (cromosoma, locus, exon
Page 41 and 42: Capítulo 1 figura 1.16). Además d
Page 43 and 44: Capítulo 1 exhaustivo en este ámb
Page 45 and 46: Capítulo 1 su presentación y deta
Page 47: Capítulo 1 adaptación para los mi
Page 50 and 51: Tesis Doctoral pueden agrupar en: t
Page 52 and 53: Tesis Doctoral enfermedad a través
Page 54 and 55: Tesis Doctoral los genes encontrado
Page 56 and 57: Tesis Doctoral real (RT-‐PCR).
Page 58 and 59: Tesis Doctoral muestras (ver figura
Page 60 and 61: Tesis Doctoral subtipo fueron: 0.97
Page 62 and 63: Tesis Doctoral En este trabajo se h
Page 64 and 65: Tesis Doctoral permitiría, sin dud
Page 68 and 69: Tesis Doctoral exacto del número d
Page 70 and 71: Tesis Doctoral Los valores extremos
Page 72 and 73: Tesis Doctoral dicho, la comparaci
Page 74 and 75: Tesis Doctoral 70 Figura 3.6. Los d
Page 76 and 77: Tesis Doctoral 3.8.b). Sin embargo
Page 78 and 79: Tesis Doctoral Human Exon 1.0. La l
Page 80 and 81: Tesis Doctoral 76 Figura 3.10. Curv
Page 82 and 83: Tesis Doctoral 78 Figura 3.10 (cont
Page 84 and 85: Tesis Doctoral del inicio del ranki
Page 87 and 88: Capítulo 4 Análisis de coexpresi
Page 89 and 90: Capítulo 4 los genes y la perspect
Page 91 and 92: Capítulo 4 Utilizando el set de da
Page 93 and 94: ENSG00000142541 RPL13A small nucleo
Page 95 and 96: Capítulo 4 Para encontrar los gene
Page 97 and 98: Capítulo 4 ENSG00000134287 ARF3 AD
Page 99 and 100: Capítulo 4 Figura 4.3. Red de coex
Page 101 and 102: Capítulo 4 Si analizamos los genes
Page 103 and 104: Capítulo 4 se hizo comparando cont
Page 105: 4.4. Discusión y posible trabajo f
Page 108 and 109: Tesis Doctoral exones, y diseñando
Page 110 and 111: Tesis Doctoral expression and isofo
Page 112 and 113: Tesis Doctoral 37, e107. Gardina, P
Page 114 and 115: Tesis Doctoral and survival in chro
Page 116 and 117:
Tesis Doctoral Roth, R.B., Hevezi,
Page 118 and 119:
Tesis Doctoral Xi, L., Feber, A., G
Page 121 and 122:
Risueño et al. BMC Bioinformatics
Page 123 and 124:
Page 125 and 126:
Page 127 and 128:
Page 129 and 130:
Page 131 and 132:
Page 133 and 134:
ORIGINAL ARTICLE Deregulation of mi
Page 135 and 136:
Targets component of miRecords inte
Page 137 and 138:
log 10 2-ΔCt -2.00 -4.00 -6.00 -8.
Page 139 and 140:
Table 4 Potential microRNA (miRNA)-
Page 141 and 142:
myeloma pathogenesis. Proc Natl Aca
Page 143 and 144:
genetic subtypes of CLL show differ
Page 145 and 146:
Table 2. Cont. Up-regulated Down-re
Page 147 and 148:
206 underexpressed in the 13q-H gro
Page 149 and 150:
Table 3. Most significant target ge
Page 151 and 152:
Discussion 13q deletion (13q-) is t
Page 153 and 154:
patients with 17p and 11q deletions
Page 155 and 156:
Human Gene Coexpression Landscape:
Page 157 and 158:
The similarity and proximity of the
Page 159 and 160:
As described in Methods we use a co
Page 161 and 162:
all data points of coexpression pai
Page 163 and 164:
Table 1. This work (2008) Pathway N
Page 165 and 166:
In conclusion, the functional consi
Page 167 and 168:
a total set of 48 microarrays. The
Page 169 and 170:
original article Annals of Oncology
Page 171 and 172:
Annals of Oncology original article
Page 173 and 174:
Page 175 and 176:
show all

Alberto Risueño Pérez - Gredos - Universidad de Salamanca

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?