Alberto Risueño Pérez - Gredos - Universidad de Salamanca
Alberto Risueño Pérez - Gredos - Universidad de Salamanca
Alberto Risueño Pérez - Gredos - Universidad de Salamanca
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Tesis Doctoral<br />
real (RT-‐PCR). Tras la obtención <strong>de</strong> los datos crudos <strong>de</strong> expresión <strong>de</strong> todos los miRNAs, se<br />
procedió a la elaboración <strong>de</strong> una lista <strong>de</strong> miRNAs <strong>de</strong>sregulados/alterados significativamente.<br />
Dicha lista fue obtenida mediante la comparación <strong>de</strong> la expresión <strong>de</strong> los miRNAs <strong>de</strong> cada<br />
alteración citogenética en relación a las células plasmáticas sanas, utilizando para ello el<br />
algoritmo SAM con un punto <strong>de</strong> corte por p-‐valor corregido: FDR < 0.001. De este modo, se<br />
i<strong>de</strong>ntificaron 11, 7, 8, 37 and 18 miRNAs para los pacientes con t(4;14), t(11;14), t(14;16),<br />
<strong>de</strong>lRB y FISH normal respectivamente (ver tabla 2.3).<br />
El trabajo principal realizado en la presente Tesis Doctoral con los datos <strong>de</strong> MM, se centra en<br />
aplicar un mo<strong>de</strong>lo predictivo para estimar el nivel <strong>de</strong> asociación entre las distintas categorías<br />
<strong>de</strong> pacientes y el conjunto <strong>de</strong> miRNAs alterados, para lo cual se utilizó el algoritmo Global Test<br />
(Goeman et al., 2004). Este algoritmo permite pre<strong>de</strong>cir la influencia <strong>de</strong> uno o varios factores<br />
pre<strong>de</strong>finidos –que en este caso son un conjunto <strong>de</strong> miRNAs con sus perfiles <strong>de</strong> expresión–<br />
sobre una variable <strong>de</strong> respuesta o <strong>de</strong> salida (outcome) que es testada –que en este caso son los<br />
subtipos <strong>de</strong> enfermedad MM <strong>de</strong>finidos–. La hipótesis nula correspon<strong>de</strong>ría al hecho <strong>de</strong> que el<br />
perfil <strong>de</strong> expresión <strong>de</strong>l conjunto <strong>de</strong> factores testado no está asociado a la variable <strong>de</strong><br />
respuesta. En el caso <strong>de</strong> MM analizamos la expresión <strong>de</strong> los miRNAs para i<strong>de</strong>ntificar cuales son<br />
los que mejor marcan o predicen las distintas alteraciones <strong>de</strong>l cariotipo usadas como<br />
respuesta. Este algoritmo se utilizó en su versión para R con el paquete llamado globaltest<br />
(Goeman and Oosting, 2009) incluido en Bioconductor.<br />
2.3. Resultados<br />
2.3.1. Análisis <strong>de</strong> muestras <strong>de</strong> Leucemia Linfocítica Crónica<br />
El análisis <strong>de</strong> expresión diferencial aplicado a las muestras <strong>de</strong>l grupo <strong>de</strong> estudio <strong>de</strong> CLL 13q-‐H<br />
contra las muestras CLL 13q-‐L <strong>de</strong>volvió un total <strong>de</strong> 3.450 genes significativos <strong>de</strong> los cuales<br />
1.244 estaban sobre-‐expresados y 2.206 reprimidos en 13q-‐H. Esta diferencia importante<br />
indica que muestras que presentan la misma enfermedad con una misma alteración<br />
citogenética tienen un patrón <strong>de</strong> expresión diferente atendiendo al porcentaje <strong>de</strong> blastos<br />
encontrados con dicha pérdida <strong>de</strong> 13q. Esto significa que las categorías patológicas <strong>de</strong>finidas<br />
por los datos clínicos (<strong>de</strong> mejor o peor pronóstico) presentan también diferencias a nivel<br />
biológico transcriptómico, lo que confirma la principal hipótesis <strong>de</strong> trabajo. Una posterior<br />
comprobación por RT-‐PCR validó varios <strong>de</strong> los genes encontrados como alterados: GAS7, E2F1<br />
y FCRL2.<br />
Otras <strong>de</strong> las hipótesis <strong>de</strong> trabajo <strong>de</strong> este estudio es que los grupos <strong>de</strong> peor pronóstico, como<br />
son CLL 13q-‐H y <strong>de</strong>l(17p/11q), comparten un perfil <strong>de</strong> expresión más cercano que las <strong>de</strong> mejor<br />
pronóstico, CLL 13q-‐L y CLL-‐nk. La utilización <strong>de</strong> un método <strong>de</strong> agrupamiento no supervisado<br />
utilizando todos los genes <strong>de</strong>tectables por los microarrays no fue <strong>de</strong> utilidad <strong>de</strong>bido a que la<br />
gran variabilidad entre pacientes por muchos factores posibles –ocultos o no <strong>de</strong>finidos– hace<br />
imposible el agrupamiento entre las muestras <strong>de</strong>l mismo tipo según las categorías dadas<br />
(datos no presentados). De esta manera, se realizó un análisis semi-‐supervisado calculando la<br />
distancia entre las distintas categorías utilizando los 3450 genes significativos que diferencian<br />
las CLLs 13q-‐H <strong>de</strong> las 13q-‐L. La figura 2.1 muestra un heatmap <strong>de</strong> este análisis <strong>de</strong> clasificación<br />
semi-‐supervisado presentando los correspondientes agrupamientos jerárquicos a nivel <strong>de</strong><br />
genes y a nivel <strong>de</strong> muestras. Las distancias en ambos casos se mi<strong>de</strong>n utilizando la correlación<br />
<strong>de</strong> Pearson (d=1-‐cor) y el tipo "complete" para calcular la disimilaridad con un método<br />
52