Alberto Risueño Pérez - Gredos - Universidad de Salamanca
Alberto Risueño Pérez - Gredos - Universidad de Salamanca
Alberto Risueño Pérez - Gredos - Universidad de Salamanca
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
3.4. Discusión y posible trabajo futuro<br />
Capítulo 3<br />
El splicing alternativo es un proceso biológico fundamental para el entendimiento <strong>de</strong>l<br />
funcionamiento <strong>de</strong> los genes en los distintos tipos celulares y <strong>de</strong> las distintas funciones que<br />
pue<strong>de</strong>n tener las isoformas <strong>de</strong> genes y proteínas en un organismo.<br />
En el trabajo <strong>de</strong>l capítulo 1 <strong>de</strong> la presente Tesis Doctoral, se trató <strong>de</strong> mejorar los análisis <strong>de</strong><br />
microarrays <strong>de</strong> oligos <strong>de</strong> alta <strong>de</strong>nsidad con GATExplorer. En el capítulo 2, se analizaron datos<br />
<strong>de</strong> expresión génica y <strong>de</strong> miRNAs para obtener biomarcadores en distintos tipos <strong>de</strong> cáncer.<br />
Después <strong>de</strong> esto, en este capítulo 3, se ha intentado avanzar en los análisis <strong>de</strong> genómicos<br />
yendo más allá <strong>de</strong> medir la expresión global <strong>de</strong>l gen y tratando <strong>de</strong> <strong>de</strong>sarrollar un algoritmo<br />
aplicado a la <strong>de</strong>tección <strong>de</strong> splicing alternativo a partir <strong>de</strong> datos <strong>de</strong> microarrays <strong>de</strong> exones.<br />
Al utilizar diversos algoritmos <strong>de</strong>stinados a la <strong>de</strong>tección <strong>de</strong> splicing basados en la tecnología <strong>de</strong><br />
microarrays <strong>de</strong> exones, se i<strong>de</strong>ntificó un problema no resuelto <strong>de</strong> forma satisfactoria por la<br />
mayoría <strong>de</strong> ellos. Las características propias <strong>de</strong> cada sonda <strong>de</strong> oligonucleótidos hacen que no<br />
pueda compararse directamente la expresión individual <strong>de</strong> cada exón con la expresión global<br />
<strong>de</strong>l locus génico que lo contiene, produciendo falsos positivos. El nuevo método diseñado en<br />
este capítulo 3, ESLiM, utiliza la totalidad <strong>de</strong> las muestras para trazar una regresión lineal que<br />
enfrenta la expresión <strong>de</strong> cada exón con la <strong>de</strong> su gen, permitiendo calcular el comportamiento<br />
<strong>de</strong> la expresión <strong>de</strong>l exón ante los cambios <strong>de</strong> expresión <strong>de</strong>l gen. Al utilizar todas las muestras<br />
para el cálculo <strong>de</strong> residuales, se esperan resultados más fiables en un set <strong>de</strong> datos con un<br />
número alto <strong>de</strong> muestras y tipos biológicos diferentes. A<strong>de</strong>más, la utilización <strong>de</strong>l mapeo<br />
realizado en GATExplorer, asegura una selección <strong>de</strong> sondas biológicamente coherente para<br />
calcular la expresión <strong>de</strong> genes y exones.<br />
La comparativa entre algoritmos utilizando un conjunto <strong>de</strong> genes con splicing previamente<br />
validado <strong>de</strong>terminó que el método ESLiM supera en precisión a las otras estrategias<br />
previamente publicadas. Las curvas ROC mostraron que las dos estrategias diseñadas (ESLiMc<br />
y ESLiMc) obtuvieron un promedio <strong>de</strong> AUC muy similar entre ellos y superior al <strong>de</strong> los otros<br />
algoritmos. Sin embargo al restringir el conjunto <strong>de</strong> genes a los <strong>de</strong> mayor significación<br />
estadística, en lugar <strong>de</strong> analizar su totalidad, los resultados fueron distintos. Esta vez ESLiMt se<br />
mostró inferior a ESLiMc, <strong>de</strong>tectando aproximadamente la mitad <strong>de</strong> verda<strong>de</strong>ros positivos. El<br />
hecho <strong>de</strong> que ESLiMt sea un método muy restrictivo <strong>de</strong> selección <strong>de</strong> sondas, hace que no sea<br />
posible la <strong>de</strong>tección <strong>de</strong> la expresión <strong>de</strong> multitud <strong>de</strong> genes. ESLiMc mapea aproximadamente el<br />
mismo número <strong>de</strong> genes que los otros algoritmos publicados, pero encuentra un número<br />
superior <strong>de</strong> verda<strong>de</strong>ros positivos entre los genes <strong>de</strong>tectados a los que asigna mayor<br />
significación estadística. Esto es particularmente importante para el investigador, que<br />
habitualmente trabaja únicamente con los genes que muestran los mejores p-‐valores, y que<br />
tratará <strong>de</strong> validar experimentalmente los resultados.<br />
El trabajo futuro en este tema podría ir encaminado en la interpretación biológica <strong>de</strong>l proceso<br />
<strong>de</strong> splicing medido a nivel genómico, tratando <strong>de</strong> i<strong>de</strong>ntificar los procesos en don<strong>de</strong> el splicing<br />
alternativo es más relevante y viendo si el grado <strong>de</strong> splicing está uniformemente distribuido<br />
entre todos los genes. El análisis <strong>de</strong>l spliceosoma mediante la correlación entre los exones que<br />
sufren splicing y la expresión <strong>de</strong> los genes regulatorios llamados splicing factors, pue<strong>de</strong> ser<br />
también útil para profundizar en el entendimiento <strong>de</strong> este proceso. Finalmente, un análisis <strong>de</strong><br />
las secuencias <strong>de</strong> los intrones regulados bajo un mismo gen, o conjunto <strong>de</strong> genes reguladores,<br />
podría i<strong>de</strong>ntificar motivos conservados que funcionan como regiones <strong>de</strong> unión al DNA.<br />
81