Alberto Risueño Pérez - Gredos - Universidad de Salamanca
Alberto Risueño Pérez - Gredos - Universidad de Salamanca
Alberto Risueño Pérez - Gredos - Universidad de Salamanca
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Capítulo 1<br />
exhaustivo en este ámbito, proporcionando una re<strong>de</strong>finición <strong>de</strong> los arrays <strong>de</strong> Affymetrix para<br />
varias especies. Nuestro grupo <strong>de</strong> investigación <strong>de</strong>l Centro <strong>de</strong>l Cáncer inició los trabajos <strong>de</strong> re-‐<br />
mapeo <strong>de</strong> sondas <strong>de</strong> microarrays también en torno a 2005, aunque nos propusimos<br />
profundizar más en el problema <strong>de</strong>l análisis <strong>de</strong> la expresión génica global estudiando a fondo<br />
los algoritmos <strong>de</strong> análisis y abordando <strong>de</strong> modo más integrado el sentido y las ventajas que<br />
tiene re-‐mapear las sondas <strong>de</strong> los microarrays. Por ello, emprendimos un trabajo ambicioso<br />
que incluye no sólo la re-‐anotación <strong>de</strong> sondas y el re-‐mapeo a genes conocidos, sino también<br />
la búsqueda <strong>de</strong> otras entida<strong>de</strong>s transcriptómicas a las que los miles <strong>de</strong> sondas no asignadas a<br />
genes codificantes se pudieran reasignar. Por ello, se realizó el re-‐mapeo a la base <strong>de</strong> datos <strong>de</strong><br />
ncRNAs (ver figura 1.8) que es genuino <strong>de</strong> nuestro estudio (como se indica también en la tabla<br />
1.9). Finalmente, GATExplorer también incluye la herramienta <strong>de</strong> visualización <strong>de</strong> sondas<br />
integrada en una plataforma web, navegador genómico transcriptómico, que no se ha<br />
<strong>de</strong>sarrollado en ninguno <strong>de</strong> los otros trabajos publicados antes y que proporciona una gran<br />
ayuda para la mejor comprensión <strong>de</strong> resultados <strong>de</strong> estudios <strong>de</strong> expresión.<br />
Tras el <strong>de</strong>sarrollo <strong>de</strong>l algoritmo <strong>de</strong> remapeo incluido en GATExplorer realizamos un análisis<br />
comparativo con el mapeo original <strong>de</strong> Affymetrix combinando distintos algoritmos <strong>de</strong><br />
normalización, utilizando una colección <strong>de</strong> microarrays que compara la expresión global <strong>de</strong><br />
ratones knock-‐out (a los cuales les falta un gen concreto) con la expresión en los ratones<br />
normales (wild-‐type). Este análisis busca <strong>de</strong>mostrar con un ejemplo práctico la eficiencia <strong>de</strong><br />
aplicar un re-‐mapeo actualizado en base a conocimiento actual <strong>de</strong> los genes para cualquier<br />
análisis <strong>de</strong> expresión dado.<br />
En la tabla 1.10 se presentan los resultados <strong>de</strong>l estudio comparativo para i<strong>de</strong>ntificar expresión<br />
diferencial en varios sets <strong>de</strong> microarrays para los que se utilizan tanto la anotación original <strong>de</strong><br />
Affymetrix (probesets) como con el remapeo nuevo <strong>de</strong> GATExplorer. Los análisis se han hecho<br />
usando 3 algoritmos <strong>de</strong> normalización: MAS5.0 (Hubbell et al., 2002; Liu et al., 2002), FARMS<br />
(Hochreiter et al., 2006) y RMA (Irizarry et al., 2003a). Los tres algoritmos se han probado<br />
utilizando la anotación original <strong>de</strong> Affymetrix; y a<strong>de</strong>más el algoritmo RMA es el que se ha<br />
utilizado para obtener la señal <strong>de</strong> expresión con el re-‐mapeo <strong>de</strong> GATExplorer. El uso <strong>de</strong> ambos<br />
mapeos se realiza mediante Chip Definition Files (CDFs) utilizando R y los paquetes <strong>de</strong><br />
BioConductor (Gentleman et al., 2004; Smyth, 2005). Como algoritmo <strong>de</strong> <strong>de</strong>tección <strong>de</strong><br />
expresión diferencial utilizamos SAM (Tusher et al., 2001). Las muestras comparadas son una<br />
colección <strong>de</strong> 5 series <strong>de</strong> microarrays <strong>de</strong> 6 muestras cada una. Cada set incluye 3 réplicas<br />
biológicas <strong>de</strong> ratones knock-‐out (KO) para un gen específico que es comparado con las 3<br />
réplicas biológicas correspondientes con el wild-‐type (WT). Estos 5 genes son: APOE-‐/-‐, IRS2-‐/-‐,<br />
NRAS-‐/-‐, SCD1-‐/-‐ y ENG+/-‐ (ver tabla 1.10). El objetivo <strong>de</strong> estas comparaciones es i<strong>de</strong>ntificar la<br />
posición <strong>de</strong>l gen no presente (i.e. eliminado por knock-‐out) en el ranking <strong>de</strong> genes cuya<br />
expresión está alterada entre ambos grupos <strong>de</strong> ratones. En condiciones i<strong>de</strong>ales, el gen que no<br />
está presente en los ratones KO <strong>de</strong>bería ser el que experimentase la mayor diferencia,<br />
mostrando la infra-‐expresión máxima comparada con los ratones WT. En esta comparación se<br />
trata <strong>de</strong> medir cómo afectan los métodos y el re-‐mapeo al resultado <strong>de</strong> la expresión diferencial<br />
y qué análisis sitúa al gen KO en una posición más alta en el ranking. Los resultados indican que<br />
el uso <strong>de</strong>l mapeo <strong>de</strong> GATExplorer funciona en general mejor que el uso <strong>de</strong> probesets originales<br />
<strong>de</strong> Affymetrix, ya que en todos los casos el gen KO se encuentra entre los primeros <strong>de</strong> la lista<br />
<strong>de</strong> genes infra-‐expresados. Cada uno <strong>de</strong> los genes testados tiene funciones diferentes, están<br />
implicados en distintos mecanismos moleculares y tienen distintos genes asociados que<br />
pue<strong>de</strong>n verse afectados por el KO. Por lo tanto, no se pue<strong>de</strong> asumir que el gen KO <strong>de</strong>be ser<br />
siempre i<strong>de</strong>ntificado como el más reprimido, pero sí <strong>de</strong>be ser uno <strong>de</strong> los más reprimidos y, sin<br />
duda, <strong>de</strong>be ser estadísticamente significativo. No obstante, po<strong>de</strong>mos encontrar diferencias<br />
significativas entre los 4 métodos utilizados, diferencias que no pue<strong>de</strong>n <strong>de</strong>berse a la biología –<br />
que es idéntica por usarse las mismas muestras en la comparación– sino a los diferentes<br />
39