08.08.2013 Views

Alberto Risueño Pérez - Gredos - Universidad de Salamanca

Alberto Risueño Pérez - Gredos - Universidad de Salamanca

Alberto Risueño Pérez - Gredos - Universidad de Salamanca

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Capítulo 4<br />

Utilizando el set <strong>de</strong> datos <strong>de</strong>scrito en el apartado anterior, se calculó la señal <strong>de</strong> los<br />

microarrays utilizando los algoritmos RMA y MAS5 y realizando ambas normalizaciones por<br />

separado con el CDF GeneMapper para el array HG-­‐U133 Plus 2.0 (contenido en GATExplorer).<br />

Como se ha explicado en el capítulo 1, la utilización <strong>de</strong> este re-­‐mapeo alternativo al original <strong>de</strong><br />

Affymetrix basado en probesets, implica la reducción <strong>de</strong> ruido posible por hibridación cruzada<br />

y proporciona un nivel <strong>de</strong> expresión para cada gen siguiendo una anotación actualizada en<br />

base a Ensembl. Después <strong>de</strong> la normalización, en lugar <strong>de</strong> realizar los cálculos <strong>de</strong> correlación<br />

con todos los genes <strong>de</strong>tectables por el microarray, se realizó un filtrado previo <strong>de</strong> los genes<br />

"poco informativos" con el objetivo <strong>de</strong> aumentar la sensibilidad <strong>de</strong>l estudio. Como es sabido,<br />

incluso cuando se manejan gran<strong>de</strong>s conjuntos <strong>de</strong> datos, hay una proporción <strong>de</strong> genes que no<br />

se expresan en ninguna condición, manteniendo su señal en niveles <strong>de</strong> ruido (Calza et al.,<br />

2007). A<strong>de</strong>más, la tecnología <strong>de</strong> microarrays <strong>de</strong> expresión <strong>de</strong> Affymetrix, al estar basada en la<br />

hibridación <strong>de</strong> ca<strong>de</strong>nas <strong>de</strong> oligos <strong>de</strong> 25 nucleótidos, presenta multitud <strong>de</strong> sondas que no son<br />

reactivas ante la presencia <strong>de</strong> su RNA complementario o son <strong>de</strong>masiado inespecíficas<br />

permaneciendo su señal saturada y por tanto exhibiendo niveles altos <strong>de</strong> expresión en todas<br />

las muestras. Por ello, se eliminaron <strong>de</strong> la matriz <strong>de</strong> expresión los genes que cumplieron las<br />

dos siguientes condiciones:<br />

1. Genes cuya diferencia <strong>de</strong> expresión (o variabilidad entre dos grupos <strong>de</strong> muestras<br />

cualesquiera) esté por <strong>de</strong>bajo <strong>de</strong> la mediana <strong>de</strong> diferencia <strong>de</strong> todos los genes.<br />

2. Genes cuya expresión media esté por <strong>de</strong>bajo <strong>de</strong> la mediana <strong>de</strong> la expresión <strong>de</strong> todos<br />

los genes.<br />

El filtrado <strong>de</strong> estos genes "poco informativos" que no cambian suficientemente en ninguna<br />

condición solo se realizó para la matriz normalizada con RMA ya que, como <strong>de</strong>mostró un<br />

trabajo previo (Prieto et al., 2008), el análisis <strong>de</strong> correlación realizado tras combinación <strong>de</strong> los<br />

algoritmos MAS5+Spearman no requiere tal filtrado previo al no cambiar nada los genes antes<br />

o <strong>de</strong>spués <strong>de</strong> tal filtrado. La matriz <strong>de</strong> expresión original contenía 17582 genes <strong>de</strong> los cuales se<br />

filtraron 4979 (28,3%) reduciendo la matriz a 12603 genes.<br />

Como ya se ha indicado, para <strong>de</strong>terminar los pares <strong>de</strong> genes que tienen una alta similitud en<br />

sus perfiles <strong>de</strong> expresión se utilizaron los métodos <strong>de</strong> correlación <strong>de</strong> Pearson y <strong>de</strong> Spearman. El<br />

umbral consi<strong>de</strong>rado para <strong>de</strong>terminar si existe una similitud significativa en la expresión <strong>de</strong> dos<br />

genes se situó en un coeficiente <strong>de</strong> correlación r >= 0.70 . Finalmente, en el trabajo <strong>de</strong> Prieto<br />

et al. (Prieto et al., 2008) se revela que las correlaciones negativas son en su mayoría un<br />

artefacto y no son consistentes ni reproducibles, por ello no son consi<strong>de</strong>radas en este estudio.<br />

La representación gráfica <strong>de</strong> la red se realizó mediante la herramienta bioinformática<br />

Cytoscape (Shannon et al., 2003; Smoot et al., 2011). Este programa <strong>de</strong> código abierto<br />

permite construir y visualizar re<strong>de</strong>s <strong>de</strong>rivadas <strong>de</strong> experimentos biomoleculares, pudiendo<br />

ampliarse también con distintas utilida<strong>de</strong>s para análisis <strong>de</strong> las re<strong>de</strong>s (ver plugins <strong>de</strong> Cytoscape).<br />

4.2.3. I<strong>de</strong>ntificación <strong>de</strong> genes housekeeping (HKG)<br />

En los últimos años, se han llevado a cabo experimentos transcriptómicos a gran escala que<br />

han aportado gran cantidad <strong>de</strong> datos sobre los genes humanos. Esta información pue<strong>de</strong> ser útil<br />

a la hora <strong>de</strong> i<strong>de</strong>ntificar HKG, ya que son los pilares que mantienen los procesos biológicos<br />

básicos para la supervivencia <strong>de</strong> la célula. La comunidad científica asume que los HKG son<br />

esenciales para cualquier tipo <strong>de</strong> célula, sin embargo, no existe aún una lista <strong>de</strong>finitiva <strong>de</strong> estos<br />

genes <strong>de</strong> referencia para el organismo humano. En este trabajo hemos <strong>de</strong>sarrollado una<br />

87

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!