Alberto Risueño Pérez - Gredos - Universidad de Salamanca
Alberto Risueño Pérez - Gredos - Universidad de Salamanca
Alberto Risueño Pérez - Gredos - Universidad de Salamanca
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Capítulo 4<br />
los genes y la perspectiva <strong>de</strong> especificidad o esencialidad <strong>de</strong> dichos genes, pue<strong>de</strong> ayudar a<br />
encontrar nuevas explicaciones respecto a las causas <strong>de</strong> esta enfermedad compleja, cuyo<br />
estudio a nivel molecular suele limitarse en analizar la funcionalidad asociada a genes o grupos<br />
<strong>de</strong> genes relacionados con cáncer (i.e. oncogenes o genes supresores).<br />
4.2. Materiales y métodos<br />
4.2.1. Conjunto <strong>de</strong> datos seleccionado para perfiles <strong>de</strong> expresión<br />
En varios meta-‐estudios previos realizados en el campo <strong>de</strong> la expresión y relación entre genes<br />
usando datos genómicos, es habitual la utilización <strong>de</strong> múltiples sets <strong>de</strong> datos analizados<br />
conjuntamente abarcando muestras <strong>de</strong> distintos tipos celulares y distintos tejidos, incluyendo<br />
réplicas biológicas por cada tipo o subtipo e incluso incluyendo muestras <strong>de</strong> tejidos patológicos<br />
(Griffith et al., 2005; Lee et al., 2004). Como es sabido, en enfermeda<strong>de</strong>s complejas como el<br />
cáncer en el que la genética juega un papel <strong>de</strong>terminante, es común encontrar genes cuya<br />
expresión está <strong>de</strong>sregulada y se muestra altamente variable <strong>de</strong> un paciente a otro, lo cual<br />
introduce un ruido significativo en los análisis y hace que la señal específica <strong>de</strong>l estado<br />
biológico en estudio se pueda difuminar. En este trabajo, se trató <strong>de</strong> evitar dicho ruido<br />
mediante una cuidada selección <strong>de</strong> las muestras biológicas que se van a comparar, empezando<br />
por seleccionar primeramente sólo muestras proce<strong>de</strong>ntes <strong>de</strong> tejidos sanos. El set <strong>de</strong> datos<br />
utilizado contenía originalmente 353 microarrays mo<strong>de</strong>lo Affymetrix U133 Plus 2.0 (GEO ID<br />
GSE3526) (Roth et al., 2006) incluyendo 65 tejidos distintos, 20 <strong>de</strong> los cuales pertenecían a<br />
tejidos <strong>de</strong>l sistema nervioso central y 45 a otro tipo <strong>de</strong> tejidos. El propósito <strong>de</strong> los autores <strong>de</strong><br />
este trabajo era caracterizar el tejido nervioso obteniendo una firma molecular común. Sin<br />
embargo, para la construcción <strong>de</strong> una red <strong>de</strong> coexpresión <strong>de</strong> genes humanos, esta proporción<br />
<strong>de</strong> tejido nervioso podría introducir un sesgo importante hacia genes expresados y no<br />
expresados en este tipo <strong>de</strong> tejidos respecto al resto. Para evitar esto, se hizo una selección <strong>de</strong><br />
las muestras equilibrada, tratando <strong>de</strong> evitar los sesgos hacia un tipo tisular <strong>de</strong>terminado, lo<br />
que <strong>de</strong>rivó en un subconjunto <strong>de</strong> 32 tejidos (ver tabla 4.1). Por cada uno <strong>de</strong> esos 32 tejidos se<br />
seleccionaron 3 réplicas haciendo un total <strong>de</strong> 96 microarrays. La selección <strong>de</strong> estas muestras se<br />
hizo <strong>de</strong> tal manera que las réplicas biológicas se agrupasen correctamente en un test <strong>de</strong><br />
agrupación no supervisado. La figura 4.1 muestra un heatmap normalizado con RMA en don<strong>de</strong><br />
las muestras están agrupadas <strong>de</strong> 3 en 3, como correspon<strong>de</strong> a las réplicas biológicas. Esto<br />
asegura que el set <strong>de</strong> datos seleccionado es óptimo para la realización <strong>de</strong> un análisis <strong>de</strong><br />
coexpresión en el que se ha minimizado tanto el ruido biológico como el ruido técnico.<br />
Adipose tissue omental Heart ventricle Oral mucosa Stomach fundus<br />
Adrenal gland cortex Kidney cortex Ovary Stomach pyloric<br />
Bone marrow Kidney medulla Pituitary gland Testes<br />
Bronchus Liver Prostate gland Thyroid gland<br />
Cerebellum Lung Salivary gland Tongue<br />
Cerebral cortex Lymph no<strong>de</strong>s Saphenous vein Tonsil<br />
Esophagus Mammary gland Skeletal muscle Trachea<br />
Heart atrium Medulla Spleen Urethra<br />
Tabla 4.1. Relación <strong>de</strong> tejidos/órganos humanos utilizados en esta parte <strong>de</strong>l trabajo proce<strong>de</strong>ntes <strong>de</strong> (Roth et al.,<br />
2006). Para eliminar un posible sesgo respecto a tejidos y sistema nervioso –que es ampliamente estudiado en<br />
el trabajo <strong>de</strong> Roth et al.–, se seleccionó un subconjunto <strong>de</strong> 32 tejidos/órganos respecto al set completo original.<br />
85