08.08.2013 Views

Alberto Risueño Pérez - Gredos - Universidad de Salamanca

Alberto Risueño Pérez - Gredos - Universidad de Salamanca

Alberto Risueño Pérez - Gredos - Universidad de Salamanca

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Capítulo 4<br />

los genes y la perspectiva <strong>de</strong> especificidad o esencialidad <strong>de</strong> dichos genes, pue<strong>de</strong> ayudar a<br />

encontrar nuevas explicaciones respecto a las causas <strong>de</strong> esta enfermedad compleja, cuyo<br />

estudio a nivel molecular suele limitarse en analizar la funcionalidad asociada a genes o grupos<br />

<strong>de</strong> genes relacionados con cáncer (i.e. oncogenes o genes supresores).<br />

4.2. Materiales y métodos<br />

4.2.1. Conjunto <strong>de</strong> datos seleccionado para perfiles <strong>de</strong> expresión<br />

En varios meta-­‐estudios previos realizados en el campo <strong>de</strong> la expresión y relación entre genes<br />

usando datos genómicos, es habitual la utilización <strong>de</strong> múltiples sets <strong>de</strong> datos analizados<br />

conjuntamente abarcando muestras <strong>de</strong> distintos tipos celulares y distintos tejidos, incluyendo<br />

réplicas biológicas por cada tipo o subtipo e incluso incluyendo muestras <strong>de</strong> tejidos patológicos<br />

(Griffith et al., 2005; Lee et al., 2004). Como es sabido, en enfermeda<strong>de</strong>s complejas como el<br />

cáncer en el que la genética juega un papel <strong>de</strong>terminante, es común encontrar genes cuya<br />

expresión está <strong>de</strong>sregulada y se muestra altamente variable <strong>de</strong> un paciente a otro, lo cual<br />

introduce un ruido significativo en los análisis y hace que la señal específica <strong>de</strong>l estado<br />

biológico en estudio se pueda difuminar. En este trabajo, se trató <strong>de</strong> evitar dicho ruido<br />

mediante una cuidada selección <strong>de</strong> las muestras biológicas que se van a comparar, empezando<br />

por seleccionar primeramente sólo muestras proce<strong>de</strong>ntes <strong>de</strong> tejidos sanos. El set <strong>de</strong> datos<br />

utilizado contenía originalmente 353 microarrays mo<strong>de</strong>lo Affymetrix U133 Plus 2.0 (GEO ID<br />

GSE3526) (Roth et al., 2006) incluyendo 65 tejidos distintos, 20 <strong>de</strong> los cuales pertenecían a<br />

tejidos <strong>de</strong>l sistema nervioso central y 45 a otro tipo <strong>de</strong> tejidos. El propósito <strong>de</strong> los autores <strong>de</strong><br />

este trabajo era caracterizar el tejido nervioso obteniendo una firma molecular común. Sin<br />

embargo, para la construcción <strong>de</strong> una red <strong>de</strong> coexpresión <strong>de</strong> genes humanos, esta proporción<br />

<strong>de</strong> tejido nervioso podría introducir un sesgo importante hacia genes expresados y no<br />

expresados en este tipo <strong>de</strong> tejidos respecto al resto. Para evitar esto, se hizo una selección <strong>de</strong><br />

las muestras equilibrada, tratando <strong>de</strong> evitar los sesgos hacia un tipo tisular <strong>de</strong>terminado, lo<br />

que <strong>de</strong>rivó en un subconjunto <strong>de</strong> 32 tejidos (ver tabla 4.1). Por cada uno <strong>de</strong> esos 32 tejidos se<br />

seleccionaron 3 réplicas haciendo un total <strong>de</strong> 96 microarrays. La selección <strong>de</strong> estas muestras se<br />

hizo <strong>de</strong> tal manera que las réplicas biológicas se agrupasen correctamente en un test <strong>de</strong><br />

agrupación no supervisado. La figura 4.1 muestra un heatmap normalizado con RMA en don<strong>de</strong><br />

las muestras están agrupadas <strong>de</strong> 3 en 3, como correspon<strong>de</strong> a las réplicas biológicas. Esto<br />

asegura que el set <strong>de</strong> datos seleccionado es óptimo para la realización <strong>de</strong> un análisis <strong>de</strong><br />

coexpresión en el que se ha minimizado tanto el ruido biológico como el ruido técnico.<br />

Adipose tissue omental Heart ventricle Oral mucosa Stomach fundus<br />

Adrenal gland cortex Kidney cortex Ovary Stomach pyloric<br />

Bone marrow Kidney medulla Pituitary gland Testes<br />

Bronchus Liver Prostate gland Thyroid gland<br />

Cerebellum Lung Salivary gland Tongue<br />

Cerebral cortex Lymph no<strong>de</strong>s Saphenous vein Tonsil<br />

Esophagus Mammary gland Skeletal muscle Trachea<br />

Heart atrium Medulla Spleen Urethra<br />

Tabla 4.1. Relación <strong>de</strong> tejidos/órganos humanos utilizados en esta parte <strong>de</strong>l trabajo proce<strong>de</strong>ntes <strong>de</strong> (Roth et al.,<br />

2006). Para eliminar un posible sesgo respecto a tejidos y sistema nervioso –que es ampliamente estudiado en<br />

el trabajo <strong>de</strong> Roth et al.–, se seleccionó un subconjunto <strong>de</strong> 32 tejidos/órganos respecto al set completo original.<br />

85

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!