08.08.2013 Views

Alberto Risueño Pérez - Gredos - Universidad de Salamanca

Alberto Risueño Pérez - Gredos - Universidad de Salamanca

Alberto Risueño Pérez - Gredos - Universidad de Salamanca

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Tesis Doctoral<br />

inclusión entre 0 y 1 calculado mediante una aproximación bayesiana. La diferencia entre los<br />

valores <strong>de</strong> inclusión entre los dos tejidos es lo que da el nivel <strong>de</strong> confianza (score) <strong>de</strong> estar<br />

realmente ante un evento <strong>de</strong> splicing alternativo. Finalmente para nuestro estudio en esta<br />

Tesis Doctoral será consi<strong>de</strong>rado únicamente el conjunto <strong>de</strong> tejidos comunes a los dos sets <strong>de</strong><br />

datos citados: el set <strong>de</strong> microarrays <strong>de</strong> Affymetrix y el trabajo <strong>de</strong> Wang et al. (ver tabla 3.1).<br />

El conjunto <strong>de</strong> tejidos comunes a ambos grupos correspon<strong>de</strong> con 6 tejidos distintos: mama,<br />

cerebelo, corazón, hígado, músculo y testículo. La combinación <strong>de</strong> estos 6 tejidos cuando se<br />

comparan <strong>de</strong> 2 en 2 proporciona un total <strong>de</strong> 15 pares distintos. El número total <strong>de</strong> pares (gen ::<br />

combinación <strong>de</strong> tejidos) suma 282, mientras que el número <strong>de</strong> genes distintos es <strong>de</strong> 270. El<br />

número <strong>de</strong> genes validados por cada par se <strong>de</strong>scribe en la tabla 3.2.<br />

breast cerebellum heart liver muscle testes<br />

breast – 75 11 5 8 16<br />

cerebellum – 22 12 38 52<br />

heart – 2 13 7<br />

liver – 2 5<br />

muscle – 14<br />

testes –<br />

Tabla 3.2. Número <strong>de</strong> genes validados por Wang et al. (Wang et al., 2008) en cada una <strong>de</strong> las combinaciones <strong>de</strong><br />

tejido. La suma total <strong>de</strong> genes es <strong>de</strong> 282 y el número <strong>de</strong> genes distintos es 270.<br />

3.2.2 Descripción <strong>de</strong> algoritmos y métodos para análisis <strong>de</strong> splicing<br />

previamente publicados<br />

La estrategia común a todos los algoritmos <strong>de</strong> <strong>de</strong>tección <strong>de</strong> splicing alternativo previamente<br />

publicados es la <strong>de</strong> comparar la expresión global <strong>de</strong>l gen contra la expresión individual <strong>de</strong> cada<br />

uno <strong>de</strong> los exones. La hipótesis fundamental es que, en ausencia <strong>de</strong> splicing alternativo, un<br />

cambio <strong>de</strong> expresión <strong>de</strong>l gen <strong>de</strong>be suponer un cambio <strong>de</strong> cada uno <strong>de</strong> sus exones en la misma<br />

proporción y sentido. En este punto, los genes que se <strong>de</strong>svían <strong>de</strong> esa norma se interpretan<br />

como splicing. El reto <strong>de</strong> los diferentes algoritmos es calcular con precisión la expresión <strong>de</strong><br />

cada una <strong>de</strong> las partes (gen y exones) y medir sus variaciones asignado un valor <strong>de</strong><br />

probabilidad.<br />

Los primeros métodos fueron propuestos por parte <strong>de</strong> la propia compañía que comercializa los<br />

chips. En un artículo llamado "Alternative Transcript Analysis Methods for Exon Arrays" <strong>de</strong> la<br />

documentación técnica publicada por Affymetrix (Affymetrix, 2005a), se <strong>de</strong>scriben 5 métodos<br />

entre los que figura el popular y sencillo Splicing In<strong>de</strong>x. Una vez estos arrays entraron en el<br />

mercado y empezaron a usarse, distintos grupos <strong>de</strong> investigación <strong>de</strong>sarrollaron sus<br />

propuestas. A continuación se revisan brevemente las más relevantes:<br />

62<br />

• Splicing In<strong>de</strong>x (Affymetrix, 2005a): Es el método más simple. En un primer paso<br />

propone normalizar la expresión <strong>de</strong>l exón dividiendo su señal por la expresión <strong>de</strong>l gen.<br />

En un segundo paso se realiza la media <strong>de</strong> la expresión normalizada por cada grupo <strong>de</strong><br />

estudio (p. ej. tejido sano y tumor) calculando su relación o ratio.<br />

• PAC (Affymetrix, 2005a): Se <strong>de</strong>riva <strong>de</strong> Splicing In<strong>de</strong>x y asume que en ausencia <strong>de</strong>

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!