Alberto Risueño Pérez - Gredos - Universidad de Salamanca
Alberto Risueño Pérez - Gredos - Universidad de Salamanca
Alberto Risueño Pérez - Gredos - Universidad de Salamanca
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Tesis Doctoral<br />
estrategia bioinformática para i<strong>de</strong>ntificar HKG utilizando como fuente <strong>de</strong> datos la información<br />
presente en GenBank (http://www.ncbi.nlm.nih.gov/genbank/) (Benson et al., 2010). Se<br />
utilizaron las librerías <strong>de</strong> secuencias expresadas (ESTs, versión <strong>de</strong> 2010) que fueron<br />
almacenadas en una base <strong>de</strong> datos junto con la información individual <strong>de</strong> cada secuencia,<br />
asociándole a<strong>de</strong>más el i<strong>de</strong>ntificador <strong>de</strong>l gen y el tejido en don<strong>de</strong> se encontró. Esto <strong>de</strong>volvió un<br />
total <strong>de</strong> 604546 ESTs asociados a 18832 genes, ubicados en 34 tejidos distintos. Debido a que<br />
algunos tejidos tenían asociados un número muy bajo <strong>de</strong> ESTs (p. ej. nodo linfático 2, bronquio<br />
6, timo 7, etc), fue necesaria la aplicación <strong>de</strong> un filtro <strong>de</strong> tejidos que se realizó eliminando<br />
aquellos con un número arbitrario elegido <strong>de</strong> ESTs inferior a 1000, lo que resultó en la<br />
eliminación <strong>de</strong> 8 tejidos escasamente representados. Posteriormente se seleccionaron<br />
aquellos genes con ESTs presentes en al menos 18 tejidos distintos (≈70%) <strong>de</strong>volviendo un<br />
total <strong>de</strong> 480 genes. Para completar esta información en términos <strong>de</strong> cobertura y fiabilidad, se<br />
recogieron también 3 listados <strong>de</strong> HKG previamente realizados por otros autores:<br />
88<br />
1. HKG humanos con expresión altamente correlacionada en perfiles obtenidos a partir<br />
<strong>de</strong> expresión en múltiples tejidos humanos diferentes, obtenidos por nuestro grupo <strong>de</strong><br />
investigación utilizando <strong>de</strong> datos <strong>de</strong> microarrays (Prieto et al., 2008).<br />
2. HKG humanos <strong>de</strong>scritos por Hsiao et al. (Hsiao et al., 2001).<br />
3. HKG humanos <strong>de</strong>scritos por Eisenberg y Levanon (Eisenberg and Levanon, 2003).<br />
Esta aproximación múltiple aporta un alto nivel <strong>de</strong> fiabilidad en la obtención <strong>de</strong> un grupo <strong>de</strong><br />
genes humanos consi<strong>de</strong>rados HKG, pudiendo seleccionar aquellos que se encuentran en 2, 3 o<br />
4 <strong>de</strong> los conjuntos <strong>de</strong> datos citados. Esto aumenta significativamente el nivel <strong>de</strong> confianza. El<br />
número <strong>de</strong> HKG <strong>de</strong>tectado por los 4 métodos es tan solo <strong>de</strong> 36 genes; sin embargo en este<br />
grupo están presentes ACTB, ALDOA y GAPDH, que son tres <strong>de</strong> los genes más conocidos y<br />
utilizados como controles en distintas pruebas <strong>de</strong> validación experimental <strong>de</strong> expresión como<br />
la RT-‐PCR (ver tabla 4.2). El número <strong>de</strong> HKG <strong>de</strong>tectados por al menos 3 métodos es <strong>de</strong> 157, lo<br />
cual supone un buen balance entre fiabilidad y cobertura. El número <strong>de</strong> genes <strong>de</strong>tectados por<br />
al menos 2 y 1 métodos es <strong>de</strong> 442 y 1235 genes respectivamente.<br />
ID Ensembl Nombre Descripción<br />
ENSG00000075624 ACTB actin, beta<br />
ENSG00000149925 ALDOA aldolase A, fructose-‐bisphosphate<br />
ENSG00000182718 ANXA2 annexin A2 pseudogene 1<br />
ENSG00000134287 ARF3 ADP-‐ribosylation factor 3<br />
ENSG00000166710 B2M beta-‐2-‐microglobulin<br />
ENSG00000198563 BAT1 small nucleolar RNA, C/D box 84<br />
ENSG00000127022 CANX calnexin<br />
ENSG00000156508 EEF1A1 eukaryotic translation elongation factor 1 alpha-‐like 7<br />
ENSG00000175390 EIF3F eukaryotic translation initiation factor 3, subunit F<br />
ENSG00000110321 EIF4G2 eukaryotic translation initiation factor 4 gamma, 2<br />
ENSG00000111640 GAPDH glyceral<strong>de</strong>hy<strong>de</strong>-‐3-‐phosphate <strong>de</strong>hydrogenase<br />
ENSG00000189403 HMGB1 high-‐mobility group box 1<br />
ENSG00000165119 HNRNPK microRNA 7-‐1<br />
ENSG00000185896 LAMP1 lysosomal-‐associated membrane protein 1<br />
ENSG00000147140 NONO non-‐POU domain containing, octamer-‐binding<br />
ENSG00000070756 PABPC1 poly(A) binding protein, cytoplasmic 1<br />
ENSG00000102144 PGK1 phosphoglycerate kinase 1<br />
ENSG00000159377 PSMB4 proteasome (prosome, macropain) subunit, beta type, 4<br />
ENSG00000187514 PTMA prothymosin, alpha<br />
ENSG00000067560 RHOA ras homolog gene family, member A<br />
ENSG00000198755 RPL10A ribosomal protein L10a