03.12.2012 Views

Anotación funcional - Bioinformatics and Genomics Department at ...

Anotación funcional - Bioinformatics and Genomics Department at ...

Anotación funcional - Bioinformatics and Genomics Department at ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Anotación</strong> Funcional de<br />

Secuencias en especies p no modelo<br />

Ana Conesa<br />

<strong>Bioinform<strong>at</strong>ics</strong> <strong>Department</strong><br />

Centro de Investigación Príncipe Felipe<br />

htt http://bioinfo.cipf.es/aconesa<br />

//bi i f i f /


Créditos<br />

Blast2GO Development:<br />

<strong>Bioinform<strong>at</strong>ics</strong> <strong>Department</strong><br />

Centro de Genómica<br />

CIPF, Valencia<br />

IVIA, Valencia<br />

Ana Conesa<br />

Javier Terol<br />

Stefan Goetz Manuel Talón<br />

Blast2GO special thanks to:<br />

ANNEX :Simen Myhre, Henrik Tveit (MTNU)<br />

GOSSIP: Nils Blüthgen (MicroDiscovery GmbH)<br />

ZVTM: Emmanuel Pietriga (INRIA)<br />

goslim goslim.tair.obo: tair obo: Suparna Mundodi (TAIR)<br />

Biomedical Inform<strong>at</strong>ics<br />

UPV, Valencia<br />

Juan Miguel Gómez<br />

Montserr<strong>at</strong> Robles<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


Contenido<br />

1. Conceptos p y<br />

necesidad de anotación<br />

2. <strong>Anotación</strong> <strong>funcional</strong> mediante B2G<br />

• Estr<strong>at</strong>egia<br />

• Aplicación informática<br />

33. Uso del B2G por la comunidad<br />

científica<br />

44. Ejercicio práctico<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


<strong>Anotación</strong> <strong>funcional</strong>, ¿por qué?<br />

Secuenciación a gran escala “for everybody”<br />

Proyectos de genoma proteoma<br />

Proyectos de ESTs<br />

A N O T A C I ON D E S E C U E N C I A S<br />

transcriptoma<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


Aclaraciones sobre “anotación”<br />

Función de proteína: se refiere<br />

al funcionamiento<br />

molecular de la proteina<br />

e.g. tyrosine kinase<br />

<strong>Anotación</strong> <strong>funcional</strong>: sentido<br />

más amplio amplio, caracterización<br />

biológica de la proteína<br />

e.g. g stress‐rel<strong>at</strong>ed protein p<br />

Sí<br />

¿Función localizable<br />

en la molécula?<br />

No<br />

necesariamente<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


<strong>Anotación</strong>: una posible ontología<br />

Referencia<br />

bibliográfica<br />

Interacción<br />

Expresión<br />

<strong>Anotación</strong><br />

Empírica Transferencia<br />

Ensayo<br />

bioquímico<br />

Análisis de<br />

de secuencia<br />

Comparación de<br />

estructura<br />

Homología de<br />

sequencia Identificación<br />

motivos<br />

Filogenia<br />

Identificación<br />

de pliegues<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


Sistemas terminológicos<br />

Motivos Funcionales<br />

Función Molecular<br />

Proceso Biológico<br />

Componente Celular<br />

Mapas Metabólicos<br />

KEGG ortólogos<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


<strong>Anotación</strong> automática: trampas y dificultades<br />

1. Fuentes de anotaciones erróneas (falta, sobra, incorrecto)<br />

‐> <strong>Anotación</strong> automática como “ “propuesta” ”<br />

2. Transferencia excesiva de funciones: transferencia de<br />

anotaciones en “cis” cis (proteínas “multi‐domain”) multi domain ) y “trans” trans<br />

(procesos biológicos)<br />

‐> Diferente impacto ORFs/Contigs, métodos homología/estructura<br />

3. ¿Genes G parálogos ál comparten t ffunción? ió ?<br />

‐> Contexto celular<br />

44. Especificidad y sensibilidad de métodos (top‐blast) (top blast) bajas<br />

‐> Los dos extremos de la balanza<br />

5. Umbral de alineamiento rel<strong>at</strong>ivo (BBDD, Secuencias,<br />

métodos) é d )<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


Servidores y Software<br />

PFP<br />

Protein Analyst y<br />

GOPEP<br />

ProKnow<br />

PFPS<br />

ProFunc<br />

ProtFun<br />

PropSearch<br />

RIO<br />

FIGENIX<br />

GGoBlet Bl t<br />

Gotcha<br />

OntoBlast<br />

Basado en Homología<br />

Usa técnicas de ML<br />

Alta recuperación<br />

Poca interacción<br />

No-intensivo<br />

AAnaliza li estructuras t t 3D Recupera Funciones<br />

Predicción desde estructura No-intensivo<br />

Predicción desde motivos<br />

Recupera Funciones<br />

No-intensivo<br />

Predicción desde filogenia Secuencias protéicas<br />

No-intensvo<br />

Basado en Homología<br />

Asigna GOs del BlastHit<br />

Recupera anotaciones<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


Nuestra propuesta<br />

�<strong>Anotación</strong> �<strong>Anotación</strong> de secuencias noveles<br />

� Herramienta de d<strong>at</strong>a mining en genómica <strong>funcional</strong><br />

�� Si Sistema IIntensivo i<br />

�Orientado a labor<strong>at</strong>orios biológicos: fácil, visual, intuitivo<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


Conceptos de anotación <strong>funcional</strong> en B2G<br />

� Blast<br />

o High‐throuput High throuput Blast<br />

o Tr<strong>at</strong>ar todos los hit vs. top‐blast<br />

o Usar BBDD gr<strong>and</strong>es (NR)<br />

�� Mapeo<br />

o Recuperar lo más posible<br />

o No importa la calidad<br />

� <strong>Anotación</strong><br />

o (Semi)automática (human supervised)<br />

o Combinación de conceptos p<br />

o Filtrado de d<strong>at</strong>os (ajustable, recall vs. precisión)<br />

� Visualización<br />

o Comprobar y validar anotación de manera rápida y sencilla<br />

� Análisis<br />

o Enriquecimiento, Charts, GO‐Slim, “Combined Graphs”<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


<strong>Anotación</strong> Funcional con Gene Ontology<br />

� La Gene Ontology (GO) es un<br />

vocabuario controlado para anotar<br />

<strong>funcional</strong>mente genes por su<br />

proceso biologico, funcion<br />

molecular y localización<br />

� El GO es un Direct Acyclic Graph<br />

� Genes están normalmente<br />

anotados td al l nivel i l más á específico ífi<br />

dentro del conocimiento actual.<br />

� La “true p<strong>at</strong>h p rule” asegura g que q<br />

para un gen todos los terminos<br />

desde su anotacion a la raiz son<br />

ciertos<br />

más general<br />

más á especifico<br />

ifi<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


<strong>Anotación</strong> en Blast2GO<br />

� Términos de Gene Ontology gy (GO). ( )<br />

� Enzimas (Kegg)<br />

� Motivos (InterPro)<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


Conceptos p de anotación <strong>funcional</strong> del B2G<br />

Similitud<br />

EEspecificidad ifi id d Precisión<br />

CCalidad lid d<br />

Selección<br />

Regla de anotación<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


Conceptos de anotación <strong>funcional</strong> del B2G<br />

término más bajo<br />

cumpliendo los requisitos<br />

requerimiento de similitud<br />

sim<br />

=<br />

∑ positives<br />

hsp<br />

∑ hsp<br />

calidad de la<br />

anotación t ió “source” “ ”<br />

EC weight<br />

IC 1<br />

TAS 1<br />

IDA 1<br />

IMP 0.9<br />

IGI 0.9<br />

IPI 0.9<br />

ISS 08 0.8<br />

IEP 0.8<br />

NAS 0.7<br />

IEA 0.7<br />

cóódigos<br />

de eevidenciaa<br />

posibilidad de abstracción<br />

Recall<br />

alignmentl ength engthhsp<br />

ND 05 0.5<br />

vs vs.<br />

NR 0.5<br />

RCA 0.5<br />

Precision<br />

lowest. node[(max. sim× ECw) + (# GO× GOw)] ≤threshold<br />

Regla de anotación<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


Evaluación<br />

� � … ¿Y Y eso funciona? f i ?<br />

� Método transparente (vs. un/supervised learning)<br />

�� PPrecisión i ió d de anotación t ió con parámetros á t por ddefecto f t alcanza l 6 65‐70%. %<br />

(que son valores típicos obtenidos por método automáticos de<br />

anotación)<br />

� … y Blast2GO ofrece una pl<strong>at</strong>aforma amigable, amplia y variada<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


Evaluación<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


Software Blast2GO<br />

� Pl<strong>at</strong>aforma universal para:<br />

1. <strong>Anotación</strong> basado en Gene Ontology<br />

2. Análisis estadístico<br />

3. Vi Visualización li ió (DAG) iinteractiva t ti y coloreada l d<br />

� Ideal para la investigación en especies no‐modelo<br />

�� AAplicación li ió ddesktop k iintuitiva i i e interactiva i i<br />

Secuencias<br />

blast análisis <strong>funcional</strong><br />

mapeo<br />

<strong>Anotación</strong><br />

GO GO,EC, EC<br />

…<br />

generación de grafos<br />

Visualización<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


Arquitectura<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


Arquitectura<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


Buscar de secuencias similares con BLAST<br />

Parámetros:<br />

•URL del Servidor<br />

• BBDD de secuencias<br />

•Blast‐Tipo<br />

(blastx, blastp,...)<br />

•Form<strong>at</strong>o de<br />

Resultados<br />

Mas parámetros:<br />

•E‐Value l Cutoff ff<br />

•Number of Hits<br />

• Mi Minimum i HSP<br />

length<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


Buscar secuencias similares con BLAST<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


Mapeo de términos GO con secuencias<br />

Fuentes del mapeo:<br />

� Gene Ontology BBDD: contiene mas de ~2<br />

milliones de “productos geneticos” anotado en GO, de<br />

Arabidopsis hasta Zebrafish.<br />

� NCBI Fl<strong>at</strong> Files: gene2accession (4 079 414 entries)<br />

gene_info (1 635 614 entries)<br />

� PIR ‐ Non‐Redundant Reference Protein D<strong>at</strong>abase:<br />

incluye PSD, UniProt, Swiss‐Prot, TrEMBL, RefSeq,<br />

GenPept y PDB<br />

Hit<br />

ACC/GI<br />

Mapping<br />

RResources<br />

EC<br />

GO-Terms GO Terms<br />

sim %<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


Mapeo detallado<br />

Blast2GO ast GO sigue sgue3 3 diferentes d e e tes caminos ca os durante du a te el e mapeo apeo para pa a obtener obte e<br />

la máxima información GO posible para los hits:<br />

1. BlastResult Accessions BlastResult.accs are used to retrieve GeneNames (Symbols) y making g<br />

use of two mapping ncbi.gene2accession.protein_accession<br />

files provided by NCBI (gene_info, gene2accession).<br />

Identified GeneNames are ncbi.gene_info.symbol(tax_id)<br />

searched in the species specific entries of the<br />

GeneProduct Table of the GO‐D<strong>at</strong>abase.<br />

go.gene_product.symbol(ncbi_taxa_id)<br />

2. BlastResult GI identifier are used to retrieve UniPort Ids making use of a<br />

BlastResult.gis<br />

mapping file from PIR (Non‐redundant REFerence protein d<strong>at</strong>abase)<br />

pir.nref.uniprot.id<br />

including PSD, UniProt, Swiss‐Prot, TrEMBL, RefSeq, GenPept <strong>and</strong> PDB.<br />

go.dbxref.xref_key<br />

g _ y<br />

Identified Uniprot Ids are searched in the DBXRef Table of the GO GO‐D<strong>at</strong>abase D<strong>at</strong>abase<br />

3. BlastResult Accessions are searched direcly in the DBXRef Table of the GO‐<br />

D<strong>at</strong>abase.<br />

D<strong>at</strong>abase. BlastResult BlastResult.accs accs<br />

go.dbxref.xref_key<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


Mapeo de términos GO con secuencias<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


<strong>Anotación</strong> GO<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


Gráficas Descriptivas <strong>Anotación</strong><br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


Modulación de la anotación<br />

Cambiar la anotación manualmente<br />

GO‐Term ACC<br />

EC‐Codes<br />

Seq. Description<br />

Extender con el “Second Layer”<br />

Myhre et al, <strong>Bioinform<strong>at</strong>ics</strong> 2006<br />

Resumir con el GOSlim”<br />

is involved in<br />

OBO GO‐Slim File<br />

MMolecular l l FFunction ti<br />

acts in<br />

Biological Process Cellular Component<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


<strong>Anotación</strong> de KEGG p<strong>at</strong>hways<br />

GO � Enzyme y Codes � KEGG maps p<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


<strong>Anotación</strong> de Motivos de InterPro<br />

Utilizar el servicio web del EBI para buscar en InterProScan y parsear resultados<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


Visualización (Una secuencia)<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


Visualización (Varias Secuencias)<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


Visualización (Varias Secuencias)<br />

Conceptos:<br />

� Herramienta para explorar y descubrir<br />

� Grafos interactivos y “zoomable”<br />

� Grafos coloreados “highlighting hot areas”<br />

Acumulación por nodo<br />

(Sequence Count)<br />

Información entrante<br />

(Node Score)<br />

∑<br />

d<br />

score = # seq× α<br />

1<br />

4<br />

3<br />

1 3<br />

1<br />

2.4<br />

3<br />

1 3<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante<br />

5<br />

2.5<br />

1<br />

1


Análisis estadístico (Fisher´s Exact Test)<br />

� El algoritmo comprueba para todos los<br />

términos GO si están enriquecidos en un<br />

grupo de prueba comparado con un grupo de<br />

referencia us<strong>and</strong>o “Fisher’s Exact Test” y<br />

“Multiple testing correction”<br />

� Todos los niveles del grafo GO están<br />

considerados y el algoritmo suma para cada<br />

nodo en el DAG cuantos genes en el “test set”<br />

y “ “reference f set” ” están á anotados d di directa o<br />

notación<br />

indirectamente con este término.<br />

An<br />

Servidor B2G<br />

Cliente<br />

Ref.:<br />

Blüthgen,N., Br<strong>and</strong>,K., Cajavec,B., Sw<strong>at</strong>,M., Herzel,H. <strong>and</strong> Beule,D., (2004) Biological Profiling of<br />

Gene Groups utilizing Gene Ontology –A St<strong>at</strong>istical Framework. arXiv:q‐bio.GN/0407034, 1, 1.<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante<br />

Visuualización


Análisis estadístico (Fisher´s Exact Test)<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


Estadísticas a partir de grafos<br />

•Sequence Distribution/GO<br />

as Bar‐Chart<br />

•Sequence Distribution/GO<br />

as Level‐Pie (level ( selection) )<br />

•Sequence Distribution/GO as Multilevel‐Pie (#score or #seq cutoff)<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


Blast2GO4Pipe<br />

Resultados Blast en<br />

form<strong>at</strong>o XML<br />

Pipe Versión:<br />

B2G sin interfaz f grafico f<br />

para Win/Linux/Mac<br />

Integración de la anotación automática de GOs<br />

dentro de un “Pipeline” u otro aplicación<br />

http://www.blast2go.de/b2gd<strong>at</strong>a/b2g4pipe.tar.gz<br />

configuración con un fichero<br />

de propiedades<br />

Anotaciones en un<br />

fichero .annot<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


Elementos adicionales<br />

•Blast Import(xml)/Export(html/txt/xml)<br />

p ( ) p ( )<br />

• Annot<strong>at</strong>ion import by ACC or Symbols<br />

•B2G Tutorial<br />

•Local Install<strong>at</strong>ion (B2G DB setup How‐To)<br />

•B2G B<strong>at</strong>ch‐Mode<br />

•<strong>Anotación</strong> de Enzimas KEGG<br />

• Ejecución de InterProScan<br />

….. y en un futuro cercano:<br />

•Blasten Grid publico<br />

• Blast2GO en la web (Babelomics)<br />

•Fisher contra genoma entero<br />

•B2G como parte de BioMoby Web Service<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


Uso mundial del Blast2GO<br />

Especies<br />

Citrus Citrus, nicotiana nicotiana, maize maize, soybean soybean, tom<strong>at</strong>o, tom<strong>at</strong>o grape… grape<br />

Streptococcus, Trichoderma, Schistosoma, Cyanobacteria…<br />

European Flounder,pig, flidder crab, r<strong>at</strong>, honneybee, human…<br />

Metagenome projects…<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


Estadísticas del Uso<br />

800<br />

700<br />

600<br />

500<br />

400<br />

300<br />

200<br />

100<br />

0<br />

Monthly Avg. Visits:<br />

Total different visitors (ip) since June 2005: 6028<br />

Jul. 2005<br />

Sep. 2005<br />

Nov. 2005<br />

Jan. 2006<br />

March 2006<br />

May 2006<br />

Jul 06<br />

Sep 06<br />

30<br />

25<br />

20<br />

15<br />

10<br />

5<br />

0<br />

Jul. 20055<br />

Daily Avg. Vis its:<br />

Sept. 2006 - 25 Visitors (avg) a day<br />

Sep. 20055<br />

Nov. 20055<br />

Jan. 20066<br />

March 20066<br />

May 20066<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante<br />

Jul 066<br />

Sep 066


Presesencia<br />

WWeb: b<br />

http://www.geneontology.org<br />

http://www.blast2go.de<br />

http://groups.google.com/group/Blast2GO<br />

Paper: p<br />

Ana Conesa, Stefan Götz, Juan Miguel García‐Gómez, Javier Terol, Manuel<br />

Talón <strong>and</strong> Montserr<strong>at</strong> Robles<br />

Blast2GO: A universal tool for annot<strong>at</strong>ion, visualiz<strong>at</strong>ion <strong>and</strong> analysis in<br />

functional genomics research.<br />

<strong>Bioinform<strong>at</strong>ics</strong> 2005 21: 3674‐3676<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


Ejemplos de usos en “papers” (I)<br />

Ref.:<br />

<strong>Anotación</strong> de ~16.000 Unigenes<br />

‐ Parámetros por defecto<br />

‐ Resultado general:<br />

‐1 a 4 anotaciones/Unigen<br />

‐Anotaciones en las 3 c<strong>at</strong>egorías g<br />

‐Fallos = sin homólogos<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


Ejemplos de uso en “papers” (II)<br />

Ref.:<br />

<strong>Anotación</strong> de ~21 ~21.000 000 “chip chip fe<strong>at</strong>ures fe<strong>at</strong>ures”<br />

‐ Uso como herramienta de anotación<br />

‐ Uso como “d<strong>at</strong>a d<strong>at</strong>a mining tool tool”<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


Ejemplos de uso en “papers” (III)<br />

Ref.:<br />

Generación de un chip de pl<strong>at</strong>ija<br />

‐ Estudio de cambios en<br />

transriptoma como marcador de<br />

contaminación.<br />

‐ B2G como herramienta de<br />

anotación y análisis <strong>funcional</strong><br />

‐ Identificación de c<strong>at</strong>egorías<br />

<strong>funcional</strong>es sobrerexpresentadas<br />

relacionadas con stress<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


Software Demo (I)<br />

Objetivo<br />

Conocer el Blast2GO como herramienta de anotación y análisis <strong>funcional</strong>.<br />

Recursos:<br />

Software via Java Web Start: http://www.blast2go.de/<br />

DD<strong>at</strong>os: t http://www.blast2go.de/b2gd<strong>at</strong>a/murcia.zip<br />

htt // bl t2 d /b2 d t / i i<br />

Desarrollo (I):<br />

• Durante este ejercicio se va a ver cómo asignar semi-automáticamente semi automáticamente funciones biológicas<br />

definido por la "Gene Ontology" a secuencias de ADN no conocidas en base a búsquedas<br />

BLAST.<br />

• Desde la página web del B2G se puede ejecutar la aplicación vía Java Web Start. Se abre el<br />

fichero (10Seqs (10Seqs.fasta) fasta) adjunto con la aplicación B2G B2G.<br />

• Blast: Búsquedas de similitudes con el NCBI Qblast (parámetros estándar) y se generan las<br />

estadísticas correspondientes con el menú “St<strong>at</strong>istics“. Revisa los resultados Blast de algunas<br />

secuencias "blasteadas“ us<strong>and</strong>o el botón derecho sobre la secuencia correspondiente en la<br />

ttabla bl dde secuencias. i GGuardar d y visualizar i li el l fi fichero h .xml l<br />

• Mapping: Menu -> Mapping -> Start Mapping -<br />

correspondientes con el menú “St<strong>at</strong>istics".<br />

y se generan las estadísticas<br />

• Anot<strong>at</strong>ion: Menu -> Annot<strong>at</strong>ion -> Start Annot<strong>at</strong>ion - y se generan g las estadísticas<br />

correspondientes con el menú “St<strong>at</strong>istics".<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


Software Demo (II)<br />

Desarrollo (II):<br />

• Ampliar las anotaciones us<strong>and</strong>o la herramienta “Annex” Annex en el menú “Annot<strong>at</strong>ion” Annot<strong>at</strong>ion y observa los<br />

resultados en “Applic<strong>at</strong>ion Messages”.<br />

• Complementar/cambiar la anotación de la secuencia no.3 manualmente us<strong>and</strong>o enlaces al<br />

NCBI y Amigo, "The Gene Ontology Web Browser" (www.geneontology.org)<br />

• PPara conseguir i eso se abre b el l menú ú ddel l contexto t t dde esa secuencia i (b (botón tó dderecho) h ) y se abre b<br />

los resultados blast, las descripciones GO y el grafo de la anotación de las 3 c<strong>at</strong>egorías de<br />

esta secuencia.<br />

• Busca en el Amigo los términos biológicos más frecuentes del resultado blast (ubiquitin) y<br />

compara los resultados con las anotaciones hechas por el B2G. Con el menú ítem: "Change<br />

annot<strong>at</strong>ion <strong>and</strong> description" añade esa nueva anotación encontrado en el Amigo (protein<br />

ubiquitin<strong>at</strong>ion).<br />

• Vuelve a generar g el ggrafo de esa anotación ppara<br />

ver el cambio.<br />

• Visualización: Visualizar la anotación de esta secuencia y generar un "Combined Graph" del<br />

conjunto de secuencias/anotaciones del grafo "molecular function". Repetir cambi<strong>and</strong>o Node<br />

Score Filter a 1.<br />

• Fisher Fisher. Hacer un análisis de enriquecimiento y visualizar d<strong>at</strong>os d<strong>at</strong>os. Utilizar ficheros<br />

reference.annot y test.txt.<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante


Para terminar<br />

� … os invitamos a probarlo en www.blast2go.de<br />

�� Y nos alegramos siempre de recibir “feedback” feedback<br />

� ¿Más preguntas?<br />

Curso Bioinformática, 19 Diciembre 2007, Universida de Alicante

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!