28.12.2012 Aufrufe

MDCK-MRP2 - Dkfz

MDCK-MRP2 - Dkfz

MDCK-MRP2 - Dkfz

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Forschungsschwerpunkt B<br />

Funktionelle und Strukturelle Genomforschung<br />

Redox-vermittelte funktionelle und strukturelle<br />

Änderungen in der Insulinrezeptorkinase<br />

A. Hotz-Wagenblatt<br />

Signalgebung durch Insulin erfordert eine Autophosphorylierung<br />

der Insulinrezeptorkinase (IRK) bei drei Tyr Rückständen,<br />

aber die ATP Bindungsseite wird blockiert gemäß<br />

der berichteten Kristallstruktur 1irk der nativen nicht-phosphorylierten<br />

IRK Domäne. 3D Modelle der IRK-0P Struktur,<br />

die man durch Energieminimierung nach Entfernung der<br />

zwei Ethyl-Quecksilbergruppen bei zwei Cys Rückständen<br />

erhält, unterscheiden sich in wichtigen Details von der ursprünglichen<br />

Kristallstruktur. Die Phosphorylierung der drei<br />

Tyr Rückstände wird bei diesem Szenario durch drei verschiedene<br />

katalytische Aminosäuren (2 Asp, 1 Glu) vermittelt<br />

und involviert keine Bindung von ATP an die ATP<br />

Bindungsseite der IRK-3P Struktur [27].<br />

Bioinformatik-Infrastruktur<br />

P. Ernst, M. Falkenhahn, K.-H. Glatting,<br />

A. Hotz-Wagenblatt, B. Pardon, S. Suhai<br />

In Zusammenarbeit mit der Abteilung Zentrale Datenverarbeitung<br />

(ZDV) haben wir eine umfassende und effiziente<br />

Bioinformatik-Infrastruktur am DKFZ aufgebaut. Neben<br />

unseren eigenen Entwicklungen bieten wir mehr als 250<br />

Softwareanwendungen und mehr als 200 regelmäßig aktualisierte<br />

Datenbanken an. Die Anwendungspakete beinhalten:<br />

HUSAR/GCG, SRS, den Bioccelerator, EMBOSS und<br />

STADEN. Beispiele für die angebotenen Datenbanken sind<br />

die vollständigen EMBL und GENBANK Nukleotiddatenbanken<br />

(täglich aktualisiert), die Proteinsequenzdatenbanken<br />

SwissProt und PIR (wöchentlich aktualisiert) oder<br />

die vollständigen Genome von Organismen wie Mensch,<br />

Maus oder Hefe (regelmäßig aktualisiert). Ferner bieten<br />

wir Benutzerunterstützung (E-mail und Telefonhotline), Kurse<br />

und Workshops an. Es werden zwei Arten von Tutorkursen<br />

angeboten: Einführungskurse über die verfügbaren<br />

Bioinformatikresourcen (monatlich) und Fortgeschrittenenworkshops<br />

über ausgewählte Themen (alle drei Monate).<br />

Unsere Gruppe hat durch die Betreuung des Deutschen<br />

EMBnet Knotens seit 1986 relevantes Know-how im Bereich<br />

der Datenanalyse erworben. Das EMBnet (http://<br />

www.embnet.org/) besteht aus 26 anerkannten Bioinformatikzentren<br />

(Knoten) und bietet der europäischen<br />

Molekularbiologiegemeinde einen Bioinformatik-Service an.<br />

An einem ähnlichen Projekt beteiligen wir uns im Rahmen<br />

des Helmholtz Netzwerks für Bioinformatik (http://<br />

www.hnbioinfo.de), wobei elf deutsche Bioinformatik-<br />

Forschungsgruppen einen bequemen Zugang zu zahlreichen<br />

Bioinformatikresourcen durch ein einziges Webportal<br />

zur Verfügung stellen. Ferner sind wir beteiligt an Datenanalyse<br />

innerhalb des DHGP (Deutsches Humangenomprojekt)<br />

und des NGFN (Nationales Genomforschungsnetzwerk),<br />

z.B. mit den Gruppen von A. Poustka, S.<br />

Wiemann (DKFZ; cDNA2Genome), E. Schmidt,<br />

T. Hankeln (GENENTERPRISE Mainz, ESTAnnotator).<br />

Abteilung B020<br />

Molekulare Biophysik<br />

Entwicklung von web-basierten Oberflächen für<br />

genomisches Computing<br />

P. Ernst, K.-H. Glatting, A. Hotz-Wagenblatt, S. Suhai,<br />

C. del Val<br />

Zusammen mit dem European Bioinformatics Institute (EBI)<br />

haben wir eine benutzerfreundliche WWW Oberfläche<br />

(W2H) (http://genome.dkfz-heidelberg.de/) entwickelt,<br />

die ständig erweitert wird. Das W3H Taskframework ermöglicht<br />

die Ausführung von Compoundjobs unter Verwendung<br />

der Beschreibung von Work- und Dataflows in einer<br />

heterogenen Bioinformatikumgebung mit Hilfe von Metadaten-Informationen.<br />

Den Wissenschaftlern stehen zur Zeit<br />

acht Tasks zur Verfügung; die meisten von ihnen werden<br />

im Kontext von Sequenzannotationen (siehe unten) benutzt,<br />

aber es gibt auch Tasks für phylogenetische Analyse<br />

[28] oder für die Unterstützung im Primerdesignprozess<br />

(PrimerSweep).<br />

Entwicklung von Hochdurchsatz-<br />

Genomannotationswerkzeugen<br />

K.-H. Glatting, A. Hotz-Wagenblatt, S. Suhai, C. del Val<br />

Innerhalb des Taskrahmens in HUSAR wurden zahlreiche<br />

Annotationswerkzeuge entwickelt und implementiert, um<br />

die Hochdurchsatz-Genomannotation zu verbessern [29].<br />

In Zusammenarbeit mit Arbeitsgruppen im NGFN/ DHGP<br />

haben wir eine Task für cDNA Mapping und die Charakterisierung<br />

von cDNAs in voller Länge entworfen (cDNA2Genome),<br />

eine weitere für die halb-automatische Analyse von<br />

EST Sequenzen [30], die die Suche nach funktionellen<br />

Annotationen von neuen Transkriptsequenzen unterstützt<br />

(ESTAnnotator), und eine für die Klassifizierung von Proteinsequenzen<br />

und Funktionsinferenz, wobei verschiedene<br />

Klassifizierungs- und Suchmethoden sowohl der gewöhnlich<br />

verwendeten Proteinfamilien-Datenbanken als auch von<br />

Interpro und Gene Ontology (DomainSweep) kombiniert<br />

werden.<br />

Funktionelle Annotation mit Hilfe von Gene<br />

Ontology<br />

K.-H. Glatting, A. Hotz-Wagenblatt, S. Suhai, C. del Val<br />

In Zusammenarbeit mit der Arbeitsgruppe von Dr. Roland<br />

Eils am DKFZ entwickeln wir einen Lernalgorithmus für die<br />

automatische Annotation von Genfunktion mit Hilfe der<br />

Gene Ontology(GO) Datenbank (http://www.<br />

godatabase.org/dev/database/). Mit diesem Ansatz werden<br />

viele der gewöhnlichen Probleme bei der automatischen<br />

Annotation überwunden, wie z.B. unvollständige<br />

oder inkonsistente Annotation oder das Fehlen einer formalisierten<br />

Annotationssprache. Die Hauptstrategie dieses<br />

Ansatzes besteht im Gebrauch von GO-kartierten Datenbanken,<br />

einschließlich Modellorganismus und Domaindatenbanken,<br />

die verläßliche und qualitativ hochwertige<br />

Informationen in strukturierten GO Begriffen enthalten.<br />

Sequenzähnlichkeit, Häufigkeit und unterstützende Informationen<br />

werden aus Datenbanksuchen ausgewählt, um<br />

Punktzahlen für jede funktionelle Kategorie zu vergeben.<br />

Verschiedene Funktionswerte werden durch ein mathematisches<br />

Modell kombiniert und ihre Anwendung zeigte<br />

eine verbesserte Qualität von Annotationen in einem<br />

Trainingsset mit Sequenzen von Hefe, Maus, Drosophila,<br />

C.elegans und Arabidopsis.<br />

DKFZ 2004: Wissenschaftlicher Ergebnisbericht 2002 - 2003<br />

109

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!