MDCK-MRP2 - Dkfz
MDCK-MRP2 - Dkfz
MDCK-MRP2 - Dkfz
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Forschungsschwerpunkt B<br />
Funktionelle und Strukturelle Genomforschung<br />
Redox-vermittelte funktionelle und strukturelle<br />
Änderungen in der Insulinrezeptorkinase<br />
A. Hotz-Wagenblatt<br />
Signalgebung durch Insulin erfordert eine Autophosphorylierung<br />
der Insulinrezeptorkinase (IRK) bei drei Tyr Rückständen,<br />
aber die ATP Bindungsseite wird blockiert gemäß<br />
der berichteten Kristallstruktur 1irk der nativen nicht-phosphorylierten<br />
IRK Domäne. 3D Modelle der IRK-0P Struktur,<br />
die man durch Energieminimierung nach Entfernung der<br />
zwei Ethyl-Quecksilbergruppen bei zwei Cys Rückständen<br />
erhält, unterscheiden sich in wichtigen Details von der ursprünglichen<br />
Kristallstruktur. Die Phosphorylierung der drei<br />
Tyr Rückstände wird bei diesem Szenario durch drei verschiedene<br />
katalytische Aminosäuren (2 Asp, 1 Glu) vermittelt<br />
und involviert keine Bindung von ATP an die ATP<br />
Bindungsseite der IRK-3P Struktur [27].<br />
Bioinformatik-Infrastruktur<br />
P. Ernst, M. Falkenhahn, K.-H. Glatting,<br />
A. Hotz-Wagenblatt, B. Pardon, S. Suhai<br />
In Zusammenarbeit mit der Abteilung Zentrale Datenverarbeitung<br />
(ZDV) haben wir eine umfassende und effiziente<br />
Bioinformatik-Infrastruktur am DKFZ aufgebaut. Neben<br />
unseren eigenen Entwicklungen bieten wir mehr als 250<br />
Softwareanwendungen und mehr als 200 regelmäßig aktualisierte<br />
Datenbanken an. Die Anwendungspakete beinhalten:<br />
HUSAR/GCG, SRS, den Bioccelerator, EMBOSS und<br />
STADEN. Beispiele für die angebotenen Datenbanken sind<br />
die vollständigen EMBL und GENBANK Nukleotiddatenbanken<br />
(täglich aktualisiert), die Proteinsequenzdatenbanken<br />
SwissProt und PIR (wöchentlich aktualisiert) oder<br />
die vollständigen Genome von Organismen wie Mensch,<br />
Maus oder Hefe (regelmäßig aktualisiert). Ferner bieten<br />
wir Benutzerunterstützung (E-mail und Telefonhotline), Kurse<br />
und Workshops an. Es werden zwei Arten von Tutorkursen<br />
angeboten: Einführungskurse über die verfügbaren<br />
Bioinformatikresourcen (monatlich) und Fortgeschrittenenworkshops<br />
über ausgewählte Themen (alle drei Monate).<br />
Unsere Gruppe hat durch die Betreuung des Deutschen<br />
EMBnet Knotens seit 1986 relevantes Know-how im Bereich<br />
der Datenanalyse erworben. Das EMBnet (http://<br />
www.embnet.org/) besteht aus 26 anerkannten Bioinformatikzentren<br />
(Knoten) und bietet der europäischen<br />
Molekularbiologiegemeinde einen Bioinformatik-Service an.<br />
An einem ähnlichen Projekt beteiligen wir uns im Rahmen<br />
des Helmholtz Netzwerks für Bioinformatik (http://<br />
www.hnbioinfo.de), wobei elf deutsche Bioinformatik-<br />
Forschungsgruppen einen bequemen Zugang zu zahlreichen<br />
Bioinformatikresourcen durch ein einziges Webportal<br />
zur Verfügung stellen. Ferner sind wir beteiligt an Datenanalyse<br />
innerhalb des DHGP (Deutsches Humangenomprojekt)<br />
und des NGFN (Nationales Genomforschungsnetzwerk),<br />
z.B. mit den Gruppen von A. Poustka, S.<br />
Wiemann (DKFZ; cDNA2Genome), E. Schmidt,<br />
T. Hankeln (GENENTERPRISE Mainz, ESTAnnotator).<br />
Abteilung B020<br />
Molekulare Biophysik<br />
Entwicklung von web-basierten Oberflächen für<br />
genomisches Computing<br />
P. Ernst, K.-H. Glatting, A. Hotz-Wagenblatt, S. Suhai,<br />
C. del Val<br />
Zusammen mit dem European Bioinformatics Institute (EBI)<br />
haben wir eine benutzerfreundliche WWW Oberfläche<br />
(W2H) (http://genome.dkfz-heidelberg.de/) entwickelt,<br />
die ständig erweitert wird. Das W3H Taskframework ermöglicht<br />
die Ausführung von Compoundjobs unter Verwendung<br />
der Beschreibung von Work- und Dataflows in einer<br />
heterogenen Bioinformatikumgebung mit Hilfe von Metadaten-Informationen.<br />
Den Wissenschaftlern stehen zur Zeit<br />
acht Tasks zur Verfügung; die meisten von ihnen werden<br />
im Kontext von Sequenzannotationen (siehe unten) benutzt,<br />
aber es gibt auch Tasks für phylogenetische Analyse<br />
[28] oder für die Unterstützung im Primerdesignprozess<br />
(PrimerSweep).<br />
Entwicklung von Hochdurchsatz-<br />
Genomannotationswerkzeugen<br />
K.-H. Glatting, A. Hotz-Wagenblatt, S. Suhai, C. del Val<br />
Innerhalb des Taskrahmens in HUSAR wurden zahlreiche<br />
Annotationswerkzeuge entwickelt und implementiert, um<br />
die Hochdurchsatz-Genomannotation zu verbessern [29].<br />
In Zusammenarbeit mit Arbeitsgruppen im NGFN/ DHGP<br />
haben wir eine Task für cDNA Mapping und die Charakterisierung<br />
von cDNAs in voller Länge entworfen (cDNA2Genome),<br />
eine weitere für die halb-automatische Analyse von<br />
EST Sequenzen [30], die die Suche nach funktionellen<br />
Annotationen von neuen Transkriptsequenzen unterstützt<br />
(ESTAnnotator), und eine für die Klassifizierung von Proteinsequenzen<br />
und Funktionsinferenz, wobei verschiedene<br />
Klassifizierungs- und Suchmethoden sowohl der gewöhnlich<br />
verwendeten Proteinfamilien-Datenbanken als auch von<br />
Interpro und Gene Ontology (DomainSweep) kombiniert<br />
werden.<br />
Funktionelle Annotation mit Hilfe von Gene<br />
Ontology<br />
K.-H. Glatting, A. Hotz-Wagenblatt, S. Suhai, C. del Val<br />
In Zusammenarbeit mit der Arbeitsgruppe von Dr. Roland<br />
Eils am DKFZ entwickeln wir einen Lernalgorithmus für die<br />
automatische Annotation von Genfunktion mit Hilfe der<br />
Gene Ontology(GO) Datenbank (http://www.<br />
godatabase.org/dev/database/). Mit diesem Ansatz werden<br />
viele der gewöhnlichen Probleme bei der automatischen<br />
Annotation überwunden, wie z.B. unvollständige<br />
oder inkonsistente Annotation oder das Fehlen einer formalisierten<br />
Annotationssprache. Die Hauptstrategie dieses<br />
Ansatzes besteht im Gebrauch von GO-kartierten Datenbanken,<br />
einschließlich Modellorganismus und Domaindatenbanken,<br />
die verläßliche und qualitativ hochwertige<br />
Informationen in strukturierten GO Begriffen enthalten.<br />
Sequenzähnlichkeit, Häufigkeit und unterstützende Informationen<br />
werden aus Datenbanksuchen ausgewählt, um<br />
Punktzahlen für jede funktionelle Kategorie zu vergeben.<br />
Verschiedene Funktionswerte werden durch ein mathematisches<br />
Modell kombiniert und ihre Anwendung zeigte<br />
eine verbesserte Qualität von Annotationen in einem<br />
Trainingsset mit Sequenzen von Hefe, Maus, Drosophila,<br />
C.elegans und Arabidopsis.<br />
DKFZ 2004: Wissenschaftlicher Ergebnisbericht 2002 - 2003<br />
109