Abschlussbericht - Abteilung Mykologie - Universität Bayreuth

Empfehlungen

Info

GBIF-D IT-Fachgruppe <strong>Abschlussbericht</strong> Januar 2008 Konzept zum Middleware-Framework innerhalb der Diversity Workbench und Einführung in XQuery, XPath und XPointer Clemens Oertel Häufige Mehrfach-DNA-Sequenzierungen und fehlende Werkzeuge zur Speicherung der Ergebnisse von Sequenzanalysen motivierten die Erstellung einer eigenen Datenbank-Anwendung für molekularbiologische Daten ähnlich GenBank, jedoch mit diversen Erweiterungen. Hiervon unabhängig bestand Bedarf an einem System zur Veröffentlichung von Bildern und Zusatzinformationen im Internet (Handzeichnungen und TEM-Aufnahmen) sowie an einem zentralen Literaturverzeichnis. Das Ziel war somit ein Datenbanksystem zur Speicherung und Verknüpfung unterschiedlicher biologischer Daten. Operationen auf den gespeicherten Daten sollten der Erweiterbarkeit halber modular zu implementieren sein. Die Dateneingabe sollte per Browser geschehen, die -ausgabe sollte in verschiedenen Formaten (XML, PDF, GenBank, ...) möglich sein. Darüber hinaus sollte die Möglichkeit zur Einbindung bestehender legacy-Systeme bestehen. Im folgenden Entwicklungsprozess entstanden verschiedene Versionen einer entsprechenden Software: Einer in PHP und MySQL entwickelter Anwendung folgte eine C++-basierte Umsetzung, die weiterhin existierenden Schwächen führten schließlich zu einer in Eiffel implementierten Version mit PostgreSQL als Datenbanksystem. Die bis heute in Verwendung und Entwicklung befindliche Version basiert auf der üblichen modularisierten Trennung von Eingabe-, Ausgabe- und dazwischen befindlicher Verarbeitungsschicht. Die flexible Gestaltung der Dateneinbindung erlaubt Zugriffe auf in unterschiedlichsten Formaten vorliegenden Daten sowie auf externe Datenbanken, für die auch ein Caching-Mechanismus vorgesehen ist. Des Weiteren weist das System eine umfangreiche Nutzerverwaltung und Authorisierungsmechanismen auf. Der Workflow innerhalb des Systems für einzelne Anfragen kann flexibel festgelegt werden; es werden hooks bereitgestellt, an die verschiedenen Bearbeitungsschritte angehängt werden können. Die verwendeten Datenstrukturen entstammen dem Diversity Workbench-Projekt. Dessen Datentyp- Beschreibungen im XML Schema Format werden direkt zur Generierung der verwendeten Klassen eingesetzt. Darüber hinausgehende Datenstrukturen können durch eine Meta-Beschreibung zur Laufzeit dem System hinzugefügt werden (dies ist allerdings mit nicht unerheblichen Performance-Einbußen verbunden). Die Kommunikation zu anderen Modulen der Diversity Workbench findet über SOAP statt. Aktuell findet eine Vereinheitlichung aller internen Pfadangaben auf XPath statt. Des Weiteren wird kontinuierlich an der Programmierung weiterer Daten-Input Module sowie einer weiteren Dynamisierung der Workflow-Festlegung gearbeitet. Ein langfristiges Ziel ist der Ausbau zu einem Middleware-System, so dass eine komponentenweise Nutzung einzelner Funktionen möglich wird. 36
GBIF-D IT-Fachgruppe <strong>Abschlussbericht</strong> Januar 2008 Ergebnisse Es sollen konkrete Datenflussszenarien entstehen, in Form eines Flussdiagramms mit erklärendem Text, die als Dokumentation für Projektskizzen für Anträge an das BMBF verwendet werden können. Hier sollten vor allem andere Datentypen als Sammlungsdaten und Taxonomie im Vordergrund stehen. Für die Entwicklung der use cases kann das von Donald Hobern (GBIF international) entworfene use case- template verwendet werden (http://www.gbif.org/Stories/STORY1040140792): Use Case: Actors Description Flow of Events Pre-conditions Basic Flow Post-conditions Alternative Flows Further Details Non-functional Requirements Issues 37
Seite 1 und 2: Abschlussbericht der IT-Fachgruppe
Seite 3 und 4: Kontakt Dr. Alexandra Kehl Universi
Seite 5 und 6: GBIF-D IT-Fachgruppe Abschlussberic
Seite 39: GBIF-D IT-Fachgruppe Abschlussberic
Seite 91 und 92:
GBIF-D IT-Fachgruppe Abschlussberic
Seite 93 und 94:
Seite 95 und 96:
Seite 97 und 98:
Seite 99 und 100:
Seite 101 und 102:
Seite 103 und 104:
Seite 105 und 106:
Anlage 2: Gesamtliste der Workshopt
Seite 107 und 108:
Anlage 3: Gesamtliste der Workshop-
Seite 109 und 110:
Merkmalstyp Eingabedatum für diese
Seite 111 und 112:
32. Datenbank Export-Formate: UM 1.
Seite 113 und 114:
13. Anzahl externer Softwareentwick
Seite 115 und 116:
4. Spezifische Probleme der Interop
Seite 117 und 118:
35 SeSam (Senckenbergisches Sammlun
Seite 119 und 120:
Verantwortlicher für das IT-Produk
Seite 121 und 122:
Welches Betriebssystem ist für Cli
Seite 123 und 124:
Verwendetes Datenbank-Verwaltungssy
Seite 125 und 126:
Welches Betriebssystem ist für Cli
Seite 127 und 128:
"Authority files" wurden integriert
Seite 129 und 130:
Art des IT-Produktes: Web-Schnittst
Seite 131 und 132:
Geplante Erweiterungen: Kartendarst
Seite 133 und 134:
24 LinkCollection Datum der Erstein
Seite 135 und 136:
verwertung, praktische Anwendungen,
Seite 137 und 138:
Verwendetes Datenbank-Verwaltungssy
Seite 139 und 140:
34 science4you online Monitoring Da
Seite 141 und 142:
Copyright für Eigenentwicklungen a
Seite 143 und 144:
Das IT-Produkt ist nicht modularisi
Seite 145 und 146:
Schnittstelle): andere. Realisierun
Seite 147 und 148:
44 VegDa Datum der Ersteingabe: 10.
Seite 149:
nische Dokumentation ist offline ve
Alle anzeigen

Abschlussbericht - Abteilung Mykologie - Universität Bayreuth

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?