Abschlussbericht - Abteilung Mykologie - Universität Bayreuth
Abschlussbericht - Abteilung Mykologie - Universität Bayreuth
Abschlussbericht - Abteilung Mykologie - Universität Bayreuth
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
GBIF-D<br />
IT-Fachgruppe <strong>Abschlussbericht</strong> Januar 2008<br />
Konzept zum Middleware-Framework innerhalb der Diversity Workbench und<br />
Einführung in XQuery, XPath und XPointer<br />
Clemens Oertel<br />
Häufige Mehrfach-DNA-Sequenzierungen und fehlende Werkzeuge zur Speicherung<br />
der Ergebnisse von Sequenzanalysen motivierten die Erstellung einer eigenen Datenbank-Anwendung<br />
für molekularbiologische Daten ähnlich GenBank, jedoch mit<br />
diversen Erweiterungen. Hiervon unabhängig bestand Bedarf an einem System zur<br />
Veröffentlichung von Bildern und Zusatzinformationen im Internet (Handzeichnungen<br />
und TEM-Aufnahmen) sowie an einem zentralen Literaturverzeichnis. Das Ziel war<br />
somit ein Datenbanksystem zur Speicherung und Verknüpfung unterschiedlicher biologischer<br />
Daten. Operationen auf den gespeicherten Daten sollten der Erweiterbarkeit<br />
halber modular zu implementieren sein. Die Dateneingabe sollte per Browser<br />
geschehen, die -ausgabe sollte in verschiedenen Formaten (XML, PDF, GenBank,<br />
...) möglich sein. Darüber hinaus sollte die Möglichkeit zur Einbindung bestehender<br />
legacy-Systeme bestehen. Im folgenden Entwicklungsprozess entstanden verschiedene<br />
Versionen einer entsprechenden Software: Einer in PHP und MySQL entwickelter<br />
Anwendung folgte eine C++-basierte Umsetzung, die weiterhin existierenden<br />
Schwächen führten schließlich zu einer in Eiffel implementierten Version mit<br />
PostgreSQL als Datenbanksystem. Die bis heute in Verwendung und Entwicklung<br />
befindliche Version basiert auf der üblichen modularisierten Trennung von Eingabe-,<br />
Ausgabe- und dazwischen befindlicher Verarbeitungsschicht. Die flexible Gestaltung<br />
der Dateneinbindung erlaubt Zugriffe auf in unterschiedlichsten Formaten vorliegenden<br />
Daten sowie auf externe Datenbanken, für die auch ein Caching-Mechanismus<br />
vorgesehen ist. Des Weiteren weist das System eine umfangreiche Nutzerverwaltung<br />
und Authorisierungsmechanismen auf. Der Workflow innerhalb des Systems für einzelne<br />
Anfragen kann flexibel festgelegt werden; es werden hooks bereitgestellt, an<br />
die verschiedenen Bearbeitungsschritte angehängt werden können. Die verwendeten<br />
Datenstrukturen entstammen dem Diversity Workbench-Projekt. Dessen Datentyp-<br />
Beschreibungen im XML Schema Format werden direkt zur Generierung der verwendeten<br />
Klassen eingesetzt. Darüber hinausgehende Datenstrukturen können<br />
durch eine Meta-Beschreibung zur Laufzeit dem System hinzugefügt werden (dies ist<br />
allerdings mit nicht unerheblichen Performance-Einbußen verbunden). Die Kommunikation<br />
zu anderen Modulen der Diversity Workbench findet über SOAP statt.<br />
Aktuell findet eine Vereinheitlichung aller internen Pfadangaben auf XPath statt. Des<br />
Weiteren wird kontinuierlich an der Programmierung weiterer Daten-Input Module<br />
sowie einer weiteren Dynamisierung der Workflow-Festlegung gearbeitet.<br />
Ein langfristiges Ziel ist der Ausbau zu einem Middleware-System, so dass eine<br />
komponentenweise Nutzung einzelner Funktionen möglich wird.<br />
36