26.01.2014 Aufrufe

Aktuelles Schlagwort “Datenbanken in der Bioinformatik”

Aktuelles Schlagwort “Datenbanken in der Bioinformatik”

Aktuelles Schlagwort “Datenbanken in der Bioinformatik”

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

wenige (ca. 9% <strong>der</strong> <strong>in</strong> [3] untersuchten) Bio<strong>in</strong>formatik-Datenbanken werden mit e<strong>in</strong>em objekt-orientierten<br />

DBMS verwaltet, obwohl die objekt-orientierte Modellierung von molekularbiologischen Daten<br />

sehr passend ist. Diese Lage ist sicherlich auch auf die rasche Entwicklung <strong>der</strong> Bio<strong>in</strong>formatik, auf<br />

das extrem schnelle Wachstum <strong>der</strong> Bio<strong>in</strong>formatik-Datenbanken sowie auf den beschränkten Erfolg<br />

<strong>der</strong> objekt-orientierten DBMS zurückzuführen. Das speziell für die Bio<strong>in</strong>formatik entwickelte DBMS<br />

ACDB ([3]) wird zur Verwaltung von noch wenigen (ca. 4% <strong>der</strong> <strong>in</strong> [3] untersuchten) Bio<strong>in</strong>formatik-<br />

Datenbanken e<strong>in</strong>gesetzt.<br />

Querverweise. Oft verweisen Datensätze von Bio<strong>in</strong>formatik-Datenbanken auf Beschreibungen <strong>der</strong><br />

Experimente, durch die die Daten gewonnen wurden und/o<strong>der</strong> auf ähnliche Daten <strong>in</strong> <strong>der</strong>selben Datenbank<br />

o<strong>der</strong> <strong>in</strong> an<strong>der</strong>en Bio<strong>in</strong>formatik-Datenbanken. Meist werden diese Verweise mittels (künstlicher)<br />

Primärschlüssel realisiert und als Hypertext-L<strong>in</strong>ks implementiert. Die Hypertext-Verl<strong>in</strong>kung ist e<strong>in</strong><br />

beson<strong>der</strong>s auffälliges Merkmal <strong>der</strong> Bio<strong>in</strong>formatik-Datenbanken.<br />

Anfragen und Crawl<strong>in</strong>g. Die meisten Bio<strong>in</strong>formatik-Datenbanken bieten (oft hierarchisch organisierte)<br />

Web-Formulare, womit Anfragen an die Datenbank gestellt werden können. Solche Schnittstellen<br />

s<strong>in</strong>d leicht zu benutzen, aber ermöglichen meist nur begrenzte Anfragen. Anfragesprachen im<br />

herkömmlichen S<strong>in</strong>n werden selten zur Verfügung gestellt, u.a. weil ihre Verwendung Fachkenntnisse<br />

erfor<strong>der</strong>n, über die nur wenige Benutzer von Bio<strong>in</strong>formatik-Datenbanken verfügen. Zusätzlich stellen<br />

fast alle Bio<strong>in</strong>formatik-Datenbanken ihre Daten <strong>in</strong> den unterschiedlichsten Formaten als Flat-Files<br />

zum Herunterladen zur Verfügung. Das System SRS zur Integration von Bio<strong>in</strong>formatik-Datenbanken<br />

bietet e<strong>in</strong>e orig<strong>in</strong>elle Anfragesprache. Mit dieser Anfragesprache kann e<strong>in</strong>e Navigation durch Datenbanken<br />

und Datensätzen spezifiziert werden. Auffällig orig<strong>in</strong>ell s<strong>in</strong>d die Crawl<strong>in</strong>g-Konstrukte <strong>der</strong><br />

SRS-Anfragesprache zur Verfolgung von Hypertext-L<strong>in</strong>ks. Interessanterweise bietet ke<strong>in</strong>e Anfragesprache<br />

für XML [4] solche Crawl<strong>in</strong>g-Konstrukte.<br />

Datenanalyse und -<strong>in</strong>tegration<br />

Auch bei <strong>der</strong> Datenanalyse gibt es überwiegend Geme<strong>in</strong>samkeiten zwischen den Bio<strong>in</strong>formatik-<br />

Datenbanken, unabhängig von <strong>der</strong> Art <strong>der</strong> gespeicherten Daten. Viele Werkzeuge zur Datenanalyse<br />

s<strong>in</strong>d zwar tendenziell eher e<strong>in</strong>er gewissen Art von Daten zu zuordnen, dennoch werden sie oft auch<br />

für Daten an<strong>der</strong>er Art angeboten und benutzt.<br />

Datenbanken, Datenanalyse und Data M<strong>in</strong><strong>in</strong>g. Die meisten Bio<strong>in</strong>formatik-Datenbanken stellen<br />

Bio<strong>in</strong>formatik-Software für die Datenanalyse zur Verfügung. Diese Software s<strong>in</strong>d entwe<strong>der</strong> Implementierungen<br />

von verbreiteten Bio<strong>in</strong>formatik-Algorithmen (z.B. dem Smith-Watermann-Algorithmus)<br />

o<strong>der</strong> Werkzeuge (z.B. BLAST), die auf bekannten und/o<strong>der</strong> weniger bekannten Algorithmen<br />

und Verfahren beruhen. E<strong>in</strong>ige dieser Werkzeuge (z.B. 3Dee) beziehen sich auf Datenbanken, so dass<br />

die Unterscheidung zwischen e<strong>in</strong>er Methode zur Datenanalyse, die e<strong>in</strong>e bestimmte Datenbank verwendet,<br />

und e<strong>in</strong>er Datenbank, die e<strong>in</strong>e bestimmte Methode zur Datenanalyse anbietet, schwierig se<strong>in</strong><br />

kann. Viele Bio<strong>in</strong>formatik-Datenbanken bieten auch elementare Computer-L<strong>in</strong>guistik-Software zur<br />

<strong>Schlagwort</strong>suche und Übersetzungen zwischen den geläufigsten Datenformaten von Bio<strong>in</strong>formatik-<br />

Datenbanken. [3] gibt e<strong>in</strong>en Überblick über die verbreitesten Methoden und Werkzeuge zur Datenanalyse,<br />

die mit Bio<strong>in</strong>formatik-Datenbanken verwendet werden. Mit dem raschen und stetigen Wachstum

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!