28.12.2013 Aufrufe

Ausarbeitung - Abteilung Datenbanken Leipzig

Ausarbeitung - Abteilung Datenbanken Leipzig

Ausarbeitung - Abteilung Datenbanken Leipzig

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

21<br />

Object-ProtocolModel (OPM)<br />

OPM wurde entwickeltzurModellierungbiologischerDaten undderEreignisabfolge in<br />

wissenschaftlichenExperimenten. Es eignetsichgutzurRepräsentationzeitlicherBedingungen<br />

und des Datenflusses zwischendenTeilexperimenten.<br />

OPM eignet sich gutzur ModellierungdynamischerDaten, wiePhenotyp-Daten und die<br />

Dynamik vonbiologischenProzessen.<br />

OPM und dessen"data management tools suite" istkommerziell.<br />

Querverwiese<br />

InBio-<strong>Datenbanken</strong> verweisen Datensätze aufBeschreibungen derExperimente, durch die<br />

die Daten gewonnen wurden, aufähnliche Daten inder selben odereinen anderen Datenbank.<br />

Meist werdendiese Verweisedurch (künstliche)Primärschlüsselrealisiertund als Hyperlinks<br />

implementiert.<br />

Diese Hypertext-Verlinkung ist einbesonders auffälliges MerkmalderBio-<strong>Datenbanken</strong>.<br />

Anfragen<br />

FürAnfragestellungenbieten dieBio-<strong>Datenbanken</strong>oft Webformulare an.<br />

Die derzeitgenutztenSchnittstellenlassen sich leichtbenutzen, es sind abernur meist begrenzte<br />

Anfragen möglich undmankann dort Anfragesprachen imherkömmlichenSinn nurselten<br />

finden. Einige Tools greifendirektaufdiese Schnittstellenzu. Zusätzlichstellenfastalle Bio-<br />

<strong>Datenbanken</strong> ihre Daten inden unterschiedlichsten Formaten als flat-files zumDownloadzur<br />

Verfügung.<br />

7.3 Datenanalyse und -integration<br />

Die meisten Bio-<strong>Datenbanken</strong> enthalten Software zurDatenanalyse. Diese Software sindentweder<br />

Implementierungenvon denbekanntenBioinformatik-Algorithmen, wiezumBeispielderSmith-<br />

Watermann-Algorithmus, oderWerkzeuge, wieBLAST, die aufbekannte oderwenige bekannte<br />

Algorithmenberuhen. Einige dieserTools sind schwierig zubenutzen, daviele Parameter<br />

angegebenwerden müssenund viele dieser Tools unzureichenddokumentiertsind.<br />

Viele Bio-<strong>Datenbanken</strong> enthalten außerdem elementare Computer-Linguistik-Software zur<br />

Schlagwortsuche undÜbersetzungenzwischenden geläufigsten Datenformaten.<br />

Wegendes schnellen Wachstums von Bio-<strong>Datenbanken</strong>spielenVerfahren zurKnowledge<br />

Discoveryund DataMiningimmergrößereRolle.<br />

Integration vonDatenunterschiedlicherUrsprünge führtzu "Beschreibungs-", "Heterogenitäts-"<br />

und "semantischen" Konflikten.<br />

Beschreibungskonflikt liegt vor, wenndas selbe semantischeObjektinverschiedenen<br />

<strong>Datenbanken</strong> unterschiedlich modelliertwird.<br />

Heterogenitätskonflikt resultiert aus denunterschiedlichen Datenmodellen und Managementsystemen<br />

der verschiedenen <strong>Datenbanken</strong>.<br />

Semantischer Konflikt tritt auf, wenndie grundlegenden Begriffe, wie zumBeispiel "Gen"in<br />

verschiedenen <strong>Datenbanken</strong>unterschiedlich ausgelegt werden.<br />

FrüheWerkzeugezur DatenintegrationberücksichtigendieseKonflikte nicht.<br />

Neuere Ansätzeversuchen Semantische Konflikte unteranderem mittels Ontologien zu lösen.<br />

Das Problem, Daten unterschiedlicherQualitätzu integrieren, wurde bishernochnicht<br />

zufriedenstellend gelöst.<br />

Um die Datenaus den verschieden<strong>Datenbanken</strong>aktuellzu halten, sind regelmäßige(tägliche)<br />

Updates nötig. BeiBio-<strong>Datenbanken</strong>istdies besonders rechenintensiv, daflat-files derdefacto<br />

Standardbeim Datenaustauschsind. Strukturierte Modelle sind fürdenDatenaustausch<br />

vorzuziehen. Die semistrukturierteHerangehensweise zurDatenmodellierungund<br />

Datenmanagementscheintvielversprechend fürdie DatenintegrationbeiBio-<strong>Datenbanken</strong>.<br />

Verschiedene Forschungen beschäftigensichmitder Modellierungmolekularbiologischer Daten<br />

mittels XML.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!