Ausarbeitung - Abteilung Datenbanken Leipzig

21 

Object-ProtocolModel (OPM) 

OPM wurde entwickeltzurModellierungbiologischerDaten undderEreignisabfolge in 

wissenschaftlichenExperimenten. Es eignetsichgutzurRepräsentationzeitlicherBedingungen 

und des Datenflusses zwischendenTeilexperimenten. 

OPM eignet sich gutzur ModellierungdynamischerDaten, wiePhenotyp-Daten und die 

Dynamik vonbiologischenProzessen. 

OPM und dessen"data management tools suite" istkommerziell. 

Querverwiese 

InBio-Datenbanken verweisen Datensätze aufBeschreibungen derExperimente, durch die 

die Daten gewonnen wurden, aufähnliche Daten inder selben odereinen anderen Datenbank. 

Meist werdendiese Verweisedurch (künstliche)Primärschlüsselrealisiertund als Hyperlinks 

implementiert. 

Diese Hypertext-Verlinkung ist einbesonders auffälliges MerkmalderBio-Datenbanken. 

Anfragen 

FürAnfragestellungenbieten dieBio-Datenbankenoft Webformulare an. 

Die derzeitgenutztenSchnittstellenlassen sich leichtbenutzen, es sind abernur meist begrenzte 

Anfragen möglich undmankann dort Anfragesprachen imherkömmlichenSinn nurselten 

finden. Einige Tools greifendirektaufdiese Schnittstellenzu. Zusätzlichstellenfastalle Bio- 

Datenbanken ihre Daten inden unterschiedlichsten Formaten als flat-files zumDownloadzur 

Verfügung. 

7.3 Datenanalyse und -integration 

Die meisten Bio-Datenbanken enthalten Software zurDatenanalyse. Diese Software sindentweder 

Implementierungenvon denbekanntenBioinformatik-Algorithmen, wiezumBeispielderSmith- 

Watermann-Algorithmus, oderWerkzeuge, wieBLAST, die aufbekannte oderwenige bekannte 

Algorithmenberuhen. Einige dieserTools sind schwierig zubenutzen, daviele Parameter 

angegebenwerden müssenund viele dieser Tools unzureichenddokumentiertsind. 

Viele Bio-Datenbanken enthalten außerdem elementare Computer-Linguistik-Software zur 

Schlagwortsuche undÜbersetzungenzwischenden geläufigsten Datenformaten. 

Wegendes schnellen Wachstums von Bio-DatenbankenspielenVerfahren zurKnowledge 

Discoveryund DataMiningimmergrößereRolle. 

Integration vonDatenunterschiedlicherUrsprünge führtzu "Beschreibungs-", "Heterogenitäts-" 

und "semantischen" Konflikten. 

Beschreibungskonflikt liegt vor, wenndas selbe semantischeObjektinverschiedenen 

Datenbanken unterschiedlich modelliertwird. 

Heterogenitätskonflikt resultiert aus denunterschiedlichen Datenmodellen und Managementsystemen 

der verschiedenen Datenbanken. 

Semantischer Konflikt tritt auf, wenndie grundlegenden Begriffe, wie zumBeispiel "Gen"in 

verschiedenen Datenbankenunterschiedlich ausgelegt werden. 

FrüheWerkzeugezur DatenintegrationberücksichtigendieseKonflikte nicht. 

Neuere Ansätzeversuchen Semantische Konflikte unteranderem mittels Ontologien zu lösen. 

Das Problem, Daten unterschiedlicherQualitätzu integrieren, wurde bishernochnicht 

zufriedenstellend gelöst. 

Um die Datenaus den verschiedenDatenbankenaktuellzu halten, sind regelmäßige(tägliche) 

Updates nötig. BeiBio-Datenbankenistdies besonders rechenintensiv, daflat-files derdefacto 

Standardbeim Datenaustauschsind. Strukturierte Modelle sind fürdenDatenaustausch 

vorzuziehen. Die semistrukturierteHerangehensweise zurDatenmodellierungund 

Datenmanagementscheintvielversprechend fürdie DatenintegrationbeiBio-Datenbanken. 

Verschiedene Forschungen beschäftigensichmitder Modellierungmolekularbiologischer Daten 

mittels XML.

Vorherige Seite

Nächste Seite

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

Ausarbeitung - Abteilung Datenbanken Leipzig

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?