Ausarbeitung - Abteilung Datenbanken Leipzig
Ausarbeitung - Abteilung Datenbanken Leipzig
Ausarbeitung - Abteilung Datenbanken Leipzig
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
21<br />
Object-ProtocolModel (OPM)<br />
OPM wurde entwickeltzurModellierungbiologischerDaten undderEreignisabfolge in<br />
wissenschaftlichenExperimenten. Es eignetsichgutzurRepräsentationzeitlicherBedingungen<br />
und des Datenflusses zwischendenTeilexperimenten.<br />
OPM eignet sich gutzur ModellierungdynamischerDaten, wiePhenotyp-Daten und die<br />
Dynamik vonbiologischenProzessen.<br />
OPM und dessen"data management tools suite" istkommerziell.<br />
Querverwiese<br />
InBio-<strong>Datenbanken</strong> verweisen Datensätze aufBeschreibungen derExperimente, durch die<br />
die Daten gewonnen wurden, aufähnliche Daten inder selben odereinen anderen Datenbank.<br />
Meist werdendiese Verweisedurch (künstliche)Primärschlüsselrealisiertund als Hyperlinks<br />
implementiert.<br />
Diese Hypertext-Verlinkung ist einbesonders auffälliges MerkmalderBio-<strong>Datenbanken</strong>.<br />
Anfragen<br />
FürAnfragestellungenbieten dieBio-<strong>Datenbanken</strong>oft Webformulare an.<br />
Die derzeitgenutztenSchnittstellenlassen sich leichtbenutzen, es sind abernur meist begrenzte<br />
Anfragen möglich undmankann dort Anfragesprachen imherkömmlichenSinn nurselten<br />
finden. Einige Tools greifendirektaufdiese Schnittstellenzu. Zusätzlichstellenfastalle Bio-<br />
<strong>Datenbanken</strong> ihre Daten inden unterschiedlichsten Formaten als flat-files zumDownloadzur<br />
Verfügung.<br />
7.3 Datenanalyse und -integration<br />
Die meisten Bio-<strong>Datenbanken</strong> enthalten Software zurDatenanalyse. Diese Software sindentweder<br />
Implementierungenvon denbekanntenBioinformatik-Algorithmen, wiezumBeispielderSmith-<br />
Watermann-Algorithmus, oderWerkzeuge, wieBLAST, die aufbekannte oderwenige bekannte<br />
Algorithmenberuhen. Einige dieserTools sind schwierig zubenutzen, daviele Parameter<br />
angegebenwerden müssenund viele dieser Tools unzureichenddokumentiertsind.<br />
Viele Bio-<strong>Datenbanken</strong> enthalten außerdem elementare Computer-Linguistik-Software zur<br />
Schlagwortsuche undÜbersetzungenzwischenden geläufigsten Datenformaten.<br />
Wegendes schnellen Wachstums von Bio-<strong>Datenbanken</strong>spielenVerfahren zurKnowledge<br />
Discoveryund DataMiningimmergrößereRolle.<br />
Integration vonDatenunterschiedlicherUrsprünge führtzu "Beschreibungs-", "Heterogenitäts-"<br />
und "semantischen" Konflikten.<br />
Beschreibungskonflikt liegt vor, wenndas selbe semantischeObjektinverschiedenen<br />
<strong>Datenbanken</strong> unterschiedlich modelliertwird.<br />
Heterogenitätskonflikt resultiert aus denunterschiedlichen Datenmodellen und Managementsystemen<br />
der verschiedenen <strong>Datenbanken</strong>.<br />
Semantischer Konflikt tritt auf, wenndie grundlegenden Begriffe, wie zumBeispiel "Gen"in<br />
verschiedenen <strong>Datenbanken</strong>unterschiedlich ausgelegt werden.<br />
FrüheWerkzeugezur DatenintegrationberücksichtigendieseKonflikte nicht.<br />
Neuere Ansätzeversuchen Semantische Konflikte unteranderem mittels Ontologien zu lösen.<br />
Das Problem, Daten unterschiedlicherQualitätzu integrieren, wurde bishernochnicht<br />
zufriedenstellend gelöst.<br />
Um die Datenaus den verschieden<strong>Datenbanken</strong>aktuellzu halten, sind regelmäßige(tägliche)<br />
Updates nötig. BeiBio-<strong>Datenbanken</strong>istdies besonders rechenintensiv, daflat-files derdefacto<br />
Standardbeim Datenaustauschsind. Strukturierte Modelle sind fürdenDatenaustausch<br />
vorzuziehen. Die semistrukturierteHerangehensweise zurDatenmodellierungund<br />
Datenmanagementscheintvielversprechend fürdie DatenintegrationbeiBio-<strong>Datenbanken</strong>.<br />
Verschiedene Forschungen beschäftigensichmitder Modellierungmolekularbiologischer Daten<br />
mittels XML.