27.02.2013 Aufrufe

Konzept und Umsetzung einer Service-orientierten Datenintegration ...

Konzept und Umsetzung einer Service-orientierten Datenintegration ...

Konzept und Umsetzung einer Service-orientierten Datenintegration ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

von verschiedenen Datenquellen kommenden Daten verarbeitet werden. Der Vorgang der<br />

<strong>Datenintegration</strong> wird im DWH System durch einen sogenannten ETL-Prozess [BG08]<br />

realisiert. ETL steht für Extraktion, Transformation <strong>und</strong> Laden. Alle nötigen Daten werden<br />

zuerst aus verschiedenen Quellsystemen extrahiert. Wegen ihres vielfältigen Ursprungs sind<br />

die Daten voneinander unterschiedlich in Bezug auf Format <strong>und</strong> Struktur. Sie müssen dann in<br />

das Format <strong>und</strong> die Struktur (Basisschema), die im DWH festgelegt sind, transformiert<br />

werden. Nach der Verarbeitung der Rohdaten im Arbeitsbereich können die Daten dann in<br />

dieses gemeinsame Basisschema des DWH geladen werden.<br />

Um die Aktualität der Daten zu gewährleisten, finden periodische Update-Operationen, z.B.<br />

täglich zu bestimmten Zeitpunkten, statt. Bei Anfragen an das Anwendungssystem erfolgt die<br />

Datenbereitstellung asynchron. Hierauf wird im Abschnitt 5.2.2 näher eingegangen.<br />

Data Warehouses sind heute die wichtigsten auf <strong>Datenintegration</strong> basierenden Systeme in<br />

Unternehmen. Da die Bearbeitung der Daten direkt auf der zentralen Datenbank stattfindet<br />

<strong>und</strong> Quellsysteme zur Anfragezeit nicht mehr involviert sind, bringt dieser Ansatz einen<br />

erheblichen Geschwindigkeitsvorteil. Außerdem ermöglicht er es, Daten im Data Warehouse<br />

getrennt von den Quellsystemen zu manipulieren.<br />

Der Nachteil von DWH besteht darin, dass bei diesem Integrationsansatz nicht immer die<br />

aktuellsten Daten zur Verfügung stehen, da das Kopieren der Datenbestände nur in<br />

bestimmten Intervallen erfolgt. Es können auch Konsistenzprobleme auftreten, wenn Daten<br />

im Data Warehouse geändert wurden. [LN06]<br />

3.3 Virtuelle Integration<br />

Im Gegensatz zur materialisierten Integration werden bei der virtuellen Integration keine<br />

Daten zentral gespeichert. Alle zur Integration notwendigen Daten bleiben hier in der<br />

Datenquelle. Anders ausgedrückt, existiert bei der virtuellen Integration der integrierte<br />

Datenbestand nur virtuell. Aus Sicht des Nutzers gibt es zwar einen homogenen Bestand, die<br />

Daten werden aber erst bei <strong>einer</strong> Anfrage von den Datenquellen übertragen - die<br />

Bereitstellung der Daten ist synchron.<br />

Im Folgenden wird eine wichtige Architektur, die zurzeit oft zur virtuellen Integration<br />

verwendet wird, vorgestellt.<br />

3.3.1 Mediatorbasierte Informationssysteme<br />

Ein mediatorbasiertes Informationssystem beinhaltet zwei wichtige Rollen: Mediator <strong>und</strong><br />

Wrapper. Sie dienen als Vermittler zwischen Datenquellen <strong>und</strong> Anwendungen. Zu jeder<br />

autonomen, heterogenen Quelle wird ein spezieller Wrapper eingesetzt. Die Wrapper sind<br />

zuständig für den Zugriff auf die einzelnen Datenquellen. Ein Mediator kann auf einen oder<br />

32

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!