18.11.2012 Aufrufe

Dokument 1 - RWTH Aachen University

Dokument 1 - RWTH Aachen University

Dokument 1 - RWTH Aachen University

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

34 3 Ein Metamodell für die Architektur von Data-Warehouse-Systemen<br />

In den folgenden Abschnitten wird zunächst die Notwendigkeit für eine erweiterte Metadatenverwaltung<br />

in DW-Systemen motiviert. Dafür analysiere ich zunächst Architekturen und Modelle<br />

für DW-Systeme in kommerziellen Produkten. Darüber hinaus werden Standards für die Verwaltung<br />

und den Austausch von Metadaten untersucht. Aufgrund der festgestellten Schwächen in<br />

diesen Modellen, wird zunächst in Abschnitt 3.4 das schon erwähnte Rahmenwerk entwickelt,<br />

und dieses dann in Abschnitt 3.5 in ein erweitertes Metamodell für DW-Systeme umgesetzt. Abschnitt<br />

3.6 präsentiert dann an einigen Beispielen, wie das Modell angewendet werden kann.<br />

Abgeschlossen wird das Kapitel mit einer Diskussion des Modells und einem Ausblick auf die<br />

folgenden Kapitel.<br />

3.1 DW-Architekturen in kommerziellen Produkten<br />

Die kommerziell verfügbaren Produkte im Bereich Data Warehousing kann man im wesentlichen<br />

in zwei Gruppen unterteilen. Auf der einen Seite gibt es die ETL-Werkzeuge (Extraktion–<br />

Transformation–Laden), die für die Beschaffung der Daten aus den Quellsystemen verantwortlich<br />

sind. Andererseits gibt es einen Markt für OLAP-Werkzeuge, die die Daten multidimensional<br />

aufbereiten, daraus Berichte generieren und über verschiedene Benutzerschnittstellen zur<br />

Verfügung stellen. Da in dieser Arbeit die Integration von Daten im Vordergrund steht, werden<br />

hier die ETL-Werkzeuge genauer betrachtet.<br />

Verschiedene Marktstudien belegen [Agosta, 2002; Friedman, 2002], dass der Markt für ETL-<br />

Produkte vor allem von Firmen beherrscht wird, die entweder sich auf ETL-Produkte spezialisiert<br />

haben (wie z.B. Ascential Software oder Informatica) oder die ETL-Produkte mit ihren Datenbankprodukten<br />

ausliefern (wie z.B. IBM, Microsoft oder Oracle). In den folgenden Abschnitten<br />

wird jeweils ein Beispiel dieser beiden Kategorien vorgestellt.<br />

3.1.1 Beispiel eines speziellen ETL-Produkts<br />

Als Beispiel für die Gruppe der speziellen ETL-Produkte wird hier das Produkt DataStage von<br />

Ascential Software vorgestellt [Ascential Software, 2002]. DataStage ist eine Zusammenstellung<br />

von Werkzeugen, die die Integration von Daten in einem Unternehmen erleichtern sollen.<br />

DW-Systeme sind zwar das Haupteinsatzgebiet von DataStage, jedoch können die Werkzeuge<br />

auch in anderen Kontexten eingesetzt werden, wo die Integration von Daten erforderlich ist. Neben<br />

Funktionen zur Extraktion, Transformation und Integration von Daten bietet DataStage auch<br />

Möglichkeiten zur Verwaltung von Datenqualitätsmerkmalen und zur Integration der Metadaten<br />

unterschiedlicher Datenquellen. Die angebotenen Funktionalitäten stehen also in direktem<br />

Zusammenhang mit den Kernthemen dieser Arbeit.<br />

Die Hauptkomponente von DataStage ist der DataStage Server, in dem die eigentlichen Integrationsprozesse<br />

ablaufen. Dieser Server ist darauf ausgelegt eine große Menge von Daten parallel<br />

zu verarbeiten und kann daher auch die Vorteile von Mehrprozessormaschinen nutzen. Des Weiteren<br />

bietet der Server eine Vielzahl von Schnittstellen zu Datenbanksystemen (wie z.B. Oracle,

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!