18.11.2012 Aufrufe

Dokument 1 - RWTH Aachen University

Dokument 1 - RWTH Aachen University

Dokument 1 - RWTH Aachen University

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

6.6 Fazit 177<br />

geforderten DW-Relation und der Datenquellen definiert. Darauf aufbauend wurde der MiniCon-<br />

Algorithmus zur Anfrageumschreibung so modifiziert und erweitert, dass aus diesen erweiterten<br />

Modellen ein Mediator für ein Datenintegrationssystem generiert werden kann. Schließlich habe<br />

ich gezeigt, wie sich die Qualitätsfaktoren und Qualitätsziele in dieses formale Rahmenwerk<br />

integrieren lassen, um die Qualität der ermittelten Ergebnisse zu beurteilen.<br />

Die Innovation und die Schwierigkeit des Verfahrens liegt in der Kombination verschiedener<br />

existierender Modelle und Algorithmen, die für die entsprechenden Problembereiche effiziente<br />

Lösungen anbieten. Die Modellierung des Unternehmensmodells und der Datenquellen nach<br />

[Calvanese et al., 2001] ermöglicht eine semantisch reichhaltige Repräsentation der Datenmodelle,<br />

es fehlt aber ein effizientes Verfahren zur Anfrageumschreibung Die Anzahl der möglichen<br />

Umschreibungen im Verfahren nach [Calvanese et al., 2001] ist von der Größenordnung<br />

her identisch mit der Anzahl der Möglichkeiten in meinem Verfahren (evtl. geringer, weil einige<br />

Mediatoroperationen nicht definiert wurden, oder höher, weil auch Umschreibungen betrachtet<br />

werden, die nicht in der ursprünglichen Anfrage enthalten sind). Jedoch muss für jede mögliche<br />

Umschreibung geprüft werden, ob sie in der Anfrage enthalten ist.<br />

Der MiniCon-Algorithmus [Pottinger und Halevy, 2001] konstruiert die Anfrage direkt auf eine<br />

solche Weise, dass die komplexen Überprüfungen nicht notwendig sind, jedoch sind die zugrundeliegenden<br />

Datenmodelle auf die logische Perspektive beschränkt und Qualitätsaspekte werden<br />

nicht berücksichtigt. Die qualitätsgesteuerte Datenintegration von Naumann [2002] betrachtet<br />

auch die Datenqualität, das Datenmodell und das Verfahren zur Anfrageumschreibung sind aber<br />

weniger stark als die vorher genannten Modelle und Verfahren.<br />

Dennoch gibt es einige Schwachpunkte am hier vorgestellten Verfahren. So werden z.B. bei der<br />

Anfrageumschreibung immer nur einzelne Prädikate betrachtet. Dabei könnte eine kombinierte<br />

Betrachtung von Prädikaten aus unterschiedlichen Datenquellen vorteilhaft sein. Im Beispiel<br />

6.4 wird das Prädikat PrivateCustomer nur durch die Relation Marketing abgedeckt. Jedoch ist<br />

auch eine Abdeckung durch einen Verbund der Relationen Customer und GermanCitizen möglich.<br />

Um solche Zusammenhänge zu erkennen sind Beweissysteme (wie z.B. FaCT [Horrocks,<br />

1999]) und eine entsprechend detaillierte Modellierung notwendig. Dies würde aber auf Kosten<br />

der Effizienz der Anfrageumschreibung gehen. Eine Integration von Beschreibungslogiken wie<br />

sie auch in [Calvanese et al., 2001] verwendet werden, würde auch die Ausdrücksstärke der<br />

Abhängigkeitsregeln verbessern.<br />

Die Modellierung der notwendigen Metadaten wurde nicht in diesem Abschnitt gezeigt, da der<br />

Schwerpunkt auf der formalen Darstellung lag. Die notwendigen Erweiterungen der konzeptuellen<br />

und logischen Perspektive können analog zu den bereits in Abschnitt 3.6 vorgestellten<br />

Erweiterungen vorgenommen werden. Die Verbund- und Vereinigungsfunktionen bei Qualitätsfaktoren<br />

können durch zusätzlichen Attribute dargestellt werden.<br />

Abschließend wurde präsentiert, wie die für das Verfahren erforderlichen Metadaten erfasst und<br />

verwaltet werden können. Dazu wurden Werkzeuge entwickelt, die die Metadaten automatisch<br />

aus den Datenquellen extrahieren oder die graphische Bearbeitung von Daten- und Qualitätsmodellen<br />

ermöglichen. Das Verfahren zur Generierung der Spezifikation eines Mediators kann in<br />

diese Umgebung integriert werden, da die notwendigen Daten dafür im Metadatenbanksystem<br />

vorhanden sind. Ein DW-Designer kann dann für eine gegebene DW-Relation und Gewichtungen

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!