18.11.2012 Aufrufe

Dokument 1 - RWTH Aachen University

Dokument 1 - RWTH Aachen University

Dokument 1 - RWTH Aachen University

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

2.2 Datenintegration 13<br />

Exportschema<br />

1<br />

Lokales<br />

Schema 1<br />

Wrapper<br />

Applikation<br />

Zentraler<br />

Datenbestand<br />

Lokales<br />

Schema 2<br />

Anfrage bzw.<br />

Ergebnisse<br />

Exportschema<br />

Globales Schema<br />

Exportschema<br />

2<br />

Wrapper Wrapper<br />

...<br />

Exportschema<br />

n<br />

Lokales<br />

Schema n<br />

Abbildung 2.2: Vereinfachte Architektur eines Datenintegrationssystems<br />

man als gegeben betrachten muss und nicht ändern kann. Diese lokalen Schemata werden durch<br />

Wrapper-Programme in Exportschemata transformiert, die einerseits ein einheitliches Datenmodell<br />

benutzen und andererseits nur den Teil des lokalen Schemas enthalten, der für das globale<br />

Schema relevant ist. In der von Sheth und Larson [1990] angegebenen Architektur wird zwischen<br />

lokalem Schema und Exportschema noch das Komponentenschema erwähnt, bei dem die<br />

unterschiedlichen Datenmodelle der lokalen Schemata in ein einheitliches Datenmodell überführt<br />

werden soll. Auf die Darstellung des Komponentenschemas in der Abbildung wurde aus<br />

Gründen der Übersichtlichkeit verzichtet.<br />

Im globalen Schema werden die Exportschemata der einzelnen Datenquellen zusammengeführt<br />

bzw. vereinigt. Das globale Schema wird auch föderiertes oder integriertes Schema genannt<br />

[Conrad, 2002]. Dies ist der wesentlichste Schritt der Schemaintegration, bei dem vor allem<br />

folgende Konflikte gelöst werden müssen [Spaccapietra et al., 1992; Jarke et al., 2000a; Conrad,<br />

2002]:<br />

Extensionale Konflikte: Auch wenn zwei Schemata die gleichen Objekte der realen Welt beschreiben,<br />

müssen die dazugehörenden Datenbestände (die Extensionen) nicht gleich sein.<br />

Die Datenbestände können in einer Teilmengenbeziehung zueinander stehen, sich überlappen<br />

oder sie können disjunkt sein.<br />

Beschreibungskonflikte: Die gleichen Objekte können in den Schemata auf unterschiedliche<br />

Weise beschrieben sein. So kann man z.B. für die Darstellung einer Adresse entweder<br />

ein Attribut oder mehrere Attribute für Postleitzahl, Ort, Straße usw. vorsehen. Objekte<br />

können auch durch unterschiedliche Mengen von Attributen charakterisiert werden. Auch

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!