Schriftliche Ausarbeitung zum Referat - Universität Konstanz
Schriftliche Ausarbeitung zum Referat - Universität Konstanz
Schriftliche Ausarbeitung zum Referat - Universität Konstanz
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
4.5 Information Manifold – Beispiel für den Einsatz von Mediator-Technik<br />
Information Manifold ist ein implementiertes Informationsintegrationssystem der Stanford<br />
University [Levy, Rajaraman, Ordille 1996], welches einheitlichen Zugang zu einer<br />
Sammlung von mehr als 100 Quellen bietet, von denen sich ein großer Teil auf dem WWW<br />
befindet. Der wissenschaftliche Schwerpunkt des Systems liegt auf der Mediator-Komponente<br />
und dabei insbesondere auf effizienten Methoden zur Auswahl von Quellen und Erstellung<br />
von Query Plänen.<br />
Integrierte Sicht / Auswahl von Quellen<br />
Information Manifold benutzt das bei Mediatoren übliche Instrument eines globalen Schemas,<br />
um eine integrierte Sicht zu bieten, gegen die der Benutzer Anfragen stellen kann. In der<br />
Regel werden derartige integrierte Sichten als Query über den Quellen gesehen (global as<br />
view). Dies entspricht auch der natürlichen Konstruktion einer Sicht, indem von den<br />
Originaldaten ausgegangen wird. Dieser Ansatz hat jedoch den Nachteil, dass er sehr<br />
laufzeitintensiv sein kann. Bei n Quellen müssen ggf. n² Interaktionen zwischen den Quellen<br />
ausgeführt werden, um eine Sicht zu konstruieren.<br />
Bei Information Manifold wird ein entgegengesetzter Ansatz verfolgt: Die Quellen werden als<br />
Sichten auf den integrierten Daten beschrieben (local as view). Dies hat den Vorteil, dass bei<br />
n Quellen nur n Sichten benötigt werden. Ferner können die oft feingranularen Unterschiede<br />
zwischen den Quellen besser modelliert werden, da in der Definition einer Sicht, die eine<br />
Quelle beschreibt, die Bedingungen exakt angegeben werden können, die alle Tupel der<br />
fraglichen Relation charakterisieren. Ausgehend von diesen exakten Beschreibung ist eine<br />
effiziente Auswahl der Quellen möglich, die für die Beantwortung einer Anfrage relevant<br />
sind.<br />
Im umgekehrten Falle, in dem das globale Schema als Query über den Quellen angesehen<br />
wird, können dagegen nur beschränkt Detailbeschreibungen der Quellen einfließen, wenn das<br />
globale Schema überschaubar gehalten werden soll. Ein weiterer Vorteil des vorliegenden<br />
Ansatzes ist, dass Quellen bequem hinzugefügt werden können, ohne dass die<br />
Beschreibungen der bisherigen Quellen geändert bzw. eine fest vordefinierte Gesamtsicht<br />
angepasst werden müsste. Nachteil hingegen ist, dass das globale Schema selbst eine<br />
minimale Instanz darstellt, die konsistent mit allen Definitionen ist. Die eigentliche<br />
Mächtigkeit der Mediator-Datenbank ist in den auf bekannten Zuständen der Quellen<br />
basierenden Sichtendefinitionen spezifiziert. Eine solche Spezifikation ist jedoch<br />
zwangsläufig unvollständig.<br />
Erstellung von Query-Plänen<br />
Zur Erstellung von Query-Plänen werden die Fähigkeiten der Quellen mit Hilfe von<br />
sogenannten Capability Records beschrieben. Diese spezifizieren für jede Quelle den<br />
möglichen Input, den möglichen Output und die Fähigkeit Selektionen vorzunehmen.<br />
Dadurch kann die Erstellung von Query-Plänen in zwei Phasen erfolgen: Zunächst werden<br />
alle semantisch korrekten Pläne ermittelt, d. h. alle Pläne, die die als Sichten beschriebenen<br />
Quellen benutzen und eine Antwort auf die Anfrage liefern. Anschließend werden die<br />
Teilpläne unter Berücksichtigung der Antwortfähigkeiten der Quellen so angeordnet, dass sie<br />
auch tatsächlich ausführbar sind.<br />
17