23.11.2012 Aufrufe

Schriftliche Ausarbeitung zum Referat - Universität Konstanz

Schriftliche Ausarbeitung zum Referat - Universität Konstanz

Schriftliche Ausarbeitung zum Referat - Universität Konstanz

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

4.5 Information Manifold – Beispiel für den Einsatz von Mediator-Technik<br />

Information Manifold ist ein implementiertes Informationsintegrationssystem der Stanford<br />

University [Levy, Rajaraman, Ordille 1996], welches einheitlichen Zugang zu einer<br />

Sammlung von mehr als 100 Quellen bietet, von denen sich ein großer Teil auf dem WWW<br />

befindet. Der wissenschaftliche Schwerpunkt des Systems liegt auf der Mediator-Komponente<br />

und dabei insbesondere auf effizienten Methoden zur Auswahl von Quellen und Erstellung<br />

von Query Plänen.<br />

Integrierte Sicht / Auswahl von Quellen<br />

Information Manifold benutzt das bei Mediatoren übliche Instrument eines globalen Schemas,<br />

um eine integrierte Sicht zu bieten, gegen die der Benutzer Anfragen stellen kann. In der<br />

Regel werden derartige integrierte Sichten als Query über den Quellen gesehen (global as<br />

view). Dies entspricht auch der natürlichen Konstruktion einer Sicht, indem von den<br />

Originaldaten ausgegangen wird. Dieser Ansatz hat jedoch den Nachteil, dass er sehr<br />

laufzeitintensiv sein kann. Bei n Quellen müssen ggf. n² Interaktionen zwischen den Quellen<br />

ausgeführt werden, um eine Sicht zu konstruieren.<br />

Bei Information Manifold wird ein entgegengesetzter Ansatz verfolgt: Die Quellen werden als<br />

Sichten auf den integrierten Daten beschrieben (local as view). Dies hat den Vorteil, dass bei<br />

n Quellen nur n Sichten benötigt werden. Ferner können die oft feingranularen Unterschiede<br />

zwischen den Quellen besser modelliert werden, da in der Definition einer Sicht, die eine<br />

Quelle beschreibt, die Bedingungen exakt angegeben werden können, die alle Tupel der<br />

fraglichen Relation charakterisieren. Ausgehend von diesen exakten Beschreibung ist eine<br />

effiziente Auswahl der Quellen möglich, die für die Beantwortung einer Anfrage relevant<br />

sind.<br />

Im umgekehrten Falle, in dem das globale Schema als Query über den Quellen angesehen<br />

wird, können dagegen nur beschränkt Detailbeschreibungen der Quellen einfließen, wenn das<br />

globale Schema überschaubar gehalten werden soll. Ein weiterer Vorteil des vorliegenden<br />

Ansatzes ist, dass Quellen bequem hinzugefügt werden können, ohne dass die<br />

Beschreibungen der bisherigen Quellen geändert bzw. eine fest vordefinierte Gesamtsicht<br />

angepasst werden müsste. Nachteil hingegen ist, dass das globale Schema selbst eine<br />

minimale Instanz darstellt, die konsistent mit allen Definitionen ist. Die eigentliche<br />

Mächtigkeit der Mediator-Datenbank ist in den auf bekannten Zuständen der Quellen<br />

basierenden Sichtendefinitionen spezifiziert. Eine solche Spezifikation ist jedoch<br />

zwangsläufig unvollständig.<br />

Erstellung von Query-Plänen<br />

Zur Erstellung von Query-Plänen werden die Fähigkeiten der Quellen mit Hilfe von<br />

sogenannten Capability Records beschrieben. Diese spezifizieren für jede Quelle den<br />

möglichen Input, den möglichen Output und die Fähigkeit Selektionen vorzunehmen.<br />

Dadurch kann die Erstellung von Query-Plänen in zwei Phasen erfolgen: Zunächst werden<br />

alle semantisch korrekten Pläne ermittelt, d. h. alle Pläne, die die als Sichten beschriebenen<br />

Quellen benutzen und eine Antwort auf die Anfrage liefern. Anschließend werden die<br />

Teilpläne unter Berücksichtigung der Antwortfähigkeiten der Quellen so angeordnet, dass sie<br />

auch tatsächlich ausführbar sind.<br />

17

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!