Schriftliche Ausarbeitung zum Referat - Universität Konstanz
Schriftliche Ausarbeitung zum Referat - Universität Konstanz
Schriftliche Ausarbeitung zum Referat - Universität Konstanz
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Die Metainformationen werden wie erwähnt i. d. R. in einer globalen Sicht vereint, welche<br />
zugleich als Schema dient, gegen das der Benutzer seine Anfragen stellt. Zur Speicherung<br />
dieser Informationen dient das Metadaten-Repository des Mediators. Bei der Verwendung<br />
von Fat Wrappern würde ein Teil der Metainformationen aus dem Repository in die Wrapper<br />
verlagert.<br />
Kombination von Mediatoren<br />
Neben einer Architektur mit einem zentralen Mediator sind auch Systeme denkbar, in denen<br />
eine Vielzahl von Mediatoren eingesetzt ist, die jeweils auf eine bestimmte Domäne oder<br />
einen Aufgabenbereich spezialisiert sind. Dabei greifen Mediatoren ebenso wie<br />
Anwendungen auf andere Mediatoren zurück. Eine solche Architektur erhöht die Flexibilität<br />
und Erweiterbarkeit, stellt jedoch auch erheblich höhere Anforderungen an die Koordination<br />
und die Kommunikation zwischen den Komponenten.<br />
4.3 Anfrageverarbeitung<br />
Die Anfrageverarbeitung kann im wesentlichen in drei Schritte eingeteilt werden:<br />
1. Auswahl der Quellen<br />
Der erste Schritt bei der Verarbeitung einer Anfrage besteht darin festzustellen, welche<br />
der vorhandenen Datenquellen Informationen zu einem Gesamtergebnis beitragen<br />
könnten. Dies wird vor allem durch die in den Quellen vorhandenen Attribute und<br />
eventuelle Beschränkungen des Wertebereichs bestimmt. Bei der Auswahl können<br />
jedoch auch Verfügbarkeit und Performanz der Quellen eine Rolle spielen.<br />
2. Anfrageaufteilung und -optimierung<br />
Aufbauend auf den ausgewählten Quellen werden nun Query-Pläne erstellt, in denen<br />
festgelegt wird, welche Teilabfragen auf welchen Quellen ausgeführt werden und in<br />
welcher Reihenfolge diese Teilabfragen erfolgen müssen.<br />
Bei der Aufteilung ist zusätzlich zur Frage, ob eine Quelle allgemein einen Beitrag<br />
leisten kann, auch die Semantik zu berücksichtigen. D. h. es ist zu analysieren, in<br />
welchem Verhältnis die Attribute einer Quelle zu denen der Anfrage und/oder anderer<br />
Quellen stehen. Derartige semantische Unterschiede werden i. d. R. im Vorfeld mit<br />
Hilfe von semantische Abbildungen zwischen den Inhalten der Datenquellen und der<br />
integrierten Gesamtsicht modelliert. In dieser Phase können potentielle Quellen auch<br />
wieder entfallen, da das von ihnen gelieferte Teilergebnis nicht sinnvoll mit<br />
Teilergebnissen aus anderen Quellen zu einem Gesamtergebnis kombiniert werden<br />
kann. Die einzelnen Pläne werden nun nach Performanzkriterien optimiert. Falls<br />
festgestellt werden kann, dass mehrer Pläne ein identisches Ergebnis liefern, wird<br />
unter diesen außerdem der kostengünstigste ausgewählt.<br />
3. Anfrageausführung und Ergebnisintegration<br />
In diesem Schritt werden die Pläne ausgeführt, indem die jeweils relevanten Daten aus<br />
den Quellen ausgelesen und verarbeitet werden. Ähnlich wie bei Datenbanksystemen<br />
müssen diese korreliert und selektiert werden, sowie Abstraktionen und Aggregationen<br />
durchgeführt werden.<br />
Hier spielt erneut das Problem der semantischen Heterogenitäten eine entscheidende<br />
Rolle. Die bei der Anfragebearbeitung erkannten Konflikte müssen mit Hilfe<br />
entsprechender Integrationsregeln für die Transformation und Verarbeitung der<br />
14