Schriftliche Ausarbeitung zum Referat - Universität Konstanz

Weitere Magazine

Empfehlungen

Info

Die Metainformationen werden wie erwähnt i. d. R. in einer globalen Sicht vereint, welche zugleich als Schema dient, gegen das der Benutzer seine Anfragen stellt. Zur Speicherung dieser Informationen dient das Metadaten-Repository des Mediators. Bei der Verwendung von Fat Wrappern würde ein Teil der Metainformationen aus dem Repository in die Wrapper verlagert. Kombination von Mediatoren Neben einer Architektur mit einem zentralen Mediator sind auch Systeme denkbar, in denen eine Vielzahl von Mediatoren eingesetzt ist, die jeweils auf eine bestimmte Domäne oder einen Aufgabenbereich spezialisiert sind. Dabei greifen Mediatoren ebenso wie Anwendungen auf andere Mediatoren zurück. Eine solche Architektur erhöht die Flexibilität und Erweiterbarkeit, stellt jedoch auch erheblich höhere Anforderungen an die Koordination und die Kommunikation zwischen den Komponenten. 4.3 Anfrageverarbeitung Die Anfrageverarbeitung kann im wesentlichen in drei Schritte eingeteilt werden: 1. Auswahl der Quellen Der erste Schritt bei der Verarbeitung einer Anfrage besteht darin festzustellen, welche der vorhandenen Datenquellen Informationen zu einem Gesamtergebnis beitragen könnten. Dies wird vor allem durch die in den Quellen vorhandenen Attribute und eventuelle Beschränkungen des Wertebereichs bestimmt. Bei der Auswahl können jedoch auch Verfügbarkeit und Performanz der Quellen eine Rolle spielen. 2. Anfrageaufteilung und -optimierung Aufbauend auf den ausgewählten Quellen werden nun Query-Pläne erstellt, in denen festgelegt wird, welche Teilabfragen auf welchen Quellen ausgeführt werden und in welcher Reihenfolge diese Teilabfragen erfolgen müssen. Bei der Aufteilung ist zusätzlich zur Frage, ob eine Quelle allgemein einen Beitrag leisten kann, auch die Semantik zu berücksichtigen. D. h. es ist zu analysieren, in welchem Verhältnis die Attribute einer Quelle zu denen der Anfrage und/oder anderer Quellen stehen. Derartige semantische Unterschiede werden i. d. R. im Vorfeld mit Hilfe von semantische Abbildungen zwischen den Inhalten der Datenquellen und der integrierten Gesamtsicht modelliert. In dieser Phase können potentielle Quellen auch wieder entfallen, da das von ihnen gelieferte Teilergebnis nicht sinnvoll mit Teilergebnissen aus anderen Quellen zu einem Gesamtergebnis kombiniert werden kann. Die einzelnen Pläne werden nun nach Performanzkriterien optimiert. Falls festgestellt werden kann, dass mehrer Pläne ein identisches Ergebnis liefern, wird unter diesen außerdem der kostengünstigste ausgewählt. 3. Anfrageausführung und Ergebnisintegration In diesem Schritt werden die Pläne ausgeführt, indem die jeweils relevanten Daten aus den Quellen ausgelesen und verarbeitet werden. Ähnlich wie bei Datenbanksystemen müssen diese korreliert und selektiert werden, sowie Abstraktionen und Aggregationen durchgeführt werden. Hier spielt erneut das Problem der semantischen Heterogenitäten eine entscheidende Rolle. Die bei der Anfragebearbeitung erkannten Konflikte müssen mit Hilfe entsprechender Integrationsregeln für die Transformation und Verarbeitung der 14
Ergebnisse beseitigt werden. Finden sich in den Datenquellen neben semantischen auch strukturelle Unterschiede (z. B. einerseits Speicherung einer Information als Attribut, andererseits als eigene Relation) dann müssen ggf. auch Schematransformationen durchgeführt werden. Beispiel für die Erstellung eines Query Plans: Gegeben seien folgende Informationsquellen auf dem Web in der Domäne Fahrzeugkauf: Quelle Input Output 1: Gebrauchtwagen Kategorie oder Modell Modell, Jahr, Preis, optional: Preisbereich,Baujahr Kontaktinformationen 2: Luxuswagen ab 20000 $ Kategorie Modell, Jahr, Preis, optional: Preisbereich Kontaktinformationen 3: Oldtimer (älter als 1950) Modell Modell, Jahr, Preis, optional: Baujahr Kontaktinformationen 4: Motorräder Modell Modell, Jahr, Preis, optional: Preisbereich Kontaktinformationen 5: Modellbeschreibungen Modell und Jahr Beschreibung An das System wird folgende Anfrage gestellt: Gesucht sind Preis und Beschreibungen für zu verkaufende Sportwagen, die nach 1992 gebaut wurden. Auswahl der Quellen: - Quelle 4 ist offensichtlich nicht relevant, da sie keine Autos enthält. - Quelle 3 ist aufgrund ihres Wertebereichs nicht interessant, da sie nur vor 1950 gebaute Fahrzeuge enthält. - In Frage kommen offensichtlich Quellen 1, 2 und 5. Damit können folgende Query Pläne erstellt werden: Plan 1: - Befrage Quelle 1 nach Modell, Jahr und Preis für alle Sportwagen, die nach 1992 produziert wurden. - Erhalte eine Beschreibung von Quelle 5 für jedes Modell - Produziere eine Menge von -Tupeln. Plan 2: - Frage Quelle 2 nach den Modellen, Baujahren und Preisen für Sportwagen. - Wähle aus den -Tupeln, die sich ergeben, diejenigen aus, bei denen das Jahr >= 1992. - Erhalte eine Beschreibung von Quelle 5 für jedes Modell der ausgewählten Tupel - Produziere eine Menge von -Tupeln Die Antwort auf die Anfrage ist die Vereinigung der beiden Tupelmengen. 4.4 Erstellung eines globalen Schemas Da der Benutzer seine Anfragen in der Regel in der Form des globalen Schemas stellt, die Daten zur Beantwortung jedoch in externen Quellen gespeichert sind, hängt die Qualität eines Mediationssystems entscheidend von Beschreibungen ab, die die Inhalte einer Quelle mit den 15
Seite 1 und 2: Gliederung Schriftliche Ausarbeitun
Seite 3 und 4: Verwendung gleichlautender Begriffe
Seite 5 und 6: Anfragen ggf. in mehrere Teilanfrag
Seite 7 und 8: 3.3 Konzept Ein Wrapper ist immer g
Seite 9 und 10: Nachteile des Wrappings - Schlechte
Seite 11 und 12: Testen und Verpacken (Testing and P
Seite 13: von Modellen, Schemata und Verfahre
Seite 17 und 18: 4.5 Information Manifold - Beispiel
Seite 19 und 20: Unterhaltung Für die Unterhaltung

Schriftliche Ausarbeitung zum Referat - Universität Konstanz

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?