Dokument 1 - RWTH Aachen University
Dokument 1 - RWTH Aachen University
Dokument 1 - RWTH Aachen University
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
7.5 Semantisch unterstützte Informationssuche im Internet 211<br />
Peer-to-Peer-Netzwerks als ein integriertes Informationssystem mit einem globalen Schema ist<br />
nicht möglich, da dadurch die Unabhängigkeit der einzelnen Knoten nicht erfasst wird [Calvanese<br />
et al., 2003; Stuckenschmidt, 2003].<br />
Ein wesentliches Problem der Anfrageverarbeitung in einem Peer-to-Peer-Netzwerk ist daher<br />
die Übersetzung einer Anfrage des Knotens X in die Terminologie des Knotens Y. Nachdem<br />
die entsprechenden Konzepte im Knoten Y identifiziert wurden, ist der Ablauf der Anfrageverarbeitung<br />
innerhalb des Knotens Y ähnlich zu der Anfrageverarbeitung in klassischen Internet-<br />
Informationssystemen. Die Anfrage muss auf die Datenquellen innerhalb des Knotens abgebildet<br />
werden. In Abhängigkeit des Formalismus zur Darstellung der Abbildungen zwischen Datenquellen<br />
und Peer-Schema des Knotens (GAV- oder LAV-Ansatz) können dafür die bekannten<br />
Lösungen aus dem Bereich der Datenintegration genutzt werden.<br />
Im SEWASIE-Projekt gehen wir davon aus, dass es innerhalb eines MBA eine Referenz-Ontologie<br />
gibt, die das Peer-Schema eines Knotens darstellt, und die zur Beschreibung der Ontologien<br />
der Datenquellen (SINodes) benutzt wird. Diese Form der Darstellung ist vergleichbar mit dem<br />
LAV-Ansatz. Zur Feststellung der relevanten SINodes für eine Anfrage kann man nun einen Teil<br />
des Datenintegrationsverfahren aus Kapitel 6 verwenden. Da der Formalismus zur Darstellung<br />
der Abhängigkeiten zwischen den Ontologien aber auf den ausdrucksstärkeren Beschreibungslogiken<br />
basiert sind einige Anpassungen notwendig, die zur Zeit untersucht werden [Ottmann,<br />
2003].<br />
Zunächst müssen für ein Konzept der Anfrage die relevanten Konzepte bestimmt werden. Der<br />
Begriff der Relevanz wird hier weiter gefasst als in DW-Systemen. Während in DW-Systemen<br />
inkorrekte Ergebnisse nicht toleriert werden können, kann man im Semantic Web nicht davon<br />
ausgehen, dass alle Informationen vollständig und korrekt vorhanden sind. Dies betrifft sowohl<br />
die Daten in den Datenquellen als auch die Metadaten, d.h. die Ontologien und die Abbildungen<br />
zwischen Ontologien können aufgrund der semi-automatischen Konstruktion fehlerhaft sein.<br />
Deshalb gelten hier all die Konzepte als relevant, die nicht disjunkt mit dem betrachteten Konzept<br />
sind. Für jedes der relevanten Konzepte kann dann eine MiniCon-Beschreibung analog zum<br />
Algorithmus makeExtendedMCDs auf Seite 153 konstruiert werden. In [Halevy et al., 2003a]<br />
wird der MiniCon-Algorithmus ebenfalls für Peer-to-Peer-Systeme erweitert, indem auch Abbildungen<br />
nach dem GAV-Prinzip bei der Umschreibung der Anfrage beachtet wird.<br />
Die isolierte Betrachtung eines Konzepts der Anfrage ist aber nicht ausreichend. Wie bei der<br />
Datenintegration in DW-Systemen muss geprüft werden, ob die Kombination der MiniCon-<br />
Beschreibungen eine erfüllbare Anfrage ergibt. Die letzte Phase der Anfrageumschreibung, die<br />
Annotation der einzelnen Lösungen mit den Mediatoroperationen ist nicht notwendig, da die SI-<br />
Nodes im SEWASIE-System eine Anfrage in Form der objekt-orientierten Anfragesprache OQL<br />
[Cattell, 1994] verarbeiten können, die Elemente aus ihrer Ontologie enthält. Die weitere Verarbeitung<br />
der Anfrage innerhalb eines SINode wird hier nicht betrachtet.<br />
7.5.4 Datenqualität im Semantic Web<br />
Wie vorher erwähnt wurde, kann im Kontext des Semantic Web nicht davon ausgehen, dass die<br />
verfügbaren Informationen auf Daten- und Metadatenebene vollständig und korrekt sind. Daher