18.11.2012 Aufrufe

Dokument 1 - RWTH Aachen University

Dokument 1 - RWTH Aachen University

Dokument 1 - RWTH Aachen University

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

7.5 Semantisch unterstützte Informationssuche im Internet 211<br />

Peer-to-Peer-Netzwerks als ein integriertes Informationssystem mit einem globalen Schema ist<br />

nicht möglich, da dadurch die Unabhängigkeit der einzelnen Knoten nicht erfasst wird [Calvanese<br />

et al., 2003; Stuckenschmidt, 2003].<br />

Ein wesentliches Problem der Anfrageverarbeitung in einem Peer-to-Peer-Netzwerk ist daher<br />

die Übersetzung einer Anfrage des Knotens X in die Terminologie des Knotens Y. Nachdem<br />

die entsprechenden Konzepte im Knoten Y identifiziert wurden, ist der Ablauf der Anfrageverarbeitung<br />

innerhalb des Knotens Y ähnlich zu der Anfrageverarbeitung in klassischen Internet-<br />

Informationssystemen. Die Anfrage muss auf die Datenquellen innerhalb des Knotens abgebildet<br />

werden. In Abhängigkeit des Formalismus zur Darstellung der Abbildungen zwischen Datenquellen<br />

und Peer-Schema des Knotens (GAV- oder LAV-Ansatz) können dafür die bekannten<br />

Lösungen aus dem Bereich der Datenintegration genutzt werden.<br />

Im SEWASIE-Projekt gehen wir davon aus, dass es innerhalb eines MBA eine Referenz-Ontologie<br />

gibt, die das Peer-Schema eines Knotens darstellt, und die zur Beschreibung der Ontologien<br />

der Datenquellen (SINodes) benutzt wird. Diese Form der Darstellung ist vergleichbar mit dem<br />

LAV-Ansatz. Zur Feststellung der relevanten SINodes für eine Anfrage kann man nun einen Teil<br />

des Datenintegrationsverfahren aus Kapitel 6 verwenden. Da der Formalismus zur Darstellung<br />

der Abhängigkeiten zwischen den Ontologien aber auf den ausdrucksstärkeren Beschreibungslogiken<br />

basiert sind einige Anpassungen notwendig, die zur Zeit untersucht werden [Ottmann,<br />

2003].<br />

Zunächst müssen für ein Konzept der Anfrage die relevanten Konzepte bestimmt werden. Der<br />

Begriff der Relevanz wird hier weiter gefasst als in DW-Systemen. Während in DW-Systemen<br />

inkorrekte Ergebnisse nicht toleriert werden können, kann man im Semantic Web nicht davon<br />

ausgehen, dass alle Informationen vollständig und korrekt vorhanden sind. Dies betrifft sowohl<br />

die Daten in den Datenquellen als auch die Metadaten, d.h. die Ontologien und die Abbildungen<br />

zwischen Ontologien können aufgrund der semi-automatischen Konstruktion fehlerhaft sein.<br />

Deshalb gelten hier all die Konzepte als relevant, die nicht disjunkt mit dem betrachteten Konzept<br />

sind. Für jedes der relevanten Konzepte kann dann eine MiniCon-Beschreibung analog zum<br />

Algorithmus makeExtendedMCDs auf Seite 153 konstruiert werden. In [Halevy et al., 2003a]<br />

wird der MiniCon-Algorithmus ebenfalls für Peer-to-Peer-Systeme erweitert, indem auch Abbildungen<br />

nach dem GAV-Prinzip bei der Umschreibung der Anfrage beachtet wird.<br />

Die isolierte Betrachtung eines Konzepts der Anfrage ist aber nicht ausreichend. Wie bei der<br />

Datenintegration in DW-Systemen muss geprüft werden, ob die Kombination der MiniCon-<br />

Beschreibungen eine erfüllbare Anfrage ergibt. Die letzte Phase der Anfrageumschreibung, die<br />

Annotation der einzelnen Lösungen mit den Mediatoroperationen ist nicht notwendig, da die SI-<br />

Nodes im SEWASIE-System eine Anfrage in Form der objekt-orientierten Anfragesprache OQL<br />

[Cattell, 1994] verarbeiten können, die Elemente aus ihrer Ontologie enthält. Die weitere Verarbeitung<br />

der Anfrage innerhalb eines SINode wird hier nicht betrachtet.<br />

7.5.4 Datenqualität im Semantic Web<br />

Wie vorher erwähnt wurde, kann im Kontext des Semantic Web nicht davon ausgehen, dass die<br />

verfügbaren Informationen auf Daten- und Metadatenebene vollständig und korrekt sind. Daher

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!