vollständige Magisterarbeit zum Thema - Michael Stollberg
vollständige Magisterarbeit zum Thema - Michael Stollberg
vollständige Magisterarbeit zum Thema - Michael Stollberg
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
<strong>Magisterarbeit</strong><br />
Ontologiebasierte Wissensmodellierung<br />
- Verwendung als semantischer Grundbaustein des Semantic Web -<br />
von<br />
<strong>Michael</strong> <strong>Stollberg</strong><br />
eingereicht am: 29. Oktober 2002<br />
Institut für Publizistik und Kommunikationswissenschaft<br />
Arbeitsbereich Informationswissenschaft<br />
Fachbereich Philosophie und Sozialwissenschaften<br />
Freie Universität Berlin<br />
Betreuer und Erstgutachter: Prof. Dr. R. D. Hennings<br />
Zweitgutachter: Prof. Dr. G. Wersig
Erklärung<br />
Hiermit versichere ich gemäß § 21 (6) der Magisterprüfungsordnung der Freien Universität<br />
Berlin vom 18.01.1991, dass ich die Arbeit in allen Teilen selbstständig verfasst<br />
und keine anderen als die angegebenen Hilfsmittel und Quellen verwendet habe. Stellen<br />
der Arbeit, die anderen Arbeiten im Wortlaut oder dem Sinne nach entnommen wurden,<br />
sind durch Angabe der entsprechenden Quelle kenntlich gemacht.<br />
__________________________<br />
Ort, Datum<br />
___________________________<br />
<strong>Michael</strong> <strong>Stollberg</strong>
Ontologiebasierte Wissensmodellierung<br />
- Verwendung als semantischer Grundbaustein des Semantic Web -<br />
Inhaltsverzeichnis:<br />
Vorwort ....................................................................................................... v<br />
Einleitung ................................................................................................... 1<br />
Zielsetzung der Arbeit .......................................................................................................................1<br />
Inhaltsübersicht ..................................................................................................................................3<br />
A Grundlagen ontologiebasierter Wissensmodellierung............................... 5<br />
A.1 Positionierung in der Künstlichen Intelligenz ........................................................................6<br />
A.1.1 Wissensrepräsentation..........................................................................................................7<br />
A.1.1.1 Theoretische Grundlagen............................................................................................7<br />
A.1.1.2 Repräsentationsschemata und -formalismen............................................................8<br />
A.1.1.3 Modellbasierter Ansatz ..............................................................................................11<br />
A.1.2 Knowledge Engineering ....................................................................................................12<br />
A.1.2.1 Wissensmodelle...........................................................................................................13<br />
A.1.2.1.1 Problem Solving Methods ..................................................................................14<br />
A.1.2.1.2 Ontologien ............................................................................................................14<br />
A.1.2.2 Methodologien............................................................................................................15<br />
A.1.2.2.1 CommonKADS ...................................................................................................15<br />
A.1.2.2.2 PROTÉGÉ...........................................................................................................16<br />
A.2 Charakteristika ontologiebasierter Wissensmodellierung....................................................18<br />
A.2.1 Eigenschaften von und Anforderungen an Ontologien ...............................................18<br />
A.2.1.1 Explizite, geteilte Konzeptionalisierung..................................................................18<br />
A.2.1.2 Formale Spezifikation ................................................................................................19<br />
A.2.2 Motivation zur Verwendung von Ontologien................................................................20<br />
A.2.2.1 Bedeutungsdefinition .................................................................................................20<br />
A.2.2.2 Einsatzmöglichkeiten.................................................................................................21<br />
A.2.3 Ergänzende Anmerkungen................................................................................................22<br />
B Ontologie-Entwicklung ......................................................................... 23<br />
B.1 Ontologie-Entwicklungs-Prozess ...........................................................................................24<br />
B.1.1 Spezifikation ........................................................................................................................26<br />
B.1.1.1 Anforderungsanalyse..................................................................................................27<br />
B.1.1.2 Wissensakquisition......................................................................................................27<br />
B.1.2 Konzeptionalisierung..........................................................................................................28<br />
B.1.2.1 Modellierungsprimitive ..............................................................................................29<br />
B.1.2.2 Zielsetzung der Konzeptionalisierung.....................................................................29<br />
B.1.2.3 Repräsentationsschemata...........................................................................................30<br />
i
B.1.3 Formalisierung.....................................................................................................................32<br />
B.1.3.1 Anforderungen an Ontologie-Spezifikations-Sprachen........................................33<br />
B.1.3.1.1 Spezifikationsfähigkeit.........................................................................................33<br />
B.1.3.1.2 Entwicklungsumgebung......................................................................................34<br />
B.1.3.2 Ontolingua...................................................................................................................35<br />
B.1.4 Evaluation und Dokumentation.......................................................................................36<br />
B.1.4.1 Evaluation....................................................................................................................36<br />
B.1.4.1.1 Kriterien der Qualitätsprüfung...........................................................................37<br />
B.1.4.1.2 Typische Fehler der Ontologie-Entwicklung...................................................37<br />
B.1.4.2 Dokumentation...........................................................................................................37<br />
B.2 Qualitätssichernde Aspekte......................................................................................................38<br />
B.2.1 Designkriterien ....................................................................................................................38<br />
B.2.2 Meta-Modellierung..............................................................................................................40<br />
B.2.2.1 Theoretische Grundlagen ..........................................................................................41<br />
B.2.2.1.1 Basisbegriffe..........................................................................................................42<br />
B.2.2.1.2 Implikationen........................................................................................................43<br />
B.2.2.2 Taxonomie-Validierung .............................................................................................44<br />
B.2.2.2.1 Basis-Taxonomie..................................................................................................44<br />
B.2.2.2.2 Vorgehensmodell .................................................................................................44<br />
B.3 Abschließende Bemerkungen..................................................................................................45<br />
C Verwendung von Ontologien in Informationssystemen.......................... 47<br />
C.1 Typologie des Ontologie-Einsatzes........................................................................................47<br />
C.1.1 Klassifikationsdimensionen...............................................................................................48<br />
C.1.1.1 Verwendungszweck....................................................................................................48<br />
C.1.1.2 Rolle der Ontologie....................................................................................................49<br />
C.1.1.3 Akteure.........................................................................................................................50<br />
C.1.2 Verwendungsszenarien.......................................................................................................51<br />
C.2 Anwendungsgebiete von Ontologien.....................................................................................52<br />
C.2.1 Multi-Agenten-Systeme......................................................................................................53<br />
C.2.1.1 Kommunikation in Multi-Agenten-Systemen ........................................................54<br />
C.2.1.2 Geteilte Ontologie als Inhaltsspezifikation.............................................................55<br />
C.2.2 Informationsintegration.....................................................................................................56<br />
C.2.2.1 Integration mit einer globalen Ontologie................................................................57<br />
C.2.2.2 Integration mit mehreren lokalen Ontologien .......................................................58<br />
C.2.3 Information Retrieval.........................................................................................................59<br />
C.2.3.1 Ontologiebasiertes Information Retrieval...............................................................59<br />
C.2.3.1.1 Ontologie als Thesaurus......................................................................................60<br />
C.2.3.1.2 ONTOSEEK........................................................................................................60<br />
C.3 Implikationen für Ontologiebasierte Informationssysteme................................................61<br />
C.3.1 Wiederverwendbarkeit .......................................................................................................62<br />
C.3.1.1 Verwendbarkeit und Wiederverwendbarkeit..........................................................62<br />
C.3.1.2 Wiederverwendung von Ontologien........................................................................63<br />
C.3.2 Integration von Ontologien ..............................................................................................64<br />
C.3.2.1 Klassifikation ontologischer Heterogenitäten ........................................................64<br />
C.3.2.2 Halbautomatisierte Ontologie-Integration..............................................................65<br />
ii
D Ontologien im Semantic Web ................................................................ 66<br />
D.1 Aufbau und Funktionsweise des Semantic Web..................................................................67<br />
D.1.1 Hintergrund der ´Vision des Semantic Web´.................................................................67<br />
D.1.1.1 Das Internet als universale Informationsplattform...............................................68<br />
D.1.1.2 Design-Prinzipien.......................................................................................................68<br />
D.1.1.3 Funktionale Zielsetzung des Semantic Web ..........................................................69<br />
D.1.2 Architekturmodell ..............................................................................................................70<br />
D.1.2.1 Semantic Web – Technologien ................................................................................70<br />
D.1.2.2 Rolle von Ontologien im Semantic Web................................................................72<br />
D.1.2.2.1 Anforderungen an Ontologien..........................................................................73<br />
D.1.2.2.2 Herausforderungen an das Ontologie-Management......................................74<br />
D.2 Ontologie-Spezifikation für das Semantic Web...................................................................74<br />
D.2.1 Resource Description Framework (RDF) ......................................................................75<br />
D.2.1.1 RDF Modell................................................................................................................75<br />
D.2.1.2 XML - Serialisierung..................................................................................................76<br />
D.2.1.3 RDF Schema (RDFS)................................................................................................76<br />
D.2.2 Ontologie-Spezifikations-Sprachen .................................................................................77<br />
D.2.2.1 Web Ontology Language (OWL) ............................................................................78<br />
D.2.2.2 Ausdrucksfähigkeit.....................................................................................................79<br />
D.3 Ontologie-Management...........................................................................................................80<br />
D.3.1 Teilbarkeit von Ontologien...............................................................................................80<br />
D.3.2 Entwicklungsfähigkeit von Ontologien ..........................................................................82<br />
D.3.2.1 Unterstützung der Ontologie-Entwicklung............................................................82<br />
D.3.2.2 Wartung von Ontologien..........................................................................................84<br />
D.3.3 Ontologie-Integration........................................................................................................85<br />
D.4 Implikationen für Semantic Web Services............................................................................87<br />
Diskussion ................................................................................................ 89<br />
Zusammenfassung der Ergebnisse ................................................................................................89<br />
Notwendigkeit und Umsetzbarkeit des Semantic Web ..............................................................90<br />
Literaturverzeichnis ...................................................................................91<br />
iii
Abbildungsverzeichnis<br />
Abbildung 1: Beispiel eines semantischen Netzes........................................................................9<br />
Abbildung 2: Beispiel Frame-Struktur............................................................................................10<br />
Abbildung 3: CommonKADS – Modell Kollektion...................................................................15<br />
Abbildung 4: CommonKADS – Modellierung Domänenwissen.............................................16<br />
Abbildung 5: PROTÉGÉ – Erstellung einer Applikationsontologie........................................17<br />
Abbildung 6: Beispiel IDEF5-Modellierung .................................................................................32<br />
Abbildung 7: Konzeptdefinition in Ontolingua ...........................................................................35<br />
Abbildung 8: Taxonomie-Evaluation mit OntoClean .................................................................45<br />
Abbildung 9: Klassifikation der Verwendung von Ontologien in Informationssystemen.....51<br />
Abbildung 10: Bespiel einer KQML-Nachricht............................................................................55<br />
Abbildung 11: Ansätze ontologiebasierter Informationsintegration .........................................57<br />
Abbildung 12: Semantic Web Architektur.....................................................................................70<br />
Abbildung 13: RDF-Aussage in Graphdarstellung ......................................................................75<br />
Abbildung 14: RDF-Aussage in XML-Serialisierung...................................................................76<br />
Abbildung 15: Ontologie-Beispiel in DAML-OIL.......................................................................78<br />
Abbildung 16: Phasen des Ontology Learning .............................................................................83<br />
Tabellenverzeichnis<br />
Tabelle 1: Level der Wissensrepräsentation...................................................................................19<br />
Tabelle 2: Phasen des Ontologie-Entwicklungs-Prozesses.........................................................26<br />
Tabelle 3: Techniken des Wissenserwerbs.....................................................................................27<br />
Tabelle 4: Modellierungsprimitive ontologiebasierter Wissensmodellierung ...........................29<br />
Tabelle 5: Werkzeuge einer Ontologie-Entwicklungsumgebung...............................................34<br />
Tabelle 6: Typische Fehler bei der Ontologie-Entwicklung .......................................................37<br />
Tabelle 7: Design-Kriterien für Ontologien..................................................................................39<br />
Tabelle 8: Basisbegriffe der OntoClean Methodologie................................................................42<br />
Tabelle 9: Beschränkungen für Subsumptions-Relationen in Taxonomien .............................43<br />
Tabelle 10: Ontologie-Arten............................................................................................................50<br />
Tabelle 11: Prozess der Wiederverwendung von Ontologien ....................................................63<br />
Tabelle 12: Design-Prinzipien des Semantic Web........................................................................69<br />
Tabelle 13: Grundtypen von RDF Schema (RDFS)....................................................................77<br />
Tabelle 14: Spezifikationsprimitive von OWL..............................................................................79<br />
Tabelle 15: Anforderungen an Ontologie-Bibliotheks-Systeme.................................................81<br />
iv
Vorwort<br />
Vor Beginn der Ausführungen sollen einige Bemerkungen über die in dieser Arbeit<br />
verwandten darstellerischen Mittel gemacht werden.<br />
Für die Quellenangaben und die Zitation wird jeweils der Name des Autors sowie das<br />
Erscheinungsjahr angegeben. Ein „+“ in der Angabe bedeutet, dass mehrere Autoren die<br />
Quelle verfasst haben. Falls mehrere Quellen desselben Autors so eine gleiche Signatur<br />
erhalten, werden diese durch einen alphabetisch Anhang gemäß der Erwähnung im Text<br />
unterschieden. Bei Websites werden die Internetadressen sowie das Datum des Aufrufes<br />
der Seite angegeben. Bei Quellenangaben aus Büchern oder Artikeln wird jeweils die Seite<br />
angegeben, während für Websites lediglich der betreffende Abschnitt des Dokuments<br />
angegeben werden kann. Durch diese Konvention sollen die wesentlichen Informationen<br />
bezüglich der verwandten Quellen aus dem Text der Ausarbeitung hervorgehen. Die<br />
Methodik der Quellenangabe im Literaturverzeichnis ist (Rückriem+97) entnommen. Die<br />
Quellenangaben im Literaturverzeichnis sind auf Grund des Umfangs nach den Kapiteln<br />
der Arbeit geordnet. Dabei sind für die einzelnen Kapitel nur diejenigen Quellen angegeben,<br />
die jeweils für ein Kapitel hinzugekommen sind. Weiterführende, nicht explizit in<br />
der Arbeit verwendete Quellenhinweise werden in Fußnoten angeführt.<br />
Der Großteil der verwendeten Literatur ist in englischer Sprache verfasst. Für die<br />
Darstellung in deutscher Sprache wurden hier folgende Konventionen verwendet.<br />
• Eigennamen und Termini Technici werden im englischen Original belassen.<br />
• Weitere Begrifflichkeiten werden in deutsch angegeben. Sind diese nicht deutschsprachiger<br />
Fachliteratur entnommen, so wird in einer Fußnote das englische Original<br />
angegeben.<br />
• Direkte Zitate aus dem Englischen werden ins Deutsche übersetzt mit Angabe des<br />
Originals in einer Fußnote.<br />
Während des Bearbeitungszeitraums dieser <strong>Magisterarbeit</strong> sind reichhaltige Forschungsaktivitäten<br />
vor allem auf dem Gebiet des Semantic Web zu erwarten, woraus entscheidende<br />
neue Erkenntnisse hervorgehen können. Auf Grund der zeitlichen Befristung der<br />
Bearbeitung musste ein Aufnahmestopp für neu erscheinendes Material festgelegt werden,<br />
welcher auf Ende Juli 2002 datiert wurde. Diese Festlegung wird im Verlauf der Ausarbeitungen<br />
genauer begründet. Auf später erscheinendes Material kann lediglich an entsprechender<br />
Stelle hingewiesen werden .<br />
Als Anlage ist der Arbeit eine CD-ROM mit den verwendeten Materialien angefügt –<br />
soweit diese in elektronischer Form vorliegen. Nach Absprache mit dem Betreuer soll<br />
diese Zusammenstellung als Referenz für weitere Arbeiten auf diesem Gebiet genutzt<br />
werden können.<br />
v
Einleitung 1<br />
Einleitung<br />
Die Geschwister Lucy und Pete organisieren mit Hilfe ihrer „Semantic Web Agents“<br />
(Berners-Lee+01, S. 25) einen Arzttermin für ihre Mutter. Die Agenten buchen automatisch<br />
den Termin, berücksichtigen angegebene Einschränkungen und Präferenzen und<br />
interagieren dabei in effektiver Art und Weise. Mit diesem Szenario, welches zu Beginn<br />
des häufig als „vision of the semantic web“ (vgl. Fensel01, S. 295) referenzierten Artikels<br />
beschrieben wird, soll das angestrebte Anwendungsziel eines semantischen Internets<br />
verdeutlicht werden. Im weiteren Verlauf des Artikels erläutern die Autoren um Tim<br />
Berners-Lee, Erfinder des World Wide Web 1 und Direktor des W3C 2 , ihre Vorstellungen<br />
zur Realisierung dieser Vision, welche hier kurz wiedergegeben werden soll.<br />
Die derzeit existenten Web-Technologien erlauben lediglich die Verarbeitung von<br />
Daten. Deren Interpretation, also die inhaltliche Erfassung von Web-Dokumenten kann<br />
nur durch den Menschen erfolgen. Mit dem Semantic Web sollen die bestehenden Web-<br />
Technologien um bedeutungsverarbeitende Fähigkeiten erweitert werden, wodurch eine<br />
maschinelle Inhaltsverarbeitung von Web-Dokumenten ermöglicht und somit eine qualitative<br />
Verbesserung des Internet als weltweit verbreitetem Informationssystem erreicht<br />
werden soll. Dafür müssen wissensverarbeitende Techniken für das Internet entwickelt<br />
werden, welche vornehmlich drei funktionale Aspekte abdecken sollen. Erstens eine<br />
maschinenverarbeitbare Darstellung der Informationen eines Web-Dokuments, zweitens<br />
die Sicherstellung der korrekten Verwendung von Begriffen hinsichtlich ihrer Bedeutung<br />
und drittens entsprechende Verarbeitungsmechanismen. Da die Künstlichen Intelligenz<br />
sich mit solchen Verfahren beschäftigt, sollen deren Erkenntnisse für die Entwicklung<br />
derartiger Techniken für das Semantic Web herangezogen werden. Für die maschinenverarbeitbare<br />
Darstellung bedeutungstragender Informationen sollen Ansätze aus dem<br />
Gebiet der Wissensrepräsentation referenziert werden. Für die Sicherstellung der<br />
terminologischen Korrektheit sollen sogenannte Ontologien verwendet werden, welche<br />
Bedeutungsdefinitionen von Entitäten sowie deren Beziehungen untereinander beinhalten.<br />
Die Verarbeitung dieser Informationen soll durch Softwareagenten durchgeführt<br />
werden, welche unter Nutzung der bedeutungsverarbeitenden Fähigkeiten verschiedenartige<br />
Funktionalitäten, beispielsweise Dienste wie im oben genannten Anwendungsszenario<br />
ausführen können (s. Berners-Lee+01, S. 26-30).<br />
Zielsetzung der Arbeit<br />
Wie aus der einführenden Darstellung der Vision des Semantic Web hervorgeht, sollen<br />
darin Ontologien als bedeutungsdefinierende Komponenten eingesetzt werden und somit<br />
den semantischen Grundbaustein des Semantic Web darstellen. In dieser Arbeit sollen die<br />
Beweggründe der Favorisierung ontologiebasierter Verfahren der Wissensmodellierung<br />
für diesen Verwendungszweck untersucht werden.<br />
1 World Wide Web (WWW): Zusammenführung und Weiterentwicklung existenter Ansätze aus der Hypertext- und<br />
der Übertragungstechnologie. Technische Grundlage des als Internet bekannt gewordenen Mediums (vgl. Berners-<br />
Lee00).<br />
2 World Wide Web Consortium: Non-Profit-Organisation mit der Zielsetzung, die Entwicklung des WWW durch<br />
Spezifikation von Technologien zu unterstützen (s. Berners-Lee00, S. 97-110, www.w3c.org).
Einleitung 2<br />
Auf Grund der rasanten Verbreitung des Internets beschäftigen sich derzeit viele<br />
Forschergruppen mit der Entwicklung von Technologien für das Semantic Web, da<br />
dadurch ein weiterer Wachstumsschub des Internet hinsichtlich seiner Verbreitung<br />
prognostiziert wird (s. Ohlms02, S. 8). Die Arbeiten in der „Semantic Web Community“ 3<br />
befassen sich größtenteils mit der softwaretechnischen Umsetzung, wobei vor allem<br />
Spezifikationssprachen für Ontologien, Techniken für das Ontologie-Management sowie<br />
Frameworks für Semantic Web Services entwickelt werden. 4 Bemerkenswert ist, dass in<br />
diesen Ansätzen Ontologien zwar eine zentrale Rolle in systemarchitektonischer oder<br />
funktionaler Hinsicht einnehmen, aber selten auf deren Spezifika eingegangen wird.<br />
Die Forschungsdisziplin des sogenannten Ontology Engineering befasst sich seit Mitte<br />
der 90er Jahre mit Ontologien als konzeptioneller Basis ´wissensverarbeitender´ Computersysteme.<br />
Dieses Themenfeld ist sehr komplex, da eine Ontologie <strong>zum</strong> einen die<br />
strukturierte Erfassung einer Wissensdomäne darstellen soll, die durch alle Beteiligten<br />
derselben akzeptiert wird. Zum anderen ist die definitorische Klarheit der Wissenselemente<br />
und ihrer Beziehungen untereinander in der Ontologie sehr wichtig, da die<br />
Verwendung der Ontologie in einem Informationssystem dessen funktionale Qualität<br />
determiniert. Die Zielsetzung des Ontology Engineering ist die Entwicklung ingenieursartiger<br />
Methodologien zur Erstellung von Ontologien – ähnlich der des Software<br />
Engineering für die Entwicklung von Software-Systemen (vgl. Gómez-Pérez99).<br />
Das Ziel dieser Arbeit besteht in der Erfassung der wesentlichen Charakteristika von<br />
Ontologien für eine differenzierte Betrachtung der Verwendung derselben im Semantic<br />
Web. Zunächst sollen die relevanten Erkenntnisse des Ontology Engineering erörtert<br />
werden, wobei erstens die Spezifika von Ontologien als Technik zur Wissensmodellierung,<br />
zweitens Verfahren zur Entwicklung von Ontologien und drittens deren<br />
Verwendung in Informationssystemen besprochen werden. Auf dieser Grundlage kann<br />
hinsichtlich der Verwendung von Ontologien im Semantic Web herausgearbeitet werden,<br />
welche Rolle sie darin übernehmen sollen und in wieweit die entsprechenden Verfahren<br />
des Ontology Engineering für eine derartige Verwendung ausgereift sind.<br />
Der Fokus liegt dabei auf der sorgfältigen Erarbeitung eines Verständnisses ontologiebasierter<br />
Wissensmodellierung, da die Untersuchung der Verwendung von Ontologien im<br />
Semantic Web lediglich auf der Grundlage eines solchen gründlichen Verständnisses<br />
möglich erscheint. Dabei liegen die Erkenntnisse über diese Modellierungstechnik bisher<br />
lediglich in relativ unstrukturierter Form vor, so dass mit deren Zusammentragung in<br />
dieser Arbeit ein Beitrag <strong>zum</strong> Verständnis ontologiebasierter Wissensmodellierung geleistet<br />
werden soll. Auf Grund dieser Herangehensweise konzentriert sich die Untersuchung<br />
auf theoretische Aspekte und verfolgt kein konkretes Anwendungsbeispiel. Eine<br />
detaillierte Beschreibung des Aufbaus der Arbeit wird in der folgenden Inhaltsübersicht<br />
gegeben.<br />
3 Das „Semantic Web Community Portal“ ist eine erschöpfende Referenz dieser Gemeinde, auf dem Forschungsprojekte<br />
zusammengetragen werden. Das Portal findet sich unter: www.SemanticWeb.org (08.06.2002).<br />
4 Arbeiten zu diesen Schwerpunkten wurden auf dem ersten „Semantic Web Working Symposium“ vorgestellt (vgl.<br />
Cruz+01).
Einleitung 3<br />
Inhaltsübersicht<br />
Die vorgestellte Zielsetzung bedingt eine Aufteilung dieser Arbeit in einen Teil zur<br />
theoretischen Erfassung von Wissensmodellierung mittels Ontologien und einen Teil zur<br />
Untersuchung der Verwendung derselben im Semantic Web. In den Kapiteln A bis C<br />
wird jeweils ein Schwerpunkt zur Erfassung der Charakteristika ontologiebasierter Wissensmodellierung<br />
erarbeitet, so dass diese Kapitel den ersten Teil darstellen. In Kapitel D<br />
wird aufbauend darauf die Verwendung im Semantic Web als zweiter Teil bearbeitet. Im<br />
Folgenden werden die Schwerpunkte sowie die behandelten Aspekte der einzelnen<br />
Kapitel kurz vorgestellt.<br />
In Kapitel A werden die Grundlagen von Ontologien als Verfahren der Wissensmodellierung<br />
erarbeitet. Dazu wird zunächst die definitorische Erfassung von Ontologien<br />
erläutert. Zur Erlangung eines fundierten Verständnisses von Wissensmodellierung und<br />
der Besonderheiten ontologiebasierter Verfahren ist die Eingliederung dieser in den<br />
relevanten wissenschaftlichen Kontext erforderlich. Die in diesem Zusammenhang betrachtete<br />
Art der Wissensmodellierung dient vornehmlich als konzeptionelle Grundlage<br />
für die Erstellung wissensverarbeitender Computersysteme. Die Entwicklung derartiger<br />
Systeme ist das Hauptanliegen der Künstlichen Intelligenz, weshalb eine Positionierung<br />
ontologiebasierter Verfahren in derselben vorgenommen wird. Dabei sind vor allem jene<br />
Ansätze interessant, auf denen ontologiebasierte Verfahren aufbauen. Zunächst werden<br />
daher die grundlegenden theoretischen Aspekte der Wissensrepräsentation erläutert und<br />
anschließend daran die Bedeutung von Ontologien im Knowledge Engineering aufgezeigt,<br />
um den Verwendungskontext derartiger Verfahren der Wissensmodellierung zu verdeutlichen.<br />
Aufbauend darauf werden die spezifischen Eigenschaften ontologiebasierter Verfahren<br />
der Wissensmodellierung erörtert, wodurch ein grundlegendes Verständnis dieser<br />
Methodik erreicht werden soll.<br />
Der in Kapitel B behandelte Schwerpunkt ist die Ontologie-Entwicklung. Nach der<br />
Erfassung der grundlegenden Charakteristika ontologiebasierter Wissensmodellierung<br />
stehen hier die Anforderungen bei der Erstellung einer Ontologie im Vordergrund. Dazu<br />
werden die wesentlichen diesbezüglichen Errungenschaften des sogenannten Ontology<br />
Engineering erörtert. Es werden zunächst methodologische Ansätze für den Entwicklungsprozess<br />
von Ontologien sowie für die einzelnen Aufgabengebiete entwickelter Techniken<br />
und Verfahren vorgestellt. Anschließend daran werden Design-Kriterien und ein<br />
Ansatz zur Meta-Modellierung besprochen, welche der Qualitätssicherung einer Ontologie<br />
dienen sollen. Diese Betrachtungen sollen eine Übersicht über den Erkenntnisstand<br />
des Ontology Engineering geben, womit ein wesentlicher Aspekt zur Nutzung ontologiebasierter<br />
Verfahren der Wissensmodellierung im Semantic Web abgedeckt wird.<br />
Als letzter Aspekt zur Erfassung der Charakteristika ontologiebasierter Wissensmodellierung<br />
wird in Kapitel C die Fragestellung bearbeitet, wie Ontologien in Informationssystemen<br />
eingesetzt werden können. Dazu werden zunächst die Verwendungsmöglichkeiten<br />
von Ontologien identifiziert. Dann werden Anwendungsgebiete von<br />
Ontologien vorgestellt, welche <strong>zum</strong> einen Beispiele für die aufgefundenen Einsatzmöglichkeiten<br />
darstellen und <strong>zum</strong> anderen im Hinblick auf die Untersuchung der Verwen-
Einleitung 4<br />
dung von Ontologien im Semantic Web grundlegende Aspekte desselben erörtern sollen.<br />
Im Anschluss daran werden die wesentlichen softwaretechnischen Herausforderungen<br />
besprochen, die sich durch die Verwendung von Ontologien in Informationssystemen<br />
ergeben. Damit wird die Erarbeitung der wesentlichen Charakteristika ontologiebasierter<br />
Verfahren der Wissensmodellierung als erstem Teil dieser Arbeit abgeschlossen.<br />
Basierend auf diesen Abhandlungen wird in Kapitel D die Verwendung von Ontologien<br />
im Semantic Web behandelt. Dabei ist das Semantic Web nicht als computergestützte<br />
Lösung für ein konkretes Anwendungsgebiet zu verstehen, sondern – ähnlich<br />
wie existente Web-Technologien – als eine informationstechnische Infrastruktur zur<br />
Bereitstellung und Verknüpfung von Applikationen für verschiedene Anwendungsgebiete.<br />
Die technologischen Lösungen zur Umsetzung des Semantic Web befinden sich<br />
noch in der Entwicklungsphase. Daher werden zunächst die grundlegenden Ideen der<br />
Vision des Semantic Web genauer erläutert und das antizipierte Architekturmodell zur<br />
Realisierung derselben vorgestellt, wobei insbesondere die darin angestrebte Rolle von<br />
Ontologien herausgearbeitet wird. Anschließend daran wird die formale Darstellung von<br />
Ontologien durch web-kompatible Sprachen erörtert, wodurch die Verwendung von<br />
Ontologien im Semantic Web ermöglicht werden soll. In diesem Zusammenhang sollen<br />
ferner die Beweggründe für die Verwendung von Ontologien als bedeutungsdefinierende<br />
Konstrukte im Semantic Web verdeutlicht sowie die auftretenden Herausforderungen<br />
hinsichtlich der Handhabung von Ontologien aufgezeigt werden. Dazu werden als dritter<br />
Aspekt des Kapitels entsprechende Lösungsansätze des Ontologie-Managements diskutiert.<br />
Abschließend wird auf die Implikationen für konkrete Anwendungen der Semantic<br />
Web – Technologien eingegangen, die aus der Verwendung von Ontologien im Semantic<br />
Web resultieren.<br />
Zum Abschluss der Ausführungen werden die Ergebnisse der Untersuchung<br />
zusammengefasst. Dabei soll auch eine kritische Betrachtung bezüglich der Notwendigkeit<br />
semantischer Web-Technologien sowie der Realisierbarkeit der Vision des Semantic<br />
Web vorgenommen werden.
Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 5<br />
A Grundlagen ontologiebasierter Wissensmodellierung<br />
Die als Ontologie bezeichnete philosophische Disziplin, die ´Lehre des Seins´, beschäftigt<br />
sich unter der Annahme, dass „ ... ein Allgemeines das bestimmende und gestaltgebende<br />
Innere der Dinge sei.“ (Störig63, S. 512ff) mit der objektiven Erfassung von Gegenständen,<br />
deren Eigenschaften und deren Beziehungen untereinander. Dieser Begriff 5<br />
wurde als Bezeichnung für ein Verfahren der Wissensmodellierung übernommen, in dem<br />
ebenfalls die Erfassung von Entitäten und deren Beziehungen untereinander in einem<br />
bestimmten Weltausschnitt verfolgt wird. Im Folgenden sollen die grundlegenden Charakteristika<br />
ontologiebasierter Verfahren der Wissensmodellierung herausgearbeitet werden.<br />
In den relevanten informatorischen Forschungsfeldern existiert eine Vielzahl unterschiedlicher<br />
definitorischer Erfassungen einer Ontologie als Mittel der Wissensmodellierung,<br />
wobei die Definition als „formale, explizite Spezifikation einer geteilten<br />
Konzeptualisierung 6 “ die am weitesten verbreitete und akzeptierte ist. Dabei wird unter<br />
´Konzeptualisierung´ die Identifikation von Entitäten – in diesem Zusammenhang als<br />
Konzepte bezeichnet – und deren Beziehungen untereinander in einer Wissensdomäne<br />
verstanden. Die Anforderung der ´geteilten´ Konzeptualisierung bedeutet, dass diese<br />
durch die beteiligten Akteure der entsprechenden Wissensdomäne gleichermaßen<br />
akzeptiert wird. Eine ´Spezifikation´ ist eine strukturierte, mittels einer spezifischen<br />
Methodik notierte Darstellung einer solchen geteilten Konzeptualisierung. ´Explizit´<br />
bezieht sich in diesem Zusammenhang auf ein eindeutige Bedeutungsdefinition der<br />
Bestandteile einer Ontologie, wodurch inhaltliche Missverständnisse und Mehrfachinterpretationen<br />
minimiert werden sollen. Die ´formale´ Darstellungsforderung besagt in<br />
einem sehr weit gefassten Sinn, dass eine Ontologie in einer maschinenverarbeitbaren<br />
Sprache definiert sein soll (s. Puppe+00, S. 622).<br />
Diese Definition ist <strong>zum</strong> einen ziemlich allgemein gehalten und <strong>zum</strong> anderen nicht<br />
nachvollziehbar, solange der entsprechende Kontext nicht bekannt ist. Diesen stellen<br />
Ansätze der Wissensmodellierung dar, die vornehmlich der Konstruktion computergestützter<br />
Informationssysteme zur Bearbeitung wissensintensiver Aufgaben, sogenannter<br />
„Wissenssysteme 7 “, dienen. Die Entwicklung derartiger Systeme ist ein Hauptanliegen der<br />
Künstlichen Intelligenz (KI), weswegen deren Grundlagen hier zur Schaffung des benötigten<br />
Hintergrundverständnisses ontologiebasierter Wissensmodellierung herangezogen<br />
werden sollen. Dazu wird im Folgenden zunächst eine Positionierung ontologiebasierter<br />
Verfahren der Wissensmodellierung innerhalb der KI vorgenommen und auf dieser Basis<br />
anschließend die wesentlichen Charakteristika von Ontologien zusammengetragen. In den<br />
weiteren Ausführungen werden die Bezüge zu anderen Wissenschaftsdisziplinen vor allem<br />
aus dem Bereich des Software Engineering und der Informationswissenschaft aufgezeigt.<br />
5 In der englischsprachigen Fachliteratur wird die Unterscheidung des Begriff mittels einer orthographischen<br />
Konvention erhalten: „Ontology“ mit großen Anfangsbuchstaben referenziert den philosophische Begriff, „ontology“<br />
klein geschrieben bezieht sich auf den informatorischen (vgl. Guarino98, S. 2).<br />
6 „An ontology is a formal, explicit specification of a shared conceptualisation.” (Fensel00, S.8: erweitert nach<br />
Gruber93, S.2).<br />
7 engl.: „Knowledge Systems“ (Schreiber+00, S. 6).
Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 6<br />
A.1 Positionierung in der Künstlichen Intelligenz<br />
Abgesehen von den unterschiedlichen Auffassungen bezüglich der Zielsetzung und des<br />
Erfolgspotenzials der KI innerhalb ihrer verschiedenen Forschungsströmungen stellt das<br />
Verstehen menschlicher Intelligenz mittels der Konstruktion intelligenter Maschinen das<br />
grundlegende Erkenntnisinteresse der KI-Forschung dar (s. Görz+00b, S. 4; McCarthy<br />
00). Derartige Systeme „ ... verhalten sich (...) für den Betrachter so, als ob sie Intelligenz<br />
besäßen.“ (Duden93, S. 364), indem sie intelligentes Verhalten zu simulieren versuchen.<br />
Obwohl ein derartiges Forschungsinteresse in der westlichen Geistes- und<br />
Wissenschaftstradition seit der Antike existiert (s. Luger01, S. 25-29), wird der Beginn der<br />
modernen KI-Forschung an den Anfang der 1950er Jahre datiert. Ein wesentliches<br />
Kriterium dabei ist, dass die Forschungsarbeiten sich zu diesem Zeitpunkt auf die Entwicklung<br />
intelligenter Computersysteme zu konzentrieren beginnen (s. McCarthy+69, S.<br />
2ff.).<br />
Ein wichtiges Ereignis in der Entwicklung der modernen KI ist eine Konferenz am<br />
Dartmouth College im Jahre 1956. Ziel dieser Konferenz war die Untersuchung der<br />
Struktur von Information und Problemlöseprozessen unter der Prämisse, jede Eigenschaft<br />
von Intelligenz sei derart beschreibbar, dass sie mit einer Maschine simuliert<br />
werden könne. Zur Umsetzung einer solchen Beschreibung sollten entsprechende Techniken<br />
zur Erzeugung und Manipulation von Symbolstrukturen entwickelt werden. Zur<br />
Verarbeitung dieser abstrahierten Darstellungen sollten computergestützte Systeme<br />
dienen, da sie den großen Bedarf an Rechenleistung und ausreichende Flexibilität für die<br />
durchzuführenden Experimente boten. (vgl. McCarthy+55). Diese Zielsetzung determiniert<br />
die Forschung bis heute, weshalb diese Konferenz als „ ... Gründungsereignis der<br />
Künstlichen Intelligenz gewertet ... “ (Görz+00b, S. 3) wird.<br />
Wesentlich ist der spezifische Intelligenzbegriff, mit dem die KI operiert. Es wird<br />
davon ausgegangen, dass Räsonieren eine konstitutive Fähigkeit höherer Intelligenz ist.<br />
Diese tritt vor allem im Zusammenhang des Problemlösens auf, wobei der Rückgriff auf<br />
Wissen über die Welt eine entscheidende Rolle spielt – z.B. bei der Wahl der besten<br />
Handlungsalternative als Folge eines Denkprozesses (s. Görz+00b, S. 1-2). Um derartige<br />
Fähigkeiten in einem formalen System (s. Hofstadter01, S. 37-45) darstellen zu können,<br />
müssen sie operationalisierbar sein. Somit sei die Art der durch KI-Methoden erfassbaren<br />
Intelligenz auf schematische, nicht-personelle Fähigkeiten des intelligenten Operierens<br />
beschränkt (vgl. Görz+00b, S. 1-2). 8 Eine Erweiterung des Intelligenzbegriffs in der KI<br />
wurde durch die Betrachtung sozialer Systeme erreicht. Dabei wird Intelligenz erst durch<br />
die Interaktion einer Vielzahl von relativ einfachen Individuen, bzw. Agenten erzeugt.<br />
Diese Sichtweise bedeutet für die KI, dass nicht allein die logische Problemlösefähigkeit<br />
das Ziel von KI-Technologien darstellt, sondern die Konstruktion von Systemen mit<br />
interagierenden Agenten (s. Luger, S. 37).<br />
8 Bezüglich der Operationalisierbarkeit von Intelligenz und somit der möglichen Simulation durch KI-Techniken<br />
herrschen widersprüchliche Auffassungen. Die Vertreter der „starken KI-These“ behaupten, dass menschliche<br />
Intelligenz reine Berechungsoperationen seien und somit jeder Aspekt von Intelligenz operationalisierbar ist, während<br />
in der „schwachen KI-These“ die operationalisierbare Informationsverarbeitung als lediglich ein Aspekt von vielen<br />
der Intelligenz betrachtet wird (s. Görz+00b, S. 2; Luger01, S. 32-35).
Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 7<br />
Görz und Wachsmuth unterteilen die Entwicklung der Künstlichen Intelligenz in vier<br />
Phasen: In der ersten Phase stand die Frage nach der generellen technischen Umsetzbarkeit<br />
der Simulation intelligenten Verhaltens im Vordergrund, wie in der Darstellung<br />
der Dartmouth-Konferenz beschrieben (s.o.). Die zweite Phase ist durch die Einrichtung<br />
von KI-Forschungsgruppen charakterisiert, in denen die auftretenden Fragestellungen<br />
systematisch erarbeitet werden sollten. Als dritte Phase wird die Entwicklung von<br />
Roboter- und Problemlösesystemen in den 1970er Jahren aufgefasst, in der vor allem in<br />
den Bereichen der Wissensrepräsentation und Systemarchitektur intelligenter Systeme<br />
Fortschritte erzielt wurden. Die vierte Phase wird durch die umfassende Mathematisierung<br />
des Gebiets und die Entwicklung neuartiger Ansätze hin zu verteilten und<br />
situierten KI-Lösungen charakterisiert. Seit Anfang der 1990er Jahre wird eine Tendenz<br />
hin zu integrierten Ansätzen – vor allem im Zusammenhang mit Internettechnologien –,<br />
sowie ein Paradigmenwechsel hin zu dezentralisierten Systemen mit einfachen interagierenden<br />
Agenten beobachtet (s. Görz+00b, S. 4-5,12).<br />
Aus den Forschungsaktivitäten der Künstlichen Intelligenz haben sich eine Vielzahl<br />
unterschiedlicher Disziplinen entwickelt. Im Folgenden sollen die für den hier betrachteten<br />
Untersuchungsgegenstand relevanten Gebiete der Wissensrepräsentation und des<br />
Knowledge Engineering vorgestellt werden. Ersteres bildet den theoretischen Hintergrund<br />
ontologiebasierter Verfahren der Wissensmodellierung und letzteres stellt den Forschungskontext<br />
dar, aus dem Ontologien als Mittel der Wissensmodellierung hervorgegangen<br />
sind.<br />
A.1.1 Wissensrepräsentation<br />
Die Wissensrepräsentation befasst sich mit der Erstellung von Repräsentationsschemata<br />
für Wissensstrukturen, deren formalisierter Darstellung sowie mit Manipulationswerkzeugen<br />
zur automatisierten Bearbeitung derselben. Die dabei erworbenen Erkenntnisse<br />
dienen als Grundlagentechnologie für intelligente Systeme, weshalb dieses Forschungsfeld<br />
eine Kerndisziplin der Künstlichen Intelligenz darstellt. Darin wurden unter anderem Verfahren<br />
der Wissensmodellierung entwickelt, welche die Basis ontologiebasierter Wissensmodellierung<br />
darstellen. Daher sollen hier die theoretischen Grundlagen sowie die<br />
wesentlichen Lösungsansätze als Ausgangspunkt für die Erarbeitung eines grundlegenden<br />
Verständnisses ontologiebasierter Wissensmodellierung erläutert werden.<br />
A.1.1.1 Theoretische Grundlagen<br />
Die Verfahren der Wissensrepräsentation basieren auf der sogenannten Symbolsystemhypothese,<br />
welche im Zuge der oben genannten Dartmouth-Konferenz formuliert und in<br />
der Folgezeit weiter ausgearbeitet wurde. 9 Diese besagt, dass „ ... Intelligenzphänomene<br />
allein auf der Basis von Symbolverarbeitung ...“ (s. Görz+00b, S. 6) simulierbar seien.<br />
Dies impliziere, dass zur Entwicklung intelligenter Systeme lediglich ein Symbolsystem zur<br />
Erfassung der Wissensstruktur mit darauf arbeitenden Operationen zur Problemlösung<br />
entworfen werden müsse (s. Luger01, S. 57). Durch alternative Konzepte wurde Simulierbarkeit<br />
intelligenten Verhaltens einzig und allein durch Symbolverarbeitung zwar revidiert,<br />
9 siehe: Newell, A.: Physical symbol systems. Cognitive Science 4, S. 135-183, 1980.
Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 8<br />
aber die Hypothese stellt noch immer einen wesentlichen Grundbaustein für Techniken<br />
der Wissensrepräsentation in der Künstlichen Intelligenz dar.<br />
Eine Erweiterung dieses Konzepts ist die Hypothese der sogenannten Wissensebene 10 ,<br />
auf der das Wissen eines Systems beschreibbar ist. In der Hierarchie abstrahierender<br />
Beschreibungsebenen von Computerprogrammen, beginnend mit elektrotechnischen<br />
Aspekten bis hin zu Datenstrukturen, nimmt die Wissensebene die oberste Schicht ein (s.<br />
Newell81, S. 94-100). Auf dieser Ebene stellt das äußerlich sichtbare Verhalten eines<br />
Systems den Indikator für das Wissen des Systems dar. Die Verbindung zwischen intelligentem<br />
Verhalten und Wissen wird dabei durch das Rationalitätsprinzip fixiert. Dieses<br />
besagt, dass ein Agent jene Handlungsalternative wählen wird, von welcher er auf Grund<br />
seines Wissens die wahrscheinlichste Erreichung seiner Ziele erwartet (s. Newell81, S.<br />
102ff). Wesentlich ist dabei, dass die dafür benötigten Repräsentationen in der direkt<br />
unter der Wissensebene angeordneten Symbolebene gehalten werden. Somit wird eine<br />
strikte Trennung zwischen dem Wissen eines Systems und der – laut der Symbolsystemhypothese<br />
– zur technischen Realisierung benötigten Repräsentation desselben vorgenommen<br />
(s. Newell81, S. 117-121). Dabei fungiert das Wissen als Anforderungsspezifikation<br />
für die Repräsentation auf der Symbolebene und ist seinerseits an die Existenz<br />
eines entsprechenden physikalischen Symbolsystems gebunden (s. Görz+00b, S. 7).<br />
Das Ziel der Wissensrepräsentation liegt in der Entwicklung von Verfahren, die den<br />
Anforderungen aus der Symbolsystem- und der Wissensebenenhypothese entsprechen.<br />
Auf Grund der Relevanz derartiger Techniken für die Entwicklung intelligenter Systeme<br />
ist die wissenschaftliche Durchdringung dieses Gebietes relativ weit fortgeschritten. Für<br />
ontologiebasierte Verfahren der Wissensmodellierung sind dabei vor allem Erkenntnisse<br />
über Darstellungsmethoden für Symbolstrukturen sowie über die Entwicklung konzeptioneller<br />
Modelle als methodologische Grundlage relevant. Im Folgenden sollen daher<br />
die wesentlichen diesbezüglichen Aspekte vorgestellt werden.<br />
A.1.1.2 Repräsentationsschemata und -formalismen<br />
Ein Repräsentationsschema ist eine Methodik zur Darstellung der relevanten Aspekte der<br />
Struktur einer Wissensdomäne auf einem geeigneten Abstraktionsniveau zur Gewährleistung<br />
der angestrebten Funktionalität eines intelligenten Systems (s. Luger01, S. 226).<br />
Durch die Abbildung des relevanten Weltausschnitts mittels eines solchen Schemas<br />
entsteht ein konzeptionelles Modell desselben, welches in eine maschinenlesbaren Darstellung<br />
überführt wird und dann als „Wissensbasis“ (Owsnicki-Klewe+00, S. 153) eines<br />
intelligenten Systems fungiert. Um eine angemessene funktionale Qualität des Systems zu<br />
ermöglichen, werden an ein Repräsentationsschema folgende Anforderungen gestellt.<br />
Erstens soll die syntaktische sowie die semantische Eindeutigkeit, also eine Homomorphie<br />
der Wissenselemente gewährleistet sein (Kommunikativität). Zweitens sollen die<br />
relevanten Informations- und Wissensphänomene innerhalb der Domäne bezüglich ihrer<br />
Komplexität erfassbar sein (Ausdrucksstärke) und drittens soll sich die Darstellung in<br />
10 engl.: “Knowledge Level Hypothesis” (Newell81, S. 99).
Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 9<br />
effektiver Art und Weise durch einen entsprechenden Repräsentationsformalismus<br />
implementieren lassen (Operationalisierbarkeit) (s. Owsnicki-Klewe+00, S. 157f).<br />
Obwohl im Zuge der oben angeführten Wissensebenenhypothese logikbasierte<br />
Ansätze als geeignetste Form der Wissensrepräsentation proklamiert wurden, haben sich<br />
andere Notationsformen in der Künstlichen Intelligenz entwickelt. Bei den logikbasierten<br />
Ansätzen lag der Fokus auf der Fähigkeit <strong>zum</strong> korrekten und <strong>vollständige</strong>n Schließen<br />
mittels rein logischer Ausdrücke, wobei die Prädikatenlogik 11 als geeignetster Formalismus<br />
angesehen wurde (s. Luger01, S. 226). Die Erfassung von Wissensstrukturen durch diese<br />
Art der Darstellung wies allerdings erhebliche Mängel auf, da die „epistemologische<br />
Neutralität“ (Owsnicki-Klewe+00, S. 171) der Prädikatenlogik den Systementwickler zur<br />
logischen Darstellung jedes einzelnen Zusammenhangs zwingt, wodurch sich der<br />
Entwicklungsaufwand extrem erhöht. Daher wurden mit den sogenannten „assoziationistischen<br />
Theorien“ (Luger01, S. 227) Schemata zur Wissensrepräsentation entworfen,<br />
bei denen die Bedeutungsfestlegung über eine netzwerkartige, graphenbasierte Erfassung<br />
der Objekte mit ihren Beziehungen erreicht wird. Da diese Art der Wissensrepräsentation<br />
eine wesentliche Grundlage für Ontologien darstellt, werden hier die wichtigsten Ansätze<br />
kurz vorgestellt. 12<br />
Der erste zu erwähnende Ansatz sind sogenannte ´semantische Netze´. Darin werden<br />
die Konzepte und deren Beziehungen in „ ... ein[em] gerichtete[n] Graph mit bewerteten<br />
Knoten und Kanten“ (Endres-Niggemeyer98, S. 16) abgebildet. Abbildung 1 zeigt ein<br />
Beispiel einer solchen Darstellung. Die Knoten stellen Konzepte und die bipolaren<br />
Kanten deren Beziehungen untereinander dar, so dass hierarchische Strukturen und<br />
andersartige Relationen implizit erfasst werden können. Der wesentliche Vorteil dieser<br />
Abbildung 1: Beispiel eines semantischen Netzes 13<br />
11 Die Prädikatenlogik basiert auf der Aussagenlogik, in welcher logische Ausdrücke dargestellt und entsprechende<br />
logische Operationen darauf durchgeführt werden können. In der Prädikatenlogik werden diese Möglichkeiten durch<br />
die Nutzung von Variablen sowie der Zugriffsmöglichkeit auf die Komponenten komplexer Ausdrücke erweitert. Die<br />
wesentlichen Beweggründe zur Nutzung der Prädikatenlogik zur Repräsentation von Wissensstrukturen liegen in<br />
ihrer wohldefinierten Semantik, der Beweisbarkeit von Schlussfolgerungen sowie deduktiver Fähigkeiten. Übersichten<br />
der Prädikatenlogik finden sich in (Luger01, S. 71-101) sowie in gängigen Lehrbüchern der KI.<br />
12 Es sei angemerkt, dass diese traditionellen Repräsentationsschemata zur Entwicklung globaler Wissensbasen<br />
dienen sollten. Neuere Forschungsansätze beschäftigen sich mit entsprechenden Verfahren zur Darstellung von verteiltem<br />
Wissen und Schließen mit un<strong>vollständige</strong>r Informationen. Diese Ansätze sind auch für die ontologiebasierte<br />
Wissensmodellierung relevant, werden aber erst später wieder aufgegriffen (s. C.2.1). Hier sind zunächst die grundlegenden<br />
Ideen interessant.<br />
13 entnommen aus: (Endres-Niggemeyer98, S. 16).
Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 10<br />
Notationsform gegenüber der Prädikatenlogik liegt darin, dass die Bedeutungen der Beziehungen<br />
nicht mehr explizit durch logische Ausdrücke dargestellt werden müssen (s.<br />
Luger01, S.233). Allerdings fällt hierbei die ungenaue Differenzierung unterschiedlicher<br />
Arten von Relationen bezüglich ihrer Bedeutung auf (vergleiche ist_ein mit Teil_von, bzw.<br />
hat_Sprache), weswegen mit der Theorie der konzeptuellen Abhängigkeiten eine diesbezügliche<br />
Standardisierung verfolgt wurde. Darin werden grundlegende Arten von<br />
Konzepten und Relationen auf einer Meta-Ebene unterschieden, wodurch deren jeweilige<br />
Bedeutung vordefiniert ist und somit die Mehrdeutigkeit von Ausdrücken reduziert, beziehungsweise<br />
verhindert werden kann (s. Luger01, S. 233-239). Mit sogenannten Skripten<br />
wird die gleiche Zielsetzung verfolgt. Durch die Beschreibung stereotyper Handlungsabläufe<br />
in der Wissensdomäne kann die jeweils intendierte Bedeutung von Begriffen aus<br />
dem Handlungsumfeld zugeordnet werden, wodurch ebenfalls Mehrfachinterpretationen<br />
vermieden werden können (vgl. Luger01, S. 239-243). Der letzte zu erwähnende Ansatz<br />
traditioneller Repräsentationsschemata sind Frames (dt. = Rahmen). Wie in Abbildung 2<br />
dargestellt, werden darin die impliziten Relationsinformationen in einer objektartigen<br />
Struktur erfasst (s. Luger, S. 243-247). Somit können Objekte der realen Welt in einer für<br />
Menschen verständlichen und für Maschinen verarbeitbare Darstellung erfasst werden. 14<br />
Frankreich<br />
ist_ein<br />
hat_Teil<br />
hat_Sprache<br />
Land<br />
Paris<br />
Französisch<br />
Paris<br />
ist_ein<br />
ist_Teil_von<br />
Französisch<br />
ist_ein<br />
Abbildung 2: Beispiel Frame-Struktur 15<br />
Stadt<br />
Frankreich<br />
Sprache<br />
ist_Sprache_von Frankreich<br />
Ein moderner Ansatz für derartige Repräsentationsschemata sind sogenannte Konzeptgraphen.<br />
16 Darin werden die Wissensstrukturen in einem bipartiden Graph dargestellt,<br />
wobei die Konzeptknoten nur Verbindungen zu Relationsknoten haben (ähnlich einem<br />
Entity-Relationship-Diagramm). Weiterhin werden Objekttypen und Instanzen zur genaueren<br />
Beschreibung von Konzepten sowie das Konzept der Vererbung für die Darstellung<br />
hierarchischen Wissens bereitgestellt (s. Luger01, S. 247-258). Die Bedeutung<br />
dieses Ansatzes für die ontologiebasierte Wissensmodellierung wird später behandelt.<br />
Abschließend ist zu diesen Ansätzen an<strong>zum</strong>erken, dass sie im Hinblick auf die<br />
Darstellung komplexer Zusammenhänge gleich mächtig sind wie die Prädikatenlogik, aber<br />
Vorteile bezüglich der Ausdrucksstärke für Relationen aufweisen (s. Luger01, S. 227f). Mit<br />
ihnen kann die epistemologische Struktur einer Wissensdomäne erfasst werden, aber sie<br />
sind nicht zur Darstellung der semantischen Struktur geeignet (s. Luger01, S. 233). Dieses<br />
soll mittels Ontologien geschehen, wie im weiteren Verlauf aufgezeigt werden wird (s.<br />
A.2.1.2).<br />
14 Auf diesem Paradigma beruht der objekt-orientierte Ansatz des Software Engineering, welcher auf Grund seiner<br />
informationsverarbeitenden Stärken in den letzten Jahren weite Verbreitung fand (s. Görz+00b, S. 8; vgl. Balzert99).<br />
15 Beispiel aus Abbildung 1 in Frame-Darstellung: Die Notation ist (Luger01, S. 245) entnommen.<br />
16 siehe: Sowa, J. F.: Conceptual Structures. Information Processing in Mind and Machine. Reading, MA: Addison<br />
Wesley 1984.
Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 11<br />
Auf die Erfassung einer Wissensstruktur mittels eines Repräsentationsschemas folgt<br />
die Operationalisierung, also die Überführung in einen Repräsentationsformalismus.<br />
Damit wird die Maschinenlesbarkeit des repräsentierten Wissens und somit die Verwendbarkeit<br />
in computergestützten Systemen erreicht. Die dazu verwandten Wissensrepräsentationssprachen<br />
müssen in der Lage sein, die Komplexität der erfassten Wissensstruktur<br />
ausdrücken zu können und eine effiziente informationstechnische Verarbeitung<br />
zu gewährleisten (s. Owsnicki-Klewe+00, S. 171). Um diesen Anforderungen zu genügen,<br />
sollte eine solche Sprache folgende Fähigkeiten aufweisen. Erstens sollte qualitatives<br />
Wissen beschreibbar sein – also die Erfassung von Beziehungszusammenhängen anstatt<br />
reiner Datenverarbeitung. Zweitens soll neues Wissen aus dem vorhandenen über inferenzielle<br />
Verknüpfungen ableitbar sein. Drittens soll die Darstellung von allgemeinabstrakten<br />
als auch von speziell-detaillierten Zusammenhängen möglich sein. Viertens<br />
sollen komplexe semantische Konstrukte beschreibbar sein und fünftens die Möglichkeit<br />
zur Darstellung von Meta-Wissen gegeben sein (vgl. Luger01, S. 60-65).<br />
Wesentlich für die Qualität derartiger Sprachen ist, dass sie eine formal definierte Semantik<br />
aufweisen. Das heißt, dass jedem Primitivum und jedem Operator eine eindeutige<br />
Bedeutung zugewiesen und somit die Homomorphie von Ausdrücken gewährleistet ist.<br />
Dazu haben logische Methoden sich als geeignetes Werkzeug etabliert. Somit folgt die<br />
Situation, dass logikbasierte Formalismen zwar nicht direkt als Repräsentationsformalismus<br />
verwandt, aber als Analysewerkzeug eingesetzt werden (s. Owsnicki-<br />
Klewe+00, S. 175f). Für die besprochenen Repräsentationsschemata wurden jeweils<br />
entsprechende Wissensrepräsentationssprachen entwickelt. Auch für Ontologien werden<br />
entsprechende Repräsentationsformalismen benötigt, welche ebenfalls später ausführlich<br />
behandelt werden.<br />
A.1.1.3 Modellbasierter Ansatz<br />
Als abschließender Aspekt aus dem Bereich der Wissensrepräsentation soll der modellbasierte<br />
Ansatz erläutert werden, der aus einem Paradigmenwechsel innerhalb des<br />
Knowledge Engineering (s. A.1.2) hervorging. Dabei wurde zunächst im sogenannten<br />
Transfer-Ansatz das Wissen menschlicher Experten in eine formale Repräsentation überführt<br />
und das entsprechende Problemlösewissen durch Schlussregeln darauf aufgesetzt.<br />
Diese Vorgehensweise zeigte jedoch erhebliche Schwächen, da <strong>zum</strong> einen implizit schwer<br />
formalisierbares Alltagswissen in den Problemlöseprozess menschlicher Experten einfließt<br />
und <strong>zum</strong> anderen, weil die nötige erschöpfende Erfassung der Wissensdomäne allein<br />
durch Extraktion von Expertenwissen nicht möglich erschien (s. Studer+98, S. 2f). Daher<br />
wurde die Erstellung eines konzeptuellen Modells der Wissensdomäne als zusätzlicher,<br />
vorgelagerter Schritt eingeführt. Darin sollte die statische Wissensstruktur auf Basis<br />
mehrerer Quellen derart erfasst werden, dass eine umfassende, konzeptionell korrekte<br />
Abbildung der Domäne entsteht. Auf dieser kann eine entsprechende Inferenzmaschine<br />
das benötigte Problemlösewissen realisieren (vgl. Struss00, S. 431-433).<br />
Bei derartigen Verfahren stellt die Wissensbasis als wissensrepräsentierende Komponente<br />
eines intelligenten Systems die modellhafte Abbildung der Wissensdomäne dar,<br />
welche auf einer objektiven Analyse der Wissensstrukturen beruht. Daher werden diese
Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 12<br />
Verfahren als Wissensmodellierung bezeichnet, womit die Abgrenzung zur einfachen Repräsentation<br />
durch Symbolsysteme verdeutlicht werden soll (s. Struss00, S. 431f). Da bei<br />
der Entwicklung einer Ontologie dieser Ansatz verfolgt wird, können sie als ein Verfahren<br />
der Wissensmodellierung bezeichnet werden. Dabei nimmt das konzeptionelle<br />
Modell der Wissensdomäne eine bedeutende Rolle ein (s. A.2.1.1), weswegen hier die<br />
wesentlichen Aspekte eines solchen Modells kurz aufgeführt werden sollen.<br />
Ein Modell soll eine „ systematische, strukturierte Darstellung von Wissen über einen<br />
Gegenstand(sbereich) [sein], aus der Aussagen über das Verhalten des Gegenstandes<br />
ableitbar sind“ (Struss00, S. 432). Als grundlegendes Prinzip wird dabei die Trennung des<br />
deklarativen Wissens 17 vom Inferenzwissen verfolgt. Diese beiden Wissensarten werden<br />
auf Grund ihrer unterschiedlichen Charakteristika in verschiedenenartigen Modellen erfasst,<br />
so dass ein konzeptionelles Modell aus einer Wissensrepräsentation mittels entsprechender<br />
Repräsentationsschemata und –formalismen (s. A.1.1.2) sowie aus verhaltensbeschreibenden<br />
Elementen 18 besteht (s. Struss00, S. 439-450). Zur Erstellung eines<br />
solchen Modells ist der relevante Weltausschnitt, die inhaltliche Tiefe sowie die Komplexität<br />
der inferenziellen Kompetenz des Modells zu bestimmen. Wesentlich ist die Validation<br />
bezüglich der konzeptionellen Korrektheit des Modells (s. Owsnicki-Klewe+00, S. 161-<br />
174). Ziel bei der Entwicklung modellbasierter Systeme ist unter anderem auch die<br />
Erstellung von Bibliotheken wiederverwendbarer Modelle, um die Komposition neuer<br />
Wissensmodelle aus existenten Modellkomponenten zu ermöglichen (s. Struss00, S. 440<br />
ff). Detailliertere Betrachtungen dieser Aspekte werden an den entsprechenden Stellen in<br />
den weiteren Ausführungen vorgenommen.<br />
A.1.2 Knowledge Engineering<br />
Die Disziplin des Knowledge Engineering entstand als Methodenlehre zur Entwicklung<br />
Wissensbasierter Systeme 19 innerhalb der Künstlichen Intelligenz und stellt damit ein anwendungsorientiertes<br />
Forschungsgebiet dar, in dem Ansätze und Lösungen für die vorhergehend<br />
beschriebenen Problemstellungen der Wissensmodellierung und der Entwicklung<br />
entsprechender intelligenter Systeme erarbeitet wurden. Im Zuge der Forschungsarbeiten<br />
wurden unter anderem Ontologien als grundlegendes Modellierungskonzept eingeführt<br />
und verwendet, weshalb die diesbezüglichen Aspekte des Knowledge Engineering<br />
als Entstehungshintergrund ontologiebasierter Verfahren der Wissensmodellierung erläutert<br />
werden sollen. Weiterhin bestehen auf Grund gleichartiger Fragestellungen viele<br />
inhaltliche Verknüpfungen zwischen Knowledge Engineering und den in dieser Arbeit<br />
untersuchten ontologiebasierten Ansätzen, so dass in den weiteren Betrachtungen die<br />
relativ umfangreichen Kenntnisse dieses Forschungsgebiets referenziert werden können.<br />
17 Als deklaratives oder deskriptives Wissen wird das durch Fakten, Regeln, Listen, Tabellen und Bilder dargelegte<br />
Wissen bezeichnet (s. Hesse96, S. 252).<br />
18 Hierbei ist nicht die getrennte Inferenzmaschinerie gemeint. Es sollen lediglich die statischen Zusammenhänge der<br />
Wissensdomäne erfasst werden. Als Inferenzmaschinerie wird die aufgabenbezogene Nutzung des Modells verstanden.<br />
Also ein intelligentes Programm, welches mit Hilfe des Modells eine bestimmte Funktionalität erfüllt.<br />
19 engl: „Knowledge-based Systems“ (s. Studer+98, S. 2), abgekürzt als KBS. Darunter werden Systeme verstanden,<br />
die Wissensstrukturen in einem allgemeinen Sinn verarbeiten. Wissen wird dabei als pragmatische Daten (= in einer<br />
definierten Syntax notierte Signale) und Informationen (= mit semantischer Bedeutung versehene Daten) verstanden,<br />
welche ein Individuum <strong>zum</strong> Handeln befähigen (s. Schreiber+00, S. 3-5).
Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 13<br />
Der Begriff des Knowledge Engineering wurde Anfang der 1980er Jahre geprägt,<br />
wobei in Anlehnung an die Zielsetzung des Software Engineering systematische und<br />
wissenschaftlich reflektierte Methoden zur Entwicklung Wissensbasierter Systeme erarbeitet<br />
werden sollten. Dabei wurde vor allem anwendungsorientierten Fragestellungen<br />
hinsichtlich Techniken zur Erfassung, Darstellung und Verarbeitung von Wissensstrukturen<br />
nachgegangen. Als hauptsächliche Forschungsgebiete des Knowledge Engineering<br />
entstanden die Wissensakquisition, die Wissensmodellierung und -formalisierung<br />
sowie der Prozess der Systementwicklung. Die dabei gewonnenen Erkenntnisse sollten in<br />
umfassende ingenieursartige Methodologien zur Entwicklung Wissensbasierter Systeme<br />
zusammengefasst werden (s. Puppe+00, S. 599ff).<br />
Zur Erläuterung des Entstehungskontextes ontologiebasierter Verfahren der Wissensmodellierung<br />
sollen hier als wesentliche Errungenschaften des Knowledge Engineering<br />
die Differenzierung verschiedener Wissensarten sowie generische, also allgemeingültige<br />
und damit wiederverwendbare Wissensmodelle zur Darstellung derselben genauer betrachtet<br />
werden. Die Differenzierung der Wissensarten beruht auf der unterschiedlichen<br />
funktionalen Verwendung von Wissensstrukturen in Wissensbasierten Systemen. Gemäß<br />
dem modellbasierten Ansatz (s. A.1.1.3) werden dabei Domänen- und Inferenzwissen<br />
unterschieden und in separaten, voneinander unabhängigen Modellen erfasst. Auf Grund<br />
dieser Unterscheidung können die zur Entwicklung eines Wissensbasierten Systems relevanten<br />
Aspekte einer Wissensdomäne hinsichtlich der einzelnen Wissensarten betrachtet<br />
werden, wodurch eine differenzierte Erfassung der Domänenstruktur ermöglicht wird.<br />
Für jede Wissensart wird eine spezifische Repräsentationsform zur Erfassung der jeweils<br />
relevanten Aspekte verwendet (s. Puppe+00, S. 606). Um existente Erfassungen von<br />
Wissensstrukturen wiederverwenden zu können, werden ihre konzeptionellen Strukturen<br />
mittels sogenannter „Wissensmodelle“ (Puppe+00, S. 617) beschrieben, welche im Folgenden<br />
genauer betrachtet werden. Anschließend daran soll die kurze Darstellung ausgewählter<br />
Methodologien des Knowledge Engineering vertiefenden Einblick in die<br />
Differenzierung der Wissensarten sowie der Verwendung der Wissensmodelle geben.<br />
A.1.2.1 Wissensmodelle<br />
Wie schon angedeutet, besteht das Ziel der hier als Wissensmodelle bezeichneten Konstrukte<br />
in einer abstrahierenden und allgemein gehaltenen Beschreibung einer Wissensstruktur.<br />
Dabei soll die konzeptionelle Beschaffenheit derselben erfasst werden, weshalb<br />
sie auch als „Modellierung der Wissensebene 20 “ (s. A.1.1.1) bezeichnet werden. Da die<br />
Erstellung einer Wissensbasis 21 eine sehr aufwendige Analyse sowie die entsprechenden<br />
Fähigkeiten vom Wissensingenieur 22 verlangt, soll ihm mit derartigen Modellen die Möglichkeit<br />
zur Wiederverwendung bereits erfasster Wissensstrukturen beziehungsweise Lösungsansätze<br />
für ähnliche Fragestellungen als Referenz gegeben werden. Als ein derartiges<br />
Wissensmodell für das Domänenwissen wurden Ontologien und für das Inferenzwissen<br />
20 engl.: „ Knowledge Level Model“ (Wielinga94, S. 19).<br />
21 Als Wissensbasis eines Systems wird die Menge der formalisierten Wissensstrukturen bezeichnet, die das System<br />
zur Erfüllung seiner wissensverarbeitenden Aufgaben benötigt (s. Pupp+00, S. 599f).<br />
22 engl: „Knowledge Engineer“ (Schreiber+00, S. 20): Tätigkeitsbezeichnung für den Systemanalysten, dessen<br />
Aufgabe vornehmlich in der Modellierung der wissensverarbeitenden Fähigkeiten eines Systems liegt.
Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 14<br />
sogenannte Problem Solving Methods entwickelt (vgl. Gómez-Pérez+99), welche im Folgenden<br />
vorgestellt werden.<br />
A.1.2.1.1 Problem Solving Methods<br />
Das primäre Ziel Wissensbasierter Systeme ist die Simulation intelligenten Verhaltens<br />
durch das automatisierte Lösen von Problemen (s. A.1). Bei der Umsetzung entsprechender<br />
Verfahren wurden allgemeine Muster aufgefunden, mit denen gleichartige Problemstellungen<br />
behandelt werden können. Zur Erfassung dieser Muster werden sie mit einer<br />
Problem Solving Method (= PSM) beschrieben, womit ein standardisierter und somit<br />
wiederverwendbarer Lösungsansatz für die Problemstellung definiert wird (s. Gómez-<br />
Pérez+99, S. 7).<br />
Dazu werden in einer PSM die nötigen Inferenzschritte, deren Reihenfolge und das zur<br />
Lösung der Aufgabe benötigte Wissen über die Domäne spezifiziert. Somit entsteht ein<br />
abstrahierendes Lösungsmuster für mehrere Aufgaben des gleichen Typus, welches der<br />
Entwickler eines Systems lediglich auf die konkreten Zusammenhänge übertragen muss.<br />
Um die Wiederverwendbarkeit zu ermöglichen, werden PSM in entsprechenden<br />
Bibliotheken organisiert (s. Studer+98, S. 21-24). Die Forschungsarbeiten auf diesem<br />
Gebiet sind relativ umfangreich. Da für den hier untersuchten Zusammenhang weitere<br />
Ausführungen dieser <strong>Thema</strong>tik nicht nötig erscheinen, wird auf die entsprechende<br />
Fachliteratur verwiesen 23 .<br />
A.1.2.1.2 Ontologien<br />
Wie im Zusammenhang der PSMs (s. A.1.2.1.1) erwähnt, wird für die Problemlösefähigkeit<br />
eines Wissensbasierten Systems Wissen über die Anwendungsdomäne benötigt.<br />
Dieses wird in entsprechenden „Domänenmodellen“ (s. Puppe+00, S. 624) abgebildet, in<br />
denen die statischen Zusammenhänge der Wissenselemente und deren Relationen erfasst<br />
werden. Eine Ontologie stellt ein vordefiniertes Vokabular für ein solches Domänenmodell<br />
der Elemente der Wissensstruktur zur Verfügung. Die Zielsetzung bei einer derartigen<br />
Verwendung von Ontologien ist die Sicherstellung der einheitlichen Verwendung<br />
der Begrifflichkeiten der Wissensdomäne, wodurch fehlerhafte Modellierungen und somit<br />
konzeptionell bedingte Fehlfunktionen verhindert werden sollen. Eine Ontologie kann<br />
dabei als Referenz für mehrere Domänenmodelle dienen und stellt somit ein Wissensmodell<br />
im oben beschriebenen Sinne dar (s. Puppe+00, S. 622).<br />
Als Hilfsmittel in der Systementwicklung können unterschiedliche Arten von<br />
Ontologien verwendet werden, wobei sie jeweils als Wissensmodell zur bedeutungsdefinierenden<br />
Erfassung der Wissensdomäne fungieren. Für die weiteren Ausführungen<br />
seien hier zunächst sogenannte Domänenontologien für die Erstellung von Domänenmodellen<br />
und Methodenontologien für die Erstellung von Problem Solving Methods<br />
genannt (s. Puppe+00, S. 623). 24 Als wesentlicher Aspekt soll an dieser Stelle die zentrale<br />
Rolle von Ontologien als bedeutungsdefinierendes Wissensmodell für die Erstellung des<br />
konzeptionellen Modells einer Wissensbasis festgehalten werden.<br />
23 Eine Übersicht sowie weiterführende Literaturangaben finden sich in (Gómez-Pérez+99).<br />
24 Eine ausführliche Behandlung verschiedener Arten von Ontologien wird im Zusammenhang mit deren Verwendung<br />
in Informationssystemen vorgenommen (s. C.1.1.2)
Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 15<br />
A.1.2.2 Methodologien<br />
Zu Verdeutlichung der vorgestellten theoretischen Errungenschaften des Knowledge<br />
Engineering sollen im Folgenden die Differenzierung verschiedener Wissensarten sowie<br />
die Verwendung von Ontologien genauer betrachtet werden, wozu die diesbezüglichen<br />
Erkenntnisse zweier Methodologien des Knowledge Engineering besprochen werden.<br />
Aus der CommonKADS-Methodologie wird die Unterscheidung der Wissensarten sowie<br />
die Modellierung des Domänenwissens unter der Verwendung von Ontologien erläutert<br />
und aus dem PROTÉGÉ-Ansatz soll die differenziertere Verwendung von Ontologien<br />
zur Konzeption Wissensbasierter Systeme vorgestellt werden. Die Auswahl dieser beiden<br />
Methodologien begründet sich darin, dass die wesentlichen Erkenntnisse für den hier verfolgten<br />
Untersuchungsaspekt aus diesen hervorgingen. Eine vergleichende Übersicht<br />
weiterer Forschungsansätze mit ähnlichen Zielsetzungen findet sich in (Angele+97).<br />
A.1.2.2.1 CommonKADS<br />
Die CommonKADS-Methodologie entstand im Zuge des ESPRIT IT- Projektes 25 und<br />
verfolgt das Ziel, ein umfassendes und standardisiertes Verfahren des Knowledge Engineering<br />
zu entwerfen (s. Schreiber+00, S. xii). Der Ansatz basiert auf einer Kollektion von<br />
Modellen (siehe Abbildung 3), durch deren sukzessive Erstellung die Entwicklung eines<br />
Wissensbasierten Systems durchgeführt wird.<br />
Dabei wird zunächst zur Erfassung des Nutzungsumfeldes des Systems die Organisationsstruktur<br />
der Wissensdomäne im Organisations-Modell beschrieben. Im Aufgaben-<br />
Modell werden die auszuführenden Aufgaben spezifiziert und in hierarchischer Art und<br />
Weise gegliedert. Im Agenten-Modell werden die ausführenden Agenten erfasst. Auf<br />
dieser Grundlage wird das Konzept des zu entwickelnden Systems erstellt, wobei im<br />
Expertise-Modell das benötigte Problemlösewissen und im Kommunikations-Modell die<br />
nötigen Interaktionen und Informationsflüsse beschrieben werden. Abschließend wird als<br />
Implementierungsgrundlage die so entstandene Konzeption in das Design-Modell<br />
überführt. 26 Abbildung 3: CommonKADS – Modell Kollektion 27<br />
25 Europäisches Forschungsprojekt mit Vertretern aus der Forschung und der Industrie. In verschiedenen Projekten im<br />
Bereich des Knowledge Engineering entstand unter anderem der KADS-Ansatz (Knowledge Acquisition and Design<br />
Structuring) zur Entwicklung Wissensbasierter Systeme. CommonKADS als Weiterentwicklung von KADS gilt als<br />
eine der wichtigsten Methodenlehren des Knowledge Engineering und wurde in mehreren Forschungsansätzen<br />
erweitert. Eine detaillierte Übersicht findet sich im sogenannten Textbook (vgl. Schreiber+00) sowie im Internet auf<br />
der Website, siehe: www.commonkads.uva.nl (16.07.2002).<br />
26 Eine detaillierte Erläuterung der einzelnen Modelle findet sich in (Schreiber+00).<br />
27 entnommen aus: (Schreiber+00, S. 18). Die Übersetzung der Begrifflichkeiten ist an (Puppe+00, S. 626) angelehnt.<br />
In der Literatur wird das Expertise-Modell mancherorts auch als Wissensmodell (engl.: „Knowledge Model“) bezeichnet<br />
(s. Schreiber+00, S. 19).
Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 16<br />
Für den hier betrachteten Zusammenhang ist vor allem das Expertise-Modell von<br />
Bedeutung, in dem die oben erwähnte Differenzierung von Wissensarten vorgenommen<br />
wurde. Dabei wird neben der Trennung von Domänen- und Inferenzwissen das sogenannte<br />
Aufgabenwissen unterschieden, welches die Struktur zu lösender Aufgaben zur<br />
Erfassung der Funktionsweise eines Wissensbasierten Systems spezifiziert (s. Wielinga94,<br />
S. 20). Für die Erfassung dieser Wissensarten werden jeweils spezifische Darstellungsformen<br />
verwendet, wobei hinsichtlich der Verwendung von Ontologien das Verfahren<br />
zur Modellierung des Domänenwissens genauer erläutert werden soll.<br />
Abbildung 4: CommonKADS – Modellierung Domänenwissen 28<br />
Abbildung 4 zeigt die verwendeten Komponenten zur Modellierung des Domänenwissens.<br />
Die Domänenmodelle (engl.: „domain models“) stellen jene Aspekte bereit, die<br />
für die Problemlösefähigkeiten des Systems benötigt werden. Dabei handelt es sich um<br />
eine zweckdienliche Darstellung eines Teils des Domänenwissens und nicht um eine<br />
modellhafte Abbildung der gesamten Wissensstruktur der Domäne. Zur Vermeidung von<br />
Fehl- oder Mehrfachinterpretationen wird die Bedeutung der in den Domänenmodellen<br />
verwendeten Modellierungsprimitive als sogenanntes „Meta-Domänenwissen 29 “ separat<br />
im Modell-Schema (engl.: „model schema“) definiert. Für diese beiden Komponenten<br />
stellen jeweils spezifische Ontologien das benötigte Vokabular zur Verfügung. In der<br />
Domänen-Ontologie sind die Entitäten der Wissensdomäne, deren Relationen und taxonomische<br />
Struktur und in der Modell-Ontologie ist eine Typologie dieser Entitäten definiert<br />
(s. Wielinga94, S. 13-15). Dieser Aufbau verdeutlicht das oben erläuterte Verwendungskonzept<br />
von Ontologien als Wissensmodell (s. A.1.2.1.2).<br />
A.1.2.2.2 PROTÉGÉ<br />
Als zweite Methodologie soll jene des PROTÉGÉ-Projekts 30 vorgestellt werden. Dieser<br />
Ansatz befasst sich mit der Entwicklung von Problem Solving Methods und Ontologien<br />
als wiederverwendbare Komponenten für Wissensbasierte Systeme im Sinne generischer<br />
Wissensmodelle (s. Puppe+00, S. 628). Hier soll die Verwendung von Ontologien in-<br />
28 entnommen aus (Wielinga94, S. 23).<br />
29 engl.: „meta domain knowledge“ (Wielinga94, S. 15).<br />
30 PROTÉGÉ-Projekt: Forschungsprojekt der Stanford University, in dem seit Ende der 1980er Jahre Lösungen für<br />
den Bereich des Knowledge Engineering erarbeitet werden. Der hier betrachtete Ansatz wird als PROTÉGÉ-II, die<br />
aktuellen Forschungen als PROTÉGÉ2000 bezeichnet. Weiterführende Informationen dazu finden sich im Internet<br />
auf der Homepage des Projektes unter: protege.semanticweb.org (08.06.2002).
Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 17<br />
nerhalb dieses Ansatzes genauer beleuchtet werden, wobei eine verbesserte Wiederverwendbarkeit<br />
von Ontologien als Wissensmodelle angestrebt wird.<br />
Zur Erstellung einer Ontologie als bedeutungsdefinierendem Hilfskonstrukt für die<br />
Entwicklung eines Wissensbasierten Systems werden verschiedene existente Ontologien<br />
kombiniert, wodurch der Grad der Wiederverwendbarkeit von Wissensmodellen erhöht<br />
werden soll. Als existente Ontologien werden dabei entsprechende Domänenontologien<br />
und Methodenontologien (s. A.1.2.1.2) verwendet. Diese sollten möglichst allgemein<br />
gehalten und unabhängig voneinander definiert sein, um als wiederverwendbare Wissensmodelle<br />
ein möglichst breites Verwendungsfeld abzudecken. Die zu erstellende Ontologie<br />
für ein konkretes Wissensbasiertes System wird aus der Domänenontologie und der Methodenontologie<br />
der entsprechenden Wissensdomäne zusammengestellt, wobei nur die in<br />
der Anwendung benötigten Wissensstrukturen übernommen werden. Somit entsteht eine<br />
sogenannte Applikationsontologie (engl.: „application ontology“) als bedeutungsdefinierende<br />
Grundlage des Systems, welche die Bedeutung aller benötigten Wissensstrukturen<br />
enthält (s. Studer+98, S. 14-15). Abbildung 5 verdeutlicht diesen Zusammenhang.<br />
Domänen-<br />
Modell<br />
bedeutungsdefinierende<br />
Begriffbasis<br />
Problem<br />
Solving Method<br />
Applikations-<br />
Ontologie<br />
Domänen-<br />
Ontologie<br />
Zusammenführung<br />
Methoden-<br />
Ontologie<br />
Abbildung 5: PROTÉGÉ – Erstellung einer Applikationsontologie 31<br />
Aus einer derartigen Verwendung ergeben sich einerseits Vorteile hinsichtlich der<br />
Wiederverwendbarkeit von Ontologien, da sie unabhängig von einer konkreten Anwendungssituation<br />
definiert werden können. 32 Andererseits wird als neuartige Problemstellung<br />
die Zusammenführung verschiedener Ontologien aufgeworfen. Denn zur Gewährleistung<br />
der Verwendbarkeit der Applikationsontologie als bedeutungsdefinierender Basis eines<br />
Systems müssen die begrifflichen Definitionen der verwendeten Domänen- und Methodenontologie<br />
korrekt aufeinander abgestimmt werden. Dabei müssen einerseits die für das<br />
System benötigten Wissensstrukturen identifiziert werden und andererseits muss die konzeptionelle<br />
Korrektheit der Abbildung der Wissensdomäne erhalten bleiben. Diese als<br />
Ontologie-Integration bezeichnete Problematik wird später ausführlicher behandelt (s.<br />
C.3.2).<br />
31 In Anlehnung an (Studer+98, S. 15).<br />
32 Hier ist zu erwähnen, dass in der sogenannten „strong interaction problem hypothesis“ (Studer+98, S. 11) der<br />
Standpunkt vertreten wurde, dass die Wiederverwendung bereits modellierter Wissensstrukturen für die Erstellung<br />
von Wissensbasen auf Grund der starken kontextuellen Abhängigkeit generell nicht möglich sei. Diese Ansicht wurde<br />
durch praktische Erfahrungen relativiert, da allgemeine Muster von Wissensstrukturen aufgefunden werden konnten.<br />
Allerdings werden die Anforderungen an eine Wissensbasis zu einem sehr hohen Maße durch die betrachtete Domäne<br />
sowie die angestrebte Funktionalität des Wissensbasierten Systems determiniert (s. Studer+98, S. 11).
Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 18<br />
A.2 Charakteristika ontologiebasierter Wissensmodellierung<br />
Auf Grundlage des im Vorhergehenden erfassten wissenschaftlichen Hintergrundes und<br />
des Entstehungskontextes ontologiebasierter Verfahren der Wissensmodellierung lassen<br />
sich nun die wesentlichen Charakteristika dieses Verfahrens zusammentragen. Dazu<br />
werden zunächst die Eigenschaften und Anforderungen an Ontologien erläutert und in<br />
den jeweiligen wissenschaftlichen Hintergrund eingegliedert. Darauf folgt eine Erörterung<br />
der Verwendung dieser Modellierungstechnik hinsichtlich des Einsatzpotenzials von<br />
Ontologien als bedeutungsdefinierende Komponente eines computergestützten Systems.<br />
Einige ergänzende Aspekte sollen die Erarbeitung der Verständnisgrundlage ontologiebasierter<br />
Verfahren der Wissensmodellierung abschließen. An<strong>zum</strong>erken ist, dass hier<br />
keine umfassende Charakterisierung dieses Verfahrens erfolgt, sondern lediglich die für<br />
den Untersuchungsgegenstand dieser Arbeit relevanten Aspekte zusammengetragen werden<br />
sollen.<br />
A.2.1 Eigenschaften von und Anforderungen an Ontologien<br />
Zur Erfassung der Eigenschaften und Anforderungen an Ontologien als Methodik der<br />
Wissensmodellierung werden im Folgenden die Begrifflichkeiten aus der eingangs<br />
angeführten Definition einer Ontologie als „formale, explizite Spezifikation einer geteilten<br />
Konzeptionalisierung“ (s.o.) detaillierter erläutert. Diese Definition enthält zwei wesentliche<br />
Teile, welche hier sukzessiv hinsichtlich des Entstehungsprozesses einer Ontologie<br />
betrachtet werden sollen. Dazu werden zunächst die Anforderungen an eine Ontologie als<br />
eine explizite, geteilte Konzeptionalisierung der relevanten Wissensdomäne und anschließend<br />
deren Darstellung in einer formalen Spezifikation erörtert.<br />
A.2.1.1 Explizite, geteilte Konzeptionalisierung<br />
Die Konzeptionalisierung einer Wissensdomäne entsteht als Artefakt der „konzeptionellen<br />
Modellierung 33 “, in welcher ein Modell der Struktur der Domäne im Sinne des<br />
Modellbasierten Ansatzes (s. A.1.1.3) in einer der Anwendungsmodellierung vorgelagerten<br />
Phase erfasst wird. Eine solche Konzeptionalisierung stellt eine simplifizierende und<br />
abstrahierende Abbildung der statischen Struktur einer Domäne dar, welche deren<br />
relevante Aspekte hinsichtlich einer bestimmten Zweckausrichtung beinhaltet (s. Gruber<br />
93, S.1). Die Zweckausrichtung einer Ontologie besteht in der Erfassung der Bedeutung<br />
von Termen und Relationen (s. A.2.2.1). Eine entsprechende Konzeptionalisierung muss<br />
daher die intensionalen, also den Zusammenhängen innewohnenden Eigenschaften der<br />
Wissensdomäne erfassen (s. Guarino98, S. 3).<br />
Dass die einer Ontologie zugrundeliegende Konzeptionalisierung explizit sein soll, ist<br />
im Hinblick ihrer Verwendung als bedeutungsdefinierende Komponente eines Informationssystems<br />
zu verstehen. Um Fehl- und Mehrfachinterpretationen von Begrifflichkeiten<br />
und Zusammenhängen zu vermeiden, muss deren Bedeutung externalisiert werden. 34 Da<br />
33 engl.: „Conceptual Modelling” (Guarino95, S. 3).<br />
34 In der Theorie der Wissensschaffung im Unternehmen wird mit Externalisierung jener Prozess beschrieben, in dem<br />
implizites, nur dem ´Inhaber´ zugängliches Wissen derart beschreibbar gemacht wird, dass es für andere verständlich<br />
und erlernbar ist (s. Nonaka+97, S. 68-108). Dazu wird ein ausgereifteres Verständnis des Gegenstandsbereichs benötigt.<br />
Diese Problematik stellt sich auch bei der Erstellung einer expliziten Konzeptionalisierung und wird später<br />
ausführlicher behandelt (s. B.1.2).
Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 19<br />
die Bestandteile einer solchen Konzeptionalisierung somit einen direkten Bezug <strong>zum</strong><br />
betrachteten Ausschnitt der realen Welt haben, werden sie auch als „Domänentheorie 35 “<br />
bezeichnet. Eine Domänentheorie unterscheidet sich von anderen schematischen Erfassungen<br />
einer Wissensdomäne hinsichtlich der Intention der Modellierung. Während in<br />
Datenbank-Schemata oder Objektmodellen aus der konventionellen Softwaretechnik das<br />
Modell lediglich zur Erstellung einer informationsverarbeitenden Applikation dient, soll in<br />
einer Ontologie ein Verständnismodell der Wissensdomäne geschaffen werden (s. Studer<br />
+98, S. 11). Dieser Aspekt wird später ausführlicher behandelt (s. B.1.2.1).<br />
Die Forderung nach der Geteiltheit bedeutet, dass die strukturelle Erfassung einer<br />
Wissensdomäne in der Konzeptionalisierung von den Beteiligten als Verständnismodell<br />
der Domäne angesehen und akzeptiert wird. Diese Anforderung lässt sich ebenfalls vor<br />
dem Hintergrund der Verwendung einer Ontologie als bedeutungsdefinierendes Konstrukt<br />
einer Wissensdomäne begründen, da eine effiziente Nutzung einer solchen Struktur<br />
nur durch eine Akzeptanz des darin postulierten Verständnisses gewährleistet werden<br />
kann. 36 Der Grad der Akzeptanz durch einen Agenten (menschlich oder künstlich) wird<br />
durch dessen „ontologische Verpflichtung 37 “ beschrieben. Damit kann im Sinne der<br />
Wissensebenen-Hypothese (s. A.1.1.1) erfasst werden, in wieweit der Agent das in der<br />
Ontologie intendierte Verständnis der Domäne in seinem Verhalten berücksichtigt (s.<br />
Gruber93, S. 3).<br />
A.2.1.2 Formale Spezifikation<br />
Durch die Formalisierung der zugrundeliegenden Konzeptionalisierung soll die Maschinenlesbarkeit<br />
erreicht und somit die Verwendbarkeit einer Ontologie in computergestützten<br />
Informationssystemen ermöglicht werden. Dazu werden entsprechende Repräsentationsschemata<br />
und -formalismen (s. A.1.1.2) benötigt. Wesentlich dabei ist, dass<br />
diese die Fähigkeit zur semantischen Beschreibung der Struktur einer Wissensdomäne<br />
aufweisen. Diese Anforderung an geeignete Darstellungstechniken für Ontologien kann<br />
durch das von Guarino postulierte „Ontologische Level 38 “ in der Hierarchie von<br />
Repräsentationsformalismen verdeutlicht werden.<br />
Level Repräsentationsprimitive Zielsetzung<br />
logisch Prädikate logische Formalisierung<br />
epistemologisch strukturierte Relationen Strukturerfassung<br />
ontologisch Bedeutungspostulate Bedeutungsdefinition<br />
konzeptionell kognitive Primitive Konzeptionalisierung<br />
linguistisch linguistische Primitive natürlich-sprachliche Darstellung<br />
Tabelle 1: Level der Wissensrepräsentation 39<br />
35 engl: „domain theory“ (Fensel00, S. 1).<br />
36 Dazu sei hier ein bekannter Ausspruch aus dem Gebiet des Wissensmanagements angeführt: „People can´t share<br />
knowledge if they don´t speak a common language“ (Schreiber+00, S. 4. nach: Davenport, T.H.; Prusak, L.: Working<br />
Knowledge. How organisations manage what they know. Boston, USA: Havard Business Scholl Press 1998). Eine<br />
Ontologie soll in diesem Sinne eine gemeinsame Verständnisgrundlage definieren.<br />
37 engl.: „ontological commitment“ (Gruber93, S. 2).<br />
38 engl.: „ontological level“ (Guarino94, S. 1).<br />
39 aus: (Guarino94, S.9). Das Modell wurde darin lediglich um das ontologische Level ergänzt.
Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 20<br />
Die Differenzierung der in Tabelle 1 unterschiedenen Arten von Repräsentationsformalismen<br />
beruht auf der Art des mit den Formalismen darstellbaren Wissens. Die Art<br />
des darstellbaren Wissens wird über die Verbundenheit der jeweiligen Repräsentationsprimitive<br />
mit Strukturen der realen Welt definiert (siehe Spalte ´Zielsetzung´ in Tabelle 1).<br />
Es werden fünf Level von Repräsentationsformalismen unterschieden, welche hier kurz<br />
erläutert werden sollen.<br />
Mit Formalismen des logischen Levels können logische Ausdrücke definiert werden,<br />
wobei die Bedeutung der Variablen nicht an Objekte der realen Welt gebunden ist. Der<br />
logische Ausdruck f(x)=>t(x) stellt erst eine sinnvolle Aussage dar, wenn x als Repräsentant<br />
eines Objekt definiert wird. Das epistemologische Level beschreibt Formalismen<br />
zur Darstellung der Struktur einer Wissensdomäne. Ein Beispiel dafür stellen die<br />
Formalismen für die traditionellen Repräsentationsschemata dar (s. A.1.1.2). Während<br />
epistemologische Formalismen lediglich den Aufbau und die Zusammengehörigkeit von<br />
Wissenselementen erfassen können, sollen Formalismen des ontologischen Levels die<br />
Spezifikation der Beschaffenheit von Wissenselementen beschreiben können. Um dieses<br />
zu ermöglichen, werden entsprechende Beschreibungsprimitive benötigt. Die Anforderungen<br />
an entsprechende Formalismen werden im Zusammenhang des Ontologie-<br />
Entwicklungsprozesses genauer erörtert (s. B.1.3). Die letzten beiden Level von Repräsentationsformalismen<br />
dienen der Beschreibung von Wissensstrukturen für deren Verständnis<br />
durch den Menschen und sind daher nicht für eine maschinelle Verarbeitung<br />
geeignet.<br />
A.2.2 Motivation zur Verwendung von Ontologien<br />
Die genannten Anforderungen an Ontologien lassen sich nur unter Berücksichtigung ihrer<br />
antizipierten Verwendung nachvollziehen. Dazu soll im Folgenden die schon erwähnte<br />
Funktion von Ontologien als bedeutungsdefinierender Komponente eines computergestützten<br />
Systems besprochen werden, ebenso die potenziellen Einsatzfelder ontologiebasierter<br />
Verfahren der Wissensmodellierung.<br />
A.2.2.1 Bedeutungsdefinition<br />
In den bisherigen Ausführungen wurden Ontologien als bedeutungsdefinierendes Konstrukt<br />
beschrieben, welches ein Vokabular der Wissensdomäne bezüglich deren Struktur<br />
definieren soll. Der resultierende funktionale Zugewinn wird auch als maschinenverarbeitbare<br />
Beschreibung der „Semantik von Daten 40 “ bezeichnet. Diese Bezeichnung<br />
sowie die hintergründige Intention zur Erstellung eines solchen Konstrukts bedürfen<br />
einer genaueren Betrachtung.<br />
Wie als Zielsetzung der Verwendung von Ontologien als Wissensmodell im Knowledge<br />
Engineering herausgearbeitet wurde (s. A.1.2.1.2), soll eine Ontologie ein Strukturmodell<br />
der betrachteten Wissensdomäne beschreiben, welches dann als Basis zur Entwicklung<br />
von Anwendungen genutzt wird. Die Intention liegt dabei in der Schaffung einer<br />
zentralen Erfassung der Wissensdomäne, in der die strukturellen Zusammenhänge<br />
definiert werden. Durch die Nutzung und Einhaltung dieser Bedeutungsdefinition der<br />
40 engl.: „ … the semantics of the data.“ (Fensel00, S. 1).
Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 21<br />
Wissensstruktur zur Erstellung weiterführender Modelle sollen konzeptionelle Fehler<br />
vermieden werden, wie die Verwendung von Ontologien in den vorgestellten Methodologien<br />
des Knowledge Engineering veranschaulicht (s. A.1.2.2).<br />
Überträgt man diese spezielle Intention auf eine allgemeinere Ebene, so stellt die<br />
Bedeutungsdefinition durch eine Ontologie eine konzeptionelle Strukturierung dar, mit<br />
der ein „geteiltes und gemeinsames Verständnis einer Wissensdomäne 41 “ erreicht werden<br />
kann – unter der Bedingung der entsprechenden ontologischen Verpflichtung der Beteiligten<br />
(s. A.2.1.1). Um diesen Anforderungen gerecht zu werden, muss in der Ontologie<br />
die Struktur der Domäne korrekt, also in Übereinstimmung mit der realen Welt<br />
erfasst werden, wobei eine objektive oder <strong>zum</strong>indest intersubjektive Wahrnehmung<br />
derselben angestrebt werden sollte. Dabei sind die Begrifflichkeiten derart zu definieren,<br />
dass die intendierte Bedeutung präzise ausgedrückt wird und durch Ausschluss, beziehungsweise<br />
Verminderung von Mehrdeutigkeiten eine einheitliche Verwendung gewährleistet<br />
werden kann. Es kann insofern von einer semantischen Struktur gesprochen<br />
werden, da in einer Ontologie die Bedeutungsbeziehungen zwischen Konzepten als<br />
Verständnismodellen, den zugehörigen Objekten der realen Welt und deren symbolische<br />
Repräsentation gemäß dem semiotischen Dreieck 42 erfasst werden sollen. Weiterhin<br />
werden mit den Anforderungen der präzisen Bedeutungserfassung und der Verhinderung<br />
von Mehrdeutigkeit Problemfelder der Semantik aufgefasst (s. Glück00, S. 618-621).<br />
Allerdings ist die Bezeichnung einer ontologiebasierten Anwendung als „semantische<br />
Technologie“ (s. Smolle02, S.5) mit Vorsicht zu genießen, da die modellhafte Erfassung<br />
einer Wissensstruktur mittels einer Ontologie lediglich als semantische Komponente in<br />
einem Informationssystem fungieren soll, damit aber keine semantische Analyse des<br />
betrachteten Weltausschnitts im Sinne der semiotischen Bedeutungslehre angestrebt wird.<br />
A.2.2.2 Einsatzmöglichkeiten<br />
Eine Ontologie als bedeutungsdefinierende Basis im vorgestellten Sinne kann zu verschiedenartigen<br />
Zwecken verwendet werden, wobei sich jeweils Nutzenzugewinne durch<br />
die Existenz einer geteilten und allgemeinen Verständnisgrundlage der Wissensdomäne ergeben.<br />
Die wichtigsten Einsatzgebiete sollen hier nur kurz aufgeführt werden, da diese<br />
<strong>Thema</strong>tik später ausführlicher behandelt wird (s. C.1.2).<br />
Zunächst können Ontologien als unterstützende Komponente bei der Entwicklung<br />
von Systemen genutzt werden, wie bei der Verwendung in den Methodologien zur Entwicklung<br />
Wissensbasierter Systeme aufgezeigt wurde (s. A.1.2.2). Dieser Verwendungszweck<br />
lässt sich für Systeme generalisieren, die für wissensintensive Aufgabenfelder eingesetzt<br />
werden. Dabei dienen Ontologien vor allem als qualitätssichernde Reliabilitätskontrolle<br />
sowie als wiederverwendbare Modellierung einer Wissensdomäne (s. A.1.2.2.2).<br />
Eine weitere Anwendung findet sich als Komponente in Informationssystemen zur Gewährleistung<br />
der Interoperabilität von Systemen, beziehungsweise deren Komponenten,<br />
41 engl.: „… shared and common understanding of a domain …“ (Fensel00, S. 1).<br />
42 Mit dem semiotischen Dreieck wird versucht, die Funktionsweise der menschlichen Bedeutungswahrnehmung zu<br />
veranschaulichen. Ein Zeichen oder Symbol trägt eine Bedeutung, welche für ein Bezugsobjekt der realen Welt steht.<br />
Die Bedeutungswahrnehmung geschieht durch ein sogenanntes mentales Konzept, worüber der Mensch die Verbindung<br />
zwischen Symbol und Bezugsobjekt herstellt (s. Glück00, S. 625f).
Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 22<br />
womit Ontologien einen Lösungsansatz für den Datenaustausch zwischen heterogenen<br />
Informationsquellen als wesentliches Problemfeld des Informationsmanagements darstellen.<br />
Ein weiteres Einsatzgebiet von Ontologien sind kommunikationsintensive Bereiche<br />
wie das Wissensmanagement oder die Kommunikation zwischen Software-Agenten,<br />
wobei die einheitliche Begriffsverwendung innerhalb einer Wissensdomäne oder zwischen<br />
verschiedenen einen Zugewinn bietet (s. Uschold+96, S.7-13).<br />
A.2.3 Ergänzende Anmerkungen<br />
Aus den Ausführungen wird zunächst deutlich, dass Ontologien als Technik der Wissensmodellierung<br />
mit dem Ziel der Bedeutungsdefinition eine neuartige Herangehensweise für<br />
die Entwicklung wissensverarbeitender Systeme darstellen, womit unter anderem das<br />
wachsende Forschungsinteresse auf diesem Gebiet zu erklären ist. Des Weiteren fällt auf,<br />
dass zur Realisierung dieser Methodik viele bekannte Aspekte verwandt werden können,<br />
so dass ontologiebasierte Verfahren nicht als ein völlig neuartiger Ansatz der Wissensmodellierung<br />
zu verstehen sind.<br />
Weiterhin ist an<strong>zum</strong>erken, dass eine Vielzahl sehr unterschiedlicher Konstrukte als<br />
Ontologien bezeichnet werden. Diese breite Fächerung beruht <strong>zum</strong> einen auf den unterschiedlichen<br />
Anforderungen, welche aus der antizipierten funktionalen Verwendung einer<br />
Ontologie resultieren. Zum anderen werden Konstrukte mit unterschiedlichen Formalisierungsgraden<br />
als Ontologie bezeichnet, soweit sie eine bedeutungsdefinierende Erfassung<br />
einer Wissensdomäne beinhalten. Dabei werden folgende drei Abstufungen unterschieden.<br />
Als informelle Ontologien werden solche bezeichnet, die eine bedeutungsdefinierende<br />
Strukturerfassung darstellen, aber nicht formal spezifiziert sind. Diese<br />
Ontologien dienen lediglich als Verständnismodell einer Wissensdomäne, sind aber nicht<br />
zur maschinellen Verarbeitung geeignet. Dies ist erst mit formalisierten Ontologien<br />
möglich, wobei semi-formale und hoch formalisierte Ontologien unterschieden werden.<br />
In letzteren sind die inferenziellen Zusammenhänge in axiomatischen Ausdrücken erfasst<br />
(s. Uschold+96, S.6).<br />
Vor diesem Hintergrund sind auch die Unterschiede in den verschiedenen definitorischen<br />
Erfassungen einer Ontologie zu verstehen. Während eine informelle<br />
Ontologie eher als konzeptionelle Erfassung einer Wissensdomäne verstanden werden<br />
kann, stellt eine hoch-formalisierte Ontologie eine Spezifikation einer logischen Theorie<br />
dar (s. Guarino +95, S. 1-3). Die einzige Gemeinsamkeit solcher vom Wesen her sehr<br />
unterschiedlichen Konstrukte ist lediglich die bedeutungsdefinierende Erfassung einer<br />
Wissensdomäne. In dieser sehr allgemeinen Anforderung kann die Begründung für das<br />
noch nicht ganz ausgereifte Verständnis von Ontologien gesehen werden. Trotz der Unklarheiten<br />
über die Wesenseigenschaften von Ontologien besteht ein Konsens darüber,<br />
dass ein solches Modell einer Wissensstruktur <strong>zum</strong> einen eine gemeinsame Verständnisgrundlage<br />
derselben schaffen und <strong>zum</strong> anderen als bedeutungsdefinierende<br />
Komponente in wissensverarbeitenden Informationssystemen eingesetzt werden kann.
Kapitel B: Ontologie-Entwicklung 23<br />
B Ontologie-Entwicklung<br />
Anschließend an die Erfassung der Charakteristika ontologiebasierter Wissensmodellierung<br />
werden in diesem Kapitel die wesentlichen Aspekte der Ontologie-Entwicklung<br />
erarbeitet, wobei der Fokus vor allem auf der Erfassung der Problemstellungen bei der<br />
Konstruktion solcher bedeutungsdefinierender Konstrukte liegen soll. Dies erfordert eine<br />
alle wesentlichen Aspekte umfassende Betrachtung der Entwicklung von Ontologien in<br />
der Praxis, da nur so das für die Untersuchung der Verwendung von Ontologien im<br />
Semantic Web benötigte Verständnis dieses Verfahrens der Wissensmodellierung erlangt<br />
werden kann. Die Erarbeitung dieses Themengebiets an Hand eines entsprechenden<br />
Beispiels würde einerseits einen beträchtlichen Aufwand zur Erläuterung desselben<br />
erfordern und andererseits nur eine partielle Beleuchtung der zu betrachtenden Aspekte<br />
erlauben. Daher wird hier auf eine solche Vorgehensweise verzichtet und stattdessen die<br />
relevant erscheinenden Errungenschaften des sogenannten „Ontology Engineering“ (vgl.<br />
Noy01) herausgearbeitet, wodurch ein vertiefendes Verständnis von Ontologien erreicht<br />
werden soll.<br />
Unter dem Begriff des Ontology Engineering werden seit Anfang der 1990er Jahre<br />
Forschungsaktivitäten zusammengefasst, die sich vornehmlich mit der Entwicklung von<br />
Ontologien beschäftigten. Wie im Software Engineering oder im Knowledge Engineering<br />
(s. A.1.2) wird dabei das Ziel verfolgt, wissenschaftlich fundierte Methodologien für die<br />
Praxis auszuarbeiten. Schwerpunktmäßig wird dabei umsetzungstechnischen Fragestellungen<br />
nachgegangen, für die entsprechende Lösungsansätze erarbeitet sowie unterstützende<br />
Techniken und Werkzeuge entwickelt werden. Auch hierbei werden methodologische<br />
Verfahrensmodelle angestrebt, welche die Entwicklung von Ontologien als<br />
eine ingenieursartige Tätigkeit erleichtern und eine entsprechende Qualitätssicherung<br />
gewährleisten sollen. Allerdings werden die Erkenntnisse dieser relativ jungen Disziplin als<br />
noch nicht in dem Maße ausgereift betrachtet wie jene des Software Engineering oder des<br />
Knowledge Engineering (s. Gómez-Pérez99, S. 1f).<br />
Die Erarbeitung der zu betrachtenden Aspekte in diesem Kapitel wird in zwei aufeinander<br />
aufbauenden Teilen vorgenommen. Zunächst wird der in verschiedene Phasen zu<br />
unterteilende Prozess zur Entwicklung einer Ontologie beschrieben. Dabei werden<br />
Lösungsansätze für die wesentlichen Aktivitäten jeder Phase aus unterschiedlichen Forschungsansätzen<br />
zusammengetragen, womit die umfassende Betrachtung dieser grundlegenden<br />
<strong>Thema</strong>tik erreicht werden soll. Daran anknüpfend werden weiterführende<br />
Errungenschaften angeführt, durch deren Berücksichtigung bei der Entwicklung einer<br />
Ontologie deren funktionale Qualität als bedeutungsdefinierende Erfassung einer<br />
Wissensdomäne sichergestellt, beziehungsweise gefördert werden soll. Abschließend wird<br />
der derzeitige Kenntnisstand des Ontology Engineering zusammengefasst und es werden<br />
zukünftige Forschungsziele aufgezeigt.
Kapitel B: Ontologie-Entwicklung 24<br />
B.1 Ontologie-Entwicklungs-Prozess 43<br />
Im Entwicklungsprozess werden die nötigen Aktivitäten zur Entwicklung einer Ontologie<br />
identifiziert und es wird eine Reihenfolge für deren Bearbeitung festgelegt. Daraus geht<br />
ein in aufeinander aufbauende, sukzessiv zu erarbeitende Phasen gegliedertes Vorgehensmodell<br />
für die Ontologie-Entwicklung hervor – ähnlich entsprechender Methodologien<br />
des Software oder Knowledge Engineering. Dazu wurden in verschiedenen Forschungsgruppen<br />
methodologische Ansätze entwickelt, von denen hier die Ansätze von ´Uschold,<br />
King´, ´Grüninger, Fox´ und ´METHONTOLOGY´ vorgestellt werden. Dabei ist an<strong>zum</strong>erken,<br />
dass diese drei Ansätze jeweils eine Verallgemeinerung von Vorgehensweisen<br />
beschreiben, die zur Entwicklung von Ontologien in konkreten Anwendungsprojekten<br />
verfolgt wurden. Daher sind sie nicht als ausgereifte Methodologien im Sinne einer<br />
wissenschaftlich fundierten Methodik für die Ontologie-Entwicklung zu verstehen,<br />
sondern lediglich als erste Ansätze zur Entwicklung einer solchen. 44 Trotzdem lassen sich<br />
gemeinsame, in allen drei Ansätzen erwähnte Phasen für die Entwicklung von Ontologien<br />
bestimmen, welche in den weiteren Ausführungen jeweils detaillierter besprochen werden.<br />
Die Auswahl der drei genannten methodologischen Ansätze begründet sich damit, dass<br />
darin jeweils der komplette Entwicklungsprozess betrachtet wird. Es existieren weitere<br />
Ansätze, welche allerdings jeweils nur Teilaspekte bearbeiten und daher für den hier verfolgten<br />
Zweck nicht geeignet erscheinen 45 .<br />
Als „Skelettale Methodologie 46 ” bezeichnen ´Uschold, King´ ihre Verfahrenweise der<br />
Ontologie-Entwicklung, welche aus den Erfahrungen der im Zusammenhang eines<br />
Frameworks zur Unternehmensmodellierung erstellten „Enterprise Ontology“ (vgl.<br />
Uschold+96b) als bedeutungsdefinierender Basis im oben erläuterten Sinne (s. A.2.2.1)<br />
hervorgegangen ist. Es werden vier Entwicklungsphasen unterschieden. Zunächst muss<br />
der „Zweck 47 “ der Ontologie identifiziert werden, wobei die antizipierte Anwendung und<br />
daraus resultierende Anforderungen zu spezifizieren sind. Die zweite Phase umfasst den<br />
kompletten Erstellungsprozess der Ontologie, in der drei weitere sukzessiv durchzuführende<br />
Aktivitäten differenziert werden. Durch die sogenannte „Eroberung 48 “ wird die<br />
konzeptionelle Erfassung der Struktur einer Wissensdomäne vorgenommen, diese dann in<br />
der Kodierungsphase in eine formale Darstellung überführt und als letzter Schritt werden<br />
existente Ontologien integriert. In der dritten Phase soll die Ontologie bezüglich ihrer<br />
konzeptionellen Korrektheit evaluiert und <strong>zum</strong> Schluss eine entsprechende Dokumentation<br />
zur Gewährleistung ihrer Verwendbarkeit durch Dritte erstellt werden (s. Uschold<br />
+95, S.2-4; Uschold+96, S. 14-17).<br />
43 engl.: „Ontology Development Process“ (Fernández+97, S.1).<br />
44 Obwohl die drei hier genannten methodologischen Ansätze keine ausgereiften Methodologien sind, stellen sie die<br />
erschöpfendsten Arbeiten zu dieser <strong>Thema</strong>tik dar. Hierin offenbart sich der oben angeführte momentane Erkenntnisstand<br />
des Ontology Engineering, in dem die Ausarbeitung umfassender Methodologien noch aussteht.<br />
45 Entsprechende Übersichten dieser Ansätze finden sich in (Jones+98, S. 6-12) und in ´OntoRoadmap – Index of<br />
Methodologies´ unter: http://babage.dia.fi.upm.es/ontoweb/wp1/OntoRoadMap/index/methodology.html<br />
(16.05.2002).<br />
46 engl: „Skeletal Methodology“ (Uschold+95, S.2). Damit wird deutlich, dass damit lediglich eine Grundlage für<br />
eine umfassende Methodologie geschaffen werden sollte.<br />
47 engl.: „Purpose“ (Uschold+95, S. 2).<br />
48 engl.: „Capture“ (Uschold+95, S.3).
Kapitel B: Ontologie-Entwicklung 25<br />
Die methodologische Beschreibung der Ontologie-Entwicklung durch ´Grüninger,<br />
Fox´ resultiert ebenfalls aus einem Projekt zur Unternehmensmodellierung, in dem ein<br />
externalisiertes Unternehmensmodell zur Erleichterung der Entwicklung informationstechnischer<br />
Optimierungslösungen geschaffen werden sollte. 49 Als erste Tätigkeit für die<br />
Entwicklung einer Ontologie werden in diesem Ansatz „motivierende Szenarien 50 “<br />
ermittelt, wodurch die mögliche Nutzenzugewinne verdeutlicht werden. Die Anforderungen<br />
an die Ontologie werden genauer durch sogenannte „Kompetenzfragen 51 “ spezifiziert.<br />
Darunter werden mögliche Anfragen an die Ontologie verstanden, mit denen die<br />
konzeptionelle und die inferenzielle Korrektheit evaluiert werden können. Im dritten<br />
Schritt wird die Terminologie, also die Bestandteile der Ontologie in einer formalen<br />
Sprache spezifiziert, wobei für alle Kompetenzfragen entsprechende wissensrepräsentierende<br />
Konstrukte definiert werden müssen. Dann werden die Kompetenzfragen auf der<br />
Grundlage der zuvor definierten Terminologie formalisiert und anschließend die terminologischen<br />
Erfassungen axiomatisiert, also in logischen Ausdrücken dargestellt. Abschließend<br />
werden „Vollständigkeitstheoreme 52 “ spezifiziert, welche Testszenarien bezüglich<br />
der Beantwortungsfähigkeit der Kompetenzfragen darstellen und somit eine<br />
formale Evaluation der Ontologie ermöglichen sollen (vgl. Grüninger+95).<br />
Der letzte vorzustellende Ansatz trägt die Bezeichnung METHONTOLOGY und<br />
basiert auf den Erfahrungen der Entwicklung einer Chemie-Ontologie (vgl. Fernandéz<br />
+99). Der Entwicklungsprozess beginnt mit der Spezifikationsphase, worin die antizipierte<br />
Anwendung, der zu erfassende Weltausschnitt sowie der benötigte Formalisierungsgrad<br />
der Ontologie festgehalten wird. Dann wird zunächst das benötigte Wissen<br />
akquiriert und in der anschließenden Konzeptionalisierungsphase das grundlegende konzeptionelle<br />
Modell erstellt. In dieser Phase werden auch existente Ontologien bezüglich<br />
einer möglichen Integration geprüft und das Design des konzeptionellen Modells wird<br />
dementsprechend ausgerichtet. Die Überführung in einen geeigneten Repräsentationsformalismus<br />
erfolgt in der Implementierungsphase. Die qualitative Evaluation sowie die<br />
Erstellung einer entsprechenden Dokumentation sollen als begleitende Tätigkeit während<br />
des gesamten Erstellungsprozesses durchgeführt werden, wodurch eventuelle Fehler<br />
frühzeitig behoben und die Dokumentation auf dem aktuellen Stand gehalten werden<br />
kann (vgl. Fernández+97).<br />
Wie einführend angedeutet, lassen sich offensichtlich Phasen des Ontologie-<br />
Entwicklungsprozesses auffinden, welche in allen drei vorgestellten methodologischen<br />
Ansätzen genannt und in gleicher Reihenfolge angegeben werden. Zunächst erfolgt eine<br />
Spezifikation bezüglich der antizipierten Verwendung der zu erstellenden Ontologie.<br />
Dann wird das entsprechende konzeptionelle Modell erstellt, dieses in eine formale<br />
Darstellung überführt und schließlich die Ontologie hinsichtlich ihrer konzeptionellen<br />
Korrektheit evaluiert. In Tabelle 2 sind diese vier aus den vorgestellten Ansätzen verallgemeinerten<br />
Phasen dargestellt.<br />
49 Das Projekt trägt die Bezeichnung TOVE - TOronto Virtual Enterprise (s. Grüninger+95, S. 1).<br />
50 engl.: „motivating szenarios“ (Grüninger+95, S.2).<br />
51 engl.: „compentency questions“ (Grüninger+95, S.3), abgekürzt als CQs.<br />
52 engl.: „completeness theorems“ (Grüninger+95, S.9).
Kapitel B: Ontologie-Entwicklung 26<br />
Gemeinsame<br />
Phasen<br />
´Uschold, King´ ´Grüninger, Fox´ METHONTOLOGY<br />
Spezifikation<br />
(s. B.1.1)<br />
1) Zweck der Ontologie<br />
identifizieren<br />
1) motivierende Szenarien<br />
2) Kompetenzfragen<br />
formulieren (informell)<br />
1) Spezifikation<br />
2) Wissensakquisition<br />
Konzeptionalisierung<br />
(s. B.1.2)<br />
Formalisierung<br />
(s. B.1.3)<br />
2) Erstellung der Ontologie<br />
a. Eroberung<br />
3) Terminologie-<br />
Spezifikation (formal)<br />
3) Konzeptionalisierung<br />
4) Integration<br />
b. Kodierung<br />
c. Integration<br />
4) Kompetenzfragen<br />
formalisieren<br />
5) Axiomatisierung<br />
5) Implementierung<br />
Evaluation<br />
(s. B.1.4)<br />
3) Evaluation<br />
4) Dokumentation<br />
6) Vollständigkeitstheoreme<br />
6) Evaluation<br />
7) Dokumentation<br />
Tabelle 2: Phasen des Ontologie-Entwicklungs-Prozesses<br />
Im Folgenden werden die wesentlichen Aspekte der identifizierten Phasen ausführlicher<br />
behandelt, wobei neben den drei erläuterten Ansätzen weitere relevante Forschungsergebnisse<br />
vorgestellt werden. Bezüglich der Charakteristik des Ontologie-<br />
Entwicklungsprozesses ist an<strong>zum</strong>erken, dass er auf Grund der durchzuführenden Tätigkeiten<br />
sowie der Reihenfolge einen Modellierungsprozesses gemäß des modell-basierten<br />
Ansatzes (s. A.1.1.3) darstellt. Als Lebenszyklusmodell wird jenes der „Evolving Prototypes<br />
53 “ favorisiert, da für die Erstellung einer Ontologie sowie für Korrekturen und<br />
Erweiterungen jeweils alle Phasen durchlaufen werden müssen (s. Fernández+97, S. 3f).<br />
Die hier und auch in den weiteren Ausführungen deutlich werdende Orientierung am<br />
Software Engineering ist auf den primären Verwendungszweck von Ontologien als<br />
bedeutungsdefinierender Komponente in Informationssystemen zurückzuführen.<br />
B.1.1 Spezifikation<br />
In allen drei vorgestellten methodologischen Ansätzen beginnt der Entwicklungsprozess<br />
mit einer Spezifikationsphase. Da Ontologien in sehr unterschiedlichen Anwendungsszenarien<br />
eingesetzt werden können (s. A.2.2.2), ist eine klassifizierende Zuordnung einer<br />
zu entwickelnden Ontologie zu einem vordefinierten Anwendungsgebiet nur begrenzt<br />
möglich (s. Uschlod+95, S. 2). Somit kann lediglich als vage Aussage festgehalten werden,<br />
dass das spezifische Einsatzgebiet sowie die daraus resultierenden Anforderungen an eine<br />
Ontologie zu Beginn deren Entwicklung zu erfassen sind.<br />
Als der Spezifikation vorgelagerte Aktivität ist zunächst eine Durchführbarkeitsstudie<br />
durchzuführen, in welcher der Entwicklungsumfang aus managerialer Sicht erfasst wird.<br />
Wird die Durchführung des Projektes entschieden, so kann die hierbei entstehende erste<br />
Erfassung der Spezifika der Ontologie als Grundlage zur Verfeinerung in den nachfolgenden<br />
Schritten genutzt werden. 54<br />
53 Evolving Prototypes: Lebenszyklusmodell (= Entwicklungsphasen eines Softwaresystems von der ersten Idee bis<br />
<strong>zum</strong> Einsatz), welches sequentiell-linare und zyklische Aspekte verbindet. Dabei müssen für jede Änderung alle<br />
Entwicklungsphasen sequentiell durchlaufen werden, bevor die nächste Änderung vorgenommen werden kann.<br />
Dieses Lebenszyklusmodell beschreibt Systeme, deren funktionale Qualität sich in ihrer konzeptionellen Geschlossenheit<br />
manifestiert (s. Draheim00, S. 52-61).<br />
54 Für die Durchführbarkeitsstudie können existente Verfahren aus dem Bereich des Knowledge Engineering<br />
verwandt werden, da deren Aussagekraft auf Grund der gleichartigen Anforderungen auch für die Ontologie-<br />
Entwicklung bestehen bleibt. (Schnurr+00) favorisieren dazu das Verfahren der CommonKADS-Methodologie (s.
Kapitel B: Ontologie-Entwicklung 27<br />
B.1.1.1 Anforderungsanalyse<br />
In den drei vorgestellten methodologischen Ansätzen wird die Anforderungsanalyse zwar<br />
einheitlich als erste durchzuführende Tätigkeit bei der Ontologie-Entwicklung angeführt,<br />
jedoch mit jeweils unterschiedlichen Herangehensweisen. Während ´Uschold, King´ lediglich<br />
die Notwendigkeit einer Festlegung des Zwecks der Ontologie ohne die Nennung<br />
einer entsprechenden Methodik betonen (s. Uschold+95, S. 2), wird im Ansatz von<br />
´Grüninger, Fox´ ein explizites Verfahren zur Anforderungsspezifikation mittels der<br />
Kompetenzfragen gegeben (s. Grüninger+95, S. 1f). In METHONTOLGY wird die<br />
Erstellung eines Spezifikationsdokumentes verlangt, welches die benötigten Informationen<br />
enthält (s. Fernández+97, S. 4).<br />
Ein derartiges Dokument scheint eine gehaltvolle Spezifikation zu erlauben, da in<br />
bewährten Methodologien des Knowledge oder Software Engineering ebensolche eingesetzt<br />
werden. Daher soll der Aufbau eines solchen Dokuments für die Ontologie-<br />
Entwicklung am Beispiel des „Anforderungs-Spezifikations-Dokumentes 55 “ von On-To-<br />
Knowledge 56 eingehender betrachtet werden. Dieses Dokument enthält natürlichsprachliche<br />
Kurzbeschreibungen des Verwendungsziels, der relevanten Wissensdomäne und der<br />
antizipierten Einsat<strong>zum</strong>gebung, sowie Auflistungen der wesentlichen Aspekte der zu<br />
erstellenden Ontologie (s. Schnurr+00, S. 26-28). Eine derartig strukturierte Erfassung der<br />
wesentlichen Informationen erlaubt einen umfassenden Überblick der Charakteristika der<br />
zu entwickelnden Ontologie.<br />
B.1.1.2 Wissensakquisition<br />
Zur Erstellung einer Ontologie wird natürlich auch das entsprechende Wissen über den<br />
zu erfassenden Weltausschnitt benötigt. Dessen Erwerb ist allerdings keine spezifische<br />
Tätigkeit der Ontologie-Entwicklung, sondern eine generell durchzuführende Tätigkeit bei<br />
der Entwicklung von Informationssystemen. Daher kann erstens auf bekannte Techniken<br />
des Wissenserwerbs verwiesen und zweitens die Betrachtung dieses Aspekts mit einer<br />
Übersicht der wichtigsten Verfahren in Tabelle 3 abgeschlossen werden.<br />
Erwerbstechnik<br />
Interview<br />
Textanalyse<br />
Data Mining<br />
Wissenseingabe<br />
Beschreibung<br />
Der Wissensingenieur befragt einen Experten und arbeitet die Erkenntnisse<br />
mit analytischen Methoden auf.<br />
Analyse von Dokumenten, welche die benötigte Wissensstruktur der<br />
Domäne beschreiben.<br />
Auswertung in elektronischer Form vorliegender Daten, vornehmlich für<br />
statistische Informationen.<br />
Direkte Eingabe des benötigten Wissens durch einen Experten in ein vom<br />
Wissensingenieur vordefiniertes Domänenmodell.<br />
Tabelle 3: Techniken des Wissenserwerbs 57<br />
A.1.2.2.1), worin nach der Erfassung des Anwendungsumfeldes im Organisationsmodell eine Entscheidung bezüglich<br />
der Durchführbarkeit des Projektes gefällt werden kann (s. Schreiber+00, S. 28-35).<br />
55 engl.: „requirement specification dodument“ (Schnurr+00, S. 26). Ein Werkzeug zur Erstellung dieses Dokuments<br />
wird mit „OntoKick“ bereitgestellt (vgl. Boyens01).<br />
56 Das Forschungsprojekt ´On-To-Knowledge´ beschäftigt sich mit der Verwendung von Ontologien im Wissensmanagement.<br />
Der darin verfolgte methodologische Ansatz zur Ontologie-Entwicklung erweitert die Herangehensweise<br />
von METHONTOLOGY (s.o.). Eine ausführliche Darstellung findet sich in (Schnurr+00) und unter:<br />
http://www.ontoknowledge.com (12.07.2002).<br />
57 nach (Puppe+00, S. 606-617). Eine ausführliche Diskussion der allgemeinen Verfahren und Problemstellungen des<br />
Wissenserwerbs sowie Vor- und Nachteile der Techniken finden sich in (Schreiber+00, S. 187-213). Im Übrigen sind
Kapitel B: Ontologie-Entwicklung 28<br />
B.1.2 Konzeptionalisierung<br />
Aufbauend auf der Spezifikationsphase wird als nächstes das konzeptionelle Modell der<br />
Ontologie erstellt. Darin werden die im Hinblick auf den Verwendungszweck relevanten<br />
Wissensstrukturen der Domäne in einem geeigneten Abstraktionsgrad erfasst und somit<br />
das Design, also der Aufbau und Inhalt der Ontologie bestimmt. Die Konzeptionalisierungsphase<br />
stellt den eigentlichen Modellierungsprozess dar, da hierin das externalisierte<br />
Verständnismodell der Wissensdomäne in einer modellhaften Darstellung im Sinne<br />
des Modellbasierten Ansatzes (s. A.1.1.3) erarbeitet wird. Dabei treten sehr komplexe und<br />
stark interdependente Problemstellungen auf. Erstens soll das konzeptionelle Modell eine<br />
Beschreibung der Domäne auf der Wissensebene (s. A.1.1.1) darstellen, zweitens soll diese<br />
Erfassung explizit, also eindeutig definiert sein, und drittens als geteilte Konzeptionalisierung<br />
einen durch die Beteiligten der Wissensdomäne akzeptierten Konsens des<br />
Verständnisses derselben beinhalten (s. A.2.1.1).<br />
Während die beiden erstgenannten Aspekte sich vornehmlich auf die modellierungstechnische<br />
Herangehensweise der Ontologie-Entwickler beziehen, wird mit der Geteiltheitsforderung<br />
ein sozialer Aspekt angesprochen. Die Schaffung eines gemeinschaftlich<br />
akzeptierten Konsens über die Beschaffenheit einer Wissensdomäne erfordert die<br />
Bereitschaft und Mitarbeit aller Beteiligten und stellt somit eine klassische Aufgabe des<br />
Wissensmanagement dar. Ohne im Detail auf die dabei auftretenden Problemstellungen<br />
einzugehen 58 , soll hier ein aus dem Kontext des Wissensmanagements hervorgegangenes<br />
Prozessmodell zur Erstellung der Konzeptionalisierung vorgestellt werden. Dabei erstellt<br />
der Ontologie-Entwickler basierend auf der Anforderungsspezifikation eine initiale Ontologie,<br />
welche an Hand des in der Wissensakquisition erworbenen Wissens detaillierter<br />
ausgearbeitet wird. Daran schließt sich ein iterativer Prozess an, in dem in direkter<br />
Zusammenarbeit mit den Beteiligten deren Verständnis der Domäne solange mit dem in<br />
der Ontologie dargestellten Verständnismodells abgeglichen wird, bis ein entsprechender<br />
Konsens erreicht ist (s. Holsapple+02, S. 44-46).<br />
Dieses Prozessmodell verdeutlicht, wie komplex und aufwendig die Erstellung des<br />
konzeptionellen Modells als Grundlage einer qualitativ hochwertigen Ontologie ist. Da<br />
eine vertiefende Betrachtung der Problematik der Konsensfindung jedoch über die<br />
Errungenschaften des Ontology Engineering und damit über den hier behandelten<br />
inhaltlichen Schwerpunkt hinausgeht, sollen im Folgenden methodologische Aspekte im<br />
Vordergrund der Betrachtungen stehen. Dazu werden die grundlegenden Modellierungsprimitive<br />
einer Ontologie vorgestellt, die Zielsetzung der Konzeptionalisierung in der<br />
Ontologie-Entwicklung herausgearbeitet und anschließend entsprechende Repräsentationsschemata<br />
vorgestellt.<br />
diese Techniken des Wissenserwerbs im Knowledge Engineering jenen des Datenerwerbs der empirischen<br />
Sozialforschung sehr ähnlich – siehe dazu: Diekmann, A.: Empirische Sozialforschung. Grundlagen, Methoden,<br />
Anwendungen. 4. durchges. Aufl. Reinbeck: Rowohlt 1995, S. 371-516).<br />
58 Hierbei sind vor allem die Bereitschaft zur Wissensteilung durch die Beteiligten, das Finden eines allgemeinen<br />
Verständnisses sowie die persönliche Akzeptanz des operationalen Nutzenzugewinns durch Schaffung neuartiger<br />
Strukturen zu nennen. Ausführliche Abhandlungen zu diesen Themen finden sich in der einschlägigen Fachliteratur,<br />
siehe u. a.: Kurtzke, C.; Popp, P.: Das wissensbasierte Unternehmen. Praxiskonzepte und Management-Tools.<br />
München: Hanser 1999.
Kapitel B: Ontologie-Entwicklung 29<br />
B.1.2.1 Modellierungsprimitive<br />
Zur Erstellung eines konzeptionellen Modells als Grundlage einer Ontologie werden<br />
Modellierungsprimitive benötigt, die den Anforderungen an Bedeutungspostulate im<br />
Sinne des ontologischen Levels der Wissensrepräsentation (s. A.2.1.2) genügen. Hier<br />
werden lediglich die grundlegenden Primitive kurz eingeführt, um eine terminologisch einheitliche<br />
Verwendung in den weiteren Ausführungen zu gewährleisten. Ein vertiefendes<br />
Verständnis zur korrekten Verwendung dieser Primitive soll im Rahmen der Meta-<br />
Modellierung erarbeitet werden (s. B.2.2).<br />
Schon öfters erwähnt wurde das Primitiv Konzept, welches zur Erfassung der grundlegenden<br />
Objekte einer Wissensdomäne dient (s. Uschold+95, S. 1). Mit einem Konzept<br />
kann sowohl der Typ eines realen Objektes als auch ein Verständnismodell im Sinne eines<br />
semiotischen mentalen Konzeptes (s. A.2.2.1) beschrieben werden. Konkrete Ausprägungen<br />
eines Konzeptes werden als Instanz bezeichnet. Die Eigenschaften von Konzepten<br />
und Instanzen werden durch sogenannte Properties 59 und Attribute beschrieben. Als<br />
Property wird dabei eine inhärente Eigenschaft eines Konzeptes oder einer Instanz verstanden,<br />
während ein Attribut eine funktionale Zuschreibung des Wertes eines anderen<br />
Konzeptes darstellt (s. KBSI-94, S.16f). 60 Das Primitivum zur Beschreibung der nichtcharakterisierenden<br />
Beziehungen zwischen Konzepten und Instanzen wird als Relation<br />
bezeichnet (s. Fernández+97, S.6). Tabelle 4 fasst die definitorischen Erfassungen dieser<br />
Basis-Modellierungsprimitive zusammen.<br />
Primitivum Verwendung zur Modellierung von ...<br />
Konzept<br />
Objekttyp / mentales Verständniskonstrukt<br />
Instanz<br />
Konkrete Ausprägung eines Konzeptes<br />
Property / Attribut Erfassung der Eigenschaften von Konzepten / Instanzen<br />
Relation<br />
Nicht-charakterisierende Beziehung zwischen Konzepten / Instanzen<br />
Tabelle 4: Modellierungsprimitive ontologiebasierter Wissensmodellierung<br />
B.1.2.2 Zielsetzung der Konzeptionalisierung<br />
Bei den vorgestellten Modellierungsprimitiven ist die definitorische Ähnlichkeit, ja sogar<br />
Äquivalenz mit entsprechenden Begrifflichkeiten aus dem Software Engineering sehr<br />
auffällig. Diese findet sich auch in weiterführenden Aspekten wie der taxonomischen<br />
Strukturierung als ein Kernaspekt der Modellierung oder im Umgang mit komplexen<br />
Konzepten wieder und bedarf daher einer genaueren Betrachtung. Dazu soll an dieser<br />
Stelle der wesentliche Unterschied zwischen Datenbank-Schemata, beziehungsweise<br />
objektorientierter Modellierung und einem konzeptionellen Modell als Grundlage einer<br />
Ontologie herausgearbeitet werden.<br />
Die schematische Erfassung der Struktur des relevanten Weltausschnittes in einem<br />
Modell des konventionellen Software Engineering dient der Abbildung dieses Ausschnitts<br />
59 Hier wird der englische Begriff als Terminus Technicus beibehalten, da der Gebrauch des deutschen Begriffs<br />
´Eigenschaften´ eine hohe Gefahr für begriffliche Unklarheit birgt.<br />
60 Dieser Unterschied kann an folgendem Beispiel der Beschreibung der Farbe eines Objektes verdeutlicht werden.<br />
Als Property wird dieses wie folgt ausgedrückt: OBJEKT – IST – ROT; als Attribut würde die Beschreibung<br />
OBJEKT – HAT_FARBE – ROT ausgedrückt. Während in der ersteren Darstellung die Farbe eine direkte Eigenschaft<br />
des Objektes darstellt, wird im letzteren dem Objekt die Instanz ROT des Konzeptes FARBE als Eigenschaft<br />
zugewiesen (s. KBSI-94, S.16).
Kapitel B: Ontologie-Entwicklung 30<br />
in einer Darstellungsform gemäß dem Datenmodell, welches durch die verwendete Technologie<br />
verarbeitet werden kann. In der Welt der relationalen Datenbanken werden die<br />
Strukturen der realen Welt in einem Entity-Relationsship-Diagramm erfasst, welches zwar<br />
nur eine geringe semantische Aussagekraft hat, die Informationen aber im relationalen<br />
Datenmodell darstellt und somit deren Verarbeitung durch die Datenbanktechnologie<br />
ermöglicht (s. O´Neil+01, S. 329-396). Ähnlich verhält es sich bei der Erstellung des<br />
Analysemodells in der objektorientierten Software-Entwicklung. Der Weltausschnitt wird<br />
in Objektstrukturen derart erfasst, dass das Modell als Basis zur Entwicklung entsprechender<br />
Applikationen unter Verwendung objektorientierter Technologien dienen<br />
kann (s. Balzert99, S. 17-88).<br />
Im Gegensatz zu einer solchen technologisch determinierten Modellierung soll ein<br />
konzeptionelles Modell als Basis der Ontologie-Entwicklung die Struktur der realen Welt<br />
selber beschreiben. Das heißt, dass mittels der beschriebenen Modellierungsprimitive das<br />
externalisierte und gemeinsam akzeptierte Verständnismodell über das Wesen des betrachteten<br />
Weltausschnitts erfasst werden und nicht die Struktur der Wissensdomäne in<br />
ein technologisch konzipiertes Modell zur Weltinterpretation überführt werden soll. Das<br />
dabei entstehende konzeptionelle Modell beschreibt die Beschaffenheit der Wissensdomäne<br />
als Ergebnis eines Modellierungsprozesses, in dem die Wissensstrukturen<br />
analysiert werden. Dieses Modell wird als „ontologische Theorie 61 “ bezeichnet, da es ein<br />
objektives oder <strong>zum</strong>indest intersubjektives Verständnismodell der Wissensstrukturen der<br />
Domäne darstellt.<br />
Trotz dieses fundamentalen Unterschiedes in der Zielsetzung der konzeptionellen<br />
Erfassung können für die Ontologie-Entwicklung gleichartige Modelle und damit gleichartige<br />
Modellierungsprimitive wie im Software Engineering genutzt werden. Wesentlich ist<br />
lediglich die Unterscheidung der verfolgten Intentionen. Die Erfassbarkeit des Verständnismodells<br />
einer Wissensdomäne mit Hilfe von klassifizierenden und assoziierenden<br />
Darstellungen wird mit Bezug auf psychologische Untersuchungen gerechtfertigt, in<br />
denen derartige Vorgehensweisen auch für die menschliche Wahrnehmung nachgewiesen<br />
wurden (s. Luger01, S. 227f).<br />
B.1.2.3 Repräsentationsschemata<br />
Zur Erstellung eines konzeptionellen Modells wird eine Darstellungsform im Sinne eines<br />
Repräsentationsschemas benötigt (s. A.1.1.2). Dabei ist insbesondere das Potenzial zur<br />
expliziten Bedeutungserfassung der identifizierten Wissensstrukturen in der Domäne für<br />
die Eignung eines Repräsentationsschemas für diesen Zweck ausschlaggebend.<br />
Bei der diesbezüglichen Betrachtung der drei einleitend vorgestellten methodologischen<br />
Ansätze zur Ontologie-Entwicklung ist festzustellen, dass jeweils die Wichtigkeit<br />
der Konzeptionalisierungsphase betont wird. Es werden allerdings sehr unterschiedliche<br />
Herangehensweisen in den einzelnen Ansätzen vorgeschlagen. ´Uschold,<br />
King´ behandeln ausführlich die sogenannte „Prozedur zur Ontologie-Eroberung 62 “, in<br />
61 engl.: „ontological theory“ (Uschold+95, S, 1). Allgemeiner wird ein Erklärungsmodell einer Wissensdomäne als<br />
Domänentheorie bezeichnet (s. A.2.1.1).<br />
62 engl.: „A Procedure for Ontology Capture“ (Uschold+95, S, 9).
Kapitel B: Ontologie-Entwicklung 31<br />
dem sie Schritte zur Erstellung des konzeptionellen Modells differenzieren und für jeden<br />
Schritt entsprechende „Vorgehensrichtlinien 63 “ angeben (s. Uschold+95, S. 9-11). Diese<br />
Prozedur stellt ein praxisorientiertes Vorgehensmodell für die Konzeptionalisierung, aber<br />
kein Repräsentationsschema im hier verstandenen Sinne dar. Bei ´Grüninger, Fox´ wird<br />
gar kein explizites konzeptionelles Modell entworfen, sondern der Ontologie-Entwickler<br />
definiert in der Terminologie-Spezifikations-Phase die benötigten Wissensstrukturen der<br />
Domäne an Hand der zuvor erstellten Kompetenzfragen direkt in einer formalen Darstellung<br />
(s. Grüninger+95, S. 5). Hier wird also die Erstellung des konzeptionellen<br />
Modells implizit durch den Entwickler ohne eine vorgelagerte modellhafte Erfassung<br />
vorgenommen.<br />
In der Konzeptionalisierungsphase von METHONTOLOGY werden mittels sogenannter<br />
„intermediärer Repräsentationen 64 “ die aufgefundenen Wissensstrukturen in einer<br />
standardisierten Darstellung erfasst. Dazu werden für die einzelnen Modellierungsprimitive<br />
spezifische Tabellen verwendet, in denen die benötigten Informationen in natürlicher<br />
Sprache festgehalten werden (s. Gómez-Pérez+96, S. 2-11). Die Erstellung dieser Tabellen<br />
erfolgt sukzessiv gemäß einem Vorgehensmodell ähnlich dem genannten Ontologie-<br />
Eroberungs-Prozess von ´Uschold, King´. Es werden zunächst die Konzepte erfasst und<br />
in einer Taxonomie geordnet, dann die Attribute und Properties beschrieben und<br />
anschließend die Relationen erfasst (s. Gómez-Pérez+96, S. 2), so dass die konzeptionelle<br />
Erfassung der Domäne sukzessiv von der Bestimmung der Konzepte bis hin zu den<br />
Relationen verfeinert wird. Die Darstellung der Wissensstrukturen mittels derartiger intermediäre<br />
Darstellungen kann dann auf Grund der Standardisierung der Erfassungstabellen<br />
für eine automatisierte Formalisierung verwendet werden. 65<br />
Trotz der in den Ansätzen herausgestellten Wichtigkeit der Konzeptionalisierung ist es<br />
erstaunlich, dass mit Ausnahme von METHONTOLOGY keine geeigneten Repräsentationsschemata<br />
für die Erstellung des konzeptionellen Modells einer Ontologie vorgestellt<br />
werden. Dies kann eventuell auf die Abstinenz ausgereifter Methodologien zurückgeführt<br />
werden, wobei dieser Aspekt in der Literatur nicht aufgegriffen wird und somit die Suche<br />
nach Begründungen rein spekulativen Charakter hätte. Es ist allerdings an<strong>zum</strong>erken, dass<br />
bei der Darstellung des konzeptionellen Modells durch die intermediären Repräsentationen<br />
von METHONTOLOGY keine visuelle Darstellung desselben erfolgt. Dadurch<br />
kann das Modell bei wachsendem Umfang schnell unübersichtlich werden und die oben<br />
als wesentliche Herausforderung vorgestellte gemeinsame Erarbeitung durch den<br />
Ontologie-Entwickler und Beteiligte der Domäne auf Grund mangelnden technischen<br />
Verständnisses sich als äußerst schwierig erweisen. Eine solche Visualisierungsmethode<br />
erscheint auch vor dem Hintergrund sinnvoll, dass in den vergleichbaren Methodologien<br />
63 engl.: „Guidelines“ (Uschold+95, S, 11).<br />
64 engl.: „intermediate representations“ (Fernández+97, S. 2).<br />
65 Für die automatische Generierung der formalen Darstellung einer Ontologie aus den intermediären Repräsentationen<br />
wurde das ´Ontolgy Design Environment´ entwickelt, das die Überführung in verschiedene Repräsentationsformalismen<br />
ermöglicht (s. Fernandéz+99, S. 43-45). Dieser Ansatz wird auch von anderen Ontologie-Entwicklungs-<br />
Werkzeugen verfolgt, von denen die bekanntesten hier aufgeführt werden sollen.<br />
1) OntoEdit der Firma ontoprise: Die Demoversion 2.5 ist unter: http://www.ontoprise.de (15.08.2002) erhältlich.<br />
2) Protégé2000: Shareware, erhältlich unter: http://protege.semanticweb.org/download.html (08.06.2002).<br />
3) OilEd: Shareware, erhältlich unter: http://oiled.man.ac.uk (16.07.2002).
Kapitel B: Ontologie-Entwicklung 32<br />
des Software und Knowledge Engineering ebensolche verwandt werden. Aus diesem<br />
Grund soll hier die visualisierende Darstellung des konzeptionellen Modells aus der<br />
IDEF5 66 -Methodologie vorgestellt werden.<br />
In der sogenannten „schematischen Sprache 67 “ von IDEF5 sind Repräsentationssymbole<br />
für die einzelnen Modellierungsprimitive definiert, so dass strukturelle Zusammenhänge<br />
der aufgefundenen Wissenselemente visualisiert werden können. Dabei sind<br />
die Bedeutungen der Symbole vordefiniert, so dass eine eindeutige semantische Definition<br />
der Begrifflichkeiten sichergestellt ist. Abbildung 6 zeigt beispielhaft die Darstellung einer<br />
´Teil-von´– Relation. Die Konzepte sind als Kreise mit jeweiligen Bezeichnern dargestellt<br />
und die Relation als gerichtete, bipolare Verknüpfung mit der entsprechenden Bezeichnung.<br />
68 Da mit dieser Darstellungsmethode den Anforderungen an Repräsentationsschemata<br />
entsprochen wird (s. A.1.1.2) und außerdem die Darstellung von Bedeutungspostulaten<br />
bezüglich des ontologischen Levels der Wissensrepräsentation (s. A.2.1.2)<br />
möglich ist, kann es als geeignete Visualisierungsmethodik für die Konzeptionalisierungsphase<br />
der Ontologie-Entwicklung bezeichnet werden.<br />
Abbildung 6: Beispiel IDEF5-Modellierung 69<br />
B.1.3 Formalisierung<br />
In der dritten Phase des Ontologie-Entwicklungsprozesses wird das konzeptionelle<br />
Modell in eine formale Darstellung überführt, so dass die Maschinenlesbarkeit der Ontologie<br />
gewährleistet ist. Dazu werden spezifische Repräsentationsformalismen (s. A.1.1.2)<br />
verwandt, welche auf Grund ihrer Fähigkeit zur formalen Spezifikation von Ontologien<br />
auch als „Ontologie-Spezifikations-Sprachen 70 “ bezeichnet werden. In dieser Phase wird<br />
mit der Erstellung einer maschinenlesbaren Darstellung von Ontologien deren primäres<br />
Verwendungsziel als bedeutungsdefinierende Komponente in computergestützten<br />
Informationssystemen realisiert, weswegen die Forschungsaktivitäten auf diesem Feld<br />
weiter fortgeschritten sind als in anderen Phasen. Dabei ist für den hier untersuchten<br />
Zusammenhang kein Vergleich existenter Spezifikationsformalismen hinsichtlich deren<br />
Repräsentationsfähigkeiten interessant, sondern vielmehr eine genauere Betrachtung der<br />
66<br />
IDEF5 Ontology Description Capture Method: Methodologie zur Ontologie-Entwicklung aus dem IICE<br />
(Information Integration for Concurrent Engineering) – Projekt der KBSI (Knowledge Based Systems, Inc.), Texas,<br />
USA. Dieser Ansatz bietet eine methodologische Beschreibung des Ontologie-Entwicklungsprozesses, welcher eine<br />
differenzierte Betrachtung der Modellierungsprimitive, einen Erstellungsprozess für Ontologien und ein graphisches<br />
Repräsentationsschema sowie einen entsprechenden Repräsentationsformalismus beinhaltet (vgl. KBSI-94). Obwohl<br />
dieser Ansatz zeitlich vor den drei hier behandelten entwickelt wurde, wird er in der Literatur aus nicht direkt<br />
nachvollziehbaren Gründen nur selten erwähnt. Daher wird er hier lediglich ergänzend aufgeführt und nicht als<br />
methodologische Basis herangezogen. Weitere Informationen finden sich unter: http://www.idef.com (15.08.2002).<br />
67 engl.: „schematic language“ (KBSI-94, S. 64).<br />
68 Eine ausführliche Darstellung der Repräsentationssymbole und deren Verwendung findet sich in (KBSI-94, S. 64-<br />
101). Dabei werden auch mögliche Lösungen zur Modellierung komplexer Konzepte und Zusammenhänge gegeben,<br />
welche von Ontologie-Entwicklern als Referenz genutzt werden können - ähnlich wie Analysemuster aus dem Bereich<br />
des objektorientierten Software Engineering (s. Balzert99, S. 89-118).<br />
69 entnommen aus: (KBSI-94, S. 70).<br />
70 engl.: „Ontology Specification Languages“ (s. Corcho+00, S. 1).
Kapitel B: Ontologie-Entwicklung 33<br />
Anforderungen an derartige Repräsentationsformalismen – insbesondere im Hinblick auf<br />
die Analyse der webbasierten Ontologie-Spezifikations-Sprachen als entsprechende Formalismen<br />
für die formale Darstellung von Ontologien im Semantic Web (s. D.2). Dazu<br />
werden im Folgenden die wesentlichen Bewertungskriterien für Ontologie-Spezifikations-<br />
Sprachen erläutert und als entsprechendes Beispiel das Ontolingua-System vorgestellt,<br />
welches sich als Quasi-Standard für die formale Spezifikation von Ontologien etabliert<br />
hat.<br />
B.1.3.1 Anforderungen an Ontologie-Spezifikations-Sprachen<br />
Die Anforderungen an einen als Ontologie-Spezifikations-Sprache verwendbaren Repräsentationsformalismus<br />
lassen sich derart zusammenfassen, dass sie den Anforderungen an<br />
derartige Formalismen im Allgemeinen 71 genügen und eine Repräsentation von Wissensstrukturen<br />
auf dem ontologischen Level (s. A.2.1.2) erlauben müssen. Konkreter bedeutet<br />
dies, dass die in der Konzeptionalisierungsphase erfassten Strukturen der Wissensdomäne<br />
korrekt in die formalen Spezifikation übertragbar sein müssen und dass die Eindeutigkeit<br />
der entstandenen Ausdrücke durch eine entsprechende formale Semantik des Formalismus<br />
(s. A.1.1.2) gewährleistet sein soll. Während der letztere Aspekt bei den zur Verfügung<br />
stehenden Sprachen als gegeben angesehen werden kann, besteht die wesentliche<br />
Aufgabe des Ontologie-Entwicklers in der Auswahl eines geeigneten Formalismus<br />
hinsichtlich des ersteren Aspekts. Daher sollen die dazu erforderlichen Kenntnisse zur<br />
Bewertung der Spezifikationsfähigkeit einer solchen Sprache hier genauer untersucht<br />
werden.<br />
B.1.3.1.1 Spezifikationsfähigkeit<br />
Für die Bewertung der Ausdrucksstärke einer Ontologie-Spezifikations-Sprache sind<br />
deren Darstellungsmöglichkeiten für Modellierungsprimitive sowie für die im konzeptionellen<br />
Modell erfassten Zusammenhänge (s. B.1.2) zu betrachten. Dazu sollen hier<br />
Kriterien erläutert werden, die für einen Vergleich von Ontologie-Spezifikations-Sprachen<br />
herangezogen wurden (vgl. Corcho+00).<br />
Zunächst ist die Qualität der formalen Erfassung für die oben erläuterten Modellierungsprimitive<br />
zu bewerten. Zur Definition eines Konzeptes ist zu beachten, ob<br />
entsprechende Metaklassen zur Beschreibung des Konzeptes definiert werden können<br />
und damit die Darstellung einer taxonomischen Struktur der Konzepte möglich ist. Dabei<br />
kommt der Behandlung von Taxonomien besondere Bedeutung zu, da die taxonomische<br />
Struktur einer Ontologie konstituierenden Charakter hat und daher die darin erfassten<br />
Zusammenhänge richtig bezüglich der intendierten Bedeutung und explizit bezüglich ihrer<br />
eindeutigen Interpretation ausgedrückt werden müssen. 72 Für die Handhabung von Instanzen<br />
ist zu prüfen, ob diese sich als Unterklassen von Konzepten erzeugen lassen und<br />
71 Die allgemeine Anforderungen an Repräsentationsformalismen (zusammenfassend aus: A.1.1.2) sind:<br />
(1) qualitatives Wissen beschreiben,<br />
(2) neues Wissen durch inferenzielle Verknüpfungen generieren,<br />
(3) allgemeine und spezielle Zusammenhänge darstellen,<br />
(4) komplexe semantische Bedeutungen beschreiben und<br />
(5) Metawissen darstellen können.<br />
72 Es sind verschiedene Arten von Beziehungen zwischen Entitäten in einer Ontologie zu differenzieren, z.B. „is-a“ –<br />
und „is-part-of“ – Relationen. Eine genauere Betrachtung dieser Problematik wird in (B.2.2) vorgenommen.
Kapitel B: Ontologie-Entwicklung 34<br />
in wieweit ein Vererbungsmechanismus für zugehörige Attribute, Properties und Relationen<br />
unterstützt wird. Da Attribute und Properties zur Beschreibung von Eigenschaften<br />
der Konzepte und Instanzen verschiedenartige Charakteristika aufweisen können, sollten<br />
die diesbezüglichen Ausdrucksfähigkeiten der Sprache beachtet werden. Als wesentliche<br />
Aspekte seien hier die Unterscheidung von Konzept- und Instanzattributen sowie die<br />
Behandlung polymorpher Attribute, beziehungsweise Properties genannt. 73 Zur formalen<br />
Darstellung von Relationen ist zu beachten, wie diese mit Konzepten oder Instanzen<br />
verknüpft, ob Integritätsbeschränkungen angegeben und ob Definitionen für inferenzielle<br />
Funktionalitäten definiert werden können. Schließlich ist die Dokumentationsmöglichkeit<br />
innerhalb des Formalisierungs-Kodes zu berücksichtigen, wodurch die Verständlichkeit<br />
und damit die Wiederverwendbarkeit der Ontologie durch Dritte gewährleistet wird (s.<br />
Corcho+00, S. 1-2).<br />
Neben den Fähigkeiten zur formalen Erfassung und Manipulation der grundlegenden<br />
Modellierungsprimitive sollte eine Ontologie-Spezifikations-Sprache auch Möglichkeiten<br />
zur Darstellung von komplexeren Zusammenhängen mittels entsprechender inferenzieller<br />
Konstrukte bieten. Dazu ist – je nach angestrebtem Formalisierungsgrad – zu prüfen, in<br />
wieweit sich axiomatisierte Ausdrücke erstellen und verwenden lassen und ob sogenannte<br />
„Produktionsregeln 74 “ für die Spezifikation komplexer Prozessabläufe innerhalb der<br />
Domäne definiert werden können (s. Corcho+00, S. 2-3).<br />
B.1.3.1.2 Entwicklungsumgebung<br />
Eine Ontologie-Spezifikations-Sprache kann nur sinnvoll für die Formalisierung einer<br />
Ontologie genutzt werden, wenn sie in eine entsprechende Entwicklungsumgebung<br />
eingebettet ist. Dazu ist hinsichtlich der Operationalisierbarkeit die Qualität vorhandener<br />
Interpreter sowie die Möglichkeiten zur softwaretechnischen Integration der Ontologie in<br />
Informationssysteme zu berücksichtigen. Weiterhin sollte eine solche Entwicklungsumgebung<br />
geeignete Werkzeuge für die Entwicklung und die Handhabung von Ontologien<br />
bieten sowie den Zugang durch Dritte ermöglichen. Eine ausführlichere Diskussion<br />
derartiger Hilfsmittel geht über die grundsätzlichen Anforderungen an Ontologie-<br />
Spezifikations-Sprachen hinaus, weshalb in Tabelle 5 lediglich die wichtigsten Werkzeuge<br />
mit eine entsprechenden Erläuterung aufgelistet werden.<br />
Werkzeug<br />
Funktion<br />
Editor<br />
Editierung der formalen Darstellung.<br />
Browser Ansicht existenter Ontologien aus der Bibliothek.<br />
Wartung Wartung und Änderbarkeit der Ontologie.<br />
Übersetzer Übersetzung in andere Repräsentationsformalismen.<br />
Integrator Integration der Meta-Ontologie / anderer zu integrierender Ontologien.<br />
Tabelle 5: Werkzeuge einer Ontologie-Entwicklungsumgebung 75<br />
73 Durch diese Unterscheidungen aus der objektorientierten Software-Entwicklung können Bedeutungsunterschiede<br />
erfasst werden, ohne sie explizit zu formalisieren. Ein Konzept,- bzw. Klassenattribut hat den gleichen Wert für alle<br />
Instanzen während ein Instanzattribut einen spezifischen, temporären Wert für seine Instanz hat (s. Balzert99, S. 35).<br />
Polymorphe Attribute tragen nur eine Bezeichnung, je nach Kontext aber eine andere Bedeutung (s. Balzert99, S. 43).<br />
74 engl.: „production rules“ (Corcho+00, S. 2).<br />
75 nach: (s. Fernández+97, S. 6f). Übersetzung der Begrifflichkeiten durch den Autor.
Kapitel B: Ontologie-Entwicklung 35<br />
B.1.3.2 Ontolingua<br />
Mit dem Ontolingua-System können Ontologien derart dargestellt werden, dass sie mit<br />
der Darstellung in anderen Repräsentationsformalismen kompatibel sind. Somit dient die<br />
formale Erfassung einer Ontologie in der Ontolingua-Sprache als Austauschformat für<br />
Ontologien zwischen verschiedenen Systemumgebungen, so dass dieselbe Ontologie in<br />
verschiedenen technischen Umgebungen verwendet werden kann (s. Gruber93b, S. 5).<br />
Um eine derartige Funktionalität bieten zu können, muss die Spezifikationsfähigkeit von<br />
Ontolingua diejenigen aller zu unterstützenden Formalismen umfassen, was beim Vergleich<br />
von Ontologie-Spezifikations-Sprachen deutlich wird (s. Cocho+00, S.6-9). Da<br />
somit eine Referenz für entsprechende Sprachen entstand, hat Ontolingua sich als Quasi-<br />
Standard für die formale Spezifikation von Ontologien etabliert (s. Motta98, S. 4f) und<br />
soll daher hier stellvertretend vorgestellt werden.<br />
Die Spezifikation von Ontologien mit Ontolingua umfasst drei Teile. Zunächst existiert<br />
eine syntaktische Notation, mit der Wissenselemente durch die entsprechenden Modellierungsprimitive<br />
deklariert und mit einer natürlichsprachlichen Beschreibung versehen<br />
werden können. Als zweiter Teil können den einzelnen Wissenselementen KIF-<br />
Ausdrücke 76 zur Spezifikation inferenzieller Zusammenhänge zugefügt werden. Den dritten<br />
Teil bildet die Frame-Ontology 77 , welche formale Spezifikationen der Modellierungsprimitive<br />
enthält und als Wissensrepräsentations-Ontologie zur Definition von Ontologien<br />
in Ontolingua dient. Abbildung 7 zeigt als Beispiel für eine bibliographische Ontologie<br />
die Definition eines Konzeptes AUTHOR in Ontolingua, wobei der Autor mindestens<br />
ein Dokument erstellt haben muss und über seinen echten Namen identifiziert wird. Die<br />
drei Teile der Spezifikation sind durch Erläuterungen gekennzeichnet. Die Zeilen 1 bis 3<br />
um-fassen den Deklarationsteil und die Zeilen 4 bis 9 den Teil mit den KIF-Ausdrücken.<br />
Im letzteren werden zur Definition der Relationen in den Zeilen 5, 6 und 7 vordefinierte<br />
ontologische Relationen aus der Frame-Ontology genutzt. Die in diesen Ausdrücken<br />
referenzierten Objekte sind Attribute des Konzepts AUTHOR, die an anderer Stelle der<br />
Ontologie-Spezifikation definiert worden sind. In den Zeilen 8 und 9 werden die inferenziellen<br />
Beziehungen für den Zugehörigkeitsprüfung definiert (s. Gruber93b, S. 9f).<br />
KIF-<br />
Ausdrücke<br />
1<br />
2<br />
3<br />
4<br />
5<br />
6<br />
7<br />
8<br />
9<br />
Konzeptdeklaration<br />
Beschreibung<br />
(define-class AUTHOR (?author)<br />
" An author must have created at least one document. In<br />
this ontology, an author is known by his or her real name."<br />
:def (and (person ?author)<br />
(= (value-cardinality ?author AUTHOR.NAME) 1) Attribut-<br />
Relationen (value-type ?author AUTHOR.NAME biblio-name) Zugriffe<br />
(>= (value-cardinality ?author AUTHOR.DOCUMENTS) 1)<br />
( (author.name ?author ?name) inferenzielle Beziehungen<br />
(person.name ?author ?name))))<br />
Abbildung 7: Konzeptdefinition in Ontolingua 78<br />
76 KIF (Knowledge Interchange Format): deklarative Sprache basierend auf der Prädikatenlogik, welche vor allem<br />
<strong>zum</strong> Austausch von formalisierten Wissensstrukturen zwischen heterogenen Repräsentationsformalismen entwickelt<br />
wurde. Dabei stellt KIF keine Implementierungssprache dar, sondern dient lediglich der strukturierten Formalisierung<br />
von Wissensstrukturen (s. Gruber93, S. 4f).<br />
77 Eine Übersicht der definierten Elemente findet sich in (Gruber93b, S.22-23).<br />
78 entnommen aus: (Gruber93b, S. 10). Anmerkungen durch den Autor.
Kapitel B: Ontologie-Entwicklung 36<br />
Eine Entwicklungsumgebung im oben erläuterten Sinne wird mit dem „Ontolingua<br />
Server“ (vgl. Farquhar+96) bereitgestellt. Darin existiert ein Editor zur Ontologie-<br />
Erstellung, ein webbasierter Browser zur Ansicht von Ontologien sowie die Möglichkeit<br />
zur Wartung und Änderung von Ontologien als authentifizierter Benutzer des Servers.<br />
Die wichtigste Komponente stellen die Übersetzer zur Überführung von Ontologie aus<br />
Ontolingua in mehrere andere Repräsentationsformalismen dar. Abschließend sei angemerkt,<br />
dass Ontolingua selber kein Formalismus für eine konkrete Implementierung,<br />
sondern lediglich für die formale Spezifikation von Ontologien ist (s. Gruber93b, S.5f).<br />
B.1.4 Evaluation und Dokumentation<br />
Als abschließende Aktivitäten der Ontologie-Entwicklung werden in den drei eingangs betrachteten<br />
methodologischen Ansätzen die Evaluation sowie die Dokumentation genannt<br />
(s. Tabelle 2). Dabei wird – wie auch für andere Phasen – die Wichtigkeit der Qualitätsprüfung<br />
für Ontologien betont, jedoch werden nur relativ vage Aussagen zur konkreten<br />
Durchführung gemacht. ´Uschold, King´ weisen lediglich darauf hin, dass eine Ontologie<br />
evaluiert und dokumentiert werden sollte (Uschold+95, S. 4). Die Vollständigkeitstheoreme<br />
und die formalisierten Kompetenzfragen im Ansatz von ´Grüninger, Fox´ ermöglichen<br />
automatisierte Evaluation (Grüninger+95, S. 9), wodurch zwar die Richtigkeit der<br />
Schlussfolgerungsfähigkeiten der Ontologie geprüft, jedoch nicht die konzeptionelle Korrektheit<br />
evaluiert werden kann. In METHONTOLOGY werden die Evaluation sowie die<br />
Erstellung einer entsprechenden Dokumentation als begleitende Tätigkeiten in allen<br />
Phasen des Ontologie-Entwicklungs-Prozesses proklamiert (s. Fernández+97, S. 7f).<br />
Daraus wird ersichtlich, dass noch keine ausgereiften Mechanismen zur Qualitätsprüfung<br />
von Ontologien existieren, so dass hier lediglich die bisher aufgefundenen Erkenntnisse<br />
zusammenfasst werden können. Hinsichtlich der Dokumentation einer Ontologie<br />
steht vor allem deren Nutzbarkeit zur Entwicklung darauf basierender Applikationen<br />
im Vordergrund. Die Erläuterung dieser beiden Aspekte schließt die Betrachtung<br />
des Ontologie-Entwicklungs-Prozesses ab.<br />
B.1.4.1 Evaluation<br />
Die Evaluation von Ontologien wird wie in entsprechenden Vorgehensmodellen aus dem<br />
Bereich des Knowledge Engineering (vgl. Schreiber+00, S. 181f) in eine interne und eine<br />
externe Prüfung unterteilt. Bei der ersteren, bezeichnet als „Verifikation 79 “, wird die technische<br />
Korrektheit der formalen Darstellung hinsichtlich Syntax und Einbettung in die<br />
softwaretechnische Umgebung geprüft. In der letzteren wird die Erfüllung der Anforderungen<br />
aus der Spezifikationsphase (s. B.1.1.1) sowie die konzeptionelle Korrektheit der<br />
ontologischen Theorie (s. B.1.2.1) geprüft, weshalb diese Prüfung als „Validierung 80 “ bezeichnet<br />
wird. Für diese beiden Aspekte sollen im Folgenden Evaluationskriterien sowie<br />
typische Fehler bei der Ontologie-Entwicklung vorgestellt werden, welche aus den<br />
bisherigen Erfahrungen hervorgegangen sind und als Grundlage für die Entwicklung<br />
entsprechender Evaluationstechniken dienen können (s. Gómez-Pérez01, S. 407f).<br />
79 engl.: „Verfication“ (Gómez-Pérez01, S. 393).<br />
80 engl.: „Validation“ (Gómez-Pérez01, S. 393).
Kapitel B: Ontologie-Entwicklung 37<br />
B.1.4.1.1 Kriterien der Qualitätsprüfung<br />
Zur Evaluation der Qualität einer Ontologie ist sie unter den folgenden fünf Gesichtspunkten<br />
zu betrachten. Werden dabei keine Fehler aufgefunden, ist die Ontologie verifiziert<br />
und validiert. Das erste Kriterium ist die Konsistenz (engl.: „Consistency“), wobei<br />
die interpretatorische Eindeutigkeit aller erfassten Wissenselemente in der Ontologie zu<br />
prüfen ist. Die Konsistenz ist erreicht, wenn die informelle sowie die formale Definition<br />
jeweils eindeutig in ihrer intendierten Bedeutung sind und die Bedeutungsdefinitionen der<br />
informellen und der formalen Definition konsistent zueinander sind. Als zweites ist die<br />
Vollständigkeit (engl.: „Completeness“) zu prüfen. Als vollständig wird eine Ontologie<br />
bezeichnet, wenn alles zur antizipierten Funktionalität der Ontologie benötigte Wissen der<br />
Domäne direkt oder indirekt, also durch inferenzielle Ableitungen in der Ontologie erfasst<br />
ist. Konträr dazu wird mit dem dritten Kriterium der Prägnanz (engl.: „Conciseness“) die<br />
Vermeidung von Redundanz gefordert. Redundante Strukturerfassungen liegen vor, wenn<br />
zwei Elemente die gleiche formale Spezifikation aufweisen. Das vierte Kriterium der<br />
Erweiterbarkeit (engl.: „Expandability“) erfasst den Aufwand zur Änderung der Ontologie.<br />
Mit dem fünften Kriterium soll hinsichtlich der Stabilität (engl.: „Sensitiveness“) der<br />
Ontologie geprüft werden, inwiefern kleine Änderungen in der Ontologie signifikante<br />
Änderungen deren grundlegender Struktur hervorrufen. 81<br />
B.1.4.1.2 Typische Fehler der Ontologie-Entwicklung<br />
Zur Verdeutlichung der vorgestellten Kriterien zeigt Tabelle 6 einige typische Fehler auf,<br />
die bei der Ontologie-Entwicklung häufig beobachtet werden können.<br />
Fehlertyp<br />
Inkonsistenz<br />
Unvollständigkeit<br />
Redundanz<br />
Beispiel<br />
- Vererbung (z. B. Behandlung disjunkter / erschöpfender Spezialisierungen)<br />
- falsche semantische Klassifikation<br />
- fehlende, un<strong>vollständige</strong> Konzepte / Relationen<br />
- un<strong>vollständige</strong> Erfassung der taxonomischen Struktur<br />
mehrere Konzepte / Relation mit gleicher formaler Spezifikation<br />
Tabelle 6: Typische Fehler bei der Ontologie-Entwicklung 82<br />
B.1.4.2 Dokumentation<br />
Eine ausführliche und qualitativ hochwertige Dokumentation von Ontologien ist vor dem<br />
Hintergrund von deren Nutzung, Wiederverwendung und Integration als bedeutungsdefinierendes<br />
Konstrukt in mehreren Applikationen als ein wichtiger Aspekt zu betrachten.<br />
Obwohl einige Dienste, beispielsweise der angesprochene Ontolingua Server (s.<br />
B.1.3.2), die Einsicht in existente Ontologien ermöglichen, stellen diese Übersichten bisher<br />
proprietäre Lösungen dar. Um Entwicklern die Auswahl einer geeigneten Ontologie<br />
für die Entwicklung einer darauf basierenden Applikation oder zur Integration in eine<br />
neue Ontologie zu erleichtern, sollten für jede Ontologie entsprechende Informationen<br />
dokumentiert sein. Zu den wichtigsten Aspekten zählen dabei die spezifizierte Verwendung,<br />
die Beschreibung des konzeptionellen Modells sowie dessen Validierung, die<br />
Verifikation der formalen Darstellung sowie die Portabilität, also die Überführbarkeit in<br />
mögliche Implementierungssprachen (s. Gómez-Pérez01, S. 395-396).<br />
81 Die Kriterien sowie deren Erläuterung sind (Gómez-Pérez01, S. 394-395) entnommen. Die Übersetzung der<br />
Begriffe wurde durch den Autor vorgenommen, wobei jeweils das englische Original mit angegeben wurde.<br />
82 Fehlertypen und Beispiele entnommen aus (Gómez-Pérez01, S. 397-399). Übersetzungen durch den Autor.
Kapitel B: Ontologie-Entwicklung 38<br />
B.2 Qualitätssichernde Aspekte<br />
Anschließend an die Erläuterungen der Phasen des Ontologie-Entwicklungsprozesses<br />
sowie der dabei auftretenden Problemstellungen sollen weiterführende Errungenschaften<br />
des Ontology Engineering vorgestellt werden, durch deren Kenntnis und Beachtung bei<br />
der Ontologie-Entwicklung vor allem konzeptionelle Fehler vermieden oder <strong>zum</strong>indest<br />
gemindert werden sollen.<br />
Als erstes werden dazu sogenannte „Design-Kriterien 83 “ (B.2.1) vorgestellt. Damit<br />
werden Prinzipien beschrieben, die bei den Design-Entscheidungen für eine zu entwickelnde<br />
Ontologie von der initialen Planung in der Spezifikationsphase bis hin zur Formalisierung<br />
befolgt werden sollten. Dahinter steht die Zielsetzung, Ontologien als bedeutungsdefinierende<br />
Konstrukte so allgemein wie möglich zu halten und somit deren Verwendungsmöglichkeiten<br />
so vielfältig wie möglich zu gestalten. Als zweiter Aspekt soll die<br />
sogenannte „OntoClean Methodologie 84 “ als ein auf philosophischen Erkenntnissen<br />
beruhender Ansatz der Meta-Modellierung (B.2.2) vorgestellt werden. Darin wird eine<br />
differenzierte Analyse der Charakteristika von Wissenselementen und deren Beziehungen<br />
untereinander für ein vertiefendes Verständnis ontologischer Modellierungsprimitive<br />
gegeben und außerdem eine Evaluationstechnik zur Validierung der taxonomischen<br />
Struktur von Ontologien entwickelt.<br />
Durch die im Folgenden vorzustellenden Aspekte sollen dem Ontologie-Entwickler<br />
vertiefende Kenntnisse zur Verfügung gestellt werden, mit deren Hilfe <strong>zum</strong> einen die<br />
angestrebte „Teilung von Wissen 85 “, also die Nutzung einer gemeinsamen Verständnisgrundlage<br />
einer Wissensdomäne als ein Hauptziel ontologiebasierter Wissensmodellierung,<br />
verbessert werden kann und <strong>zum</strong> anderen typische Fehler in der Konzeptionalisierungs-<br />
und Formalisierungsphase (s. B.1.4.1.2) der Ontologie-Entwicklung vermieden<br />
werden können. Daher vermag die Berücksichtigung dieser Kenntnisse bei der Entwicklung<br />
von Ontologien zur Erhöhung der Qualität beitragen, weshalb der zweite Teil<br />
dieses Kapitels entsprechend mit ´Qualitätssichernde Aspekte´ betitelt wurde.<br />
B.2.1 Designkriterien<br />
Unter dem Designaspekt einer Ontologie werden Entscheidungen darüber verstanden,<br />
wie diese aufgebaut, strukturiert und dargestellt werden soll, um die antizipierte Funktionalität<br />
gewährleisten zu können. Dabei determinieren die funktionalen Anforderungen an<br />
eine Ontologie die Art und Weise des Aufbaus und der Darstellung der erfassten Wissensstrukturen<br />
in allen Entwicklungsphasen (s. Gruber93, S. 2). Werden dafür allgemein<br />
gehaltene Vorgaben zur Handhabung derartiger Implikationen erstellt, so können diese als<br />
Design-Prinzipien bezeichnet werden. Hier sollen jene von Gruber definierten Prinzipien<br />
vorgestellt werden, die er als Design-Kriterien bezeichnet. Diese umfassen die grundlegenden<br />
Design-Entscheidungen und werden in der Literatur jeweils als die wesentlichen<br />
Design-Prinzipien referenziert. (vgl. Uschold+96, S. 17f; Gómez-Pérez99, S.2). In Tabelle<br />
7 werden diese Kriterien aufgelistet und erläutert.<br />
83 engl.: „design criteria“ (Gruber93, S. 2).<br />
84 engl.: „OntoClean methodology“ (Guarino+02).<br />
85 engl.: „knowledge sharing“(Gruber93, S. 0 (Abstract)).
Kapitel B: Ontologie-Entwicklung 39<br />
Kriterium<br />
Klarheit<br />
(engl.: „Clarity“)<br />
Kohärenz<br />
(engl.: „Coherence“)<br />
Erweiterbarkeit<br />
(engl.: „Extendibility“)<br />
Minimaler Implementierungseinfluss<br />
(engl.: „minimal encoding<br />
bias“)<br />
Minimale ontologische<br />
Verpflichtung<br />
(engl.: „minimal ontological<br />
commitment“)<br />
Beschreibung<br />
Mit diesem Kriterium wird die definitorische Klarheit, also eine möglichst objektive,<br />
allgemein verständliche Beschreibung der in der Ontologie erfassten<br />
Wissenselemente gefordert. Sind Zusammenhänge axiomatisiert, so<br />
sollen entsprechend notwendige und hinreichende Bedingungen definiert<br />
werden. Weiterhin wird für jedes erfasste Wissenselement eine natürlichsprachliche<br />
Beschreibung gefordert.<br />
Hiermit wird die schon im Zusammenhang der Evaluation (s. B.1.4.1.1) erwähnte<br />
Konsistenz der beschriebenen Wissensstrukturen innerhalb einer<br />
Ontologie gefordert. Dieses erstreckt sich nicht nur über die interpretative<br />
Eindeutigkeit einzelner Elemente, sondern auch auf deren strukturellen Zusammenhang.<br />
Die ebenfalls im Rahmen der Evaluation erwähnte Erweiterbarkeit einer<br />
Ontologie sollte bei Design-Entscheidungen berücksichtigt werden. Je einfacher<br />
eine Ontologie zu erweitern ist, desto besser kann sie für die Verwendung<br />
in einer konkreten Anwendungssituation modifiziert werden.<br />
Hierunter wird verstanden, dass bei der formalen Spezifikation einer Ontologie<br />
keine implementierungstechnischen Aspekte eines eventuell favorisierten<br />
Repräsentationsformalismus berücksichtigt werden sollen, da Ontologien<br />
die Beschreibung von Wissensdomänen auf der Wissensebene (s.<br />
A.1.1.1) darstellen. Dieses Kriterium ist unter dem Hintergrund zu verstehen,<br />
dass dessen Autor im Ontolingua-Projekt (s. B.1.3.2) tätig war und<br />
daher Ontologien in erster Linie als formale Spezifikation einer ontologischen<br />
Theorie (s. B.1.2.2) ohne Implementierungsziel versteht.<br />
Dieses Kriterium besagt, dass eine Ontologie von den sie nutzenden Agenten<br />
eine möglichst geringe ontologische Verpflichtung (s. A.2.1.1) verlangen<br />
sollte. Dass bedeutet, dass die ontologische Theorie möglichst wenig<br />
wertende Annahmen über die Wissensdomäne beinhaltet und somit den<br />
Agenten größtmögliche interpretative Freiheiten erlaubt. Dadurch soll ein<br />
breites Verwendungsfeld der Ontologie durch Nutzer mit unterschiedlichen<br />
Inten-ionen ermöglicht werden.<br />
Tabelle 7: Design-Kriterien für Ontologien 86<br />
Die ersten beiden Kriterien (Klarheit und Kohärenz) beziehen sich auf die konzeptionelle<br />
Korrektheit der in der Ontologie erfassten Wissensstruktur. Mit den Forderungen<br />
nach hoher Erweiterbarkeit und einer minimalen ontologischen Verpflichtung soll die<br />
ermöglichte Wissensteilung durch eine Ontologie als generelles Ziel ontologiebasierter<br />
Wissensmodellierung erhöht werden. Die Forderung nach minimalem Implementierungseinfluss<br />
soll den bedeutungsdefinierenden Charakter einer Ontologie als Domänenbeschreibung<br />
auf der Wissensebene verdeutlichen. Die Ähnlichkeit dieser Design-Kriterien<br />
mit den oben vorgestellten Kriterien zur Evaluation von Ontologien (s. B.1.4.1.1) beruht<br />
auf der gleichartigen Zielsetzung der Qualitätssicherung und impliziert, dass durch deren<br />
Berücksichtung während der Entwicklung die Qualität einer Ontologie verbessert werden<br />
kann.<br />
86 Kriterien und Erläuterungen entnommen aus (Gruber93, S. 2f). Übersetzungen durch den Autor, wobei für die<br />
Kriterienbezeichnung das englische Original mit angegeben wurde. Weitere Prinzipien mit ähnlicher Zielsetzung sind<br />
in (Gómez99, S.2f) aufgeführt.
Kapitel B: Ontologie-Entwicklung 40<br />
B.2.2 Meta-Modellierung<br />
Als weiterer Aspekt der Qualitätssicherung der Ontologie-Entwicklung soll ein methodologischer<br />
Ansatz vorgestellt werden, aus dem ein vertiefendes Verständnis der für die<br />
Ontologie-Entwicklung zur Verfügung stehenden Modellierungsprimitive gewonnen<br />
werden kann und der weiterhin eine formale Evaluation taxonomischer Strukturen als<br />
strukturgebende Basis einer Ontologie ermöglicht. Forschungsarbeiten im Rahmen dieses<br />
Ansatzes, auf Grund seiner evaluatorischen Fähigkeiten auch als „OntoClean Methodologie<br />
87 “ bezeichnet, werden seit Mitte der 1990er Jahre im Umfeld von N. Guarino und<br />
C. Welty durchgeführt. 88 Ziel der Arbeiten ist die Entwicklung einer Methodologie zur<br />
„ontologiebasierten konzeptuellen Analyse 89 “, worin die im Folgenden vorzustellende<br />
Methodik den funktionalen Kern bildet (s. Guarino+00a, S. 1).<br />
Die Methodologie beruht auf Basisbegriffen aus der philosophischen Ontologie<br />
(´Lehre des Seins´, vgl. A.), mit welchen die „ontologische Natur 90 “, also die wesensbeschreibenden<br />
Charakteristika von Entitäten und deren Beziehungen untereinander<br />
genauer erfasst werden können. Diese Begrifflichkeiten sind <strong>zum</strong> einen derart allgemein<br />
definiert, dass sie domänenunabhängig zur charakterlichen Beschreibung aufgefundener<br />
Wissenselemente und -strukturen verwandt werden können. Zum anderen sind sie als formale<br />
Ausdrücke definiert, so dass sich daraus allgemeingültige, regelhafte Beschränkungen<br />
für Relationen zwischen Wissenselementen bezüglich deren ontologischer Korrektheit<br />
ableiten lassen. Mit Hilfe dieser wesensbeschreibenden, formalen Begrifflichkeiten als<br />
sogenannte „Meta-Properties 91 “ können Taxonomien validiert werden. Dazu wird jedes<br />
Wissenselement einer taxonomischen Struktur im Sinne einer Meta-Modellierungs-<br />
Sprache (s. Guarino+00, S. 1) mit den Basisbegriffen beschrieben. An Hand der allgemeinen<br />
Regeln und Beschränkungen kann die taxonomische Struktur bezüglich Inkonsistenzen<br />
oder verfälschender Modellierungsentscheidungen auf eine formale Art und<br />
Weise evaluiert und korrigiert werden.<br />
Der Begriff der Taxonomie hat in diesem Ansatz entscheidende Bedeutung und soll<br />
daher genauer betrachtet werden. Eine Taxonomie beschreibt die Struktur von Wissenselementen<br />
einer Domäne in einer Hierarchie, die ausschließlich durch Subsumptions-<br />
Relationen (auch „is_a“- oder „Subclass“-Relation) gebildet wird (s. Guarino+00b, S. 63).<br />
Eine Subsumptions-Relation liegt vor, wenn die wesensdefinierenden Eigenschaften einer<br />
untergeordneten Klasse denen der ihr übergeordneten Oberklasse entsprechen und somit<br />
eine Vererbung im Sinne von Spezialisierung und Generalisierung besteht (s. Luger01, S.<br />
252ff). Taxonomische Strukturen eignen sich gut für eine leicht verständliche Darstellung<br />
87 engl.: „OntoClean methodology“ (Guarino+02).<br />
88 NICOLA GUARINO: Wissenschaftler am ´Institute for System Theory and Biomedical Engineering of the Italian<br />
National Research COUNCIL (CNR)´, Padova, Italien. CHRISTOPHER WELTY: Assistant Professor for Computer<br />
Science, Vassar College in Poughkeepie, New York, USA.<br />
89 engl.: „ontology-driven conceptual analysis (ODCA)“ (Guarino+00a, S. 1).<br />
90 engl.: „ontological nature“ (Guarino+00a, S. 1).<br />
91 Der Begriff „Meta-Property“ (Guarino+00a, S. 1) wird hier als Terminus Technicus beibehalten. Es sei an dieser<br />
Stelle auf die andersartige Verwendung der Begrifflichkeiten durch die Autoren im Vergleich zu den bisherigen Ausführungen<br />
hingewiesen. In der vorliegenden Literatur zu diesem Themengebiet wird der Begriff ´Property´ als Oberbegriff<br />
aller Bestandteile einer Ontologie verwendet, während in dieser Ausarbeitung eine Property als Modellierungsprimitivum<br />
für Eigenschaften verwendet wurde (s. B.1.2.1). Um eine begriffliche Einheitlichkeit in den<br />
Ausführungen zu erhalten, wird im weiteren Verlauf ´Wissenselement´ als entsprechender Oberbegriff verwendet.
Kapitel B: Ontologie-Entwicklung 41<br />
von Zusammenhängen, weshalb sie insbesondere im Bereich der konzeptionellen Modellierung<br />
vielfach eingesetzt werden. Dabei werden häufig fälschlicherweise Subsumptions-<br />
Relationen proklamiert, was sowohl auf die Ausnutzung der strukturierenden Funktion als<br />
auch auf methodische Unkenntnisse zurückgeführt wird (s. Guarino+02, S. 63ff). In<br />
konventionellen softwaretechnischen Bereichen dient eine solche vom Prinzip her fehlerhafte<br />
Verwendung von Subsumptions-Relationen häufig als Hilfsmittel zur technischen<br />
Realisierung, welche keine Auswirkungen auf die funktionale Qualität des Systems hat.<br />
Die diesbezügliche Korrektheit von Taxonomien als strukturkonstituierende Basis von<br />
Ontologien ist dagegen als sehr wichtig zu betrachten, da die ontologische Theorie durch<br />
die Definition fehlerhafter Subsumptions-Beziehungen ihrem Anspruch als korrektes und<br />
allgemeines Verständnismodell der Domäne nicht gerecht werden kann. Daher wird mit<br />
dem hier vorgestellten Ansatz das Ziel verfolgt, die taxonomische Struktur einer Ontologie<br />
hinsichtlich der Richtigkeit proklamierter Subsumptions-Relationen mit Hilfe einer<br />
differenzierten Analyse der Wesenseigenschaften der erfassten Wissenselemente zu evaluieren<br />
(s. Guarino+00b, S. 3-5).<br />
Aus diesem methodologischen Ansatz können zweierlei Erkenntnisse gewonnen<br />
werden. Zum einen bieten die Basisbegriffe ein vertiefendes Verständnis zur korrekten<br />
Verwendung der Modellierungsprimitive für eine valide Konzeptionalisierung (s. B.1.2).<br />
Zum anderen ergibt sich durch deren Nutzung zur Meta-Modellierung eine formale, theoretisch<br />
fundierte Methodik zur qualitativen Analyse des konzeptionellen Modells, welche<br />
als Evaluationstechnik zur Qualitätsprüfung von Ontologien (s. B.1.4.1.1) verwendet<br />
werden kann. Um diese Aspekte herauszuarbeiten, werden im Folgenden zunächst die<br />
Basisbegriffe sowie die daraus resultierenden Implikationen als theoretisches Fundament<br />
dieses Ansatzes erläutert und anschließend die darauf basierende Methodik zur Validierung<br />
von Taxonomien vorgestellt.<br />
B.2.2.1 Theoretische Grundlagen<br />
Der Vorstellung der Basisbegriffe dieses methodologischen Ansatzes ist zunächst eine<br />
kurze Erläuterung ihrer Herkunft voranzustellen. Es handelt sich dabei um grundlegende<br />
Begrifflichkeiten der sogenannten „Formalen Ontologie 92 “, welche sich mit Objekten der<br />
realen Welt und deren Verknüpfungen beschäftigt, dafür formale Aussagen definiert und<br />
so die ontologische Natur, also die Wesenseigenschaften betrachteter Objekte mittels allgemeingültiger<br />
Beschreibungen erfassen möchte (s. Smith98, S.1). Ohne ausführlicher auf<br />
die Erkenntnisse dieser philosophische Disziplin einzugehen, seien hier die drei wesentlichen<br />
theoretischen Grundlagen genannt. Die erste ist die als Mereologie bezeichnete<br />
formale Theorie der Relation zwischen Teil und Ganzem (s. Brockhaus96 Bd. 14, S. 512).<br />
Die Topologie als mathematische Theorie zur Strukturierung von Räumen und Gegenständen<br />
(s. Brockhaus96-14 Bd. 22, S. 186ff) stellt die zweite Theoriebasis dar und die<br />
dritte ist die Theorie der Abhängigkeit 93 , worin existentielle Abhängigkeiten zwischen<br />
Objekten untersucht werden.<br />
92 engl.: „Formal Ontology“ (Smith98, S.1).<br />
93 engl.: „theory of dependence“ (Smith98, S. 1).
Kapitel B: Ontologie-Entwicklung 42<br />
B.2.2.1.1 Basisbegriffe<br />
Zur Erläuterung der Basisbegriffe werden diese zunächst in Tabelle 8 übersichtlich dargestellt<br />
und deren Definition natürlichsprachlich wiedergegeben. 94 Weiterhin wird in der<br />
Tabelle die Notation angegeben, welche bei der Zuweisung der Basisbegriffe als Meta-<br />
Properties zu Wissenselementen einer Taxonomie zwecks deren Validierung (s. B.2.2.2)<br />
verwendet wird. Dazu werden drei dem Symbol für den Basisbegriff vorangestellte Präfixe<br />
genutzt. (+) bedeutet, dass alle Instanzen des Wissenselementes die Meta-Property erfüllen.<br />
Als Gegenteil dazu bedeutet (-), dass nicht alle Instanzen sie tragen. (~) besagt,<br />
dass keine Instanz diese Meta-Property erfüllt, was eine stärkere Einschränkung darstellt<br />
als (-) (s. Guarino+ 00a, S. 1). Anschließend an die tabellarische Übersicht soll die Bedeutung<br />
der Basisbegriffe für die Wesensbeschreibung von Wissenselementen und -strukturen<br />
an Hand entsprechender Beispiele verdeutlicht werden.<br />
Basisbegriff Erläuterung Notation<br />
Rigidität<br />
(engl.: „rigidity“)<br />
Ein Wissenselement ist rigide, wenn es für alle seine Instanzen<br />
essentiell ist: Also, wenn es immer wahr ist und sich nicht ändert.<br />
+R, -R, ~R<br />
Identität<br />
(engl.: „identity“)<br />
Über ihre Identität können einzelne Wissenselemente identifiziert<br />
werden. Diese ist durch die Ungleichheit zweier Entitäten bezüglich<br />
eines Identitätskriteriums (eine charakterisierende Eigenschaftsbedingung,<br />
die notwendig oder hinreichend ist) in einer sogenannten<br />
„Identitätskondition 95 “ (IC) definiert. Nur rigide Entitäten können ICs,<br />
also eine eigene Identität tragen; diese kann an nicht-ridige Unterklassen<br />
vererbt werden. Ein Wissenselement unterstützt eine IC,<br />
wenn es selber diese IC trägt, aber sie nicht von allen seinen untergeordneten<br />
Elementen getragen wird.<br />
+I, -I<br />
(Identität<br />
tragend)<br />
+O, -O<br />
(Identität<br />
unterstützend)<br />
Zusammengehörigkeit<br />
(engl.: „unity“)<br />
Durch die Zusammengehörigkeit wird erfasst, ob ein Wissenselement<br />
ein Ganzes, also eine abgeschlossene und eigenständige Entität<br />
darstellt. Dies ist der Fall, wenn alle seine Teile miteinander und<br />
mit nichts anderem verbunden sind. Ein Wissenselement trägt eine<br />
„Zusammengehörigkeitsbedingung 96 “ (UC), wenn alle seine Instanzen<br />
zu allen Zeitpunkten Ganze sind.<br />
+U, -U, ~U<br />
Abhängigkeit<br />
(engl.: „dependence“)<br />
Ein Wissenselement ist abhängig von einem anderen, wenn es ohne<br />
das Andere nicht existieren kann.<br />
Tabelle 8: Basisbegriffe der OntoClean Methodologie 97<br />
+D, -D<br />
Die folgenden Beispiele sollen die Möglichkeit zur expliziten Beschreibung der intendierten<br />
Bedeutung aufgefundener Wissenselemente durch die Annotation mit den Basisbegriffen<br />
in einer Taxonomie verdeutlichen. Mit der Rigidität kann beispielsweise ein wesentlicher<br />
Unterschied zwischen PERSON und STUDENT beschrieben werden. Während<br />
eine PERSON immer eine solche ist (also +R), ist der Studentenstatus temporär für den<br />
Zeitraum der Immatrikulation und somit anti-rigide (~R) (s. Guarino+02, S. 62).<br />
94 Auf eine Erläuterung der formalen Definitionen wird hier verzichtet, da dies den Rahmen dieser Untersuchung<br />
sprengen würde (siehe dazu Guarino+00a, S.2-4).<br />
95 engl.: „identity condition“ (Guarino+00a, S. 3), abgekürzt als IC.<br />
96 engl. „unity condition“ (Guarino+00a, S. 3), abgekürzt als UC.<br />
97 Basisbegriffe und Erläuterungen aus (Guarino+00a, S. 2-4) und (Guarino+02, S.61-63). Übersetzungen durch den<br />
Autor mit Angabe des englischen Originals.
Kapitel B: Ontologie-Entwicklung 43<br />
Die Problematik der Identitätsbestimmung kann an Hand einer fehlerhaften Subsumptions-Relation<br />
erläutert werden, wozu das Wissenselement INTERVALL dem Element ZEIT-<br />
DAUER untergeordnet sein soll (intendierte Bedeutung: jedes Intervall ist eine Zeitdauer).<br />
Hat man nun zwei Instanzen von INTERVALL von je 1 Stunde, so sind diese als Instanzen<br />
von ZEITDAUER gleich, da die Zeitspanne dafür das Identitätskriterium darstellt und hier<br />
den gleichen Wert hat. Diese Subsumption ist insofern falsch, da jede Instanz eines untergeordneten<br />
Elementes auch genau eine Instanz des übergeordneten sein muss (s. Guarino<br />
+02, S. 62f). Zur Verdeutlichung einer unterstützten Identität kann wieder das Person-<br />
Student-Beispiel mit PERSON als übergeordnetem Element aufgegriffen werden. Das Identitätskriterium<br />
für PERSON, beispielsweise die Sozialversicherungsnummer, wird zwar von<br />
direkten Instanzen getragen, aber STUDENT trägt eine eigene Identität, z.B. die Immatrikulationsnummer.<br />
Somit ist PERSON mit (+O), STUDENT aber nur mit (+I-O) zu beschreiben<br />
(s. Guarino+00a, S. 3).<br />
Auch die Zusammengehörigkeit kann an einer fehlerhaften Subsumptions-Relation erläutert<br />
werden. WASSER möge dem Element OZEAN übergeordnet sein. Hierbei ist WASSER<br />
nicht als ein Ganzes zu verstehen (~U), da es nicht isoliert betrachtbar ist. Ein Ozean hingegen<br />
stellt ein Ganzes dar (bestehend aus einer Menge von Wasser, Lebewesen, etc.) und<br />
kann mit (+U) beschrieben werden. Der Subsumptionsfehler liegt in einer Vererbung<br />
zwischen Entitäten mit unterschiedlichen Wesenseigenschaften (s. Guarino+02, S. 63).<br />
Ein Beispiel für die Abhängigkeit stellt die Entität HAUS (+D) dar, welche unter anderem<br />
existenziell von WAND abhängig ist (s. Guarino+00a, S. 4).<br />
B.2.2.1.2 Implikationen<br />
Wie an den Beispielen deutlich wurde, können mit Hilfe der Basisbegriffe wesenscharakterisierende<br />
Unterschiede zwischen Wissenselementen aufgefunden und diese dann<br />
als Meta-Properties den jeweiligen Wissenselementen zugewiesen werden. Entsprechend<br />
der Definition einer Subsumptions-Relation, wonach eine derartige Vererbungsstruktur<br />
nur dann vorliegt, wenn alle Instanzen eines untergeordneten Elementes auch Instanzen<br />
des übergeordneten sind (s.o.), können regelhafte „Beschränkungen 98 “ für korrekte<br />
Subsumptions-Relationen zwischen Wissenselementen auf Grund ihrer Meta-Properties<br />
definiert werden. Diese dienen als Ausgangspunkt zur Validierung von Taxonomien und<br />
werden in Tabelle 9 zusammenfassend aufgelistet.<br />
Basisbegriff<br />
resultierende Beschränkung<br />
Rigidität 1) (+R) kann nicht von (~R) erben.<br />
Identität 2) (-I) kann nicht von (+I) erben.<br />
Zusammengehörigkeit 3) (-U) kann nicht von (+U) erben.<br />
4) (+U) kann nicht von (~U) erben.<br />
Abhängigkeit 5) (-D) kann nicht von (+D) erben.<br />
Tabelle 9: Beschränkungen für Subsumptions-Relationen in Taxonomien 99<br />
98 engl.: „Constraints“ (Guarino+00a, S. 4).<br />
99 Definitionen nach (Guarino+00a, S. 4f). Weitere dort genannte, aber im Hinblick auf die Taxonomie-Validierung<br />
nicht relevante Implikationen sind: (1) Wissenselemente mit inkompatiblen Identitätsbedingungen sind disjunkt. (2)<br />
Wissenselemente mit inkompatiblen Zusammengehörigkeitsbedingungen sind disjunkt.
Kapitel B: Ontologie-Entwicklung 44<br />
B.2.2.2 Taxonomie-Validierung<br />
Wie schon angesprochen, kann die taxonomische Struktur eines konzeptionellen Modells<br />
durch die Beschreibung der Wissenselemente mit den vorgestellten Meta-Properties<br />
evaluiert werden, indem die Korrektheit von Subsumptions-Relationen an Hand der ebenfalls<br />
vorgestellten Beschränkungen geprüft wird. Da diese Evaluationsmethodik lediglich<br />
eine Anwendung der bisher ausgeführten Aspekte dieses methodologischen Ansatz ohne<br />
signifikante neuartige Erkenntnisse darstellt, wird sie hier nur kurz besprochen. Vor der<br />
Erläuterung der einzelnen Schritte des Verfahrens soll zunächst der bei diesem Verfahren<br />
wesentliche Begriff der sogenannten „Basis-Taxonomie 100 “ erläutert werden.<br />
B.2.2.2.1 Basis-Taxonomie<br />
Die sogenannte Basis-Taxonomie besteht nur aus den rigiden Wissenselementen der<br />
erfassten taxonomischen Struktur. Somit sind lediglich die invarianten Elemente der betrachteten<br />
Wissensdomäne erfasst, welche die essentielle Struktur der Domäne beschreiben<br />
und somit konstituierenden Charakter haben. Das Ziel bei der Erfassung dieser<br />
grundlegenden Taxonomie ist eine übersichtliche Darstellung der wesentlichen Aspekte<br />
einer Domäne, welche die Zuordnung weiterer Wissenselemente vereinfachen soll. Des<br />
Weiteren können verschiedene Ontologien bezüglich ihrer Basis-Taxonomien verglichen<br />
werden, wodurch die Integration von Ontologien erleichtert wird (s. Guarino+02, S. 63).<br />
Drei Arten von Wissenselementen 101 werden als Bestandteile der Basis-Taxonomie<br />
unterschieden. Erstens sogenannte „Kategorien 102 “ mit den Meta-Properties (+R -I -O),<br />
welche allgemein als abstrakte Elemente die höchste Hierarchie-Ebene bilden. Zweitens<br />
„Typen 103 “ mit den Meta-Properties (+R +I +O), mit denen die in der Domäne existenten<br />
Wissenselemente im Sinne von Datentypen beschrieben werden und drittens sogenannte<br />
„Quasi-Typen 104 “ mit den Meta-Properties (+R +I -O), welche die gleiche<br />
Funktion haben wie „Typen“, jedoch keine Identitäten unterstützen (s. Guarino+00b, S.<br />
10-12).<br />
B.2.2.2.2 Vorgehensmodell<br />
Auf der Grundlage der bisher erarbeiteten theoretischen Aspekte kann die Validierung<br />
von Taxonomien durch einen sechsstufigen Prozess durchgeführt werden, welcher in<br />
Abbildung 8 aufgeführt wird. Dabei wird das konzeptionelle Modell aus der Konzeptionalisierungsphase<br />
lediglich bezüglich seiner taxonomischen Struktur, jedoch nicht<br />
bezüglich der erfassten Wissenselemente geprüft und verbessert. Somit stellt dieses Verfahren<br />
eine formale Evaluationstechnik für die Qualitätskriterien der Konsistenz und der<br />
Prägnanz einer Ontologie dar, welches aber die anderen oben aufgeführten Kriterien (s.<br />
B.1.4.1.1) nicht zu überprüfen vermag.<br />
100 engl.: „Backbone Taxonomie“ (Guarino+00a, S. 5): Hier wurde eine freie Übersetzung mit gleichartiger<br />
Bedeutung durch den Autor gewählt, da die wörtliche im Deutschen unpassend erschien.<br />
101 In (Guarino+00b, S. 10-14) wird eine Ontologie von Wissenstypen-Arten vorgestellt, welche auf einer Differenzierung<br />
der möglichen Kombinationen der hier vorgestellten Meta-Properties beruht.<br />
102 engl.: “Categories” (Guarino+00b, S. 11).<br />
103 engl.: “Types” (Guarino+00b, S. 11).<br />
104 engl.: “Quasi-Types” (Guarino+00b, S. 12).
Kapitel B: Ontologie-Entwicklung 45<br />
Schritte der Taxonomie-Validierung<br />
1) Wissenselemente mit Meta-Properties beschreiben.<br />
2) Konsistenzcheck* für alle Wissenselemente, eventuelle Korrektur.<br />
3) Basis-Taxonomie erstellen (alle nicht-rigiden Elemente entfernen).<br />
4) Konsistenzcheck* der Basis-Taxonomie, eventuelle Korrektur.<br />
5) andere Wissenselemente wieder hinzufügen, Konsistenzcheck*.<br />
6) eventuell fehlende Konzepte hinzufügen, so dass in der validierten<br />
Taxonomie keine Konsistenzverletzungen mehr vorhanden sind.<br />
* bezüglich der Beschränkungen für korrekte Subsumptions-Relationen (s. Tabelle 9).<br />
Abbildung 8: Taxonomie-Evaluation mit OntoClean 105<br />
B.3 Abschließende Bemerkungen<br />
Wie die vorhergehenden Ausführungen zeigen, liegt ein grundsätzliches Verständnis der<br />
Aufgaben- und Problemstellungen bei der Entwicklung von Ontologien als bedeutungsdefinierende<br />
Beschreibung von Wissensdomänen vor. Allerdings wird auch deutlich, dass<br />
die existenten Lösungsansätze jeweils nur partielle Problemstellungen bearbeiten und dass<br />
sie weiterhin aus unabhängigen und voneinander getrennt arbeitenden Forschungsaktivitäten<br />
hervorgegangen sind und somit lediglich proprietäre Lösungen darstellen. Daher<br />
kann festgehalten werden, dass die Erstellung umfassender ingenieursartiger Methodologien<br />
als Ziel des Ontology Engineering bisher noch nicht erreicht worden ist, weshalb<br />
die Ontologie-Entwicklung derzeit „ ... eher eine Kunstfertigkeit als einer Ingenieurstätigkeit<br />
darstellt. 106 “ Im Folgenden sollen <strong>zum</strong> Abschluss der Ausführungen zur<br />
Ontologie-Entwicklung die sehr breit gefächerten Aufgabengebiete innerhalb des Entwicklungsprozesses<br />
von Ontologien aufgezeigt sowie diese Aspekte betreffende Forderungen<br />
zur Integration entsprechender Kenntnisse aus verschiedenen Wissenschaftsdisziplinen<br />
in eine umfassende Methodologie dargelegt werden.<br />
Die unterschiedlichen Kompetenzanforderungen an Ontologie-Entwickler sollen an<br />
Hand einer sukzessiven Erläuterung der wesentlichen Aufgabengebiete in den einzelnen<br />
Phasen des oben besprochenen Ontologie-Entwicklungsprozesses (s. B.1.) herausgestellt<br />
werden. In der Spezifikationsphase werden für die Anforderungsanalyse <strong>zum</strong> einen<br />
Kenntnisse über das antizipierte Einsatzfeld der zu entwickelnden Ontologie und <strong>zum</strong><br />
anderen softwaretechnische Kenntnisse für die Verwendungskonzeption der Ontologie<br />
innerhalb eines computergestützten Informationssystems benötigt. Weiterhin müssen die<br />
Techniken zur Wissensakquisition beherrscht werden. Zur Erstellung eines hinsichtlich<br />
der ontologischen Theorie validen konzeptionellen Modells in der Konzeptionalisierungsphase<br />
sind vor allem analytische Fähigkeiten, Kenntnisse über die zur Verfügung<br />
stehenden Modellierungsprimitive für eine korrekte Handhabung sowie über die Methoden<br />
für deren Darstellung relevant. Wichtig ist hier auch die Fähigkeit zur Konsensfindung,<br />
um ein von allen Beteiligten akzeptierten Verständnismodells der betrachteten<br />
Wissensdomäne entwickeln zu können. In der Formalisierungsphase werden program-<br />
105 Die Schritte sowie die Beschreibungen sind (Guarino+00a, S. 5ff) entnommen. Darin findet sich ein ausführlich<br />
dokumentiertes Beispiel zur Taxonomie-Validierung mit OntoClean.<br />
106 „ The ontology building process is rather a craft than an engineering activity. “ (Gómez99, S. 37).
Kapitel B: Ontologie-Entwicklung 46<br />
miertechnische Fähigkeiten zur Erstellung einer korrekten formalen Spezifikation gefordert.<br />
Darüber hinaus sind umfassende Kenntnisse alternativ verwendbarer Repräsentationsformalismen<br />
erforderlich, um den geeignetsten für die gegebene Anwendungssituation<br />
auszuwählen. Schließlich werden in der Evaluationsphase Kenntnisse über Verfahren<br />
zur Qualitätsprüfung der Ontologie benötigt.<br />
Die aufgezeigten Aufgabengebiete sind jenen der konventionellen Software-<br />
Entwicklung sehr ähnlich, weshalb die vorgestellten Techniken und Methoden auf existenten<br />
Ansätzen für gleichartige Problemstellung aus dem Software Engineering basieren<br />
oder sich <strong>zum</strong>indest daran orientieren. Allerdings können die Verfahren des Software<br />
oder Knowledge Engineering nicht einfach für die Ontologie-Entwicklung übernommen<br />
werden, da deren angestrebte Funktionalität als bedeutungsdefinierendes Konstrukt<br />
basierend auf einer ontologischen Theorie der Wissensdomäne anders gelagert ist und<br />
somit die Entwicklung spezifischer Verfahren erfordert (s. Gómez-Pérez01, S. 392). Dies<br />
gilt grundsätzlich für alle aufgezeigten Aufgabenfelder. Die Spezifikation einer Ontologie<br />
erfordert genaue Kenntnisse über das Einsatzpotenzial von Ontologien. Zur Erstellung<br />
der Konzeptionalisierung werden spezifische Modellierungsmethoden und ein genaueres<br />
Verständnis derselben benötigt. Spezielle Fachkenntnisse über geeignete Repräsentationsformalismen<br />
sind für die Formalisierung gefordert und zur Evaluation von Ontologien<br />
müssen die entsprechenden Techniken bekannt sein und richtig eingesetzt werden<br />
können.<br />
Auf Grund der strukturellen und inhaltlichen Ähnlichkeiten zu den ausgereifteren Methodologien<br />
des Software und Knowledge Engineering wird innerhalb der Forschungsgemeinde<br />
des Ontology Engineering eine stärkere Orientierung an diesen und anderen<br />
relevanten Wissenschaftsdisziplinen gefordert. Dabei können für die Differenzierung der<br />
Aufgabengebiete im Ontologie-Entwicklungsprozess die entsprechenden Untergliederungen<br />
aus dem Software Engineering in Analyse-, Implementierungs-, und<br />
Architekturaufgabenfelder als Vorlage dienen (vgl. Devedžić02). Die Orientierung an der<br />
Formalen Ontologie aus der Philosophie wurde schon erwähnt und als theoretische Basis<br />
für sehr wichtig erachtet (s. Guarino95, S. 3f). Mit derartigen Ausgangspunkten soll die<br />
Erstellung einer umfassenden Methodologie der Ontologie-Entwicklung, die Verfahren<br />
im Sinne der vorgestellten Evaluationstechnik der Konsistenz von Taxonomien (S.<br />
B.2.2.2) für alle Phasen und Aufgabenfelder des Ontologie-Entwicklungsprozesses<br />
beinhalten soll, erleichtert werden.
Kapitel C: Verwendung von Ontologien in Informationssystemen 47<br />
C Verwendung von Ontologien in Informationssystemen<br />
Als letzten zu betrachtenden Aspekt zur Erfassung der Charakteristika ontologiebasierter<br />
Verfahren der Wissensmodellierung im ersten Teil der Arbeit beschäftigt sich dieses<br />
Kapitel mit der Verwendung von Ontologien als bedeutungsdefinierender Komponente<br />
in computergestützten Informationssystemen. Dabei sollen die grundsätzlichen Anwendungsmöglichkeiten<br />
(s. A.2.2.2) dieses Verfahrens der Wissensmodellierung genauer betrachtet,<br />
die wesentlichen Spezifika ontologiebasierter Applikationen aufgezeigt und die<br />
aus der Verwendung von Ontologien resultierenden softwaretechnischen Implikationen<br />
herausgearbeitet werden. Hinsichtlich des Untersuchungsziels der Verwendung von Ontologien<br />
im Semantic Web im zweiten Teil dieser Arbeit konzentrieren sich die folgenden<br />
Ausarbeitung vor allem auf jene Aspekte, die für die Erlangung eines hintergründigen<br />
Verständnisses des Semantic Web als ontologiegestützter Informationstechnologie<br />
relevant erscheinen.<br />
Zunächst wird eine Typologisierung der grundlegenden Einsatzmöglichkeiten von Ontologien<br />
in Informationssystemen vorgenommen. Dazu wird ein Klassifikationsschema<br />
vorgestellt und es werden die damit aufgefundenen grundsätzlichen Verwendungsszenarien<br />
aufgeführt. Zur Verdeutlichung dieser Verwendungsszenarien werden im zweiten Teil<br />
des Kapitels Beispiele für die Ontologieverwendung in Informationssystemen diskutiert,<br />
wobei sich die Auswahl der vorgestellten Anwendungsgebiete in ihrer Relevanz für das<br />
Semantic Web als ontologiebasierter Informationstechnologie begründet. Anschließend<br />
daran werden im dritten Teil umsetzungstechnische Implikationen aufgezeigt, welche sich<br />
für die Entwicklung ontologiebasierter Informationssysteme ergeben und als zusätzliche<br />
Anforderungen neben der im vorhergehenden Kapitel behandelten inhaltlichen Qualität<br />
an Ontologien gestellt werden. Auch dieser Aspekt ist für die Handhabung von Ontologien<br />
im Semantic Web relevant.<br />
C.1 Typologie des Ontologie-Einsatzes<br />
Die im Folgenden erläuterte Typologisierung der Verwendungsmöglichkeiten von Ontologien<br />
beruht auf einem Klassifikationsansatz, der existente ontologiebasierte Applikationen<br />
bezüglich allgemeiner Betrachtungsdimensionen zu klassifizieren versucht. Damit<br />
soll ein gemeinsames Verständnis der Nutzbarkeit ontologiebasierter Verfahren der<br />
Wissensmodellierung innerhalb und zwischen den im Ontologie-Entwicklungsprozess<br />
beteiligten Wissenschaftsdisziplinen erreicht werden (s. Uschold+99, S. 1f). Weiterhin<br />
kann diese Typologisierung als Hilfestellung in der Spezifikationsphase der Ontologie-<br />
Entwicklung (s. B.1.1) genutzt werden, wobei die Klassifikation allerdings sehr allgemein<br />
gehalten ist und eher dem intellektuellen Verständnis verschiedenartiger Einsatzmöglichkeiten<br />
von Ontologien dient als dass es eine verwendbare Klassifikationsvorlage darstellt.<br />
Es werden zunächst die Betrachtungsdimensionen erläutert und durch über das Klassifikationsschema<br />
hinausgehende Aspekte verdeutlicht. Anschließend daran werden die<br />
mittels der Betrachtungsdimensionen unterschiedenen Verwendungsszenarien aufgezeigt<br />
sowie eine verallgemeinernde Kategorisierung derselben vorgestellt.
Kapitel C: Verwendung von Ontologien in Informationssystemen 48<br />
C.1.1 Klassifikationsdimensionen<br />
In dem referenzierten Klassifikationsschema (vgl. Uschlod+99) werden drei wesentliche<br />
Betrachtungsdimensionen unterschieden, die im Folgenden besprochen werden sollen.<br />
Für jede dieser Dimensionen sind Kategorien vordefiniert, welche aus der Betrachtung<br />
ontologiebasierter Applikationen verallgemeinernd gewonnen wurden und als einheitliche<br />
Beschreibungshilfen zur Charakterisierung der verschiedenen Verwendungsszenarien von<br />
Ontologien dienen sollen. Neben den hier aufgeführten Dimensionen wurde auch die<br />
Existenz unterstützender Technologien für die softwaretechnische Einbindung der Applikationen<br />
sowie deren Reifegrad betrachtet. Da diese beiden Aspekte nur peripher zur<br />
Charakterisierung der Verwendungsmöglichkeiten von Ontologien in Informationssystemen<br />
beitragen, werden sie hier nicht weiter beachtet (s. Uschold+99, S. 2).<br />
C.1.1.1 Verwendungszweck 107<br />
Mit der ersten Betrachtungsdimension soll der Verwendungszweck und intendierte<br />
Nutzengewinn durch die Verwendung einer Ontologie beschrieben werden, welcher in<br />
der Anforderungsanalyse der Ontologie-Entwicklung (s. B.1.1.1) festzuhalten ist. Hierfür<br />
werden drei grundsätzliche Verwendungszwecke von Ontologien unterschieden, die im<br />
Zusammenhang der Charakteristika ontologiebasierter Wissensmodellierung bereits erwähnt<br />
wurden (s. A.2.2.2) und daher hier nur kurz wiedergegeben werden.<br />
Die erste Funktionalität stellt die Kommunikationsunterstützung zwischen Agenten als<br />
Oberbegriff für die menschlichen und technischen Akteure in einer Wissensdomäne dar,<br />
wobei kommunikative Fehler durch die ontologische Verpflichtung (s. A.2.1.1) gegenüber<br />
dem in der Ontologie erfassten Verständnismodell der Ontologie vermieden werden<br />
sollen. Als zweite Funktionalität wird die Verbesserung der Interoperabilität zwischen<br />
Computersystemen oder deren Komponenten aufgeführt. Dabei sollen Ontologien vor<br />
allem die Transformation zwischen verschiedenartigen Wissensmodellen ermöglichen, so<br />
dass die semantische Korrektheit von ausgetauschten Informationen gewährleistet wird.<br />
Unter der dritten Funktionalität werden mehrere Aspekte zur Verbesserung wissensverarbeitender<br />
Systeme zusammengefasst. Hier sei zunächst die Optimierung des Informationsmanagements<br />
durch ontologiebasierte Indizierung genannt, während die Aspekte bezüglich<br />
der Systementwicklung im dritten Teil dieses Kapitels ausführlicher behandelt<br />
werden sollen (s. Uschold+99, S.1f).<br />
Neben den drei grundlegenden Verwendungsmöglichkeiten ist für das Design der<br />
Ontologie sowie der Architektur des Informationssystems zu beachten, wie die Ontologie<br />
mit den anderen Komponenten interagiert und inwiefern dieses die Konzeption der Ontologie<br />
determiniert. Wird die Ontologie als allgemeines Verständnismodell zur Wissensteilung<br />
verwendet, so stellt sie meist ein externes, vorab definiertes normatives Modell dar.<br />
Bei der Nutzung als Austauschbasis zwischen heterogenen Informationsquellen ist die<br />
Ontologie ein Meta-Modell der zu verbindenden Wissensmodelle. Für die Indizierungsfunktionalität<br />
wird der Inhalt der ontologischen Struktur zur Laufzeit des Systems ständig<br />
bezüglich geänderter Informationsquellen aktualisiert (s. Uschold+99, S. 4f).<br />
107 engl.: „Purpose and Benefits“ (Uschold+99, S. 2).
Kapitel C: Verwendung von Ontologien in Informationssystemen 49<br />
C.1.1.2 Rolle der Ontologie 108<br />
Die zweite wesentliche Betrachtungsdimension erfasst die Rolle, welche eine Ontologie<br />
innerhalb eines Informationssystems einnimmt. Darunter wird verstanden, welche Art<br />
von Wissensstruktur durch die Ontologie erfasst wird. Dazu wird im hier vorgestellten<br />
Klassifikationsschema eine dreistufige Hierarchie sogenannter „Informationslevel 109 “ zur<br />
Differenzierung von Wissensstrukturen in ontologiebasierten Applikationen eingeführt.<br />
Die unterste Ebene stellen darin die „operationalen Daten 110 “ dar, worunter in einer<br />
beispielhaften Anwendung zur ontologiegestützten Informationsindexierung die laufend<br />
aktualisierten Informationen aus den überwachten Quellen fallen würden. Diese Daten<br />
werden auf der nächsthöheren Stufe durch eine Ontologie beschrieben, welche wiederum<br />
durch einen Repräsentationsformalismus als höchste Hierarchiestufe beschrieben wird (s.<br />
Uschold+99, S. 3). Somit lassen sich die in einer ontologiebasierten Applikation verwandten<br />
Wissensstrukturen hinsichtlich ihres funktionalen Zusammenhangs unterscheiden.<br />
Da Ontologien <strong>zum</strong>eist auf dem mittleren Informationslevel als Beschreibungen von<br />
operationalen Daten verwendet werden, erscheint eine erweiternde Betrachtung verschiedener<br />
Arten von Ontologien zur Differenzierung der damit dargestellten Wissensstrukturen<br />
sowie des intendierten Verwendungszwecks als sinnvoll. Dazu werden in<br />
Tabelle 10 die wesentlichen in der Literatur unterschiedenen Ontologie-Arten vorgestellt<br />
und an Hand von häufig referenzierten Beispielen verdeutlicht.<br />
Ontologie-Art<br />
Meta- / Generische<br />
Ontologie<br />
Wissensrepräsentations-<br />
Ontologie<br />
Top Level / Generelle<br />
Ontologie<br />
Domänen-Ontologie<br />
Beschreibung<br />
Beschreibung von grundlegenden Zusammenhängen für die Erstellung<br />
von Ontologien. Ein Beispiel ist die „Mereology Ontology 111 “.<br />
Ontologische Erfassung der Modellierungsprimitive für die Ontologie-<br />
Entwicklung als spezielle Art von Meta-Ontologie. Das bekannteste<br />
Beispiel ist die Frame-Ontology des Ontolingua-Systems (s. B.1.3.2).<br />
Beschreibung allgemeinen Wissens über die reale Welt. Die darin erfassten<br />
Wissensstrukturen können von Ontologien für konkrete Anwendungsgebiete<br />
genutzt werden, so dass für die automatische Problemlösung<br />
benötigtes Alltagswissen zur Verfügung steht. Dieser Ansatz<br />
wird im CYC-Projekt 112 verfolgt.<br />
Beschreibung der Struktur einer Wissensdomäne im Sinne einer ontologischen<br />
Theorie (s. B.1.2.2), welche für verschiedene Anwendungen<br />
der Domäne wiederverwendet werden kann. Als Beispiel sei hier die<br />
(KA) 2 -Ontologie 113 genannt.<br />
108 engl.: „Role of the Ontology“ (Uschold+99, S. 3).<br />
109 engl.: „information levels” (Uschold+99, S. 3).<br />
110 engl.: „operational data” (Uschold+99, S. 3).<br />
111 Mereology Ontology: Formale Spezifikation der mereologischen “part-of”-Relation im Sinne der korrekten<br />
Zusammengehörigkeit eines Ganzen und seiner Teile (s. B.2.2.1.1). Entstanden im Rahmen des PHYSYS-Projektes,<br />
worin eine Bibliothek wiederverwendbarer Ontologien zur Beschreibung physischer Systeme entwickelt wurde (s.<br />
Borst97, S. 28-33; S. 128-131).<br />
112 CYC: Seit Mitte der 1980er Jahre versucht das Entwicklungsteam um Douglas Lenat, eine umfassende Wissensbasis<br />
menschlichen Alltagswissens zu erstellen, welche als entsprechende Referenz für Wissensbasierte Systeme<br />
dienen soll. Die CYC-Wissensbasis umfasst verschiedene Domänen, wobei die Wissensstrukturen jeweils in Modulen,<br />
sogenannten Mikrotheorien, mit dem entsprechenden Domänen- und Inferenzwissen erfasst sind (vgl. Elkan<br />
+93). Ein Teil der CYC-Wissensbasis ist öffentlich zugänglich unter: www.cyc.com. Eine ausführliche Beschreibung<br />
der Intention und der Herangehensweise findet sich in: Lenat, D. B.; Guha, R. V.: Building Large Knowledge<br />
Based Systems. Representation and Inference in the CYC Project. Reading, Massachusetts (USA): Addison-Wesley,<br />
1990.<br />
113 (KA) 2 -Ontologie: Ontologie der Forscher in der Knowledge Annotation Initiative aus der Knowledge Acquisition<br />
Community. Mit Annotationen können die Wissensstrukturen der Ontologie in die Web-Dokumente der Forschungsgemeinde<br />
eingebunden werden, wodurch eine verbesserte Informationsverarbeitung erreicht werden soll (vgl. Benjamins+98).<br />
Obwohl das Projekt eingestellt wurde, werden die Arbeiten in Nachfolgeprojekten fortgesetzt.
Kapitel C: Verwendung von Ontologien in Informationssystemen 50<br />
Methoden-Ontologie<br />
Aufgaben-Ontologie<br />
Applikations-Ontologie<br />
Domänenunabhängige Begriffsdefinition zur Beschreibung von Problemlösewissen<br />
mittels Problem Solving Methods (s. A.1.2.1).<br />
Allgemeine Begriffsdefinition für die Beschreibung von Aufgaben, z.B.<br />
Begriffe wie ´Plan´, ´Zielsetzung´, etc.<br />
Zusammenführung von Domänen-, Methoden- und Aufgaben-Ontologien<br />
als konzeptionelles Modell für eine konkrete Applikation (s.<br />
A.1.2.2.2.). Ein Bespiel ist die „Enterprise Ontology 114 “.<br />
Tabelle 10: Ontologie-Arten 115<br />
Die ersten beiden genannten Ontologie-Arten sind auf der obersten Ebene der im<br />
Klassifikationsansatz definierten Informationslevel anzusiedeln, da sie Begriffsdefinitionen<br />
für die Verwendung in ontologischen Erfassungen beinhalten. Alle anderen<br />
Arten sind auf der mittleren Ebene einzuordnen, wobei mit Top-Level- und Domänenontologien<br />
das statische Domänenwissen und mit Methoden- sowie Aufgabenontologien<br />
das Problemlösewissen gemäß deren Trennung innerhalb des modellbasierten Ansatzes (s.<br />
A.1.1.3) erfasst wird. Mit Hilfe dieser Differenzierung wird deutlich, dass mit Ontologien<br />
sehr unterschiedliche Arten von Wissensstrukturen beschrieben und somit diesbezüglich<br />
klassifiziert werden können. Als weitere Betrachtungskriterien zur Beschreibung einer<br />
Ontologie sind unabhängig von der darin erfassten Art der Wissensstruktur die Größe<br />
sowie der Formalisierungsgrad zu berücksichtigen (s. Uschold+99, S. 4).<br />
C.1.1.3 Akteure 116<br />
Als dritte Betrachtungsdimension einer ontologiebasierten Anwendung werden die Rollen<br />
der beteiligten Akteure erfasst, welche in verschiedenen Anwendungen unterschiedlich<br />
sein können. So kann beispielsweise die Entwicklung der Ontologie allein durch entsprechende<br />
Spezialisten ausgeführt werden, während in einem anderen Projekt diese<br />
Aufgabe arbeitsteilig von Personen aus unterschiedlichen Fachgebieten erfolgt. In dem<br />
hier vorgestellten Klassifikationsschema werden dazu verschiedene Akteure differenziert,<br />
die im Folgenden kurz erläutert werden sollen.<br />
Der erste Akteur ist der Ontologie-Entwickler (engl.: „Ontology Author“), dessen Aufgabe<br />
in der Erstellung der Ontologie besteht. Als zweite Art von Akteur wird der Daten-<br />
Author (engl.: „(Operational) Data Author”) genannt. Damit ist beispielsweise der Autor<br />
eines Dokuments gemeint, welches unter Nutzung einer Ontologie indiziert wird. Als<br />
dritter Akteur wird der Entwickler einer ontologiebasierten Anwendung (engl.: „Application<br />
Developer“) und als vierter Akteur der Benutzer (eng.: „Application User“) derselben<br />
unterschieden. Der fünfte und letzte Akteur ist der Wissensarbeiter (engl.: „Knowledge<br />
Worker“), der mit dem Wissen der Ontologie beziehungsweise jenem der ontologiebasierten<br />
Anwendung arbeitet. Der Unterschied zwischen den beiden letztgenannten besteht<br />
darin, dass der Wissensarbeiter <strong>zum</strong>eist ein Mensch ist, während der Anwendungsnutzer<br />
auch ein Softwareprogramm sein kann. 117<br />
114 Enterprise Ontology: Entwickelt als begriffsdefinierende Basis für ein Framework zur Unternehmensmodellierung<br />
(vgl. Uschold+96b). Aus den bei der Erstellung gewonnenen Erfahrungen ging der methodologische Ansatz zur Ontologie-Entwicklung<br />
von ´Uschold, King´ hervor (s. B.1).<br />
115 Bezeichnungen und Erläuterungen entnommen aus (Gómez-Pérez99, S. 4f) und (Fensel00, S. 8f). Deutsche Übersetzungen<br />
nach (Puppe+00, S. 623).<br />
116 engl.: „Actors“ (Uschold+99, S. 4).<br />
117 Bezeichnungen und Erläuterungen nach (Uschold+99, S. 3f). Übersetzungen durch den Autor mit Angabe des<br />
englischen Originals.
Kapitel C: Verwendung von Ontologien in Informationssystemen 51<br />
C.1.2 Verwendungsszenarien<br />
Aus der Betrachtung existenter ontologiebasierter Applikationen postuliert der Klassifikationsansatz<br />
verschiedene Verwendungsszenarien für Ontologien in Informationssystemen,<br />
welche mittels der vorgestellten Betrachtungsdimensionen beschrieben werden.<br />
Die Szenarien werden in drei grundlegende Kategorien unterteilt, welche in Abbildung 9<br />
zunächst übersichtlich dargestellt und anschließend genauer erläutert werden. 118<br />
Kategorien und Verwendungsszenarien von Ontologien<br />
I. Neutrale Editierung (engl.: „Neutral Authoring“)<br />
I.a Ontologie als wiederverwendbare Begriffsdefinition für verschiedene Zielsysteme.<br />
I.b ... Terminologie-Spezifikation für die Handhabung operationaler Daten.<br />
II. Gemeinsamer Informationszugang (engl.: „Common Access to Information“)<br />
II.a ... von allen Beteiligten akzeptiertes Verständnismodell einer Wissensdomäne.<br />
II.b ... Meta-Modell für korrekten Informationsaustausch zwischen heterogenen Wissensmodellen.<br />
II.c ... Abgleich heterogener Ontologien für korrekten Informationsaustausch.<br />
III. Indizierung (engl.: „Indexing“)<br />
III.a ... Strukturdefinition des Indexes von Informationsquellen einer Wissensdomäne.<br />
Abbildung 9: Klassifikation der Verwendung von Ontologien in Informationssystemen 119<br />
Die Kategorie Neutrale Editierung (I.) umfasst jene Verwendungsszenarien, in denen<br />
eine Ontologie als formal spezifizierte Begriffsdefinition einer Wissensdomäne erstellt und<br />
als entsprechende Basis bei der Entwicklung von Applikationen für die Domäne genutzt<br />
wird. Dadurch soll erstens die einheitliche und korrekte Nutzung der Wissensstrukturen<br />
einer Domäne gewährleistet und zweitens die Wiederverwendbarkeit bereits formalisierter<br />
ontologischer Erfassungen ermöglicht werden. Somit stellen die Verwendungsszenarien<br />
dieser Kategorie hinsichtlich des Verwendungszwecks eine Hilfestellung für die Systementwicklung<br />
dar, wobei vor allem Ontologien zur Beschreibung statischer Wissensstrukturen,<br />
also Meta-, Top-Level sowie Domänenontologien erstellt werden. Die Unterscheidung<br />
der beiden Szenarien beruht auf der Priorität der beteiligten Akteure. In (I.a)<br />
erstellt der Ontologie-Entwickler als wichtigster Akteur die Ontologie als begriffsdefinierende<br />
Basis für alle anderen Beteiligten, welche dann für die jeweiligen Anwendungszwecke<br />
transformiert wird; beispielsweise unter Nutzung der Funktionalitäten des<br />
Ontolingua-Systems (s. B.1.3.2). In (I.b) werden operationale Daten mit einer vordefinierten<br />
Ontologie beschrieben, wobei die operationalen Daten als Kernteil der<br />
Applikation die Schlüsselposition einnehmen und die Ontologie lediglich sekundären<br />
funktionalen Charakter hat (Uschold +99, S. 5-7).<br />
Die zweite Kategorie des Gemeinsamen Informationszugangs (II.) umfasst Verwendungsmöglichkeiten<br />
von Ontologien, in denen mit Hilfe einer Ontologie ein gemeinsames Ver-<br />
118 An<strong>zum</strong>erken ist, dass die hierbei vorgenommene Klassifikation nicht auf einer statistischen Analyse existenter<br />
Verwendungsszenarien beruht. Als Datenquelle wird lediglich angegeben, dass die postulierten Szenarien Abstraktionen<br />
spezifischer ontologiebasierter Anwendungen aus der Forschung und der industriellen Praxis darstellen (s.<br />
Uschold+99, S. 5). Trotz der wissenschaftlich nicht fundierten Grundlage wurde dieser Klassifikationsansatz als Ausgangspunkt<br />
für die Erläuterung der Verwendungsmöglichkeiten von Ontologien in Informationssystemen ausgewählt,<br />
weil darin eine verallgemeinernde Erfassung der Einsatzmöglichkeiten vorgenommen wird und somit ein höherer<br />
Aussagegehalt geboten wird als bei der einfachen Auflistung von Verwendungsszenarien in vergleichbaren Arbeiten<br />
(siehe z.B. (Obitko01)).<br />
119 Bezeichnungen und Erläuterungen aus (Uschold+99, S. 5-10). Übersetzungen durch den Autor mit Angabe des<br />
englischen Originals.
Kapitel C: Verwendung von Ontologien in Informationssystemen 52<br />
ständnis der Wissensdomäne erreicht, beziehungsweise die korrekte Nutzung von Informationen<br />
aus heterogenen Quellen hinsichtlich der intendierten Bedeutung gewährleistet<br />
werden kann. In (II.a) wird eine Ontologie als gemeinsame Verständnisgrundlage für die<br />
Wissensarbeiter der Wissensdomäne zur Verbesserung der zwischenmenschlichen Kommunikation<br />
erstellt, wobei <strong>zum</strong>eist eine Domänenontologie verwendet wird. In (II.b) und<br />
(II.c) werden Ontologien eingesetzt, um die Interoperabilität zwischen Softwarekomponenten<br />
als Applikations-Nutzern zu ermöglichen. Dabei wird in (II.b) eine sogenannte<br />
„geteilte Ontologie 120 “ erstellt, welche bei der Entwicklung entsprechender Applikationen<br />
im Sinne einer ontologischen Verpflichtung (s. A.2.1.1) als bedeutungsdefinierende Basis<br />
genutzt wird. Im Unterschied dazu basieren in (II.c) die einzelnen Systemkomponenten<br />
auf eigenen Ontologien oder ähnlichen konzeptionellen Modellen und die Interoperabilität<br />
durch einen „Abgleich 121 “ dieser heterogenen Wissensmodelle gewährleistet wird.<br />
Da für die Interoperabilität zwischen Systemen oder ihren Komponenten Informationen<br />
aus allen drei Informationslevels (s. C.1.1.2) benötigt werden, können in den beiden letztgenannten<br />
Szenarien grundsätzlich alle in Tabelle 10 aufgeführten Ontologie-Arten Verwendung<br />
finden (Uschold+99, S. 7-10).<br />
Die letzte Kategorie der Indizierung (III.) beinhaltet nur ein Szenarium (III.a), welches<br />
zur Verbesserung des Informationsmanagements, insbesondere der Suchfunktionalität in<br />
Informationssystemen dient. Dabei werden die Informationsquellen mittels einer entsprechenden<br />
Domänenontologie extern (im Gegensatz zur Dokumentenannotation)<br />
indiziert, so dass eine kontextsensitive Suche erfolgen kann. Die wesentlichen Akteure in<br />
diesem Szenario sind der Ontologie-Entwickler sowie die Wissensarbeiter, die mit Hilfe<br />
ontologiebasierter Suchmaschinen schneller und effektiver das von ihnen benötigte<br />
Wissen auffinden können (Uschold+99, S. 10).<br />
C.2 Anwendungsgebiete von Ontologien<br />
Obwohl mit Hilfe der vorgestellten Kategorisierung von Verwendungsszenarien die<br />
Einsatzmöglichkeiten von Ontologien in Informationssystemen differenziert werden<br />
können, sind die Beschreibungen der Szenarien sehr abstrakt gehalten. Um diese<br />
konkreter zu erläutern, werden im Folgenden entsprechende Anwendungsgebiete ontologiebasierter<br />
Applikationen vorgestellt. Dabei sollen mit den aufgeführten Anwendungsgebieten<br />
<strong>zum</strong> einen Beispiele für die Verwendungsszenarien gegeben und <strong>zum</strong> anderen<br />
grundlegende Aspekte des Semantic Web als ontologiebasierter Informationstechnologie<br />
aufgezeigt werden.<br />
Als erstes wird die Kommunikation in Multi-Agenten-Systemen als Beispiel der<br />
Verwendungsszenarien der Kategorie A behandelt. Dieses Anwendungsgebiet ist insofern<br />
für das Semantic Web von grundlegender Bedeutung, als das es selber ein Multi-Agenten-<br />
System darstellt (siehe dazu das eingangs erwähnte Anwendungsszenario des Semantic<br />
Web aus (Berners-Lee+01)). Mit der Informationsintegration als zweitem Anwendungsgebiet<br />
wird ein Beispiel für die Verwendungsszenarien II.b und II.c besprochen. Die<br />
Ermöglichung der Interoperabilität zwischen heterogenen Informationsquellen ist eine<br />
120 engl.: „shared ontology“ (Uschold+99, S. 8).<br />
121 engl.: „mapping“ (Uschold+99, S. 9).
Kapitel C: Verwendung von Ontologien in Informationssystemen 53<br />
grundlegende Anforderung an moderne Informationssysteme und somit auch für das<br />
Semantic Web relevant. Als drittes Anwendungsgebiet werden Verfahren des ontologiebasierten<br />
Information Retrieval hinsichtlich des Verwendungsszenarios III.a vorgestellt,<br />
wobei sich die Relevanz dieses Gebietes für das Semantic Web aus der grundlegenden<br />
Anforderung der Verbesserung der Suchfunktionalität für webbasierte Informationstechnologien<br />
ergibt.<br />
Neben den drei hier ausführlich behandelten Anwendungsgebieten seien als weitere<br />
wesentliche Verwendungsmöglichkeiten von Ontologien in Informationssystemen die Bereiche<br />
des Wissensmanagements sowie der Sprachverarbeitung erwähnt. In den Ansätzen<br />
des sogenannten „ontologiebasierten Wissensmanagements“ (vgl. Schnurr+01) werden<br />
vor allem die Vorteile der gemeinsamen Verständnisgrundlage einer Wissensdomäne<br />
durch eine Ontologie gemäß Verwendungsszenario II.a herausgestellt. Für die Sprachverarbeitung<br />
werden sogenannte „Linguistische Ontologien 122 “ zur Analyse natürlicher<br />
Sprache entwickelt. Damit kann das inhaltliche Verstehen von Texten automatisiert und<br />
somit eine Grundlage für automatische Übersetzungen gewonnen werden, was hinsichtlich<br />
der Multilingualitätsproblematik ein wichtiges Anwendungsgebiet von Semantic Web<br />
– Technologien darstellt.<br />
C.2.1 Multi-Agenten-Systeme<br />
Seit Beginn der 1990er Jahre zeichnet sich in der Künstlichen Intelligenz ein Paradigmenwechsel<br />
bei der Entwicklung wissensverarbeitender Systeme ab (s. A.1). Im Gegensatz zu<br />
den zuvor entwickelten globalen, zentralisierten Architekturen für alleinstehende und<br />
funktional abgeschlossene Systeme werden im agentenbasierten Ansatz integrierte, dezentrale<br />
Systemstrukturen entworfen. Darin sollen autonom agierende Teilsysteme, sogenannte<br />
Agenten, individuelle Ziele verfolgen und Lösungen für ihre spezifischen Aufgaben<br />
in Kooperation mit anderen Agenten finden. Im Unterschied zu traditionellen<br />
Wissenssystemen wird in solchen „Multi-Agenten-Systemen“ (Burkhard00, S. 996) anstelle<br />
einer zentralen Wissensbasis das benötigte Wissen von den einzelnen Agenten selber<br />
getragen und die Steuerungsfunktion von jedem Agenten individuell übernommen. Diesem<br />
Ansatz liegt eine Verschiebung des Intelligenzbegriffs innerhalb der Künstlichen<br />
Intelligenz zugrunde. Während mit dem logisch-rationalistischem Paradigma der Symbolsystemhypothese<br />
(s. A.1.1.1) intelligentes Verhalten allein durch die Erstellung und Manipulation<br />
entsprechender Symbolsysteme simuliert werden sollte, wird Intelligenz im<br />
„agenten-orientierten Paradigma“ (Luger01, S. 268) als aus dem kollektiven Verhalten<br />
autonom agierender Individuen hervorgehend verstanden (s. Luger01, S. 37). 123<br />
122 engl.: „linguistic ontologies“ (Gómez-Pérez99, S. 4). Die bedeutendsten Ontologien dieses Anwendungsgebietes<br />
sind das Generalized Upper Model (GUM) sowie WordNet. Im GUM werden die grundlegenden linguistischen<br />
Konzepte einzelner Sprachen beschrieben und deren Relationen in den verschiedenen Sprachen dargestellt, wodurch<br />
die Grundlage für eine bedeutungserhaltene Übersetzung gegeben werden soll (vgl. Bateman+95). WordNet ist eine<br />
lexikalische Datenbank für die englische Sprache, in der Bedeutungszusammenhänge mittels grundlegender Konstrukte<br />
der Semantik (Synonyme, Antonyme, etc.) beschrieben werden (vgl. Fellbaum98). Eine aktuelle Version von<br />
WordNet sowie weiterführende Informationen sind erhältlich unter: http://www.cogsci.princeton.edu/~wn/ (08.06.<br />
2002).<br />
123 Andersartige Entwürfe des Intelligenzverständnisses in der Künstlichen Intelligenz resultieren aus den Schwierigkeiten,<br />
welche sich bei der Entwicklung umfangreicher intelligenter Systeme auf der Grundlage reiner Symbolverarbeitungssysteme<br />
ergaben. Dabei wurden Vorbilder intelligenten Verhaltens aus der Natur gesucht, wie beispiels-
Kapitel C: Verwendung von Ontologien in Informationssystemen 54<br />
Ein Multi-Agenten-System besteht also aus einzelnen Agenten, die jeweils individuelle<br />
Ziele verfolgen und zur Bearbeitung ihrer Aufgaben Dienste anderer Agenten in Anspruch<br />
nehmen. Dabei soll ein Agent folgende Eigenschaften aufweisen. Erstens soll er<br />
autonom handeln können, also selbstgesteuert ohne Einfluss von außen. Zweitens soll er<br />
sich situiert verhalten, also kontextbezogen mit der Umwelt interagieren können. Drittens<br />
soll er zu entsprechendem sozialen Verhalten fähig sein, worunter hier die Fähigkeit zur<br />
Kommunikation und Kooperation mit anderen Agenten des Systems verstanden wird (s.<br />
Luger01, S. 266f). Die erste Anforderung impliziert, dass ein Agent über eigene<br />
Komponenten zur Problemlösung, Verhaltensentscheidung und Systemsteuerung verfügen<br />
muss. Zur Gewährleistung der kontextbezogen Interaktion mit der Umwelt müssen<br />
entsprechende Schnittstellen für den Austausch von Informationen unterstützt werden (s.<br />
Burkhard00, S. 971-978). Hinsichtlich der Anforderung geeigneter Kommunikations- und<br />
Kooperationsfähigkeiten müssen die Agenten eines Multi-Agenten-Systems gewissen<br />
Konventionen genügen. Dabei spielen Ontologien eine wesentliche Rolle, weshalb dieser<br />
Aspekt hier genauer beleuchtet werden soll.<br />
C.2.1.1 Kommunikation in Multi-Agenten-Systemen<br />
Um während eines kommunikativen Aktes zwischen Agenten die semantische Korrektheit<br />
der ausgetauschten Informationen gewährleisten zu können, muss jeder Agent <strong>zum</strong><br />
einen über ein Verständnis des behandelten Wissens verfügen und zweitens in geeigneter<br />
Form darüber kommunizieren können. Hinsichtlich der ersteren Anforderung muss ein<br />
Agent über ein entsprechendes Modell der für seine Aufgaben relevanten Wissensstrukturen<br />
verfügen, welches hier als „Umweltmodell“ (Burkhard00, S. 975) bezeichnet wird.<br />
Bezüglich der zweiten Anforderung muss der Agent eine sogenannte „Agenten-Kommunikations-Sprache<br />
124 “ unterstützen, wobei die Wichtigkeit der Kommunikationsfähigkeit<br />
durch deren Proklamation als konstituierende Eigenschaft von Agenten in Multi-<br />
Agenten-Systemen hervorgehoben wird (s. Finin+97, S. 1).<br />
Zur Realisation dieser auch als „Kommunikation auf der Wissensebene 125 “ bezeichneten<br />
Fähigkeit werden Konventionen auf drei technischen Ebenen verlangt: Erstens ein<br />
gemeinsames Repräsentationsformat für den verlustfreien Austausch, zweitens ein geeignetes<br />
Protokoll zur Sicherung der Konsistenz ausgetauschter Nachrichten und drittens<br />
eine von allen Beteiligten akzeptierte Spezifikation des kommunizierten Inhaltes, also der<br />
Wissensstrukturen (s. Gruber93, S. 1). Die Arbeiten der Knowledge Sharing Effort – Initiative<br />
(KSE) 126 decken diese drei Gebiete ab und sollen daher hier vorgestellt werden.<br />
weise die Funktionsweise des menschlichen Gehirns im Ansatz der Neuronalen Netze nachgeahmt wird (s. Görz+<br />
00b, S. 11f). Der im agentenorientierten Paradigma aufgegriffene Intelligenzbegriff orientiert sich an der Funktionsweise<br />
sozialer Systeme, in denen sich „ ... die Intelligenz .. in der Interaktion [manifestiert]“ (Görz+00b, S.2).<br />
124 engl.: „agent communication language“ (Obitko01, S.20).<br />
125 engl.: „knowledge level communication“ (Gruber93, S. 1).<br />
126 Knowledge Sharing Effort (KSE): Forschungsinitiative zur Entwicklung technischer Infrastrukturen für die Teilung<br />
von Wissen, also die Verwendung formal erfasster Wissensstrukturen in mehreren Applikationen. Seit Anfang<br />
der 1990er Jahre arbeiten an unterschiedlicher US-amerikanischer Universitäten drei Forschungsgruppen in den<br />
Bereichen der Austauschsprachen, wiederverwendbarer Wissensbasen und der Kommunikationsprotokolle (vgl.<br />
Neches+91). Weiterführende Informationen sowie die wesentlichen Publikationen finden sich auf der Homepage der<br />
Forschungsinitiative unter: http://ww-ksl.stanford.edu/knowledge-sharing/index.html (04.09.2002).
Kapitel C: Verwendung von Ontologien in Informationssystemen 55<br />
Innerhalb des KSE wurden die Sprache KIF sowie das Ontolingua-System entwickelt.<br />
Wie bei deren Vorstellung als Referenzbeispiel für die Formalisierung von Ontologien (s.<br />
B.1.3.2) erläutert, dienen diese beiden Techniken der plattformunabhängigen formalen<br />
Spezifikation einer Ontologie. Dabei sind sie auf Grund ihrer Ausdrucksstärke vornehmlich<br />
als Format für den verlustfreien Austausch formalisierter Wissensstrukturen zwischen<br />
verschiedenen Zielsystemen konzipiert und stellen somit eine Lösung für ein gemeinsames<br />
Repräsentationsformat dar (s. Gruber93b, S. 5ff). Als Kommunikationsprotokoll<br />
für den Nachrichtenaustausch im Sinne einer Agenten-Kommunikations-Sprache wurde<br />
KQML 127 entwickelt, worin basierend auf den Erkenntnissen der Sprechakt-Theorie 128<br />
grundlegende Kommunikationsakte mit entsprechend festgelegter Bedeutung definiert<br />
sind. Eine KQML-Nachricht ist in drei Teile gegliedert: Der Inhaltsteil (engl.: „Content<br />
Layer“) enthält die eigentlichen Informationen, im Kommunikationsteil (engl. „Communication<br />
Layer“) werden Sender, Empfänger und eine Identifikation der Nachricht angegeben<br />
und im Nachrichtenteil (engl.: „Massage Layer“) die verwendete Sprache sowie die<br />
verwandte Ontologie spezifiziert (s. Finin+97, S. 6-16). Abbildung 10 zeigt ein Beispiel<br />
einer KQML-Nachricht mit entsprechenden Erläuterungen.<br />
Inhaltsteil<br />
Nachrichtenteil<br />
(ask-one<br />
: sender joe<br />
: content (PRICE IBM ?price)<br />
: receiver stock-server<br />
: reply-with ibm-stock<br />
: language LPROLOG<br />
: ontology NYSE-TICKS)<br />
Performativum<br />
Kommunikationsteil<br />
Abbildung 10: Bespiel einer KQML-Nachricht 129<br />
Die geteilte Spezifikation des Kommunikationsinhaltes als dritte Konventionsebene für<br />
die Kommunikationsfähigkeit zwischen Agenten ist im hier betrachteten Zusammenhang<br />
der Ontologieverwendung wesentlich und soll deshalb ausführlicher betrachtet werden.<br />
C.2.1.2 Geteilte Ontologie als Inhaltsspezifikation<br />
Mit einem gemeinsamen Repräsentationsformat und einer geeigneten Kommunikationssprache<br />
kann der verlustfreie und korrekte Austausch von Wissen zwischen Agenten gewährleistet<br />
werden. Allerdings ist die inhaltliche Korrektheit des ausgetauschten Wissens<br />
damit noch nicht gesichert, weshalb zur Bedeutungsdefinition des Vokabulars der<br />
zwischen den Agenten ausgetauschten Wissensstrukturen eine sogenannte „gemeinsame<br />
Ontologie 130 “ genutzt wird. Diese Ontologie stellt eine vorab definierte Erfassung der<br />
127 KQML: Knowledge Query and Manipulation Language. Entwickelt von der KSE-Forschungsgruppe für externe<br />
Schnittstellen von Wissensbasen und als Quasi-Standard etabliert – ähnlich wie das Ontolingua-System zur formalen<br />
Spezifikation von Ontologien. Eine äquivalente Sprache stellt die ´Agent Commication Language´ (ACL) der FIPA<br />
dar (vgl. FIPA-97). FIPA(Foundation for Intelligent Physical Agents): Non-Profit-Organisation mit der Zielsetzung,<br />
international akzeptierte Spezifikationen für Agententechnologien zu definieren. Siehe: www.fipa.org (04.09.2002).<br />
128 Die Sprechakt-Theorie untersucht Sprechakte als die kleinsten Einheiten sprachlicher Kommunikation hinsichtlich<br />
deren Struktur und Bedingungen für das Verstehen und Gelingen eines Sprechaktes. Dabei werden Sprechakte bezüglich<br />
ihrer lautsprachlichen und semantischen Struktur, der Wirkungsintention des Sprechers sowie der Wirkung beim<br />
Rezipienten unterschieden (vgl. Hindelang94). Diese verschiedenartigen Sprechakte werden in KQML als vordefinierte<br />
Performative (engl.: „performatives“ (Finin+97, S.10)) übernommen.<br />
129 entnommen aus: (Finin+97, S. 10). Erläuterungen durch den Autor.<br />
130 engl.: „common ontology“ (Gruber93b, S. 3).
Kapitel C: Verwendung von Ontologien in Informationssystemen 56<br />
relevanten Wissensstrukturen dar, wobei die Erhaltung der semantischen Korrektheit über<br />
entsprechende ontologische Verpflichtungen durch die beteiligten Agenten erreicht wird<br />
(s. Finin+97, S. 6). Ein derartiger Einsatz von Ontologien in Multi-Agenten-Systemen<br />
wird im KRAFT-Projekt 131 verfolgt (s. Jones98, S. 2f). Hinsichtlich der oben vorgestellten<br />
Verwendungsszenarien von Ontologien (s. C.1.2) entspricht eine solche gemeinsame<br />
Ontologie zur Spezifikation des Inhalts von Kommunikation zwischen Agenten Szenario<br />
I.a, beziehungsweise I.b – je nach Betrachtung der funktionalen Priorität.<br />
Mit einer gemeinsamen Ontologie soll neben der primären Funktion der Sicherstellung<br />
der Korrektheit ausgetauschter Wissensstrukturen das Ziel der Wissensteilung bei der<br />
Entwicklung intelligenter Systeme realisiert werden, da eine gemeinsame Ontologie nur<br />
einmal entwickelt werden muss und fortan für verschiedene Applikationen genutzt werden<br />
kann (s. Gruber93b, S. 2ff). Um eine effiziente Nutzung einer solchen Ontologie zu<br />
gewährleisten, müssen entsprechende infrastrukturelle Lösungen zur Verfügung stehen.<br />
Grundlegende Bedeutung haben dabei „Ontologie Server 132 “, die existente Ontologien<br />
bereitstellen, verwalten und den Zugang zu ihnen ermöglichen. Weiterhin muss die<br />
Handhabung der Ontologien durch Agenten geregelt werden. Die FIPA (siehe Fußnote<br />
127) entwirft dafür einen sogenannten „Ontology Agent“ (FIPA-98, S. 13), der alle diesbezüglichen<br />
Aufgaben für die Verwendung von Ontologien in Multi-Agenten-Systemen<br />
übernehmen soll.<br />
Abschließend ist an<strong>zum</strong>erken, dass die Entwicklung einer geeigneten gemeinsamen<br />
Ontologie für ein Multi-Agenten-System sehr aufwendig ist und in der Praxis als nicht<br />
durchführbar angesehen wird. Daher werden Ansätze mit mehreren Ontologien zur<br />
Sicherung der inhaltlichen Korrektheit der Kommunikation verfolgt (s. Campell+98, S.<br />
1f). Bei derartigen Ansätzen treten neuartige Problemstellungen hinsichtlich der semantischen<br />
Interoperabilität zwischen verschiedenen Ontologien auf, welche später ausführlicher<br />
behandelt werden sollen (s. C.3.2).<br />
C.2.2 Informationsintegration<br />
Unter dem Begriff der Integration wird im informationstechnischen Umfeld die Zusammenführung<br />
von Inhalten aus heterogenen, also nicht kompatiblen Quellen verstanden (s.<br />
Wache+01, S.1). Dabei werden verschiedene Level der Integration gemäß der Unterscheidung<br />
von Daten, Information und Wissen differenziert (s. Schreiber+00, S. 3-5). Als<br />
Datenintegration wird die Schaffung der syntaktischen Kompatibilität, als Informationsintegration<br />
die Zusammenführung bedeutungstragender Daten und als Wissensintegration<br />
die Integration formal erfasster Wissensstrukturen verstanden (s. Rodrígez00, S 8ff). Hier<br />
sollen Verfahren zur ontologie-basierten Informationsintegration besprochen werden.<br />
Die grundlegende Problematik der Schaffung von Interoperabilität zwischen Systemen<br />
oder ihren Komponenten besteht in der Heterogenität der Systemstrukturen, wobei vier<br />
Stufen unterschieden werden. Die niedrigste Stufe stellt die Systemheterogenität hinsicht-<br />
131 KRAFT: Projekt zur Informationsintegration aus heterogenen Quellen, wobei ein entsprechendes Multi-Agenten-<br />
System , ´KRAFT Network´, entwickelt wurde. Darin werden die durchzuführenden Aufgaben an jeweils spezialisierte<br />
Agenten delegiert, deren Kommunikation über eine geteilte Ontologie gesichert wird (s. Jones98, S. 3f).<br />
132 engl.: „ontology server“ (Falasconi+96, S. 13).
Kapitel C: Verwendung von Ontologien in Informationssystemen 57<br />
lich verwandter Hardware und Betriebssysteme dar. Die zweite Stufe der Syntaxheterogenität<br />
bezieht sich auf Sprachen und Datenrepräsentationen. Die als strukturelle Heterogenität<br />
bezeichnete dritte Stufe erfasst Unterschiede in verwandten Datenmodellen, und<br />
die vierte Stufe der semantischen Heterogenität bezieht sich auf Unterschiede in der Bedeutung<br />
der Informationen (s. Sheth98, S.4ff). Die ersten beiden Stufen fallen in den<br />
Bereich der Datenintegration und die letzten beiden in jenen der Informationsintegration,<br />
wobei mit der Verwendung von Ontologien vor allem die Problematik der semantischen<br />
Heterogenität gelöst werden soll (s. Kashyap+96, S. 1f).<br />
Dazu werden im Folgenden zwei Ansätze vorgestellt, in denen die semantische Kompatibilität<br />
zwischen Informationsquellen mit Hilfe von Ontologien als bedeutungsdefinierende<br />
Spezifikation der Inhalte erreicht werden soll (s. Wache+01, S. 2f). Abbildung 11<br />
zeigt die grundlegenden Architekturstrukturen, die anschließend genauer erläutert werden.<br />
Ansatz mit globaler Ontologie (s. C.2.2.1)<br />
Ansatz mit lokalen Ontologien (s. C.2.2.2)<br />
Abbildung 11: Ansätze ontologiebasierter Informationsintegration 133<br />
C.2.2.1 Integration mit einer globalen Ontologie<br />
Im ersten Ansatz enthält eine „globale Ontologie 134 “ bedeutungsdefinierende Beschreibungen<br />
der Inhalte aller zu integrierenden Informationsquellen und stellt somit ein Meta-<br />
Modell zur Gewährleistung der semantischen Interoperabilität zwischen heterogenen Informationsquellen<br />
im Sinne des Verwendungsszenarios II.b (s. C.1.2) dar. Ähnlich wie<br />
eine geteilte Ontologie für die Agentenkommunikation (s. C.2.1.2) wird dadurch ein<br />
einheitliches, bedeutungserhaltendes Vokabular für die Verarbeitung von Informationen<br />
definiert, wobei die Ontologie den maximal erreichbaren Konsens der semantischen<br />
Struktur der einzelnen Informationsquellen darstellt. Je übereinstimmender dieser<br />
Konsens, desto höher ist die geschaffene semantische Interoperabilität (s. Wache+01, S.<br />
2).<br />
Eine globale Ontologie zur Informationsintegration kann aus softwaretechnischen<br />
Beweggründen aus mehreren Ontologien zusammengesetzt werden, wobei die funktionale<br />
Intention jedoch gleich bleibt. Das DOME-Projekt 135 arbeitet mit einer solchen Struktur<br />
und soll daher hier beispielhaft erläutert werden. Darin wird die globale Ontologie durch<br />
eine Hierarchie von Ontologien realisiert, wobei die unterste Ebene die Ontologien der<br />
133 entnommen aus: (Wache+01, S. 2).<br />
134 engl.: „global ontology“ (Wache+01, S.1).<br />
135 DOME (Domain Ontology Management Environment): Projekt der ´Intelligent Business Systems Research<br />
Group´ der BT Group (siehe: http://193.113.209.147/projects/ibsr/dome/index.htm, 11.09.02) zur Entwicklung ontologiebasierter<br />
Techniken für den Bereich des Electronic Business. Das DOME-Werkzeug ist eine Entwicklungsumgebung<br />
für ontologiebasierte Anwendungen (s. Cui+01, S. 3ff).
Kapitel C: Verwendung von Ontologien in Informationssystemen 58<br />
einzelnen Informationsquellen bilden. Die Ontologie auf der nächsthöheren Ebene stellt<br />
eine Zusammenführung ähnlicher Ontologien als den maximal erreichbaren Konsens dar.<br />
Diese Zusammenfassung wird solange vorgenommen, bis nur noch eine Ontologie als<br />
oberste Ebene zur Gewährleistung der semantischen Interoperabilität innerhalb des<br />
Systems existiert. Die Erstellung der einzelnen Ontologien wird durch entsprechende<br />
Werkzeuge unterstützt, muss aber vom Ontologie-Entwickler manuell korrigiert werden<br />
(s. Cui+00, S. 3-5).<br />
Obwohl dieser Ansatz zur Informationsintegration das Problem der semantischen<br />
Heterogenität zu lösen vermag, weist er in der Praxis ähnliche Schwierigkeiten wie bei der<br />
Erstellung der geteilten Ontologie für die Agentenkommunikation auf. Denn je heterogener<br />
die Strukturen der zu integrierenden Informationsquellen sind, desto schwieriger ist<br />
die Findung eines gemeinsamen Verständniskonsenses für die globale Ontologie und desto<br />
geringer ist die erreichbare semantische Interoperabilität (Wache+01, S. 2).<br />
C.2.2.2 Integration mit mehreren lokalen Ontologien<br />
Für verteilte und inhaltlich sehr heterogene Informationssysteme, wie das Internet,<br />
respektive das Semantic Web eines darstellt, wird die Erstellung einer alles umfassenden<br />
globalen Ontologie zur Informationsintegration als sehr schwierig bis unmöglich bewertet<br />
(s. Kashyap+96, S. 1f). Daher wurde ein Ansatz für die Informationsintegration entworfen,<br />
der auf die Erstellung einer globalen Ontologie und somit der Findung eines gemeinsamen<br />
Verständniskonsenses verzichtet. Es werden – wie in Abbildung 11 dargestellt<br />
– lediglich „lokale Ontologien 136 “ zur Inhaltsbeschreibung der einzelnen Ressourcen<br />
verwendet und die semantische Interoperabilität durch sogenannte „interontologische Abbildungen<br />
137 “ erreicht, so dass dieser Ansatz dem Verwendungsszenario II.b (s. C.1.2)<br />
entspricht (s. Wache+01, S. 2).<br />
Eine implementierte Lösung dieses Ansatzes stellt das OBSERVER-System 138 dar, dessen<br />
wesentliche Aspekte hier kurz vorgestellt werden sollen. Gemäß dem Ansatz wird<br />
darin jede Informationsquelle mit einer eigenen Ontologie beschrieben, ohne dass diese in<br />
einer globalen Ontologie zusammengefasst werden. Stattdessen sind im sogenannten „Interontology<br />
Relationship Manager (IRM)“ (Mena+00, S. 16) die Unterschiede zwischen<br />
den Ontologien hinsichtlich der Bedeutungsdifferenzen einzelner Terme beschrieben und<br />
entsprechende Transformationsfunktionen für den bedeutungserhaltenden Austausch von<br />
Informationen definiert. Für diese Abbildungsfunktionen werden die Synonyme (äquivalente<br />
Begriffe), Hyponyme (hierarchisch untergeordnet) und Hypernyme (hierarchisch<br />
übergeordnet) der einzelnen Terme herangezogen (s. Mena+00, S. 17).<br />
Die semantische Interoperabilität zwischen heterogenen Informationsressourcen wird<br />
also durch die IRM-Komponente ermöglicht, wobei der kritische Punkt des Systems in<br />
der manuell zu erstellenden Definition der semantischen Beziehungen sowie der darauf<br />
basierenden Abbildungsfunktionen liegt.<br />
136 engl.: “local ontologies” (Wache+01, S.2).<br />
137 engl.: “inter-ontology mapping” (Wache+01, S.2).<br />
138 OBSERVER (Ontology Based System Enhanced with Relationships for Vocabulary hEterogeneity Resolution).<br />
Entstanden aus einem Forschungsprojekt der ´Universidad de Zaragoza´ zur Handhabung heterogener Ontologien.<br />
Eine umfassende Beschreibung des Ansatzes findet sich in (Mena+00).
Kapitel C: Verwendung von Ontologien in Informationssystemen 59<br />
Die Definition interontologischer Abbildungen fällt in den Bereich der Wissensintegration<br />
und ist im Hinblick auf die Gewährleistung und Erhaltung der semantischen<br />
Korrektheit sehr kompliziert. (s. Wache+01, S. 3). Hinsichtlich der Verwendung von Ontologien<br />
im Semantic Web liegt eine grundlegende Herausforderung an die Forschung in<br />
der Entwicklung zur Handhabung heterogener Ontologien, weshalb dieser Aspekt später<br />
ausführlicher behandelt werden soll (s. C.3.2).<br />
C.2.3 Information Retrieval<br />
Unter Information Retrieval (IR) werden Techniken <strong>zum</strong> Auf-, beziehungsweise Wiederfinden<br />
von Information in Informationssystemen verstanden. Dabei stellt der Benutzer<br />
über eine entsprechende Schnittstelle eine Anfrage, welche das System mit den erfassten<br />
Informationen abgleicht und als Suchresultat die passenden Informationen zurückgibt.<br />
Auf Grund der wachsenden Menge an verfügbaren Informationen, vor allem in weltweit<br />
vernetzten Informationssystemen wie dem Internet, werden immer höhere Qualitätsansprüche<br />
an IR-Techniken gestellt, weshalb reichhaltige Forschungsaktivitäten auf<br />
diesem Gebiet zu verzeichnen sind (s. Greengrass00, S. 6ff).<br />
C.2.3.1 Ontologiebasiertes Information Retrieval<br />
Der ontologiebasierte Ansatz des Information Retrieval basiert auf dem Einsatz von<br />
Ontologien zur Strukturdefinition eines IR-Systems. Dabei wir die Anfrageschnittstelle<br />
auf der Ontologiestruktur basierend konzipiert und die Indizierung der Informationen<br />
durch deren Zuweisung als Instanzen der in der Ontologie erfassten Konzepte vorgenommen.<br />
Als wesentliche Verbesserung der funktionalen Qualität des IR-Systems soll<br />
dadurch das sogenannte „semantische Abgleichen 139 “ ermöglicht werden. Darunter wird<br />
verstanden, dass die intendierte Bedeutung eines in der Anfrage formulierten<br />
Suchbegriffes auf Grund dessen Zuordnung in der Ontologiestruktur in den richtigen<br />
Kontext eingebettet werden kann und so das Suchresultat nur diejenigen Informationen<br />
beihaltet, die dem Suchbegriff entsprechen und außerdem dem relevanten Kontext angehören.<br />
Weiterhin kann eine Ontologie die im System existenten Informationen mit<br />
hintergründigem Wissen ergänzen, wodurch eine erweiterte Informationsgewinnung für<br />
den Nutzer des IR-Systems erreicht werden kann (s. McGuinness98, S. 304ff).<br />
Da ontologiebasierte Verfahren mit den Wissensstrukturen eines Informationssystems<br />
arbeiten, werden sie auch als „Knowledge Retrieval“ (Rodrígez00, S. 26) bezeichnet. Hinsichtlich<br />
der wesentlichen Erfolgsmaße für IR-Systeme 140 wird ontologiebasierten Verfahren<br />
eine höhere Effektivität als anderen Ansätzen zugeschrieben, was vor allem auf die<br />
Möglichkeit der bedeutungsbeschreibenden Erfassung der Informationsressourcen sowie<br />
auf die Möglichkeit <strong>zum</strong> semantischen Abgleichen derselben mit Anfragen zurückgeführt<br />
wird. In einem Effizienzvergleich eines Keyword-Matching-Systems mit einem ontologiebasierten<br />
Ansatz wird dieses empirisch bestätigt (s. Aitken+00, S. 3).<br />
139 engl.: „semantic matching“ (Guarino97, S. 2).<br />
140 Die grundlegenden Erfolgsmaße für IR-Systeme nach (Greengrass00, S. 10):<br />
(1) Trefferquote (engl.: „recall factor“): Anteil der relevanten Informationen im Suchergebnis (Clason76, S.<br />
320).<br />
(2) Genauigkeit (engl.: „precision“): Verhältnis der relevanten Information im Suchergebnis zu den nicht im<br />
Suchergebnis enthaltenen (Clason76, S. 301).
Kapitel C: Verwendung von Ontologien in Informationssystemen 60<br />
C.2.3.1.1 Ontologie als Thesaurus<br />
Wie schon erläutert, werden Ontologien in ontologiebasierten IR-System als strukturdefinierende<br />
Ordnungssysteme verwendet und übernehmen somit eine klassische Thesaurusfunktionalität<br />
(s. Gaus98, S. 148). Die Primitive der Ontologie stellen dabei die Deskriptoren<br />
für die Informationsressourcen dar, wobei gemäß den Anforderungen an einen<br />
Thesaurus bei der Erstellung der Ontologie vor allem die semantischen Zusammenhänge<br />
der Begriffe zu berücksichtigen sind. 141 Die wesentlichen Anforderungen an Ordnungssysteme<br />
im Information Retrieval hinsichtlich der <strong>vollständige</strong>n und konsistenten Erfassung<br />
der Wissensstrukturen werden in gleicher Weise an Ontologien gestellt (s. B.1.4.1),<br />
weshalb deren Verwendung zur Strukturdefinition für die Indizierung im Information Retrieval<br />
im Sinne des Verwendungsszenarios III.a (s. C.1.2) als sinnvoll betrachtet werden<br />
kann. Als entsprechendes Beispiel soll die Verwendung von Ontologien in ONTOSEEK<br />
vorgestellt werden.<br />
C.2.3.1.2 ONTOSEEK<br />
ONTOSEEK 142 ist ein Information Retrieval – System, das eine Ontologie im vorgestellten<br />
Sinne verwendet. Es ermöglicht einen semantischen Abgleich durch Nutzung sprachverarbeitender<br />
Verfahren, was im Folgenden erläutert werden soll.<br />
Zunächst wird die inhaltlich Struktur der Informationen mittels Sprachverarbeitungstechniken<br />
in sogenannten „lexikalischen semantischen Graphen 143 “ dargestellt und dieser<br />
Strukturerfassung unter Verwendung von SENSUS 144 die intendierte Bedeutung zugewiesen.<br />
Diese inhaltlichen Beschreibungen der Informationen werden als bedeutungsbeschreibende<br />
Indexierung in einer Datenbank abgelegt. Außerdem werden sie als<br />
Instanzen der System-Ontologie zugeordnet, welche eine Domänenontologie der entsprechenden<br />
Wissensdomäne darstellt.<br />
Die natürlichsprachlichen Nutzeranfragen werden auf gleiche Art und Weise erfasst,<br />
wobei ihnen die primäre Bedeutung aus der SENSUS-Ontologie zugewiesen wird. Auf<br />
dieser Grundlage kann ein semantischer Abgleich vorgenommen werden: Dazu werden<br />
nur jene Inhaltserfassungen in der Datenbank mit der Abfrage abgeglichen, die in der<br />
System-Ontologie dem gleichen Konzept oder diesem untergeordneten Konzepten zugeordnet<br />
sind wie die bearbeitete Anfrage. Somit soll das Suchergebnis hinsichtlich der Trefferquote<br />
und der Genauigkeit verbessert werden (s. Borgo+97, S. 1-4).<br />
141 Definition eines Thesaurus als Dokumentationssprache im Bereich des Information Retrieval:<br />
“Ein Thesaurus im Bereich der Information und Dokumentation ist eine geordnete Zusammenstellung von Begriffen<br />
und ihren (vorwiegend natürlichsprachlichen) Bezeichnungen, die in einem Dokumentationsgebiet <strong>zum</strong> Indexieren,<br />
Speichern und Wiederauffinden dient. Er ist durch folgende Merkmale gekennzeichnet:<br />
a) Begriffe und Bezeichnungen werden eindeutig aufeinander bezogen (´terminologische Kontrolle´), indem<br />
- Synonyme möglichst vollständig erfasst werden,<br />
- Homonyme und Polyseme besonders gekennzeichnet werden,<br />
- für jeden Begriff eine Bezeichnung [...]festgelegt wird, die den Begriff vertritt,<br />
b) Beziehungen zwischen Begriffen (repräsentiert durch ihre Bezeichnungen) werden dargestellt.“ (DIN 1463, S. 22).<br />
142 ONTOSEEK: Ontologiebasiertes Information Retrieval – System, das mit dem Ziel der Verarbeitung natürlichsprachlicher<br />
Anfragen entwickelt wurde (s. Borgo+97, S. 1f).<br />
143 engl.: „Lexical Semantic Graphs“ (Borgo+97, S.2). Diese dienen der strukturellen Erfassung natürlichsprachlicher<br />
Zusammenhänge und basieren auf dem Ansatz der Konzeptgraphen (s. A.1.1.2).<br />
144 SENSUS: umfangreiche Top-Level-Ontologie, in der mehrere linguistische Ontologien (s. C.2) zusammengeführt<br />
sind. Sie enthält eine einfache taxonomische Struktur der Bedeutung natürlichsprachlicher (englischer) Begriffe und<br />
soll als wiederverwendbare Basis für sprachverarbeitende Applikationen dienen soll (s. Swartout+97).
Kapitel C: Verwendung von Ontologien in Informationssystemen 61<br />
C.3 Implikationen für Ontologiebasierte Informationssysteme<br />
Als Abschluss der Betrachtungen zur Verwendung von Ontologien in Informationssystemen<br />
sollen die wesentlichen Implikationen herausgearbeitet werden, welche sich für<br />
die Erstellung „ontologiebasierter Informationssysteme 145 “ ergeben. Da in den bisherigen<br />
Ausführungen vornehmlich die Einsatzmöglichkeiten von Ontologien als bedeutungsdefinierende<br />
Systemkomponenten behandelt worden sind, soll hier zunächst die Verwendung<br />
von Ontologien als konzeptionelles Hilfsmittel in der Systemsentwicklung besprochen<br />
werden.<br />
Im Unterschied zu den bisher aufgezeigten Verwendungsmöglichkeiten stellt eine im<br />
Entwicklungsprozess eines Systems genutzte Ontologie keine Funktionalität bereit, sondern<br />
eine Konzeptionsgrundlage vor allem für die der Implementierung vor- und nachgelagerten<br />
Entwicklungsstufen. Ein nutzenbringender Einsatz wird vor allem in vier Bereichen<br />
gesehen, für welche die möglichen Vorteile durch die Verwendung einer Ontologie<br />
kurz erläutert werden sollen. Der erste Bereich ist die Systemspezifikation, wobei<br />
eine Domänenontologie als Verständnismodell des Anwendungsgebietes des zu entwickelnden<br />
Systems die Basis zur Identifikation der Systemaufgaben und -funktionalitäten<br />
bilden und somit eine höhere Qualität der Spezifikation gewährleisten kann (s. Borst 97, S.<br />
23f). Weiterhin kann eine Ontologie als zweiter Bereich die Wissensakquisition unterstützen,<br />
indem sie eine Ausgangsbasis für den Wissenserwerb durch ein grundlegendes<br />
Verständnis der behandelten Wissensdomäne bietet und die Zuordnung akquirierter<br />
Wissensstrukturen in den strukturellen Zusammenhang ermöglicht (s. vanHeijst+97, S.<br />
33-50). Für die nachgelagerten Stufen der Systementwicklung kann eine Ontologie erstens<br />
für Systemtests hinsichtlich der Reliabilität verwandt werden (s. Uschold+96, S. 13) und<br />
zweitens die Grundlage für die Erstellung der Dokumentation des Systems bieten (s.<br />
Uschold+99, S. 3).<br />
Dabei kann für alle vorgestellten Bereiche die gleiche Ontologie genutzt werden,<br />
weshalb eine solche Verwendung von Ontologien auch als „ontologiebasierter Ansatz der<br />
Systementwicklung 146 “ bezeichnet wird. Dabei soll die Verwendung einer Ontologie eine<br />
einheitliche, qualitätssichernde Grundlage für die Systementwicklung gewährleisten (s.<br />
Guarino98, S. 8f). Da die Verwendung von Ontologien als Hilfsmittel in der Systementwicklung<br />
für den hier verfolgten Untersuchungszusammenhang lediglich sekundäre<br />
Bedeutung hat, soll dieser Themenbereich nicht weiter ausgeführt werden.<br />
Wesentlicher erscheinen die softwaretechnischen Aspekte zur Handhabung von Ontologien<br />
als wiederverwendbare und integrierbare Komponenten zur Bedeutungsdefinition<br />
in Informationssystemen, da die angestrebten Verbesserungen wissensverarbeitender<br />
Systeme durch ontologiebasierte Verfahren der Wissensmodellierung erst mit der<br />
Bereitstellung entsprechender Techniken erreicht werden können. Dazu sollen die in den<br />
Ausführungen schon häufiger erwähnten Aspekte der Wiederverwendung von Ontologien<br />
in verschiedenen Zielsystemen sowie die Handhabung mehrerer heterogener Ontologien<br />
in einem System genauer betrachtet werden.<br />
145 engl.: „ontology-driven information systems“ (Guarino98, S. 8).<br />
146 engl.: „ontology-driven information system development” (Guarino98, S. 8).
Kapitel C: Verwendung von Ontologien in Informationssystemen 62<br />
C.3.1 Wiederverwendbarkeit<br />
Die Wiederverwendung existenter Programmteile ist ein grundlegendes Anliegen bei der<br />
Entwicklung computergestützter Systeme, wobei die Motivation relativ einfach nachzuvollziehen<br />
ist: Die Entwicklung eines Systems ohne jegliche Vorlage ist sehr aufwendig<br />
und kostenintensiv, außerdem sind umfangreiche Fachkenntnisse zur Gewährleistung einer<br />
angemessenen Qualität des Systems nötig. Daher werden von Spezialisten wiederverwendbare<br />
Komponenten für allgemeine Systemfunktionalitäten entwickelt, durch deren<br />
Verwendung in einem neuen System erstens der Entwicklungsaufwand minimiert und<br />
zweitens dessen funktionale Qualität gesichert werden kann (s. Borst97, S.1f).<br />
Während für die Wiederverwendbarkeit in der konventionelle Softwareentwicklung die<br />
Funktionalität der Komponenten sowie deren Integrierbarkeit durch die Unterstützung<br />
entsprechender Schnittstellen entscheidend ist, müssen wiederverwendbare Komponenten<br />
für wissensverarbeitende Aufgaben vor allem eine allgemeingültige Wissensstruktur<br />
beinhalten, die für unterschiedliche Aufgaben eingesetzt werden kann. Die Erfassbarkeit<br />
derartiger Wissensstrukturen wurde im Hinblick auf das sogenannte „Interaktionsproblem<br />
147 “ in Frage gestellt, wobei diese Einwände durch die Entwicklung generischer<br />
Wissensmodelle im Knowledge Engineering (s. A.1.2.1) entkräftet wurden. Ein generelles<br />
Problem der Erstellung solcher allgemeingültiger Wissensmodelle liegt in der nötigen<br />
Abwägung zwischen Verwendbarkeit und Wiederverwendbarkeit 148 , wozu im Folgenden<br />
ein Lösungsansatz für Ontologien vorgestellt werden soll. Anschließend werden die<br />
wesentlichen Aspekte des Prozesses zur Wiederverwendung von Ontologien dargelegt.<br />
C.3.1.1 Verwendbarkeit und Wiederverwendbarkeit<br />
In seiner Dissertation ging Willem N. Borst (vgl. Borst97) der Fragestellung nach, ob Ontologien<br />
verwendbar für eine konkrete Anwendung und gleichzeitig wiederverwendbar für<br />
verschiedene Applikationen sein können. Dazu wurden zunächst eine Gruppe allgemeingültiger<br />
Ontologien namens PHYSYS zur Beschreibung physischer Systeme entworfen (s.<br />
Borst97, S. 25-54), deren Verwendbarkeit hinsichtlich der Vollständigkeit der darin erfassten<br />
Wissensstrukturen durch die Verwendung als Basis einer Ontologiebibliothek für<br />
physikalische Simulationen bewiesen wurde (Borst97, S. 55-80). Mit der Nutzung der<br />
PHYSYS-Ontologien als Grundlage einer Ontologie für die Produktionswirtschaft (Borst<br />
97, S. 81-120) wurde nachgewiesen, dass die PHYSYS-Ontologien auch in andersartigen<br />
Anwendungskontexten verwendbar sind.<br />
Daraus resultiert, dass trotz des existenten Widerspruchs von Verwendbarkeit und<br />
Wiederverwendbarkeit Ontologien entworfen werden können, die gleichzeitig und in angemessener<br />
Qualität verwendbar und wiederverwendbar sind (s. Borst97, S. 121). Für die<br />
Erstellung derartiger Ontologien ist ein entsprechendes Entwicklungsprinzip zu verfolgen,<br />
wozu Borst das aus dem konventionellen Software Engineering bekannte Prinzip des<br />
147 engl.: „interaction problem“ (Bylander+88, S. 2). Dieses besagt, dass formal erfasste Wissensstrukturen generell<br />
nicht wiederverwendbar sind, weil ihre Struktur derart stark durch ihr spezifisches Anwendungsumfeld determiniert<br />
ist, dass sie nicht auf einen anderen Anwendungszusammenhang übertragen werden können.<br />
148 engl.: „reusability-usability trade-off“ (Klinker+91, S. 3). Damit ist folgender Widerspruch bezüglich der erreichbaren<br />
Qualität generischer Wissensmodelle gemeint: Je wiederverwendbarer ein Wissensmodell ist, desto allgemeingültiger<br />
muss es sein und je allgemeingültiger es ist, desto weniger ist es für eine spezifische Aufgabe verwendbar.
Kapitel C: Verwendung von Ontologien in Informationssystemen 63<br />
„Teilens und Zusammenführens 149 “ proklamiert. Dabei wird eine Modularisierung der<br />
Ontologie in kleinere Teilontologien vorgenommen, welche je eine inhaltlich abgeschlossene,<br />
allgemeingültige Erfassung des Weltausschnitts darstellen (s. Borst97, S. 18f).<br />
Diese Module können zusammengeführt und über sogenannte „ontologische Projektionen<br />
150 “ als Grundlage der Ontologie für einen spezifischen Anwendungskontext verwandt<br />
werden. Dabei werden drei Arten von Projektionen unterscheiden, wobei das<br />
Ontologie-Modul jeweils in die Anwendungsontologie inkludiert und in deren Struktur<br />
eingepasst wird. Die erste Art von Projektion wird als Inklusion und Erweiterung (engl.:<br />
„include and extend“) bezeichnet, wobei das Ontologie-Modul unverändert übernommen<br />
und lediglich dem Kontext entsprechend erweitert wird. Bei der Inklusion und Spezialisierung<br />
(engl.: „include and specialize“) als zweiter Art dient ein abstraktes Ontologie-<br />
Modul als Strukturvorgabe, wobei die Konzepte und Instanzen der Ontologie jenen des<br />
Ontologie-Moduls untergeordnet werden. Bei der dritten Art, bezeichnet als Inklusion<br />
und Abgleich (engl.: „include and map“), müssen die ontologischen Theorien auf Grund<br />
semantischer Heterogenitäten abgeglichen werden (s. Borst97, S. 53f). Dieser Aspekt wird<br />
anschließend genauer betrachtet (s. C.3.2).<br />
C.3.1.2 Wiederverwendung von Ontologien<br />
Durch die Erstellung modularisierter Ontologien und die Definition entsprechender<br />
Operationen für deren Zusammenführung ist zwar die theoretische Möglichkeit der<br />
Wiederverwendung von Ontologien gegeben, jedoch keine Erfassung der nötigen Schritte<br />
zur Integration existenter Ontologien in die Ontologie eines konkreten Anwendungskontextes.<br />
Diese Aufgabe erfordert einen strukturellen Abgleich der zu integrierenden<br />
Ontologie-Module mit den Anforderungen der zu erstellenden Anwendungsontologie<br />
und muss hinsichtlich der konzeptionellen Aspekte manuell vom Ontologie-Entwickler<br />
ausgeführt werden. Eine Unterstützung kann lediglich durch Werkzeuge für einzelne Teilaufgaben<br />
gegeben werden (s. Uschlod+98, S. 179).<br />
In den methodologischen Ansätzen der Ontologie-Entwicklung wird die Wiederverwendung<br />
existenter Ontologien bei der Entwicklung einer neuen Ontologie als zentrales<br />
Ziel ontologiebasierter Verfahren der Wissensmodellierung herausgestellt (s. B.1). Die<br />
dazu durchzuführenden Schritte werden in Tabelle 11 zusammenfassend erläutert.<br />
Tätigkeit<br />
Erläuterung<br />
1. Wiederverwendbarkeit Die Eignung der zu integrierenden Ontologie muss bezüglich der darin erfassten<br />
Wissensstrukturen hinsichtlich des für die Anwendungsontologie benötig-<br />
prüfen<br />
ten Wissens geprüft werden.<br />
2. Übersetzbarkeit prüfen Die Darstellbarkeit in gewünschten Zielsystem ist zu prüfen und eventuell existente<br />
semantische Unterschiede zwischen der zu integrierenden und der Anwendungsontologie<br />
sind hinsichtlich deren Auflösbarkeit zu bewerten.<br />
3. Transformation Falls 1. und 2. positiv ausfallen, wird die Integration vorgenommen. Dazu wird<br />
das konzeptionelle Modell der Anwendungsontologie mit den Definitionen der<br />
integrierten Ontologie erweitert (s. C.3.2)<br />
4. Verifikation der Prüfung der Funktionalität, Vollständigkeit und Konsistenz der neuen Anwendungsontologie<br />
bezüglich der dafür spezifizierten Anforderungen.<br />
Anwendungsontologie<br />
Tabelle 11: Prozess der Wiederverwendung von Ontologien 151<br />
149 engl.: „Divide and Conquer“ (Borst97, S. 18).<br />
150 engl.: „Ontology Projections“ (Borst97, S. 53).<br />
151 nach: (Uschold+98, S. 181-190). Übersetzungen der Begrifflichkeiten durch den Autor.
Kapitel C: Verwendung von Ontologien in Informationssystemen 64<br />
C.3.2 Integration von Ontologien<br />
Die besprochenen Verwendungsmöglichkeiten zeigen einige signifikante funktionale Verbesserungen<br />
durch den Einsatz von Ontologien in Informationssystemen auf. Dabei<br />
wurde jedoch deutlich, dass die Erstellung einer globalen, alle benötigten Wissensstrukturen<br />
erfassenden Ontologie auf Grund der hohen Umweltkomplexität <strong>zum</strong>eist nicht realisierbar<br />
erscheint und daher Ansätze mit mehreren heterogenen Ontologien innerhalb<br />
eines Systems als praktikabler angesehen werden (s. C.2.1.2, C.2.2.2). Um die semantische<br />
Interoperabilität als fundamentales Ziel der Verwendung von Ontologien in Informationssystemen<br />
in derartigen Ansätzen zu gewährleisten, muss diese zwischen den heterogenen<br />
Ontologien ermöglicht werden. Entsprechende Techniken werden als Verfahren<br />
der „Ontologie-Integration 152 “ bezeichnet.<br />
Das grundlegende Problem stellt dabei die semantischen Heterogenität, spezieller die<br />
als „ontologische Heterogenitäten 153 “ bezeichneten Differenzen in der bedeutungsdefinierenden<br />
Erfassung einer Wissensdomäne durch unterschiedliche Ontologien dar. Zur<br />
Gewährleistung der größtmöglichen Interoperabilität wird mit der „Vereinheitlichung 154 “<br />
heterogener Ontologien das höchste Level der Integration angestrebt. Ähnlich der Wiederverwendung<br />
von Ontologien kann diese Aufgabe hinsichtlich der Anforderungen auf<br />
der konzeptionellen Ebene nicht vollständig automatisiert, sondern lediglich durch entsprechende<br />
Werkzeuge unterstützt werden (s. Gangemi+98, S. 166f).<br />
Die Forschungsarbeiten auf diesem Gebiet sind noch nicht weit fortgeschritten, was<br />
auf die Komplexität dieser Problemstellung zurückgeführt wird (s. Wache+01, S. 3). Da<br />
die Ontologie-Integration für Verwendung von Ontologien im Semantic Web von wesentlicher<br />
Bedeutung ist, soll hier eine Klassifikation ontologischer Heterogenitäten sowie<br />
ein Ansatz zur werkzeuggestützten Behandlung derselben vorgestellt werden.<br />
C.3.2.1 Klassifikation ontologischer Heterogenitäten<br />
Mit der Klassifikation ontologischer Heterogenitäten 155 verfolgen Visser et al. das Ziel,<br />
den Aufwand für die Integration zweier Ontologien abschätzen und somit die Umsetzbarkeit<br />
der Integration differenzierter bewerten zu können. Es werden zwei Gruppen von<br />
Heterogenitäten unterschieden, wobei in der erste Gruppe Differenzen in den konzeptionellen<br />
Modellen zusammengefasst sind und in der zweiten Unterschiede in der formalen<br />
Spezifikation. 156 Jede Gruppe ist in mehrere verschiedenartige Heterogenitäten untergliedert<br />
(Visser+98, S. 151-154).<br />
Hinsichtlich des Behebungsaufwandes werden die unterschiedenen Heterogenitäten in<br />
drei Schwierigkeitsstufen eingeordnet. Als einfach behebbar werden dabei die Heterogenitäten<br />
in der formalen Spezifikation bewertet, Term- und Attributzugehörigkeiten<br />
werden als kontextabhängig eingestuft und taxonomische sowie andersartige strukturelle<br />
152 engl.: „Ontology Integration“ (Gangemi+98, S. 163).<br />
153 engl.: „ontological heterogeneity“ (Visser+98, S. 149).<br />
154 engl.: „unification“ (Gangemi+98, S. 166).<br />
155 Die Heterogenitäten werden dabei als „ontological mismatches“ (Visser+98, S. 151) bezeichnet. Obwohl damit<br />
nicht die wortwörtliche Übersetzung gewählt wurde, sollen sie zur Erhaltung der begrifflichen Einheitlichkeit in dieser<br />
Arbeit als ontologische Heterogenitäten bezeichnet werden.<br />
156 Die erste Gruppe wird als „conceptualisation mismatches“, die zweite als „explication mismatches“ bezeichnet<br />
(Visser+98, S. 151).
Kapitel C: Verwendung von Ontologien in Informationssystemen 65<br />
Heterogenitäten als nur schwer lösbar betrachtet (Visser +98, S. 161f). Mit Hilfe dieser<br />
Klassifikation kann sowohl über die generelle Umsetzbarkeit der Integration zweier Ontologien<br />
entschieden als auch der entsprechende Aufwand abgeschätzt werden.<br />
C.3.2.2 Halbautomatisierte Ontologie-Integration<br />
Das ONION-System 157 bietet eine werkzeuggestützte Lösung <strong>zum</strong> Auffinden und zur Behandlung<br />
ontologischer Heterogenitäten. Zur Erläuterung der Funktionsweise des Systems<br />
sollen zunächst die mathematischen Operationen erläutert werden, welche der Zusammenführung<br />
zweier Ontologien zugrunde liegen.<br />
Die Erstellung einer zwei Quellenontologien integrierenden Ontologie beruht auf drei<br />
algebraischen Operationen, welche auch als „Ontologie-Algebra 158 “ bezeichnet werden.<br />
Die erste Operation heißt Intersektion (engl.: „Intersection“), welche die Schnittmenge<br />
der übereinstimmenden Entitäten aus den beiden Quellenontologien zurückliefert und in<br />
Anlehnung an die Mengenalgebra mit dem Operator ´∩´ beschrieben wird. Die Operation<br />
der Vereinigung (engl.: „Union“), bezeichnet durch den Operator ´U´, vereinigt die beiden<br />
Ontologien mit Angabe der Herkunft für jene Entitäten, die in den Quellenontologien unterschiedlich<br />
sind. Die dritte Operation der Differenzierung (engl.: „Difference“), gekennzeichnet<br />
durch den Operator ´–´, liefert diejenigen Entitäten der ersten Ontologie zurück,<br />
die nicht jenen mit der zweiten Ontologie übereinstimmen (s. Wiederhold94, S. 9f).<br />
Für die Ontologie-Integration mit ONION werden die beiden Quellenontologien zunächst<br />
in das systemeigene Repräsentationsformat überführt, um eine einheitliche formale<br />
Darstellung zu erreichen. Dann werden mit Hilfe entsprechender Algorithmen die<br />
Strukturen der Ontologien erfasst und für die Behebung aufgefundener ontologischer<br />
Heterogenitäten sogenannte „Artikulationsregeln 159 “ definiert. 160 Diese müssen von menschlichen<br />
Domänenexperten hinsichtlich ihrer semantischen Korrektheit überprüft und<br />
gegebenenfalls korrigiert werden, da die Algorithmen lediglich eine Struktur-, aber keine<br />
Bedeutungsanalyse erlauben. Auf dieser Grundlage kann als Vereinheitlichung der beiden<br />
Quellenontologien eine neue Ontologie generiert werden, wodurch die Interoperabilität<br />
zwischen den durch die Quellenontologien beschriebenen Informationsressourcen ermöglicht<br />
wird (s. Mitra+01, S. 319-325). Für diesen Vorgang werden die erläuterten algebraischen<br />
Operationen verwendet. Das ONION-System loggt die dabei vorgenommenen<br />
Schritte, so dass der Integrationsprozess nachverfolgt, korrigiert und bei Änderungen in<br />
den Quellenontologien aktualisiert werden kann (s. Mitra+01, S. 325f).<br />
Mit Hilfe eines solchen Systems lässt sich die Ontologie-Integration zwar erleichtern,<br />
die Prüfung der semantischen Korrektheit der Integration bedarf jedoch weiterhin der<br />
Überprüfung durch den Menschen.<br />
157 ONION (ONtology compositION): Im Information Laboratory der Stanford University entwickeltes Werkzeug<br />
zur semi-automatischen Interoperation heterogener Informationsressourcen (s. Mitra+01, S. 1f).<br />
158 engl.: „Ontology Algebra“ (Mitra+01, S. 325).<br />
159 engl.: „articulation rules“ (Mitra+01, S. 319).<br />
160 Da die Diskussion der verwandten Algorithmen über das hier verfolgte Ziel der grundlegenden Erläuterung des<br />
Ansatzes hinausginge, wird an dieser Stelle lediglich auf deren ausführliche Darstellung in (Mitra+99) verwiesen.
Kaptitel D: Ontologien im Semantic Web 66<br />
D Ontologien im Semantic Web<br />
Als zweiter Teil der Arbeit befasst sich dieses Kapitel mit der Verwendung von Ontologien<br />
im Semantic Web, wobei die bisher erarbeiteten Charakteristika ontologiebasierter<br />
Verfahren der Wissensmodellierung als Verständnisgrundlage dienen sollen. Wie eingangs<br />
schon erwähnt, soll mit dem Semantic Web 161 eine Erweiterung der existenten Web-<br />
Technologien als informationstechnische Infrastruktur geschaffen werden. Die Intention<br />
liegt dabei in einer Verbesserung der informationsverarbeitenden Funktionalitäten des<br />
Internets, wodurch dessen Qualität als weltweit vernetztes Informationssystem erhöht<br />
werden soll. Zur Realisierung dieses Vorhabens müssen wissensverarbeitende Techniken<br />
für das Internet bereitgestellt werden, wobei Ontologien als bedeutungsdefinierende<br />
Komponente eingesetzt werden sollen (s. Berners-Lee+01, S. 26-30). Im Folgenden wird<br />
diese Vision genauer erläutert sowie der Stand der Forschung hinsichtlich der<br />
Realisierungen vorgestellt, wobei vor allem die Beweggründe für die Verwendung von<br />
Ontologien genauer untersucht werden sollen. Dazu ist folgenden drei Fragestellungen<br />
nachzugehen: Welche funktionale Rolle sollen Ontologien im Semantic Web übernehmen,<br />
inwieweit sind die Verfahren ontologiebasierter Wissensmodellierung für eine derartige<br />
Verwendung von Ontologien ausgereift, und welche Implikationen resultieren daraus für<br />
konkrete Semantic Web – Anwendungen?<br />
Zur Bearbeitungen dieser Fragestellungen wird zunächst der geplante funktionale<br />
Aufbau des Semantic Web erörtert, wobei vor allem die darin antizipierte Rolle von Ontologien<br />
herausgearbeitet werden soll. Aus der Verwendung von Ontologien als bedeutungsdefinierendem<br />
Grundbaustein des Semantic Web resultieren zwei wesentliche Herausforderungen<br />
an ontologiebasierte Verfahren der Wissensmodellierung. Zum einen werden<br />
web-kompatible Techniken für die formale Spezifikation von Ontologien benötigt und<br />
<strong>zum</strong> anderen Verfahren, die eine angemessene Handhabung von Ontologien bezüglich<br />
der Umweltcharakteristika des Internets erlauben. Für den ersten Aspekt werden im<br />
zweiten Abschnitt des Kapitels entsprechende Ontologie-Spezifikations-Sprachen vorgestellt.<br />
Hinsichtlich des zweiten Aspekts werden im dritten Abschnitt die wesentlichen<br />
Problemstellungen der Handhabung von Ontologien im Semantic Web besprochen und<br />
entsprechende Lösungsansätze aufgezeigt. Abschließend wird kurz auf die Verwendung<br />
von Ontologien in konkreten Semantic Web – Anwendungen eingegangen.<br />
Der Fortführung der Ausführungen sollen noch einige Anmerkungen über die<br />
Forschungsaktivitäten auf diesem Gebiet vorangestellt werden. Wie im Vorwort schon<br />
angedeutet, sind auf Grund des erwarteten Entwicklungsschubs des Internet reichhaltige<br />
Forschungen hinsichtlich der Realisierung der Vision des Semantic Web zu verzeichnen.<br />
Dies wird ersichtlich angesichts der quantitativen sowie qualitativen Fülle der momentanen<br />
Aktivitäten innerhalb der beiden wichtigsten Forschungsgruppen, die sich mit der<br />
Entwicklung entsprechender technischer Lösungen beschäftigen. Die eine Gruppe ist die<br />
161 Der Begriff des „Semantic Web“ wurde von Tim Berners-Lee als Bezeichnung für bedeutungsverarbeitende Web-<br />
Technologien eingeführt (s. Berners-Lee00, S. 169). Hier soll dieser Begriff als Eigenname des Ansatzes des World<br />
Wide Web Consortium (W3C) zur Realisierung eines semantischen Internets verstanden werden.
Kaptitel D: Ontologien im Semantic Web 67<br />
sogenannte „Semantic Web Activity 162 “ des World Wide Web Konsortiums (W3C),<br />
welche im Sinne des W3C Technologie-Standards für das Semantic Web erarbeitet. Die<br />
zweite Gruppe ist die Forschungsgemeinde, die Lösungsansätze für Semantic Web –<br />
Technologien in Projekten erarbeitet. 163 Die erwähnte Festlegung des Aufnahmestopps<br />
neuen Materials für dieses Kapitel auf Ende Juli 2002 begründet sich darin, dass am<br />
29.07.2002 die vorläufige Spezifikation einer Ontologie-Spezifikations-Sprache für das<br />
Semantic Web der Semantic Web Activity erschien. Weiterhin wurden zu diesem Zeitpunkt<br />
die Ergebnisse zweier Konferenzen veröffentlicht, welche in der Bearbeitung Berücksichtigung<br />
finden sollen. 164 Obwohl mit diesen Veröffentlichung Fortschritte für die<br />
hier behandelten Fragestellungen erreicht wurden, sind weiterhin neuartige Kenntnisse zu<br />
erwarten. 165 Auf Grund der befristeten Bearbeitungszeit kann in dieser Arbeit lediglich der<br />
Kenntnisstand bis <strong>zum</strong> genannten Aufnahmestopp berücksichtigt werden.<br />
D.1 Aufbau und Funktionsweise des Semantic Web<br />
Um die Verwendung von Ontologien im Semantic Web untersuchen zu können, sind<br />
zunächst die Grundlagen desselben zu erläutern. Dazu werden im Folgenden die der<br />
´Vision´ des Semantic Web zugrundeliegenden Ideen genauer erläutert und anschließend<br />
die vom W3C vorgeschlagene Architektur zur technischen Realisierung dieser Vision<br />
vorgestellt. Dabei soll insbesondere die antizipierte Rolle von Ontologien herausgearbeitet<br />
und die daraus resultierenden Herausforderungen hinsichtlich der Handhabung von Ontologien<br />
im Semantic Web aufgezeigt werden.<br />
D.1.1 Hintergrund der ´Vision des Semantic Web´<br />
Die vorgestellte Vision des Semantic Web ist nicht als neuartige Idee zur Erstellung eines<br />
intelligenten, weltweit vernetzten Informationssystems zu verstehen, sondern als nächste<br />
Entwicklungsstufe des vorhandenen Internets. Dabei besteht das grundlegende Ziel bei<br />
der Entwicklung des World Wide Web (WWW) in der Erstellung einer „universellen Informationsplattform<br />
166 “, welche durch die Vernetzung von Informationsquellen sowie<br />
durch die Bereitstellung entsprechender Zugriffsmöglichkeiten den Zugang zu allen Informationen<br />
durch jedermann erlauben soll. 167<br />
162 Informationen hierzu finden sich auf der Homepage der W3C Semantic Web Activity: www.w3.org/2001/sw/<br />
(25.09.2002). Da das W3C bei der Entwicklung von Web-Technologien eine gewichtige Rolle einnimmt – es versteht<br />
sich als Gremium zur Steuerung der Entwicklung des Internets als Informationsinfrastruktur (vgl. Jacobs00, W3C<br />
Mission) –, sind den Arbeiten der Semantic Web Activity eine sehr hohe Relevanz zuzuschreiben.<br />
163 Auf dem ´Semantic Web Community Portal´, siehe: www.semanticweb.org (08.06.2002), werden die Ergebnisse<br />
der wesentlichen Forschungsprojekte sowie von entsprechenden Konferenzen zusammengetragen.<br />
164 Die beiden Konferenzen sind:<br />
1) ISWC2002: 1 st International Semantic Web Conference. Sardinia, Italien: 09.06. – 12.06.2002.<br />
siehe: http://iswc.semanticweb.org (12.08.2002)<br />
2) ECAI-2002: 15 th European Conference on Artificial Intelligence. Lyon, Frankreich: 21.07. – 26.07.2002<br />
siehe: http://ecai2002.univ-lyon1.fr/show_en.pl (12.08.02)<br />
165 Hier seien als Beispiel zwei neue Veröffentlichungen genannt, die sich intensiv mit der <strong>Thema</strong>tik befassen.<br />
1) Fensel, D.; Wahlster, W.; Lieberman (Hrsg.): Spinning the Semantic Web. Bringing the World Wide Web to Its<br />
Full Potential. Boston: MIT Press. voraussichtliches Erscheinungsdatum: 15.11.2002.<br />
2) ´Semantic Web´: ERCIM (European Research Consortium for Informatics and Mathematics), Sonderheft<br />
Oktober 2002.<br />
166 engl.: „universal information space“ (Berners-Lee+99, Abstract).<br />
167 Mit dieser Absicht entwickelte Tim Berners-Lee zu Beginn der 1990er Jahre das World Wide Web (s. Berners-<br />
Lee00, S. 8-26). Das W3C wurde gegründet, um die Entwicklung des Internets hinsichtlich dieser Zielvorstellung<br />
voranzutreiben und den Entwurf entsprechender Technologien zu unterstützen (s. Jacobs00, Background).
Kaptitel D: Ontologien im Semantic Web 68<br />
D.1.1.1 Das Internet als universale Informationsplattform<br />
Zur Umsetzung dieses Ziels wurden technische Lösungen entwickelt, die prinzipiell die<br />
Vernetzung und den Zugang zu allen Informationsquellen ermöglichen sollen. Deren<br />
architektonische Grundlage stellt das sogenannte URI 168 -Prinzip dar. Dieses besagt, dass<br />
jede Ressource im Internet mit einer Identifikation versehen werden und somit alles mit<br />
allem verknüpft werden kann (s. Berners-Lee98, The Universal Web). Mit der Bereitstellung<br />
entsprechender Übertragungsprotokolle sowie HTML 169 als Hypertextsprache zur<br />
Darstellung und Verknüpfung von Web-Dokumenten entstand jene Server-Infrastruktur,<br />
die das Internet in seiner existenten Form bildet. Damit wird die Vernetzung von Informationsquellen<br />
sowie der Zugriff auf diese ermöglicht, so dass das grundlegende Ziel der<br />
Entwicklung einer universellen Informationsplattform mit dem bisher existenten WWW<br />
realisiert worden ist (s. Berners-Lee+01, S. 25f).<br />
Allerdings können die Informationen aus Web-Dokumenten derzeit nicht, beziehungsweise<br />
nur mittels proprietärer Lösungen automatisch verarbeitet werden. Dies wird vor<br />
allem auf die Unstrukturiertheit der Informationsdarstellung durch HTML zurückgeführt.<br />
170 Somit stellt das existente Internet eine informationstechnische Infrastruktur zur<br />
Verfügung, welche zwar den Zugang zu Informationsquellen ermöglicht, aber die Interpretation<br />
der Inhalte durch den Menschen erfordert (s. Berners-Lee98, Human Readable<br />
Information). Um die Qualität des Internet als universelle Informationsplattform zu<br />
erhöhen, soll durch Semantic Web – Technologien die Informationsdarstellung derart verbessert<br />
werden, dass eine automatisierte Verarbeitung der Inhalte möglich ist. Dazu ist<br />
zunächst die Strukturiertheit der Informationsdarstellung erforderlich, um eine maschinelle<br />
Verarbeitung generell zu ermöglichen. Weiterhin muss eine Bedeutungsdefinition für<br />
die Informationen gegeben sein, um deren korrekte Handhabung durch die verarbeitenden<br />
Programme zu gewährleisten (s. Miller01, Introduction). Die Ansätze zur Realisierung<br />
dieses Vorhabens werden anschließend genauer erläutert (s. D.1.2).<br />
D.1.1.2 Design-Prinzipien<br />
Dem Design von Web-Technologien liegen drei wesentliche Prinzipien zugrunde, welche<br />
die Funktionalität des Internets als weltweit vernetzte und universell zugängliche Informationsplattform<br />
gewährleisten sollen. Das erste Prinzip der Interoperabilität (engl.: „Interoperability“)<br />
fordert die Kompatibilität von Sprachen und Protokollen, wodurch der<br />
Zugriff auf unterschiedliche Arten von Informationsquellen gesichert werden soll. Mit der<br />
Entwicklungsfähigkeit (engl.: „Evolvability“) als zweitem Prinzip wird die Anpassungsfähigkeit<br />
an neue Technologien gefordert. Das heißt, dass technische Lösungen derart<br />
konzipiert werden sollen, dass nachfolgende Technologien zur Weiterentwicklung des<br />
Internets auf den existenten aufbauen können. Das dritte Prinzip der Dezentralisierung<br />
(engl: „Decentralization“) fordert, dass statt eines zentralen Steuerungsmechanismus die<br />
168 URI: Uniform Resource Identifier. Ein solcher kann jeder Ressource unabhängig von ihren spezifischen Charakteristika<br />
zugewiesen werden, so dass sie eindeutig identifizierbar ist (s. Berners-Lee00, S. 42f).<br />
169 HTML: Hypertext Markup Language. Zur Sicherstellung der Interoperabilität zwischen Informationsquellen entwickelte<br />
Sprache, die sich als Standard zur Darstellung von Web-Sites etabliert hat (s. Berners-Lee98, HTML).<br />
170 HTML dient der visuellen Darstellung von Informationen. Der HTML-Code einer Website spezifiziert das Erscheinungsbild<br />
der Informationen. Es können allerdings keine Angaben über die Struktur der Informationen gemacht<br />
werden, wie sie für eine automatisierte Bearbeitung benötigt werden (s. Berners-Lee98, HTML).
Kaptitel D: Ontologien im Semantic Web 69<br />
Kontrolle des Systems durch die teilnehmenden Server selber vorgenommen werden soll<br />
(s. Jacobs00, Design Principles of the Web). Mit der Entwicklung der existenten Web-<br />
Technologien wurden diese Prinzipien umgesetzt.<br />
Der Realisierung des Semantic Web sollen weiterführende Prinzipien zugrunde liegen.<br />
Diese stellen grundlegende Annahmen bezüglich der Handhabung von Informationen im<br />
Internet sowie deren Verarbeitung mittels entsprechender Technologien dar, weshalb sie<br />
in Tabelle 12 vorgestellt und erläutert werden sollen.<br />
Prinzip<br />
URI-Prinzip<br />
Typendeklaration<br />
Toleranz partieller<br />
Information<br />
Relativer Wahrheitsbeweis<br />
Behandlung heterogener<br />
Konzeptionalisierungen<br />
171<br />
Minimalistisches<br />
Design<br />
Beschreibung<br />
Grundsätzliche Verknüpfbarkeit aller Ressourcen (s.o.).<br />
Ressourcen und Links werden Typen zugewiesen – ähnlich den Datentypen<br />
in einer Programmiersprache. Im bisherigen Web gibt es lediglich Ressourcen<br />
(z.B. ein Web-Dokument) und verknüpfende Links. Die Typ-Zuweisung<br />
stellt eine genauere Beschreibung eines Web-Bestandteils dar, woraus Informationen<br />
über die Beschaffenheit desselben gewonnen werden können.<br />
Dieses Prinzip soll mit dem Ressource Description Framework (s. D.2.1)<br />
umgesetzt werden.<br />
Dieses Prinzip bezieht sich auf die Unbegrenztheit der Informationen im<br />
Internet. Auf Grund der Dezentralisierung kann der Autor jedes Web-Dokuments<br />
Links definieren und diese wieder entfernen. Web-Technologien sollen<br />
dadurch entstehende fehlerhafte Verlinkungen tolerieren können.<br />
Dies bezieht sich auf die Validierung von Beweisführungen. Da keine zentrale<br />
Datenhaltung innerhalb des Internet existiert, müssen Applikationen<br />
entsprechende Aufgaben lokal bearbeiten. Ein Beispiel ist die Verwaltung<br />
von Zugangsrechten.<br />
Hiermit wird als grundlegende Anforderung an das Semantic Web die Behandlung<br />
heterogener Konzeptionalisierungen einer Wissensdomäne gefordert,<br />
welches durch die Verwendung von Ontologien erreicht werden soll (s.<br />
D.1.2.2).<br />
Die Standardisierung von Technologien soll so gering wie möglich gehalten<br />
werden, um eine größtmögliche Verwendungsvielfalt zu gewährleisten.<br />
Tabelle 12: Design-Prinzipien des Semantic Web 172<br />
D.1.1.3 Funktionale Zielsetzung des Semantic Web<br />
Mit dem Semantic Web soll – in Abgrenzung zu vergleichbaren Ansätzen aus der Künstlichen<br />
Intelligenz – kein System zur Simulation menschlicher Intelligenz, sondern eine<br />
Informationsplattform zur Verbesserung der Kooperation zwischen Menschen und Maschinen<br />
entwickelt werden. Zur Verdeutlichung der funktionalen Zielsetzung wird daher<br />
die Metapher einer „globalen Datenbank“ (Berners-Lee98, Mashine-Understandable Information:<br />
Semantic Web) herangezogen. Diese soll verdeutlichen, dass vornehmlich eine<br />
verbesserte Verwaltung von Informationen für deren Nutzung durch den Menschen angestrebt<br />
wird. Dazu werden keine <strong>vollständige</strong>n und korrekten Schlussfolgerungsmechanismen<br />
benötigt, die ein grundlegendes Problem bei der Umsetzung vergleichbarer KI-<br />
Ansätze darstellen. Im Semantic Web sollen Inferenzmechanismen lediglich eine zusätzliche<br />
Funktionalität für die Aufbereitung von Daten zur Verfügung stellen (vgl. Berners-<br />
Lee98a). 173<br />
171 Im Original wird dieses Prinzip als „Unterstützung von Entwicklungsfähigkeit“ (engl. „Evolution is supported“,<br />
Koivunen +01) bezeichnet. Mit Hinblick auf die bisherigen Ausführungen und zur Wahrung der sprachlichen Einheitlichkeit<br />
in dieser Arbeit wurde eine freie, aber sinngemäße Übersetzung gewählt.<br />
172 nach (Koivunen+01, 2. Semantic Web Main Principles). Übersetzungen durch den Autor.<br />
173 Diese Äußerungen sind unter dem Gesichtspunkt zu betrachten, dass sie von Tim Berners-Lee als Initiator der<br />
Semantic Web Initiative stammen. Sie sind hier aufgeführt, um die Zielsetzung der Entwicklung des Semantic Web
Kaptitel D: Ontologien im Semantic Web 70<br />
D.1.2 Architekturmodell<br />
Zur Realisierung des Semantic Web wird vom W3C die in Abbildung 12 dargestellte<br />
schichtenartige Struktur von Web-Technologien vorgeschlagen, welche nach dem Design-<br />
Prinzip der Entwicklungsfähigkeit (s. D.1.1.2) auf existenten Technologien aufbauen und<br />
durch ihr Zusammenwirken die antizipierte Funktionalität des Semantic Web ermöglichen<br />
sollen (s. Koivunen+01, 3. Semantic Web Layers). Dieser Architekturentwurf stellt quasi<br />
den ´Fahrplan´ für die Forschungsarbeiten zur Realisierung des Semantic Web dar und<br />
soll daher hier erläutert werden. Insbesondere soll dabei herausgearbeitet werden, welche<br />
Rolle Ontologien innerhalb der Architektur zugedacht ist, welche Funktionalitäten sie<br />
bereit stellen sollen und welche Herausforderungen hinsichtlich der Handhabung von<br />
Ontologien für diesen Verwendungszweck auftreten. An dieser Stelle sei darauf hingewiesen,<br />
dass noch nicht alle in der Abbildung aufgeführten Technologien für ihren vorgesehenen<br />
Einsatz ausgereift sind.<br />
Abbildung 12: Semantic Web Architektur 174<br />
D.1.2.1 Semantic Web – Technologien<br />
Abbildung 12 zeigt die einzelnen Technologien zur Realisierung des Semantic Web, wobei<br />
durch die hierarchische Anordnung das Zusammenwirken der Bausteine verdeutlicht werden<br />
soll. Des Weiteren sind mit den Anmerkungen auf der linken Seite der Abbildung die<br />
Funktionalitäten der Technologien auf den jeweiligen Schichten angegeben. Auf der untersten<br />
Ebene sind die grundlegenden Techniken zur Informationsdarstellung im Internet<br />
angesiedelt, welche im bisherigen WWW schon Verwendung finden. Dabei wird mit ´Unicode´<br />
ein internationaler Standard zur Darstellung von Zeichen 175 verwendet. Die Identifikation<br />
von Web-Ressourcen wird durch die Zuweisung eines eindeutigen Identifikators<br />
gemäß des URI-Prinzips vorgenommen (s. D.1.1.1).<br />
Die nächste Ebene bildet die Sprache XML 176 , welche die geforderte strukturierte Darstellung<br />
der Informationen für eine automatisierte Verarbeitung derselben gewährleisten<br />
zu verdeutlichen. Eine Diskussion darüber, inwieweit sie als ´Werbung´ für das Semantic Web zu verstehen sind,<br />
ginge über das Ziel dieser Arbeit hinaus. Daher werden sie hier lediglich unkommentiert aufgeführt.<br />
174 entnommen aus (Koivunen+01, 3. Semantic Web Layers).<br />
175 Der Unicode Standard definiert die Darstellung von Zeichnen in Computersystemen. Die Verwendung im Internet<br />
soll eine international eindeutige Informationsdarstellung gewährleisten. Siehe: The Unicode Consortium. The Unicode<br />
Standard, Version 3.0. Reading, Massachusetts (USA): Addison-Wesley Developers Press, 2000.<br />
176 XML: Extensible Markup Language. Zur ausführlichen Spezifikation dieser Sprache siehe (Bray+00).
Kaptitel D: Ontologien im Semantic Web 71<br />
soll (s. D.1.1.1). Dazu wird jedes Informationselement in einem XML-Tag mit einer Bezeichnung<br />
versehen, womit die Beschaffenheit der Informationen im Sinne einer Meta-<br />
Information beschrieben wird. Durch die Gliederung dieser Beschreibungen in einer<br />
baumartigen Struktur können weiterhin strukturelle Zusammenhänge der Informationen<br />
dargestellt werden. Ein XML-Dokument enthält also eine Beschreibung der Beschaffenheit<br />
von Informationen sowie deren strukturellen Zusammenhänge, weswegen es auch als<br />
selbstbeschreibendes Dokument bezeichnet wird (s. Bray+00, 2. Documents). Für die Realisierung<br />
der Semantic Web Architektur stellt die XML-Technologie auf Grund ihrer<br />
Fähigkeit zur Strukturierung von Informationen die Grundlage für eine automatisierte Informationsverarbeitung<br />
durch entsprechende Web-Applikationen dar (s. Koivunen+01, 3.<br />
Semantic Web Layers). 177 Auf der XML-Ebene werden zwei weitere technische Lösungen<br />
aufgeführt, die der Vollständigkeit halber hier kurz erklärt werden sollen. Mit sogenannten<br />
„XML Namespaces“ (vgl. Bray+99) – in Abbildung 12 als ´NS´ abgekürzt – kann ein<br />
semantisch abgeschlossener Informationsraum im Internet definiert werden. 178 Als zweites<br />
wird „XML-Schema“ (vgl. Fallside01) aufgeführt, womit der strukturelle Aufbau von<br />
XML-Dokumenten spezifiziert und so eine entsprechende Validitätsprüfung durchgeführt<br />
werden kann.<br />
Mit XML kann zwar die Beschaffenheit von Informationen und deren struktureller<br />
Zusammenhang definiert werden, allerdings ist keine Bedeutungsdefinition der verwandten<br />
Beschreibungsbegriffe möglich (s. Decker+00, S. 2). Eine solche ist zur Gewährleistung<br />
der semantischen Interoperabilität im Internet als Informationsinfrastruktur mit<br />
sehr heterogenen Informationsquellen nötig (s. C.2.2), weshalb auf den folgenden beiden<br />
Ebenen des Architekturmodells entsprechende Technologien angesiedelt sind. Das erste<br />
Level bildet mit dem Resource Description Framework (RDF) 179 ein Modell zur Beschreibung<br />
von Ressourcen und Links im Sinne des Designprinzips der Typendeklaration<br />
(s. D.1.1.2). Die in RDF-Ausdrücken verwendeten Beschreibungsprimitive werden dabei<br />
in sogenannten RDF Schemata (RDFS) 180 definiert, äquivalent der Strukturdefinition<br />
durch XML-Schemata. Diese Technologien erlauben eine Beschreibung der semantischen<br />
Struktur der Informationen, welche allerdings erstens nur über eine geringe Ausdrucksfähigkeit<br />
verfügen und zweitens die Eindeutigkeit der Bedeutungsdefinitionen nur in semantisch<br />
abgeschlossenen Informationsräumen gewährleisten können. Mit der Verwendung<br />
von Ontologien auf der nächsten Ebene sollen daher <strong>zum</strong> einen ausdrucksstärkere<br />
Verfahren zur Bedeutungsdefinition eingesetzt und <strong>zum</strong> anderen die semantische Interoperabilität<br />
zwischen autonom entwickelten und somit potenziell heterogenen Informationsräumen<br />
sichergestellt werden (s. Heflin+02, Introduction). Eine ausführlichere Dis-<br />
177 Auf Grund der Trennbarkeit der Informationsdarstellung in die Präsentation durch HTML und die Strukturdefinition<br />
durch XML stellt XML ein wichtiges Datenformat für informationsverarbeitende Web-Anwendungen dar. Es<br />
wurde eine Vielzahl von Werkzeugen entwickelt, welche die Verarbeitung von Informationen aus XML-Dokumenten<br />
ermöglichen. Da eine genauere Betrachtung derselben keinen Erkenntnisgewinn für den hier betrachteten Zusammenhang<br />
bietet, soll lediglich auf die wichtigsten diesbezüglichen Informationsquellen im Internet verwiesen werden.<br />
Siehe: www.w3c.org/XML/ und www.xml.org (beide 28.09.2002).<br />
178 Ein XML-Namespace definiert lediglich ein Namensraum, in dem die Begrifflichkeiten eindeutig sein sollen. Die<br />
Bedeutung der Begriffe muss in den Verarbeitungswerkzeugen explizit definiert sein (s. Bray+99, Qualified Names).<br />
179 RDF: Resource Description Framework. Die standardisierte Spezifikation findet sich in (Lassila+99).<br />
180 RDFS: Resource Description Framework Schema. Eine vorläufige Spezifikation wird in (Bickley+00) gegeben.
Kaptitel D: Ontologien im Semantic Web 72<br />
kussion des Verhältnisses von RDF und Ontologien wird im Zusammenhang der Spezifikation<br />
von Ontologien für das Semantic Web vorgenommen (s. D.2).<br />
Die in Abbildung 12 über der Ontologie-Ebene angesiedelten Technologien sollen der<br />
Definition und Verarbeitung von Inferenzmechanismen dienen, weshalb diese Ebenen<br />
auch als Logik-Level bezeichnet werden. Mit ihnen soll das informationsverarbeitende<br />
Potenzial des Semantic Web ausgeschöpft werden können, wobei die Arbeiten auf diesem<br />
Gebiet noch nicht sehr weit fortgeschritten sind (s. Berners-Lee98, Semantic Web: the<br />
pieces). Ergänzend dazu sollen mit Verfahren der Digitalen Signatur Technologien zur<br />
maschinellen Authentizitätsprüfung von Informationen aus dem Internet bereitgestellt<br />
werden (s. Berners-Lee98b, Digital Signature). Im Rahmen der Untersuchung der Verwendung<br />
von Ontologien im Semantic Web erscheint eine weitere Betrachtung dieser<br />
Technologien nicht erforderlich.<br />
D.1.2.2 Rolle von Ontologien im Semantic Web<br />
Wie aus der Erläuterung des Architekturmodells zur Realisierung des Semantic Web hervorgeht,<br />
sollen Ontologien darin als bedeutungsdefinierende Technologie-Komponente<br />
eingesetzt werden. Dabei sind zwei Funktionalitäten zu unterscheiden, welche durch die<br />
Verwendung von Ontologien im Semantic Web bereitgestellt werden sollen. Die erste<br />
Funktionalität ist die semantische Beschreibung von Informationsressourcen, wobei eine<br />
Ontologie auf Grund ihrer größeren Ausdrucksfähigkeiten zur Bedeutungsdefinition die<br />
Beschreibung von Informationszusammenhängen durch RDF(S) unterstützen und erweitern<br />
soll. Die zweite Funktionalität ist die Gewährleistung der semantischen Interoperabilität<br />
heterogener Informationsräume, also eine Technik für den bedeutungserhaltenden<br />
Informationsaustausch zwischen Informationsräumen mit unterschiedlichen Verständnisoder<br />
Begriffsmodellen einer Wissensdomäne. Damit sollen Ontologien die technische Lösung<br />
zur Realisierung des Design-Prinzips der Unterstützung heterogener Konzeptionalisierungen<br />
(s. D.1.1.2) darstellen. Mit der Verwirklichung dieses Prinzips soll die automatisierte<br />
und bedeutungserhaltende Informationsverarbeitung zwischen den Informationsräumen<br />
des Internet ermöglicht werden, was eine grundlegende Anforderung an das Semantic<br />
Web als universelle Informationsinfrastruktur mit informationsverarbeitenden<br />
Fähigkeiten darstellt. Auf Grund der wesentlichen Bedeutung dieser Funktionalität für die<br />
Realisierung des Semantic Web werden Ontologien als ein „essentieller Grundbaustein<br />
des Semantic Web 181 “ bezeichnet.<br />
Die grundsätzliche Eignung von Ontologien für die angestrebte Verwendung im<br />
Architekturmodell des Semantic Web zur Gewährleistung dieser beiden Funktionalitäten<br />
kann an Hand der vorhergehenden Betrachtung der Charakteristika ontologiebasierter<br />
Verfahren der Wissensmodellierung nachvollzogen werden. Die funktionale Konzeption<br />
von Ontologien als bedeutungsdefinierende Konstrukte wurde im Zuge der Erläuterung<br />
der Charakteristika ontologiebasierter Wissensmodellierung herausgearbeitet (s. A.2). Hinsichtlich<br />
der Entwicklung entsprechender Ontologien wurden die existenten methodologischen<br />
Ansätze für den Ontologie-Entwicklungsprozess diskutiert (s. B.1). Die Verwend-<br />
181 engl.: „Ontologies are often seen as the basic building blocks for the Semantic Web, ...” (Klein+01, S. 75).
Kaptitel D: Ontologien im Semantic Web 73<br />
barkeit von Ontologien als bedeutungsdefinierende Komponente in Informationssystemen<br />
unter besonderer Berücksichtigung der wesentlichen Anwendungsszenarien für das<br />
Semantic Web wurde in Kapitel C dargelegt (s. C.1, C.2).<br />
Diese Erkenntnisse aus dem Ontology Engineering verleiten zu der Annahme, dass die<br />
nötigen Kenntnisse für die Verwendung von Ontologien im Semantic Web vorhanden<br />
seien (s. Berners-Lee00a, S. 12). Auf Grund der in den bisherigen Ausführungen erarbeiteten<br />
Kenntnisse muss eine differenzierte Betrachtung dieser Annahme vorgenommen<br />
und deren Allgemeingültigkeit revidiert werden. Es existieren Methoden für die Erstellung<br />
von Ontologien und Kenntnisse über die sinnvolle Verwendung derselben als bedeutungsdefinierender<br />
Komponente in Informationssystemen, welche vor allem die erstgenannte<br />
Funktionalität im Semantic Web ermöglichen. Für die zweite Funktionalität der<br />
Verwirklichung der semantischen Interoperabilität von Informationsressourcen im Internet<br />
werden Verfahren für die Handhabung mehrerer heterogener Ontologien benötigt.<br />
Wie bei der Besprechung von Lösungsansätzen für diese Problematik deutlich wurde (s.<br />
C.3.2), sind die Kenntnisse auf diesem Gebiet noch nicht ausreichend fortgeschritten. Auf<br />
Grund der oben aufgezeigten Wichtigkeit dieser Funktionalität stellt die Entwicklung entsprechender<br />
Verfahren eine wesentliche Herausforderung für die Realisierung der Vision<br />
des Semantic Web dar.<br />
D.1.2.2.1 Anforderungen an Ontologien<br />
Die Anforderungen an Ontologien für deren Verwendung als bedeutungsdefinierendem<br />
Grundbaustein des Semantic Web entsprechen denjenigen, die an Ontologien für andere<br />
Anwendungsgebiete gestellt werden.<br />
Um eine korrekte, bedeutungsdefinierende Beschreibung von Informationsressourcen<br />
im Internet zu gewährleisten, muss eine Ontologie ein Verständnismodell der behandelten<br />
Wissensdomäne im Sinne einer ontologischen Theorie (s. B.1.2.2) darstellen. Somit sollten<br />
Ontologien für das Semantic Web auf einer geteilten und expliziten Konzeptionalisierung<br />
basieren (s. A.2.1.1). Weiterhin sollten in der Ontologie die grundlegenden inferenziellen<br />
Beziehungen der Wissensdomäne erfasst sein, welche als Grundlage für darauf<br />
aufsetzende informationsverarbeitende Applikationen dienen können (s. Heflin +02,<br />
Introduction). Um den Qualitätsansprüchen an Ontologien (s. B.1.4.1) zu genügen, sollten<br />
bei der Entwicklung einer Ontologie für das Semantic Web die entsprechenden Design-<br />
Kriterien (s. B.2.1.) berücksichtigt werden. Weiterhin muss eine im Semantic Web verwendbare<br />
Ontologie in einer formalen Spezifikation vorliegen (s. B.1.3).<br />
Für die meisten Aufgabengebiete der Entwicklung von Ontologien für das Semantic<br />
Web können die in Kapitel B besprochenen Methoden der Ontologie-Entwicklung verwendet<br />
werden. 182 Lediglich für die formale Darstellung von Ontologien müssen webkompatible<br />
Ontologie-Spezifikations-Sprachen entwickelt werden, um die Verarbeitung<br />
von Ontologien durch Web-Technologien gewährleisten zu können und somit dem<br />
Design-Prinzip der Entwicklungsfähigkeit (s. D.1.1.2) gerecht zu werden. Dieser Aspekt<br />
wird anschließend ausführlicher behandelt (s. D.2).<br />
182 Es sei an dieser Stelle nochmals darauf hingewiesen, dass die Entwicklung von Ontologien ein sehr aufwendiges<br />
Unterfangen ist und dass noch keine umfassende Methodologie für die Ontologie-Entwicklung bereitsteht (s. B.3).
Kaptitel D: Ontologien im Semantic Web 74<br />
D.1.2.2.2 Herausforderungen an das Ontologie-Management<br />
Die Gewährleistung der Interoperabilität zwischen verschiedenen Informationsräumen im<br />
Internet stellt das wesentliche Ziel bei der Verwendung von Ontologien im Semantic Web<br />
dar. Diese soll durch den Aufbau eines „Netzwerks von Ontologien 183 “ erreicht werden,<br />
in dem alle benötigen Informationsstrukturen in einzelnen Ontologien erfasst sind. In diesem<br />
Netzwerk können grundsätzlich alle Arten von Ontologien (s. C.1.2, Tabelle 10)<br />
auftreten, wobei sie als Ontologie-Module gemäß dem Ansatz des „Teilens und Zusammenführens“<br />
für die Wiederverwendbarkeit von Ontologien (s. C.3.1.1) aufgebaut sein<br />
sollen. Der bedeutungserhaltende Informationsaustausch zwischen heterogenen Informationsräumen<br />
soll durch die Sicherstellung der semantischen Interoperabilität zwischen den<br />
einzelnen Ontologien ermöglicht werden. Weiterhin sollen die einzelnen Ontologien anpassungsfähig<br />
an die Umweltcharakteristika des Internet sein, so dass mit dem Netzwerk<br />
interagierender und anpassungsfähiger Ontologien der semantische Grundbaustein des<br />
Semantic Web zur Verfügung gestellt werden soll (s. Berners-Lee+01, S. 27f).<br />
Auf Grund dieser Zielsetzung ergeben sich drei wesentliche Herausforderung für die<br />
Handhabung von Ontologien im Semantic Web. Die erste ist die Teilbarkeit von Ontologien<br />
(engl.: „shared ontologies“), worunter die Verwendbarkeit der gleichen Ontologie<br />
für mehrere Applikationen und die Wiederverwendbarkeit existenter Ontologie-Module<br />
als Basis neuer Ontologien verstanden wird (s. C.3.1). Mit der Entwicklungsfähigkeit<br />
(engl.: „ontology evolution“) als zweite Herausforderung wird die Anpassungsfähigkeit<br />
von Ontologien an Umweltveränderungen gefordert. Auf Grund der Anonymität sowie<br />
der Dezentralisierung des Internet sind solche häufig zu erwarten, weshalb die längerfristige<br />
Nutzbarkeit von Ontologien nur durch eine entsprechende Anpassung gewährleistet<br />
werden kann. Die dritte wesentliche Herausforderung ist Gewährleistung der Interoperabilität<br />
zwischen Ontologien (engl.: „ontology interoperability“), also die oben diskutierte<br />
Problematik der Behandlung heterogener Ontologien (s. Heflin +02, 3. Design<br />
Goals). Lösungsansätze für diese Herausforderungen werden später vorgestellt (s. D.3).<br />
D.2 Ontologie-Spezifikation für das Semantic Web<br />
Für die Verwendung von Ontologien im Semantic Web wurde als neuartige Anforderung<br />
die Entwicklung von Ontologie-Spezifikations-Sprachen herausgestellt, die mit den existenten<br />
Web-Technologien kompatibel sind. Dazu wird im Folgenden jener Ansatz vorgestellt,<br />
den das W3C zur Standardisierung entsprechender Repräsentationsformalismen<br />
verfolgt. 184 Im Vordergrund der Betrachtungen soll dabei die funktionale Integration der<br />
Techniken mit den existenten Web-Technologien stehen. Da die RDF-Technologie dabei<br />
eine grundlegende Rolle einnimmt, wird zunächst deren Funktionsweise erläutert und<br />
anschließend darauf aufbauende Spezifikationssprachen für Ontologien besprochen.<br />
183 engl.: „web of ontologies“ (Heflin+02, 3.3 Ontology Interoperation).<br />
184 Es ist darauf hinzuweisen, dass noch nicht für alle hier zu besprechenden Technologien endgültige Spezifikationen<br />
seitens des W3C vorliegen. Dabei dürfen noch in der Entwicklungsphase befindliche Spezifikationen nicht als<br />
Referenzen für technologische Lösungen angesehen werden. Der Entwicklungstand einer Technologie kann an Hand<br />
der Art des referenzierten Dokumentes nachvollzogen werden, welche im Literaturverzeichnis angegeben ist. Dabei<br />
wird eine endgültige Spezifikation als ´Recommendation´, eine noch nicht endgültige als ´Candidate´ oder ´Proposed<br />
Recommendation´ und ein erster Entwurf als ´Working Draft´ bezeichnet. Nähere Erläuterungen hierzu finden sich<br />
im ´W3C Process Document´ unter: www.w3.org/Consortium/Process-20010719/tr (04.10.2002).
Kaptitel D: Ontologien im Semantic Web 75<br />
D.2.1 Resource Description Framework (RDF)<br />
Das Resource Description Framework (RDF) ist ein Verfahren zur Repräsentation von<br />
Meta-Daten, mit dem sowohl Informationsressourcen im Internet beschrieben als auch<br />
darüber hinausgehende Zusammenhänge dargestellt werden können. Den Kern der RDF-<br />
Technologie bildet ein Modell zur Repräsentation von Informationszusammenhängen,<br />
das zur Gewährleistung der Interoperabilität mit anderen Web-Technologien in XML dargestellt<br />
werden kann (s. Lassila+99, 1. Introduction). Im Folgenden werden die wesentlichen<br />
Bestandteile dieser Technologie erläutert.<br />
D.2.1.1 RDF Modell<br />
Zur Repräsentation von Meta-Informationen werden im RDF Modell sogenannte „RDF-<br />
Ausdrücke 185 “ verwendet, welche eine „Behauptung 186 “ über die Beschaffenheit einer Ressource<br />
durch die Definition einer Subjekt-Prädikat-Objekt – Beziehung beinhalten. Dabei<br />
wird das Subjekt mit Hilfe des Prädikat beschrieben und das Objekt stellt den Wert, also<br />
den Inhalt des Prädikats dar. Diese Beziehungen werden in „gerichteten, bewerteten Graphen<br />
187 “ abgebildet, wobei die Knoten die Subjekte, beziehungsweise die Objekte darstellen<br />
und die Prädikate durch entsprechend bezeichnete Kanten repräsentiert werden.<br />
Alle mit diesem Modell darstellbaren Informationen werden als Ressourcen bezeichnet,<br />
wobei jede Ressource durch sogenannte Properties beschrieben werden kann (s. Lassila<br />
+99, 2.1. Basic RDF Model).<br />
Zur Veranschaulichung zeigt Abbildung 13 einen solchen Graph, der folgende Aussage<br />
repräsentiert: Ein Web-Dokument, identifiziert über eine spezifische URL, hat den Titel<br />
´RDF/XML Syntax Specification (Revised)´ und einen Autor namens ´Dave Beckett´, der<br />
wiederum eine eigene Homepage mit der Adresse ´http://purl.org/net/dajobe/´ hat.<br />
Abbildung 13: RDF-Aussage in Graphdarstellung 188<br />
In der Abbildung stellen die rechteckigen Knoten einfache Strings dar. Die ovalen<br />
Knoten sowie die Prädikate repräsentieren Ressourcen, die über eine URI genau identifiziert<br />
werden können. Mit dem Prädikat ´http://www.example.org/terms/editor´ wird<br />
so eine im Internet verfügbare Definition für den Begriff ´editor´ referenziert, wodurch<br />
185 engl.: „statements“ (Lassila+99, 2.1 Basic RDF Model).<br />
186 engl.: „assertion“ (Berners-Lee98b, The basic assertion model).<br />
187 engl: „directed labeled graphs“(Lassila+99, 2.1 Basic RDF Model).<br />
188 entnommen aus (Manola+02, 3 An XML Syntax for RDF).
Kaptitel D: Ontologien im Semantic Web 76<br />
das intendierte Verständnis des Begriffs explizit definiert wird. Die Identifizierbarkeit auf<br />
Grundlage des URI-Prinzips (s. D.1.1.1) erlaubt die bedeutungsdefinierende Strukturbeschreibung<br />
einer Wissensdomäne durch RDF-Ausdrücke, da diese somit Aussagen über<br />
real existierende Ressourcen machen können (s. Manola+02, 2.3 The RDF Model). 189<br />
D.2.1.2 XML - Serialisierung<br />
Die als Serialisierung bezeichnete Darstellung eines RDF-Modells in XML soll dessen Interoperabilität<br />
mit den anderen Semantic Web – Technologien ermöglichen. Dazu werden<br />
die Beschreibungselemente aus den Modellgraphen in eine entsprechende XML-Struktur<br />
überführt. 190 Abbildung 14 stellt die XML-Serialisierung des RDF-Ausdrucks aus Abbildung<br />
13 dar. Es sei angemerkt, dass RDF-Modelle auch in andere Repräsentationsformalismen<br />
übertragen werden können (s. Lassila+99, 2.2.1. Basic Serialization Syntax).<br />
1 <br />
2 <br />
5 <br />
6 RDF/XML Syntax Specification (Revised)<br />
7 <br />
8 Dave Beckett<br />
9 <br />
10 <br />
11 <br />
12 <br />
Abbildung 14: RDF-Aussage in XML-Serialisierung 191<br />
Ohne vertiefend auf die Spezifika von XML einzugehen, sollen hier die <strong>zum</strong> Verständnis<br />
wesentlichen syntaktischen Aspekte der XML-Serialisierung aus der Abbildung erläutert<br />
werden. Zeile 1 definiert das Dokument als ein XML-Dokument. Der RDF-Ausdruck<br />
wird in einem -Tag dargestellt. Die verwandten XML-Namespaces werden in den<br />
Zeilen 2 bis 4 definiert, so dass die Eindeutigkeit der Begriffsdefinitionen durch Nutzung<br />
der entsprechenden Präfixe sichergestellt ist (siehe Fußnote 178). Die Zeilen 5 bis 11 enthalten<br />
die Kodierung der Aussage aus dem RDF-Graphen, wobei die Prädikatenstruktur<br />
implizit in der baumartigen Struktur des XML-Dokuments enthalten ist. In Zeile 12 wird<br />
der gesamte RDF-Ausdurck geschlossen (s. Beckett02, 2 An XML Syntax for RDF).<br />
D.2.1.3 RDF Schema (RDFS)<br />
Mit dem grundlegenden RDF-Modell lassen sich Eigenschaften und Zusammenhänge<br />
von Ressourcen im Sinne von Meta-Informationen beschreiben. Allerdings können darin<br />
keine Angaben über Typen von Ressourcen oder deren strukturelle Zusammengehörigkeit<br />
definiert werden. Da derartige Funktionalitäten für die Beschreibung von Informationsstrukturen<br />
eine grundlegende Rolle einnehmen (s. B.2.2), wird mit RDF Schema (RDFS)<br />
ein Mechanismus für diese Art der Beschreibung von Ressourcen bereitgestellt. In RDFS<br />
ist ein entsprechendes Typensystem definiert, dass ähnlich wie die Frame Ontology des<br />
Ontolingua-Systems (s. B.1.3.2) eine Art Wissensrepräsentations-Ontologie (s. C.1.1.2,<br />
189 Der Bezug zur realen Welt stellt die grundlegende Bedingung für die modelltheoretische Definition der präzisen<br />
Semantik der Beschreibungsprimitive von RDF dar, welche die Verwendung von RDF als Repräsentationsschema<br />
verbessern soll. Der erste Entwurf einer entsprechenden Modelltheorie findet sich in (Hayes02).<br />
190 Der Spezifikationsentwurf einer XML-Syntax zur Darstellung von RDF-Ausdrücken findet sich in (Beckett02).<br />
191 entnommen aus (Manola+02, 3 An XML Syntax for RDF).
Kaptitel D: Ontologien im Semantic Web 77<br />
Tabelle 10) für RDF-Ausdrücke darstellt (s. Manola+02, 4. Defining RDF Vocabularies:<br />
RDF Schema). In Tabelle 13 sind die wichtigsten Typen von RDFS erfasst und kurz erläutert.<br />
Ein vertiefendes Verständnis der Typen soll durch die Verwendung im Beispiel<br />
der Ontologie-Spezifikation gegeben werden (s. D.2.2.1).<br />
Typ<br />
Core Classes<br />
rdfs:Class<br />
rdfs:Resource<br />
rdf:Property<br />
Core Properties<br />
Beschreibung<br />
Grundlegende Arten von Ressourcen in RDF-Ausdrücken.<br />
Basis-Klasse: Alle Konzepte werden dieser Klasse untergeordnet.<br />
Abstrakte RDF-Ressource: Alle Ressourcen eines RDF-Ausdrucks werden<br />
als Instanzen davon verstanden.<br />
Abstrakte RDF-Property: Alle Properties einer Ressource werden als Instanzen<br />
davon verstanden. Untermenge von rdfs:Resource.<br />
Primitive zur Beschreibung von Properties und Relationen.<br />
rdf:type<br />
Deklaration der Zugehörigkeit einer Ressource zu einer Klasse.<br />
rdfs:subClassOf Deklaration einer Subsumptions-Beziehung (s. B.2.2) zwischen Klassen.<br />
rdfs:subPropertyOf Deklaration einer Subsumptions-Beziehung zwischen Properties.<br />
Constraints<br />
rdfs:range<br />
rdfs:domain<br />
Primitive zur Beschränkung der Gültigkeit von Klassen und Properties.<br />
Gültigkeitsbeschränkung einer Property für eine Klasse und deren Instanzen.<br />
Gültigkeitsbeschränkung einer Property für eine Klasse und deren untergeordnete<br />
Klassen.<br />
Tabelle 13: Grundtypen von RDF Schema (RDFS) 192<br />
D.2.2 Ontologie-Spezifikations-Sprachen<br />
Wie aus den bisherigen Erläuterungen deutlich geworden ist, stellt die RDF-Technologie<br />
ein Verfahren zur Repräsentation bedeutungsdefinierender Meta-Informationen für das<br />
Semantic Web dar. Durch die Verwendung des RDFS-Typensystems können einfache taxonomische<br />
Informationsstrukturen definiert werden und die Darstellbarkeit eines RDF-<br />
Modells in XML erlaubt den Austausch der Informationen zwischen Semantic Web –<br />
Applikationen sowie deren Verarbeitung mit Hilfe entsprechender Werkzeuge. 193 Somit<br />
erfüllt die RDF-Technologie die wesentlichen Anforderungen an eine Ontologie-<br />
Spezifikations-Sprache für das Semantic Web, weil damit die bedeutungsdefinierende<br />
Beschreibung von Informationsressourcen im Internet möglich die Kompatibilität mit<br />
den existenten Web-Technologien gewährleistet ist.<br />
Allerdings verfügt die RDF-Technologie nur über eine geringe Ausdrucksfähigkeit hinsichtlich<br />
der erfassbaren Informationsstrukturen. Für die formale Spezifikation einer Ontologie<br />
wird vom Repräsentationsformalismus jedoch die Fähigkeit zur <strong>vollständige</strong>n und<br />
korrekten Überführung der im konzeptionellen Modell erfassten Wissensstrukturen<br />
gefordert (s. B.1.3.1). Daher sollen mit den Ontologie-Spezifikations-Sprachen weiterführende<br />
Beschreibungsprimitive zur Verfügung gestellt werden, welche auf der RDF-<br />
Technologie als grundlegendem Repräsentationsformalismus aufsetzen und erweiternde<br />
192 nach (Brickley+00, 2. Classes and Properties; 3. Constraints). Darin finden sich weiterführende Erläuterungen und<br />
Beispiele. Die Bezeichnungen wurden in englischer Sprache belassen, da es sich um definierte Eigennamen handelt.<br />
193 Für die Be- und Verarbeitung von RDF/XML-Informationen sind vornehmlich zwei Arten von Werkzeugen relevant.<br />
Erstens visualisierende Entwicklungswerkzeuge für die Erstellung eines RDF-Ausdrucks und dessen XML-<br />
Serialisierung - ähnlich wie visualisierende Repräsentationsschemata für die Ontologie-Entwicklung (s. B.1.2.3). Das<br />
Tool ´IsaViz´ ist eine beispielhafte Implementierung des W3C für ein solches Tool und ist frei erhältlich unter:<br />
www.w3.org/2001/11/IsaViz/ (25.09.2002). Zweitens werden entsprechende RDF/XML-Parser zur Extraktion der<br />
RDF-Informationen aus der XML-Darstellung für die weitere Verarbeitung benötigt (s. Manola+02, 3. An XML<br />
Syntax for RDF).
Kaptitel D: Ontologien im Semantic Web 78<br />
Spezifikationsfähigkeiten aufweisen sollen. Dazu wurden in verschiedenen Forschungsprojekten<br />
entsprechende Sprachen entwickelt. Für diese soll hier stellvertretend jene vorgestellt<br />
werden, die zur Standardisierung einer Ontologie-Spezifikations-Sprache für das<br />
Semantic Web durch das W3C vorgeschlagen wird . 194<br />
D.2.2.1 Web Ontology Language (OWL)<br />
In der Semantic Web Activity des W3C (siehe Fußnote 162) ist die sogenannte Web-<br />
Ontology Working Group 195 mit der Spezifikation einer Ontologie-Spezifikations-Sprache<br />
beauftragt, welche als standardisierte Web-Technologie auf der Ontologie-Ebene des<br />
Architekturmodells des Semantic Web (s. D.1.2) fungieren soll. Dazu wurde ein erster<br />
Entwurf der OWL Web Ontology Language 196 vorgelegt. Trotz der noch nicht abgeschlossenen<br />
Spezifikationsarbeiten 197 soll diese Sprache hier vorgestellt werden, da ihr als<br />
Vorschlag durch das W3C zur Standardisierung einer Ontologie-Spezifikations-Sprache<br />
für das Semantic Web eine zukünftig wesentliche Bedeutung zugeschrieben werden kann.<br />
OWL stellt keine von Grund auf neu entwickelte Sprache dar, sondern basiert auf der<br />
Ontologie-Spezifikations-Sprache DAML+OIL 198 . Mit dieser Sprache wird der oben beschriebenen<br />
Ansatz zur formalen Spezifikation von Ontologien durch die Erweiterung der<br />
Spezifikationsfähigkeiten von RDF verfolgt. Die Verwendung von DAML+OIL als Basis<br />
für OWL begründet sich darin, dass erstens mit der Nutzung der RDF-Technologie die<br />
Kompatibilität mit anderen Web-Technologien gewährleistet ist, und dass zweitens die<br />
Spezifikationsfähigkeiten DAML+OIL als sehr geeignet für die Ontologie-Spezifikation<br />
im Semantic Web angesehen werden (s. Patel-Schneider+02, Introduction). Daher soll zur<br />
Erläuterung der Verwendung derartiger Ontologie-Spezifikations-Sprachen in Abbildung<br />
15 die Darstellung eines ontologischen Konstrukts in DAML+OIL dienen.<br />
1<br />
2<br />
3<br />
4<br />
5<br />
6<br />
7<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
Abbildung 15: Ontologie-Beispiel in DAML-OIL 199<br />
194 Neben den ausführlich besprochen web-kompatiblen Ontologie-Spezifikations-Sprachen seien hier diejenigen erwähnt,<br />
die ebenfalls den Ansatz der XML-Darstellung von Ontologien verfolgen.<br />
1) XOL (Ontology Exchange Language): XML-basierte Sprache für den Austausch von Ontologien (s. Karp+99).<br />
2) SHOE (Simple HTML Ontology Extensions): Ontologie-Spezifikation als Erweiterung des HTML-Kodes<br />
(s. Luke+00). Hervorgegangen aus dem SHOE-Projekt, www.cs.umd.edu/projects/plus/SHOE, (24.06.02).<br />
3) OML (Ontology Markup Language): XML-Serialisierung von SHOE. (s. Kent98).<br />
Ein ausführlicher Vergleich dieser Sprachen hinsichtlich deren Ausdrucksfähigkeit findet sich in (Gómez-Pérez+02).<br />
195 Homepage der Web-Ontology Working Group: www.w3.org/2001/sw/WebOnt/ (25.09.2002).<br />
196 Der Aufbau und die Funktionsweise der OWL Web Ontology Language werden in (Dean+02) beschrieben.<br />
197 Alle Veröffentlichungen zur OWL Web Ontology Language befinden sich im Status eines ´Working Drafts´ des<br />
W3C (siehe Erläuterungen in Fußnote 184) und dürfen daher lediglich als „Arbeitsentwurf “ (engl. : „work in progress“)<br />
bezeichnet werden (s. Dean+02, Status of this Document).<br />
198 DAML+OIL: Aus zwei Sprachen zusammengeführte Ontologie-Spezifikations-Sprache. DAML (DARPA Agent<br />
Markup Language) ist eine web-kompatible semantische Markup-Sprache (vgl. Hendler+00) und wurde im DAML-<br />
Programm entwickelt (s. www.daml.org (12.07.2002)). OIL (Ontology Interchange Layer) wurde innerhalb des OnTo<br />
Knowledge-Projekts (s. www.ontoknowledge.org, (12.07.2002)) als Format zur Gewährleistung der semantischen<br />
Interoperabilität zwischen Web-Ressourcen entwickelt (vgl. Fensel+00). Die Sprachreferenz von DAML+OIL findet<br />
sich in (Horrocks+01). Die formale Spezifikation befindet sich unter: http://www.daml.org/2001/03/daml+oil (07.04.<br />
2002).<br />
199 Auszug aus einer beispielhaften Ontologie-Spezifikation unter: www.daml.org/2001/03/daml+oil-ex (07.04.2002).
Kaptitel D: Ontologien im Semantic Web 79<br />
In der Abbildung ist folgende Aussage spezifiziert: Jedes der Klasse ´Animal´ untergeordnete<br />
Konzept, also jedes Tier, hat genau zwei Elternteile. 200 In Zeile 1 wird definiert,<br />
dass dieses Konzept sich auf die zuvor bekannte Klasse ´Animal´ bezieht. Die Zeilen 2 bis<br />
6 umfassen die RDFS-Subklassenrelation, so dass die Restriktion in Zeile 3 bis 5 für alle<br />
untergeordneten Konzepte gilt. Die Restriktion wird mit Hilfe vordefinierter Spezifikationsprimitive<br />
von DAML+OIL vorgenommen. Für die Ressource ´hasParent´, die eine<br />
Property von ´Animal´ ist, wird eine Kardinalitätsbeschränkung von ´2´ definiert. 201<br />
D.2.2.2 Ausdrucksfähigkeit<br />
Die Ausführungen zu Ontologie-Spezifikations-Sprachen für das Semantic Web soll mit<br />
einer kurzen Erläuterung der wesentlichen Spezifikationsprimitive abgeschlossen werden,<br />
die OWL als angestrebter Standard zur Erweiterung der Spezifikationsfähigkeit von RDF<br />
bereitstellen soll. In Tabelle 14 sind die wichtigsten Primitive dargestellt, nach ihrer Funktionalität<br />
geordnet und ihr Verwendungsziel kurz erläutert.<br />
Funktionalität Primitive Beschreibung<br />
Äquivalenzdefinition<br />
Gleichheitsdefinition für Konzepte und Properties.<br />
Diese Primitive sind vornehmlich für<br />
den Abgleich heterogener Ontologien relevant.<br />
Property-<br />
Beschreibung<br />
sameClassAs;<br />
samePropertyAs;<br />
sameIndividualAs;<br />
differentIndividualFrom<br />
inverseOf;<br />
TransitiveProperty;<br />
SymmetricProperty;<br />
FunctionalProperty;<br />
InverseFunctionalProperty;<br />
allValuesFrom;<br />
someValuesFrom<br />
Erweiternde Beschreibung von Properties.<br />
Somit kann das intendierte Verständnis von<br />
Attributen, Properties und Relationen als<br />
ontologische Modellierungsprimitive (s. B.1.<br />
2.1) genauer definiert werden.<br />
Kardinalitätsbeschränkung<br />
minCardinality;<br />
maxCardinality; cardinality<br />
Kardinalitätsdefinition. Wie im Beispiel aus<br />
Abbildung 15.<br />
Datentypen noch nicht spezifiziert. Definition von Datentypen für Ressourcen.<br />
Header-<br />
Informationen<br />
imports; versionInfo<br />
Angaben über die Ontologie. Wesentlich ist<br />
die Importierbarkeit anderer Ontologien.<br />
Axiomatisierung oneOf; disjointWith;<br />
Definition grundlegender inferenzieller Zusammenhänge<br />
Boolsche unionOf; intersectionOf;<br />
in der Ontologie.<br />
Kombinationen complementOf<br />
Tabelle 14: Spezifikationsprimitive von OWL 202<br />
Hinsichtlich der Eignungsanforderungen an Repräsentationsformalismen zur Verwendung<br />
als Ontologie-Spezifikations-Sprache (s. B.1.3.1.1) lässt sich festhalten, dass die<br />
Kombination von RDF und einer Sprache wie OWL für die formale Spezifikation von<br />
Ontologien für das Semantic Web geeignet ist. Die Definition taxonomischer Strukturen,<br />
entsprechende Vererbungsmechanismen und eine natürlichsprachliche Dokumentation<br />
wird durch RDFS ermöglicht. Die erweiternden Spezifikationsprimitive von OWL erlauben<br />
eine differenzierte Erfassung von Properties und Relationen sowie die Definition<br />
grundlegender inferenzieller Zusammenhänge. Als indirekte empirische Verifikation dafür<br />
kann der Vergleich XML-basierter Ontologie-Spezifikations-Sprachen herangezogen wer-<br />
200 Zur Wahrung der Übersichtlichkeit ist lediglich die Klassendefinition abgebildet. Das Präfix ´daml:´ bezieht sich<br />
auf die DAML+OIL-Spezifikation unter ´http://www.daml.org/2001/03/daml+oil´, die anderen Präfixe<br />
auf die Spezifikationen von RDF und RDFS (vgl. Abbildung 14, Zeilen 2 und 3).<br />
201 Die syntaktischen Erläuterungen sind an (Horrocks+01) angelehnt.<br />
202 nach (McGuiness+02, 2. Language Synopsis). Es sei an dieser Stelle nochmals darauf hingewiesen, dass die Spezifikationsarbeiten<br />
für OWL noch nicht abgeschlossen sind.
Kaptitel D: Ontologien im Semantic Web 80<br />
den, worin DAML+OIL als Basis von OWL die größte Ausdruckstärke zugesprochen<br />
wird (s. Gómez-Pérez+02, S. 58f).<br />
D.3 Ontologie-Management<br />
Die bisherigen Ausführungen zeigen, dass Ontologien grundsätzlich als bedeutungsdefinierende<br />
Komponente für das Semantic Web geeignet sind und dass mit web-kompatiblen<br />
Ontologie-Spezifikations-Sprachen eine derartige Verwendung von Ontologien ermöglicht<br />
wird. Allerdings ergeben sich für die angestrebte Entwicklung eines Netzwerks<br />
von modularen und interagierenden Ontologien als semantischem Grundbaustein des Semantic<br />
Web (s. D.1.2.2.2) Herausforderungen hinsichtlich der Gewährleistung der konzeptionellen<br />
Korrektheit und der semantischen Interoperabilität derart verteilter und potenziell<br />
heterogener Ontologien. Dabei besteht das grundlegende Problem, dass das Internet<br />
als universelle Informationsplattform auf Grund seiner dezentralen Struktur eine sehr<br />
dynamische Umwelt aufweist, während Ontologien als bedeutungsdefinierende Erfassung<br />
einer Wissensdomäne ein zentrales Verständnismodell derselben durch die statische Beschreibung<br />
von Wissensstrukturen darstellen sollen (s. Kahshyap01, S. 26f).<br />
Die Lösung dieser konzeptionellen Widersprüche ist insofern von grundlegender Bedeutung,<br />
da damit die Interoperabilität semantisch heterogener Informationsräume als<br />
wesentliche Zielsetzung der Verwendung von Ontologien im Semantic Web ermöglicht<br />
werden kann. Dazu sollen im Folgenden als wesentliche Aspekte des Ontologie-Managements<br />
für das Semantic Web Lösungsansätze für jene Herausforderungen vorgestellt werden,<br />
die im Zuge der Erläuterung der antizipierten Rolle von Ontologien in der Semantic<br />
Web Architektur aufgeführt wurden (s. D.1.2.2.2). Dabei sollen vor allem die grundlegenden<br />
Ideen der Ansätze sowie deren Entwicklungsstand herausgearbeitet werden.<br />
D.3.1 Teilbarkeit von Ontologien<br />
Die Forderung der Teilbarkeit von Ontologien für deren Einsatz im Semantic Web bezieht<br />
sich auf die Verwendbarkeit einer Ontologie als bedeutungsdefinierender Basis für<br />
mehrere verschiedenartige Anwendungen (s. D.1.2.2.2). Dazu muss eine Ontologie<br />
einerseits als begriffliche Basis verwendbar für eine konkrete Anwendungssituation und<br />
andererseits wiederverwendbar für unterschiedliche Verwendungszwecke sein. Dieser Anforderung<br />
kann durch die Berücksichtigung des Ansatzes des ´Teilens und Zusammenführens´<br />
(s. C.3.1.1) bei der Entwicklung von Ontologien für das Semantic Web genügt<br />
werden, weshalb dieser Aspekt hier nicht weiter ausgeführt werden soll.<br />
Neben den qualitativen Anforderungen ist für die Gewährleistung der Nutzbarkeit von<br />
Ontologien in Semantic Web – Anwendungen eine entsprechende technische Infrastruktur<br />
bereitzustellen, welche die Ontologien verwaltet und den Zugriff auf diese durch<br />
Applikationen ermöglicht. Als Basis des Ontologie-Managements im Semantic Web sollen<br />
diese Funktionalitäten sogenannte „Ontologie-Bibliotheks-Systeme 203 “ übernehmen. Da<br />
diese bisher nur peripher erwähnt wurden (s. B.1.3; C.2.1.2), sollen hier die wesentlichen<br />
Aspekte solcher Systeme zusammengetragen werden.<br />
203 engl.: „ontology library systems“ (Ding+01, S. 93).
Kaptitel D: Ontologien im Semantic Web 81<br />
Ein Ontologie-Bibliotheks-System soll existente Ontologien verwalten und den Zugriff<br />
durch Dritte ermöglichen – wobei als Dritte sowohl der Entwickler einer neuen Anwendung<br />
als auch die Anwendung selber gemeint sein kann. Um eine angemessene Ver- und<br />
Wiederverwendung von Ontologien zu gewährleisten, sollten solche Systeme entsprechende<br />
Funktionalitäten bereitstellen (s. Ding+01, S.93f). Die wesentlichen Anforderungen<br />
an Ontologie-Bibliotheks-Systeme sind in Tabelle 15 aufgeführt und erläutert.<br />
Funktionalität<br />
Erläuterung<br />
Anforderungen bezüglich der Haltung und der Verwaltung von Ontologien als<br />
grundlegende Aufgabe von Ontologie-Bibliotheks-Systemen.<br />
Haltung<br />
Art und Weise der Haltung von Ontologien. Dabei sollte erstens die Zugänglichkeit<br />
der Ontologien durch Dritte gewährleistet sein. Zweitens sollte eine<br />
(engl.: „Storage“)<br />
Klassifikation die Auswahl einer geeigneten Ontologie durch den Entwickler<br />
einer neuen Applikation unterstützen. Drittens sollten die Ontologien als Module<br />
organisiert sein, um den Ansatz des ´Teilens und Zusammenführens´<br />
(s.o.) zur Entwicklung neuer Ontologien zu unterstützen.<br />
Identifikation Zur Verwaltung sollte jede Ontologie eindeutig identifizierbar sein.<br />
Versionierung Um Änderungen in Ontologien nachvollziehen und die aktuelle Version einer<br />
Ontologie bereitstellen zu können, sollte das System über einen entsprechenden<br />
Versionierungsmechanismus verfügen (siehe auch D.3.2.2).<br />
Funktionalitäten zur Unterstützung von Applikationsentwicklern bei der Auswahl<br />
einer geeigneten Ontologie und zur Wartung der Ontologien im System.<br />
Suche<br />
Such- und Browsing-Funktionalitäten zur Ansicht der existenten Ontologien.<br />
Editierung<br />
Bearbeitungsmöglichkeit von Ontologien im System (siehe auch D.3.2.1).<br />
Automatisierte Hierunter werden einfache Werkzeuge verstanden, mit denen beispielsweise<br />
Qualitätsprüfung die Struktur einer Ontologie hinsichtlich der Integrierbarkeit mit einer anderen<br />
geprüft werden kann.<br />
Gewährleistung der syntaktischen Interoperabilität sowie der Nutzung einer<br />
gemeinsamen semantischen Basis der Ontologien in der Bibliothek.<br />
Repräsentation Formale Darstellung der Ontologien in einem Austauschformat für Ontologien<br />
(z.B. Ontolingua, s. B.1.3.2) oder einer standardisierten Sprache.<br />
Basis-Ontologie Definition einer Top Level – Ontologie (s. C.1.1.2, Tabelle 10), welche von<br />
allen Ontologien des Systems als begriffliche Basis verwendet wird.<br />
Tabelle 15: Anforderungen an Ontologie-Bibliotheks-Systeme 204<br />
Management<br />
Adaption<br />
Standardisierung<br />
Für die Eignung eines Ontologie-Bibliotheks-Systems zur Verwaltung von Ontologien<br />
für das Semantic Web sind aus den aufgeführten Funktionalitäten vor allem drei Aspekte<br />
relevant. Erstens muss die Zugänglichkeit der Ontologien über das Internet gegeben sein,<br />
damit Semantic Web – Anwendungen auf die benötigten Ontologien zugreifen können.<br />
Als zweiter Aspekt ist eine web-basierte Such- und Browsing-Funktionalität notwendig,<br />
um die Einsicht in die existenten Ontologien zu ermöglichen. Dazu sollten die einzelnen<br />
Ontologien angemessen dokumentiert sein (s. B.1.4.2). Der dritte Aspekt ist die Unterstützung<br />
einer web-kompatiblen Ontologie-Spezifikations-Sprache, wobei im Falle der<br />
Empfehlung zur Standardisierung von OWL als Ontologie-Spezifikations-Sprache für das<br />
Semantic Web durch das W3C (s. D.2.2.1) die Unterstützung dieser Sprache wesentlich<br />
sein wird.<br />
Aus dem Vergleich existenter Ontologie-Bibliotheks-Systeme geht hervor, dass noch<br />
keines die aufgeführten Anforderungen für eine Verwendung im Semantic Web erfüllt. Es<br />
wurden innerhalb der wichtigsten Forschungsgruppen des Ontology Engineering sowie<br />
bei Projekten zur Entwicklung von Semantic Web – Technologien entsprechende Systeme<br />
entwickelt, welche zwar die grundlegenden Funktionalitäten, aber noch nicht den für<br />
204 nach (Ding+01, S. 94f; 109-111). Übersetzungen durch den Autor.
Kaptitel D: Ontologien im Semantic Web 82<br />
die Nutzung im Semantic Web benötigten Funktionsumfang bieten (s. Ding+01, S. 107-<br />
111) . 205<br />
D.3.2 Entwicklungsfähigkeit von Ontologien<br />
Die zweite Herausforderung an das Ontologie-Management für das Semantic Web ist die<br />
Entwicklungsfähigkeit von Ontologien, womit die oben erläuterte Anpassungsfähigkeit<br />
von Ontologien an die Umweltcharakteristika des Internet gefordert wird (s. D.1.2.2.2).<br />
Die dazu notwendige Flexibilität von Ontologien, also die Fähigkeit zur Handhabung<br />
der dynamischen Informationsstrukturen im Internet, soll durch sogenannte Verfahren<br />
der „Instandhaltung von Ontologien 206 “ gewährleistet werden. Für die angestrebte Verwendung<br />
von Ontologien im Semantic Web sind dabei insbesondere Techniken von Bedeutung,<br />
die erstens die Erstellung und Änderung einer individuellen Ontologie erlauben<br />
und zweitens die korrekte Einbindung dieser in ihren jeweiligen semantischen Kontext<br />
ermöglichen. Für diese beiden Aspekte soll im Folgenden je ein Lösungsansatz besprochen<br />
werden.<br />
D.3.2.1 Unterstützung der Ontologie-Entwicklung<br />
Als Ansatz zur Unterstützung der Ontologie-Entwicklung für das Semantic Web soll hier<br />
der sogenannte ´Ontology Learning´- Ansatz 207 vorgestellt werden. Darin wird ein Verfahren<br />
zur Erstellung und Editierung von Ontologien für das Semantic Web entwickelt, in<br />
dem die Aufwendigkeit des Ontologie-Entwicklungsprozesses (s. B.3) durch die Automatisierung<br />
von Teilprozessen reduziert werden soll.<br />
Die grundlegende Idee des Ansatzes liegt in der Nutzung bereits vorhandener konzeptioneller<br />
Erfassungen der relevanten Wissensdomäne als Ausgangsbasis für die zu erstellende<br />
oder zu ändernde Ontologie. Aus diesen Informationsquellen wird unter Verwendung<br />
von Verfahren des Maschinellen Lernens 208 eine initiale Ontologie generiert, die<br />
dann lediglich dem konkreten Verwendungszweck angepasst werden muss. Diese Automation<br />
soll die Entwicklung einer Ontologie vor allem hinsichtlich des zeitlichen Aufwands<br />
sowie der konzeptionellen Validität erleichtern, da die aufwendigen und schwierigen<br />
Aufgabenbereiche der Spezifikation und der Konzeptionalisierung durch Werkzeuge<br />
unterstützt werden (s. Maedche+01, S. 1f).<br />
205 Hier sollen die Ontologie-Bibliotheks-Systeme der in dieser Arbeit referenzierten Forschungsgruppen kurz genannt<br />
werden. Eine ausführliche Übersicht dieser und weiterer Ansätze findet sich in (Ding+01, S. 95-107).<br />
1) Ontolingua: Ontologie-Bibliothek des Ontolingua-Systems (s. B.1.3.2). Dieses stellt das derzeit ausgereifteste<br />
System dar, was auf die Verbreitung von Ontolingua als Quasi-Standard zur formalen Spezifikation von<br />
Ontologien zurückgeführt werden kann.<br />
2) DAML Library: System des DAML-Programms (s. Fußnote 198), aus dem DAML+OIL (s. D.2.2.1) hervorgegangen<br />
ist. Die Bibliothek ist öffentlich zugänglich unter: http://daml.semanticweb.org/ontologies (12.07.2002).<br />
3) SHOE: Bibliotheks-System des SHOE-Projekts (s. Fußnote 194). Eine ausführliche Beschreibung findet sich in<br />
(Heflin+00). Siehe auch (D.3.2.2).<br />
206 engl.: „ontology maintenance“ (Tuttle+01, S. 21).<br />
207 Dies ist der Eigenname des Ansatzes (s. Maedche+01, S. 1). Der hier referenzierte Artikel wurde aus dem reichhaltig<br />
vorhandenen Material ausgewählt, da er eine umfassende Übersicht beinhaltet. Eine ausführliche Darstellung<br />
findet sich in: Maedche, A.: Ontology Learning for the Semantic Web. The Kluwer International Series in Engineering<br />
and Computer Science, Volume 665. Kluwer Academic Publishers: 2002.<br />
208 Das KI-Forschungsgebiet des Maschinellen Lernens beschäftigt sich mit der „computergestützten Modellierung<br />
und Realisierung von Lernphänomenen“ (Wrobel+00, S. 517). Dabei werden Verfahren entwickelt, mit denen eine<br />
intelligente Maschine neuartige Wissensstrukturen erlernen kann. Ein wesentliches Anwendungsgebiet derartiger<br />
Techniken ist das Data Mining, wobei die Verfahren für die vollständig automatisierte Wissensakquisition aus Datenbanken<br />
relativ weit fortgeschritten sind. Eine einführende Übersicht des Gebietes findet sich in (Wrobel+00).
Kaptitel D: Ontologien im Semantic Web 83<br />
In Abbildung 16 wird zunächst der „Ontologie-Lernzyklus 209 “ des ´Ontology Learning´<br />
vorgestellt. Daran soll sich eine genauere Erörterung dieses Ansatzes anschließen.<br />
Phasen des Ontology Learning<br />
1. Import und Wiederverwendung (engl. „import and re-use“):<br />
Zunächst werden existente konzeptionelle Erfassungen der Wissensdomäne - also Datenbanken,<br />
XML-Dokumente sowie bereits bestehende Ontologien - identifiziert und deren Verwendbarkeit<br />
als Grundlage für die zu erstellende Ontologie geprüft. Diese Tätigkeiten sind manuell durchzuführen.<br />
Anschließend werden die brauchbaren Erfassungen zu einer einheitlichen Ausgangsbasis<br />
zusammengeführt, wobei für die wiederverwendbaren Ontologien Verfahren der Ontologie-<br />
Integration genutzt werden sollen.<br />
2. Extraktion (engl. „extraction“):<br />
Die Ausgangsbasis stellt lediglich eine begrifflich einheitliche Zusammenfassung wiederverwendbarer<br />
konzeptioneller Erfassungen dar. Die Generierung der initialen Ontologie-Struktur erfolgt<br />
durch die Strukturanalyse der Informationsquellen unter Verwendung entsprechender algorithmischer<br />
Verfahren. Für diese Funktionalitäten wurde als Kern des ´Ontology Learning´- Ansatzes<br />
das Werkzeug ´Text-To-Onto´210 entwickelt.<br />
Mit der Erstellung der initialen Ontologie ist der aufwendigste Teil der Konzeptionalisierung abgeschlossen.<br />
In den anschließenden Phasen ist die Ontologie lediglich der antizipierten Verwendung<br />
anzupassen und hinsichtlich der Qualitätskriterien der Ontologie-Entwicklung (s. B.1.4.1.1)<br />
zu evaluieren. Dazu können bekannte Verfahren des Ontology Engineering verwendet werden.<br />
3. Säuberung (engl. „pruning“):<br />
Entfernung nicht benötigter oder redundanter Ontologie-Elemente (entsprechend der OntoClean –<br />
Methodologie, s. B.2.2).<br />
4. Veredelung (engl. „refinement“):<br />
Feinedition der Ontologie hinsichtlich des konkreten Verwendungsziels.<br />
5. Validierung (engl. „validation“):<br />
Qualitätsprüfung der Ontologie an Hand der Verwendbarkeit für die geplante Anwendung.<br />
Abbildung 16: Phasen des Ontology Learning 211<br />
Aus der Beschreibung wird deutlich, dass mit dem ´Ontology Learning´- Ansatz eine<br />
umfassende, werkzeuggestützte Methodologie für die Ontologie-Entwicklung angestrebt<br />
wird. Die grundlegende Herangehensweise der Nutzung existenter konzeptioneller Erfassungen<br />
zur Reduzierung des Erstellungsaufwands des konzeptionellen Modells ist insbesondere<br />
im Hinblick auf die Entwicklung von Ontologien für das Semantic Web als<br />
sinnvoll zu betrachten, da viele der benötigten Informationsstrukturen bereits im Internet<br />
vorhanden sind. Allerdings ist die angestrebte Automatisierung aufwendiger Teilaufgaben<br />
des Ontologie-Entwicklungsprozesses derzeit als nicht realisierbar einzustufen, weil sowohl<br />
die Verfahren der Ontologie-Integration als auch die Algorithmen für die Analyse<br />
ontologischer Strukturen noch nicht ausgereift genug für die beabsichtigte Verwendung<br />
sind. Wie später noch ausführlicher erläutert wird, erlauben die algorithmischen Verfahren<br />
lediglich eine automatische Analyse von Informationsstrukturen, jedoch ist die Bearbeitung<br />
ontologischer Heterogenitäten nur manuell durchführbar (s. D.3.3).<br />
Somit ist der ´Ontology Learning´- Ansatz zwar grundsätzlich für die Erstellung und<br />
Editierung von Ontologien für das Semantic Web als geeignet zu bewerten, da mit der<br />
209 engl.: „ontology learning cylce“ (Maedche+01, S. 1). Dieser kann für Erweiterungen der Ontologie mehrmals<br />
durchlaufen werden, was dem Lebenszyklusmodell der ´Evolving Prototypes´ (s. Fußnote 53) entspricht.<br />
210 Text-To-Onto: Dieses Werkzeug soll die Erstellung einer ontologischen Struktur sowohl aus unstrukturiertem<br />
Text als auch durch die algorithmische Analyse von Ontologien erlauben. Allerdings ist weder eine detaillierte<br />
Funktionsbeschreibung noch eine frei erhältliche Version dieses Tools erhältlich, so dass keine qualitativen Aussagen<br />
darüber möglich sind. Als weiterführende Informationsquelle kann nur die Homepage unter http://ontoserver.aifb.unikarlsruhe.de/texttoonto/<br />
(15.10.2002) angegeben werden, die aber auch keine weiteren Beschreibungen enthält.<br />
211 nach (Maedche+01, S. 2; 5-7).
Kaptitel D: Ontologien im Semantic Web 84<br />
Wiederverwendung existenter Informationsstrukturen eine enge Bindung neuer oder geänderter<br />
Ontologien an ihr semantisches Umfeld ermöglicht wird. Allerdings ist die Qualität<br />
der Werkzeugunterstützung von der Entwicklung geeigneter algorithmischer Verfahren<br />
abhängig, so dass der Ansatz insgesamt als noch nicht ausgereift betrachtet werden<br />
muss.<br />
D.3.2.2 Wartung von Ontologien<br />
Neben der Erstellung geeigneter Ontologien ist zur Gewährleistung der Entwicklungsfähigkeit<br />
von Ontologien im Semantic Web deren Änderbarkeit durch entsprechende Verfahren<br />
zu unterstützen. Auf Grund der Dynamik des Internet sind häufig Änderungen der<br />
Informationsstrukturen zu erwarten, welche in die Ontologien als semantische Basis<br />
übernommen werden müssen. Da Ontologien prinzipiell eine einmalig erstellte Abbildung<br />
der Strukturen einer Wissensdomäne darstellen und nicht für jede Umweltänderung eine<br />
neue Ontologie entwickelt werden kann, sollten existente Ontologien im Semantic Web<br />
an veränderte Informationsstrukturen anpassbar sein. Dazu werden Verfahren zur sogenannten<br />
„Ontologie-Versionierung 212 “ entwickelt, welche die Aktualisierung einer Ontologie<br />
durch einen Versionierungsmechanismus ermöglichen und die Verwaltung verschiedener<br />
Versionen einer Ontologie erlauben sollen (s. Klein+01, S. 75f).<br />
Wie in Tabelle 15 aufgeführt, sollen derartige Verfahren Bestandteil von Ontologie-<br />
Bibliotheks-Systemen sein. Von den existenten Ansätzen für Bibliotheks-Systeme weist<br />
allerdings nur das System des SHOE-Projekts (siehe Fußnote 205) eine entsprechende<br />
Funktionalität auf (s. Ding+01, S. 102). Dabei kann die Änderung einer Ontologie als eine<br />
neue Version abgespeichert werden, in dem eine neue Datei mit der geänderten formalen<br />
Spezifikation erstellt und diese mit einer entsprechenden Versionsnummer versehen wird.<br />
Es kann dafür eine rückwärtige Kompatibilität mit der vorhergehenden Version der Ontologie<br />
definiert werden, soweit diese hinsichtlich der Struktur der Ontologie gegeben ist<br />
(s. Heflin+00, S. 446f).<br />
Mit diesem Mechanismus ist die grundsätzliche Anforderung der Änderbarkeit von<br />
Ontologien erfüllt. Allerdings können durch die Änderungen in der Ontologie Fehlfunktionen<br />
in denjenigen Anwendungen resultieren, welche die Ontologie als bedeutungsdefinierende<br />
Komponente verwenden. Dies ist insbesondere für die Versionierung von<br />
Ontologien im Semantic Web von Bedeutung, da die Funktionalität eines Netzwerks von<br />
Ontologien als semantischer Grundbaustein nur erreicht werden kann, wenn die Kompatibilität<br />
der Ontologien mit den darauf basierenden Applikationen sowie der einzelnen<br />
Ontologien untereinander gewährleistet ist. Dazu muss bei der Änderung einer Ontologie<br />
deren semantisches Umfeld entsprechend angepasst werden, weshalb Verfahren der<br />
Ontologie-Versionierung neben der Erstellbarkeit einer neuen Version einer Ontologie erweiterte<br />
Funktionalitäten zur Verfügung stellen sollten (s. Klein+01, S. 78-80).<br />
Die wesentliche Anforderung besteht dabei in der dokumentarischen Bereitstellung<br />
von Informationen über die vorgenommenen Änderungen in einer Ontologie, so dass die<br />
auf der Ontologie basierenden Anwendungen mit möglichst geringem Aufwand an die<br />
212 engl.: „Ontology Versioning“ (Klein+01, S. 76).
Kaptitel D: Ontologien im Semantic Web 85<br />
neue Version angepasst werden können. Dazu sollte ein für das Semantic Web geeignetes<br />
Versionierungs-System erstens die Identifikation von Ontologien und ihren Versionen im<br />
Internet erlauben und zweitens eine Dokumentation der Änderungen zwischen den einzelnen<br />
Versionen bereitstellen. Drittens sollte die Kompatibilität zwischen den Ontologie-<br />
Versionen spezifiziert werden können, wodurch eine möglichst hohe Interoperabilität<br />
zwischen den verschiedenen Versionen der Ontologie erreicht werden soll und somit ein<br />
möglichst geringer Änderungsbedarf für die von der Ontologie abhängigen Applikationen<br />
entsteht (s. Klein+01, S. 84ff).<br />
Diese Funktionalitäten sollen mit dem Versionierungs-System OntoView 213 bereitgestellt<br />
werden. Darin wird für die Ontologie-Identifikation nur der zugrundeliegenden<br />
Konzeptionalisierung eine URI als eindeutig identifizierte Web-Ressource zugewiesen,<br />
während die Versionen sowie die anderen Ontologie-Elemente systemintern referenziert<br />
werden. Damit soll die Zusammengehörigkeit der Ontologie-Elemente leichter nachvollziehbar<br />
sein und so die Handhabung der Ontologie als semantischer Basis erleichtert werden<br />
(s. Klein+02, S. 4-7). Die Verwaltung der Änderungen zwischen den Versionen soll<br />
durch den werkzeuggestützten Vergleich der jeweiligen formalen Spezifikation verschiedener<br />
Ontologie-Versionen ermöglicht werden. Dazu werden die Dateien syntaktisch verglichen,<br />
die Unterschiede aufgezeigt und diese dann hinsichtlich ihrer Auswirkungen auf<br />
die ontologische Struktur klassifiziert. 214 Diese Änderungen können als Dokumentation<br />
des Versionierungsprozesses separat dargestellt werden, wodurch die Anpassung der<br />
abhängigen Applikationen erleichtert werden soll (s. Klein+01, 9-14). Somit stellt Onto<br />
View ein vom Ansatz her geeignetes Versionierungs-System für das Semantic Web dar,<br />
welches sich allerdings noch in der Entwicklungsphase befindet.<br />
D.3.3 Ontologie-Integration<br />
Als dritte wesentliche Herausforderung an das Ontologie-Management für das Semantic<br />
Web wurde die Entwicklung von Verfahren der Ontologie-Integration zur Behandlung<br />
semantischer Heterogenitäten aufgeführt (s. D.1.2.2.2). Die essentielle Bedeutung derartiger<br />
Techniken wurde schon in anderen Anwendungszusammenhängen von Ontologien<br />
erläutert, wobei sie die semantische Interoperabilität lokaler, potenziell heterogener<br />
Ontologien sicherstellen sollen (s. C.3.2). Dieselbe Funktionalität ist auch für das Semantic<br />
Web von grundlegender Bedeutung, da mit der Handhabung heterogener Ontologien<br />
die angestrebte semantische Interoperabilität zwischen den unterschiedlichen Informationsräumen<br />
im Internet als wesentliches Ziel der Verwendung von Ontologien gewährleistet<br />
werden soll (s. D.1.2.2). Entsprechende Verfahren sollen dazu eine möglichst weitgehende<br />
Automatisierung der Ontologie-Integration erlauben, um eine effiziente Handhabung<br />
der semantischen Basis des Semantic Web zu ermöglichen (s. D.3.2.1).<br />
213 OntoView: Web-basiertes Ontologie-Versionierungs-System, das auf der Funktionsweise von Versionierungs-<br />
Systemen aus dem konventionellen Software Engineering aufbaut, sogenannten Concurrent Version Systems (CVS).<br />
Das System befindet sich noch in der Entwicklungsphase, weshalb noch keine ausführliche Funktionsbeschreibung<br />
vorliegt. Eine einführende Vorstellung findet sich unter: www.cs.vu.nl/~mcaklein/papers/ontoview.pdf (16.10.2002).<br />
Im Internet ist das System zugänglich unter http://ontoview.org/repository/ (16.10. 2002).<br />
214 Die Veränderungen werden in solche ohne Auswirkungen auf die ontologische Struktur (z.B. Kommentare oder<br />
Namensänderungen) und solche mit Auswirkungen (z.B. Definitionsänderungen, Hinzufügung oder Entfernung von<br />
Definitionen) unterteilt. Die Zuordnung der Änderungen muss manuell vorgenommen werden (s. Klein+02, S. 10).
Kaptitel D: Ontologien im Semantic Web 86<br />
Wie schon im Zusammenhang der Implikationen für Informationssysteme durch die<br />
Verwendung von Ontologien herausgestellt wurde, ermöglichen die bisher existenten<br />
Techniken lediglich eine Werkzeugunterstützung des Ontologie-Integrationsprozesses.<br />
Dabei können die Strukturen zweier zu integrierender Ontologien mit Hilfe von algebraischen<br />
Operationen durch entsprechende Algorithmen automatisch analysiert und die auftretenden<br />
ontologischen Heterogenitäten aufgezeigt werden. Die Behandlung dieser Unterschiede,<br />
deren Auflösung das Ziel der Ontologie-Integration darstellt, ist allerdings nur<br />
durch menschliche Intervention möglich (s. C.3.2.2).<br />
Die Notwendigkeit der Kontrolle der semantischen Korrektheit durch den Menschen<br />
bei der Ontologie-Integration soll an Hand eines einfachen Beispiels verdeutlicht werden.<br />
Es seien zwei Ausgangs-Ontologien A und B gegeben, in denen jeweils ein Konzept<br />
ADRESSE definiert ist. A spezifiziert ADRESSE als einen zusammenhängenden String,<br />
während in B eine Unterteilung in Strasse, Hausnummer und Postleitzahl vorliegt. Diese<br />
konzeptionelle Differenz kann durch eine automatisierte Syntaxanalyse der formalen Spezifikationen<br />
von A und B zwar aufgefunden, aber durch algorithmische Verfahren nicht in<br />
die ´richtige´ Konzeptionalisierung aufgelöst werden. Dazu müsste eine Regel in Form<br />
einer Referenz-Ontologie vorhanden sein, welche die benötigte Auflösung determiniert.<br />
Da genau dieses bei der Integration von Ontologien nicht gegeben ist, muss die angemessene<br />
ontologische Erfassung von Hand ausgewählt werden. 215<br />
Um trotz des erforderlichen menschlichen Eingreifens eine effiziente Handhabung<br />
heterogener Ontologien im Semantic Web zu ermöglichen, werden Verfahren für eine<br />
möglichst weitgehende Automatisierung der Ontologie-Integration entwickelt. Einen generellen,<br />
häufig referenzierten Ansatz stellt das PROMPT-System 216 dar. Darin werden<br />
dem Nutzer neben den Ergebnissen der syntaktischen Strukturanalyse der Ausgangs-<br />
Ontologien vordefinierte Operationen zur Hand gegeben, welche die manuelle Zusammenführung<br />
erleichtern sollen (s. Noy+00, S. 3f). Ein anderer Ansatz für die Ontologie-<br />
Integration im Semantic Web ist die Definition sogenannter „semantischer Brückenontologien<br />
217 “, wie sie im MAFRA-System 218 vorgenommen wird. Statt der Generierung<br />
einer neuen Ontologie werden in einer solchen Brückenontologie die Differenzen zwischen<br />
den zu integrierenden Ontologien erfasst und entsprechend aufgelöst. Somit können<br />
die Ausgangs-Ontologien erhalten bleiben und gleichzeitig deren semantische Interoperabilität<br />
sichergestellt werden. Allerdings muss auch hierbei die Auflösung der ontologischen<br />
Heterogenitäten manuell definiert werden (s. Maedche+02, S. 66f).<br />
215 In Anlehnung an ein Beispiel der Ontologie-Integration (s. Noy+99, S. 3f).<br />
216 PROMPT: Aus dem PROTÉGÉ-Projekt (s. A.1.2.2.2) hervorgegangener Ansatz zur semi-automatischen Zusammenführung<br />
von Ontologien (vgl. Noy+00). Eine frei erhältliche Implementierung liegt als PlugIn für das PROTÉGÉ<br />
2000-Ontologie-Entwicklungswerkzeug (siehe Fußnote 65) vor. Siehe: http://protege.stanford.edu/plugins/prompt/<br />
prompt.html (18.10.2002).<br />
217 engl.: „semantic bridging ontology“ (Maedche+02, S. 68).<br />
218 Das MAFRA-System (MApping FRAmework) stellt einen infrastrukturellen Lösungsansatz für die Handhabung<br />
von Ontologien im Semantic Web dar. Es wird innerhalb des KAON-Projekts (KArlsruhe ONtology and Semantic<br />
Web Infrastructur) entwickelt - einem Forschungsprojekt des Forschungszentrums Informatik (FZI) und des Instituts<br />
für Angewandte Informatik und Formale Beschreibungsverfahren (AIFB) der Universität Karlsruhe. Das KAON-<br />
System soll eine Infrastruktur mit entsprechenden Werkzeugen für die Entwicklung ontologiebasierter Semantic Web<br />
– Anwendungen zur Verfügung stellen (s. Maedche+02, S. 71f). Weiterführende Informationen über das KAON-<br />
System finden sich auf der Homepage des Projekts unter: http://kaon.semanticweb.org/ (12.07.2002).
Kaptitel D: Ontologien im Semantic Web 87<br />
Aus der Erläuterung existenter Verfahren der Ontologie-Integration geht hervor, dass<br />
derzeit die Behandlung ontologischer Heterogenitäten nur manuell möglich ist und lediglich<br />
durch entsprechende Werkzeuge unterstützt werden kann. Dies bedeutet, dass die angestrebte<br />
Erstellung eines Netzwerks von interagierenden, automatisch aktualisierbaren<br />
Ontologien zur Gewährleistung der semantischen Interoperabilität zwischen potenziell<br />
heterogenen Informationsräumen im Semantic Web (s. D.1.2.2.2) zwar im Prinzip möglich<br />
ist, aber einen hohen Anteil menschlicher Intervention bedingt. Denn zur Erstellung<br />
und Wartung eines solchen Netzwerks müsste erstens die Ontologie jeder konkreten<br />
Anwendung in ihr jeweiliges semantisches Umfeld integriert und zweitens bei Änderung<br />
einer Ontologie die von ihr abhängigen Anwendungen und Ontologien entsprechend angepasst<br />
werden. Obwohl mit den vorgestellten Lösungen des Ontologie-Managements<br />
Werkzeuge zur Unterstützung der Ontologie-Integration zur Verfügung gestellt werden,<br />
müsste dazu jeder einzelne Integrationsprozess manuell durchgeführt werden.<br />
Da für die Erhaltung einer solchen semantischen Basis des Semantic Web ein hoher,<br />
nicht adäquater Bedarf an menschlicher Intervention durch entsprechend geschulte Fachkräfte<br />
auftreten würde, wird eine andersartige Verwendung von Ontologien als strukturund<br />
bedeutungsdefinierender Komponente des Semantic Web vorgeschlagen. Dabei soll<br />
eine Ontologie die standardisierte Erfassung eines Informationsraumes im Internet darstellen<br />
– im Gegensatz zur Beschreibung einzelner Informationsressourcen. Damit soll ein<br />
geteiltes, präskriptives Verständnismodell desselben bereitgestellt werden, welches als<br />
Strukturvorgabe für Web-Applikationen innerhalb des Informationsraums fungieren soll.<br />
Durch eine derartige Nutzung von Ontologien kann die Notwendigkeit der Integration<br />
von Ontologien auf die Schnittstellen zwischen verschiedenen Informationsräumen beschränkt<br />
werden, da die semantische Interoperabilität von Informationsressourcen im<br />
Internet mit der Auflösung der ontologischen Heterogenitäten lediglich zwischen den<br />
standardisierten Ontologien gewährleistet werden kann (s. Uschold01, S. 6). Dieser technologisch<br />
bedingte Ansatz zur Strukturierung der semantischen Basis des Semantic Web<br />
impliziert jedoch eine Abweichung vom oben erläuterten Ziel einer universellen Informationsplattform<br />
ohne zentral vorgegebene Informationsstrukturen (s. D.1.1).<br />
D.4 Implikationen für Semantic Web Services<br />
Als letzter Aspekt zur Verwendung von Ontologien im Semantic Web sind die Auswirkungen<br />
zu besprechen, die aus der Bereitstellung einer einheitlichen semantischen Basis<br />
für sogenannte „Semantic Web Services“ (Visser+00, S. 1) als konkrete Anwendungen der<br />
Semantic Web – Technologien resultieren. Als Web Services werden Applikationen bezeichnet,<br />
die unter Nutzung von Web-Technologien informationsverarbeitende Dienste<br />
im Internet bereitstellen. 219 Dabei soll ein Web Service als autonom handelnde Anwendung<br />
spezifische Aufgaben erfüllen und dazu in geeigneter Art und Weise mit anderen<br />
Web Services interagieren, so dass die Informationsverarbeitung im Internet durch ein<br />
Netzwerk von Web Services im Sinne eines Multi-Agenten-Systems (s. C.2.1) realisiert<br />
werden soll (s. Bernes-Lee+01, S. 28f). Hier sollen die funktionalen und konzeptionellen<br />
219 Als ´Semantic Web Service´ werden entsprechend Web Services bezeichnet, die mit Semantic Web – Technologien<br />
arbeiten (s. Visser+01, S. 1).
Kaptitel D: Ontologien im Semantic Web 88<br />
Implikationen für Semantic Web Services aufgezeigt werden, die sich aus der Verwendung<br />
von Ontologien zur Bereitstellung der semantischen Basis ergeben. Dazu werden hier<br />
lediglich die wesentlichen Aspekte zusammengetragen, da eine ausführliche Betrachtung<br />
dieser <strong>Thema</strong>tik <strong>zum</strong> einen die Wiederholung von zuvor bereits behandelten Gesichtspunkten<br />
bedeuten würde und <strong>zum</strong> anderen keine wesentlichen neuen Erkenntnisse über<br />
die Verwendung von Ontologien im Semantic Web daraus hervorgehen würden.<br />
Als informationsverarbeitende Anwendung benötigen Web Services eine struktur- und<br />
bedeutungsdefinierende Beschreibung der zu verarbeitenden Informationen (s. D.1.1). Da<br />
diese im Semantic Web durch Ontologien bereitgestellt werden soll, können die im Zusammenhang<br />
der Verwendung von Ontologien in Informationssystemen vorgestellten<br />
Verbesserungen für das Auffinden, die Verarbeitung und die Darstellung von Informationen<br />
(s. C.2.2; C.2.3) für die grundlegenden informationsverarbeitenden Fähigkeiten von<br />
Semantic Web Services genutzt werden. Des Weiteren können Semantic Web Services an<br />
Hand von Ontologien mit einer bedeutungsdefinierenden Beschreibung versehen werden,<br />
wodurch die semantische Korrektheit bei der Kommunikation zwischen einzelnen Services<br />
gewährleistet werden kann (vgl. Fensel+02) – entsprechend der Zielsetzung bei der<br />
Verwendung geteilter Ontologien für die Agentenkommunikation (s. C.2.1).<br />
Bezüglich der funktionalen Ausrichtung von Semantic Web Services ergeben sich aus<br />
den erläuterten Charakteristika der semantischen Basis des Semantic Web zwei wesentliche<br />
Aspekte. Erstens wird durch die Sicherstellung der semantischen Interoperabilität<br />
von Informationsressourcen die bedeutungserhaltende Interaktion zwischen Web Services<br />
verschiedener Informationsräume ermöglicht, so dass domänenübergreifende Anwendungsszenarien<br />
wie das zu Beginn der Arbeit angeführte Beispiel prinzipiell umsetzbar<br />
sind (s. Einleitung). Der zweite Aspekt bezieht sich auf die Standardisierung von Ontologien<br />
für einzelne Informationsräume, welche auf Grund der Probleme bei Ontologie-<br />
Integration proklamiert wird (s. D.3.3). Obwohl dies zunächst als eine Einschränkung erscheint,<br />
kann die präskriptive Beschreibung eines Informationsraumes als Strukturvorgabe<br />
für einen Semantic Web Service dienen. Das bedeutet, dass die funktionale Konzeption<br />
eines Web Services an das Verständnismodell der Ontologie angelehnt werden kann, so<br />
dass die standardisierte Erfassung einer Wissensdomäne zur Komplexitäts- und Unsicherheitsreduktion<br />
beitragen und somit eine Hilfestellung für die Entwicklung von Semantic<br />
Web Services bieten kann (s. Kim02, S. 51-54).<br />
Die erläuterten Implikationen für Semantic Web Services verdeutlichen die Relevanz<br />
eines struktur- und bedeutungsdefinierenden Grundbausteins des Semantic Web. Denn<br />
das informationsverarbeitende Potenzial des Semantic Web kann nur durch derartige Web<br />
Services ausgeschöpft werden, welche wiederum nur auf einer angemessenen und funktionstüchtigen<br />
semantischen Basis arbeiten können. Daher ist die Entwicklung entsprechender<br />
technischer Lösung zur Bereitstellung und Handhabung einer solchen von grundlegender<br />
Bedeutung für die erfolgreiche Realisierung der Vision des Semantic Web.
Diskussion 89<br />
Diskussion<br />
Als Fazit der Untersuchung der Verwendung von Ontologien als semantischem Grundbaustein<br />
des Semantic Web werden zunächst die herausgearbeiteten Erkenntnisse dahingehend<br />
zusammengefasst, inwieweit die derzeit existenten Verfahren ontologiebasierter<br />
Wissensmodellierung für die Umsetzung der antizipierten Rolle von Ontologien im Semantic<br />
Web geeignet sind. Anschließend daran werden einige Aspekte aufgezeigt, die sich<br />
als weiterführende Fragestellungen hinsichtlich der Notwendigkeit und der Umsetzbarkeit<br />
der Vision des Semantic Web ergeben.<br />
Zusammenfassung der Ergebnisse<br />
Die Vision des Semantic Web besteht in der Erweiterung der informationsverarbeitenden<br />
Fähigkeiten der bestehenden Web-Technologien, um die Qualität des Internet als universeller<br />
Informationsplattform zu verbessern. Im Architekturmodell zur Realisierung dieser<br />
Vision sollen Ontologien zur bedeutungsdefinierenden Beschreibung von Informationsstrukturen<br />
eingesetzt werden, wodurch eine semantische Basis für Semantic Web Services<br />
als informationsverarbeitende Web-Applikationen geschaffen werden soll. Die Zielsetzung<br />
der Verwendung von Ontologien im Semantic Web besteht in der Erstellung eines<br />
Netzwerks interagierender Ontologien, womit erstens der struktur- und bedeutungsdefinierende<br />
Grundbaustein für Semantic Web Services bereitgestellt und zweitens die Interoperabilität<br />
zwischen potenziell heterogenen Informationsräumen im Internet gewährleistet<br />
werden soll.<br />
Die grundlegende Eignung ontologiebasierter Verfahren der Wissensmodellierung für<br />
eine derartige Verwendung ergibt sich aus deren konzeptioneller Intention. Eine Ontologie<br />
soll ein von den Beteiligten einer Wissensdomäne gemeinsam akzeptiertes Verständnismodell<br />
derselben darstellen, worin die Wissensstrukturen der Domäne mit expliziten<br />
Definitionen der intendierten Bedeutung der Begrifflichkeiten erfasst sind. Durch die formale<br />
Darstellung dieses konzeptionellen Modells mittels entsprechender Spezifikationssprachen<br />
kann die Maschinenlesbarkeit von Ontologien ermöglicht werden. Obwohl noch<br />
keine umfassende Methodologie der Ontologie-Entwicklung entworfen wurde, existieren<br />
Ansätze für die grundlegenden Verfahren zur Erstellung und Qualitätssicherung von Ontologien.<br />
Die für den Einsatz von Ontologien im Semantic Web notwendige Kompatibilität<br />
von Ontologie-Spezifikations-Sprachen mit den Web-Technologien kann durch entsprechende<br />
Repräsentationsformalismen gewährleistet werden. Der Nutzengewinn durch<br />
den Einsatz von Ontologien als bedeutungsdefinierender Komponente im Semantic Web<br />
besteht in Verbesserungen für die grundlegenden informationsverarbeitenden Funktionalitäten<br />
von Web-Anwendungen.<br />
Bei der Nutzung von Ontologien in Informationssystemen wird deutlich, dass auf<br />
Grund der Schwierigkeit bei der Erstellung einer globalen, alle relevanten Wissensstrukturen<br />
erfassenden Ontologie der Einsatz mehrerer unabhängiger Ontologien bevorzugt<br />
wird. Auf diesem Prinzip soll auch die Verwendung von Ontologien im Semantic Web<br />
basieren: Jede Informationsquelle, beziehungsweise jeder Informationsraum im Internet<br />
soll durch eine Ontologie beschrieben und der bedeutungserhaltende Informationsaus-
Diskussion 90<br />
tausch zwischen diesen soll durch die Gewährleistung der Interoperabilität der einzelnen<br />
Ontologien sichergestellt werden. Dazu werden Techniken zur Behandlung von Differenzen<br />
zwischen einzelnen Ontologien benötigt. Entsprechende Verfahren der Ontologie-<br />
Integration erlauben jedoch nur eine Werkzeugunterstützung des Integrationsprozesses,<br />
während die eigentliche Auflösung ontologischer Heterogenitäten durch den Menschen<br />
vorgenommen werden muss.<br />
Aus diesem Grund würde die Erstellung und Wartung der semantischen Basis des Semantic<br />
Web in Form eines Netzwerks interagierender, an die Dynamik der Informationsstrukturen<br />
im Internet anpassbarer Ontologien ein nicht adäquates Maß an menschlicher<br />
Intervention bedingen. Daher wird eine andersartige Konzeption der semantischen Basis<br />
vorgeschlagen, wobei Ontologien die standardisierte Erfassung einzelner Informationsräume<br />
darstellen sollen. Konkrete Anwendungen könnten sich an dieser Strukturvorgabe<br />
orientieren und die Auflösung ontologischer Heterogenitäten würde auf die Schnittstellen<br />
verschiedenartiger Informationsräume begrenzt.<br />
Notwendigkeit und Umsetzbarkeit des Semantic Web<br />
Durch die Entwicklung von Web-Technologien mit informationsverarbeitenden Fähigkeiten<br />
kann zweifellos die Qualität des Internet als Informationsplattform verbessert<br />
werden. Es ist aber zu hinterfragen, ob dazu die Verwendung von Ontologien als semantischer<br />
Basis – die unabdingbar für eine automatisierte Informationsverarbeitung ist – erforderlich<br />
ist. Denn eine einheitliche, formal spezifizierte semantische Basis wird nur benötigt,<br />
wenn die Interoperabilität zwischen Systemen mit unterschiedlichen Verständnismodellen<br />
gewährleistet werden soll (s. Uschold01, S. 5f). Derartige Differenzen würden<br />
bei einer Standardisierung einzelner Informationsräume lediglich zwischen verschiedenen<br />
Informationsräumen zu erwarten sein. Da diese durch entsprechende Konventionen auch<br />
ohne Ontologien aufgelöst werden könnten, erscheint die Verwendung von Ontologien<br />
zur Gewährleistung der semantischen Interoperabilität als nicht zwingend notwendig.<br />
Allerdings würde der Verzicht auf Ontologien im Semantic Web auch den Verzicht auf<br />
jene funktionalen Verbesserungen bedeuten, die mit Ontologien für informationsverarbeitende<br />
Web-Applikationen bereitgestellt werden können. Somit kann festgehalten werden,<br />
dass aus funktionaler Sicht die Verwendung von Ontologien für die semantische Basis des<br />
Semantic Web zwar nicht erforderlich ist, aber durchaus Vorteile daraus entstehen.<br />
Abschließend sei hinsichtlich der Realisierbarkeit der Vision des Semantic Web aus betriebswirtschaftlicher<br />
Sicht angemerkt, dass ein signifikanter Mehrwert der Semantic Web<br />
- Technologien erst bei einer weiten Verbreitung derselben deutlich wird. Denn erst wenn<br />
viele Applikationen auf einer einheitlichen semantischen Grundlage basieren, werden die<br />
daraus resultierenden Vorteile deutlich. Da ein Unternehmen somit nur langfristig einen<br />
Profit aus Investitionen für die Entwicklung von Semantic Web – Anwendungen erwarten<br />
kann, wird die Realisierbarkeit des Semantic Web aus dieser Perspektive als sehr kritisch<br />
und nur über einen längeren Zeitraum hinweg für möglich erachtet. 220<br />
220 Diese Aspekte führte Dr. Jürgen Laartz, McKinsey Company, in seinem Vortrag <strong>zum</strong> <strong>Thema</strong> „Semantic Web –<br />
Wissenschaftliche Spielerei oder ökonomischer Mehrwert?“ auf dem 3. Berliner E-Business-Forum, 04.07.2002, an.
Literaturverzeichnis 91<br />
Literaturverzeichnis<br />
Rückriem+97<br />
Berners-Lee+01<br />
Berners-Lee00<br />
Cruz+01<br />
Fensel01<br />
Gómez-Pérez99<br />
Ohlms02<br />
Angele+97<br />
Balzert99<br />
Duden93<br />
Endres-Niggemeyer98<br />
Fensel00<br />
Glück00<br />
Gómez-Pérez+99<br />
Görz+00a<br />
Vorwort<br />
RÜCKRIEM, G.; STARY, J.; FRANCK, N.: Die Technik wissenschaftlichen<br />
Arbeitens. Eine praktische Anleitung. 10. überarbeitete Auflage. Paderborn,<br />
München, Wien, Zürich: Schönigh 1997.<br />
Einleitung<br />
BERNERS-LEE, T.; HENDLER, J.; LASSILA, O.: The Semantic Web. A new<br />
form of Web Content that is meaningful to computers will unleash a<br />
revolution of new possibilities. In: Future of the Web. Scientific American<br />
Online Issue 2002, S. 24-30 (erschienen in: Scientific American, May<br />
2001).<br />
BERNERS-LEE, T.: Weaving the Web. The Past, Present and Future of the<br />
World Wide Web by its Inventor. London, New York: Texere 2000.<br />
CRUZ, I. F. U. A.: Proceedings of the First Semantic Web Working<br />
Symposium. California (USA): Stanford University 2001.<br />
FENSEL, D.: The Semantic Web. Vortragsfoliensatz, Semantic Web Workshop.<br />
Hong Kong: 2001.<br />
GÓMEZ-PÉREZ, A.: Ontological Engineering. A State of the Art. Madrid:<br />
Expert Update 1999.<br />
OHLMS, C.: The Future of the Semantic Web. A Perspective on the Market<br />
Adoption of Semantic Web Technologies. Karlsruhe: 9. AIK-Symposium<br />
2002.<br />
Kapitel A<br />
ANGELE, J. U.A.: Abschlußbericht der GI-Arbeitsgruppe "Vergleichende<br />
Analyse von Problemstellungen und Lösungsansätzen in den Fachgebieten<br />
Information Systems Engineering, Software Engineering und Knowledge<br />
Engineering". EMISA Forum 7 (2): 11-58 (1997)<br />
BALZERT, HEIDE.: Lehrbuch der Objektmodellierung. Analyse und Entwurf.<br />
Heidelberg; Berlin: Spektrum Verlag 1999.<br />
ENGESSER, H. (HRSG.): Duden Informatik. Ein Sachlexikon für Studium<br />
und Praxis. 2. Aufl. Mannheim, Leipzig, Wien, Zürich: Dudenverlag 1993.<br />
ENDRES-NIGGEMEYER, B.: Logische Grundlagen der Verarbeitung von<br />
Wissen und Information. Hannover: Vorlesungsskriptum FH Hannover<br />
SoSe 1998.<br />
FENSEL, D.: Ontologies. Silver Bullet for Knowledge Management and<br />
Electronic Commerce. Berlin: Springer 2000.<br />
GLÜCK, H. (HRSG.): Metzler Lexikon Sprache. 2. überarbeitete und erweiterte<br />
Auflage. Stuttgart, Weimar: Metzler 2000.<br />
GÓMEZ-PÉREZ, A.; BENJAMINS, V. R.: Overview of Knowledge Sharing and<br />
Reuse Components. Ontologies and Problem Solving Methods. In: Proceedings<br />
of the IJCAI-99 Workshop on Ontologies and Problem-Solving<br />
Methods (KRR5). Stockholm: 1999.<br />
GÖRZ, G.; ROLLINGER, C.-R.; SCHNEEBERGER, J. (HRSG.): Handbuch der<br />
Künstlichen Intelligenz. 3. Aufl. München: Oldenburg Verlag 2000.
Literaturverzeichnis 92<br />
Görz+00b GÖRZ, G.; WACHSMUTH, I.: Einleitung. In: (Görz+00a) Kapitel 5, S. 1-15.<br />
Gruber93<br />
Guarino+95<br />
Guarino94<br />
Guarino95<br />
Guarino98<br />
Hesse96<br />
GRUBER, T. R.: Towards Principles for the Design of Ontologies used for<br />
Knowledge Sharing. Stanford University, Knowledge Systems Laboratory:<br />
Technical Report KSL 93-04, 1993.<br />
GUARINO, N.; GIARETTA, P.: Ontologies and Knowledge Bases. Towards a<br />
Terminological Clarification. In: N. Mars (Hrsg.): Towards Very Large<br />
Knowledge Bases. Knowledge Building and Knowledge Sharing.<br />
Amsterdam: IOS Press 1995.<br />
GUARINO, N.: The Ontological Level. In: R. Casati, B. Smith and G. White<br />
(Hrsg.): Philosophy and the Cognitive Science. Wien: Hölder-Pichler-<br />
Tempsky 1994.<br />
GUARINO, N.: Formal Ontology, Conceptual Analysis and Knowledge<br />
Represenation. International Journal of Human and Computer Studies<br />
43(5/6): 625-640.<br />
GUARINO, N.: Formal Ontology and Information Systems. In N. Guarino<br />
(Hrsg.): Formal Ontology in Information Systems. Proceedings of FOIS98.<br />
Amsterdam: IOS Press 1998.<br />
HESSE, S.: Expert Lexikon. Künstliche Intelligenz. Reunigen-Malsheim:<br />
Expert Verlag 1996.<br />
Hofstadter01 HOFSTADTER, D. R.: Gödel, Escher, Bach. Ein endlos geflochtenes Band. 8.<br />
Aufl. München: Deutscher Taschenbuch Verlag 2001.<br />
Luger01<br />
McCarthy+55<br />
McCarthy+69<br />
LUGER, G. F.: Künstliche Intelligenz. Strategien <strong>zum</strong> Lösen komplexer<br />
Probleme. München: Pearson Studien 2001.<br />
MCCARTHY, J. U. A.: A Proposal on the Dartmouth Summer Research<br />
Project on Artificial Intelligence. Dartmouth (New Hampshire, USA):<br />
1955.<br />
MCCARTHY, J.; HAYES, P. J.: Some Philosophical Problems from the<br />
Standpoint of Artificial Intelligence. Machine Intelligence 4, 1969.<br />
McCarthy00 MCCARTHY, J.: What is Artificial Intelligence? Stanford University 2000.<br />
Newell81 NEWELL, A.: The Knowledge Level. Artificial Intelligence 18 (1), S. 87-<br />
127.<br />
Nonaka+97<br />
Owsnicki-Klewe+00<br />
Puppe+00<br />
Schreiber+00<br />
Smolle02<br />
Störig63<br />
NONAKA, X.; TAKEUCHI, Y.: Die Organisation des Wissens. Wie japanische<br />
Unternehmen eine brachliegende Ressource nutzbar machen.<br />
Frankfurt a. M.: Campus Verlag 1997.<br />
OWSNICKI-KLEWE, B.; LUCK, K. VON; NEBEL, B.: Wissensrepräsentation<br />
und Logik – Eine Einführung. In: (Görz+00a) Kapitel 5, S. 153-197.<br />
PUPPE, F. ; STOYAN, H.; STUDER, R.: Knowledge Engineering. In:<br />
(Görz+00a) Kapitel 15, S. 599-641.<br />
SCHREIBER, G. U.A.: Knowledge Engineering and Management. The<br />
CommonKADS Methodology. Cambridge (USA), London: MIT Press<br />
2000.<br />
SMOLLE, P. F.: Semantische Technologien & Elektronische Märkte.<br />
Karlsruhe: 9. AIK-Symposium 2002.<br />
STÖRIG, H.J.: Kleine Weltgeschichte der Philosophie. München, Zürich:<br />
Droemersche Verlagsanstalt 1963.
Literaturverzeichnis 93<br />
Struss00<br />
Studer+98<br />
Uschold+96<br />
Wielinga94<br />
STRUSS, P.: Modellbasierte Systeme und qualitative Modellierung. In:<br />
(Görz+00a) Kapitel 12, S. 431-490.<br />
STUDER, R.; BENJAMINS, V.R.; FENSEL, D.: Knowledge Engineering.<br />
Principles and Methods. In: Data and Knowledge Engineering 25 (1-2)<br />
1998.<br />
USCHOLD, M.; GRUNINGER, M.: Ontologies. Principles, Methods and<br />
Applications. In: Knowledge Engineering Review 11(2), 1996.<br />
WIELINGA, B. J. (HRSG.): Expertise Model Definition Document. ESPRIT<br />
Project, University of Amsterdam 1994.<br />
Kapitel B<br />
Boyens01<br />
Brockhaus96<br />
Corcho+00<br />
Devedžić02<br />
BOYENS, C.: OntoKick – Ein Werkzeug zur Unterstützung von ontologiebasiertem<br />
Wissensmanagement. Dipl.-Arb., Karlsruhe 2001.<br />
BROCKHAUS – DIE ENZYKLOPÄDIE. In 24 Bänden. 20., überarbeitete und<br />
aktualisierte Aufl. Leipzig, Mannheim: Brockhaus 1996.<br />
CORCHO, O.; GÓMEZ-PÉREZ, A.: Evaluating Knowledge Representation and<br />
Reasoning Capabilities of Ontology Specification Languages. In: Proceedings<br />
of the ECAI 2000 Workshop on Applications of Ontologies and<br />
Problem Solving Methods. Berlin 2000.<br />
DEVEDŽIĆ, V.: Understanding Ontological Engineering. In: Communications<br />
of the ACM 45 (4), 2002: S. 136-144.<br />
Draheim00 DRAHEIM, D.: Vorlesungsskript Softwaretechnik. FU Berlin, WS 00 / 01.<br />
Farquhar+96<br />
Fernández+97<br />
Fernandéz+99<br />
Gómez-Pérez+96<br />
Gómez-Pérez01<br />
Gruber93b<br />
Grüninger+95<br />
Guarino+00a<br />
FRAQUHAR, A.; FIKES, R.; RICE,J.: The Ontolingua Server. A Tool for<br />
Collaborative Ontology Construction. In: Proceedings of KAW96. Banff<br />
(Canada) 1996.<br />
FERNÁNDEZ, M.; GÓMEZ-PÉREZ, A.; JURISTO, N.: METHONTOLOGY.<br />
From Ontological Art towards Ontological Engineering. In: AAAI-97<br />
Spring-Symposium on Ontological Engineering. Stanford University 1997.<br />
FERNÁNDEZ, M.; GÓMEZ-PÉREZ, A.; SIERRA, J. P.: Building a Chemical<br />
Ontology Using Methontology and the Ontology Design Environment. In:<br />
IEEE Intelligent Systems 14 (1), 1999.<br />
GÓMEZ-PÉREZ, A.; FERNÁNDÉZ, M.; DE VICENTE, A. : Towards a Method<br />
to Conceptualize Domain Ontologies. In: Working Notes of the Workshop<br />
Ontological Engineering, ECAI 1996.<br />
GOMEZ-PEREZ, A.: Evaluation of ontologies. In R. R. Yager (Hrsg.):<br />
International Journal of Intelligent Systems 16 (3). Special Issue on<br />
Verification and Validation in Databases, Knowledge Based Systems, and<br />
Ontologies. London: John Wiley & Sons 2001, S. 391-409.<br />
GRUBER, T. R.: A Translation Approach to Portable Ontology Specification.<br />
Knowledge Acquisition 5, 1993.<br />
GRÜNINGER, M.; FOX, M. S.: Methodology for the Design and Evolution of<br />
Ontologies. IJCAI-95 Workshop on Basic Ontological Issues in Knowledge<br />
Sharing. Montral (Cananda): 1995.<br />
GUARINO, N.; WELTY, C.: Towards a methodology for ontology-based<br />
model engineering. In: Proceedings of ECOOP-2000 Workshop on Model<br />
Engineering. Cannes (France): 2000.
Literaturverzeichnis 94<br />
Guarino+00b<br />
Guarino+02<br />
Holsapple+02<br />
Jones+98<br />
KBSI-94<br />
Motta98<br />
Noy01<br />
O´Neil+01<br />
Schnurr+00<br />
Smith98<br />
Uschold+95<br />
Uschold+96b<br />
GUARINO, N.; WELTY, C.: A Formal Ontology of Properties. In R. Dieng<br />
and O. Corby (Hrsg.): Knowledge Engineering and Knowledge Management.<br />
Methods, Models and Tools. 12th International Conference, EKAW<br />
2000. Berlin: Springer 2000, S. 97-112.<br />
GUARINO, N.; WELTY, C.: Evaluating Ontological Decisions with Onto<br />
Clean. In: Communications of the ACM 45 (2), 2002; S. 61-65.<br />
HOLSAPPLE, C. W.; JOSHI, K.D.: A Collaborative Approach to Ontology<br />
Design. In: Communications of the ACM 45 (2), 2002; S. 42-47.<br />
JONES, D.; BENCH-Capon, T.; Visser, P.: Methodologies for Ontology<br />
Development. In: Proceedings of IT&KNOWS Conference of the 15th IFIP<br />
World Computer Congress. Budapest: Chapman-Hall 1998.<br />
KNOWLEDGE BASED SYSTEMS, INC.: The IDEF5 Ontology Description<br />
Capture Method Overview. Texas (USA): KBSI Report 1994.<br />
MOTTA, E.: An Overview of the OCML Modelling Language. In: Proceedings<br />
of the 8 th Workshop on Knowledge Engineering: Methods &<br />
Languages KEML 98. Karlsruhe: 1998.<br />
NOY, N. F.: Ontology Engineering for the Semantic Web and Beyond.<br />
Semantic Web Working Symposium Tutorial. California, USA: Stanford<br />
University 2001.<br />
O´NEIL, P.; O´NEIL, E.: Database. Principles, Programming, and Performance.<br />
2 Aufl. Boston: Morgan Kaufmann Publishers 2001.<br />
SCHNURR, H.-P. U. A.: On-To-Knowledge Methodology – Baseline Version.<br />
Karlsruhe: On-To-Knowledge Consortium 2000.<br />
SMITH, B.: Basic Concepts of Formal Ontology. In N. Guarino (Hrsg.):<br />
Formal Ontology in Information Systems. Proceedings of FOIS98. Amsterdam:<br />
IOS Press 1998.<br />
USCHOLD, M.; KING, M.: Towards a Methodology for Building Ontologies.<br />
IJCAI-95 Workshop on Basic Ontological Issues in Knowledge Sharing.<br />
Montreal (Canada): 1995.<br />
USCHOLD, M. U.A.: The Enterprise Ontology. Knowledge Engineering<br />
Review 11(2), 1996.<br />
Kapitel C<br />
Aitken+00<br />
Bateman+95<br />
Benjamins+98<br />
Borgo+97<br />
AITKEN, S.; REID, S.: Evaluation of an Ontology-Based Information<br />
Retrieval Tool. In: Proceedings of ECAI'00 Workshop on Applications of<br />
Ontologies and Problem-Solving Methods, 2000.<br />
BATEMAN, J. A.; MAGNINI, B.; FABRIS, G.: The Generalized Upper Model<br />
Knowledge Bare. Organization and Use. In N. Mars (Hrsg.): Towards Very<br />
Large Knowledge Bases. Knowledge Building and Knowledge Sharing.<br />
Amsterdam: IOS Press 1995.<br />
BENJAMINS, V. R.; FENSEL, D.: The Ontological Engineering Initiative<br />
(KA) 2 . In N. Guarino (Hrsg.): Formal Ontology in Information Systems.<br />
Proceedings of FOIS98. Amsterdam: IOS Press 1998.<br />
BORGO, S. U. A.: Using a Large Linguistic Ontology for Internet-Based<br />
Retrieval of Object-Oriented Components. In Proceedings of 1997<br />
Conference on Software Engineering and Knowledge Engineering. Snokie<br />
(USA), 1997.
Literaturverzeichnis 95<br />
Borst97<br />
BORST, W. N.: Construction of Engineering Ontologies for Knowledge<br />
Sharing and Reuse. Enschede, Diss. 1997.<br />
Burkhard00 BURKHARD, H.-D.: Software-Agenten. In: (Görz+00a), Kapitel 24; S. 941-<br />
1018.<br />
Bylander+88<br />
Campell+98<br />
Clason76<br />
Cui+00<br />
Cui+01<br />
DIN 1463<br />
Elkan+93<br />
Falasconi+96<br />
Fellbaum98<br />
Finin+97<br />
FIPA-97<br />
FIPA-98<br />
Gangemi+98<br />
Gaus98<br />
Greengrass00<br />
BYLANDER, T.; CHANDRASEKARAN, B.: Generic tasks in knowledge-based<br />
reasoning. The right level of abstraction for knowledge acquisition. In B.<br />
Gaines, J. Boose (Hrsg.): Knowledge Acquisition for Knowledge Based<br />
Systems. Vol. 1 London: Academic Press 1988.<br />
CAMPELL, A. E.; SHAPIRO, S. C.: Algorithms for Ontological Mediation.<br />
Technical Report 98-03, Dep. of CS and Engineering, State Univ. of New<br />
York at Buffalo, 1998.<br />
CLASON, W. E.: Elsevier´s Dictionary of Library Science, Information and<br />
Documentation. Amsterdam: Elsevier 1976.<br />
CUI, Z.; O´BRIEN, P.: Domain Ontology Management Environment. In:<br />
Proceedings of the 33rd Hawaii International Conference on System<br />
Sciences, 2000.<br />
CUI, Z. ; JONES, D.; O´BRIEN P.: Issues in Ontology-based Information<br />
Integration. In: Proceedings of the IJCAI01 Workshop on E-Business and<br />
the Intelligent Web, Seattle (USA) 2001.<br />
DIN 1463, TEIL 1: Erstellung und Entwicklung von Thesauri. Einsprachige<br />
Thesauri. Berlin: Beuth 1988 (12 S.).<br />
ELKAN, C.; GREINER, R.: Book Review. Building Large Knowledge Based<br />
Systems. Representation and Inference in the CYC Project. Artificial<br />
Intelligence (61), 1993.<br />
FALASCONI, S.; LANZOLA, G.; STEFANELLI, M.: Using Ontologies in Multi-<br />
Agent Systems. In: Proceedings of the 10th Knowledge Acqisition for<br />
Knowledge-Based Systems Workshop KAW´96. Banff (Canada): 1996.<br />
FELLBAUM (HRSG.): WordNet. An Electronic Lexical Database. Cambridge<br />
(USA), London: MIT Press 1998.<br />
FININ, T.; LABROU, Y.; MAYFIELD, J.: KQML as an agent communication<br />
language. In J. Bradshaw (Hrsg.): Software Agents. Cambridge (USA),<br />
London: MIT Press 1997.<br />
FIPA: Agent Communication Language Specification. Foundation for<br />
Intelligent Physical Agents, Genf 1997.<br />
unter: www.fipa.org/specs/fipa00003/ (04.09.2002).<br />
FIPA: Ontology Service Specification. Foundation for Intelligent Physical<br />
Agents, Genf 1998.<br />
unter: www.fipa.org/specs/fipa00006/ (04.09.2002).<br />
GANGEMI, A.; PISANELLI, D. M.; STEVE, G.: Ontology Integration. Experiences<br />
with Medical Terminologies. In N. Guarino (Hrsg.): Formal Ontology<br />
in Information Systems. Proceedings of FOIS98. Amsterdam: IOS Press<br />
1998.<br />
GAUS, W.: Dokumentations- und Ordnungslehre. Theorie und Praxis des<br />
Information Retrieval. 3 Aufl. Berlin, Heidelberg: Springer 1998.<br />
GREENGRASS, E.: Information Retrieval – A Survey. UMBC Center for<br />
Architectures for Data-Driven Information Processing, Maryland (USA):<br />
2000.
Literaturverzeichnis 96<br />
Guarino97<br />
Hindelang94<br />
Jones98<br />
Kashyap+96<br />
Klinker+91<br />
McGuinness98<br />
Mena+00<br />
Mena+98<br />
Mitra+01<br />
Mitra+99<br />
Neches+91<br />
Obitko01<br />
Rodrígez00<br />
Schnurr+01<br />
Sheth98<br />
Swartout+97<br />
GUARINO, N.: Semantic Matching. Formal Ontological Distinctions for<br />
Information Organization, Extraction, and Integration. In M. T. Pazienza<br />
(Hrsg.) Information Extraction: A Multidisciplinary Approach to an Emerging<br />
Information Technology. Berlin, Heidelberg: Springer 1997.<br />
HINDELANG, G.: Einführung in die Sprechakt-Theorie. 2. Aufl. Tübingen:<br />
Niemeyer 1994.<br />
JONES, D.: Developing Shared Ontologies in Multi-agent Systems. In<br />
Proceedings of the ECAI'98 Workshop on Intelligent Information Integration.<br />
Brighton (GB) 1998.<br />
KASHYAP, V.; SHETH, A. P.: Semantic Heterogeneity in Global Information<br />
Systems. The Role of Metadata, Context and Ontologies. In M.<br />
Papazoglou, G. Schlageter (Hrsg.): Cooperative Information Systems.<br />
Current Trends and Applications, 1996.<br />
KLINKER, G. U.A.: Usable and reusable programming constructs. In:<br />
Knowledge Acquisition (3), 1991.<br />
MCGUINNESS, D. L.: Ontological Issues for Knowledge-Enhanced Search.<br />
In N. Guarino (Hrsg.): Formal Ontology in Information Systems. Proceedings<br />
of FOIS98. Amsterdam: IOS Press 1998.<br />
MENA, E. U. A.: OBSERVER. An Approach for Query Processing in Global<br />
Information Systems based on Interoperation across pre-existing<br />
Ontologies. In: International Journal on Distributed and Parallel Databases,<br />
Vol. 8, No. 2, pp. 223-271, April 2000.<br />
MENA, E. U. A.: Domain Specific Ontologies for Semantic Information<br />
Brokering on the Global Information Infrastructure. In N. Guarino (Hrsg.):<br />
Formal Ontology in Information Systems. Proceedings of FOIS98. Amsterdam:<br />
IOS Press 1998.<br />
MITRA, P.; WIEDERHOLD, G.; DECKER, S.: A Scalable Framework for the<br />
Interoperation of Information Sources. In: Proceedings of the First<br />
Semantic Web Working Symposium SWWS´01. Stanford University 2001;<br />
S. 317-330.<br />
MITRA, P, WIEDERHOLD, G.; JANNINK J.: Semi-automatic integration of<br />
knowledge sources. In: Proceedings of the 2 nd International Conference on<br />
Information FUSION´99, 1999.<br />
NECHES, R. U. A.: Enabling Technology for Knowledge Sharing. AI Magazine<br />
12 (3), 1991.<br />
OBITKO, M.: Ontologies. Descriptions and Applications. Research Report<br />
No. 126/01, Gerster Laboratory for Intelligent Decision Making and<br />
Control, Czech Technical University. Prag: 2001.<br />
RODRÍGEZ, M. A.: Assessing Semantic Similarity among Spatial Entity<br />
Classes. University of Maine, Diss. 2000.<br />
SCHNURR, H.-P. U.A.: Ontologiebasiertes Wissensmanagement – ein<br />
umfassender Ansatz zur Gestaltung des Knowledge Life Cycle. Karlsruhe:<br />
2001.<br />
SHETH, A. P.: Changing Focus on Interoperability in Information Systems.<br />
Form System, Syntax, Structure to Semantics. In M. F. Goodschild u. a.<br />
(Hrsg): Interoperating Geographic Information Systems. Kluwer 1998.<br />
SWARTOUT, W. R.: Towards Distributed Use of Large-Scale Ontologies. In:<br />
AAAI-97 Spring Symposium on Ontological Engineering. Stanford University,<br />
1997.
Literaturverzeichnis 97<br />
Uschold+98<br />
Uschold+99<br />
vanHeijst+97<br />
Visser+98<br />
Wache+01<br />
Wiederhold94<br />
USCHOLD, M. U. A.: Ontology Reuse and Application. In N. Guarino<br />
(Hrsg.): Formal Ontology in Information Systems. Proceedings of FOIS98.<br />
Amsterdam: IOS Press 1998.<br />
USCHOLD, M.; JASPER, R.: A Framework for Understanding and Classifying<br />
Ontology Applications. In V. R. Benjamins u. a. (Hrsg.): Proceedings<br />
of the IJCAI-99 Workshop on Ontologies and Problem-Solving-<br />
Methods. Stockholm 1999.<br />
VAN HEIJST, G.; SCHREIBER, A. TH.; WIELINGA, B. J.: Using Explicit<br />
Ontologies in KBS Development. In: International Journal of Human-<br />
Computer-Studies (45), 1997.<br />
VISSER, P. R. S. U. A.: Assessing Heterogeneity by Classifying Ontology<br />
Mismatches. In N. Guarino (Hrsg.): Formal Ontology in Information<br />
Systems. Proceedings of FOIS98. Amsterdam: IOS Press 1998.<br />
WACHE, H. U. A.: Ontology-Based Information Integration – A Survey of<br />
Existing Approaches. In: Proceedings of the Workshop Ontologies and<br />
Information Sharing. IJCAI 2001.<br />
WIEDERHOLD, G.: Interoperation, Mediation, and Ontologies. In: Proceedings<br />
of the International Symposium for Fifth Generation Computer<br />
Systems, Workshop on Heterogeneous Cooperative Knowledge Bases.<br />
Tokyo 1994.<br />
Kapitel D<br />
Beckett02<br />
Berners-Lee00a<br />
Berners-Lee98<br />
BECKETT, D.: RDF/XML Syntax Specification (Revised). W3C Working<br />
Draft: 2002.<br />
unter: www.w3.org/TR/rdf-syntax-grammar/ (25.09.2002).<br />
BERNERS-LEE, T.: Semantic Web on XML. Vortragsfoliensatz zur XML-<br />
Conference 2000, Washington DC: 2000.<br />
unter: www.w3.org/2000/Talks/1206-xml-2k-tbl/Overview.html (08.06.02).<br />
BERNERS-LEE, T.: Web-Architecture from 50.000 feet. W3C: 1998. letzter<br />
Update: 25.02.2002.<br />
unter: www.w3.org/DesignIssues/Architecture.html (26.09.2002).<br />
Berners-Lee98a BERNERS-LEE, T.: What the Semantic Web can represent. W3C: 1998.<br />
unter: www.w3.org/DesignIssues/RDFnot.html (26.09.2002).<br />
Berners-Lee98b BERNERS-LEE, T.: Semantic Web Road map. W3C, Draft: 1998.<br />
unter: www.w3.org/DesignIssues/Semantic.html (26.09.2002).<br />
Bray+00<br />
Bray+99<br />
Brickley+00<br />
Dean+02<br />
BRAY, T. U. A.: Extensible Markup Language (XML) 1.0. Second Edition.<br />
W3C Recommendation: 2000.<br />
unter: www.w3.org/TR/REC-xml (25.09.2002).<br />
BRAY, T.; HOLLANDER, D.; LAYMAN, A.: Namespaces in XML. W3C Recommendation:<br />
1999.<br />
unter: www.w3.org/TR/1999/REC-xml-names-19990114/ (04.10.2002).<br />
BRICKLEY, D.; GUHA, R. V.: Resource Description Framework (RDF)<br />
Schema Specification 1.0. W3C Candidate Recommendation: 2000.<br />
unter: www.w3.org/TR/2000/CR-rdf-schema-20000327/ (26.09.2002).<br />
DEAN. J. U. A.: OWL Web Ontology Language 1.0. Reference. W3C Working<br />
Draft: 2002.<br />
unter: www.w3.org/TR/owl-ref/ (25.09.2002).
Literaturverzeichnis 98<br />
Decker+00<br />
Ding+01<br />
Fallside01<br />
Fensel+01<br />
Fensel+02<br />
Gómez-Pérez+02<br />
DECKER, S. U. A.: The Semantic Web. The Roles of XML and RDF. In:<br />
IEEE Internet Computing. (5) 2000; S. 2-13.<br />
DING, Y.; FENSEL, D.: Ontology Library Systems. The key to successful<br />
Ontology Re-Use. In: Proceedings of the First Semantic Web Working<br />
Symposium. California, USA: Stanford University 2001; S. 93-112.<br />
FALLSIDE, D. C.: XML Schema Part 0: Primer. W3C Recommendation:<br />
2001.<br />
unter: www.w3.org/TR/xmlschema-0/ (04.10.2002).<br />
FENSEL, D. U. A.: OIL. An Ontology Infrastructure for the Semantic Web.<br />
In: IEEE Intelligent Systems (2) 2001; S. 38-45.<br />
FENSEL, D.; BUSSLER, C.; MAEDCHE, A.: Semantic Web Enabled Web<br />
Services. In: Proceedings of the 1 st International Semantic Web Conference<br />
(ISWC02). Sardinia (Italien): 2002; S. 1-2.<br />
GÓMEZ-PÉREZ, A.; CORCHO, O.: Ontology Languages for the Semantic<br />
Web. In: IEEE Intelligent Systems (1) 2002; S. 54-60.<br />
Hayes02 HAYES, P.: RDF Model Theory. W3C Working Draft: 2002.<br />
unter: www.w3.org/TR/rdf-mt/ (25.09.2002).<br />
Heflin+00<br />
Heflin+02<br />
Hendler+00<br />
Horrocks+01<br />
HEFLIN, J.; HENDLER, J.: Dynamic ontologies on the Web. In: Proceedings<br />
of the 17 th National Conference on Artificial Intelligence (AAAI-2000).<br />
Menlo Park (California): AAAI/MIT Press 2000; S. 443-449.<br />
HEFLIN, J.; VOLZ, R.; DALE, J.: Requirements for a Web Ontology Language.<br />
W3C Working Draft: 2002.<br />
unter: www.w3.org/TR/webont-req/ (25.09.2002).<br />
HENDLER, J.; MCGUINESS, D. L.: The DARPA Agent Markup Language.<br />
In: IEEE Intelligent Systems Trend and Controversies 2000.<br />
HORROCKS, I.; VAN HARMELEN, F.: Reference Description of the DAML+<br />
OIL Ontology Markup Language. DAML Program: Draft Report 2001.<br />
unter: www.daml.org/2000/12/reference.html (12.07.2002).<br />
Jacobs00 JACOBS, I.: About the World Wide Web Consortium (W3C). W3C: 2000.<br />
unter: www.w3.org/Consortium/ (01.10.2002).<br />
Karp+99<br />
Kashyap01<br />
KARPD, R.; CHAUDHRI, V.; THOMERE, J.: XOL. An XML-Based Ontology<br />
Exchange Language. Version 0.4: 1999.<br />
unter: www.ai.sri.com/~pkarp/xol (24.06.2002).<br />
KASHYAP, V.: Report on the „Interoperation, Integration, and Composition”<br />
track. In I. F. Cruz (Hrsg.): International Semantic Web Working Symposium<br />
(SWWS). Chicago, University of Illinois at Chicago: 2001; S. 24-<br />
27.<br />
Kent98 KENT, R.: Conceptual Knowledge Markup Language (Version 0.2). 1998.<br />
unter: www.ontologos.org/CKML/CKML%200.2html (24.06.2002).<br />
Kim02<br />
Klein+01<br />
Klein+02<br />
KIM, H.: Predicting how Ontologies for the Semantic Web will evolve. In:<br />
Communications of the ACM 45 (2), 2002: S. 48-54.<br />
KLEIN, M.; FENSEL, D.: Ontology Versioning on the Semantic Web. In:<br />
Proceedings of the First Semantic Web Working Symposium. California,<br />
USA: Stanford University 2001; S. 75-92.<br />
KLEIN, M. U. A.: Ontology versioning and change detection on the web. In:<br />
Proceedings of the 13th Conference on Knowledge Engineering and<br />
Knowledge Management (EKAW02). Siguenza (Spanien): 2002.
Literaturverzeichnis 99<br />
Koivunen+01<br />
Lassila+99<br />
Luke+00<br />
Maedche+01<br />
Maedche+02<br />
KOIVUNEN, M.-R.; MILLER, E.: W3C Semantic Web Activity. In: Proceedings<br />
of the Semantic Web Kick-off Seminar in Finland. Helsinki: 2001.<br />
unter: www.w3c.org/2001/12/semweb-fin/w3csw (25.09.2002).<br />
LASSILA, O.; SWICK, R. R.: Resource Description Framework (RDF) Model<br />
and Syntax Specification. W3C Recommendation: 1999.<br />
unter: www.w3.org/TR/REC-rdf-syntax/ (25.09.2002).<br />
LUKE, S.; HEFLIN, J.: SHOE 1.01 Proposed Specification. SHOE Project:<br />
2000.<br />
unter: www.ca.umd.edu/projects/plus/SHOE/spec1.01.html (24.06.2002).<br />
MAEDCHE, A.; STAAB, S.: Learning Ontologies for the Semantic Web. In:<br />
Proceedings of the Semantic Web Workshop. Hong Kong: 2001.<br />
MAEDCHE, A. U. A.: MAFRA – A MApping FRAmework for Distributed<br />
Ontologies in the Semantic Web. In: Proceedings of the Workshop on<br />
Knowledge Transformation for the Semantic Web at the 15 th European<br />
Conference on Artificial Intelligence ECAI02. Lyon (Frankreich): 2002; S.<br />
59-67.<br />
Manola+02 MANOLA, F.; MILLER, E.: RDF Primer. W3C Working Draft: 2002.<br />
unter: www.w3.org/TR/2002/WD-rdf-primer-20020319/ (25.09.2002).<br />
McGuiness+02<br />
Miller01<br />
Noy+99<br />
Noy+00<br />
Patel-Schneider+02<br />
Tuttle+01<br />
Uschold01<br />
Visser+00<br />
Wrobel+00<br />
MCGUINESS, D. L.; VAN HARMELEN, F.: Feature Synopsis for OWL Lite<br />
and OWL. W3C Working Draft: 2002.<br />
unter: www.w3.org/TR/2002/WD-owl-features-20020729/ (25.09.2002).<br />
MILLER, E.: The Semantic Web Activity Statement. W3C, 2001. letzter<br />
Update: 24.04.2002.<br />
unter: www.w3.org/2001/sw/Activity (25.09.2002).<br />
NOY, N. F.; MUSEN, M. A.: An Algorithm for Merging and Aligning Ontologies.<br />
Automation and Tool Support. In: Proceedings of the Workshop on<br />
Ontology Management at the 16 th National Conference on Artificial Intelligence<br />
(AAA-99). Orlando, Florida (USA): AAAI Press 1999.<br />
NOY, N. F.; MUSEN, M. A.: PROMPT. Algorithm and Tool for Automated<br />
Ontology Merging and Alignment. In: Proceedings of the 17 th National<br />
Conference on Artificial Intelligence (AAAI-2000). Menlo Park (California):<br />
AAAI/MIT Press 2000.<br />
PATEL-SCHNEIDER, P. F., HORROCKS, I.; VAN HARMELEN, F.: OWL Web<br />
Ontology Language 1.0. Abstract Syntax. W3C Working Draft: 2002.<br />
unter: www.w3.org/TR/2002/WD-owl-absyn-20020729/ (25.09.2002).<br />
TUTTLE, M. S.; MCGUINESS, D. L.: Report on the „Ontologies and Ontology<br />
Maintenance“ track. In I. F. Cruz (Hrsg.): International Semantic Web<br />
Working Symposium (SWWS). Chicago, University of Illinois at Chicago:<br />
2001; S. 21-23.<br />
USCHOLD, M.: Where is the Semantics in the Semantic Web? In: Proceedings<br />
of the Workshop on Ontologies in Agent Systems (OAS), 5th<br />
International Conference on Autonomous Agents, 2001.<br />
VISSER, U.; SCHUSTER, G.: Semantic Web Services. A Practical Solution.<br />
In: Proceedings of the Ontologies and Semantic Interoperability at the 15 th<br />
European Conference on Artificial Intelligence ECAI02. Lyon (Frankreich):<br />
2002.<br />
WROBEL, S.; MORIK, K.; JOACHIMS, T.: Maschinelles Lernen und Data<br />
Mining. In: (Görz+00a) Kapitel 14, S. 517-598.