04.11.2013 Aufrufe

vollständige Magisterarbeit zum Thema - Michael Stollberg

vollständige Magisterarbeit zum Thema - Michael Stollberg

vollständige Magisterarbeit zum Thema - Michael Stollberg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

<strong>Magisterarbeit</strong><br />

Ontologiebasierte Wissensmodellierung<br />

- Verwendung als semantischer Grundbaustein des Semantic Web -<br />

von<br />

<strong>Michael</strong> <strong>Stollberg</strong><br />

eingereicht am: 29. Oktober 2002<br />

Institut für Publizistik und Kommunikationswissenschaft<br />

Arbeitsbereich Informationswissenschaft<br />

Fachbereich Philosophie und Sozialwissenschaften<br />

Freie Universität Berlin<br />

Betreuer und Erstgutachter: Prof. Dr. R. D. Hennings<br />

Zweitgutachter: Prof. Dr. G. Wersig


Erklärung<br />

Hiermit versichere ich gemäß § 21 (6) der Magisterprüfungsordnung der Freien Universität<br />

Berlin vom 18.01.1991, dass ich die Arbeit in allen Teilen selbstständig verfasst<br />

und keine anderen als die angegebenen Hilfsmittel und Quellen verwendet habe. Stellen<br />

der Arbeit, die anderen Arbeiten im Wortlaut oder dem Sinne nach entnommen wurden,<br />

sind durch Angabe der entsprechenden Quelle kenntlich gemacht.<br />

__________________________<br />

Ort, Datum<br />

___________________________<br />

<strong>Michael</strong> <strong>Stollberg</strong>


Ontologiebasierte Wissensmodellierung<br />

- Verwendung als semantischer Grundbaustein des Semantic Web -<br />

Inhaltsverzeichnis:<br />

Vorwort ....................................................................................................... v<br />

Einleitung ................................................................................................... 1<br />

Zielsetzung der Arbeit .......................................................................................................................1<br />

Inhaltsübersicht ..................................................................................................................................3<br />

A Grundlagen ontologiebasierter Wissensmodellierung............................... 5<br />

A.1 Positionierung in der Künstlichen Intelligenz ........................................................................6<br />

A.1.1 Wissensrepräsentation..........................................................................................................7<br />

A.1.1.1 Theoretische Grundlagen............................................................................................7<br />

A.1.1.2 Repräsentationsschemata und -formalismen............................................................8<br />

A.1.1.3 Modellbasierter Ansatz ..............................................................................................11<br />

A.1.2 Knowledge Engineering ....................................................................................................12<br />

A.1.2.1 Wissensmodelle...........................................................................................................13<br />

A.1.2.1.1 Problem Solving Methods ..................................................................................14<br />

A.1.2.1.2 Ontologien ............................................................................................................14<br />

A.1.2.2 Methodologien............................................................................................................15<br />

A.1.2.2.1 CommonKADS ...................................................................................................15<br />

A.1.2.2.2 PROTÉGÉ...........................................................................................................16<br />

A.2 Charakteristika ontologiebasierter Wissensmodellierung....................................................18<br />

A.2.1 Eigenschaften von und Anforderungen an Ontologien ...............................................18<br />

A.2.1.1 Explizite, geteilte Konzeptionalisierung..................................................................18<br />

A.2.1.2 Formale Spezifikation ................................................................................................19<br />

A.2.2 Motivation zur Verwendung von Ontologien................................................................20<br />

A.2.2.1 Bedeutungsdefinition .................................................................................................20<br />

A.2.2.2 Einsatzmöglichkeiten.................................................................................................21<br />

A.2.3 Ergänzende Anmerkungen................................................................................................22<br />

B Ontologie-Entwicklung ......................................................................... 23<br />

B.1 Ontologie-Entwicklungs-Prozess ...........................................................................................24<br />

B.1.1 Spezifikation ........................................................................................................................26<br />

B.1.1.1 Anforderungsanalyse..................................................................................................27<br />

B.1.1.2 Wissensakquisition......................................................................................................27<br />

B.1.2 Konzeptionalisierung..........................................................................................................28<br />

B.1.2.1 Modellierungsprimitive ..............................................................................................29<br />

B.1.2.2 Zielsetzung der Konzeptionalisierung.....................................................................29<br />

B.1.2.3 Repräsentationsschemata...........................................................................................30<br />

i


B.1.3 Formalisierung.....................................................................................................................32<br />

B.1.3.1 Anforderungen an Ontologie-Spezifikations-Sprachen........................................33<br />

B.1.3.1.1 Spezifikationsfähigkeit.........................................................................................33<br />

B.1.3.1.2 Entwicklungsumgebung......................................................................................34<br />

B.1.3.2 Ontolingua...................................................................................................................35<br />

B.1.4 Evaluation und Dokumentation.......................................................................................36<br />

B.1.4.1 Evaluation....................................................................................................................36<br />

B.1.4.1.1 Kriterien der Qualitätsprüfung...........................................................................37<br />

B.1.4.1.2 Typische Fehler der Ontologie-Entwicklung...................................................37<br />

B.1.4.2 Dokumentation...........................................................................................................37<br />

B.2 Qualitätssichernde Aspekte......................................................................................................38<br />

B.2.1 Designkriterien ....................................................................................................................38<br />

B.2.2 Meta-Modellierung..............................................................................................................40<br />

B.2.2.1 Theoretische Grundlagen ..........................................................................................41<br />

B.2.2.1.1 Basisbegriffe..........................................................................................................42<br />

B.2.2.1.2 Implikationen........................................................................................................43<br />

B.2.2.2 Taxonomie-Validierung .............................................................................................44<br />

B.2.2.2.1 Basis-Taxonomie..................................................................................................44<br />

B.2.2.2.2 Vorgehensmodell .................................................................................................44<br />

B.3 Abschließende Bemerkungen..................................................................................................45<br />

C Verwendung von Ontologien in Informationssystemen.......................... 47<br />

C.1 Typologie des Ontologie-Einsatzes........................................................................................47<br />

C.1.1 Klassifikationsdimensionen...............................................................................................48<br />

C.1.1.1 Verwendungszweck....................................................................................................48<br />

C.1.1.2 Rolle der Ontologie....................................................................................................49<br />

C.1.1.3 Akteure.........................................................................................................................50<br />

C.1.2 Verwendungsszenarien.......................................................................................................51<br />

C.2 Anwendungsgebiete von Ontologien.....................................................................................52<br />

C.2.1 Multi-Agenten-Systeme......................................................................................................53<br />

C.2.1.1 Kommunikation in Multi-Agenten-Systemen ........................................................54<br />

C.2.1.2 Geteilte Ontologie als Inhaltsspezifikation.............................................................55<br />

C.2.2 Informationsintegration.....................................................................................................56<br />

C.2.2.1 Integration mit einer globalen Ontologie................................................................57<br />

C.2.2.2 Integration mit mehreren lokalen Ontologien .......................................................58<br />

C.2.3 Information Retrieval.........................................................................................................59<br />

C.2.3.1 Ontologiebasiertes Information Retrieval...............................................................59<br />

C.2.3.1.1 Ontologie als Thesaurus......................................................................................60<br />

C.2.3.1.2 ONTOSEEK........................................................................................................60<br />

C.3 Implikationen für Ontologiebasierte Informationssysteme................................................61<br />

C.3.1 Wiederverwendbarkeit .......................................................................................................62<br />

C.3.1.1 Verwendbarkeit und Wiederverwendbarkeit..........................................................62<br />

C.3.1.2 Wiederverwendung von Ontologien........................................................................63<br />

C.3.2 Integration von Ontologien ..............................................................................................64<br />

C.3.2.1 Klassifikation ontologischer Heterogenitäten ........................................................64<br />

C.3.2.2 Halbautomatisierte Ontologie-Integration..............................................................65<br />

ii


D Ontologien im Semantic Web ................................................................ 66<br />

D.1 Aufbau und Funktionsweise des Semantic Web..................................................................67<br />

D.1.1 Hintergrund der ´Vision des Semantic Web´.................................................................67<br />

D.1.1.1 Das Internet als universale Informationsplattform...............................................68<br />

D.1.1.2 Design-Prinzipien.......................................................................................................68<br />

D.1.1.3 Funktionale Zielsetzung des Semantic Web ..........................................................69<br />

D.1.2 Architekturmodell ..............................................................................................................70<br />

D.1.2.1 Semantic Web – Technologien ................................................................................70<br />

D.1.2.2 Rolle von Ontologien im Semantic Web................................................................72<br />

D.1.2.2.1 Anforderungen an Ontologien..........................................................................73<br />

D.1.2.2.2 Herausforderungen an das Ontologie-Management......................................74<br />

D.2 Ontologie-Spezifikation für das Semantic Web...................................................................74<br />

D.2.1 Resource Description Framework (RDF) ......................................................................75<br />

D.2.1.1 RDF Modell................................................................................................................75<br />

D.2.1.2 XML - Serialisierung..................................................................................................76<br />

D.2.1.3 RDF Schema (RDFS)................................................................................................76<br />

D.2.2 Ontologie-Spezifikations-Sprachen .................................................................................77<br />

D.2.2.1 Web Ontology Language (OWL) ............................................................................78<br />

D.2.2.2 Ausdrucksfähigkeit.....................................................................................................79<br />

D.3 Ontologie-Management...........................................................................................................80<br />

D.3.1 Teilbarkeit von Ontologien...............................................................................................80<br />

D.3.2 Entwicklungsfähigkeit von Ontologien ..........................................................................82<br />

D.3.2.1 Unterstützung der Ontologie-Entwicklung............................................................82<br />

D.3.2.2 Wartung von Ontologien..........................................................................................84<br />

D.3.3 Ontologie-Integration........................................................................................................85<br />

D.4 Implikationen für Semantic Web Services............................................................................87<br />

Diskussion ................................................................................................ 89<br />

Zusammenfassung der Ergebnisse ................................................................................................89<br />

Notwendigkeit und Umsetzbarkeit des Semantic Web ..............................................................90<br />

Literaturverzeichnis ...................................................................................91<br />

iii


Abbildungsverzeichnis<br />

Abbildung 1: Beispiel eines semantischen Netzes........................................................................9<br />

Abbildung 2: Beispiel Frame-Struktur............................................................................................10<br />

Abbildung 3: CommonKADS – Modell Kollektion...................................................................15<br />

Abbildung 4: CommonKADS – Modellierung Domänenwissen.............................................16<br />

Abbildung 5: PROTÉGÉ – Erstellung einer Applikationsontologie........................................17<br />

Abbildung 6: Beispiel IDEF5-Modellierung .................................................................................32<br />

Abbildung 7: Konzeptdefinition in Ontolingua ...........................................................................35<br />

Abbildung 8: Taxonomie-Evaluation mit OntoClean .................................................................45<br />

Abbildung 9: Klassifikation der Verwendung von Ontologien in Informationssystemen.....51<br />

Abbildung 10: Bespiel einer KQML-Nachricht............................................................................55<br />

Abbildung 11: Ansätze ontologiebasierter Informationsintegration .........................................57<br />

Abbildung 12: Semantic Web Architektur.....................................................................................70<br />

Abbildung 13: RDF-Aussage in Graphdarstellung ......................................................................75<br />

Abbildung 14: RDF-Aussage in XML-Serialisierung...................................................................76<br />

Abbildung 15: Ontologie-Beispiel in DAML-OIL.......................................................................78<br />

Abbildung 16: Phasen des Ontology Learning .............................................................................83<br />

Tabellenverzeichnis<br />

Tabelle 1: Level der Wissensrepräsentation...................................................................................19<br />

Tabelle 2: Phasen des Ontologie-Entwicklungs-Prozesses.........................................................26<br />

Tabelle 3: Techniken des Wissenserwerbs.....................................................................................27<br />

Tabelle 4: Modellierungsprimitive ontologiebasierter Wissensmodellierung ...........................29<br />

Tabelle 5: Werkzeuge einer Ontologie-Entwicklungsumgebung...............................................34<br />

Tabelle 6: Typische Fehler bei der Ontologie-Entwicklung .......................................................37<br />

Tabelle 7: Design-Kriterien für Ontologien..................................................................................39<br />

Tabelle 8: Basisbegriffe der OntoClean Methodologie................................................................42<br />

Tabelle 9: Beschränkungen für Subsumptions-Relationen in Taxonomien .............................43<br />

Tabelle 10: Ontologie-Arten............................................................................................................50<br />

Tabelle 11: Prozess der Wiederverwendung von Ontologien ....................................................63<br />

Tabelle 12: Design-Prinzipien des Semantic Web........................................................................69<br />

Tabelle 13: Grundtypen von RDF Schema (RDFS)....................................................................77<br />

Tabelle 14: Spezifikationsprimitive von OWL..............................................................................79<br />

Tabelle 15: Anforderungen an Ontologie-Bibliotheks-Systeme.................................................81<br />

iv


Vorwort<br />

Vor Beginn der Ausführungen sollen einige Bemerkungen über die in dieser Arbeit<br />

verwandten darstellerischen Mittel gemacht werden.<br />

Für die Quellenangaben und die Zitation wird jeweils der Name des Autors sowie das<br />

Erscheinungsjahr angegeben. Ein „+“ in der Angabe bedeutet, dass mehrere Autoren die<br />

Quelle verfasst haben. Falls mehrere Quellen desselben Autors so eine gleiche Signatur<br />

erhalten, werden diese durch einen alphabetisch Anhang gemäß der Erwähnung im Text<br />

unterschieden. Bei Websites werden die Internetadressen sowie das Datum des Aufrufes<br />

der Seite angegeben. Bei Quellenangaben aus Büchern oder Artikeln wird jeweils die Seite<br />

angegeben, während für Websites lediglich der betreffende Abschnitt des Dokuments<br />

angegeben werden kann. Durch diese Konvention sollen die wesentlichen Informationen<br />

bezüglich der verwandten Quellen aus dem Text der Ausarbeitung hervorgehen. Die<br />

Methodik der Quellenangabe im Literaturverzeichnis ist (Rückriem+97) entnommen. Die<br />

Quellenangaben im Literaturverzeichnis sind auf Grund des Umfangs nach den Kapiteln<br />

der Arbeit geordnet. Dabei sind für die einzelnen Kapitel nur diejenigen Quellen angegeben,<br />

die jeweils für ein Kapitel hinzugekommen sind. Weiterführende, nicht explizit in<br />

der Arbeit verwendete Quellenhinweise werden in Fußnoten angeführt.<br />

Der Großteil der verwendeten Literatur ist in englischer Sprache verfasst. Für die<br />

Darstellung in deutscher Sprache wurden hier folgende Konventionen verwendet.<br />

• Eigennamen und Termini Technici werden im englischen Original belassen.<br />

• Weitere Begrifflichkeiten werden in deutsch angegeben. Sind diese nicht deutschsprachiger<br />

Fachliteratur entnommen, so wird in einer Fußnote das englische Original<br />

angegeben.<br />

• Direkte Zitate aus dem Englischen werden ins Deutsche übersetzt mit Angabe des<br />

Originals in einer Fußnote.<br />

Während des Bearbeitungszeitraums dieser <strong>Magisterarbeit</strong> sind reichhaltige Forschungsaktivitäten<br />

vor allem auf dem Gebiet des Semantic Web zu erwarten, woraus entscheidende<br />

neue Erkenntnisse hervorgehen können. Auf Grund der zeitlichen Befristung der<br />

Bearbeitung musste ein Aufnahmestopp für neu erscheinendes Material festgelegt werden,<br />

welcher auf Ende Juli 2002 datiert wurde. Diese Festlegung wird im Verlauf der Ausarbeitungen<br />

genauer begründet. Auf später erscheinendes Material kann lediglich an entsprechender<br />

Stelle hingewiesen werden .<br />

Als Anlage ist der Arbeit eine CD-ROM mit den verwendeten Materialien angefügt –<br />

soweit diese in elektronischer Form vorliegen. Nach Absprache mit dem Betreuer soll<br />

diese Zusammenstellung als Referenz für weitere Arbeiten auf diesem Gebiet genutzt<br />

werden können.<br />

v


Einleitung 1<br />

Einleitung<br />

Die Geschwister Lucy und Pete organisieren mit Hilfe ihrer „Semantic Web Agents“<br />

(Berners-Lee+01, S. 25) einen Arzttermin für ihre Mutter. Die Agenten buchen automatisch<br />

den Termin, berücksichtigen angegebene Einschränkungen und Präferenzen und<br />

interagieren dabei in effektiver Art und Weise. Mit diesem Szenario, welches zu Beginn<br />

des häufig als „vision of the semantic web“ (vgl. Fensel01, S. 295) referenzierten Artikels<br />

beschrieben wird, soll das angestrebte Anwendungsziel eines semantischen Internets<br />

verdeutlicht werden. Im weiteren Verlauf des Artikels erläutern die Autoren um Tim<br />

Berners-Lee, Erfinder des World Wide Web 1 und Direktor des W3C 2 , ihre Vorstellungen<br />

zur Realisierung dieser Vision, welche hier kurz wiedergegeben werden soll.<br />

Die derzeit existenten Web-Technologien erlauben lediglich die Verarbeitung von<br />

Daten. Deren Interpretation, also die inhaltliche Erfassung von Web-Dokumenten kann<br />

nur durch den Menschen erfolgen. Mit dem Semantic Web sollen die bestehenden Web-<br />

Technologien um bedeutungsverarbeitende Fähigkeiten erweitert werden, wodurch eine<br />

maschinelle Inhaltsverarbeitung von Web-Dokumenten ermöglicht und somit eine qualitative<br />

Verbesserung des Internet als weltweit verbreitetem Informationssystem erreicht<br />

werden soll. Dafür müssen wissensverarbeitende Techniken für das Internet entwickelt<br />

werden, welche vornehmlich drei funktionale Aspekte abdecken sollen. Erstens eine<br />

maschinenverarbeitbare Darstellung der Informationen eines Web-Dokuments, zweitens<br />

die Sicherstellung der korrekten Verwendung von Begriffen hinsichtlich ihrer Bedeutung<br />

und drittens entsprechende Verarbeitungsmechanismen. Da die Künstlichen Intelligenz<br />

sich mit solchen Verfahren beschäftigt, sollen deren Erkenntnisse für die Entwicklung<br />

derartiger Techniken für das Semantic Web herangezogen werden. Für die maschinenverarbeitbare<br />

Darstellung bedeutungstragender Informationen sollen Ansätze aus dem<br />

Gebiet der Wissensrepräsentation referenziert werden. Für die Sicherstellung der<br />

terminologischen Korrektheit sollen sogenannte Ontologien verwendet werden, welche<br />

Bedeutungsdefinitionen von Entitäten sowie deren Beziehungen untereinander beinhalten.<br />

Die Verarbeitung dieser Informationen soll durch Softwareagenten durchgeführt<br />

werden, welche unter Nutzung der bedeutungsverarbeitenden Fähigkeiten verschiedenartige<br />

Funktionalitäten, beispielsweise Dienste wie im oben genannten Anwendungsszenario<br />

ausführen können (s. Berners-Lee+01, S. 26-30).<br />

Zielsetzung der Arbeit<br />

Wie aus der einführenden Darstellung der Vision des Semantic Web hervorgeht, sollen<br />

darin Ontologien als bedeutungsdefinierende Komponenten eingesetzt werden und somit<br />

den semantischen Grundbaustein des Semantic Web darstellen. In dieser Arbeit sollen die<br />

Beweggründe der Favorisierung ontologiebasierter Verfahren der Wissensmodellierung<br />

für diesen Verwendungszweck untersucht werden.<br />

1 World Wide Web (WWW): Zusammenführung und Weiterentwicklung existenter Ansätze aus der Hypertext- und<br />

der Übertragungstechnologie. Technische Grundlage des als Internet bekannt gewordenen Mediums (vgl. Berners-<br />

Lee00).<br />

2 World Wide Web Consortium: Non-Profit-Organisation mit der Zielsetzung, die Entwicklung des WWW durch<br />

Spezifikation von Technologien zu unterstützen (s. Berners-Lee00, S. 97-110, www.w3c.org).


Einleitung 2<br />

Auf Grund der rasanten Verbreitung des Internets beschäftigen sich derzeit viele<br />

Forschergruppen mit der Entwicklung von Technologien für das Semantic Web, da<br />

dadurch ein weiterer Wachstumsschub des Internet hinsichtlich seiner Verbreitung<br />

prognostiziert wird (s. Ohlms02, S. 8). Die Arbeiten in der „Semantic Web Community“ 3<br />

befassen sich größtenteils mit der softwaretechnischen Umsetzung, wobei vor allem<br />

Spezifikationssprachen für Ontologien, Techniken für das Ontologie-Management sowie<br />

Frameworks für Semantic Web Services entwickelt werden. 4 Bemerkenswert ist, dass in<br />

diesen Ansätzen Ontologien zwar eine zentrale Rolle in systemarchitektonischer oder<br />

funktionaler Hinsicht einnehmen, aber selten auf deren Spezifika eingegangen wird.<br />

Die Forschungsdisziplin des sogenannten Ontology Engineering befasst sich seit Mitte<br />

der 90er Jahre mit Ontologien als konzeptioneller Basis ´wissensverarbeitender´ Computersysteme.<br />

Dieses Themenfeld ist sehr komplex, da eine Ontologie <strong>zum</strong> einen die<br />

strukturierte Erfassung einer Wissensdomäne darstellen soll, die durch alle Beteiligten<br />

derselben akzeptiert wird. Zum anderen ist die definitorische Klarheit der Wissenselemente<br />

und ihrer Beziehungen untereinander in der Ontologie sehr wichtig, da die<br />

Verwendung der Ontologie in einem Informationssystem dessen funktionale Qualität<br />

determiniert. Die Zielsetzung des Ontology Engineering ist die Entwicklung ingenieursartiger<br />

Methodologien zur Erstellung von Ontologien – ähnlich der des Software<br />

Engineering für die Entwicklung von Software-Systemen (vgl. Gómez-Pérez99).<br />

Das Ziel dieser Arbeit besteht in der Erfassung der wesentlichen Charakteristika von<br />

Ontologien für eine differenzierte Betrachtung der Verwendung derselben im Semantic<br />

Web. Zunächst sollen die relevanten Erkenntnisse des Ontology Engineering erörtert<br />

werden, wobei erstens die Spezifika von Ontologien als Technik zur Wissensmodellierung,<br />

zweitens Verfahren zur Entwicklung von Ontologien und drittens deren<br />

Verwendung in Informationssystemen besprochen werden. Auf dieser Grundlage kann<br />

hinsichtlich der Verwendung von Ontologien im Semantic Web herausgearbeitet werden,<br />

welche Rolle sie darin übernehmen sollen und in wieweit die entsprechenden Verfahren<br />

des Ontology Engineering für eine derartige Verwendung ausgereift sind.<br />

Der Fokus liegt dabei auf der sorgfältigen Erarbeitung eines Verständnisses ontologiebasierter<br />

Wissensmodellierung, da die Untersuchung der Verwendung von Ontologien im<br />

Semantic Web lediglich auf der Grundlage eines solchen gründlichen Verständnisses<br />

möglich erscheint. Dabei liegen die Erkenntnisse über diese Modellierungstechnik bisher<br />

lediglich in relativ unstrukturierter Form vor, so dass mit deren Zusammentragung in<br />

dieser Arbeit ein Beitrag <strong>zum</strong> Verständnis ontologiebasierter Wissensmodellierung geleistet<br />

werden soll. Auf Grund dieser Herangehensweise konzentriert sich die Untersuchung<br />

auf theoretische Aspekte und verfolgt kein konkretes Anwendungsbeispiel. Eine<br />

detaillierte Beschreibung des Aufbaus der Arbeit wird in der folgenden Inhaltsübersicht<br />

gegeben.<br />

3 Das „Semantic Web Community Portal“ ist eine erschöpfende Referenz dieser Gemeinde, auf dem Forschungsprojekte<br />

zusammengetragen werden. Das Portal findet sich unter: www.SemanticWeb.org (08.06.2002).<br />

4 Arbeiten zu diesen Schwerpunkten wurden auf dem ersten „Semantic Web Working Symposium“ vorgestellt (vgl.<br />

Cruz+01).


Einleitung 3<br />

Inhaltsübersicht<br />

Die vorgestellte Zielsetzung bedingt eine Aufteilung dieser Arbeit in einen Teil zur<br />

theoretischen Erfassung von Wissensmodellierung mittels Ontologien und einen Teil zur<br />

Untersuchung der Verwendung derselben im Semantic Web. In den Kapiteln A bis C<br />

wird jeweils ein Schwerpunkt zur Erfassung der Charakteristika ontologiebasierter Wissensmodellierung<br />

erarbeitet, so dass diese Kapitel den ersten Teil darstellen. In Kapitel D<br />

wird aufbauend darauf die Verwendung im Semantic Web als zweiter Teil bearbeitet. Im<br />

Folgenden werden die Schwerpunkte sowie die behandelten Aspekte der einzelnen<br />

Kapitel kurz vorgestellt.<br />

In Kapitel A werden die Grundlagen von Ontologien als Verfahren der Wissensmodellierung<br />

erarbeitet. Dazu wird zunächst die definitorische Erfassung von Ontologien<br />

erläutert. Zur Erlangung eines fundierten Verständnisses von Wissensmodellierung und<br />

der Besonderheiten ontologiebasierter Verfahren ist die Eingliederung dieser in den<br />

relevanten wissenschaftlichen Kontext erforderlich. Die in diesem Zusammenhang betrachtete<br />

Art der Wissensmodellierung dient vornehmlich als konzeptionelle Grundlage<br />

für die Erstellung wissensverarbeitender Computersysteme. Die Entwicklung derartiger<br />

Systeme ist das Hauptanliegen der Künstlichen Intelligenz, weshalb eine Positionierung<br />

ontologiebasierter Verfahren in derselben vorgenommen wird. Dabei sind vor allem jene<br />

Ansätze interessant, auf denen ontologiebasierte Verfahren aufbauen. Zunächst werden<br />

daher die grundlegenden theoretischen Aspekte der Wissensrepräsentation erläutert und<br />

anschließend daran die Bedeutung von Ontologien im Knowledge Engineering aufgezeigt,<br />

um den Verwendungskontext derartiger Verfahren der Wissensmodellierung zu verdeutlichen.<br />

Aufbauend darauf werden die spezifischen Eigenschaften ontologiebasierter Verfahren<br />

der Wissensmodellierung erörtert, wodurch ein grundlegendes Verständnis dieser<br />

Methodik erreicht werden soll.<br />

Der in Kapitel B behandelte Schwerpunkt ist die Ontologie-Entwicklung. Nach der<br />

Erfassung der grundlegenden Charakteristika ontologiebasierter Wissensmodellierung<br />

stehen hier die Anforderungen bei der Erstellung einer Ontologie im Vordergrund. Dazu<br />

werden die wesentlichen diesbezüglichen Errungenschaften des sogenannten Ontology<br />

Engineering erörtert. Es werden zunächst methodologische Ansätze für den Entwicklungsprozess<br />

von Ontologien sowie für die einzelnen Aufgabengebiete entwickelter Techniken<br />

und Verfahren vorgestellt. Anschließend daran werden Design-Kriterien und ein<br />

Ansatz zur Meta-Modellierung besprochen, welche der Qualitätssicherung einer Ontologie<br />

dienen sollen. Diese Betrachtungen sollen eine Übersicht über den Erkenntnisstand<br />

des Ontology Engineering geben, womit ein wesentlicher Aspekt zur Nutzung ontologiebasierter<br />

Verfahren der Wissensmodellierung im Semantic Web abgedeckt wird.<br />

Als letzter Aspekt zur Erfassung der Charakteristika ontologiebasierter Wissensmodellierung<br />

wird in Kapitel C die Fragestellung bearbeitet, wie Ontologien in Informationssystemen<br />

eingesetzt werden können. Dazu werden zunächst die Verwendungsmöglichkeiten<br />

von Ontologien identifiziert. Dann werden Anwendungsgebiete von<br />

Ontologien vorgestellt, welche <strong>zum</strong> einen Beispiele für die aufgefundenen Einsatzmöglichkeiten<br />

darstellen und <strong>zum</strong> anderen im Hinblick auf die Untersuchung der Verwen-


Einleitung 4<br />

dung von Ontologien im Semantic Web grundlegende Aspekte desselben erörtern sollen.<br />

Im Anschluss daran werden die wesentlichen softwaretechnischen Herausforderungen<br />

besprochen, die sich durch die Verwendung von Ontologien in Informationssystemen<br />

ergeben. Damit wird die Erarbeitung der wesentlichen Charakteristika ontologiebasierter<br />

Verfahren der Wissensmodellierung als erstem Teil dieser Arbeit abgeschlossen.<br />

Basierend auf diesen Abhandlungen wird in Kapitel D die Verwendung von Ontologien<br />

im Semantic Web behandelt. Dabei ist das Semantic Web nicht als computergestützte<br />

Lösung für ein konkretes Anwendungsgebiet zu verstehen, sondern – ähnlich<br />

wie existente Web-Technologien – als eine informationstechnische Infrastruktur zur<br />

Bereitstellung und Verknüpfung von Applikationen für verschiedene Anwendungsgebiete.<br />

Die technologischen Lösungen zur Umsetzung des Semantic Web befinden sich<br />

noch in der Entwicklungsphase. Daher werden zunächst die grundlegenden Ideen der<br />

Vision des Semantic Web genauer erläutert und das antizipierte Architekturmodell zur<br />

Realisierung derselben vorgestellt, wobei insbesondere die darin angestrebte Rolle von<br />

Ontologien herausgearbeitet wird. Anschließend daran wird die formale Darstellung von<br />

Ontologien durch web-kompatible Sprachen erörtert, wodurch die Verwendung von<br />

Ontologien im Semantic Web ermöglicht werden soll. In diesem Zusammenhang sollen<br />

ferner die Beweggründe für die Verwendung von Ontologien als bedeutungsdefinierende<br />

Konstrukte im Semantic Web verdeutlicht sowie die auftretenden Herausforderungen<br />

hinsichtlich der Handhabung von Ontologien aufgezeigt werden. Dazu werden als dritter<br />

Aspekt des Kapitels entsprechende Lösungsansätze des Ontologie-Managements diskutiert.<br />

Abschließend wird auf die Implikationen für konkrete Anwendungen der Semantic<br />

Web – Technologien eingegangen, die aus der Verwendung von Ontologien im Semantic<br />

Web resultieren.<br />

Zum Abschluss der Ausführungen werden die Ergebnisse der Untersuchung<br />

zusammengefasst. Dabei soll auch eine kritische Betrachtung bezüglich der Notwendigkeit<br />

semantischer Web-Technologien sowie der Realisierbarkeit der Vision des Semantic<br />

Web vorgenommen werden.


Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 5<br />

A Grundlagen ontologiebasierter Wissensmodellierung<br />

Die als Ontologie bezeichnete philosophische Disziplin, die ´Lehre des Seins´, beschäftigt<br />

sich unter der Annahme, dass „ ... ein Allgemeines das bestimmende und gestaltgebende<br />

Innere der Dinge sei.“ (Störig63, S. 512ff) mit der objektiven Erfassung von Gegenständen,<br />

deren Eigenschaften und deren Beziehungen untereinander. Dieser Begriff 5<br />

wurde als Bezeichnung für ein Verfahren der Wissensmodellierung übernommen, in dem<br />

ebenfalls die Erfassung von Entitäten und deren Beziehungen untereinander in einem<br />

bestimmten Weltausschnitt verfolgt wird. Im Folgenden sollen die grundlegenden Charakteristika<br />

ontologiebasierter Verfahren der Wissensmodellierung herausgearbeitet werden.<br />

In den relevanten informatorischen Forschungsfeldern existiert eine Vielzahl unterschiedlicher<br />

definitorischer Erfassungen einer Ontologie als Mittel der Wissensmodellierung,<br />

wobei die Definition als „formale, explizite Spezifikation einer geteilten<br />

Konzeptualisierung 6 “ die am weitesten verbreitete und akzeptierte ist. Dabei wird unter<br />

´Konzeptualisierung´ die Identifikation von Entitäten – in diesem Zusammenhang als<br />

Konzepte bezeichnet – und deren Beziehungen untereinander in einer Wissensdomäne<br />

verstanden. Die Anforderung der ´geteilten´ Konzeptualisierung bedeutet, dass diese<br />

durch die beteiligten Akteure der entsprechenden Wissensdomäne gleichermaßen<br />

akzeptiert wird. Eine ´Spezifikation´ ist eine strukturierte, mittels einer spezifischen<br />

Methodik notierte Darstellung einer solchen geteilten Konzeptualisierung. ´Explizit´<br />

bezieht sich in diesem Zusammenhang auf ein eindeutige Bedeutungsdefinition der<br />

Bestandteile einer Ontologie, wodurch inhaltliche Missverständnisse und Mehrfachinterpretationen<br />

minimiert werden sollen. Die ´formale´ Darstellungsforderung besagt in<br />

einem sehr weit gefassten Sinn, dass eine Ontologie in einer maschinenverarbeitbaren<br />

Sprache definiert sein soll (s. Puppe+00, S. 622).<br />

Diese Definition ist <strong>zum</strong> einen ziemlich allgemein gehalten und <strong>zum</strong> anderen nicht<br />

nachvollziehbar, solange der entsprechende Kontext nicht bekannt ist. Diesen stellen<br />

Ansätze der Wissensmodellierung dar, die vornehmlich der Konstruktion computergestützter<br />

Informationssysteme zur Bearbeitung wissensintensiver Aufgaben, sogenannter<br />

„Wissenssysteme 7 “, dienen. Die Entwicklung derartiger Systeme ist ein Hauptanliegen der<br />

Künstlichen Intelligenz (KI), weswegen deren Grundlagen hier zur Schaffung des benötigten<br />

Hintergrundverständnisses ontologiebasierter Wissensmodellierung herangezogen<br />

werden sollen. Dazu wird im Folgenden zunächst eine Positionierung ontologiebasierter<br />

Verfahren der Wissensmodellierung innerhalb der KI vorgenommen und auf dieser Basis<br />

anschließend die wesentlichen Charakteristika von Ontologien zusammengetragen. In den<br />

weiteren Ausführungen werden die Bezüge zu anderen Wissenschaftsdisziplinen vor allem<br />

aus dem Bereich des Software Engineering und der Informationswissenschaft aufgezeigt.<br />

5 In der englischsprachigen Fachliteratur wird die Unterscheidung des Begriff mittels einer orthographischen<br />

Konvention erhalten: „Ontology“ mit großen Anfangsbuchstaben referenziert den philosophische Begriff, „ontology“<br />

klein geschrieben bezieht sich auf den informatorischen (vgl. Guarino98, S. 2).<br />

6 „An ontology is a formal, explicit specification of a shared conceptualisation.” (Fensel00, S.8: erweitert nach<br />

Gruber93, S.2).<br />

7 engl.: „Knowledge Systems“ (Schreiber+00, S. 6).


Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 6<br />

A.1 Positionierung in der Künstlichen Intelligenz<br />

Abgesehen von den unterschiedlichen Auffassungen bezüglich der Zielsetzung und des<br />

Erfolgspotenzials der KI innerhalb ihrer verschiedenen Forschungsströmungen stellt das<br />

Verstehen menschlicher Intelligenz mittels der Konstruktion intelligenter Maschinen das<br />

grundlegende Erkenntnisinteresse der KI-Forschung dar (s. Görz+00b, S. 4; McCarthy<br />

00). Derartige Systeme „ ... verhalten sich (...) für den Betrachter so, als ob sie Intelligenz<br />

besäßen.“ (Duden93, S. 364), indem sie intelligentes Verhalten zu simulieren versuchen.<br />

Obwohl ein derartiges Forschungsinteresse in der westlichen Geistes- und<br />

Wissenschaftstradition seit der Antike existiert (s. Luger01, S. 25-29), wird der Beginn der<br />

modernen KI-Forschung an den Anfang der 1950er Jahre datiert. Ein wesentliches<br />

Kriterium dabei ist, dass die Forschungsarbeiten sich zu diesem Zeitpunkt auf die Entwicklung<br />

intelligenter Computersysteme zu konzentrieren beginnen (s. McCarthy+69, S.<br />

2ff.).<br />

Ein wichtiges Ereignis in der Entwicklung der modernen KI ist eine Konferenz am<br />

Dartmouth College im Jahre 1956. Ziel dieser Konferenz war die Untersuchung der<br />

Struktur von Information und Problemlöseprozessen unter der Prämisse, jede Eigenschaft<br />

von Intelligenz sei derart beschreibbar, dass sie mit einer Maschine simuliert<br />

werden könne. Zur Umsetzung einer solchen Beschreibung sollten entsprechende Techniken<br />

zur Erzeugung und Manipulation von Symbolstrukturen entwickelt werden. Zur<br />

Verarbeitung dieser abstrahierten Darstellungen sollten computergestützte Systeme<br />

dienen, da sie den großen Bedarf an Rechenleistung und ausreichende Flexibilität für die<br />

durchzuführenden Experimente boten. (vgl. McCarthy+55). Diese Zielsetzung determiniert<br />

die Forschung bis heute, weshalb diese Konferenz als „ ... Gründungsereignis der<br />

Künstlichen Intelligenz gewertet ... “ (Görz+00b, S. 3) wird.<br />

Wesentlich ist der spezifische Intelligenzbegriff, mit dem die KI operiert. Es wird<br />

davon ausgegangen, dass Räsonieren eine konstitutive Fähigkeit höherer Intelligenz ist.<br />

Diese tritt vor allem im Zusammenhang des Problemlösens auf, wobei der Rückgriff auf<br />

Wissen über die Welt eine entscheidende Rolle spielt – z.B. bei der Wahl der besten<br />

Handlungsalternative als Folge eines Denkprozesses (s. Görz+00b, S. 1-2). Um derartige<br />

Fähigkeiten in einem formalen System (s. Hofstadter01, S. 37-45) darstellen zu können,<br />

müssen sie operationalisierbar sein. Somit sei die Art der durch KI-Methoden erfassbaren<br />

Intelligenz auf schematische, nicht-personelle Fähigkeiten des intelligenten Operierens<br />

beschränkt (vgl. Görz+00b, S. 1-2). 8 Eine Erweiterung des Intelligenzbegriffs in der KI<br />

wurde durch die Betrachtung sozialer Systeme erreicht. Dabei wird Intelligenz erst durch<br />

die Interaktion einer Vielzahl von relativ einfachen Individuen, bzw. Agenten erzeugt.<br />

Diese Sichtweise bedeutet für die KI, dass nicht allein die logische Problemlösefähigkeit<br />

das Ziel von KI-Technologien darstellt, sondern die Konstruktion von Systemen mit<br />

interagierenden Agenten (s. Luger, S. 37).<br />

8 Bezüglich der Operationalisierbarkeit von Intelligenz und somit der möglichen Simulation durch KI-Techniken<br />

herrschen widersprüchliche Auffassungen. Die Vertreter der „starken KI-These“ behaupten, dass menschliche<br />

Intelligenz reine Berechungsoperationen seien und somit jeder Aspekt von Intelligenz operationalisierbar ist, während<br />

in der „schwachen KI-These“ die operationalisierbare Informationsverarbeitung als lediglich ein Aspekt von vielen<br />

der Intelligenz betrachtet wird (s. Görz+00b, S. 2; Luger01, S. 32-35).


Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 7<br />

Görz und Wachsmuth unterteilen die Entwicklung der Künstlichen Intelligenz in vier<br />

Phasen: In der ersten Phase stand die Frage nach der generellen technischen Umsetzbarkeit<br />

der Simulation intelligenten Verhaltens im Vordergrund, wie in der Darstellung<br />

der Dartmouth-Konferenz beschrieben (s.o.). Die zweite Phase ist durch die Einrichtung<br />

von KI-Forschungsgruppen charakterisiert, in denen die auftretenden Fragestellungen<br />

systematisch erarbeitet werden sollten. Als dritte Phase wird die Entwicklung von<br />

Roboter- und Problemlösesystemen in den 1970er Jahren aufgefasst, in der vor allem in<br />

den Bereichen der Wissensrepräsentation und Systemarchitektur intelligenter Systeme<br />

Fortschritte erzielt wurden. Die vierte Phase wird durch die umfassende Mathematisierung<br />

des Gebiets und die Entwicklung neuartiger Ansätze hin zu verteilten und<br />

situierten KI-Lösungen charakterisiert. Seit Anfang der 1990er Jahre wird eine Tendenz<br />

hin zu integrierten Ansätzen – vor allem im Zusammenhang mit Internettechnologien –,<br />

sowie ein Paradigmenwechsel hin zu dezentralisierten Systemen mit einfachen interagierenden<br />

Agenten beobachtet (s. Görz+00b, S. 4-5,12).<br />

Aus den Forschungsaktivitäten der Künstlichen Intelligenz haben sich eine Vielzahl<br />

unterschiedlicher Disziplinen entwickelt. Im Folgenden sollen die für den hier betrachteten<br />

Untersuchungsgegenstand relevanten Gebiete der Wissensrepräsentation und des<br />

Knowledge Engineering vorgestellt werden. Ersteres bildet den theoretischen Hintergrund<br />

ontologiebasierter Verfahren der Wissensmodellierung und letzteres stellt den Forschungskontext<br />

dar, aus dem Ontologien als Mittel der Wissensmodellierung hervorgegangen<br />

sind.<br />

A.1.1 Wissensrepräsentation<br />

Die Wissensrepräsentation befasst sich mit der Erstellung von Repräsentationsschemata<br />

für Wissensstrukturen, deren formalisierter Darstellung sowie mit Manipulationswerkzeugen<br />

zur automatisierten Bearbeitung derselben. Die dabei erworbenen Erkenntnisse<br />

dienen als Grundlagentechnologie für intelligente Systeme, weshalb dieses Forschungsfeld<br />

eine Kerndisziplin der Künstlichen Intelligenz darstellt. Darin wurden unter anderem Verfahren<br />

der Wissensmodellierung entwickelt, welche die Basis ontologiebasierter Wissensmodellierung<br />

darstellen. Daher sollen hier die theoretischen Grundlagen sowie die<br />

wesentlichen Lösungsansätze als Ausgangspunkt für die Erarbeitung eines grundlegenden<br />

Verständnisses ontologiebasierter Wissensmodellierung erläutert werden.<br />

A.1.1.1 Theoretische Grundlagen<br />

Die Verfahren der Wissensrepräsentation basieren auf der sogenannten Symbolsystemhypothese,<br />

welche im Zuge der oben genannten Dartmouth-Konferenz formuliert und in<br />

der Folgezeit weiter ausgearbeitet wurde. 9 Diese besagt, dass „ ... Intelligenzphänomene<br />

allein auf der Basis von Symbolverarbeitung ...“ (s. Görz+00b, S. 6) simulierbar seien.<br />

Dies impliziere, dass zur Entwicklung intelligenter Systeme lediglich ein Symbolsystem zur<br />

Erfassung der Wissensstruktur mit darauf arbeitenden Operationen zur Problemlösung<br />

entworfen werden müsse (s. Luger01, S. 57). Durch alternative Konzepte wurde Simulierbarkeit<br />

intelligenten Verhaltens einzig und allein durch Symbolverarbeitung zwar revidiert,<br />

9 siehe: Newell, A.: Physical symbol systems. Cognitive Science 4, S. 135-183, 1980.


Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 8<br />

aber die Hypothese stellt noch immer einen wesentlichen Grundbaustein für Techniken<br />

der Wissensrepräsentation in der Künstlichen Intelligenz dar.<br />

Eine Erweiterung dieses Konzepts ist die Hypothese der sogenannten Wissensebene 10 ,<br />

auf der das Wissen eines Systems beschreibbar ist. In der Hierarchie abstrahierender<br />

Beschreibungsebenen von Computerprogrammen, beginnend mit elektrotechnischen<br />

Aspekten bis hin zu Datenstrukturen, nimmt die Wissensebene die oberste Schicht ein (s.<br />

Newell81, S. 94-100). Auf dieser Ebene stellt das äußerlich sichtbare Verhalten eines<br />

Systems den Indikator für das Wissen des Systems dar. Die Verbindung zwischen intelligentem<br />

Verhalten und Wissen wird dabei durch das Rationalitätsprinzip fixiert. Dieses<br />

besagt, dass ein Agent jene Handlungsalternative wählen wird, von welcher er auf Grund<br />

seines Wissens die wahrscheinlichste Erreichung seiner Ziele erwartet (s. Newell81, S.<br />

102ff). Wesentlich ist dabei, dass die dafür benötigten Repräsentationen in der direkt<br />

unter der Wissensebene angeordneten Symbolebene gehalten werden. Somit wird eine<br />

strikte Trennung zwischen dem Wissen eines Systems und der – laut der Symbolsystemhypothese<br />

– zur technischen Realisierung benötigten Repräsentation desselben vorgenommen<br />

(s. Newell81, S. 117-121). Dabei fungiert das Wissen als Anforderungsspezifikation<br />

für die Repräsentation auf der Symbolebene und ist seinerseits an die Existenz<br />

eines entsprechenden physikalischen Symbolsystems gebunden (s. Görz+00b, S. 7).<br />

Das Ziel der Wissensrepräsentation liegt in der Entwicklung von Verfahren, die den<br />

Anforderungen aus der Symbolsystem- und der Wissensebenenhypothese entsprechen.<br />

Auf Grund der Relevanz derartiger Techniken für die Entwicklung intelligenter Systeme<br />

ist die wissenschaftliche Durchdringung dieses Gebietes relativ weit fortgeschritten. Für<br />

ontologiebasierte Verfahren der Wissensmodellierung sind dabei vor allem Erkenntnisse<br />

über Darstellungsmethoden für Symbolstrukturen sowie über die Entwicklung konzeptioneller<br />

Modelle als methodologische Grundlage relevant. Im Folgenden sollen daher<br />

die wesentlichen diesbezüglichen Aspekte vorgestellt werden.<br />

A.1.1.2 Repräsentationsschemata und -formalismen<br />

Ein Repräsentationsschema ist eine Methodik zur Darstellung der relevanten Aspekte der<br />

Struktur einer Wissensdomäne auf einem geeigneten Abstraktionsniveau zur Gewährleistung<br />

der angestrebten Funktionalität eines intelligenten Systems (s. Luger01, S. 226).<br />

Durch die Abbildung des relevanten Weltausschnitts mittels eines solchen Schemas<br />

entsteht ein konzeptionelles Modell desselben, welches in eine maschinenlesbaren Darstellung<br />

überführt wird und dann als „Wissensbasis“ (Owsnicki-Klewe+00, S. 153) eines<br />

intelligenten Systems fungiert. Um eine angemessene funktionale Qualität des Systems zu<br />

ermöglichen, werden an ein Repräsentationsschema folgende Anforderungen gestellt.<br />

Erstens soll die syntaktische sowie die semantische Eindeutigkeit, also eine Homomorphie<br />

der Wissenselemente gewährleistet sein (Kommunikativität). Zweitens sollen die<br />

relevanten Informations- und Wissensphänomene innerhalb der Domäne bezüglich ihrer<br />

Komplexität erfassbar sein (Ausdrucksstärke) und drittens soll sich die Darstellung in<br />

10 engl.: “Knowledge Level Hypothesis” (Newell81, S. 99).


Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 9<br />

effektiver Art und Weise durch einen entsprechenden Repräsentationsformalismus<br />

implementieren lassen (Operationalisierbarkeit) (s. Owsnicki-Klewe+00, S. 157f).<br />

Obwohl im Zuge der oben angeführten Wissensebenenhypothese logikbasierte<br />

Ansätze als geeignetste Form der Wissensrepräsentation proklamiert wurden, haben sich<br />

andere Notationsformen in der Künstlichen Intelligenz entwickelt. Bei den logikbasierten<br />

Ansätzen lag der Fokus auf der Fähigkeit <strong>zum</strong> korrekten und <strong>vollständige</strong>n Schließen<br />

mittels rein logischer Ausdrücke, wobei die Prädikatenlogik 11 als geeignetster Formalismus<br />

angesehen wurde (s. Luger01, S. 226). Die Erfassung von Wissensstrukturen durch diese<br />

Art der Darstellung wies allerdings erhebliche Mängel auf, da die „epistemologische<br />

Neutralität“ (Owsnicki-Klewe+00, S. 171) der Prädikatenlogik den Systementwickler zur<br />

logischen Darstellung jedes einzelnen Zusammenhangs zwingt, wodurch sich der<br />

Entwicklungsaufwand extrem erhöht. Daher wurden mit den sogenannten „assoziationistischen<br />

Theorien“ (Luger01, S. 227) Schemata zur Wissensrepräsentation entworfen,<br />

bei denen die Bedeutungsfestlegung über eine netzwerkartige, graphenbasierte Erfassung<br />

der Objekte mit ihren Beziehungen erreicht wird. Da diese Art der Wissensrepräsentation<br />

eine wesentliche Grundlage für Ontologien darstellt, werden hier die wichtigsten Ansätze<br />

kurz vorgestellt. 12<br />

Der erste zu erwähnende Ansatz sind sogenannte ´semantische Netze´. Darin werden<br />

die Konzepte und deren Beziehungen in „ ... ein[em] gerichtete[n] Graph mit bewerteten<br />

Knoten und Kanten“ (Endres-Niggemeyer98, S. 16) abgebildet. Abbildung 1 zeigt ein<br />

Beispiel einer solchen Darstellung. Die Knoten stellen Konzepte und die bipolaren<br />

Kanten deren Beziehungen untereinander dar, so dass hierarchische Strukturen und<br />

andersartige Relationen implizit erfasst werden können. Der wesentliche Vorteil dieser<br />

Abbildung 1: Beispiel eines semantischen Netzes 13<br />

11 Die Prädikatenlogik basiert auf der Aussagenlogik, in welcher logische Ausdrücke dargestellt und entsprechende<br />

logische Operationen darauf durchgeführt werden können. In der Prädikatenlogik werden diese Möglichkeiten durch<br />

die Nutzung von Variablen sowie der Zugriffsmöglichkeit auf die Komponenten komplexer Ausdrücke erweitert. Die<br />

wesentlichen Beweggründe zur Nutzung der Prädikatenlogik zur Repräsentation von Wissensstrukturen liegen in<br />

ihrer wohldefinierten Semantik, der Beweisbarkeit von Schlussfolgerungen sowie deduktiver Fähigkeiten. Übersichten<br />

der Prädikatenlogik finden sich in (Luger01, S. 71-101) sowie in gängigen Lehrbüchern der KI.<br />

12 Es sei angemerkt, dass diese traditionellen Repräsentationsschemata zur Entwicklung globaler Wissensbasen<br />

dienen sollten. Neuere Forschungsansätze beschäftigen sich mit entsprechenden Verfahren zur Darstellung von verteiltem<br />

Wissen und Schließen mit un<strong>vollständige</strong>r Informationen. Diese Ansätze sind auch für die ontologiebasierte<br />

Wissensmodellierung relevant, werden aber erst später wieder aufgegriffen (s. C.2.1). Hier sind zunächst die grundlegenden<br />

Ideen interessant.<br />

13 entnommen aus: (Endres-Niggemeyer98, S. 16).


Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 10<br />

Notationsform gegenüber der Prädikatenlogik liegt darin, dass die Bedeutungen der Beziehungen<br />

nicht mehr explizit durch logische Ausdrücke dargestellt werden müssen (s.<br />

Luger01, S.233). Allerdings fällt hierbei die ungenaue Differenzierung unterschiedlicher<br />

Arten von Relationen bezüglich ihrer Bedeutung auf (vergleiche ist_ein mit Teil_von, bzw.<br />

hat_Sprache), weswegen mit der Theorie der konzeptuellen Abhängigkeiten eine diesbezügliche<br />

Standardisierung verfolgt wurde. Darin werden grundlegende Arten von<br />

Konzepten und Relationen auf einer Meta-Ebene unterschieden, wodurch deren jeweilige<br />

Bedeutung vordefiniert ist und somit die Mehrdeutigkeit von Ausdrücken reduziert, beziehungsweise<br />

verhindert werden kann (s. Luger01, S. 233-239). Mit sogenannten Skripten<br />

wird die gleiche Zielsetzung verfolgt. Durch die Beschreibung stereotyper Handlungsabläufe<br />

in der Wissensdomäne kann die jeweils intendierte Bedeutung von Begriffen aus<br />

dem Handlungsumfeld zugeordnet werden, wodurch ebenfalls Mehrfachinterpretationen<br />

vermieden werden können (vgl. Luger01, S. 239-243). Der letzte zu erwähnende Ansatz<br />

traditioneller Repräsentationsschemata sind Frames (dt. = Rahmen). Wie in Abbildung 2<br />

dargestellt, werden darin die impliziten Relationsinformationen in einer objektartigen<br />

Struktur erfasst (s. Luger, S. 243-247). Somit können Objekte der realen Welt in einer für<br />

Menschen verständlichen und für Maschinen verarbeitbare Darstellung erfasst werden. 14<br />

Frankreich<br />

ist_ein<br />

hat_Teil<br />

hat_Sprache<br />

Land<br />

Paris<br />

Französisch<br />

Paris<br />

ist_ein<br />

ist_Teil_von<br />

Französisch<br />

ist_ein<br />

Abbildung 2: Beispiel Frame-Struktur 15<br />

Stadt<br />

Frankreich<br />

Sprache<br />

ist_Sprache_von Frankreich<br />

Ein moderner Ansatz für derartige Repräsentationsschemata sind sogenannte Konzeptgraphen.<br />

16 Darin werden die Wissensstrukturen in einem bipartiden Graph dargestellt,<br />

wobei die Konzeptknoten nur Verbindungen zu Relationsknoten haben (ähnlich einem<br />

Entity-Relationship-Diagramm). Weiterhin werden Objekttypen und Instanzen zur genaueren<br />

Beschreibung von Konzepten sowie das Konzept der Vererbung für die Darstellung<br />

hierarchischen Wissens bereitgestellt (s. Luger01, S. 247-258). Die Bedeutung<br />

dieses Ansatzes für die ontologiebasierte Wissensmodellierung wird später behandelt.<br />

Abschließend ist zu diesen Ansätzen an<strong>zum</strong>erken, dass sie im Hinblick auf die<br />

Darstellung komplexer Zusammenhänge gleich mächtig sind wie die Prädikatenlogik, aber<br />

Vorteile bezüglich der Ausdrucksstärke für Relationen aufweisen (s. Luger01, S. 227f). Mit<br />

ihnen kann die epistemologische Struktur einer Wissensdomäne erfasst werden, aber sie<br />

sind nicht zur Darstellung der semantischen Struktur geeignet (s. Luger01, S. 233). Dieses<br />

soll mittels Ontologien geschehen, wie im weiteren Verlauf aufgezeigt werden wird (s.<br />

A.2.1.2).<br />

14 Auf diesem Paradigma beruht der objekt-orientierte Ansatz des Software Engineering, welcher auf Grund seiner<br />

informationsverarbeitenden Stärken in den letzten Jahren weite Verbreitung fand (s. Görz+00b, S. 8; vgl. Balzert99).<br />

15 Beispiel aus Abbildung 1 in Frame-Darstellung: Die Notation ist (Luger01, S. 245) entnommen.<br />

16 siehe: Sowa, J. F.: Conceptual Structures. Information Processing in Mind and Machine. Reading, MA: Addison<br />

Wesley 1984.


Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 11<br />

Auf die Erfassung einer Wissensstruktur mittels eines Repräsentationsschemas folgt<br />

die Operationalisierung, also die Überführung in einen Repräsentationsformalismus.<br />

Damit wird die Maschinenlesbarkeit des repräsentierten Wissens und somit die Verwendbarkeit<br />

in computergestützten Systemen erreicht. Die dazu verwandten Wissensrepräsentationssprachen<br />

müssen in der Lage sein, die Komplexität der erfassten Wissensstruktur<br />

ausdrücken zu können und eine effiziente informationstechnische Verarbeitung<br />

zu gewährleisten (s. Owsnicki-Klewe+00, S. 171). Um diesen Anforderungen zu genügen,<br />

sollte eine solche Sprache folgende Fähigkeiten aufweisen. Erstens sollte qualitatives<br />

Wissen beschreibbar sein – also die Erfassung von Beziehungszusammenhängen anstatt<br />

reiner Datenverarbeitung. Zweitens soll neues Wissen aus dem vorhandenen über inferenzielle<br />

Verknüpfungen ableitbar sein. Drittens soll die Darstellung von allgemeinabstrakten<br />

als auch von speziell-detaillierten Zusammenhängen möglich sein. Viertens<br />

sollen komplexe semantische Konstrukte beschreibbar sein und fünftens die Möglichkeit<br />

zur Darstellung von Meta-Wissen gegeben sein (vgl. Luger01, S. 60-65).<br />

Wesentlich für die Qualität derartiger Sprachen ist, dass sie eine formal definierte Semantik<br />

aufweisen. Das heißt, dass jedem Primitivum und jedem Operator eine eindeutige<br />

Bedeutung zugewiesen und somit die Homomorphie von Ausdrücken gewährleistet ist.<br />

Dazu haben logische Methoden sich als geeignetes Werkzeug etabliert. Somit folgt die<br />

Situation, dass logikbasierte Formalismen zwar nicht direkt als Repräsentationsformalismus<br />

verwandt, aber als Analysewerkzeug eingesetzt werden (s. Owsnicki-<br />

Klewe+00, S. 175f). Für die besprochenen Repräsentationsschemata wurden jeweils<br />

entsprechende Wissensrepräsentationssprachen entwickelt. Auch für Ontologien werden<br />

entsprechende Repräsentationsformalismen benötigt, welche ebenfalls später ausführlich<br />

behandelt werden.<br />

A.1.1.3 Modellbasierter Ansatz<br />

Als abschließender Aspekt aus dem Bereich der Wissensrepräsentation soll der modellbasierte<br />

Ansatz erläutert werden, der aus einem Paradigmenwechsel innerhalb des<br />

Knowledge Engineering (s. A.1.2) hervorging. Dabei wurde zunächst im sogenannten<br />

Transfer-Ansatz das Wissen menschlicher Experten in eine formale Repräsentation überführt<br />

und das entsprechende Problemlösewissen durch Schlussregeln darauf aufgesetzt.<br />

Diese Vorgehensweise zeigte jedoch erhebliche Schwächen, da <strong>zum</strong> einen implizit schwer<br />

formalisierbares Alltagswissen in den Problemlöseprozess menschlicher Experten einfließt<br />

und <strong>zum</strong> anderen, weil die nötige erschöpfende Erfassung der Wissensdomäne allein<br />

durch Extraktion von Expertenwissen nicht möglich erschien (s. Studer+98, S. 2f). Daher<br />

wurde die Erstellung eines konzeptuellen Modells der Wissensdomäne als zusätzlicher,<br />

vorgelagerter Schritt eingeführt. Darin sollte die statische Wissensstruktur auf Basis<br />

mehrerer Quellen derart erfasst werden, dass eine umfassende, konzeptionell korrekte<br />

Abbildung der Domäne entsteht. Auf dieser kann eine entsprechende Inferenzmaschine<br />

das benötigte Problemlösewissen realisieren (vgl. Struss00, S. 431-433).<br />

Bei derartigen Verfahren stellt die Wissensbasis als wissensrepräsentierende Komponente<br />

eines intelligenten Systems die modellhafte Abbildung der Wissensdomäne dar,<br />

welche auf einer objektiven Analyse der Wissensstrukturen beruht. Daher werden diese


Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 12<br />

Verfahren als Wissensmodellierung bezeichnet, womit die Abgrenzung zur einfachen Repräsentation<br />

durch Symbolsysteme verdeutlicht werden soll (s. Struss00, S. 431f). Da bei<br />

der Entwicklung einer Ontologie dieser Ansatz verfolgt wird, können sie als ein Verfahren<br />

der Wissensmodellierung bezeichnet werden. Dabei nimmt das konzeptionelle<br />

Modell der Wissensdomäne eine bedeutende Rolle ein (s. A.2.1.1), weswegen hier die<br />

wesentlichen Aspekte eines solchen Modells kurz aufgeführt werden sollen.<br />

Ein Modell soll eine „ systematische, strukturierte Darstellung von Wissen über einen<br />

Gegenstand(sbereich) [sein], aus der Aussagen über das Verhalten des Gegenstandes<br />

ableitbar sind“ (Struss00, S. 432). Als grundlegendes Prinzip wird dabei die Trennung des<br />

deklarativen Wissens 17 vom Inferenzwissen verfolgt. Diese beiden Wissensarten werden<br />

auf Grund ihrer unterschiedlichen Charakteristika in verschiedenenartigen Modellen erfasst,<br />

so dass ein konzeptionelles Modell aus einer Wissensrepräsentation mittels entsprechender<br />

Repräsentationsschemata und –formalismen (s. A.1.1.2) sowie aus verhaltensbeschreibenden<br />

Elementen 18 besteht (s. Struss00, S. 439-450). Zur Erstellung eines<br />

solchen Modells ist der relevante Weltausschnitt, die inhaltliche Tiefe sowie die Komplexität<br />

der inferenziellen Kompetenz des Modells zu bestimmen. Wesentlich ist die Validation<br />

bezüglich der konzeptionellen Korrektheit des Modells (s. Owsnicki-Klewe+00, S. 161-<br />

174). Ziel bei der Entwicklung modellbasierter Systeme ist unter anderem auch die<br />

Erstellung von Bibliotheken wiederverwendbarer Modelle, um die Komposition neuer<br />

Wissensmodelle aus existenten Modellkomponenten zu ermöglichen (s. Struss00, S. 440<br />

ff). Detailliertere Betrachtungen dieser Aspekte werden an den entsprechenden Stellen in<br />

den weiteren Ausführungen vorgenommen.<br />

A.1.2 Knowledge Engineering<br />

Die Disziplin des Knowledge Engineering entstand als Methodenlehre zur Entwicklung<br />

Wissensbasierter Systeme 19 innerhalb der Künstlichen Intelligenz und stellt damit ein anwendungsorientiertes<br />

Forschungsgebiet dar, in dem Ansätze und Lösungen für die vorhergehend<br />

beschriebenen Problemstellungen der Wissensmodellierung und der Entwicklung<br />

entsprechender intelligenter Systeme erarbeitet wurden. Im Zuge der Forschungsarbeiten<br />

wurden unter anderem Ontologien als grundlegendes Modellierungskonzept eingeführt<br />

und verwendet, weshalb die diesbezüglichen Aspekte des Knowledge Engineering<br />

als Entstehungshintergrund ontologiebasierter Verfahren der Wissensmodellierung erläutert<br />

werden sollen. Weiterhin bestehen auf Grund gleichartiger Fragestellungen viele<br />

inhaltliche Verknüpfungen zwischen Knowledge Engineering und den in dieser Arbeit<br />

untersuchten ontologiebasierten Ansätzen, so dass in den weiteren Betrachtungen die<br />

relativ umfangreichen Kenntnisse dieses Forschungsgebiets referenziert werden können.<br />

17 Als deklaratives oder deskriptives Wissen wird das durch Fakten, Regeln, Listen, Tabellen und Bilder dargelegte<br />

Wissen bezeichnet (s. Hesse96, S. 252).<br />

18 Hierbei ist nicht die getrennte Inferenzmaschinerie gemeint. Es sollen lediglich die statischen Zusammenhänge der<br />

Wissensdomäne erfasst werden. Als Inferenzmaschinerie wird die aufgabenbezogene Nutzung des Modells verstanden.<br />

Also ein intelligentes Programm, welches mit Hilfe des Modells eine bestimmte Funktionalität erfüllt.<br />

19 engl: „Knowledge-based Systems“ (s. Studer+98, S. 2), abgekürzt als KBS. Darunter werden Systeme verstanden,<br />

die Wissensstrukturen in einem allgemeinen Sinn verarbeiten. Wissen wird dabei als pragmatische Daten (= in einer<br />

definierten Syntax notierte Signale) und Informationen (= mit semantischer Bedeutung versehene Daten) verstanden,<br />

welche ein Individuum <strong>zum</strong> Handeln befähigen (s. Schreiber+00, S. 3-5).


Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 13<br />

Der Begriff des Knowledge Engineering wurde Anfang der 1980er Jahre geprägt,<br />

wobei in Anlehnung an die Zielsetzung des Software Engineering systematische und<br />

wissenschaftlich reflektierte Methoden zur Entwicklung Wissensbasierter Systeme erarbeitet<br />

werden sollten. Dabei wurde vor allem anwendungsorientierten Fragestellungen<br />

hinsichtlich Techniken zur Erfassung, Darstellung und Verarbeitung von Wissensstrukturen<br />

nachgegangen. Als hauptsächliche Forschungsgebiete des Knowledge Engineering<br />

entstanden die Wissensakquisition, die Wissensmodellierung und -formalisierung<br />

sowie der Prozess der Systementwicklung. Die dabei gewonnenen Erkenntnisse sollten in<br />

umfassende ingenieursartige Methodologien zur Entwicklung Wissensbasierter Systeme<br />

zusammengefasst werden (s. Puppe+00, S. 599ff).<br />

Zur Erläuterung des Entstehungskontextes ontologiebasierter Verfahren der Wissensmodellierung<br />

sollen hier als wesentliche Errungenschaften des Knowledge Engineering<br />

die Differenzierung verschiedener Wissensarten sowie generische, also allgemeingültige<br />

und damit wiederverwendbare Wissensmodelle zur Darstellung derselben genauer betrachtet<br />

werden. Die Differenzierung der Wissensarten beruht auf der unterschiedlichen<br />

funktionalen Verwendung von Wissensstrukturen in Wissensbasierten Systemen. Gemäß<br />

dem modellbasierten Ansatz (s. A.1.1.3) werden dabei Domänen- und Inferenzwissen<br />

unterschieden und in separaten, voneinander unabhängigen Modellen erfasst. Auf Grund<br />

dieser Unterscheidung können die zur Entwicklung eines Wissensbasierten Systems relevanten<br />

Aspekte einer Wissensdomäne hinsichtlich der einzelnen Wissensarten betrachtet<br />

werden, wodurch eine differenzierte Erfassung der Domänenstruktur ermöglicht wird.<br />

Für jede Wissensart wird eine spezifische Repräsentationsform zur Erfassung der jeweils<br />

relevanten Aspekte verwendet (s. Puppe+00, S. 606). Um existente Erfassungen von<br />

Wissensstrukturen wiederverwenden zu können, werden ihre konzeptionellen Strukturen<br />

mittels sogenannter „Wissensmodelle“ (Puppe+00, S. 617) beschrieben, welche im Folgenden<br />

genauer betrachtet werden. Anschließend daran soll die kurze Darstellung ausgewählter<br />

Methodologien des Knowledge Engineering vertiefenden Einblick in die<br />

Differenzierung der Wissensarten sowie der Verwendung der Wissensmodelle geben.<br />

A.1.2.1 Wissensmodelle<br />

Wie schon angedeutet, besteht das Ziel der hier als Wissensmodelle bezeichneten Konstrukte<br />

in einer abstrahierenden und allgemein gehaltenen Beschreibung einer Wissensstruktur.<br />

Dabei soll die konzeptionelle Beschaffenheit derselben erfasst werden, weshalb<br />

sie auch als „Modellierung der Wissensebene 20 “ (s. A.1.1.1) bezeichnet werden. Da die<br />

Erstellung einer Wissensbasis 21 eine sehr aufwendige Analyse sowie die entsprechenden<br />

Fähigkeiten vom Wissensingenieur 22 verlangt, soll ihm mit derartigen Modellen die Möglichkeit<br />

zur Wiederverwendung bereits erfasster Wissensstrukturen beziehungsweise Lösungsansätze<br />

für ähnliche Fragestellungen als Referenz gegeben werden. Als ein derartiges<br />

Wissensmodell für das Domänenwissen wurden Ontologien und für das Inferenzwissen<br />

20 engl.: „ Knowledge Level Model“ (Wielinga94, S. 19).<br />

21 Als Wissensbasis eines Systems wird die Menge der formalisierten Wissensstrukturen bezeichnet, die das System<br />

zur Erfüllung seiner wissensverarbeitenden Aufgaben benötigt (s. Pupp+00, S. 599f).<br />

22 engl: „Knowledge Engineer“ (Schreiber+00, S. 20): Tätigkeitsbezeichnung für den Systemanalysten, dessen<br />

Aufgabe vornehmlich in der Modellierung der wissensverarbeitenden Fähigkeiten eines Systems liegt.


Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 14<br />

sogenannte Problem Solving Methods entwickelt (vgl. Gómez-Pérez+99), welche im Folgenden<br />

vorgestellt werden.<br />

A.1.2.1.1 Problem Solving Methods<br />

Das primäre Ziel Wissensbasierter Systeme ist die Simulation intelligenten Verhaltens<br />

durch das automatisierte Lösen von Problemen (s. A.1). Bei der Umsetzung entsprechender<br />

Verfahren wurden allgemeine Muster aufgefunden, mit denen gleichartige Problemstellungen<br />

behandelt werden können. Zur Erfassung dieser Muster werden sie mit einer<br />

Problem Solving Method (= PSM) beschrieben, womit ein standardisierter und somit<br />

wiederverwendbarer Lösungsansatz für die Problemstellung definiert wird (s. Gómez-<br />

Pérez+99, S. 7).<br />

Dazu werden in einer PSM die nötigen Inferenzschritte, deren Reihenfolge und das zur<br />

Lösung der Aufgabe benötigte Wissen über die Domäne spezifiziert. Somit entsteht ein<br />

abstrahierendes Lösungsmuster für mehrere Aufgaben des gleichen Typus, welches der<br />

Entwickler eines Systems lediglich auf die konkreten Zusammenhänge übertragen muss.<br />

Um die Wiederverwendbarkeit zu ermöglichen, werden PSM in entsprechenden<br />

Bibliotheken organisiert (s. Studer+98, S. 21-24). Die Forschungsarbeiten auf diesem<br />

Gebiet sind relativ umfangreich. Da für den hier untersuchten Zusammenhang weitere<br />

Ausführungen dieser <strong>Thema</strong>tik nicht nötig erscheinen, wird auf die entsprechende<br />

Fachliteratur verwiesen 23 .<br />

A.1.2.1.2 Ontologien<br />

Wie im Zusammenhang der PSMs (s. A.1.2.1.1) erwähnt, wird für die Problemlösefähigkeit<br />

eines Wissensbasierten Systems Wissen über die Anwendungsdomäne benötigt.<br />

Dieses wird in entsprechenden „Domänenmodellen“ (s. Puppe+00, S. 624) abgebildet, in<br />

denen die statischen Zusammenhänge der Wissenselemente und deren Relationen erfasst<br />

werden. Eine Ontologie stellt ein vordefiniertes Vokabular für ein solches Domänenmodell<br />

der Elemente der Wissensstruktur zur Verfügung. Die Zielsetzung bei einer derartigen<br />

Verwendung von Ontologien ist die Sicherstellung der einheitlichen Verwendung<br />

der Begrifflichkeiten der Wissensdomäne, wodurch fehlerhafte Modellierungen und somit<br />

konzeptionell bedingte Fehlfunktionen verhindert werden sollen. Eine Ontologie kann<br />

dabei als Referenz für mehrere Domänenmodelle dienen und stellt somit ein Wissensmodell<br />

im oben beschriebenen Sinne dar (s. Puppe+00, S. 622).<br />

Als Hilfsmittel in der Systementwicklung können unterschiedliche Arten von<br />

Ontologien verwendet werden, wobei sie jeweils als Wissensmodell zur bedeutungsdefinierenden<br />

Erfassung der Wissensdomäne fungieren. Für die weiteren Ausführungen<br />

seien hier zunächst sogenannte Domänenontologien für die Erstellung von Domänenmodellen<br />

und Methodenontologien für die Erstellung von Problem Solving Methods<br />

genannt (s. Puppe+00, S. 623). 24 Als wesentlicher Aspekt soll an dieser Stelle die zentrale<br />

Rolle von Ontologien als bedeutungsdefinierendes Wissensmodell für die Erstellung des<br />

konzeptionellen Modells einer Wissensbasis festgehalten werden.<br />

23 Eine Übersicht sowie weiterführende Literaturangaben finden sich in (Gómez-Pérez+99).<br />

24 Eine ausführliche Behandlung verschiedener Arten von Ontologien wird im Zusammenhang mit deren Verwendung<br />

in Informationssystemen vorgenommen (s. C.1.1.2)


Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 15<br />

A.1.2.2 Methodologien<br />

Zu Verdeutlichung der vorgestellten theoretischen Errungenschaften des Knowledge<br />

Engineering sollen im Folgenden die Differenzierung verschiedener Wissensarten sowie<br />

die Verwendung von Ontologien genauer betrachtet werden, wozu die diesbezüglichen<br />

Erkenntnisse zweier Methodologien des Knowledge Engineering besprochen werden.<br />

Aus der CommonKADS-Methodologie wird die Unterscheidung der Wissensarten sowie<br />

die Modellierung des Domänenwissens unter der Verwendung von Ontologien erläutert<br />

und aus dem PROTÉGÉ-Ansatz soll die differenziertere Verwendung von Ontologien<br />

zur Konzeption Wissensbasierter Systeme vorgestellt werden. Die Auswahl dieser beiden<br />

Methodologien begründet sich darin, dass die wesentlichen Erkenntnisse für den hier verfolgten<br />

Untersuchungsaspekt aus diesen hervorgingen. Eine vergleichende Übersicht<br />

weiterer Forschungsansätze mit ähnlichen Zielsetzungen findet sich in (Angele+97).<br />

A.1.2.2.1 CommonKADS<br />

Die CommonKADS-Methodologie entstand im Zuge des ESPRIT IT- Projektes 25 und<br />

verfolgt das Ziel, ein umfassendes und standardisiertes Verfahren des Knowledge Engineering<br />

zu entwerfen (s. Schreiber+00, S. xii). Der Ansatz basiert auf einer Kollektion von<br />

Modellen (siehe Abbildung 3), durch deren sukzessive Erstellung die Entwicklung eines<br />

Wissensbasierten Systems durchgeführt wird.<br />

Dabei wird zunächst zur Erfassung des Nutzungsumfeldes des Systems die Organisationsstruktur<br />

der Wissensdomäne im Organisations-Modell beschrieben. Im Aufgaben-<br />

Modell werden die auszuführenden Aufgaben spezifiziert und in hierarchischer Art und<br />

Weise gegliedert. Im Agenten-Modell werden die ausführenden Agenten erfasst. Auf<br />

dieser Grundlage wird das Konzept des zu entwickelnden Systems erstellt, wobei im<br />

Expertise-Modell das benötigte Problemlösewissen und im Kommunikations-Modell die<br />

nötigen Interaktionen und Informationsflüsse beschrieben werden. Abschließend wird als<br />

Implementierungsgrundlage die so entstandene Konzeption in das Design-Modell<br />

überführt. 26 Abbildung 3: CommonKADS – Modell Kollektion 27<br />

25 Europäisches Forschungsprojekt mit Vertretern aus der Forschung und der Industrie. In verschiedenen Projekten im<br />

Bereich des Knowledge Engineering entstand unter anderem der KADS-Ansatz (Knowledge Acquisition and Design<br />

Structuring) zur Entwicklung Wissensbasierter Systeme. CommonKADS als Weiterentwicklung von KADS gilt als<br />

eine der wichtigsten Methodenlehren des Knowledge Engineering und wurde in mehreren Forschungsansätzen<br />

erweitert. Eine detaillierte Übersicht findet sich im sogenannten Textbook (vgl. Schreiber+00) sowie im Internet auf<br />

der Website, siehe: www.commonkads.uva.nl (16.07.2002).<br />

26 Eine detaillierte Erläuterung der einzelnen Modelle findet sich in (Schreiber+00).<br />

27 entnommen aus: (Schreiber+00, S. 18). Die Übersetzung der Begrifflichkeiten ist an (Puppe+00, S. 626) angelehnt.<br />

In der Literatur wird das Expertise-Modell mancherorts auch als Wissensmodell (engl.: „Knowledge Model“) bezeichnet<br />

(s. Schreiber+00, S. 19).


Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 16<br />

Für den hier betrachteten Zusammenhang ist vor allem das Expertise-Modell von<br />

Bedeutung, in dem die oben erwähnte Differenzierung von Wissensarten vorgenommen<br />

wurde. Dabei wird neben der Trennung von Domänen- und Inferenzwissen das sogenannte<br />

Aufgabenwissen unterschieden, welches die Struktur zu lösender Aufgaben zur<br />

Erfassung der Funktionsweise eines Wissensbasierten Systems spezifiziert (s. Wielinga94,<br />

S. 20). Für die Erfassung dieser Wissensarten werden jeweils spezifische Darstellungsformen<br />

verwendet, wobei hinsichtlich der Verwendung von Ontologien das Verfahren<br />

zur Modellierung des Domänenwissens genauer erläutert werden soll.<br />

Abbildung 4: CommonKADS – Modellierung Domänenwissen 28<br />

Abbildung 4 zeigt die verwendeten Komponenten zur Modellierung des Domänenwissens.<br />

Die Domänenmodelle (engl.: „domain models“) stellen jene Aspekte bereit, die<br />

für die Problemlösefähigkeiten des Systems benötigt werden. Dabei handelt es sich um<br />

eine zweckdienliche Darstellung eines Teils des Domänenwissens und nicht um eine<br />

modellhafte Abbildung der gesamten Wissensstruktur der Domäne. Zur Vermeidung von<br />

Fehl- oder Mehrfachinterpretationen wird die Bedeutung der in den Domänenmodellen<br />

verwendeten Modellierungsprimitive als sogenanntes „Meta-Domänenwissen 29 “ separat<br />

im Modell-Schema (engl.: „model schema“) definiert. Für diese beiden Komponenten<br />

stellen jeweils spezifische Ontologien das benötigte Vokabular zur Verfügung. In der<br />

Domänen-Ontologie sind die Entitäten der Wissensdomäne, deren Relationen und taxonomische<br />

Struktur und in der Modell-Ontologie ist eine Typologie dieser Entitäten definiert<br />

(s. Wielinga94, S. 13-15). Dieser Aufbau verdeutlicht das oben erläuterte Verwendungskonzept<br />

von Ontologien als Wissensmodell (s. A.1.2.1.2).<br />

A.1.2.2.2 PROTÉGÉ<br />

Als zweite Methodologie soll jene des PROTÉGÉ-Projekts 30 vorgestellt werden. Dieser<br />

Ansatz befasst sich mit der Entwicklung von Problem Solving Methods und Ontologien<br />

als wiederverwendbare Komponenten für Wissensbasierte Systeme im Sinne generischer<br />

Wissensmodelle (s. Puppe+00, S. 628). Hier soll die Verwendung von Ontologien in-<br />

28 entnommen aus (Wielinga94, S. 23).<br />

29 engl.: „meta domain knowledge“ (Wielinga94, S. 15).<br />

30 PROTÉGÉ-Projekt: Forschungsprojekt der Stanford University, in dem seit Ende der 1980er Jahre Lösungen für<br />

den Bereich des Knowledge Engineering erarbeitet werden. Der hier betrachtete Ansatz wird als PROTÉGÉ-II, die<br />

aktuellen Forschungen als PROTÉGÉ2000 bezeichnet. Weiterführende Informationen dazu finden sich im Internet<br />

auf der Homepage des Projektes unter: protege.semanticweb.org (08.06.2002).


Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 17<br />

nerhalb dieses Ansatzes genauer beleuchtet werden, wobei eine verbesserte Wiederverwendbarkeit<br />

von Ontologien als Wissensmodelle angestrebt wird.<br />

Zur Erstellung einer Ontologie als bedeutungsdefinierendem Hilfskonstrukt für die<br />

Entwicklung eines Wissensbasierten Systems werden verschiedene existente Ontologien<br />

kombiniert, wodurch der Grad der Wiederverwendbarkeit von Wissensmodellen erhöht<br />

werden soll. Als existente Ontologien werden dabei entsprechende Domänenontologien<br />

und Methodenontologien (s. A.1.2.1.2) verwendet. Diese sollten möglichst allgemein<br />

gehalten und unabhängig voneinander definiert sein, um als wiederverwendbare Wissensmodelle<br />

ein möglichst breites Verwendungsfeld abzudecken. Die zu erstellende Ontologie<br />

für ein konkretes Wissensbasiertes System wird aus der Domänenontologie und der Methodenontologie<br />

der entsprechenden Wissensdomäne zusammengestellt, wobei nur die in<br />

der Anwendung benötigten Wissensstrukturen übernommen werden. Somit entsteht eine<br />

sogenannte Applikationsontologie (engl.: „application ontology“) als bedeutungsdefinierende<br />

Grundlage des Systems, welche die Bedeutung aller benötigten Wissensstrukturen<br />

enthält (s. Studer+98, S. 14-15). Abbildung 5 verdeutlicht diesen Zusammenhang.<br />

Domänen-<br />

Modell<br />

bedeutungsdefinierende<br />

Begriffbasis<br />

Problem<br />

Solving Method<br />

Applikations-<br />

Ontologie<br />

Domänen-<br />

Ontologie<br />

Zusammenführung<br />

Methoden-<br />

Ontologie<br />

Abbildung 5: PROTÉGÉ – Erstellung einer Applikationsontologie 31<br />

Aus einer derartigen Verwendung ergeben sich einerseits Vorteile hinsichtlich der<br />

Wiederverwendbarkeit von Ontologien, da sie unabhängig von einer konkreten Anwendungssituation<br />

definiert werden können. 32 Andererseits wird als neuartige Problemstellung<br />

die Zusammenführung verschiedener Ontologien aufgeworfen. Denn zur Gewährleistung<br />

der Verwendbarkeit der Applikationsontologie als bedeutungsdefinierender Basis eines<br />

Systems müssen die begrifflichen Definitionen der verwendeten Domänen- und Methodenontologie<br />

korrekt aufeinander abgestimmt werden. Dabei müssen einerseits die für das<br />

System benötigten Wissensstrukturen identifiziert werden und andererseits muss die konzeptionelle<br />

Korrektheit der Abbildung der Wissensdomäne erhalten bleiben. Diese als<br />

Ontologie-Integration bezeichnete Problematik wird später ausführlicher behandelt (s.<br />

C.3.2).<br />

31 In Anlehnung an (Studer+98, S. 15).<br />

32 Hier ist zu erwähnen, dass in der sogenannten „strong interaction problem hypothesis“ (Studer+98, S. 11) der<br />

Standpunkt vertreten wurde, dass die Wiederverwendung bereits modellierter Wissensstrukturen für die Erstellung<br />

von Wissensbasen auf Grund der starken kontextuellen Abhängigkeit generell nicht möglich sei. Diese Ansicht wurde<br />

durch praktische Erfahrungen relativiert, da allgemeine Muster von Wissensstrukturen aufgefunden werden konnten.<br />

Allerdings werden die Anforderungen an eine Wissensbasis zu einem sehr hohen Maße durch die betrachtete Domäne<br />

sowie die angestrebte Funktionalität des Wissensbasierten Systems determiniert (s. Studer+98, S. 11).


Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 18<br />

A.2 Charakteristika ontologiebasierter Wissensmodellierung<br />

Auf Grundlage des im Vorhergehenden erfassten wissenschaftlichen Hintergrundes und<br />

des Entstehungskontextes ontologiebasierter Verfahren der Wissensmodellierung lassen<br />

sich nun die wesentlichen Charakteristika dieses Verfahrens zusammentragen. Dazu<br />

werden zunächst die Eigenschaften und Anforderungen an Ontologien erläutert und in<br />

den jeweiligen wissenschaftlichen Hintergrund eingegliedert. Darauf folgt eine Erörterung<br />

der Verwendung dieser Modellierungstechnik hinsichtlich des Einsatzpotenzials von<br />

Ontologien als bedeutungsdefinierende Komponente eines computergestützten Systems.<br />

Einige ergänzende Aspekte sollen die Erarbeitung der Verständnisgrundlage ontologiebasierter<br />

Verfahren der Wissensmodellierung abschließen. An<strong>zum</strong>erken ist, dass hier<br />

keine umfassende Charakterisierung dieses Verfahrens erfolgt, sondern lediglich die für<br />

den Untersuchungsgegenstand dieser Arbeit relevanten Aspekte zusammengetragen werden<br />

sollen.<br />

A.2.1 Eigenschaften von und Anforderungen an Ontologien<br />

Zur Erfassung der Eigenschaften und Anforderungen an Ontologien als Methodik der<br />

Wissensmodellierung werden im Folgenden die Begrifflichkeiten aus der eingangs<br />

angeführten Definition einer Ontologie als „formale, explizite Spezifikation einer geteilten<br />

Konzeptionalisierung“ (s.o.) detaillierter erläutert. Diese Definition enthält zwei wesentliche<br />

Teile, welche hier sukzessiv hinsichtlich des Entstehungsprozesses einer Ontologie<br />

betrachtet werden sollen. Dazu werden zunächst die Anforderungen an eine Ontologie als<br />

eine explizite, geteilte Konzeptionalisierung der relevanten Wissensdomäne und anschließend<br />

deren Darstellung in einer formalen Spezifikation erörtert.<br />

A.2.1.1 Explizite, geteilte Konzeptionalisierung<br />

Die Konzeptionalisierung einer Wissensdomäne entsteht als Artefakt der „konzeptionellen<br />

Modellierung 33 “, in welcher ein Modell der Struktur der Domäne im Sinne des<br />

Modellbasierten Ansatzes (s. A.1.1.3) in einer der Anwendungsmodellierung vorgelagerten<br />

Phase erfasst wird. Eine solche Konzeptionalisierung stellt eine simplifizierende und<br />

abstrahierende Abbildung der statischen Struktur einer Domäne dar, welche deren<br />

relevante Aspekte hinsichtlich einer bestimmten Zweckausrichtung beinhaltet (s. Gruber<br />

93, S.1). Die Zweckausrichtung einer Ontologie besteht in der Erfassung der Bedeutung<br />

von Termen und Relationen (s. A.2.2.1). Eine entsprechende Konzeptionalisierung muss<br />

daher die intensionalen, also den Zusammenhängen innewohnenden Eigenschaften der<br />

Wissensdomäne erfassen (s. Guarino98, S. 3).<br />

Dass die einer Ontologie zugrundeliegende Konzeptionalisierung explizit sein soll, ist<br />

im Hinblick ihrer Verwendung als bedeutungsdefinierende Komponente eines Informationssystems<br />

zu verstehen. Um Fehl- und Mehrfachinterpretationen von Begrifflichkeiten<br />

und Zusammenhängen zu vermeiden, muss deren Bedeutung externalisiert werden. 34 Da<br />

33 engl.: „Conceptual Modelling” (Guarino95, S. 3).<br />

34 In der Theorie der Wissensschaffung im Unternehmen wird mit Externalisierung jener Prozess beschrieben, in dem<br />

implizites, nur dem ´Inhaber´ zugängliches Wissen derart beschreibbar gemacht wird, dass es für andere verständlich<br />

und erlernbar ist (s. Nonaka+97, S. 68-108). Dazu wird ein ausgereifteres Verständnis des Gegenstandsbereichs benötigt.<br />

Diese Problematik stellt sich auch bei der Erstellung einer expliziten Konzeptionalisierung und wird später<br />

ausführlicher behandelt (s. B.1.2).


Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 19<br />

die Bestandteile einer solchen Konzeptionalisierung somit einen direkten Bezug <strong>zum</strong><br />

betrachteten Ausschnitt der realen Welt haben, werden sie auch als „Domänentheorie 35 “<br />

bezeichnet. Eine Domänentheorie unterscheidet sich von anderen schematischen Erfassungen<br />

einer Wissensdomäne hinsichtlich der Intention der Modellierung. Während in<br />

Datenbank-Schemata oder Objektmodellen aus der konventionellen Softwaretechnik das<br />

Modell lediglich zur Erstellung einer informationsverarbeitenden Applikation dient, soll in<br />

einer Ontologie ein Verständnismodell der Wissensdomäne geschaffen werden (s. Studer<br />

+98, S. 11). Dieser Aspekt wird später ausführlicher behandelt (s. B.1.2.1).<br />

Die Forderung nach der Geteiltheit bedeutet, dass die strukturelle Erfassung einer<br />

Wissensdomäne in der Konzeptionalisierung von den Beteiligten als Verständnismodell<br />

der Domäne angesehen und akzeptiert wird. Diese Anforderung lässt sich ebenfalls vor<br />

dem Hintergrund der Verwendung einer Ontologie als bedeutungsdefinierendes Konstrukt<br />

einer Wissensdomäne begründen, da eine effiziente Nutzung einer solchen Struktur<br />

nur durch eine Akzeptanz des darin postulierten Verständnisses gewährleistet werden<br />

kann. 36 Der Grad der Akzeptanz durch einen Agenten (menschlich oder künstlich) wird<br />

durch dessen „ontologische Verpflichtung 37 “ beschrieben. Damit kann im Sinne der<br />

Wissensebenen-Hypothese (s. A.1.1.1) erfasst werden, in wieweit der Agent das in der<br />

Ontologie intendierte Verständnis der Domäne in seinem Verhalten berücksichtigt (s.<br />

Gruber93, S. 3).<br />

A.2.1.2 Formale Spezifikation<br />

Durch die Formalisierung der zugrundeliegenden Konzeptionalisierung soll die Maschinenlesbarkeit<br />

erreicht und somit die Verwendbarkeit einer Ontologie in computergestützten<br />

Informationssystemen ermöglicht werden. Dazu werden entsprechende Repräsentationsschemata<br />

und -formalismen (s. A.1.1.2) benötigt. Wesentlich dabei ist, dass<br />

diese die Fähigkeit zur semantischen Beschreibung der Struktur einer Wissensdomäne<br />

aufweisen. Diese Anforderung an geeignete Darstellungstechniken für Ontologien kann<br />

durch das von Guarino postulierte „Ontologische Level 38 “ in der Hierarchie von<br />

Repräsentationsformalismen verdeutlicht werden.<br />

Level Repräsentationsprimitive Zielsetzung<br />

logisch Prädikate logische Formalisierung<br />

epistemologisch strukturierte Relationen Strukturerfassung<br />

ontologisch Bedeutungspostulate Bedeutungsdefinition<br />

konzeptionell kognitive Primitive Konzeptionalisierung<br />

linguistisch linguistische Primitive natürlich-sprachliche Darstellung<br />

Tabelle 1: Level der Wissensrepräsentation 39<br />

35 engl: „domain theory“ (Fensel00, S. 1).<br />

36 Dazu sei hier ein bekannter Ausspruch aus dem Gebiet des Wissensmanagements angeführt: „People can´t share<br />

knowledge if they don´t speak a common language“ (Schreiber+00, S. 4. nach: Davenport, T.H.; Prusak, L.: Working<br />

Knowledge. How organisations manage what they know. Boston, USA: Havard Business Scholl Press 1998). Eine<br />

Ontologie soll in diesem Sinne eine gemeinsame Verständnisgrundlage definieren.<br />

37 engl.: „ontological commitment“ (Gruber93, S. 2).<br />

38 engl.: „ontological level“ (Guarino94, S. 1).<br />

39 aus: (Guarino94, S.9). Das Modell wurde darin lediglich um das ontologische Level ergänzt.


Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 20<br />

Die Differenzierung der in Tabelle 1 unterschiedenen Arten von Repräsentationsformalismen<br />

beruht auf der Art des mit den Formalismen darstellbaren Wissens. Die Art<br />

des darstellbaren Wissens wird über die Verbundenheit der jeweiligen Repräsentationsprimitive<br />

mit Strukturen der realen Welt definiert (siehe Spalte ´Zielsetzung´ in Tabelle 1).<br />

Es werden fünf Level von Repräsentationsformalismen unterschieden, welche hier kurz<br />

erläutert werden sollen.<br />

Mit Formalismen des logischen Levels können logische Ausdrücke definiert werden,<br />

wobei die Bedeutung der Variablen nicht an Objekte der realen Welt gebunden ist. Der<br />

logische Ausdruck f(x)=>t(x) stellt erst eine sinnvolle Aussage dar, wenn x als Repräsentant<br />

eines Objekt definiert wird. Das epistemologische Level beschreibt Formalismen<br />

zur Darstellung der Struktur einer Wissensdomäne. Ein Beispiel dafür stellen die<br />

Formalismen für die traditionellen Repräsentationsschemata dar (s. A.1.1.2). Während<br />

epistemologische Formalismen lediglich den Aufbau und die Zusammengehörigkeit von<br />

Wissenselementen erfassen können, sollen Formalismen des ontologischen Levels die<br />

Spezifikation der Beschaffenheit von Wissenselementen beschreiben können. Um dieses<br />

zu ermöglichen, werden entsprechende Beschreibungsprimitive benötigt. Die Anforderungen<br />

an entsprechende Formalismen werden im Zusammenhang des Ontologie-<br />

Entwicklungsprozesses genauer erörtert (s. B.1.3). Die letzten beiden Level von Repräsentationsformalismen<br />

dienen der Beschreibung von Wissensstrukturen für deren Verständnis<br />

durch den Menschen und sind daher nicht für eine maschinelle Verarbeitung<br />

geeignet.<br />

A.2.2 Motivation zur Verwendung von Ontologien<br />

Die genannten Anforderungen an Ontologien lassen sich nur unter Berücksichtigung ihrer<br />

antizipierten Verwendung nachvollziehen. Dazu soll im Folgenden die schon erwähnte<br />

Funktion von Ontologien als bedeutungsdefinierender Komponente eines computergestützten<br />

Systems besprochen werden, ebenso die potenziellen Einsatzfelder ontologiebasierter<br />

Verfahren der Wissensmodellierung.<br />

A.2.2.1 Bedeutungsdefinition<br />

In den bisherigen Ausführungen wurden Ontologien als bedeutungsdefinierendes Konstrukt<br />

beschrieben, welches ein Vokabular der Wissensdomäne bezüglich deren Struktur<br />

definieren soll. Der resultierende funktionale Zugewinn wird auch als maschinenverarbeitbare<br />

Beschreibung der „Semantik von Daten 40 “ bezeichnet. Diese Bezeichnung<br />

sowie die hintergründige Intention zur Erstellung eines solchen Konstrukts bedürfen<br />

einer genaueren Betrachtung.<br />

Wie als Zielsetzung der Verwendung von Ontologien als Wissensmodell im Knowledge<br />

Engineering herausgearbeitet wurde (s. A.1.2.1.2), soll eine Ontologie ein Strukturmodell<br />

der betrachteten Wissensdomäne beschreiben, welches dann als Basis zur Entwicklung<br />

von Anwendungen genutzt wird. Die Intention liegt dabei in der Schaffung einer<br />

zentralen Erfassung der Wissensdomäne, in der die strukturellen Zusammenhänge<br />

definiert werden. Durch die Nutzung und Einhaltung dieser Bedeutungsdefinition der<br />

40 engl.: „ … the semantics of the data.“ (Fensel00, S. 1).


Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 21<br />

Wissensstruktur zur Erstellung weiterführender Modelle sollen konzeptionelle Fehler<br />

vermieden werden, wie die Verwendung von Ontologien in den vorgestellten Methodologien<br />

des Knowledge Engineering veranschaulicht (s. A.1.2.2).<br />

Überträgt man diese spezielle Intention auf eine allgemeinere Ebene, so stellt die<br />

Bedeutungsdefinition durch eine Ontologie eine konzeptionelle Strukturierung dar, mit<br />

der ein „geteiltes und gemeinsames Verständnis einer Wissensdomäne 41 “ erreicht werden<br />

kann – unter der Bedingung der entsprechenden ontologischen Verpflichtung der Beteiligten<br />

(s. A.2.1.1). Um diesen Anforderungen gerecht zu werden, muss in der Ontologie<br />

die Struktur der Domäne korrekt, also in Übereinstimmung mit der realen Welt<br />

erfasst werden, wobei eine objektive oder <strong>zum</strong>indest intersubjektive Wahrnehmung<br />

derselben angestrebt werden sollte. Dabei sind die Begrifflichkeiten derart zu definieren,<br />

dass die intendierte Bedeutung präzise ausgedrückt wird und durch Ausschluss, beziehungsweise<br />

Verminderung von Mehrdeutigkeiten eine einheitliche Verwendung gewährleistet<br />

werden kann. Es kann insofern von einer semantischen Struktur gesprochen<br />

werden, da in einer Ontologie die Bedeutungsbeziehungen zwischen Konzepten als<br />

Verständnismodellen, den zugehörigen Objekten der realen Welt und deren symbolische<br />

Repräsentation gemäß dem semiotischen Dreieck 42 erfasst werden sollen. Weiterhin<br />

werden mit den Anforderungen der präzisen Bedeutungserfassung und der Verhinderung<br />

von Mehrdeutigkeit Problemfelder der Semantik aufgefasst (s. Glück00, S. 618-621).<br />

Allerdings ist die Bezeichnung einer ontologiebasierten Anwendung als „semantische<br />

Technologie“ (s. Smolle02, S.5) mit Vorsicht zu genießen, da die modellhafte Erfassung<br />

einer Wissensstruktur mittels einer Ontologie lediglich als semantische Komponente in<br />

einem Informationssystem fungieren soll, damit aber keine semantische Analyse des<br />

betrachteten Weltausschnitts im Sinne der semiotischen Bedeutungslehre angestrebt wird.<br />

A.2.2.2 Einsatzmöglichkeiten<br />

Eine Ontologie als bedeutungsdefinierende Basis im vorgestellten Sinne kann zu verschiedenartigen<br />

Zwecken verwendet werden, wobei sich jeweils Nutzenzugewinne durch<br />

die Existenz einer geteilten und allgemeinen Verständnisgrundlage der Wissensdomäne ergeben.<br />

Die wichtigsten Einsatzgebiete sollen hier nur kurz aufgeführt werden, da diese<br />

<strong>Thema</strong>tik später ausführlicher behandelt wird (s. C.1.2).<br />

Zunächst können Ontologien als unterstützende Komponente bei der Entwicklung<br />

von Systemen genutzt werden, wie bei der Verwendung in den Methodologien zur Entwicklung<br />

Wissensbasierter Systeme aufgezeigt wurde (s. A.1.2.2). Dieser Verwendungszweck<br />

lässt sich für Systeme generalisieren, die für wissensintensive Aufgabenfelder eingesetzt<br />

werden. Dabei dienen Ontologien vor allem als qualitätssichernde Reliabilitätskontrolle<br />

sowie als wiederverwendbare Modellierung einer Wissensdomäne (s. A.1.2.2.2).<br />

Eine weitere Anwendung findet sich als Komponente in Informationssystemen zur Gewährleistung<br />

der Interoperabilität von Systemen, beziehungsweise deren Komponenten,<br />

41 engl.: „… shared and common understanding of a domain …“ (Fensel00, S. 1).<br />

42 Mit dem semiotischen Dreieck wird versucht, die Funktionsweise der menschlichen Bedeutungswahrnehmung zu<br />

veranschaulichen. Ein Zeichen oder Symbol trägt eine Bedeutung, welche für ein Bezugsobjekt der realen Welt steht.<br />

Die Bedeutungswahrnehmung geschieht durch ein sogenanntes mentales Konzept, worüber der Mensch die Verbindung<br />

zwischen Symbol und Bezugsobjekt herstellt (s. Glück00, S. 625f).


Kapitel A: Grundlagen ontologiebasierter Wissensmodellierung 22<br />

womit Ontologien einen Lösungsansatz für den Datenaustausch zwischen heterogenen<br />

Informationsquellen als wesentliches Problemfeld des Informationsmanagements darstellen.<br />

Ein weiteres Einsatzgebiet von Ontologien sind kommunikationsintensive Bereiche<br />

wie das Wissensmanagement oder die Kommunikation zwischen Software-Agenten,<br />

wobei die einheitliche Begriffsverwendung innerhalb einer Wissensdomäne oder zwischen<br />

verschiedenen einen Zugewinn bietet (s. Uschold+96, S.7-13).<br />

A.2.3 Ergänzende Anmerkungen<br />

Aus den Ausführungen wird zunächst deutlich, dass Ontologien als Technik der Wissensmodellierung<br />

mit dem Ziel der Bedeutungsdefinition eine neuartige Herangehensweise für<br />

die Entwicklung wissensverarbeitender Systeme darstellen, womit unter anderem das<br />

wachsende Forschungsinteresse auf diesem Gebiet zu erklären ist. Des Weiteren fällt auf,<br />

dass zur Realisierung dieser Methodik viele bekannte Aspekte verwandt werden können,<br />

so dass ontologiebasierte Verfahren nicht als ein völlig neuartiger Ansatz der Wissensmodellierung<br />

zu verstehen sind.<br />

Weiterhin ist an<strong>zum</strong>erken, dass eine Vielzahl sehr unterschiedlicher Konstrukte als<br />

Ontologien bezeichnet werden. Diese breite Fächerung beruht <strong>zum</strong> einen auf den unterschiedlichen<br />

Anforderungen, welche aus der antizipierten funktionalen Verwendung einer<br />

Ontologie resultieren. Zum anderen werden Konstrukte mit unterschiedlichen Formalisierungsgraden<br />

als Ontologie bezeichnet, soweit sie eine bedeutungsdefinierende Erfassung<br />

einer Wissensdomäne beinhalten. Dabei werden folgende drei Abstufungen unterschieden.<br />

Als informelle Ontologien werden solche bezeichnet, die eine bedeutungsdefinierende<br />

Strukturerfassung darstellen, aber nicht formal spezifiziert sind. Diese<br />

Ontologien dienen lediglich als Verständnismodell einer Wissensdomäne, sind aber nicht<br />

zur maschinellen Verarbeitung geeignet. Dies ist erst mit formalisierten Ontologien<br />

möglich, wobei semi-formale und hoch formalisierte Ontologien unterschieden werden.<br />

In letzteren sind die inferenziellen Zusammenhänge in axiomatischen Ausdrücken erfasst<br />

(s. Uschold+96, S.6).<br />

Vor diesem Hintergrund sind auch die Unterschiede in den verschiedenen definitorischen<br />

Erfassungen einer Ontologie zu verstehen. Während eine informelle<br />

Ontologie eher als konzeptionelle Erfassung einer Wissensdomäne verstanden werden<br />

kann, stellt eine hoch-formalisierte Ontologie eine Spezifikation einer logischen Theorie<br />

dar (s. Guarino +95, S. 1-3). Die einzige Gemeinsamkeit solcher vom Wesen her sehr<br />

unterschiedlichen Konstrukte ist lediglich die bedeutungsdefinierende Erfassung einer<br />

Wissensdomäne. In dieser sehr allgemeinen Anforderung kann die Begründung für das<br />

noch nicht ganz ausgereifte Verständnis von Ontologien gesehen werden. Trotz der Unklarheiten<br />

über die Wesenseigenschaften von Ontologien besteht ein Konsens darüber,<br />

dass ein solches Modell einer Wissensstruktur <strong>zum</strong> einen eine gemeinsame Verständnisgrundlage<br />

derselben schaffen und <strong>zum</strong> anderen als bedeutungsdefinierende<br />

Komponente in wissensverarbeitenden Informationssystemen eingesetzt werden kann.


Kapitel B: Ontologie-Entwicklung 23<br />

B Ontologie-Entwicklung<br />

Anschließend an die Erfassung der Charakteristika ontologiebasierter Wissensmodellierung<br />

werden in diesem Kapitel die wesentlichen Aspekte der Ontologie-Entwicklung<br />

erarbeitet, wobei der Fokus vor allem auf der Erfassung der Problemstellungen bei der<br />

Konstruktion solcher bedeutungsdefinierender Konstrukte liegen soll. Dies erfordert eine<br />

alle wesentlichen Aspekte umfassende Betrachtung der Entwicklung von Ontologien in<br />

der Praxis, da nur so das für die Untersuchung der Verwendung von Ontologien im<br />

Semantic Web benötigte Verständnis dieses Verfahrens der Wissensmodellierung erlangt<br />

werden kann. Die Erarbeitung dieses Themengebiets an Hand eines entsprechenden<br />

Beispiels würde einerseits einen beträchtlichen Aufwand zur Erläuterung desselben<br />

erfordern und andererseits nur eine partielle Beleuchtung der zu betrachtenden Aspekte<br />

erlauben. Daher wird hier auf eine solche Vorgehensweise verzichtet und stattdessen die<br />

relevant erscheinenden Errungenschaften des sogenannten „Ontology Engineering“ (vgl.<br />

Noy01) herausgearbeitet, wodurch ein vertiefendes Verständnis von Ontologien erreicht<br />

werden soll.<br />

Unter dem Begriff des Ontology Engineering werden seit Anfang der 1990er Jahre<br />

Forschungsaktivitäten zusammengefasst, die sich vornehmlich mit der Entwicklung von<br />

Ontologien beschäftigten. Wie im Software Engineering oder im Knowledge Engineering<br />

(s. A.1.2) wird dabei das Ziel verfolgt, wissenschaftlich fundierte Methodologien für die<br />

Praxis auszuarbeiten. Schwerpunktmäßig wird dabei umsetzungstechnischen Fragestellungen<br />

nachgegangen, für die entsprechende Lösungsansätze erarbeitet sowie unterstützende<br />

Techniken und Werkzeuge entwickelt werden. Auch hierbei werden methodologische<br />

Verfahrensmodelle angestrebt, welche die Entwicklung von Ontologien als<br />

eine ingenieursartige Tätigkeit erleichtern und eine entsprechende Qualitätssicherung<br />

gewährleisten sollen. Allerdings werden die Erkenntnisse dieser relativ jungen Disziplin als<br />

noch nicht in dem Maße ausgereift betrachtet wie jene des Software Engineering oder des<br />

Knowledge Engineering (s. Gómez-Pérez99, S. 1f).<br />

Die Erarbeitung der zu betrachtenden Aspekte in diesem Kapitel wird in zwei aufeinander<br />

aufbauenden Teilen vorgenommen. Zunächst wird der in verschiedene Phasen zu<br />

unterteilende Prozess zur Entwicklung einer Ontologie beschrieben. Dabei werden<br />

Lösungsansätze für die wesentlichen Aktivitäten jeder Phase aus unterschiedlichen Forschungsansätzen<br />

zusammengetragen, womit die umfassende Betrachtung dieser grundlegenden<br />

<strong>Thema</strong>tik erreicht werden soll. Daran anknüpfend werden weiterführende<br />

Errungenschaften angeführt, durch deren Berücksichtigung bei der Entwicklung einer<br />

Ontologie deren funktionale Qualität als bedeutungsdefinierende Erfassung einer<br />

Wissensdomäne sichergestellt, beziehungsweise gefördert werden soll. Abschließend wird<br />

der derzeitige Kenntnisstand des Ontology Engineering zusammengefasst und es werden<br />

zukünftige Forschungsziele aufgezeigt.


Kapitel B: Ontologie-Entwicklung 24<br />

B.1 Ontologie-Entwicklungs-Prozess 43<br />

Im Entwicklungsprozess werden die nötigen Aktivitäten zur Entwicklung einer Ontologie<br />

identifiziert und es wird eine Reihenfolge für deren Bearbeitung festgelegt. Daraus geht<br />

ein in aufeinander aufbauende, sukzessiv zu erarbeitende Phasen gegliedertes Vorgehensmodell<br />

für die Ontologie-Entwicklung hervor – ähnlich entsprechender Methodologien<br />

des Software oder Knowledge Engineering. Dazu wurden in verschiedenen Forschungsgruppen<br />

methodologische Ansätze entwickelt, von denen hier die Ansätze von ´Uschold,<br />

King´, ´Grüninger, Fox´ und ´METHONTOLOGY´ vorgestellt werden. Dabei ist an<strong>zum</strong>erken,<br />

dass diese drei Ansätze jeweils eine Verallgemeinerung von Vorgehensweisen<br />

beschreiben, die zur Entwicklung von Ontologien in konkreten Anwendungsprojekten<br />

verfolgt wurden. Daher sind sie nicht als ausgereifte Methodologien im Sinne einer<br />

wissenschaftlich fundierten Methodik für die Ontologie-Entwicklung zu verstehen,<br />

sondern lediglich als erste Ansätze zur Entwicklung einer solchen. 44 Trotzdem lassen sich<br />

gemeinsame, in allen drei Ansätzen erwähnte Phasen für die Entwicklung von Ontologien<br />

bestimmen, welche in den weiteren Ausführungen jeweils detaillierter besprochen werden.<br />

Die Auswahl der drei genannten methodologischen Ansätze begründet sich damit, dass<br />

darin jeweils der komplette Entwicklungsprozess betrachtet wird. Es existieren weitere<br />

Ansätze, welche allerdings jeweils nur Teilaspekte bearbeiten und daher für den hier verfolgten<br />

Zweck nicht geeignet erscheinen 45 .<br />

Als „Skelettale Methodologie 46 ” bezeichnen ´Uschold, King´ ihre Verfahrenweise der<br />

Ontologie-Entwicklung, welche aus den Erfahrungen der im Zusammenhang eines<br />

Frameworks zur Unternehmensmodellierung erstellten „Enterprise Ontology“ (vgl.<br />

Uschold+96b) als bedeutungsdefinierender Basis im oben erläuterten Sinne (s. A.2.2.1)<br />

hervorgegangen ist. Es werden vier Entwicklungsphasen unterschieden. Zunächst muss<br />

der „Zweck 47 “ der Ontologie identifiziert werden, wobei die antizipierte Anwendung und<br />

daraus resultierende Anforderungen zu spezifizieren sind. Die zweite Phase umfasst den<br />

kompletten Erstellungsprozess der Ontologie, in der drei weitere sukzessiv durchzuführende<br />

Aktivitäten differenziert werden. Durch die sogenannte „Eroberung 48 “ wird die<br />

konzeptionelle Erfassung der Struktur einer Wissensdomäne vorgenommen, diese dann in<br />

der Kodierungsphase in eine formale Darstellung überführt und als letzter Schritt werden<br />

existente Ontologien integriert. In der dritten Phase soll die Ontologie bezüglich ihrer<br />

konzeptionellen Korrektheit evaluiert und <strong>zum</strong> Schluss eine entsprechende Dokumentation<br />

zur Gewährleistung ihrer Verwendbarkeit durch Dritte erstellt werden (s. Uschold<br />

+95, S.2-4; Uschold+96, S. 14-17).<br />

43 engl.: „Ontology Development Process“ (Fernández+97, S.1).<br />

44 Obwohl die drei hier genannten methodologischen Ansätze keine ausgereiften Methodologien sind, stellen sie die<br />

erschöpfendsten Arbeiten zu dieser <strong>Thema</strong>tik dar. Hierin offenbart sich der oben angeführte momentane Erkenntnisstand<br />

des Ontology Engineering, in dem die Ausarbeitung umfassender Methodologien noch aussteht.<br />

45 Entsprechende Übersichten dieser Ansätze finden sich in (Jones+98, S. 6-12) und in ´OntoRoadmap – Index of<br />

Methodologies´ unter: http://babage.dia.fi.upm.es/ontoweb/wp1/OntoRoadMap/index/methodology.html<br />

(16.05.2002).<br />

46 engl: „Skeletal Methodology“ (Uschold+95, S.2). Damit wird deutlich, dass damit lediglich eine Grundlage für<br />

eine umfassende Methodologie geschaffen werden sollte.<br />

47 engl.: „Purpose“ (Uschold+95, S. 2).<br />

48 engl.: „Capture“ (Uschold+95, S.3).


Kapitel B: Ontologie-Entwicklung 25<br />

Die methodologische Beschreibung der Ontologie-Entwicklung durch ´Grüninger,<br />

Fox´ resultiert ebenfalls aus einem Projekt zur Unternehmensmodellierung, in dem ein<br />

externalisiertes Unternehmensmodell zur Erleichterung der Entwicklung informationstechnischer<br />

Optimierungslösungen geschaffen werden sollte. 49 Als erste Tätigkeit für die<br />

Entwicklung einer Ontologie werden in diesem Ansatz „motivierende Szenarien 50 “<br />

ermittelt, wodurch die mögliche Nutzenzugewinne verdeutlicht werden. Die Anforderungen<br />

an die Ontologie werden genauer durch sogenannte „Kompetenzfragen 51 “ spezifiziert.<br />

Darunter werden mögliche Anfragen an die Ontologie verstanden, mit denen die<br />

konzeptionelle und die inferenzielle Korrektheit evaluiert werden können. Im dritten<br />

Schritt wird die Terminologie, also die Bestandteile der Ontologie in einer formalen<br />

Sprache spezifiziert, wobei für alle Kompetenzfragen entsprechende wissensrepräsentierende<br />

Konstrukte definiert werden müssen. Dann werden die Kompetenzfragen auf der<br />

Grundlage der zuvor definierten Terminologie formalisiert und anschließend die terminologischen<br />

Erfassungen axiomatisiert, also in logischen Ausdrücken dargestellt. Abschließend<br />

werden „Vollständigkeitstheoreme 52 “ spezifiziert, welche Testszenarien bezüglich<br />

der Beantwortungsfähigkeit der Kompetenzfragen darstellen und somit eine<br />

formale Evaluation der Ontologie ermöglichen sollen (vgl. Grüninger+95).<br />

Der letzte vorzustellende Ansatz trägt die Bezeichnung METHONTOLOGY und<br />

basiert auf den Erfahrungen der Entwicklung einer Chemie-Ontologie (vgl. Fernandéz<br />

+99). Der Entwicklungsprozess beginnt mit der Spezifikationsphase, worin die antizipierte<br />

Anwendung, der zu erfassende Weltausschnitt sowie der benötigte Formalisierungsgrad<br />

der Ontologie festgehalten wird. Dann wird zunächst das benötigte Wissen<br />

akquiriert und in der anschließenden Konzeptionalisierungsphase das grundlegende konzeptionelle<br />

Modell erstellt. In dieser Phase werden auch existente Ontologien bezüglich<br />

einer möglichen Integration geprüft und das Design des konzeptionellen Modells wird<br />

dementsprechend ausgerichtet. Die Überführung in einen geeigneten Repräsentationsformalismus<br />

erfolgt in der Implementierungsphase. Die qualitative Evaluation sowie die<br />

Erstellung einer entsprechenden Dokumentation sollen als begleitende Tätigkeit während<br />

des gesamten Erstellungsprozesses durchgeführt werden, wodurch eventuelle Fehler<br />

frühzeitig behoben und die Dokumentation auf dem aktuellen Stand gehalten werden<br />

kann (vgl. Fernández+97).<br />

Wie einführend angedeutet, lassen sich offensichtlich Phasen des Ontologie-<br />

Entwicklungsprozesses auffinden, welche in allen drei vorgestellten methodologischen<br />

Ansätzen genannt und in gleicher Reihenfolge angegeben werden. Zunächst erfolgt eine<br />

Spezifikation bezüglich der antizipierten Verwendung der zu erstellenden Ontologie.<br />

Dann wird das entsprechende konzeptionelle Modell erstellt, dieses in eine formale<br />

Darstellung überführt und schließlich die Ontologie hinsichtlich ihrer konzeptionellen<br />

Korrektheit evaluiert. In Tabelle 2 sind diese vier aus den vorgestellten Ansätzen verallgemeinerten<br />

Phasen dargestellt.<br />

49 Das Projekt trägt die Bezeichnung TOVE - TOronto Virtual Enterprise (s. Grüninger+95, S. 1).<br />

50 engl.: „motivating szenarios“ (Grüninger+95, S.2).<br />

51 engl.: „compentency questions“ (Grüninger+95, S.3), abgekürzt als CQs.<br />

52 engl.: „completeness theorems“ (Grüninger+95, S.9).


Kapitel B: Ontologie-Entwicklung 26<br />

Gemeinsame<br />

Phasen<br />

´Uschold, King´ ´Grüninger, Fox´ METHONTOLOGY<br />

Spezifikation<br />

(s. B.1.1)<br />

1) Zweck der Ontologie<br />

identifizieren<br />

1) motivierende Szenarien<br />

2) Kompetenzfragen<br />

formulieren (informell)<br />

1) Spezifikation<br />

2) Wissensakquisition<br />

Konzeptionalisierung<br />

(s. B.1.2)<br />

Formalisierung<br />

(s. B.1.3)<br />

2) Erstellung der Ontologie<br />

a. Eroberung<br />

3) Terminologie-<br />

Spezifikation (formal)<br />

3) Konzeptionalisierung<br />

4) Integration<br />

b. Kodierung<br />

c. Integration<br />

4) Kompetenzfragen<br />

formalisieren<br />

5) Axiomatisierung<br />

5) Implementierung<br />

Evaluation<br />

(s. B.1.4)<br />

3) Evaluation<br />

4) Dokumentation<br />

6) Vollständigkeitstheoreme<br />

6) Evaluation<br />

7) Dokumentation<br />

Tabelle 2: Phasen des Ontologie-Entwicklungs-Prozesses<br />

Im Folgenden werden die wesentlichen Aspekte der identifizierten Phasen ausführlicher<br />

behandelt, wobei neben den drei erläuterten Ansätzen weitere relevante Forschungsergebnisse<br />

vorgestellt werden. Bezüglich der Charakteristik des Ontologie-<br />

Entwicklungsprozesses ist an<strong>zum</strong>erken, dass er auf Grund der durchzuführenden Tätigkeiten<br />

sowie der Reihenfolge einen Modellierungsprozesses gemäß des modell-basierten<br />

Ansatzes (s. A.1.1.3) darstellt. Als Lebenszyklusmodell wird jenes der „Evolving Prototypes<br />

53 “ favorisiert, da für die Erstellung einer Ontologie sowie für Korrekturen und<br />

Erweiterungen jeweils alle Phasen durchlaufen werden müssen (s. Fernández+97, S. 3f).<br />

Die hier und auch in den weiteren Ausführungen deutlich werdende Orientierung am<br />

Software Engineering ist auf den primären Verwendungszweck von Ontologien als<br />

bedeutungsdefinierender Komponente in Informationssystemen zurückzuführen.<br />

B.1.1 Spezifikation<br />

In allen drei vorgestellten methodologischen Ansätzen beginnt der Entwicklungsprozess<br />

mit einer Spezifikationsphase. Da Ontologien in sehr unterschiedlichen Anwendungsszenarien<br />

eingesetzt werden können (s. A.2.2.2), ist eine klassifizierende Zuordnung einer<br />

zu entwickelnden Ontologie zu einem vordefinierten Anwendungsgebiet nur begrenzt<br />

möglich (s. Uschlod+95, S. 2). Somit kann lediglich als vage Aussage festgehalten werden,<br />

dass das spezifische Einsatzgebiet sowie die daraus resultierenden Anforderungen an eine<br />

Ontologie zu Beginn deren Entwicklung zu erfassen sind.<br />

Als der Spezifikation vorgelagerte Aktivität ist zunächst eine Durchführbarkeitsstudie<br />

durchzuführen, in welcher der Entwicklungsumfang aus managerialer Sicht erfasst wird.<br />

Wird die Durchführung des Projektes entschieden, so kann die hierbei entstehende erste<br />

Erfassung der Spezifika der Ontologie als Grundlage zur Verfeinerung in den nachfolgenden<br />

Schritten genutzt werden. 54<br />

53 Evolving Prototypes: Lebenszyklusmodell (= Entwicklungsphasen eines Softwaresystems von der ersten Idee bis<br />

<strong>zum</strong> Einsatz), welches sequentiell-linare und zyklische Aspekte verbindet. Dabei müssen für jede Änderung alle<br />

Entwicklungsphasen sequentiell durchlaufen werden, bevor die nächste Änderung vorgenommen werden kann.<br />

Dieses Lebenszyklusmodell beschreibt Systeme, deren funktionale Qualität sich in ihrer konzeptionellen Geschlossenheit<br />

manifestiert (s. Draheim00, S. 52-61).<br />

54 Für die Durchführbarkeitsstudie können existente Verfahren aus dem Bereich des Knowledge Engineering<br />

verwandt werden, da deren Aussagekraft auf Grund der gleichartigen Anforderungen auch für die Ontologie-<br />

Entwicklung bestehen bleibt. (Schnurr+00) favorisieren dazu das Verfahren der CommonKADS-Methodologie (s.


Kapitel B: Ontologie-Entwicklung 27<br />

B.1.1.1 Anforderungsanalyse<br />

In den drei vorgestellten methodologischen Ansätzen wird die Anforderungsanalyse zwar<br />

einheitlich als erste durchzuführende Tätigkeit bei der Ontologie-Entwicklung angeführt,<br />

jedoch mit jeweils unterschiedlichen Herangehensweisen. Während ´Uschold, King´ lediglich<br />

die Notwendigkeit einer Festlegung des Zwecks der Ontologie ohne die Nennung<br />

einer entsprechenden Methodik betonen (s. Uschold+95, S. 2), wird im Ansatz von<br />

´Grüninger, Fox´ ein explizites Verfahren zur Anforderungsspezifikation mittels der<br />

Kompetenzfragen gegeben (s. Grüninger+95, S. 1f). In METHONTOLGY wird die<br />

Erstellung eines Spezifikationsdokumentes verlangt, welches die benötigten Informationen<br />

enthält (s. Fernández+97, S. 4).<br />

Ein derartiges Dokument scheint eine gehaltvolle Spezifikation zu erlauben, da in<br />

bewährten Methodologien des Knowledge oder Software Engineering ebensolche eingesetzt<br />

werden. Daher soll der Aufbau eines solchen Dokuments für die Ontologie-<br />

Entwicklung am Beispiel des „Anforderungs-Spezifikations-Dokumentes 55 “ von On-To-<br />

Knowledge 56 eingehender betrachtet werden. Dieses Dokument enthält natürlichsprachliche<br />

Kurzbeschreibungen des Verwendungsziels, der relevanten Wissensdomäne und der<br />

antizipierten Einsat<strong>zum</strong>gebung, sowie Auflistungen der wesentlichen Aspekte der zu<br />

erstellenden Ontologie (s. Schnurr+00, S. 26-28). Eine derartig strukturierte Erfassung der<br />

wesentlichen Informationen erlaubt einen umfassenden Überblick der Charakteristika der<br />

zu entwickelnden Ontologie.<br />

B.1.1.2 Wissensakquisition<br />

Zur Erstellung einer Ontologie wird natürlich auch das entsprechende Wissen über den<br />

zu erfassenden Weltausschnitt benötigt. Dessen Erwerb ist allerdings keine spezifische<br />

Tätigkeit der Ontologie-Entwicklung, sondern eine generell durchzuführende Tätigkeit bei<br />

der Entwicklung von Informationssystemen. Daher kann erstens auf bekannte Techniken<br />

des Wissenserwerbs verwiesen und zweitens die Betrachtung dieses Aspekts mit einer<br />

Übersicht der wichtigsten Verfahren in Tabelle 3 abgeschlossen werden.<br />

Erwerbstechnik<br />

Interview<br />

Textanalyse<br />

Data Mining<br />

Wissenseingabe<br />

Beschreibung<br />

Der Wissensingenieur befragt einen Experten und arbeitet die Erkenntnisse<br />

mit analytischen Methoden auf.<br />

Analyse von Dokumenten, welche die benötigte Wissensstruktur der<br />

Domäne beschreiben.<br />

Auswertung in elektronischer Form vorliegender Daten, vornehmlich für<br />

statistische Informationen.<br />

Direkte Eingabe des benötigten Wissens durch einen Experten in ein vom<br />

Wissensingenieur vordefiniertes Domänenmodell.<br />

Tabelle 3: Techniken des Wissenserwerbs 57<br />

A.1.2.2.1), worin nach der Erfassung des Anwendungsumfeldes im Organisationsmodell eine Entscheidung bezüglich<br />

der Durchführbarkeit des Projektes gefällt werden kann (s. Schreiber+00, S. 28-35).<br />

55 engl.: „requirement specification dodument“ (Schnurr+00, S. 26). Ein Werkzeug zur Erstellung dieses Dokuments<br />

wird mit „OntoKick“ bereitgestellt (vgl. Boyens01).<br />

56 Das Forschungsprojekt ´On-To-Knowledge´ beschäftigt sich mit der Verwendung von Ontologien im Wissensmanagement.<br />

Der darin verfolgte methodologische Ansatz zur Ontologie-Entwicklung erweitert die Herangehensweise<br />

von METHONTOLOGY (s.o.). Eine ausführliche Darstellung findet sich in (Schnurr+00) und unter:<br />

http://www.ontoknowledge.com (12.07.2002).<br />

57 nach (Puppe+00, S. 606-617). Eine ausführliche Diskussion der allgemeinen Verfahren und Problemstellungen des<br />

Wissenserwerbs sowie Vor- und Nachteile der Techniken finden sich in (Schreiber+00, S. 187-213). Im Übrigen sind


Kapitel B: Ontologie-Entwicklung 28<br />

B.1.2 Konzeptionalisierung<br />

Aufbauend auf der Spezifikationsphase wird als nächstes das konzeptionelle Modell der<br />

Ontologie erstellt. Darin werden die im Hinblick auf den Verwendungszweck relevanten<br />

Wissensstrukturen der Domäne in einem geeigneten Abstraktionsgrad erfasst und somit<br />

das Design, also der Aufbau und Inhalt der Ontologie bestimmt. Die Konzeptionalisierungsphase<br />

stellt den eigentlichen Modellierungsprozess dar, da hierin das externalisierte<br />

Verständnismodell der Wissensdomäne in einer modellhaften Darstellung im Sinne<br />

des Modellbasierten Ansatzes (s. A.1.1.3) erarbeitet wird. Dabei treten sehr komplexe und<br />

stark interdependente Problemstellungen auf. Erstens soll das konzeptionelle Modell eine<br />

Beschreibung der Domäne auf der Wissensebene (s. A.1.1.1) darstellen, zweitens soll diese<br />

Erfassung explizit, also eindeutig definiert sein, und drittens als geteilte Konzeptionalisierung<br />

einen durch die Beteiligten der Wissensdomäne akzeptierten Konsens des<br />

Verständnisses derselben beinhalten (s. A.2.1.1).<br />

Während die beiden erstgenannten Aspekte sich vornehmlich auf die modellierungstechnische<br />

Herangehensweise der Ontologie-Entwickler beziehen, wird mit der Geteiltheitsforderung<br />

ein sozialer Aspekt angesprochen. Die Schaffung eines gemeinschaftlich<br />

akzeptierten Konsens über die Beschaffenheit einer Wissensdomäne erfordert die<br />

Bereitschaft und Mitarbeit aller Beteiligten und stellt somit eine klassische Aufgabe des<br />

Wissensmanagement dar. Ohne im Detail auf die dabei auftretenden Problemstellungen<br />

einzugehen 58 , soll hier ein aus dem Kontext des Wissensmanagements hervorgegangenes<br />

Prozessmodell zur Erstellung der Konzeptionalisierung vorgestellt werden. Dabei erstellt<br />

der Ontologie-Entwickler basierend auf der Anforderungsspezifikation eine initiale Ontologie,<br />

welche an Hand des in der Wissensakquisition erworbenen Wissens detaillierter<br />

ausgearbeitet wird. Daran schließt sich ein iterativer Prozess an, in dem in direkter<br />

Zusammenarbeit mit den Beteiligten deren Verständnis der Domäne solange mit dem in<br />

der Ontologie dargestellten Verständnismodells abgeglichen wird, bis ein entsprechender<br />

Konsens erreicht ist (s. Holsapple+02, S. 44-46).<br />

Dieses Prozessmodell verdeutlicht, wie komplex und aufwendig die Erstellung des<br />

konzeptionellen Modells als Grundlage einer qualitativ hochwertigen Ontologie ist. Da<br />

eine vertiefende Betrachtung der Problematik der Konsensfindung jedoch über die<br />

Errungenschaften des Ontology Engineering und damit über den hier behandelten<br />

inhaltlichen Schwerpunkt hinausgeht, sollen im Folgenden methodologische Aspekte im<br />

Vordergrund der Betrachtungen stehen. Dazu werden die grundlegenden Modellierungsprimitive<br />

einer Ontologie vorgestellt, die Zielsetzung der Konzeptionalisierung in der<br />

Ontologie-Entwicklung herausgearbeitet und anschließend entsprechende Repräsentationsschemata<br />

vorgestellt.<br />

diese Techniken des Wissenserwerbs im Knowledge Engineering jenen des Datenerwerbs der empirischen<br />

Sozialforschung sehr ähnlich – siehe dazu: Diekmann, A.: Empirische Sozialforschung. Grundlagen, Methoden,<br />

Anwendungen. 4. durchges. Aufl. Reinbeck: Rowohlt 1995, S. 371-516).<br />

58 Hierbei sind vor allem die Bereitschaft zur Wissensteilung durch die Beteiligten, das Finden eines allgemeinen<br />

Verständnisses sowie die persönliche Akzeptanz des operationalen Nutzenzugewinns durch Schaffung neuartiger<br />

Strukturen zu nennen. Ausführliche Abhandlungen zu diesen Themen finden sich in der einschlägigen Fachliteratur,<br />

siehe u. a.: Kurtzke, C.; Popp, P.: Das wissensbasierte Unternehmen. Praxiskonzepte und Management-Tools.<br />

München: Hanser 1999.


Kapitel B: Ontologie-Entwicklung 29<br />

B.1.2.1 Modellierungsprimitive<br />

Zur Erstellung eines konzeptionellen Modells als Grundlage einer Ontologie werden<br />

Modellierungsprimitive benötigt, die den Anforderungen an Bedeutungspostulate im<br />

Sinne des ontologischen Levels der Wissensrepräsentation (s. A.2.1.2) genügen. Hier<br />

werden lediglich die grundlegenden Primitive kurz eingeführt, um eine terminologisch einheitliche<br />

Verwendung in den weiteren Ausführungen zu gewährleisten. Ein vertiefendes<br />

Verständnis zur korrekten Verwendung dieser Primitive soll im Rahmen der Meta-<br />

Modellierung erarbeitet werden (s. B.2.2).<br />

Schon öfters erwähnt wurde das Primitiv Konzept, welches zur Erfassung der grundlegenden<br />

Objekte einer Wissensdomäne dient (s. Uschold+95, S. 1). Mit einem Konzept<br />

kann sowohl der Typ eines realen Objektes als auch ein Verständnismodell im Sinne eines<br />

semiotischen mentalen Konzeptes (s. A.2.2.1) beschrieben werden. Konkrete Ausprägungen<br />

eines Konzeptes werden als Instanz bezeichnet. Die Eigenschaften von Konzepten<br />

und Instanzen werden durch sogenannte Properties 59 und Attribute beschrieben. Als<br />

Property wird dabei eine inhärente Eigenschaft eines Konzeptes oder einer Instanz verstanden,<br />

während ein Attribut eine funktionale Zuschreibung des Wertes eines anderen<br />

Konzeptes darstellt (s. KBSI-94, S.16f). 60 Das Primitivum zur Beschreibung der nichtcharakterisierenden<br />

Beziehungen zwischen Konzepten und Instanzen wird als Relation<br />

bezeichnet (s. Fernández+97, S.6). Tabelle 4 fasst die definitorischen Erfassungen dieser<br />

Basis-Modellierungsprimitive zusammen.<br />

Primitivum Verwendung zur Modellierung von ...<br />

Konzept<br />

Objekttyp / mentales Verständniskonstrukt<br />

Instanz<br />

Konkrete Ausprägung eines Konzeptes<br />

Property / Attribut Erfassung der Eigenschaften von Konzepten / Instanzen<br />

Relation<br />

Nicht-charakterisierende Beziehung zwischen Konzepten / Instanzen<br />

Tabelle 4: Modellierungsprimitive ontologiebasierter Wissensmodellierung<br />

B.1.2.2 Zielsetzung der Konzeptionalisierung<br />

Bei den vorgestellten Modellierungsprimitiven ist die definitorische Ähnlichkeit, ja sogar<br />

Äquivalenz mit entsprechenden Begrifflichkeiten aus dem Software Engineering sehr<br />

auffällig. Diese findet sich auch in weiterführenden Aspekten wie der taxonomischen<br />

Strukturierung als ein Kernaspekt der Modellierung oder im Umgang mit komplexen<br />

Konzepten wieder und bedarf daher einer genaueren Betrachtung. Dazu soll an dieser<br />

Stelle der wesentliche Unterschied zwischen Datenbank-Schemata, beziehungsweise<br />

objektorientierter Modellierung und einem konzeptionellen Modell als Grundlage einer<br />

Ontologie herausgearbeitet werden.<br />

Die schematische Erfassung der Struktur des relevanten Weltausschnittes in einem<br />

Modell des konventionellen Software Engineering dient der Abbildung dieses Ausschnitts<br />

59 Hier wird der englische Begriff als Terminus Technicus beibehalten, da der Gebrauch des deutschen Begriffs<br />

´Eigenschaften´ eine hohe Gefahr für begriffliche Unklarheit birgt.<br />

60 Dieser Unterschied kann an folgendem Beispiel der Beschreibung der Farbe eines Objektes verdeutlicht werden.<br />

Als Property wird dieses wie folgt ausgedrückt: OBJEKT – IST – ROT; als Attribut würde die Beschreibung<br />

OBJEKT – HAT_FARBE – ROT ausgedrückt. Während in der ersteren Darstellung die Farbe eine direkte Eigenschaft<br />

des Objektes darstellt, wird im letzteren dem Objekt die Instanz ROT des Konzeptes FARBE als Eigenschaft<br />

zugewiesen (s. KBSI-94, S.16).


Kapitel B: Ontologie-Entwicklung 30<br />

in einer Darstellungsform gemäß dem Datenmodell, welches durch die verwendete Technologie<br />

verarbeitet werden kann. In der Welt der relationalen Datenbanken werden die<br />

Strukturen der realen Welt in einem Entity-Relationsship-Diagramm erfasst, welches zwar<br />

nur eine geringe semantische Aussagekraft hat, die Informationen aber im relationalen<br />

Datenmodell darstellt und somit deren Verarbeitung durch die Datenbanktechnologie<br />

ermöglicht (s. O´Neil+01, S. 329-396). Ähnlich verhält es sich bei der Erstellung des<br />

Analysemodells in der objektorientierten Software-Entwicklung. Der Weltausschnitt wird<br />

in Objektstrukturen derart erfasst, dass das Modell als Basis zur Entwicklung entsprechender<br />

Applikationen unter Verwendung objektorientierter Technologien dienen<br />

kann (s. Balzert99, S. 17-88).<br />

Im Gegensatz zu einer solchen technologisch determinierten Modellierung soll ein<br />

konzeptionelles Modell als Basis der Ontologie-Entwicklung die Struktur der realen Welt<br />

selber beschreiben. Das heißt, dass mittels der beschriebenen Modellierungsprimitive das<br />

externalisierte und gemeinsam akzeptierte Verständnismodell über das Wesen des betrachteten<br />

Weltausschnitts erfasst werden und nicht die Struktur der Wissensdomäne in<br />

ein technologisch konzipiertes Modell zur Weltinterpretation überführt werden soll. Das<br />

dabei entstehende konzeptionelle Modell beschreibt die Beschaffenheit der Wissensdomäne<br />

als Ergebnis eines Modellierungsprozesses, in dem die Wissensstrukturen<br />

analysiert werden. Dieses Modell wird als „ontologische Theorie 61 “ bezeichnet, da es ein<br />

objektives oder <strong>zum</strong>indest intersubjektives Verständnismodell der Wissensstrukturen der<br />

Domäne darstellt.<br />

Trotz dieses fundamentalen Unterschiedes in der Zielsetzung der konzeptionellen<br />

Erfassung können für die Ontologie-Entwicklung gleichartige Modelle und damit gleichartige<br />

Modellierungsprimitive wie im Software Engineering genutzt werden. Wesentlich ist<br />

lediglich die Unterscheidung der verfolgten Intentionen. Die Erfassbarkeit des Verständnismodells<br />

einer Wissensdomäne mit Hilfe von klassifizierenden und assoziierenden<br />

Darstellungen wird mit Bezug auf psychologische Untersuchungen gerechtfertigt, in<br />

denen derartige Vorgehensweisen auch für die menschliche Wahrnehmung nachgewiesen<br />

wurden (s. Luger01, S. 227f).<br />

B.1.2.3 Repräsentationsschemata<br />

Zur Erstellung eines konzeptionellen Modells wird eine Darstellungsform im Sinne eines<br />

Repräsentationsschemas benötigt (s. A.1.1.2). Dabei ist insbesondere das Potenzial zur<br />

expliziten Bedeutungserfassung der identifizierten Wissensstrukturen in der Domäne für<br />

die Eignung eines Repräsentationsschemas für diesen Zweck ausschlaggebend.<br />

Bei der diesbezüglichen Betrachtung der drei einleitend vorgestellten methodologischen<br />

Ansätze zur Ontologie-Entwicklung ist festzustellen, dass jeweils die Wichtigkeit<br />

der Konzeptionalisierungsphase betont wird. Es werden allerdings sehr unterschiedliche<br />

Herangehensweisen in den einzelnen Ansätzen vorgeschlagen. ´Uschold,<br />

King´ behandeln ausführlich die sogenannte „Prozedur zur Ontologie-Eroberung 62 “, in<br />

61 engl.: „ontological theory“ (Uschold+95, S, 1). Allgemeiner wird ein Erklärungsmodell einer Wissensdomäne als<br />

Domänentheorie bezeichnet (s. A.2.1.1).<br />

62 engl.: „A Procedure for Ontology Capture“ (Uschold+95, S, 9).


Kapitel B: Ontologie-Entwicklung 31<br />

dem sie Schritte zur Erstellung des konzeptionellen Modells differenzieren und für jeden<br />

Schritt entsprechende „Vorgehensrichtlinien 63 “ angeben (s. Uschold+95, S. 9-11). Diese<br />

Prozedur stellt ein praxisorientiertes Vorgehensmodell für die Konzeptionalisierung, aber<br />

kein Repräsentationsschema im hier verstandenen Sinne dar. Bei ´Grüninger, Fox´ wird<br />

gar kein explizites konzeptionelles Modell entworfen, sondern der Ontologie-Entwickler<br />

definiert in der Terminologie-Spezifikations-Phase die benötigten Wissensstrukturen der<br />

Domäne an Hand der zuvor erstellten Kompetenzfragen direkt in einer formalen Darstellung<br />

(s. Grüninger+95, S. 5). Hier wird also die Erstellung des konzeptionellen<br />

Modells implizit durch den Entwickler ohne eine vorgelagerte modellhafte Erfassung<br />

vorgenommen.<br />

In der Konzeptionalisierungsphase von METHONTOLOGY werden mittels sogenannter<br />

„intermediärer Repräsentationen 64 “ die aufgefundenen Wissensstrukturen in einer<br />

standardisierten Darstellung erfasst. Dazu werden für die einzelnen Modellierungsprimitive<br />

spezifische Tabellen verwendet, in denen die benötigten Informationen in natürlicher<br />

Sprache festgehalten werden (s. Gómez-Pérez+96, S. 2-11). Die Erstellung dieser Tabellen<br />

erfolgt sukzessiv gemäß einem Vorgehensmodell ähnlich dem genannten Ontologie-<br />

Eroberungs-Prozess von ´Uschold, King´. Es werden zunächst die Konzepte erfasst und<br />

in einer Taxonomie geordnet, dann die Attribute und Properties beschrieben und<br />

anschließend die Relationen erfasst (s. Gómez-Pérez+96, S. 2), so dass die konzeptionelle<br />

Erfassung der Domäne sukzessiv von der Bestimmung der Konzepte bis hin zu den<br />

Relationen verfeinert wird. Die Darstellung der Wissensstrukturen mittels derartiger intermediäre<br />

Darstellungen kann dann auf Grund der Standardisierung der Erfassungstabellen<br />

für eine automatisierte Formalisierung verwendet werden. 65<br />

Trotz der in den Ansätzen herausgestellten Wichtigkeit der Konzeptionalisierung ist es<br />

erstaunlich, dass mit Ausnahme von METHONTOLOGY keine geeigneten Repräsentationsschemata<br />

für die Erstellung des konzeptionellen Modells einer Ontologie vorgestellt<br />

werden. Dies kann eventuell auf die Abstinenz ausgereifter Methodologien zurückgeführt<br />

werden, wobei dieser Aspekt in der Literatur nicht aufgegriffen wird und somit die Suche<br />

nach Begründungen rein spekulativen Charakter hätte. Es ist allerdings an<strong>zum</strong>erken, dass<br />

bei der Darstellung des konzeptionellen Modells durch die intermediären Repräsentationen<br />

von METHONTOLOGY keine visuelle Darstellung desselben erfolgt. Dadurch<br />

kann das Modell bei wachsendem Umfang schnell unübersichtlich werden und die oben<br />

als wesentliche Herausforderung vorgestellte gemeinsame Erarbeitung durch den<br />

Ontologie-Entwickler und Beteiligte der Domäne auf Grund mangelnden technischen<br />

Verständnisses sich als äußerst schwierig erweisen. Eine solche Visualisierungsmethode<br />

erscheint auch vor dem Hintergrund sinnvoll, dass in den vergleichbaren Methodologien<br />

63 engl.: „Guidelines“ (Uschold+95, S, 11).<br />

64 engl.: „intermediate representations“ (Fernández+97, S. 2).<br />

65 Für die automatische Generierung der formalen Darstellung einer Ontologie aus den intermediären Repräsentationen<br />

wurde das ´Ontolgy Design Environment´ entwickelt, das die Überführung in verschiedene Repräsentationsformalismen<br />

ermöglicht (s. Fernandéz+99, S. 43-45). Dieser Ansatz wird auch von anderen Ontologie-Entwicklungs-<br />

Werkzeugen verfolgt, von denen die bekanntesten hier aufgeführt werden sollen.<br />

1) OntoEdit der Firma ontoprise: Die Demoversion 2.5 ist unter: http://www.ontoprise.de (15.08.2002) erhältlich.<br />

2) Protégé2000: Shareware, erhältlich unter: http://protege.semanticweb.org/download.html (08.06.2002).<br />

3) OilEd: Shareware, erhältlich unter: http://oiled.man.ac.uk (16.07.2002).


Kapitel B: Ontologie-Entwicklung 32<br />

des Software und Knowledge Engineering ebensolche verwandt werden. Aus diesem<br />

Grund soll hier die visualisierende Darstellung des konzeptionellen Modells aus der<br />

IDEF5 66 -Methodologie vorgestellt werden.<br />

In der sogenannten „schematischen Sprache 67 “ von IDEF5 sind Repräsentationssymbole<br />

für die einzelnen Modellierungsprimitive definiert, so dass strukturelle Zusammenhänge<br />

der aufgefundenen Wissenselemente visualisiert werden können. Dabei sind<br />

die Bedeutungen der Symbole vordefiniert, so dass eine eindeutige semantische Definition<br />

der Begrifflichkeiten sichergestellt ist. Abbildung 6 zeigt beispielhaft die Darstellung einer<br />

´Teil-von´– Relation. Die Konzepte sind als Kreise mit jeweiligen Bezeichnern dargestellt<br />

und die Relation als gerichtete, bipolare Verknüpfung mit der entsprechenden Bezeichnung.<br />

68 Da mit dieser Darstellungsmethode den Anforderungen an Repräsentationsschemata<br />

entsprochen wird (s. A.1.1.2) und außerdem die Darstellung von Bedeutungspostulaten<br />

bezüglich des ontologischen Levels der Wissensrepräsentation (s. A.2.1.2)<br />

möglich ist, kann es als geeignete Visualisierungsmethodik für die Konzeptionalisierungsphase<br />

der Ontologie-Entwicklung bezeichnet werden.<br />

Abbildung 6: Beispiel IDEF5-Modellierung 69<br />

B.1.3 Formalisierung<br />

In der dritten Phase des Ontologie-Entwicklungsprozesses wird das konzeptionelle<br />

Modell in eine formale Darstellung überführt, so dass die Maschinenlesbarkeit der Ontologie<br />

gewährleistet ist. Dazu werden spezifische Repräsentationsformalismen (s. A.1.1.2)<br />

verwandt, welche auf Grund ihrer Fähigkeit zur formalen Spezifikation von Ontologien<br />

auch als „Ontologie-Spezifikations-Sprachen 70 “ bezeichnet werden. In dieser Phase wird<br />

mit der Erstellung einer maschinenlesbaren Darstellung von Ontologien deren primäres<br />

Verwendungsziel als bedeutungsdefinierende Komponente in computergestützten<br />

Informationssystemen realisiert, weswegen die Forschungsaktivitäten auf diesem Feld<br />

weiter fortgeschritten sind als in anderen Phasen. Dabei ist für den hier untersuchten<br />

Zusammenhang kein Vergleich existenter Spezifikationsformalismen hinsichtlich deren<br />

Repräsentationsfähigkeiten interessant, sondern vielmehr eine genauere Betrachtung der<br />

66<br />

IDEF5 Ontology Description Capture Method: Methodologie zur Ontologie-Entwicklung aus dem IICE<br />

(Information Integration for Concurrent Engineering) – Projekt der KBSI (Knowledge Based Systems, Inc.), Texas,<br />

USA. Dieser Ansatz bietet eine methodologische Beschreibung des Ontologie-Entwicklungsprozesses, welcher eine<br />

differenzierte Betrachtung der Modellierungsprimitive, einen Erstellungsprozess für Ontologien und ein graphisches<br />

Repräsentationsschema sowie einen entsprechenden Repräsentationsformalismus beinhaltet (vgl. KBSI-94). Obwohl<br />

dieser Ansatz zeitlich vor den drei hier behandelten entwickelt wurde, wird er in der Literatur aus nicht direkt<br />

nachvollziehbaren Gründen nur selten erwähnt. Daher wird er hier lediglich ergänzend aufgeführt und nicht als<br />

methodologische Basis herangezogen. Weitere Informationen finden sich unter: http://www.idef.com (15.08.2002).<br />

67 engl.: „schematic language“ (KBSI-94, S. 64).<br />

68 Eine ausführliche Darstellung der Repräsentationssymbole und deren Verwendung findet sich in (KBSI-94, S. 64-<br />

101). Dabei werden auch mögliche Lösungen zur Modellierung komplexer Konzepte und Zusammenhänge gegeben,<br />

welche von Ontologie-Entwicklern als Referenz genutzt werden können - ähnlich wie Analysemuster aus dem Bereich<br />

des objektorientierten Software Engineering (s. Balzert99, S. 89-118).<br />

69 entnommen aus: (KBSI-94, S. 70).<br />

70 engl.: „Ontology Specification Languages“ (s. Corcho+00, S. 1).


Kapitel B: Ontologie-Entwicklung 33<br />

Anforderungen an derartige Repräsentationsformalismen – insbesondere im Hinblick auf<br />

die Analyse der webbasierten Ontologie-Spezifikations-Sprachen als entsprechende Formalismen<br />

für die formale Darstellung von Ontologien im Semantic Web (s. D.2). Dazu<br />

werden im Folgenden die wesentlichen Bewertungskriterien für Ontologie-Spezifikations-<br />

Sprachen erläutert und als entsprechendes Beispiel das Ontolingua-System vorgestellt,<br />

welches sich als Quasi-Standard für die formale Spezifikation von Ontologien etabliert<br />

hat.<br />

B.1.3.1 Anforderungen an Ontologie-Spezifikations-Sprachen<br />

Die Anforderungen an einen als Ontologie-Spezifikations-Sprache verwendbaren Repräsentationsformalismus<br />

lassen sich derart zusammenfassen, dass sie den Anforderungen an<br />

derartige Formalismen im Allgemeinen 71 genügen und eine Repräsentation von Wissensstrukturen<br />

auf dem ontologischen Level (s. A.2.1.2) erlauben müssen. Konkreter bedeutet<br />

dies, dass die in der Konzeptionalisierungsphase erfassten Strukturen der Wissensdomäne<br />

korrekt in die formalen Spezifikation übertragbar sein müssen und dass die Eindeutigkeit<br />

der entstandenen Ausdrücke durch eine entsprechende formale Semantik des Formalismus<br />

(s. A.1.1.2) gewährleistet sein soll. Während der letztere Aspekt bei den zur Verfügung<br />

stehenden Sprachen als gegeben angesehen werden kann, besteht die wesentliche<br />

Aufgabe des Ontologie-Entwicklers in der Auswahl eines geeigneten Formalismus<br />

hinsichtlich des ersteren Aspekts. Daher sollen die dazu erforderlichen Kenntnisse zur<br />

Bewertung der Spezifikationsfähigkeit einer solchen Sprache hier genauer untersucht<br />

werden.<br />

B.1.3.1.1 Spezifikationsfähigkeit<br />

Für die Bewertung der Ausdrucksstärke einer Ontologie-Spezifikations-Sprache sind<br />

deren Darstellungsmöglichkeiten für Modellierungsprimitive sowie für die im konzeptionellen<br />

Modell erfassten Zusammenhänge (s. B.1.2) zu betrachten. Dazu sollen hier<br />

Kriterien erläutert werden, die für einen Vergleich von Ontologie-Spezifikations-Sprachen<br />

herangezogen wurden (vgl. Corcho+00).<br />

Zunächst ist die Qualität der formalen Erfassung für die oben erläuterten Modellierungsprimitive<br />

zu bewerten. Zur Definition eines Konzeptes ist zu beachten, ob<br />

entsprechende Metaklassen zur Beschreibung des Konzeptes definiert werden können<br />

und damit die Darstellung einer taxonomischen Struktur der Konzepte möglich ist. Dabei<br />

kommt der Behandlung von Taxonomien besondere Bedeutung zu, da die taxonomische<br />

Struktur einer Ontologie konstituierenden Charakter hat und daher die darin erfassten<br />

Zusammenhänge richtig bezüglich der intendierten Bedeutung und explizit bezüglich ihrer<br />

eindeutigen Interpretation ausgedrückt werden müssen. 72 Für die Handhabung von Instanzen<br />

ist zu prüfen, ob diese sich als Unterklassen von Konzepten erzeugen lassen und<br />

71 Die allgemeine Anforderungen an Repräsentationsformalismen (zusammenfassend aus: A.1.1.2) sind:<br />

(1) qualitatives Wissen beschreiben,<br />

(2) neues Wissen durch inferenzielle Verknüpfungen generieren,<br />

(3) allgemeine und spezielle Zusammenhänge darstellen,<br />

(4) komplexe semantische Bedeutungen beschreiben und<br />

(5) Metawissen darstellen können.<br />

72 Es sind verschiedene Arten von Beziehungen zwischen Entitäten in einer Ontologie zu differenzieren, z.B. „is-a“ –<br />

und „is-part-of“ – Relationen. Eine genauere Betrachtung dieser Problematik wird in (B.2.2) vorgenommen.


Kapitel B: Ontologie-Entwicklung 34<br />

in wieweit ein Vererbungsmechanismus für zugehörige Attribute, Properties und Relationen<br />

unterstützt wird. Da Attribute und Properties zur Beschreibung von Eigenschaften<br />

der Konzepte und Instanzen verschiedenartige Charakteristika aufweisen können, sollten<br />

die diesbezüglichen Ausdrucksfähigkeiten der Sprache beachtet werden. Als wesentliche<br />

Aspekte seien hier die Unterscheidung von Konzept- und Instanzattributen sowie die<br />

Behandlung polymorpher Attribute, beziehungsweise Properties genannt. 73 Zur formalen<br />

Darstellung von Relationen ist zu beachten, wie diese mit Konzepten oder Instanzen<br />

verknüpft, ob Integritätsbeschränkungen angegeben und ob Definitionen für inferenzielle<br />

Funktionalitäten definiert werden können. Schließlich ist die Dokumentationsmöglichkeit<br />

innerhalb des Formalisierungs-Kodes zu berücksichtigen, wodurch die Verständlichkeit<br />

und damit die Wiederverwendbarkeit der Ontologie durch Dritte gewährleistet wird (s.<br />

Corcho+00, S. 1-2).<br />

Neben den Fähigkeiten zur formalen Erfassung und Manipulation der grundlegenden<br />

Modellierungsprimitive sollte eine Ontologie-Spezifikations-Sprache auch Möglichkeiten<br />

zur Darstellung von komplexeren Zusammenhängen mittels entsprechender inferenzieller<br />

Konstrukte bieten. Dazu ist – je nach angestrebtem Formalisierungsgrad – zu prüfen, in<br />

wieweit sich axiomatisierte Ausdrücke erstellen und verwenden lassen und ob sogenannte<br />

„Produktionsregeln 74 “ für die Spezifikation komplexer Prozessabläufe innerhalb der<br />

Domäne definiert werden können (s. Corcho+00, S. 2-3).<br />

B.1.3.1.2 Entwicklungsumgebung<br />

Eine Ontologie-Spezifikations-Sprache kann nur sinnvoll für die Formalisierung einer<br />

Ontologie genutzt werden, wenn sie in eine entsprechende Entwicklungsumgebung<br />

eingebettet ist. Dazu ist hinsichtlich der Operationalisierbarkeit die Qualität vorhandener<br />

Interpreter sowie die Möglichkeiten zur softwaretechnischen Integration der Ontologie in<br />

Informationssysteme zu berücksichtigen. Weiterhin sollte eine solche Entwicklungsumgebung<br />

geeignete Werkzeuge für die Entwicklung und die Handhabung von Ontologien<br />

bieten sowie den Zugang durch Dritte ermöglichen. Eine ausführlichere Diskussion<br />

derartiger Hilfsmittel geht über die grundsätzlichen Anforderungen an Ontologie-<br />

Spezifikations-Sprachen hinaus, weshalb in Tabelle 5 lediglich die wichtigsten Werkzeuge<br />

mit eine entsprechenden Erläuterung aufgelistet werden.<br />

Werkzeug<br />

Funktion<br />

Editor<br />

Editierung der formalen Darstellung.<br />

Browser Ansicht existenter Ontologien aus der Bibliothek.<br />

Wartung Wartung und Änderbarkeit der Ontologie.<br />

Übersetzer Übersetzung in andere Repräsentationsformalismen.<br />

Integrator Integration der Meta-Ontologie / anderer zu integrierender Ontologien.<br />

Tabelle 5: Werkzeuge einer Ontologie-Entwicklungsumgebung 75<br />

73 Durch diese Unterscheidungen aus der objektorientierten Software-Entwicklung können Bedeutungsunterschiede<br />

erfasst werden, ohne sie explizit zu formalisieren. Ein Konzept,- bzw. Klassenattribut hat den gleichen Wert für alle<br />

Instanzen während ein Instanzattribut einen spezifischen, temporären Wert für seine Instanz hat (s. Balzert99, S. 35).<br />

Polymorphe Attribute tragen nur eine Bezeichnung, je nach Kontext aber eine andere Bedeutung (s. Balzert99, S. 43).<br />

74 engl.: „production rules“ (Corcho+00, S. 2).<br />

75 nach: (s. Fernández+97, S. 6f). Übersetzung der Begrifflichkeiten durch den Autor.


Kapitel B: Ontologie-Entwicklung 35<br />

B.1.3.2 Ontolingua<br />

Mit dem Ontolingua-System können Ontologien derart dargestellt werden, dass sie mit<br />

der Darstellung in anderen Repräsentationsformalismen kompatibel sind. Somit dient die<br />

formale Erfassung einer Ontologie in der Ontolingua-Sprache als Austauschformat für<br />

Ontologien zwischen verschiedenen Systemumgebungen, so dass dieselbe Ontologie in<br />

verschiedenen technischen Umgebungen verwendet werden kann (s. Gruber93b, S. 5).<br />

Um eine derartige Funktionalität bieten zu können, muss die Spezifikationsfähigkeit von<br />

Ontolingua diejenigen aller zu unterstützenden Formalismen umfassen, was beim Vergleich<br />

von Ontologie-Spezifikations-Sprachen deutlich wird (s. Cocho+00, S.6-9). Da<br />

somit eine Referenz für entsprechende Sprachen entstand, hat Ontolingua sich als Quasi-<br />

Standard für die formale Spezifikation von Ontologien etabliert (s. Motta98, S. 4f) und<br />

soll daher hier stellvertretend vorgestellt werden.<br />

Die Spezifikation von Ontologien mit Ontolingua umfasst drei Teile. Zunächst existiert<br />

eine syntaktische Notation, mit der Wissenselemente durch die entsprechenden Modellierungsprimitive<br />

deklariert und mit einer natürlichsprachlichen Beschreibung versehen<br />

werden können. Als zweiter Teil können den einzelnen Wissenselementen KIF-<br />

Ausdrücke 76 zur Spezifikation inferenzieller Zusammenhänge zugefügt werden. Den dritten<br />

Teil bildet die Frame-Ontology 77 , welche formale Spezifikationen der Modellierungsprimitive<br />

enthält und als Wissensrepräsentations-Ontologie zur Definition von Ontologien<br />

in Ontolingua dient. Abbildung 7 zeigt als Beispiel für eine bibliographische Ontologie<br />

die Definition eines Konzeptes AUTHOR in Ontolingua, wobei der Autor mindestens<br />

ein Dokument erstellt haben muss und über seinen echten Namen identifiziert wird. Die<br />

drei Teile der Spezifikation sind durch Erläuterungen gekennzeichnet. Die Zeilen 1 bis 3<br />

um-fassen den Deklarationsteil und die Zeilen 4 bis 9 den Teil mit den KIF-Ausdrücken.<br />

Im letzteren werden zur Definition der Relationen in den Zeilen 5, 6 und 7 vordefinierte<br />

ontologische Relationen aus der Frame-Ontology genutzt. Die in diesen Ausdrücken<br />

referenzierten Objekte sind Attribute des Konzepts AUTHOR, die an anderer Stelle der<br />

Ontologie-Spezifikation definiert worden sind. In den Zeilen 8 und 9 werden die inferenziellen<br />

Beziehungen für den Zugehörigkeitsprüfung definiert (s. Gruber93b, S. 9f).<br />

KIF-<br />

Ausdrücke<br />

1<br />

2<br />

3<br />

4<br />

5<br />

6<br />

7<br />

8<br />

9<br />

Konzeptdeklaration<br />

Beschreibung<br />

(define-class AUTHOR (?author)<br />

" An author must have created at least one document. In<br />

this ontology, an author is known by his or her real name."<br />

:def (and (person ?author)<br />

(= (value-cardinality ?author AUTHOR.NAME) 1) Attribut-<br />

Relationen (value-type ?author AUTHOR.NAME biblio-name) Zugriffe<br />

(>= (value-cardinality ?author AUTHOR.DOCUMENTS) 1)<br />

( (author.name ?author ?name) inferenzielle Beziehungen<br />

(person.name ?author ?name))))<br />

Abbildung 7: Konzeptdefinition in Ontolingua 78<br />

76 KIF (Knowledge Interchange Format): deklarative Sprache basierend auf der Prädikatenlogik, welche vor allem<br />

<strong>zum</strong> Austausch von formalisierten Wissensstrukturen zwischen heterogenen Repräsentationsformalismen entwickelt<br />

wurde. Dabei stellt KIF keine Implementierungssprache dar, sondern dient lediglich der strukturierten Formalisierung<br />

von Wissensstrukturen (s. Gruber93, S. 4f).<br />

77 Eine Übersicht der definierten Elemente findet sich in (Gruber93b, S.22-23).<br />

78 entnommen aus: (Gruber93b, S. 10). Anmerkungen durch den Autor.


Kapitel B: Ontologie-Entwicklung 36<br />

Eine Entwicklungsumgebung im oben erläuterten Sinne wird mit dem „Ontolingua<br />

Server“ (vgl. Farquhar+96) bereitgestellt. Darin existiert ein Editor zur Ontologie-<br />

Erstellung, ein webbasierter Browser zur Ansicht von Ontologien sowie die Möglichkeit<br />

zur Wartung und Änderung von Ontologien als authentifizierter Benutzer des Servers.<br />

Die wichtigste Komponente stellen die Übersetzer zur Überführung von Ontologie aus<br />

Ontolingua in mehrere andere Repräsentationsformalismen dar. Abschließend sei angemerkt,<br />

dass Ontolingua selber kein Formalismus für eine konkrete Implementierung,<br />

sondern lediglich für die formale Spezifikation von Ontologien ist (s. Gruber93b, S.5f).<br />

B.1.4 Evaluation und Dokumentation<br />

Als abschließende Aktivitäten der Ontologie-Entwicklung werden in den drei eingangs betrachteten<br />

methodologischen Ansätzen die Evaluation sowie die Dokumentation genannt<br />

(s. Tabelle 2). Dabei wird – wie auch für andere Phasen – die Wichtigkeit der Qualitätsprüfung<br />

für Ontologien betont, jedoch werden nur relativ vage Aussagen zur konkreten<br />

Durchführung gemacht. ´Uschold, King´ weisen lediglich darauf hin, dass eine Ontologie<br />

evaluiert und dokumentiert werden sollte (Uschold+95, S. 4). Die Vollständigkeitstheoreme<br />

und die formalisierten Kompetenzfragen im Ansatz von ´Grüninger, Fox´ ermöglichen<br />

automatisierte Evaluation (Grüninger+95, S. 9), wodurch zwar die Richtigkeit der<br />

Schlussfolgerungsfähigkeiten der Ontologie geprüft, jedoch nicht die konzeptionelle Korrektheit<br />

evaluiert werden kann. In METHONTOLOGY werden die Evaluation sowie die<br />

Erstellung einer entsprechenden Dokumentation als begleitende Tätigkeiten in allen<br />

Phasen des Ontologie-Entwicklungs-Prozesses proklamiert (s. Fernández+97, S. 7f).<br />

Daraus wird ersichtlich, dass noch keine ausgereiften Mechanismen zur Qualitätsprüfung<br />

von Ontologien existieren, so dass hier lediglich die bisher aufgefundenen Erkenntnisse<br />

zusammenfasst werden können. Hinsichtlich der Dokumentation einer Ontologie<br />

steht vor allem deren Nutzbarkeit zur Entwicklung darauf basierender Applikationen<br />

im Vordergrund. Die Erläuterung dieser beiden Aspekte schließt die Betrachtung<br />

des Ontologie-Entwicklungs-Prozesses ab.<br />

B.1.4.1 Evaluation<br />

Die Evaluation von Ontologien wird wie in entsprechenden Vorgehensmodellen aus dem<br />

Bereich des Knowledge Engineering (vgl. Schreiber+00, S. 181f) in eine interne und eine<br />

externe Prüfung unterteilt. Bei der ersteren, bezeichnet als „Verifikation 79 “, wird die technische<br />

Korrektheit der formalen Darstellung hinsichtlich Syntax und Einbettung in die<br />

softwaretechnische Umgebung geprüft. In der letzteren wird die Erfüllung der Anforderungen<br />

aus der Spezifikationsphase (s. B.1.1.1) sowie die konzeptionelle Korrektheit der<br />

ontologischen Theorie (s. B.1.2.1) geprüft, weshalb diese Prüfung als „Validierung 80 “ bezeichnet<br />

wird. Für diese beiden Aspekte sollen im Folgenden Evaluationskriterien sowie<br />

typische Fehler bei der Ontologie-Entwicklung vorgestellt werden, welche aus den<br />

bisherigen Erfahrungen hervorgegangen sind und als Grundlage für die Entwicklung<br />

entsprechender Evaluationstechniken dienen können (s. Gómez-Pérez01, S. 407f).<br />

79 engl.: „Verfication“ (Gómez-Pérez01, S. 393).<br />

80 engl.: „Validation“ (Gómez-Pérez01, S. 393).


Kapitel B: Ontologie-Entwicklung 37<br />

B.1.4.1.1 Kriterien der Qualitätsprüfung<br />

Zur Evaluation der Qualität einer Ontologie ist sie unter den folgenden fünf Gesichtspunkten<br />

zu betrachten. Werden dabei keine Fehler aufgefunden, ist die Ontologie verifiziert<br />

und validiert. Das erste Kriterium ist die Konsistenz (engl.: „Consistency“), wobei<br />

die interpretatorische Eindeutigkeit aller erfassten Wissenselemente in der Ontologie zu<br />

prüfen ist. Die Konsistenz ist erreicht, wenn die informelle sowie die formale Definition<br />

jeweils eindeutig in ihrer intendierten Bedeutung sind und die Bedeutungsdefinitionen der<br />

informellen und der formalen Definition konsistent zueinander sind. Als zweites ist die<br />

Vollständigkeit (engl.: „Completeness“) zu prüfen. Als vollständig wird eine Ontologie<br />

bezeichnet, wenn alles zur antizipierten Funktionalität der Ontologie benötigte Wissen der<br />

Domäne direkt oder indirekt, also durch inferenzielle Ableitungen in der Ontologie erfasst<br />

ist. Konträr dazu wird mit dem dritten Kriterium der Prägnanz (engl.: „Conciseness“) die<br />

Vermeidung von Redundanz gefordert. Redundante Strukturerfassungen liegen vor, wenn<br />

zwei Elemente die gleiche formale Spezifikation aufweisen. Das vierte Kriterium der<br />

Erweiterbarkeit (engl.: „Expandability“) erfasst den Aufwand zur Änderung der Ontologie.<br />

Mit dem fünften Kriterium soll hinsichtlich der Stabilität (engl.: „Sensitiveness“) der<br />

Ontologie geprüft werden, inwiefern kleine Änderungen in der Ontologie signifikante<br />

Änderungen deren grundlegender Struktur hervorrufen. 81<br />

B.1.4.1.2 Typische Fehler der Ontologie-Entwicklung<br />

Zur Verdeutlichung der vorgestellten Kriterien zeigt Tabelle 6 einige typische Fehler auf,<br />

die bei der Ontologie-Entwicklung häufig beobachtet werden können.<br />

Fehlertyp<br />

Inkonsistenz<br />

Unvollständigkeit<br />

Redundanz<br />

Beispiel<br />

- Vererbung (z. B. Behandlung disjunkter / erschöpfender Spezialisierungen)<br />

- falsche semantische Klassifikation<br />

- fehlende, un<strong>vollständige</strong> Konzepte / Relationen<br />

- un<strong>vollständige</strong> Erfassung der taxonomischen Struktur<br />

mehrere Konzepte / Relation mit gleicher formaler Spezifikation<br />

Tabelle 6: Typische Fehler bei der Ontologie-Entwicklung 82<br />

B.1.4.2 Dokumentation<br />

Eine ausführliche und qualitativ hochwertige Dokumentation von Ontologien ist vor dem<br />

Hintergrund von deren Nutzung, Wiederverwendung und Integration als bedeutungsdefinierendes<br />

Konstrukt in mehreren Applikationen als ein wichtiger Aspekt zu betrachten.<br />

Obwohl einige Dienste, beispielsweise der angesprochene Ontolingua Server (s.<br />

B.1.3.2), die Einsicht in existente Ontologien ermöglichen, stellen diese Übersichten bisher<br />

proprietäre Lösungen dar. Um Entwicklern die Auswahl einer geeigneten Ontologie<br />

für die Entwicklung einer darauf basierenden Applikation oder zur Integration in eine<br />

neue Ontologie zu erleichtern, sollten für jede Ontologie entsprechende Informationen<br />

dokumentiert sein. Zu den wichtigsten Aspekten zählen dabei die spezifizierte Verwendung,<br />

die Beschreibung des konzeptionellen Modells sowie dessen Validierung, die<br />

Verifikation der formalen Darstellung sowie die Portabilität, also die Überführbarkeit in<br />

mögliche Implementierungssprachen (s. Gómez-Pérez01, S. 395-396).<br />

81 Die Kriterien sowie deren Erläuterung sind (Gómez-Pérez01, S. 394-395) entnommen. Die Übersetzung der<br />

Begriffe wurde durch den Autor vorgenommen, wobei jeweils das englische Original mit angegeben wurde.<br />

82 Fehlertypen und Beispiele entnommen aus (Gómez-Pérez01, S. 397-399). Übersetzungen durch den Autor.


Kapitel B: Ontologie-Entwicklung 38<br />

B.2 Qualitätssichernde Aspekte<br />

Anschließend an die Erläuterungen der Phasen des Ontologie-Entwicklungsprozesses<br />

sowie der dabei auftretenden Problemstellungen sollen weiterführende Errungenschaften<br />

des Ontology Engineering vorgestellt werden, durch deren Kenntnis und Beachtung bei<br />

der Ontologie-Entwicklung vor allem konzeptionelle Fehler vermieden oder <strong>zum</strong>indest<br />

gemindert werden sollen.<br />

Als erstes werden dazu sogenannte „Design-Kriterien 83 “ (B.2.1) vorgestellt. Damit<br />

werden Prinzipien beschrieben, die bei den Design-Entscheidungen für eine zu entwickelnde<br />

Ontologie von der initialen Planung in der Spezifikationsphase bis hin zur Formalisierung<br />

befolgt werden sollten. Dahinter steht die Zielsetzung, Ontologien als bedeutungsdefinierende<br />

Konstrukte so allgemein wie möglich zu halten und somit deren Verwendungsmöglichkeiten<br />

so vielfältig wie möglich zu gestalten. Als zweiter Aspekt soll die<br />

sogenannte „OntoClean Methodologie 84 “ als ein auf philosophischen Erkenntnissen<br />

beruhender Ansatz der Meta-Modellierung (B.2.2) vorgestellt werden. Darin wird eine<br />

differenzierte Analyse der Charakteristika von Wissenselementen und deren Beziehungen<br />

untereinander für ein vertiefendes Verständnis ontologischer Modellierungsprimitive<br />

gegeben und außerdem eine Evaluationstechnik zur Validierung der taxonomischen<br />

Struktur von Ontologien entwickelt.<br />

Durch die im Folgenden vorzustellenden Aspekte sollen dem Ontologie-Entwickler<br />

vertiefende Kenntnisse zur Verfügung gestellt werden, mit deren Hilfe <strong>zum</strong> einen die<br />

angestrebte „Teilung von Wissen 85 “, also die Nutzung einer gemeinsamen Verständnisgrundlage<br />

einer Wissensdomäne als ein Hauptziel ontologiebasierter Wissensmodellierung,<br />

verbessert werden kann und <strong>zum</strong> anderen typische Fehler in der Konzeptionalisierungs-<br />

und Formalisierungsphase (s. B.1.4.1.2) der Ontologie-Entwicklung vermieden<br />

werden können. Daher vermag die Berücksichtigung dieser Kenntnisse bei der Entwicklung<br />

von Ontologien zur Erhöhung der Qualität beitragen, weshalb der zweite Teil<br />

dieses Kapitels entsprechend mit ´Qualitätssichernde Aspekte´ betitelt wurde.<br />

B.2.1 Designkriterien<br />

Unter dem Designaspekt einer Ontologie werden Entscheidungen darüber verstanden,<br />

wie diese aufgebaut, strukturiert und dargestellt werden soll, um die antizipierte Funktionalität<br />

gewährleisten zu können. Dabei determinieren die funktionalen Anforderungen an<br />

eine Ontologie die Art und Weise des Aufbaus und der Darstellung der erfassten Wissensstrukturen<br />

in allen Entwicklungsphasen (s. Gruber93, S. 2). Werden dafür allgemein<br />

gehaltene Vorgaben zur Handhabung derartiger Implikationen erstellt, so können diese als<br />

Design-Prinzipien bezeichnet werden. Hier sollen jene von Gruber definierten Prinzipien<br />

vorgestellt werden, die er als Design-Kriterien bezeichnet. Diese umfassen die grundlegenden<br />

Design-Entscheidungen und werden in der Literatur jeweils als die wesentlichen<br />

Design-Prinzipien referenziert. (vgl. Uschold+96, S. 17f; Gómez-Pérez99, S.2). In Tabelle<br />

7 werden diese Kriterien aufgelistet und erläutert.<br />

83 engl.: „design criteria“ (Gruber93, S. 2).<br />

84 engl.: „OntoClean methodology“ (Guarino+02).<br />

85 engl.: „knowledge sharing“(Gruber93, S. 0 (Abstract)).


Kapitel B: Ontologie-Entwicklung 39<br />

Kriterium<br />

Klarheit<br />

(engl.: „Clarity“)<br />

Kohärenz<br />

(engl.: „Coherence“)<br />

Erweiterbarkeit<br />

(engl.: „Extendibility“)<br />

Minimaler Implementierungseinfluss<br />

(engl.: „minimal encoding<br />

bias“)<br />

Minimale ontologische<br />

Verpflichtung<br />

(engl.: „minimal ontological<br />

commitment“)<br />

Beschreibung<br />

Mit diesem Kriterium wird die definitorische Klarheit, also eine möglichst objektive,<br />

allgemein verständliche Beschreibung der in der Ontologie erfassten<br />

Wissenselemente gefordert. Sind Zusammenhänge axiomatisiert, so<br />

sollen entsprechend notwendige und hinreichende Bedingungen definiert<br />

werden. Weiterhin wird für jedes erfasste Wissenselement eine natürlichsprachliche<br />

Beschreibung gefordert.<br />

Hiermit wird die schon im Zusammenhang der Evaluation (s. B.1.4.1.1) erwähnte<br />

Konsistenz der beschriebenen Wissensstrukturen innerhalb einer<br />

Ontologie gefordert. Dieses erstreckt sich nicht nur über die interpretative<br />

Eindeutigkeit einzelner Elemente, sondern auch auf deren strukturellen Zusammenhang.<br />

Die ebenfalls im Rahmen der Evaluation erwähnte Erweiterbarkeit einer<br />

Ontologie sollte bei Design-Entscheidungen berücksichtigt werden. Je einfacher<br />

eine Ontologie zu erweitern ist, desto besser kann sie für die Verwendung<br />

in einer konkreten Anwendungssituation modifiziert werden.<br />

Hierunter wird verstanden, dass bei der formalen Spezifikation einer Ontologie<br />

keine implementierungstechnischen Aspekte eines eventuell favorisierten<br />

Repräsentationsformalismus berücksichtigt werden sollen, da Ontologien<br />

die Beschreibung von Wissensdomänen auf der Wissensebene (s.<br />

A.1.1.1) darstellen. Dieses Kriterium ist unter dem Hintergrund zu verstehen,<br />

dass dessen Autor im Ontolingua-Projekt (s. B.1.3.2) tätig war und<br />

daher Ontologien in erster Linie als formale Spezifikation einer ontologischen<br />

Theorie (s. B.1.2.2) ohne Implementierungsziel versteht.<br />

Dieses Kriterium besagt, dass eine Ontologie von den sie nutzenden Agenten<br />

eine möglichst geringe ontologische Verpflichtung (s. A.2.1.1) verlangen<br />

sollte. Dass bedeutet, dass die ontologische Theorie möglichst wenig<br />

wertende Annahmen über die Wissensdomäne beinhaltet und somit den<br />

Agenten größtmögliche interpretative Freiheiten erlaubt. Dadurch soll ein<br />

breites Verwendungsfeld der Ontologie durch Nutzer mit unterschiedlichen<br />

Inten-ionen ermöglicht werden.<br />

Tabelle 7: Design-Kriterien für Ontologien 86<br />

Die ersten beiden Kriterien (Klarheit und Kohärenz) beziehen sich auf die konzeptionelle<br />

Korrektheit der in der Ontologie erfassten Wissensstruktur. Mit den Forderungen<br />

nach hoher Erweiterbarkeit und einer minimalen ontologischen Verpflichtung soll die<br />

ermöglichte Wissensteilung durch eine Ontologie als generelles Ziel ontologiebasierter<br />

Wissensmodellierung erhöht werden. Die Forderung nach minimalem Implementierungseinfluss<br />

soll den bedeutungsdefinierenden Charakter einer Ontologie als Domänenbeschreibung<br />

auf der Wissensebene verdeutlichen. Die Ähnlichkeit dieser Design-Kriterien<br />

mit den oben vorgestellten Kriterien zur Evaluation von Ontologien (s. B.1.4.1.1) beruht<br />

auf der gleichartigen Zielsetzung der Qualitätssicherung und impliziert, dass durch deren<br />

Berücksichtung während der Entwicklung die Qualität einer Ontologie verbessert werden<br />

kann.<br />

86 Kriterien und Erläuterungen entnommen aus (Gruber93, S. 2f). Übersetzungen durch den Autor, wobei für die<br />

Kriterienbezeichnung das englische Original mit angegeben wurde. Weitere Prinzipien mit ähnlicher Zielsetzung sind<br />

in (Gómez99, S.2f) aufgeführt.


Kapitel B: Ontologie-Entwicklung 40<br />

B.2.2 Meta-Modellierung<br />

Als weiterer Aspekt der Qualitätssicherung der Ontologie-Entwicklung soll ein methodologischer<br />

Ansatz vorgestellt werden, aus dem ein vertiefendes Verständnis der für die<br />

Ontologie-Entwicklung zur Verfügung stehenden Modellierungsprimitive gewonnen<br />

werden kann und der weiterhin eine formale Evaluation taxonomischer Strukturen als<br />

strukturgebende Basis einer Ontologie ermöglicht. Forschungsarbeiten im Rahmen dieses<br />

Ansatzes, auf Grund seiner evaluatorischen Fähigkeiten auch als „OntoClean Methodologie<br />

87 “ bezeichnet, werden seit Mitte der 1990er Jahre im Umfeld von N. Guarino und<br />

C. Welty durchgeführt. 88 Ziel der Arbeiten ist die Entwicklung einer Methodologie zur<br />

„ontologiebasierten konzeptuellen Analyse 89 “, worin die im Folgenden vorzustellende<br />

Methodik den funktionalen Kern bildet (s. Guarino+00a, S. 1).<br />

Die Methodologie beruht auf Basisbegriffen aus der philosophischen Ontologie<br />

(´Lehre des Seins´, vgl. A.), mit welchen die „ontologische Natur 90 “, also die wesensbeschreibenden<br />

Charakteristika von Entitäten und deren Beziehungen untereinander<br />

genauer erfasst werden können. Diese Begrifflichkeiten sind <strong>zum</strong> einen derart allgemein<br />

definiert, dass sie domänenunabhängig zur charakterlichen Beschreibung aufgefundener<br />

Wissenselemente und -strukturen verwandt werden können. Zum anderen sind sie als formale<br />

Ausdrücke definiert, so dass sich daraus allgemeingültige, regelhafte Beschränkungen<br />

für Relationen zwischen Wissenselementen bezüglich deren ontologischer Korrektheit<br />

ableiten lassen. Mit Hilfe dieser wesensbeschreibenden, formalen Begrifflichkeiten als<br />

sogenannte „Meta-Properties 91 “ können Taxonomien validiert werden. Dazu wird jedes<br />

Wissenselement einer taxonomischen Struktur im Sinne einer Meta-Modellierungs-<br />

Sprache (s. Guarino+00, S. 1) mit den Basisbegriffen beschrieben. An Hand der allgemeinen<br />

Regeln und Beschränkungen kann die taxonomische Struktur bezüglich Inkonsistenzen<br />

oder verfälschender Modellierungsentscheidungen auf eine formale Art und<br />

Weise evaluiert und korrigiert werden.<br />

Der Begriff der Taxonomie hat in diesem Ansatz entscheidende Bedeutung und soll<br />

daher genauer betrachtet werden. Eine Taxonomie beschreibt die Struktur von Wissenselementen<br />

einer Domäne in einer Hierarchie, die ausschließlich durch Subsumptions-<br />

Relationen (auch „is_a“- oder „Subclass“-Relation) gebildet wird (s. Guarino+00b, S. 63).<br />

Eine Subsumptions-Relation liegt vor, wenn die wesensdefinierenden Eigenschaften einer<br />

untergeordneten Klasse denen der ihr übergeordneten Oberklasse entsprechen und somit<br />

eine Vererbung im Sinne von Spezialisierung und Generalisierung besteht (s. Luger01, S.<br />

252ff). Taxonomische Strukturen eignen sich gut für eine leicht verständliche Darstellung<br />

87 engl.: „OntoClean methodology“ (Guarino+02).<br />

88 NICOLA GUARINO: Wissenschaftler am ´Institute for System Theory and Biomedical Engineering of the Italian<br />

National Research COUNCIL (CNR)´, Padova, Italien. CHRISTOPHER WELTY: Assistant Professor for Computer<br />

Science, Vassar College in Poughkeepie, New York, USA.<br />

89 engl.: „ontology-driven conceptual analysis (ODCA)“ (Guarino+00a, S. 1).<br />

90 engl.: „ontological nature“ (Guarino+00a, S. 1).<br />

91 Der Begriff „Meta-Property“ (Guarino+00a, S. 1) wird hier als Terminus Technicus beibehalten. Es sei an dieser<br />

Stelle auf die andersartige Verwendung der Begrifflichkeiten durch die Autoren im Vergleich zu den bisherigen Ausführungen<br />

hingewiesen. In der vorliegenden Literatur zu diesem Themengebiet wird der Begriff ´Property´ als Oberbegriff<br />

aller Bestandteile einer Ontologie verwendet, während in dieser Ausarbeitung eine Property als Modellierungsprimitivum<br />

für Eigenschaften verwendet wurde (s. B.1.2.1). Um eine begriffliche Einheitlichkeit in den<br />

Ausführungen zu erhalten, wird im weiteren Verlauf ´Wissenselement´ als entsprechender Oberbegriff verwendet.


Kapitel B: Ontologie-Entwicklung 41<br />

von Zusammenhängen, weshalb sie insbesondere im Bereich der konzeptionellen Modellierung<br />

vielfach eingesetzt werden. Dabei werden häufig fälschlicherweise Subsumptions-<br />

Relationen proklamiert, was sowohl auf die Ausnutzung der strukturierenden Funktion als<br />

auch auf methodische Unkenntnisse zurückgeführt wird (s. Guarino+02, S. 63ff). In<br />

konventionellen softwaretechnischen Bereichen dient eine solche vom Prinzip her fehlerhafte<br />

Verwendung von Subsumptions-Relationen häufig als Hilfsmittel zur technischen<br />

Realisierung, welche keine Auswirkungen auf die funktionale Qualität des Systems hat.<br />

Die diesbezügliche Korrektheit von Taxonomien als strukturkonstituierende Basis von<br />

Ontologien ist dagegen als sehr wichtig zu betrachten, da die ontologische Theorie durch<br />

die Definition fehlerhafter Subsumptions-Beziehungen ihrem Anspruch als korrektes und<br />

allgemeines Verständnismodell der Domäne nicht gerecht werden kann. Daher wird mit<br />

dem hier vorgestellten Ansatz das Ziel verfolgt, die taxonomische Struktur einer Ontologie<br />

hinsichtlich der Richtigkeit proklamierter Subsumptions-Relationen mit Hilfe einer<br />

differenzierten Analyse der Wesenseigenschaften der erfassten Wissenselemente zu evaluieren<br />

(s. Guarino+00b, S. 3-5).<br />

Aus diesem methodologischen Ansatz können zweierlei Erkenntnisse gewonnen<br />

werden. Zum einen bieten die Basisbegriffe ein vertiefendes Verständnis zur korrekten<br />

Verwendung der Modellierungsprimitive für eine valide Konzeptionalisierung (s. B.1.2).<br />

Zum anderen ergibt sich durch deren Nutzung zur Meta-Modellierung eine formale, theoretisch<br />

fundierte Methodik zur qualitativen Analyse des konzeptionellen Modells, welche<br />

als Evaluationstechnik zur Qualitätsprüfung von Ontologien (s. B.1.4.1.1) verwendet<br />

werden kann. Um diese Aspekte herauszuarbeiten, werden im Folgenden zunächst die<br />

Basisbegriffe sowie die daraus resultierenden Implikationen als theoretisches Fundament<br />

dieses Ansatzes erläutert und anschließend die darauf basierende Methodik zur Validierung<br />

von Taxonomien vorgestellt.<br />

B.2.2.1 Theoretische Grundlagen<br />

Der Vorstellung der Basisbegriffe dieses methodologischen Ansatzes ist zunächst eine<br />

kurze Erläuterung ihrer Herkunft voranzustellen. Es handelt sich dabei um grundlegende<br />

Begrifflichkeiten der sogenannten „Formalen Ontologie 92 “, welche sich mit Objekten der<br />

realen Welt und deren Verknüpfungen beschäftigt, dafür formale Aussagen definiert und<br />

so die ontologische Natur, also die Wesenseigenschaften betrachteter Objekte mittels allgemeingültiger<br />

Beschreibungen erfassen möchte (s. Smith98, S.1). Ohne ausführlicher auf<br />

die Erkenntnisse dieser philosophische Disziplin einzugehen, seien hier die drei wesentlichen<br />

theoretischen Grundlagen genannt. Die erste ist die als Mereologie bezeichnete<br />

formale Theorie der Relation zwischen Teil und Ganzem (s. Brockhaus96 Bd. 14, S. 512).<br />

Die Topologie als mathematische Theorie zur Strukturierung von Räumen und Gegenständen<br />

(s. Brockhaus96-14 Bd. 22, S. 186ff) stellt die zweite Theoriebasis dar und die<br />

dritte ist die Theorie der Abhängigkeit 93 , worin existentielle Abhängigkeiten zwischen<br />

Objekten untersucht werden.<br />

92 engl.: „Formal Ontology“ (Smith98, S.1).<br />

93 engl.: „theory of dependence“ (Smith98, S. 1).


Kapitel B: Ontologie-Entwicklung 42<br />

B.2.2.1.1 Basisbegriffe<br />

Zur Erläuterung der Basisbegriffe werden diese zunächst in Tabelle 8 übersichtlich dargestellt<br />

und deren Definition natürlichsprachlich wiedergegeben. 94 Weiterhin wird in der<br />

Tabelle die Notation angegeben, welche bei der Zuweisung der Basisbegriffe als Meta-<br />

Properties zu Wissenselementen einer Taxonomie zwecks deren Validierung (s. B.2.2.2)<br />

verwendet wird. Dazu werden drei dem Symbol für den Basisbegriff vorangestellte Präfixe<br />

genutzt. (+) bedeutet, dass alle Instanzen des Wissenselementes die Meta-Property erfüllen.<br />

Als Gegenteil dazu bedeutet (-), dass nicht alle Instanzen sie tragen. (~) besagt,<br />

dass keine Instanz diese Meta-Property erfüllt, was eine stärkere Einschränkung darstellt<br />

als (-) (s. Guarino+ 00a, S. 1). Anschließend an die tabellarische Übersicht soll die Bedeutung<br />

der Basisbegriffe für die Wesensbeschreibung von Wissenselementen und -strukturen<br />

an Hand entsprechender Beispiele verdeutlicht werden.<br />

Basisbegriff Erläuterung Notation<br />

Rigidität<br />

(engl.: „rigidity“)<br />

Ein Wissenselement ist rigide, wenn es für alle seine Instanzen<br />

essentiell ist: Also, wenn es immer wahr ist und sich nicht ändert.<br />

+R, -R, ~R<br />

Identität<br />

(engl.: „identity“)<br />

Über ihre Identität können einzelne Wissenselemente identifiziert<br />

werden. Diese ist durch die Ungleichheit zweier Entitäten bezüglich<br />

eines Identitätskriteriums (eine charakterisierende Eigenschaftsbedingung,<br />

die notwendig oder hinreichend ist) in einer sogenannten<br />

„Identitätskondition 95 “ (IC) definiert. Nur rigide Entitäten können ICs,<br />

also eine eigene Identität tragen; diese kann an nicht-ridige Unterklassen<br />

vererbt werden. Ein Wissenselement unterstützt eine IC,<br />

wenn es selber diese IC trägt, aber sie nicht von allen seinen untergeordneten<br />

Elementen getragen wird.<br />

+I, -I<br />

(Identität<br />

tragend)<br />

+O, -O<br />

(Identität<br />

unterstützend)<br />

Zusammengehörigkeit<br />

(engl.: „unity“)<br />

Durch die Zusammengehörigkeit wird erfasst, ob ein Wissenselement<br />

ein Ganzes, also eine abgeschlossene und eigenständige Entität<br />

darstellt. Dies ist der Fall, wenn alle seine Teile miteinander und<br />

mit nichts anderem verbunden sind. Ein Wissenselement trägt eine<br />

„Zusammengehörigkeitsbedingung 96 “ (UC), wenn alle seine Instanzen<br />

zu allen Zeitpunkten Ganze sind.<br />

+U, -U, ~U<br />

Abhängigkeit<br />

(engl.: „dependence“)<br />

Ein Wissenselement ist abhängig von einem anderen, wenn es ohne<br />

das Andere nicht existieren kann.<br />

Tabelle 8: Basisbegriffe der OntoClean Methodologie 97<br />

+D, -D<br />

Die folgenden Beispiele sollen die Möglichkeit zur expliziten Beschreibung der intendierten<br />

Bedeutung aufgefundener Wissenselemente durch die Annotation mit den Basisbegriffen<br />

in einer Taxonomie verdeutlichen. Mit der Rigidität kann beispielsweise ein wesentlicher<br />

Unterschied zwischen PERSON und STUDENT beschrieben werden. Während<br />

eine PERSON immer eine solche ist (also +R), ist der Studentenstatus temporär für den<br />

Zeitraum der Immatrikulation und somit anti-rigide (~R) (s. Guarino+02, S. 62).<br />

94 Auf eine Erläuterung der formalen Definitionen wird hier verzichtet, da dies den Rahmen dieser Untersuchung<br />

sprengen würde (siehe dazu Guarino+00a, S.2-4).<br />

95 engl.: „identity condition“ (Guarino+00a, S. 3), abgekürzt als IC.<br />

96 engl. „unity condition“ (Guarino+00a, S. 3), abgekürzt als UC.<br />

97 Basisbegriffe und Erläuterungen aus (Guarino+00a, S. 2-4) und (Guarino+02, S.61-63). Übersetzungen durch den<br />

Autor mit Angabe des englischen Originals.


Kapitel B: Ontologie-Entwicklung 43<br />

Die Problematik der Identitätsbestimmung kann an Hand einer fehlerhaften Subsumptions-Relation<br />

erläutert werden, wozu das Wissenselement INTERVALL dem Element ZEIT-<br />

DAUER untergeordnet sein soll (intendierte Bedeutung: jedes Intervall ist eine Zeitdauer).<br />

Hat man nun zwei Instanzen von INTERVALL von je 1 Stunde, so sind diese als Instanzen<br />

von ZEITDAUER gleich, da die Zeitspanne dafür das Identitätskriterium darstellt und hier<br />

den gleichen Wert hat. Diese Subsumption ist insofern falsch, da jede Instanz eines untergeordneten<br />

Elementes auch genau eine Instanz des übergeordneten sein muss (s. Guarino<br />

+02, S. 62f). Zur Verdeutlichung einer unterstützten Identität kann wieder das Person-<br />

Student-Beispiel mit PERSON als übergeordnetem Element aufgegriffen werden. Das Identitätskriterium<br />

für PERSON, beispielsweise die Sozialversicherungsnummer, wird zwar von<br />

direkten Instanzen getragen, aber STUDENT trägt eine eigene Identität, z.B. die Immatrikulationsnummer.<br />

Somit ist PERSON mit (+O), STUDENT aber nur mit (+I-O) zu beschreiben<br />

(s. Guarino+00a, S. 3).<br />

Auch die Zusammengehörigkeit kann an einer fehlerhaften Subsumptions-Relation erläutert<br />

werden. WASSER möge dem Element OZEAN übergeordnet sein. Hierbei ist WASSER<br />

nicht als ein Ganzes zu verstehen (~U), da es nicht isoliert betrachtbar ist. Ein Ozean hingegen<br />

stellt ein Ganzes dar (bestehend aus einer Menge von Wasser, Lebewesen, etc.) und<br />

kann mit (+U) beschrieben werden. Der Subsumptionsfehler liegt in einer Vererbung<br />

zwischen Entitäten mit unterschiedlichen Wesenseigenschaften (s. Guarino+02, S. 63).<br />

Ein Beispiel für die Abhängigkeit stellt die Entität HAUS (+D) dar, welche unter anderem<br />

existenziell von WAND abhängig ist (s. Guarino+00a, S. 4).<br />

B.2.2.1.2 Implikationen<br />

Wie an den Beispielen deutlich wurde, können mit Hilfe der Basisbegriffe wesenscharakterisierende<br />

Unterschiede zwischen Wissenselementen aufgefunden und diese dann<br />

als Meta-Properties den jeweiligen Wissenselementen zugewiesen werden. Entsprechend<br />

der Definition einer Subsumptions-Relation, wonach eine derartige Vererbungsstruktur<br />

nur dann vorliegt, wenn alle Instanzen eines untergeordneten Elementes auch Instanzen<br />

des übergeordneten sind (s.o.), können regelhafte „Beschränkungen 98 “ für korrekte<br />

Subsumptions-Relationen zwischen Wissenselementen auf Grund ihrer Meta-Properties<br />

definiert werden. Diese dienen als Ausgangspunkt zur Validierung von Taxonomien und<br />

werden in Tabelle 9 zusammenfassend aufgelistet.<br />

Basisbegriff<br />

resultierende Beschränkung<br />

Rigidität 1) (+R) kann nicht von (~R) erben.<br />

Identität 2) (-I) kann nicht von (+I) erben.<br />

Zusammengehörigkeit 3) (-U) kann nicht von (+U) erben.<br />

4) (+U) kann nicht von (~U) erben.<br />

Abhängigkeit 5) (-D) kann nicht von (+D) erben.<br />

Tabelle 9: Beschränkungen für Subsumptions-Relationen in Taxonomien 99<br />

98 engl.: „Constraints“ (Guarino+00a, S. 4).<br />

99 Definitionen nach (Guarino+00a, S. 4f). Weitere dort genannte, aber im Hinblick auf die Taxonomie-Validierung<br />

nicht relevante Implikationen sind: (1) Wissenselemente mit inkompatiblen Identitätsbedingungen sind disjunkt. (2)<br />

Wissenselemente mit inkompatiblen Zusammengehörigkeitsbedingungen sind disjunkt.


Kapitel B: Ontologie-Entwicklung 44<br />

B.2.2.2 Taxonomie-Validierung<br />

Wie schon angesprochen, kann die taxonomische Struktur eines konzeptionellen Modells<br />

durch die Beschreibung der Wissenselemente mit den vorgestellten Meta-Properties<br />

evaluiert werden, indem die Korrektheit von Subsumptions-Relationen an Hand der ebenfalls<br />

vorgestellten Beschränkungen geprüft wird. Da diese Evaluationsmethodik lediglich<br />

eine Anwendung der bisher ausgeführten Aspekte dieses methodologischen Ansatz ohne<br />

signifikante neuartige Erkenntnisse darstellt, wird sie hier nur kurz besprochen. Vor der<br />

Erläuterung der einzelnen Schritte des Verfahrens soll zunächst der bei diesem Verfahren<br />

wesentliche Begriff der sogenannten „Basis-Taxonomie 100 “ erläutert werden.<br />

B.2.2.2.1 Basis-Taxonomie<br />

Die sogenannte Basis-Taxonomie besteht nur aus den rigiden Wissenselementen der<br />

erfassten taxonomischen Struktur. Somit sind lediglich die invarianten Elemente der betrachteten<br />

Wissensdomäne erfasst, welche die essentielle Struktur der Domäne beschreiben<br />

und somit konstituierenden Charakter haben. Das Ziel bei der Erfassung dieser<br />

grundlegenden Taxonomie ist eine übersichtliche Darstellung der wesentlichen Aspekte<br />

einer Domäne, welche die Zuordnung weiterer Wissenselemente vereinfachen soll. Des<br />

Weiteren können verschiedene Ontologien bezüglich ihrer Basis-Taxonomien verglichen<br />

werden, wodurch die Integration von Ontologien erleichtert wird (s. Guarino+02, S. 63).<br />

Drei Arten von Wissenselementen 101 werden als Bestandteile der Basis-Taxonomie<br />

unterschieden. Erstens sogenannte „Kategorien 102 “ mit den Meta-Properties (+R -I -O),<br />

welche allgemein als abstrakte Elemente die höchste Hierarchie-Ebene bilden. Zweitens<br />

„Typen 103 “ mit den Meta-Properties (+R +I +O), mit denen die in der Domäne existenten<br />

Wissenselemente im Sinne von Datentypen beschrieben werden und drittens sogenannte<br />

„Quasi-Typen 104 “ mit den Meta-Properties (+R +I -O), welche die gleiche<br />

Funktion haben wie „Typen“, jedoch keine Identitäten unterstützen (s. Guarino+00b, S.<br />

10-12).<br />

B.2.2.2.2 Vorgehensmodell<br />

Auf der Grundlage der bisher erarbeiteten theoretischen Aspekte kann die Validierung<br />

von Taxonomien durch einen sechsstufigen Prozess durchgeführt werden, welcher in<br />

Abbildung 8 aufgeführt wird. Dabei wird das konzeptionelle Modell aus der Konzeptionalisierungsphase<br />

lediglich bezüglich seiner taxonomischen Struktur, jedoch nicht<br />

bezüglich der erfassten Wissenselemente geprüft und verbessert. Somit stellt dieses Verfahren<br />

eine formale Evaluationstechnik für die Qualitätskriterien der Konsistenz und der<br />

Prägnanz einer Ontologie dar, welches aber die anderen oben aufgeführten Kriterien (s.<br />

B.1.4.1.1) nicht zu überprüfen vermag.<br />

100 engl.: „Backbone Taxonomie“ (Guarino+00a, S. 5): Hier wurde eine freie Übersetzung mit gleichartiger<br />

Bedeutung durch den Autor gewählt, da die wörtliche im Deutschen unpassend erschien.<br />

101 In (Guarino+00b, S. 10-14) wird eine Ontologie von Wissenstypen-Arten vorgestellt, welche auf einer Differenzierung<br />

der möglichen Kombinationen der hier vorgestellten Meta-Properties beruht.<br />

102 engl.: “Categories” (Guarino+00b, S. 11).<br />

103 engl.: “Types” (Guarino+00b, S. 11).<br />

104 engl.: “Quasi-Types” (Guarino+00b, S. 12).


Kapitel B: Ontologie-Entwicklung 45<br />

Schritte der Taxonomie-Validierung<br />

1) Wissenselemente mit Meta-Properties beschreiben.<br />

2) Konsistenzcheck* für alle Wissenselemente, eventuelle Korrektur.<br />

3) Basis-Taxonomie erstellen (alle nicht-rigiden Elemente entfernen).<br />

4) Konsistenzcheck* der Basis-Taxonomie, eventuelle Korrektur.<br />

5) andere Wissenselemente wieder hinzufügen, Konsistenzcheck*.<br />

6) eventuell fehlende Konzepte hinzufügen, so dass in der validierten<br />

Taxonomie keine Konsistenzverletzungen mehr vorhanden sind.<br />

* bezüglich der Beschränkungen für korrekte Subsumptions-Relationen (s. Tabelle 9).<br />

Abbildung 8: Taxonomie-Evaluation mit OntoClean 105<br />

B.3 Abschließende Bemerkungen<br />

Wie die vorhergehenden Ausführungen zeigen, liegt ein grundsätzliches Verständnis der<br />

Aufgaben- und Problemstellungen bei der Entwicklung von Ontologien als bedeutungsdefinierende<br />

Beschreibung von Wissensdomänen vor. Allerdings wird auch deutlich, dass<br />

die existenten Lösungsansätze jeweils nur partielle Problemstellungen bearbeiten und dass<br />

sie weiterhin aus unabhängigen und voneinander getrennt arbeitenden Forschungsaktivitäten<br />

hervorgegangen sind und somit lediglich proprietäre Lösungen darstellen. Daher<br />

kann festgehalten werden, dass die Erstellung umfassender ingenieursartiger Methodologien<br />

als Ziel des Ontology Engineering bisher noch nicht erreicht worden ist, weshalb<br />

die Ontologie-Entwicklung derzeit „ ... eher eine Kunstfertigkeit als einer Ingenieurstätigkeit<br />

darstellt. 106 “ Im Folgenden sollen <strong>zum</strong> Abschluss der Ausführungen zur<br />

Ontologie-Entwicklung die sehr breit gefächerten Aufgabengebiete innerhalb des Entwicklungsprozesses<br />

von Ontologien aufgezeigt sowie diese Aspekte betreffende Forderungen<br />

zur Integration entsprechender Kenntnisse aus verschiedenen Wissenschaftsdisziplinen<br />

in eine umfassende Methodologie dargelegt werden.<br />

Die unterschiedlichen Kompetenzanforderungen an Ontologie-Entwickler sollen an<br />

Hand einer sukzessiven Erläuterung der wesentlichen Aufgabengebiete in den einzelnen<br />

Phasen des oben besprochenen Ontologie-Entwicklungsprozesses (s. B.1.) herausgestellt<br />

werden. In der Spezifikationsphase werden für die Anforderungsanalyse <strong>zum</strong> einen<br />

Kenntnisse über das antizipierte Einsatzfeld der zu entwickelnden Ontologie und <strong>zum</strong><br />

anderen softwaretechnische Kenntnisse für die Verwendungskonzeption der Ontologie<br />

innerhalb eines computergestützten Informationssystems benötigt. Weiterhin müssen die<br />

Techniken zur Wissensakquisition beherrscht werden. Zur Erstellung eines hinsichtlich<br />

der ontologischen Theorie validen konzeptionellen Modells in der Konzeptionalisierungsphase<br />

sind vor allem analytische Fähigkeiten, Kenntnisse über die zur Verfügung<br />

stehenden Modellierungsprimitive für eine korrekte Handhabung sowie über die Methoden<br />

für deren Darstellung relevant. Wichtig ist hier auch die Fähigkeit zur Konsensfindung,<br />

um ein von allen Beteiligten akzeptierten Verständnismodells der betrachteten<br />

Wissensdomäne entwickeln zu können. In der Formalisierungsphase werden program-<br />

105 Die Schritte sowie die Beschreibungen sind (Guarino+00a, S. 5ff) entnommen. Darin findet sich ein ausführlich<br />

dokumentiertes Beispiel zur Taxonomie-Validierung mit OntoClean.<br />

106 „ The ontology building process is rather a craft than an engineering activity. “ (Gómez99, S. 37).


Kapitel B: Ontologie-Entwicklung 46<br />

miertechnische Fähigkeiten zur Erstellung einer korrekten formalen Spezifikation gefordert.<br />

Darüber hinaus sind umfassende Kenntnisse alternativ verwendbarer Repräsentationsformalismen<br />

erforderlich, um den geeignetsten für die gegebene Anwendungssituation<br />

auszuwählen. Schließlich werden in der Evaluationsphase Kenntnisse über Verfahren<br />

zur Qualitätsprüfung der Ontologie benötigt.<br />

Die aufgezeigten Aufgabengebiete sind jenen der konventionellen Software-<br />

Entwicklung sehr ähnlich, weshalb die vorgestellten Techniken und Methoden auf existenten<br />

Ansätzen für gleichartige Problemstellung aus dem Software Engineering basieren<br />

oder sich <strong>zum</strong>indest daran orientieren. Allerdings können die Verfahren des Software<br />

oder Knowledge Engineering nicht einfach für die Ontologie-Entwicklung übernommen<br />

werden, da deren angestrebte Funktionalität als bedeutungsdefinierendes Konstrukt<br />

basierend auf einer ontologischen Theorie der Wissensdomäne anders gelagert ist und<br />

somit die Entwicklung spezifischer Verfahren erfordert (s. Gómez-Pérez01, S. 392). Dies<br />

gilt grundsätzlich für alle aufgezeigten Aufgabenfelder. Die Spezifikation einer Ontologie<br />

erfordert genaue Kenntnisse über das Einsatzpotenzial von Ontologien. Zur Erstellung<br />

der Konzeptionalisierung werden spezifische Modellierungsmethoden und ein genaueres<br />

Verständnis derselben benötigt. Spezielle Fachkenntnisse über geeignete Repräsentationsformalismen<br />

sind für die Formalisierung gefordert und zur Evaluation von Ontologien<br />

müssen die entsprechenden Techniken bekannt sein und richtig eingesetzt werden<br />

können.<br />

Auf Grund der strukturellen und inhaltlichen Ähnlichkeiten zu den ausgereifteren Methodologien<br />

des Software und Knowledge Engineering wird innerhalb der Forschungsgemeinde<br />

des Ontology Engineering eine stärkere Orientierung an diesen und anderen<br />

relevanten Wissenschaftsdisziplinen gefordert. Dabei können für die Differenzierung der<br />

Aufgabengebiete im Ontologie-Entwicklungsprozess die entsprechenden Untergliederungen<br />

aus dem Software Engineering in Analyse-, Implementierungs-, und<br />

Architekturaufgabenfelder als Vorlage dienen (vgl. Devedžić02). Die Orientierung an der<br />

Formalen Ontologie aus der Philosophie wurde schon erwähnt und als theoretische Basis<br />

für sehr wichtig erachtet (s. Guarino95, S. 3f). Mit derartigen Ausgangspunkten soll die<br />

Erstellung einer umfassenden Methodologie der Ontologie-Entwicklung, die Verfahren<br />

im Sinne der vorgestellten Evaluationstechnik der Konsistenz von Taxonomien (S.<br />

B.2.2.2) für alle Phasen und Aufgabenfelder des Ontologie-Entwicklungsprozesses<br />

beinhalten soll, erleichtert werden.


Kapitel C: Verwendung von Ontologien in Informationssystemen 47<br />

C Verwendung von Ontologien in Informationssystemen<br />

Als letzten zu betrachtenden Aspekt zur Erfassung der Charakteristika ontologiebasierter<br />

Verfahren der Wissensmodellierung im ersten Teil der Arbeit beschäftigt sich dieses<br />

Kapitel mit der Verwendung von Ontologien als bedeutungsdefinierender Komponente<br />

in computergestützten Informationssystemen. Dabei sollen die grundsätzlichen Anwendungsmöglichkeiten<br />

(s. A.2.2.2) dieses Verfahrens der Wissensmodellierung genauer betrachtet,<br />

die wesentlichen Spezifika ontologiebasierter Applikationen aufgezeigt und die<br />

aus der Verwendung von Ontologien resultierenden softwaretechnischen Implikationen<br />

herausgearbeitet werden. Hinsichtlich des Untersuchungsziels der Verwendung von Ontologien<br />

im Semantic Web im zweiten Teil dieser Arbeit konzentrieren sich die folgenden<br />

Ausarbeitung vor allem auf jene Aspekte, die für die Erlangung eines hintergründigen<br />

Verständnisses des Semantic Web als ontologiegestützter Informationstechnologie<br />

relevant erscheinen.<br />

Zunächst wird eine Typologisierung der grundlegenden Einsatzmöglichkeiten von Ontologien<br />

in Informationssystemen vorgenommen. Dazu wird ein Klassifikationsschema<br />

vorgestellt und es werden die damit aufgefundenen grundsätzlichen Verwendungsszenarien<br />

aufgeführt. Zur Verdeutlichung dieser Verwendungsszenarien werden im zweiten Teil<br />

des Kapitels Beispiele für die Ontologieverwendung in Informationssystemen diskutiert,<br />

wobei sich die Auswahl der vorgestellten Anwendungsgebiete in ihrer Relevanz für das<br />

Semantic Web als ontologiebasierter Informationstechnologie begründet. Anschließend<br />

daran werden im dritten Teil umsetzungstechnische Implikationen aufgezeigt, welche sich<br />

für die Entwicklung ontologiebasierter Informationssysteme ergeben und als zusätzliche<br />

Anforderungen neben der im vorhergehenden Kapitel behandelten inhaltlichen Qualität<br />

an Ontologien gestellt werden. Auch dieser Aspekt ist für die Handhabung von Ontologien<br />

im Semantic Web relevant.<br />

C.1 Typologie des Ontologie-Einsatzes<br />

Die im Folgenden erläuterte Typologisierung der Verwendungsmöglichkeiten von Ontologien<br />

beruht auf einem Klassifikationsansatz, der existente ontologiebasierte Applikationen<br />

bezüglich allgemeiner Betrachtungsdimensionen zu klassifizieren versucht. Damit<br />

soll ein gemeinsames Verständnis der Nutzbarkeit ontologiebasierter Verfahren der<br />

Wissensmodellierung innerhalb und zwischen den im Ontologie-Entwicklungsprozess<br />

beteiligten Wissenschaftsdisziplinen erreicht werden (s. Uschold+99, S. 1f). Weiterhin<br />

kann diese Typologisierung als Hilfestellung in der Spezifikationsphase der Ontologie-<br />

Entwicklung (s. B.1.1) genutzt werden, wobei die Klassifikation allerdings sehr allgemein<br />

gehalten ist und eher dem intellektuellen Verständnis verschiedenartiger Einsatzmöglichkeiten<br />

von Ontologien dient als dass es eine verwendbare Klassifikationsvorlage darstellt.<br />

Es werden zunächst die Betrachtungsdimensionen erläutert und durch über das Klassifikationsschema<br />

hinausgehende Aspekte verdeutlicht. Anschließend daran werden die<br />

mittels der Betrachtungsdimensionen unterschiedenen Verwendungsszenarien aufgezeigt<br />

sowie eine verallgemeinernde Kategorisierung derselben vorgestellt.


Kapitel C: Verwendung von Ontologien in Informationssystemen 48<br />

C.1.1 Klassifikationsdimensionen<br />

In dem referenzierten Klassifikationsschema (vgl. Uschlod+99) werden drei wesentliche<br />

Betrachtungsdimensionen unterschieden, die im Folgenden besprochen werden sollen.<br />

Für jede dieser Dimensionen sind Kategorien vordefiniert, welche aus der Betrachtung<br />

ontologiebasierter Applikationen verallgemeinernd gewonnen wurden und als einheitliche<br />

Beschreibungshilfen zur Charakterisierung der verschiedenen Verwendungsszenarien von<br />

Ontologien dienen sollen. Neben den hier aufgeführten Dimensionen wurde auch die<br />

Existenz unterstützender Technologien für die softwaretechnische Einbindung der Applikationen<br />

sowie deren Reifegrad betrachtet. Da diese beiden Aspekte nur peripher zur<br />

Charakterisierung der Verwendungsmöglichkeiten von Ontologien in Informationssystemen<br />

beitragen, werden sie hier nicht weiter beachtet (s. Uschold+99, S. 2).<br />

C.1.1.1 Verwendungszweck 107<br />

Mit der ersten Betrachtungsdimension soll der Verwendungszweck und intendierte<br />

Nutzengewinn durch die Verwendung einer Ontologie beschrieben werden, welcher in<br />

der Anforderungsanalyse der Ontologie-Entwicklung (s. B.1.1.1) festzuhalten ist. Hierfür<br />

werden drei grundsätzliche Verwendungszwecke von Ontologien unterschieden, die im<br />

Zusammenhang der Charakteristika ontologiebasierter Wissensmodellierung bereits erwähnt<br />

wurden (s. A.2.2.2) und daher hier nur kurz wiedergegeben werden.<br />

Die erste Funktionalität stellt die Kommunikationsunterstützung zwischen Agenten als<br />

Oberbegriff für die menschlichen und technischen Akteure in einer Wissensdomäne dar,<br />

wobei kommunikative Fehler durch die ontologische Verpflichtung (s. A.2.1.1) gegenüber<br />

dem in der Ontologie erfassten Verständnismodell der Ontologie vermieden werden<br />

sollen. Als zweite Funktionalität wird die Verbesserung der Interoperabilität zwischen<br />

Computersystemen oder deren Komponenten aufgeführt. Dabei sollen Ontologien vor<br />

allem die Transformation zwischen verschiedenartigen Wissensmodellen ermöglichen, so<br />

dass die semantische Korrektheit von ausgetauschten Informationen gewährleistet wird.<br />

Unter der dritten Funktionalität werden mehrere Aspekte zur Verbesserung wissensverarbeitender<br />

Systeme zusammengefasst. Hier sei zunächst die Optimierung des Informationsmanagements<br />

durch ontologiebasierte Indizierung genannt, während die Aspekte bezüglich<br />

der Systementwicklung im dritten Teil dieses Kapitels ausführlicher behandelt<br />

werden sollen (s. Uschold+99, S.1f).<br />

Neben den drei grundlegenden Verwendungsmöglichkeiten ist für das Design der<br />

Ontologie sowie der Architektur des Informationssystems zu beachten, wie die Ontologie<br />

mit den anderen Komponenten interagiert und inwiefern dieses die Konzeption der Ontologie<br />

determiniert. Wird die Ontologie als allgemeines Verständnismodell zur Wissensteilung<br />

verwendet, so stellt sie meist ein externes, vorab definiertes normatives Modell dar.<br />

Bei der Nutzung als Austauschbasis zwischen heterogenen Informationsquellen ist die<br />

Ontologie ein Meta-Modell der zu verbindenden Wissensmodelle. Für die Indizierungsfunktionalität<br />

wird der Inhalt der ontologischen Struktur zur Laufzeit des Systems ständig<br />

bezüglich geänderter Informationsquellen aktualisiert (s. Uschold+99, S. 4f).<br />

107 engl.: „Purpose and Benefits“ (Uschold+99, S. 2).


Kapitel C: Verwendung von Ontologien in Informationssystemen 49<br />

C.1.1.2 Rolle der Ontologie 108<br />

Die zweite wesentliche Betrachtungsdimension erfasst die Rolle, welche eine Ontologie<br />

innerhalb eines Informationssystems einnimmt. Darunter wird verstanden, welche Art<br />

von Wissensstruktur durch die Ontologie erfasst wird. Dazu wird im hier vorgestellten<br />

Klassifikationsschema eine dreistufige Hierarchie sogenannter „Informationslevel 109 “ zur<br />

Differenzierung von Wissensstrukturen in ontologiebasierten Applikationen eingeführt.<br />

Die unterste Ebene stellen darin die „operationalen Daten 110 “ dar, worunter in einer<br />

beispielhaften Anwendung zur ontologiegestützten Informationsindexierung die laufend<br />

aktualisierten Informationen aus den überwachten Quellen fallen würden. Diese Daten<br />

werden auf der nächsthöheren Stufe durch eine Ontologie beschrieben, welche wiederum<br />

durch einen Repräsentationsformalismus als höchste Hierarchiestufe beschrieben wird (s.<br />

Uschold+99, S. 3). Somit lassen sich die in einer ontologiebasierten Applikation verwandten<br />

Wissensstrukturen hinsichtlich ihres funktionalen Zusammenhangs unterscheiden.<br />

Da Ontologien <strong>zum</strong>eist auf dem mittleren Informationslevel als Beschreibungen von<br />

operationalen Daten verwendet werden, erscheint eine erweiternde Betrachtung verschiedener<br />

Arten von Ontologien zur Differenzierung der damit dargestellten Wissensstrukturen<br />

sowie des intendierten Verwendungszwecks als sinnvoll. Dazu werden in<br />

Tabelle 10 die wesentlichen in der Literatur unterschiedenen Ontologie-Arten vorgestellt<br />

und an Hand von häufig referenzierten Beispielen verdeutlicht.<br />

Ontologie-Art<br />

Meta- / Generische<br />

Ontologie<br />

Wissensrepräsentations-<br />

Ontologie<br />

Top Level / Generelle<br />

Ontologie<br />

Domänen-Ontologie<br />

Beschreibung<br />

Beschreibung von grundlegenden Zusammenhängen für die Erstellung<br />

von Ontologien. Ein Beispiel ist die „Mereology Ontology 111 “.<br />

Ontologische Erfassung der Modellierungsprimitive für die Ontologie-<br />

Entwicklung als spezielle Art von Meta-Ontologie. Das bekannteste<br />

Beispiel ist die Frame-Ontology des Ontolingua-Systems (s. B.1.3.2).<br />

Beschreibung allgemeinen Wissens über die reale Welt. Die darin erfassten<br />

Wissensstrukturen können von Ontologien für konkrete Anwendungsgebiete<br />

genutzt werden, so dass für die automatische Problemlösung<br />

benötigtes Alltagswissen zur Verfügung steht. Dieser Ansatz<br />

wird im CYC-Projekt 112 verfolgt.<br />

Beschreibung der Struktur einer Wissensdomäne im Sinne einer ontologischen<br />

Theorie (s. B.1.2.2), welche für verschiedene Anwendungen<br />

der Domäne wiederverwendet werden kann. Als Beispiel sei hier die<br />

(KA) 2 -Ontologie 113 genannt.<br />

108 engl.: „Role of the Ontology“ (Uschold+99, S. 3).<br />

109 engl.: „information levels” (Uschold+99, S. 3).<br />

110 engl.: „operational data” (Uschold+99, S. 3).<br />

111 Mereology Ontology: Formale Spezifikation der mereologischen “part-of”-Relation im Sinne der korrekten<br />

Zusammengehörigkeit eines Ganzen und seiner Teile (s. B.2.2.1.1). Entstanden im Rahmen des PHYSYS-Projektes,<br />

worin eine Bibliothek wiederverwendbarer Ontologien zur Beschreibung physischer Systeme entwickelt wurde (s.<br />

Borst97, S. 28-33; S. 128-131).<br />

112 CYC: Seit Mitte der 1980er Jahre versucht das Entwicklungsteam um Douglas Lenat, eine umfassende Wissensbasis<br />

menschlichen Alltagswissens zu erstellen, welche als entsprechende Referenz für Wissensbasierte Systeme<br />

dienen soll. Die CYC-Wissensbasis umfasst verschiedene Domänen, wobei die Wissensstrukturen jeweils in Modulen,<br />

sogenannten Mikrotheorien, mit dem entsprechenden Domänen- und Inferenzwissen erfasst sind (vgl. Elkan<br />

+93). Ein Teil der CYC-Wissensbasis ist öffentlich zugänglich unter: www.cyc.com. Eine ausführliche Beschreibung<br />

der Intention und der Herangehensweise findet sich in: Lenat, D. B.; Guha, R. V.: Building Large Knowledge<br />

Based Systems. Representation and Inference in the CYC Project. Reading, Massachusetts (USA): Addison-Wesley,<br />

1990.<br />

113 (KA) 2 -Ontologie: Ontologie der Forscher in der Knowledge Annotation Initiative aus der Knowledge Acquisition<br />

Community. Mit Annotationen können die Wissensstrukturen der Ontologie in die Web-Dokumente der Forschungsgemeinde<br />

eingebunden werden, wodurch eine verbesserte Informationsverarbeitung erreicht werden soll (vgl. Benjamins+98).<br />

Obwohl das Projekt eingestellt wurde, werden die Arbeiten in Nachfolgeprojekten fortgesetzt.


Kapitel C: Verwendung von Ontologien in Informationssystemen 50<br />

Methoden-Ontologie<br />

Aufgaben-Ontologie<br />

Applikations-Ontologie<br />

Domänenunabhängige Begriffsdefinition zur Beschreibung von Problemlösewissen<br />

mittels Problem Solving Methods (s. A.1.2.1).<br />

Allgemeine Begriffsdefinition für die Beschreibung von Aufgaben, z.B.<br />

Begriffe wie ´Plan´, ´Zielsetzung´, etc.<br />

Zusammenführung von Domänen-, Methoden- und Aufgaben-Ontologien<br />

als konzeptionelles Modell für eine konkrete Applikation (s.<br />

A.1.2.2.2.). Ein Bespiel ist die „Enterprise Ontology 114 “.<br />

Tabelle 10: Ontologie-Arten 115<br />

Die ersten beiden genannten Ontologie-Arten sind auf der obersten Ebene der im<br />

Klassifikationsansatz definierten Informationslevel anzusiedeln, da sie Begriffsdefinitionen<br />

für die Verwendung in ontologischen Erfassungen beinhalten. Alle anderen<br />

Arten sind auf der mittleren Ebene einzuordnen, wobei mit Top-Level- und Domänenontologien<br />

das statische Domänenwissen und mit Methoden- sowie Aufgabenontologien<br />

das Problemlösewissen gemäß deren Trennung innerhalb des modellbasierten Ansatzes (s.<br />

A.1.1.3) erfasst wird. Mit Hilfe dieser Differenzierung wird deutlich, dass mit Ontologien<br />

sehr unterschiedliche Arten von Wissensstrukturen beschrieben und somit diesbezüglich<br />

klassifiziert werden können. Als weitere Betrachtungskriterien zur Beschreibung einer<br />

Ontologie sind unabhängig von der darin erfassten Art der Wissensstruktur die Größe<br />

sowie der Formalisierungsgrad zu berücksichtigen (s. Uschold+99, S. 4).<br />

C.1.1.3 Akteure 116<br />

Als dritte Betrachtungsdimension einer ontologiebasierten Anwendung werden die Rollen<br />

der beteiligten Akteure erfasst, welche in verschiedenen Anwendungen unterschiedlich<br />

sein können. So kann beispielsweise die Entwicklung der Ontologie allein durch entsprechende<br />

Spezialisten ausgeführt werden, während in einem anderen Projekt diese<br />

Aufgabe arbeitsteilig von Personen aus unterschiedlichen Fachgebieten erfolgt. In dem<br />

hier vorgestellten Klassifikationsschema werden dazu verschiedene Akteure differenziert,<br />

die im Folgenden kurz erläutert werden sollen.<br />

Der erste Akteur ist der Ontologie-Entwickler (engl.: „Ontology Author“), dessen Aufgabe<br />

in der Erstellung der Ontologie besteht. Als zweite Art von Akteur wird der Daten-<br />

Author (engl.: „(Operational) Data Author”) genannt. Damit ist beispielsweise der Autor<br />

eines Dokuments gemeint, welches unter Nutzung einer Ontologie indiziert wird. Als<br />

dritter Akteur wird der Entwickler einer ontologiebasierten Anwendung (engl.: „Application<br />

Developer“) und als vierter Akteur der Benutzer (eng.: „Application User“) derselben<br />

unterschieden. Der fünfte und letzte Akteur ist der Wissensarbeiter (engl.: „Knowledge<br />

Worker“), der mit dem Wissen der Ontologie beziehungsweise jenem der ontologiebasierten<br />

Anwendung arbeitet. Der Unterschied zwischen den beiden letztgenannten besteht<br />

darin, dass der Wissensarbeiter <strong>zum</strong>eist ein Mensch ist, während der Anwendungsnutzer<br />

auch ein Softwareprogramm sein kann. 117<br />

114 Enterprise Ontology: Entwickelt als begriffsdefinierende Basis für ein Framework zur Unternehmensmodellierung<br />

(vgl. Uschold+96b). Aus den bei der Erstellung gewonnenen Erfahrungen ging der methodologische Ansatz zur Ontologie-Entwicklung<br />

von ´Uschold, King´ hervor (s. B.1).<br />

115 Bezeichnungen und Erläuterungen entnommen aus (Gómez-Pérez99, S. 4f) und (Fensel00, S. 8f). Deutsche Übersetzungen<br />

nach (Puppe+00, S. 623).<br />

116 engl.: „Actors“ (Uschold+99, S. 4).<br />

117 Bezeichnungen und Erläuterungen nach (Uschold+99, S. 3f). Übersetzungen durch den Autor mit Angabe des<br />

englischen Originals.


Kapitel C: Verwendung von Ontologien in Informationssystemen 51<br />

C.1.2 Verwendungsszenarien<br />

Aus der Betrachtung existenter ontologiebasierter Applikationen postuliert der Klassifikationsansatz<br />

verschiedene Verwendungsszenarien für Ontologien in Informationssystemen,<br />

welche mittels der vorgestellten Betrachtungsdimensionen beschrieben werden.<br />

Die Szenarien werden in drei grundlegende Kategorien unterteilt, welche in Abbildung 9<br />

zunächst übersichtlich dargestellt und anschließend genauer erläutert werden. 118<br />

Kategorien und Verwendungsszenarien von Ontologien<br />

I. Neutrale Editierung (engl.: „Neutral Authoring“)<br />

I.a Ontologie als wiederverwendbare Begriffsdefinition für verschiedene Zielsysteme.<br />

I.b ... Terminologie-Spezifikation für die Handhabung operationaler Daten.<br />

II. Gemeinsamer Informationszugang (engl.: „Common Access to Information“)<br />

II.a ... von allen Beteiligten akzeptiertes Verständnismodell einer Wissensdomäne.<br />

II.b ... Meta-Modell für korrekten Informationsaustausch zwischen heterogenen Wissensmodellen.<br />

II.c ... Abgleich heterogener Ontologien für korrekten Informationsaustausch.<br />

III. Indizierung (engl.: „Indexing“)<br />

III.a ... Strukturdefinition des Indexes von Informationsquellen einer Wissensdomäne.<br />

Abbildung 9: Klassifikation der Verwendung von Ontologien in Informationssystemen 119<br />

Die Kategorie Neutrale Editierung (I.) umfasst jene Verwendungsszenarien, in denen<br />

eine Ontologie als formal spezifizierte Begriffsdefinition einer Wissensdomäne erstellt und<br />

als entsprechende Basis bei der Entwicklung von Applikationen für die Domäne genutzt<br />

wird. Dadurch soll erstens die einheitliche und korrekte Nutzung der Wissensstrukturen<br />

einer Domäne gewährleistet und zweitens die Wiederverwendbarkeit bereits formalisierter<br />

ontologischer Erfassungen ermöglicht werden. Somit stellen die Verwendungsszenarien<br />

dieser Kategorie hinsichtlich des Verwendungszwecks eine Hilfestellung für die Systementwicklung<br />

dar, wobei vor allem Ontologien zur Beschreibung statischer Wissensstrukturen,<br />

also Meta-, Top-Level sowie Domänenontologien erstellt werden. Die Unterscheidung<br />

der beiden Szenarien beruht auf der Priorität der beteiligten Akteure. In (I.a)<br />

erstellt der Ontologie-Entwickler als wichtigster Akteur die Ontologie als begriffsdefinierende<br />

Basis für alle anderen Beteiligten, welche dann für die jeweiligen Anwendungszwecke<br />

transformiert wird; beispielsweise unter Nutzung der Funktionalitäten des<br />

Ontolingua-Systems (s. B.1.3.2). In (I.b) werden operationale Daten mit einer vordefinierten<br />

Ontologie beschrieben, wobei die operationalen Daten als Kernteil der<br />

Applikation die Schlüsselposition einnehmen und die Ontologie lediglich sekundären<br />

funktionalen Charakter hat (Uschold +99, S. 5-7).<br />

Die zweite Kategorie des Gemeinsamen Informationszugangs (II.) umfasst Verwendungsmöglichkeiten<br />

von Ontologien, in denen mit Hilfe einer Ontologie ein gemeinsames Ver-<br />

118 An<strong>zum</strong>erken ist, dass die hierbei vorgenommene Klassifikation nicht auf einer statistischen Analyse existenter<br />

Verwendungsszenarien beruht. Als Datenquelle wird lediglich angegeben, dass die postulierten Szenarien Abstraktionen<br />

spezifischer ontologiebasierter Anwendungen aus der Forschung und der industriellen Praxis darstellen (s.<br />

Uschold+99, S. 5). Trotz der wissenschaftlich nicht fundierten Grundlage wurde dieser Klassifikationsansatz als Ausgangspunkt<br />

für die Erläuterung der Verwendungsmöglichkeiten von Ontologien in Informationssystemen ausgewählt,<br />

weil darin eine verallgemeinernde Erfassung der Einsatzmöglichkeiten vorgenommen wird und somit ein höherer<br />

Aussagegehalt geboten wird als bei der einfachen Auflistung von Verwendungsszenarien in vergleichbaren Arbeiten<br />

(siehe z.B. (Obitko01)).<br />

119 Bezeichnungen und Erläuterungen aus (Uschold+99, S. 5-10). Übersetzungen durch den Autor mit Angabe des<br />

englischen Originals.


Kapitel C: Verwendung von Ontologien in Informationssystemen 52<br />

ständnis der Wissensdomäne erreicht, beziehungsweise die korrekte Nutzung von Informationen<br />

aus heterogenen Quellen hinsichtlich der intendierten Bedeutung gewährleistet<br />

werden kann. In (II.a) wird eine Ontologie als gemeinsame Verständnisgrundlage für die<br />

Wissensarbeiter der Wissensdomäne zur Verbesserung der zwischenmenschlichen Kommunikation<br />

erstellt, wobei <strong>zum</strong>eist eine Domänenontologie verwendet wird. In (II.b) und<br />

(II.c) werden Ontologien eingesetzt, um die Interoperabilität zwischen Softwarekomponenten<br />

als Applikations-Nutzern zu ermöglichen. Dabei wird in (II.b) eine sogenannte<br />

„geteilte Ontologie 120 “ erstellt, welche bei der Entwicklung entsprechender Applikationen<br />

im Sinne einer ontologischen Verpflichtung (s. A.2.1.1) als bedeutungsdefinierende Basis<br />

genutzt wird. Im Unterschied dazu basieren in (II.c) die einzelnen Systemkomponenten<br />

auf eigenen Ontologien oder ähnlichen konzeptionellen Modellen und die Interoperabilität<br />

durch einen „Abgleich 121 “ dieser heterogenen Wissensmodelle gewährleistet wird.<br />

Da für die Interoperabilität zwischen Systemen oder ihren Komponenten Informationen<br />

aus allen drei Informationslevels (s. C.1.1.2) benötigt werden, können in den beiden letztgenannten<br />

Szenarien grundsätzlich alle in Tabelle 10 aufgeführten Ontologie-Arten Verwendung<br />

finden (Uschold+99, S. 7-10).<br />

Die letzte Kategorie der Indizierung (III.) beinhaltet nur ein Szenarium (III.a), welches<br />

zur Verbesserung des Informationsmanagements, insbesondere der Suchfunktionalität in<br />

Informationssystemen dient. Dabei werden die Informationsquellen mittels einer entsprechenden<br />

Domänenontologie extern (im Gegensatz zur Dokumentenannotation)<br />

indiziert, so dass eine kontextsensitive Suche erfolgen kann. Die wesentlichen Akteure in<br />

diesem Szenario sind der Ontologie-Entwickler sowie die Wissensarbeiter, die mit Hilfe<br />

ontologiebasierter Suchmaschinen schneller und effektiver das von ihnen benötigte<br />

Wissen auffinden können (Uschold+99, S. 10).<br />

C.2 Anwendungsgebiete von Ontologien<br />

Obwohl mit Hilfe der vorgestellten Kategorisierung von Verwendungsszenarien die<br />

Einsatzmöglichkeiten von Ontologien in Informationssystemen differenziert werden<br />

können, sind die Beschreibungen der Szenarien sehr abstrakt gehalten. Um diese<br />

konkreter zu erläutern, werden im Folgenden entsprechende Anwendungsgebiete ontologiebasierter<br />

Applikationen vorgestellt. Dabei sollen mit den aufgeführten Anwendungsgebieten<br />

<strong>zum</strong> einen Beispiele für die Verwendungsszenarien gegeben und <strong>zum</strong> anderen<br />

grundlegende Aspekte des Semantic Web als ontologiebasierter Informationstechnologie<br />

aufgezeigt werden.<br />

Als erstes wird die Kommunikation in Multi-Agenten-Systemen als Beispiel der<br />

Verwendungsszenarien der Kategorie A behandelt. Dieses Anwendungsgebiet ist insofern<br />

für das Semantic Web von grundlegender Bedeutung, als das es selber ein Multi-Agenten-<br />

System darstellt (siehe dazu das eingangs erwähnte Anwendungsszenario des Semantic<br />

Web aus (Berners-Lee+01)). Mit der Informationsintegration als zweitem Anwendungsgebiet<br />

wird ein Beispiel für die Verwendungsszenarien II.b und II.c besprochen. Die<br />

Ermöglichung der Interoperabilität zwischen heterogenen Informationsquellen ist eine<br />

120 engl.: „shared ontology“ (Uschold+99, S. 8).<br />

121 engl.: „mapping“ (Uschold+99, S. 9).


Kapitel C: Verwendung von Ontologien in Informationssystemen 53<br />

grundlegende Anforderung an moderne Informationssysteme und somit auch für das<br />

Semantic Web relevant. Als drittes Anwendungsgebiet werden Verfahren des ontologiebasierten<br />

Information Retrieval hinsichtlich des Verwendungsszenarios III.a vorgestellt,<br />

wobei sich die Relevanz dieses Gebietes für das Semantic Web aus der grundlegenden<br />

Anforderung der Verbesserung der Suchfunktionalität für webbasierte Informationstechnologien<br />

ergibt.<br />

Neben den drei hier ausführlich behandelten Anwendungsgebieten seien als weitere<br />

wesentliche Verwendungsmöglichkeiten von Ontologien in Informationssystemen die Bereiche<br />

des Wissensmanagements sowie der Sprachverarbeitung erwähnt. In den Ansätzen<br />

des sogenannten „ontologiebasierten Wissensmanagements“ (vgl. Schnurr+01) werden<br />

vor allem die Vorteile der gemeinsamen Verständnisgrundlage einer Wissensdomäne<br />

durch eine Ontologie gemäß Verwendungsszenario II.a herausgestellt. Für die Sprachverarbeitung<br />

werden sogenannte „Linguistische Ontologien 122 “ zur Analyse natürlicher<br />

Sprache entwickelt. Damit kann das inhaltliche Verstehen von Texten automatisiert und<br />

somit eine Grundlage für automatische Übersetzungen gewonnen werden, was hinsichtlich<br />

der Multilingualitätsproblematik ein wichtiges Anwendungsgebiet von Semantic Web<br />

– Technologien darstellt.<br />

C.2.1 Multi-Agenten-Systeme<br />

Seit Beginn der 1990er Jahre zeichnet sich in der Künstlichen Intelligenz ein Paradigmenwechsel<br />

bei der Entwicklung wissensverarbeitender Systeme ab (s. A.1). Im Gegensatz zu<br />

den zuvor entwickelten globalen, zentralisierten Architekturen für alleinstehende und<br />

funktional abgeschlossene Systeme werden im agentenbasierten Ansatz integrierte, dezentrale<br />

Systemstrukturen entworfen. Darin sollen autonom agierende Teilsysteme, sogenannte<br />

Agenten, individuelle Ziele verfolgen und Lösungen für ihre spezifischen Aufgaben<br />

in Kooperation mit anderen Agenten finden. Im Unterschied zu traditionellen<br />

Wissenssystemen wird in solchen „Multi-Agenten-Systemen“ (Burkhard00, S. 996) anstelle<br />

einer zentralen Wissensbasis das benötigte Wissen von den einzelnen Agenten selber<br />

getragen und die Steuerungsfunktion von jedem Agenten individuell übernommen. Diesem<br />

Ansatz liegt eine Verschiebung des Intelligenzbegriffs innerhalb der Künstlichen<br />

Intelligenz zugrunde. Während mit dem logisch-rationalistischem Paradigma der Symbolsystemhypothese<br />

(s. A.1.1.1) intelligentes Verhalten allein durch die Erstellung und Manipulation<br />

entsprechender Symbolsysteme simuliert werden sollte, wird Intelligenz im<br />

„agenten-orientierten Paradigma“ (Luger01, S. 268) als aus dem kollektiven Verhalten<br />

autonom agierender Individuen hervorgehend verstanden (s. Luger01, S. 37). 123<br />

122 engl.: „linguistic ontologies“ (Gómez-Pérez99, S. 4). Die bedeutendsten Ontologien dieses Anwendungsgebietes<br />

sind das Generalized Upper Model (GUM) sowie WordNet. Im GUM werden die grundlegenden linguistischen<br />

Konzepte einzelner Sprachen beschrieben und deren Relationen in den verschiedenen Sprachen dargestellt, wodurch<br />

die Grundlage für eine bedeutungserhaltene Übersetzung gegeben werden soll (vgl. Bateman+95). WordNet ist eine<br />

lexikalische Datenbank für die englische Sprache, in der Bedeutungszusammenhänge mittels grundlegender Konstrukte<br />

der Semantik (Synonyme, Antonyme, etc.) beschrieben werden (vgl. Fellbaum98). Eine aktuelle Version von<br />

WordNet sowie weiterführende Informationen sind erhältlich unter: http://www.cogsci.princeton.edu/~wn/ (08.06.<br />

2002).<br />

123 Andersartige Entwürfe des Intelligenzverständnisses in der Künstlichen Intelligenz resultieren aus den Schwierigkeiten,<br />

welche sich bei der Entwicklung umfangreicher intelligenter Systeme auf der Grundlage reiner Symbolverarbeitungssysteme<br />

ergaben. Dabei wurden Vorbilder intelligenten Verhaltens aus der Natur gesucht, wie beispiels-


Kapitel C: Verwendung von Ontologien in Informationssystemen 54<br />

Ein Multi-Agenten-System besteht also aus einzelnen Agenten, die jeweils individuelle<br />

Ziele verfolgen und zur Bearbeitung ihrer Aufgaben Dienste anderer Agenten in Anspruch<br />

nehmen. Dabei soll ein Agent folgende Eigenschaften aufweisen. Erstens soll er<br />

autonom handeln können, also selbstgesteuert ohne Einfluss von außen. Zweitens soll er<br />

sich situiert verhalten, also kontextbezogen mit der Umwelt interagieren können. Drittens<br />

soll er zu entsprechendem sozialen Verhalten fähig sein, worunter hier die Fähigkeit zur<br />

Kommunikation und Kooperation mit anderen Agenten des Systems verstanden wird (s.<br />

Luger01, S. 266f). Die erste Anforderung impliziert, dass ein Agent über eigene<br />

Komponenten zur Problemlösung, Verhaltensentscheidung und Systemsteuerung verfügen<br />

muss. Zur Gewährleistung der kontextbezogen Interaktion mit der Umwelt müssen<br />

entsprechende Schnittstellen für den Austausch von Informationen unterstützt werden (s.<br />

Burkhard00, S. 971-978). Hinsichtlich der Anforderung geeigneter Kommunikations- und<br />

Kooperationsfähigkeiten müssen die Agenten eines Multi-Agenten-Systems gewissen<br />

Konventionen genügen. Dabei spielen Ontologien eine wesentliche Rolle, weshalb dieser<br />

Aspekt hier genauer beleuchtet werden soll.<br />

C.2.1.1 Kommunikation in Multi-Agenten-Systemen<br />

Um während eines kommunikativen Aktes zwischen Agenten die semantische Korrektheit<br />

der ausgetauschten Informationen gewährleisten zu können, muss jeder Agent <strong>zum</strong><br />

einen über ein Verständnis des behandelten Wissens verfügen und zweitens in geeigneter<br />

Form darüber kommunizieren können. Hinsichtlich der ersteren Anforderung muss ein<br />

Agent über ein entsprechendes Modell der für seine Aufgaben relevanten Wissensstrukturen<br />

verfügen, welches hier als „Umweltmodell“ (Burkhard00, S. 975) bezeichnet wird.<br />

Bezüglich der zweiten Anforderung muss der Agent eine sogenannte „Agenten-Kommunikations-Sprache<br />

124 “ unterstützen, wobei die Wichtigkeit der Kommunikationsfähigkeit<br />

durch deren Proklamation als konstituierende Eigenschaft von Agenten in Multi-<br />

Agenten-Systemen hervorgehoben wird (s. Finin+97, S. 1).<br />

Zur Realisation dieser auch als „Kommunikation auf der Wissensebene 125 “ bezeichneten<br />

Fähigkeit werden Konventionen auf drei technischen Ebenen verlangt: Erstens ein<br />

gemeinsames Repräsentationsformat für den verlustfreien Austausch, zweitens ein geeignetes<br />

Protokoll zur Sicherung der Konsistenz ausgetauschter Nachrichten und drittens<br />

eine von allen Beteiligten akzeptierte Spezifikation des kommunizierten Inhaltes, also der<br />

Wissensstrukturen (s. Gruber93, S. 1). Die Arbeiten der Knowledge Sharing Effort – Initiative<br />

(KSE) 126 decken diese drei Gebiete ab und sollen daher hier vorgestellt werden.<br />

weise die Funktionsweise des menschlichen Gehirns im Ansatz der Neuronalen Netze nachgeahmt wird (s. Görz+<br />

00b, S. 11f). Der im agentenorientierten Paradigma aufgegriffene Intelligenzbegriff orientiert sich an der Funktionsweise<br />

sozialer Systeme, in denen sich „ ... die Intelligenz .. in der Interaktion [manifestiert]“ (Görz+00b, S.2).<br />

124 engl.: „agent communication language“ (Obitko01, S.20).<br />

125 engl.: „knowledge level communication“ (Gruber93, S. 1).<br />

126 Knowledge Sharing Effort (KSE): Forschungsinitiative zur Entwicklung technischer Infrastrukturen für die Teilung<br />

von Wissen, also die Verwendung formal erfasster Wissensstrukturen in mehreren Applikationen. Seit Anfang<br />

der 1990er Jahre arbeiten an unterschiedlicher US-amerikanischer Universitäten drei Forschungsgruppen in den<br />

Bereichen der Austauschsprachen, wiederverwendbarer Wissensbasen und der Kommunikationsprotokolle (vgl.<br />

Neches+91). Weiterführende Informationen sowie die wesentlichen Publikationen finden sich auf der Homepage der<br />

Forschungsinitiative unter: http://ww-ksl.stanford.edu/knowledge-sharing/index.html (04.09.2002).


Kapitel C: Verwendung von Ontologien in Informationssystemen 55<br />

Innerhalb des KSE wurden die Sprache KIF sowie das Ontolingua-System entwickelt.<br />

Wie bei deren Vorstellung als Referenzbeispiel für die Formalisierung von Ontologien (s.<br />

B.1.3.2) erläutert, dienen diese beiden Techniken der plattformunabhängigen formalen<br />

Spezifikation einer Ontologie. Dabei sind sie auf Grund ihrer Ausdrucksstärke vornehmlich<br />

als Format für den verlustfreien Austausch formalisierter Wissensstrukturen zwischen<br />

verschiedenen Zielsystemen konzipiert und stellen somit eine Lösung für ein gemeinsames<br />

Repräsentationsformat dar (s. Gruber93b, S. 5ff). Als Kommunikationsprotokoll<br />

für den Nachrichtenaustausch im Sinne einer Agenten-Kommunikations-Sprache wurde<br />

KQML 127 entwickelt, worin basierend auf den Erkenntnissen der Sprechakt-Theorie 128<br />

grundlegende Kommunikationsakte mit entsprechend festgelegter Bedeutung definiert<br />

sind. Eine KQML-Nachricht ist in drei Teile gegliedert: Der Inhaltsteil (engl.: „Content<br />

Layer“) enthält die eigentlichen Informationen, im Kommunikationsteil (engl. „Communication<br />

Layer“) werden Sender, Empfänger und eine Identifikation der Nachricht angegeben<br />

und im Nachrichtenteil (engl.: „Massage Layer“) die verwendete Sprache sowie die<br />

verwandte Ontologie spezifiziert (s. Finin+97, S. 6-16). Abbildung 10 zeigt ein Beispiel<br />

einer KQML-Nachricht mit entsprechenden Erläuterungen.<br />

Inhaltsteil<br />

Nachrichtenteil<br />

(ask-one<br />

: sender joe<br />

: content (PRICE IBM ?price)<br />

: receiver stock-server<br />

: reply-with ibm-stock<br />

: language LPROLOG<br />

: ontology NYSE-TICKS)<br />

Performativum<br />

Kommunikationsteil<br />

Abbildung 10: Bespiel einer KQML-Nachricht 129<br />

Die geteilte Spezifikation des Kommunikationsinhaltes als dritte Konventionsebene für<br />

die Kommunikationsfähigkeit zwischen Agenten ist im hier betrachteten Zusammenhang<br />

der Ontologieverwendung wesentlich und soll deshalb ausführlicher betrachtet werden.<br />

C.2.1.2 Geteilte Ontologie als Inhaltsspezifikation<br />

Mit einem gemeinsamen Repräsentationsformat und einer geeigneten Kommunikationssprache<br />

kann der verlustfreie und korrekte Austausch von Wissen zwischen Agenten gewährleistet<br />

werden. Allerdings ist die inhaltliche Korrektheit des ausgetauschten Wissens<br />

damit noch nicht gesichert, weshalb zur Bedeutungsdefinition des Vokabulars der<br />

zwischen den Agenten ausgetauschten Wissensstrukturen eine sogenannte „gemeinsame<br />

Ontologie 130 “ genutzt wird. Diese Ontologie stellt eine vorab definierte Erfassung der<br />

127 KQML: Knowledge Query and Manipulation Language. Entwickelt von der KSE-Forschungsgruppe für externe<br />

Schnittstellen von Wissensbasen und als Quasi-Standard etabliert – ähnlich wie das Ontolingua-System zur formalen<br />

Spezifikation von Ontologien. Eine äquivalente Sprache stellt die ´Agent Commication Language´ (ACL) der FIPA<br />

dar (vgl. FIPA-97). FIPA(Foundation for Intelligent Physical Agents): Non-Profit-Organisation mit der Zielsetzung,<br />

international akzeptierte Spezifikationen für Agententechnologien zu definieren. Siehe: www.fipa.org (04.09.2002).<br />

128 Die Sprechakt-Theorie untersucht Sprechakte als die kleinsten Einheiten sprachlicher Kommunikation hinsichtlich<br />

deren Struktur und Bedingungen für das Verstehen und Gelingen eines Sprechaktes. Dabei werden Sprechakte bezüglich<br />

ihrer lautsprachlichen und semantischen Struktur, der Wirkungsintention des Sprechers sowie der Wirkung beim<br />

Rezipienten unterschieden (vgl. Hindelang94). Diese verschiedenartigen Sprechakte werden in KQML als vordefinierte<br />

Performative (engl.: „performatives“ (Finin+97, S.10)) übernommen.<br />

129 entnommen aus: (Finin+97, S. 10). Erläuterungen durch den Autor.<br />

130 engl.: „common ontology“ (Gruber93b, S. 3).


Kapitel C: Verwendung von Ontologien in Informationssystemen 56<br />

relevanten Wissensstrukturen dar, wobei die Erhaltung der semantischen Korrektheit über<br />

entsprechende ontologische Verpflichtungen durch die beteiligten Agenten erreicht wird<br />

(s. Finin+97, S. 6). Ein derartiger Einsatz von Ontologien in Multi-Agenten-Systemen<br />

wird im KRAFT-Projekt 131 verfolgt (s. Jones98, S. 2f). Hinsichtlich der oben vorgestellten<br />

Verwendungsszenarien von Ontologien (s. C.1.2) entspricht eine solche gemeinsame<br />

Ontologie zur Spezifikation des Inhalts von Kommunikation zwischen Agenten Szenario<br />

I.a, beziehungsweise I.b – je nach Betrachtung der funktionalen Priorität.<br />

Mit einer gemeinsamen Ontologie soll neben der primären Funktion der Sicherstellung<br />

der Korrektheit ausgetauschter Wissensstrukturen das Ziel der Wissensteilung bei der<br />

Entwicklung intelligenter Systeme realisiert werden, da eine gemeinsame Ontologie nur<br />

einmal entwickelt werden muss und fortan für verschiedene Applikationen genutzt werden<br />

kann (s. Gruber93b, S. 2ff). Um eine effiziente Nutzung einer solchen Ontologie zu<br />

gewährleisten, müssen entsprechende infrastrukturelle Lösungen zur Verfügung stehen.<br />

Grundlegende Bedeutung haben dabei „Ontologie Server 132 “, die existente Ontologien<br />

bereitstellen, verwalten und den Zugang zu ihnen ermöglichen. Weiterhin muss die<br />

Handhabung der Ontologien durch Agenten geregelt werden. Die FIPA (siehe Fußnote<br />

127) entwirft dafür einen sogenannten „Ontology Agent“ (FIPA-98, S. 13), der alle diesbezüglichen<br />

Aufgaben für die Verwendung von Ontologien in Multi-Agenten-Systemen<br />

übernehmen soll.<br />

Abschließend ist an<strong>zum</strong>erken, dass die Entwicklung einer geeigneten gemeinsamen<br />

Ontologie für ein Multi-Agenten-System sehr aufwendig ist und in der Praxis als nicht<br />

durchführbar angesehen wird. Daher werden Ansätze mit mehreren Ontologien zur<br />

Sicherung der inhaltlichen Korrektheit der Kommunikation verfolgt (s. Campell+98, S.<br />

1f). Bei derartigen Ansätzen treten neuartige Problemstellungen hinsichtlich der semantischen<br />

Interoperabilität zwischen verschiedenen Ontologien auf, welche später ausführlicher<br />

behandelt werden sollen (s. C.3.2).<br />

C.2.2 Informationsintegration<br />

Unter dem Begriff der Integration wird im informationstechnischen Umfeld die Zusammenführung<br />

von Inhalten aus heterogenen, also nicht kompatiblen Quellen verstanden (s.<br />

Wache+01, S.1). Dabei werden verschiedene Level der Integration gemäß der Unterscheidung<br />

von Daten, Information und Wissen differenziert (s. Schreiber+00, S. 3-5). Als<br />

Datenintegration wird die Schaffung der syntaktischen Kompatibilität, als Informationsintegration<br />

die Zusammenführung bedeutungstragender Daten und als Wissensintegration<br />

die Integration formal erfasster Wissensstrukturen verstanden (s. Rodrígez00, S 8ff). Hier<br />

sollen Verfahren zur ontologie-basierten Informationsintegration besprochen werden.<br />

Die grundlegende Problematik der Schaffung von Interoperabilität zwischen Systemen<br />

oder ihren Komponenten besteht in der Heterogenität der Systemstrukturen, wobei vier<br />

Stufen unterschieden werden. Die niedrigste Stufe stellt die Systemheterogenität hinsicht-<br />

131 KRAFT: Projekt zur Informationsintegration aus heterogenen Quellen, wobei ein entsprechendes Multi-Agenten-<br />

System , ´KRAFT Network´, entwickelt wurde. Darin werden die durchzuführenden Aufgaben an jeweils spezialisierte<br />

Agenten delegiert, deren Kommunikation über eine geteilte Ontologie gesichert wird (s. Jones98, S. 3f).<br />

132 engl.: „ontology server“ (Falasconi+96, S. 13).


Kapitel C: Verwendung von Ontologien in Informationssystemen 57<br />

lich verwandter Hardware und Betriebssysteme dar. Die zweite Stufe der Syntaxheterogenität<br />

bezieht sich auf Sprachen und Datenrepräsentationen. Die als strukturelle Heterogenität<br />

bezeichnete dritte Stufe erfasst Unterschiede in verwandten Datenmodellen, und<br />

die vierte Stufe der semantischen Heterogenität bezieht sich auf Unterschiede in der Bedeutung<br />

der Informationen (s. Sheth98, S.4ff). Die ersten beiden Stufen fallen in den<br />

Bereich der Datenintegration und die letzten beiden in jenen der Informationsintegration,<br />

wobei mit der Verwendung von Ontologien vor allem die Problematik der semantischen<br />

Heterogenität gelöst werden soll (s. Kashyap+96, S. 1f).<br />

Dazu werden im Folgenden zwei Ansätze vorgestellt, in denen die semantische Kompatibilität<br />

zwischen Informationsquellen mit Hilfe von Ontologien als bedeutungsdefinierende<br />

Spezifikation der Inhalte erreicht werden soll (s. Wache+01, S. 2f). Abbildung 11<br />

zeigt die grundlegenden Architekturstrukturen, die anschließend genauer erläutert werden.<br />

Ansatz mit globaler Ontologie (s. C.2.2.1)<br />

Ansatz mit lokalen Ontologien (s. C.2.2.2)<br />

Abbildung 11: Ansätze ontologiebasierter Informationsintegration 133<br />

C.2.2.1 Integration mit einer globalen Ontologie<br />

Im ersten Ansatz enthält eine „globale Ontologie 134 “ bedeutungsdefinierende Beschreibungen<br />

der Inhalte aller zu integrierenden Informationsquellen und stellt somit ein Meta-<br />

Modell zur Gewährleistung der semantischen Interoperabilität zwischen heterogenen Informationsquellen<br />

im Sinne des Verwendungsszenarios II.b (s. C.1.2) dar. Ähnlich wie<br />

eine geteilte Ontologie für die Agentenkommunikation (s. C.2.1.2) wird dadurch ein<br />

einheitliches, bedeutungserhaltendes Vokabular für die Verarbeitung von Informationen<br />

definiert, wobei die Ontologie den maximal erreichbaren Konsens der semantischen<br />

Struktur der einzelnen Informationsquellen darstellt. Je übereinstimmender dieser<br />

Konsens, desto höher ist die geschaffene semantische Interoperabilität (s. Wache+01, S.<br />

2).<br />

Eine globale Ontologie zur Informationsintegration kann aus softwaretechnischen<br />

Beweggründen aus mehreren Ontologien zusammengesetzt werden, wobei die funktionale<br />

Intention jedoch gleich bleibt. Das DOME-Projekt 135 arbeitet mit einer solchen Struktur<br />

und soll daher hier beispielhaft erläutert werden. Darin wird die globale Ontologie durch<br />

eine Hierarchie von Ontologien realisiert, wobei die unterste Ebene die Ontologien der<br />

133 entnommen aus: (Wache+01, S. 2).<br />

134 engl.: „global ontology“ (Wache+01, S.1).<br />

135 DOME (Domain Ontology Management Environment): Projekt der ´Intelligent Business Systems Research<br />

Group´ der BT Group (siehe: http://193.113.209.147/projects/ibsr/dome/index.htm, 11.09.02) zur Entwicklung ontologiebasierter<br />

Techniken für den Bereich des Electronic Business. Das DOME-Werkzeug ist eine Entwicklungsumgebung<br />

für ontologiebasierte Anwendungen (s. Cui+01, S. 3ff).


Kapitel C: Verwendung von Ontologien in Informationssystemen 58<br />

einzelnen Informationsquellen bilden. Die Ontologie auf der nächsthöheren Ebene stellt<br />

eine Zusammenführung ähnlicher Ontologien als den maximal erreichbaren Konsens dar.<br />

Diese Zusammenfassung wird solange vorgenommen, bis nur noch eine Ontologie als<br />

oberste Ebene zur Gewährleistung der semantischen Interoperabilität innerhalb des<br />

Systems existiert. Die Erstellung der einzelnen Ontologien wird durch entsprechende<br />

Werkzeuge unterstützt, muss aber vom Ontologie-Entwickler manuell korrigiert werden<br />

(s. Cui+00, S. 3-5).<br />

Obwohl dieser Ansatz zur Informationsintegration das Problem der semantischen<br />

Heterogenität zu lösen vermag, weist er in der Praxis ähnliche Schwierigkeiten wie bei der<br />

Erstellung der geteilten Ontologie für die Agentenkommunikation auf. Denn je heterogener<br />

die Strukturen der zu integrierenden Informationsquellen sind, desto schwieriger ist<br />

die Findung eines gemeinsamen Verständniskonsenses für die globale Ontologie und desto<br />

geringer ist die erreichbare semantische Interoperabilität (Wache+01, S. 2).<br />

C.2.2.2 Integration mit mehreren lokalen Ontologien<br />

Für verteilte und inhaltlich sehr heterogene Informationssysteme, wie das Internet,<br />

respektive das Semantic Web eines darstellt, wird die Erstellung einer alles umfassenden<br />

globalen Ontologie zur Informationsintegration als sehr schwierig bis unmöglich bewertet<br />

(s. Kashyap+96, S. 1f). Daher wurde ein Ansatz für die Informationsintegration entworfen,<br />

der auf die Erstellung einer globalen Ontologie und somit der Findung eines gemeinsamen<br />

Verständniskonsenses verzichtet. Es werden – wie in Abbildung 11 dargestellt<br />

– lediglich „lokale Ontologien 136 “ zur Inhaltsbeschreibung der einzelnen Ressourcen<br />

verwendet und die semantische Interoperabilität durch sogenannte „interontologische Abbildungen<br />

137 “ erreicht, so dass dieser Ansatz dem Verwendungsszenario II.b (s. C.1.2)<br />

entspricht (s. Wache+01, S. 2).<br />

Eine implementierte Lösung dieses Ansatzes stellt das OBSERVER-System 138 dar, dessen<br />

wesentliche Aspekte hier kurz vorgestellt werden sollen. Gemäß dem Ansatz wird<br />

darin jede Informationsquelle mit einer eigenen Ontologie beschrieben, ohne dass diese in<br />

einer globalen Ontologie zusammengefasst werden. Stattdessen sind im sogenannten „Interontology<br />

Relationship Manager (IRM)“ (Mena+00, S. 16) die Unterschiede zwischen<br />

den Ontologien hinsichtlich der Bedeutungsdifferenzen einzelner Terme beschrieben und<br />

entsprechende Transformationsfunktionen für den bedeutungserhaltenden Austausch von<br />

Informationen definiert. Für diese Abbildungsfunktionen werden die Synonyme (äquivalente<br />

Begriffe), Hyponyme (hierarchisch untergeordnet) und Hypernyme (hierarchisch<br />

übergeordnet) der einzelnen Terme herangezogen (s. Mena+00, S. 17).<br />

Die semantische Interoperabilität zwischen heterogenen Informationsressourcen wird<br />

also durch die IRM-Komponente ermöglicht, wobei der kritische Punkt des Systems in<br />

der manuell zu erstellenden Definition der semantischen Beziehungen sowie der darauf<br />

basierenden Abbildungsfunktionen liegt.<br />

136 engl.: “local ontologies” (Wache+01, S.2).<br />

137 engl.: “inter-ontology mapping” (Wache+01, S.2).<br />

138 OBSERVER (Ontology Based System Enhanced with Relationships for Vocabulary hEterogeneity Resolution).<br />

Entstanden aus einem Forschungsprojekt der ´Universidad de Zaragoza´ zur Handhabung heterogener Ontologien.<br />

Eine umfassende Beschreibung des Ansatzes findet sich in (Mena+00).


Kapitel C: Verwendung von Ontologien in Informationssystemen 59<br />

Die Definition interontologischer Abbildungen fällt in den Bereich der Wissensintegration<br />

und ist im Hinblick auf die Gewährleistung und Erhaltung der semantischen<br />

Korrektheit sehr kompliziert. (s. Wache+01, S. 3). Hinsichtlich der Verwendung von Ontologien<br />

im Semantic Web liegt eine grundlegende Herausforderung an die Forschung in<br />

der Entwicklung zur Handhabung heterogener Ontologien, weshalb dieser Aspekt später<br />

ausführlicher behandelt werden soll (s. C.3.2).<br />

C.2.3 Information Retrieval<br />

Unter Information Retrieval (IR) werden Techniken <strong>zum</strong> Auf-, beziehungsweise Wiederfinden<br />

von Information in Informationssystemen verstanden. Dabei stellt der Benutzer<br />

über eine entsprechende Schnittstelle eine Anfrage, welche das System mit den erfassten<br />

Informationen abgleicht und als Suchresultat die passenden Informationen zurückgibt.<br />

Auf Grund der wachsenden Menge an verfügbaren Informationen, vor allem in weltweit<br />

vernetzten Informationssystemen wie dem Internet, werden immer höhere Qualitätsansprüche<br />

an IR-Techniken gestellt, weshalb reichhaltige Forschungsaktivitäten auf<br />

diesem Gebiet zu verzeichnen sind (s. Greengrass00, S. 6ff).<br />

C.2.3.1 Ontologiebasiertes Information Retrieval<br />

Der ontologiebasierte Ansatz des Information Retrieval basiert auf dem Einsatz von<br />

Ontologien zur Strukturdefinition eines IR-Systems. Dabei wir die Anfrageschnittstelle<br />

auf der Ontologiestruktur basierend konzipiert und die Indizierung der Informationen<br />

durch deren Zuweisung als Instanzen der in der Ontologie erfassten Konzepte vorgenommen.<br />

Als wesentliche Verbesserung der funktionalen Qualität des IR-Systems soll<br />

dadurch das sogenannte „semantische Abgleichen 139 “ ermöglicht werden. Darunter wird<br />

verstanden, dass die intendierte Bedeutung eines in der Anfrage formulierten<br />

Suchbegriffes auf Grund dessen Zuordnung in der Ontologiestruktur in den richtigen<br />

Kontext eingebettet werden kann und so das Suchresultat nur diejenigen Informationen<br />

beihaltet, die dem Suchbegriff entsprechen und außerdem dem relevanten Kontext angehören.<br />

Weiterhin kann eine Ontologie die im System existenten Informationen mit<br />

hintergründigem Wissen ergänzen, wodurch eine erweiterte Informationsgewinnung für<br />

den Nutzer des IR-Systems erreicht werden kann (s. McGuinness98, S. 304ff).<br />

Da ontologiebasierte Verfahren mit den Wissensstrukturen eines Informationssystems<br />

arbeiten, werden sie auch als „Knowledge Retrieval“ (Rodrígez00, S. 26) bezeichnet. Hinsichtlich<br />

der wesentlichen Erfolgsmaße für IR-Systeme 140 wird ontologiebasierten Verfahren<br />

eine höhere Effektivität als anderen Ansätzen zugeschrieben, was vor allem auf die<br />

Möglichkeit der bedeutungsbeschreibenden Erfassung der Informationsressourcen sowie<br />

auf die Möglichkeit <strong>zum</strong> semantischen Abgleichen derselben mit Anfragen zurückgeführt<br />

wird. In einem Effizienzvergleich eines Keyword-Matching-Systems mit einem ontologiebasierten<br />

Ansatz wird dieses empirisch bestätigt (s. Aitken+00, S. 3).<br />

139 engl.: „semantic matching“ (Guarino97, S. 2).<br />

140 Die grundlegenden Erfolgsmaße für IR-Systeme nach (Greengrass00, S. 10):<br />

(1) Trefferquote (engl.: „recall factor“): Anteil der relevanten Informationen im Suchergebnis (Clason76, S.<br />

320).<br />

(2) Genauigkeit (engl.: „precision“): Verhältnis der relevanten Information im Suchergebnis zu den nicht im<br />

Suchergebnis enthaltenen (Clason76, S. 301).


Kapitel C: Verwendung von Ontologien in Informationssystemen 60<br />

C.2.3.1.1 Ontologie als Thesaurus<br />

Wie schon erläutert, werden Ontologien in ontologiebasierten IR-System als strukturdefinierende<br />

Ordnungssysteme verwendet und übernehmen somit eine klassische Thesaurusfunktionalität<br />

(s. Gaus98, S. 148). Die Primitive der Ontologie stellen dabei die Deskriptoren<br />

für die Informationsressourcen dar, wobei gemäß den Anforderungen an einen<br />

Thesaurus bei der Erstellung der Ontologie vor allem die semantischen Zusammenhänge<br />

der Begriffe zu berücksichtigen sind. 141 Die wesentlichen Anforderungen an Ordnungssysteme<br />

im Information Retrieval hinsichtlich der <strong>vollständige</strong>n und konsistenten Erfassung<br />

der Wissensstrukturen werden in gleicher Weise an Ontologien gestellt (s. B.1.4.1),<br />

weshalb deren Verwendung zur Strukturdefinition für die Indizierung im Information Retrieval<br />

im Sinne des Verwendungsszenarios III.a (s. C.1.2) als sinnvoll betrachtet werden<br />

kann. Als entsprechendes Beispiel soll die Verwendung von Ontologien in ONTOSEEK<br />

vorgestellt werden.<br />

C.2.3.1.2 ONTOSEEK<br />

ONTOSEEK 142 ist ein Information Retrieval – System, das eine Ontologie im vorgestellten<br />

Sinne verwendet. Es ermöglicht einen semantischen Abgleich durch Nutzung sprachverarbeitender<br />

Verfahren, was im Folgenden erläutert werden soll.<br />

Zunächst wird die inhaltlich Struktur der Informationen mittels Sprachverarbeitungstechniken<br />

in sogenannten „lexikalischen semantischen Graphen 143 “ dargestellt und dieser<br />

Strukturerfassung unter Verwendung von SENSUS 144 die intendierte Bedeutung zugewiesen.<br />

Diese inhaltlichen Beschreibungen der Informationen werden als bedeutungsbeschreibende<br />

Indexierung in einer Datenbank abgelegt. Außerdem werden sie als<br />

Instanzen der System-Ontologie zugeordnet, welche eine Domänenontologie der entsprechenden<br />

Wissensdomäne darstellt.<br />

Die natürlichsprachlichen Nutzeranfragen werden auf gleiche Art und Weise erfasst,<br />

wobei ihnen die primäre Bedeutung aus der SENSUS-Ontologie zugewiesen wird. Auf<br />

dieser Grundlage kann ein semantischer Abgleich vorgenommen werden: Dazu werden<br />

nur jene Inhaltserfassungen in der Datenbank mit der Abfrage abgeglichen, die in der<br />

System-Ontologie dem gleichen Konzept oder diesem untergeordneten Konzepten zugeordnet<br />

sind wie die bearbeitete Anfrage. Somit soll das Suchergebnis hinsichtlich der Trefferquote<br />

und der Genauigkeit verbessert werden (s. Borgo+97, S. 1-4).<br />

141 Definition eines Thesaurus als Dokumentationssprache im Bereich des Information Retrieval:<br />

“Ein Thesaurus im Bereich der Information und Dokumentation ist eine geordnete Zusammenstellung von Begriffen<br />

und ihren (vorwiegend natürlichsprachlichen) Bezeichnungen, die in einem Dokumentationsgebiet <strong>zum</strong> Indexieren,<br />

Speichern und Wiederauffinden dient. Er ist durch folgende Merkmale gekennzeichnet:<br />

a) Begriffe und Bezeichnungen werden eindeutig aufeinander bezogen (´terminologische Kontrolle´), indem<br />

- Synonyme möglichst vollständig erfasst werden,<br />

- Homonyme und Polyseme besonders gekennzeichnet werden,<br />

- für jeden Begriff eine Bezeichnung [...]festgelegt wird, die den Begriff vertritt,<br />

b) Beziehungen zwischen Begriffen (repräsentiert durch ihre Bezeichnungen) werden dargestellt.“ (DIN 1463, S. 22).<br />

142 ONTOSEEK: Ontologiebasiertes Information Retrieval – System, das mit dem Ziel der Verarbeitung natürlichsprachlicher<br />

Anfragen entwickelt wurde (s. Borgo+97, S. 1f).<br />

143 engl.: „Lexical Semantic Graphs“ (Borgo+97, S.2). Diese dienen der strukturellen Erfassung natürlichsprachlicher<br />

Zusammenhänge und basieren auf dem Ansatz der Konzeptgraphen (s. A.1.1.2).<br />

144 SENSUS: umfangreiche Top-Level-Ontologie, in der mehrere linguistische Ontologien (s. C.2) zusammengeführt<br />

sind. Sie enthält eine einfache taxonomische Struktur der Bedeutung natürlichsprachlicher (englischer) Begriffe und<br />

soll als wiederverwendbare Basis für sprachverarbeitende Applikationen dienen soll (s. Swartout+97).


Kapitel C: Verwendung von Ontologien in Informationssystemen 61<br />

C.3 Implikationen für Ontologiebasierte Informationssysteme<br />

Als Abschluss der Betrachtungen zur Verwendung von Ontologien in Informationssystemen<br />

sollen die wesentlichen Implikationen herausgearbeitet werden, welche sich für<br />

die Erstellung „ontologiebasierter Informationssysteme 145 “ ergeben. Da in den bisherigen<br />

Ausführungen vornehmlich die Einsatzmöglichkeiten von Ontologien als bedeutungsdefinierende<br />

Systemkomponenten behandelt worden sind, soll hier zunächst die Verwendung<br />

von Ontologien als konzeptionelles Hilfsmittel in der Systemsentwicklung besprochen<br />

werden.<br />

Im Unterschied zu den bisher aufgezeigten Verwendungsmöglichkeiten stellt eine im<br />

Entwicklungsprozess eines Systems genutzte Ontologie keine Funktionalität bereit, sondern<br />

eine Konzeptionsgrundlage vor allem für die der Implementierung vor- und nachgelagerten<br />

Entwicklungsstufen. Ein nutzenbringender Einsatz wird vor allem in vier Bereichen<br />

gesehen, für welche die möglichen Vorteile durch die Verwendung einer Ontologie<br />

kurz erläutert werden sollen. Der erste Bereich ist die Systemspezifikation, wobei<br />

eine Domänenontologie als Verständnismodell des Anwendungsgebietes des zu entwickelnden<br />

Systems die Basis zur Identifikation der Systemaufgaben und -funktionalitäten<br />

bilden und somit eine höhere Qualität der Spezifikation gewährleisten kann (s. Borst 97, S.<br />

23f). Weiterhin kann eine Ontologie als zweiter Bereich die Wissensakquisition unterstützen,<br />

indem sie eine Ausgangsbasis für den Wissenserwerb durch ein grundlegendes<br />

Verständnis der behandelten Wissensdomäne bietet und die Zuordnung akquirierter<br />

Wissensstrukturen in den strukturellen Zusammenhang ermöglicht (s. vanHeijst+97, S.<br />

33-50). Für die nachgelagerten Stufen der Systementwicklung kann eine Ontologie erstens<br />

für Systemtests hinsichtlich der Reliabilität verwandt werden (s. Uschold+96, S. 13) und<br />

zweitens die Grundlage für die Erstellung der Dokumentation des Systems bieten (s.<br />

Uschold+99, S. 3).<br />

Dabei kann für alle vorgestellten Bereiche die gleiche Ontologie genutzt werden,<br />

weshalb eine solche Verwendung von Ontologien auch als „ontologiebasierter Ansatz der<br />

Systementwicklung 146 “ bezeichnet wird. Dabei soll die Verwendung einer Ontologie eine<br />

einheitliche, qualitätssichernde Grundlage für die Systementwicklung gewährleisten (s.<br />

Guarino98, S. 8f). Da die Verwendung von Ontologien als Hilfsmittel in der Systementwicklung<br />

für den hier verfolgten Untersuchungszusammenhang lediglich sekundäre<br />

Bedeutung hat, soll dieser Themenbereich nicht weiter ausgeführt werden.<br />

Wesentlicher erscheinen die softwaretechnischen Aspekte zur Handhabung von Ontologien<br />

als wiederverwendbare und integrierbare Komponenten zur Bedeutungsdefinition<br />

in Informationssystemen, da die angestrebten Verbesserungen wissensverarbeitender<br />

Systeme durch ontologiebasierte Verfahren der Wissensmodellierung erst mit der<br />

Bereitstellung entsprechender Techniken erreicht werden können. Dazu sollen die in den<br />

Ausführungen schon häufiger erwähnten Aspekte der Wiederverwendung von Ontologien<br />

in verschiedenen Zielsystemen sowie die Handhabung mehrerer heterogener Ontologien<br />

in einem System genauer betrachtet werden.<br />

145 engl.: „ontology-driven information systems“ (Guarino98, S. 8).<br />

146 engl.: „ontology-driven information system development” (Guarino98, S. 8).


Kapitel C: Verwendung von Ontologien in Informationssystemen 62<br />

C.3.1 Wiederverwendbarkeit<br />

Die Wiederverwendung existenter Programmteile ist ein grundlegendes Anliegen bei der<br />

Entwicklung computergestützter Systeme, wobei die Motivation relativ einfach nachzuvollziehen<br />

ist: Die Entwicklung eines Systems ohne jegliche Vorlage ist sehr aufwendig<br />

und kostenintensiv, außerdem sind umfangreiche Fachkenntnisse zur Gewährleistung einer<br />

angemessenen Qualität des Systems nötig. Daher werden von Spezialisten wiederverwendbare<br />

Komponenten für allgemeine Systemfunktionalitäten entwickelt, durch deren<br />

Verwendung in einem neuen System erstens der Entwicklungsaufwand minimiert und<br />

zweitens dessen funktionale Qualität gesichert werden kann (s. Borst97, S.1f).<br />

Während für die Wiederverwendbarkeit in der konventionelle Softwareentwicklung die<br />

Funktionalität der Komponenten sowie deren Integrierbarkeit durch die Unterstützung<br />

entsprechender Schnittstellen entscheidend ist, müssen wiederverwendbare Komponenten<br />

für wissensverarbeitende Aufgaben vor allem eine allgemeingültige Wissensstruktur<br />

beinhalten, die für unterschiedliche Aufgaben eingesetzt werden kann. Die Erfassbarkeit<br />

derartiger Wissensstrukturen wurde im Hinblick auf das sogenannte „Interaktionsproblem<br />

147 “ in Frage gestellt, wobei diese Einwände durch die Entwicklung generischer<br />

Wissensmodelle im Knowledge Engineering (s. A.1.2.1) entkräftet wurden. Ein generelles<br />

Problem der Erstellung solcher allgemeingültiger Wissensmodelle liegt in der nötigen<br />

Abwägung zwischen Verwendbarkeit und Wiederverwendbarkeit 148 , wozu im Folgenden<br />

ein Lösungsansatz für Ontologien vorgestellt werden soll. Anschließend werden die<br />

wesentlichen Aspekte des Prozesses zur Wiederverwendung von Ontologien dargelegt.<br />

C.3.1.1 Verwendbarkeit und Wiederverwendbarkeit<br />

In seiner Dissertation ging Willem N. Borst (vgl. Borst97) der Fragestellung nach, ob Ontologien<br />

verwendbar für eine konkrete Anwendung und gleichzeitig wiederverwendbar für<br />

verschiedene Applikationen sein können. Dazu wurden zunächst eine Gruppe allgemeingültiger<br />

Ontologien namens PHYSYS zur Beschreibung physischer Systeme entworfen (s.<br />

Borst97, S. 25-54), deren Verwendbarkeit hinsichtlich der Vollständigkeit der darin erfassten<br />

Wissensstrukturen durch die Verwendung als Basis einer Ontologiebibliothek für<br />

physikalische Simulationen bewiesen wurde (Borst97, S. 55-80). Mit der Nutzung der<br />

PHYSYS-Ontologien als Grundlage einer Ontologie für die Produktionswirtschaft (Borst<br />

97, S. 81-120) wurde nachgewiesen, dass die PHYSYS-Ontologien auch in andersartigen<br />

Anwendungskontexten verwendbar sind.<br />

Daraus resultiert, dass trotz des existenten Widerspruchs von Verwendbarkeit und<br />

Wiederverwendbarkeit Ontologien entworfen werden können, die gleichzeitig und in angemessener<br />

Qualität verwendbar und wiederverwendbar sind (s. Borst97, S. 121). Für die<br />

Erstellung derartiger Ontologien ist ein entsprechendes Entwicklungsprinzip zu verfolgen,<br />

wozu Borst das aus dem konventionellen Software Engineering bekannte Prinzip des<br />

147 engl.: „interaction problem“ (Bylander+88, S. 2). Dieses besagt, dass formal erfasste Wissensstrukturen generell<br />

nicht wiederverwendbar sind, weil ihre Struktur derart stark durch ihr spezifisches Anwendungsumfeld determiniert<br />

ist, dass sie nicht auf einen anderen Anwendungszusammenhang übertragen werden können.<br />

148 engl.: „reusability-usability trade-off“ (Klinker+91, S. 3). Damit ist folgender Widerspruch bezüglich der erreichbaren<br />

Qualität generischer Wissensmodelle gemeint: Je wiederverwendbarer ein Wissensmodell ist, desto allgemeingültiger<br />

muss es sein und je allgemeingültiger es ist, desto weniger ist es für eine spezifische Aufgabe verwendbar.


Kapitel C: Verwendung von Ontologien in Informationssystemen 63<br />

„Teilens und Zusammenführens 149 “ proklamiert. Dabei wird eine Modularisierung der<br />

Ontologie in kleinere Teilontologien vorgenommen, welche je eine inhaltlich abgeschlossene,<br />

allgemeingültige Erfassung des Weltausschnitts darstellen (s. Borst97, S. 18f).<br />

Diese Module können zusammengeführt und über sogenannte „ontologische Projektionen<br />

150 “ als Grundlage der Ontologie für einen spezifischen Anwendungskontext verwandt<br />

werden. Dabei werden drei Arten von Projektionen unterscheiden, wobei das<br />

Ontologie-Modul jeweils in die Anwendungsontologie inkludiert und in deren Struktur<br />

eingepasst wird. Die erste Art von Projektion wird als Inklusion und Erweiterung (engl.:<br />

„include and extend“) bezeichnet, wobei das Ontologie-Modul unverändert übernommen<br />

und lediglich dem Kontext entsprechend erweitert wird. Bei der Inklusion und Spezialisierung<br />

(engl.: „include and specialize“) als zweiter Art dient ein abstraktes Ontologie-<br />

Modul als Strukturvorgabe, wobei die Konzepte und Instanzen der Ontologie jenen des<br />

Ontologie-Moduls untergeordnet werden. Bei der dritten Art, bezeichnet als Inklusion<br />

und Abgleich (engl.: „include and map“), müssen die ontologischen Theorien auf Grund<br />

semantischer Heterogenitäten abgeglichen werden (s. Borst97, S. 53f). Dieser Aspekt wird<br />

anschließend genauer betrachtet (s. C.3.2).<br />

C.3.1.2 Wiederverwendung von Ontologien<br />

Durch die Erstellung modularisierter Ontologien und die Definition entsprechender<br />

Operationen für deren Zusammenführung ist zwar die theoretische Möglichkeit der<br />

Wiederverwendung von Ontologien gegeben, jedoch keine Erfassung der nötigen Schritte<br />

zur Integration existenter Ontologien in die Ontologie eines konkreten Anwendungskontextes.<br />

Diese Aufgabe erfordert einen strukturellen Abgleich der zu integrierenden<br />

Ontologie-Module mit den Anforderungen der zu erstellenden Anwendungsontologie<br />

und muss hinsichtlich der konzeptionellen Aspekte manuell vom Ontologie-Entwickler<br />

ausgeführt werden. Eine Unterstützung kann lediglich durch Werkzeuge für einzelne Teilaufgaben<br />

gegeben werden (s. Uschlod+98, S. 179).<br />

In den methodologischen Ansätzen der Ontologie-Entwicklung wird die Wiederverwendung<br />

existenter Ontologien bei der Entwicklung einer neuen Ontologie als zentrales<br />

Ziel ontologiebasierter Verfahren der Wissensmodellierung herausgestellt (s. B.1). Die<br />

dazu durchzuführenden Schritte werden in Tabelle 11 zusammenfassend erläutert.<br />

Tätigkeit<br />

Erläuterung<br />

1. Wiederverwendbarkeit Die Eignung der zu integrierenden Ontologie muss bezüglich der darin erfassten<br />

Wissensstrukturen hinsichtlich des für die Anwendungsontologie benötig-<br />

prüfen<br />

ten Wissens geprüft werden.<br />

2. Übersetzbarkeit prüfen Die Darstellbarkeit in gewünschten Zielsystem ist zu prüfen und eventuell existente<br />

semantische Unterschiede zwischen der zu integrierenden und der Anwendungsontologie<br />

sind hinsichtlich deren Auflösbarkeit zu bewerten.<br />

3. Transformation Falls 1. und 2. positiv ausfallen, wird die Integration vorgenommen. Dazu wird<br />

das konzeptionelle Modell der Anwendungsontologie mit den Definitionen der<br />

integrierten Ontologie erweitert (s. C.3.2)<br />

4. Verifikation der Prüfung der Funktionalität, Vollständigkeit und Konsistenz der neuen Anwendungsontologie<br />

bezüglich der dafür spezifizierten Anforderungen.<br />

Anwendungsontologie<br />

Tabelle 11: Prozess der Wiederverwendung von Ontologien 151<br />

149 engl.: „Divide and Conquer“ (Borst97, S. 18).<br />

150 engl.: „Ontology Projections“ (Borst97, S. 53).<br />

151 nach: (Uschold+98, S. 181-190). Übersetzungen der Begrifflichkeiten durch den Autor.


Kapitel C: Verwendung von Ontologien in Informationssystemen 64<br />

C.3.2 Integration von Ontologien<br />

Die besprochenen Verwendungsmöglichkeiten zeigen einige signifikante funktionale Verbesserungen<br />

durch den Einsatz von Ontologien in Informationssystemen auf. Dabei<br />

wurde jedoch deutlich, dass die Erstellung einer globalen, alle benötigten Wissensstrukturen<br />

erfassenden Ontologie auf Grund der hohen Umweltkomplexität <strong>zum</strong>eist nicht realisierbar<br />

erscheint und daher Ansätze mit mehreren heterogenen Ontologien innerhalb<br />

eines Systems als praktikabler angesehen werden (s. C.2.1.2, C.2.2.2). Um die semantische<br />

Interoperabilität als fundamentales Ziel der Verwendung von Ontologien in Informationssystemen<br />

in derartigen Ansätzen zu gewährleisten, muss diese zwischen den heterogenen<br />

Ontologien ermöglicht werden. Entsprechende Techniken werden als Verfahren<br />

der „Ontologie-Integration 152 “ bezeichnet.<br />

Das grundlegende Problem stellt dabei die semantischen Heterogenität, spezieller die<br />

als „ontologische Heterogenitäten 153 “ bezeichneten Differenzen in der bedeutungsdefinierenden<br />

Erfassung einer Wissensdomäne durch unterschiedliche Ontologien dar. Zur<br />

Gewährleistung der größtmöglichen Interoperabilität wird mit der „Vereinheitlichung 154 “<br />

heterogener Ontologien das höchste Level der Integration angestrebt. Ähnlich der Wiederverwendung<br />

von Ontologien kann diese Aufgabe hinsichtlich der Anforderungen auf<br />

der konzeptionellen Ebene nicht vollständig automatisiert, sondern lediglich durch entsprechende<br />

Werkzeuge unterstützt werden (s. Gangemi+98, S. 166f).<br />

Die Forschungsarbeiten auf diesem Gebiet sind noch nicht weit fortgeschritten, was<br />

auf die Komplexität dieser Problemstellung zurückgeführt wird (s. Wache+01, S. 3). Da<br />

die Ontologie-Integration für Verwendung von Ontologien im Semantic Web von wesentlicher<br />

Bedeutung ist, soll hier eine Klassifikation ontologischer Heterogenitäten sowie<br />

ein Ansatz zur werkzeuggestützten Behandlung derselben vorgestellt werden.<br />

C.3.2.1 Klassifikation ontologischer Heterogenitäten<br />

Mit der Klassifikation ontologischer Heterogenitäten 155 verfolgen Visser et al. das Ziel,<br />

den Aufwand für die Integration zweier Ontologien abschätzen und somit die Umsetzbarkeit<br />

der Integration differenzierter bewerten zu können. Es werden zwei Gruppen von<br />

Heterogenitäten unterschieden, wobei in der erste Gruppe Differenzen in den konzeptionellen<br />

Modellen zusammengefasst sind und in der zweiten Unterschiede in der formalen<br />

Spezifikation. 156 Jede Gruppe ist in mehrere verschiedenartige Heterogenitäten untergliedert<br />

(Visser+98, S. 151-154).<br />

Hinsichtlich des Behebungsaufwandes werden die unterschiedenen Heterogenitäten in<br />

drei Schwierigkeitsstufen eingeordnet. Als einfach behebbar werden dabei die Heterogenitäten<br />

in der formalen Spezifikation bewertet, Term- und Attributzugehörigkeiten<br />

werden als kontextabhängig eingestuft und taxonomische sowie andersartige strukturelle<br />

152 engl.: „Ontology Integration“ (Gangemi+98, S. 163).<br />

153 engl.: „ontological heterogeneity“ (Visser+98, S. 149).<br />

154 engl.: „unification“ (Gangemi+98, S. 166).<br />

155 Die Heterogenitäten werden dabei als „ontological mismatches“ (Visser+98, S. 151) bezeichnet. Obwohl damit<br />

nicht die wortwörtliche Übersetzung gewählt wurde, sollen sie zur Erhaltung der begrifflichen Einheitlichkeit in dieser<br />

Arbeit als ontologische Heterogenitäten bezeichnet werden.<br />

156 Die erste Gruppe wird als „conceptualisation mismatches“, die zweite als „explication mismatches“ bezeichnet<br />

(Visser+98, S. 151).


Kapitel C: Verwendung von Ontologien in Informationssystemen 65<br />

Heterogenitäten als nur schwer lösbar betrachtet (Visser +98, S. 161f). Mit Hilfe dieser<br />

Klassifikation kann sowohl über die generelle Umsetzbarkeit der Integration zweier Ontologien<br />

entschieden als auch der entsprechende Aufwand abgeschätzt werden.<br />

C.3.2.2 Halbautomatisierte Ontologie-Integration<br />

Das ONION-System 157 bietet eine werkzeuggestützte Lösung <strong>zum</strong> Auffinden und zur Behandlung<br />

ontologischer Heterogenitäten. Zur Erläuterung der Funktionsweise des Systems<br />

sollen zunächst die mathematischen Operationen erläutert werden, welche der Zusammenführung<br />

zweier Ontologien zugrunde liegen.<br />

Die Erstellung einer zwei Quellenontologien integrierenden Ontologie beruht auf drei<br />

algebraischen Operationen, welche auch als „Ontologie-Algebra 158 “ bezeichnet werden.<br />

Die erste Operation heißt Intersektion (engl.: „Intersection“), welche die Schnittmenge<br />

der übereinstimmenden Entitäten aus den beiden Quellenontologien zurückliefert und in<br />

Anlehnung an die Mengenalgebra mit dem Operator ´∩´ beschrieben wird. Die Operation<br />

der Vereinigung (engl.: „Union“), bezeichnet durch den Operator ´U´, vereinigt die beiden<br />

Ontologien mit Angabe der Herkunft für jene Entitäten, die in den Quellenontologien unterschiedlich<br />

sind. Die dritte Operation der Differenzierung (engl.: „Difference“), gekennzeichnet<br />

durch den Operator ´–´, liefert diejenigen Entitäten der ersten Ontologie zurück,<br />

die nicht jenen mit der zweiten Ontologie übereinstimmen (s. Wiederhold94, S. 9f).<br />

Für die Ontologie-Integration mit ONION werden die beiden Quellenontologien zunächst<br />

in das systemeigene Repräsentationsformat überführt, um eine einheitliche formale<br />

Darstellung zu erreichen. Dann werden mit Hilfe entsprechender Algorithmen die<br />

Strukturen der Ontologien erfasst und für die Behebung aufgefundener ontologischer<br />

Heterogenitäten sogenannte „Artikulationsregeln 159 “ definiert. 160 Diese müssen von menschlichen<br />

Domänenexperten hinsichtlich ihrer semantischen Korrektheit überprüft und<br />

gegebenenfalls korrigiert werden, da die Algorithmen lediglich eine Struktur-, aber keine<br />

Bedeutungsanalyse erlauben. Auf dieser Grundlage kann als Vereinheitlichung der beiden<br />

Quellenontologien eine neue Ontologie generiert werden, wodurch die Interoperabilität<br />

zwischen den durch die Quellenontologien beschriebenen Informationsressourcen ermöglicht<br />

wird (s. Mitra+01, S. 319-325). Für diesen Vorgang werden die erläuterten algebraischen<br />

Operationen verwendet. Das ONION-System loggt die dabei vorgenommenen<br />

Schritte, so dass der Integrationsprozess nachverfolgt, korrigiert und bei Änderungen in<br />

den Quellenontologien aktualisiert werden kann (s. Mitra+01, S. 325f).<br />

Mit Hilfe eines solchen Systems lässt sich die Ontologie-Integration zwar erleichtern,<br />

die Prüfung der semantischen Korrektheit der Integration bedarf jedoch weiterhin der<br />

Überprüfung durch den Menschen.<br />

157 ONION (ONtology compositION): Im Information Laboratory der Stanford University entwickeltes Werkzeug<br />

zur semi-automatischen Interoperation heterogener Informationsressourcen (s. Mitra+01, S. 1f).<br />

158 engl.: „Ontology Algebra“ (Mitra+01, S. 325).<br />

159 engl.: „articulation rules“ (Mitra+01, S. 319).<br />

160 Da die Diskussion der verwandten Algorithmen über das hier verfolgte Ziel der grundlegenden Erläuterung des<br />

Ansatzes hinausginge, wird an dieser Stelle lediglich auf deren ausführliche Darstellung in (Mitra+99) verwiesen.


Kaptitel D: Ontologien im Semantic Web 66<br />

D Ontologien im Semantic Web<br />

Als zweiter Teil der Arbeit befasst sich dieses Kapitel mit der Verwendung von Ontologien<br />

im Semantic Web, wobei die bisher erarbeiteten Charakteristika ontologiebasierter<br />

Verfahren der Wissensmodellierung als Verständnisgrundlage dienen sollen. Wie eingangs<br />

schon erwähnt, soll mit dem Semantic Web 161 eine Erweiterung der existenten Web-<br />

Technologien als informationstechnische Infrastruktur geschaffen werden. Die Intention<br />

liegt dabei in einer Verbesserung der informationsverarbeitenden Funktionalitäten des<br />

Internets, wodurch dessen Qualität als weltweit vernetztes Informationssystem erhöht<br />

werden soll. Zur Realisierung dieses Vorhabens müssen wissensverarbeitende Techniken<br />

für das Internet bereitgestellt werden, wobei Ontologien als bedeutungsdefinierende<br />

Komponente eingesetzt werden sollen (s. Berners-Lee+01, S. 26-30). Im Folgenden wird<br />

diese Vision genauer erläutert sowie der Stand der Forschung hinsichtlich der<br />

Realisierungen vorgestellt, wobei vor allem die Beweggründe für die Verwendung von<br />

Ontologien genauer untersucht werden sollen. Dazu ist folgenden drei Fragestellungen<br />

nachzugehen: Welche funktionale Rolle sollen Ontologien im Semantic Web übernehmen,<br />

inwieweit sind die Verfahren ontologiebasierter Wissensmodellierung für eine derartige<br />

Verwendung von Ontologien ausgereift, und welche Implikationen resultieren daraus für<br />

konkrete Semantic Web – Anwendungen?<br />

Zur Bearbeitungen dieser Fragestellungen wird zunächst der geplante funktionale<br />

Aufbau des Semantic Web erörtert, wobei vor allem die darin antizipierte Rolle von Ontologien<br />

herausgearbeitet werden soll. Aus der Verwendung von Ontologien als bedeutungsdefinierendem<br />

Grundbaustein des Semantic Web resultieren zwei wesentliche Herausforderungen<br />

an ontologiebasierte Verfahren der Wissensmodellierung. Zum einen werden<br />

web-kompatible Techniken für die formale Spezifikation von Ontologien benötigt und<br />

<strong>zum</strong> anderen Verfahren, die eine angemessene Handhabung von Ontologien bezüglich<br />

der Umweltcharakteristika des Internets erlauben. Für den ersten Aspekt werden im<br />

zweiten Abschnitt des Kapitels entsprechende Ontologie-Spezifikations-Sprachen vorgestellt.<br />

Hinsichtlich des zweiten Aspekts werden im dritten Abschnitt die wesentlichen<br />

Problemstellungen der Handhabung von Ontologien im Semantic Web besprochen und<br />

entsprechende Lösungsansätze aufgezeigt. Abschließend wird kurz auf die Verwendung<br />

von Ontologien in konkreten Semantic Web – Anwendungen eingegangen.<br />

Der Fortführung der Ausführungen sollen noch einige Anmerkungen über die<br />

Forschungsaktivitäten auf diesem Gebiet vorangestellt werden. Wie im Vorwort schon<br />

angedeutet, sind auf Grund des erwarteten Entwicklungsschubs des Internet reichhaltige<br />

Forschungen hinsichtlich der Realisierung der Vision des Semantic Web zu verzeichnen.<br />

Dies wird ersichtlich angesichts der quantitativen sowie qualitativen Fülle der momentanen<br />

Aktivitäten innerhalb der beiden wichtigsten Forschungsgruppen, die sich mit der<br />

Entwicklung entsprechender technischer Lösungen beschäftigen. Die eine Gruppe ist die<br />

161 Der Begriff des „Semantic Web“ wurde von Tim Berners-Lee als Bezeichnung für bedeutungsverarbeitende Web-<br />

Technologien eingeführt (s. Berners-Lee00, S. 169). Hier soll dieser Begriff als Eigenname des Ansatzes des World<br />

Wide Web Consortium (W3C) zur Realisierung eines semantischen Internets verstanden werden.


Kaptitel D: Ontologien im Semantic Web 67<br />

sogenannte „Semantic Web Activity 162 “ des World Wide Web Konsortiums (W3C),<br />

welche im Sinne des W3C Technologie-Standards für das Semantic Web erarbeitet. Die<br />

zweite Gruppe ist die Forschungsgemeinde, die Lösungsansätze für Semantic Web –<br />

Technologien in Projekten erarbeitet. 163 Die erwähnte Festlegung des Aufnahmestopps<br />

neuen Materials für dieses Kapitel auf Ende Juli 2002 begründet sich darin, dass am<br />

29.07.2002 die vorläufige Spezifikation einer Ontologie-Spezifikations-Sprache für das<br />

Semantic Web der Semantic Web Activity erschien. Weiterhin wurden zu diesem Zeitpunkt<br />

die Ergebnisse zweier Konferenzen veröffentlicht, welche in der Bearbeitung Berücksichtigung<br />

finden sollen. 164 Obwohl mit diesen Veröffentlichung Fortschritte für die<br />

hier behandelten Fragestellungen erreicht wurden, sind weiterhin neuartige Kenntnisse zu<br />

erwarten. 165 Auf Grund der befristeten Bearbeitungszeit kann in dieser Arbeit lediglich der<br />

Kenntnisstand bis <strong>zum</strong> genannten Aufnahmestopp berücksichtigt werden.<br />

D.1 Aufbau und Funktionsweise des Semantic Web<br />

Um die Verwendung von Ontologien im Semantic Web untersuchen zu können, sind<br />

zunächst die Grundlagen desselben zu erläutern. Dazu werden im Folgenden die der<br />

´Vision´ des Semantic Web zugrundeliegenden Ideen genauer erläutert und anschließend<br />

die vom W3C vorgeschlagene Architektur zur technischen Realisierung dieser Vision<br />

vorgestellt. Dabei soll insbesondere die antizipierte Rolle von Ontologien herausgearbeitet<br />

und die daraus resultierenden Herausforderungen hinsichtlich der Handhabung von Ontologien<br />

im Semantic Web aufgezeigt werden.<br />

D.1.1 Hintergrund der ´Vision des Semantic Web´<br />

Die vorgestellte Vision des Semantic Web ist nicht als neuartige Idee zur Erstellung eines<br />

intelligenten, weltweit vernetzten Informationssystems zu verstehen, sondern als nächste<br />

Entwicklungsstufe des vorhandenen Internets. Dabei besteht das grundlegende Ziel bei<br />

der Entwicklung des World Wide Web (WWW) in der Erstellung einer „universellen Informationsplattform<br />

166 “, welche durch die Vernetzung von Informationsquellen sowie<br />

durch die Bereitstellung entsprechender Zugriffsmöglichkeiten den Zugang zu allen Informationen<br />

durch jedermann erlauben soll. 167<br />

162 Informationen hierzu finden sich auf der Homepage der W3C Semantic Web Activity: www.w3.org/2001/sw/<br />

(25.09.2002). Da das W3C bei der Entwicklung von Web-Technologien eine gewichtige Rolle einnimmt – es versteht<br />

sich als Gremium zur Steuerung der Entwicklung des Internets als Informationsinfrastruktur (vgl. Jacobs00, W3C<br />

Mission) –, sind den Arbeiten der Semantic Web Activity eine sehr hohe Relevanz zuzuschreiben.<br />

163 Auf dem ´Semantic Web Community Portal´, siehe: www.semanticweb.org (08.06.2002), werden die Ergebnisse<br />

der wesentlichen Forschungsprojekte sowie von entsprechenden Konferenzen zusammengetragen.<br />

164 Die beiden Konferenzen sind:<br />

1) ISWC2002: 1 st International Semantic Web Conference. Sardinia, Italien: 09.06. – 12.06.2002.<br />

siehe: http://iswc.semanticweb.org (12.08.2002)<br />

2) ECAI-2002: 15 th European Conference on Artificial Intelligence. Lyon, Frankreich: 21.07. – 26.07.2002<br />

siehe: http://ecai2002.univ-lyon1.fr/show_en.pl (12.08.02)<br />

165 Hier seien als Beispiel zwei neue Veröffentlichungen genannt, die sich intensiv mit der <strong>Thema</strong>tik befassen.<br />

1) Fensel, D.; Wahlster, W.; Lieberman (Hrsg.): Spinning the Semantic Web. Bringing the World Wide Web to Its<br />

Full Potential. Boston: MIT Press. voraussichtliches Erscheinungsdatum: 15.11.2002.<br />

2) ´Semantic Web´: ERCIM (European Research Consortium for Informatics and Mathematics), Sonderheft<br />

Oktober 2002.<br />

166 engl.: „universal information space“ (Berners-Lee+99, Abstract).<br />

167 Mit dieser Absicht entwickelte Tim Berners-Lee zu Beginn der 1990er Jahre das World Wide Web (s. Berners-<br />

Lee00, S. 8-26). Das W3C wurde gegründet, um die Entwicklung des Internets hinsichtlich dieser Zielvorstellung<br />

voranzutreiben und den Entwurf entsprechender Technologien zu unterstützen (s. Jacobs00, Background).


Kaptitel D: Ontologien im Semantic Web 68<br />

D.1.1.1 Das Internet als universale Informationsplattform<br />

Zur Umsetzung dieses Ziels wurden technische Lösungen entwickelt, die prinzipiell die<br />

Vernetzung und den Zugang zu allen Informationsquellen ermöglichen sollen. Deren<br />

architektonische Grundlage stellt das sogenannte URI 168 -Prinzip dar. Dieses besagt, dass<br />

jede Ressource im Internet mit einer Identifikation versehen werden und somit alles mit<br />

allem verknüpft werden kann (s. Berners-Lee98, The Universal Web). Mit der Bereitstellung<br />

entsprechender Übertragungsprotokolle sowie HTML 169 als Hypertextsprache zur<br />

Darstellung und Verknüpfung von Web-Dokumenten entstand jene Server-Infrastruktur,<br />

die das Internet in seiner existenten Form bildet. Damit wird die Vernetzung von Informationsquellen<br />

sowie der Zugriff auf diese ermöglicht, so dass das grundlegende Ziel der<br />

Entwicklung einer universellen Informationsplattform mit dem bisher existenten WWW<br />

realisiert worden ist (s. Berners-Lee+01, S. 25f).<br />

Allerdings können die Informationen aus Web-Dokumenten derzeit nicht, beziehungsweise<br />

nur mittels proprietärer Lösungen automatisch verarbeitet werden. Dies wird vor<br />

allem auf die Unstrukturiertheit der Informationsdarstellung durch HTML zurückgeführt.<br />

170 Somit stellt das existente Internet eine informationstechnische Infrastruktur zur<br />

Verfügung, welche zwar den Zugang zu Informationsquellen ermöglicht, aber die Interpretation<br />

der Inhalte durch den Menschen erfordert (s. Berners-Lee98, Human Readable<br />

Information). Um die Qualität des Internet als universelle Informationsplattform zu<br />

erhöhen, soll durch Semantic Web – Technologien die Informationsdarstellung derart verbessert<br />

werden, dass eine automatisierte Verarbeitung der Inhalte möglich ist. Dazu ist<br />

zunächst die Strukturiertheit der Informationsdarstellung erforderlich, um eine maschinelle<br />

Verarbeitung generell zu ermöglichen. Weiterhin muss eine Bedeutungsdefinition für<br />

die Informationen gegeben sein, um deren korrekte Handhabung durch die verarbeitenden<br />

Programme zu gewährleisten (s. Miller01, Introduction). Die Ansätze zur Realisierung<br />

dieses Vorhabens werden anschließend genauer erläutert (s. D.1.2).<br />

D.1.1.2 Design-Prinzipien<br />

Dem Design von Web-Technologien liegen drei wesentliche Prinzipien zugrunde, welche<br />

die Funktionalität des Internets als weltweit vernetzte und universell zugängliche Informationsplattform<br />

gewährleisten sollen. Das erste Prinzip der Interoperabilität (engl.: „Interoperability“)<br />

fordert die Kompatibilität von Sprachen und Protokollen, wodurch der<br />

Zugriff auf unterschiedliche Arten von Informationsquellen gesichert werden soll. Mit der<br />

Entwicklungsfähigkeit (engl.: „Evolvability“) als zweitem Prinzip wird die Anpassungsfähigkeit<br />

an neue Technologien gefordert. Das heißt, dass technische Lösungen derart<br />

konzipiert werden sollen, dass nachfolgende Technologien zur Weiterentwicklung des<br />

Internets auf den existenten aufbauen können. Das dritte Prinzip der Dezentralisierung<br />

(engl: „Decentralization“) fordert, dass statt eines zentralen Steuerungsmechanismus die<br />

168 URI: Uniform Resource Identifier. Ein solcher kann jeder Ressource unabhängig von ihren spezifischen Charakteristika<br />

zugewiesen werden, so dass sie eindeutig identifizierbar ist (s. Berners-Lee00, S. 42f).<br />

169 HTML: Hypertext Markup Language. Zur Sicherstellung der Interoperabilität zwischen Informationsquellen entwickelte<br />

Sprache, die sich als Standard zur Darstellung von Web-Sites etabliert hat (s. Berners-Lee98, HTML).<br />

170 HTML dient der visuellen Darstellung von Informationen. Der HTML-Code einer Website spezifiziert das Erscheinungsbild<br />

der Informationen. Es können allerdings keine Angaben über die Struktur der Informationen gemacht<br />

werden, wie sie für eine automatisierte Bearbeitung benötigt werden (s. Berners-Lee98, HTML).


Kaptitel D: Ontologien im Semantic Web 69<br />

Kontrolle des Systems durch die teilnehmenden Server selber vorgenommen werden soll<br />

(s. Jacobs00, Design Principles of the Web). Mit der Entwicklung der existenten Web-<br />

Technologien wurden diese Prinzipien umgesetzt.<br />

Der Realisierung des Semantic Web sollen weiterführende Prinzipien zugrunde liegen.<br />

Diese stellen grundlegende Annahmen bezüglich der Handhabung von Informationen im<br />

Internet sowie deren Verarbeitung mittels entsprechender Technologien dar, weshalb sie<br />

in Tabelle 12 vorgestellt und erläutert werden sollen.<br />

Prinzip<br />

URI-Prinzip<br />

Typendeklaration<br />

Toleranz partieller<br />

Information<br />

Relativer Wahrheitsbeweis<br />

Behandlung heterogener<br />

Konzeptionalisierungen<br />

171<br />

Minimalistisches<br />

Design<br />

Beschreibung<br />

Grundsätzliche Verknüpfbarkeit aller Ressourcen (s.o.).<br />

Ressourcen und Links werden Typen zugewiesen – ähnlich den Datentypen<br />

in einer Programmiersprache. Im bisherigen Web gibt es lediglich Ressourcen<br />

(z.B. ein Web-Dokument) und verknüpfende Links. Die Typ-Zuweisung<br />

stellt eine genauere Beschreibung eines Web-Bestandteils dar, woraus Informationen<br />

über die Beschaffenheit desselben gewonnen werden können.<br />

Dieses Prinzip soll mit dem Ressource Description Framework (s. D.2.1)<br />

umgesetzt werden.<br />

Dieses Prinzip bezieht sich auf die Unbegrenztheit der Informationen im<br />

Internet. Auf Grund der Dezentralisierung kann der Autor jedes Web-Dokuments<br />

Links definieren und diese wieder entfernen. Web-Technologien sollen<br />

dadurch entstehende fehlerhafte Verlinkungen tolerieren können.<br />

Dies bezieht sich auf die Validierung von Beweisführungen. Da keine zentrale<br />

Datenhaltung innerhalb des Internet existiert, müssen Applikationen<br />

entsprechende Aufgaben lokal bearbeiten. Ein Beispiel ist die Verwaltung<br />

von Zugangsrechten.<br />

Hiermit wird als grundlegende Anforderung an das Semantic Web die Behandlung<br />

heterogener Konzeptionalisierungen einer Wissensdomäne gefordert,<br />

welches durch die Verwendung von Ontologien erreicht werden soll (s.<br />

D.1.2.2).<br />

Die Standardisierung von Technologien soll so gering wie möglich gehalten<br />

werden, um eine größtmögliche Verwendungsvielfalt zu gewährleisten.<br />

Tabelle 12: Design-Prinzipien des Semantic Web 172<br />

D.1.1.3 Funktionale Zielsetzung des Semantic Web<br />

Mit dem Semantic Web soll – in Abgrenzung zu vergleichbaren Ansätzen aus der Künstlichen<br />

Intelligenz – kein System zur Simulation menschlicher Intelligenz, sondern eine<br />

Informationsplattform zur Verbesserung der Kooperation zwischen Menschen und Maschinen<br />

entwickelt werden. Zur Verdeutlichung der funktionalen Zielsetzung wird daher<br />

die Metapher einer „globalen Datenbank“ (Berners-Lee98, Mashine-Understandable Information:<br />

Semantic Web) herangezogen. Diese soll verdeutlichen, dass vornehmlich eine<br />

verbesserte Verwaltung von Informationen für deren Nutzung durch den Menschen angestrebt<br />

wird. Dazu werden keine <strong>vollständige</strong>n und korrekten Schlussfolgerungsmechanismen<br />

benötigt, die ein grundlegendes Problem bei der Umsetzung vergleichbarer KI-<br />

Ansätze darstellen. Im Semantic Web sollen Inferenzmechanismen lediglich eine zusätzliche<br />

Funktionalität für die Aufbereitung von Daten zur Verfügung stellen (vgl. Berners-<br />

Lee98a). 173<br />

171 Im Original wird dieses Prinzip als „Unterstützung von Entwicklungsfähigkeit“ (engl. „Evolution is supported“,<br />

Koivunen +01) bezeichnet. Mit Hinblick auf die bisherigen Ausführungen und zur Wahrung der sprachlichen Einheitlichkeit<br />

in dieser Arbeit wurde eine freie, aber sinngemäße Übersetzung gewählt.<br />

172 nach (Koivunen+01, 2. Semantic Web Main Principles). Übersetzungen durch den Autor.<br />

173 Diese Äußerungen sind unter dem Gesichtspunkt zu betrachten, dass sie von Tim Berners-Lee als Initiator der<br />

Semantic Web Initiative stammen. Sie sind hier aufgeführt, um die Zielsetzung der Entwicklung des Semantic Web


Kaptitel D: Ontologien im Semantic Web 70<br />

D.1.2 Architekturmodell<br />

Zur Realisierung des Semantic Web wird vom W3C die in Abbildung 12 dargestellte<br />

schichtenartige Struktur von Web-Technologien vorgeschlagen, welche nach dem Design-<br />

Prinzip der Entwicklungsfähigkeit (s. D.1.1.2) auf existenten Technologien aufbauen und<br />

durch ihr Zusammenwirken die antizipierte Funktionalität des Semantic Web ermöglichen<br />

sollen (s. Koivunen+01, 3. Semantic Web Layers). Dieser Architekturentwurf stellt quasi<br />

den ´Fahrplan´ für die Forschungsarbeiten zur Realisierung des Semantic Web dar und<br />

soll daher hier erläutert werden. Insbesondere soll dabei herausgearbeitet werden, welche<br />

Rolle Ontologien innerhalb der Architektur zugedacht ist, welche Funktionalitäten sie<br />

bereit stellen sollen und welche Herausforderungen hinsichtlich der Handhabung von<br />

Ontologien für diesen Verwendungszweck auftreten. An dieser Stelle sei darauf hingewiesen,<br />

dass noch nicht alle in der Abbildung aufgeführten Technologien für ihren vorgesehenen<br />

Einsatz ausgereift sind.<br />

Abbildung 12: Semantic Web Architektur 174<br />

D.1.2.1 Semantic Web – Technologien<br />

Abbildung 12 zeigt die einzelnen Technologien zur Realisierung des Semantic Web, wobei<br />

durch die hierarchische Anordnung das Zusammenwirken der Bausteine verdeutlicht werden<br />

soll. Des Weiteren sind mit den Anmerkungen auf der linken Seite der Abbildung die<br />

Funktionalitäten der Technologien auf den jeweiligen Schichten angegeben. Auf der untersten<br />

Ebene sind die grundlegenden Techniken zur Informationsdarstellung im Internet<br />

angesiedelt, welche im bisherigen WWW schon Verwendung finden. Dabei wird mit ´Unicode´<br />

ein internationaler Standard zur Darstellung von Zeichen 175 verwendet. Die Identifikation<br />

von Web-Ressourcen wird durch die Zuweisung eines eindeutigen Identifikators<br />

gemäß des URI-Prinzips vorgenommen (s. D.1.1.1).<br />

Die nächste Ebene bildet die Sprache XML 176 , welche die geforderte strukturierte Darstellung<br />

der Informationen für eine automatisierte Verarbeitung derselben gewährleisten<br />

zu verdeutlichen. Eine Diskussion darüber, inwieweit sie als ´Werbung´ für das Semantic Web zu verstehen sind,<br />

ginge über das Ziel dieser Arbeit hinaus. Daher werden sie hier lediglich unkommentiert aufgeführt.<br />

174 entnommen aus (Koivunen+01, 3. Semantic Web Layers).<br />

175 Der Unicode Standard definiert die Darstellung von Zeichnen in Computersystemen. Die Verwendung im Internet<br />

soll eine international eindeutige Informationsdarstellung gewährleisten. Siehe: The Unicode Consortium. The Unicode<br />

Standard, Version 3.0. Reading, Massachusetts (USA): Addison-Wesley Developers Press, 2000.<br />

176 XML: Extensible Markup Language. Zur ausführlichen Spezifikation dieser Sprache siehe (Bray+00).


Kaptitel D: Ontologien im Semantic Web 71<br />

soll (s. D.1.1.1). Dazu wird jedes Informationselement in einem XML-Tag mit einer Bezeichnung<br />

versehen, womit die Beschaffenheit der Informationen im Sinne einer Meta-<br />

Information beschrieben wird. Durch die Gliederung dieser Beschreibungen in einer<br />

baumartigen Struktur können weiterhin strukturelle Zusammenhänge der Informationen<br />

dargestellt werden. Ein XML-Dokument enthält also eine Beschreibung der Beschaffenheit<br />

von Informationen sowie deren strukturellen Zusammenhänge, weswegen es auch als<br />

selbstbeschreibendes Dokument bezeichnet wird (s. Bray+00, 2. Documents). Für die Realisierung<br />

der Semantic Web Architektur stellt die XML-Technologie auf Grund ihrer<br />

Fähigkeit zur Strukturierung von Informationen die Grundlage für eine automatisierte Informationsverarbeitung<br />

durch entsprechende Web-Applikationen dar (s. Koivunen+01, 3.<br />

Semantic Web Layers). 177 Auf der XML-Ebene werden zwei weitere technische Lösungen<br />

aufgeführt, die der Vollständigkeit halber hier kurz erklärt werden sollen. Mit sogenannten<br />

„XML Namespaces“ (vgl. Bray+99) – in Abbildung 12 als ´NS´ abgekürzt – kann ein<br />

semantisch abgeschlossener Informationsraum im Internet definiert werden. 178 Als zweites<br />

wird „XML-Schema“ (vgl. Fallside01) aufgeführt, womit der strukturelle Aufbau von<br />

XML-Dokumenten spezifiziert und so eine entsprechende Validitätsprüfung durchgeführt<br />

werden kann.<br />

Mit XML kann zwar die Beschaffenheit von Informationen und deren struktureller<br />

Zusammenhang definiert werden, allerdings ist keine Bedeutungsdefinition der verwandten<br />

Beschreibungsbegriffe möglich (s. Decker+00, S. 2). Eine solche ist zur Gewährleistung<br />

der semantischen Interoperabilität im Internet als Informationsinfrastruktur mit<br />

sehr heterogenen Informationsquellen nötig (s. C.2.2), weshalb auf den folgenden beiden<br />

Ebenen des Architekturmodells entsprechende Technologien angesiedelt sind. Das erste<br />

Level bildet mit dem Resource Description Framework (RDF) 179 ein Modell zur Beschreibung<br />

von Ressourcen und Links im Sinne des Designprinzips der Typendeklaration<br />

(s. D.1.1.2). Die in RDF-Ausdrücken verwendeten Beschreibungsprimitive werden dabei<br />

in sogenannten RDF Schemata (RDFS) 180 definiert, äquivalent der Strukturdefinition<br />

durch XML-Schemata. Diese Technologien erlauben eine Beschreibung der semantischen<br />

Struktur der Informationen, welche allerdings erstens nur über eine geringe Ausdrucksfähigkeit<br />

verfügen und zweitens die Eindeutigkeit der Bedeutungsdefinitionen nur in semantisch<br />

abgeschlossenen Informationsräumen gewährleisten können. Mit der Verwendung<br />

von Ontologien auf der nächsten Ebene sollen daher <strong>zum</strong> einen ausdrucksstärkere<br />

Verfahren zur Bedeutungsdefinition eingesetzt und <strong>zum</strong> anderen die semantische Interoperabilität<br />

zwischen autonom entwickelten und somit potenziell heterogenen Informationsräumen<br />

sichergestellt werden (s. Heflin+02, Introduction). Eine ausführlichere Dis-<br />

177 Auf Grund der Trennbarkeit der Informationsdarstellung in die Präsentation durch HTML und die Strukturdefinition<br />

durch XML stellt XML ein wichtiges Datenformat für informationsverarbeitende Web-Anwendungen dar. Es<br />

wurde eine Vielzahl von Werkzeugen entwickelt, welche die Verarbeitung von Informationen aus XML-Dokumenten<br />

ermöglichen. Da eine genauere Betrachtung derselben keinen Erkenntnisgewinn für den hier betrachteten Zusammenhang<br />

bietet, soll lediglich auf die wichtigsten diesbezüglichen Informationsquellen im Internet verwiesen werden.<br />

Siehe: www.w3c.org/XML/ und www.xml.org (beide 28.09.2002).<br />

178 Ein XML-Namespace definiert lediglich ein Namensraum, in dem die Begrifflichkeiten eindeutig sein sollen. Die<br />

Bedeutung der Begriffe muss in den Verarbeitungswerkzeugen explizit definiert sein (s. Bray+99, Qualified Names).<br />

179 RDF: Resource Description Framework. Die standardisierte Spezifikation findet sich in (Lassila+99).<br />

180 RDFS: Resource Description Framework Schema. Eine vorläufige Spezifikation wird in (Bickley+00) gegeben.


Kaptitel D: Ontologien im Semantic Web 72<br />

kussion des Verhältnisses von RDF und Ontologien wird im Zusammenhang der Spezifikation<br />

von Ontologien für das Semantic Web vorgenommen (s. D.2).<br />

Die in Abbildung 12 über der Ontologie-Ebene angesiedelten Technologien sollen der<br />

Definition und Verarbeitung von Inferenzmechanismen dienen, weshalb diese Ebenen<br />

auch als Logik-Level bezeichnet werden. Mit ihnen soll das informationsverarbeitende<br />

Potenzial des Semantic Web ausgeschöpft werden können, wobei die Arbeiten auf diesem<br />

Gebiet noch nicht sehr weit fortgeschritten sind (s. Berners-Lee98, Semantic Web: the<br />

pieces). Ergänzend dazu sollen mit Verfahren der Digitalen Signatur Technologien zur<br />

maschinellen Authentizitätsprüfung von Informationen aus dem Internet bereitgestellt<br />

werden (s. Berners-Lee98b, Digital Signature). Im Rahmen der Untersuchung der Verwendung<br />

von Ontologien im Semantic Web erscheint eine weitere Betrachtung dieser<br />

Technologien nicht erforderlich.<br />

D.1.2.2 Rolle von Ontologien im Semantic Web<br />

Wie aus der Erläuterung des Architekturmodells zur Realisierung des Semantic Web hervorgeht,<br />

sollen Ontologien darin als bedeutungsdefinierende Technologie-Komponente<br />

eingesetzt werden. Dabei sind zwei Funktionalitäten zu unterscheiden, welche durch die<br />

Verwendung von Ontologien im Semantic Web bereitgestellt werden sollen. Die erste<br />

Funktionalität ist die semantische Beschreibung von Informationsressourcen, wobei eine<br />

Ontologie auf Grund ihrer größeren Ausdrucksfähigkeiten zur Bedeutungsdefinition die<br />

Beschreibung von Informationszusammenhängen durch RDF(S) unterstützen und erweitern<br />

soll. Die zweite Funktionalität ist die Gewährleistung der semantischen Interoperabilität<br />

heterogener Informationsräume, also eine Technik für den bedeutungserhaltenden<br />

Informationsaustausch zwischen Informationsräumen mit unterschiedlichen Verständnisoder<br />

Begriffsmodellen einer Wissensdomäne. Damit sollen Ontologien die technische Lösung<br />

zur Realisierung des Design-Prinzips der Unterstützung heterogener Konzeptionalisierungen<br />

(s. D.1.1.2) darstellen. Mit der Verwirklichung dieses Prinzips soll die automatisierte<br />

und bedeutungserhaltende Informationsverarbeitung zwischen den Informationsräumen<br />

des Internet ermöglicht werden, was eine grundlegende Anforderung an das Semantic<br />

Web als universelle Informationsinfrastruktur mit informationsverarbeitenden<br />

Fähigkeiten darstellt. Auf Grund der wesentlichen Bedeutung dieser Funktionalität für die<br />

Realisierung des Semantic Web werden Ontologien als ein „essentieller Grundbaustein<br />

des Semantic Web 181 “ bezeichnet.<br />

Die grundsätzliche Eignung von Ontologien für die angestrebte Verwendung im<br />

Architekturmodell des Semantic Web zur Gewährleistung dieser beiden Funktionalitäten<br />

kann an Hand der vorhergehenden Betrachtung der Charakteristika ontologiebasierter<br />

Verfahren der Wissensmodellierung nachvollzogen werden. Die funktionale Konzeption<br />

von Ontologien als bedeutungsdefinierende Konstrukte wurde im Zuge der Erläuterung<br />

der Charakteristika ontologiebasierter Wissensmodellierung herausgearbeitet (s. A.2). Hinsichtlich<br />

der Entwicklung entsprechender Ontologien wurden die existenten methodologischen<br />

Ansätze für den Ontologie-Entwicklungsprozess diskutiert (s. B.1). Die Verwend-<br />

181 engl.: „Ontologies are often seen as the basic building blocks for the Semantic Web, ...” (Klein+01, S. 75).


Kaptitel D: Ontologien im Semantic Web 73<br />

barkeit von Ontologien als bedeutungsdefinierende Komponente in Informationssystemen<br />

unter besonderer Berücksichtigung der wesentlichen Anwendungsszenarien für das<br />

Semantic Web wurde in Kapitel C dargelegt (s. C.1, C.2).<br />

Diese Erkenntnisse aus dem Ontology Engineering verleiten zu der Annahme, dass die<br />

nötigen Kenntnisse für die Verwendung von Ontologien im Semantic Web vorhanden<br />

seien (s. Berners-Lee00a, S. 12). Auf Grund der in den bisherigen Ausführungen erarbeiteten<br />

Kenntnisse muss eine differenzierte Betrachtung dieser Annahme vorgenommen<br />

und deren Allgemeingültigkeit revidiert werden. Es existieren Methoden für die Erstellung<br />

von Ontologien und Kenntnisse über die sinnvolle Verwendung derselben als bedeutungsdefinierender<br />

Komponente in Informationssystemen, welche vor allem die erstgenannte<br />

Funktionalität im Semantic Web ermöglichen. Für die zweite Funktionalität der<br />

Verwirklichung der semantischen Interoperabilität von Informationsressourcen im Internet<br />

werden Verfahren für die Handhabung mehrerer heterogener Ontologien benötigt.<br />

Wie bei der Besprechung von Lösungsansätzen für diese Problematik deutlich wurde (s.<br />

C.3.2), sind die Kenntnisse auf diesem Gebiet noch nicht ausreichend fortgeschritten. Auf<br />

Grund der oben aufgezeigten Wichtigkeit dieser Funktionalität stellt die Entwicklung entsprechender<br />

Verfahren eine wesentliche Herausforderung für die Realisierung der Vision<br />

des Semantic Web dar.<br />

D.1.2.2.1 Anforderungen an Ontologien<br />

Die Anforderungen an Ontologien für deren Verwendung als bedeutungsdefinierendem<br />

Grundbaustein des Semantic Web entsprechen denjenigen, die an Ontologien für andere<br />

Anwendungsgebiete gestellt werden.<br />

Um eine korrekte, bedeutungsdefinierende Beschreibung von Informationsressourcen<br />

im Internet zu gewährleisten, muss eine Ontologie ein Verständnismodell der behandelten<br />

Wissensdomäne im Sinne einer ontologischen Theorie (s. B.1.2.2) darstellen. Somit sollten<br />

Ontologien für das Semantic Web auf einer geteilten und expliziten Konzeptionalisierung<br />

basieren (s. A.2.1.1). Weiterhin sollten in der Ontologie die grundlegenden inferenziellen<br />

Beziehungen der Wissensdomäne erfasst sein, welche als Grundlage für darauf<br />

aufsetzende informationsverarbeitende Applikationen dienen können (s. Heflin +02,<br />

Introduction). Um den Qualitätsansprüchen an Ontologien (s. B.1.4.1) zu genügen, sollten<br />

bei der Entwicklung einer Ontologie für das Semantic Web die entsprechenden Design-<br />

Kriterien (s. B.2.1.) berücksichtigt werden. Weiterhin muss eine im Semantic Web verwendbare<br />

Ontologie in einer formalen Spezifikation vorliegen (s. B.1.3).<br />

Für die meisten Aufgabengebiete der Entwicklung von Ontologien für das Semantic<br />

Web können die in Kapitel B besprochenen Methoden der Ontologie-Entwicklung verwendet<br />

werden. 182 Lediglich für die formale Darstellung von Ontologien müssen webkompatible<br />

Ontologie-Spezifikations-Sprachen entwickelt werden, um die Verarbeitung<br />

von Ontologien durch Web-Technologien gewährleisten zu können und somit dem<br />

Design-Prinzip der Entwicklungsfähigkeit (s. D.1.1.2) gerecht zu werden. Dieser Aspekt<br />

wird anschließend ausführlicher behandelt (s. D.2).<br />

182 Es sei an dieser Stelle nochmals darauf hingewiesen, dass die Entwicklung von Ontologien ein sehr aufwendiges<br />

Unterfangen ist und dass noch keine umfassende Methodologie für die Ontologie-Entwicklung bereitsteht (s. B.3).


Kaptitel D: Ontologien im Semantic Web 74<br />

D.1.2.2.2 Herausforderungen an das Ontologie-Management<br />

Die Gewährleistung der Interoperabilität zwischen verschiedenen Informationsräumen im<br />

Internet stellt das wesentliche Ziel bei der Verwendung von Ontologien im Semantic Web<br />

dar. Diese soll durch den Aufbau eines „Netzwerks von Ontologien 183 “ erreicht werden,<br />

in dem alle benötigen Informationsstrukturen in einzelnen Ontologien erfasst sind. In diesem<br />

Netzwerk können grundsätzlich alle Arten von Ontologien (s. C.1.2, Tabelle 10)<br />

auftreten, wobei sie als Ontologie-Module gemäß dem Ansatz des „Teilens und Zusammenführens“<br />

für die Wiederverwendbarkeit von Ontologien (s. C.3.1.1) aufgebaut sein<br />

sollen. Der bedeutungserhaltende Informationsaustausch zwischen heterogenen Informationsräumen<br />

soll durch die Sicherstellung der semantischen Interoperabilität zwischen den<br />

einzelnen Ontologien ermöglicht werden. Weiterhin sollen die einzelnen Ontologien anpassungsfähig<br />

an die Umweltcharakteristika des Internet sein, so dass mit dem Netzwerk<br />

interagierender und anpassungsfähiger Ontologien der semantische Grundbaustein des<br />

Semantic Web zur Verfügung gestellt werden soll (s. Berners-Lee+01, S. 27f).<br />

Auf Grund dieser Zielsetzung ergeben sich drei wesentliche Herausforderung für die<br />

Handhabung von Ontologien im Semantic Web. Die erste ist die Teilbarkeit von Ontologien<br />

(engl.: „shared ontologies“), worunter die Verwendbarkeit der gleichen Ontologie<br />

für mehrere Applikationen und die Wiederverwendbarkeit existenter Ontologie-Module<br />

als Basis neuer Ontologien verstanden wird (s. C.3.1). Mit der Entwicklungsfähigkeit<br />

(engl.: „ontology evolution“) als zweite Herausforderung wird die Anpassungsfähigkeit<br />

von Ontologien an Umweltveränderungen gefordert. Auf Grund der Anonymität sowie<br />

der Dezentralisierung des Internet sind solche häufig zu erwarten, weshalb die längerfristige<br />

Nutzbarkeit von Ontologien nur durch eine entsprechende Anpassung gewährleistet<br />

werden kann. Die dritte wesentliche Herausforderung ist Gewährleistung der Interoperabilität<br />

zwischen Ontologien (engl.: „ontology interoperability“), also die oben diskutierte<br />

Problematik der Behandlung heterogener Ontologien (s. Heflin +02, 3. Design<br />

Goals). Lösungsansätze für diese Herausforderungen werden später vorgestellt (s. D.3).<br />

D.2 Ontologie-Spezifikation für das Semantic Web<br />

Für die Verwendung von Ontologien im Semantic Web wurde als neuartige Anforderung<br />

die Entwicklung von Ontologie-Spezifikations-Sprachen herausgestellt, die mit den existenten<br />

Web-Technologien kompatibel sind. Dazu wird im Folgenden jener Ansatz vorgestellt,<br />

den das W3C zur Standardisierung entsprechender Repräsentationsformalismen<br />

verfolgt. 184 Im Vordergrund der Betrachtungen soll dabei die funktionale Integration der<br />

Techniken mit den existenten Web-Technologien stehen. Da die RDF-Technologie dabei<br />

eine grundlegende Rolle einnimmt, wird zunächst deren Funktionsweise erläutert und<br />

anschließend darauf aufbauende Spezifikationssprachen für Ontologien besprochen.<br />

183 engl.: „web of ontologies“ (Heflin+02, 3.3 Ontology Interoperation).<br />

184 Es ist darauf hinzuweisen, dass noch nicht für alle hier zu besprechenden Technologien endgültige Spezifikationen<br />

seitens des W3C vorliegen. Dabei dürfen noch in der Entwicklungsphase befindliche Spezifikationen nicht als<br />

Referenzen für technologische Lösungen angesehen werden. Der Entwicklungstand einer Technologie kann an Hand<br />

der Art des referenzierten Dokumentes nachvollzogen werden, welche im Literaturverzeichnis angegeben ist. Dabei<br />

wird eine endgültige Spezifikation als ´Recommendation´, eine noch nicht endgültige als ´Candidate´ oder ´Proposed<br />

Recommendation´ und ein erster Entwurf als ´Working Draft´ bezeichnet. Nähere Erläuterungen hierzu finden sich<br />

im ´W3C Process Document´ unter: www.w3.org/Consortium/Process-20010719/tr (04.10.2002).


Kaptitel D: Ontologien im Semantic Web 75<br />

D.2.1 Resource Description Framework (RDF)<br />

Das Resource Description Framework (RDF) ist ein Verfahren zur Repräsentation von<br />

Meta-Daten, mit dem sowohl Informationsressourcen im Internet beschrieben als auch<br />

darüber hinausgehende Zusammenhänge dargestellt werden können. Den Kern der RDF-<br />

Technologie bildet ein Modell zur Repräsentation von Informationszusammenhängen,<br />

das zur Gewährleistung der Interoperabilität mit anderen Web-Technologien in XML dargestellt<br />

werden kann (s. Lassila+99, 1. Introduction). Im Folgenden werden die wesentlichen<br />

Bestandteile dieser Technologie erläutert.<br />

D.2.1.1 RDF Modell<br />

Zur Repräsentation von Meta-Informationen werden im RDF Modell sogenannte „RDF-<br />

Ausdrücke 185 “ verwendet, welche eine „Behauptung 186 “ über die Beschaffenheit einer Ressource<br />

durch die Definition einer Subjekt-Prädikat-Objekt – Beziehung beinhalten. Dabei<br />

wird das Subjekt mit Hilfe des Prädikat beschrieben und das Objekt stellt den Wert, also<br />

den Inhalt des Prädikats dar. Diese Beziehungen werden in „gerichteten, bewerteten Graphen<br />

187 “ abgebildet, wobei die Knoten die Subjekte, beziehungsweise die Objekte darstellen<br />

und die Prädikate durch entsprechend bezeichnete Kanten repräsentiert werden.<br />

Alle mit diesem Modell darstellbaren Informationen werden als Ressourcen bezeichnet,<br />

wobei jede Ressource durch sogenannte Properties beschrieben werden kann (s. Lassila<br />

+99, 2.1. Basic RDF Model).<br />

Zur Veranschaulichung zeigt Abbildung 13 einen solchen Graph, der folgende Aussage<br />

repräsentiert: Ein Web-Dokument, identifiziert über eine spezifische URL, hat den Titel<br />

´RDF/XML Syntax Specification (Revised)´ und einen Autor namens ´Dave Beckett´, der<br />

wiederum eine eigene Homepage mit der Adresse ´http://purl.org/net/dajobe/´ hat.<br />

Abbildung 13: RDF-Aussage in Graphdarstellung 188<br />

In der Abbildung stellen die rechteckigen Knoten einfache Strings dar. Die ovalen<br />

Knoten sowie die Prädikate repräsentieren Ressourcen, die über eine URI genau identifiziert<br />

werden können. Mit dem Prädikat ´http://www.example.org/terms/editor´ wird<br />

so eine im Internet verfügbare Definition für den Begriff ´editor´ referenziert, wodurch<br />

185 engl.: „statements“ (Lassila+99, 2.1 Basic RDF Model).<br />

186 engl.: „assertion“ (Berners-Lee98b, The basic assertion model).<br />

187 engl: „directed labeled graphs“(Lassila+99, 2.1 Basic RDF Model).<br />

188 entnommen aus (Manola+02, 3 An XML Syntax for RDF).


Kaptitel D: Ontologien im Semantic Web 76<br />

das intendierte Verständnis des Begriffs explizit definiert wird. Die Identifizierbarkeit auf<br />

Grundlage des URI-Prinzips (s. D.1.1.1) erlaubt die bedeutungsdefinierende Strukturbeschreibung<br />

einer Wissensdomäne durch RDF-Ausdrücke, da diese somit Aussagen über<br />

real existierende Ressourcen machen können (s. Manola+02, 2.3 The RDF Model). 189<br />

D.2.1.2 XML - Serialisierung<br />

Die als Serialisierung bezeichnete Darstellung eines RDF-Modells in XML soll dessen Interoperabilität<br />

mit den anderen Semantic Web – Technologien ermöglichen. Dazu werden<br />

die Beschreibungselemente aus den Modellgraphen in eine entsprechende XML-Struktur<br />

überführt. 190 Abbildung 14 stellt die XML-Serialisierung des RDF-Ausdrucks aus Abbildung<br />

13 dar. Es sei angemerkt, dass RDF-Modelle auch in andere Repräsentationsformalismen<br />

übertragen werden können (s. Lassila+99, 2.2.1. Basic Serialization Syntax).<br />

1 <br />

2 <br />

5 <br />

6 RDF/XML Syntax Specification (Revised)<br />

7 <br />

8 Dave Beckett<br />

9 <br />

10 <br />

11 <br />

12 <br />

Abbildung 14: RDF-Aussage in XML-Serialisierung 191<br />

Ohne vertiefend auf die Spezifika von XML einzugehen, sollen hier die <strong>zum</strong> Verständnis<br />

wesentlichen syntaktischen Aspekte der XML-Serialisierung aus der Abbildung erläutert<br />

werden. Zeile 1 definiert das Dokument als ein XML-Dokument. Der RDF-Ausdruck<br />

wird in einem -Tag dargestellt. Die verwandten XML-Namespaces werden in den<br />

Zeilen 2 bis 4 definiert, so dass die Eindeutigkeit der Begriffsdefinitionen durch Nutzung<br />

der entsprechenden Präfixe sichergestellt ist (siehe Fußnote 178). Die Zeilen 5 bis 11 enthalten<br />

die Kodierung der Aussage aus dem RDF-Graphen, wobei die Prädikatenstruktur<br />

implizit in der baumartigen Struktur des XML-Dokuments enthalten ist. In Zeile 12 wird<br />

der gesamte RDF-Ausdurck geschlossen (s. Beckett02, 2 An XML Syntax for RDF).<br />

D.2.1.3 RDF Schema (RDFS)<br />

Mit dem grundlegenden RDF-Modell lassen sich Eigenschaften und Zusammenhänge<br />

von Ressourcen im Sinne von Meta-Informationen beschreiben. Allerdings können darin<br />

keine Angaben über Typen von Ressourcen oder deren strukturelle Zusammengehörigkeit<br />

definiert werden. Da derartige Funktionalitäten für die Beschreibung von Informationsstrukturen<br />

eine grundlegende Rolle einnehmen (s. B.2.2), wird mit RDF Schema (RDFS)<br />

ein Mechanismus für diese Art der Beschreibung von Ressourcen bereitgestellt. In RDFS<br />

ist ein entsprechendes Typensystem definiert, dass ähnlich wie die Frame Ontology des<br />

Ontolingua-Systems (s. B.1.3.2) eine Art Wissensrepräsentations-Ontologie (s. C.1.1.2,<br />

189 Der Bezug zur realen Welt stellt die grundlegende Bedingung für die modelltheoretische Definition der präzisen<br />

Semantik der Beschreibungsprimitive von RDF dar, welche die Verwendung von RDF als Repräsentationsschema<br />

verbessern soll. Der erste Entwurf einer entsprechenden Modelltheorie findet sich in (Hayes02).<br />

190 Der Spezifikationsentwurf einer XML-Syntax zur Darstellung von RDF-Ausdrücken findet sich in (Beckett02).<br />

191 entnommen aus (Manola+02, 3 An XML Syntax for RDF).


Kaptitel D: Ontologien im Semantic Web 77<br />

Tabelle 10) für RDF-Ausdrücke darstellt (s. Manola+02, 4. Defining RDF Vocabularies:<br />

RDF Schema). In Tabelle 13 sind die wichtigsten Typen von RDFS erfasst und kurz erläutert.<br />

Ein vertiefendes Verständnis der Typen soll durch die Verwendung im Beispiel<br />

der Ontologie-Spezifikation gegeben werden (s. D.2.2.1).<br />

Typ<br />

Core Classes<br />

rdfs:Class<br />

rdfs:Resource<br />

rdf:Property<br />

Core Properties<br />

Beschreibung<br />

Grundlegende Arten von Ressourcen in RDF-Ausdrücken.<br />

Basis-Klasse: Alle Konzepte werden dieser Klasse untergeordnet.<br />

Abstrakte RDF-Ressource: Alle Ressourcen eines RDF-Ausdrucks werden<br />

als Instanzen davon verstanden.<br />

Abstrakte RDF-Property: Alle Properties einer Ressource werden als Instanzen<br />

davon verstanden. Untermenge von rdfs:Resource.<br />

Primitive zur Beschreibung von Properties und Relationen.<br />

rdf:type<br />

Deklaration der Zugehörigkeit einer Ressource zu einer Klasse.<br />

rdfs:subClassOf Deklaration einer Subsumptions-Beziehung (s. B.2.2) zwischen Klassen.<br />

rdfs:subPropertyOf Deklaration einer Subsumptions-Beziehung zwischen Properties.<br />

Constraints<br />

rdfs:range<br />

rdfs:domain<br />

Primitive zur Beschränkung der Gültigkeit von Klassen und Properties.<br />

Gültigkeitsbeschränkung einer Property für eine Klasse und deren Instanzen.<br />

Gültigkeitsbeschränkung einer Property für eine Klasse und deren untergeordnete<br />

Klassen.<br />

Tabelle 13: Grundtypen von RDF Schema (RDFS) 192<br />

D.2.2 Ontologie-Spezifikations-Sprachen<br />

Wie aus den bisherigen Erläuterungen deutlich geworden ist, stellt die RDF-Technologie<br />

ein Verfahren zur Repräsentation bedeutungsdefinierender Meta-Informationen für das<br />

Semantic Web dar. Durch die Verwendung des RDFS-Typensystems können einfache taxonomische<br />

Informationsstrukturen definiert werden und die Darstellbarkeit eines RDF-<br />

Modells in XML erlaubt den Austausch der Informationen zwischen Semantic Web –<br />

Applikationen sowie deren Verarbeitung mit Hilfe entsprechender Werkzeuge. 193 Somit<br />

erfüllt die RDF-Technologie die wesentlichen Anforderungen an eine Ontologie-<br />

Spezifikations-Sprache für das Semantic Web, weil damit die bedeutungsdefinierende<br />

Beschreibung von Informationsressourcen im Internet möglich die Kompatibilität mit<br />

den existenten Web-Technologien gewährleistet ist.<br />

Allerdings verfügt die RDF-Technologie nur über eine geringe Ausdrucksfähigkeit hinsichtlich<br />

der erfassbaren Informationsstrukturen. Für die formale Spezifikation einer Ontologie<br />

wird vom Repräsentationsformalismus jedoch die Fähigkeit zur <strong>vollständige</strong>n und<br />

korrekten Überführung der im konzeptionellen Modell erfassten Wissensstrukturen<br />

gefordert (s. B.1.3.1). Daher sollen mit den Ontologie-Spezifikations-Sprachen weiterführende<br />

Beschreibungsprimitive zur Verfügung gestellt werden, welche auf der RDF-<br />

Technologie als grundlegendem Repräsentationsformalismus aufsetzen und erweiternde<br />

192 nach (Brickley+00, 2. Classes and Properties; 3. Constraints). Darin finden sich weiterführende Erläuterungen und<br />

Beispiele. Die Bezeichnungen wurden in englischer Sprache belassen, da es sich um definierte Eigennamen handelt.<br />

193 Für die Be- und Verarbeitung von RDF/XML-Informationen sind vornehmlich zwei Arten von Werkzeugen relevant.<br />

Erstens visualisierende Entwicklungswerkzeuge für die Erstellung eines RDF-Ausdrucks und dessen XML-<br />

Serialisierung - ähnlich wie visualisierende Repräsentationsschemata für die Ontologie-Entwicklung (s. B.1.2.3). Das<br />

Tool ´IsaViz´ ist eine beispielhafte Implementierung des W3C für ein solches Tool und ist frei erhältlich unter:<br />

www.w3.org/2001/11/IsaViz/ (25.09.2002). Zweitens werden entsprechende RDF/XML-Parser zur Extraktion der<br />

RDF-Informationen aus der XML-Darstellung für die weitere Verarbeitung benötigt (s. Manola+02, 3. An XML<br />

Syntax for RDF).


Kaptitel D: Ontologien im Semantic Web 78<br />

Spezifikationsfähigkeiten aufweisen sollen. Dazu wurden in verschiedenen Forschungsprojekten<br />

entsprechende Sprachen entwickelt. Für diese soll hier stellvertretend jene vorgestellt<br />

werden, die zur Standardisierung einer Ontologie-Spezifikations-Sprache für das<br />

Semantic Web durch das W3C vorgeschlagen wird . 194<br />

D.2.2.1 Web Ontology Language (OWL)<br />

In der Semantic Web Activity des W3C (siehe Fußnote 162) ist die sogenannte Web-<br />

Ontology Working Group 195 mit der Spezifikation einer Ontologie-Spezifikations-Sprache<br />

beauftragt, welche als standardisierte Web-Technologie auf der Ontologie-Ebene des<br />

Architekturmodells des Semantic Web (s. D.1.2) fungieren soll. Dazu wurde ein erster<br />

Entwurf der OWL Web Ontology Language 196 vorgelegt. Trotz der noch nicht abgeschlossenen<br />

Spezifikationsarbeiten 197 soll diese Sprache hier vorgestellt werden, da ihr als<br />

Vorschlag durch das W3C zur Standardisierung einer Ontologie-Spezifikations-Sprache<br />

für das Semantic Web eine zukünftig wesentliche Bedeutung zugeschrieben werden kann.<br />

OWL stellt keine von Grund auf neu entwickelte Sprache dar, sondern basiert auf der<br />

Ontologie-Spezifikations-Sprache DAML+OIL 198 . Mit dieser Sprache wird der oben beschriebenen<br />

Ansatz zur formalen Spezifikation von Ontologien durch die Erweiterung der<br />

Spezifikationsfähigkeiten von RDF verfolgt. Die Verwendung von DAML+OIL als Basis<br />

für OWL begründet sich darin, dass erstens mit der Nutzung der RDF-Technologie die<br />

Kompatibilität mit anderen Web-Technologien gewährleistet ist, und dass zweitens die<br />

Spezifikationsfähigkeiten DAML+OIL als sehr geeignet für die Ontologie-Spezifikation<br />

im Semantic Web angesehen werden (s. Patel-Schneider+02, Introduction). Daher soll zur<br />

Erläuterung der Verwendung derartiger Ontologie-Spezifikations-Sprachen in Abbildung<br />

15 die Darstellung eines ontologischen Konstrukts in DAML+OIL dienen.<br />

1<br />

2<br />

3<br />

4<br />

5<br />

6<br />

7<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

Abbildung 15: Ontologie-Beispiel in DAML-OIL 199<br />

194 Neben den ausführlich besprochen web-kompatiblen Ontologie-Spezifikations-Sprachen seien hier diejenigen erwähnt,<br />

die ebenfalls den Ansatz der XML-Darstellung von Ontologien verfolgen.<br />

1) XOL (Ontology Exchange Language): XML-basierte Sprache für den Austausch von Ontologien (s. Karp+99).<br />

2) SHOE (Simple HTML Ontology Extensions): Ontologie-Spezifikation als Erweiterung des HTML-Kodes<br />

(s. Luke+00). Hervorgegangen aus dem SHOE-Projekt, www.cs.umd.edu/projects/plus/SHOE, (24.06.02).<br />

3) OML (Ontology Markup Language): XML-Serialisierung von SHOE. (s. Kent98).<br />

Ein ausführlicher Vergleich dieser Sprachen hinsichtlich deren Ausdrucksfähigkeit findet sich in (Gómez-Pérez+02).<br />

195 Homepage der Web-Ontology Working Group: www.w3.org/2001/sw/WebOnt/ (25.09.2002).<br />

196 Der Aufbau und die Funktionsweise der OWL Web Ontology Language werden in (Dean+02) beschrieben.<br />

197 Alle Veröffentlichungen zur OWL Web Ontology Language befinden sich im Status eines ´Working Drafts´ des<br />

W3C (siehe Erläuterungen in Fußnote 184) und dürfen daher lediglich als „Arbeitsentwurf “ (engl. : „work in progress“)<br />

bezeichnet werden (s. Dean+02, Status of this Document).<br />

198 DAML+OIL: Aus zwei Sprachen zusammengeführte Ontologie-Spezifikations-Sprache. DAML (DARPA Agent<br />

Markup Language) ist eine web-kompatible semantische Markup-Sprache (vgl. Hendler+00) und wurde im DAML-<br />

Programm entwickelt (s. www.daml.org (12.07.2002)). OIL (Ontology Interchange Layer) wurde innerhalb des OnTo<br />

Knowledge-Projekts (s. www.ontoknowledge.org, (12.07.2002)) als Format zur Gewährleistung der semantischen<br />

Interoperabilität zwischen Web-Ressourcen entwickelt (vgl. Fensel+00). Die Sprachreferenz von DAML+OIL findet<br />

sich in (Horrocks+01). Die formale Spezifikation befindet sich unter: http://www.daml.org/2001/03/daml+oil (07.04.<br />

2002).<br />

199 Auszug aus einer beispielhaften Ontologie-Spezifikation unter: www.daml.org/2001/03/daml+oil-ex (07.04.2002).


Kaptitel D: Ontologien im Semantic Web 79<br />

In der Abbildung ist folgende Aussage spezifiziert: Jedes der Klasse ´Animal´ untergeordnete<br />

Konzept, also jedes Tier, hat genau zwei Elternteile. 200 In Zeile 1 wird definiert,<br />

dass dieses Konzept sich auf die zuvor bekannte Klasse ´Animal´ bezieht. Die Zeilen 2 bis<br />

6 umfassen die RDFS-Subklassenrelation, so dass die Restriktion in Zeile 3 bis 5 für alle<br />

untergeordneten Konzepte gilt. Die Restriktion wird mit Hilfe vordefinierter Spezifikationsprimitive<br />

von DAML+OIL vorgenommen. Für die Ressource ´hasParent´, die eine<br />

Property von ´Animal´ ist, wird eine Kardinalitätsbeschränkung von ´2´ definiert. 201<br />

D.2.2.2 Ausdrucksfähigkeit<br />

Die Ausführungen zu Ontologie-Spezifikations-Sprachen für das Semantic Web soll mit<br />

einer kurzen Erläuterung der wesentlichen Spezifikationsprimitive abgeschlossen werden,<br />

die OWL als angestrebter Standard zur Erweiterung der Spezifikationsfähigkeit von RDF<br />

bereitstellen soll. In Tabelle 14 sind die wichtigsten Primitive dargestellt, nach ihrer Funktionalität<br />

geordnet und ihr Verwendungsziel kurz erläutert.<br />

Funktionalität Primitive Beschreibung<br />

Äquivalenzdefinition<br />

Gleichheitsdefinition für Konzepte und Properties.<br />

Diese Primitive sind vornehmlich für<br />

den Abgleich heterogener Ontologien relevant.<br />

Property-<br />

Beschreibung<br />

sameClassAs;<br />

samePropertyAs;<br />

sameIndividualAs;<br />

differentIndividualFrom<br />

inverseOf;<br />

TransitiveProperty;<br />

SymmetricProperty;<br />

FunctionalProperty;<br />

InverseFunctionalProperty;<br />

allValuesFrom;<br />

someValuesFrom<br />

Erweiternde Beschreibung von Properties.<br />

Somit kann das intendierte Verständnis von<br />

Attributen, Properties und Relationen als<br />

ontologische Modellierungsprimitive (s. B.1.<br />

2.1) genauer definiert werden.<br />

Kardinalitätsbeschränkung<br />

minCardinality;<br />

maxCardinality; cardinality<br />

Kardinalitätsdefinition. Wie im Beispiel aus<br />

Abbildung 15.<br />

Datentypen noch nicht spezifiziert. Definition von Datentypen für Ressourcen.<br />

Header-<br />

Informationen<br />

imports; versionInfo<br />

Angaben über die Ontologie. Wesentlich ist<br />

die Importierbarkeit anderer Ontologien.<br />

Axiomatisierung oneOf; disjointWith;<br />

Definition grundlegender inferenzieller Zusammenhänge<br />

Boolsche unionOf; intersectionOf;<br />

in der Ontologie.<br />

Kombinationen complementOf<br />

Tabelle 14: Spezifikationsprimitive von OWL 202<br />

Hinsichtlich der Eignungsanforderungen an Repräsentationsformalismen zur Verwendung<br />

als Ontologie-Spezifikations-Sprache (s. B.1.3.1.1) lässt sich festhalten, dass die<br />

Kombination von RDF und einer Sprache wie OWL für die formale Spezifikation von<br />

Ontologien für das Semantic Web geeignet ist. Die Definition taxonomischer Strukturen,<br />

entsprechende Vererbungsmechanismen und eine natürlichsprachliche Dokumentation<br />

wird durch RDFS ermöglicht. Die erweiternden Spezifikationsprimitive von OWL erlauben<br />

eine differenzierte Erfassung von Properties und Relationen sowie die Definition<br />

grundlegender inferenzieller Zusammenhänge. Als indirekte empirische Verifikation dafür<br />

kann der Vergleich XML-basierter Ontologie-Spezifikations-Sprachen herangezogen wer-<br />

200 Zur Wahrung der Übersichtlichkeit ist lediglich die Klassendefinition abgebildet. Das Präfix ´daml:´ bezieht sich<br />

auf die DAML+OIL-Spezifikation unter ´http://www.daml.org/2001/03/daml+oil´, die anderen Präfixe<br />

auf die Spezifikationen von RDF und RDFS (vgl. Abbildung 14, Zeilen 2 und 3).<br />

201 Die syntaktischen Erläuterungen sind an (Horrocks+01) angelehnt.<br />

202 nach (McGuiness+02, 2. Language Synopsis). Es sei an dieser Stelle nochmals darauf hingewiesen, dass die Spezifikationsarbeiten<br />

für OWL noch nicht abgeschlossen sind.


Kaptitel D: Ontologien im Semantic Web 80<br />

den, worin DAML+OIL als Basis von OWL die größte Ausdruckstärke zugesprochen<br />

wird (s. Gómez-Pérez+02, S. 58f).<br />

D.3 Ontologie-Management<br />

Die bisherigen Ausführungen zeigen, dass Ontologien grundsätzlich als bedeutungsdefinierende<br />

Komponente für das Semantic Web geeignet sind und dass mit web-kompatiblen<br />

Ontologie-Spezifikations-Sprachen eine derartige Verwendung von Ontologien ermöglicht<br />

wird. Allerdings ergeben sich für die angestrebte Entwicklung eines Netzwerks<br />

von modularen und interagierenden Ontologien als semantischem Grundbaustein des Semantic<br />

Web (s. D.1.2.2.2) Herausforderungen hinsichtlich der Gewährleistung der konzeptionellen<br />

Korrektheit und der semantischen Interoperabilität derart verteilter und potenziell<br />

heterogener Ontologien. Dabei besteht das grundlegende Problem, dass das Internet<br />

als universelle Informationsplattform auf Grund seiner dezentralen Struktur eine sehr<br />

dynamische Umwelt aufweist, während Ontologien als bedeutungsdefinierende Erfassung<br />

einer Wissensdomäne ein zentrales Verständnismodell derselben durch die statische Beschreibung<br />

von Wissensstrukturen darstellen sollen (s. Kahshyap01, S. 26f).<br />

Die Lösung dieser konzeptionellen Widersprüche ist insofern von grundlegender Bedeutung,<br />

da damit die Interoperabilität semantisch heterogener Informationsräume als<br />

wesentliche Zielsetzung der Verwendung von Ontologien im Semantic Web ermöglicht<br />

werden kann. Dazu sollen im Folgenden als wesentliche Aspekte des Ontologie-Managements<br />

für das Semantic Web Lösungsansätze für jene Herausforderungen vorgestellt werden,<br />

die im Zuge der Erläuterung der antizipierten Rolle von Ontologien in der Semantic<br />

Web Architektur aufgeführt wurden (s. D.1.2.2.2). Dabei sollen vor allem die grundlegenden<br />

Ideen der Ansätze sowie deren Entwicklungsstand herausgearbeitet werden.<br />

D.3.1 Teilbarkeit von Ontologien<br />

Die Forderung der Teilbarkeit von Ontologien für deren Einsatz im Semantic Web bezieht<br />

sich auf die Verwendbarkeit einer Ontologie als bedeutungsdefinierender Basis für<br />

mehrere verschiedenartige Anwendungen (s. D.1.2.2.2). Dazu muss eine Ontologie<br />

einerseits als begriffliche Basis verwendbar für eine konkrete Anwendungssituation und<br />

andererseits wiederverwendbar für unterschiedliche Verwendungszwecke sein. Dieser Anforderung<br />

kann durch die Berücksichtigung des Ansatzes des ´Teilens und Zusammenführens´<br />

(s. C.3.1.1) bei der Entwicklung von Ontologien für das Semantic Web genügt<br />

werden, weshalb dieser Aspekt hier nicht weiter ausgeführt werden soll.<br />

Neben den qualitativen Anforderungen ist für die Gewährleistung der Nutzbarkeit von<br />

Ontologien in Semantic Web – Anwendungen eine entsprechende technische Infrastruktur<br />

bereitzustellen, welche die Ontologien verwaltet und den Zugriff auf diese durch<br />

Applikationen ermöglicht. Als Basis des Ontologie-Managements im Semantic Web sollen<br />

diese Funktionalitäten sogenannte „Ontologie-Bibliotheks-Systeme 203 “ übernehmen. Da<br />

diese bisher nur peripher erwähnt wurden (s. B.1.3; C.2.1.2), sollen hier die wesentlichen<br />

Aspekte solcher Systeme zusammengetragen werden.<br />

203 engl.: „ontology library systems“ (Ding+01, S. 93).


Kaptitel D: Ontologien im Semantic Web 81<br />

Ein Ontologie-Bibliotheks-System soll existente Ontologien verwalten und den Zugriff<br />

durch Dritte ermöglichen – wobei als Dritte sowohl der Entwickler einer neuen Anwendung<br />

als auch die Anwendung selber gemeint sein kann. Um eine angemessene Ver- und<br />

Wiederverwendung von Ontologien zu gewährleisten, sollten solche Systeme entsprechende<br />

Funktionalitäten bereitstellen (s. Ding+01, S.93f). Die wesentlichen Anforderungen<br />

an Ontologie-Bibliotheks-Systeme sind in Tabelle 15 aufgeführt und erläutert.<br />

Funktionalität<br />

Erläuterung<br />

Anforderungen bezüglich der Haltung und der Verwaltung von Ontologien als<br />

grundlegende Aufgabe von Ontologie-Bibliotheks-Systemen.<br />

Haltung<br />

Art und Weise der Haltung von Ontologien. Dabei sollte erstens die Zugänglichkeit<br />

der Ontologien durch Dritte gewährleistet sein. Zweitens sollte eine<br />

(engl.: „Storage“)<br />

Klassifikation die Auswahl einer geeigneten Ontologie durch den Entwickler<br />

einer neuen Applikation unterstützen. Drittens sollten die Ontologien als Module<br />

organisiert sein, um den Ansatz des ´Teilens und Zusammenführens´<br />

(s.o.) zur Entwicklung neuer Ontologien zu unterstützen.<br />

Identifikation Zur Verwaltung sollte jede Ontologie eindeutig identifizierbar sein.<br />

Versionierung Um Änderungen in Ontologien nachvollziehen und die aktuelle Version einer<br />

Ontologie bereitstellen zu können, sollte das System über einen entsprechenden<br />

Versionierungsmechanismus verfügen (siehe auch D.3.2.2).<br />

Funktionalitäten zur Unterstützung von Applikationsentwicklern bei der Auswahl<br />

einer geeigneten Ontologie und zur Wartung der Ontologien im System.<br />

Suche<br />

Such- und Browsing-Funktionalitäten zur Ansicht der existenten Ontologien.<br />

Editierung<br />

Bearbeitungsmöglichkeit von Ontologien im System (siehe auch D.3.2.1).<br />

Automatisierte Hierunter werden einfache Werkzeuge verstanden, mit denen beispielsweise<br />

Qualitätsprüfung die Struktur einer Ontologie hinsichtlich der Integrierbarkeit mit einer anderen<br />

geprüft werden kann.<br />

Gewährleistung der syntaktischen Interoperabilität sowie der Nutzung einer<br />

gemeinsamen semantischen Basis der Ontologien in der Bibliothek.<br />

Repräsentation Formale Darstellung der Ontologien in einem Austauschformat für Ontologien<br />

(z.B. Ontolingua, s. B.1.3.2) oder einer standardisierten Sprache.<br />

Basis-Ontologie Definition einer Top Level – Ontologie (s. C.1.1.2, Tabelle 10), welche von<br />

allen Ontologien des Systems als begriffliche Basis verwendet wird.<br />

Tabelle 15: Anforderungen an Ontologie-Bibliotheks-Systeme 204<br />

Management<br />

Adaption<br />

Standardisierung<br />

Für die Eignung eines Ontologie-Bibliotheks-Systems zur Verwaltung von Ontologien<br />

für das Semantic Web sind aus den aufgeführten Funktionalitäten vor allem drei Aspekte<br />

relevant. Erstens muss die Zugänglichkeit der Ontologien über das Internet gegeben sein,<br />

damit Semantic Web – Anwendungen auf die benötigten Ontologien zugreifen können.<br />

Als zweiter Aspekt ist eine web-basierte Such- und Browsing-Funktionalität notwendig,<br />

um die Einsicht in die existenten Ontologien zu ermöglichen. Dazu sollten die einzelnen<br />

Ontologien angemessen dokumentiert sein (s. B.1.4.2). Der dritte Aspekt ist die Unterstützung<br />

einer web-kompatiblen Ontologie-Spezifikations-Sprache, wobei im Falle der<br />

Empfehlung zur Standardisierung von OWL als Ontologie-Spezifikations-Sprache für das<br />

Semantic Web durch das W3C (s. D.2.2.1) die Unterstützung dieser Sprache wesentlich<br />

sein wird.<br />

Aus dem Vergleich existenter Ontologie-Bibliotheks-Systeme geht hervor, dass noch<br />

keines die aufgeführten Anforderungen für eine Verwendung im Semantic Web erfüllt. Es<br />

wurden innerhalb der wichtigsten Forschungsgruppen des Ontology Engineering sowie<br />

bei Projekten zur Entwicklung von Semantic Web – Technologien entsprechende Systeme<br />

entwickelt, welche zwar die grundlegenden Funktionalitäten, aber noch nicht den für<br />

204 nach (Ding+01, S. 94f; 109-111). Übersetzungen durch den Autor.


Kaptitel D: Ontologien im Semantic Web 82<br />

die Nutzung im Semantic Web benötigten Funktionsumfang bieten (s. Ding+01, S. 107-<br />

111) . 205<br />

D.3.2 Entwicklungsfähigkeit von Ontologien<br />

Die zweite Herausforderung an das Ontologie-Management für das Semantic Web ist die<br />

Entwicklungsfähigkeit von Ontologien, womit die oben erläuterte Anpassungsfähigkeit<br />

von Ontologien an die Umweltcharakteristika des Internet gefordert wird (s. D.1.2.2.2).<br />

Die dazu notwendige Flexibilität von Ontologien, also die Fähigkeit zur Handhabung<br />

der dynamischen Informationsstrukturen im Internet, soll durch sogenannte Verfahren<br />

der „Instandhaltung von Ontologien 206 “ gewährleistet werden. Für die angestrebte Verwendung<br />

von Ontologien im Semantic Web sind dabei insbesondere Techniken von Bedeutung,<br />

die erstens die Erstellung und Änderung einer individuellen Ontologie erlauben<br />

und zweitens die korrekte Einbindung dieser in ihren jeweiligen semantischen Kontext<br />

ermöglichen. Für diese beiden Aspekte soll im Folgenden je ein Lösungsansatz besprochen<br />

werden.<br />

D.3.2.1 Unterstützung der Ontologie-Entwicklung<br />

Als Ansatz zur Unterstützung der Ontologie-Entwicklung für das Semantic Web soll hier<br />

der sogenannte ´Ontology Learning´- Ansatz 207 vorgestellt werden. Darin wird ein Verfahren<br />

zur Erstellung und Editierung von Ontologien für das Semantic Web entwickelt, in<br />

dem die Aufwendigkeit des Ontologie-Entwicklungsprozesses (s. B.3) durch die Automatisierung<br />

von Teilprozessen reduziert werden soll.<br />

Die grundlegende Idee des Ansatzes liegt in der Nutzung bereits vorhandener konzeptioneller<br />

Erfassungen der relevanten Wissensdomäne als Ausgangsbasis für die zu erstellende<br />

oder zu ändernde Ontologie. Aus diesen Informationsquellen wird unter Verwendung<br />

von Verfahren des Maschinellen Lernens 208 eine initiale Ontologie generiert, die<br />

dann lediglich dem konkreten Verwendungszweck angepasst werden muss. Diese Automation<br />

soll die Entwicklung einer Ontologie vor allem hinsichtlich des zeitlichen Aufwands<br />

sowie der konzeptionellen Validität erleichtern, da die aufwendigen und schwierigen<br />

Aufgabenbereiche der Spezifikation und der Konzeptionalisierung durch Werkzeuge<br />

unterstützt werden (s. Maedche+01, S. 1f).<br />

205 Hier sollen die Ontologie-Bibliotheks-Systeme der in dieser Arbeit referenzierten Forschungsgruppen kurz genannt<br />

werden. Eine ausführliche Übersicht dieser und weiterer Ansätze findet sich in (Ding+01, S. 95-107).<br />

1) Ontolingua: Ontologie-Bibliothek des Ontolingua-Systems (s. B.1.3.2). Dieses stellt das derzeit ausgereifteste<br />

System dar, was auf die Verbreitung von Ontolingua als Quasi-Standard zur formalen Spezifikation von<br />

Ontologien zurückgeführt werden kann.<br />

2) DAML Library: System des DAML-Programms (s. Fußnote 198), aus dem DAML+OIL (s. D.2.2.1) hervorgegangen<br />

ist. Die Bibliothek ist öffentlich zugänglich unter: http://daml.semanticweb.org/ontologies (12.07.2002).<br />

3) SHOE: Bibliotheks-System des SHOE-Projekts (s. Fußnote 194). Eine ausführliche Beschreibung findet sich in<br />

(Heflin+00). Siehe auch (D.3.2.2).<br />

206 engl.: „ontology maintenance“ (Tuttle+01, S. 21).<br />

207 Dies ist der Eigenname des Ansatzes (s. Maedche+01, S. 1). Der hier referenzierte Artikel wurde aus dem reichhaltig<br />

vorhandenen Material ausgewählt, da er eine umfassende Übersicht beinhaltet. Eine ausführliche Darstellung<br />

findet sich in: Maedche, A.: Ontology Learning for the Semantic Web. The Kluwer International Series in Engineering<br />

and Computer Science, Volume 665. Kluwer Academic Publishers: 2002.<br />

208 Das KI-Forschungsgebiet des Maschinellen Lernens beschäftigt sich mit der „computergestützten Modellierung<br />

und Realisierung von Lernphänomenen“ (Wrobel+00, S. 517). Dabei werden Verfahren entwickelt, mit denen eine<br />

intelligente Maschine neuartige Wissensstrukturen erlernen kann. Ein wesentliches Anwendungsgebiet derartiger<br />

Techniken ist das Data Mining, wobei die Verfahren für die vollständig automatisierte Wissensakquisition aus Datenbanken<br />

relativ weit fortgeschritten sind. Eine einführende Übersicht des Gebietes findet sich in (Wrobel+00).


Kaptitel D: Ontologien im Semantic Web 83<br />

In Abbildung 16 wird zunächst der „Ontologie-Lernzyklus 209 “ des ´Ontology Learning´<br />

vorgestellt. Daran soll sich eine genauere Erörterung dieses Ansatzes anschließen.<br />

Phasen des Ontology Learning<br />

1. Import und Wiederverwendung (engl. „import and re-use“):<br />

Zunächst werden existente konzeptionelle Erfassungen der Wissensdomäne - also Datenbanken,<br />

XML-Dokumente sowie bereits bestehende Ontologien - identifiziert und deren Verwendbarkeit<br />

als Grundlage für die zu erstellende Ontologie geprüft. Diese Tätigkeiten sind manuell durchzuführen.<br />

Anschließend werden die brauchbaren Erfassungen zu einer einheitlichen Ausgangsbasis<br />

zusammengeführt, wobei für die wiederverwendbaren Ontologien Verfahren der Ontologie-<br />

Integration genutzt werden sollen.<br />

2. Extraktion (engl. „extraction“):<br />

Die Ausgangsbasis stellt lediglich eine begrifflich einheitliche Zusammenfassung wiederverwendbarer<br />

konzeptioneller Erfassungen dar. Die Generierung der initialen Ontologie-Struktur erfolgt<br />

durch die Strukturanalyse der Informationsquellen unter Verwendung entsprechender algorithmischer<br />

Verfahren. Für diese Funktionalitäten wurde als Kern des ´Ontology Learning´- Ansatzes<br />

das Werkzeug ´Text-To-Onto´210 entwickelt.<br />

Mit der Erstellung der initialen Ontologie ist der aufwendigste Teil der Konzeptionalisierung abgeschlossen.<br />

In den anschließenden Phasen ist die Ontologie lediglich der antizipierten Verwendung<br />

anzupassen und hinsichtlich der Qualitätskriterien der Ontologie-Entwicklung (s. B.1.4.1.1)<br />

zu evaluieren. Dazu können bekannte Verfahren des Ontology Engineering verwendet werden.<br />

3. Säuberung (engl. „pruning“):<br />

Entfernung nicht benötigter oder redundanter Ontologie-Elemente (entsprechend der OntoClean –<br />

Methodologie, s. B.2.2).<br />

4. Veredelung (engl. „refinement“):<br />

Feinedition der Ontologie hinsichtlich des konkreten Verwendungsziels.<br />

5. Validierung (engl. „validation“):<br />

Qualitätsprüfung der Ontologie an Hand der Verwendbarkeit für die geplante Anwendung.<br />

Abbildung 16: Phasen des Ontology Learning 211<br />

Aus der Beschreibung wird deutlich, dass mit dem ´Ontology Learning´- Ansatz eine<br />

umfassende, werkzeuggestützte Methodologie für die Ontologie-Entwicklung angestrebt<br />

wird. Die grundlegende Herangehensweise der Nutzung existenter konzeptioneller Erfassungen<br />

zur Reduzierung des Erstellungsaufwands des konzeptionellen Modells ist insbesondere<br />

im Hinblick auf die Entwicklung von Ontologien für das Semantic Web als<br />

sinnvoll zu betrachten, da viele der benötigten Informationsstrukturen bereits im Internet<br />

vorhanden sind. Allerdings ist die angestrebte Automatisierung aufwendiger Teilaufgaben<br />

des Ontologie-Entwicklungsprozesses derzeit als nicht realisierbar einzustufen, weil sowohl<br />

die Verfahren der Ontologie-Integration als auch die Algorithmen für die Analyse<br />

ontologischer Strukturen noch nicht ausgereift genug für die beabsichtigte Verwendung<br />

sind. Wie später noch ausführlicher erläutert wird, erlauben die algorithmischen Verfahren<br />

lediglich eine automatische Analyse von Informationsstrukturen, jedoch ist die Bearbeitung<br />

ontologischer Heterogenitäten nur manuell durchführbar (s. D.3.3).<br />

Somit ist der ´Ontology Learning´- Ansatz zwar grundsätzlich für die Erstellung und<br />

Editierung von Ontologien für das Semantic Web als geeignet zu bewerten, da mit der<br />

209 engl.: „ontology learning cylce“ (Maedche+01, S. 1). Dieser kann für Erweiterungen der Ontologie mehrmals<br />

durchlaufen werden, was dem Lebenszyklusmodell der ´Evolving Prototypes´ (s. Fußnote 53) entspricht.<br />

210 Text-To-Onto: Dieses Werkzeug soll die Erstellung einer ontologischen Struktur sowohl aus unstrukturiertem<br />

Text als auch durch die algorithmische Analyse von Ontologien erlauben. Allerdings ist weder eine detaillierte<br />

Funktionsbeschreibung noch eine frei erhältliche Version dieses Tools erhältlich, so dass keine qualitativen Aussagen<br />

darüber möglich sind. Als weiterführende Informationsquelle kann nur die Homepage unter http://ontoserver.aifb.unikarlsruhe.de/texttoonto/<br />

(15.10.2002) angegeben werden, die aber auch keine weiteren Beschreibungen enthält.<br />

211 nach (Maedche+01, S. 2; 5-7).


Kaptitel D: Ontologien im Semantic Web 84<br />

Wiederverwendung existenter Informationsstrukturen eine enge Bindung neuer oder geänderter<br />

Ontologien an ihr semantisches Umfeld ermöglicht wird. Allerdings ist die Qualität<br />

der Werkzeugunterstützung von der Entwicklung geeigneter algorithmischer Verfahren<br />

abhängig, so dass der Ansatz insgesamt als noch nicht ausgereift betrachtet werden<br />

muss.<br />

D.3.2.2 Wartung von Ontologien<br />

Neben der Erstellung geeigneter Ontologien ist zur Gewährleistung der Entwicklungsfähigkeit<br />

von Ontologien im Semantic Web deren Änderbarkeit durch entsprechende Verfahren<br />

zu unterstützen. Auf Grund der Dynamik des Internet sind häufig Änderungen der<br />

Informationsstrukturen zu erwarten, welche in die Ontologien als semantische Basis<br />

übernommen werden müssen. Da Ontologien prinzipiell eine einmalig erstellte Abbildung<br />

der Strukturen einer Wissensdomäne darstellen und nicht für jede Umweltänderung eine<br />

neue Ontologie entwickelt werden kann, sollten existente Ontologien im Semantic Web<br />

an veränderte Informationsstrukturen anpassbar sein. Dazu werden Verfahren zur sogenannten<br />

„Ontologie-Versionierung 212 “ entwickelt, welche die Aktualisierung einer Ontologie<br />

durch einen Versionierungsmechanismus ermöglichen und die Verwaltung verschiedener<br />

Versionen einer Ontologie erlauben sollen (s. Klein+01, S. 75f).<br />

Wie in Tabelle 15 aufgeführt, sollen derartige Verfahren Bestandteil von Ontologie-<br />

Bibliotheks-Systemen sein. Von den existenten Ansätzen für Bibliotheks-Systeme weist<br />

allerdings nur das System des SHOE-Projekts (siehe Fußnote 205) eine entsprechende<br />

Funktionalität auf (s. Ding+01, S. 102). Dabei kann die Änderung einer Ontologie als eine<br />

neue Version abgespeichert werden, in dem eine neue Datei mit der geänderten formalen<br />

Spezifikation erstellt und diese mit einer entsprechenden Versionsnummer versehen wird.<br />

Es kann dafür eine rückwärtige Kompatibilität mit der vorhergehenden Version der Ontologie<br />

definiert werden, soweit diese hinsichtlich der Struktur der Ontologie gegeben ist<br />

(s. Heflin+00, S. 446f).<br />

Mit diesem Mechanismus ist die grundsätzliche Anforderung der Änderbarkeit von<br />

Ontologien erfüllt. Allerdings können durch die Änderungen in der Ontologie Fehlfunktionen<br />

in denjenigen Anwendungen resultieren, welche die Ontologie als bedeutungsdefinierende<br />

Komponente verwenden. Dies ist insbesondere für die Versionierung von<br />

Ontologien im Semantic Web von Bedeutung, da die Funktionalität eines Netzwerks von<br />

Ontologien als semantischer Grundbaustein nur erreicht werden kann, wenn die Kompatibilität<br />

der Ontologien mit den darauf basierenden Applikationen sowie der einzelnen<br />

Ontologien untereinander gewährleistet ist. Dazu muss bei der Änderung einer Ontologie<br />

deren semantisches Umfeld entsprechend angepasst werden, weshalb Verfahren der<br />

Ontologie-Versionierung neben der Erstellbarkeit einer neuen Version einer Ontologie erweiterte<br />

Funktionalitäten zur Verfügung stellen sollten (s. Klein+01, S. 78-80).<br />

Die wesentliche Anforderung besteht dabei in der dokumentarischen Bereitstellung<br />

von Informationen über die vorgenommenen Änderungen in einer Ontologie, so dass die<br />

auf der Ontologie basierenden Anwendungen mit möglichst geringem Aufwand an die<br />

212 engl.: „Ontology Versioning“ (Klein+01, S. 76).


Kaptitel D: Ontologien im Semantic Web 85<br />

neue Version angepasst werden können. Dazu sollte ein für das Semantic Web geeignetes<br />

Versionierungs-System erstens die Identifikation von Ontologien und ihren Versionen im<br />

Internet erlauben und zweitens eine Dokumentation der Änderungen zwischen den einzelnen<br />

Versionen bereitstellen. Drittens sollte die Kompatibilität zwischen den Ontologie-<br />

Versionen spezifiziert werden können, wodurch eine möglichst hohe Interoperabilität<br />

zwischen den verschiedenen Versionen der Ontologie erreicht werden soll und somit ein<br />

möglichst geringer Änderungsbedarf für die von der Ontologie abhängigen Applikationen<br />

entsteht (s. Klein+01, S. 84ff).<br />

Diese Funktionalitäten sollen mit dem Versionierungs-System OntoView 213 bereitgestellt<br />

werden. Darin wird für die Ontologie-Identifikation nur der zugrundeliegenden<br />

Konzeptionalisierung eine URI als eindeutig identifizierte Web-Ressource zugewiesen,<br />

während die Versionen sowie die anderen Ontologie-Elemente systemintern referenziert<br />

werden. Damit soll die Zusammengehörigkeit der Ontologie-Elemente leichter nachvollziehbar<br />

sein und so die Handhabung der Ontologie als semantischer Basis erleichtert werden<br />

(s. Klein+02, S. 4-7). Die Verwaltung der Änderungen zwischen den Versionen soll<br />

durch den werkzeuggestützten Vergleich der jeweiligen formalen Spezifikation verschiedener<br />

Ontologie-Versionen ermöglicht werden. Dazu werden die Dateien syntaktisch verglichen,<br />

die Unterschiede aufgezeigt und diese dann hinsichtlich ihrer Auswirkungen auf<br />

die ontologische Struktur klassifiziert. 214 Diese Änderungen können als Dokumentation<br />

des Versionierungsprozesses separat dargestellt werden, wodurch die Anpassung der<br />

abhängigen Applikationen erleichtert werden soll (s. Klein+01, 9-14). Somit stellt Onto<br />

View ein vom Ansatz her geeignetes Versionierungs-System für das Semantic Web dar,<br />

welches sich allerdings noch in der Entwicklungsphase befindet.<br />

D.3.3 Ontologie-Integration<br />

Als dritte wesentliche Herausforderung an das Ontologie-Management für das Semantic<br />

Web wurde die Entwicklung von Verfahren der Ontologie-Integration zur Behandlung<br />

semantischer Heterogenitäten aufgeführt (s. D.1.2.2.2). Die essentielle Bedeutung derartiger<br />

Techniken wurde schon in anderen Anwendungszusammenhängen von Ontologien<br />

erläutert, wobei sie die semantische Interoperabilität lokaler, potenziell heterogener<br />

Ontologien sicherstellen sollen (s. C.3.2). Dieselbe Funktionalität ist auch für das Semantic<br />

Web von grundlegender Bedeutung, da mit der Handhabung heterogener Ontologien<br />

die angestrebte semantische Interoperabilität zwischen den unterschiedlichen Informationsräumen<br />

im Internet als wesentliches Ziel der Verwendung von Ontologien gewährleistet<br />

werden soll (s. D.1.2.2). Entsprechende Verfahren sollen dazu eine möglichst weitgehende<br />

Automatisierung der Ontologie-Integration erlauben, um eine effiziente Handhabung<br />

der semantischen Basis des Semantic Web zu ermöglichen (s. D.3.2.1).<br />

213 OntoView: Web-basiertes Ontologie-Versionierungs-System, das auf der Funktionsweise von Versionierungs-<br />

Systemen aus dem konventionellen Software Engineering aufbaut, sogenannten Concurrent Version Systems (CVS).<br />

Das System befindet sich noch in der Entwicklungsphase, weshalb noch keine ausführliche Funktionsbeschreibung<br />

vorliegt. Eine einführende Vorstellung findet sich unter: www.cs.vu.nl/~mcaklein/papers/ontoview.pdf (16.10.2002).<br />

Im Internet ist das System zugänglich unter http://ontoview.org/repository/ (16.10. 2002).<br />

214 Die Veränderungen werden in solche ohne Auswirkungen auf die ontologische Struktur (z.B. Kommentare oder<br />

Namensänderungen) und solche mit Auswirkungen (z.B. Definitionsänderungen, Hinzufügung oder Entfernung von<br />

Definitionen) unterteilt. Die Zuordnung der Änderungen muss manuell vorgenommen werden (s. Klein+02, S. 10).


Kaptitel D: Ontologien im Semantic Web 86<br />

Wie schon im Zusammenhang der Implikationen für Informationssysteme durch die<br />

Verwendung von Ontologien herausgestellt wurde, ermöglichen die bisher existenten<br />

Techniken lediglich eine Werkzeugunterstützung des Ontologie-Integrationsprozesses.<br />

Dabei können die Strukturen zweier zu integrierender Ontologien mit Hilfe von algebraischen<br />

Operationen durch entsprechende Algorithmen automatisch analysiert und die auftretenden<br />

ontologischen Heterogenitäten aufgezeigt werden. Die Behandlung dieser Unterschiede,<br />

deren Auflösung das Ziel der Ontologie-Integration darstellt, ist allerdings nur<br />

durch menschliche Intervention möglich (s. C.3.2.2).<br />

Die Notwendigkeit der Kontrolle der semantischen Korrektheit durch den Menschen<br />

bei der Ontologie-Integration soll an Hand eines einfachen Beispiels verdeutlicht werden.<br />

Es seien zwei Ausgangs-Ontologien A und B gegeben, in denen jeweils ein Konzept<br />

ADRESSE definiert ist. A spezifiziert ADRESSE als einen zusammenhängenden String,<br />

während in B eine Unterteilung in Strasse, Hausnummer und Postleitzahl vorliegt. Diese<br />

konzeptionelle Differenz kann durch eine automatisierte Syntaxanalyse der formalen Spezifikationen<br />

von A und B zwar aufgefunden, aber durch algorithmische Verfahren nicht in<br />

die ´richtige´ Konzeptionalisierung aufgelöst werden. Dazu müsste eine Regel in Form<br />

einer Referenz-Ontologie vorhanden sein, welche die benötigte Auflösung determiniert.<br />

Da genau dieses bei der Integration von Ontologien nicht gegeben ist, muss die angemessene<br />

ontologische Erfassung von Hand ausgewählt werden. 215<br />

Um trotz des erforderlichen menschlichen Eingreifens eine effiziente Handhabung<br />

heterogener Ontologien im Semantic Web zu ermöglichen, werden Verfahren für eine<br />

möglichst weitgehende Automatisierung der Ontologie-Integration entwickelt. Einen generellen,<br />

häufig referenzierten Ansatz stellt das PROMPT-System 216 dar. Darin werden<br />

dem Nutzer neben den Ergebnissen der syntaktischen Strukturanalyse der Ausgangs-<br />

Ontologien vordefinierte Operationen zur Hand gegeben, welche die manuelle Zusammenführung<br />

erleichtern sollen (s. Noy+00, S. 3f). Ein anderer Ansatz für die Ontologie-<br />

Integration im Semantic Web ist die Definition sogenannter „semantischer Brückenontologien<br />

217 “, wie sie im MAFRA-System 218 vorgenommen wird. Statt der Generierung<br />

einer neuen Ontologie werden in einer solchen Brückenontologie die Differenzen zwischen<br />

den zu integrierenden Ontologien erfasst und entsprechend aufgelöst. Somit können<br />

die Ausgangs-Ontologien erhalten bleiben und gleichzeitig deren semantische Interoperabilität<br />

sichergestellt werden. Allerdings muss auch hierbei die Auflösung der ontologischen<br />

Heterogenitäten manuell definiert werden (s. Maedche+02, S. 66f).<br />

215 In Anlehnung an ein Beispiel der Ontologie-Integration (s. Noy+99, S. 3f).<br />

216 PROMPT: Aus dem PROTÉGÉ-Projekt (s. A.1.2.2.2) hervorgegangener Ansatz zur semi-automatischen Zusammenführung<br />

von Ontologien (vgl. Noy+00). Eine frei erhältliche Implementierung liegt als PlugIn für das PROTÉGÉ<br />

2000-Ontologie-Entwicklungswerkzeug (siehe Fußnote 65) vor. Siehe: http://protege.stanford.edu/plugins/prompt/<br />

prompt.html (18.10.2002).<br />

217 engl.: „semantic bridging ontology“ (Maedche+02, S. 68).<br />

218 Das MAFRA-System (MApping FRAmework) stellt einen infrastrukturellen Lösungsansatz für die Handhabung<br />

von Ontologien im Semantic Web dar. Es wird innerhalb des KAON-Projekts (KArlsruhe ONtology and Semantic<br />

Web Infrastructur) entwickelt - einem Forschungsprojekt des Forschungszentrums Informatik (FZI) und des Instituts<br />

für Angewandte Informatik und Formale Beschreibungsverfahren (AIFB) der Universität Karlsruhe. Das KAON-<br />

System soll eine Infrastruktur mit entsprechenden Werkzeugen für die Entwicklung ontologiebasierter Semantic Web<br />

– Anwendungen zur Verfügung stellen (s. Maedche+02, S. 71f). Weiterführende Informationen über das KAON-<br />

System finden sich auf der Homepage des Projekts unter: http://kaon.semanticweb.org/ (12.07.2002).


Kaptitel D: Ontologien im Semantic Web 87<br />

Aus der Erläuterung existenter Verfahren der Ontologie-Integration geht hervor, dass<br />

derzeit die Behandlung ontologischer Heterogenitäten nur manuell möglich ist und lediglich<br />

durch entsprechende Werkzeuge unterstützt werden kann. Dies bedeutet, dass die angestrebte<br />

Erstellung eines Netzwerks von interagierenden, automatisch aktualisierbaren<br />

Ontologien zur Gewährleistung der semantischen Interoperabilität zwischen potenziell<br />

heterogenen Informationsräumen im Semantic Web (s. D.1.2.2.2) zwar im Prinzip möglich<br />

ist, aber einen hohen Anteil menschlicher Intervention bedingt. Denn zur Erstellung<br />

und Wartung eines solchen Netzwerks müsste erstens die Ontologie jeder konkreten<br />

Anwendung in ihr jeweiliges semantisches Umfeld integriert und zweitens bei Änderung<br />

einer Ontologie die von ihr abhängigen Anwendungen und Ontologien entsprechend angepasst<br />

werden. Obwohl mit den vorgestellten Lösungen des Ontologie-Managements<br />

Werkzeuge zur Unterstützung der Ontologie-Integration zur Verfügung gestellt werden,<br />

müsste dazu jeder einzelne Integrationsprozess manuell durchgeführt werden.<br />

Da für die Erhaltung einer solchen semantischen Basis des Semantic Web ein hoher,<br />

nicht adäquater Bedarf an menschlicher Intervention durch entsprechend geschulte Fachkräfte<br />

auftreten würde, wird eine andersartige Verwendung von Ontologien als strukturund<br />

bedeutungsdefinierender Komponente des Semantic Web vorgeschlagen. Dabei soll<br />

eine Ontologie die standardisierte Erfassung eines Informationsraumes im Internet darstellen<br />

– im Gegensatz zur Beschreibung einzelner Informationsressourcen. Damit soll ein<br />

geteiltes, präskriptives Verständnismodell desselben bereitgestellt werden, welches als<br />

Strukturvorgabe für Web-Applikationen innerhalb des Informationsraums fungieren soll.<br />

Durch eine derartige Nutzung von Ontologien kann die Notwendigkeit der Integration<br />

von Ontologien auf die Schnittstellen zwischen verschiedenen Informationsräumen beschränkt<br />

werden, da die semantische Interoperabilität von Informationsressourcen im<br />

Internet mit der Auflösung der ontologischen Heterogenitäten lediglich zwischen den<br />

standardisierten Ontologien gewährleistet werden kann (s. Uschold01, S. 6). Dieser technologisch<br />

bedingte Ansatz zur Strukturierung der semantischen Basis des Semantic Web<br />

impliziert jedoch eine Abweichung vom oben erläuterten Ziel einer universellen Informationsplattform<br />

ohne zentral vorgegebene Informationsstrukturen (s. D.1.1).<br />

D.4 Implikationen für Semantic Web Services<br />

Als letzter Aspekt zur Verwendung von Ontologien im Semantic Web sind die Auswirkungen<br />

zu besprechen, die aus der Bereitstellung einer einheitlichen semantischen Basis<br />

für sogenannte „Semantic Web Services“ (Visser+00, S. 1) als konkrete Anwendungen der<br />

Semantic Web – Technologien resultieren. Als Web Services werden Applikationen bezeichnet,<br />

die unter Nutzung von Web-Technologien informationsverarbeitende Dienste<br />

im Internet bereitstellen. 219 Dabei soll ein Web Service als autonom handelnde Anwendung<br />

spezifische Aufgaben erfüllen und dazu in geeigneter Art und Weise mit anderen<br />

Web Services interagieren, so dass die Informationsverarbeitung im Internet durch ein<br />

Netzwerk von Web Services im Sinne eines Multi-Agenten-Systems (s. C.2.1) realisiert<br />

werden soll (s. Bernes-Lee+01, S. 28f). Hier sollen die funktionalen und konzeptionellen<br />

219 Als ´Semantic Web Service´ werden entsprechend Web Services bezeichnet, die mit Semantic Web – Technologien<br />

arbeiten (s. Visser+01, S. 1).


Kaptitel D: Ontologien im Semantic Web 88<br />

Implikationen für Semantic Web Services aufgezeigt werden, die sich aus der Verwendung<br />

von Ontologien zur Bereitstellung der semantischen Basis ergeben. Dazu werden hier<br />

lediglich die wesentlichen Aspekte zusammengetragen, da eine ausführliche Betrachtung<br />

dieser <strong>Thema</strong>tik <strong>zum</strong> einen die Wiederholung von zuvor bereits behandelten Gesichtspunkten<br />

bedeuten würde und <strong>zum</strong> anderen keine wesentlichen neuen Erkenntnisse über<br />

die Verwendung von Ontologien im Semantic Web daraus hervorgehen würden.<br />

Als informationsverarbeitende Anwendung benötigen Web Services eine struktur- und<br />

bedeutungsdefinierende Beschreibung der zu verarbeitenden Informationen (s. D.1.1). Da<br />

diese im Semantic Web durch Ontologien bereitgestellt werden soll, können die im Zusammenhang<br />

der Verwendung von Ontologien in Informationssystemen vorgestellten<br />

Verbesserungen für das Auffinden, die Verarbeitung und die Darstellung von Informationen<br />

(s. C.2.2; C.2.3) für die grundlegenden informationsverarbeitenden Fähigkeiten von<br />

Semantic Web Services genutzt werden. Des Weiteren können Semantic Web Services an<br />

Hand von Ontologien mit einer bedeutungsdefinierenden Beschreibung versehen werden,<br />

wodurch die semantische Korrektheit bei der Kommunikation zwischen einzelnen Services<br />

gewährleistet werden kann (vgl. Fensel+02) – entsprechend der Zielsetzung bei der<br />

Verwendung geteilter Ontologien für die Agentenkommunikation (s. C.2.1).<br />

Bezüglich der funktionalen Ausrichtung von Semantic Web Services ergeben sich aus<br />

den erläuterten Charakteristika der semantischen Basis des Semantic Web zwei wesentliche<br />

Aspekte. Erstens wird durch die Sicherstellung der semantischen Interoperabilität<br />

von Informationsressourcen die bedeutungserhaltende Interaktion zwischen Web Services<br />

verschiedener Informationsräume ermöglicht, so dass domänenübergreifende Anwendungsszenarien<br />

wie das zu Beginn der Arbeit angeführte Beispiel prinzipiell umsetzbar<br />

sind (s. Einleitung). Der zweite Aspekt bezieht sich auf die Standardisierung von Ontologien<br />

für einzelne Informationsräume, welche auf Grund der Probleme bei Ontologie-<br />

Integration proklamiert wird (s. D.3.3). Obwohl dies zunächst als eine Einschränkung erscheint,<br />

kann die präskriptive Beschreibung eines Informationsraumes als Strukturvorgabe<br />

für einen Semantic Web Service dienen. Das bedeutet, dass die funktionale Konzeption<br />

eines Web Services an das Verständnismodell der Ontologie angelehnt werden kann, so<br />

dass die standardisierte Erfassung einer Wissensdomäne zur Komplexitäts- und Unsicherheitsreduktion<br />

beitragen und somit eine Hilfestellung für die Entwicklung von Semantic<br />

Web Services bieten kann (s. Kim02, S. 51-54).<br />

Die erläuterten Implikationen für Semantic Web Services verdeutlichen die Relevanz<br />

eines struktur- und bedeutungsdefinierenden Grundbausteins des Semantic Web. Denn<br />

das informationsverarbeitende Potenzial des Semantic Web kann nur durch derartige Web<br />

Services ausgeschöpft werden, welche wiederum nur auf einer angemessenen und funktionstüchtigen<br />

semantischen Basis arbeiten können. Daher ist die Entwicklung entsprechender<br />

technischer Lösung zur Bereitstellung und Handhabung einer solchen von grundlegender<br />

Bedeutung für die erfolgreiche Realisierung der Vision des Semantic Web.


Diskussion 89<br />

Diskussion<br />

Als Fazit der Untersuchung der Verwendung von Ontologien als semantischem Grundbaustein<br />

des Semantic Web werden zunächst die herausgearbeiteten Erkenntnisse dahingehend<br />

zusammengefasst, inwieweit die derzeit existenten Verfahren ontologiebasierter<br />

Wissensmodellierung für die Umsetzung der antizipierten Rolle von Ontologien im Semantic<br />

Web geeignet sind. Anschließend daran werden einige Aspekte aufgezeigt, die sich<br />

als weiterführende Fragestellungen hinsichtlich der Notwendigkeit und der Umsetzbarkeit<br />

der Vision des Semantic Web ergeben.<br />

Zusammenfassung der Ergebnisse<br />

Die Vision des Semantic Web besteht in der Erweiterung der informationsverarbeitenden<br />

Fähigkeiten der bestehenden Web-Technologien, um die Qualität des Internet als universeller<br />

Informationsplattform zu verbessern. Im Architekturmodell zur Realisierung dieser<br />

Vision sollen Ontologien zur bedeutungsdefinierenden Beschreibung von Informationsstrukturen<br />

eingesetzt werden, wodurch eine semantische Basis für Semantic Web Services<br />

als informationsverarbeitende Web-Applikationen geschaffen werden soll. Die Zielsetzung<br />

der Verwendung von Ontologien im Semantic Web besteht in der Erstellung eines<br />

Netzwerks interagierender Ontologien, womit erstens der struktur- und bedeutungsdefinierende<br />

Grundbaustein für Semantic Web Services bereitgestellt und zweitens die Interoperabilität<br />

zwischen potenziell heterogenen Informationsräumen im Internet gewährleistet<br />

werden soll.<br />

Die grundlegende Eignung ontologiebasierter Verfahren der Wissensmodellierung für<br />

eine derartige Verwendung ergibt sich aus deren konzeptioneller Intention. Eine Ontologie<br />

soll ein von den Beteiligten einer Wissensdomäne gemeinsam akzeptiertes Verständnismodell<br />

derselben darstellen, worin die Wissensstrukturen der Domäne mit expliziten<br />

Definitionen der intendierten Bedeutung der Begrifflichkeiten erfasst sind. Durch die formale<br />

Darstellung dieses konzeptionellen Modells mittels entsprechender Spezifikationssprachen<br />

kann die Maschinenlesbarkeit von Ontologien ermöglicht werden. Obwohl noch<br />

keine umfassende Methodologie der Ontologie-Entwicklung entworfen wurde, existieren<br />

Ansätze für die grundlegenden Verfahren zur Erstellung und Qualitätssicherung von Ontologien.<br />

Die für den Einsatz von Ontologien im Semantic Web notwendige Kompatibilität<br />

von Ontologie-Spezifikations-Sprachen mit den Web-Technologien kann durch entsprechende<br />

Repräsentationsformalismen gewährleistet werden. Der Nutzengewinn durch<br />

den Einsatz von Ontologien als bedeutungsdefinierender Komponente im Semantic Web<br />

besteht in Verbesserungen für die grundlegenden informationsverarbeitenden Funktionalitäten<br />

von Web-Anwendungen.<br />

Bei der Nutzung von Ontologien in Informationssystemen wird deutlich, dass auf<br />

Grund der Schwierigkeit bei der Erstellung einer globalen, alle relevanten Wissensstrukturen<br />

erfassenden Ontologie der Einsatz mehrerer unabhängiger Ontologien bevorzugt<br />

wird. Auf diesem Prinzip soll auch die Verwendung von Ontologien im Semantic Web<br />

basieren: Jede Informationsquelle, beziehungsweise jeder Informationsraum im Internet<br />

soll durch eine Ontologie beschrieben und der bedeutungserhaltende Informationsaus-


Diskussion 90<br />

tausch zwischen diesen soll durch die Gewährleistung der Interoperabilität der einzelnen<br />

Ontologien sichergestellt werden. Dazu werden Techniken zur Behandlung von Differenzen<br />

zwischen einzelnen Ontologien benötigt. Entsprechende Verfahren der Ontologie-<br />

Integration erlauben jedoch nur eine Werkzeugunterstützung des Integrationsprozesses,<br />

während die eigentliche Auflösung ontologischer Heterogenitäten durch den Menschen<br />

vorgenommen werden muss.<br />

Aus diesem Grund würde die Erstellung und Wartung der semantischen Basis des Semantic<br />

Web in Form eines Netzwerks interagierender, an die Dynamik der Informationsstrukturen<br />

im Internet anpassbarer Ontologien ein nicht adäquates Maß an menschlicher<br />

Intervention bedingen. Daher wird eine andersartige Konzeption der semantischen Basis<br />

vorgeschlagen, wobei Ontologien die standardisierte Erfassung einzelner Informationsräume<br />

darstellen sollen. Konkrete Anwendungen könnten sich an dieser Strukturvorgabe<br />

orientieren und die Auflösung ontologischer Heterogenitäten würde auf die Schnittstellen<br />

verschiedenartiger Informationsräume begrenzt.<br />

Notwendigkeit und Umsetzbarkeit des Semantic Web<br />

Durch die Entwicklung von Web-Technologien mit informationsverarbeitenden Fähigkeiten<br />

kann zweifellos die Qualität des Internet als Informationsplattform verbessert<br />

werden. Es ist aber zu hinterfragen, ob dazu die Verwendung von Ontologien als semantischer<br />

Basis – die unabdingbar für eine automatisierte Informationsverarbeitung ist – erforderlich<br />

ist. Denn eine einheitliche, formal spezifizierte semantische Basis wird nur benötigt,<br />

wenn die Interoperabilität zwischen Systemen mit unterschiedlichen Verständnismodellen<br />

gewährleistet werden soll (s. Uschold01, S. 5f). Derartige Differenzen würden<br />

bei einer Standardisierung einzelner Informationsräume lediglich zwischen verschiedenen<br />

Informationsräumen zu erwarten sein. Da diese durch entsprechende Konventionen auch<br />

ohne Ontologien aufgelöst werden könnten, erscheint die Verwendung von Ontologien<br />

zur Gewährleistung der semantischen Interoperabilität als nicht zwingend notwendig.<br />

Allerdings würde der Verzicht auf Ontologien im Semantic Web auch den Verzicht auf<br />

jene funktionalen Verbesserungen bedeuten, die mit Ontologien für informationsverarbeitende<br />

Web-Applikationen bereitgestellt werden können. Somit kann festgehalten werden,<br />

dass aus funktionaler Sicht die Verwendung von Ontologien für die semantische Basis des<br />

Semantic Web zwar nicht erforderlich ist, aber durchaus Vorteile daraus entstehen.<br />

Abschließend sei hinsichtlich der Realisierbarkeit der Vision des Semantic Web aus betriebswirtschaftlicher<br />

Sicht angemerkt, dass ein signifikanter Mehrwert der Semantic Web<br />

- Technologien erst bei einer weiten Verbreitung derselben deutlich wird. Denn erst wenn<br />

viele Applikationen auf einer einheitlichen semantischen Grundlage basieren, werden die<br />

daraus resultierenden Vorteile deutlich. Da ein Unternehmen somit nur langfristig einen<br />

Profit aus Investitionen für die Entwicklung von Semantic Web – Anwendungen erwarten<br />

kann, wird die Realisierbarkeit des Semantic Web aus dieser Perspektive als sehr kritisch<br />

und nur über einen längeren Zeitraum hinweg für möglich erachtet. 220<br />

220 Diese Aspekte führte Dr. Jürgen Laartz, McKinsey Company, in seinem Vortrag <strong>zum</strong> <strong>Thema</strong> „Semantic Web –<br />

Wissenschaftliche Spielerei oder ökonomischer Mehrwert?“ auf dem 3. Berliner E-Business-Forum, 04.07.2002, an.


Literaturverzeichnis 91<br />

Literaturverzeichnis<br />

Rückriem+97<br />

Berners-Lee+01<br />

Berners-Lee00<br />

Cruz+01<br />

Fensel01<br />

Gómez-Pérez99<br />

Ohlms02<br />

Angele+97<br />

Balzert99<br />

Duden93<br />

Endres-Niggemeyer98<br />

Fensel00<br />

Glück00<br />

Gómez-Pérez+99<br />

Görz+00a<br />

Vorwort<br />

RÜCKRIEM, G.; STARY, J.; FRANCK, N.: Die Technik wissenschaftlichen<br />

Arbeitens. Eine praktische Anleitung. 10. überarbeitete Auflage. Paderborn,<br />

München, Wien, Zürich: Schönigh 1997.<br />

Einleitung<br />

BERNERS-LEE, T.; HENDLER, J.; LASSILA, O.: The Semantic Web. A new<br />

form of Web Content that is meaningful to computers will unleash a<br />

revolution of new possibilities. In: Future of the Web. Scientific American<br />

Online Issue 2002, S. 24-30 (erschienen in: Scientific American, May<br />

2001).<br />

BERNERS-LEE, T.: Weaving the Web. The Past, Present and Future of the<br />

World Wide Web by its Inventor. London, New York: Texere 2000.<br />

CRUZ, I. F. U. A.: Proceedings of the First Semantic Web Working<br />

Symposium. California (USA): Stanford University 2001.<br />

FENSEL, D.: The Semantic Web. Vortragsfoliensatz, Semantic Web Workshop.<br />

Hong Kong: 2001.<br />

GÓMEZ-PÉREZ, A.: Ontological Engineering. A State of the Art. Madrid:<br />

Expert Update 1999.<br />

OHLMS, C.: The Future of the Semantic Web. A Perspective on the Market<br />

Adoption of Semantic Web Technologies. Karlsruhe: 9. AIK-Symposium<br />

2002.<br />

Kapitel A<br />

ANGELE, J. U.A.: Abschlußbericht der GI-Arbeitsgruppe "Vergleichende<br />

Analyse von Problemstellungen und Lösungsansätzen in den Fachgebieten<br />

Information Systems Engineering, Software Engineering und Knowledge<br />

Engineering". EMISA Forum 7 (2): 11-58 (1997)<br />

BALZERT, HEIDE.: Lehrbuch der Objektmodellierung. Analyse und Entwurf.<br />

Heidelberg; Berlin: Spektrum Verlag 1999.<br />

ENGESSER, H. (HRSG.): Duden Informatik. Ein Sachlexikon für Studium<br />

und Praxis. 2. Aufl. Mannheim, Leipzig, Wien, Zürich: Dudenverlag 1993.<br />

ENDRES-NIGGEMEYER, B.: Logische Grundlagen der Verarbeitung von<br />

Wissen und Information. Hannover: Vorlesungsskriptum FH Hannover<br />

SoSe 1998.<br />

FENSEL, D.: Ontologies. Silver Bullet for Knowledge Management and<br />

Electronic Commerce. Berlin: Springer 2000.<br />

GLÜCK, H. (HRSG.): Metzler Lexikon Sprache. 2. überarbeitete und erweiterte<br />

Auflage. Stuttgart, Weimar: Metzler 2000.<br />

GÓMEZ-PÉREZ, A.; BENJAMINS, V. R.: Overview of Knowledge Sharing and<br />

Reuse Components. Ontologies and Problem Solving Methods. In: Proceedings<br />

of the IJCAI-99 Workshop on Ontologies and Problem-Solving<br />

Methods (KRR5). Stockholm: 1999.<br />

GÖRZ, G.; ROLLINGER, C.-R.; SCHNEEBERGER, J. (HRSG.): Handbuch der<br />

Künstlichen Intelligenz. 3. Aufl. München: Oldenburg Verlag 2000.


Literaturverzeichnis 92<br />

Görz+00b GÖRZ, G.; WACHSMUTH, I.: Einleitung. In: (Görz+00a) Kapitel 5, S. 1-15.<br />

Gruber93<br />

Guarino+95<br />

Guarino94<br />

Guarino95<br />

Guarino98<br />

Hesse96<br />

GRUBER, T. R.: Towards Principles for the Design of Ontologies used for<br />

Knowledge Sharing. Stanford University, Knowledge Systems Laboratory:<br />

Technical Report KSL 93-04, 1993.<br />

GUARINO, N.; GIARETTA, P.: Ontologies and Knowledge Bases. Towards a<br />

Terminological Clarification. In: N. Mars (Hrsg.): Towards Very Large<br />

Knowledge Bases. Knowledge Building and Knowledge Sharing.<br />

Amsterdam: IOS Press 1995.<br />

GUARINO, N.: The Ontological Level. In: R. Casati, B. Smith and G. White<br />

(Hrsg.): Philosophy and the Cognitive Science. Wien: Hölder-Pichler-<br />

Tempsky 1994.<br />

GUARINO, N.: Formal Ontology, Conceptual Analysis and Knowledge<br />

Represenation. International Journal of Human and Computer Studies<br />

43(5/6): 625-640.<br />

GUARINO, N.: Formal Ontology and Information Systems. In N. Guarino<br />

(Hrsg.): Formal Ontology in Information Systems. Proceedings of FOIS98.<br />

Amsterdam: IOS Press 1998.<br />

HESSE, S.: Expert Lexikon. Künstliche Intelligenz. Reunigen-Malsheim:<br />

Expert Verlag 1996.<br />

Hofstadter01 HOFSTADTER, D. R.: Gödel, Escher, Bach. Ein endlos geflochtenes Band. 8.<br />

Aufl. München: Deutscher Taschenbuch Verlag 2001.<br />

Luger01<br />

McCarthy+55<br />

McCarthy+69<br />

LUGER, G. F.: Künstliche Intelligenz. Strategien <strong>zum</strong> Lösen komplexer<br />

Probleme. München: Pearson Studien 2001.<br />

MCCARTHY, J. U. A.: A Proposal on the Dartmouth Summer Research<br />

Project on Artificial Intelligence. Dartmouth (New Hampshire, USA):<br />

1955.<br />

MCCARTHY, J.; HAYES, P. J.: Some Philosophical Problems from the<br />

Standpoint of Artificial Intelligence. Machine Intelligence 4, 1969.<br />

McCarthy00 MCCARTHY, J.: What is Artificial Intelligence? Stanford University 2000.<br />

Newell81 NEWELL, A.: The Knowledge Level. Artificial Intelligence 18 (1), S. 87-<br />

127.<br />

Nonaka+97<br />

Owsnicki-Klewe+00<br />

Puppe+00<br />

Schreiber+00<br />

Smolle02<br />

Störig63<br />

NONAKA, X.; TAKEUCHI, Y.: Die Organisation des Wissens. Wie japanische<br />

Unternehmen eine brachliegende Ressource nutzbar machen.<br />

Frankfurt a. M.: Campus Verlag 1997.<br />

OWSNICKI-KLEWE, B.; LUCK, K. VON; NEBEL, B.: Wissensrepräsentation<br />

und Logik – Eine Einführung. In: (Görz+00a) Kapitel 5, S. 153-197.<br />

PUPPE, F. ; STOYAN, H.; STUDER, R.: Knowledge Engineering. In:<br />

(Görz+00a) Kapitel 15, S. 599-641.<br />

SCHREIBER, G. U.A.: Knowledge Engineering and Management. The<br />

CommonKADS Methodology. Cambridge (USA), London: MIT Press<br />

2000.<br />

SMOLLE, P. F.: Semantische Technologien & Elektronische Märkte.<br />

Karlsruhe: 9. AIK-Symposium 2002.<br />

STÖRIG, H.J.: Kleine Weltgeschichte der Philosophie. München, Zürich:<br />

Droemersche Verlagsanstalt 1963.


Literaturverzeichnis 93<br />

Struss00<br />

Studer+98<br />

Uschold+96<br />

Wielinga94<br />

STRUSS, P.: Modellbasierte Systeme und qualitative Modellierung. In:<br />

(Görz+00a) Kapitel 12, S. 431-490.<br />

STUDER, R.; BENJAMINS, V.R.; FENSEL, D.: Knowledge Engineering.<br />

Principles and Methods. In: Data and Knowledge Engineering 25 (1-2)<br />

1998.<br />

USCHOLD, M.; GRUNINGER, M.: Ontologies. Principles, Methods and<br />

Applications. In: Knowledge Engineering Review 11(2), 1996.<br />

WIELINGA, B. J. (HRSG.): Expertise Model Definition Document. ESPRIT<br />

Project, University of Amsterdam 1994.<br />

Kapitel B<br />

Boyens01<br />

Brockhaus96<br />

Corcho+00<br />

Devedžić02<br />

BOYENS, C.: OntoKick – Ein Werkzeug zur Unterstützung von ontologiebasiertem<br />

Wissensmanagement. Dipl.-Arb., Karlsruhe 2001.<br />

BROCKHAUS – DIE ENZYKLOPÄDIE. In 24 Bänden. 20., überarbeitete und<br />

aktualisierte Aufl. Leipzig, Mannheim: Brockhaus 1996.<br />

CORCHO, O.; GÓMEZ-PÉREZ, A.: Evaluating Knowledge Representation and<br />

Reasoning Capabilities of Ontology Specification Languages. In: Proceedings<br />

of the ECAI 2000 Workshop on Applications of Ontologies and<br />

Problem Solving Methods. Berlin 2000.<br />

DEVEDŽIĆ, V.: Understanding Ontological Engineering. In: Communications<br />

of the ACM 45 (4), 2002: S. 136-144.<br />

Draheim00 DRAHEIM, D.: Vorlesungsskript Softwaretechnik. FU Berlin, WS 00 / 01.<br />

Farquhar+96<br />

Fernández+97<br />

Fernandéz+99<br />

Gómez-Pérez+96<br />

Gómez-Pérez01<br />

Gruber93b<br />

Grüninger+95<br />

Guarino+00a<br />

FRAQUHAR, A.; FIKES, R.; RICE,J.: The Ontolingua Server. A Tool for<br />

Collaborative Ontology Construction. In: Proceedings of KAW96. Banff<br />

(Canada) 1996.<br />

FERNÁNDEZ, M.; GÓMEZ-PÉREZ, A.; JURISTO, N.: METHONTOLOGY.<br />

From Ontological Art towards Ontological Engineering. In: AAAI-97<br />

Spring-Symposium on Ontological Engineering. Stanford University 1997.<br />

FERNÁNDEZ, M.; GÓMEZ-PÉREZ, A.; SIERRA, J. P.: Building a Chemical<br />

Ontology Using Methontology and the Ontology Design Environment. In:<br />

IEEE Intelligent Systems 14 (1), 1999.<br />

GÓMEZ-PÉREZ, A.; FERNÁNDÉZ, M.; DE VICENTE, A. : Towards a Method<br />

to Conceptualize Domain Ontologies. In: Working Notes of the Workshop<br />

Ontological Engineering, ECAI 1996.<br />

GOMEZ-PEREZ, A.: Evaluation of ontologies. In R. R. Yager (Hrsg.):<br />

International Journal of Intelligent Systems 16 (3). Special Issue on<br />

Verification and Validation in Databases, Knowledge Based Systems, and<br />

Ontologies. London: John Wiley & Sons 2001, S. 391-409.<br />

GRUBER, T. R.: A Translation Approach to Portable Ontology Specification.<br />

Knowledge Acquisition 5, 1993.<br />

GRÜNINGER, M.; FOX, M. S.: Methodology for the Design and Evolution of<br />

Ontologies. IJCAI-95 Workshop on Basic Ontological Issues in Knowledge<br />

Sharing. Montral (Cananda): 1995.<br />

GUARINO, N.; WELTY, C.: Towards a methodology for ontology-based<br />

model engineering. In: Proceedings of ECOOP-2000 Workshop on Model<br />

Engineering. Cannes (France): 2000.


Literaturverzeichnis 94<br />

Guarino+00b<br />

Guarino+02<br />

Holsapple+02<br />

Jones+98<br />

KBSI-94<br />

Motta98<br />

Noy01<br />

O´Neil+01<br />

Schnurr+00<br />

Smith98<br />

Uschold+95<br />

Uschold+96b<br />

GUARINO, N.; WELTY, C.: A Formal Ontology of Properties. In R. Dieng<br />

and O. Corby (Hrsg.): Knowledge Engineering and Knowledge Management.<br />

Methods, Models and Tools. 12th International Conference, EKAW<br />

2000. Berlin: Springer 2000, S. 97-112.<br />

GUARINO, N.; WELTY, C.: Evaluating Ontological Decisions with Onto<br />

Clean. In: Communications of the ACM 45 (2), 2002; S. 61-65.<br />

HOLSAPPLE, C. W.; JOSHI, K.D.: A Collaborative Approach to Ontology<br />

Design. In: Communications of the ACM 45 (2), 2002; S. 42-47.<br />

JONES, D.; BENCH-Capon, T.; Visser, P.: Methodologies for Ontology<br />

Development. In: Proceedings of IT&KNOWS Conference of the 15th IFIP<br />

World Computer Congress. Budapest: Chapman-Hall 1998.<br />

KNOWLEDGE BASED SYSTEMS, INC.: The IDEF5 Ontology Description<br />

Capture Method Overview. Texas (USA): KBSI Report 1994.<br />

MOTTA, E.: An Overview of the OCML Modelling Language. In: Proceedings<br />

of the 8 th Workshop on Knowledge Engineering: Methods &<br />

Languages KEML 98. Karlsruhe: 1998.<br />

NOY, N. F.: Ontology Engineering for the Semantic Web and Beyond.<br />

Semantic Web Working Symposium Tutorial. California, USA: Stanford<br />

University 2001.<br />

O´NEIL, P.; O´NEIL, E.: Database. Principles, Programming, and Performance.<br />

2 Aufl. Boston: Morgan Kaufmann Publishers 2001.<br />

SCHNURR, H.-P. U. A.: On-To-Knowledge Methodology – Baseline Version.<br />

Karlsruhe: On-To-Knowledge Consortium 2000.<br />

SMITH, B.: Basic Concepts of Formal Ontology. In N. Guarino (Hrsg.):<br />

Formal Ontology in Information Systems. Proceedings of FOIS98. Amsterdam:<br />

IOS Press 1998.<br />

USCHOLD, M.; KING, M.: Towards a Methodology for Building Ontologies.<br />

IJCAI-95 Workshop on Basic Ontological Issues in Knowledge Sharing.<br />

Montreal (Canada): 1995.<br />

USCHOLD, M. U.A.: The Enterprise Ontology. Knowledge Engineering<br />

Review 11(2), 1996.<br />

Kapitel C<br />

Aitken+00<br />

Bateman+95<br />

Benjamins+98<br />

Borgo+97<br />

AITKEN, S.; REID, S.: Evaluation of an Ontology-Based Information<br />

Retrieval Tool. In: Proceedings of ECAI'00 Workshop on Applications of<br />

Ontologies and Problem-Solving Methods, 2000.<br />

BATEMAN, J. A.; MAGNINI, B.; FABRIS, G.: The Generalized Upper Model<br />

Knowledge Bare. Organization and Use. In N. Mars (Hrsg.): Towards Very<br />

Large Knowledge Bases. Knowledge Building and Knowledge Sharing.<br />

Amsterdam: IOS Press 1995.<br />

BENJAMINS, V. R.; FENSEL, D.: The Ontological Engineering Initiative<br />

(KA) 2 . In N. Guarino (Hrsg.): Formal Ontology in Information Systems.<br />

Proceedings of FOIS98. Amsterdam: IOS Press 1998.<br />

BORGO, S. U. A.: Using a Large Linguistic Ontology for Internet-Based<br />

Retrieval of Object-Oriented Components. In Proceedings of 1997<br />

Conference on Software Engineering and Knowledge Engineering. Snokie<br />

(USA), 1997.


Literaturverzeichnis 95<br />

Borst97<br />

BORST, W. N.: Construction of Engineering Ontologies for Knowledge<br />

Sharing and Reuse. Enschede, Diss. 1997.<br />

Burkhard00 BURKHARD, H.-D.: Software-Agenten. In: (Görz+00a), Kapitel 24; S. 941-<br />

1018.<br />

Bylander+88<br />

Campell+98<br />

Clason76<br />

Cui+00<br />

Cui+01<br />

DIN 1463<br />

Elkan+93<br />

Falasconi+96<br />

Fellbaum98<br />

Finin+97<br />

FIPA-97<br />

FIPA-98<br />

Gangemi+98<br />

Gaus98<br />

Greengrass00<br />

BYLANDER, T.; CHANDRASEKARAN, B.: Generic tasks in knowledge-based<br />

reasoning. The right level of abstraction for knowledge acquisition. In B.<br />

Gaines, J. Boose (Hrsg.): Knowledge Acquisition for Knowledge Based<br />

Systems. Vol. 1 London: Academic Press 1988.<br />

CAMPELL, A. E.; SHAPIRO, S. C.: Algorithms for Ontological Mediation.<br />

Technical Report 98-03, Dep. of CS and Engineering, State Univ. of New<br />

York at Buffalo, 1998.<br />

CLASON, W. E.: Elsevier´s Dictionary of Library Science, Information and<br />

Documentation. Amsterdam: Elsevier 1976.<br />

CUI, Z.; O´BRIEN, P.: Domain Ontology Management Environment. In:<br />

Proceedings of the 33rd Hawaii International Conference on System<br />

Sciences, 2000.<br />

CUI, Z. ; JONES, D.; O´BRIEN P.: Issues in Ontology-based Information<br />

Integration. In: Proceedings of the IJCAI01 Workshop on E-Business and<br />

the Intelligent Web, Seattle (USA) 2001.<br />

DIN 1463, TEIL 1: Erstellung und Entwicklung von Thesauri. Einsprachige<br />

Thesauri. Berlin: Beuth 1988 (12 S.).<br />

ELKAN, C.; GREINER, R.: Book Review. Building Large Knowledge Based<br />

Systems. Representation and Inference in the CYC Project. Artificial<br />

Intelligence (61), 1993.<br />

FALASCONI, S.; LANZOLA, G.; STEFANELLI, M.: Using Ontologies in Multi-<br />

Agent Systems. In: Proceedings of the 10th Knowledge Acqisition for<br />

Knowledge-Based Systems Workshop KAW´96. Banff (Canada): 1996.<br />

FELLBAUM (HRSG.): WordNet. An Electronic Lexical Database. Cambridge<br />

(USA), London: MIT Press 1998.<br />

FININ, T.; LABROU, Y.; MAYFIELD, J.: KQML as an agent communication<br />

language. In J. Bradshaw (Hrsg.): Software Agents. Cambridge (USA),<br />

London: MIT Press 1997.<br />

FIPA: Agent Communication Language Specification. Foundation for<br />

Intelligent Physical Agents, Genf 1997.<br />

unter: www.fipa.org/specs/fipa00003/ (04.09.2002).<br />

FIPA: Ontology Service Specification. Foundation for Intelligent Physical<br />

Agents, Genf 1998.<br />

unter: www.fipa.org/specs/fipa00006/ (04.09.2002).<br />

GANGEMI, A.; PISANELLI, D. M.; STEVE, G.: Ontology Integration. Experiences<br />

with Medical Terminologies. In N. Guarino (Hrsg.): Formal Ontology<br />

in Information Systems. Proceedings of FOIS98. Amsterdam: IOS Press<br />

1998.<br />

GAUS, W.: Dokumentations- und Ordnungslehre. Theorie und Praxis des<br />

Information Retrieval. 3 Aufl. Berlin, Heidelberg: Springer 1998.<br />

GREENGRASS, E.: Information Retrieval – A Survey. UMBC Center for<br />

Architectures for Data-Driven Information Processing, Maryland (USA):<br />

2000.


Literaturverzeichnis 96<br />

Guarino97<br />

Hindelang94<br />

Jones98<br />

Kashyap+96<br />

Klinker+91<br />

McGuinness98<br />

Mena+00<br />

Mena+98<br />

Mitra+01<br />

Mitra+99<br />

Neches+91<br />

Obitko01<br />

Rodrígez00<br />

Schnurr+01<br />

Sheth98<br />

Swartout+97<br />

GUARINO, N.: Semantic Matching. Formal Ontological Distinctions for<br />

Information Organization, Extraction, and Integration. In M. T. Pazienza<br />

(Hrsg.) Information Extraction: A Multidisciplinary Approach to an Emerging<br />

Information Technology. Berlin, Heidelberg: Springer 1997.<br />

HINDELANG, G.: Einführung in die Sprechakt-Theorie. 2. Aufl. Tübingen:<br />

Niemeyer 1994.<br />

JONES, D.: Developing Shared Ontologies in Multi-agent Systems. In<br />

Proceedings of the ECAI'98 Workshop on Intelligent Information Integration.<br />

Brighton (GB) 1998.<br />

KASHYAP, V.; SHETH, A. P.: Semantic Heterogeneity in Global Information<br />

Systems. The Role of Metadata, Context and Ontologies. In M.<br />

Papazoglou, G. Schlageter (Hrsg.): Cooperative Information Systems.<br />

Current Trends and Applications, 1996.<br />

KLINKER, G. U.A.: Usable and reusable programming constructs. In:<br />

Knowledge Acquisition (3), 1991.<br />

MCGUINNESS, D. L.: Ontological Issues for Knowledge-Enhanced Search.<br />

In N. Guarino (Hrsg.): Formal Ontology in Information Systems. Proceedings<br />

of FOIS98. Amsterdam: IOS Press 1998.<br />

MENA, E. U. A.: OBSERVER. An Approach for Query Processing in Global<br />

Information Systems based on Interoperation across pre-existing<br />

Ontologies. In: International Journal on Distributed and Parallel Databases,<br />

Vol. 8, No. 2, pp. 223-271, April 2000.<br />

MENA, E. U. A.: Domain Specific Ontologies for Semantic Information<br />

Brokering on the Global Information Infrastructure. In N. Guarino (Hrsg.):<br />

Formal Ontology in Information Systems. Proceedings of FOIS98. Amsterdam:<br />

IOS Press 1998.<br />

MITRA, P.; WIEDERHOLD, G.; DECKER, S.: A Scalable Framework for the<br />

Interoperation of Information Sources. In: Proceedings of the First<br />

Semantic Web Working Symposium SWWS´01. Stanford University 2001;<br />

S. 317-330.<br />

MITRA, P, WIEDERHOLD, G.; JANNINK J.: Semi-automatic integration of<br />

knowledge sources. In: Proceedings of the 2 nd International Conference on<br />

Information FUSION´99, 1999.<br />

NECHES, R. U. A.: Enabling Technology for Knowledge Sharing. AI Magazine<br />

12 (3), 1991.<br />

OBITKO, M.: Ontologies. Descriptions and Applications. Research Report<br />

No. 126/01, Gerster Laboratory for Intelligent Decision Making and<br />

Control, Czech Technical University. Prag: 2001.<br />

RODRÍGEZ, M. A.: Assessing Semantic Similarity among Spatial Entity<br />

Classes. University of Maine, Diss. 2000.<br />

SCHNURR, H.-P. U.A.: Ontologiebasiertes Wissensmanagement – ein<br />

umfassender Ansatz zur Gestaltung des Knowledge Life Cycle. Karlsruhe:<br />

2001.<br />

SHETH, A. P.: Changing Focus on Interoperability in Information Systems.<br />

Form System, Syntax, Structure to Semantics. In M. F. Goodschild u. a.<br />

(Hrsg): Interoperating Geographic Information Systems. Kluwer 1998.<br />

SWARTOUT, W. R.: Towards Distributed Use of Large-Scale Ontologies. In:<br />

AAAI-97 Spring Symposium on Ontological Engineering. Stanford University,<br />

1997.


Literaturverzeichnis 97<br />

Uschold+98<br />

Uschold+99<br />

vanHeijst+97<br />

Visser+98<br />

Wache+01<br />

Wiederhold94<br />

USCHOLD, M. U. A.: Ontology Reuse and Application. In N. Guarino<br />

(Hrsg.): Formal Ontology in Information Systems. Proceedings of FOIS98.<br />

Amsterdam: IOS Press 1998.<br />

USCHOLD, M.; JASPER, R.: A Framework for Understanding and Classifying<br />

Ontology Applications. In V. R. Benjamins u. a. (Hrsg.): Proceedings<br />

of the IJCAI-99 Workshop on Ontologies and Problem-Solving-<br />

Methods. Stockholm 1999.<br />

VAN HEIJST, G.; SCHREIBER, A. TH.; WIELINGA, B. J.: Using Explicit<br />

Ontologies in KBS Development. In: International Journal of Human-<br />

Computer-Studies (45), 1997.<br />

VISSER, P. R. S. U. A.: Assessing Heterogeneity by Classifying Ontology<br />

Mismatches. In N. Guarino (Hrsg.): Formal Ontology in Information<br />

Systems. Proceedings of FOIS98. Amsterdam: IOS Press 1998.<br />

WACHE, H. U. A.: Ontology-Based Information Integration – A Survey of<br />

Existing Approaches. In: Proceedings of the Workshop Ontologies and<br />

Information Sharing. IJCAI 2001.<br />

WIEDERHOLD, G.: Interoperation, Mediation, and Ontologies. In: Proceedings<br />

of the International Symposium for Fifth Generation Computer<br />

Systems, Workshop on Heterogeneous Cooperative Knowledge Bases.<br />

Tokyo 1994.<br />

Kapitel D<br />

Beckett02<br />

Berners-Lee00a<br />

Berners-Lee98<br />

BECKETT, D.: RDF/XML Syntax Specification (Revised). W3C Working<br />

Draft: 2002.<br />

unter: www.w3.org/TR/rdf-syntax-grammar/ (25.09.2002).<br />

BERNERS-LEE, T.: Semantic Web on XML. Vortragsfoliensatz zur XML-<br />

Conference 2000, Washington DC: 2000.<br />

unter: www.w3.org/2000/Talks/1206-xml-2k-tbl/Overview.html (08.06.02).<br />

BERNERS-LEE, T.: Web-Architecture from 50.000 feet. W3C: 1998. letzter<br />

Update: 25.02.2002.<br />

unter: www.w3.org/DesignIssues/Architecture.html (26.09.2002).<br />

Berners-Lee98a BERNERS-LEE, T.: What the Semantic Web can represent. W3C: 1998.<br />

unter: www.w3.org/DesignIssues/RDFnot.html (26.09.2002).<br />

Berners-Lee98b BERNERS-LEE, T.: Semantic Web Road map. W3C, Draft: 1998.<br />

unter: www.w3.org/DesignIssues/Semantic.html (26.09.2002).<br />

Bray+00<br />

Bray+99<br />

Brickley+00<br />

Dean+02<br />

BRAY, T. U. A.: Extensible Markup Language (XML) 1.0. Second Edition.<br />

W3C Recommendation: 2000.<br />

unter: www.w3.org/TR/REC-xml (25.09.2002).<br />

BRAY, T.; HOLLANDER, D.; LAYMAN, A.: Namespaces in XML. W3C Recommendation:<br />

1999.<br />

unter: www.w3.org/TR/1999/REC-xml-names-19990114/ (04.10.2002).<br />

BRICKLEY, D.; GUHA, R. V.: Resource Description Framework (RDF)<br />

Schema Specification 1.0. W3C Candidate Recommendation: 2000.<br />

unter: www.w3.org/TR/2000/CR-rdf-schema-20000327/ (26.09.2002).<br />

DEAN. J. U. A.: OWL Web Ontology Language 1.0. Reference. W3C Working<br />

Draft: 2002.<br />

unter: www.w3.org/TR/owl-ref/ (25.09.2002).


Literaturverzeichnis 98<br />

Decker+00<br />

Ding+01<br />

Fallside01<br />

Fensel+01<br />

Fensel+02<br />

Gómez-Pérez+02<br />

DECKER, S. U. A.: The Semantic Web. The Roles of XML and RDF. In:<br />

IEEE Internet Computing. (5) 2000; S. 2-13.<br />

DING, Y.; FENSEL, D.: Ontology Library Systems. The key to successful<br />

Ontology Re-Use. In: Proceedings of the First Semantic Web Working<br />

Symposium. California, USA: Stanford University 2001; S. 93-112.<br />

FALLSIDE, D. C.: XML Schema Part 0: Primer. W3C Recommendation:<br />

2001.<br />

unter: www.w3.org/TR/xmlschema-0/ (04.10.2002).<br />

FENSEL, D. U. A.: OIL. An Ontology Infrastructure for the Semantic Web.<br />

In: IEEE Intelligent Systems (2) 2001; S. 38-45.<br />

FENSEL, D.; BUSSLER, C.; MAEDCHE, A.: Semantic Web Enabled Web<br />

Services. In: Proceedings of the 1 st International Semantic Web Conference<br />

(ISWC02). Sardinia (Italien): 2002; S. 1-2.<br />

GÓMEZ-PÉREZ, A.; CORCHO, O.: Ontology Languages for the Semantic<br />

Web. In: IEEE Intelligent Systems (1) 2002; S. 54-60.<br />

Hayes02 HAYES, P.: RDF Model Theory. W3C Working Draft: 2002.<br />

unter: www.w3.org/TR/rdf-mt/ (25.09.2002).<br />

Heflin+00<br />

Heflin+02<br />

Hendler+00<br />

Horrocks+01<br />

HEFLIN, J.; HENDLER, J.: Dynamic ontologies on the Web. In: Proceedings<br />

of the 17 th National Conference on Artificial Intelligence (AAAI-2000).<br />

Menlo Park (California): AAAI/MIT Press 2000; S. 443-449.<br />

HEFLIN, J.; VOLZ, R.; DALE, J.: Requirements for a Web Ontology Language.<br />

W3C Working Draft: 2002.<br />

unter: www.w3.org/TR/webont-req/ (25.09.2002).<br />

HENDLER, J.; MCGUINESS, D. L.: The DARPA Agent Markup Language.<br />

In: IEEE Intelligent Systems Trend and Controversies 2000.<br />

HORROCKS, I.; VAN HARMELEN, F.: Reference Description of the DAML+<br />

OIL Ontology Markup Language. DAML Program: Draft Report 2001.<br />

unter: www.daml.org/2000/12/reference.html (12.07.2002).<br />

Jacobs00 JACOBS, I.: About the World Wide Web Consortium (W3C). W3C: 2000.<br />

unter: www.w3.org/Consortium/ (01.10.2002).<br />

Karp+99<br />

Kashyap01<br />

KARPD, R.; CHAUDHRI, V.; THOMERE, J.: XOL. An XML-Based Ontology<br />

Exchange Language. Version 0.4: 1999.<br />

unter: www.ai.sri.com/~pkarp/xol (24.06.2002).<br />

KASHYAP, V.: Report on the „Interoperation, Integration, and Composition”<br />

track. In I. F. Cruz (Hrsg.): International Semantic Web Working Symposium<br />

(SWWS). Chicago, University of Illinois at Chicago: 2001; S. 24-<br />

27.<br />

Kent98 KENT, R.: Conceptual Knowledge Markup Language (Version 0.2). 1998.<br />

unter: www.ontologos.org/CKML/CKML%200.2html (24.06.2002).<br />

Kim02<br />

Klein+01<br />

Klein+02<br />

KIM, H.: Predicting how Ontologies for the Semantic Web will evolve. In:<br />

Communications of the ACM 45 (2), 2002: S. 48-54.<br />

KLEIN, M.; FENSEL, D.: Ontology Versioning on the Semantic Web. In:<br />

Proceedings of the First Semantic Web Working Symposium. California,<br />

USA: Stanford University 2001; S. 75-92.<br />

KLEIN, M. U. A.: Ontology versioning and change detection on the web. In:<br />

Proceedings of the 13th Conference on Knowledge Engineering and<br />

Knowledge Management (EKAW02). Siguenza (Spanien): 2002.


Literaturverzeichnis 99<br />

Koivunen+01<br />

Lassila+99<br />

Luke+00<br />

Maedche+01<br />

Maedche+02<br />

KOIVUNEN, M.-R.; MILLER, E.: W3C Semantic Web Activity. In: Proceedings<br />

of the Semantic Web Kick-off Seminar in Finland. Helsinki: 2001.<br />

unter: www.w3c.org/2001/12/semweb-fin/w3csw (25.09.2002).<br />

LASSILA, O.; SWICK, R. R.: Resource Description Framework (RDF) Model<br />

and Syntax Specification. W3C Recommendation: 1999.<br />

unter: www.w3.org/TR/REC-rdf-syntax/ (25.09.2002).<br />

LUKE, S.; HEFLIN, J.: SHOE 1.01 Proposed Specification. SHOE Project:<br />

2000.<br />

unter: www.ca.umd.edu/projects/plus/SHOE/spec1.01.html (24.06.2002).<br />

MAEDCHE, A.; STAAB, S.: Learning Ontologies for the Semantic Web. In:<br />

Proceedings of the Semantic Web Workshop. Hong Kong: 2001.<br />

MAEDCHE, A. U. A.: MAFRA – A MApping FRAmework for Distributed<br />

Ontologies in the Semantic Web. In: Proceedings of the Workshop on<br />

Knowledge Transformation for the Semantic Web at the 15 th European<br />

Conference on Artificial Intelligence ECAI02. Lyon (Frankreich): 2002; S.<br />

59-67.<br />

Manola+02 MANOLA, F.; MILLER, E.: RDF Primer. W3C Working Draft: 2002.<br />

unter: www.w3.org/TR/2002/WD-rdf-primer-20020319/ (25.09.2002).<br />

McGuiness+02<br />

Miller01<br />

Noy+99<br />

Noy+00<br />

Patel-Schneider+02<br />

Tuttle+01<br />

Uschold01<br />

Visser+00<br />

Wrobel+00<br />

MCGUINESS, D. L.; VAN HARMELEN, F.: Feature Synopsis for OWL Lite<br />

and OWL. W3C Working Draft: 2002.<br />

unter: www.w3.org/TR/2002/WD-owl-features-20020729/ (25.09.2002).<br />

MILLER, E.: The Semantic Web Activity Statement. W3C, 2001. letzter<br />

Update: 24.04.2002.<br />

unter: www.w3.org/2001/sw/Activity (25.09.2002).<br />

NOY, N. F.; MUSEN, M. A.: An Algorithm for Merging and Aligning Ontologies.<br />

Automation and Tool Support. In: Proceedings of the Workshop on<br />

Ontology Management at the 16 th National Conference on Artificial Intelligence<br />

(AAA-99). Orlando, Florida (USA): AAAI Press 1999.<br />

NOY, N. F.; MUSEN, M. A.: PROMPT. Algorithm and Tool for Automated<br />

Ontology Merging and Alignment. In: Proceedings of the 17 th National<br />

Conference on Artificial Intelligence (AAAI-2000). Menlo Park (California):<br />

AAAI/MIT Press 2000.<br />

PATEL-SCHNEIDER, P. F., HORROCKS, I.; VAN HARMELEN, F.: OWL Web<br />

Ontology Language 1.0. Abstract Syntax. W3C Working Draft: 2002.<br />

unter: www.w3.org/TR/2002/WD-owl-absyn-20020729/ (25.09.2002).<br />

TUTTLE, M. S.; MCGUINESS, D. L.: Report on the „Ontologies and Ontology<br />

Maintenance“ track. In I. F. Cruz (Hrsg.): International Semantic Web<br />

Working Symposium (SWWS). Chicago, University of Illinois at Chicago:<br />

2001; S. 21-23.<br />

USCHOLD, M.: Where is the Semantics in the Semantic Web? In: Proceedings<br />

of the Workshop on Ontologies in Agent Systems (OAS), 5th<br />

International Conference on Autonomous Agents, 2001.<br />

VISSER, U.; SCHUSTER, G.: Semantic Web Services. A Practical Solution.<br />

In: Proceedings of the Ontologies and Semantic Interoperability at the 15 th<br />

European Conference on Artificial Intelligence ECAI02. Lyon (Frankreich):<br />

2002.<br />

WROBEL, S.; MORIK, K.; JOACHIMS, T.: Maschinelles Lernen und Data<br />

Mining. In: (Görz+00a) Kapitel 14, S. 517-598.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!