RHEINISCHE FACHHOCHSCHULE KÖLN - Bernd-schmitz.net
RHEINISCHE FACHHOCHSCHULE KÖLN - Bernd-schmitz.net
RHEINISCHE FACHHOCHSCHULE KÖLN - Bernd-schmitz.net
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
<strong>RHEINISCHE</strong> <strong>FACHHOCHSCHULE</strong><br />
<strong>KÖLN</strong><br />
University of Applied Sciences<br />
Fachbereich: Wirtschaft & Recht<br />
Studiengang: Medienwirtschaft I<br />
Diplomarbeit<br />
Chancen und Auswirkungen<br />
des<br />
semantischen Webs<br />
Holger Sistig<br />
Sommersemester 2008
<strong>RHEINISCHE</strong> <strong>FACHHOCHSCHULE</strong> <strong>KÖLN</strong><br />
University of Applied Sciences<br />
Fachbereich: Wirtschaft & Recht<br />
Studiengang: Medienwirtschaft I<br />
Diplomarbeit<br />
Chancen und Auswirkungen<br />
des<br />
semantischen Webs<br />
Diplomarbeit vorgelegt von: Holger Sistig<br />
1. Prüfer: Dipl. BW. <strong>Bernd</strong> Schmitz<br />
2. Prüfer: Prof. Dr. Dieter Nennen<br />
Sommersemester 2008
Inhaltsverzeichnis<br />
1 Das Inter<strong>net</strong> heute........................................................................1<br />
1.1 Definition des semantischen Webs ........................................................4<br />
1.2 Semantik und das semantische Web ....................................................5<br />
1.3 Web 3.0 – Bedarf des semantischen Webs im Inter<strong>net</strong> ........................5<br />
1.3.1 Knowledge-Management..............................................................6<br />
1.3.2 Business-to-Consumer (B2C) Electronic Commerce...................7<br />
1.3.3 Business-to-Business (B2B) Electronic Commerce......................9<br />
1.4 Web 3.0 – Bedarf an semantischen Web im Unternehmen ................10<br />
1.4.1 Entscheidungsunterstützung.......................................................12<br />
1.4.2 Business Development...............................................................12<br />
1.4.3 Automatisierte Verwaltung..........................................................14<br />
1.5 Möglichkeiten des semantischen Webs im privaten Bereich...............15<br />
1.5.1 Personal Agents..........................................................................15<br />
1.5.2 Veränderungen in der physikalischen Welt................................19<br />
1.6 Abgrenzung zur künstlichen Intelligenz................................................20<br />
1.7 Vorgehensweise....................................................................................21<br />
2 Das Inter<strong>net</strong> morgen...................................................................22<br />
2.1 Das W3C-Konsortium...........................................................................22<br />
2.2 Die Grundprinzipien des semantischen Webs......................................24<br />
2.2.1 Prinzip 1: Alles kann mittels URIs identifiziert werden................24<br />
2.2.2 Prinzip 2: Ressourcen und Beziehungen sind typisiert..............25<br />
2.2.3 Prinzip 3: Partielle Informationen sind akzeptabel......................27<br />
2.2.4 Prinzip 4: Absolute Wahrheit wird nicht benötigt........................27<br />
2.2.5 Prinzip 5: Evolution wird unterstützt............................................28<br />
2.2.6 Prinzip 6: Minimalistisches Design der Technologien................30<br />
2.3 Technologien des semantischen Webs................................................30<br />
2.3.1 Unicode und URI.........................................................................32<br />
2.3.2 Extensible Markup Language (XML)...........................................33<br />
2.3.3 Resource Description Framework (RDF)....................................36<br />
2.3.4 RDF Schema (RDFS).................................................................41<br />
2.3.5 Ontologien...................................................................................43<br />
2.3.6 Ontology Web Language (OWL) ................................................45<br />
2.3.7 Logik und Schlussfolgerungen....................................................47<br />
2.3.8 Beweise, Vertrauen und digitale Signaturen...............................50<br />
2.3.9 Entwicklung des Schichtenmodells.............................................54
2.4 Evolution zum semantischen Web........................................................57<br />
2.4.1 Der Bottom-Up Ansatz................................................................57<br />
2.4.2 Der Top-Down Ansatz.................................................................58<br />
2.4.3 Der hybride Ansatz......................................................................59<br />
2.4.4 Zeitliche Einordnung bis zur Verwirklichung...............................60<br />
2.5 Anwendungsbeispiele aus der Wirtschaft ............................................62<br />
2.5.1 WEASEL, Vodafone R&D Corporate Semantic Web ................62<br />
2.5.2 POPS - NASA’s Expertise Location Service...............................64<br />
2.5.3 Renault - Semantic Web in Automotive Repair and Diagnostic 70<br />
2.6 Anwendungsbeispiele aus dem Gesundheitswesen............................71<br />
2.6.1 SAPPHIRE .................................................................................72<br />
2.6.2 Arzneimittelforschung..................................................................73<br />
2.7 Anwendungsbeispiele für den privaten Bereich...................................76<br />
2.7.1 FOAF – Friend of a Friend..........................................................76<br />
2.7.2 Noserub.de – ein dezentrales soziales Netzwerk.......................79<br />
3 Fazit und Ausblick......................................................................81<br />
Darstellungsverzeichnis<br />
Abkürzungsverzeichnis<br />
Literaturverzeichnis<br />
Inter<strong>net</strong>verzeichnis<br />
Zeitschriftenverzeichnis<br />
Erklärung<br />
Lebenslauf
1 Das Inter<strong>net</strong> heute<br />
Das World Wide Web (WWW) hat die Gesellschaft und die Wirtschaft in den<br />
letzten Jahren erheblich beeinflusst und verändert. So beläuft sich beispielswei-<br />
se die Summe des weltweiten E-Commerce-Umsatzes mittlerweile auf 17,9 Bil-<br />
lionen EUR in 2006 1 und die Gesamtmenge der Daten im Inter<strong>net</strong> auf 281 Milli-<br />
arden Gigabyte in 2007 2 , jeweils mit anhaltend steigender Tendenz. Das stän-<br />
dig wachsende Datenaufkommen macht es immer schwieriger, relevante Infor-<br />
mationen zu finden, darauf zuzugreifen und diese sinnvoll wiederzuverwerten,<br />
ob nun als Privatperson oder als Unternehmen. Wie wichtig dabei dieses Know-<br />
ledge-Management in Zukunft für eine erfolgreiche Informationsgesellschaft<br />
sein wird, lässt sich leicht erahnen. Das nützlichste Werkzeug beim Suchen und<br />
Verwenden von Informationen sind zurzeit Suchmaschinen. Mit den auf Schlag-<br />
wörtern basierenden Suchmaschinen wie z.B. Google sind allerdings einige<br />
Probleme verbunden. Sie liefern eine hohe Trefferzahl, leider aber auch oft ge-<br />
ringe Genauigkeit, denn zu viele Suchergebnisse sind letztendlich genauso un-<br />
brauchbar wie zu wenige. Außerdem können Wortdoppelbedeutungen nicht<br />
unterschieden werden und die Ergebnisse sind stets nur auf einzelnen Websei-<br />
ten zu finden. Benötigen wir Informationen, die sich über mehrere Webseiten<br />
verteilen, müssen wir die Informationen selbst einzeln entnehmen und zusam-<br />
menfügen.<br />
Natürlich gibt es heute bereits Software, die Text verarbeiten, Rechtschreibung<br />
prüfen oder die Wörter zählen kann. Geht es aber darum, die Bedeutung von<br />
Sätzen zu interpretieren und daraus brauchbare Informationen für den Nutzer<br />
zu extrahieren, so sind alle verfügbaren Programme stark limitiert, wenn nicht<br />
gar unbrauchbar. Eine Suchmaschine kann die Bedeutung des Satzes: „Ich bin<br />
ein Student der Medienwirtschaft.“ nicht von: „Ich bin ein Student der Medien-<br />
wirtschaft, könnte man meinen, aber...“ unterscheiden. Das Hauptproblem ist,<br />
dass der Großteil der Daten im Inter<strong>net</strong> zum Lesen und Deuten durch den Men-<br />
1 TNS Infratest, 10. Faktenbericht 2007, S. 229<br />
2 Computerwoche (2008): IDC: Weltweite Datenmenge verzehnfacht sich in fünf Jahren. Online verfügbar<br />
unter http://www.computerwoche.de/index.cfm?pid=254&pk=1858302, zuletzt geprüft am 12.05.2008.<br />
1
schen konzipiert ist und von Maschinen respektive Computern weder interpre-<br />
tiert noch weiter verarbeitet werden können.<br />
Eine Lösungsmöglichkeit wäre, die Inhalte so zu belassen, wie sie heute sind<br />
und die Maschinen mittels künstlicher Intelligenz und Computerlinguistik zu<br />
verbessern. Die Wissenschaft verfolgt diesen Ansatz schon einige Zeit, aller-<br />
dings wurde bis auf einige kleine Verbesserungen kein wesentlicher Durch-<br />
bruch erreicht. 3<br />
Ein anderer Ansatz ist, die Inhalte des World Wide Web so darzustellen, dass<br />
sie leichter von Maschinen interpretiert und verarbeitet werden können. Genau<br />
diese Vision entwarf der Erfinder des Inter<strong>net</strong>s, Tim Berners-Lee, als er im März<br />
1989 versuchte, das CERN-Management vom Nutzen eines globalen Hyper-<br />
text-Systems zu überzeugen. Seine Vision verfolgte zwei Ziele: Zum einen das<br />
Inter<strong>net</strong> zu einem hoch kollaborativen Medium zu machen und zum anderen es<br />
verständlicher zu machen, um so selbst Maschinen das Interpretieren und Ver-<br />
arbeiten der Inhalte zu ermöglichen. Abbildung 1 zeigt Tim Berners-Lees ori-<br />
ginales Diagramm zu seiner Vision. MESH war damals sein Arbeitstitel, aus<br />
dem bei der praktischen Umsetzung 1990 das World Wide Web wurde. 4<br />
3 Tim Berners-Lee, James Hendler Ora Lassila: The Semantic Web: a new form of Web content that is<br />
meaningful to computers will unleash a revolution of new possibilities. In: Scientific American, H. 284<br />
(5), S. 34–43.<br />
4 Tim Berners-Lee (1989): Information Management: A Proposal. Herausgegeben von W3C-Konsortium.<br />
CERN. Online verfügbar unter http://www.w3.org/History/1989/proposal.html, zuletzt geprüft am<br />
22.04.2008.<br />
2
Abbildung 1: Tim Berners-Lee (1989): Information Management: A Proposal. Herausgegeben<br />
von W3C-Konsortium. CERN. Online verfügbar unter http://www.w3.org/History/1989/propo-<br />
sal.html, zuletzt geprüft am 22.04.2008.<br />
Abbildung 1 zeigt, dass Tim Berners-Lee ursprüngliche Vision mehr beinhaltete<br />
als das bloße Abrufen von HTML-Dokumenten von Webservern. Die Abbildung<br />
stellt auch Relationen wie etwa “includes”, “wrote” und “describes” zwischen<br />
den einzelnen Informationselementen dar. Diese Relationen – auch als Meta-<br />
daten zu bezeichnen – finden so im heutigen Inter<strong>net</strong> noch keine Anwendung,<br />
sind aber gleichzeitig der Schlüssel, damit Maschinen die im Inter<strong>net</strong> verfüg-<br />
baren Informationen interpretieren und verarbeiten können.<br />
3
1.1 Definition des semantischen Webs<br />
„The Semantic Web is not a separate Web, but an extension of the cur-<br />
rent one, in which information is given well-defined meaning, better en-<br />
abling computers and people to work in cooperation.” 5<br />
Diese Definition aus dem Artikel “The Semantic Web: a new form of Web con-<br />
tent that is meaningful to computers will unleash a revolution of new possibili-<br />
ties“ in der wissentschaftlichen Zeitschrift Scientific American, der erstmalig<br />
dem Thema semantisches Web eine breite Öffentlichkeit verschaffte, stellt zual-<br />
lererst deutlich klar, dass das semantische Web das gegenwärtige World Wide<br />
Weg nicht ersetzt, sondern eine Erweiterung dessen darstellt. Die Definition be-<br />
tont, dass Informationen mit einer genau definierten Bedeutung versehen wer-<br />
den und so Mensch und Maschine in einem höheren Maße voneinander profi-<br />
tieren können.<br />
Eine ausführlichere Definition liefert das W3C-Konsortium:<br />
„The Semantic Web provides a common framework that allows data to<br />
be shared and reused across application, enterprise, and community<br />
boundaries. It is a collaborative effort led by W3C with participation from<br />
a large number of researchers and industrial partners.“ 6<br />
Diese Definition geht intensiver auf die Interoperabilität zwischen verschiedenen<br />
Systemen und das Überschreiten von Grenzen ein und nimmt erklärenden Be-<br />
zug auf die Struktur und die gemeinsame Aufgabe des W3C-Konsortiums. Die<br />
Idee des semantischen Webs ist also nur durch gemeinsame Leistung erreich-<br />
bar.<br />
5 Tim Berners-Lee, James Hendler Ora Lassila: The Semantic Web: a new form of Web content that is<br />
meaningful to computers will unleash a revolution of new possibilities. In: Scientific American, H. 284<br />
(5), S. 34–43.<br />
6 Ivan Herman (Semantic Web Activity Lead) (2008): W3C Semantic Web Activity. Unter Mitarbeit von<br />
Tim Berners-Lee, Dan Connolly, Sandro Hawke, Ivan Herman, Eric Prud'hommeaux, and Ralph Swick.<br />
Herausgegeben von W3C-Konsortium. Online verfügbar unter http://www.w3.org/2001/sw/, zuletzt geprüft<br />
am 19.04.2008.<br />
4
1.2 Semantik und das semantische Web<br />
Die Semantik, auch Bedeutungslehre genannt, ist das Teilgebiet der Linguistik,<br />
das sich mit der Bedeutung von Sprache bzw. sprachlichen Zeichen befasst. 7<br />
Tim Berners-Lee, der Erfinder des Inter<strong>net</strong>s, gab bei einem Vortrag an der Prin-<br />
ceton Universität in den USA im Jahre 2006 selber zu, dass es vielleicht falsch<br />
war, den Namen “Semantic Web” für seine Idee zu wählen, da dieses Wort<br />
schon von vielen verschiedenen Gruppierungen mit jeweils unterschiedlichen<br />
Bedeutungen verwendet wird. Eine bessere Beschreibung seines Konzeptes<br />
wäre wohl der Begriff “Data Web” gewesen, meint Tim Berners-Lee im Nach-<br />
hinein. 8<br />
Grundsätzlich ist es nachvollziehbar, warum Sir Tim Berners-Lee diesen Na-<br />
men für seine Idee wählte. Er wollte einen einschlägigen Begriff finden, der ver-<br />
deutlicht, dass Maschinen respektive Computer die Bedeutung der ver-<br />
schiedenen Datenressourcen im World Wide Web interpretieren und ver-<br />
arbeiten können. Auch wenn das Konzept “Semantic Web” nicht wirklich viel mit<br />
der Bedeutungslehre der Linguistik gemeinsam hat, und Neulinge auf diesem<br />
Gebiet anfangs vielleicht etwas Falsches interpretieren, wird sich der Begriff<br />
“Semantic Web” langfristig etablieren und eine gleichwertige Stellung innerhalb<br />
der vielen verschiedenen Verwendungen des Wortes “Semantik” erreichen. Je<br />
mehr greifbare semantische Anwendungen zur Verfügung stehen, desto klarer<br />
wird der Allgemeinheit das Konzept hinter dem Begriff “Semantisches Web”.<br />
1.3 Web 3.0 – Bedarf des semantischen Webs im Inter<strong>net</strong><br />
Der folgende Abschnitt zeigt beispielhaft einige Bereiche auf, die von der Wei-<br />
terentwicklung und Verbreitung der semantischen Technologien profitieren wer-<br />
den.<br />
7 Sebastian Löbner (2003): Semantik: eine Einführung. 1. Aufl.: Gruyter, S. 3–4.<br />
8 Rachael King (2007): Q&A with Tim Berners-Lee. The inventor of the Web explains how the new Semantic<br />
Web could have profound effects on the growth of knowledge and innovation. Herausgegeben<br />
von Business Week. Online verfügbar unter http://www.businessweek.com/technology/content/apr2007/<br />
tc20070409_961951.htm, zuletzt geprüft am 21.04.2008.<br />
5
1.3.1 Knowledge-Management<br />
Unter dem Begriff “Knowledge-Management” wird die Beschaffung, der Zugang<br />
und die Erhaltung von Wissen innerhalb einer Organisation verstanden. Dabei<br />
wird das Ziel verfolgt, durch eine optimale Verwertung des intellektuellen Ver-<br />
mögens eines Unternehmens eine höhere Produktivität, neue Werte und eine<br />
höhere Wettbewerbsfähigkeit zu schaffen. Durch die fortschreitende Globalisie-<br />
rung und die Adaption der Möglichkeiten des Inter<strong>net</strong>s in weltweit agierenden<br />
Unternehmen sind diese mehr und mehr gezwungen, sich in virtuellen Teams<br />
zusammenzufinden und ihr Informationsmanagement stetig zu verbessern. Das<br />
erarbeitete Wissen wird zunehmend in Dokumenten im Inter<strong>net</strong> oder in In-<br />
tra<strong>net</strong>s gelagert. Einhergehend mit dieser Entwicklung werden verstärkt Doku-<br />
menten-Management-Systeme am Markt angeboten, die aber heute schon ei-<br />
nige Schwächen aufweisen.<br />
Die Technologie des semantischen Webs könnte diese Schwächen beseitigen:<br />
� Informationen suchen. Die auf Schlagworten (Keywords) basierende<br />
Suche liefert irrelevante Ergebnisse, da das Schlagwort zum Beispiel in<br />
einem anderen Kontext benutzt wird, als in dem Kontext, nach dem der<br />
User sucht. Wie bereits weiter oben angesprochen, werden mit steigen-<br />
dem Datenaufkommen im Inter<strong>net</strong> und in Intra<strong>net</strong>s auch die Ergebnisse,<br />
die eine auf Schlagworten basierende Suchmaschine auswirft, enorm<br />
zunehmen. Auch hier gilt wieder: Zu viele Ergebnisse sind letztendlich<br />
genauso unbrauchbar wie zu wenige.<br />
� Informationen extrahieren. Zurzeit ist es nicht möglich, Informationen<br />
aus verschiedenen Ressourcen zu gewinnen, ohne das der Mensch<br />
selbst das Lesen und Browsen übernimmt. Gegenwärtig gibt es noch<br />
keine automatisierten Agenten, die die textualen Informationen im Inter-<br />
<strong>net</strong> verstehen und weiter verarbeiten oder gar Informationen aus ver-<br />
schiedenen Ressourcenquellen zu einer sinnvollen Information aggre-<br />
gieren können.<br />
6
� Informationen verwalten. Die Instandhaltung und Pflege von textbasier-<br />
ten Informationsquellen ist eine zeitintensive und aufwendige Angelegen-<br />
heit – umso mehr, je größer die Quelle wird. Diese Sammlung an Daten<br />
konsistent, korrekt und aktuell zu halten, macht eine semantische und<br />
einheitliche Beschreibung der Inhalte dieser Dokumente notwendig. Eine<br />
solche Darstellung der Daten existiert momentan nicht.<br />
Die semantische Technologie wird eine strukturierte und bedeutungsmäßige<br />
Definition von Dokumenten ermöglichen, wodurch eine Vielzahl an neuen<br />
Chancen entsteht: eine intelligente Suche statt die auf Schlagworten basieren-<br />
de, Beantwortung von Fragen statt das bloße Wiederherstellen und Darstellen<br />
von Informationen sowie der Austausch und die Wiederverwertung von Doku-<br />
menten zwischen verschiedenen Profit-Centern. 9<br />
1.3.2 Business-to-Consumer (B2C) Electronic Commerce<br />
Im Bereich des Business-to-Consumer Electronic Commerce werden Produkte<br />
oder Dienstleistungen an den Inter<strong>net</strong>-User verkauft. In einem typischen Szena-<br />
rio besucht ein User mehrere Online-Shops, stöbert in deren Angeboten, wählt<br />
einige aus und bestellt sie. Im optimalen Fall sammelt der Nutzer für ihn rele-<br />
vante Informationen über Preise und Konditionen aller Angebote in verschiede-<br />
nen Online-Shops, vergleicht diese und bestellt das für ihn beste Produkt. Auch<br />
hier wird wieder deutlich, dass mit steigendem Produktangebot im Inter<strong>net</strong> die<br />
manuelle Auswahl zwischen den Produkten und Online-Shops eine sehr zeitin-<br />
tensive und aufwendige Angelegenheit ist. Selbst wenn ein hoher Anspruch be-<br />
steht, viele Angebote in die Entscheidung mit einzubeziehen, wird der Konsu-<br />
ment zurzeit letztendlich nur einen geringen Anteil aller im Inter<strong>net</strong> verfügbaren<br />
Produkte vergleichen. Um diese Arbeit zu erleichtern, sind mittlerweile so ge-<br />
nannte Shopping-Bots im Inter<strong>net</strong> verfügbar, die verschiedene Online-Shops<br />
besuchen und dort die unterschiedlichen Produkt- und Preisinformationen extra-<br />
hieren und zu einer Markübersicht zusammenstellen. Die Funktionalität dieser<br />
Shopping-Bots wird gewährleistet durch so genannte “wrappers“ (Hülle oder<br />
Umschlag), Programme also, die Informationen aus einem Online-Shop entneh-<br />
9 Dieter Fensel (2003): Spinning the semantic Web: bringing the World Wide Web to its full potential.<br />
Unter Mitarbeit von Henry Lieberman, Wolfgang Wahlster , James Hendler.<br />
7
men. Hierzu muss allerdings jeweils ein “wrapper“ pro Online-Shop entwickelt<br />
werden. Es liegt auf der Hand, dass mit diesem Ansatz langfristig einige Proble-<br />
me verbunden sind, beispielsweise, dass diese Vorgehensweise die Skalierung<br />
des E-Commerce zur Zeit noch stark hemmt. Die Informationen, die diese Bots<br />
aus den Shops herausfiltern, basieren zum wiederholten Male auf Schlagwor-<br />
ten und einer Analyse des Textes. Dabei funktionieren die Bots aufgrund be-<br />
stimmter Annahmen: Zur Ermittlung des Preises wird nach dem Wort Preis, ge-<br />
folgt von einem €-Zeichen und einem positiven Wert, gesucht. Dieses Vorgehen<br />
ist fehleranfällig und aufgrund dieser Schwierigkeiten extrahieren die Bots oft-<br />
mals nur die nötigsten Informationen. Entscheidungskritische Informationen für<br />
den Käufer, wie etwa Versandgebühren, Liefergebiet und -zeiten sowie Rückga-<br />
berecht, werden normalerweise von den Shopping-Bots nicht mit entnommen.<br />
Die semantische Technologie ermöglicht die Entwicklung von Software Agents<br />
respektive Shopping Agents, die die Produktinformationen und Allgemeinen<br />
Geschäftsbedingungen interpretieren und verarbeiten können. Daraus<br />
entstehen eine Reihe von Vorteilen:<br />
� Produktinformationen und -preise werden korrekt extrahiert und Zustel-<br />
lungskonditionen und die Allgemeinen Geschäftsbedingungen werden<br />
hinsichtlich der Anforderungen des Users interpretiert werden können.<br />
� Zusätzliche Informationen über die Reputation des Online-Händlers<br />
können aus anderen Quellen hinzugezogen werden, beispielsweise von<br />
unabhängigen Ratingagenturen oder aus Bewertungsplattformen von<br />
Konsumenten.<br />
� Die aufwendige Einzel-Programmierung von sogenannten “wrappers“<br />
entfällt gänzlich.<br />
� Intelligente Shopping Agents werden automatisch Verhandlungen für den<br />
Käufer mit dem Shopping Agent des Verkäufers führen können. 10<br />
10 Frank Hermelen, Grigoris Antoniou (2004): A Semantic Web Primer. Herausgegeben von The MIT<br />
Press.<br />
8
1.3.3 Business-to-Business (B2B) Electronic Commerce<br />
Die meisten Benutzer des Inter<strong>net</strong>s verbinden mit elektronischem Handel<br />
hauptsächlich das Geschäft mit Privatkunden (B2C). Allerdings liegt das wahre<br />
wirtschaftliche Potenzial, das die Veränderung durch digitale Technologien mit<br />
sich bringt, im Bereich des Business-to-Business Electronic Commerce (B2B).<br />
Nun ist der elektronische Handel keine neue Erscheinung, vielmehr existieren<br />
bereits seit den 1960er Jahren Initiativen, die den elektronischen Datenaus-<br />
tausch (electronic data exchange) zwischen verschiedenen EDV-Systemen der<br />
Unternehmen forcieren. 11 Damit Informationen zwischen den Unternehmen aus-<br />
getauscht werden können, müssen sich Sender und Empfänger auf einen ge-<br />
meinsamen Standard einigen – ein Protokoll, welches den Inhalt überträgt und<br />
eine gemeinsame Sprache, die den Inhalt beschreibt. Eine Reihe von verschie-<br />
denen Standards sind seit dem entwickelt worden – ein Beispiel für einen sol-<br />
chen branchenübergreifenden EDI-Standard ist der United Nations Electronic<br />
Data Interchange For Administration, Commerce and Transport (UN/EDIFACT).<br />
Generell blieb der tatsächliche Nutzen solcher automatisierter Geschäftsvor-<br />
gänge weit hinter den Erwartungen zurück, und im Speziellen sind mit dem EDI-<br />
Standard folgende Nachteile verbunden:<br />
� Der elektronische Datenaustausch zwischen den Teilnehmern setzt im-<br />
mer eine hohes Maß an Kompatibilität von Hardware, Software und<br />
Übertragungsprozeduren auf beiden Seiten voraus.<br />
� Mit der Einführung von EDI werden meist Änderungen bei internen Un-<br />
ternehmensabläufen notwendig, wodurch in der Regel hohe zusätzliche<br />
Investitionskosten entstehen.<br />
� Genauso wie einmalige Investitionskosten entstehen, sind die laufenden<br />
Kosten für den Betrieb des EDI-Systems nicht unerheblich. 12<br />
11 Dieter Fensel (2003): Spinning the semantic Web: bringing the World Wide Web to its full potential.<br />
Unter Mitarbeit von Henry Lieberman Wolfgang Wahlster James Hendler.<br />
12 Mark-Oliver Würtz (2007): Möglichkeiten und Methoden des'computer supported Cooperative<br />
Work'(CSCW). Herausgegeben von GRIN Verlag.<br />
9
Und trotzdem hat Nutzung der Infrastruktur des Inter<strong>net</strong>s in den vergangenen<br />
Jahren den Austausch von geschäftlichen Daten enorm verbessert. Anzuführen<br />
wäre das Beispiel WebEDI. WebEDI ist ein Verfahren zur Anbindung von<br />
Geschäftspartnern an das EDI-System ohne EDI-Infrastruktur unter Nutzung<br />
des Inter<strong>net</strong>s. 13 Dennoch wird der geschäftliche Datenaustausch nach wie vor<br />
dadurch behindert, dass die momentan noch weit verbreitete Hypertext Markup<br />
Language (HTML), eine auf Text basierende Auszeichnungssprache zur Struk-<br />
turierung von Webinhalten, keine Möglichkeit bietet, die Syntax und Bedeutung<br />
von Daten wiederzugeben. Die Extensible Markup Language (XML) löst in An-<br />
sätzen diese Problematik, denn sie verfügt über eine standardisierte und<br />
vorgegebene Syntax, die die Struktur und den Bedeutungsinhalt von Daten ein-<br />
heitlich definiert. Dennoch unterstützt XML zurzeit keine standardisierten Daten-<br />
strukturen und Terminologien, um Geschäftsvorgänge oder angebotene Pro-<br />
dukte zu beschreiben. Hierfür werden die semantische Technologie und die<br />
Möglichkeiten von XML eine bedeutende Rolle spielen. So wird sie flexible Un-<br />
ternehmenskooperationen ohne hohe Verwaltungskosten ermöglichen, sowie<br />
den automatischen Austausch von Daten enorm beschleunigen und optimieren,<br />
wodurch neue Geschäftsmodelle entstehen können. Außerdem werden durch<br />
die Software Agents automatische Auktionen, Verhandlungen und Vertragsab-<br />
schlüsse ermöglicht werden.<br />
1.4 Web 3.0 – Bedarf an semantischen Web im Unternehmen<br />
Dieser Abschnitt behandelt die Möglichkeiten, die sich durch die Implementie-<br />
rung und Anwendung der semantischen Technologien innerhalb des Un-<br />
ternehmens ergeben. Die Entwicklung von der Industriegesellschaft zur Infor-<br />
mationsgesellschaft, verbunden mit der stetig wachsenden Menge an<br />
produzierten Informationen durch den Menschen, lässt das Management von<br />
Wissen in Unternehmen und vor allem großen Organisationen immer wichtiger<br />
werden. Am Ende des Tages wird die Organisation den größten Wettbewerbs-<br />
vorteil erreichen, die die besten Informationen hat, weiß, wo sie diese findet,<br />
und sie am schnellstens für sich nutzbar machen kann. Nun hat bereits die Ein-<br />
13 Arne Dicks: Was ist WebEDI? GS1 Germany GmbH. Online verfügbar unter http://www.gs1-germany.de/inter<strong>net</strong>/content/produkte/ean/ecommerce_edi/webedi/index_ger.html,<br />
zuletzt geprüft am<br />
13.04.2008.<br />
10
führung des Inter<strong>net</strong>s beim herkömmlichen “Knowledge-Management” für einige<br />
Herausforderungen gesorgt: Informationsüberlastung, die Ineffizienz der auf<br />
Schlagworten basierenden Suche sowie das Fehlen von Computersystemen,<br />
die natürliche Spache deuten und verarbeiten können. 14 Die semantischen<br />
Technologien können dieses Informations-Chaos strukturieren. Dafür müssen<br />
wir jedoch beginnen, die Vorteile des semantischen Webs für uns zu nutzen,<br />
beispielsweise die Informationen, die wir produzieren, mit Markierungen (Tags)<br />
zu versehen, die von Maschinen respektive Computern gedeutet und ver-<br />
arbeitet werden können.<br />
Abbildung 2 zeigt beispielhaft, in welchen Bereichen sich eine Organisation die<br />
Abbildung 2: Use of the Semantic Web in your enterprise; Michael C. Daconta, Leo J. Obrst,<br />
Kevin T. Smith: The Semantic Web S.19<br />
semantische Technologie zu Nutzen machen kann. Nur wenn man die<br />
benötigten und produzierten Informationen aus allen Bereichen ver<strong>net</strong>zen und<br />
nach ihrem Bedeutungsgehalt markieren kann, wird aus rohen Informationen<br />
anwendbares Wissen für die Mitarbeiter eines Unternehmens. Das Unterneh-<br />
men, welches all diese losgelösten Informationelemente aus den verschiedenen<br />
Bereichen und Abteilungen zusammenzufügen, zu organisieren und<br />
wiederzufinden vermag, wird diese auch langfristig kapitalisieren können. Die<br />
14 Fensel, Bussler, Ding, Kartseva, Klein, Korotkiy, Omelayenko, Siebes (27. - 28.06.2007):<br />
Semantic Web Applications Areas. 7th International Workshop on Applications of Natural Language to<br />
Information Systems. Veranstaltung vom 27. - 28.06.2007. Sweden, Stockholm.<br />
11
nachfolgenden Ausführungen zeigen den konkreten Nutzen der semantischen<br />
Technologie beispielhaft in einigen unternehmerischen Bereichen.<br />
1.4.1 Entscheidungsunterstützung<br />
Innerhalb des Unternehmens über erfolgskritisches Wissen anstatt über rohe<br />
Daten zu verfügen, führt zu schnelleren und fundierteren Entscheidungen. Nun<br />
sind die meisten großen Unternehmen organisiert in Tochterunternehmen, re-<br />
gionalen Divisionen, Gruppen- und Projektteams, die unterschiedliche Quellen<br />
zur Informationsbeschaffung nutzen und verschiedene Problemlösungen in<br />
Form von Informationen erarbeiten. Teilweise werden bereits innerhalb der-<br />
selben Organisation diese erarbeiteten Lösungen meist in proprietären Daten-<br />
banken und Servern abgelegt, was die Interoperabilität und den Austausch von<br />
Informationen zwischen den verschiedenen Organisationseinheiten enorm<br />
hemmt. Diese Problematik wird sich erst lösen, wenn die unterschiedlichen In-<br />
formationselemente verschiedener Abteilungen und Unternehmensbereiche<br />
sinnvoll kombiniert und die Verbindungen zwischen diesen Elementen eindeutig<br />
beschrieben und genutzt werden können.<br />
Diese Arbeit wird in Zukunft von sogenannten semantischen “decision support<br />
systems” (DSS) geleistet werden. Die Systeme zur Entscheidungsunterstützung<br />
analysieren die unterschiedlichen Software Agents und unterstützen die Interak-<br />
tion zwischen dem Nutzer und seinem Computersystem, um so bessere<br />
Entscheidungen zu treffen. 15 Selbst ohne die “decision support systems” wer-<br />
den die Software Agents die eigene Wissensdatenbank überwachen können<br />
und bei Bedarf den Eigner durch einen Alert (Alarmhinweis) über Wichtiges in-<br />
formieren. Um bessere Entscheidungen zu treffen, braucht man besseres Wis-<br />
sen. Die semantische Technologie wird dies ermöglichen.<br />
1.4.2 Business Development<br />
Die erfolgreiche Geschäftsentwicklung, also hauptsächlich die Anbahnung<br />
zukünftiger Geschäfte und Folgegeschäfte, hängt in hohem Maße von den ge-<br />
15 M. Casey and M. Austin (November 2001): Semantic Web Methodologies for Spatial Decision Support.<br />
Herausgegeben von University of Maryland. Institute for Systems Research and Department of Civil and<br />
Environmental Engeneering, November 2001.<br />
12
wonnenen Informationen über Wettbewerber, Kunden, Beschaffungs- und Ab-<br />
satzmärkte sowie Produkte ab. Nun ist es in der Praxis kaum möglich, neben<br />
einem kleinen Vertriebsteam die Mitarbeiter aller weiteren Unternehmens-<br />
bereiche profilaktisch mit zu einer Kundenpräsentation zu schicken, für den Fall,<br />
dass ein Kunde Informationen wünscht, die so nicht explizit vorbereitet worden<br />
sind. Ist es dem Vertriebsteam allerdings möglich, von außerhalb auf die se-<br />
mantische Unternehmenswissensdatenbank (Corporate Knowledge-Base)<br />
zuzugreifen, so können alle erfolgskritischen Informationen in kürzester Zeit<br />
abgerufen und dem Kunden zur Verfügung gestellt werden. Das Vertriebsteam<br />
könnte so über die entscheidenden Informationen aus vertriebsfremden<br />
Bereichen verfügen und dem Kunden gegenüber nutzbar machen.<br />
Ein weiterer Anwendungsbereich des semantischen Webs im Unternehmen ist<br />
die Abgabe wettbewerbsfähiger Angebote. Letztendlich hat das Unternehmen<br />
mit den besten Informationen über den potentiellen Kunden, die gestellte<br />
Aufgabe und die geforderten Fähigkeiten und Leistungen die größte Chance,<br />
den Zuschlag zu erhalten. Verfügt man nun als Unternehmen über eine se-<br />
mantische Wissensdatenbank, in der Statusreporte, Angebote, Konkurrenzbeo-<br />
bachtungen und Erfahrungsberichte aus der Vergangenheit nach ihrem Bedeu-<br />
tungsgehalt und mit ihren Relationen abgelegt werden, so könnte dies<br />
schlussendlich bei der Angebotsabgabe für den nötigen Unterschied und somit<br />
Zuschlag sorgen. Voraussetzung dafür ist die Implementierung der se-<br />
mantischen Technologie innerhalb der Unternehmen und die semantische<br />
Pflege der Daten. Sind diese Erfordernisse erfüllt, könnten die un-<br />
ternehmerischen Software Agents diese gesammelten Informationen analysier-<br />
en und sogar gegebenenfalls zu bisher nicht erkannten, erfolgskritischen In-<br />
formationspaketen kombinieren.<br />
In Anlehnung an den Vortrag von Trastour, Bartolini, Gonzales-Castillo mit dem<br />
Titel “A Semantic Web Approach to Service Description of Matchmaking of Ser-<br />
vice” auf dem International Semantic Web Working Symposium (SWWS) an der<br />
Standford University in Kalifornien im Jahre 2001 wird die semantische Techno-<br />
logie das automatische “Matchmaking” im elektronischen Handel ermöglichen.<br />
Unter “Matchmaking” wird hier die automatische Vermittlung von Geschäften<br />
13
zwischen potentiellen Geschäftspartner und Kunden verstanden. Diese auto-<br />
matische Vermittlung könnte im Bereich der Werbung so weit gehen, dass das<br />
Werbeinventar digitaler Werbemittel semantisch markiert und kategorisiert wird<br />
und von den Software Agents der Werbetreibenden automatisch nach den<br />
festgelegten Kriterien gebucht werden könnte.<br />
1.4.3 Automatisierte Verwaltung<br />
Die beiden vorangegangenen Unterabschnitte haben hauptsächlich die Vorteile<br />
der semantischen Technologien in Bezug auf ein semantisches “Knowledge-<br />
Mangement” behandelt. Ein Zusatznutzen, den eine semantische Wissens-<br />
datenbank liefert, ist die Möglichkeit der Ankopplung unternehmerischer Soft-<br />
ware zur Erledigung wiederkehrender Verwaltungsaufgaben. Die Koordination<br />
von Reisebuchungen im Unternehmen ist ein Beispiel für eine solche wieder-<br />
kehrende Verwaltungsaufgabe. Der Planende ist konfrontiert mit divergierenden<br />
persönlichen Vorlieben hinsichtlich der Transportart (Auto, Zug, Bus, Flugzeug),<br />
der Hotelauswahl und der Fluglinie sowie mit Variablen wie etwa der Entfernung<br />
zum gemeinsamen Besprechungsort und Bevorzugungen je nach Hierarchie.<br />
Sind diese Variablen darüber hinaus mit Vorgaben des Unternehmens<br />
verknüpft, also beispielweise bei Entfernungen unter 300 Kilometern sollte das<br />
Automobil genutzt werden oder Personal der ersten Managementebene reist 1.<br />
Klasse und alles abwärts 2. Klasse, so kann die Reisebuchung zu einer sehr<br />
komplexen Aufgabe innerhalb des Unternehmens werden. Auch hier kann in<br />
Zukunft die semantische Technologie diese zeit- und kostenaufwendige<br />
Aufgabe automatisch vollbringen. Sind die persönlichen Präferenzen der ges-<br />
amten Belegschaft und die unternehmerischen Vorgaben in der semantischen<br />
Wissensdatenbank hinterlegt, könnte diese Verwaltungsaufgabe in Zukunft<br />
automatisch von der eigenen unternehmerischen Reise-Applikation übernom-<br />
men werden. Die Applikation würde dann zur Konfliktlösung auf das in der se-<br />
mantischen “Knowledge-Base” festgelegte, maschinenlesbare Regelwerk<br />
zurückgreifen. Durch den Zugang zu im Inter<strong>net</strong> verfügbaren, semantisch gek-<br />
ennzeich<strong>net</strong>en Reise- und Hotelbuchungsanbietern wird die Reise-Applikation<br />
in der Lage sein zu vergleichen, gegenüberzustellen, die verschiedenen Altern-<br />
14
ativen zu bewerten und dem Planenden eine übersichtliche Liste mit allen rele-<br />
vanten Informationen auszuwerfen. 16<br />
Und dies ist nur ein Beispiel von täglich wiederkehrenden Verwaltungsaufgaben<br />
im Unternehmen, die durch die Implementierung der semantischen Technologi-<br />
en stark vereinfacht werden könnten.<br />
1.5 Möglichkeiten des semantischen Webs im privaten Bereich<br />
Analog zu den Software Agents im Unternehmen wird die semantische Techno-<br />
logie sogenannte Personal Agents ermöglichen, die ihre Benutzer bei wieder-<br />
kehrenden, alltäglichen Aufgaben unterstützen. So könnten Personal Agents<br />
beispielsweise den persönlichen Kalender verwalten, Aktivitäten mit Familie,<br />
Freunden und Bekannten koordinieren und einfache Anfragen von außerhalb<br />
für ihren Besitzer beantworten. 17 Der Nutzen, der durch Personal Agents er-<br />
reicht wird, erhöht sich selbstredend mit der allgemeinen Verbreitung der<br />
Agents – das semantische Web profitiert vom Netzwerkeffekt. Eine Umgebung,<br />
in der mehrere Personal Agents miteinander interagieren, wird auch Multi-Agent<br />
System genannt. Die nachfolgenden Ausführungen beleuchten die Möglich-<br />
keiten, die sich durch die semantischen Technologien im privaten Bereich<br />
ergeben.<br />
1.5.1 Personal Agents<br />
Die Motivation der Idee der Personal Agents ist auf die stetig wachsende<br />
Menge an Informationen und die damit verbundene Informationsüberflutung<br />
zurückzuführen. Der alternative Ansatz, eine zentrale Suchmaschine, die den<br />
genauen Informationsbedarf der Nutzer kennt und speichert, wird für die End-<br />
nutzer langfristig keine zufriedenstellende Lösung aufgrund der offengelegten<br />
Privatssphäre, darstellen. Semantische Personal Agents, die nur ihrem Eigner<br />
Rechenschaft schuldig sind, stellen hinsichtlich des Auffindens und der Verwer-<br />
16 Michael C. Daconta (2003): The Semantic Web. A Guide to the Future of XML, Web Services, and<br />
Knowlege Management. Unter Mitarbeit von Kevin T. Smith Leo. J. Obrst. Herausgegeben von WILEY,<br />
S. 17–18.<br />
17 Department of Computer Science and Electrical Engineering (Hg.) (November, 2002): Personal Agents<br />
on the Semantic Web. Unter Mitarbeit von Anugeetha Kunjithapatham Mithun Sheshagiri Tim Finin Anupam<br />
Joshi Yun Peng and R. Scott Cost Subhash Kumar. University of Maryland Baltimore County.<br />
15
tung von Informationen auf lange Sicht die bessere Lösung dar. Personal<br />
Agents werden allerdings nicht nur für das persönliche Knowledge-Manage-<br />
ment nützlich sein. Sie werden mit anderen Agents kommunizieren können,<br />
also bestimmte Anfragen starten und empfangen, und dies jeweils immer unter<br />
Berücksichtung der persönlichen Vorlieben und Einstellung ihrer Besitzer. Ver-<br />
handlungen und Auktion werden analog zu unternehmerischen Agents von<br />
Personal Agents auf privater Basis durchgeführt werden.<br />
Woolwridge definiert Software Agents folgendermaßen:<br />
� Agenten. Ein Agent ist ein computerbasiertes System, das in einer<br />
Umgebung autonom handeln kann.<br />
� Intelligente Agenten. Ein intelligenter Agent ist ein computerbasiertes<br />
System, das in einer Umgebung flexibel und autonom handeln kann.<br />
� Flexibles autonomes Handeln. Flexibles autonomes Handeln ist<br />
charakterisiert durch Reaktivität, Proaktivität und soziales Verständnis.<br />
� Reaktivität. Ein reaktives System steht permanent in einem Regelkreis-<br />
lauf mit den umgebenden Systemen und reagiert auf Veränderungen in<br />
der Umgebung in angemessener Zeit, wobei angemessen in diesem<br />
Zusammenhang in Bezug zum Nutzen der Reaktion steht.<br />
� Proaktivität. Ein Software Agent erfüllt Aufgaben und muss dazu ziel-<br />
gerichtet handeln. Das bedeutet auch, dass der Agent Handlungsmög-<br />
lichkeiten erkennen und nutzen muss.<br />
� Soziales Verständnis. Sozialkompetenz ist bei Agenten die Fähigkeit,<br />
mit anderen Agenten und möglicherweise auch mit Menschen zu kom-<br />
munizieren und zu kooperieren. 18<br />
18 Michael Wooldridge (2002): An Introduction to Multi-agent Systems. 1. Aufl.: Wiley & Sons.<br />
16
Anhand dieser Charakteristika lässt sich leicht ausmalen, welche vielfältigen<br />
Möglichkeiten Personal Agents in Zukunft bieten. Das folgende Szenario ist ein<br />
konkretes Beispiel:<br />
Der Personal Agent wird beauftragt, ein geig<strong>net</strong>es Auto zum Kauf ausfindig zu<br />
machen. Er kennt die Vorlieben des Besitzers und trifft eine Vorauswahl der in-<br />
frage kommenden Modelle. Der Agent kontaktiert die Agents verschiedener An-<br />
bieter und wählt schließlich eine kleine Auswahl der in der Nähe befindlichen<br />
Anbieter aus. Die Agents tauschen Preise, Produkt-Details und Lieferbedingun-<br />
gen aus und führen gegebenenfalls automatisch die Verhandlungen durch.<br />
Dabei wird der Personal Agent die Reputation der Anbieter anhand unab-<br />
hängiger Quellen mit berücksichtigen. Wird tatsächlich ein geeig<strong>net</strong>es Angebot<br />
gefunden, greift der Agent auf den persönlichen Terminkalender zurück, um<br />
freie Termine zu finden und einen Zeitpunkt zur Probefahrt mit dem Agent des<br />
Anbieters zu vereinbaren. Schließlich informiert der Personal Agent ein mobiles<br />
Endgerät, welches der Besitzer bei sich trägt.<br />
Dieses konkrete Beispiel lässt sich auf alle erdenklichen privaten Bereiche<br />
übertragen. Die Personal Agents der Zukunft sind eng verzahnt mit den gegen-<br />
wärtig aktuellen Themen “Webservices” und “Serviceorientierte Architekturen”.<br />
“Webservices are software applications that can be discovered, de-<br />
scribed, and accesed based on XML and standard Web protocols over<br />
intra<strong>net</strong>s, extra<strong>net</strong>s and the Inter<strong>net</strong>”. 19<br />
Webservices könnten also als die Vorfahren von Personal Agents angesehen<br />
werden, außer dass ihnen der Aspekt der semantischen Beschreibung fehlt, so<br />
dass ihre spezielle Funktion von anderen Agenten nicht lokalisiert, identifiziert<br />
und somit genutzt werden kann.<br />
19 Michael C. Daconta (2003): The Semantic Web. A Guide to the Future of XML, Web Services, and<br />
Knowlege Management. Unter Mitarbeit von Kevin T. Smith Leo. J. Obrst. Herausgegeben von WILEY,<br />
S. 58.<br />
17
“Eine Serviceorientierte Architektur ist ein Framework für die Integration<br />
von Geschäftsprozessen und unterstützender IT-Infrastruktur in Form<br />
von sicheren, standardisierten Komponenten - Services -, die sich<br />
wiederverwenden und kombinieren lassen, um wechselnde Geschäftsan-<br />
forderungen abzubilden.” 20<br />
Services sind in diesem Zusammenhang als Softwarekomponenten zu ver-<br />
stehen, die so einfach konstruiert sind, dass sie sich mit anderen Softwarekom-<br />
ponenten mühelos verbinden lassen und so einmal programmierte Services<br />
langfristig ihren Wert erhalten, da ihre Leistung einzeln immer abrufbar und ver-<br />
fügbar ist und stets mit neuen Services kombiniert werden kann. Das Beispiel<br />
eines Online-Brokerage-Anbieters zum Abschluss von Wertpapiergeschäften<br />
würde insgesamt die nachfolgenden einzelnen Softwarekomponenten enthal-<br />
ten, die aber auch stets einzeln abrufbar sind.<br />
� Wertpapierdienst, der handelbare Wertpapiere nennt.<br />
� Marktdatendienst, der zu einem Wertpapier aktuelle Börsenkurse liefert.<br />
� Depotdienst, der Zugriff auf das Wertpapierdepot des Anwenders er-<br />
laubt.<br />
� Orderdienst, der Kauf-/Verkaufsaufträge des Anwenders an eine Börse<br />
übermittelt.<br />
� Archivdienst, der alle Daten der Transaktion revisionssicher archiviert.<br />
Ähnlich zum Konzept der Serviceorientierten Architekturen werden auch Per-<br />
sonal Agents im semantischen Web einzelne, losgelöste Services oder Informa-<br />
tionsbruchstücke zu Wertschöpfungketten zusammenfügen können. Dazu wer-<br />
den die einzelnen Komponenten von Agent zu Agent gereicht, wobei jeder<br />
Agent auf seine bestimmte Weise einen Nutzen bzw. eine Information hin-<br />
zufügt, wodurch schließlich das finale Produkt, das vom Endnutzer angefragt<br />
20 Norbert Bieberstein, Sanjay K. Bose, Marc Fiammante, Keith Jones, Rawn Shah (2005):<br />
Service-Oriented Architecture Compass. Business Value, Planning, and Enterprise Roadmap:<br />
Prentice Hall International.<br />
18
worden ist, konstruiert wird. 21 Außerdem steht das Thema Serviceorientierte Ar-<br />
chitekturen insofern in Beziehung zum semantischen Web, als dass es auf<br />
Seiten der Unternehmen das Bewusstsein zur Entwicklung von losgelösten Ser-<br />
vices schafft, die so in Zukunft eventuell von Software Agents verwendet wer-<br />
den könnten. Weiterhin hat die Forschung rund um das Thema Serviceori-<br />
entierte Architekturen erkannt, dass sie einige semantischen Technologien nicht<br />
umgehen kann bzw. die Serviceorientierte Architekturen von den Technologien<br />
des semantischen Webs profitieren werden.<br />
1.5.2 Veränderungen in der physikalischen Welt<br />
In der weiteren Entwicklung wird das semantische Web aus der virtuellen Welt<br />
ausbrechen und sich auf unsere physikalische Welt erweitern. Mittels Uniform<br />
Resource Identifiers (URI), auf die später noch eingegangen wird, kann auf<br />
alles eindeutig verwiesen und dadurch unmissverständlich identifiziert werden,<br />
also auch physikalische Endgeräte wie Mobiltelefone, Televisionsgeräte, Kühls-<br />
chränke, hausinterne Sicherheitssysteme, Radiogeräte und viele mehr. Diese<br />
Geräte können zukünftig ihre Funktionen bewerben, also nach außen darstel-<br />
len, was sie können und wie sie bedient werden. Sie werden untereinander<br />
kommunizieren und auch automatische Schlussfolgerungen vollziehen können.<br />
Die flexible, semantische Ansteuerung von Geräten wird den heute verfügbaren<br />
Methoden, etwa “Universal Plug and Play”, weit überlegen sein und eine Fülle<br />
von Möglichkeiten eröffnen.<br />
Die heutige Hausautomatisierung, also die Informations- und Kommunikations-<br />
technologie für mehr Komfort im und in der Umgebung des eigenen Hauses, er-<br />
fordert eine penibelst genaue Abstimmung aller teilnehmenden Geräte, damit<br />
ein solches System überhaupt funktionieren kann. Die semantische Be-<br />
schreibung der Möglichkeiten und Funktionen der häuslichen Endgeräte ermög-<br />
licht einen höheren Grad der Automatisierung mit minimalem menschlichem<br />
Eingreifen. So könnten sich zum Beispiel alle Endgeräte im Haus, die<br />
akustische Signale von sich geben (Televisionsgeräte, Radiogeräte, Stereoan-<br />
lage), bei einem eingehenden Anruf automatisch den Ton leise stellen. Gegen-<br />
21 Tim Berners-Lee, James Hendler Ora Lassila (2001): The Semantic Web: a new form of Web content<br />
that is meaningful to computers will unleash a revolution of new possibilities. In: Scientific American, H.<br />
284 (5), S. 34–43.<br />
19
wärtig müsste man für eine solche Funktion jedes einzelne Gerät und deren<br />
Schnittstellen programmieren. Im semantischen Web würde man eine solche<br />
Funktion nur einmal für alle lokalen Endgeräte programmieren, die eine Funk-<br />
tion “Lautstärkeregelung” bewerben – das Televisionsgerät, das DVD-Abspiel-<br />
gerät und selbst der Laptop, den man nur für einen Abend von der Arbeit mitge-<br />
bracht hat. Wahrscheinlich wird es sogar soweit gehen, dass lokale Endgeräte<br />
andere Endgeräte und Services automatisch auffinden und beauftragen<br />
können, um zusätzliche Informationen oder Funktionalitäten zu erhalten. So<br />
könnte die mit dem World Wide Web verbundene Mikrowelle die Website des<br />
Tiefkühlwarenherstellers kontaktieren, um die optimalen Zubereitungsangaben<br />
und -zeiten zu erhalten. 22<br />
1.6 Abgrenzung zur künstlichen Intelligenz<br />
Damit der gewünschte Automatisierungsgrad von Software Agents und Web-<br />
services im semantischen Web erreicht werden kann, müssen Computer auf<br />
strukturierte Sammlungen von Informationen und auf eine Reihe von<br />
Ableitungsregeln, die sie benutzen können, um automatische Schlussfolger-<br />
ungen durchzuführen, zurückgreifen können. Die Forschung der künstlichen In-<br />
telligenz beschäftigte sich mit solchen Systemen schon lange vor der<br />
Entstehung des Inter<strong>net</strong>s. Und tatsächlich bauen viele der Technologien, die<br />
zur Realisierung des semantischen Webs benötigt werden, auf die Erkenntnisse<br />
aus der Forschung der künstlichen Intelligenz auf. Das Konzept des se-<br />
mantischen Webs hat nichts mit der künstlichen Intelligenz zu tun. The-<br />
menschwerpunkte der Forschung der künstlichen Intelligenz sind beispiels-<br />
weise komplexe Entscheidungsprozeduren, räumliches Denken, selbständiges<br />
Schlussfolgern aus unvollständigen Informationen (Abduktion), assoziatives<br />
Schlussfolgern sowie Bild- und Mustererkennung – all dies hat nichts mit dem<br />
semantischen Web zu tun. Nachfolgend werden weitere grundlegende Unter-<br />
schiede in der Konzepten dieser beiden Forschungsgebiete beschrieben. Die<br />
traditionellen Systeme der Wissensrepräsentation sind zentral ausgerichtet, im<br />
Gegensatz zum dezentralen Inter<strong>net</strong> und semantischen Web. Durch diese Zen-<br />
22 Tim Berners-Lee, James Hendler Ora Lassila (2001): The Semantic Web: a new form of Web content<br />
that is meaningful to computers will unleash a revolution of new possibilities. In: Scientific American, H.<br />
284 (5), S. 34–43.<br />
20
tralität sind alle Teilnehmer gezwungen, exakt dieselben Definitionen von<br />
Konzepten zu verwenden. Darüber hinaus sind die Abfragemöglichkeiten der<br />
traditionellen Wissensrepräsentationsysteme stark begrenzt, damit das System<br />
verlässliche Ergebnisse liefert bzw. überhaupt antworten und funktionieren<br />
kann. Aus diesem Grund haben diese Systeme immer jeweils eigene<br />
Ableitungsregeln, die nicht ohne weiteres von einem System ins andere trans-<br />
feriert werden können. 23<br />
Zusammengefasst lässt sich festhalten, dass das semantische Web auf vielen<br />
Erkenntnissen der Forschung der künstlichen Intelligenz aufbaut und das die<br />
Forschung im Bereich des semantischen Webs von weiteren Erkenntnissen der<br />
künstlichen Intelligenz profitieren wird. Wenn aber in diesen Ausführungen von<br />
Software Agents gesprochen wird, hat es nicht im Entferntesten etwas mit der<br />
künstlichen Intelligenz von Robotermenschen wie C-3PO aus dem Film Star<br />
Wars zu tun. Weiterhin besteht auch nicht die Notwendigkeit, auf einen Durch-<br />
bruch in der Forschung der künstlichen Intelligenz zu warten, bis das Konzept<br />
des semantischen Webs umgesetzt werden kann.<br />
1.7 Vorgehensweise<br />
Die vorliegende Arbeit untersucht die Chancen und Auswirkungen des se-<br />
mantischen Webs. In der Einleitung werden die relevanten Begriffe erklärt, der<br />
Untersuchungsraum eingegrenzt und die Bereiche mit Bedarf an semantischen<br />
Technologien sowie zukünftige Möglichkeiten beleuchtet.<br />
Im Hauptteil werden das W3C-Konsortium, seine Rolle und Aufgaben sowie die<br />
aufgestellten Grundprinzipien des semantischen Webs vorgestellt und erläutert.<br />
Im weiteren Verlauf werden die Technologien des semantischen Webs vorge-<br />
stellt, wobei es nicht Ziel dieses Abschnittes ist, Programmiersprachen und der-<br />
en Funktionsweise zu erklären, sondern die Konzepte und Möglichkeiten hinter<br />
den Technologien aufzudecken und zu vermitteln. Anschließend wird eine zeit-<br />
liche Einordnung bis zur vollständigen Verwirklichung des semantischen Webs<br />
23 Tim Berners-Lee, James Hendler Ora Lassila (2001): The Semantic Web: a new form of Web content<br />
that is meaningful to computers will unleash a revolution of new possibilities. In: Scientific American,<br />
H. 284 (5), S. 34–43.<br />
21
vorgenommen und verschiedene Umsetzungsszenarien beschrieben. Im letzen<br />
Teil des Hauptteils werden anhand von Praxisbeispielen die Auswirkungen und<br />
Chancen des semantischen Webs für die Wirtschaft, den Gesundheitsbereich<br />
und den privaten Bereich dargestellt.<br />
Letztendlich werden im letzten Schlussteil die wichtigsten Ergebnisse kritisch<br />
zusammengefasst und ein Ausblick sowie weitere Perspektiven zum Thema<br />
geliefert.<br />
2 Das Inter<strong>net</strong> morgen<br />
Das semantische Web ist keine separate Erweiterung des bestehenden Inter-<br />
<strong>net</strong>s, sondern vielmehr eine Vielzahl kleinerer Technologien, die in ihrer Kom-<br />
bination die in der Einleitung angedeuteten Veränderungen bewirken. Zuerst<br />
wird das W3C-Konsortium, seine Rolle und Aufgaben vorgestellt, um dann nä-<br />
her auf die vom W3C verabschiedeten Grundprinzipien des semantischen<br />
Webs einzugehen. Im weiteren Verlauf setzt sich die Arbeit mit den relevanten<br />
Technologien des semantischen Webs auseinander, ohne zu sehr auf technis-<br />
che Spezifikationen dieser Technologien einzugehen. Vielmehr wird versucht,<br />
die hinter den Technologien liegenden Konzepte und Möglichkeiten zu erklären<br />
und zu vermitteln. Anschließend wird die Architektur des semantischen Webs<br />
anhand des von Tim Berners-Lee vorgeschlagenem Schichtenmodell erklärt<br />
und auf die Wichtigkeit und Bedeutung dieses Schichtenmodells für die Weiter-<br />
entwicklung des semantischen Webs eingegangen. Außerdem werden ver-<br />
schiedene Umsetzungsszenarien zur vollständigen Verwirklichung des se-<br />
mantischen Webs kritisch gewürdigt und eine zeitliche Einordnung vorgenom-<br />
men. Schließlich werden die Chancen und Auswirkungen des semantsichen<br />
Webs anhand von ausgewählten Praxisbeispielen angedeutet.<br />
2.1 Das W3C-Konsortium<br />
Die wohl wichtigste Vereinigung bei der allgemeinen Entwicklung des Inter<strong>net</strong>s<br />
und insbesondere zur Verwirklichung der Idee des semantischen Webs ist das<br />
22
W3C-Konsortium. Es ist ein internationales Konsortium bestehend aus über 400<br />
bedeutenden internationalen Unternehmen und Universitäten, und einem fest<br />
angestellen Team. Das Konsortium arbeitet gemeinsam daran, Standards im In-<br />
ter<strong>net</strong> zu entwicklen, um durch diese festgelegten Protokolle und Richtlinien die<br />
vollen Möglichkeiten des World Wide Webs zu erschließen und so ein lang-<br />
fristiges Wachstum des Inter<strong>net</strong>s zu ermöglichen. Dabei hat das W3C in den er-<br />
sten zehn Jahren ihrer Arbeit mehr als achtzig W3C Recommendations heraus-<br />
gegeben, engagiert sich in Ausbildung und Verbreitung der Standards, entwick-<br />
elt Software und dient als offenes Diskussionsforum. Damit das gesamte Poten-<br />
zial des Inter<strong>net</strong>s ausgeschöpft werden kann, müssen die fundamentalen Web-<br />
Technologien kompatibel untereinander sein und mit jeder beliebigen Hard- und<br />
Software, die auf das Inte<strong>net</strong> zugreift, zusammenarbeiten. Das W3C bezeich<strong>net</strong><br />
dieses Ziel als “Web-Interoperabilität”. Durch die Veröffentlichung von offenen,<br />
nicht proprietären Standards versucht das W3C-Konsortium eine Marktfragmen-<br />
tierung – und damit eine Fragmentierung des Inter<strong>net</strong>s – zu vermeiden. Tim<br />
Berners-Lee ist Direktor des W3C-Konsortiums seit der Gründung dieser Or-<br />
gansation im Jahre 1994.<br />
Mit ihrer Mission verfolgt das W3C-Konsortium folgende allgemein gültige, lang-<br />
fristige Ziele:<br />
� Das Web für Jedermann. Die soziale Stärke des Inter<strong>net</strong>s besteht dar-<br />
in, dass es zwischenmenschliche Kommunikation, eine Umgebung für<br />
Geschäfte und Möglichkeiten zum Wissensaustausch bietet. Eines der<br />
Hauptziele der W3C ist es, diese Vorteile allen Menschen, unabhänig<br />
von ihrer Hard- und Software, Netzinfrastruktur, Muttersprache und Kul-<br />
tur, geografischer Position, physischen und geistigen Fähigkeiten,<br />
zugänglich zu machen.<br />
� Das Web auf allen Geräten. Die Vielzahl der Endgeräte, die auf das In-<br />
ter<strong>net</strong> zugreifen können, wachsen kontinuierlich. Mobiltelefone, Smart-<br />
phones, PDAs, interaktive Fernsehsysteme, Spielekonsolen – all diesen<br />
Endgeräten soll der Zugang zum Inter<strong>net</strong> einfach und bequem ermöglicht<br />
werden.<br />
23
� Wissensschatz. Das Inter<strong>net</strong> ist nicht nur eine riesige Informationsquelle<br />
für Menschen, die darin suchen und Informationen untereinander aus-<br />
tauschen können. Es ist auch eine sehr große Datenbank, die es Com-<br />
putern ermöglichen kann, mehr nützliche Arbeit für den Menschen zu<br />
übernehmen. So arbeitet das W3C daran, ein Inter<strong>net</strong> sowohl für die<br />
Menschen als auch für die Maschinen zu entwickeln.<br />
� Sicherheit und Vertrauen. Damit das Inter<strong>net</strong> zu einem nutzenbringen-<br />
dem Medium für soziale Aktivitäten werden kann, muss man den Teil-<br />
nehmern vertrauen können. Obwohl Vertrauen niemals durch Technik<br />
geschaffen werden kann, fördert das W3C-Konsortium Technologien, die<br />
eine stärker gemeinschaftliche Umgebung ermöglichen, also ein Inter<strong>net</strong>,<br />
das Verantwortung, Sicherheit, Vertrauen und Vertraulichkeit in sich ver-<br />
eint. 24<br />
2.2 Die Grundprinzipien des semantischen Webs<br />
Der folgende Abschnitt behandelt die sechs vom W3C-Konsortium erarbeiteten<br />
Grundprinzipien des semantischen Webs.<br />
2.2.1 Prinzip 1: Alles kann mittels URIs identifiziert werden<br />
“A Uniform Resource Identifier (URI) is a compact sequence of charac-<br />
ters that identifies an abstract or physical resource.” 25<br />
Menschen, Orte und Dinge aus der physikalischen Welt können vom se-<br />
mantischen Web profitieren und daran teilhaben, in dem sie über sogenannte<br />
Identifier (Bezeichner) eindeutig beschrieben und lokalisiert werden können.<br />
Jeder, der über einen Namensraum im Inter<strong>net</strong>, also zum Beispiel über einen<br />
Webserver, Kontrolle ausüben kann, kann einen URI erstellen und damit aus-<br />
drücken, dass dieser URI etwas in der physikalischen Welt identifiziert. Eine<br />
24 Head of Communication Ian Jacobs: Über das World Wide Web Consortium (W3C). Herausgegeben<br />
von W3C-Konsortium. Online verfügbar unter http://www.w3c.de/about/overview.html, zuletzt geprüft am<br />
28.04.2008.<br />
25 T. Berners-Lee (2008): RFC 3986 - Uniform Resource Identifier (URI): Generic Syntax. Unter Mitarbeit<br />
von R. Fielding, L. Masinter. Herausgegeben von W3C-Konsortium und MIT. Online verfügbar unter<br />
http://tools.ietf.org/html/rfc3986, zuletzt aktualisiert am 28.04.2008.<br />
24
Gruppierung der Entwicklergemeinschaft des Inter<strong>net</strong>s besteht darauf, dass nur<br />
ein geringer Teil der Web URI Namensräume für diese Zwecke zur Verfügung<br />
gestellt wird. Das semantische Web hingegen setzt solche Einschränkungen<br />
weder voraus noch erzwingt es solche Einschränkungen. Vielmehr kann es<br />
auch indirekt auf genau solche physikalischen Einheiten verweisen. Zum Bei-<br />
spiel könnte eine Person mit dem Namen “Max Mustermann” über die URI zu<br />
seinem persönlichem E-Mail Account max@mustermann.de eindeutig identifi-<br />
ziert werden, und ohne die Verwendung weiterer URIs könnten über diesen ein-<br />
zigen Uniform Resource Identifier viele weitere Informationen über genau diese<br />
Person gesammelt werden. Analog dazu könnten Orte über die URI zu einer<br />
Website (die URL ist eine Unterklasse der URI), beispielsweise die von der<br />
Stadt Köln betriebene Domäne http://www.koeln.de, eindeutig identifiziert und<br />
um weitere Informationen angereichert werden. Mit besseren Metadaten, also<br />
Daten über die Daten, ist es möglich, die Beziehung der realen Stadt und des<br />
URIs genauer zu beschreiben. Mittels Uniform Resource Identifiern ist es also<br />
möglich, jeden und alles sowohl in der physikalischen also auch in der digitalen<br />
Welt eindeutig zu identifizieren.<br />
2.2.2 Prinzip 2: Ressourcen und Beziehungen sind typisiert<br />
Das gegenwärtige Inter<strong>net</strong> besteht aus Ressourcen und ihren Verlinkungen un-<br />
tereinander, wie in der folgenden Abbildung unter a) zu sehen ist.<br />
25
Im heutigen Inter<strong>net</strong> handelt es sich bei den Ressourcen meist um Inter<strong>net</strong>-<br />
Abbildung 3: Current Web vs. Semantic Web; Marja-Riitta Koivunen, Eric Miller (2008): W3C<br />
Semantic Web Activity. Semantic Web Main Principles. Herausgegeben von W3C-Konsortium<br />
und MIT. Online verfügbar unter http://www.w3.org/2001/12/semweb-fin/w3csw, zuletzt aktualis-<br />
iert am 28.04.2008.<br />
Dokumente, die zum einen auf die Verwendung durch den Menschen abzielen<br />
und zum anderen üblicherweise keine Metadaten enthalten, die beschreiben,<br />
auf welche Art sie verwendet werden können und wie ihre Beziehungen zu an-<br />
deren Dokumenten im Inter<strong>net</strong> ist. Während Menschen schnell erschließen,<br />
dass das eine Dokument eine Rechnung, das andere Dokument ein wis-<br />
senschaftliches Papier ist, ist es Maschinen respektive Computer zum gegen-<br />
wärtigen Zeitpunkt nicht möglich, diese Informationen und ihre Beziehungen zu<br />
erschließen. Hilfreich wären reichhaltigere Beschreibungen der Beziehungen<br />
der Dokumente untereinander, wie zum Beispiel “depends on”, “is version of”<br />
oder “author”. Wie die Abbildung zeigt, werden Ressourcen und ihre Verlinkun-<br />
gen auch ein Bestandteil des semantischen Webs sein, allerdings werden diese<br />
typisiert werden können und definieren so die Konzepte hinter den Ressourcen,<br />
so dass es auch Maschinen möglich ist diese zu interpretieren. So könnten ein-<br />
ige Links die Beschreibung enthalten, dass diese Ressource eine Version einer<br />
anderen Ressource ist oder von einer Ressource geschrieben worden ist, die<br />
26
eine Person beschreibt. Die Typisierung von Ressourcen und ihren Verlinkun-<br />
gen ist also ein Grundprizip des semantischen Webs und kann das Informa-<br />
tionsmanagement in Zukunft erheblich vereinfachen und optimieren.<br />
2.2.3 Prinzip 3: Partielle Informationen sind akzeptabel<br />
Das gegenwärtige Inter<strong>net</strong> ist unbegrenzt: Es opfert die Integrität der Links für<br />
die Skalierbarkeit des Inter<strong>net</strong>s. Das bedeutet, ein Autor kann sehr leicht auf<br />
andere Ressourcen verlinken, ohne das eine Verlinkung der Gegenseite not-<br />
wndig ist. So hat die Gegenseite allerdings keine Möglichkeit, den Verlinkenden<br />
über einen Umzug der Ressource zu informieren. Die Fehlermeldung 404 “File<br />
not found”, die uns darüber informiert, dass die Verlinkung nicht mehr funk-<br />
tioniert, ist zu akzeptieren. In ähnlicher Weise ist das semantische Web auch<br />
unbegrenzt. Jeder kann veröffentlichen, was er möchte und verschiedene Arten<br />
von Verlinkungen zwischen den Ressourcen erstellen. Manche der verlinkten<br />
Ressourcen werden eventuell nach einen bestimmten Zeitraum nicht mehr ex-<br />
istieren oder die Adresse wurde mittlerweile für etwas anderes verwendet. Die<br />
Werkzeuge des semantischen Webs tolerieren diesen Datenverfall und funk-<br />
tionieren trotzdem. Wie bereits weiter oben beschrieben, können Informationen<br />
über Uniform Resource Identifier eindeutig identifiziert werden, und selbst wenn<br />
eine Verlinkung zu einer bestimmten Informationen über diese Person nicht<br />
mehr innerhalb der URI zur Verfügung steht, können die bestehenden Informa-<br />
tionen für Rückschlüsse genutzt werden. Die Werkzeuge des semantischen<br />
Webs können mit ausgewählten Informationsinseln bzw. partiellen Information-<br />
en arbeiten.<br />
2.2.4 Prinzip 4: Absolute Wahrheit wird nicht benötigt<br />
Nicht alles aus dem gegenwärtigen Inter<strong>net</strong> ist wahr, und auch das semantische<br />
Web wird dies in keiner Weise ändern. Wahrheit im Sinne von Glaubhaftigkeit<br />
wird von den Applikationen eingeschätzt, die die Informationen im World Wide<br />
Web verarbeiten. Die Applikationen entscheiden also für sich, welcher Quelle<br />
sie vertrauen, indem sie den Kontext, aus dem die Aussage stammt, bewerten.<br />
Sie prüfen zum Beispiel, welche Ressource hat was und wann gesagt und<br />
welche Legitimation diese Ressource besitzt, um genau das auszudrücken.<br />
27
Die Abbildung zeigt Tiina, angestellt bei Elisa, die den Mitgliederbereich der<br />
Abbildung 4: Chain of trust: Marja-Riitta Koivunen, Eric Miller (2008): W3C Semantic Web Activ-<br />
ity. Semantic Web Main Principles. Herausgegeben von W3C-Konsortium und MIT. Online ver-<br />
fügbar unter http://www.w3.org/2001/12/semweb-fin/w3csw, zuletzt aktualisiert am 28.04.2008.<br />
W3C-Website besuchen möchte. Damit sie diesen Mitgliederbereich betreten<br />
darf, muss sie einen Beweis (Proof) liefern, dass sie die Rechte dazu besitzt. Ti-<br />
ina kann diesen Beweis liefern, in dem sie sich auf die vier Aussagen von Alan<br />
und Kari bezieht, die wiederum als vertrauenswürdig gelten und das Recht<br />
besitzen, solche Aussagen zu treffen, da sie Mitglieder von Elisas Gremium<br />
sind. Die Applikation würde diesen Beweis zulassen, da sie den Aussagen von<br />
Alan vertraut und Alan die Verantwortung für den Zugang zum Mitgliederbereich<br />
auf Kari delegiert hat.<br />
2.2.5 Prinzip 5: Evolution wird unterstützt<br />
Es kommt häufig vor, dass sich sehr ähnelnde Konzepte von unterschiedlichen<br />
Gruppen an verschiedenen Orten oder gar von derselben Gruppe zu ver-<br />
schiedenen Zeitpunkten entwickelt und definiert werden. Hier wäre es sehr<br />
nützlich, die Daten, die dieselben Konzepte beschreiben, miteinander zu kom-<br />
binieren. Das semantische Web benutzt ein bestimmtes Regelwerk zur Be-<br />
schreibung dieser Konzepte, das sich genauso weiterentwickeln kann, wie es<br />
der menschliche Verstand auch tut. Zusätzlich erlaubt dieses Regelwerk das ef-<br />
28
fektive Kombinieren von untereinander unabhängigen Konzepten von ver-<br />
schiedenen Gemeinschaften sogar dann, wenn diese verschiedenartige Voka-<br />
bulare benutzen. Das semantische Web hält Werkzeuge bereit, um Doppel-<br />
deutigkeiten zu beseitigen und Widersprüche zu klären. Außerdem können be-<br />
stehende Informationen angereichert werden, ohne die alten Informationen zu<br />
verändern.<br />
Die Abbildung zeigt im linken Bereich aktuelle Informationen über eine Person<br />
Abbildung 5: Combining new information with old when the old information cannot be changed:<br />
Marja-Riitta Koivunen, Eric Miller (2008): W3C Semantic Web Activity. Semantic Web Main<br />
Principles. Herausgegeben von W3C-Konsortium und MIT. Online verfügbar unter<br />
http://www.w3.org/2001/12/semweb-fin/w3csw, zuletzt aktualisiert am 28.04.2008.<br />
mit dem Nachnamen Miller unter der Verwendung eines bestimmten Vokabu-<br />
lars. Der rechte Bereich zeigt Informationen über dieselbe Person aus einer an-<br />
deren, z.B. älteren Ressource aus dem World Wide Web. Diese beiden Infor-<br />
mationen über ein und dieselbe Person können nun im semantischen Web auf<br />
vielzählige Weise kombiniert werden. Man könnte z.B. eine neue Eigenschaft<br />
“previousIdentity” (ältere Identität) hinzufügen, die diese beiden Beschreibun-<br />
gen ein und derselben Person verbinden. Genauso könnte man eine Trans-<br />
formation des aktuellen Vokabular auf das ältere Vokabular definieren, in der<br />
festgehalten wird, dass “worksAt” und “employedBy” dieselben Beziehungen<br />
ausdrücken. Mit dem semantischen Web wird es darüber hinaus möglich sein,<br />
neue Eigenschaftbeschreibungen hinzuzufügen, die angeben, in welchem<br />
Zeitraum eine bestimmte Information Gültigkeit besaß. Die zusätzlichen Inform-<br />
29
ationen können überall gespeichert und überall von Applikationen gefunden<br />
werden, wenn diese losgelösten Informationselemente auf den eindeutigen Uni-<br />
form Resource Identifier der älteren Informationsquelle verweisen und somit<br />
eindeutig zugeord<strong>net</strong> werden können. So ermöglicht das semantische Web eine<br />
natürliche Evolution der Daten, indem alte Informationsressourcen verwendet<br />
und mit neuen Informationsquellen kombiniert und verlinkt werden können.<br />
2.2.6 Prinzip 6: Minimalistisches Design der Technologien<br />
Das semantische Web macht die einfachen Dinge einfach und die komplexen<br />
Dinge möglich. Das Ziel des W3C-Konsortiums ist es, nicht mehr als nötig zu<br />
standardisieren. Dieser Anspruch ermöglicht das Implementieren von einfachen<br />
Applikation auf bereits standardisierten Technologien. Dabei sollte der Geb-<br />
rauch der semantischen Technologien, die, wie wir später sehen, aufeinander<br />
aufbauen, einen höheren Mehrwert liefern als die Summe des Nutzens der ein-<br />
zelnen Technologien. Das bedeutet, das durch diesen Ansatz Vorteile<br />
entstehen, die heute teilweise noch gar nicht abzusehen sind. 26<br />
2.3 Technologien des semantischen Webs<br />
Das semantische Web ist keine Zukunftsmusik mehr – wissenschaftlich sind die<br />
relevanten Entwicklungen und Bereiche bereits bekannt. Vielmehr liegt die<br />
Herausforderung nun in einer breitflächigen Integration der Technologien, der<br />
Standardisierung, der Entwicklung von greifbaren Werkzeugen und dem Ge-<br />
brauch durch die Nutzer. Tim Berners-Lee präsentierte am 06. Dezember 2000<br />
auf der Konferenz “XML 2000” seine Vision der Architektur des semantischen<br />
Webs. Die folgende Abbildung zeigt seine Vision von aufeinander aufbauenden<br />
Technologien, die zum Teil bereits ausreichend erforscht sind und zur Verfü-<br />
gung stehen, zu einem anderen Teil aber noch erforscht werden müssen.<br />
26 Marja-Riitta Koivunen, Eric Miller (2008): W3C Semantic Web Activity. Semantic Web Main Principles.<br />
Herausgegeben von W3C-Konsortium und MIT. Online verfügbar unter http://www.w3.org/2001/12/semweb-fin/w3csw,<br />
zuletzt geprüft am 28.04.2008.<br />
30
Abbildung 6: The Semantic Web Stack: W3C-Konsortium: http://www.w3.org/2000/Talks/1206-<br />
xml2k-tbl/slide10-0.html Zuletzt geprüft am 24.04.08<br />
Die Wissenschaft im Bereich des semantischen Webs ist bis zum heutigen Zeit-<br />
punkt (in der Abbildung von unten gesehen) bis zu den Ontologien<br />
vorgedrungen. Diese Technologien sind ausreichend erforscht, für die Ziele und<br />
aufgestellten Grundprinzipien, die mit dem semantischen Web verbunden sind,<br />
für sinnvoll und nutzbar befunden und schließlich vom W3C-Konsortium als Re-<br />
commendations (Empfehlungen), also als festgelegte Standards, veröffentlicht<br />
worden. Logik (Logic), Beweise (Proof) und Vertrauen (Trust) sind die Bereiche,<br />
die noch wissenschaftlich aufgearbeitet werden müssen. Theoretisch ist be-<br />
kannt, was diese Ebenen leisten müssen, praktisch fehlen teilweise noch die<br />
konkreten Technologien bzw. Programmiersprachen zur Umsetzung. Trotzdem<br />
liefert dieses Schichtensystem mit dem Namen “The Semantic Seb Stack” oder<br />
auch “Semantic Layer Cake” ein hervorragendes Gerüst, um die Technologien<br />
des semantischen Webs zu erläutern. Die unterschiedlichen Technologien<br />
bzw. Abstraktionsebenen bauen dabei aufeinander auf, das bedeutet, sie sind<br />
abwärtskompatibel. Ein Software Agent sollte also, wenn er z.B. Ontologien in-<br />
terpretieren und verwenden kann, auch in der Lage sein, die Informationen der<br />
31
darunter liegenden Schichten zu interpretieren und zu verwenden. In entge-<br />
gengesetzer Richtung, also aufwärts, sollten Software Agents die Fähigkeit<br />
haben, weiter unten liegende Ebene zu verstehen und zu interpretieren, um so<br />
zumindest teilweise die Vorteile aus den darüber liegenden Schichten ziehen zu<br />
können. Jede Ebene ist als ein Schritt in Richtung vollständiger Realisation des<br />
semantischen Webs zu verstehen.<br />
2.3.1 Unicode und URI<br />
Unicode vereint unterschiedliche Zeichensätze wie zum Beispiel arabische, ja-<br />
panische, kyrillische und lateinische Zeichensätze und wird so grundlegender<br />
internationaler Kodierungsstandard für die Daten im semantischen Web. Uni-<br />
code ord<strong>net</strong> jedem Zeichen eine eigene Nummer zu, die so leichter und un-<br />
missverständlicher durch Computer interpretiert werden kann. Durch diese<br />
nummerische Zuordnung ist Unicode systemunabhängig, programmunabhängig<br />
und sprachunabhängig. 27<br />
Ein URI (Uniform Resource Identifier) besteht aus einer Kette von Zeichen, die<br />
eine abstrakte oder physikalische Ressource identifiziert. Eine solche Quelle<br />
könnten Dokumente, Bilder, herunterladbare Dateien oder ähnliches im Web<br />
sein oder auch physikalische Geräte wie Fernseher, Kühlschrank oder Rund-<br />
funkradio. Der URI macht diese verschiedenen Quellen verfügbar und teilt<br />
ihnen eine eindeutige Adresse zu. Dabei verwendet der URI eine Vielzahl von<br />
unterschiedlichen Namensschemata und Zugangsmethoden wie etwa HTTP<br />
oder FTP. Die wohl unter Laien bekannteste Unterkategorie von Uniform Re-<br />
source Identifiern (URI) ist der Uniform Resource Locator (URL), der zur Ad-<br />
ressierung und Identifikation von Webseiten im Inter<strong>net</strong> genutzt wird. 28<br />
Alle die nun folgenden Technologien bauen auf die jeweils vorher beschrieben-<br />
en Technologien auf oder verwenden diese zumindest teilweise.<br />
27 Unicode, Inc (2008): Unicode. Unter Mitarbeit von Unicode Consortium®. Online verfügbar unter<br />
http://www.unicode.org/, zuletzt geprüft am 26.04.2008.<br />
28 W3C-Konsortium (2008): Naming and Addressing: URIs, URLs, … Unter Mitarbeit von diversen Mitarbeitern.<br />
Online verfügbar unter http://www.w3.org/Addressing/, zuletzt geprüft am 26.04.2008.<br />
32
2.3.2 Extensible Markup Language (XML)<br />
Die “Extensible Markup Language” (XML) ist ein Eckpfeiler des semantischen<br />
Webs. 29 In der Vergangenheit war HTML (hypertext markup language) die<br />
Standard-Sprache, in der Webseiten geschrieben worden sind. HTML wurde<br />
von SGML (standard generalized markup language), einem internationalen<br />
Standard für die Definition von einer gerät- und systemunabhängigen Darstel-<br />
lung von Informationen, abgeleitet. Dabei wurde SGML so konzipiert, dass die<br />
Inhalte sowohl vom Menschen als auch von Maschinen gelesen werden konn-<br />
ten. Sprachen, die sich auf SGML beziehen, nennt man SGLM-Applikationen,<br />
HTML ist eine solche Applikation. HTML wurde entwickelt, weil SGLM als viel<br />
zu kompliziert für die Anwendung im Inter<strong>net</strong> erachtet wurde. XML ist auch eine<br />
SGML-Applikation, die allerdings durch die erkannten Mängel der “hypertext<br />
markup language” entstanden ist. 30 Mittlerweile hat XML die Entwicklungsphase<br />
verlassen und findet auf breiter Basis Akzeptanz. XML wurde am 10. Februar<br />
1998 vom W3C-Konsortium offiziell zu einer Empfehlung (Recommendation)<br />
und so zu einem offiziell anerkannten Standard. 31<br />
Die Vorteile, die XML gegenüber HTML mit sich bringt, sind folgende:<br />
� XML ermöglicht die Erstellung von applikationsunabhängigen Doku-<br />
menten und Daten.<br />
� XML besitzt eine Standard-Syntax für die Beschreibung von Metadaten<br />
(Daten über die Daten).<br />
� XML besitzt eine Standard-Struktur sowohl für Dokumente als auch<br />
Daten.<br />
29<br />
Tim Berners-Lee, James Hendler Ora Lassila: The Semantic Web: a new form of Web content that is<br />
meaningful to computers will unleash a revolution of new possibilities. In: Scientific American, H. 284<br />
(5), S. 34–43.<br />
30<br />
Frank Hermelen, Grigoris Antoniou (2004): A Semantic Web Primer; Seite 23; Herausgegeben von The<br />
MIT Press.<br />
31<br />
W3C-Konsortium (1998): Extensible Markup Language (XML) 1.0. W3C Recommendation 10-<br />
February-1998. Unter Mitarbeit von Jean Paoli C. M. Sperberg-McQueen Tim Bray. Online verfügbar<br />
unter http://www.w3.org/TR/1998/REC-xml-19980210, zuletzt geprüft am 23.04.2008.<br />
33
� XML ist keine neue Technologie.<br />
XML ist von Applikationen unabhängig, da sie als Verschlüsselung einfachen<br />
Text in einer vom Menschen lesbaren Form verwendet. Zum Entwerfen von<br />
XML-Dokumenten sind einfache Editoren, wie etwa von Open Office, verfügbar.<br />
Im Gegensatz dazu gibt es beispielsweise in sich geschlossene, binär ver-<br />
schlüsselte Formate wie Microsoft Word, bei denen lediglich die Entwickler<br />
selbst das Format verstehen. Diese binäre Verschlüsselung des Formats hat<br />
den Nachteil, dass sie sich selbst in bestimmte Applikationen – also z.B. Mi-<br />
crosoft Word – einschließt. Die Verschlüsselung von XML durch einfachen Text<br />
erlaubt es hingegen jeder Applikation oder jedem Programm, die Datei zu öff-<br />
nen und zu lesen. Durch die Verwendung einer offenen und standardisierten<br />
Syntax und einer ausführlichen Beschreibung der Bedeutung der Daten ist XML<br />
von jedem lesbar und interpretierbar, nicht nur von einer bestimmten Applika-<br />
tion und ihrem Produzenten. Das ist ein entscheidender Grundpfeiler des se-<br />
mantischen Webs, weil heute die Vielzahl an Software Agents, Programmen<br />
und Systemen der Zukunft, die einmal Daten des World Wide Webs interpretier-<br />
en und weiterverarbeiten können sollen, kaum voraussehbar ist. Eine Aus-<br />
zeichungssprache, die von allen digitalen Systemen der Zukunft verstanden<br />
werden kann, ist also ein grundlegendes Erfordernis auf dem Weg zum se-<br />
mantischen Web. Ein weiterer Vorteil beim Speichern von Daten in der “Extens-<br />
ible Markup Language” ist die einfache Durchsuchbarkeit vergleichbar zu den<br />
Inhalten von Webseiten heute.<br />
Einen weiteren Vorteil, den XML gegenüber HTML bietet, ist die Standard-Syn-<br />
tax für die Beschreibung von Metadaten. Die Syntax, oder speziell die Syntax<br />
formaler Sprachen – also die Syntax von Programmiersprachen in der Infor-<br />
matik und Kalkülen in der Logik – bezeich<strong>net</strong> ein System von Regeln, nach<br />
dem erlaubte Konstruktionen bzw. Ausdrücke aus einem grundlegenden<br />
Zeichenvorrat gebildet werden. 32<br />
Metadaten über ein Buch sind zum Beispiel:<br />
32 Arnim Regenbogen, Uwe Meyer, Friedrich Kirchner, Carl Michaelis, Johannes Hofmeister (2006): Wörterbuch<br />
der philosophischen Begriffe. 1. Aufl.: Verlag Meiner.<br />
34
� Der Name des Autors<br />
� Die Auflage<br />
� Das Erscheinungsjahr<br />
� Auflage und Verlag<br />
Ohne genauer auf die technischen Spezifikationen der Syntax an dieser Stelle<br />
einzugehen, ist die Entwicklung der XML-Syntax auf dem Weg zum se-<br />
mantischen Web von hoher Signifikanz, denn sie standardisiert eine einfache,<br />
auf Text basierende Methode zur Auf- und Verschlüsselung der Bedeutung von<br />
Daten oder semantischen Informationen. Während Daten kontext-spezifische<br />
Werte darstellen, beschreiben die Metadaten die Bedeutung oder den Zweck<br />
dieser Daten.<br />
Ein weiterer wichtiger Schritt in Richtung des semantischen Webs liefert XML<br />
mit ihrer Standard-Struktur, die geeig<strong>net</strong> ist, semantische Informationen sowohl<br />
für Dokumente als auch Datenfelder auszudrücken. Ein elektronisches Doku-<br />
ment kann als Gegenstück zu einem aus Papier bestehenden Dokument ver-<br />
standen werden, es enthält rohe Informationen und Anweisungen zur Darstel-<br />
lung der Informationen. Im Gegensatz dazu bestehen Datenfelder aus Werte-<br />
paaren (Name=Müller), die von Computer verarbeitet werden können und im<br />
Inter<strong>net</strong> oft in Formularen vorzufinden sind. Beide Arten von Informationen sind<br />
weit verbreitet innerhalb von Organisationen und auch im World Wide Web.<br />
XML macht es möglich, Metadaten sowohl an Dokumente als auch Datenfelder<br />
anzuhängen, und schließt so die Lücke zwischen Daten in Dokumenten und<br />
losgelösten Datenfeldern – beispielsweise in Formularen.<br />
Nicht unerheblich ist die Tatsache, das XML die Kinderkrankheiten neuer Tech-<br />
nologien bereits überstanden hat. Die Extensible Markup Language ist eine<br />
Ausgliederung der bereits oben beschriebenen “Standardized Generalized<br />
Markup Language” (SGML), die im Jahre 1969 von Dr. Charles Goldfarb, Ed<br />
35
Mosher und Ray Lorie entwickelt wurde. Das bedeutet, das Konzept hinter XML<br />
wurde fast 40 Jahre getestet und weiterentwickelt. 33<br />
Dennoch reicht diese Technologie zur Verwirklichung des semantischen Webs<br />
nicht aus, stellt aber Grundlage aller darauf aufbauender Technolgien dar. Mit<br />
Hilfe von XML können Struktur und Inhalt getrennt werden sowie einzelene Ab-<br />
schnitte eines Dokuments markiert (getagged), also beschrieben werden. Da<br />
aber jeder Entwickler völlig frei in der Wahl seiner Markierung ist, besteht kein<br />
einheitlicher Standard in der Beschreibung der Struktur eines Dokuments und<br />
bei dem Datenaustausch müssen sich Sender und Empfänger auf eine gemein-<br />
same Struktur des XML-Dokuments festlegen. Dieses Problem wird durch das<br />
Resource Description Framework (RDF) gelöst.<br />
2.3.3 Resource Description Framework (RDF)<br />
Einfach ausgedrückt ist das Resource Description Framework eine auf XML<br />
basierende Sprache zur Beschreibung von Ressourcen. Unter einer Ressource<br />
könnte z.B. eine elektronische Datei im Inter<strong>net</strong> verstanden werden. Auf eine<br />
solche Datei wird über eine URL (Uniform Resource Locator) zugegriffen.<br />
Während es mit XML möglich ist, Metadaten an einzelne Teile eines Doku-<br />
ments anzuhängen, ist ein Vorteil von RDF, dass es Metadaten über das ge-<br />
samte Dokument anhängen kann, etwa Informationen wie Autor, Erstellungs-<br />
datum und Art des Dokuments. Ein gelungenes Beispiel für den Nutzen von<br />
RDF ist die Beschreibung eher undurchsichtiger Dateien wie etwa Bild- oder<br />
Audiodateien. Die folgende Abbildung zeigt die vom W3C-Konsortium entwick-<br />
elte Demonstrations-Anwendung “RDFpic” zur Einbindung von Metadaten in-<br />
nerhalb von Bilddateien.<br />
33 Michael C. Daconta (2003): The Semantic Web. A Guide to the Future of XML, Web Services, and<br />
Knowlege Management. Unter Mitarbeit von Kevin T. Smith Leo. J. Obrst. Herausgegeben von WILEY.<br />
36
Dabei arbeitet die Anwendung in Verbindung mit einem Server, in diesem Falle<br />
Abbildung 7: RDFpic 2.1; Michael C. Daconta (2003): The Semantic Web. A Guide to the Fu-<br />
ture of XML, Web Services, and Knowlege Management (S. 87). Unter Mitarbeit von Kevin T.<br />
Smith Leo. J. Obrst. Herausgegeben von WILEY.<br />
der W3C-Jigsaw-Webserver, auf dem automatisch die angehängten Metain-<br />
formationen in Form einer externen RDF-Datei gespeichert werden. Außerdem<br />
ist es mit “RDFpic” möglich, verschiedene spezielle RDF-Schemata zur Be-<br />
schreibung des Bildes zu laden. Die im Programm mitgelieferten Standard-<br />
Schemata zur Beschreibung des Bildes sind Dublin Core (DC) und ein tech-<br />
nisches Schemata (Technical), welches Metadaten über die benutzte Kamera<br />
enthält. Die folgende Abbildung zeigt die von “RDFpic” generierte RDF-Datei.<br />
37
Auffällig ist die Verwendung von sogenannten “namespaces” (Namensräumen,<br />
Abbildung 8: RDF geniert durch RDFpic; Michael C. Daconta (2003): The Semantic Web. A<br />
Guide to the Future of XML, Web Services, and Knowlege Management (S. 86). Unter Mit-<br />
arbeit von Kevin T. Smith Leo. J. Obrst. Herausgegeben von WILEY.<br />
hier im Beispiel xmlns:rdf=”http://www.w3.org/1999/02/22-rdf-syntax-ns#”).<br />
“Namespaces” sind ein einfaches Hilfmittel zur Erstellung von global eindeuti-<br />
gen Namen für die Elemente und Attribute einer Auszeichnungssprache. Sie<br />
sind aus zwei Gründen von Bedeutung: Erstens zur Vermeidung von Konflikten<br />
von einheitlichen Namen zwischen verschiedenen Auszeichnungssprachen und<br />
zweitens ermöglichen sie, mehrere Auszeichnungssprachen ohne Doppeldeut-<br />
igkeiten zu mischen. 34 Das Root-Element () spezifiziert das Doku-<br />
ment als RDF-Dokument und in ihm sind vier Namesräume deklariert. Außer-<br />
dem enthält jedes RDF-Dokument eine oder mehrere “descriptions” (Be-<br />
schreibungen), die Aussagen über die beschriebene Ressource enthalten.<br />
Dieses Element enthält ein rdf:about Merkmal, das auf die<br />
beschrieben Quelle verweist. Diese Verweise in Form von “Uniform Resource<br />
Identifier” (URI) sind wichtig, um das Resource Description Framework zu ver-<br />
stehen, denn alle Ressourcen, die durch RDF beschrieben werden, müssen mit<br />
einem URI bezeich<strong>net</strong> werden. Zusammengefasst hat uns die Abbildung, die<br />
eine RDF-Syntax darstellt, die Beschreibung der Ressource, die Eigenschaften<br />
34 Michael C. Daconta (2003): The Semantic Web. A Guide to the Future of XML, Web Services, and<br />
Knowlege Management (S. 42). Unter Mitarbeit von Kevin T. Smith Leo. J. Obrst. Herausgegeben von<br />
WILEY.<br />
38
der Ressource und die Werte dieser Eigenschaften präsentiert. Dieses<br />
dreigeteilte Modell ist typisch für RDF und deshalb wird das RDF-Modell auch<br />
oft als “triple” bezeich<strong>net</strong>.<br />
Genauso, wie man das RDF-Modell mittels seiner Ressourcen-Eigenschaften<br />
beschreiben kann, nämlich erstens “Beschreibung der Ressource”, zweitens<br />
“Eigenschaften der Ressource” und drittens “Werte dieser Eigenschaften”,<br />
erklären Forscher und Wissenschaftler der künstlichen Intelligenz, die dieses<br />
Forschungsgebiet “knowledge representation” nennen, das gleiche Modell an<br />
den grammatikalischen Teilen eines Satzes, nämlich mit Subjekt, Prädikat und<br />
Objekt.<br />
Die Schlüsselelemente eines RDF-”triple” sind also folgende:<br />
Das Subjekt. In der Grammatik bezeich<strong>net</strong> man das Satzglied als Subjekt, das<br />
mit der Frage: “Wer oder Was?” erfragt werden kann. Es ist also eine Person<br />
oder ein sachliches Objekt. In dem Satz “Das Unternehmen verkauft Strümpfe”<br />
39<br />
Abbildung 9: The<br />
RDF triple: Michael C. Daconta (2003): The Semantic Web. A Guide to the Future of XML,<br />
Web Services, and Knowlege Management (S.88). Unter Mitarbeit von Kevin T. Smith Leo. J.<br />
Obrst. Herausgegeben von WILEY.
ist das Subjekt “Das Unternehmen”. Das Subjekt eines Satzes vermittelt uns<br />
also, worüber der Satz handelt. Im Bereich der Logik ist das Subjekt der Aus-<br />
druck, über den etwas angegeben wird. Im RDF-Modell ist das Subjekt die Res-<br />
source, die durch das folgende Prädikat und Objekt beschrieben wird. Das Sub-<br />
jekt wird im RDF-Modell demzufolge mit einem Uniform Ressource Identifier<br />
(URI) eindeutig beschrieben, da der URI in der digitalen Welt eine genauso un-<br />
missverständliche Zuordnung ermöglicht, wie “Das Unternehmen” in der gram-<br />
matikalischen Welt.<br />
Das Prädikat. Grammatikalisch modifiziert dieser Teil des Satzes das Subjekt.<br />
In unserem Beispielsatz “Das Unternehmen verkauft Strümpfe” ist das Prädikat<br />
das Wort “verkauft”. Das Prädikat teilt uns also etwas über das Subjekt mit. Im<br />
RDF-Modell stellt das Prädikat die Verbindung zwischen Subjekt und Objekt<br />
her. Im RDF-Modell müsste für die Bedeutung des Wortes “verkauft” eine<br />
eindeutige URI definiert werden, die beispielsweise so aussehen könnte:<br />
“http://www.unternehmen.org/ontologien/#verkauft”.<br />
Das Objekt. In der Grammatik ist diese Satzglied ein Nomen, welches sich auf<br />
das Prädikat bezieht. In dem Beispielsatz “Das Unternehmen verkauft Strüm-<br />
pfe” ist das Objekt das Wort “Strümpfe”. Im RDF-Modell ist das Objekt also eine<br />
Ressource, die sich entweder auf das Prädikat oder auf einen wörtlichen Wert<br />
(literal) bezieht. Auch hier würde für das Objekt im RDF-Modell ein URI definiert<br />
werden müssen, der analog zu den vorher gezeigten URI-Beispielen ver-<br />
standen werden kann. 35<br />
Die nächste Abbildung zeigt das bis hierhin theoretisch besprochene Modell in<br />
der Grammatik übertragen auf RDF als Graph.<br />
35 Michael C. Daconta (2003): The Semantic Web. A Guide to the Future of XML, Web Services, and<br />
Knowlege Management. Unter Mitarbeit von Kevin T. Smith Leo. J. Obrst. Herausgegeben von WILEY,<br />
S. 85–92.<br />
40
ildung 10: A graph of two RDF statements. Michael C. Daconta (2003): The Se-<br />
mantic Web. A Guide to the Future of XML, Web Services, and Knowlege Manage-<br />
ment (S.89). Unter Mitarbeit von Kevin T. Smith Leo. J. Obrst. Herausgegeben von<br />
WILEY.<br />
RDF-Ressourcen stehen also entweder für elektronische Ressourcen, wie etwa<br />
Dateien, oder auch für Konzepte wie Personen. Sehr wichtig dabei ist, dass<br />
diese Ressourcen sich eindeutig identifizieren können über die vorher be-<br />
sprochenen URIs. Denn nur so kann eine Idee, ein Konzept, die das Subjekt<br />
oder Objekt beschreibt, global und ohne Doppeldeutigkeiten definiert werden.<br />
Das ist ein Kernunterschied, den die Benutzung der semantischen Technologi-<br />
en gegenüber der klassischen Syntax hat, denn in der Lehre der sprachlichen<br />
Zeichen gibt es sehr häufig Wortdoppelbedeutungen. Die eindeutige<br />
Identifizierbarkeit der Objekte und Subjekte durch URIs löst so das Problem der<br />
Wortdoppelbedeutungen. “Die Fliege passt nicht zum Hemd” und “Die Fliege<br />
fliegt im Zimmer umher” sind zwei Sätze mit dem jeweils selben Wort “Fliege”,<br />
aber mit unterschiedlichen Bedeutungen. Im RDF-Modell ist es möglich, dem<br />
Tier Fliege eine global eindeutige URI zuzuteilen, wodurch diese<br />
Doppeldeutigkeiten behoben werden. Diese URI könnte in diesem Fall so aus-<br />
sehen: “http://www.unternehmen.org/ontologien/tier/#fliege”.<br />
2.3.4 RDF Schema (RDFS)<br />
Das RDF-Schema (RDFS) ist eine Erweiterung des klassischen RDF Ansatzes.<br />
Genauso wie RDF ist auch RDFS eine W3C-Konsortium Recommendation und<br />
somit ein offizieller Standard. Neben RDF-Schema wird mittlerweile auch der<br />
Begriff “RDF Vocabulary Description Language” für das dahinterstehende<br />
Ab-<br />
41
Konzept verwendet. RDF-Schema ist eine auf RDF aufgesetzte Vokabular-Bes-<br />
chreibungssprache, die aus einem einfachen Bündel von gewöhnlichen RDF<br />
Ressourcen und Eigenschaften besteht. Hat man mit RDF die Möglichkeit, Aus-<br />
sagen (statements) über Ressourcen, deren Eigenschaften und Werte zu tref-<br />
fen, so bietet RDFS nun die Möglichkeit, ein speziell verwendetes Vokabular für<br />
diese Aussagen festzulegen, in dem spezielle Klassen oder Arten von Res-<br />
sourcen verankert sind. Unter einer Klasse kann in diesem Zusammenhang<br />
eine Gruppe von Dingen mit ähnlichen Eigenschaften verstanden werden.<br />
Wie könnte ein solches spezielles Vokubular aussehen? Ein Hersteller von Zel-<br />
ten würde zum Beispiel zur semantischen Beschreibung seiner Produkte die<br />
Klasse Zelt (exterms:tent) benötigen. Diese Gruppe von Zelten hat unterschied-<br />
liche Eigenschaften wie etwa Modell (exterms:model), Gewicht in KG<br />
(exterms:weightInKg) und Paketgröße (exterms:packedsize). Genau hier stößt<br />
RDF an seine Grenzen, denn damit ist es nicht möglich, solche an-<br />
wendungsspezifischen Klassen oder Eigenschaften zu definieren. Dabei liegt es<br />
auf der Hand, dass genau das von Nöten ist für die unzähligen Produkte und<br />
Produktgattungen im E-Commerce. Stattdessen bietet RDF eben die Möglich-<br />
keit, diese Klassen und Eigenschaften übergeord<strong>net</strong> zu beschreiben, wodurch<br />
verschiedene Klassen und Eigenschaften untereinander genutzt werden<br />
können. RDFS aber bietet die Option, Klassen hierarchisch zu organisieren.<br />
Zum Beispiel könnte eine Klasse Hund (ex:dog) eine Unterklasse von Säu-<br />
getieren (ex:mammal) sein, die wiederum eine Unterklasse der Klasse Tier<br />
(ex:animal) ist. So wäre jede Ressource, die auch in der Klasse Hund (ex:dog)<br />
ist, automatisch auch in der Klasse Tier (ex:animal).<br />
RDFS bietet also die Möglichkeit spezielle Klassen, deren Eigenschaften und<br />
die Beziehungen zwischen diesen zu beschreiben. Grundsätzlich werden Daten<br />
in Ontologiesprachen formalisiert und auch RDFS ist eine Ontologiesprache.<br />
Alle weiteren Ontologiesprachen erweitern das Konzept RDFS und erhöhen so<br />
den Nutzen. Im nun folgenden Abschnitt wird näher auf Ontologien und die<br />
42
spezielle “Ontology Web Language” eingegangen. Alle Ontologiesprachen ber-<br />
uhen dabei auf dem RDF Datenmodell. 36<br />
2.3.5 Ontologien<br />
Das Transportieren von Bedeutung ist Ziel jeder Kommunikation. Dabei<br />
differieren oftmals die gedanklichen Verknüpfungen der verwendeten Worte bei<br />
Sender und Empfänger. In Standard-Situationen, wie zum Beispiel beim<br />
Überqueren einer Fußgängerampel oder in anderen stark reglementierten<br />
Abläufen, besteht kaum Klärungsbedarf hinsichtlich der verwendeten Zeichen<br />
oder des verwendeten Vokabulars. Treffen allerdings Sender und Empfänger in<br />
einem weniger stark reglementierten oder unterschiedliche interpretierbarem<br />
Kontext aufeinander, so müssen zuerst das unterschiedlich verwendete Voka-<br />
bular und die dahinterstehenden Bedeutungen abgeglichen werden.<br />
Während also mit Hilfe des Resource Description Frameworks (RDF) die Ei-<br />
genschaften von Ressourcen im World Wide Web in einer maschinenauswert-<br />
baren Form beschrieben werden können, und das Resource Description<br />
Framework Schema (RDFS) ein zusätzliches Konzept liefert, ein eigenes spezi-<br />
elles Vokabular zu definieren, so liefert das Konzept der Ontologien die Mög-<br />
lichkeit eigenständig lokal definierte Vokabulare gegeneinander abzugleichen.<br />
Der Begriff Ontologie stammt ursprünglich aus der Philosophie und ist dort eine<br />
philosophische Grunddisziplin der allgemeinen Metaphysik oder Lehre vom<br />
Sein. Die philosophische Ontologie lässt sich in eine formale und eine materi-<br />
elle Ontologie unterteilen, wobei die materielle Ontologie vom organischen Auf-<br />
bau der Welt als Gegenstand allgemeiner Klassifizierungen handelt und die Ele-<br />
mente des Seins aufgrund bestimmter Merkmale nach Einzelerscheinungen,<br />
Gruppen, Arten und Gattungen ord<strong>net</strong>”. 37 In der allgemeinen Informatik sind On-<br />
tologien kein neues Konzept und es existieren viele verschiedene Definitionen.<br />
Nach dem von Thomas R. Gruber verfassten Artikel “A translation approach to<br />
portable ontology specifications” aus der wissenschaftlichen Zeitschrift “Know-<br />
ledge Acquisition” auf den Seiten 199-200 aus dem Jahr 1993 definiert die<br />
36 Frank Manola, Eric Miller (2004): RDF Primer. W3C Recommendation 10 February 2004. Unter Mitarbeit<br />
von Brian McBride. Herausgegeben von W3C-Konsortium. Online verfügbar unter<br />
http://www.w3.org/TR/rdf-primer/, zuletzt geprüft am 24.04.08.<br />
37 Brockhaus (Hg.) (1998): Die Enzyklopädie: in 24 Bänden.<br />
43
allgemeine Informatik Ontologien als “An ontology is an explicit specification of<br />
an conceptualization”. Die explizite Spezifikation bedeutet in diesem Zusam-<br />
menhang, dass der Konzepttyp und die Nebenbedingungen erklärend definiert<br />
sind und so eine Verarbeitung durch Maschinen gewährleistet ist. Die Konzep-<br />
tualisierung bedeutet in diesem Rahmen ein gemeinsames Verständnis eines<br />
Anwendungsbereiches, getragen von einer Gruppe von Menschen. Steht also<br />
die Ontologie in der klassischen Informatik für ein gemeinsame Begriffsystem,<br />
so wird den Ontologien im semantischen Web eine besondere Rolle zuteil,<br />
nämlich die Ontologie als Technologie.<br />
Durch die dezentrale Natur des Inter<strong>net</strong>s bestehen kaum Einschränkungen<br />
hinsichtlich der Formulierung von Vokabularen (RDF-Instanzen) und den damit<br />
zusammenhängenden Schemata (RDFS). Im Verlauf der Zeit entstehen somit<br />
zwangsläufig unterschiedliche Beschreibungsinseln, die nicht homogene Voka-<br />
bulare verwenden. Dieses Problem möchte das W3C-Konsortium mit seiner<br />
Empfehlung (Recommendation) zur “Ontology Web Language” (OWL) aus dem<br />
Jahre 2004 lösen. Dazu werden solche domänenspezifische Vokabulare von<br />
Begriffen um die formalisierten Beziehungen zwischen den Begriffen ange-<br />
reichert, wodurch eine Ontologie entsteht, die also im Kern eine formale,<br />
maschinell auswertbare Definition der grundlegenden Konzepte eines Wissens-<br />
gebietes sowie den Beziehungen zwischen den Konzepten darstellt. Dadurch<br />
entstehen einige Synergien zwischen verschiedenen Domänen:<br />
� Es können identische Inhalte aus unterschiedlichen Quellen oder spezi-<br />
eller unterschiedlichen Identifikatoren verknüpft werden. So können bei-<br />
spielsweise spezielle Vokabulare von bereits bestehenden Vokabularen<br />
profitieren.<br />
� Das automatische, logische Erschließen (reasoning) von neuen Zusam-<br />
menhängen wird ermöglicht. Software Agents ziehen logische Schlüsse<br />
aufgrund der in der Ontologie definierten Ableitungsregeln.<br />
44
� Software Agents können Grundfunktionalitäten erschließen und zu einem<br />
besseren Service zusammenfassen.<br />
Durch diese Brückenschlag zwischen RDF-basierter Identifikation von Res-<br />
sourcen mittels URIs und der dezentralen Herstellung von Bedeutungszusam-<br />
menhängen zwischen den Ressourcen mittels Ontologien kann das Problem<br />
der isolierten Beschreibungsinseln gelöst werden. 38<br />
Bedeutung von Ressourcen kann also eindeutig mittels dem Resource Descrip-<br />
tion Framework (RDF) beschrieben werden, die z.B. für den E-Commerce<br />
benötigten domänen-spezifischen Vokabulare können mittels Resource De-<br />
scription Framework Schema (RDFS) definiert und zugänglich gemacht werden<br />
und der Abgleich zwischen diesen domänen-spezifischen Vokabularen gelingt<br />
über Ontologien. Im nächsten Abschnitt wird kurz auf die spezielle Program-<br />
miersprache “Ontology Web Language” (OWL) zur Umsetzung von Ontologien<br />
eingegangen.<br />
2.3.6 Ontology Web Language (OWL)<br />
Wie bereits erwähnt, wurde die “Web Ontology Language” am 10. Februar 2004<br />
eine offizielle Empfehlung des W3C-Konsortiums und somit allgemein verfüg-<br />
bare semantische Auszeichnungssprache, um Ontologien zu veröffentlichen<br />
und zu teilen. 39 Dabei hatten sowohl Forschungsgruppen aus den USA als auch<br />
aus Europa den Bedarf nach einer Auszeichungssprache zur Modellierung von<br />
Ontologien identifiziert. So entstand eine Initiative zur Definition einer reich-<br />
haltigeren Sprache, um Ontologien auszudrücken, die sich DAML+OIL nennt.<br />
Sie bildete sich aus dem amerikanischen Vorschlag DAML+ONT und der<br />
europäischen Sprache OIL. Somit wurde die Programmiersprache DAML+OIL<br />
Aussgangspunkt für die W3C Web Ontology Working Group 40 beim Definieren<br />
38<br />
Wolfgang Dostal, Mario Jeckle, Werner Kriechbaum (2004): Semantik und Web Services: Vokabulare<br />
und Ontologien. In: Java Spektrum, H. 3, S. 51–54.<br />
39<br />
Sean Bechhofer, Frank van Harmelen, Jim Hendler, Ian Horrocks, Deborah L. McGuinness, Peter F.<br />
Patel-Schneider, Lynn Andrea Stein (2004): OWL Web Ontology Language Reference. W3C Recommendation<br />
10 February 2004. Unter Mitarbeit von Mike Dean, Guus Schreiber. Online verfügbar unter<br />
http://www.w3.org/TR/2004/REC-owl-ref-20040210/, zuletzt geprüft am 26.04.2008.<br />
40<br />
diverse Teilnehmer: Web-Ontology (WebOnt) Working Group. Online verfügbar unter http://www.w3.org/<br />
2001/sw/WebOnt/, zuletzt geprüft am 26.04.2008.<br />
45
der Ontology Web Language. Anschließend wurden eine Reihe von Anfor-<br />
derungen an eine Ontology Web Language aufgestellt.<br />
Diese Hauptanforderungen sind:<br />
� eine gut definierte Syntax<br />
� effiziente Unterstützung beim automatischen Schlussfolgern<br />
� eine formale Semantik und<br />
� ausreichende Kraft zur Abbildung der Ontologien<br />
Aus der Problematik heraus all diesen Anforderungen und um den Mängel des<br />
Ressource Description Frameworks (RDF) und des Ressource Description<br />
Framework Schema (RDFS) gerecht zu werden, definierte die W3C Web Onto-<br />
logy Working Group drei unterschiedliche (Unter-) Sprachen, die jeweils aus-<br />
gerichtet sind, verschiedene Aspekte dieser Anforderungen zu erfüllen. Die<br />
“OWL Full”, die “OWL DL”, wobei DL für “Description Logic” steht, und die<br />
“OWL Lite”.<br />
OWL Full. Dies ist die vollständigste Sprache und gebraucht sämtliche Model-<br />
lierungsprimitive. Sie ermöglicht die umfassende Interpretation der vollständi-<br />
gen OWL-Modellierungsprimitive entsprechend der Möglichkeiten, die durch<br />
RDF vorgegeben werden. Dabei ist OWL Full absolut aufwärtskompatibel zu<br />
RDF, d.h. jedes zulässige RDF-Dokument entspricht einem zulässigen OWL-<br />
Dokument. Gleichzeitig liegt hierin auch ein Nachteil von OWL Full. Die Aus-<br />
drucksmächtigkeit ist so groß, dass nicht jede OWL-Full-Ontologie hinsichtlich<br />
ihrer Schlussfolgerungsmöglichkeiten überhaupt comtergestützt verwendet wer-<br />
den kann.<br />
OWL DL. Diese Sprache zur Formulierung von Ontologien umfasst auch die<br />
vollständigen OWL-Modellierungsprimitive. Diese können jedoch nur einge-<br />
46
schränkt verwendet und interpretiert werden. Damit wird das Ziel verfolgt, dass<br />
ein OWL DL Programmiercode hinsichtlich seiner Schlussfolgerungen noch in<br />
endlicher Zeit ausgeführt werden kann. Diese Beschränkungen gehen jedoch<br />
wiederum zu Lasten einer vollständigen Kompatibilität mit RDF und RDFS.<br />
OWL Lite. OWL Lite ist die einfachste Ontology Web Language und ist darauf<br />
beschränkt, Hierarchien von Konzepten mit einfachen Beschränkungsei-<br />
genschaften (Nebenbedingungen) auszudrücken. OWL Lite dient hauptsächlich<br />
der schnellen Integration bereits existierender Klassifikationssysteme. 41<br />
Sicherlich ist die Ontology Web Language nicht die letzte Entwicklung zur Ab-<br />
bildung von Ontologien im semantischen Web. Eine Reihe von weiteren<br />
benötigten Funktionen sind bereits identifiziert und werden innerhalb der Ent-<br />
wicklergemeinschaft diskutiert. Nur so ist Weiterentwicklung möglich. Zurzeit<br />
aber bestehen zum Beispiel noch Probleme beim Import von Ontologien.<br />
Der Import fremder Ontologien wird eine Grundfunktion im semantischen Web<br />
sein. Zurzeit ist die Importfunktion der Ontology Web Language sehr trivial,<br />
denn sie erlaubt nur das Importieren einer vollständigen Ontolgie, die durch<br />
eine Lokation spezifiziert ist. Das bedeutet, selbst wenn man nur einen kleinen<br />
Teil einer fremden Ontologie nutzen möchte, ist man gezwungen, die komplette<br />
Ontologie zu importieren. 42<br />
2.3.7 Logik und Schlussfolgerungen<br />
Die bis hierhin behandelten Themen des semantischen Schichtenmodells han-<br />
delten allesamt von bereits erforschten Technologien, die es ermöglichen sol-<br />
len, Daten im World Wide Web von Maschinen interpretieren und weiterver-<br />
arbeiten zu lassen. Diese Themen sind eng verbunden mit dem Gebiet der Wis-<br />
sensrepresentation, also Wissen über die Inhalte von Inter<strong>net</strong>ressourcen, Wis-<br />
sen über die Konzepte einer Domäne und ihrer Beziehungen untereinander. Zu<br />
41 Lars U. Dittmann (2007): OntoFMEA. Ontologiebasierte Fehlermöglichkeits- und Einflussanalyse. Information<br />
- Organisation - Produktion. 1. Aufl. Herausgegeben von Hans Corten, Michael Reiß, Claus<br />
Steinle, Stephan Zelewski: Deutscher Universitätsverlag (DUV), S. 108–109.<br />
42 Frank Hermelen, Grigoris Antoniou (2004): A Semantic Web Primer. Herausgegeben von The MIT<br />
Press.<br />
47
den bis hierhin beschriebenen Technologien existieren bereits W3C-Recom-<br />
mendations, sie sind also offiziell festgelegte und festgesetzte Standards. Die<br />
nun folgenden Schichten “Logic”, “Proof” und “Trust” stellen die aktuelle<br />
Herausforderung der Forschung und der Entwicklergemeinschaft auf dem Weg<br />
zum gewünschten Automatisierungsgrad des semantischen Webs dar und han-<br />
deln eher vom Regelwerk automatischer Schlussfolgerungen und von der<br />
Glaubwürdigkeit verschiedener Ressourcen als von Daten, deren Interpretation<br />
und Metabeschreibung.<br />
Wissensrepresentation als Teilgebiet der Logik wurde schon lange vor der<br />
Entstehung des Inter<strong>net</strong>s im Gebiet der künstlichen Intelligenz und davor in der<br />
Philosophie erforscht. Zurückzuführen ist die Logik auf die antiken Griechen.<br />
Aristoteles, einer der bekanntesten Philosophen, gilt als Vater der Logik, und<br />
die Logik bildet auch heute noch die Grundlage der Wissensrepresentation. In<br />
unserem Schichtenmodell soll mittels der Logik-Schicht neues Wissen durch<br />
automatisches Schlussfolgern aus den vorhandenen Aussagen der Ontologie-<br />
Konzepte entstehen. So dienen die Fakten aus Ontologien als Grundlage für<br />
diese logischen Schlussfolgerungen, die vor allem für die Software Agents eine<br />
bedeutende Rolle spielen werden. Es gibt eine Vielzahl an Logik-Konzepten,<br />
die das automatische Schlussfolgern ermöglichen können. Nachfolgend werden<br />
der Einfachheit halber zwei dieser Konzepte beleuchtet: Die einfache Aus-<br />
sagenlogik (proposotional logic) und die Prädikatenlogik erster Ordnung (first-<br />
order predicate logic).<br />
Die Aussagenlogik. Sie ist die einfachste Form der Logik und ermöglicht es,<br />
simple semantische Wahrheiten über die Welt auszudrücken, also Aussagen<br />
über die Welt zu treffen. Diese Aussagen können in der einfachen Aussagenlo-<br />
gik “wahr” oder “falsch” sein. Innerhalb von bestimmten Logik-Konzepten<br />
kommt noch der Wert “unbekannt” hinzu. Die Aussagen bestehen dabei aus<br />
einfachen Sätzen ohne Junktoren (“und”, “oder”, “nicht”, “wenn...dann”). Beis-<br />
piele für eine Aussage in der einfachen Aussagenlogik sind “es reg<strong>net</strong>” oder<br />
“Martin hat Fieber”. Durch die Integration der Aussagenlogik wird es möglich,<br />
zusätzliche Informationen zu hinterlegen. So könnte es bei der Zusammen-<br />
führung zweier Datenbanken sehr hilfreich sein, bestimmte gleichartige Ele-<br />
48
mente dieser Datenbank auch als gleichartig zu kennzeichen. Mittels der ein-<br />
fachen Aussagenlogik könnten – ähnlich zum Konzept der Ontologien – zwei<br />
unterschiedliche Begriffe mit der gleichen Bedeutung, zum Beispiel bei einer<br />
französischen und einer deutschen Datenbank die Begriffe “Stockwerk” und<br />
“étage”, miteinander verknüpft werden. Ein Nachteil der Aussagenlogik ist al-<br />
lerdings, dass keine Aussagen über Individuen getroffen werden können, weil<br />
die Granularität dafür nicht fein genug ist. Die Basis-Einheit bei der Aussagenlo-<br />
gik ist stets die Aussage, egal ob “wahr” oder “falsch”. Abstrakt dargestellt: “Die<br />
Aussage, die für A steht, ist falsch” oder “Die Aussage, die für A steht, ist wahr”.<br />
Durch die Verwendung dieser Basis-Einheit “Aussage” ist es nicht möglich,<br />
spezielle Klassen oder Eigenschaften aus der Aussagenlogik zu entnehmen.<br />
Kompliziertere Aussagen oder Bündel von Aussagen, die durch den Gebrauch<br />
von Bindegliedern wie “und” oder “oder” entstehen, können mithilfe der ein-<br />
fachen Aussagenlogik nicht ausgedrückt werden. Hier kann die Prädikatenlogik<br />
erster Ordnung Abhilfe schaffen.<br />
Die Prädikatenlogik erster Ordnung. Sie ermöglicht das Ausdrücken feinerer<br />
semantische Unterschiede und ist eine Erweiterung der einfachen Ausagenlo-<br />
gik. Prädikate können in der Grammatik und der Logik dazu verwendet werden,<br />
Aussagen über etwas zu treffen. Bei der Prädikatenlogik erster Ordnung<br />
können sich unterschiedliche Prädikate auf das gleiche Individuum beziehen,<br />
was in der einfachen Aussagenlogik nicht möglich ist. So wird es möglich, so-<br />
wohl Eigenschaften also auch Individuen mittels der Prädikatenlogik abzu-<br />
bilden. Eine weitere Stärke der Prädikatenlogik ist die Verwendung so genan-<br />
nter Quantifikatoren, mit denen ausgesagt werden kann, auf wieviele Individuen<br />
ein Prädikat zutrifft. Es gibt viele verschiedene Quantifikatoren, doch für se-<br />
mantische Zwecke sind zwei von besonderer Bedeutung: Der Universalquanti-<br />
fikator und der Existenzialquantifikator. Der Universalquantifikator sagt aus,<br />
dass ein Prädikat auf alle Individuen zutrifft und der Existenzialquantifikator sagt<br />
aus, dass ein Prädikat auf mindestens ein Individuum zutrifft. Der Univer-<br />
salquantifikator verankert so eine gekennzeich<strong>net</strong>e Instanz-Variable innerhalb<br />
einer Aussage, so dass, egal wo und in welchem Prädikat diese Variable ver-<br />
wendet wird, sie in jeder möglichen Substitution als “wahr” anerkannt wird.<br />
Damit wäre es möglich, Anfragen zu stellen, wie etwa “Zeige mir alle Bars in<br />
49
Köln, die lateinamerikanische Musik spielen und heute Happy-Hour haben”. Mit-<br />
tels der Prädikatenlogik erster Ordnung können also sehr feine logische und se-<br />
mantische Unterschiede ausgedrückt und formalisiert werden. Die se-<br />
mantischen Sprachen DAML+OIL und OWL, mit deren Hilfe Ontologien<br />
entstehen, verwenden eine ähnliche Logik als Grundlage, die aber nicht so<br />
kompliziert ist wie die Prädikatenlogik erster Ordnung. Genau diese Logik als<br />
Grundlage macht die Verarbeitung durch Maschinen möglich. Die Maschine re-<br />
spektive der Computer erkennt diese auf Logik fundierten Modelle und kann sie<br />
Stück für Stück nachvollziehen. 43<br />
Zusammengefasst dienen also die Fakten der Ontologien als Grundlage für<br />
automatisierte, logische Schlussfolgerungen auf Basis eines festgelegten Re-<br />
gelsystems. Das Schlussfolgerungssystem, ein so genannter “Reasoner”, kann<br />
dann aus den Regeln und Informationen der Ontologien Schlussfolgerungen<br />
ziehen. Somit kann mittels einer Inferenzmaschine (inference engine) neues<br />
Wissen von bereits existierendem, spezifiziertem Wissen abgeleitet werden. Es<br />
entsteht also aus implizitem Wissen explizites Wissen. Bis zum heutigen Zeit-<br />
punkt arbeiten die Forscher und die Entwicklungsgemeinschaft des se-<br />
mantischen Webs an einer Universalsprache zur Darstellung von solchen auf<br />
Logik basierender Regelsysteme. Während die Logik-Schicht die Informationen<br />
und Regeln der Ontologien ausliest und daraus schlussfolgern kann, hat die<br />
nächste Schicht die Aufgabe, die von der Logik-Schicht aufgestellten<br />
Schlussfolgerungen zu bestätigen oder zu widerlegen.<br />
2.3.8 Beweise, Vertrauen und digitale Signaturen<br />
Auch die auf der Logik-Schicht aufbauenden Schichten “Proof” und “Trust” sind<br />
zurzeit lediglich wissenschaftliche Konzepte, an denen die Gemeinschaft der<br />
semantischen Forscher arbeitet. Wenn der in der Einleitung beschriebene Auto-<br />
matisierungsgrad von Software Agents erreicht werden will, benötigen die Soft-<br />
ware Agents ein Werkzeug, um die in der Logik-Schicht aufgestellten logischen<br />
Regeln zu prüfen. Dies gilt im Übrigen nicht nur für die in der Logik-Schicht<br />
43 Michael C. Daconta (2003): The Semantic Web. A Guide to the Future of XML, Web Services, and<br />
Knowlege Management. Unter Mitarbeit von Kevin T. Smith Leo. J. Obrst. Herausgegeben von WILEY,<br />
S. 226–229.<br />
50
aufgestellten automatischen Schlussfolgerungen. Wie schon zuvor erläutert,<br />
ergeben sich Regeln bereits aus dem Verhältnis, wie einzelne Klassen und Ei-<br />
genschaften im Ressource Description Framework, im Ressource Description<br />
Framework Schema und in der Ontology Web Language zueinander in Be-<br />
ziehung stehen. Die Beweis-Schicht (proof layer) hat nun die Aufgabe, das<br />
World Wide Web so lange nach Regeln und Ontologien zu durchsuchen, bis<br />
diese aufgestellten Behauptungen mithilfe einer heuristischen Maschine (heur-<br />
istic engine) bestätigt oder widerlegt werden können. Heuristik bezeich<strong>net</strong> die<br />
Kunst, wahre Aussagen zu finden, im Gegensatz zur Logik, die lehrt, wahre<br />
Aussagen zu begründen. Programme, die diese Regeln auswerten können,<br />
benötigen wiederum spezielle Programmiersprachen, sogenannte “proof lan-<br />
guages” (Beweis-Sprachen). Erste Ansätze für eine solche Beweis-Sprache<br />
sind XMLEncryption und XMLSignature. Greifbare Anwendungen sind bis zum<br />
heutigen Zeitpunkt nicht entwickelt. 44<br />
Die Logik-Schicht ermöglicht es also jedem, Regeln zu veröffentlichen.<br />
Gleichzeitig sollen die Logik- und die Beweisschicht dafür Sorge tragen, dass<br />
die logische Schlüssigkeit zwischen den Daten im semantischen Web erhalten<br />
bleibt. Im semantischen Web kann jeder alles aussagen, also können auch in-<br />
haltlich falsche Aussagen getroffen werden. Die Vertrauens-Schicht (trust layer)<br />
soll diese inhaltlichen Falschaussagen von vornherein unterbinden. Dabei geht<br />
es weniger darum zu verhindern, dass jeder das aussagen und veröffentlichen<br />
kann, was er möchte. Vielmehr geht es darum, den Software Agents<br />
Werkzeuge an die Hand zu geben, mit denen sie selbst entscheiden können,<br />
welchen Quellen und anfragenden Agents sie Glauben schenken, also ver-<br />
trauen oder nicht. Verschiedene Ansätze wurden bis dato entwickelt.<br />
Das W3C-Konsortium konzentriert sich bei der Umsetzung des Konzepts der<br />
Vertrauens-Schicht vor allem auf technische Standards wie etwa Verschlüsse-<br />
lungsverfahren und digitale Signaturen. Verschlüsselungsverfahren sind der<br />
Kryptographie zuzuordnen, der Wissenschaft von der Ver- und Entschlüsselung<br />
44 Dr. rer. nat. Harald Sack (Wintersemester 2006/2007): Vorlesungsmaterial Semantic Web. Web of<br />
Trust. Herausgegeben von Institut für Informatik. Friedrich Schiller Universität Jena. Online verfügbar<br />
unter http://www.db-thueringen.de/servlets/DerivateServlet/Derivate-10503/semweb-08_WebOf-<br />
Trust.pdf, zuletzt geprüft am 01.05.2008.<br />
51
von Informationen. 45 Die Kryptographie unterscheidet zwischen symmetrischen<br />
und asymmetrischen Verschlüsselungsverfahren, wobei für die Zwecke der Ver-<br />
trauens-Schicht vor allem die asymmetrischen Verschlüsselungsverfahren eine<br />
bedeutende Rolle spielen. Egal wie komplex das Verschlüsselungsverfahren<br />
auch ist, hängt die Sicherheit insbesondere von einem sicheren Austausch der<br />
Daten ab. Dieses Problem hat die asymmetrische Verschlüsselung erkannt. Sie<br />
verwendet einen geheimen Schlüssel, der beim Besitzer verbleibt, und einen öf-<br />
fentliche Schlüssel, der von jedem genutzt werden kann. Öffentlicher und ge-<br />
heimer Schlüssel dienen dabei zum gegenseitigen Ver- und Entschlüsseln. Die<br />
digitale Signatur ist auch ein kryptographisches Verfahren, das auf den be-<br />
schriebenen asymmetrischen Verschlüsselungsverfahren beruht. An beliebige<br />
Daten wird eine kryptographische Zahl angehängt, die den Urheber der Na-<br />
chricht eindeutig identifiziert. Die asymmetrische Verschlüsselung garantiert,<br />
dass auch tatsächlich einzig der Empfänger in der Lage ist, die Nachricht zu<br />
entschlüsseln. Wie aber kann der Empfänger sicher gehen, dass die Nachricht<br />
auch von dem angegebenen Absender stammt und nicht beim Austauschen<br />
verfälscht worden ist? Dazu wird das Verschlüsselungsverfahren – wie oben<br />
beschrieben – umgedreht, in dem der Sender die Nachricht mit dem persön-<br />
lichen, geheimen Schlüssel codiert und der Empfänger die Nachricht mit dem<br />
öffentlichen Schlüssel decodieren kann. 46<br />
Einen anderen Ansatz verfolgen die Forscher des semantischen Webs an der<br />
Stanford University in Kalifornien. Sie setzten auf ein Verfahren, dass die<br />
soziale Komponente des Vertrauens im semantischen Web stärker betont, so<br />
genannte “trust-<strong>net</strong>works”-Verfahren. Diese Vertrauens<strong>net</strong>zwerke basieren auf<br />
dem sozialen Prinzip, dass wir Menschen oder auch anderen Ressourcen, die<br />
wir kennen, eher vertrauen, als solchen, die wir nicht kennen. In der Praxis kön-<br />
nte man jene verschiedenen Vertrauensebenen aus den sozialen Netzwerken,<br />
an denen ein Benutzer teilnimmt, ableiten, oder besser noch aus dezentralen<br />
semantischen Freundes<strong>net</strong>zwerken, wie etwa Friend of a Friend (FOAF), auf<br />
das später noch näher eingegangen wird. So kann zum einen Vertrauen über<br />
45 Brockhaus (Hg.): Kompakt Wissen von A bis Z in 5 Bänden. 3. Aufl. 5 Bände. Wiesbaden.<br />
46 Dr. rer. nat. Harald Sack (Wintersemester 2006/2007): Vorlesungsmaterial Semantic Web. Web of<br />
Trust. Folie 8-25. Herausgegeben von Institut für Informatik. Friedrich Schiller Universität Jena. Online<br />
verfügbar unter http://www.db-thueringen.de/servlets/DerivateServlet/Derivate-10503/semweb-08_WebOfTrust.pdf,<br />
zuletzt geprüft am 01.05.2008.<br />
52
die Zwischenstationen im Netzwerk hergeleitet werden: A vertraut B, B vertraut<br />
C, also kann A dem C vermutlich auch vertrauen. Zum anderen kann die Ver-<br />
trauensstufe auch über die Anzahl der Zwischenstationen zumindest grob<br />
eingeschätzt werden. 47 Umgekehrt würde man dem eigenen Netzwerk je nach<br />
Gruppierung (Freunde, Bekannte, Arbeitskollegen, Projektteams etc.) bestim-<br />
mte Rechte vergeben und vertrauenswürdige Personen und Quellen<br />
kennzeichnen, sodass die Software Agents bei ausgehenden oder eingehenden<br />
Anfragen diese personalisierte Einstufung verwenden können.<br />
Ein weiterer Ansatz zur Schaffung von Vertrauen im semantischen Web sind<br />
sogenannte “open rating systems”, also offene Bewertungssysteme, mit deren<br />
Hilfe die Reputation von Menschen, Gruppen und anderen Quellen eingestuft<br />
werden kann. Dazu werden unterschiedlichste Bewertungen aus verschieden-<br />
sten Quellen aggregiert und zu einem einheitlichem Ranking zusammengefasst.<br />
Neben dieser Aggregation wird ein solches Bewertungssystem auch die unter-<br />
schiedlichen Bewertungen nach ihrer Qualität einstufen müssen, also über eine<br />
Art Meta-Ranking verfügen. 48<br />
Vermutlich würde ein hybrider Ansatz, der die technische und soziale Kompon-<br />
ente des Vertrauens vereint und sich verschiedenster Bewertungssysteme<br />
bedient, die wirksamste Umsetzung darstellen. Das Zusammenwirken der<br />
Konzepte hinter den Schichten “Logic”, “Proof” und “Trust” wird auch als “Web<br />
of Trust” bezeich<strong>net</strong>, also ein Inter<strong>net</strong>, in dem mit wenigen, gezielten Schritten<br />
Vertrauensbeziehungen zwischen beliebigen Software Agenten beschrieben<br />
werden können.<br />
2.3.9 Entwicklung des Schichtenmodells<br />
Das ursprüngliche Schichtenmodell, das Tim Berners-Lee am 06. Dezember<br />
2000 auf der Konferenz “XML 2000” präsentierte, hat die Fortentwicklung des<br />
47 Jochen Notholt (2005): Die Zukunft des Semantic Web. Herausgegeben von Prof. Dr. Maximilian Herberger.<br />
Universität des Saarlandes. (JurPC Web-Dok., 66/2005). Online verfügbar unter http://www.jurpc.de/aufsatz/20050066.htm#fn0,<br />
zuletzt geprüft am 01.05.2008.<br />
48 Dr. rer. nat. Harald Sack (Wintersemester 2006/2007): Vorlesungsmaterial Semantic Web. Web of<br />
Trust. Herausgegeben von Institut für Informatik. Friedrich Schiller Universität Jena, S. 55–56. Online<br />
verfügbar unter http://www.db-thueringen.de/servlets/DerivateServlet/Derivate-10503/semweb-08_WebOfTrust.pdf,<br />
zuletzt geprüft am 01.05.2008.<br />
53
semantischen Webs überhaupt erst ermöglicht. Denn anstatt die Idee des se-<br />
mantischen Webs als abstraktes Konstrukt zu beschreiben, hat er eine konkrete<br />
Architektur von aufeinander aufbauenden Technologien vorgeschlagen, die die<br />
Entwicklergemeinschaft dazu befähigt, die verschiedenen Technologien zu<br />
diskutieren, Fehler zu erkennen und Berichtigungen vorzunehmen. Er hat<br />
sozusagen einen Orientierungsraum geschaffen, der Dissens und Konsens<br />
fördert und so die Entwicklung beschleunigt. So wurden inzwischen viele<br />
modifizierte Versionen des semantischen Schichtenmodells von unterschied-<br />
lichen Forschungsgruppen veröffentlicht und innerhalb der Entwicklerge-<br />
meinschaft zur Diskussion gestellt. Einige Verbesserungsvorschläge wurden<br />
übernommen und an das Schichtenmodell adaptiert, einige wurden wieder ver-<br />
worfen. Die Standardisierung von Technologien ist ein entscheidender Schritt<br />
zur allgemeinen Verbreitung der semantischen Technologien und somit zur Ver-<br />
wirklichung des semantischen Webs. Ein Schichtenmodell vorzuschlagen, dass<br />
einzelne Technologien präsentiert und zur Diskussion stellt, ist ein hervorra-<br />
gender Weg, die Technologien von der Allgemeinheit, insbesondere aber auch<br />
von den an das W3C-Konsortium angeschlossenen Universitäten und Un-<br />
ternehmen prüfen zu lassen und sich so letztendlich schneller auf einen ge-<br />
meinsamen Standard zu einigen. Im Jahre 2007 hat das W3C-Konsortium<br />
schließlich eine neue Version des Schichtenmodells veröffentlicht, in das die<br />
Erkenntnisse aus dem wissenschaftlichen Diskurs der vergangenen Jahre<br />
eingeflossen sind. Die folgende Abbildung zeigt die aktuelle, offizielle Version<br />
des semantischen Schichtenmodells.<br />
54
Abbildung 11: Latest Layercake: Ivan Herman (Semantic Web Activity Lead) (2008):<br />
W3C Semantic Web Activity. Unter Mitarbeit von Tim Berners-Lee, Dan Connolly ,<br />
Sandro Hawke, Ivan Herman, Eric Prud'hommeaux, and Ralph Swick. Heraus-<br />
gegeben von W3C-Konsortium. Online verfügbar unter<br />
http://www.w3.org/2007/03/layerCake.png, zuletzt geprüft am 29.04.2008.<br />
Wirklich neu hinzugekommen sind in diesem Schichtenmodell das “Rule Inter-<br />
change Format (RIF)” und die Anfragesprache “SPARQL”. “IRI” stellt eine Er-<br />
gänzung des Uniform Resource Identifiers dar.<br />
IRI steht für “Internationalized Resource Identifiers” und ist lediglich ein zusätz-<br />
liches Protokoll als Ergänzung zum Uniform Resource Identifier (URI). Diese in-<br />
55
ternationalisierte Form der URIs erweitern die erlaubten Zeichen um fast alle<br />
Zeichen des Universal Character Sets (Unicode/ISO10646). 49<br />
SPARQL ist eine der aktuellsten W3C-Recommendations vom 15. Februar<br />
2008. SPARQL ist eine Anfragesprache für die in RDF spezifizierten Informa-<br />
tionen und die Darstellung dieser Informationen. Die Anfragesprache lässt kom-<br />
plexere Anfragen zu und ermöglicht verschiedenste Darstellungen und Filter bei<br />
der Ausgabe – was so vorher nicht ohne weiteres möglich war. 50<br />
RIF steht für “Rule Interchange Format” und ist zurzeit noch kein offizieller<br />
Standard. Die Arbeitsgruppe des W3C-Konsortiums entwickelt eine allge-<br />
meingültiges Format zum Austausch von Regeln und deren Erweiterungen, die<br />
es gemeinsam ermöglichen sollen, Regeln und die dadurch möglichen automat-<br />
ischen Schlussfolgerungen zwischen verschiedenen Regelsprachen zu überset-<br />
zen und somit bestimmte Regelsprachen von einem Regelsystem zum anderen<br />
zu transferieren. 51<br />
In dieser Weise arbeitet sich das W3C-Konsortium langsam in Richtung voll-<br />
ständiger Verwirklichung des semantischen Webs vor. Ohne das ursprüngliche<br />
Schichtenmodell wäre kein wissenschaftlicher Diskurs und somit kein Fortschritt<br />
in der Entwicklung zum finalen Modell entstanden. Je mehr wissenschaftliche<br />
Auseinandersetzung, desto mehr Konsens. Je eher Konsens, desto schneller<br />
wird eine Technologie zum allgemeingültigen W3C-Standard. Je mehr allge-<br />
meingültige Standards verfügbar sind, desto schneller werden Unternehmen die<br />
Technologien in ihre Systeme integrieren und das semantische Web Wirklich-<br />
keit werden.<br />
49<br />
M. Duerst (2003): Internationalized Resource Identifiers (IRIs). Unter Mitarbeit von M. Suignard. Herausgegeben<br />
von W3C-Konsortium. Online verfügbar unter http://www.w3.org/International/iri-edit/draft-duerst-iri-04.txt,<br />
zuletzt geprüft am 01.05.2008.<br />
50<br />
Pascal Hitzler, Markus Krötzsch, Sebastian Rudolph, York Sure (2008): Semantic Web. Grundlagen. 1.<br />
Aufl.: Springer, S. 202–241.<br />
51<br />
Sandro Hawke (2005): Rule Interchange Format. Working Group Charter. Unter Mitarbeit von diversen<br />
Mitarbeitern. Herausgegeben von W3C-Konsortium. Online verfügbar unter http://www.w3.org/2005/rules/wg/charter.html,<br />
zuletzt geprüft am 04.05.2008.<br />
56
2.4 Evolution zum semantischen Web<br />
Der folgende Abschnitt beschreibt zum einen zwei in der Entwicklergemein-<br />
schaft diskutierte Umsetzungsszenarien zur Adaption des semantischen Webs<br />
an das bestehende World Wide Web und zum anderen gibt er eine grobe zeit-<br />
liche Einordnung, bis wann diese Adaption vollzogen sein wird. Im englischen<br />
Sprachgebrauch wird der Unterschied dieser Umsetzungsszenarien durch<br />
Groß- und Kleinschreibung untermalt. Der Bottom-Up Ansatz wird mit kleinen<br />
Anfangsbuchstaben geschrieben – “semantic web”. Der Top-Down Ansatz wird<br />
durch die Verwendung von goßen Anfangsbuchstaben kenntlich gemacht –<br />
“Semantic Web”.<br />
2.4.1 Der Bottom-Up Ansatz<br />
Alex Iskold, Autor des Technologie-Weblogs “Read/WriteWeb” und Gründer<br />
sowie Chief Executive Officer (CEO) von AdaptiveBlue, ein Unternehmen spezi-<br />
alisiert auf personalisiertes Browsing (das Durchstöbern von Inter<strong>net</strong>seiten), hat<br />
mit seinem Artikel “Semantic Web: Difficulties with the Classic Approach” vom<br />
19. September 2007 52 erstmalig das Umsetzungsszenario mit dem Namen “bot-<br />
tom-up approach” geprägt. Er beschreibt dieses Umsetzungsszenario als An-<br />
satz von unten nach oben, da bereits eine sehr große Menge an Informationen<br />
im World Wide Web existiert, die zur Umsetzung des semantischen Webs erst<br />
einmal semantisch codiert werden muss und die Technologien des se-<br />
mantischen Webs auf das bestehnde WWW aufgesetz werden. Er kritisiert weit-<br />
erhin, dass das manuelle Markieren mit Metadaten all jener bestehenden Daten<br />
eine nicht zu bewältigende Aufgabe sei. Eine schnelle Transformation der alten,<br />
nicht semantisch beschriebenen Daten, könne nur über einen zentralen se-<br />
mantischen Web Crawler, der diese Daten auffindet und automatisch mit se-<br />
mantischen Metabeschreibungen codiert, geschehen. Web Crawler werden<br />
heutzutage hauptsächlich von Suchmaschinen eingesetzt. Sie durchsuchen das<br />
World Wide Web nach neuen oder veränderten Inhalten, analysieren diese und<br />
stellen die Ergebnisse bei Suchanfragen dar. Alex Iskold bezweifelt stark, dass<br />
52<br />
Alex Iskold (2007): Semantic Web: Difficulties with the Classic Approach. Herausgegeben von ReadWriteWeb.<br />
Online verfügbar unter<br />
http://www.readwriteweb.com/archives/semantic_web_difficulties_with_classic_approach.php, zuletzt<br />
geprüft am 06.05.2008.<br />
57
es in naher Zukunft einen solchen automatischen Algorithmus geben wird, der<br />
die Bedeutung aus Text – in menschenähnlicher Weise – auslesen und daraus<br />
Metadaten für die zurzeit noch semantisch uncodierten Informationen ableiten<br />
kann. Im Übrigen stellt er fest, dass die Grundlagentechnologien Resource De-<br />
scription Framework (RDF) und die Ontology Web Language (OWL) zur se-<br />
mantischen Auszeichnung von bestehenden Webseiten viel zu komplex zum<br />
schnellen Erlernen seien. Der Nutzen für Unternehmen und Privatleute werde<br />
nicht ausdrücklich genug kommuniziert. So bestünde zu wenig Anreiz zum<br />
Erlernen der Technologien und zum Auszeichnen in semantischer Weise. Aus<br />
dieser Kritik heraus entwickelte der Autor das zweite Umsetzungsszenario –<br />
den Top-Down Ansatz.<br />
2.4.2 Der Top-Down Ansatz<br />
Der Top-Down Ansatz (top-down approach) beschreibt das umgekehrte Umset-<br />
zungsszenario – nämlich von oben nach unten. Mit diesem Ansatz sollen die<br />
Probleme des klassischen Bottom-up Ansatzes gelöst werden. Die technische<br />
Schwierigkeiten, wie das Erlernen der komplexen Technologien RDF und OWL<br />
und das manuelle Auszeichen aller existierender Webseiten, sowie die<br />
fehlenden Anreize für Unternehmen, Entwickler und Privatleute, sich diesen<br />
technischen Herausforderungen zu stellen, könnten mit diesem Ansatz umgan-<br />
gen werden. Bei dem Top-Down Ansatz handelt es sich um einen praktikabler-<br />
en Ansatz, der vom Marktpotenzial und den Erwartungen der Unternehmer an-<br />
getrieben wird sowie eher auf den Nutzen für den Endnutzer fokussiert ist, als<br />
der klassische Ansatz.<br />
Viele Unternehmen machen sich die semantischen Technologien zu Nutzen, in<br />
dem sie die im Inter<strong>net</strong> bestehenden, unstrukturierten Informationen ver-<br />
wenden, um so vertikale, semantische Webservices anzubieten. Vertikal<br />
bedeutet in diesem Zusammenhang, dass sich es sich um themenspezische<br />
Services handelt, wie beispielsweise die vertikale Suchmaschine “Spock”, die<br />
das Inter<strong>net</strong> nach allen erdenklichen Informationen über Personen durchsucht.<br />
Vertikal also, weil Spocks ausschließlich dazu verwendet werden kann, Infor-<br />
mationen über Personen zu finden. Spock weiß, wie Namen von Personen aus<br />
58
HTML herausgelesen werden, sucht nach weiteren in Verbindung stehenden In-<br />
formationen wie Geburtsdatum und Wohnort und kann die Beziehungen, in den-<br />
en Personen zueinander stehen, deuten und darstellen. Wird zum Beispiel nach<br />
Steve Jobs, dem Gründer und CEO von Apple, gesucht, zeigt Spock auch den<br />
Rivalen Bill Gates an. Spock ist eine gelungene Endnutzeranwendung, die sich<br />
mit ihrem Zwitterdasein sowohl der Vorteile des semantischen Webs bedient als<br />
auch die bestehenden, unstrukturierten Informationen im gegenwärtigen Inter-<br />
<strong>net</strong> zu nutzen weiß. 53<br />
Der Top-Down Ansatz ist im Grunde genommen nichts anderes als die Verwirk-<br />
lichung des semantischen Webs durch nützliche, von Unternehmen entwickelte<br />
und auf Profit ausgerichetet vertikale, teilweise semantische Webservices. Un-<br />
ternehmen greifen die semantischen Technologien auf, weil sie sich davon<br />
Profit versprechen und entwickeln deswegen auf den Kundennutzen aus-<br />
gerichtet Webservices. Wo möglich, verwenden sie bereits semantische Tech-<br />
nologien und überbrücken so die zeitliche Lücke bis zur vollen Verwirklichung<br />
des semantischen Webs.<br />
53 Alex Iskold (2007): Top-Down: A New Approach to the Semantic Web. Herausgegeben von ReadWrite-<br />
Web. Online verfügbar unter http://www.readwriteweb.com/archives/the_top-down_semantic_web.php,<br />
zuletzt geprüft am 06.05.2008.<br />
59
2.4.3 Der hybride Ansatz<br />
Das von Alex Iskold gezeich<strong>net</strong>e Bild verwendet nur die Farben Schwarz und<br />
Weiß. In der Praxis werden sich beide beschriebene Ansätze vermischen. Auch<br />
wenn die Kritik am klassischen Bottom-Up Ansatz verständlich und teilweise be-<br />
gründet ist, befinden wir uns in einer Übergangszeit zwischen zwei Standards.<br />
Damit geht zwangsläufig einher, dass ein Teil der Inter<strong>net</strong>nutzer und Unterneh-<br />
men die neuen Standards, insbesondere die Standards zur Verwirklichung des<br />
semantischen Webs, noch nicht verwendet, weil ihnen zurzeit der klare Nutzen<br />
fehlt. Andere Unternehmen aber erkennen den Nutzen und verwenden die<br />
neuen Standards bei ihren Projekten und Geschäften. Je früher das Thema in<br />
der allgemeinen Öffentlichkeit und vor allem in Forschung und Ausbildung mehr<br />
Gehör findet, desto eher wird ein Bewusstsein für die neuen Technologien und<br />
Standards geschaffen. Universitäten vermitteln dann das nötige Wissen und<br />
Unternehmen verwenden semantische Technologien. Der Bottom-Up Ansatz ist<br />
also eher als Prozess zu verstehen und ist schwerfälliger als der Top-Down An-<br />
satz.<br />
Der Top-Down Ansatz betont die Verwirklichung des semantischen Webs vom<br />
Markt her. Neue Technologien erlangen selten den Durchbruch, weil sie so<br />
vielversprechend sind. Vielmehr werden sie von Unternehmen adaptiert, wenn<br />
ein klarer Nutzen erkenntlich und somit Profit damit verbunden ist. Hat es ein<br />
bestimmtes Unternehmen einmal geschafft, eine neue Technologie zu kapitalis-<br />
ieren, werden weitere Unternehmen folgen. Auf der anderen Seite wissen die<br />
Unternehmen, dass sie einen Webservice nur dann gewinnbringend am Markt<br />
platzieren können, wenn er einen klaren Vorteil für die Endnutzer bietet. Somit<br />
werden die Endnutzer zu Nutznießern. Das Bewusstsein für den Nutzen der se-<br />
mantischen Technologien steigt dadurch auch bei den Endnutzern. Je mehr Un-<br />
ternehmen die Verwendung und den Nutzen der semantischen Technologien<br />
erfolgreich demonstrieren, desto mehr Unternehmen werden folgen, die Stand-<br />
ards des semantischen Webs adaptieren und so gemeinsam die Verwirklichung<br />
des semantischen Webs schneller vorantreiben. Sicherlich steckt in diesem<br />
Top-Down Ansatz mehr Dynamik als in dem Bottom-Up Ansatz. Schlussendlich<br />
wird aber der hybride Ansatz die Entwicklung bis zur vollständigen Realisation<br />
des semantischen Webs voranbringen.<br />
60
2.4.4 Zeitliche Einordnung bis zur Verwirklichung<br />
Die vorrangige Frage ist nun: “Wenn bereits die ursprüngliche Vision des Inter-<br />
<strong>net</strong>s von Tim Berners-Lee aus dem Jahre 1989 grobe Züge der Idee des se-<br />
mantischen Webs enthielt, warum hat es so lange gedauert, bis davon ein Teil<br />
überhaupt realisiert worden ist?” Laut Nova Spivak, dem CEO von Radar<strong>net</strong>-<br />
works, der Betreibergesellschaft von Twine, hat dies verschiedene Gründe.<br />
Zum einen war die Wissenschaft in den Anfängen zu fokussiert auf eine Lösung<br />
durch künstliche Intelligenz, zum anderen waren die Technologien unreif. Es<br />
waren keine greifbaren Werkzeuge verfügbar. Außerdem war der Bedarf nach<br />
offenen, interoperablen Daten nicht groß genug und die Entwicklung ging eher<br />
in Richtung geschützter, proprietärer Unternehmensdatenbänke. Nicht zuletzt<br />
war die auf Schlagworten basierende Suche wegen der halbwegs über-<br />
schaubaren Datenmenge bis heute völlig ausreichend. Es wurde bis dato keine<br />
Killerapplikation entwickelt, die selbst auch nur einer der semantischen Techno-<br />
logien zum Durchbruch verholfen hätte. 54<br />
Die grundlegenden Technologien RDF, RDFS und OWL sind festgelegte<br />
Standards und hatten die letzten Jahre Zeit, den Kinderschuhen zu entwach-<br />
sen. Diese Technologien können, wie folgenden Ausführungen zu den An-<br />
wendungsbeispielen eindrucksvoll demonstrieren, ohne die höheren Schichten<br />
“Logic”, “Proof” und “Trust” bereits verwendet werden. RDF wird in immer mehr<br />
Softwareanwendungen als Standard zur Beschreibung von Metadaten imple-<br />
mentiert werden, und so werden verschiedene Typen von erstellten Dateien<br />
(Text, Bild, Audio etc.) mit einer einheitlichen Metabeschreibung versehen.<br />
Weiterhin beginnt das Interesse an dem Thema zu wachsen. Führende Un-<br />
ternehmen wie HP oder Adobe integrieren die Standards mittlerweile in ihren<br />
Softwareprodukten. Auch führende Suchmaschinen wie Google oder Yahoo<br />
loten die Möglichkeiten für sich aus und Mobilfunkunternehmen nehmen sich<br />
dem Thema an, um die Nutzung des Inter<strong>net</strong>s über das Mobiltelefon interess-<br />
anter zu gestalten. All diese Entwicklungen werden ihre Zeit bis zur Marktreife<br />
brauchen, es ist aber zu erwarten, dass innerhalb der nächsten zwei bis drei<br />
Jahre immer mehr “early-adopter”-Produkte auf den Markt drängen.<br />
54 Nova Spivak (CEO&FOUNDER Radar<strong>net</strong>works) (2008): Making sense of the Semantic Web. Herausgegeben<br />
von slideshare. Online verfügbar unter http://www.slideshare.<strong>net</strong>/BlogTalk2008/spivackblogtalk-2008,<br />
zuletzt geprüft am 10.05.2008. Folie 24<br />
61
Umfangreichere Ontologien, die mit automatischen Schlussfolgerungen<br />
arbeiten, werden noch auf sich warten lassen. Die Standardisierungsprozess<br />
einer Technologie, insbesondere einer Universalsprache zum Ausdruck von Lo-<br />
gik und den daraus ableitbaren automatischen Schlussfolgerungen, hat bis<br />
heute nicht die exploratorische Phase der Standardisierung verlassen. Es ist<br />
davon auszugehen, dass noch mindestens drei weitere Jahre verstreichen, bis<br />
hierfür ein offzieller Standard vom W3C verabschiedet wird. Ist ein Standard für<br />
Logik und automatisches Schlussfolgern festgelegt, werden wahrscheinlich<br />
weitere drei bis fünf Jahre vergehen, bis erste greifbare Applikationen entwickelt<br />
werden. 55<br />
Das Marktforschungsunternehmen Gartner geht in seiner Studie zum se-<br />
mantischen Web “Finding and Exploiting Value in Semantic Web Technologies<br />
on the Web” aus dem Jahre 2007 davon aus, dass innerhalb der nächsten zehn<br />
Jahre durch webbasierte Technologien die Möglichkeit, semantische Strukturen<br />
in Daten einzubinden, stetig verbessert wird. Im Jahre 2017 soll die vollständige<br />
Evolution des semantischen Webs abgeschlossen sein und der Großteil der<br />
Webseiten im WWW mit semantischem Hypertext versehen sein. Im Jahre<br />
2012 schon sollen laut Gartner 80 % der öffentlichen Webseiten über ein<br />
gewisses Nivau an semantischen Beschreibungen verfügen und 15 % der öf-<br />
fentlichen Webseiten werden exzessiven Gebrauch von webbasierten, se-<br />
mantischen Ontologien machen, um damit semantische Datenbanken zu erstel-<br />
len. 56<br />
2.5 Anwendungsbeispiele aus der Wirtschaft<br />
Das W3C-Konsortium stellt auf ihrer Website Case Studies und Use Cases von<br />
Organisationen bereit, die bereits mit den semantischen Technologien Er-<br />
fahrungen gesammelt haben. Die Use Cases sind eher als konstruierte Beis-<br />
55 Dr. Brian Matthews: Semantic Web Technologies. Unter Mitarbeit von Dan Brickley, Leigh Dodds. Herausgegeben<br />
von CCLRC Rutherford Appleton Laboratory. JISC Technology and Standards Watch. Online<br />
verfügbar unter http://www.jisc.ac.uk/uploaded_documents/jisctsw_05_02bpdf.pdf, zuletzt geprüft<br />
am 10.05.2008.<br />
56 David W. Cearley, Whit Andrews, Nicholas Gall (2007): Finding and Exploiting Value in Semantic Technologies<br />
on the Web. Gartner Research Report, May 2007. Herausgegeben von Gartner. Online verfügbar<br />
unter http://www.gartner.com/DisplayDocument?ref=g_search&id=505304, zuletzt geprüft am<br />
09.05.2008.<br />
62
piele zu verstehen, wo innerhalb des Unternehmens ein Prototyp entwickelt<br />
wurde, der aber so nicht in der Praxis eingesetzt wird. Die Case Studies hinge-<br />
gen beinhalten Beschreibungen von semantischen Systemen, die so auch tat-<br />
sächlich im Unternehmen umgesetzt worden sind. Die folgenden Unterab-<br />
schnitte behandeln zwei Use Cases und eine Case Study.<br />
2.5.1 WEASEL, Vodafone R&D Corporate Semantic Web<br />
Der folgende Use Case stellt das Konzept der semantischen, un-<br />
ternehmerischen Wissensdatenbank der Vodafone R&D vor.<br />
Vodafone ist eines der größten Unternehmen im Bereich des Mobilfunks mit<br />
mehreren Millionen Kunden weltweit. In dem sich schnell verändernden und<br />
stark umkämpften Wettbewerbsumfeld stellt Innovation ein Schlüsselelement<br />
für langfristigen Erfolg dar. Die Vodafone R&D ist die zu einer Unternehmen-<br />
seinheit ausgegliederte Forschung- & Entwicklungsabteilung von Vodafone, die<br />
als globale Organisation die Geschäftseinheiten von Vodafone mit Information-<br />
en über neue Technologien, Produkte und Leistungen versorgt. Alle zusam-<br />
mengetragenen Informationen der Vodafone R&D werden von den Mitarbeitern<br />
in einem internen Bereich der Unternehmenswebsite mit zwei Zielen zusam-<br />
mengetragen. Erstens soll so die Entwicklung und Sicherung von technologis-<br />
chem Know-How innerhalb des Unternehmens gewährleistet werden und<br />
zweitens sollen so die sozialen Netzwerke, die sich rund um Projektteams und<br />
Abteilungen bilden, aufgedeckt und zu Nutzen gemacht werden.<br />
Das Problem. Selbst wenn man die oben beschriebenen Informationen den<br />
Mitarbeitern zur Verfügung stellt, ist damit noch nicht gewährleistet, dass diese<br />
Informationen von diesen auch tatsächlich wahrgenommen werden. Außerdem<br />
können alle Mitarbeiter Informationen in das System einspeisen, von denen sie<br />
denken, dass sie interessant oder von Relevanz in Zukunft sein könnten. Dabei<br />
existieren keine Beschränkungen hinsichtlich der Struktur und des Formats<br />
dieser hochgeladenen Informationen und auch keine genauen Vorgaben, an<br />
welchem Ort die Informationen abgelegt werden sollen. Aus diesem Grund ist<br />
es für die Mitarbeiter im Nachhinein sehr schwer, nützliche Informationen<br />
63
abzurufen und einzelne Informationselemente sinnvoll miteinandern zu<br />
verknüpfen.<br />
Die Lösung. Die Herausforderung für Vodafone R&D besteht darin, eine<br />
Vielzahl von hetereogenen Unternehmenswebseiten und -datenbanken, die un-<br />
strukturierte, aber in Verbindung stehende Daten enthalten, einheitlich und mit<br />
sinnvollen Relationen versehen den Mitarbeitern in einer intuitiven Weise zur<br />
Verfügung zu stellen. Die Lösungsansätze, die in das interne, un-<br />
ternehmerische semantische Web “WEASEL” implementiert werden könnten,<br />
gehen dabei in zwei Richtungen. Erstens soll die Aggregation von Daten aus<br />
unterschiedlichen Informationensquellen durch automatische semantische Be-<br />
merkungen innerhalb der unterschiedlichen Daten gewährleistet werden, um so<br />
diese aggregierten und strukturierten Daten nach ihrem Bedeutungsgehalt der<br />
gesamten Organisation zur Verfügung zu stellen. Zweitens wird es durch die<br />
Verwendung von Ontologien möglich, den Mitarbeitern hochwertige Schnittstel-<br />
len zur individuellen Informationsbeschaffung zur Verfügung zu stellen. Zwei<br />
Arten von Schnittstellen stellt WEASEL bereit. Die erste Schnittstelle erlaubt<br />
das Durchstöbern der Struktur der verwendeten Ontologie, um so Informationen<br />
besser zu finden und die zweite Schnittstelle ist eine Art Suchmaschine, mit<br />
deren Hilfe die Mitarbeiter eine frei formulierte Abfrage der semantischen Un-<br />
ternehmensdatenbank tätigen können. Die Suchergebnisse werden zusätzlich<br />
noch erklärt. 57<br />
Durch die Verwendung der semantischen Technolgien bei Vodafone R&D kon-<br />
nten zuvor zerstreute Daten in global konsitente Informationen transformiert<br />
werden. Die Metadaten, also die Bemerkungen innerhalb der verschiedenen<br />
Daten, können so automatisch aktuell gehalten werden und die Schnittstelle,<br />
die frei formulierte Fragen zulässt, liefert konkrete Antworten anstatt einer<br />
Auflistung von möglichen Fundstellen. Der Mehrwert und die Einsparungspoten-<br />
ziale, die durch die semantische Verknüpfung der Daten innerhalb der Orga-<br />
nisation entstehen, liegen auf der Hand. Die gesamten Informationen eines Un-<br />
ternehmens anhand einer allgemein verständlichen Ontologie zu strukturieren,<br />
57 Juan José Valverde Fúster (2007): WEASEL, Vodafone R&D Corporate Semantic Web. Herausgegeben<br />
von Vodafone Group Research & Development. Online verfügbar unter http://www.w3.org/2001/sw/<br />
sweo/public/UseCases/Vodafone-es/, zuletzt geprüft am 05.05.2008.<br />
64
gewährleistet, dass einmal gewonnene Einzelerkenntnisse langfristig gesichert<br />
werden können und das Wissen eines Unternehmens unabhängig von allge-<br />
meiner Fluktuation, dem Kommen und Gehen einzelner Experten und von<br />
gegründeten und aufgelösten Abteilungen, strukturiert wächst und so auch<br />
langfristig an Wert gewinnt.<br />
2.5.2 POPS - NASA’s Expertise Location Service<br />
Die folgende Case Study stellt die von der NASA entwickelte Schnittstelle<br />
“POPS” vor.<br />
NASA steht für “National Aeronautics and Space Administration” und ist die US-<br />
amerikanische Organisation für das öffentliche Luft- und Raumfahrtprogramm.<br />
Die NASA sammelt und speichert Informationen über ihre Mitarbeiter hinsicht-<br />
lich ihrer organisatorischen Zugehörigkeit, ihrer historischen Vergangenheit in-<br />
nerhalb der NASA und der entwickelten Fähigkeiten. Das Problem besteht dar-<br />
in, dass diese Informationen sich über mehrere Datenbanken, mehrere Applika-<br />
tionen und andere Systeme verteilen. Wenn man einen Mitarbeiter mit beson-<br />
deren Fähigkeiten und einem bestimmten Arbeitshintergrund sucht, kann dies<br />
nur über Abfragen in den unterschiedlichen Systemen erfolgen. Selbst wenn<br />
das Abfragen der verschiedenen Systeme einfach wäre, würden die meisten<br />
Mitarbeiter zusätzlich eine persönliche Meinung oder Empfehlung über die ge-<br />
fundene Person von jemandem einholen, dem sie vertrauen. Die bis hierhin<br />
beschriebene Problematik gilt nicht speziell nur für die NASA, sondern könnte<br />
ein Szenario aus allen möglichen größeren Organisationen sein. Wenn man<br />
nach einem geeig<strong>net</strong>en Kandidat zur Bildung einer neuen Projektgruppe oder<br />
einer neuen Abteilung sucht, gibt es nur einen kleinen Alternativenraum. En-<br />
tweder man kennt bereits jemanden innerhalb der Organisation, der für diese<br />
Aufgabe geeig<strong>net</strong> ist, oder man fragt jemanden, ob ein solcher Kandiat bekannt<br />
ist. Um jedoch mehrwertige, globale Unternehmensentwicklung unter Berück-<br />
sichtung der individuellen Stärken und Schwächen der Mitarbeitern zu be-<br />
treiben, ist dieses Vorgehen gänzlich ungeeig<strong>net</strong>. Jeder, der vor der Aufgabe<br />
steht, eine Abteilung oder Projektgruppe optimal zu besetzen, muss sich<br />
65
zwangsläufig auf die soziale Reichweite seines persönlichen Netzwerkes ver-<br />
lassen.<br />
Diese Problematik soll das von der NASA entwickelte semantische System<br />
“POPS” zum Auffinden von bestimmtem Fachwissen innerhalb der Organisation<br />
lösen. Das Ziel von “POPS” ist es, alle Informationen über die Mitarbeiter in<br />
einem System zusammenzutragen und diese Fakten sinnvoll miteinander zu<br />
verknüpfen, um so eine umfassende Informationsquelle für die Mitarbeiter, die<br />
Personalabteilung, Analysten und das Management zur Verfügung zu stellen.<br />
“POPS” bietet dabei eine einfach zu verwendende, effektive Applikation zum<br />
Auffinden von Fachwissen und zum Analysieren der Belegschaft, die durch die<br />
Verwendung von existierenden Informationsquellen, die mittels RDF und ander-<br />
en semantischen Technologien integriert werden, zusätzlich sehr kostengünstig<br />
ist. “POPS” soll die erste semantische Anwendung für alle Mitarbeiter der NASA<br />
werden. Dies wird ausführlicher in den nachfolgenden Ausführungen bes-<br />
chrieben.<br />
Im ersten Schritt hat man die vielen verschiedenen Datenquellen in einer RDF-<br />
Datenbank vereinheitlicht und integriert. Kontaktinformationen über die Mit-<br />
arbeiter liegen auf einem separaten Server, Projektinformationen werden in<br />
einem Zeit- und Anwesenheitssystem gespeichert, die Kompetenzen der Mit-<br />
arbeiter liegen in einem abgesonderten System der Personalabteilung und die<br />
technischen Berichte wiederum liegen auf einem weiteren System. Durch die<br />
Integration dieser verschiedenen Datenressourcen konnte zum einen eine in-<br />
tegrierte Informations-Infrastruktur und zum anderen das “POPS”-System zum<br />
Auffinden von Fachwissen geschaffen werden. Die Aggregation der ver-<br />
schiedenen Datenquellen stellte nur den ersten Schritt dar, im zweiten Schritt<br />
musste den Nutzern ein Werkzeug an die Hand gegeben werden, mit dessen<br />
Hilfe sie auf diese Informationen einfach und schnell zugreifen konnten, ohne<br />
eine spezielle Anfragesprache zu lernen. Zu diesem Zweck entwickelte die in-<br />
volvierte Clark & Parsia LLC, ein Unternehmen spezialisiert auf semantische<br />
Technologien und künstliche Intelligenz, das System “jSpace”. “jSpace” ist ein<br />
grafisches Universalwerkzeug zum Abfragen und Durchstöbern von RDF-<br />
66
Datenbanken. Die folgende Abbildung zeigt “jSpace” beim Auffinden von spezi-<br />
ellem Fachwissen.<br />
Eine Schlüsselkomponente von “jSpace” ist die Möglichkeit, vom Benutzer<br />
Abbildung 12: Michael Grove (C&P LLC), Andrew Schain (NASA) (2008): POPS — NASA’s Ex-<br />
pertise Location Service Powered by Semantic Web Technologies. Herausgegeben von Clark &<br />
Parsia, LLC. Online verfügbar unter http://www.w3.org/2001/sw/sweo/public/UseCases/Nasa/,<br />
zuletzt geprüft am 05.05.2008.<br />
benötigte Zusatzmodule auf einfache Art und Weise anzugliedern, um so<br />
maßgeschneiderte Ansichten der Schnittstelle für spezielle Zwecke zu ermög-<br />
lichen. Neben der standardmäßigen Detailansicht, die in der Abbildung weiter<br />
oben zu sehen ist, hat das Entwicklerteam von “POPS” mehrere<br />
maßgeschneiderte Komponenten für “POPS” entwickelt. Eine der interessan-<br />
testen Komponenten ist ein so genannter “Social Network Visualizer”, der die<br />
bereits angesprochenen sozialen Netzwerke der Mitarbeiter anschaulich visu-<br />
alisiert. Der “Social Network Visualizer” veranschaulicht also die sozialen<br />
Netzwerke der Mitarbeiter, die in der selben Abteilung arbeiten, an den selben<br />
Projekten arbeiten oder auch Mitarbeiter mit ähnlichen Fähigkeiten und Kom-<br />
petenzen. Diese Komponente von “POPS” enthält zusätzlich eine “know-who”-<br />
Funktion, die dem nach einem geeig<strong>net</strong>em Mitarbeiter Suchenden direkt eine<br />
67
weitere Person ausgibt, die sowohl den Suchenden als auch die Zielperson<br />
kennt und vermittelnd helfen kann.<br />
Abbildung 13: The “Know-Who” function of the Social Network plug-in. Michael Grove (C&P<br />
LLC), Andrew Schain (NASA) (2008): POPS — NASA’s Expertise Location Service Powered by<br />
Semantic Web Technologies. Herausgegeben von Clark & Parsia, LLC. Online verfügbar unter<br />
http://www.w3.org/2001/sw/sweo/public/UseCases/Nasa/, zuletzt geprüft am 05.05.2008.<br />
Die oben aufgeführte Abbildung zeigt die “know-who”-Funktion des “Social Net-<br />
work”-Zusatzmoduls. Außerdem kann man die Informationen, die sich in<br />
“POPS” befinden, mit in Beziehung stehenden externen Informationen aus dem<br />
World Wide Web verbinden. Die nächste Abbildung zeigt das “POPS”-Interface<br />
wie es die Informationen über das “Hubble Space Telescope”-Projekt mit In-<br />
formationen aus Wikipedia verknüpft.<br />
68
Abbildung 14: The Web View, which integrates existing web content into the jSpace browser.<br />
Michael Grove (C&P LLC), Andrew Schain (NASA) (2008): POPS — NASA’s Expertise Loca-<br />
tion Service Powered by Semantic Web Technologies. Herausgegeben von Clark & Parsia,<br />
LLC. Online verfügbar unter http://www.w3.org/2001/sw/sweo/public/UseCases/Nasa/, zuletzt<br />
geprüft am 05.05.2008.<br />
Die NASA konnte durch die Aggregation und Verlinkung der unterschiedlichen<br />
bestehenden Informationsquellen eine einfach zu bedienende und einfach zu<br />
verstehende Schnittstelle schaffen, die heute nicht nur zum Auffinden von<br />
speziellem Fachwissen genutzt wird, sondern auch eine sehr nützliche organ-<br />
isationsweite, integrierte Informationsinfrastruktur darstellt. 58<br />
Wie auch schon im zuvor dargelegten Beispiel ergaben sich bei der NASA<br />
bereits wertvolle Vorteile durch das Vereinigen verschiedener, voneinander los-<br />
gelöster Datenquellen. Durch die Verwendung der semantischen Technologien<br />
konnte nicht nur ein System geschaffen werden, von dem die Mitarbeiter im<br />
Hier und Jetzt profitieren, sondern vielmehr wird die NASA von ihrer integrierten<br />
Informationsinfrastruktur in Zukunft in jedem Bereich profitieren können, denn<br />
bestehende Daten sind nach ihrer Bedeutung sinnvoll miteinander verknüpft<br />
58 Michael Grove (C&P LLC), Andrew Schain (NASA) (2008): POPS — NASA’s Expertise Location Service<br />
Powered by Semantic Web Technologies. Herausgegeben von Clark & Parsia, LLC. Online verfügbar<br />
unter http://www.w3.org/2001/sw/sweo/public/UseCases/Nasa/, zuletzt geprüft am 05.05.2008.<br />
69
und hinzukommende Daten gliedern sich sinnvoll ein. Gerade bei weltweit<br />
agierenden Organisationen mit ihrer geografischen Dezentralität können Inform-<br />
ationen, die sich automatisch sinnvoll verknüpfen, einen enormen Mehrwert<br />
bieten. Denn die Erkenntnisse eines autark arbeitenden Projektteams werden<br />
so automatisch mit den relevanten Themengebieten verknüpft. Andere Projekt-<br />
teams wiederum, die vielleicht gar nichts von der Arbeit des autark arbeitenden<br />
Projektteams wissen, profitieren demnach automatisch von den geschaffenen<br />
Erkenntnissen.<br />
2.5.3 Renault - Semantic Web in Automotive Repair and Diagnostic<br />
Ungleichartige Applikationen und Datenquellen in einer großen Organisation zu<br />
integrieren ist eine zeit- und kostenintensive Angelegenheit. Das Beispiel<br />
Renault veranschaulicht, wie mithilfe der semantischen Technologien diese<br />
Kosten sehr stark gesenkt werden können. Besonders die Technologien RDF<br />
und OWL sind offene und mittlerweile reife Standards, mit denen Informationen<br />
auf einfache Art und Weise zwischen verschiedenen Systemen ausgetauscht<br />
und integriert werden können. Renault, der französische Automobilhersteller,<br />
wählte diese Standards zur Entwicklung eines Prototyps zur Autoreparatur- und<br />
Diagnostikdokumentation, denn gerade in diesen Bereichen kommen viele un-<br />
gleichartige Systeme zur Anwendung.<br />
Im Jahre 2006 versuchte Renault ein Werkzeug zu entwickeln, das die Kosten<br />
der Diagnostik senken sollte. Schnell bemerkten sie, dass das Informationssys-<br />
tem, aus dem die relevanten Informationen entnommen werden sollten, für<br />
diese Zwecke nicht geeig<strong>net</strong> war. Die Systeme bei Renault waren darauf aus-<br />
gerichtet, das Management der Dokumente, die die Reparatur und Diagnostik<br />
beschreiben, so einfach wie möglich zu halten, nicht aber für den Austausch<br />
von Daten zwischen den Systemen. Außerdem waren die zur Verfügung<br />
stehenden Daten für die geplanten Zwecke nicht präzise genug. Dennoch war<br />
man davon überzeugt, dass ein System, das alle möglichen Reparatur- und<br />
Diagnostikverfahren enthält, einen großen Mehrwert für das hauseigene Infor-<br />
mationssystem darstellte. So verwarf man das ursprüngliche Konzept und be-<br />
nutzte OWL, um dieses System zu modellieren und die Relationen zu den an-<br />
70
deren Systemen abzubilden. RDF wurde zum Austausch von Informationen<br />
zwischen den Systemen verwendet. Diese neu geschaffene Architektur mittels<br />
RDF und OWL sollte es für die Anwender weitaus einfacher machen, Informa-<br />
tionen über Reparaturen zu finden, als das herkömmliche Durchstöbern der<br />
Webseiten des hauseigenen Intra<strong>net</strong>s. Zusätzlich sollte das System dem Mit-<br />
arbeiter, der eine Diagnostik zu erstellen hat, durchzuführende Überprüfungen<br />
automatisch empfehlen, woraufhin der Mitarbeiter die ermittelten Testwerte in<br />
das System einspeist. Das System musste also alle möglichen Verfahren zu<br />
Reparatur und Diagnostik enthalten, also auch bestimmte Symptome, Stand-<br />
ard-Fehler-Codes, bestimmte Fehler von Autoteilen, diagnostische Testver-<br />
fahren, Anleitungen zum Ausbau von bestimmten Teilen und unzählige Produkt-<br />
Spezifikationen. Renault entschied sich, diese Fülle an verschiedenen Ver-<br />
fahren mittels URIs eindeutig zu identifizieren. 59<br />
So konnte ein System geschaffen werden, dass bei Eingabe eines bestimmten<br />
Symptoms die mögliche Ursache sortiert nach Relevanz auswirft und den Ben-<br />
utzer auffordert, bestimmte Tests durchzuführen. Darüber hinaus verfügt<br />
Renault jetzt über ein integriertes Informationssystem, in dem alte und neue<br />
Daten sinnvoll nebeneinander existieren können. Die Reparatur- und<br />
Diagnostikexperten bei Renault führen die gleiche Arbeit aus wie früher, nur<br />
dass sie ihre Anleitungen und Handlungsempfehlungen zur Diagnostik in<br />
Zukunft nicht mehr in physikalischen Handbüchern niederschreiben, sondern in<br />
das integrierte Informationssystem einspeisen.<br />
59 François-Paul Servant (2007): Semantic Web Technologies in Automotive Repair and Diagnostic.<br />
Herausgegeben von Renault. Online verfügbar unter<br />
http://www.w3.org/2001/sw/sweo/public/UseCases/ Renault/, zuletzt geprüft am 05.05.2008.<br />
71
2.6 Anwendungsbeispiele aus dem Gesundheitswesen<br />
Dass die semantischen Technologien nicht nur im wirtschaftlichen Bereich von<br />
Bedeutung sind, zeigen die folgenden Beispiele. Auch das Gesundheitswesen<br />
und somit die Allgemeinheit kann von den semantischen Technologien profitier-<br />
en, wie die folgenden Ausführungen über das SAPPHIRE-System und die Ver-<br />
wendung von semantischen Technologien am “Children`s Hospital Mediacal<br />
Center” im amerikanischen Cincinnati veranschaulichen.<br />
2.6.1 SAPPHIRE<br />
In Anlehnung an den Artikel “The Web in Action” von den Autoren Lee Feigen-<br />
baum, Ivan Herman, Tonya Hongsermeier, Eric Neumann und Susie Stephens<br />
aus der wissenschaftlichen Zeitschrift „Scientific American“ vom Dezember letz-<br />
ten Jahres beschreibt der folgende Abschnitt die Initiative „SAPPHIRE“.<br />
SAPPHIRE steht für „situational awareness and preparedness for public health<br />
incidences using reasoning engines“ und existiert seit 2004 an der Universität<br />
Texas mit dem Ziel, aufkommende öffentliche Gesundheitsprobleme besser<br />
ausfindig zu machen, zu analysieren und darauf zu reagieren. Das System inte-<br />
griert dabei eine Fülle von Daten aus unterschiedlichsten Quellen wie etwa Da-<br />
ten von Krankenversicherungen, Krankenhäusern, Umweltschutzagenturen und<br />
wissenschaftlicher Literatur. Gesundheitsbeamte können durch verschiedene<br />
Linsen bzw. Filter die Informationen des Systems abrufen. So können sie die<br />
Verbreitung des Influenza-Virus verfolgen oder die Behandlungsmethoden von<br />
HIV-Fällen abrufen. Dabei erhält SAPPHIRE alle 10 Minuten Berichte aus den<br />
Notaufnahmen, Selbsteinschätzungen und Beschreibungen der Patienten zu ih-<br />
ren Symptomen, aktuelle elektronische Gesundheitsberichte und medizinische<br />
Mitteilungen von acht umliegenden Krankenhäusern aus der Umgebung von<br />
Houston. Unter Einsatz der semantischen Technologien werden all diese Infor-<br />
mationen zu einer einfachen Ansicht der aktuellen gesundheitlichen Lage des<br />
Gebietes aggregiert. Eine Schlüsselfunktion des Systems ist eine Ontologie, die<br />
die unerklärlichen Krankheitsbilder mit grippeähnlichen Symptomen aus der Re-<br />
gion als mögliche Influenza-Fälle klassifiziert und automatisch an das örtliche<br />
Gesundheitsamt weiterleitet. Durch diese automatisch generierten Berichte<br />
72
konnten bisher neun Krankenschwestern von der manuellen Anfertigung der<br />
Berichte befreit werden und stehen wieder zur aktiven Krankenpflege zur Verfü-<br />
gung. Außerdem werden die Berichte durch das SAPPHIRE-System zwei bis<br />
drei Tage schneller fertig als durch die manuelle Bearbeitung durch die Kran-<br />
kenschwestern. Das „Center for Disease Control and Preventation“ in den USA,<br />
vergleichbar mit dem deutschen Bundesministerium für Gesundheit, hilft nun<br />
den lokalen Gesundheitsämtern landesweit dabei, solche Systeme zu imple-<br />
mentieren. Dabei erlaubt die Flexibilität der semantischen Technologien dem<br />
System SAPPHIRE auch, in einem anderen Kontext zu funktionieren. Als die<br />
evakuierten Opfer des Hurrikan Katrina in Houston Schutz suchten, waren die<br />
Beamten des örtlichen Gesundheitsamtes beunruhigt über eine eventuell auf-<br />
kommende, schnelle Verbreitung von unerwünschten Krankheiten. Nach nur<br />
acht Stunden hatten die Forscher der Universität von Texas das SAPPHIRE<br />
System umkonfiguriert und die Beamten der Gesundheitsämter mit Taschen-<br />
computern ausgestattet, die einen speziellen Gesundheitsfragebogen enthiel-<br />
ten. Die Antworten der evakuierten Opfer wurden zunächst in das System hoch-<br />
geladen, wo sie dann zusätzlich mit den Daten der umliegenden Notaufnahmen<br />
sowie der Überwachungsberichte der örtlichen Epidemiebehörde angereichert<br />
wurden. Die Aktion war ein Erfolg, denn dadurch konnten Krankheitsausbrüche,<br />
die Magen und Darm, die Atmung und Bindehaut betreffen, viel schneller als<br />
üblich identifiziert werden. Die Flexibilität von SAPPHIRE in diesem konkreten<br />
Fall lehrt eine wichtige Lektion die semantischen Technologien betreffend: Ist<br />
das System erstmal für ein allgemeines Problem entwickelt worden, wie in die-<br />
sem Fall, um über den gesundheitlichen Zustand der allgemeinen Bevölkerung<br />
zu informieren, kann ein solches System zügig auf alle möglichen Spezialfälle<br />
im gleichen Gebiet adaptiert werden. Selbstredend ist es Ziel des “Center for<br />
Disease Control and Preventation“ in den USA, dieses System nun national zu<br />
implementieren. Der Erfolg von SAPPHIRE liegt darin begründet, dass es Infor-<br />
mationen aus den verschiedensten Quellen vereinheitlichen kann, um dann die-<br />
se aggregierten Informationen für die unterschiedlichsten Zwecke zu verwen-<br />
den.<br />
73
2.6.2 Arzneimittelforschung<br />
Die traditionelle Arzneimitteldosierung berücksichtigt nicht die individuellen<br />
Gene oder bestimmte emotionale und physikalische Umgebungen der jeweili-<br />
gen Patienten. Je nach Ausprägung dieser Umstände reagieren Patienten un-<br />
terschiedlich auf ein und das gleiche Medikament. Dieser Zustand wurde von<br />
der Wissenschaft und den Menschen bisher in Ermangelung einer Lösung hin-<br />
genommen. Das soll sich nun ändern, indem die heutigen Erkenntnisse der Bio-<br />
logie und das Wissen über Arzneimittel mit Werkzeugen kombiniert werden, die<br />
voraussagen können, welches Arzneimittel in welcher Dosis für ein bestimmtes<br />
Individuum wirkt. Solche Voraussagen würden maßgeschneiderte, personalis-<br />
ierte, medizinische Behandlungen ermöglichen und langfristig unerwünschte<br />
Nebenwirkungen vollständig eliminieren. Um diese Herausforderung zu<br />
meistern, müssten verschiedene, zurzeit noch voneinander losgelöste Daten-<br />
banken und -sammlungen miteinandern kombiniert und semantisch verbunden<br />
werden: alle Arten von historischen und aktuellen medizinischen Patien-<br />
tenakten, alle erdenkliche wissenschaftliche Berichte über Arzneimittel, Tests<br />
von Arzneimitteln und ihre möglichen Nebenwirkungen und Auswirkungen für<br />
verschiedene Patienten. Traditionelle Datenbanken können diese Funktion auf-<br />
grund ihrer Komplexität bisher nicht abdecken und eine manuelle Verbindung<br />
der Datenbanken zu diesen Zwecken wäre sowohl zu zeit- als auch zu kosten-<br />
intensiv. Allein die Daten in den Datenbanken konsistent und frei von Re-<br />
dundanz zu halten, wäre ein fast unmögliches Unterfangen. Jedes Mal, wenn<br />
neue wissenschaftliche Erkenntnisse in einer bestimmte Datenbank erneuert<br />
werden würden, müssten die, die dahin verlinkt haben, ihren Link erneuern –<br />
wenn sie, wie weiter oben beschrieben, es überhaupt mitbekommen.<br />
Eine Gruppe von Forschern vom “Children`s Hospital Mediacal Center” im<br />
amerikanischen Cincinnati versucht, aufbauend auf den Möglichkeiten des se-<br />
mantischen Webs, die verborgenen ge<strong>net</strong>ischen Gründe für Herz-Kreislauf-<br />
Erkrankungen aufzudecken. Hierzu würde die traditionelle Forschung nach<br />
Genen suchen, die sich unterschiedlich in gesundem und erkranktem Gewebe<br />
verhalten, und daraus schließen, dass diese Gene in irgendeinem Zusammen-<br />
hang mit der kardiovaskulären Erkrankung stehen. Dieses Vorgehen würde zu<br />
unzähligen in Frage kommenden Genen führen, wobei die Forscher für jedes<br />
74
Gen wiederum viele verschiedene Datenbanken durchsuchen müssten, um<br />
herauszufinden, welches Gen genau diesen negativen Effekt hätte am ehesten<br />
verursacht haben können. Eine sehr zeitintensive Aufgabe, die sich die<br />
Forscher oftmals nicht erlauben dürfen. Das Team aus Cincinnati, welches von<br />
einem semantischen Berater unterstützt wurde, begann damit, die vielen ver-<br />
schiedenen relevanten Datenbanken mit ihren unterschiedlichen Formaten auf<br />
ihren Computer herunterzuladen. Dazu zählten beispielsweise Gen-Ontologien,<br />
MeSH, eine Datenbank, die auf Erkrankungen und ihre Symptome fokussiert<br />
ist, Entrez Gene, eine Datenbank mit Informationen bezogen auf Gene sowie<br />
OMIM, eine Datenbank, die die Beschreibung menschlicher Gene und ihrer<br />
Störungen enthält. Im zweiten Schritt übersetzten die Forscher die unterschied-<br />
lichen Formate der verschiedenen Datenbanken in das einheitliche Resource<br />
Description Frameworl (RDF) und speicherten diese Informationen in einer se-<br />
mantischen Datenbank.<br />
Anschließend nutzen sie den kostenlos verfügbaren (open source) Ontologie-<br />
Editor Protégé 60 , entwickelt von Forschern an der Stanford Universität, um das<br />
Wissen aus den diversen Quellen in eine Ontologie zu integrieren. Mittels eines<br />
Ranglisten-Algorithmuses, vergleichbar mit dem Algorithmus, der hinter dem<br />
Google Pagerank steckt, priorisierten die Forscher die Menge an Genen, die mit<br />
Herzerkrankungen in Verbindung stehen könnten. So fanden sie potentielle<br />
Kandidaten, die eine verursachende Rolle bei der Schwächung der Pumpfunk-<br />
tion des Herzens haben, und ließen als Nächstes diese Ergebnisse von der<br />
Software evaluieren. Durch diese Überprüfung konnten sie vier Gene isolieren,<br />
die eine starke Verbindung zu einer chromosomalen Region haben, die für die<br />
Schwächung der Pumpfunktion des Herzens verantwortlich sein könnte. Ge-<br />
genwärtig ermitteln die Forscher aus Cincinnati die Effekte dieser vier Gen-<br />
Mutationen als mögliches Ziel für neue therapeutische Behandlungen. Zudem<br />
weiten die Forscher ihr System auf andere Herzerkrankungen aus und erhoffen<br />
sich eine ähnlich dramatische Verbesserung der Effizienz. Selbstredend könnte<br />
dieses System auf weitere Krankheitsbilder ausgeweitet werden.<br />
60 Mark Musen, M.D., Ph.D.: Protégé Software. Herausgegeben von Stanford University School of Medicine.<br />
Stanford Center for Biomedical Informatics Research. Online verfügbar unter http://protege.stanford.edu/,<br />
zuletzt geprüft am 02.05.2008.<br />
75
Dies ist nur ein gutes Beispiel, das zeigt, wie und wo die semantische Techno-<br />
logie von wahrem Nutzen ist. In ähnlicher Weise machen sich die Forscher der<br />
Pharma-Kooperation Eli Lilly 61 die semantischen Technologien zu Nutzen. Sie<br />
verwenden die semantischen Technologien, um ein vollständiges Bild der wahr-<br />
scheinlichsten Arzneimittelziele im Körper für ein gegebenes Krankheitsbild zu<br />
erarbeiten. Semantische Werkzeuge erlauben ihnen dabei die unterschiedlich-<br />
sten, inkompatiblen, biologischen Beschreibungen in einer einheitlichen Datei<br />
zusammenzustellen und auf diese Weise den Durchbruch auf der Suche nach<br />
dem nächsten innovativen Arzneimittel schneller zu erreichen. Pfizer, ein welt-<br />
weit agierender Pharmakonzern, nutzt die semantischen Technologien, um un-<br />
terschiedliche Datensätze von Protein-Protein-Interaktionen miteinandern zu<br />
verzahnen und so die unklaren Korrelationen aufzudecken, die helfen könnten,<br />
vielversprechende Medikationen zu identifizieren. Die Forscher bei Pfizer sind<br />
davon überzeugt, dass diese Technologien die Chance auf unerwartete Ent-<br />
deckungen erhöhen, die Zeit zur Markteinführung von neuen Medikamenten<br />
enorm beschleunigen und die gesamte Gesundheitsindustrie dem Thema per-<br />
sonalisierte Medikation ein Stück weit näher bringen. In all diesen Fällen wird<br />
die Arzneimittelforschung durch die semantischen Technologien bestärkt, in-<br />
dem Daten aus den unterschiedlichsten Quellen und mit verschiedensten Voka-<br />
bularen zusammengeführt werden konnten. 62<br />
2.7 Anwendungsbeispiele für den privaten Bereich<br />
Der Erfolg und die Verbreitung der semantischen Technologien hängt in hohem<br />
Maße vom für Endnutzer generiertem Nutzen ab. Die folgenden Ausführungen<br />
beschreiben zwei Projekte, die sich an Endnutzer richten.<br />
2.7.1 FOAF – Friend of a Friend<br />
FOAF steht für “Friend of a Friend” und ist ein Projekt, das die semantischen<br />
Technologien nutzt, um Menschen und ihre Beziehungen untereinander, ihre In-<br />
teressen und Aktivitäten, in maschinen-verständlicher Form darzustellen. Es<br />
61 Eli Lilly and Company. Online verfügbar unter http://www.lilly.com, zuletzt geprüft am 02.05.2008.<br />
62 Lee Feigenbaum, Ivan Herman, Tonya Hongsermeier, Eric Neumann und Susie Stephens (2007): The<br />
Semantic Web in Action. Corporate Applications are well under way, and consumer uses are emerging.<br />
In: Scientific American, H. 6, S. 64–71.<br />
76
könnte demnach als eine Art dezentrales soziales Netzwerk (social <strong>net</strong>work)<br />
beschrieben werden. Gegründet wurde FOAF von Dan Brickley and Libby Miller<br />
als offene, von einer freiwilligen Gemeinschaft vorangetriebene, Initiative. Aus<br />
technologischer Sicht ist FOAF ein auf RDFS basierendes Vokabular, das die<br />
Klassen und Eigenschaften der Menschen und ihrer Beziehungen unterein-<br />
ander allgemeingültig und eindeutig definiert. Die persönlichen Informationen<br />
werden in einem RDF-Dokument gespeichert, auf einem Webserver abgelegt<br />
und sind auf diese Weise im World Wide Web verfügbar. Neben persönlichen<br />
Informationen wie Titel, Name, E-Mail Adresse und Website kann diese RDF-<br />
Datei alle erdenklichen Beschreibungen enthalten wie zum Beispiel eine Be-<br />
schreibung der Arbeitsstelle, der Schule und Universität und der Leute, die man<br />
kennt. Durch die semantische Beschreibung dieser Daten werden Maschinen<br />
sie interpretieren und miteinander kombinieren können. 63 Die Problematik, dass<br />
RDF und Ontologien nicht ohne weiteres von Laien verstanden und angewen-<br />
det werden können, konnte mittlerweile durch eine Art Editor (eine auf Java-<br />
script basierende Anwendung) zum Erstellen der RDF-Datei umgangen werden.<br />
Die folgende Abbildung zeigt den von Leigh Dodds entwickelten Editor zum Er-<br />
stellen der FOAF-RDF-Datei FOAF-a-Matic, mit dem auch Laien eine solche<br />
Datei erstellen können.<br />
63 Dan Brickley, Libby Miller (2008): foaf project. Online verfügbar unter http://www.foaf-project.org, zuletzt<br />
geprüft am 10.05.2008.<br />
77
Abbildung 15: FOAF-a-Matic. Leigh Dodds: Editor zum Erstellen einer RDF-FOAF-Datei.<br />
Herausgegeben von Leigh Dodds. Online verfügbar unter<br />
http://www.ldodds.com/foaf/foaf-a-matic, zuletzt geprüft am 10.05.2008.<br />
Aus diesen Eingaben generiert der Editor dann das RDF-Dokument, wie die fol-<br />
gende Abbildung zeigt.<br />
78
ildung 16: Generiertes RDF-Dokument; Leigh Dodds: FOAF-a-Matic. Editor zum Erstel-<br />
len einer RDF-FOAF-Datei. Herausgegeben von Leigh Dodds. Online verfügbar unter<br />
http://www.ldodds.com/foaf/foaf-a-matic, zuletzt geprüft am 10.05.2008.<br />
Semantische Web Crawler, Programme, die das WWW nach Informationen<br />
durchsuchen und die Metadaten aufnehmen, können dann den Verlinkungen zu<br />
den FOAF-Dateien der Freunde folgen und dadurch die sozialen Netzwerke ab-<br />
bilden. Auch hier steigt der Wert, den FOAF bietet, mit jedem weiteren Teil-<br />
nehmer – das Netzwerk profitiert also auch vom Netzwerkeffekt. Je mehr<br />
Menschen sich und ihre Beziehungen zu anderen Menschen beschreiben,<br />
desto mehr Wert entsteht insgesamt und komplexe Anfragen werden möglich.<br />
Sind in der RDF-Datei zum Beispiel die Freunde und in deren RDF-Dateien der-<br />
en Interessen definiert, könnten komplexe Anfrage wie: “Zeige mir alle Freunde<br />
von Holger Sistig, die sich für Basketball und Reisen interessieren.”, ausgeführt<br />
werden. Die Anwendungsmöglichkeiten könnten in Zukunft noch weit über<br />
diese Zwecke hinausgehen, und überall dort eine wichtige Rolle spielen, wo<br />
A<br />
79
personenbezogene Daten relevant sind, konstatiert Leigh Dodds. 64 Mit der Zeit<br />
wird die Integration von Informationen in die eigene FOAF-Datei einfacher wer-<br />
den. Es könnten dann zum Beispiel die Kontakte aus dem E-Mail Programm,<br />
vom Handy und vor allem auch aus den diversen zentralen sozialen Net-<br />
zwerken (Xing, Facebook, LinkedIn, StudiVZ, Friendster, Orkut etc.) in die ei-<br />
gene FOAF-Datei semantisch überführt werden. Somit wäre es möglich, sein<br />
gesamtes persönliches Netzwerk in einer zentralen FOAF-Datei abzubilden und<br />
dadurch bei der Anmeldung in einem neuen Netzwerk das bestehende Net-<br />
zwerk in einem Zug zu importieren. Ob das im Sinne der zentralen sozialen<br />
Netzwerke ist und diese die semantischen Technologien adaptieren, ist stark zu<br />
bezweifeln. Denn die einzelnen Netzwerke der Nutzer und deren Aktivitäten un-<br />
tereinander (social graph) sind das Kapital der sozialen Netzwerke. Die aktuelle<br />
Aufgabe der FOAF-Community ist es demnach Werkzeuge zum Benutzen und<br />
Finden der FOAF-Angaben zu entwickeln.<br />
2.7.2 Noserub.de – ein dezentrales soziales Netzwerk<br />
Mit Hilfe von sozialen Netzwerken bleibt man mit Freunden und Bekannten auf<br />
der ganzen Welt in Kontakt und kann neue Freunde aufgrund gleicher In-<br />
teressen finden. Die meisten Netzwerke bedienen allerdings nur einen bestim-<br />
mten Zweck, eine bestimmte Nische, wie etwa das Hochladen und Diskutieren<br />
über Fotos (flickr.com). Das Aufkommen von immer mehr spezialisierten<br />
sozialen Netzwerken bringt den Nachteil mit sich, dass der Aufwand, diese zen-<br />
tralen Netzwerke einzelnen zu pflegen, steitg steigt. Teilweise interessiert die<br />
spezielle Thematik des Netzwerkes nicht einmal, sondern man möchte einfach<br />
mit bestimmten Freunden in Kontakt bleiben und über deren Aktivitäten in-<br />
formiert sein.<br />
Noserub ermöglicht es, die Vielzahl der verschiedenen zentralen sozialen Net-<br />
zwerke in ein dezentrales Noserub-Netzwerk zu aggregieren. Die Kontrolle über<br />
die eigenen Daten wird dadurch gewährleistet, dass Noserub auch auf einem<br />
eigenen Server installiert werden kann. Aus technologischer Sicht ist Noserub<br />
ein Protokoll, also eine Einigung zwischen zwei Parteien, wie die Kommunika-<br />
64 Leigh Dodds: FOAF-a-Matic. Editor zum Erstellen einer RDF-FOAF-Datei.<br />
Herausgegeben von Leigh Dodds. Online verfügbar unter http://www.ldodds.com/foaf/foaf-amatic,<br />
zuletzt geprüft am 10.05.2008.<br />
80
tion, die Verbindung und die Übertragung von Daten ablaufen soll. Noserub<br />
baut auf verfügbare Standards wie etwa FOAF, OpenID und RSS auf. OpenID<br />
löst das Problem der vielen verschiedenen Benutzeraccounts eines Nutzers im<br />
Inter<strong>net</strong>, in dem es eine eindeutige digitale Identität zur Verfügung stellt, mit der<br />
man sich (bei teilnehmenden) Webseiten einzig mit der Angabe der OpenID an-<br />
melden kann – das lästige Zuteilen und auch Behalten von Benutzernamen und<br />
Passwörtern entfällt so gänzlich. 65 RSS steht für “really simple syndication” und<br />
ist eine Methode zum Senden und Empfangen von Neuigkeiten und Informa-<br />
tionen. Ein RSS-Feed kann abonniert werden, und man bekommt die letzen<br />
Neuigkeiten automatisch zugestellt. 66 Die folgende Abbildung zeigt die<br />
Netzwerk-Ansicht von Noserub:<br />
geprüft am 10.05.2008.<br />
Die Abbildung zeigt die letzen Aktivitäten der eigenen Kontakte. In der hori-<br />
zontalen Menüleiste können die Aktivitäten der Kontakte nach verschiedenen<br />
Medienformen eingegrenzt werden, so dass etwa lediglich die zuletzt ge-<br />
65 The OpenID Foundation (OIDF) (2008). Unter Mitarbeit von Community Board Members & Corporate<br />
Board Members. Online verfügbar unter http://openid.<strong>net</strong>, zuletzt geprüft am 10.05.2008.<br />
66 Web Accessibility Initiative (WAI) (2008): About RSS. Herausgegeben von W3C-Konsortium. Online<br />
verfügbar unter http://www.w3.org/WAI/highlights/about-rss.html, zuletzt geprüft am 10.05.2008.<br />
81<br />
Abbildung 17: Netzwerk-<br />
Ansicht; Dirk Olbertz (2008): noserub.de. Online verfügbar unter http://noserub.de, zuletzt
posteten Fotos (Videos, Audio, Links, Text) der eigenen Kontakte angezeigt<br />
werden.<br />
Eine Hürde muss Noserub noch nehmen. Es muss Laien eine Möglichkeit bie-<br />
ten, ein Noserub-Netzwerk aufzusetzen. Bis dato sind Programmierkenntnisse<br />
erforderlich, um an dem dezentralen sozialen Netzwerk teilzunehmen. Ist diese<br />
Hürde genommen, steht dem Wachstum und dem damit verbundenem Nutzen<br />
der Teilnehmer nichts mehr im Wege.<br />
3 Fazit und Ausblick<br />
Bereits die ursprüngliche Vision des Inter<strong>net</strong>s von Tim Berners-Lee aus dem<br />
Jahre 1989 enthielt Ansätze des heute klar definierten Konzepts des se-<br />
mantischen Webs. Die beschränkten technologischen Möglichkeiten, Umset-<br />
zungsversuche mit der Wissenschaft der künstlichen Intelligenz und das ein-<br />
fache Veröffentlichen von Inhalten auch durch Laien, hat das Inter<strong>net</strong> in Bezug<br />
auf die semantische Vision erstmal dahin geführt, wo es heute steht. Im Jahre<br />
2000 hat Tim Berners-Lee einen zweiten Anlauf genommen und der Öffentlich-<br />
keit sein Architektur-Konzept vom semantischen Web veröffentlicht – das Kind<br />
hatte nun einen Namen. Seit der Veröffentlichung der Architektur hat das<br />
Thema semantisches Web immer mehr Aufmerksamkeit gefunden. Die Ent-<br />
wicklergemeinschaft und die Forschung haben das Schichtenmodell ständig<br />
weiterentwickelt, Verbesserungen an den Technologien vorgenommen und offi-<br />
zielle Standards verabschiedet. Die Unternehmen hingegen haben sich zurück-<br />
gehalten, was die Verwendung der Standards und die Entwicklung von se-<br />
mantischen Produkten angeht. Dieser Zustand ist vor allem auf das Fehlen<br />
eines klaren und verständlichen Nutzens sowie die fehlende Aussicht auf kurz-<br />
fristigen unternehmerischen Gewinn zurückzuführen. Hier ist zum heutigen Zeit-<br />
punkt eine Wendung zu erkennen. Immer mehr Unternehmen implementieren<br />
die semantischen Standards in ihre Produkte und Webservices oder loten zu-<br />
mindest die konkreten Möglichkeiten für ihr jeweiliges Geschäftsmodell aus. Ein<br />
weiterer Indikator für diesen Wandel ist das vermehrte Aufkommen von Un-<br />
ternehmen, die andere Unternehmen zum Thema semantisches Web beraten.<br />
82
Dieses Thema gewinnt langsam aber sicher immer mehr an öffentlichem Be-<br />
wusstsein und die Weiterentwicklung gewinnt infolgedessen zunehmend an Dy-<br />
namik. Doch warum verlief die Entwicklung bis dato so langsam? Das damalige<br />
World Wide Web stellte – zumindest für die allgemeine Öffentlichkeit – eine ab-<br />
solute Innovation dar. Es gab zum damaligen Zeitpunkt nichts Vergleichbares<br />
und die Vision eines weltweiten Daten<strong>net</strong>zes übte eine ungemeine<br />
Anziehungskraft aus. Genau das ist heute anders. Das semantische Web ist<br />
eine Erweiterung des bestehenden World Wide Webs und auch das Konzept<br />
dahinter ist nicht ohne Weiteres zu verstehen. Auch sind die Technologien für<br />
Laien und teilweise auch Experten nicht einfach zu erlernen, vor allem aber<br />
auch nicht einfach anzuwenden. HTML jedoch war auch von Laien einfach an-<br />
zuwenden war. Dennoch veranschaulichen die Praxisbeispiele deutlich, dass<br />
die bis heute erforschten und offiziellen Technologien des Schichtenmodell<br />
bereits enormen Nutzen stiften. Wahrscheinlich werden die ersten se-<br />
mantischen Anwendungen, die auch automatisch schlussfolgern können, in den<br />
Intra<strong>net</strong>s der Unternehmen entstehen. Sind erstmal die obersten Ebenen des<br />
Schichtenmodells vollständig erforscht und offizielle Standards für automat-<br />
isches Schlussfolgern und die Sicherheit in der selbständigen Kommunikation<br />
der Agents verabschiedet, ergeben sich weitere Chancen und Möglichkeiten,<br />
die heute in ihrer Vielfalt und ihrer Auswirkung noch nicht absehbar sind.<br />
Sicherlich sieht sich die Entwicklergemeinschaft des semantischen Webs auch<br />
mit einigen Herausforderungen konfrontiert. Die Auseinandersetzung mit den<br />
Technologien des semantischen Webs geht weiter – die Web Ontology Lan-<br />
guage wird für zu komplex gehalten und der Fokus richtet sich auf die Weiter-<br />
entwicklung von OWL Lite. Auch wird derzeit diskutiert, ob die Kombination von<br />
Logik und Ableitungsregeln nicht doch viel zu komplex ist und alternativ RDFS<br />
mit Ableitungsregeln für diese Zwecke kombiniert werden könnte. 67<br />
Sicherheit und Datenschutz wird weitaus mehr an Wichtigkeit gewinnen, als<br />
diese Themen ohnehin im heutigen World Wide Web schon haben. Die Aktiv-<br />
itäten eines Nutzers können aus vielen verschiedenen Quellen zu einem ein-<br />
67 Frank Hermelen, Grigoris Antoniou (2004): A Semantic Web Primer. Herausgegeben von The MIT<br />
Press, S. 224.<br />
83
heitlichen Profil zusammengeführt werden, die so wiederum von anderen<br />
Nutzer abgefragt werden können. Aber auch die Sicherheit in der automat-<br />
ischen Kommunikation der Agents ist noch nicht schlussendlich geklärt.<br />
Eine weitere Herausforderung liegt in der Entwicklung und Verbreitung von<br />
Standard-Ontologien. Auch wenn es schon einige Standard-Ontologien bei-<br />
spielsweise aus der Medizin oder Ahnenforschung gibt, fehlt bis heute das Wis-<br />
sen in Unternehmen zur Entwicklung von speziellen Ontologien und der Adap-<br />
tion an Standard-Ontologien. Ebenso ist noch unklar, wie sich Endnutzer in<br />
großen Ontologien zurechtfinden können.<br />
Darüber hinaus ist fraglich, ob sich die Unternehmen der absoluten Vergleich-<br />
barkeit überhaupt stellen wollen. Verfügt ein Online-Shop nicht über die beste<br />
Qualität und nicht den günstigsten Preis, wird er aus den Ergebnislisten der<br />
Personal Agents aussortiert – und der Unternehmer überlegt sich zweimal, ob<br />
er seine Produkte weiterhin bzw. überhaupt semantisch codiert.<br />
Eine zusätzliche Herausforderung liegt in der Entwicklung von einfach zu hand-<br />
habenden Werkzeugen für die Endnutzer. Diesen muss in Zukunft eine Mög-<br />
lichkeit geboten werden, ohne die Kenntnisse von Informatik Inhalte im se-<br />
mantischen Web zu produzieren. Mit der Fortentwicklung des semantischen<br />
Webs werden Probleme auftauchen, die heute noch nicht abzusehen sind. Je<br />
größer jedoch das Verständnis für die Möglichkeiten des semantischen Webs<br />
bei allen Involvierten wird, desto eher können diese Probleme gelöst werden<br />
und sich das semantische Web bis zu seiner Vollendung entwickeln.<br />
Die Auswirkungen, die durch das semantische Web entstehen, werden alle<br />
Bereiche unserer Gesellschaft betreffen. Informationsmanagement, Wissens-<br />
management, Prozessintegration sind nur einige Teilgebiete, die von den Mög-<br />
lichkeiten des semantischen Webs profitieren werden. Gerade auch im Bereich<br />
der Wirtschaft und insbesondere der Medienwirtschaft wird das semantische<br />
Web Veränderungen in den Bereichen Contentproduktion, Vermarktung von<br />
Content und in der Zusammenstellung von Content bewirken. Das relativ junge<br />
84
Konzept der “Microformats”, mit dem es möglich ist, kleinste Teile von<br />
produziertem Content (Video, Text, Bild, Audio) automatisch abzurufen, zuzus-<br />
tellen und zu kombinieren, könnte den Wert von produzierten Inhalten steigern<br />
und die Wertschöpfungskette ein ganzes Stück weit verlängern. 68 Ebenso ist es<br />
vorstellbar, dass die Buchung von Werbeflächen im Inter<strong>net</strong> in Zukunft automat-<br />
isch über Agents ablaufen könnte. Die Publisher deklarieren ihr Werbeinventar<br />
semantisch nach Context, Zielgruppenstrukturen, PageImpression bzw.<br />
Aufenthaltsdauer und die Advertising Agents der Werbetreibenden können<br />
diese Informationen auslesen und weltweite, fragmentierte Werbeflächen<br />
buchen. Auch nicht ausgeschlossen ist ein weltweites, ständig in Kommunika-<br />
tion stehendes Netz von unternehmerischen und privaten Agents. Die un-<br />
ternehmerischen Agents kategorisieren ihre Angebote und die Personal Agents<br />
können so konfiguriert werden, dass sie nur bestimmte Kategorien abrufen und<br />
auf Aktuelles prüfen. So wird aus Push-Marketing Pull-Marketing. Ein weiterer<br />
Gedanke betrifft das Urheberrecht und die Verwertung von Content – wenn alle<br />
Ressourcen im semantischen Web eindeutig identifizierbar, auffindbar und ab-<br />
rufbar sind, und die “Proof”- und “Trust”-Schicht den Urheber immer eindeutig<br />
identifiziernen kann, dann ist es auch möglich, die Kontrolle über einmal<br />
produzierten Content (Spielfilm, Dokumentation, Musik, Bücher, Fotos etc.) zu<br />
behalten und diesen langfristig zu verwerten. Vielleicht werden Schüler in<br />
Zukunft nicht mehr die DIN-Norm zur Erstellung eines Standard-Briefes<br />
erlernen, sondern wie man Daten semantisch aufbereitet und mit den rele-<br />
vanten Ontologien verknüpft. Tim Berners-Lee konstatiert, dass das se-<br />
mantische Web sogar die Evolution des Wissens dieser Welt unterstützen kön-<br />
nte. 69<br />
“Das Aufregendste am semantischen Web ist nicht das, was wir uns alles<br />
damit vorstellen können, sondern das, was wir uns jetzt noch gar nicht<br />
vorstellen können." 70<br />
68<br />
Diverse Entwickler (2008): Microfomats. Online verfügbar unter http://microformats.org/, zuletzt geprüft<br />
am 12.05.2008.<br />
69<br />
Tim Berners-Lee, James Hendler Ora Lassila (2001): The Semantic Web: a new form of Web content<br />
that is meaningful to computers will unleash a revolution of new possibilities. In: Scientific American, H.<br />
284 (5), S. 34–43.<br />
70<br />
Peter Zschunke (2003): Aufräumen im Datenchaos. Herausgegeben von SPIEGEL ONLINE. Online<br />
verfügbar unter http://www.spiegel.de/<strong>net</strong>zwelt/tech/0,1518,253290,00.html, zuletzt geprüft am<br />
12.05.2008.<br />
85
Darstellungsverzeichnis<br />
Abbildung 1: A Proposal byTim Berners-Lee.......................................................3<br />
Abbildung 2: Use of the Semantic Web in your enterprise.................................11<br />
Abbildung 3: Current Web vs. Semantic Web....................................................26<br />
Abbildung 4: Chain of trust.................................................................................28<br />
Abbildung 5: Combining new information with old..............................................29<br />
Abbildung 6: The Semantic Web Stack (Semantic Layer Cake)........................31<br />
Abbildung 7: RDFpic 2.1.....................................................................................37<br />
Abbildung 8: RDF geniert durch RDFpic............................................................38<br />
Abbildung 9: The RDF triple...............................................................................39<br />
Abbildung 10: A graph of two RDF statements..................................................41<br />
Abbildung 11: Latest Layercake.........................................................................55<br />
Abbildung 12: POPS — NASA’s Expertise Location Service.............................67<br />
Abbildung 13: The “Know-Who” function of the Social Network plug-in............68<br />
Abbildung 14: The Web View of POPS..............................................................69<br />
Abbildung 15: FOAF-a-Matic..............................................................................77<br />
Abbildung 16: Generiertes RDF-Dokument........................................................78<br />
Abbildung 17: Noserub.de Netzwerk-Ansicht.....................................................80<br />
87
Abkürzungsverzeichnis<br />
B2B Business-to-Business Electronic Commerce<br />
B2C Business-to-Consumer Electronic Commerce<br />
CERN Conseil Européen pour la Recherche Nucléaire<br />
DC Dublin Core<br />
DSS Decision support system<br />
EDI Electronic Data Interchange<br />
EDV Elektronische Datenverarbeitung<br />
FOAF Friend of a Friend<br />
FTP File Transfer Protocol<br />
HTML Hypertext Markup Language<br />
HTTP Hypertext Transfer Protocol<br />
IRI Internationalized Resource Identifier<br />
OWL Ontology Web Language<br />
R&D Research & Development<br />
RDF Resource Description Framework<br />
RDFS Resource Description Framework Schema<br />
RIF Rule Interchange Format<br />
SGML Standard Generalized Markup Language<br />
SOA Serviceorientierte Architekturen<br />
UN/EDIFACT United Nations Electronic Data Interchange For<br />
Administration, Commerce and Transport
URI Uniform Resource Identifier<br />
URL Uniform Resource Locator<br />
W3C World Wide Web Consortium<br />
WWW World Wide Web<br />
XML Extensible Markup Language
Literaturverzeichnis<br />
Brockhaus [Kompakt Wissen, 1983]<br />
Kompakt Wissen von A bis Z in 5 Bänden<br />
Bockhaus, Wiesbaden, 1983<br />
Dieter Fensel [Spinning the semantic Web, 2005]<br />
Frank Hermelen,<br />
Grigoris Antoniou<br />
Spinning the semantic Web: bringing the World Wide<br />
Web to its full potential<br />
MIT Press , Cambridge – Massachusetts, 2005<br />
[A Semantic Web Primer]<br />
A Semantic Web Primer<br />
Lars U. Dittmann [OntoFMEA, 2007]<br />
MIT Press , Cambridge – Massachusetts, 2004<br />
OntoFMES: Ontologiebasierte Fehlermöglichkeits-<br />
und Einflussanalyse<br />
Deutscher Universitätsverlag (DUV), Wiesbaden,<br />
2007<br />
Mark-Oliver Würtz [Computer Supported Cooperative Work, 2007]<br />
Michael C. Daconta<br />
u.a.<br />
Möglichkeiten und Methoden des 'Computer Suppor-<br />
ted Cooperative Work' (CSCW)<br />
GRIN Verlag, München, 2007<br />
[The Semantic Web, 2003]<br />
The Semantic Web: A Guide to the Future of XML,<br />
Web Services, and Knowlege Management<br />
Wiley Publishing, Indianapolis, 2003
Michael Wooldridge [An Introduction to Multi-Agent Systems, 2002]<br />
Norbert Bieberstein<br />
u.a.<br />
An Introduction to Multi-Agent Systems<br />
Wiley & Sons, Indianapolis, 2002<br />
[Service-Oriented Architecture Compass, 2005]<br />
Service-Oriented Architecture Compass, Business<br />
Value, Planning, and Enterprise Roadmap<br />
Prentice Hall International , 2005<br />
Pascal Hitzler u.a. [Semantic Web, 2008]<br />
Semantic Web: Grundlagen<br />
Sebastian Löbner [Semantik, 2003]<br />
Tim Berners-Lee,<br />
Mark Fischetti<br />
Springer, Berlin – Heidelberg, 2008<br />
Semantik: Eine Einführung<br />
Gruyter, Berlin, 2003<br />
[Weaving the Web, 1999]<br />
Weaving the Web, The Original Design and Ultimate<br />
Destiny of the World Wide Web by Its Inventor<br />
Harper & Collins , Sanfranscisco, 1999
Inter<strong>net</strong>verzeichnis<br />
Alex Iskold Semantic Web: Difficulties with the Classic Approach<br />
http://www.readwriteweb.com/archives/semantic_web<br />
_difficulties_with_classic_approach.php<br />
(Stand 06. Mai 2008)<br />
Alex Iskold Top-Down: A New Approach to the Semantic Web<br />
http://www.readwriteweb.com/archives/the_top-<br />
down_semantic_web.php<br />
(Stand 06. Mai 2008)<br />
Arne Dicks Was ist WebEDI?<br />
http://www.gs1-germany.de/inter<strong>net</strong>/content/produkte/<br />
ean/ecommerce_edi/webedi/index_ger.html<br />
(Stand 13. April 2008)<br />
o.V. (Computerwoche) IDC: Weltweite Datenmenge verzehnfacht sich in fünf<br />
Dan Brickley,<br />
Libby Miller<br />
Jahren<br />
http://www.computerwoche.de/index.cfm?<br />
pid=254&pk=1858302<br />
(Stand 12. Mai 2008)<br />
foaf project<br />
http://www.foaf-project.org<br />
(Stand 10. Mai 2008)<br />
David W. Cearley u.a. Finding and Exploiting Value in Semantic Technolo-<br />
gies on the Web<br />
http://www.gartner.com/DisplayDocument?<br />
ref=g_search&id=505304
(Stand 09. Mai 2008)<br />
Michael Wooldridge [An Introduction to Multi-Agent Systems, 2002]<br />
o.V. Microfomats<br />
An Introduction to Multi-Agent Systems<br />
Wiley & Sons, Indianapolis, 2002<br />
http://microformats.org/<br />
(Stand 12. Mai 2008)<br />
o.V. Web-Ontology (WebOnt) Working Group<br />
http://www.w3.org/2001/sw/WebOnt/<br />
(Stand 26. April 2008)<br />
Dr. Brian Matthews Semantic Web Technologies<br />
Dr. rer. nat. Harald<br />
Sack u.a.<br />
http://www.jisc.ac.uk/uploaded_documents/jisctsw_05<br />
_02bpdf.pdf<br />
(Stand 09. Mai 2008)<br />
Vorlesungsmaterial Semantic Web<br />
http://www.db-thueringen.de/servlets/DerivateServlet/<br />
Derivate-10503/semweb-08_WebOfTrust.pdf<br />
(Stand 01. Mai 2008)<br />
François-Paul Servant Semantic Web Technologies in Automotive Repair<br />
and Diagnostic<br />
http://www.w3.org/2001/sw/sweo/public/UseCases/R<br />
enault/<br />
(Stand 05. Mai 2008)
Frank Manola,<br />
Eric Miller<br />
RDF Primer<br />
http://www.w3.org/TR/rdf-primer/<br />
(Stand 24. April 2008)<br />
Ian Jacobs Über das World Wide Web Consortium (W3C)<br />
http://www.w3c.de/about/overview.html<br />
(Stand 28. April 2008)<br />
Ivan Herman W3C Semantic Web Activity<br />
http://www.w3.org/2007/03/layerCake.png<br />
(Stand 19. April 2008)<br />
Jochen Notholt Die Zukunft des Semantic Web<br />
Juan José<br />
Valverde Fúster<br />
http://www.jurpc.de/aufsatz/20050066.htm#fn0<br />
(Stand 1. Mai 2008)<br />
WEASEL, Vodafone R&D Corporate Semantic Web<br />
http://www.w3.org/2001/sw/sweo/public/UseCases/Vo<br />
dafone-es/<br />
(Stand 5. Mai 2008)<br />
Leigh Dodds FOAF-a-Matic<br />
http://www.ldodds.com/foaf/foaf-a-matic<br />
(Stand 10. Mai 2008)<br />
M. Duerst Internationalized Resource Identifiers (IRIs)<br />
http://www.w3.org/International/iri-edit/draft-duerst-<br />
iri-04.txt<br />
(Stand 1. Mai 2008)
Marja-Riitta Koivunen,<br />
Eric Miller<br />
Mark Musen, M.D.,<br />
Ph.D.<br />
Michael Grove ,<br />
Andrew Schain<br />
W3C Semantic Web Activity<br />
http://www.w3.org/2001/12/semweb-fin/w3csw<br />
(Stand 28. April 2008)<br />
Protégé Software<br />
http://protege.stanford.edu/<br />
(Stand 2. Mai 2008)<br />
POPS — NASA’s Expertise Location Service Powe-<br />
red by Semantic Web Technologies<br />
http://www.w3.org/2001/sw/sweo/public/UseCases/N<br />
asa/<br />
(Stand 5. Mai 2008)<br />
Nova Spivak Making sense of the Semantic Web<br />
http://www.slideshare.<strong>net</strong>/BlogTalk2008/spivack-blog-<br />
talk-2008<br />
(Stand 10. Mai 2008)<br />
Peter Zschunke Aufräumen im Datenchaos<br />
http://www.spiegel.de/<strong>net</strong>zwelt/tech/0,1518,253290,0<br />
0.html<br />
(Stand 12. Mai 2008)<br />
Rachael King Q&A with Tim Berners-Lee<br />
http://www.businessweek.com/technology/content/apr<br />
2007/tc20070409_961951.htm<br />
(Stand 21. April 2008)<br />
Sean Bechhofer u.a. OWL Web Ontology Language Reference
Zeitschriftenverzeichnis<br />
Lee Feigenbaum u.a. The Semantic Web in Action<br />
Corporate Applications are well under way, and con-<br />
sumer uses are emerging<br />
In: Scientific American, H. 6, S. 64–71.<br />
Thomas R. Gruber A translation approach to portable ontology specifica-<br />
tions In: Knowledge Acquisition, Jg. Volume 5, H. 2,<br />
S. 199–200.<br />
Tim Berners-Lee u.a. The Semantic Web: a new form of Web content that<br />
is meaningful to computers will unleash a revolution<br />
of new possibilities<br />
In: Scientific American, H. 284 (5), S. 34–43.<br />
Wolfgang Dostal u.a. Semantik und Web Services:<br />
Vokabulare und Ontologien<br />
In: Java Spektrum, H. 3, S. 51–54.
Erklärung<br />
Hiermit erkläre ich, dass ich die vorliegende Diplomarbeit selbstständig und<br />
ohne Benutzung anderer als der angegebenen Hilfsmittel angefertigt habe.<br />
_________________________ ___________________________<br />
Ort, Datum Unterschrift
Lebenslauf<br />
Persönliche Daten<br />
Name: Holger Sistig<br />
Adresse: Römerstraße 95, 50389 Wesseling<br />
Geburtsdaten: Köln, 24.03.1981<br />
Staatsangehörigkeit: deutsch<br />
Familienstand: ledig<br />
Beruflicher Werdegang<br />
Januar 2008 – heute<br />
Concept Factory Werbeagentur – Business Development Manager<br />
Oktober 2006 – Dezember 2007<br />
OnVista Group – Business Development<br />
Mai 2006 – Oktober 2006<br />
ifp – Personalberatung & Managementdiagnostik – Research Analyst<br />
Februar 2005 – Mai 2005<br />
Casting Concept GmbH – Studentische Projekt in Casting-Redaktion<br />
Dezember 1999 – November 2003<br />
Concept Factory Werbeagentur – Mitglied Geschäftsleitung, Gesellschafter
Schulischer Werdegang<br />
Oktober 2005 – heute<br />
Rheinische Fachhochschule Köln – Medienwirtschaft I<br />
Oktober 2002 – April 2005<br />
Universität zu Köln – Betriebswirtschaftslehre (ohne Abschluss)<br />
September 1999 – Juli 2001<br />
Wirtschaftsgymnasium Karl-Schiller, Brühl – Allgemeine Hochschulreife<br />
September 1992 – Juli 1999<br />
Käthe-Kollwitz Gymnasium, Wesseling – bis 11. Klasse<br />
_________________________ ___________________________<br />
Ort, Datum Unterschrift