04.01.2013 Aufrufe

RHEINISCHE FACHHOCHSCHULE KÖLN - Bernd-schmitz.net

RHEINISCHE FACHHOCHSCHULE KÖLN - Bernd-schmitz.net

RHEINISCHE FACHHOCHSCHULE KÖLN - Bernd-schmitz.net

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

<strong>RHEINISCHE</strong> <strong>FACHHOCHSCHULE</strong><br />

<strong>KÖLN</strong><br />

University of Applied Sciences<br />

Fachbereich: Wirtschaft & Recht<br />

Studiengang: Medienwirtschaft I<br />

Diplomarbeit<br />

Chancen und Auswirkungen<br />

des<br />

semantischen Webs<br />

Holger Sistig<br />

Sommersemester 2008


<strong>RHEINISCHE</strong> <strong>FACHHOCHSCHULE</strong> <strong>KÖLN</strong><br />

University of Applied Sciences<br />

Fachbereich: Wirtschaft & Recht<br />

Studiengang: Medienwirtschaft I<br />

Diplomarbeit<br />

Chancen und Auswirkungen<br />

des<br />

semantischen Webs<br />

Diplomarbeit vorgelegt von: Holger Sistig<br />

1. Prüfer: Dipl. BW. <strong>Bernd</strong> Schmitz<br />

2. Prüfer: Prof. Dr. Dieter Nennen<br />

Sommersemester 2008


Inhaltsverzeichnis<br />

1 Das Inter<strong>net</strong> heute........................................................................1<br />

1.1 Definition des semantischen Webs ........................................................4<br />

1.2 Semantik und das semantische Web ....................................................5<br />

1.3 Web 3.0 – Bedarf des semantischen Webs im Inter<strong>net</strong> ........................5<br />

1.3.1 Knowledge-Management..............................................................6<br />

1.3.2 Business-to-Consumer (B2C) Electronic Commerce...................7<br />

1.3.3 Business-to-Business (B2B) Electronic Commerce......................9<br />

1.4 Web 3.0 – Bedarf an semantischen Web im Unternehmen ................10<br />

1.4.1 Entscheidungsunterstützung.......................................................12<br />

1.4.2 Business Development...............................................................12<br />

1.4.3 Automatisierte Verwaltung..........................................................14<br />

1.5 Möglichkeiten des semantischen Webs im privaten Bereich...............15<br />

1.5.1 Personal Agents..........................................................................15<br />

1.5.2 Veränderungen in der physikalischen Welt................................19<br />

1.6 Abgrenzung zur künstlichen Intelligenz................................................20<br />

1.7 Vorgehensweise....................................................................................21<br />

2 Das Inter<strong>net</strong> morgen...................................................................22<br />

2.1 Das W3C-Konsortium...........................................................................22<br />

2.2 Die Grundprinzipien des semantischen Webs......................................24<br />

2.2.1 Prinzip 1: Alles kann mittels URIs identifiziert werden................24<br />

2.2.2 Prinzip 2: Ressourcen und Beziehungen sind typisiert..............25<br />

2.2.3 Prinzip 3: Partielle Informationen sind akzeptabel......................27<br />

2.2.4 Prinzip 4: Absolute Wahrheit wird nicht benötigt........................27<br />

2.2.5 Prinzip 5: Evolution wird unterstützt............................................28<br />

2.2.6 Prinzip 6: Minimalistisches Design der Technologien................30<br />

2.3 Technologien des semantischen Webs................................................30<br />

2.3.1 Unicode und URI.........................................................................32<br />

2.3.2 Extensible Markup Language (XML)...........................................33<br />

2.3.3 Resource Description Framework (RDF)....................................36<br />

2.3.4 RDF Schema (RDFS).................................................................41<br />

2.3.5 Ontologien...................................................................................43<br />

2.3.6 Ontology Web Language (OWL) ................................................45<br />

2.3.7 Logik und Schlussfolgerungen....................................................47<br />

2.3.8 Beweise, Vertrauen und digitale Signaturen...............................50<br />

2.3.9 Entwicklung des Schichtenmodells.............................................54


2.4 Evolution zum semantischen Web........................................................57<br />

2.4.1 Der Bottom-Up Ansatz................................................................57<br />

2.4.2 Der Top-Down Ansatz.................................................................58<br />

2.4.3 Der hybride Ansatz......................................................................59<br />

2.4.4 Zeitliche Einordnung bis zur Verwirklichung...............................60<br />

2.5 Anwendungsbeispiele aus der Wirtschaft ............................................62<br />

2.5.1 WEASEL, Vodafone R&D Corporate Semantic Web ................62<br />

2.5.2 POPS - NASA’s Expertise Location Service...............................64<br />

2.5.3 Renault - Semantic Web in Automotive Repair and Diagnostic 70<br />

2.6 Anwendungsbeispiele aus dem Gesundheitswesen............................71<br />

2.6.1 SAPPHIRE .................................................................................72<br />

2.6.2 Arzneimittelforschung..................................................................73<br />

2.7 Anwendungsbeispiele für den privaten Bereich...................................76<br />

2.7.1 FOAF – Friend of a Friend..........................................................76<br />

2.7.2 Noserub.de – ein dezentrales soziales Netzwerk.......................79<br />

3 Fazit und Ausblick......................................................................81<br />

Darstellungsverzeichnis<br />

Abkürzungsverzeichnis<br />

Literaturverzeichnis<br />

Inter<strong>net</strong>verzeichnis<br />

Zeitschriftenverzeichnis<br />

Erklärung<br />

Lebenslauf


1 Das Inter<strong>net</strong> heute<br />

Das World Wide Web (WWW) hat die Gesellschaft und die Wirtschaft in den<br />

letzten Jahren erheblich beeinflusst und verändert. So beläuft sich beispielswei-<br />

se die Summe des weltweiten E-Commerce-Umsatzes mittlerweile auf 17,9 Bil-<br />

lionen EUR in 2006 1 und die Gesamtmenge der Daten im Inter<strong>net</strong> auf 281 Milli-<br />

arden Gigabyte in 2007 2 , jeweils mit anhaltend steigender Tendenz. Das stän-<br />

dig wachsende Datenaufkommen macht es immer schwieriger, relevante Infor-<br />

mationen zu finden, darauf zuzugreifen und diese sinnvoll wiederzuverwerten,<br />

ob nun als Privatperson oder als Unternehmen. Wie wichtig dabei dieses Know-<br />

ledge-Management in Zukunft für eine erfolgreiche Informationsgesellschaft<br />

sein wird, lässt sich leicht erahnen. Das nützlichste Werkzeug beim Suchen und<br />

Verwenden von Informationen sind zurzeit Suchmaschinen. Mit den auf Schlag-<br />

wörtern basierenden Suchmaschinen wie z.B. Google sind allerdings einige<br />

Probleme verbunden. Sie liefern eine hohe Trefferzahl, leider aber auch oft ge-<br />

ringe Genauigkeit, denn zu viele Suchergebnisse sind letztendlich genauso un-<br />

brauchbar wie zu wenige. Außerdem können Wortdoppelbedeutungen nicht<br />

unterschieden werden und die Ergebnisse sind stets nur auf einzelnen Websei-<br />

ten zu finden. Benötigen wir Informationen, die sich über mehrere Webseiten<br />

verteilen, müssen wir die Informationen selbst einzeln entnehmen und zusam-<br />

menfügen.<br />

Natürlich gibt es heute bereits Software, die Text verarbeiten, Rechtschreibung<br />

prüfen oder die Wörter zählen kann. Geht es aber darum, die Bedeutung von<br />

Sätzen zu interpretieren und daraus brauchbare Informationen für den Nutzer<br />

zu extrahieren, so sind alle verfügbaren Programme stark limitiert, wenn nicht<br />

gar unbrauchbar. Eine Suchmaschine kann die Bedeutung des Satzes: „Ich bin<br />

ein Student der Medienwirtschaft.“ nicht von: „Ich bin ein Student der Medien-<br />

wirtschaft, könnte man meinen, aber...“ unterscheiden. Das Hauptproblem ist,<br />

dass der Großteil der Daten im Inter<strong>net</strong> zum Lesen und Deuten durch den Men-<br />

1 TNS Infratest, 10. Faktenbericht 2007, S. 229<br />

2 Computerwoche (2008): IDC: Weltweite Datenmenge verzehnfacht sich in fünf Jahren. Online verfügbar<br />

unter http://www.computerwoche.de/index.cfm?pid=254&pk=1858302, zuletzt geprüft am 12.05.2008.<br />

1


schen konzipiert ist und von Maschinen respektive Computern weder interpre-<br />

tiert noch weiter verarbeitet werden können.<br />

Eine Lösungsmöglichkeit wäre, die Inhalte so zu belassen, wie sie heute sind<br />

und die Maschinen mittels künstlicher Intelligenz und Computerlinguistik zu<br />

verbessern. Die Wissenschaft verfolgt diesen Ansatz schon einige Zeit, aller-<br />

dings wurde bis auf einige kleine Verbesserungen kein wesentlicher Durch-<br />

bruch erreicht. 3<br />

Ein anderer Ansatz ist, die Inhalte des World Wide Web so darzustellen, dass<br />

sie leichter von Maschinen interpretiert und verarbeitet werden können. Genau<br />

diese Vision entwarf der Erfinder des Inter<strong>net</strong>s, Tim Berners-Lee, als er im März<br />

1989 versuchte, das CERN-Management vom Nutzen eines globalen Hyper-<br />

text-Systems zu überzeugen. Seine Vision verfolgte zwei Ziele: Zum einen das<br />

Inter<strong>net</strong> zu einem hoch kollaborativen Medium zu machen und zum anderen es<br />

verständlicher zu machen, um so selbst Maschinen das Interpretieren und Ver-<br />

arbeiten der Inhalte zu ermöglichen. Abbildung 1 zeigt Tim Berners-Lees ori-<br />

ginales Diagramm zu seiner Vision. MESH war damals sein Arbeitstitel, aus<br />

dem bei der praktischen Umsetzung 1990 das World Wide Web wurde. 4<br />

3 Tim Berners-Lee, James Hendler Ora Lassila: The Semantic Web: a new form of Web content that is<br />

meaningful to computers will unleash a revolution of new possibilities. In: Scientific American, H. 284<br />

(5), S. 34–43.<br />

4 Tim Berners-Lee (1989): Information Management: A Proposal. Herausgegeben von W3C-Konsortium.<br />

CERN. Online verfügbar unter http://www.w3.org/History/1989/proposal.html, zuletzt geprüft am<br />

22.04.2008.<br />

2


Abbildung 1: Tim Berners-Lee (1989): Information Management: A Proposal. Herausgegeben<br />

von W3C-Konsortium. CERN. Online verfügbar unter http://www.w3.org/History/1989/propo-<br />

sal.html, zuletzt geprüft am 22.04.2008.<br />

Abbildung 1 zeigt, dass Tim Berners-Lee ursprüngliche Vision mehr beinhaltete<br />

als das bloße Abrufen von HTML-Dokumenten von Webservern. Die Abbildung<br />

stellt auch Relationen wie etwa “includes”, “wrote” und “describes” zwischen<br />

den einzelnen Informationselementen dar. Diese Relationen – auch als Meta-<br />

daten zu bezeichnen – finden so im heutigen Inter<strong>net</strong> noch keine Anwendung,<br />

sind aber gleichzeitig der Schlüssel, damit Maschinen die im Inter<strong>net</strong> verfüg-<br />

baren Informationen interpretieren und verarbeiten können.<br />

3


1.1 Definition des semantischen Webs<br />

„The Semantic Web is not a separate Web, but an extension of the cur-<br />

rent one, in which information is given well-defined meaning, better en-<br />

abling computers and people to work in cooperation.” 5<br />

Diese Definition aus dem Artikel “The Semantic Web: a new form of Web con-<br />

tent that is meaningful to computers will unleash a revolution of new possibili-<br />

ties“ in der wissentschaftlichen Zeitschrift Scientific American, der erstmalig<br />

dem Thema semantisches Web eine breite Öffentlichkeit verschaffte, stellt zual-<br />

lererst deutlich klar, dass das semantische Web das gegenwärtige World Wide<br />

Weg nicht ersetzt, sondern eine Erweiterung dessen darstellt. Die Definition be-<br />

tont, dass Informationen mit einer genau definierten Bedeutung versehen wer-<br />

den und so Mensch und Maschine in einem höheren Maße voneinander profi-<br />

tieren können.<br />

Eine ausführlichere Definition liefert das W3C-Konsortium:<br />

„The Semantic Web provides a common framework that allows data to<br />

be shared and reused across application, enterprise, and community<br />

boundaries. It is a collaborative effort led by W3C with participation from<br />

a large number of researchers and industrial partners.“ 6<br />

Diese Definition geht intensiver auf die Interoperabilität zwischen verschiedenen<br />

Systemen und das Überschreiten von Grenzen ein und nimmt erklärenden Be-<br />

zug auf die Struktur und die gemeinsame Aufgabe des W3C-Konsortiums. Die<br />

Idee des semantischen Webs ist also nur durch gemeinsame Leistung erreich-<br />

bar.<br />

5 Tim Berners-Lee, James Hendler Ora Lassila: The Semantic Web: a new form of Web content that is<br />

meaningful to computers will unleash a revolution of new possibilities. In: Scientific American, H. 284<br />

(5), S. 34–43.<br />

6 Ivan Herman (Semantic Web Activity Lead) (2008): W3C Semantic Web Activity. Unter Mitarbeit von<br />

Tim Berners-Lee, Dan Connolly, Sandro Hawke, Ivan Herman, Eric Prud'hommeaux, and Ralph Swick.<br />

Herausgegeben von W3C-Konsortium. Online verfügbar unter http://www.w3.org/2001/sw/, zuletzt geprüft<br />

am 19.04.2008.<br />

4


1.2 Semantik und das semantische Web<br />

Die Semantik, auch Bedeutungslehre genannt, ist das Teilgebiet der Linguistik,<br />

das sich mit der Bedeutung von Sprache bzw. sprachlichen Zeichen befasst. 7<br />

Tim Berners-Lee, der Erfinder des Inter<strong>net</strong>s, gab bei einem Vortrag an der Prin-<br />

ceton Universität in den USA im Jahre 2006 selber zu, dass es vielleicht falsch<br />

war, den Namen “Semantic Web” für seine Idee zu wählen, da dieses Wort<br />

schon von vielen verschiedenen Gruppierungen mit jeweils unterschiedlichen<br />

Bedeutungen verwendet wird. Eine bessere Beschreibung seines Konzeptes<br />

wäre wohl der Begriff “Data Web” gewesen, meint Tim Berners-Lee im Nach-<br />

hinein. 8<br />

Grundsätzlich ist es nachvollziehbar, warum Sir Tim Berners-Lee diesen Na-<br />

men für seine Idee wählte. Er wollte einen einschlägigen Begriff finden, der ver-<br />

deutlicht, dass Maschinen respektive Computer die Bedeutung der ver-<br />

schiedenen Datenressourcen im World Wide Web interpretieren und ver-<br />

arbeiten können. Auch wenn das Konzept “Semantic Web” nicht wirklich viel mit<br />

der Bedeutungslehre der Linguistik gemeinsam hat, und Neulinge auf diesem<br />

Gebiet anfangs vielleicht etwas Falsches interpretieren, wird sich der Begriff<br />

“Semantic Web” langfristig etablieren und eine gleichwertige Stellung innerhalb<br />

der vielen verschiedenen Verwendungen des Wortes “Semantik” erreichen. Je<br />

mehr greifbare semantische Anwendungen zur Verfügung stehen, desto klarer<br />

wird der Allgemeinheit das Konzept hinter dem Begriff “Semantisches Web”.<br />

1.3 Web 3.0 – Bedarf des semantischen Webs im Inter<strong>net</strong><br />

Der folgende Abschnitt zeigt beispielhaft einige Bereiche auf, die von der Wei-<br />

terentwicklung und Verbreitung der semantischen Technologien profitieren wer-<br />

den.<br />

7 Sebastian Löbner (2003): Semantik: eine Einführung. 1. Aufl.: Gruyter, S. 3–4.<br />

8 Rachael King (2007): Q&A with Tim Berners-Lee. The inventor of the Web explains how the new Semantic<br />

Web could have profound effects on the growth of knowledge and innovation. Herausgegeben<br />

von Business Week. Online verfügbar unter http://www.businessweek.com/technology/content/apr2007/<br />

tc20070409_961951.htm, zuletzt geprüft am 21.04.2008.<br />

5


1.3.1 Knowledge-Management<br />

Unter dem Begriff “Knowledge-Management” wird die Beschaffung, der Zugang<br />

und die Erhaltung von Wissen innerhalb einer Organisation verstanden. Dabei<br />

wird das Ziel verfolgt, durch eine optimale Verwertung des intellektuellen Ver-<br />

mögens eines Unternehmens eine höhere Produktivität, neue Werte und eine<br />

höhere Wettbewerbsfähigkeit zu schaffen. Durch die fortschreitende Globalisie-<br />

rung und die Adaption der Möglichkeiten des Inter<strong>net</strong>s in weltweit agierenden<br />

Unternehmen sind diese mehr und mehr gezwungen, sich in virtuellen Teams<br />

zusammenzufinden und ihr Informationsmanagement stetig zu verbessern. Das<br />

erarbeitete Wissen wird zunehmend in Dokumenten im Inter<strong>net</strong> oder in In-<br />

tra<strong>net</strong>s gelagert. Einhergehend mit dieser Entwicklung werden verstärkt Doku-<br />

menten-Management-Systeme am Markt angeboten, die aber heute schon ei-<br />

nige Schwächen aufweisen.<br />

Die Technologie des semantischen Webs könnte diese Schwächen beseitigen:<br />

� Informationen suchen. Die auf Schlagworten (Keywords) basierende<br />

Suche liefert irrelevante Ergebnisse, da das Schlagwort zum Beispiel in<br />

einem anderen Kontext benutzt wird, als in dem Kontext, nach dem der<br />

User sucht. Wie bereits weiter oben angesprochen, werden mit steigen-<br />

dem Datenaufkommen im Inter<strong>net</strong> und in Intra<strong>net</strong>s auch die Ergebnisse,<br />

die eine auf Schlagworten basierende Suchmaschine auswirft, enorm<br />

zunehmen. Auch hier gilt wieder: Zu viele Ergebnisse sind letztendlich<br />

genauso unbrauchbar wie zu wenige.<br />

� Informationen extrahieren. Zurzeit ist es nicht möglich, Informationen<br />

aus verschiedenen Ressourcen zu gewinnen, ohne das der Mensch<br />

selbst das Lesen und Browsen übernimmt. Gegenwärtig gibt es noch<br />

keine automatisierten Agenten, die die textualen Informationen im Inter-<br />

<strong>net</strong> verstehen und weiter verarbeiten oder gar Informationen aus ver-<br />

schiedenen Ressourcenquellen zu einer sinnvollen Information aggre-<br />

gieren können.<br />

6


� Informationen verwalten. Die Instandhaltung und Pflege von textbasier-<br />

ten Informationsquellen ist eine zeitintensive und aufwendige Angelegen-<br />

heit – umso mehr, je größer die Quelle wird. Diese Sammlung an Daten<br />

konsistent, korrekt und aktuell zu halten, macht eine semantische und<br />

einheitliche Beschreibung der Inhalte dieser Dokumente notwendig. Eine<br />

solche Darstellung der Daten existiert momentan nicht.<br />

Die semantische Technologie wird eine strukturierte und bedeutungsmäßige<br />

Definition von Dokumenten ermöglichen, wodurch eine Vielzahl an neuen<br />

Chancen entsteht: eine intelligente Suche statt die auf Schlagworten basieren-<br />

de, Beantwortung von Fragen statt das bloße Wiederherstellen und Darstellen<br />

von Informationen sowie der Austausch und die Wiederverwertung von Doku-<br />

menten zwischen verschiedenen Profit-Centern. 9<br />

1.3.2 Business-to-Consumer (B2C) Electronic Commerce<br />

Im Bereich des Business-to-Consumer Electronic Commerce werden Produkte<br />

oder Dienstleistungen an den Inter<strong>net</strong>-User verkauft. In einem typischen Szena-<br />

rio besucht ein User mehrere Online-Shops, stöbert in deren Angeboten, wählt<br />

einige aus und bestellt sie. Im optimalen Fall sammelt der Nutzer für ihn rele-<br />

vante Informationen über Preise und Konditionen aller Angebote in verschiede-<br />

nen Online-Shops, vergleicht diese und bestellt das für ihn beste Produkt. Auch<br />

hier wird wieder deutlich, dass mit steigendem Produktangebot im Inter<strong>net</strong> die<br />

manuelle Auswahl zwischen den Produkten und Online-Shops eine sehr zeitin-<br />

tensive und aufwendige Angelegenheit ist. Selbst wenn ein hoher Anspruch be-<br />

steht, viele Angebote in die Entscheidung mit einzubeziehen, wird der Konsu-<br />

ment zurzeit letztendlich nur einen geringen Anteil aller im Inter<strong>net</strong> verfügbaren<br />

Produkte vergleichen. Um diese Arbeit zu erleichtern, sind mittlerweile so ge-<br />

nannte Shopping-Bots im Inter<strong>net</strong> verfügbar, die verschiedene Online-Shops<br />

besuchen und dort die unterschiedlichen Produkt- und Preisinformationen extra-<br />

hieren und zu einer Markübersicht zusammenstellen. Die Funktionalität dieser<br />

Shopping-Bots wird gewährleistet durch so genannte “wrappers“ (Hülle oder<br />

Umschlag), Programme also, die Informationen aus einem Online-Shop entneh-<br />

9 Dieter Fensel (2003): Spinning the semantic Web: bringing the World Wide Web to its full potential.<br />

Unter Mitarbeit von Henry Lieberman, Wolfgang Wahlster , James Hendler.<br />

7


men. Hierzu muss allerdings jeweils ein “wrapper“ pro Online-Shop entwickelt<br />

werden. Es liegt auf der Hand, dass mit diesem Ansatz langfristig einige Proble-<br />

me verbunden sind, beispielsweise, dass diese Vorgehensweise die Skalierung<br />

des E-Commerce zur Zeit noch stark hemmt. Die Informationen, die diese Bots<br />

aus den Shops herausfiltern, basieren zum wiederholten Male auf Schlagwor-<br />

ten und einer Analyse des Textes. Dabei funktionieren die Bots aufgrund be-<br />

stimmter Annahmen: Zur Ermittlung des Preises wird nach dem Wort Preis, ge-<br />

folgt von einem €-Zeichen und einem positiven Wert, gesucht. Dieses Vorgehen<br />

ist fehleranfällig und aufgrund dieser Schwierigkeiten extrahieren die Bots oft-<br />

mals nur die nötigsten Informationen. Entscheidungskritische Informationen für<br />

den Käufer, wie etwa Versandgebühren, Liefergebiet und -zeiten sowie Rückga-<br />

berecht, werden normalerweise von den Shopping-Bots nicht mit entnommen.<br />

Die semantische Technologie ermöglicht die Entwicklung von Software Agents<br />

respektive Shopping Agents, die die Produktinformationen und Allgemeinen<br />

Geschäftsbedingungen interpretieren und verarbeiten können. Daraus<br />

entstehen eine Reihe von Vorteilen:<br />

� Produktinformationen und -preise werden korrekt extrahiert und Zustel-<br />

lungskonditionen und die Allgemeinen Geschäftsbedingungen werden<br />

hinsichtlich der Anforderungen des Users interpretiert werden können.<br />

� Zusätzliche Informationen über die Reputation des Online-Händlers<br />

können aus anderen Quellen hinzugezogen werden, beispielsweise von<br />

unabhängigen Ratingagenturen oder aus Bewertungsplattformen von<br />

Konsumenten.<br />

� Die aufwendige Einzel-Programmierung von sogenannten “wrappers“<br />

entfällt gänzlich.<br />

� Intelligente Shopping Agents werden automatisch Verhandlungen für den<br />

Käufer mit dem Shopping Agent des Verkäufers führen können. 10<br />

10 Frank Hermelen, Grigoris Antoniou (2004): A Semantic Web Primer. Herausgegeben von The MIT<br />

Press.<br />

8


1.3.3 Business-to-Business (B2B) Electronic Commerce<br />

Die meisten Benutzer des Inter<strong>net</strong>s verbinden mit elektronischem Handel<br />

hauptsächlich das Geschäft mit Privatkunden (B2C). Allerdings liegt das wahre<br />

wirtschaftliche Potenzial, das die Veränderung durch digitale Technologien mit<br />

sich bringt, im Bereich des Business-to-Business Electronic Commerce (B2B).<br />

Nun ist der elektronische Handel keine neue Erscheinung, vielmehr existieren<br />

bereits seit den 1960er Jahren Initiativen, die den elektronischen Datenaus-<br />

tausch (electronic data exchange) zwischen verschiedenen EDV-Systemen der<br />

Unternehmen forcieren. 11 Damit Informationen zwischen den Unternehmen aus-<br />

getauscht werden können, müssen sich Sender und Empfänger auf einen ge-<br />

meinsamen Standard einigen – ein Protokoll, welches den Inhalt überträgt und<br />

eine gemeinsame Sprache, die den Inhalt beschreibt. Eine Reihe von verschie-<br />

denen Standards sind seit dem entwickelt worden – ein Beispiel für einen sol-<br />

chen branchenübergreifenden EDI-Standard ist der United Nations Electronic<br />

Data Interchange For Administration, Commerce and Transport (UN/EDIFACT).<br />

Generell blieb der tatsächliche Nutzen solcher automatisierter Geschäftsvor-<br />

gänge weit hinter den Erwartungen zurück, und im Speziellen sind mit dem EDI-<br />

Standard folgende Nachteile verbunden:<br />

� Der elektronische Datenaustausch zwischen den Teilnehmern setzt im-<br />

mer eine hohes Maß an Kompatibilität von Hardware, Software und<br />

Übertragungsprozeduren auf beiden Seiten voraus.<br />

� Mit der Einführung von EDI werden meist Änderungen bei internen Un-<br />

ternehmensabläufen notwendig, wodurch in der Regel hohe zusätzliche<br />

Investitionskosten entstehen.<br />

� Genauso wie einmalige Investitionskosten entstehen, sind die laufenden<br />

Kosten für den Betrieb des EDI-Systems nicht unerheblich. 12<br />

11 Dieter Fensel (2003): Spinning the semantic Web: bringing the World Wide Web to its full potential.<br />

Unter Mitarbeit von Henry Lieberman Wolfgang Wahlster James Hendler.<br />

12 Mark-Oliver Würtz (2007): Möglichkeiten und Methoden des'computer supported Cooperative<br />

Work'(CSCW). Herausgegeben von GRIN Verlag.<br />

9


Und trotzdem hat Nutzung der Infrastruktur des Inter<strong>net</strong>s in den vergangenen<br />

Jahren den Austausch von geschäftlichen Daten enorm verbessert. Anzuführen<br />

wäre das Beispiel WebEDI. WebEDI ist ein Verfahren zur Anbindung von<br />

Geschäftspartnern an das EDI-System ohne EDI-Infrastruktur unter Nutzung<br />

des Inter<strong>net</strong>s. 13 Dennoch wird der geschäftliche Datenaustausch nach wie vor<br />

dadurch behindert, dass die momentan noch weit verbreitete Hypertext Markup<br />

Language (HTML), eine auf Text basierende Auszeichnungssprache zur Struk-<br />

turierung von Webinhalten, keine Möglichkeit bietet, die Syntax und Bedeutung<br />

von Daten wiederzugeben. Die Extensible Markup Language (XML) löst in An-<br />

sätzen diese Problematik, denn sie verfügt über eine standardisierte und<br />

vorgegebene Syntax, die die Struktur und den Bedeutungsinhalt von Daten ein-<br />

heitlich definiert. Dennoch unterstützt XML zurzeit keine standardisierten Daten-<br />

strukturen und Terminologien, um Geschäftsvorgänge oder angebotene Pro-<br />

dukte zu beschreiben. Hierfür werden die semantische Technologie und die<br />

Möglichkeiten von XML eine bedeutende Rolle spielen. So wird sie flexible Un-<br />

ternehmenskooperationen ohne hohe Verwaltungskosten ermöglichen, sowie<br />

den automatischen Austausch von Daten enorm beschleunigen und optimieren,<br />

wodurch neue Geschäftsmodelle entstehen können. Außerdem werden durch<br />

die Software Agents automatische Auktionen, Verhandlungen und Vertragsab-<br />

schlüsse ermöglicht werden.<br />

1.4 Web 3.0 – Bedarf an semantischen Web im Unternehmen<br />

Dieser Abschnitt behandelt die Möglichkeiten, die sich durch die Implementie-<br />

rung und Anwendung der semantischen Technologien innerhalb des Un-<br />

ternehmens ergeben. Die Entwicklung von der Industriegesellschaft zur Infor-<br />

mationsgesellschaft, verbunden mit der stetig wachsenden Menge an<br />

produzierten Informationen durch den Menschen, lässt das Management von<br />

Wissen in Unternehmen und vor allem großen Organisationen immer wichtiger<br />

werden. Am Ende des Tages wird die Organisation den größten Wettbewerbs-<br />

vorteil erreichen, die die besten Informationen hat, weiß, wo sie diese findet,<br />

und sie am schnellstens für sich nutzbar machen kann. Nun hat bereits die Ein-<br />

13 Arne Dicks: Was ist WebEDI? GS1 Germany GmbH. Online verfügbar unter http://www.gs1-germany.de/inter<strong>net</strong>/content/produkte/ean/ecommerce_edi/webedi/index_ger.html,<br />

zuletzt geprüft am<br />

13.04.2008.<br />

10


führung des Inter<strong>net</strong>s beim herkömmlichen “Knowledge-Management” für einige<br />

Herausforderungen gesorgt: Informationsüberlastung, die Ineffizienz der auf<br />

Schlagworten basierenden Suche sowie das Fehlen von Computersystemen,<br />

die natürliche Spache deuten und verarbeiten können. 14 Die semantischen<br />

Technologien können dieses Informations-Chaos strukturieren. Dafür müssen<br />

wir jedoch beginnen, die Vorteile des semantischen Webs für uns zu nutzen,<br />

beispielsweise die Informationen, die wir produzieren, mit Markierungen (Tags)<br />

zu versehen, die von Maschinen respektive Computern gedeutet und ver-<br />

arbeitet werden können.<br />

Abbildung 2 zeigt beispielhaft, in welchen Bereichen sich eine Organisation die<br />

Abbildung 2: Use of the Semantic Web in your enterprise; Michael C. Daconta, Leo J. Obrst,<br />

Kevin T. Smith: The Semantic Web S.19<br />

semantische Technologie zu Nutzen machen kann. Nur wenn man die<br />

benötigten und produzierten Informationen aus allen Bereichen ver<strong>net</strong>zen und<br />

nach ihrem Bedeutungsgehalt markieren kann, wird aus rohen Informationen<br />

anwendbares Wissen für die Mitarbeiter eines Unternehmens. Das Unterneh-<br />

men, welches all diese losgelösten Informationelemente aus den verschiedenen<br />

Bereichen und Abteilungen zusammenzufügen, zu organisieren und<br />

wiederzufinden vermag, wird diese auch langfristig kapitalisieren können. Die<br />

14 Fensel, Bussler, Ding, Kartseva, Klein, Korotkiy, Omelayenko, Siebes (27. - 28.06.2007):<br />

Semantic Web Applications Areas. 7th International Workshop on Applications of Natural Language to<br />

Information Systems. Veranstaltung vom 27. - 28.06.2007. Sweden, Stockholm.<br />

11


nachfolgenden Ausführungen zeigen den konkreten Nutzen der semantischen<br />

Technologie beispielhaft in einigen unternehmerischen Bereichen.<br />

1.4.1 Entscheidungsunterstützung<br />

Innerhalb des Unternehmens über erfolgskritisches Wissen anstatt über rohe<br />

Daten zu verfügen, führt zu schnelleren und fundierteren Entscheidungen. Nun<br />

sind die meisten großen Unternehmen organisiert in Tochterunternehmen, re-<br />

gionalen Divisionen, Gruppen- und Projektteams, die unterschiedliche Quellen<br />

zur Informationsbeschaffung nutzen und verschiedene Problemlösungen in<br />

Form von Informationen erarbeiten. Teilweise werden bereits innerhalb der-<br />

selben Organisation diese erarbeiteten Lösungen meist in proprietären Daten-<br />

banken und Servern abgelegt, was die Interoperabilität und den Austausch von<br />

Informationen zwischen den verschiedenen Organisationseinheiten enorm<br />

hemmt. Diese Problematik wird sich erst lösen, wenn die unterschiedlichen In-<br />

formationselemente verschiedener Abteilungen und Unternehmensbereiche<br />

sinnvoll kombiniert und die Verbindungen zwischen diesen Elementen eindeutig<br />

beschrieben und genutzt werden können.<br />

Diese Arbeit wird in Zukunft von sogenannten semantischen “decision support<br />

systems” (DSS) geleistet werden. Die Systeme zur Entscheidungsunterstützung<br />

analysieren die unterschiedlichen Software Agents und unterstützen die Interak-<br />

tion zwischen dem Nutzer und seinem Computersystem, um so bessere<br />

Entscheidungen zu treffen. 15 Selbst ohne die “decision support systems” wer-<br />

den die Software Agents die eigene Wissensdatenbank überwachen können<br />

und bei Bedarf den Eigner durch einen Alert (Alarmhinweis) über Wichtiges in-<br />

formieren. Um bessere Entscheidungen zu treffen, braucht man besseres Wis-<br />

sen. Die semantische Technologie wird dies ermöglichen.<br />

1.4.2 Business Development<br />

Die erfolgreiche Geschäftsentwicklung, also hauptsächlich die Anbahnung<br />

zukünftiger Geschäfte und Folgegeschäfte, hängt in hohem Maße von den ge-<br />

15 M. Casey and M. Austin (November 2001): Semantic Web Methodologies for Spatial Decision Support.<br />

Herausgegeben von University of Maryland. Institute for Systems Research and Department of Civil and<br />

Environmental Engeneering, November 2001.<br />

12


wonnenen Informationen über Wettbewerber, Kunden, Beschaffungs- und Ab-<br />

satzmärkte sowie Produkte ab. Nun ist es in der Praxis kaum möglich, neben<br />

einem kleinen Vertriebsteam die Mitarbeiter aller weiteren Unternehmens-<br />

bereiche profilaktisch mit zu einer Kundenpräsentation zu schicken, für den Fall,<br />

dass ein Kunde Informationen wünscht, die so nicht explizit vorbereitet worden<br />

sind. Ist es dem Vertriebsteam allerdings möglich, von außerhalb auf die se-<br />

mantische Unternehmenswissensdatenbank (Corporate Knowledge-Base)<br />

zuzugreifen, so können alle erfolgskritischen Informationen in kürzester Zeit<br />

abgerufen und dem Kunden zur Verfügung gestellt werden. Das Vertriebsteam<br />

könnte so über die entscheidenden Informationen aus vertriebsfremden<br />

Bereichen verfügen und dem Kunden gegenüber nutzbar machen.<br />

Ein weiterer Anwendungsbereich des semantischen Webs im Unternehmen ist<br />

die Abgabe wettbewerbsfähiger Angebote. Letztendlich hat das Unternehmen<br />

mit den besten Informationen über den potentiellen Kunden, die gestellte<br />

Aufgabe und die geforderten Fähigkeiten und Leistungen die größte Chance,<br />

den Zuschlag zu erhalten. Verfügt man nun als Unternehmen über eine se-<br />

mantische Wissensdatenbank, in der Statusreporte, Angebote, Konkurrenzbeo-<br />

bachtungen und Erfahrungsberichte aus der Vergangenheit nach ihrem Bedeu-<br />

tungsgehalt und mit ihren Relationen abgelegt werden, so könnte dies<br />

schlussendlich bei der Angebotsabgabe für den nötigen Unterschied und somit<br />

Zuschlag sorgen. Voraussetzung dafür ist die Implementierung der se-<br />

mantischen Technologie innerhalb der Unternehmen und die semantische<br />

Pflege der Daten. Sind diese Erfordernisse erfüllt, könnten die un-<br />

ternehmerischen Software Agents diese gesammelten Informationen analysier-<br />

en und sogar gegebenenfalls zu bisher nicht erkannten, erfolgskritischen In-<br />

formationspaketen kombinieren.<br />

In Anlehnung an den Vortrag von Trastour, Bartolini, Gonzales-Castillo mit dem<br />

Titel “A Semantic Web Approach to Service Description of Matchmaking of Ser-<br />

vice” auf dem International Semantic Web Working Symposium (SWWS) an der<br />

Standford University in Kalifornien im Jahre 2001 wird die semantische Techno-<br />

logie das automatische “Matchmaking” im elektronischen Handel ermöglichen.<br />

Unter “Matchmaking” wird hier die automatische Vermittlung von Geschäften<br />

13


zwischen potentiellen Geschäftspartner und Kunden verstanden. Diese auto-<br />

matische Vermittlung könnte im Bereich der Werbung so weit gehen, dass das<br />

Werbeinventar digitaler Werbemittel semantisch markiert und kategorisiert wird<br />

und von den Software Agents der Werbetreibenden automatisch nach den<br />

festgelegten Kriterien gebucht werden könnte.<br />

1.4.3 Automatisierte Verwaltung<br />

Die beiden vorangegangenen Unterabschnitte haben hauptsächlich die Vorteile<br />

der semantischen Technologien in Bezug auf ein semantisches “Knowledge-<br />

Mangement” behandelt. Ein Zusatznutzen, den eine semantische Wissens-<br />

datenbank liefert, ist die Möglichkeit der Ankopplung unternehmerischer Soft-<br />

ware zur Erledigung wiederkehrender Verwaltungsaufgaben. Die Koordination<br />

von Reisebuchungen im Unternehmen ist ein Beispiel für eine solche wieder-<br />

kehrende Verwaltungsaufgabe. Der Planende ist konfrontiert mit divergierenden<br />

persönlichen Vorlieben hinsichtlich der Transportart (Auto, Zug, Bus, Flugzeug),<br />

der Hotelauswahl und der Fluglinie sowie mit Variablen wie etwa der Entfernung<br />

zum gemeinsamen Besprechungsort und Bevorzugungen je nach Hierarchie.<br />

Sind diese Variablen darüber hinaus mit Vorgaben des Unternehmens<br />

verknüpft, also beispielweise bei Entfernungen unter 300 Kilometern sollte das<br />

Automobil genutzt werden oder Personal der ersten Managementebene reist 1.<br />

Klasse und alles abwärts 2. Klasse, so kann die Reisebuchung zu einer sehr<br />

komplexen Aufgabe innerhalb des Unternehmens werden. Auch hier kann in<br />

Zukunft die semantische Technologie diese zeit- und kostenaufwendige<br />

Aufgabe automatisch vollbringen. Sind die persönlichen Präferenzen der ges-<br />

amten Belegschaft und die unternehmerischen Vorgaben in der semantischen<br />

Wissensdatenbank hinterlegt, könnte diese Verwaltungsaufgabe in Zukunft<br />

automatisch von der eigenen unternehmerischen Reise-Applikation übernom-<br />

men werden. Die Applikation würde dann zur Konfliktlösung auf das in der se-<br />

mantischen “Knowledge-Base” festgelegte, maschinenlesbare Regelwerk<br />

zurückgreifen. Durch den Zugang zu im Inter<strong>net</strong> verfügbaren, semantisch gek-<br />

ennzeich<strong>net</strong>en Reise- und Hotelbuchungsanbietern wird die Reise-Applikation<br />

in der Lage sein zu vergleichen, gegenüberzustellen, die verschiedenen Altern-<br />

14


ativen zu bewerten und dem Planenden eine übersichtliche Liste mit allen rele-<br />

vanten Informationen auszuwerfen. 16<br />

Und dies ist nur ein Beispiel von täglich wiederkehrenden Verwaltungsaufgaben<br />

im Unternehmen, die durch die Implementierung der semantischen Technologi-<br />

en stark vereinfacht werden könnten.<br />

1.5 Möglichkeiten des semantischen Webs im privaten Bereich<br />

Analog zu den Software Agents im Unternehmen wird die semantische Techno-<br />

logie sogenannte Personal Agents ermöglichen, die ihre Benutzer bei wieder-<br />

kehrenden, alltäglichen Aufgaben unterstützen. So könnten Personal Agents<br />

beispielsweise den persönlichen Kalender verwalten, Aktivitäten mit Familie,<br />

Freunden und Bekannten koordinieren und einfache Anfragen von außerhalb<br />

für ihren Besitzer beantworten. 17 Der Nutzen, der durch Personal Agents er-<br />

reicht wird, erhöht sich selbstredend mit der allgemeinen Verbreitung der<br />

Agents – das semantische Web profitiert vom Netzwerkeffekt. Eine Umgebung,<br />

in der mehrere Personal Agents miteinander interagieren, wird auch Multi-Agent<br />

System genannt. Die nachfolgenden Ausführungen beleuchten die Möglich-<br />

keiten, die sich durch die semantischen Technologien im privaten Bereich<br />

ergeben.<br />

1.5.1 Personal Agents<br />

Die Motivation der Idee der Personal Agents ist auf die stetig wachsende<br />

Menge an Informationen und die damit verbundene Informationsüberflutung<br />

zurückzuführen. Der alternative Ansatz, eine zentrale Suchmaschine, die den<br />

genauen Informationsbedarf der Nutzer kennt und speichert, wird für die End-<br />

nutzer langfristig keine zufriedenstellende Lösung aufgrund der offengelegten<br />

Privatssphäre, darstellen. Semantische Personal Agents, die nur ihrem Eigner<br />

Rechenschaft schuldig sind, stellen hinsichtlich des Auffindens und der Verwer-<br />

16 Michael C. Daconta (2003): The Semantic Web. A Guide to the Future of XML, Web Services, and<br />

Knowlege Management. Unter Mitarbeit von Kevin T. Smith Leo. J. Obrst. Herausgegeben von WILEY,<br />

S. 17–18.<br />

17 Department of Computer Science and Electrical Engineering (Hg.) (November, 2002): Personal Agents<br />

on the Semantic Web. Unter Mitarbeit von Anugeetha Kunjithapatham Mithun Sheshagiri Tim Finin Anupam<br />

Joshi Yun Peng and R. Scott Cost Subhash Kumar. University of Maryland Baltimore County.<br />

15


tung von Informationen auf lange Sicht die bessere Lösung dar. Personal<br />

Agents werden allerdings nicht nur für das persönliche Knowledge-Manage-<br />

ment nützlich sein. Sie werden mit anderen Agents kommunizieren können,<br />

also bestimmte Anfragen starten und empfangen, und dies jeweils immer unter<br />

Berücksichtung der persönlichen Vorlieben und Einstellung ihrer Besitzer. Ver-<br />

handlungen und Auktion werden analog zu unternehmerischen Agents von<br />

Personal Agents auf privater Basis durchgeführt werden.<br />

Woolwridge definiert Software Agents folgendermaßen:<br />

� Agenten. Ein Agent ist ein computerbasiertes System, das in einer<br />

Umgebung autonom handeln kann.<br />

� Intelligente Agenten. Ein intelligenter Agent ist ein computerbasiertes<br />

System, das in einer Umgebung flexibel und autonom handeln kann.<br />

� Flexibles autonomes Handeln. Flexibles autonomes Handeln ist<br />

charakterisiert durch Reaktivität, Proaktivität und soziales Verständnis.<br />

� Reaktivität. Ein reaktives System steht permanent in einem Regelkreis-<br />

lauf mit den umgebenden Systemen und reagiert auf Veränderungen in<br />

der Umgebung in angemessener Zeit, wobei angemessen in diesem<br />

Zusammenhang in Bezug zum Nutzen der Reaktion steht.<br />

� Proaktivität. Ein Software Agent erfüllt Aufgaben und muss dazu ziel-<br />

gerichtet handeln. Das bedeutet auch, dass der Agent Handlungsmög-<br />

lichkeiten erkennen und nutzen muss.<br />

� Soziales Verständnis. Sozialkompetenz ist bei Agenten die Fähigkeit,<br />

mit anderen Agenten und möglicherweise auch mit Menschen zu kom-<br />

munizieren und zu kooperieren. 18<br />

18 Michael Wooldridge (2002): An Introduction to Multi-agent Systems. 1. Aufl.: Wiley & Sons.<br />

16


Anhand dieser Charakteristika lässt sich leicht ausmalen, welche vielfältigen<br />

Möglichkeiten Personal Agents in Zukunft bieten. Das folgende Szenario ist ein<br />

konkretes Beispiel:<br />

Der Personal Agent wird beauftragt, ein geig<strong>net</strong>es Auto zum Kauf ausfindig zu<br />

machen. Er kennt die Vorlieben des Besitzers und trifft eine Vorauswahl der in-<br />

frage kommenden Modelle. Der Agent kontaktiert die Agents verschiedener An-<br />

bieter und wählt schließlich eine kleine Auswahl der in der Nähe befindlichen<br />

Anbieter aus. Die Agents tauschen Preise, Produkt-Details und Lieferbedingun-<br />

gen aus und führen gegebenenfalls automatisch die Verhandlungen durch.<br />

Dabei wird der Personal Agent die Reputation der Anbieter anhand unab-<br />

hängiger Quellen mit berücksichtigen. Wird tatsächlich ein geeig<strong>net</strong>es Angebot<br />

gefunden, greift der Agent auf den persönlichen Terminkalender zurück, um<br />

freie Termine zu finden und einen Zeitpunkt zur Probefahrt mit dem Agent des<br />

Anbieters zu vereinbaren. Schließlich informiert der Personal Agent ein mobiles<br />

Endgerät, welches der Besitzer bei sich trägt.<br />

Dieses konkrete Beispiel lässt sich auf alle erdenklichen privaten Bereiche<br />

übertragen. Die Personal Agents der Zukunft sind eng verzahnt mit den gegen-<br />

wärtig aktuellen Themen “Webservices” und “Serviceorientierte Architekturen”.<br />

“Webservices are software applications that can be discovered, de-<br />

scribed, and accesed based on XML and standard Web protocols over<br />

intra<strong>net</strong>s, extra<strong>net</strong>s and the Inter<strong>net</strong>”. 19<br />

Webservices könnten also als die Vorfahren von Personal Agents angesehen<br />

werden, außer dass ihnen der Aspekt der semantischen Beschreibung fehlt, so<br />

dass ihre spezielle Funktion von anderen Agenten nicht lokalisiert, identifiziert<br />

und somit genutzt werden kann.<br />

19 Michael C. Daconta (2003): The Semantic Web. A Guide to the Future of XML, Web Services, and<br />

Knowlege Management. Unter Mitarbeit von Kevin T. Smith Leo. J. Obrst. Herausgegeben von WILEY,<br />

S. 58.<br />

17


“Eine Serviceorientierte Architektur ist ein Framework für die Integration<br />

von Geschäftsprozessen und unterstützender IT-Infrastruktur in Form<br />

von sicheren, standardisierten Komponenten - Services -, die sich<br />

wiederverwenden und kombinieren lassen, um wechselnde Geschäftsan-<br />

forderungen abzubilden.” 20<br />

Services sind in diesem Zusammenhang als Softwarekomponenten zu ver-<br />

stehen, die so einfach konstruiert sind, dass sie sich mit anderen Softwarekom-<br />

ponenten mühelos verbinden lassen und so einmal programmierte Services<br />

langfristig ihren Wert erhalten, da ihre Leistung einzeln immer abrufbar und ver-<br />

fügbar ist und stets mit neuen Services kombiniert werden kann. Das Beispiel<br />

eines Online-Brokerage-Anbieters zum Abschluss von Wertpapiergeschäften<br />

würde insgesamt die nachfolgenden einzelnen Softwarekomponenten enthal-<br />

ten, die aber auch stets einzeln abrufbar sind.<br />

� Wertpapierdienst, der handelbare Wertpapiere nennt.<br />

� Marktdatendienst, der zu einem Wertpapier aktuelle Börsenkurse liefert.<br />

� Depotdienst, der Zugriff auf das Wertpapierdepot des Anwenders er-<br />

laubt.<br />

� Orderdienst, der Kauf-/Verkaufsaufträge des Anwenders an eine Börse<br />

übermittelt.<br />

� Archivdienst, der alle Daten der Transaktion revisionssicher archiviert.<br />

Ähnlich zum Konzept der Serviceorientierten Architekturen werden auch Per-<br />

sonal Agents im semantischen Web einzelne, losgelöste Services oder Informa-<br />

tionsbruchstücke zu Wertschöpfungketten zusammenfügen können. Dazu wer-<br />

den die einzelnen Komponenten von Agent zu Agent gereicht, wobei jeder<br />

Agent auf seine bestimmte Weise einen Nutzen bzw. eine Information hin-<br />

zufügt, wodurch schließlich das finale Produkt, das vom Endnutzer angefragt<br />

20 Norbert Bieberstein, Sanjay K. Bose, Marc Fiammante, Keith Jones, Rawn Shah (2005):<br />

Service-Oriented Architecture Compass. Business Value, Planning, and Enterprise Roadmap:<br />

Prentice Hall International.<br />

18


worden ist, konstruiert wird. 21 Außerdem steht das Thema Serviceorientierte Ar-<br />

chitekturen insofern in Beziehung zum semantischen Web, als dass es auf<br />

Seiten der Unternehmen das Bewusstsein zur Entwicklung von losgelösten Ser-<br />

vices schafft, die so in Zukunft eventuell von Software Agents verwendet wer-<br />

den könnten. Weiterhin hat die Forschung rund um das Thema Serviceori-<br />

entierte Architekturen erkannt, dass sie einige semantischen Technologien nicht<br />

umgehen kann bzw. die Serviceorientierte Architekturen von den Technologien<br />

des semantischen Webs profitieren werden.<br />

1.5.2 Veränderungen in der physikalischen Welt<br />

In der weiteren Entwicklung wird das semantische Web aus der virtuellen Welt<br />

ausbrechen und sich auf unsere physikalische Welt erweitern. Mittels Uniform<br />

Resource Identifiers (URI), auf die später noch eingegangen wird, kann auf<br />

alles eindeutig verwiesen und dadurch unmissverständlich identifiziert werden,<br />

also auch physikalische Endgeräte wie Mobiltelefone, Televisionsgeräte, Kühls-<br />

chränke, hausinterne Sicherheitssysteme, Radiogeräte und viele mehr. Diese<br />

Geräte können zukünftig ihre Funktionen bewerben, also nach außen darstel-<br />

len, was sie können und wie sie bedient werden. Sie werden untereinander<br />

kommunizieren und auch automatische Schlussfolgerungen vollziehen können.<br />

Die flexible, semantische Ansteuerung von Geräten wird den heute verfügbaren<br />

Methoden, etwa “Universal Plug and Play”, weit überlegen sein und eine Fülle<br />

von Möglichkeiten eröffnen.<br />

Die heutige Hausautomatisierung, also die Informations- und Kommunikations-<br />

technologie für mehr Komfort im und in der Umgebung des eigenen Hauses, er-<br />

fordert eine penibelst genaue Abstimmung aller teilnehmenden Geräte, damit<br />

ein solches System überhaupt funktionieren kann. Die semantische Be-<br />

schreibung der Möglichkeiten und Funktionen der häuslichen Endgeräte ermög-<br />

licht einen höheren Grad der Automatisierung mit minimalem menschlichem<br />

Eingreifen. So könnten sich zum Beispiel alle Endgeräte im Haus, die<br />

akustische Signale von sich geben (Televisionsgeräte, Radiogeräte, Stereoan-<br />

lage), bei einem eingehenden Anruf automatisch den Ton leise stellen. Gegen-<br />

21 Tim Berners-Lee, James Hendler Ora Lassila (2001): The Semantic Web: a new form of Web content<br />

that is meaningful to computers will unleash a revolution of new possibilities. In: Scientific American, H.<br />

284 (5), S. 34–43.<br />

19


wärtig müsste man für eine solche Funktion jedes einzelne Gerät und deren<br />

Schnittstellen programmieren. Im semantischen Web würde man eine solche<br />

Funktion nur einmal für alle lokalen Endgeräte programmieren, die eine Funk-<br />

tion “Lautstärkeregelung” bewerben – das Televisionsgerät, das DVD-Abspiel-<br />

gerät und selbst der Laptop, den man nur für einen Abend von der Arbeit mitge-<br />

bracht hat. Wahrscheinlich wird es sogar soweit gehen, dass lokale Endgeräte<br />

andere Endgeräte und Services automatisch auffinden und beauftragen<br />

können, um zusätzliche Informationen oder Funktionalitäten zu erhalten. So<br />

könnte die mit dem World Wide Web verbundene Mikrowelle die Website des<br />

Tiefkühlwarenherstellers kontaktieren, um die optimalen Zubereitungsangaben<br />

und -zeiten zu erhalten. 22<br />

1.6 Abgrenzung zur künstlichen Intelligenz<br />

Damit der gewünschte Automatisierungsgrad von Software Agents und Web-<br />

services im semantischen Web erreicht werden kann, müssen Computer auf<br />

strukturierte Sammlungen von Informationen und auf eine Reihe von<br />

Ableitungsregeln, die sie benutzen können, um automatische Schlussfolger-<br />

ungen durchzuführen, zurückgreifen können. Die Forschung der künstlichen In-<br />

telligenz beschäftigte sich mit solchen Systemen schon lange vor der<br />

Entstehung des Inter<strong>net</strong>s. Und tatsächlich bauen viele der Technologien, die<br />

zur Realisierung des semantischen Webs benötigt werden, auf die Erkenntnisse<br />

aus der Forschung der künstlichen Intelligenz auf. Das Konzept des se-<br />

mantischen Webs hat nichts mit der künstlichen Intelligenz zu tun. The-<br />

menschwerpunkte der Forschung der künstlichen Intelligenz sind beispiels-<br />

weise komplexe Entscheidungsprozeduren, räumliches Denken, selbständiges<br />

Schlussfolgern aus unvollständigen Informationen (Abduktion), assoziatives<br />

Schlussfolgern sowie Bild- und Mustererkennung – all dies hat nichts mit dem<br />

semantischen Web zu tun. Nachfolgend werden weitere grundlegende Unter-<br />

schiede in der Konzepten dieser beiden Forschungsgebiete beschrieben. Die<br />

traditionellen Systeme der Wissensrepräsentation sind zentral ausgerichtet, im<br />

Gegensatz zum dezentralen Inter<strong>net</strong> und semantischen Web. Durch diese Zen-<br />

22 Tim Berners-Lee, James Hendler Ora Lassila (2001): The Semantic Web: a new form of Web content<br />

that is meaningful to computers will unleash a revolution of new possibilities. In: Scientific American, H.<br />

284 (5), S. 34–43.<br />

20


tralität sind alle Teilnehmer gezwungen, exakt dieselben Definitionen von<br />

Konzepten zu verwenden. Darüber hinaus sind die Abfragemöglichkeiten der<br />

traditionellen Wissensrepräsentationsysteme stark begrenzt, damit das System<br />

verlässliche Ergebnisse liefert bzw. überhaupt antworten und funktionieren<br />

kann. Aus diesem Grund haben diese Systeme immer jeweils eigene<br />

Ableitungsregeln, die nicht ohne weiteres von einem System ins andere trans-<br />

feriert werden können. 23<br />

Zusammengefasst lässt sich festhalten, dass das semantische Web auf vielen<br />

Erkenntnissen der Forschung der künstlichen Intelligenz aufbaut und das die<br />

Forschung im Bereich des semantischen Webs von weiteren Erkenntnissen der<br />

künstlichen Intelligenz profitieren wird. Wenn aber in diesen Ausführungen von<br />

Software Agents gesprochen wird, hat es nicht im Entferntesten etwas mit der<br />

künstlichen Intelligenz von Robotermenschen wie C-3PO aus dem Film Star<br />

Wars zu tun. Weiterhin besteht auch nicht die Notwendigkeit, auf einen Durch-<br />

bruch in der Forschung der künstlichen Intelligenz zu warten, bis das Konzept<br />

des semantischen Webs umgesetzt werden kann.<br />

1.7 Vorgehensweise<br />

Die vorliegende Arbeit untersucht die Chancen und Auswirkungen des se-<br />

mantischen Webs. In der Einleitung werden die relevanten Begriffe erklärt, der<br />

Untersuchungsraum eingegrenzt und die Bereiche mit Bedarf an semantischen<br />

Technologien sowie zukünftige Möglichkeiten beleuchtet.<br />

Im Hauptteil werden das W3C-Konsortium, seine Rolle und Aufgaben sowie die<br />

aufgestellten Grundprinzipien des semantischen Webs vorgestellt und erläutert.<br />

Im weiteren Verlauf werden die Technologien des semantischen Webs vorge-<br />

stellt, wobei es nicht Ziel dieses Abschnittes ist, Programmiersprachen und der-<br />

en Funktionsweise zu erklären, sondern die Konzepte und Möglichkeiten hinter<br />

den Technologien aufzudecken und zu vermitteln. Anschließend wird eine zeit-<br />

liche Einordnung bis zur vollständigen Verwirklichung des semantischen Webs<br />

23 Tim Berners-Lee, James Hendler Ora Lassila (2001): The Semantic Web: a new form of Web content<br />

that is meaningful to computers will unleash a revolution of new possibilities. In: Scientific American,<br />

H. 284 (5), S. 34–43.<br />

21


vorgenommen und verschiedene Umsetzungsszenarien beschrieben. Im letzen<br />

Teil des Hauptteils werden anhand von Praxisbeispielen die Auswirkungen und<br />

Chancen des semantischen Webs für die Wirtschaft, den Gesundheitsbereich<br />

und den privaten Bereich dargestellt.<br />

Letztendlich werden im letzten Schlussteil die wichtigsten Ergebnisse kritisch<br />

zusammengefasst und ein Ausblick sowie weitere Perspektiven zum Thema<br />

geliefert.<br />

2 Das Inter<strong>net</strong> morgen<br />

Das semantische Web ist keine separate Erweiterung des bestehenden Inter-<br />

<strong>net</strong>s, sondern vielmehr eine Vielzahl kleinerer Technologien, die in ihrer Kom-<br />

bination die in der Einleitung angedeuteten Veränderungen bewirken. Zuerst<br />

wird das W3C-Konsortium, seine Rolle und Aufgaben vorgestellt, um dann nä-<br />

her auf die vom W3C verabschiedeten Grundprinzipien des semantischen<br />

Webs einzugehen. Im weiteren Verlauf setzt sich die Arbeit mit den relevanten<br />

Technologien des semantischen Webs auseinander, ohne zu sehr auf technis-<br />

che Spezifikationen dieser Technologien einzugehen. Vielmehr wird versucht,<br />

die hinter den Technologien liegenden Konzepte und Möglichkeiten zu erklären<br />

und zu vermitteln. Anschließend wird die Architektur des semantischen Webs<br />

anhand des von Tim Berners-Lee vorgeschlagenem Schichtenmodell erklärt<br />

und auf die Wichtigkeit und Bedeutung dieses Schichtenmodells für die Weiter-<br />

entwicklung des semantischen Webs eingegangen. Außerdem werden ver-<br />

schiedene Umsetzungsszenarien zur vollständigen Verwirklichung des se-<br />

mantischen Webs kritisch gewürdigt und eine zeitliche Einordnung vorgenom-<br />

men. Schließlich werden die Chancen und Auswirkungen des semantsichen<br />

Webs anhand von ausgewählten Praxisbeispielen angedeutet.<br />

2.1 Das W3C-Konsortium<br />

Die wohl wichtigste Vereinigung bei der allgemeinen Entwicklung des Inter<strong>net</strong>s<br />

und insbesondere zur Verwirklichung der Idee des semantischen Webs ist das<br />

22


W3C-Konsortium. Es ist ein internationales Konsortium bestehend aus über 400<br />

bedeutenden internationalen Unternehmen und Universitäten, und einem fest<br />

angestellen Team. Das Konsortium arbeitet gemeinsam daran, Standards im In-<br />

ter<strong>net</strong> zu entwicklen, um durch diese festgelegten Protokolle und Richtlinien die<br />

vollen Möglichkeiten des World Wide Webs zu erschließen und so ein lang-<br />

fristiges Wachstum des Inter<strong>net</strong>s zu ermöglichen. Dabei hat das W3C in den er-<br />

sten zehn Jahren ihrer Arbeit mehr als achtzig W3C Recommendations heraus-<br />

gegeben, engagiert sich in Ausbildung und Verbreitung der Standards, entwick-<br />

elt Software und dient als offenes Diskussionsforum. Damit das gesamte Poten-<br />

zial des Inter<strong>net</strong>s ausgeschöpft werden kann, müssen die fundamentalen Web-<br />

Technologien kompatibel untereinander sein und mit jeder beliebigen Hard- und<br />

Software, die auf das Inte<strong>net</strong> zugreift, zusammenarbeiten. Das W3C bezeich<strong>net</strong><br />

dieses Ziel als “Web-Interoperabilität”. Durch die Veröffentlichung von offenen,<br />

nicht proprietären Standards versucht das W3C-Konsortium eine Marktfragmen-<br />

tierung – und damit eine Fragmentierung des Inter<strong>net</strong>s – zu vermeiden. Tim<br />

Berners-Lee ist Direktor des W3C-Konsortiums seit der Gründung dieser Or-<br />

gansation im Jahre 1994.<br />

Mit ihrer Mission verfolgt das W3C-Konsortium folgende allgemein gültige, lang-<br />

fristige Ziele:<br />

� Das Web für Jedermann. Die soziale Stärke des Inter<strong>net</strong>s besteht dar-<br />

in, dass es zwischenmenschliche Kommunikation, eine Umgebung für<br />

Geschäfte und Möglichkeiten zum Wissensaustausch bietet. Eines der<br />

Hauptziele der W3C ist es, diese Vorteile allen Menschen, unabhänig<br />

von ihrer Hard- und Software, Netzinfrastruktur, Muttersprache und Kul-<br />

tur, geografischer Position, physischen und geistigen Fähigkeiten,<br />

zugänglich zu machen.<br />

� Das Web auf allen Geräten. Die Vielzahl der Endgeräte, die auf das In-<br />

ter<strong>net</strong> zugreifen können, wachsen kontinuierlich. Mobiltelefone, Smart-<br />

phones, PDAs, interaktive Fernsehsysteme, Spielekonsolen – all diesen<br />

Endgeräten soll der Zugang zum Inter<strong>net</strong> einfach und bequem ermöglicht<br />

werden.<br />

23


� Wissensschatz. Das Inter<strong>net</strong> ist nicht nur eine riesige Informationsquelle<br />

für Menschen, die darin suchen und Informationen untereinander aus-<br />

tauschen können. Es ist auch eine sehr große Datenbank, die es Com-<br />

putern ermöglichen kann, mehr nützliche Arbeit für den Menschen zu<br />

übernehmen. So arbeitet das W3C daran, ein Inter<strong>net</strong> sowohl für die<br />

Menschen als auch für die Maschinen zu entwickeln.<br />

� Sicherheit und Vertrauen. Damit das Inter<strong>net</strong> zu einem nutzenbringen-<br />

dem Medium für soziale Aktivitäten werden kann, muss man den Teil-<br />

nehmern vertrauen können. Obwohl Vertrauen niemals durch Technik<br />

geschaffen werden kann, fördert das W3C-Konsortium Technologien, die<br />

eine stärker gemeinschaftliche Umgebung ermöglichen, also ein Inter<strong>net</strong>,<br />

das Verantwortung, Sicherheit, Vertrauen und Vertraulichkeit in sich ver-<br />

eint. 24<br />

2.2 Die Grundprinzipien des semantischen Webs<br />

Der folgende Abschnitt behandelt die sechs vom W3C-Konsortium erarbeiteten<br />

Grundprinzipien des semantischen Webs.<br />

2.2.1 Prinzip 1: Alles kann mittels URIs identifiziert werden<br />

“A Uniform Resource Identifier (URI) is a compact sequence of charac-<br />

ters that identifies an abstract or physical resource.” 25<br />

Menschen, Orte und Dinge aus der physikalischen Welt können vom se-<br />

mantischen Web profitieren und daran teilhaben, in dem sie über sogenannte<br />

Identifier (Bezeichner) eindeutig beschrieben und lokalisiert werden können.<br />

Jeder, der über einen Namensraum im Inter<strong>net</strong>, also zum Beispiel über einen<br />

Webserver, Kontrolle ausüben kann, kann einen URI erstellen und damit aus-<br />

drücken, dass dieser URI etwas in der physikalischen Welt identifiziert. Eine<br />

24 Head of Communication Ian Jacobs: Über das World Wide Web Consortium (W3C). Herausgegeben<br />

von W3C-Konsortium. Online verfügbar unter http://www.w3c.de/about/overview.html, zuletzt geprüft am<br />

28.04.2008.<br />

25 T. Berners-Lee (2008): RFC 3986 - Uniform Resource Identifier (URI): Generic Syntax. Unter Mitarbeit<br />

von R. Fielding, L. Masinter. Herausgegeben von W3C-Konsortium und MIT. Online verfügbar unter<br />

http://tools.ietf.org/html/rfc3986, zuletzt aktualisiert am 28.04.2008.<br />

24


Gruppierung der Entwicklergemeinschaft des Inter<strong>net</strong>s besteht darauf, dass nur<br />

ein geringer Teil der Web URI Namensräume für diese Zwecke zur Verfügung<br />

gestellt wird. Das semantische Web hingegen setzt solche Einschränkungen<br />

weder voraus noch erzwingt es solche Einschränkungen. Vielmehr kann es<br />

auch indirekt auf genau solche physikalischen Einheiten verweisen. Zum Bei-<br />

spiel könnte eine Person mit dem Namen “Max Mustermann” über die URI zu<br />

seinem persönlichem E-Mail Account max@mustermann.de eindeutig identifi-<br />

ziert werden, und ohne die Verwendung weiterer URIs könnten über diesen ein-<br />

zigen Uniform Resource Identifier viele weitere Informationen über genau diese<br />

Person gesammelt werden. Analog dazu könnten Orte über die URI zu einer<br />

Website (die URL ist eine Unterklasse der URI), beispielsweise die von der<br />

Stadt Köln betriebene Domäne http://www.koeln.de, eindeutig identifiziert und<br />

um weitere Informationen angereichert werden. Mit besseren Metadaten, also<br />

Daten über die Daten, ist es möglich, die Beziehung der realen Stadt und des<br />

URIs genauer zu beschreiben. Mittels Uniform Resource Identifiern ist es also<br />

möglich, jeden und alles sowohl in der physikalischen also auch in der digitalen<br />

Welt eindeutig zu identifizieren.<br />

2.2.2 Prinzip 2: Ressourcen und Beziehungen sind typisiert<br />

Das gegenwärtige Inter<strong>net</strong> besteht aus Ressourcen und ihren Verlinkungen un-<br />

tereinander, wie in der folgenden Abbildung unter a) zu sehen ist.<br />

25


Im heutigen Inter<strong>net</strong> handelt es sich bei den Ressourcen meist um Inter<strong>net</strong>-<br />

Abbildung 3: Current Web vs. Semantic Web; Marja-Riitta Koivunen, Eric Miller (2008): W3C<br />

Semantic Web Activity. Semantic Web Main Principles. Herausgegeben von W3C-Konsortium<br />

und MIT. Online verfügbar unter http://www.w3.org/2001/12/semweb-fin/w3csw, zuletzt aktualis-<br />

iert am 28.04.2008.<br />

Dokumente, die zum einen auf die Verwendung durch den Menschen abzielen<br />

und zum anderen üblicherweise keine Metadaten enthalten, die beschreiben,<br />

auf welche Art sie verwendet werden können und wie ihre Beziehungen zu an-<br />

deren Dokumenten im Inter<strong>net</strong> ist. Während Menschen schnell erschließen,<br />

dass das eine Dokument eine Rechnung, das andere Dokument ein wis-<br />

senschaftliches Papier ist, ist es Maschinen respektive Computer zum gegen-<br />

wärtigen Zeitpunkt nicht möglich, diese Informationen und ihre Beziehungen zu<br />

erschließen. Hilfreich wären reichhaltigere Beschreibungen der Beziehungen<br />

der Dokumente untereinander, wie zum Beispiel “depends on”, “is version of”<br />

oder “author”. Wie die Abbildung zeigt, werden Ressourcen und ihre Verlinkun-<br />

gen auch ein Bestandteil des semantischen Webs sein, allerdings werden diese<br />

typisiert werden können und definieren so die Konzepte hinter den Ressourcen,<br />

so dass es auch Maschinen möglich ist diese zu interpretieren. So könnten ein-<br />

ige Links die Beschreibung enthalten, dass diese Ressource eine Version einer<br />

anderen Ressource ist oder von einer Ressource geschrieben worden ist, die<br />

26


eine Person beschreibt. Die Typisierung von Ressourcen und ihren Verlinkun-<br />

gen ist also ein Grundprizip des semantischen Webs und kann das Informa-<br />

tionsmanagement in Zukunft erheblich vereinfachen und optimieren.<br />

2.2.3 Prinzip 3: Partielle Informationen sind akzeptabel<br />

Das gegenwärtige Inter<strong>net</strong> ist unbegrenzt: Es opfert die Integrität der Links für<br />

die Skalierbarkeit des Inter<strong>net</strong>s. Das bedeutet, ein Autor kann sehr leicht auf<br />

andere Ressourcen verlinken, ohne das eine Verlinkung der Gegenseite not-<br />

wndig ist. So hat die Gegenseite allerdings keine Möglichkeit, den Verlinkenden<br />

über einen Umzug der Ressource zu informieren. Die Fehlermeldung 404 “File<br />

not found”, die uns darüber informiert, dass die Verlinkung nicht mehr funk-<br />

tioniert, ist zu akzeptieren. In ähnlicher Weise ist das semantische Web auch<br />

unbegrenzt. Jeder kann veröffentlichen, was er möchte und verschiedene Arten<br />

von Verlinkungen zwischen den Ressourcen erstellen. Manche der verlinkten<br />

Ressourcen werden eventuell nach einen bestimmten Zeitraum nicht mehr ex-<br />

istieren oder die Adresse wurde mittlerweile für etwas anderes verwendet. Die<br />

Werkzeuge des semantischen Webs tolerieren diesen Datenverfall und funk-<br />

tionieren trotzdem. Wie bereits weiter oben beschrieben, können Informationen<br />

über Uniform Resource Identifier eindeutig identifiziert werden, und selbst wenn<br />

eine Verlinkung zu einer bestimmten Informationen über diese Person nicht<br />

mehr innerhalb der URI zur Verfügung steht, können die bestehenden Informa-<br />

tionen für Rückschlüsse genutzt werden. Die Werkzeuge des semantischen<br />

Webs können mit ausgewählten Informationsinseln bzw. partiellen Information-<br />

en arbeiten.<br />

2.2.4 Prinzip 4: Absolute Wahrheit wird nicht benötigt<br />

Nicht alles aus dem gegenwärtigen Inter<strong>net</strong> ist wahr, und auch das semantische<br />

Web wird dies in keiner Weise ändern. Wahrheit im Sinne von Glaubhaftigkeit<br />

wird von den Applikationen eingeschätzt, die die Informationen im World Wide<br />

Web verarbeiten. Die Applikationen entscheiden also für sich, welcher Quelle<br />

sie vertrauen, indem sie den Kontext, aus dem die Aussage stammt, bewerten.<br />

Sie prüfen zum Beispiel, welche Ressource hat was und wann gesagt und<br />

welche Legitimation diese Ressource besitzt, um genau das auszudrücken.<br />

27


Die Abbildung zeigt Tiina, angestellt bei Elisa, die den Mitgliederbereich der<br />

Abbildung 4: Chain of trust: Marja-Riitta Koivunen, Eric Miller (2008): W3C Semantic Web Activ-<br />

ity. Semantic Web Main Principles. Herausgegeben von W3C-Konsortium und MIT. Online ver-<br />

fügbar unter http://www.w3.org/2001/12/semweb-fin/w3csw, zuletzt aktualisiert am 28.04.2008.<br />

W3C-Website besuchen möchte. Damit sie diesen Mitgliederbereich betreten<br />

darf, muss sie einen Beweis (Proof) liefern, dass sie die Rechte dazu besitzt. Ti-<br />

ina kann diesen Beweis liefern, in dem sie sich auf die vier Aussagen von Alan<br />

und Kari bezieht, die wiederum als vertrauenswürdig gelten und das Recht<br />

besitzen, solche Aussagen zu treffen, da sie Mitglieder von Elisas Gremium<br />

sind. Die Applikation würde diesen Beweis zulassen, da sie den Aussagen von<br />

Alan vertraut und Alan die Verantwortung für den Zugang zum Mitgliederbereich<br />

auf Kari delegiert hat.<br />

2.2.5 Prinzip 5: Evolution wird unterstützt<br />

Es kommt häufig vor, dass sich sehr ähnelnde Konzepte von unterschiedlichen<br />

Gruppen an verschiedenen Orten oder gar von derselben Gruppe zu ver-<br />

schiedenen Zeitpunkten entwickelt und definiert werden. Hier wäre es sehr<br />

nützlich, die Daten, die dieselben Konzepte beschreiben, miteinander zu kom-<br />

binieren. Das semantische Web benutzt ein bestimmtes Regelwerk zur Be-<br />

schreibung dieser Konzepte, das sich genauso weiterentwickeln kann, wie es<br />

der menschliche Verstand auch tut. Zusätzlich erlaubt dieses Regelwerk das ef-<br />

28


fektive Kombinieren von untereinander unabhängigen Konzepten von ver-<br />

schiedenen Gemeinschaften sogar dann, wenn diese verschiedenartige Voka-<br />

bulare benutzen. Das semantische Web hält Werkzeuge bereit, um Doppel-<br />

deutigkeiten zu beseitigen und Widersprüche zu klären. Außerdem können be-<br />

stehende Informationen angereichert werden, ohne die alten Informationen zu<br />

verändern.<br />

Die Abbildung zeigt im linken Bereich aktuelle Informationen über eine Person<br />

Abbildung 5: Combining new information with old when the old information cannot be changed:<br />

Marja-Riitta Koivunen, Eric Miller (2008): W3C Semantic Web Activity. Semantic Web Main<br />

Principles. Herausgegeben von W3C-Konsortium und MIT. Online verfügbar unter<br />

http://www.w3.org/2001/12/semweb-fin/w3csw, zuletzt aktualisiert am 28.04.2008.<br />

mit dem Nachnamen Miller unter der Verwendung eines bestimmten Vokabu-<br />

lars. Der rechte Bereich zeigt Informationen über dieselbe Person aus einer an-<br />

deren, z.B. älteren Ressource aus dem World Wide Web. Diese beiden Infor-<br />

mationen über ein und dieselbe Person können nun im semantischen Web auf<br />

vielzählige Weise kombiniert werden. Man könnte z.B. eine neue Eigenschaft<br />

“previousIdentity” (ältere Identität) hinzufügen, die diese beiden Beschreibun-<br />

gen ein und derselben Person verbinden. Genauso könnte man eine Trans-<br />

formation des aktuellen Vokabular auf das ältere Vokabular definieren, in der<br />

festgehalten wird, dass “worksAt” und “employedBy” dieselben Beziehungen<br />

ausdrücken. Mit dem semantischen Web wird es darüber hinaus möglich sein,<br />

neue Eigenschaftbeschreibungen hinzuzufügen, die angeben, in welchem<br />

Zeitraum eine bestimmte Information Gültigkeit besaß. Die zusätzlichen Inform-<br />

29


ationen können überall gespeichert und überall von Applikationen gefunden<br />

werden, wenn diese losgelösten Informationselemente auf den eindeutigen Uni-<br />

form Resource Identifier der älteren Informationsquelle verweisen und somit<br />

eindeutig zugeord<strong>net</strong> werden können. So ermöglicht das semantische Web eine<br />

natürliche Evolution der Daten, indem alte Informationsressourcen verwendet<br />

und mit neuen Informationsquellen kombiniert und verlinkt werden können.<br />

2.2.6 Prinzip 6: Minimalistisches Design der Technologien<br />

Das semantische Web macht die einfachen Dinge einfach und die komplexen<br />

Dinge möglich. Das Ziel des W3C-Konsortiums ist es, nicht mehr als nötig zu<br />

standardisieren. Dieser Anspruch ermöglicht das Implementieren von einfachen<br />

Applikation auf bereits standardisierten Technologien. Dabei sollte der Geb-<br />

rauch der semantischen Technologien, die, wie wir später sehen, aufeinander<br />

aufbauen, einen höheren Mehrwert liefern als die Summe des Nutzens der ein-<br />

zelnen Technologien. Das bedeutet, das durch diesen Ansatz Vorteile<br />

entstehen, die heute teilweise noch gar nicht abzusehen sind. 26<br />

2.3 Technologien des semantischen Webs<br />

Das semantische Web ist keine Zukunftsmusik mehr – wissenschaftlich sind die<br />

relevanten Entwicklungen und Bereiche bereits bekannt. Vielmehr liegt die<br />

Herausforderung nun in einer breitflächigen Integration der Technologien, der<br />

Standardisierung, der Entwicklung von greifbaren Werkzeugen und dem Ge-<br />

brauch durch die Nutzer. Tim Berners-Lee präsentierte am 06. Dezember 2000<br />

auf der Konferenz “XML 2000” seine Vision der Architektur des semantischen<br />

Webs. Die folgende Abbildung zeigt seine Vision von aufeinander aufbauenden<br />

Technologien, die zum Teil bereits ausreichend erforscht sind und zur Verfü-<br />

gung stehen, zu einem anderen Teil aber noch erforscht werden müssen.<br />

26 Marja-Riitta Koivunen, Eric Miller (2008): W3C Semantic Web Activity. Semantic Web Main Principles.<br />

Herausgegeben von W3C-Konsortium und MIT. Online verfügbar unter http://www.w3.org/2001/12/semweb-fin/w3csw,<br />

zuletzt geprüft am 28.04.2008.<br />

30


Abbildung 6: The Semantic Web Stack: W3C-Konsortium: http://www.w3.org/2000/Talks/1206-<br />

xml2k-tbl/slide10-0.html Zuletzt geprüft am 24.04.08<br />

Die Wissenschaft im Bereich des semantischen Webs ist bis zum heutigen Zeit-<br />

punkt (in der Abbildung von unten gesehen) bis zu den Ontologien<br />

vorgedrungen. Diese Technologien sind ausreichend erforscht, für die Ziele und<br />

aufgestellten Grundprinzipien, die mit dem semantischen Web verbunden sind,<br />

für sinnvoll und nutzbar befunden und schließlich vom W3C-Konsortium als Re-<br />

commendations (Empfehlungen), also als festgelegte Standards, veröffentlicht<br />

worden. Logik (Logic), Beweise (Proof) und Vertrauen (Trust) sind die Bereiche,<br />

die noch wissenschaftlich aufgearbeitet werden müssen. Theoretisch ist be-<br />

kannt, was diese Ebenen leisten müssen, praktisch fehlen teilweise noch die<br />

konkreten Technologien bzw. Programmiersprachen zur Umsetzung. Trotzdem<br />

liefert dieses Schichtensystem mit dem Namen “The Semantic Seb Stack” oder<br />

auch “Semantic Layer Cake” ein hervorragendes Gerüst, um die Technologien<br />

des semantischen Webs zu erläutern. Die unterschiedlichen Technologien<br />

bzw. Abstraktionsebenen bauen dabei aufeinander auf, das bedeutet, sie sind<br />

abwärtskompatibel. Ein Software Agent sollte also, wenn er z.B. Ontologien in-<br />

terpretieren und verwenden kann, auch in der Lage sein, die Informationen der<br />

31


darunter liegenden Schichten zu interpretieren und zu verwenden. In entge-<br />

gengesetzer Richtung, also aufwärts, sollten Software Agents die Fähigkeit<br />

haben, weiter unten liegende Ebene zu verstehen und zu interpretieren, um so<br />

zumindest teilweise die Vorteile aus den darüber liegenden Schichten ziehen zu<br />

können. Jede Ebene ist als ein Schritt in Richtung vollständiger Realisation des<br />

semantischen Webs zu verstehen.<br />

2.3.1 Unicode und URI<br />

Unicode vereint unterschiedliche Zeichensätze wie zum Beispiel arabische, ja-<br />

panische, kyrillische und lateinische Zeichensätze und wird so grundlegender<br />

internationaler Kodierungsstandard für die Daten im semantischen Web. Uni-<br />

code ord<strong>net</strong> jedem Zeichen eine eigene Nummer zu, die so leichter und un-<br />

missverständlicher durch Computer interpretiert werden kann. Durch diese<br />

nummerische Zuordnung ist Unicode systemunabhängig, programmunabhängig<br />

und sprachunabhängig. 27<br />

Ein URI (Uniform Resource Identifier) besteht aus einer Kette von Zeichen, die<br />

eine abstrakte oder physikalische Ressource identifiziert. Eine solche Quelle<br />

könnten Dokumente, Bilder, herunterladbare Dateien oder ähnliches im Web<br />

sein oder auch physikalische Geräte wie Fernseher, Kühlschrank oder Rund-<br />

funkradio. Der URI macht diese verschiedenen Quellen verfügbar und teilt<br />

ihnen eine eindeutige Adresse zu. Dabei verwendet der URI eine Vielzahl von<br />

unterschiedlichen Namensschemata und Zugangsmethoden wie etwa HTTP<br />

oder FTP. Die wohl unter Laien bekannteste Unterkategorie von Uniform Re-<br />

source Identifiern (URI) ist der Uniform Resource Locator (URL), der zur Ad-<br />

ressierung und Identifikation von Webseiten im Inter<strong>net</strong> genutzt wird. 28<br />

Alle die nun folgenden Technologien bauen auf die jeweils vorher beschrieben-<br />

en Technologien auf oder verwenden diese zumindest teilweise.<br />

27 Unicode, Inc (2008): Unicode. Unter Mitarbeit von Unicode Consortium®. Online verfügbar unter<br />

http://www.unicode.org/, zuletzt geprüft am 26.04.2008.<br />

28 W3C-Konsortium (2008): Naming and Addressing: URIs, URLs, … Unter Mitarbeit von diversen Mitarbeitern.<br />

Online verfügbar unter http://www.w3.org/Addressing/, zuletzt geprüft am 26.04.2008.<br />

32


2.3.2 Extensible Markup Language (XML)<br />

Die “Extensible Markup Language” (XML) ist ein Eckpfeiler des semantischen<br />

Webs. 29 In der Vergangenheit war HTML (hypertext markup language) die<br />

Standard-Sprache, in der Webseiten geschrieben worden sind. HTML wurde<br />

von SGML (standard generalized markup language), einem internationalen<br />

Standard für die Definition von einer gerät- und systemunabhängigen Darstel-<br />

lung von Informationen, abgeleitet. Dabei wurde SGML so konzipiert, dass die<br />

Inhalte sowohl vom Menschen als auch von Maschinen gelesen werden konn-<br />

ten. Sprachen, die sich auf SGML beziehen, nennt man SGLM-Applikationen,<br />

HTML ist eine solche Applikation. HTML wurde entwickelt, weil SGLM als viel<br />

zu kompliziert für die Anwendung im Inter<strong>net</strong> erachtet wurde. XML ist auch eine<br />

SGML-Applikation, die allerdings durch die erkannten Mängel der “hypertext<br />

markup language” entstanden ist. 30 Mittlerweile hat XML die Entwicklungsphase<br />

verlassen und findet auf breiter Basis Akzeptanz. XML wurde am 10. Februar<br />

1998 vom W3C-Konsortium offiziell zu einer Empfehlung (Recommendation)<br />

und so zu einem offiziell anerkannten Standard. 31<br />

Die Vorteile, die XML gegenüber HTML mit sich bringt, sind folgende:<br />

� XML ermöglicht die Erstellung von applikationsunabhängigen Doku-<br />

menten und Daten.<br />

� XML besitzt eine Standard-Syntax für die Beschreibung von Metadaten<br />

(Daten über die Daten).<br />

� XML besitzt eine Standard-Struktur sowohl für Dokumente als auch<br />

Daten.<br />

29<br />

Tim Berners-Lee, James Hendler Ora Lassila: The Semantic Web: a new form of Web content that is<br />

meaningful to computers will unleash a revolution of new possibilities. In: Scientific American, H. 284<br />

(5), S. 34–43.<br />

30<br />

Frank Hermelen, Grigoris Antoniou (2004): A Semantic Web Primer; Seite 23; Herausgegeben von The<br />

MIT Press.<br />

31<br />

W3C-Konsortium (1998): Extensible Markup Language (XML) 1.0. W3C Recommendation 10-<br />

February-1998. Unter Mitarbeit von Jean Paoli C. M. Sperberg-McQueen Tim Bray. Online verfügbar<br />

unter http://www.w3.org/TR/1998/REC-xml-19980210, zuletzt geprüft am 23.04.2008.<br />

33


� XML ist keine neue Technologie.<br />

XML ist von Applikationen unabhängig, da sie als Verschlüsselung einfachen<br />

Text in einer vom Menschen lesbaren Form verwendet. Zum Entwerfen von<br />

XML-Dokumenten sind einfache Editoren, wie etwa von Open Office, verfügbar.<br />

Im Gegensatz dazu gibt es beispielsweise in sich geschlossene, binär ver-<br />

schlüsselte Formate wie Microsoft Word, bei denen lediglich die Entwickler<br />

selbst das Format verstehen. Diese binäre Verschlüsselung des Formats hat<br />

den Nachteil, dass sie sich selbst in bestimmte Applikationen – also z.B. Mi-<br />

crosoft Word – einschließt. Die Verschlüsselung von XML durch einfachen Text<br />

erlaubt es hingegen jeder Applikation oder jedem Programm, die Datei zu öff-<br />

nen und zu lesen. Durch die Verwendung einer offenen und standardisierten<br />

Syntax und einer ausführlichen Beschreibung der Bedeutung der Daten ist XML<br />

von jedem lesbar und interpretierbar, nicht nur von einer bestimmten Applika-<br />

tion und ihrem Produzenten. Das ist ein entscheidender Grundpfeiler des se-<br />

mantischen Webs, weil heute die Vielzahl an Software Agents, Programmen<br />

und Systemen der Zukunft, die einmal Daten des World Wide Webs interpretier-<br />

en und weiterverarbeiten können sollen, kaum voraussehbar ist. Eine Aus-<br />

zeichungssprache, die von allen digitalen Systemen der Zukunft verstanden<br />

werden kann, ist also ein grundlegendes Erfordernis auf dem Weg zum se-<br />

mantischen Web. Ein weiterer Vorteil beim Speichern von Daten in der “Extens-<br />

ible Markup Language” ist die einfache Durchsuchbarkeit vergleichbar zu den<br />

Inhalten von Webseiten heute.<br />

Einen weiteren Vorteil, den XML gegenüber HTML bietet, ist die Standard-Syn-<br />

tax für die Beschreibung von Metadaten. Die Syntax, oder speziell die Syntax<br />

formaler Sprachen – also die Syntax von Programmiersprachen in der Infor-<br />

matik und Kalkülen in der Logik – bezeich<strong>net</strong> ein System von Regeln, nach<br />

dem erlaubte Konstruktionen bzw. Ausdrücke aus einem grundlegenden<br />

Zeichenvorrat gebildet werden. 32<br />

Metadaten über ein Buch sind zum Beispiel:<br />

32 Arnim Regenbogen, Uwe Meyer, Friedrich Kirchner, Carl Michaelis, Johannes Hofmeister (2006): Wörterbuch<br />

der philosophischen Begriffe. 1. Aufl.: Verlag Meiner.<br />

34


� Der Name des Autors<br />

� Die Auflage<br />

� Das Erscheinungsjahr<br />

� Auflage und Verlag<br />

Ohne genauer auf die technischen Spezifikationen der Syntax an dieser Stelle<br />

einzugehen, ist die Entwicklung der XML-Syntax auf dem Weg zum se-<br />

mantischen Web von hoher Signifikanz, denn sie standardisiert eine einfache,<br />

auf Text basierende Methode zur Auf- und Verschlüsselung der Bedeutung von<br />

Daten oder semantischen Informationen. Während Daten kontext-spezifische<br />

Werte darstellen, beschreiben die Metadaten die Bedeutung oder den Zweck<br />

dieser Daten.<br />

Ein weiterer wichtiger Schritt in Richtung des semantischen Webs liefert XML<br />

mit ihrer Standard-Struktur, die geeig<strong>net</strong> ist, semantische Informationen sowohl<br />

für Dokumente als auch Datenfelder auszudrücken. Ein elektronisches Doku-<br />

ment kann als Gegenstück zu einem aus Papier bestehenden Dokument ver-<br />

standen werden, es enthält rohe Informationen und Anweisungen zur Darstel-<br />

lung der Informationen. Im Gegensatz dazu bestehen Datenfelder aus Werte-<br />

paaren (Name=Müller), die von Computer verarbeitet werden können und im<br />

Inter<strong>net</strong> oft in Formularen vorzufinden sind. Beide Arten von Informationen sind<br />

weit verbreitet innerhalb von Organisationen und auch im World Wide Web.<br />

XML macht es möglich, Metadaten sowohl an Dokumente als auch Datenfelder<br />

anzuhängen, und schließt so die Lücke zwischen Daten in Dokumenten und<br />

losgelösten Datenfeldern – beispielsweise in Formularen.<br />

Nicht unerheblich ist die Tatsache, das XML die Kinderkrankheiten neuer Tech-<br />

nologien bereits überstanden hat. Die Extensible Markup Language ist eine<br />

Ausgliederung der bereits oben beschriebenen “Standardized Generalized<br />

Markup Language” (SGML), die im Jahre 1969 von Dr. Charles Goldfarb, Ed<br />

35


Mosher und Ray Lorie entwickelt wurde. Das bedeutet, das Konzept hinter XML<br />

wurde fast 40 Jahre getestet und weiterentwickelt. 33<br />

Dennoch reicht diese Technologie zur Verwirklichung des semantischen Webs<br />

nicht aus, stellt aber Grundlage aller darauf aufbauender Technolgien dar. Mit<br />

Hilfe von XML können Struktur und Inhalt getrennt werden sowie einzelene Ab-<br />

schnitte eines Dokuments markiert (getagged), also beschrieben werden. Da<br />

aber jeder Entwickler völlig frei in der Wahl seiner Markierung ist, besteht kein<br />

einheitlicher Standard in der Beschreibung der Struktur eines Dokuments und<br />

bei dem Datenaustausch müssen sich Sender und Empfänger auf eine gemein-<br />

same Struktur des XML-Dokuments festlegen. Dieses Problem wird durch das<br />

Resource Description Framework (RDF) gelöst.<br />

2.3.3 Resource Description Framework (RDF)<br />

Einfach ausgedrückt ist das Resource Description Framework eine auf XML<br />

basierende Sprache zur Beschreibung von Ressourcen. Unter einer Ressource<br />

könnte z.B. eine elektronische Datei im Inter<strong>net</strong> verstanden werden. Auf eine<br />

solche Datei wird über eine URL (Uniform Resource Locator) zugegriffen.<br />

Während es mit XML möglich ist, Metadaten an einzelne Teile eines Doku-<br />

ments anzuhängen, ist ein Vorteil von RDF, dass es Metadaten über das ge-<br />

samte Dokument anhängen kann, etwa Informationen wie Autor, Erstellungs-<br />

datum und Art des Dokuments. Ein gelungenes Beispiel für den Nutzen von<br />

RDF ist die Beschreibung eher undurchsichtiger Dateien wie etwa Bild- oder<br />

Audiodateien. Die folgende Abbildung zeigt die vom W3C-Konsortium entwick-<br />

elte Demonstrations-Anwendung “RDFpic” zur Einbindung von Metadaten in-<br />

nerhalb von Bilddateien.<br />

33 Michael C. Daconta (2003): The Semantic Web. A Guide to the Future of XML, Web Services, and<br />

Knowlege Management. Unter Mitarbeit von Kevin T. Smith Leo. J. Obrst. Herausgegeben von WILEY.<br />

36


Dabei arbeitet die Anwendung in Verbindung mit einem Server, in diesem Falle<br />

Abbildung 7: RDFpic 2.1; Michael C. Daconta (2003): The Semantic Web. A Guide to the Fu-<br />

ture of XML, Web Services, and Knowlege Management (S. 87). Unter Mitarbeit von Kevin T.<br />

Smith Leo. J. Obrst. Herausgegeben von WILEY.<br />

der W3C-Jigsaw-Webserver, auf dem automatisch die angehängten Metain-<br />

formationen in Form einer externen RDF-Datei gespeichert werden. Außerdem<br />

ist es mit “RDFpic” möglich, verschiedene spezielle RDF-Schemata zur Be-<br />

schreibung des Bildes zu laden. Die im Programm mitgelieferten Standard-<br />

Schemata zur Beschreibung des Bildes sind Dublin Core (DC) und ein tech-<br />

nisches Schemata (Technical), welches Metadaten über die benutzte Kamera<br />

enthält. Die folgende Abbildung zeigt die von “RDFpic” generierte RDF-Datei.<br />

37


Auffällig ist die Verwendung von sogenannten “namespaces” (Namensräumen,<br />

Abbildung 8: RDF geniert durch RDFpic; Michael C. Daconta (2003): The Semantic Web. A<br />

Guide to the Future of XML, Web Services, and Knowlege Management (S. 86). Unter Mit-<br />

arbeit von Kevin T. Smith Leo. J. Obrst. Herausgegeben von WILEY.<br />

hier im Beispiel xmlns:rdf=”http://www.w3.org/1999/02/22-rdf-syntax-ns#”).<br />

“Namespaces” sind ein einfaches Hilfmittel zur Erstellung von global eindeuti-<br />

gen Namen für die Elemente und Attribute einer Auszeichnungssprache. Sie<br />

sind aus zwei Gründen von Bedeutung: Erstens zur Vermeidung von Konflikten<br />

von einheitlichen Namen zwischen verschiedenen Auszeichnungssprachen und<br />

zweitens ermöglichen sie, mehrere Auszeichnungssprachen ohne Doppeldeut-<br />

igkeiten zu mischen. 34 Das Root-Element () spezifiziert das Doku-<br />

ment als RDF-Dokument und in ihm sind vier Namesräume deklariert. Außer-<br />

dem enthält jedes RDF-Dokument eine oder mehrere “descriptions” (Be-<br />

schreibungen), die Aussagen über die beschriebene Ressource enthalten.<br />

Dieses Element enthält ein rdf:about Merkmal, das auf die<br />

beschrieben Quelle verweist. Diese Verweise in Form von “Uniform Resource<br />

Identifier” (URI) sind wichtig, um das Resource Description Framework zu ver-<br />

stehen, denn alle Ressourcen, die durch RDF beschrieben werden, müssen mit<br />

einem URI bezeich<strong>net</strong> werden. Zusammengefasst hat uns die Abbildung, die<br />

eine RDF-Syntax darstellt, die Beschreibung der Ressource, die Eigenschaften<br />

34 Michael C. Daconta (2003): The Semantic Web. A Guide to the Future of XML, Web Services, and<br />

Knowlege Management (S. 42). Unter Mitarbeit von Kevin T. Smith Leo. J. Obrst. Herausgegeben von<br />

WILEY.<br />

38


der Ressource und die Werte dieser Eigenschaften präsentiert. Dieses<br />

dreigeteilte Modell ist typisch für RDF und deshalb wird das RDF-Modell auch<br />

oft als “triple” bezeich<strong>net</strong>.<br />

Genauso, wie man das RDF-Modell mittels seiner Ressourcen-Eigenschaften<br />

beschreiben kann, nämlich erstens “Beschreibung der Ressource”, zweitens<br />

“Eigenschaften der Ressource” und drittens “Werte dieser Eigenschaften”,<br />

erklären Forscher und Wissenschaftler der künstlichen Intelligenz, die dieses<br />

Forschungsgebiet “knowledge representation” nennen, das gleiche Modell an<br />

den grammatikalischen Teilen eines Satzes, nämlich mit Subjekt, Prädikat und<br />

Objekt.<br />

Die Schlüsselelemente eines RDF-”triple” sind also folgende:<br />

Das Subjekt. In der Grammatik bezeich<strong>net</strong> man das Satzglied als Subjekt, das<br />

mit der Frage: “Wer oder Was?” erfragt werden kann. Es ist also eine Person<br />

oder ein sachliches Objekt. In dem Satz “Das Unternehmen verkauft Strümpfe”<br />

39<br />

Abbildung 9: The<br />

RDF triple: Michael C. Daconta (2003): The Semantic Web. A Guide to the Future of XML,<br />

Web Services, and Knowlege Management (S.88). Unter Mitarbeit von Kevin T. Smith Leo. J.<br />

Obrst. Herausgegeben von WILEY.


ist das Subjekt “Das Unternehmen”. Das Subjekt eines Satzes vermittelt uns<br />

also, worüber der Satz handelt. Im Bereich der Logik ist das Subjekt der Aus-<br />

druck, über den etwas angegeben wird. Im RDF-Modell ist das Subjekt die Res-<br />

source, die durch das folgende Prädikat und Objekt beschrieben wird. Das Sub-<br />

jekt wird im RDF-Modell demzufolge mit einem Uniform Ressource Identifier<br />

(URI) eindeutig beschrieben, da der URI in der digitalen Welt eine genauso un-<br />

missverständliche Zuordnung ermöglicht, wie “Das Unternehmen” in der gram-<br />

matikalischen Welt.<br />

Das Prädikat. Grammatikalisch modifiziert dieser Teil des Satzes das Subjekt.<br />

In unserem Beispielsatz “Das Unternehmen verkauft Strümpfe” ist das Prädikat<br />

das Wort “verkauft”. Das Prädikat teilt uns also etwas über das Subjekt mit. Im<br />

RDF-Modell stellt das Prädikat die Verbindung zwischen Subjekt und Objekt<br />

her. Im RDF-Modell müsste für die Bedeutung des Wortes “verkauft” eine<br />

eindeutige URI definiert werden, die beispielsweise so aussehen könnte:<br />

“http://www.unternehmen.org/ontologien/#verkauft”.<br />

Das Objekt. In der Grammatik ist diese Satzglied ein Nomen, welches sich auf<br />

das Prädikat bezieht. In dem Beispielsatz “Das Unternehmen verkauft Strüm-<br />

pfe” ist das Objekt das Wort “Strümpfe”. Im RDF-Modell ist das Objekt also eine<br />

Ressource, die sich entweder auf das Prädikat oder auf einen wörtlichen Wert<br />

(literal) bezieht. Auch hier würde für das Objekt im RDF-Modell ein URI definiert<br />

werden müssen, der analog zu den vorher gezeigten URI-Beispielen ver-<br />

standen werden kann. 35<br />

Die nächste Abbildung zeigt das bis hierhin theoretisch besprochene Modell in<br />

der Grammatik übertragen auf RDF als Graph.<br />

35 Michael C. Daconta (2003): The Semantic Web. A Guide to the Future of XML, Web Services, and<br />

Knowlege Management. Unter Mitarbeit von Kevin T. Smith Leo. J. Obrst. Herausgegeben von WILEY,<br />

S. 85–92.<br />

40


ildung 10: A graph of two RDF statements. Michael C. Daconta (2003): The Se-<br />

mantic Web. A Guide to the Future of XML, Web Services, and Knowlege Manage-<br />

ment (S.89). Unter Mitarbeit von Kevin T. Smith Leo. J. Obrst. Herausgegeben von<br />

WILEY.<br />

RDF-Ressourcen stehen also entweder für elektronische Ressourcen, wie etwa<br />

Dateien, oder auch für Konzepte wie Personen. Sehr wichtig dabei ist, dass<br />

diese Ressourcen sich eindeutig identifizieren können über die vorher be-<br />

sprochenen URIs. Denn nur so kann eine Idee, ein Konzept, die das Subjekt<br />

oder Objekt beschreibt, global und ohne Doppeldeutigkeiten definiert werden.<br />

Das ist ein Kernunterschied, den die Benutzung der semantischen Technologi-<br />

en gegenüber der klassischen Syntax hat, denn in der Lehre der sprachlichen<br />

Zeichen gibt es sehr häufig Wortdoppelbedeutungen. Die eindeutige<br />

Identifizierbarkeit der Objekte und Subjekte durch URIs löst so das Problem der<br />

Wortdoppelbedeutungen. “Die Fliege passt nicht zum Hemd” und “Die Fliege<br />

fliegt im Zimmer umher” sind zwei Sätze mit dem jeweils selben Wort “Fliege”,<br />

aber mit unterschiedlichen Bedeutungen. Im RDF-Modell ist es möglich, dem<br />

Tier Fliege eine global eindeutige URI zuzuteilen, wodurch diese<br />

Doppeldeutigkeiten behoben werden. Diese URI könnte in diesem Fall so aus-<br />

sehen: “http://www.unternehmen.org/ontologien/tier/#fliege”.<br />

2.3.4 RDF Schema (RDFS)<br />

Das RDF-Schema (RDFS) ist eine Erweiterung des klassischen RDF Ansatzes.<br />

Genauso wie RDF ist auch RDFS eine W3C-Konsortium Recommendation und<br />

somit ein offizieller Standard. Neben RDF-Schema wird mittlerweile auch der<br />

Begriff “RDF Vocabulary Description Language” für das dahinterstehende<br />

Ab-<br />

41


Konzept verwendet. RDF-Schema ist eine auf RDF aufgesetzte Vokabular-Bes-<br />

chreibungssprache, die aus einem einfachen Bündel von gewöhnlichen RDF<br />

Ressourcen und Eigenschaften besteht. Hat man mit RDF die Möglichkeit, Aus-<br />

sagen (statements) über Ressourcen, deren Eigenschaften und Werte zu tref-<br />

fen, so bietet RDFS nun die Möglichkeit, ein speziell verwendetes Vokabular für<br />

diese Aussagen festzulegen, in dem spezielle Klassen oder Arten von Res-<br />

sourcen verankert sind. Unter einer Klasse kann in diesem Zusammenhang<br />

eine Gruppe von Dingen mit ähnlichen Eigenschaften verstanden werden.<br />

Wie könnte ein solches spezielles Vokubular aussehen? Ein Hersteller von Zel-<br />

ten würde zum Beispiel zur semantischen Beschreibung seiner Produkte die<br />

Klasse Zelt (exterms:tent) benötigen. Diese Gruppe von Zelten hat unterschied-<br />

liche Eigenschaften wie etwa Modell (exterms:model), Gewicht in KG<br />

(exterms:weightInKg) und Paketgröße (exterms:packedsize). Genau hier stößt<br />

RDF an seine Grenzen, denn damit ist es nicht möglich, solche an-<br />

wendungsspezifischen Klassen oder Eigenschaften zu definieren. Dabei liegt es<br />

auf der Hand, dass genau das von Nöten ist für die unzähligen Produkte und<br />

Produktgattungen im E-Commerce. Stattdessen bietet RDF eben die Möglich-<br />

keit, diese Klassen und Eigenschaften übergeord<strong>net</strong> zu beschreiben, wodurch<br />

verschiedene Klassen und Eigenschaften untereinander genutzt werden<br />

können. RDFS aber bietet die Option, Klassen hierarchisch zu organisieren.<br />

Zum Beispiel könnte eine Klasse Hund (ex:dog) eine Unterklasse von Säu-<br />

getieren (ex:mammal) sein, die wiederum eine Unterklasse der Klasse Tier<br />

(ex:animal) ist. So wäre jede Ressource, die auch in der Klasse Hund (ex:dog)<br />

ist, automatisch auch in der Klasse Tier (ex:animal).<br />

RDFS bietet also die Möglichkeit spezielle Klassen, deren Eigenschaften und<br />

die Beziehungen zwischen diesen zu beschreiben. Grundsätzlich werden Daten<br />

in Ontologiesprachen formalisiert und auch RDFS ist eine Ontologiesprache.<br />

Alle weiteren Ontologiesprachen erweitern das Konzept RDFS und erhöhen so<br />

den Nutzen. Im nun folgenden Abschnitt wird näher auf Ontologien und die<br />

42


spezielle “Ontology Web Language” eingegangen. Alle Ontologiesprachen ber-<br />

uhen dabei auf dem RDF Datenmodell. 36<br />

2.3.5 Ontologien<br />

Das Transportieren von Bedeutung ist Ziel jeder Kommunikation. Dabei<br />

differieren oftmals die gedanklichen Verknüpfungen der verwendeten Worte bei<br />

Sender und Empfänger. In Standard-Situationen, wie zum Beispiel beim<br />

Überqueren einer Fußgängerampel oder in anderen stark reglementierten<br />

Abläufen, besteht kaum Klärungsbedarf hinsichtlich der verwendeten Zeichen<br />

oder des verwendeten Vokabulars. Treffen allerdings Sender und Empfänger in<br />

einem weniger stark reglementierten oder unterschiedliche interpretierbarem<br />

Kontext aufeinander, so müssen zuerst das unterschiedlich verwendete Voka-<br />

bular und die dahinterstehenden Bedeutungen abgeglichen werden.<br />

Während also mit Hilfe des Resource Description Frameworks (RDF) die Ei-<br />

genschaften von Ressourcen im World Wide Web in einer maschinenauswert-<br />

baren Form beschrieben werden können, und das Resource Description<br />

Framework Schema (RDFS) ein zusätzliches Konzept liefert, ein eigenes spezi-<br />

elles Vokabular zu definieren, so liefert das Konzept der Ontologien die Mög-<br />

lichkeit eigenständig lokal definierte Vokabulare gegeneinander abzugleichen.<br />

Der Begriff Ontologie stammt ursprünglich aus der Philosophie und ist dort eine<br />

philosophische Grunddisziplin der allgemeinen Metaphysik oder Lehre vom<br />

Sein. Die philosophische Ontologie lässt sich in eine formale und eine materi-<br />

elle Ontologie unterteilen, wobei die materielle Ontologie vom organischen Auf-<br />

bau der Welt als Gegenstand allgemeiner Klassifizierungen handelt und die Ele-<br />

mente des Seins aufgrund bestimmter Merkmale nach Einzelerscheinungen,<br />

Gruppen, Arten und Gattungen ord<strong>net</strong>”. 37 In der allgemeinen Informatik sind On-<br />

tologien kein neues Konzept und es existieren viele verschiedene Definitionen.<br />

Nach dem von Thomas R. Gruber verfassten Artikel “A translation approach to<br />

portable ontology specifications” aus der wissenschaftlichen Zeitschrift “Know-<br />

ledge Acquisition” auf den Seiten 199-200 aus dem Jahr 1993 definiert die<br />

36 Frank Manola, Eric Miller (2004): RDF Primer. W3C Recommendation 10 February 2004. Unter Mitarbeit<br />

von Brian McBride. Herausgegeben von W3C-Konsortium. Online verfügbar unter<br />

http://www.w3.org/TR/rdf-primer/, zuletzt geprüft am 24.04.08.<br />

37 Brockhaus (Hg.) (1998): Die Enzyklopädie: in 24 Bänden.<br />

43


allgemeine Informatik Ontologien als “An ontology is an explicit specification of<br />

an conceptualization”. Die explizite Spezifikation bedeutet in diesem Zusam-<br />

menhang, dass der Konzepttyp und die Nebenbedingungen erklärend definiert<br />

sind und so eine Verarbeitung durch Maschinen gewährleistet ist. Die Konzep-<br />

tualisierung bedeutet in diesem Rahmen ein gemeinsames Verständnis eines<br />

Anwendungsbereiches, getragen von einer Gruppe von Menschen. Steht also<br />

die Ontologie in der klassischen Informatik für ein gemeinsame Begriffsystem,<br />

so wird den Ontologien im semantischen Web eine besondere Rolle zuteil,<br />

nämlich die Ontologie als Technologie.<br />

Durch die dezentrale Natur des Inter<strong>net</strong>s bestehen kaum Einschränkungen<br />

hinsichtlich der Formulierung von Vokabularen (RDF-Instanzen) und den damit<br />

zusammenhängenden Schemata (RDFS). Im Verlauf der Zeit entstehen somit<br />

zwangsläufig unterschiedliche Beschreibungsinseln, die nicht homogene Voka-<br />

bulare verwenden. Dieses Problem möchte das W3C-Konsortium mit seiner<br />

Empfehlung (Recommendation) zur “Ontology Web Language” (OWL) aus dem<br />

Jahre 2004 lösen. Dazu werden solche domänenspezifische Vokabulare von<br />

Begriffen um die formalisierten Beziehungen zwischen den Begriffen ange-<br />

reichert, wodurch eine Ontologie entsteht, die also im Kern eine formale,<br />

maschinell auswertbare Definition der grundlegenden Konzepte eines Wissens-<br />

gebietes sowie den Beziehungen zwischen den Konzepten darstellt. Dadurch<br />

entstehen einige Synergien zwischen verschiedenen Domänen:<br />

� Es können identische Inhalte aus unterschiedlichen Quellen oder spezi-<br />

eller unterschiedlichen Identifikatoren verknüpft werden. So können bei-<br />

spielsweise spezielle Vokabulare von bereits bestehenden Vokabularen<br />

profitieren.<br />

� Das automatische, logische Erschließen (reasoning) von neuen Zusam-<br />

menhängen wird ermöglicht. Software Agents ziehen logische Schlüsse<br />

aufgrund der in der Ontologie definierten Ableitungsregeln.<br />

44


� Software Agents können Grundfunktionalitäten erschließen und zu einem<br />

besseren Service zusammenfassen.<br />

Durch diese Brückenschlag zwischen RDF-basierter Identifikation von Res-<br />

sourcen mittels URIs und der dezentralen Herstellung von Bedeutungszusam-<br />

menhängen zwischen den Ressourcen mittels Ontologien kann das Problem<br />

der isolierten Beschreibungsinseln gelöst werden. 38<br />

Bedeutung von Ressourcen kann also eindeutig mittels dem Resource Descrip-<br />

tion Framework (RDF) beschrieben werden, die z.B. für den E-Commerce<br />

benötigten domänen-spezifischen Vokabulare können mittels Resource De-<br />

scription Framework Schema (RDFS) definiert und zugänglich gemacht werden<br />

und der Abgleich zwischen diesen domänen-spezifischen Vokabularen gelingt<br />

über Ontologien. Im nächsten Abschnitt wird kurz auf die spezielle Program-<br />

miersprache “Ontology Web Language” (OWL) zur Umsetzung von Ontologien<br />

eingegangen.<br />

2.3.6 Ontology Web Language (OWL)<br />

Wie bereits erwähnt, wurde die “Web Ontology Language” am 10. Februar 2004<br />

eine offizielle Empfehlung des W3C-Konsortiums und somit allgemein verfüg-<br />

bare semantische Auszeichnungssprache, um Ontologien zu veröffentlichen<br />

und zu teilen. 39 Dabei hatten sowohl Forschungsgruppen aus den USA als auch<br />

aus Europa den Bedarf nach einer Auszeichungssprache zur Modellierung von<br />

Ontologien identifiziert. So entstand eine Initiative zur Definition einer reich-<br />

haltigeren Sprache, um Ontologien auszudrücken, die sich DAML+OIL nennt.<br />

Sie bildete sich aus dem amerikanischen Vorschlag DAML+ONT und der<br />

europäischen Sprache OIL. Somit wurde die Programmiersprache DAML+OIL<br />

Aussgangspunkt für die W3C Web Ontology Working Group 40 beim Definieren<br />

38<br />

Wolfgang Dostal, Mario Jeckle, Werner Kriechbaum (2004): Semantik und Web Services: Vokabulare<br />

und Ontologien. In: Java Spektrum, H. 3, S. 51–54.<br />

39<br />

Sean Bechhofer, Frank van Harmelen, Jim Hendler, Ian Horrocks, Deborah L. McGuinness, Peter F.<br />

Patel-Schneider, Lynn Andrea Stein (2004): OWL Web Ontology Language Reference. W3C Recommendation<br />

10 February 2004. Unter Mitarbeit von Mike Dean, Guus Schreiber. Online verfügbar unter<br />

http://www.w3.org/TR/2004/REC-owl-ref-20040210/, zuletzt geprüft am 26.04.2008.<br />

40<br />

diverse Teilnehmer: Web-Ontology (WebOnt) Working Group. Online verfügbar unter http://www.w3.org/<br />

2001/sw/WebOnt/, zuletzt geprüft am 26.04.2008.<br />

45


der Ontology Web Language. Anschließend wurden eine Reihe von Anfor-<br />

derungen an eine Ontology Web Language aufgestellt.<br />

Diese Hauptanforderungen sind:<br />

� eine gut definierte Syntax<br />

� effiziente Unterstützung beim automatischen Schlussfolgern<br />

� eine formale Semantik und<br />

� ausreichende Kraft zur Abbildung der Ontologien<br />

Aus der Problematik heraus all diesen Anforderungen und um den Mängel des<br />

Ressource Description Frameworks (RDF) und des Ressource Description<br />

Framework Schema (RDFS) gerecht zu werden, definierte die W3C Web Onto-<br />

logy Working Group drei unterschiedliche (Unter-) Sprachen, die jeweils aus-<br />

gerichtet sind, verschiedene Aspekte dieser Anforderungen zu erfüllen. Die<br />

“OWL Full”, die “OWL DL”, wobei DL für “Description Logic” steht, und die<br />

“OWL Lite”.<br />

OWL Full. Dies ist die vollständigste Sprache und gebraucht sämtliche Model-<br />

lierungsprimitive. Sie ermöglicht die umfassende Interpretation der vollständi-<br />

gen OWL-Modellierungsprimitive entsprechend der Möglichkeiten, die durch<br />

RDF vorgegeben werden. Dabei ist OWL Full absolut aufwärtskompatibel zu<br />

RDF, d.h. jedes zulässige RDF-Dokument entspricht einem zulässigen OWL-<br />

Dokument. Gleichzeitig liegt hierin auch ein Nachteil von OWL Full. Die Aus-<br />

drucksmächtigkeit ist so groß, dass nicht jede OWL-Full-Ontologie hinsichtlich<br />

ihrer Schlussfolgerungsmöglichkeiten überhaupt comtergestützt verwendet wer-<br />

den kann.<br />

OWL DL. Diese Sprache zur Formulierung von Ontologien umfasst auch die<br />

vollständigen OWL-Modellierungsprimitive. Diese können jedoch nur einge-<br />

46


schränkt verwendet und interpretiert werden. Damit wird das Ziel verfolgt, dass<br />

ein OWL DL Programmiercode hinsichtlich seiner Schlussfolgerungen noch in<br />

endlicher Zeit ausgeführt werden kann. Diese Beschränkungen gehen jedoch<br />

wiederum zu Lasten einer vollständigen Kompatibilität mit RDF und RDFS.<br />

OWL Lite. OWL Lite ist die einfachste Ontology Web Language und ist darauf<br />

beschränkt, Hierarchien von Konzepten mit einfachen Beschränkungsei-<br />

genschaften (Nebenbedingungen) auszudrücken. OWL Lite dient hauptsächlich<br />

der schnellen Integration bereits existierender Klassifikationssysteme. 41<br />

Sicherlich ist die Ontology Web Language nicht die letzte Entwicklung zur Ab-<br />

bildung von Ontologien im semantischen Web. Eine Reihe von weiteren<br />

benötigten Funktionen sind bereits identifiziert und werden innerhalb der Ent-<br />

wicklergemeinschaft diskutiert. Nur so ist Weiterentwicklung möglich. Zurzeit<br />

aber bestehen zum Beispiel noch Probleme beim Import von Ontologien.<br />

Der Import fremder Ontologien wird eine Grundfunktion im semantischen Web<br />

sein. Zurzeit ist die Importfunktion der Ontology Web Language sehr trivial,<br />

denn sie erlaubt nur das Importieren einer vollständigen Ontolgie, die durch<br />

eine Lokation spezifiziert ist. Das bedeutet, selbst wenn man nur einen kleinen<br />

Teil einer fremden Ontologie nutzen möchte, ist man gezwungen, die komplette<br />

Ontologie zu importieren. 42<br />

2.3.7 Logik und Schlussfolgerungen<br />

Die bis hierhin behandelten Themen des semantischen Schichtenmodells han-<br />

delten allesamt von bereits erforschten Technologien, die es ermöglichen sol-<br />

len, Daten im World Wide Web von Maschinen interpretieren und weiterver-<br />

arbeiten zu lassen. Diese Themen sind eng verbunden mit dem Gebiet der Wis-<br />

sensrepresentation, also Wissen über die Inhalte von Inter<strong>net</strong>ressourcen, Wis-<br />

sen über die Konzepte einer Domäne und ihrer Beziehungen untereinander. Zu<br />

41 Lars U. Dittmann (2007): OntoFMEA. Ontologiebasierte Fehlermöglichkeits- und Einflussanalyse. Information<br />

- Organisation - Produktion. 1. Aufl. Herausgegeben von Hans Corten, Michael Reiß, Claus<br />

Steinle, Stephan Zelewski: Deutscher Universitätsverlag (DUV), S. 108–109.<br />

42 Frank Hermelen, Grigoris Antoniou (2004): A Semantic Web Primer. Herausgegeben von The MIT<br />

Press.<br />

47


den bis hierhin beschriebenen Technologien existieren bereits W3C-Recom-<br />

mendations, sie sind also offiziell festgelegte und festgesetzte Standards. Die<br />

nun folgenden Schichten “Logic”, “Proof” und “Trust” stellen die aktuelle<br />

Herausforderung der Forschung und der Entwicklergemeinschaft auf dem Weg<br />

zum gewünschten Automatisierungsgrad des semantischen Webs dar und han-<br />

deln eher vom Regelwerk automatischer Schlussfolgerungen und von der<br />

Glaubwürdigkeit verschiedener Ressourcen als von Daten, deren Interpretation<br />

und Metabeschreibung.<br />

Wissensrepresentation als Teilgebiet der Logik wurde schon lange vor der<br />

Entstehung des Inter<strong>net</strong>s im Gebiet der künstlichen Intelligenz und davor in der<br />

Philosophie erforscht. Zurückzuführen ist die Logik auf die antiken Griechen.<br />

Aristoteles, einer der bekanntesten Philosophen, gilt als Vater der Logik, und<br />

die Logik bildet auch heute noch die Grundlage der Wissensrepresentation. In<br />

unserem Schichtenmodell soll mittels der Logik-Schicht neues Wissen durch<br />

automatisches Schlussfolgern aus den vorhandenen Aussagen der Ontologie-<br />

Konzepte entstehen. So dienen die Fakten aus Ontologien als Grundlage für<br />

diese logischen Schlussfolgerungen, die vor allem für die Software Agents eine<br />

bedeutende Rolle spielen werden. Es gibt eine Vielzahl an Logik-Konzepten,<br />

die das automatische Schlussfolgern ermöglichen können. Nachfolgend werden<br />

der Einfachheit halber zwei dieser Konzepte beleuchtet: Die einfache Aus-<br />

sagenlogik (proposotional logic) und die Prädikatenlogik erster Ordnung (first-<br />

order predicate logic).<br />

Die Aussagenlogik. Sie ist die einfachste Form der Logik und ermöglicht es,<br />

simple semantische Wahrheiten über die Welt auszudrücken, also Aussagen<br />

über die Welt zu treffen. Diese Aussagen können in der einfachen Aussagenlo-<br />

gik “wahr” oder “falsch” sein. Innerhalb von bestimmten Logik-Konzepten<br />

kommt noch der Wert “unbekannt” hinzu. Die Aussagen bestehen dabei aus<br />

einfachen Sätzen ohne Junktoren (“und”, “oder”, “nicht”, “wenn...dann”). Beis-<br />

piele für eine Aussage in der einfachen Aussagenlogik sind “es reg<strong>net</strong>” oder<br />

“Martin hat Fieber”. Durch die Integration der Aussagenlogik wird es möglich,<br />

zusätzliche Informationen zu hinterlegen. So könnte es bei der Zusammen-<br />

führung zweier Datenbanken sehr hilfreich sein, bestimmte gleichartige Ele-<br />

48


mente dieser Datenbank auch als gleichartig zu kennzeichen. Mittels der ein-<br />

fachen Aussagenlogik könnten – ähnlich zum Konzept der Ontologien – zwei<br />

unterschiedliche Begriffe mit der gleichen Bedeutung, zum Beispiel bei einer<br />

französischen und einer deutschen Datenbank die Begriffe “Stockwerk” und<br />

“étage”, miteinander verknüpft werden. Ein Nachteil der Aussagenlogik ist al-<br />

lerdings, dass keine Aussagen über Individuen getroffen werden können, weil<br />

die Granularität dafür nicht fein genug ist. Die Basis-Einheit bei der Aussagenlo-<br />

gik ist stets die Aussage, egal ob “wahr” oder “falsch”. Abstrakt dargestellt: “Die<br />

Aussage, die für A steht, ist falsch” oder “Die Aussage, die für A steht, ist wahr”.<br />

Durch die Verwendung dieser Basis-Einheit “Aussage” ist es nicht möglich,<br />

spezielle Klassen oder Eigenschaften aus der Aussagenlogik zu entnehmen.<br />

Kompliziertere Aussagen oder Bündel von Aussagen, die durch den Gebrauch<br />

von Bindegliedern wie “und” oder “oder” entstehen, können mithilfe der ein-<br />

fachen Aussagenlogik nicht ausgedrückt werden. Hier kann die Prädikatenlogik<br />

erster Ordnung Abhilfe schaffen.<br />

Die Prädikatenlogik erster Ordnung. Sie ermöglicht das Ausdrücken feinerer<br />

semantische Unterschiede und ist eine Erweiterung der einfachen Ausagenlo-<br />

gik. Prädikate können in der Grammatik und der Logik dazu verwendet werden,<br />

Aussagen über etwas zu treffen. Bei der Prädikatenlogik erster Ordnung<br />

können sich unterschiedliche Prädikate auf das gleiche Individuum beziehen,<br />

was in der einfachen Aussagenlogik nicht möglich ist. So wird es möglich, so-<br />

wohl Eigenschaften also auch Individuen mittels der Prädikatenlogik abzu-<br />

bilden. Eine weitere Stärke der Prädikatenlogik ist die Verwendung so genan-<br />

nter Quantifikatoren, mit denen ausgesagt werden kann, auf wieviele Individuen<br />

ein Prädikat zutrifft. Es gibt viele verschiedene Quantifikatoren, doch für se-<br />

mantische Zwecke sind zwei von besonderer Bedeutung: Der Universalquanti-<br />

fikator und der Existenzialquantifikator. Der Universalquantifikator sagt aus,<br />

dass ein Prädikat auf alle Individuen zutrifft und der Existenzialquantifikator sagt<br />

aus, dass ein Prädikat auf mindestens ein Individuum zutrifft. Der Univer-<br />

salquantifikator verankert so eine gekennzeich<strong>net</strong>e Instanz-Variable innerhalb<br />

einer Aussage, so dass, egal wo und in welchem Prädikat diese Variable ver-<br />

wendet wird, sie in jeder möglichen Substitution als “wahr” anerkannt wird.<br />

Damit wäre es möglich, Anfragen zu stellen, wie etwa “Zeige mir alle Bars in<br />

49


Köln, die lateinamerikanische Musik spielen und heute Happy-Hour haben”. Mit-<br />

tels der Prädikatenlogik erster Ordnung können also sehr feine logische und se-<br />

mantische Unterschiede ausgedrückt und formalisiert werden. Die se-<br />

mantischen Sprachen DAML+OIL und OWL, mit deren Hilfe Ontologien<br />

entstehen, verwenden eine ähnliche Logik als Grundlage, die aber nicht so<br />

kompliziert ist wie die Prädikatenlogik erster Ordnung. Genau diese Logik als<br />

Grundlage macht die Verarbeitung durch Maschinen möglich. Die Maschine re-<br />

spektive der Computer erkennt diese auf Logik fundierten Modelle und kann sie<br />

Stück für Stück nachvollziehen. 43<br />

Zusammengefasst dienen also die Fakten der Ontologien als Grundlage für<br />

automatisierte, logische Schlussfolgerungen auf Basis eines festgelegten Re-<br />

gelsystems. Das Schlussfolgerungssystem, ein so genannter “Reasoner”, kann<br />

dann aus den Regeln und Informationen der Ontologien Schlussfolgerungen<br />

ziehen. Somit kann mittels einer Inferenzmaschine (inference engine) neues<br />

Wissen von bereits existierendem, spezifiziertem Wissen abgeleitet werden. Es<br />

entsteht also aus implizitem Wissen explizites Wissen. Bis zum heutigen Zeit-<br />

punkt arbeiten die Forscher und die Entwicklungsgemeinschaft des se-<br />

mantischen Webs an einer Universalsprache zur Darstellung von solchen auf<br />

Logik basierender Regelsysteme. Während die Logik-Schicht die Informationen<br />

und Regeln der Ontologien ausliest und daraus schlussfolgern kann, hat die<br />

nächste Schicht die Aufgabe, die von der Logik-Schicht aufgestellten<br />

Schlussfolgerungen zu bestätigen oder zu widerlegen.<br />

2.3.8 Beweise, Vertrauen und digitale Signaturen<br />

Auch die auf der Logik-Schicht aufbauenden Schichten “Proof” und “Trust” sind<br />

zurzeit lediglich wissenschaftliche Konzepte, an denen die Gemeinschaft der<br />

semantischen Forscher arbeitet. Wenn der in der Einleitung beschriebene Auto-<br />

matisierungsgrad von Software Agents erreicht werden will, benötigen die Soft-<br />

ware Agents ein Werkzeug, um die in der Logik-Schicht aufgestellten logischen<br />

Regeln zu prüfen. Dies gilt im Übrigen nicht nur für die in der Logik-Schicht<br />

43 Michael C. Daconta (2003): The Semantic Web. A Guide to the Future of XML, Web Services, and<br />

Knowlege Management. Unter Mitarbeit von Kevin T. Smith Leo. J. Obrst. Herausgegeben von WILEY,<br />

S. 226–229.<br />

50


aufgestellten automatischen Schlussfolgerungen. Wie schon zuvor erläutert,<br />

ergeben sich Regeln bereits aus dem Verhältnis, wie einzelne Klassen und Ei-<br />

genschaften im Ressource Description Framework, im Ressource Description<br />

Framework Schema und in der Ontology Web Language zueinander in Be-<br />

ziehung stehen. Die Beweis-Schicht (proof layer) hat nun die Aufgabe, das<br />

World Wide Web so lange nach Regeln und Ontologien zu durchsuchen, bis<br />

diese aufgestellten Behauptungen mithilfe einer heuristischen Maschine (heur-<br />

istic engine) bestätigt oder widerlegt werden können. Heuristik bezeich<strong>net</strong> die<br />

Kunst, wahre Aussagen zu finden, im Gegensatz zur Logik, die lehrt, wahre<br />

Aussagen zu begründen. Programme, die diese Regeln auswerten können,<br />

benötigen wiederum spezielle Programmiersprachen, sogenannte “proof lan-<br />

guages” (Beweis-Sprachen). Erste Ansätze für eine solche Beweis-Sprache<br />

sind XMLEncryption und XMLSignature. Greifbare Anwendungen sind bis zum<br />

heutigen Zeitpunkt nicht entwickelt. 44<br />

Die Logik-Schicht ermöglicht es also jedem, Regeln zu veröffentlichen.<br />

Gleichzeitig sollen die Logik- und die Beweisschicht dafür Sorge tragen, dass<br />

die logische Schlüssigkeit zwischen den Daten im semantischen Web erhalten<br />

bleibt. Im semantischen Web kann jeder alles aussagen, also können auch in-<br />

haltlich falsche Aussagen getroffen werden. Die Vertrauens-Schicht (trust layer)<br />

soll diese inhaltlichen Falschaussagen von vornherein unterbinden. Dabei geht<br />

es weniger darum zu verhindern, dass jeder das aussagen und veröffentlichen<br />

kann, was er möchte. Vielmehr geht es darum, den Software Agents<br />

Werkzeuge an die Hand zu geben, mit denen sie selbst entscheiden können,<br />

welchen Quellen und anfragenden Agents sie Glauben schenken, also ver-<br />

trauen oder nicht. Verschiedene Ansätze wurden bis dato entwickelt.<br />

Das W3C-Konsortium konzentriert sich bei der Umsetzung des Konzepts der<br />

Vertrauens-Schicht vor allem auf technische Standards wie etwa Verschlüsse-<br />

lungsverfahren und digitale Signaturen. Verschlüsselungsverfahren sind der<br />

Kryptographie zuzuordnen, der Wissenschaft von der Ver- und Entschlüsselung<br />

44 Dr. rer. nat. Harald Sack (Wintersemester 2006/2007): Vorlesungsmaterial Semantic Web. Web of<br />

Trust. Herausgegeben von Institut für Informatik. Friedrich Schiller Universität Jena. Online verfügbar<br />

unter http://www.db-thueringen.de/servlets/DerivateServlet/Derivate-10503/semweb-08_WebOf-<br />

Trust.pdf, zuletzt geprüft am 01.05.2008.<br />

51


von Informationen. 45 Die Kryptographie unterscheidet zwischen symmetrischen<br />

und asymmetrischen Verschlüsselungsverfahren, wobei für die Zwecke der Ver-<br />

trauens-Schicht vor allem die asymmetrischen Verschlüsselungsverfahren eine<br />

bedeutende Rolle spielen. Egal wie komplex das Verschlüsselungsverfahren<br />

auch ist, hängt die Sicherheit insbesondere von einem sicheren Austausch der<br />

Daten ab. Dieses Problem hat die asymmetrische Verschlüsselung erkannt. Sie<br />

verwendet einen geheimen Schlüssel, der beim Besitzer verbleibt, und einen öf-<br />

fentliche Schlüssel, der von jedem genutzt werden kann. Öffentlicher und ge-<br />

heimer Schlüssel dienen dabei zum gegenseitigen Ver- und Entschlüsseln. Die<br />

digitale Signatur ist auch ein kryptographisches Verfahren, das auf den be-<br />

schriebenen asymmetrischen Verschlüsselungsverfahren beruht. An beliebige<br />

Daten wird eine kryptographische Zahl angehängt, die den Urheber der Na-<br />

chricht eindeutig identifiziert. Die asymmetrische Verschlüsselung garantiert,<br />

dass auch tatsächlich einzig der Empfänger in der Lage ist, die Nachricht zu<br />

entschlüsseln. Wie aber kann der Empfänger sicher gehen, dass die Nachricht<br />

auch von dem angegebenen Absender stammt und nicht beim Austauschen<br />

verfälscht worden ist? Dazu wird das Verschlüsselungsverfahren – wie oben<br />

beschrieben – umgedreht, in dem der Sender die Nachricht mit dem persön-<br />

lichen, geheimen Schlüssel codiert und der Empfänger die Nachricht mit dem<br />

öffentlichen Schlüssel decodieren kann. 46<br />

Einen anderen Ansatz verfolgen die Forscher des semantischen Webs an der<br />

Stanford University in Kalifornien. Sie setzten auf ein Verfahren, dass die<br />

soziale Komponente des Vertrauens im semantischen Web stärker betont, so<br />

genannte “trust-<strong>net</strong>works”-Verfahren. Diese Vertrauens<strong>net</strong>zwerke basieren auf<br />

dem sozialen Prinzip, dass wir Menschen oder auch anderen Ressourcen, die<br />

wir kennen, eher vertrauen, als solchen, die wir nicht kennen. In der Praxis kön-<br />

nte man jene verschiedenen Vertrauensebenen aus den sozialen Netzwerken,<br />

an denen ein Benutzer teilnimmt, ableiten, oder besser noch aus dezentralen<br />

semantischen Freundes<strong>net</strong>zwerken, wie etwa Friend of a Friend (FOAF), auf<br />

das später noch näher eingegangen wird. So kann zum einen Vertrauen über<br />

45 Brockhaus (Hg.): Kompakt Wissen von A bis Z in 5 Bänden. 3. Aufl. 5 Bände. Wiesbaden.<br />

46 Dr. rer. nat. Harald Sack (Wintersemester 2006/2007): Vorlesungsmaterial Semantic Web. Web of<br />

Trust. Folie 8-25. Herausgegeben von Institut für Informatik. Friedrich Schiller Universität Jena. Online<br />

verfügbar unter http://www.db-thueringen.de/servlets/DerivateServlet/Derivate-10503/semweb-08_WebOfTrust.pdf,<br />

zuletzt geprüft am 01.05.2008.<br />

52


die Zwischenstationen im Netzwerk hergeleitet werden: A vertraut B, B vertraut<br />

C, also kann A dem C vermutlich auch vertrauen. Zum anderen kann die Ver-<br />

trauensstufe auch über die Anzahl der Zwischenstationen zumindest grob<br />

eingeschätzt werden. 47 Umgekehrt würde man dem eigenen Netzwerk je nach<br />

Gruppierung (Freunde, Bekannte, Arbeitskollegen, Projektteams etc.) bestim-<br />

mte Rechte vergeben und vertrauenswürdige Personen und Quellen<br />

kennzeichnen, sodass die Software Agents bei ausgehenden oder eingehenden<br />

Anfragen diese personalisierte Einstufung verwenden können.<br />

Ein weiterer Ansatz zur Schaffung von Vertrauen im semantischen Web sind<br />

sogenannte “open rating systems”, also offene Bewertungssysteme, mit deren<br />

Hilfe die Reputation von Menschen, Gruppen und anderen Quellen eingestuft<br />

werden kann. Dazu werden unterschiedlichste Bewertungen aus verschieden-<br />

sten Quellen aggregiert und zu einem einheitlichem Ranking zusammengefasst.<br />

Neben dieser Aggregation wird ein solches Bewertungssystem auch die unter-<br />

schiedlichen Bewertungen nach ihrer Qualität einstufen müssen, also über eine<br />

Art Meta-Ranking verfügen. 48<br />

Vermutlich würde ein hybrider Ansatz, der die technische und soziale Kompon-<br />

ente des Vertrauens vereint und sich verschiedenster Bewertungssysteme<br />

bedient, die wirksamste Umsetzung darstellen. Das Zusammenwirken der<br />

Konzepte hinter den Schichten “Logic”, “Proof” und “Trust” wird auch als “Web<br />

of Trust” bezeich<strong>net</strong>, also ein Inter<strong>net</strong>, in dem mit wenigen, gezielten Schritten<br />

Vertrauensbeziehungen zwischen beliebigen Software Agenten beschrieben<br />

werden können.<br />

2.3.9 Entwicklung des Schichtenmodells<br />

Das ursprüngliche Schichtenmodell, das Tim Berners-Lee am 06. Dezember<br />

2000 auf der Konferenz “XML 2000” präsentierte, hat die Fortentwicklung des<br />

47 Jochen Notholt (2005): Die Zukunft des Semantic Web. Herausgegeben von Prof. Dr. Maximilian Herberger.<br />

Universität des Saarlandes. (JurPC Web-Dok., 66/2005). Online verfügbar unter http://www.jurpc.de/aufsatz/20050066.htm#fn0,<br />

zuletzt geprüft am 01.05.2008.<br />

48 Dr. rer. nat. Harald Sack (Wintersemester 2006/2007): Vorlesungsmaterial Semantic Web. Web of<br />

Trust. Herausgegeben von Institut für Informatik. Friedrich Schiller Universität Jena, S. 55–56. Online<br />

verfügbar unter http://www.db-thueringen.de/servlets/DerivateServlet/Derivate-10503/semweb-08_WebOfTrust.pdf,<br />

zuletzt geprüft am 01.05.2008.<br />

53


semantischen Webs überhaupt erst ermöglicht. Denn anstatt die Idee des se-<br />

mantischen Webs als abstraktes Konstrukt zu beschreiben, hat er eine konkrete<br />

Architektur von aufeinander aufbauenden Technologien vorgeschlagen, die die<br />

Entwicklergemeinschaft dazu befähigt, die verschiedenen Technologien zu<br />

diskutieren, Fehler zu erkennen und Berichtigungen vorzunehmen. Er hat<br />

sozusagen einen Orientierungsraum geschaffen, der Dissens und Konsens<br />

fördert und so die Entwicklung beschleunigt. So wurden inzwischen viele<br />

modifizierte Versionen des semantischen Schichtenmodells von unterschied-<br />

lichen Forschungsgruppen veröffentlicht und innerhalb der Entwicklerge-<br />

meinschaft zur Diskussion gestellt. Einige Verbesserungsvorschläge wurden<br />

übernommen und an das Schichtenmodell adaptiert, einige wurden wieder ver-<br />

worfen. Die Standardisierung von Technologien ist ein entscheidender Schritt<br />

zur allgemeinen Verbreitung der semantischen Technologien und somit zur Ver-<br />

wirklichung des semantischen Webs. Ein Schichtenmodell vorzuschlagen, dass<br />

einzelne Technologien präsentiert und zur Diskussion stellt, ist ein hervorra-<br />

gender Weg, die Technologien von der Allgemeinheit, insbesondere aber auch<br />

von den an das W3C-Konsortium angeschlossenen Universitäten und Un-<br />

ternehmen prüfen zu lassen und sich so letztendlich schneller auf einen ge-<br />

meinsamen Standard zu einigen. Im Jahre 2007 hat das W3C-Konsortium<br />

schließlich eine neue Version des Schichtenmodells veröffentlicht, in das die<br />

Erkenntnisse aus dem wissenschaftlichen Diskurs der vergangenen Jahre<br />

eingeflossen sind. Die folgende Abbildung zeigt die aktuelle, offizielle Version<br />

des semantischen Schichtenmodells.<br />

54


Abbildung 11: Latest Layercake: Ivan Herman (Semantic Web Activity Lead) (2008):<br />

W3C Semantic Web Activity. Unter Mitarbeit von Tim Berners-Lee, Dan Connolly ,<br />

Sandro Hawke, Ivan Herman, Eric Prud'hommeaux, and Ralph Swick. Heraus-<br />

gegeben von W3C-Konsortium. Online verfügbar unter<br />

http://www.w3.org/2007/03/layerCake.png, zuletzt geprüft am 29.04.2008.<br />

Wirklich neu hinzugekommen sind in diesem Schichtenmodell das “Rule Inter-<br />

change Format (RIF)” und die Anfragesprache “SPARQL”. “IRI” stellt eine Er-<br />

gänzung des Uniform Resource Identifiers dar.<br />

IRI steht für “Internationalized Resource Identifiers” und ist lediglich ein zusätz-<br />

liches Protokoll als Ergänzung zum Uniform Resource Identifier (URI). Diese in-<br />

55


ternationalisierte Form der URIs erweitern die erlaubten Zeichen um fast alle<br />

Zeichen des Universal Character Sets (Unicode/ISO10646). 49<br />

SPARQL ist eine der aktuellsten W3C-Recommendations vom 15. Februar<br />

2008. SPARQL ist eine Anfragesprache für die in RDF spezifizierten Informa-<br />

tionen und die Darstellung dieser Informationen. Die Anfragesprache lässt kom-<br />

plexere Anfragen zu und ermöglicht verschiedenste Darstellungen und Filter bei<br />

der Ausgabe – was so vorher nicht ohne weiteres möglich war. 50<br />

RIF steht für “Rule Interchange Format” und ist zurzeit noch kein offizieller<br />

Standard. Die Arbeitsgruppe des W3C-Konsortiums entwickelt eine allge-<br />

meingültiges Format zum Austausch von Regeln und deren Erweiterungen, die<br />

es gemeinsam ermöglichen sollen, Regeln und die dadurch möglichen automat-<br />

ischen Schlussfolgerungen zwischen verschiedenen Regelsprachen zu überset-<br />

zen und somit bestimmte Regelsprachen von einem Regelsystem zum anderen<br />

zu transferieren. 51<br />

In dieser Weise arbeitet sich das W3C-Konsortium langsam in Richtung voll-<br />

ständiger Verwirklichung des semantischen Webs vor. Ohne das ursprüngliche<br />

Schichtenmodell wäre kein wissenschaftlicher Diskurs und somit kein Fortschritt<br />

in der Entwicklung zum finalen Modell entstanden. Je mehr wissenschaftliche<br />

Auseinandersetzung, desto mehr Konsens. Je eher Konsens, desto schneller<br />

wird eine Technologie zum allgemeingültigen W3C-Standard. Je mehr allge-<br />

meingültige Standards verfügbar sind, desto schneller werden Unternehmen die<br />

Technologien in ihre Systeme integrieren und das semantische Web Wirklich-<br />

keit werden.<br />

49<br />

M. Duerst (2003): Internationalized Resource Identifiers (IRIs). Unter Mitarbeit von M. Suignard. Herausgegeben<br />

von W3C-Konsortium. Online verfügbar unter http://www.w3.org/International/iri-edit/draft-duerst-iri-04.txt,<br />

zuletzt geprüft am 01.05.2008.<br />

50<br />

Pascal Hitzler, Markus Krötzsch, Sebastian Rudolph, York Sure (2008): Semantic Web. Grundlagen. 1.<br />

Aufl.: Springer, S. 202–241.<br />

51<br />

Sandro Hawke (2005): Rule Interchange Format. Working Group Charter. Unter Mitarbeit von diversen<br />

Mitarbeitern. Herausgegeben von W3C-Konsortium. Online verfügbar unter http://www.w3.org/2005/rules/wg/charter.html,<br />

zuletzt geprüft am 04.05.2008.<br />

56


2.4 Evolution zum semantischen Web<br />

Der folgende Abschnitt beschreibt zum einen zwei in der Entwicklergemein-<br />

schaft diskutierte Umsetzungsszenarien zur Adaption des semantischen Webs<br />

an das bestehende World Wide Web und zum anderen gibt er eine grobe zeit-<br />

liche Einordnung, bis wann diese Adaption vollzogen sein wird. Im englischen<br />

Sprachgebrauch wird der Unterschied dieser Umsetzungsszenarien durch<br />

Groß- und Kleinschreibung untermalt. Der Bottom-Up Ansatz wird mit kleinen<br />

Anfangsbuchstaben geschrieben – “semantic web”. Der Top-Down Ansatz wird<br />

durch die Verwendung von goßen Anfangsbuchstaben kenntlich gemacht –<br />

“Semantic Web”.<br />

2.4.1 Der Bottom-Up Ansatz<br />

Alex Iskold, Autor des Technologie-Weblogs “Read/WriteWeb” und Gründer<br />

sowie Chief Executive Officer (CEO) von AdaptiveBlue, ein Unternehmen spezi-<br />

alisiert auf personalisiertes Browsing (das Durchstöbern von Inter<strong>net</strong>seiten), hat<br />

mit seinem Artikel “Semantic Web: Difficulties with the Classic Approach” vom<br />

19. September 2007 52 erstmalig das Umsetzungsszenario mit dem Namen “bot-<br />

tom-up approach” geprägt. Er beschreibt dieses Umsetzungsszenario als An-<br />

satz von unten nach oben, da bereits eine sehr große Menge an Informationen<br />

im World Wide Web existiert, die zur Umsetzung des semantischen Webs erst<br />

einmal semantisch codiert werden muss und die Technologien des se-<br />

mantischen Webs auf das bestehnde WWW aufgesetz werden. Er kritisiert weit-<br />

erhin, dass das manuelle Markieren mit Metadaten all jener bestehenden Daten<br />

eine nicht zu bewältigende Aufgabe sei. Eine schnelle Transformation der alten,<br />

nicht semantisch beschriebenen Daten, könne nur über einen zentralen se-<br />

mantischen Web Crawler, der diese Daten auffindet und automatisch mit se-<br />

mantischen Metabeschreibungen codiert, geschehen. Web Crawler werden<br />

heutzutage hauptsächlich von Suchmaschinen eingesetzt. Sie durchsuchen das<br />

World Wide Web nach neuen oder veränderten Inhalten, analysieren diese und<br />

stellen die Ergebnisse bei Suchanfragen dar. Alex Iskold bezweifelt stark, dass<br />

52<br />

Alex Iskold (2007): Semantic Web: Difficulties with the Classic Approach. Herausgegeben von ReadWriteWeb.<br />

Online verfügbar unter<br />

http://www.readwriteweb.com/archives/semantic_web_difficulties_with_classic_approach.php, zuletzt<br />

geprüft am 06.05.2008.<br />

57


es in naher Zukunft einen solchen automatischen Algorithmus geben wird, der<br />

die Bedeutung aus Text – in menschenähnlicher Weise – auslesen und daraus<br />

Metadaten für die zurzeit noch semantisch uncodierten Informationen ableiten<br />

kann. Im Übrigen stellt er fest, dass die Grundlagentechnologien Resource De-<br />

scription Framework (RDF) und die Ontology Web Language (OWL) zur se-<br />

mantischen Auszeichnung von bestehenden Webseiten viel zu komplex zum<br />

schnellen Erlernen seien. Der Nutzen für Unternehmen und Privatleute werde<br />

nicht ausdrücklich genug kommuniziert. So bestünde zu wenig Anreiz zum<br />

Erlernen der Technologien und zum Auszeichnen in semantischer Weise. Aus<br />

dieser Kritik heraus entwickelte der Autor das zweite Umsetzungsszenario –<br />

den Top-Down Ansatz.<br />

2.4.2 Der Top-Down Ansatz<br />

Der Top-Down Ansatz (top-down approach) beschreibt das umgekehrte Umset-<br />

zungsszenario – nämlich von oben nach unten. Mit diesem Ansatz sollen die<br />

Probleme des klassischen Bottom-up Ansatzes gelöst werden. Die technische<br />

Schwierigkeiten, wie das Erlernen der komplexen Technologien RDF und OWL<br />

und das manuelle Auszeichen aller existierender Webseiten, sowie die<br />

fehlenden Anreize für Unternehmen, Entwickler und Privatleute, sich diesen<br />

technischen Herausforderungen zu stellen, könnten mit diesem Ansatz umgan-<br />

gen werden. Bei dem Top-Down Ansatz handelt es sich um einen praktikabler-<br />

en Ansatz, der vom Marktpotenzial und den Erwartungen der Unternehmer an-<br />

getrieben wird sowie eher auf den Nutzen für den Endnutzer fokussiert ist, als<br />

der klassische Ansatz.<br />

Viele Unternehmen machen sich die semantischen Technologien zu Nutzen, in<br />

dem sie die im Inter<strong>net</strong> bestehenden, unstrukturierten Informationen ver-<br />

wenden, um so vertikale, semantische Webservices anzubieten. Vertikal<br />

bedeutet in diesem Zusammenhang, dass sich es sich um themenspezische<br />

Services handelt, wie beispielsweise die vertikale Suchmaschine “Spock”, die<br />

das Inter<strong>net</strong> nach allen erdenklichen Informationen über Personen durchsucht.<br />

Vertikal also, weil Spocks ausschließlich dazu verwendet werden kann, Infor-<br />

mationen über Personen zu finden. Spock weiß, wie Namen von Personen aus<br />

58


HTML herausgelesen werden, sucht nach weiteren in Verbindung stehenden In-<br />

formationen wie Geburtsdatum und Wohnort und kann die Beziehungen, in den-<br />

en Personen zueinander stehen, deuten und darstellen. Wird zum Beispiel nach<br />

Steve Jobs, dem Gründer und CEO von Apple, gesucht, zeigt Spock auch den<br />

Rivalen Bill Gates an. Spock ist eine gelungene Endnutzeranwendung, die sich<br />

mit ihrem Zwitterdasein sowohl der Vorteile des semantischen Webs bedient als<br />

auch die bestehenden, unstrukturierten Informationen im gegenwärtigen Inter-<br />

<strong>net</strong> zu nutzen weiß. 53<br />

Der Top-Down Ansatz ist im Grunde genommen nichts anderes als die Verwirk-<br />

lichung des semantischen Webs durch nützliche, von Unternehmen entwickelte<br />

und auf Profit ausgerichetet vertikale, teilweise semantische Webservices. Un-<br />

ternehmen greifen die semantischen Technologien auf, weil sie sich davon<br />

Profit versprechen und entwickeln deswegen auf den Kundennutzen aus-<br />

gerichtet Webservices. Wo möglich, verwenden sie bereits semantische Tech-<br />

nologien und überbrücken so die zeitliche Lücke bis zur vollen Verwirklichung<br />

des semantischen Webs.<br />

53 Alex Iskold (2007): Top-Down: A New Approach to the Semantic Web. Herausgegeben von ReadWrite-<br />

Web. Online verfügbar unter http://www.readwriteweb.com/archives/the_top-down_semantic_web.php,<br />

zuletzt geprüft am 06.05.2008.<br />

59


2.4.3 Der hybride Ansatz<br />

Das von Alex Iskold gezeich<strong>net</strong>e Bild verwendet nur die Farben Schwarz und<br />

Weiß. In der Praxis werden sich beide beschriebene Ansätze vermischen. Auch<br />

wenn die Kritik am klassischen Bottom-Up Ansatz verständlich und teilweise be-<br />

gründet ist, befinden wir uns in einer Übergangszeit zwischen zwei Standards.<br />

Damit geht zwangsläufig einher, dass ein Teil der Inter<strong>net</strong>nutzer und Unterneh-<br />

men die neuen Standards, insbesondere die Standards zur Verwirklichung des<br />

semantischen Webs, noch nicht verwendet, weil ihnen zurzeit der klare Nutzen<br />

fehlt. Andere Unternehmen aber erkennen den Nutzen und verwenden die<br />

neuen Standards bei ihren Projekten und Geschäften. Je früher das Thema in<br />

der allgemeinen Öffentlichkeit und vor allem in Forschung und Ausbildung mehr<br />

Gehör findet, desto eher wird ein Bewusstsein für die neuen Technologien und<br />

Standards geschaffen. Universitäten vermitteln dann das nötige Wissen und<br />

Unternehmen verwenden semantische Technologien. Der Bottom-Up Ansatz ist<br />

also eher als Prozess zu verstehen und ist schwerfälliger als der Top-Down An-<br />

satz.<br />

Der Top-Down Ansatz betont die Verwirklichung des semantischen Webs vom<br />

Markt her. Neue Technologien erlangen selten den Durchbruch, weil sie so<br />

vielversprechend sind. Vielmehr werden sie von Unternehmen adaptiert, wenn<br />

ein klarer Nutzen erkenntlich und somit Profit damit verbunden ist. Hat es ein<br />

bestimmtes Unternehmen einmal geschafft, eine neue Technologie zu kapitalis-<br />

ieren, werden weitere Unternehmen folgen. Auf der anderen Seite wissen die<br />

Unternehmen, dass sie einen Webservice nur dann gewinnbringend am Markt<br />

platzieren können, wenn er einen klaren Vorteil für die Endnutzer bietet. Somit<br />

werden die Endnutzer zu Nutznießern. Das Bewusstsein für den Nutzen der se-<br />

mantischen Technologien steigt dadurch auch bei den Endnutzern. Je mehr Un-<br />

ternehmen die Verwendung und den Nutzen der semantischen Technologien<br />

erfolgreich demonstrieren, desto mehr Unternehmen werden folgen, die Stand-<br />

ards des semantischen Webs adaptieren und so gemeinsam die Verwirklichung<br />

des semantischen Webs schneller vorantreiben. Sicherlich steckt in diesem<br />

Top-Down Ansatz mehr Dynamik als in dem Bottom-Up Ansatz. Schlussendlich<br />

wird aber der hybride Ansatz die Entwicklung bis zur vollständigen Realisation<br />

des semantischen Webs voranbringen.<br />

60


2.4.4 Zeitliche Einordnung bis zur Verwirklichung<br />

Die vorrangige Frage ist nun: “Wenn bereits die ursprüngliche Vision des Inter-<br />

<strong>net</strong>s von Tim Berners-Lee aus dem Jahre 1989 grobe Züge der Idee des se-<br />

mantischen Webs enthielt, warum hat es so lange gedauert, bis davon ein Teil<br />

überhaupt realisiert worden ist?” Laut Nova Spivak, dem CEO von Radar<strong>net</strong>-<br />

works, der Betreibergesellschaft von Twine, hat dies verschiedene Gründe.<br />

Zum einen war die Wissenschaft in den Anfängen zu fokussiert auf eine Lösung<br />

durch künstliche Intelligenz, zum anderen waren die Technologien unreif. Es<br />

waren keine greifbaren Werkzeuge verfügbar. Außerdem war der Bedarf nach<br />

offenen, interoperablen Daten nicht groß genug und die Entwicklung ging eher<br />

in Richtung geschützter, proprietärer Unternehmensdatenbänke. Nicht zuletzt<br />

war die auf Schlagworten basierende Suche wegen der halbwegs über-<br />

schaubaren Datenmenge bis heute völlig ausreichend. Es wurde bis dato keine<br />

Killerapplikation entwickelt, die selbst auch nur einer der semantischen Techno-<br />

logien zum Durchbruch verholfen hätte. 54<br />

Die grundlegenden Technologien RDF, RDFS und OWL sind festgelegte<br />

Standards und hatten die letzten Jahre Zeit, den Kinderschuhen zu entwach-<br />

sen. Diese Technologien können, wie folgenden Ausführungen zu den An-<br />

wendungsbeispielen eindrucksvoll demonstrieren, ohne die höheren Schichten<br />

“Logic”, “Proof” und “Trust” bereits verwendet werden. RDF wird in immer mehr<br />

Softwareanwendungen als Standard zur Beschreibung von Metadaten imple-<br />

mentiert werden, und so werden verschiedene Typen von erstellten Dateien<br />

(Text, Bild, Audio etc.) mit einer einheitlichen Metabeschreibung versehen.<br />

Weiterhin beginnt das Interesse an dem Thema zu wachsen. Führende Un-<br />

ternehmen wie HP oder Adobe integrieren die Standards mittlerweile in ihren<br />

Softwareprodukten. Auch führende Suchmaschinen wie Google oder Yahoo<br />

loten die Möglichkeiten für sich aus und Mobilfunkunternehmen nehmen sich<br />

dem Thema an, um die Nutzung des Inter<strong>net</strong>s über das Mobiltelefon interess-<br />

anter zu gestalten. All diese Entwicklungen werden ihre Zeit bis zur Marktreife<br />

brauchen, es ist aber zu erwarten, dass innerhalb der nächsten zwei bis drei<br />

Jahre immer mehr “early-adopter”-Produkte auf den Markt drängen.<br />

54 Nova Spivak (CEO&FOUNDER Radar<strong>net</strong>works) (2008): Making sense of the Semantic Web. Herausgegeben<br />

von slideshare. Online verfügbar unter http://www.slideshare.<strong>net</strong>/BlogTalk2008/spivackblogtalk-2008,<br />

zuletzt geprüft am 10.05.2008. Folie 24<br />

61


Umfangreichere Ontologien, die mit automatischen Schlussfolgerungen<br />

arbeiten, werden noch auf sich warten lassen. Die Standardisierungsprozess<br />

einer Technologie, insbesondere einer Universalsprache zum Ausdruck von Lo-<br />

gik und den daraus ableitbaren automatischen Schlussfolgerungen, hat bis<br />

heute nicht die exploratorische Phase der Standardisierung verlassen. Es ist<br />

davon auszugehen, dass noch mindestens drei weitere Jahre verstreichen, bis<br />

hierfür ein offzieller Standard vom W3C verabschiedet wird. Ist ein Standard für<br />

Logik und automatisches Schlussfolgern festgelegt, werden wahrscheinlich<br />

weitere drei bis fünf Jahre vergehen, bis erste greifbare Applikationen entwickelt<br />

werden. 55<br />

Das Marktforschungsunternehmen Gartner geht in seiner Studie zum se-<br />

mantischen Web “Finding and Exploiting Value in Semantic Web Technologies<br />

on the Web” aus dem Jahre 2007 davon aus, dass innerhalb der nächsten zehn<br />

Jahre durch webbasierte Technologien die Möglichkeit, semantische Strukturen<br />

in Daten einzubinden, stetig verbessert wird. Im Jahre 2017 soll die vollständige<br />

Evolution des semantischen Webs abgeschlossen sein und der Großteil der<br />

Webseiten im WWW mit semantischem Hypertext versehen sein. Im Jahre<br />

2012 schon sollen laut Gartner 80 % der öffentlichen Webseiten über ein<br />

gewisses Nivau an semantischen Beschreibungen verfügen und 15 % der öf-<br />

fentlichen Webseiten werden exzessiven Gebrauch von webbasierten, se-<br />

mantischen Ontologien machen, um damit semantische Datenbanken zu erstel-<br />

len. 56<br />

2.5 Anwendungsbeispiele aus der Wirtschaft<br />

Das W3C-Konsortium stellt auf ihrer Website Case Studies und Use Cases von<br />

Organisationen bereit, die bereits mit den semantischen Technologien Er-<br />

fahrungen gesammelt haben. Die Use Cases sind eher als konstruierte Beis-<br />

55 Dr. Brian Matthews: Semantic Web Technologies. Unter Mitarbeit von Dan Brickley, Leigh Dodds. Herausgegeben<br />

von CCLRC Rutherford Appleton Laboratory. JISC Technology and Standards Watch. Online<br />

verfügbar unter http://www.jisc.ac.uk/uploaded_documents/jisctsw_05_02bpdf.pdf, zuletzt geprüft<br />

am 10.05.2008.<br />

56 David W. Cearley, Whit Andrews, Nicholas Gall (2007): Finding and Exploiting Value in Semantic Technologies<br />

on the Web. Gartner Research Report, May 2007. Herausgegeben von Gartner. Online verfügbar<br />

unter http://www.gartner.com/DisplayDocument?ref=g_search&id=505304, zuletzt geprüft am<br />

09.05.2008.<br />

62


piele zu verstehen, wo innerhalb des Unternehmens ein Prototyp entwickelt<br />

wurde, der aber so nicht in der Praxis eingesetzt wird. Die Case Studies hinge-<br />

gen beinhalten Beschreibungen von semantischen Systemen, die so auch tat-<br />

sächlich im Unternehmen umgesetzt worden sind. Die folgenden Unterab-<br />

schnitte behandeln zwei Use Cases und eine Case Study.<br />

2.5.1 WEASEL, Vodafone R&D Corporate Semantic Web<br />

Der folgende Use Case stellt das Konzept der semantischen, un-<br />

ternehmerischen Wissensdatenbank der Vodafone R&D vor.<br />

Vodafone ist eines der größten Unternehmen im Bereich des Mobilfunks mit<br />

mehreren Millionen Kunden weltweit. In dem sich schnell verändernden und<br />

stark umkämpften Wettbewerbsumfeld stellt Innovation ein Schlüsselelement<br />

für langfristigen Erfolg dar. Die Vodafone R&D ist die zu einer Unternehmen-<br />

seinheit ausgegliederte Forschung- & Entwicklungsabteilung von Vodafone, die<br />

als globale Organisation die Geschäftseinheiten von Vodafone mit Information-<br />

en über neue Technologien, Produkte und Leistungen versorgt. Alle zusam-<br />

mengetragenen Informationen der Vodafone R&D werden von den Mitarbeitern<br />

in einem internen Bereich der Unternehmenswebsite mit zwei Zielen zusam-<br />

mengetragen. Erstens soll so die Entwicklung und Sicherung von technologis-<br />

chem Know-How innerhalb des Unternehmens gewährleistet werden und<br />

zweitens sollen so die sozialen Netzwerke, die sich rund um Projektteams und<br />

Abteilungen bilden, aufgedeckt und zu Nutzen gemacht werden.<br />

Das Problem. Selbst wenn man die oben beschriebenen Informationen den<br />

Mitarbeitern zur Verfügung stellt, ist damit noch nicht gewährleistet, dass diese<br />

Informationen von diesen auch tatsächlich wahrgenommen werden. Außerdem<br />

können alle Mitarbeiter Informationen in das System einspeisen, von denen sie<br />

denken, dass sie interessant oder von Relevanz in Zukunft sein könnten. Dabei<br />

existieren keine Beschränkungen hinsichtlich der Struktur und des Formats<br />

dieser hochgeladenen Informationen und auch keine genauen Vorgaben, an<br />

welchem Ort die Informationen abgelegt werden sollen. Aus diesem Grund ist<br />

es für die Mitarbeiter im Nachhinein sehr schwer, nützliche Informationen<br />

63


abzurufen und einzelne Informationselemente sinnvoll miteinandern zu<br />

verknüpfen.<br />

Die Lösung. Die Herausforderung für Vodafone R&D besteht darin, eine<br />

Vielzahl von hetereogenen Unternehmenswebseiten und -datenbanken, die un-<br />

strukturierte, aber in Verbindung stehende Daten enthalten, einheitlich und mit<br />

sinnvollen Relationen versehen den Mitarbeitern in einer intuitiven Weise zur<br />

Verfügung zu stellen. Die Lösungsansätze, die in das interne, un-<br />

ternehmerische semantische Web “WEASEL” implementiert werden könnten,<br />

gehen dabei in zwei Richtungen. Erstens soll die Aggregation von Daten aus<br />

unterschiedlichen Informationensquellen durch automatische semantische Be-<br />

merkungen innerhalb der unterschiedlichen Daten gewährleistet werden, um so<br />

diese aggregierten und strukturierten Daten nach ihrem Bedeutungsgehalt der<br />

gesamten Organisation zur Verfügung zu stellen. Zweitens wird es durch die<br />

Verwendung von Ontologien möglich, den Mitarbeitern hochwertige Schnittstel-<br />

len zur individuellen Informationsbeschaffung zur Verfügung zu stellen. Zwei<br />

Arten von Schnittstellen stellt WEASEL bereit. Die erste Schnittstelle erlaubt<br />

das Durchstöbern der Struktur der verwendeten Ontologie, um so Informationen<br />

besser zu finden und die zweite Schnittstelle ist eine Art Suchmaschine, mit<br />

deren Hilfe die Mitarbeiter eine frei formulierte Abfrage der semantischen Un-<br />

ternehmensdatenbank tätigen können. Die Suchergebnisse werden zusätzlich<br />

noch erklärt. 57<br />

Durch die Verwendung der semantischen Technolgien bei Vodafone R&D kon-<br />

nten zuvor zerstreute Daten in global konsitente Informationen transformiert<br />

werden. Die Metadaten, also die Bemerkungen innerhalb der verschiedenen<br />

Daten, können so automatisch aktuell gehalten werden und die Schnittstelle,<br />

die frei formulierte Fragen zulässt, liefert konkrete Antworten anstatt einer<br />

Auflistung von möglichen Fundstellen. Der Mehrwert und die Einsparungspoten-<br />

ziale, die durch die semantische Verknüpfung der Daten innerhalb der Orga-<br />

nisation entstehen, liegen auf der Hand. Die gesamten Informationen eines Un-<br />

ternehmens anhand einer allgemein verständlichen Ontologie zu strukturieren,<br />

57 Juan José Valverde Fúster (2007): WEASEL, Vodafone R&D Corporate Semantic Web. Herausgegeben<br />

von Vodafone Group Research & Development. Online verfügbar unter http://www.w3.org/2001/sw/<br />

sweo/public/UseCases/Vodafone-es/, zuletzt geprüft am 05.05.2008.<br />

64


gewährleistet, dass einmal gewonnene Einzelerkenntnisse langfristig gesichert<br />

werden können und das Wissen eines Unternehmens unabhängig von allge-<br />

meiner Fluktuation, dem Kommen und Gehen einzelner Experten und von<br />

gegründeten und aufgelösten Abteilungen, strukturiert wächst und so auch<br />

langfristig an Wert gewinnt.<br />

2.5.2 POPS - NASA’s Expertise Location Service<br />

Die folgende Case Study stellt die von der NASA entwickelte Schnittstelle<br />

“POPS” vor.<br />

NASA steht für “National Aeronautics and Space Administration” und ist die US-<br />

amerikanische Organisation für das öffentliche Luft- und Raumfahrtprogramm.<br />

Die NASA sammelt und speichert Informationen über ihre Mitarbeiter hinsicht-<br />

lich ihrer organisatorischen Zugehörigkeit, ihrer historischen Vergangenheit in-<br />

nerhalb der NASA und der entwickelten Fähigkeiten. Das Problem besteht dar-<br />

in, dass diese Informationen sich über mehrere Datenbanken, mehrere Applika-<br />

tionen und andere Systeme verteilen. Wenn man einen Mitarbeiter mit beson-<br />

deren Fähigkeiten und einem bestimmten Arbeitshintergrund sucht, kann dies<br />

nur über Abfragen in den unterschiedlichen Systemen erfolgen. Selbst wenn<br />

das Abfragen der verschiedenen Systeme einfach wäre, würden die meisten<br />

Mitarbeiter zusätzlich eine persönliche Meinung oder Empfehlung über die ge-<br />

fundene Person von jemandem einholen, dem sie vertrauen. Die bis hierhin<br />

beschriebene Problematik gilt nicht speziell nur für die NASA, sondern könnte<br />

ein Szenario aus allen möglichen größeren Organisationen sein. Wenn man<br />

nach einem geeig<strong>net</strong>en Kandidat zur Bildung einer neuen Projektgruppe oder<br />

einer neuen Abteilung sucht, gibt es nur einen kleinen Alternativenraum. En-<br />

tweder man kennt bereits jemanden innerhalb der Organisation, der für diese<br />

Aufgabe geeig<strong>net</strong> ist, oder man fragt jemanden, ob ein solcher Kandiat bekannt<br />

ist. Um jedoch mehrwertige, globale Unternehmensentwicklung unter Berück-<br />

sichtung der individuellen Stärken und Schwächen der Mitarbeitern zu be-<br />

treiben, ist dieses Vorgehen gänzlich ungeeig<strong>net</strong>. Jeder, der vor der Aufgabe<br />

steht, eine Abteilung oder Projektgruppe optimal zu besetzen, muss sich<br />

65


zwangsläufig auf die soziale Reichweite seines persönlichen Netzwerkes ver-<br />

lassen.<br />

Diese Problematik soll das von der NASA entwickelte semantische System<br />

“POPS” zum Auffinden von bestimmtem Fachwissen innerhalb der Organisation<br />

lösen. Das Ziel von “POPS” ist es, alle Informationen über die Mitarbeiter in<br />

einem System zusammenzutragen und diese Fakten sinnvoll miteinander zu<br />

verknüpfen, um so eine umfassende Informationsquelle für die Mitarbeiter, die<br />

Personalabteilung, Analysten und das Management zur Verfügung zu stellen.<br />

“POPS” bietet dabei eine einfach zu verwendende, effektive Applikation zum<br />

Auffinden von Fachwissen und zum Analysieren der Belegschaft, die durch die<br />

Verwendung von existierenden Informationsquellen, die mittels RDF und ander-<br />

en semantischen Technologien integriert werden, zusätzlich sehr kostengünstig<br />

ist. “POPS” soll die erste semantische Anwendung für alle Mitarbeiter der NASA<br />

werden. Dies wird ausführlicher in den nachfolgenden Ausführungen bes-<br />

chrieben.<br />

Im ersten Schritt hat man die vielen verschiedenen Datenquellen in einer RDF-<br />

Datenbank vereinheitlicht und integriert. Kontaktinformationen über die Mit-<br />

arbeiter liegen auf einem separaten Server, Projektinformationen werden in<br />

einem Zeit- und Anwesenheitssystem gespeichert, die Kompetenzen der Mit-<br />

arbeiter liegen in einem abgesonderten System der Personalabteilung und die<br />

technischen Berichte wiederum liegen auf einem weiteren System. Durch die<br />

Integration dieser verschiedenen Datenressourcen konnte zum einen eine in-<br />

tegrierte Informations-Infrastruktur und zum anderen das “POPS”-System zum<br />

Auffinden von Fachwissen geschaffen werden. Die Aggregation der ver-<br />

schiedenen Datenquellen stellte nur den ersten Schritt dar, im zweiten Schritt<br />

musste den Nutzern ein Werkzeug an die Hand gegeben werden, mit dessen<br />

Hilfe sie auf diese Informationen einfach und schnell zugreifen konnten, ohne<br />

eine spezielle Anfragesprache zu lernen. Zu diesem Zweck entwickelte die in-<br />

volvierte Clark & Parsia LLC, ein Unternehmen spezialisiert auf semantische<br />

Technologien und künstliche Intelligenz, das System “jSpace”. “jSpace” ist ein<br />

grafisches Universalwerkzeug zum Abfragen und Durchstöbern von RDF-<br />

66


Datenbanken. Die folgende Abbildung zeigt “jSpace” beim Auffinden von spezi-<br />

ellem Fachwissen.<br />

Eine Schlüsselkomponente von “jSpace” ist die Möglichkeit, vom Benutzer<br />

Abbildung 12: Michael Grove (C&P LLC), Andrew Schain (NASA) (2008): POPS — NASA’s Ex-<br />

pertise Location Service Powered by Semantic Web Technologies. Herausgegeben von Clark &<br />

Parsia, LLC. Online verfügbar unter http://www.w3.org/2001/sw/sweo/public/UseCases/Nasa/,<br />

zuletzt geprüft am 05.05.2008.<br />

benötigte Zusatzmodule auf einfache Art und Weise anzugliedern, um so<br />

maßgeschneiderte Ansichten der Schnittstelle für spezielle Zwecke zu ermög-<br />

lichen. Neben der standardmäßigen Detailansicht, die in der Abbildung weiter<br />

oben zu sehen ist, hat das Entwicklerteam von “POPS” mehrere<br />

maßgeschneiderte Komponenten für “POPS” entwickelt. Eine der interessan-<br />

testen Komponenten ist ein so genannter “Social Network Visualizer”, der die<br />

bereits angesprochenen sozialen Netzwerke der Mitarbeiter anschaulich visu-<br />

alisiert. Der “Social Network Visualizer” veranschaulicht also die sozialen<br />

Netzwerke der Mitarbeiter, die in der selben Abteilung arbeiten, an den selben<br />

Projekten arbeiten oder auch Mitarbeiter mit ähnlichen Fähigkeiten und Kom-<br />

petenzen. Diese Komponente von “POPS” enthält zusätzlich eine “know-who”-<br />

Funktion, die dem nach einem geeig<strong>net</strong>em Mitarbeiter Suchenden direkt eine<br />

67


weitere Person ausgibt, die sowohl den Suchenden als auch die Zielperson<br />

kennt und vermittelnd helfen kann.<br />

Abbildung 13: The “Know-Who” function of the Social Network plug-in. Michael Grove (C&P<br />

LLC), Andrew Schain (NASA) (2008): POPS — NASA’s Expertise Location Service Powered by<br />

Semantic Web Technologies. Herausgegeben von Clark & Parsia, LLC. Online verfügbar unter<br />

http://www.w3.org/2001/sw/sweo/public/UseCases/Nasa/, zuletzt geprüft am 05.05.2008.<br />

Die oben aufgeführte Abbildung zeigt die “know-who”-Funktion des “Social Net-<br />

work”-Zusatzmoduls. Außerdem kann man die Informationen, die sich in<br />

“POPS” befinden, mit in Beziehung stehenden externen Informationen aus dem<br />

World Wide Web verbinden. Die nächste Abbildung zeigt das “POPS”-Interface<br />

wie es die Informationen über das “Hubble Space Telescope”-Projekt mit In-<br />

formationen aus Wikipedia verknüpft.<br />

68


Abbildung 14: The Web View, which integrates existing web content into the jSpace browser.<br />

Michael Grove (C&P LLC), Andrew Schain (NASA) (2008): POPS — NASA’s Expertise Loca-<br />

tion Service Powered by Semantic Web Technologies. Herausgegeben von Clark & Parsia,<br />

LLC. Online verfügbar unter http://www.w3.org/2001/sw/sweo/public/UseCases/Nasa/, zuletzt<br />

geprüft am 05.05.2008.<br />

Die NASA konnte durch die Aggregation und Verlinkung der unterschiedlichen<br />

bestehenden Informationsquellen eine einfach zu bedienende und einfach zu<br />

verstehende Schnittstelle schaffen, die heute nicht nur zum Auffinden von<br />

speziellem Fachwissen genutzt wird, sondern auch eine sehr nützliche organ-<br />

isationsweite, integrierte Informationsinfrastruktur darstellt. 58<br />

Wie auch schon im zuvor dargelegten Beispiel ergaben sich bei der NASA<br />

bereits wertvolle Vorteile durch das Vereinigen verschiedener, voneinander los-<br />

gelöster Datenquellen. Durch die Verwendung der semantischen Technologien<br />

konnte nicht nur ein System geschaffen werden, von dem die Mitarbeiter im<br />

Hier und Jetzt profitieren, sondern vielmehr wird die NASA von ihrer integrierten<br />

Informationsinfrastruktur in Zukunft in jedem Bereich profitieren können, denn<br />

bestehende Daten sind nach ihrer Bedeutung sinnvoll miteinander verknüpft<br />

58 Michael Grove (C&P LLC), Andrew Schain (NASA) (2008): POPS — NASA’s Expertise Location Service<br />

Powered by Semantic Web Technologies. Herausgegeben von Clark & Parsia, LLC. Online verfügbar<br />

unter http://www.w3.org/2001/sw/sweo/public/UseCases/Nasa/, zuletzt geprüft am 05.05.2008.<br />

69


und hinzukommende Daten gliedern sich sinnvoll ein. Gerade bei weltweit<br />

agierenden Organisationen mit ihrer geografischen Dezentralität können Inform-<br />

ationen, die sich automatisch sinnvoll verknüpfen, einen enormen Mehrwert<br />

bieten. Denn die Erkenntnisse eines autark arbeitenden Projektteams werden<br />

so automatisch mit den relevanten Themengebieten verknüpft. Andere Projekt-<br />

teams wiederum, die vielleicht gar nichts von der Arbeit des autark arbeitenden<br />

Projektteams wissen, profitieren demnach automatisch von den geschaffenen<br />

Erkenntnissen.<br />

2.5.3 Renault - Semantic Web in Automotive Repair and Diagnostic<br />

Ungleichartige Applikationen und Datenquellen in einer großen Organisation zu<br />

integrieren ist eine zeit- und kostenintensive Angelegenheit. Das Beispiel<br />

Renault veranschaulicht, wie mithilfe der semantischen Technologien diese<br />

Kosten sehr stark gesenkt werden können. Besonders die Technologien RDF<br />

und OWL sind offene und mittlerweile reife Standards, mit denen Informationen<br />

auf einfache Art und Weise zwischen verschiedenen Systemen ausgetauscht<br />

und integriert werden können. Renault, der französische Automobilhersteller,<br />

wählte diese Standards zur Entwicklung eines Prototyps zur Autoreparatur- und<br />

Diagnostikdokumentation, denn gerade in diesen Bereichen kommen viele un-<br />

gleichartige Systeme zur Anwendung.<br />

Im Jahre 2006 versuchte Renault ein Werkzeug zu entwickeln, das die Kosten<br />

der Diagnostik senken sollte. Schnell bemerkten sie, dass das Informationssys-<br />

tem, aus dem die relevanten Informationen entnommen werden sollten, für<br />

diese Zwecke nicht geeig<strong>net</strong> war. Die Systeme bei Renault waren darauf aus-<br />

gerichtet, das Management der Dokumente, die die Reparatur und Diagnostik<br />

beschreiben, so einfach wie möglich zu halten, nicht aber für den Austausch<br />

von Daten zwischen den Systemen. Außerdem waren die zur Verfügung<br />

stehenden Daten für die geplanten Zwecke nicht präzise genug. Dennoch war<br />

man davon überzeugt, dass ein System, das alle möglichen Reparatur- und<br />

Diagnostikverfahren enthält, einen großen Mehrwert für das hauseigene Infor-<br />

mationssystem darstellte. So verwarf man das ursprüngliche Konzept und be-<br />

nutzte OWL, um dieses System zu modellieren und die Relationen zu den an-<br />

70


deren Systemen abzubilden. RDF wurde zum Austausch von Informationen<br />

zwischen den Systemen verwendet. Diese neu geschaffene Architektur mittels<br />

RDF und OWL sollte es für die Anwender weitaus einfacher machen, Informa-<br />

tionen über Reparaturen zu finden, als das herkömmliche Durchstöbern der<br />

Webseiten des hauseigenen Intra<strong>net</strong>s. Zusätzlich sollte das System dem Mit-<br />

arbeiter, der eine Diagnostik zu erstellen hat, durchzuführende Überprüfungen<br />

automatisch empfehlen, woraufhin der Mitarbeiter die ermittelten Testwerte in<br />

das System einspeist. Das System musste also alle möglichen Verfahren zu<br />

Reparatur und Diagnostik enthalten, also auch bestimmte Symptome, Stand-<br />

ard-Fehler-Codes, bestimmte Fehler von Autoteilen, diagnostische Testver-<br />

fahren, Anleitungen zum Ausbau von bestimmten Teilen und unzählige Produkt-<br />

Spezifikationen. Renault entschied sich, diese Fülle an verschiedenen Ver-<br />

fahren mittels URIs eindeutig zu identifizieren. 59<br />

So konnte ein System geschaffen werden, dass bei Eingabe eines bestimmten<br />

Symptoms die mögliche Ursache sortiert nach Relevanz auswirft und den Ben-<br />

utzer auffordert, bestimmte Tests durchzuführen. Darüber hinaus verfügt<br />

Renault jetzt über ein integriertes Informationssystem, in dem alte und neue<br />

Daten sinnvoll nebeneinander existieren können. Die Reparatur- und<br />

Diagnostikexperten bei Renault führen die gleiche Arbeit aus wie früher, nur<br />

dass sie ihre Anleitungen und Handlungsempfehlungen zur Diagnostik in<br />

Zukunft nicht mehr in physikalischen Handbüchern niederschreiben, sondern in<br />

das integrierte Informationssystem einspeisen.<br />

59 François-Paul Servant (2007): Semantic Web Technologies in Automotive Repair and Diagnostic.<br />

Herausgegeben von Renault. Online verfügbar unter<br />

http://www.w3.org/2001/sw/sweo/public/UseCases/ Renault/, zuletzt geprüft am 05.05.2008.<br />

71


2.6 Anwendungsbeispiele aus dem Gesundheitswesen<br />

Dass die semantischen Technologien nicht nur im wirtschaftlichen Bereich von<br />

Bedeutung sind, zeigen die folgenden Beispiele. Auch das Gesundheitswesen<br />

und somit die Allgemeinheit kann von den semantischen Technologien profitier-<br />

en, wie die folgenden Ausführungen über das SAPPHIRE-System und die Ver-<br />

wendung von semantischen Technologien am “Children`s Hospital Mediacal<br />

Center” im amerikanischen Cincinnati veranschaulichen.<br />

2.6.1 SAPPHIRE<br />

In Anlehnung an den Artikel “The Web in Action” von den Autoren Lee Feigen-<br />

baum, Ivan Herman, Tonya Hongsermeier, Eric Neumann und Susie Stephens<br />

aus der wissenschaftlichen Zeitschrift „Scientific American“ vom Dezember letz-<br />

ten Jahres beschreibt der folgende Abschnitt die Initiative „SAPPHIRE“.<br />

SAPPHIRE steht für „situational awareness and preparedness for public health<br />

incidences using reasoning engines“ und existiert seit 2004 an der Universität<br />

Texas mit dem Ziel, aufkommende öffentliche Gesundheitsprobleme besser<br />

ausfindig zu machen, zu analysieren und darauf zu reagieren. Das System inte-<br />

griert dabei eine Fülle von Daten aus unterschiedlichsten Quellen wie etwa Da-<br />

ten von Krankenversicherungen, Krankenhäusern, Umweltschutzagenturen und<br />

wissenschaftlicher Literatur. Gesundheitsbeamte können durch verschiedene<br />

Linsen bzw. Filter die Informationen des Systems abrufen. So können sie die<br />

Verbreitung des Influenza-Virus verfolgen oder die Behandlungsmethoden von<br />

HIV-Fällen abrufen. Dabei erhält SAPPHIRE alle 10 Minuten Berichte aus den<br />

Notaufnahmen, Selbsteinschätzungen und Beschreibungen der Patienten zu ih-<br />

ren Symptomen, aktuelle elektronische Gesundheitsberichte und medizinische<br />

Mitteilungen von acht umliegenden Krankenhäusern aus der Umgebung von<br />

Houston. Unter Einsatz der semantischen Technologien werden all diese Infor-<br />

mationen zu einer einfachen Ansicht der aktuellen gesundheitlichen Lage des<br />

Gebietes aggregiert. Eine Schlüsselfunktion des Systems ist eine Ontologie, die<br />

die unerklärlichen Krankheitsbilder mit grippeähnlichen Symptomen aus der Re-<br />

gion als mögliche Influenza-Fälle klassifiziert und automatisch an das örtliche<br />

Gesundheitsamt weiterleitet. Durch diese automatisch generierten Berichte<br />

72


konnten bisher neun Krankenschwestern von der manuellen Anfertigung der<br />

Berichte befreit werden und stehen wieder zur aktiven Krankenpflege zur Verfü-<br />

gung. Außerdem werden die Berichte durch das SAPPHIRE-System zwei bis<br />

drei Tage schneller fertig als durch die manuelle Bearbeitung durch die Kran-<br />

kenschwestern. Das „Center for Disease Control and Preventation“ in den USA,<br />

vergleichbar mit dem deutschen Bundesministerium für Gesundheit, hilft nun<br />

den lokalen Gesundheitsämtern landesweit dabei, solche Systeme zu imple-<br />

mentieren. Dabei erlaubt die Flexibilität der semantischen Technologien dem<br />

System SAPPHIRE auch, in einem anderen Kontext zu funktionieren. Als die<br />

evakuierten Opfer des Hurrikan Katrina in Houston Schutz suchten, waren die<br />

Beamten des örtlichen Gesundheitsamtes beunruhigt über eine eventuell auf-<br />

kommende, schnelle Verbreitung von unerwünschten Krankheiten. Nach nur<br />

acht Stunden hatten die Forscher der Universität von Texas das SAPPHIRE<br />

System umkonfiguriert und die Beamten der Gesundheitsämter mit Taschen-<br />

computern ausgestattet, die einen speziellen Gesundheitsfragebogen enthiel-<br />

ten. Die Antworten der evakuierten Opfer wurden zunächst in das System hoch-<br />

geladen, wo sie dann zusätzlich mit den Daten der umliegenden Notaufnahmen<br />

sowie der Überwachungsberichte der örtlichen Epidemiebehörde angereichert<br />

wurden. Die Aktion war ein Erfolg, denn dadurch konnten Krankheitsausbrüche,<br />

die Magen und Darm, die Atmung und Bindehaut betreffen, viel schneller als<br />

üblich identifiziert werden. Die Flexibilität von SAPPHIRE in diesem konkreten<br />

Fall lehrt eine wichtige Lektion die semantischen Technologien betreffend: Ist<br />

das System erstmal für ein allgemeines Problem entwickelt worden, wie in die-<br />

sem Fall, um über den gesundheitlichen Zustand der allgemeinen Bevölkerung<br />

zu informieren, kann ein solches System zügig auf alle möglichen Spezialfälle<br />

im gleichen Gebiet adaptiert werden. Selbstredend ist es Ziel des “Center for<br />

Disease Control and Preventation“ in den USA, dieses System nun national zu<br />

implementieren. Der Erfolg von SAPPHIRE liegt darin begründet, dass es Infor-<br />

mationen aus den verschiedensten Quellen vereinheitlichen kann, um dann die-<br />

se aggregierten Informationen für die unterschiedlichsten Zwecke zu verwen-<br />

den.<br />

73


2.6.2 Arzneimittelforschung<br />

Die traditionelle Arzneimitteldosierung berücksichtigt nicht die individuellen<br />

Gene oder bestimmte emotionale und physikalische Umgebungen der jeweili-<br />

gen Patienten. Je nach Ausprägung dieser Umstände reagieren Patienten un-<br />

terschiedlich auf ein und das gleiche Medikament. Dieser Zustand wurde von<br />

der Wissenschaft und den Menschen bisher in Ermangelung einer Lösung hin-<br />

genommen. Das soll sich nun ändern, indem die heutigen Erkenntnisse der Bio-<br />

logie und das Wissen über Arzneimittel mit Werkzeugen kombiniert werden, die<br />

voraussagen können, welches Arzneimittel in welcher Dosis für ein bestimmtes<br />

Individuum wirkt. Solche Voraussagen würden maßgeschneiderte, personalis-<br />

ierte, medizinische Behandlungen ermöglichen und langfristig unerwünschte<br />

Nebenwirkungen vollständig eliminieren. Um diese Herausforderung zu<br />

meistern, müssten verschiedene, zurzeit noch voneinander losgelöste Daten-<br />

banken und -sammlungen miteinandern kombiniert und semantisch verbunden<br />

werden: alle Arten von historischen und aktuellen medizinischen Patien-<br />

tenakten, alle erdenkliche wissenschaftliche Berichte über Arzneimittel, Tests<br />

von Arzneimitteln und ihre möglichen Nebenwirkungen und Auswirkungen für<br />

verschiedene Patienten. Traditionelle Datenbanken können diese Funktion auf-<br />

grund ihrer Komplexität bisher nicht abdecken und eine manuelle Verbindung<br />

der Datenbanken zu diesen Zwecken wäre sowohl zu zeit- als auch zu kosten-<br />

intensiv. Allein die Daten in den Datenbanken konsistent und frei von Re-<br />

dundanz zu halten, wäre ein fast unmögliches Unterfangen. Jedes Mal, wenn<br />

neue wissenschaftliche Erkenntnisse in einer bestimmte Datenbank erneuert<br />

werden würden, müssten die, die dahin verlinkt haben, ihren Link erneuern –<br />

wenn sie, wie weiter oben beschrieben, es überhaupt mitbekommen.<br />

Eine Gruppe von Forschern vom “Children`s Hospital Mediacal Center” im<br />

amerikanischen Cincinnati versucht, aufbauend auf den Möglichkeiten des se-<br />

mantischen Webs, die verborgenen ge<strong>net</strong>ischen Gründe für Herz-Kreislauf-<br />

Erkrankungen aufzudecken. Hierzu würde die traditionelle Forschung nach<br />

Genen suchen, die sich unterschiedlich in gesundem und erkranktem Gewebe<br />

verhalten, und daraus schließen, dass diese Gene in irgendeinem Zusammen-<br />

hang mit der kardiovaskulären Erkrankung stehen. Dieses Vorgehen würde zu<br />

unzähligen in Frage kommenden Genen führen, wobei die Forscher für jedes<br />

74


Gen wiederum viele verschiedene Datenbanken durchsuchen müssten, um<br />

herauszufinden, welches Gen genau diesen negativen Effekt hätte am ehesten<br />

verursacht haben können. Eine sehr zeitintensive Aufgabe, die sich die<br />

Forscher oftmals nicht erlauben dürfen. Das Team aus Cincinnati, welches von<br />

einem semantischen Berater unterstützt wurde, begann damit, die vielen ver-<br />

schiedenen relevanten Datenbanken mit ihren unterschiedlichen Formaten auf<br />

ihren Computer herunterzuladen. Dazu zählten beispielsweise Gen-Ontologien,<br />

MeSH, eine Datenbank, die auf Erkrankungen und ihre Symptome fokussiert<br />

ist, Entrez Gene, eine Datenbank mit Informationen bezogen auf Gene sowie<br />

OMIM, eine Datenbank, die die Beschreibung menschlicher Gene und ihrer<br />

Störungen enthält. Im zweiten Schritt übersetzten die Forscher die unterschied-<br />

lichen Formate der verschiedenen Datenbanken in das einheitliche Resource<br />

Description Frameworl (RDF) und speicherten diese Informationen in einer se-<br />

mantischen Datenbank.<br />

Anschließend nutzen sie den kostenlos verfügbaren (open source) Ontologie-<br />

Editor Protégé 60 , entwickelt von Forschern an der Stanford Universität, um das<br />

Wissen aus den diversen Quellen in eine Ontologie zu integrieren. Mittels eines<br />

Ranglisten-Algorithmuses, vergleichbar mit dem Algorithmus, der hinter dem<br />

Google Pagerank steckt, priorisierten die Forscher die Menge an Genen, die mit<br />

Herzerkrankungen in Verbindung stehen könnten. So fanden sie potentielle<br />

Kandidaten, die eine verursachende Rolle bei der Schwächung der Pumpfunk-<br />

tion des Herzens haben, und ließen als Nächstes diese Ergebnisse von der<br />

Software evaluieren. Durch diese Überprüfung konnten sie vier Gene isolieren,<br />

die eine starke Verbindung zu einer chromosomalen Region haben, die für die<br />

Schwächung der Pumpfunktion des Herzens verantwortlich sein könnte. Ge-<br />

genwärtig ermitteln die Forscher aus Cincinnati die Effekte dieser vier Gen-<br />

Mutationen als mögliches Ziel für neue therapeutische Behandlungen. Zudem<br />

weiten die Forscher ihr System auf andere Herzerkrankungen aus und erhoffen<br />

sich eine ähnlich dramatische Verbesserung der Effizienz. Selbstredend könnte<br />

dieses System auf weitere Krankheitsbilder ausgeweitet werden.<br />

60 Mark Musen, M.D., Ph.D.: Protégé Software. Herausgegeben von Stanford University School of Medicine.<br />

Stanford Center for Biomedical Informatics Research. Online verfügbar unter http://protege.stanford.edu/,<br />

zuletzt geprüft am 02.05.2008.<br />

75


Dies ist nur ein gutes Beispiel, das zeigt, wie und wo die semantische Techno-<br />

logie von wahrem Nutzen ist. In ähnlicher Weise machen sich die Forscher der<br />

Pharma-Kooperation Eli Lilly 61 die semantischen Technologien zu Nutzen. Sie<br />

verwenden die semantischen Technologien, um ein vollständiges Bild der wahr-<br />

scheinlichsten Arzneimittelziele im Körper für ein gegebenes Krankheitsbild zu<br />

erarbeiten. Semantische Werkzeuge erlauben ihnen dabei die unterschiedlich-<br />

sten, inkompatiblen, biologischen Beschreibungen in einer einheitlichen Datei<br />

zusammenzustellen und auf diese Weise den Durchbruch auf der Suche nach<br />

dem nächsten innovativen Arzneimittel schneller zu erreichen. Pfizer, ein welt-<br />

weit agierender Pharmakonzern, nutzt die semantischen Technologien, um un-<br />

terschiedliche Datensätze von Protein-Protein-Interaktionen miteinandern zu<br />

verzahnen und so die unklaren Korrelationen aufzudecken, die helfen könnten,<br />

vielversprechende Medikationen zu identifizieren. Die Forscher bei Pfizer sind<br />

davon überzeugt, dass diese Technologien die Chance auf unerwartete Ent-<br />

deckungen erhöhen, die Zeit zur Markteinführung von neuen Medikamenten<br />

enorm beschleunigen und die gesamte Gesundheitsindustrie dem Thema per-<br />

sonalisierte Medikation ein Stück weit näher bringen. In all diesen Fällen wird<br />

die Arzneimittelforschung durch die semantischen Technologien bestärkt, in-<br />

dem Daten aus den unterschiedlichsten Quellen und mit verschiedensten Voka-<br />

bularen zusammengeführt werden konnten. 62<br />

2.7 Anwendungsbeispiele für den privaten Bereich<br />

Der Erfolg und die Verbreitung der semantischen Technologien hängt in hohem<br />

Maße vom für Endnutzer generiertem Nutzen ab. Die folgenden Ausführungen<br />

beschreiben zwei Projekte, die sich an Endnutzer richten.<br />

2.7.1 FOAF – Friend of a Friend<br />

FOAF steht für “Friend of a Friend” und ist ein Projekt, das die semantischen<br />

Technologien nutzt, um Menschen und ihre Beziehungen untereinander, ihre In-<br />

teressen und Aktivitäten, in maschinen-verständlicher Form darzustellen. Es<br />

61 Eli Lilly and Company. Online verfügbar unter http://www.lilly.com, zuletzt geprüft am 02.05.2008.<br />

62 Lee Feigenbaum, Ivan Herman, Tonya Hongsermeier, Eric Neumann und Susie Stephens (2007): The<br />

Semantic Web in Action. Corporate Applications are well under way, and consumer uses are emerging.<br />

In: Scientific American, H. 6, S. 64–71.<br />

76


könnte demnach als eine Art dezentrales soziales Netzwerk (social <strong>net</strong>work)<br />

beschrieben werden. Gegründet wurde FOAF von Dan Brickley and Libby Miller<br />

als offene, von einer freiwilligen Gemeinschaft vorangetriebene, Initiative. Aus<br />

technologischer Sicht ist FOAF ein auf RDFS basierendes Vokabular, das die<br />

Klassen und Eigenschaften der Menschen und ihrer Beziehungen unterein-<br />

ander allgemeingültig und eindeutig definiert. Die persönlichen Informationen<br />

werden in einem RDF-Dokument gespeichert, auf einem Webserver abgelegt<br />

und sind auf diese Weise im World Wide Web verfügbar. Neben persönlichen<br />

Informationen wie Titel, Name, E-Mail Adresse und Website kann diese RDF-<br />

Datei alle erdenklichen Beschreibungen enthalten wie zum Beispiel eine Be-<br />

schreibung der Arbeitsstelle, der Schule und Universität und der Leute, die man<br />

kennt. Durch die semantische Beschreibung dieser Daten werden Maschinen<br />

sie interpretieren und miteinander kombinieren können. 63 Die Problematik, dass<br />

RDF und Ontologien nicht ohne weiteres von Laien verstanden und angewen-<br />

det werden können, konnte mittlerweile durch eine Art Editor (eine auf Java-<br />

script basierende Anwendung) zum Erstellen der RDF-Datei umgangen werden.<br />

Die folgende Abbildung zeigt den von Leigh Dodds entwickelten Editor zum Er-<br />

stellen der FOAF-RDF-Datei FOAF-a-Matic, mit dem auch Laien eine solche<br />

Datei erstellen können.<br />

63 Dan Brickley, Libby Miller (2008): foaf project. Online verfügbar unter http://www.foaf-project.org, zuletzt<br />

geprüft am 10.05.2008.<br />

77


Abbildung 15: FOAF-a-Matic. Leigh Dodds: Editor zum Erstellen einer RDF-FOAF-Datei.<br />

Herausgegeben von Leigh Dodds. Online verfügbar unter<br />

http://www.ldodds.com/foaf/foaf-a-matic, zuletzt geprüft am 10.05.2008.<br />

Aus diesen Eingaben generiert der Editor dann das RDF-Dokument, wie die fol-<br />

gende Abbildung zeigt.<br />

78


ildung 16: Generiertes RDF-Dokument; Leigh Dodds: FOAF-a-Matic. Editor zum Erstel-<br />

len einer RDF-FOAF-Datei. Herausgegeben von Leigh Dodds. Online verfügbar unter<br />

http://www.ldodds.com/foaf/foaf-a-matic, zuletzt geprüft am 10.05.2008.<br />

Semantische Web Crawler, Programme, die das WWW nach Informationen<br />

durchsuchen und die Metadaten aufnehmen, können dann den Verlinkungen zu<br />

den FOAF-Dateien der Freunde folgen und dadurch die sozialen Netzwerke ab-<br />

bilden. Auch hier steigt der Wert, den FOAF bietet, mit jedem weiteren Teil-<br />

nehmer – das Netzwerk profitiert also auch vom Netzwerkeffekt. Je mehr<br />

Menschen sich und ihre Beziehungen zu anderen Menschen beschreiben,<br />

desto mehr Wert entsteht insgesamt und komplexe Anfragen werden möglich.<br />

Sind in der RDF-Datei zum Beispiel die Freunde und in deren RDF-Dateien der-<br />

en Interessen definiert, könnten komplexe Anfrage wie: “Zeige mir alle Freunde<br />

von Holger Sistig, die sich für Basketball und Reisen interessieren.”, ausgeführt<br />

werden. Die Anwendungsmöglichkeiten könnten in Zukunft noch weit über<br />

diese Zwecke hinausgehen, und überall dort eine wichtige Rolle spielen, wo<br />

A<br />

79


personenbezogene Daten relevant sind, konstatiert Leigh Dodds. 64 Mit der Zeit<br />

wird die Integration von Informationen in die eigene FOAF-Datei einfacher wer-<br />

den. Es könnten dann zum Beispiel die Kontakte aus dem E-Mail Programm,<br />

vom Handy und vor allem auch aus den diversen zentralen sozialen Net-<br />

zwerken (Xing, Facebook, LinkedIn, StudiVZ, Friendster, Orkut etc.) in die ei-<br />

gene FOAF-Datei semantisch überführt werden. Somit wäre es möglich, sein<br />

gesamtes persönliches Netzwerk in einer zentralen FOAF-Datei abzubilden und<br />

dadurch bei der Anmeldung in einem neuen Netzwerk das bestehende Net-<br />

zwerk in einem Zug zu importieren. Ob das im Sinne der zentralen sozialen<br />

Netzwerke ist und diese die semantischen Technologien adaptieren, ist stark zu<br />

bezweifeln. Denn die einzelnen Netzwerke der Nutzer und deren Aktivitäten un-<br />

tereinander (social graph) sind das Kapital der sozialen Netzwerke. Die aktuelle<br />

Aufgabe der FOAF-Community ist es demnach Werkzeuge zum Benutzen und<br />

Finden der FOAF-Angaben zu entwickeln.<br />

2.7.2 Noserub.de – ein dezentrales soziales Netzwerk<br />

Mit Hilfe von sozialen Netzwerken bleibt man mit Freunden und Bekannten auf<br />

der ganzen Welt in Kontakt und kann neue Freunde aufgrund gleicher In-<br />

teressen finden. Die meisten Netzwerke bedienen allerdings nur einen bestim-<br />

mten Zweck, eine bestimmte Nische, wie etwa das Hochladen und Diskutieren<br />

über Fotos (flickr.com). Das Aufkommen von immer mehr spezialisierten<br />

sozialen Netzwerken bringt den Nachteil mit sich, dass der Aufwand, diese zen-<br />

tralen Netzwerke einzelnen zu pflegen, steitg steigt. Teilweise interessiert die<br />

spezielle Thematik des Netzwerkes nicht einmal, sondern man möchte einfach<br />

mit bestimmten Freunden in Kontakt bleiben und über deren Aktivitäten in-<br />

formiert sein.<br />

Noserub ermöglicht es, die Vielzahl der verschiedenen zentralen sozialen Net-<br />

zwerke in ein dezentrales Noserub-Netzwerk zu aggregieren. Die Kontrolle über<br />

die eigenen Daten wird dadurch gewährleistet, dass Noserub auch auf einem<br />

eigenen Server installiert werden kann. Aus technologischer Sicht ist Noserub<br />

ein Protokoll, also eine Einigung zwischen zwei Parteien, wie die Kommunika-<br />

64 Leigh Dodds: FOAF-a-Matic. Editor zum Erstellen einer RDF-FOAF-Datei.<br />

Herausgegeben von Leigh Dodds. Online verfügbar unter http://www.ldodds.com/foaf/foaf-amatic,<br />

zuletzt geprüft am 10.05.2008.<br />

80


tion, die Verbindung und die Übertragung von Daten ablaufen soll. Noserub<br />

baut auf verfügbare Standards wie etwa FOAF, OpenID und RSS auf. OpenID<br />

löst das Problem der vielen verschiedenen Benutzeraccounts eines Nutzers im<br />

Inter<strong>net</strong>, in dem es eine eindeutige digitale Identität zur Verfügung stellt, mit der<br />

man sich (bei teilnehmenden) Webseiten einzig mit der Angabe der OpenID an-<br />

melden kann – das lästige Zuteilen und auch Behalten von Benutzernamen und<br />

Passwörtern entfällt so gänzlich. 65 RSS steht für “really simple syndication” und<br />

ist eine Methode zum Senden und Empfangen von Neuigkeiten und Informa-<br />

tionen. Ein RSS-Feed kann abonniert werden, und man bekommt die letzen<br />

Neuigkeiten automatisch zugestellt. 66 Die folgende Abbildung zeigt die<br />

Netzwerk-Ansicht von Noserub:<br />

geprüft am 10.05.2008.<br />

Die Abbildung zeigt die letzen Aktivitäten der eigenen Kontakte. In der hori-<br />

zontalen Menüleiste können die Aktivitäten der Kontakte nach verschiedenen<br />

Medienformen eingegrenzt werden, so dass etwa lediglich die zuletzt ge-<br />

65 The OpenID Foundation (OIDF) (2008). Unter Mitarbeit von Community Board Members & Corporate<br />

Board Members. Online verfügbar unter http://openid.<strong>net</strong>, zuletzt geprüft am 10.05.2008.<br />

66 Web Accessibility Initiative (WAI) (2008): About RSS. Herausgegeben von W3C-Konsortium. Online<br />

verfügbar unter http://www.w3.org/WAI/highlights/about-rss.html, zuletzt geprüft am 10.05.2008.<br />

81<br />

Abbildung 17: Netzwerk-<br />

Ansicht; Dirk Olbertz (2008): noserub.de. Online verfügbar unter http://noserub.de, zuletzt


posteten Fotos (Videos, Audio, Links, Text) der eigenen Kontakte angezeigt<br />

werden.<br />

Eine Hürde muss Noserub noch nehmen. Es muss Laien eine Möglichkeit bie-<br />

ten, ein Noserub-Netzwerk aufzusetzen. Bis dato sind Programmierkenntnisse<br />

erforderlich, um an dem dezentralen sozialen Netzwerk teilzunehmen. Ist diese<br />

Hürde genommen, steht dem Wachstum und dem damit verbundenem Nutzen<br />

der Teilnehmer nichts mehr im Wege.<br />

3 Fazit und Ausblick<br />

Bereits die ursprüngliche Vision des Inter<strong>net</strong>s von Tim Berners-Lee aus dem<br />

Jahre 1989 enthielt Ansätze des heute klar definierten Konzepts des se-<br />

mantischen Webs. Die beschränkten technologischen Möglichkeiten, Umset-<br />

zungsversuche mit der Wissenschaft der künstlichen Intelligenz und das ein-<br />

fache Veröffentlichen von Inhalten auch durch Laien, hat das Inter<strong>net</strong> in Bezug<br />

auf die semantische Vision erstmal dahin geführt, wo es heute steht. Im Jahre<br />

2000 hat Tim Berners-Lee einen zweiten Anlauf genommen und der Öffentlich-<br />

keit sein Architektur-Konzept vom semantischen Web veröffentlicht – das Kind<br />

hatte nun einen Namen. Seit der Veröffentlichung der Architektur hat das<br />

Thema semantisches Web immer mehr Aufmerksamkeit gefunden. Die Ent-<br />

wicklergemeinschaft und die Forschung haben das Schichtenmodell ständig<br />

weiterentwickelt, Verbesserungen an den Technologien vorgenommen und offi-<br />

zielle Standards verabschiedet. Die Unternehmen hingegen haben sich zurück-<br />

gehalten, was die Verwendung der Standards und die Entwicklung von se-<br />

mantischen Produkten angeht. Dieser Zustand ist vor allem auf das Fehlen<br />

eines klaren und verständlichen Nutzens sowie die fehlende Aussicht auf kurz-<br />

fristigen unternehmerischen Gewinn zurückzuführen. Hier ist zum heutigen Zeit-<br />

punkt eine Wendung zu erkennen. Immer mehr Unternehmen implementieren<br />

die semantischen Standards in ihre Produkte und Webservices oder loten zu-<br />

mindest die konkreten Möglichkeiten für ihr jeweiliges Geschäftsmodell aus. Ein<br />

weiterer Indikator für diesen Wandel ist das vermehrte Aufkommen von Un-<br />

ternehmen, die andere Unternehmen zum Thema semantisches Web beraten.<br />

82


Dieses Thema gewinnt langsam aber sicher immer mehr an öffentlichem Be-<br />

wusstsein und die Weiterentwicklung gewinnt infolgedessen zunehmend an Dy-<br />

namik. Doch warum verlief die Entwicklung bis dato so langsam? Das damalige<br />

World Wide Web stellte – zumindest für die allgemeine Öffentlichkeit – eine ab-<br />

solute Innovation dar. Es gab zum damaligen Zeitpunkt nichts Vergleichbares<br />

und die Vision eines weltweiten Daten<strong>net</strong>zes übte eine ungemeine<br />

Anziehungskraft aus. Genau das ist heute anders. Das semantische Web ist<br />

eine Erweiterung des bestehenden World Wide Webs und auch das Konzept<br />

dahinter ist nicht ohne Weiteres zu verstehen. Auch sind die Technologien für<br />

Laien und teilweise auch Experten nicht einfach zu erlernen, vor allem aber<br />

auch nicht einfach anzuwenden. HTML jedoch war auch von Laien einfach an-<br />

zuwenden war. Dennoch veranschaulichen die Praxisbeispiele deutlich, dass<br />

die bis heute erforschten und offiziellen Technologien des Schichtenmodell<br />

bereits enormen Nutzen stiften. Wahrscheinlich werden die ersten se-<br />

mantischen Anwendungen, die auch automatisch schlussfolgern können, in den<br />

Intra<strong>net</strong>s der Unternehmen entstehen. Sind erstmal die obersten Ebenen des<br />

Schichtenmodells vollständig erforscht und offizielle Standards für automat-<br />

isches Schlussfolgern und die Sicherheit in der selbständigen Kommunikation<br />

der Agents verabschiedet, ergeben sich weitere Chancen und Möglichkeiten,<br />

die heute in ihrer Vielfalt und ihrer Auswirkung noch nicht absehbar sind.<br />

Sicherlich sieht sich die Entwicklergemeinschaft des semantischen Webs auch<br />

mit einigen Herausforderungen konfrontiert. Die Auseinandersetzung mit den<br />

Technologien des semantischen Webs geht weiter – die Web Ontology Lan-<br />

guage wird für zu komplex gehalten und der Fokus richtet sich auf die Weiter-<br />

entwicklung von OWL Lite. Auch wird derzeit diskutiert, ob die Kombination von<br />

Logik und Ableitungsregeln nicht doch viel zu komplex ist und alternativ RDFS<br />

mit Ableitungsregeln für diese Zwecke kombiniert werden könnte. 67<br />

Sicherheit und Datenschutz wird weitaus mehr an Wichtigkeit gewinnen, als<br />

diese Themen ohnehin im heutigen World Wide Web schon haben. Die Aktiv-<br />

itäten eines Nutzers können aus vielen verschiedenen Quellen zu einem ein-<br />

67 Frank Hermelen, Grigoris Antoniou (2004): A Semantic Web Primer. Herausgegeben von The MIT<br />

Press, S. 224.<br />

83


heitlichen Profil zusammengeführt werden, die so wiederum von anderen<br />

Nutzer abgefragt werden können. Aber auch die Sicherheit in der automat-<br />

ischen Kommunikation der Agents ist noch nicht schlussendlich geklärt.<br />

Eine weitere Herausforderung liegt in der Entwicklung und Verbreitung von<br />

Standard-Ontologien. Auch wenn es schon einige Standard-Ontologien bei-<br />

spielsweise aus der Medizin oder Ahnenforschung gibt, fehlt bis heute das Wis-<br />

sen in Unternehmen zur Entwicklung von speziellen Ontologien und der Adap-<br />

tion an Standard-Ontologien. Ebenso ist noch unklar, wie sich Endnutzer in<br />

großen Ontologien zurechtfinden können.<br />

Darüber hinaus ist fraglich, ob sich die Unternehmen der absoluten Vergleich-<br />

barkeit überhaupt stellen wollen. Verfügt ein Online-Shop nicht über die beste<br />

Qualität und nicht den günstigsten Preis, wird er aus den Ergebnislisten der<br />

Personal Agents aussortiert – und der Unternehmer überlegt sich zweimal, ob<br />

er seine Produkte weiterhin bzw. überhaupt semantisch codiert.<br />

Eine zusätzliche Herausforderung liegt in der Entwicklung von einfach zu hand-<br />

habenden Werkzeugen für die Endnutzer. Diesen muss in Zukunft eine Mög-<br />

lichkeit geboten werden, ohne die Kenntnisse von Informatik Inhalte im se-<br />

mantischen Web zu produzieren. Mit der Fortentwicklung des semantischen<br />

Webs werden Probleme auftauchen, die heute noch nicht abzusehen sind. Je<br />

größer jedoch das Verständnis für die Möglichkeiten des semantischen Webs<br />

bei allen Involvierten wird, desto eher können diese Probleme gelöst werden<br />

und sich das semantische Web bis zu seiner Vollendung entwickeln.<br />

Die Auswirkungen, die durch das semantische Web entstehen, werden alle<br />

Bereiche unserer Gesellschaft betreffen. Informationsmanagement, Wissens-<br />

management, Prozessintegration sind nur einige Teilgebiete, die von den Mög-<br />

lichkeiten des semantischen Webs profitieren werden. Gerade auch im Bereich<br />

der Wirtschaft und insbesondere der Medienwirtschaft wird das semantische<br />

Web Veränderungen in den Bereichen Contentproduktion, Vermarktung von<br />

Content und in der Zusammenstellung von Content bewirken. Das relativ junge<br />

84


Konzept der “Microformats”, mit dem es möglich ist, kleinste Teile von<br />

produziertem Content (Video, Text, Bild, Audio) automatisch abzurufen, zuzus-<br />

tellen und zu kombinieren, könnte den Wert von produzierten Inhalten steigern<br />

und die Wertschöpfungskette ein ganzes Stück weit verlängern. 68 Ebenso ist es<br />

vorstellbar, dass die Buchung von Werbeflächen im Inter<strong>net</strong> in Zukunft automat-<br />

isch über Agents ablaufen könnte. Die Publisher deklarieren ihr Werbeinventar<br />

semantisch nach Context, Zielgruppenstrukturen, PageImpression bzw.<br />

Aufenthaltsdauer und die Advertising Agents der Werbetreibenden können<br />

diese Informationen auslesen und weltweite, fragmentierte Werbeflächen<br />

buchen. Auch nicht ausgeschlossen ist ein weltweites, ständig in Kommunika-<br />

tion stehendes Netz von unternehmerischen und privaten Agents. Die un-<br />

ternehmerischen Agents kategorisieren ihre Angebote und die Personal Agents<br />

können so konfiguriert werden, dass sie nur bestimmte Kategorien abrufen und<br />

auf Aktuelles prüfen. So wird aus Push-Marketing Pull-Marketing. Ein weiterer<br />

Gedanke betrifft das Urheberrecht und die Verwertung von Content – wenn alle<br />

Ressourcen im semantischen Web eindeutig identifizierbar, auffindbar und ab-<br />

rufbar sind, und die “Proof”- und “Trust”-Schicht den Urheber immer eindeutig<br />

identifiziernen kann, dann ist es auch möglich, die Kontrolle über einmal<br />

produzierten Content (Spielfilm, Dokumentation, Musik, Bücher, Fotos etc.) zu<br />

behalten und diesen langfristig zu verwerten. Vielleicht werden Schüler in<br />

Zukunft nicht mehr die DIN-Norm zur Erstellung eines Standard-Briefes<br />

erlernen, sondern wie man Daten semantisch aufbereitet und mit den rele-<br />

vanten Ontologien verknüpft. Tim Berners-Lee konstatiert, dass das se-<br />

mantische Web sogar die Evolution des Wissens dieser Welt unterstützen kön-<br />

nte. 69<br />

“Das Aufregendste am semantischen Web ist nicht das, was wir uns alles<br />

damit vorstellen können, sondern das, was wir uns jetzt noch gar nicht<br />

vorstellen können." 70<br />

68<br />

Diverse Entwickler (2008): Microfomats. Online verfügbar unter http://microformats.org/, zuletzt geprüft<br />

am 12.05.2008.<br />

69<br />

Tim Berners-Lee, James Hendler Ora Lassila (2001): The Semantic Web: a new form of Web content<br />

that is meaningful to computers will unleash a revolution of new possibilities. In: Scientific American, H.<br />

284 (5), S. 34–43.<br />

70<br />

Peter Zschunke (2003): Aufräumen im Datenchaos. Herausgegeben von SPIEGEL ONLINE. Online<br />

verfügbar unter http://www.spiegel.de/<strong>net</strong>zwelt/tech/0,1518,253290,00.html, zuletzt geprüft am<br />

12.05.2008.<br />

85


Darstellungsverzeichnis<br />

Abbildung 1: A Proposal byTim Berners-Lee.......................................................3<br />

Abbildung 2: Use of the Semantic Web in your enterprise.................................11<br />

Abbildung 3: Current Web vs. Semantic Web....................................................26<br />

Abbildung 4: Chain of trust.................................................................................28<br />

Abbildung 5: Combining new information with old..............................................29<br />

Abbildung 6: The Semantic Web Stack (Semantic Layer Cake)........................31<br />

Abbildung 7: RDFpic 2.1.....................................................................................37<br />

Abbildung 8: RDF geniert durch RDFpic............................................................38<br />

Abbildung 9: The RDF triple...............................................................................39<br />

Abbildung 10: A graph of two RDF statements..................................................41<br />

Abbildung 11: Latest Layercake.........................................................................55<br />

Abbildung 12: POPS — NASA’s Expertise Location Service.............................67<br />

Abbildung 13: The “Know-Who” function of the Social Network plug-in............68<br />

Abbildung 14: The Web View of POPS..............................................................69<br />

Abbildung 15: FOAF-a-Matic..............................................................................77<br />

Abbildung 16: Generiertes RDF-Dokument........................................................78<br />

Abbildung 17: Noserub.de Netzwerk-Ansicht.....................................................80<br />

87


Abkürzungsverzeichnis<br />

B2B Business-to-Business Electronic Commerce<br />

B2C Business-to-Consumer Electronic Commerce<br />

CERN Conseil Européen pour la Recherche Nucléaire<br />

DC Dublin Core<br />

DSS Decision support system<br />

EDI Electronic Data Interchange<br />

EDV Elektronische Datenverarbeitung<br />

FOAF Friend of a Friend<br />

FTP File Transfer Protocol<br />

HTML Hypertext Markup Language<br />

HTTP Hypertext Transfer Protocol<br />

IRI Internationalized Resource Identifier<br />

OWL Ontology Web Language<br />

R&D Research & Development<br />

RDF Resource Description Framework<br />

RDFS Resource Description Framework Schema<br />

RIF Rule Interchange Format<br />

SGML Standard Generalized Markup Language<br />

SOA Serviceorientierte Architekturen<br />

UN/EDIFACT United Nations Electronic Data Interchange For<br />

Administration, Commerce and Transport


URI Uniform Resource Identifier<br />

URL Uniform Resource Locator<br />

W3C World Wide Web Consortium<br />

WWW World Wide Web<br />

XML Extensible Markup Language


Literaturverzeichnis<br />

Brockhaus [Kompakt Wissen, 1983]<br />

Kompakt Wissen von A bis Z in 5 Bänden<br />

Bockhaus, Wiesbaden, 1983<br />

Dieter Fensel [Spinning the semantic Web, 2005]<br />

Frank Hermelen,<br />

Grigoris Antoniou<br />

Spinning the semantic Web: bringing the World Wide<br />

Web to its full potential<br />

MIT Press , Cambridge – Massachusetts, 2005<br />

[A Semantic Web Primer]<br />

A Semantic Web Primer<br />

Lars U. Dittmann [OntoFMEA, 2007]<br />

MIT Press , Cambridge – Massachusetts, 2004<br />

OntoFMES: Ontologiebasierte Fehlermöglichkeits-<br />

und Einflussanalyse<br />

Deutscher Universitätsverlag (DUV), Wiesbaden,<br />

2007<br />

Mark-Oliver Würtz [Computer Supported Cooperative Work, 2007]<br />

Michael C. Daconta<br />

u.a.<br />

Möglichkeiten und Methoden des 'Computer Suppor-<br />

ted Cooperative Work' (CSCW)<br />

GRIN Verlag, München, 2007<br />

[The Semantic Web, 2003]<br />

The Semantic Web: A Guide to the Future of XML,<br />

Web Services, and Knowlege Management<br />

Wiley Publishing, Indianapolis, 2003


Michael Wooldridge [An Introduction to Multi-Agent Systems, 2002]<br />

Norbert Bieberstein<br />

u.a.<br />

An Introduction to Multi-Agent Systems<br />

Wiley & Sons, Indianapolis, 2002<br />

[Service-Oriented Architecture Compass, 2005]<br />

Service-Oriented Architecture Compass, Business<br />

Value, Planning, and Enterprise Roadmap<br />

Prentice Hall International , 2005<br />

Pascal Hitzler u.a. [Semantic Web, 2008]<br />

Semantic Web: Grundlagen<br />

Sebastian Löbner [Semantik, 2003]<br />

Tim Berners-Lee,<br />

Mark Fischetti<br />

Springer, Berlin – Heidelberg, 2008<br />

Semantik: Eine Einführung<br />

Gruyter, Berlin, 2003<br />

[Weaving the Web, 1999]<br />

Weaving the Web, The Original Design and Ultimate<br />

Destiny of the World Wide Web by Its Inventor<br />

Harper & Collins , Sanfranscisco, 1999


Inter<strong>net</strong>verzeichnis<br />

Alex Iskold Semantic Web: Difficulties with the Classic Approach<br />

http://www.readwriteweb.com/archives/semantic_web<br />

_difficulties_with_classic_approach.php<br />

(Stand 06. Mai 2008)<br />

Alex Iskold Top-Down: A New Approach to the Semantic Web<br />

http://www.readwriteweb.com/archives/the_top-<br />

down_semantic_web.php<br />

(Stand 06. Mai 2008)<br />

Arne Dicks Was ist WebEDI?<br />

http://www.gs1-germany.de/inter<strong>net</strong>/content/produkte/<br />

ean/ecommerce_edi/webedi/index_ger.html<br />

(Stand 13. April 2008)<br />

o.V. (Computerwoche) IDC: Weltweite Datenmenge verzehnfacht sich in fünf<br />

Dan Brickley,<br />

Libby Miller<br />

Jahren<br />

http://www.computerwoche.de/index.cfm?<br />

pid=254&pk=1858302<br />

(Stand 12. Mai 2008)<br />

foaf project<br />

http://www.foaf-project.org<br />

(Stand 10. Mai 2008)<br />

David W. Cearley u.a. Finding and Exploiting Value in Semantic Technolo-<br />

gies on the Web<br />

http://www.gartner.com/DisplayDocument?<br />

ref=g_search&id=505304


(Stand 09. Mai 2008)<br />

Michael Wooldridge [An Introduction to Multi-Agent Systems, 2002]<br />

o.V. Microfomats<br />

An Introduction to Multi-Agent Systems<br />

Wiley & Sons, Indianapolis, 2002<br />

http://microformats.org/<br />

(Stand 12. Mai 2008)<br />

o.V. Web-Ontology (WebOnt) Working Group<br />

http://www.w3.org/2001/sw/WebOnt/<br />

(Stand 26. April 2008)<br />

Dr. Brian Matthews Semantic Web Technologies<br />

Dr. rer. nat. Harald<br />

Sack u.a.<br />

http://www.jisc.ac.uk/uploaded_documents/jisctsw_05<br />

_02bpdf.pdf<br />

(Stand 09. Mai 2008)<br />

Vorlesungsmaterial Semantic Web<br />

http://www.db-thueringen.de/servlets/DerivateServlet/<br />

Derivate-10503/semweb-08_WebOfTrust.pdf<br />

(Stand 01. Mai 2008)<br />

François-Paul Servant Semantic Web Technologies in Automotive Repair<br />

and Diagnostic<br />

http://www.w3.org/2001/sw/sweo/public/UseCases/R<br />

enault/<br />

(Stand 05. Mai 2008)


Frank Manola,<br />

Eric Miller<br />

RDF Primer<br />

http://www.w3.org/TR/rdf-primer/<br />

(Stand 24. April 2008)<br />

Ian Jacobs Über das World Wide Web Consortium (W3C)<br />

http://www.w3c.de/about/overview.html<br />

(Stand 28. April 2008)<br />

Ivan Herman W3C Semantic Web Activity<br />

http://www.w3.org/2007/03/layerCake.png<br />

(Stand 19. April 2008)<br />

Jochen Notholt Die Zukunft des Semantic Web<br />

Juan José<br />

Valverde Fúster<br />

http://www.jurpc.de/aufsatz/20050066.htm#fn0<br />

(Stand 1. Mai 2008)<br />

WEASEL, Vodafone R&D Corporate Semantic Web<br />

http://www.w3.org/2001/sw/sweo/public/UseCases/Vo<br />

dafone-es/<br />

(Stand 5. Mai 2008)<br />

Leigh Dodds FOAF-a-Matic<br />

http://www.ldodds.com/foaf/foaf-a-matic<br />

(Stand 10. Mai 2008)<br />

M. Duerst Internationalized Resource Identifiers (IRIs)<br />

http://www.w3.org/International/iri-edit/draft-duerst-<br />

iri-04.txt<br />

(Stand 1. Mai 2008)


Marja-Riitta Koivunen,<br />

Eric Miller<br />

Mark Musen, M.D.,<br />

Ph.D.<br />

Michael Grove ,<br />

Andrew Schain<br />

W3C Semantic Web Activity<br />

http://www.w3.org/2001/12/semweb-fin/w3csw<br />

(Stand 28. April 2008)<br />

Protégé Software<br />

http://protege.stanford.edu/<br />

(Stand 2. Mai 2008)<br />

POPS — NASA’s Expertise Location Service Powe-<br />

red by Semantic Web Technologies<br />

http://www.w3.org/2001/sw/sweo/public/UseCases/N<br />

asa/<br />

(Stand 5. Mai 2008)<br />

Nova Spivak Making sense of the Semantic Web<br />

http://www.slideshare.<strong>net</strong>/BlogTalk2008/spivack-blog-<br />

talk-2008<br />

(Stand 10. Mai 2008)<br />

Peter Zschunke Aufräumen im Datenchaos<br />

http://www.spiegel.de/<strong>net</strong>zwelt/tech/0,1518,253290,0<br />

0.html<br />

(Stand 12. Mai 2008)<br />

Rachael King Q&A with Tim Berners-Lee<br />

http://www.businessweek.com/technology/content/apr<br />

2007/tc20070409_961951.htm<br />

(Stand 21. April 2008)<br />

Sean Bechhofer u.a. OWL Web Ontology Language Reference


Zeitschriftenverzeichnis<br />

Lee Feigenbaum u.a. The Semantic Web in Action<br />

Corporate Applications are well under way, and con-<br />

sumer uses are emerging<br />

In: Scientific American, H. 6, S. 64–71.<br />

Thomas R. Gruber A translation approach to portable ontology specifica-<br />

tions In: Knowledge Acquisition, Jg. Volume 5, H. 2,<br />

S. 199–200.<br />

Tim Berners-Lee u.a. The Semantic Web: a new form of Web content that<br />

is meaningful to computers will unleash a revolution<br />

of new possibilities<br />

In: Scientific American, H. 284 (5), S. 34–43.<br />

Wolfgang Dostal u.a. Semantik und Web Services:<br />

Vokabulare und Ontologien<br />

In: Java Spektrum, H. 3, S. 51–54.


Erklärung<br />

Hiermit erkläre ich, dass ich die vorliegende Diplomarbeit selbstständig und<br />

ohne Benutzung anderer als der angegebenen Hilfsmittel angefertigt habe.<br />

_________________________ ___________________________<br />

Ort, Datum Unterschrift


Lebenslauf<br />

Persönliche Daten<br />

Name: Holger Sistig<br />

Adresse: Römerstraße 95, 50389 Wesseling<br />

Geburtsdaten: Köln, 24.03.1981<br />

Staatsangehörigkeit: deutsch<br />

Familienstand: ledig<br />

Beruflicher Werdegang<br />

Januar 2008 – heute<br />

Concept Factory Werbeagentur – Business Development Manager<br />

Oktober 2006 – Dezember 2007<br />

OnVista Group – Business Development<br />

Mai 2006 – Oktober 2006<br />

ifp – Personalberatung & Managementdiagnostik – Research Analyst<br />

Februar 2005 – Mai 2005<br />

Casting Concept GmbH – Studentische Projekt in Casting-Redaktion<br />

Dezember 1999 – November 2003<br />

Concept Factory Werbeagentur – Mitglied Geschäftsleitung, Gesellschafter


Schulischer Werdegang<br />

Oktober 2005 – heute<br />

Rheinische Fachhochschule Köln – Medienwirtschaft I<br />

Oktober 2002 – April 2005<br />

Universität zu Köln – Betriebswirtschaftslehre (ohne Abschluss)<br />

September 1999 – Juli 2001<br />

Wirtschaftsgymnasium Karl-Schiller, Brühl – Allgemeine Hochschulreife<br />

September 1992 – Juli 1999<br />

Käthe-Kollwitz Gymnasium, Wesseling – bis 11. Klasse<br />

_________________________ ___________________________<br />

Ort, Datum Unterschrift

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!