Internetentwicklung und Entwicklung im Internet - uDoo
Internetentwicklung und Entwicklung im Internet - uDoo
Internetentwicklung und Entwicklung im Internet - uDoo
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
<strong><strong>Internet</strong>entwicklung</strong> <strong>und</strong> <strong>Entwicklung</strong> <strong>im</strong> <strong>Internet</strong><br />
Prof. Dr. Jörg Becker<br />
European Research Center for Information Systems (ERCIS)<br />
der Westfälischen Wilhelms-Universität<br />
Leonardo-Campus 3<br />
48149 Münster<br />
Tel: ++49-(0)251-8338100<br />
Fax: ++49-(0)251-8338109<br />
Mail: becker@wi.uni-muenster.de<br />
Dipl. Wirt.-Inf. Michael Thygs<br />
European Research Center for Information Systems (ERCIS)<br />
der Westfälischen Wilhelms-Universität<br />
Leonardo-Campus 3<br />
48149 Münster<br />
Tel: ++49-(0)251-8338089<br />
Fax: ++49-(0)251-8328089<br />
Mail: ismith@wi.uni-muenster.de
Inhaltsverzeichnis<br />
1 <strong>Entwicklung</strong> des <strong>Internet</strong>s ............................................................................................. 3<br />
1.1 Dienste des <strong>Internet</strong>s .............................................................................................. 4<br />
1.2 Der Adressraum des <strong>Internet</strong>s: IPv4 <strong>und</strong> IPv6 ...................................................... 5<br />
1.3 World Wide Web ................................................................................................... 7<br />
1.4 Semantic WEB ....................................................................................................... 9<br />
2 <strong>Entwicklung</strong> <strong>im</strong> <strong>Internet</strong> ............................................................................................. 10<br />
2.1 Content Management ........................................................................................... 12<br />
2.2 Fallbeispiel: Gregorsmesse der Forschungsgruppe 'Kulturgeschichte <strong>und</strong><br />
Theologie des Bildes <strong>im</strong> Christentum' ................................................................. 13<br />
3 Ausblick ...................................................................................................................... 16<br />
Kurzbeschreibung:<br />
Trotz des Alters von über 40 Jahren ist das <strong>Internet</strong> erst Mitte der 90er Jahre populär geworden.<br />
Bereits heute ist es für viele nicht mehr aus dem privaten oder geschäftlichen Alltag<br />
wegzudenken. Das <strong>Internet</strong> hat sich als weltweites Kommunikationsmedium etabliert. 68%<br />
der Deutschen nutzen das Informationsangebot des World Wide Web, versenden Emails oder<br />
diskutieren in Newsgroups. Den Siegeszug erlangte das <strong>Internet</strong> durch die Einfachheit der<br />
Technologie wie TCP/IP <strong>und</strong> HTML, die Etablierung schaffte es durch die Vielfältigkeit der<br />
Möglichkeiten (verschiedene Dienste wie WWW, E-mail, Newsgroup, usw.). Die Nutzung<br />
der Potenziale erfordert die professionelle Gestaltung der Inhalte, des Designs <strong>und</strong> der Navigation.<br />
Das Content Mangement ermöglicht die differenzierte Verwaltung <strong>und</strong> integriert die<br />
Inhalt, Navigation <strong>und</strong> Design für die Publikation <strong>im</strong> <strong>Internet</strong>.<br />
Abstract:<br />
Despite the age of over 40 years the <strong>Internet</strong> became popular in the mid 90´s. However, today<br />
it can not be excluded from the private or business life. The <strong>Internet</strong> is established as worldwide<br />
communication medium. 68% of the Germans use the information offer of the World<br />
Wide Web, send E-Mails, or discuss in newsgroup. The <strong>Internet</strong> attained the triumphant advance<br />
by the s<strong>im</strong>plicity of the technology such as TCP/IP and HTML, it has been established<br />
by the variety of the possibilities (different services such as WWW, E-mail, Newsgroup, etc.).<br />
The use of the possible efforts needs professional content, design, and navigation. Content<br />
Mangement differentiates between these parts and integrates the content, navigation and design<br />
for the publication in the <strong>Internet</strong>.
1 <strong>Entwicklung</strong> des <strong>Internet</strong>s<br />
Das <strong>Internet</strong> verbindet weltweit viele Netze miteinander <strong>und</strong> wird allgemein hin als das „Netz<br />
der Netze“ bezeichnet. Die Anfänge des <strong>Internet</strong>s gehen zurück in die Zeit des kalten Krieges.<br />
In den 60er Jahren war die Angst vor einem atomaren Angriff Motivation für das US-<br />
Verteidigungsministerium, die <strong>Entwicklung</strong> eines Computernetzes in Auftrag zu geben, das<br />
auch be<strong>im</strong> Ausfall eines Teilnetzes funktionsfähig bleibt. Dazu bildete die Advanced Research<br />
Projects Agency (ARPA) ein Forschungsteam, welches ein auf dem TCP/IP-Protokoll<br />
(Transmission Control Protocol/<strong>Internet</strong> Protocol) basierendes Netz entwarf. Die Gr<strong>und</strong>idee<br />
bestand darin, Nachrichten, die durch das Netz verschickt wurden, in kleine Pakete aufzuteilen,<br />
die zwar Ihren Best<strong>im</strong>mungsort, nicht jedoch den Weg dorthin kannten. Die Steuerung<br />
der Pakete durch das Netzwerk (das so genannte Routing) wird durch die einzelnen teilnehmenden<br />
Stationen durchgeführt, welche ihre unmittelbare Umgebung (die Topologie) kennen.<br />
So kann es vorkommen, dass zwei Pakete mit demselben Best<strong>im</strong>mungsort diesen auf unterschiedlichen<br />
Routen erreichen. Durch diese Flexibilität ist das Netz auch be<strong>im</strong> Ausfall eines<br />
oder mehrerer Knoten funktionsfähig, solange noch auf irgendeinem Weg eine durchgehende<br />
Verbindung vom Start- zum Zielknoten existiert.<br />
Nach einiger <strong>Entwicklung</strong>szeit wurde am 1. September 1969 der erste Knotenrechner an der<br />
University of California in Los Angeles in Betrieb genommen, ein Honeywell 516 mit 12 KB<br />
RAM. Kurz darauf folgten weitere Rechner in Stanford, Santa Barbara <strong>und</strong> Utah. Diese vier<br />
Rechner bildeten den Ausgangspunkt für die <strong>Entwicklung</strong> des ARPANets, benannt nach dem<br />
Finanzgeber. Der erste funktionsfähige Dienst, der zwischen diesen Rechnern eingerichtet<br />
wurde, war ein remote login in Utah, der es den Teilnehmern der anderen Standorte ermöglichte,<br />
sich auf dem Rechner in Utah anzumelden <strong>und</strong> dort Befehle auszuführen.<br />
Während die Netzwerke anfangs der 70er Jahre auf die USA beschränkt waren, engagierten<br />
sich zunehmend Universitäten, die das Medium E-Mail für den schnellen Austausch von Forschungsergebnissen<br />
zu schätzen wussten. Die erste Transatlantikverbindung wurde Mitte der<br />
70er Jahre hergestellt. Von diesem Punkt an verbreiteten sich die TCP/IP-basierten Netze<br />
auch in Europa.<br />
1983 wurde das ARPANet in die Bestandteile ARPANET (private Einrichtungen <strong>und</strong> Universitäten)<br />
<strong>und</strong> MILNET (militärische Nutzer) getrennt. Letzteres ging später in dem 1982 gegründeten<br />
Defense Data Network auf. Das ARPANET, der Urvater des <strong>Internet</strong>, wurde 1990<br />
außer Dienst gestellt. Seine Rolle wurde fortan vom NSFNET (National Science Fo<strong>und</strong>ation<br />
Network) übernommen.
Während heute überwiegend von "dem" <strong>Internet</strong> gesprochen wird, so muss an dieser Stelle<br />
betont werden, dass es sich be<strong>im</strong> <strong>Internet</strong> um eine Sammlung zahlreicher Teilnetze handelt,<br />
die durch Übergänge (Gateways) miteinander verb<strong>und</strong>en sind. Betreiber der Teilnetze sind die<br />
Telekommunikationskonzerne der jeweiligen Länder, Universitäten sowie andere Anbieter,<br />
die über ein eigenes Leitungsnetz verfügen.<br />
1.1 Dienste des <strong>Internet</strong>s<br />
Neben diesem Missverständnis werden häufig die Begriffe WWW <strong>und</strong> <strong>Internet</strong> synonym<br />
verwand. Das WWW (World Wide Web) ist neben der Email, dem File Transfer, dem Usenet<br />
<strong>und</strong> der Terminal Emulation ein Dienst des <strong>Internet</strong>s. Die Dienste werden durch unterschiedliche<br />
Protokolle realisiert. Die Protokolle legen die Ausgestaltung der Pakete fest <strong>und</strong> regeln<br />
die Art der Kommunikation zwischen den Rechnern.<br />
Dienst Protokoll Beschreibung<br />
File Transfer File Transfer Protocol<br />
(FTP)<br />
Elektronic Mail<br />
(E-Mail)<br />
S<strong>im</strong>ple Mail Transfer<br />
Protocol (SMTP)<br />
Terminal Emulation: Telnet Protocol<br />
(Telnet)<br />
<strong>Internet</strong> Newsgroups Network News<br />
Transfer Protocol<br />
(NNTP)<br />
World Wide Web Hypertext Transfer<br />
Protocol (HTTP)<br />
Tab. 1.1 Dienste des <strong>Internet</strong>s<br />
Austausch von Dateien zwischen Rechnern<br />
des <strong>Internet</strong>s<br />
Austausch von Nachrichten mit anderen<br />
Benutzern des <strong>Internet</strong>s<br />
Ermöglicht die Arbeit an einem entfernten<br />
Computer <strong>im</strong> <strong>Internet</strong><br />
Diskussionsforum, an dem mehrer Nutzer<br />
des <strong>Internet</strong>s partizipieren<br />
Umfasst die obigen Operationen <strong>und</strong> zusätzlich<br />
die Übermittlung von Texten, Bildern,<br />
Audio <strong>und</strong> Video zum lokalen Computer<br />
Die Verwechslung von WWW <strong>und</strong> <strong>Internet</strong> entsteht insbesondere durch die Nachbildung verschiedener<br />
Dienste <strong>im</strong> WWW. Beispielsweise wird die Abwicklung der Emailabfrage <strong>im</strong><br />
Browser wie bei www.web.de , www.gmx.de o.ä. <strong>im</strong> Browser per WWW-Technologie dar-
gestellt, das eigentlich SMTP-Protokoll wird aber <strong>im</strong> Hintergr<strong>und</strong> ausgeführt. Bei Verwendung<br />
eines E-Mail-Clients wie Outlook, Pegasus-Mail o.ä. wird das SMTP-Protokoll direkt<br />
verwendet.<br />
1.2 Der Adressraum des <strong>Internet</strong>s: IPv4 <strong>und</strong> IPv6<br />
Die Zahl der Knotenrechner <strong>im</strong> <strong>Internet</strong> ist seit Beginn der 90er Jahre sprunghaft angestiegen.<br />
Im März 1993 machte HTML-Datenverkehr (also die Datenlast durch WWW-Seiten-<br />
Übertragung) 0,1 % des NSF-Backbone-Verkehrs aus (<strong>im</strong> März 1995 bereits 24 %) 1 es existierten<br />
<strong>im</strong> März 1993 etwa 50 bekannte WWW-Server, <strong>im</strong> Oktober desselben Jahres waren es<br />
bereits über 200, Anfang 2000 fast 10 Millionen. Neben den WWW-Servern existieren <strong>im</strong><br />
<strong>Internet</strong> aber noch weitaus mehr Rechner, die z. B. als Mail-Server oder einfach als Anwendungsrechner<br />
fungieren. Im Januar 2003 wurden <strong>im</strong> <strong>Internet</strong> 171,64 Millionen Knotenrechner<br />
(Hosts) gezählt, 2 davon mehr als 14,49 Millionen in Deutschland. 3 Ein Knotenrechner verbindet<br />
verschiedene Einzelnetze. Diese Netze sind dann über diesen Netzknoten miteinander<br />
verb<strong>und</strong>en.<br />
Bei der Zahl der <strong>Internet</strong>-Nutzer gibt es allerdings keine gesicherten Zahlen, vielmehr wird<br />
von den Analysten die Zahl der <strong>Internet</strong>-Nutzer auf 63% der Bevölkerung in den USA <strong>und</strong><br />
68 % Bevölkerung in Deutschland geschätzt.<br />
Um Rechner (Hosts) <strong>im</strong> <strong>Internet</strong> gezielt ansprechen (ansteuern, aufrufen) zu können, werden<br />
allen <strong>im</strong> <strong>Internet</strong> beteiligten Rechnern <strong>Internet</strong> Protocol Adressen (IP) -Adressen zugewiesen.<br />
Diese setzen sich aus vier bis zu dreistelligen Zahlen zusammen, die von 0 bis 255 reichen<br />
<strong>und</strong> durch Punkte getrennt werden. Die Adresse 128.176.188.115 entspricht dem Webserver<br />
der Universität Münster. Diese Notation entspricht dem aktuell gültigen IPv4-Standard4 mit<br />
32bit. Da die Anzahl der benötigten <strong>Internet</strong> Adressen, die in der Vision das Handys, Kühlschränke,<br />
Waschmaschinen u.v.m. mit IP-Adressen ausgestattet werden sollen, noch weiter<br />
steigen wird, ist die theoretische Anzahl von 4.294.967.296 bereits heute sehr eng bemessen.<br />
Es muss erwähnt werden, dass in den o.g. 171 Mio. nur die Knotenrechner (Hosts) berücksichtigt<br />
sind. Jeder Benutzer bekommt für die Online-Zeit eine eigene IP-Adresse zugewiesen.<br />
Dieses Problem wurde in den 90er Jahren erkannt <strong>und</strong> seitdem wird der neue IPv6 mit 128bit<br />
1 vgl. http://www.mit.edu/people/integray/net/web-growth-summary.html<br />
2 vgl. http://www.isc.org<br />
3 vgl. http://www.ripe.net/statistics/<br />
4 IPv4 = <strong>Internet</strong> Protocol Version 4; IPv6 = <strong>Internet</strong> Protocol Version 6
entwickelt, welches die Adressierung von 655.570.793.348.866.943.898.599 Geräten pro<br />
Quadrat-Meter Erdoberfläche ermöglicht. Daher scheint der synonyme Begriff IPNG (IP Next<br />
Generation) gar ein wenig kurz gegriffen.<br />
Anzahl Rechner in Mio.<br />
Anzahl Rechner <strong>im</strong> <strong>Internet</strong> (1993-2003)<br />
200<br />
180<br />
160<br />
140<br />
120<br />
100<br />
80<br />
60<br />
40<br />
20<br />
0<br />
Abb. 1.1 Knotenrechner <strong>im</strong> <strong>Internet</strong><br />
Jan 93<br />
Jan 94<br />
Jan 95<br />
Jan 96<br />
Jan 97<br />
Jan 98<br />
Jan 99<br />
Jan 00<br />
Jan 01<br />
Jan 02<br />
Jan 03<br />
Aufgr<strong>und</strong> der schlechten Lesbarkeit der IP-Adressen werden den Zahlen Begrifflichkeiten<br />
zugeordnet. Beispielsweise repräsentiert die o.g. Adresse den Webserver der Universität<br />
Münster (www.uni-muenster.de) 5 . Die Endung eines Rechnernamens (hier: .de) besteht aus<br />
einem Länder bzw. Einrichtungskürzel, den sog. Top-Level-Domain. Zu Gründerzeiten wurde<br />
in den USA angenommen, dass diese Art von Netzen nur in Amerika Verbreitung finden<br />
würde <strong>und</strong> es entstanden die Top-Level-Domain .com, .edu, .gov, .mil, .net, .org. Im Rahmen<br />
der Internationalisierung kamen die länderspezifischen Top-Level-Domain hinzu, .de für<br />
Deutschland, .ch für die Schweiz usw. Darüber hinaus existieren weitere Top-Level-Domain<br />
wie .biz, .info, .pro usw.<br />
In Deutschland ist seit dem 1. Januar 1994 der Interessenverband Deutsches Network Information<br />
Center (IV-DeNIC) 6 für die Vergabe der IP-Adressen der deutschen Domäne „.de“<br />
zuständig. Die de-Domäne ist mit 7 Millionen Einträge die beliebteste Länderdomäne <strong>und</strong><br />
5<br />
Der Zusammenhang kann überprüft werden, in dem die IP-Adressen (http://128.176.188.115) als Adresse in<br />
den Browser eingegeben wird.<br />
6<br />
Vgl. www.denic.de
insgesamt die zweitgrößte nach der .com-Domäne, die genau wie die „org„, „net“ <strong>und</strong> „gov“<br />
von der <strong>Internet</strong> Corporation For Assigned Names and Numbers (ICANN) 7 vergeben werden.<br />
1.3 World Wide Web<br />
Die bekanntesten <strong>und</strong> meist genutzten Dienste <strong>im</strong> <strong>Internet</strong> sind die E-Mail <strong>und</strong> das World<br />
Wide Web (WWW), die basierend auf der kostenlosen Nutzung zu der weiten Verbreitung<br />
des <strong>Internet</strong>s geführt. Die E-Mail hat als asynchrones <strong>und</strong> schnelles Kommunikationsmedium<br />
einen Platz zwischen der Telefonie <strong>und</strong> dem Briefverkehr gef<strong>und</strong>en.<br />
Das World Wide Web (kurz: Web) wurde 1989 <strong>im</strong> Europäischen Labor für Teilchenphysik<br />
(CERN) 8 entwickelt. T<strong>im</strong> Berners-Lee hatte die Vision Computersysteme miteinander zu verknüpfen<br />
<strong>und</strong> ein System zu schaffen, in dem Mitarbeiter unterschiedlicher Projekte, an unterschiedlichen<br />
Orten <strong>und</strong> von zuhause, über die Inkompatibilitäten der verschiedenen Computersysteme<br />
hinweg Nachrichten, Dokumente, Grafiken, Audiodateien <strong>und</strong> Videos austauschen<br />
konnten. Die technische Gr<strong>und</strong>lage ist ein Protokoll, über das die verschiedenen Computersysteme<br />
miteinander kommunizieren konnten, das aber keiner zentralen wachstumshemmenden<br />
Instanz bedurfte. Im World Wide Web wird das Hyptertext Transfer Protocol (http) Protokoll<br />
verwendet <strong>und</strong> die Inhalte werden in der Beschreibungssprache Hyptertext Markup<br />
Language (HTML) dargestellt.<br />
Hypertext Transfer Protocol (http)<br />
Das Hypertext Transfer Protocol (http) best<strong>im</strong>mt auf welche Weise Computer <strong>im</strong> WWW miteinander<br />
kommunizieren. Es muss geregelt werden, in welcher Reihenfolge die Computer<br />
„sprechen“ <strong>und</strong> es müssen Verfahren zur Repräsentation der Daten gef<strong>und</strong>en werden. Das<br />
HTTP basiert auf einem Frage/Antwort Paradigma. Eine einfache vollständige Transaktion<br />
besteht aus einer Anfrage <strong>und</strong> einer Antwort. Ein Nutzer stellt eine Anfrage an einen entfernten<br />
Rechner, wofür eine Verbindung zu dem entfernten Rechner aufgebaut wird, der die angeforderten<br />
Daten sendet. Nach Abschluss der Transaktion wird die Verbindung geschlossen.<br />
Wenn beispielsweise ein Dokument mit zehn eingebetteten Grafiken geladen werden soll,<br />
wird zunächst eine Transaktion für das Dokument durchgeführt <strong>und</strong> anschließend werden<br />
7 Vgl. www.icann.org<br />
8 Ehemals Centre Européenne pour la Recherche Nucléaire jetzt Organisation Européenne pour la Recherche<br />
Nucléaire
sukzessiv die Bilder in einzelnen Transaktionen geladen. Es müssen dementsprechend elf<br />
Verbindungen zum Server aufgebaut werden. Bei langsamen Verbindungen kann beobachtet<br />
werden, dass zunächst der Text <strong>und</strong> zeitverzögert die Bilder geladen werden. Dieses Vorgehen<br />
wirkt sich negativ auf das Antwortzeitverhalten <strong>und</strong> die Netzwerklast aus. Aufgr<strong>und</strong> der<br />
Unterstützung anderer Protokolle <strong>und</strong> der Art <strong>und</strong> Weise der Transaktionsbehandlung handelt<br />
es sich bei dem HTTP um ein generisches, verbindungsloses Protokoll.<br />
Hypertext Markup Language (HTML)<br />
Neben der technischen Abwicklung der Transaktionen hat sich die Aufbereitung der Daten für<br />
den Nutzer von einer reinen Textorientierung zu einer Darstellung komplexer, mult<strong>im</strong>edialer<br />
Dokumente gewandelt. Zur Darstellung der Dokumente wurde von Beginn an die Hypertext<br />
Markup Language (HTML) verwendet. HTML ist eine Seitenbeschreibungssprache <strong>und</strong> gilt<br />
als lingua franca für die Publikation von Hypertext-Dokumente <strong>im</strong> World Wide Web. 9 Die<br />
Besonderheit ist die Verknüpfung der Inhalte mit den sog. (Hyper)-Links, mit denen an jeder<br />
beliebigen Stelle auf ein anderes weltweit verteiltes Dokument verwiesen werden kann.<br />
Mit dieser Sprache ist es gelungen, trotz der begrenzten Bandbreite des <strong>Internet</strong>s dem Benutzer<br />
grafische Oberflächen <strong>und</strong> mult<strong>im</strong>ediale Inhalte anzubieten. Die Funktionsweise von<br />
HTML beruht dabei auf Markierungen (Tags), die in spitzen Klammern eingeschlossen werden<br />
(vgl. Abb. 1.2). In knapp 10 Minuten können die elementaren Sprachelemente erlernt<br />
werden (www.w3.org/MarkUp/Guide/ ).<br />
Abb. 1.2 HTML-Beispiel: Hello World<br />
9 Vgl. http://www.w3.org/MarkUp/
HTML wird ständig weiterentwickelt, die aktuelle Version 4.01 umfasst mult<strong>im</strong>ediale Zusätze,<br />
Skriptsprachen, Style sheets (Formatvorlagen) <strong>und</strong> verbesserte Druckmöglichkeiten. Darüber<br />
hinaus werden Sprachelemente spezifiziert, um die Barrierefreiheit des <strong>Internet</strong>s zu verbessern.<br />
In Deutschland ist für die öffentlichen Einrichtungen mit dem Gesetz zur Gleichstellung<br />
behinderter Menschen10 die Schaffung von barrierefreien <strong>Internet</strong>seiten gesetzlich verankert.<br />
Einige Browser wie Opera <strong>und</strong> Mozilla sind mit Zoomfunktionen ausgerichtet, die sehbehinderten<br />
Menschen das Lesen erleichtern. Die Seite des Beauftragten der B<strong>und</strong>esregierung<br />
für die Belange behinderter Menschen bietet eine Funktion zur Vergrößerung der Schrift. Die<br />
gestiegenen Ansprüche an die Formatierungsmöglichkeiten (das Design) <strong>und</strong> die Ansprüche<br />
an die Funktionalität haben die Anzahl der bereitgestellten Elemente <strong>und</strong> Programmierkonstrukte<br />
ansteigen lassen, so dass die Programmierung von HTML-Seiten spezieller Vorkenntnisse<br />
bedarf.<br />
Neben der Darstellung von Inhalten mit Hilfe von HTML, die aufgr<strong>und</strong> der Unveränderbarkeit<br />
durch den Benutzer statisch sind, ist die Präsentation von dynamischen Inhalten von zunehmender<br />
Bedeutung. Dynamische Inhalte werden verwendet, wenn die Inhaltsgestaltung<br />
bzw. -zusammensetzung der Seiten durch den Benutzer beeinflussbar ist. Die Suche in einer<br />
Datenbank erfordert beispielsweise zunächst die Angaben des Nutzers, die an die Datenbank<br />
weitergereicht werden. Die aus der Datenbank erhaltenen Ergebnisse müssen dann in HTML<br />
umgewandelt werden. Dynamische Inhalte werden ferner benötigt, wenn zu publizierenden<br />
Inhalte einer hohen Änderungsfrequenz bedürfen (z.B. Börsenkurs, Verfügbarkeitsprüfung in<br />
Shop-Systemen). Für diese zusätzlichen Funktionalitäten werden neben der reinen Beschreibungssprache<br />
HTML weitere Programmiersprachen benötigt, die die Ablauflogik der Erstellung<br />
solcher dynamischer Inhalte durchführen.<br />
1.4 Semantic WEB<br />
Die nächste Generation des WWW wird am W3C unter dem Namen Semantic Web entwickelt.<br />
Die Entwickler T<strong>im</strong> Berners-Lee, James Hendler <strong>und</strong> Ora Lassila beschreiben das Semantic<br />
Web wie folgt: „The Semantic Web is an extension of the current web in which information<br />
is given well-defined meaning, better enabling computers and people to work in cooperation.”<br />
11 Das derzeitige WWW ermöglicht die Darstellung von Inhalten für Personen, <strong>im</strong><br />
Semantic Web werden die Daten strukturiert <strong>und</strong> erweitert, um insbesondere die Maschinen-<br />
10<br />
Vgl. www.behindertenbeauftragter.de/gesetzgebung/behindertengleichstellungsgesetz<br />
11<br />
Vgl. www.w3.org/
lesbarkeit der Daten zu erweitern. Die Beurteilung der Information durch den Menschen soll<br />
erleichtert werden. Die Problematik liegt in der Bewertung der Information, die mit der Aufnahme<br />
der Information einhergeht, eine a-priori Beurteilung über den Nutzen oder den Wert<br />
einer Information ist nicht möglich, da erst die vollständige Aufnahme die Wertschätzung<br />
ermöglicht. Daher müssen die eigenen Beurteilungen um externe Beurteilungskriterien wie<br />
den Kontext der Information oder die Bewertung durch vertrauensvolle Personen oder Einrichtungen<br />
erweitert werden. Die Ansätze des Semantic Web basieren auf der intensiven Verlinkung<br />
der Inhalte untereinander, der Erstellung von Metadaten, die ursprüngliche Informationen<br />
um allgemein definierte Eckwerte erweitern <strong>und</strong> auf der Verwendung von Ontologien,<br />
deren Nutzen <strong>im</strong> einheitlichen Gebrauch von Begrifflichkeiten zumindest für die Sprachgemeinschaft<br />
der Ontologie liegen.<br />
2 <strong>Entwicklung</strong> <strong>im</strong> <strong>Internet</strong><br />
Zu Beginn reichte rud<strong>im</strong>entäres Wissen über die Funktionalität von Webservern <strong>und</strong> die Programmierung<br />
von HTML mit Text-Editoren zur Darstellung der Inhalte <strong>im</strong> <strong>Internet</strong> aus. Die<br />
einfachen Seiten der ersten Generation wurden mit gewöhnlichen Texteditoren unter Verwendung<br />
der Tags erstellt. Dazu mussten die Inhalte, wenn diese elektronisch vorlagen, entsprechend<br />
um die rud<strong>im</strong>entären Sprachelemente erweitert werden. Dieser Schritt ermöglichte eine<br />
einfache <strong>und</strong> schnelle Publikation der Inhalte für ein breites Publikum. Die Anforderungen an<br />
die Erstellung von Webseiten wuchsen <strong>im</strong> Hinblick auf die Menge der dargestellten Inhalte<br />
<strong>und</strong> die Möglichkeiten der Designgestaltung.<br />
Neben dem Begriff <strong>Internet</strong> entstanden die Begriffe Extranet <strong>und</strong> Intranet, die lediglich eine<br />
Einschränkung der Zugriffsmöglichkeiten bedeuten. Das Extranet ist ein Teil der Inhalte, die<br />
auf normalen Web-Servern vorgehalten werden, jedoch nur einer begrenzten Personengruppe<br />
zugängig sind. Solche Angebote finden sich bsp. bei Zeitschriften, die nur ihren Abonnenten<br />
einen Zugriff auf das Online-Archiv ermöglichen. Be<strong>im</strong> Intranet handelt es sich um ein geschlossenes<br />
Netz, welches nicht mit dem <strong>Internet</strong> verb<strong>und</strong>en ist, aber die gleiche Technologie<br />
<strong>und</strong> Protokolle insbesondere das TCP/IP verwendet. Wird die Sicht auf das WWW beschränkt,<br />
sind ebenso HTML <strong>und</strong> HTTP zu nennen. Insbesondere in Unternehmen hat sich<br />
das Intranet etabliert, da die Technologie lange erprobt <strong>und</strong> <strong>im</strong> Gegensatz zu einer proprietären<br />
Anwendung einfach zu administrieren ist. Ein besonderer Vorteil liegt in der einfachen<br />
<strong>und</strong> durch die Verwendung des <strong>Internet</strong>s bereits etablierte Handhabung der Benutzeroberfläche<br />
anhand des Browsers.<br />
In Unternehmen, die für eine professionelle Informationsversorgung der Mitarbeiter (<strong>im</strong> Intranet),<br />
für Kooperationen mit anderen Unternehmen (<strong>im</strong> Extranet) oder für die Außenwirkung<br />
ein einheitliches Corporate Design aufbauen wollten, waren es die Administratoren oder
speziell interessierte Mitarbeiter, die die Inhalte für die Webseiten umsetzten. Da den wenigen<br />
Mitarbeitern mit HTML-Kenntnissen eine große Anzahl an Inhaltsproduzenten gegenüberstand,<br />
entstand ein Engpass, der die rechtzeitige Bereitstellung der Inhalte verzögerte. Darüber<br />
hinaus wuchsen die <strong>Internet</strong>präsenzen, so dass die Verwaltung der zigfachen HTML-Seiten<br />
nicht vollständig überschaut wurde <strong>und</strong> sog. „tote Links“ entstanden, d.h. es wurden Seiten<br />
aus der <strong>Internet</strong>präsenz entfernt <strong>und</strong> andere Seiten, die auf diese Seite verweisen, wurden<br />
nicht aktualisiert. Oder es wurden Inhalte auf dem Webserver verschoben <strong>und</strong> für die Benutzer<br />
erst anhand intensiver Suche wieder auffindbar.<br />
Die wichtigste Erkenntnis der Post-Hypezeit des <strong>Internet</strong>s liegt darin, dass das <strong>Internet</strong> nicht<br />
ersetzt hat, sondern eine Alternative darstellt. Es hat die Verbreitung digitaler Güter <strong>und</strong> <strong>im</strong><br />
besondere die Verbreitung von Informationen vereinfacht. Durch die Publikation der Informationen<br />
<strong>im</strong> <strong>Internet</strong> kann eine Omnipräsens der Information ermöglicht werden, wobei kaum<br />
Kosten für die Vervielfältigung entstehen. Diese Eigenschaften führten zu einem enormen<br />
Anwachsen der <strong>im</strong> WWW dargestellten Dokumente, Bilder, Musik <strong>und</strong> Videos. Als Benutzer<br />
hat man Schwierigkeiten, die gewünschten Informationen zu finden. Dies führte einerseits zur<br />
<strong>Entwicklung</strong> von Portalen, auf denen für eine vorher spezifizierte Benutzergruppe die Informationen<br />
gesammelt <strong>und</strong> sortiert wurden, andererseits entstanden Suchmaschinen, die sämtliche<br />
Inhalte des WWW erfassen (indizieren) <strong>und</strong> dem Suchenden jene Dokumente liefern, die<br />
syntaxgleiche Worte enthalten. Die Pflege des Portals ist mit <strong>im</strong>mensem Aufwand verb<strong>und</strong>en<br />
<strong>und</strong> der Nutzer kann nicht sicher sein, alle relevanten (verfügbaren) Informationen des <strong>Internet</strong>s<br />
zu erhalten. Im Gegensatz dazu bieten die Suchmaschinen zwar sämtlichen verfügbaren<br />
Dokumente an, deren Wertung <strong>und</strong> Sortierung aber manipulierbar ist. So ist in den Anfängen<br />
einfach die Häufigkeit des vorkommenden Wortes als Maß verwandt worden. Kommerzielle<br />
Webseiten Betreiber nutzten diese Kennzahl aus, in dem verschiedenste Begriffe <strong>im</strong> verborgenen<br />
Teil der Webseite (Meta-Tag) eingestellt wurden, ohne das ein direkter inhaltlicher<br />
Bezug bestand. Der Nutzer wurde auf als hoch relevant klassifizierte Seiten verwiesen, die<br />
etwas verkaufen wollten, aber keine Inhalte lieferten, was schnell zu einer Suchfrustration<br />
führte. Die Meta-Tags werden aufgr<strong>und</strong> des Missbrauchs in dieser Form nicht mehr verwandt.<br />
Der aktuelle Marktführer (www.google.com) verwendet zur Beurteilung <strong>und</strong> Sortierung der<br />
Dokumente nach Relevanz die Anzahl der Dokumente, die auf dieses Dokument verweisen.<br />
Dieses Beurteilungsmaß wird bereits durch die Generierung von Webseiten umgangen, die<br />
ausschließlich aus Links für die zu fördernden Inhalte bestehen. Damit verliert das Maß jedoch<br />
seine Objektivität.
2.1 Content Management<br />
Um den Problemen zu begegnen, wurde Ende der 90er Jahre das Content Management entwickelt,<br />
welches für die Publikation von Inhalten <strong>im</strong> <strong>Internet</strong> die Gestaltung der <strong>Internet</strong>seiten in<br />
die Komponenten Inhalt, Navigation12 <strong>und</strong> Design (Präsentation) trennt. Die Gr<strong>und</strong>idee war es<br />
das Expertenwissen der verschiedenen Beteiligten an der <strong>Entwicklung</strong> eines <strong>Internet</strong>auftritts<br />
Redakteur, Administrator <strong>und</strong> Designer dedizierter zu nutzen. Der Administrator verwaltet die<br />
Navigation <strong>und</strong> stellt die Verfügbarkeit des Systems sicher. Der Designer legt initial den grafischen<br />
Aufbau <strong>und</strong> die Farben fest, die systemseitig allen Redakteuren mit begrenzten Änderungsmöglichkeiten<br />
vorgegeben werden. Der Redakteur als Inhaltsproduzent kann ohne technische<br />
Kenntnisse (Administration, Web-Design <strong>und</strong> HTML) Inhalte einstellen. Die Trennung<br />
bewirkt zudem eine Vereinheitlichung des gesamten <strong>Internet</strong>auftritts (Corporate Design), da<br />
die Gestaltung zentral vom Designer vorgenommen wird.<br />
Text einer<br />
Web-Seite<br />
(einzelnes<br />
Contentobjekt)<br />
Inhalt<br />
Layout<br />
i<br />
Gleicher Text <strong>im</strong><br />
anderen Layout (z.B.<br />
Druckansicht)<br />
l<br />
s<br />
Bild oder<br />
detaillierterer Text<br />
(gleiche Stelle,<br />
gleiches Layout)<br />
Abb. 2.1 Trennung in Inhalt, Layout <strong>und</strong> Navigation<br />
Gleicher Text an<br />
einer anderen Stelle<br />
(z.B. andere Rubrik)<br />
Navigation<br />
(Struktur)<br />
Diese Gr<strong>und</strong>idee wurde <strong>im</strong> Laufe der Zeit um weitere Aspekte zur Verbesserung der Inhaltspflege<br />
erweitert:<br />
• Unterstützung des Content-Life-Cycle, d. h. die systemseitige Unterstützung bei der<br />
Erstellung, Änderung <strong>und</strong> Archivierung eines Inhalts<br />
12 Mitunter findet sich der nicht treffende Begriff Struktur anstatt Navigation.
• Unterstützung unterschiedlicher Ausgabemedien durch medienneutrale Datenhaltung<br />
(<strong>Internet</strong>, Druck, WAP etc.)<br />
• Wiederverwendung von Inhalten<br />
• Austausch von Inhalten mit anderen Anbietern (sog. Content-Syndication)<br />
• Reine Browserbasierung, d.h. Inhaltspflege kann von jedem beliebigen <strong>Internet</strong>arbeitsplatz<br />
erledigt werden<br />
• Personalisierung<br />
• Unterstützung der Mehrsprachigkeit<br />
Das Content Management unterstützt die administrativen Prozesse zur Unterstützung von<br />
Inhalten. Für die nächste Generation des <strong>Internet</strong>s werden erweiterte Konzepte <strong>und</strong> Modellierungstechniken<br />
benötigt. Bspw. müssen für die inhärente Integration von alten <strong>und</strong> neuen Systemen<br />
des Semantic Web, Werkzeuge <strong>und</strong> Methoden zur Unterstützung der automatisierten<br />
Kommunikation von Rechnern entwickelt werden.<br />
2.2 Fallbeispiel: Gregorsmesse der Forschungsgruppe 'Kulturgeschichte <strong>und</strong> Theologie<br />
des Bildes <strong>im</strong> Christentum'<br />
Die Forschungsgruppe 'Kulturgeschichte <strong>und</strong> Theologie des Bildes <strong>im</strong> Christentum' hat <strong>im</strong><br />
Rahmen ihrer Forschung in einer proprietären Datenbank bildwissenschaftliches Material zur<br />
‚Gregorsmesse' erfasst. Ziel der Forschungsgruppe ist Abfragen nach ikonographischen <strong>und</strong><br />
bildwissenschaftlichen Kriterien zu ermöglichen. Da für Bilddaten keine zur Textsuche adäquate<br />
Suchmöglichkeit bestand, hat die Forschungsgruppe ein Repertorium geschaffen, welches<br />
die Bilder typologisiert. Die Klassifizierung der Dokumente wurde über die üblichen<br />
kunsthistorischen Daten hinaus um für die Erschließung <strong>und</strong> Erforschung der Bilder notwendigen,<br />
fachspezifischen Eigenschaften erweitert.
Abb. 2.2 Ausschnitt der Repertoriumsdaten<br />
In enger Zusammenarbeit mit dem Institut für Wirtschaftsinformatik sollten die Forschungsergebnisse<br />
<strong>im</strong> <strong>Internet</strong> einem erweiterten Publikum zur Verfügung gestellt werden. Während<br />
der Fachkonzeption wurden die Gestaltungsmöglichkeit des <strong>Internet</strong>s allgemein <strong>und</strong> die Umsetzung<br />
der Funktionalität der proprietären Datenbank <strong>im</strong> Detail besprochen. Die Restriktionen<br />
der WWW-Technologie (zustandsloses Protokoll, statische Inhalte) erfordern die Verwendung<br />
von Programmiersprachen zur Unterstützung der dynamischen Abfrage von Informationen<br />
aus der Datenbank. Die besondere Schwierigkeit lag in der Integration einer „alten“<br />
proprietären Datenbank mit der „neueren“ <strong>Internet</strong>technologie.<br />
Die grafische Oberfläche für die Nutzer ist vollständig <strong>im</strong> WWW zu bedienen <strong>und</strong> damit<br />
weltweit verfügbar (http://gregorsmesse.uni-muenster.de). Die Daten werden weiterhin in der<br />
proprietären Datenbank erfasst. Die Daten werden zur Darstellung <strong>im</strong> WWW automatisiert<br />
auf den Webserver kopiert <strong>und</strong> stehen unmittelbar zur Ansicht bereit, da die WWW-<br />
Anwendung die Daten direkt aus der Datenbank liest.
Abb. 2.3 Ausschnitt der Suchergebnisse<br />
In der nächsten Ausbaustufe dieses Projekts wird der Einsatz eine Content Management Systems<br />
unter Ablösung der propietären Datenbank vorgenommen, so dass das <strong>Internet</strong> nicht<br />
ausschließlich als Repräsentation der Ergebnisse dient, sondern auch die Inhaltspflege über<br />
einen Browser erfolgen kann. Die reine Browserbasierung ermöglicht die Pflege der Daten<br />
von jedem internetfähigen Rechner. Die Administration der proprietären Datenbank <strong>und</strong> die<br />
Installation auf dem Client entfallen. Alle Mitarbeiter können zeitgleich ohne die bei verteiltem<br />
Arbeiten an unterschiedlichen Rechnern notwendige Replikation auf dem aktuellsten Datenbestand<br />
arbeiten. Die Lizenzkosten für die Datenbank entfallen. Jeder Eintrag in die Datenbank<br />
kann unmittelbar den Endnutzer des Systems zur Verfügung gestellt werden. Unter<br />
Verwendung der Mehrsprachigkeit kann das erreichte Publikum sogar erweitert werden.
3 Ausblick<br />
Das <strong>Internet</strong> als weltweites Netz bietet eine kostengünstige Publikationsbasis, in dem die<br />
WWW-Anwendungen der Darstellung von Inhalten dienen <strong>und</strong> die E-Mails ein schnelles <strong>und</strong><br />
kostengünstiges direktes Kommunikationsmedium sind. Newsgroups bilden eine Kommunikationsplattform<br />
für Gruppen, um Inhalte, Fragen <strong>und</strong> Problem zu diskutieren. Diese Formen<br />
der Kommunikation bieten ein breites Spektrum, um mit Menschen direkt oder zeitversetzt<br />
weltweit zu kommunizieren. Die Gestaltung des Informationsaustausches wird dabei auf die<br />
Erstellung der Inhalte ohne Technologiewissen vereinfacht. Die semantisch sinnvolle Verknüpfung<br />
von Inhalte anhand der Hyperlinks ermöglicht die Zusammenstellung kontextähnlicher<br />
Informationen. Eine ausgereifte <strong>und</strong> durchdachte Navigation verbessert die Zusammenstellung<br />
der Informationen <strong>und</strong> erleichtert die Suchprozesse der Nutzer.<br />
Die Gestaltung von Texten anhand einfacher Webseiten wird um die Darstellung datenbankbasierter<br />
Inhalten wie Grafik-, Audio- <strong>und</strong> Videodaten erweitert. Das Konzept des Content<br />
Managements vereinfacht die Administration der Inhalte, der Navigation <strong>und</strong> des Designs <strong>und</strong><br />
ermöglicht die Konzentration auf die Kernkompetenzen der Mitarbeiter.<br />
Zusätzlich zu den Medien werden mehr <strong>und</strong> mehr Prozesse in das <strong>Internet</strong> verlagert. In der<br />
aktuellen Forschung werden sog. Web Services untersucht, die inhaltlich abgeschlossene<br />
Dienstleistungen über das <strong>Internet</strong> ausgeführen. Ein solcher Web Service bietet bspw. zur<br />
aktuellen Position den kürzesten Weg zur nächsten Sehenswürdigkeit inkl. einer mehrsprachigen<br />
Erläuterung der historischen Daten, die selbstverständlich ebenso als Audio- oder Videoausgabe<br />
möglich ist. Die in dem Personal Digital Assistent (PDA) integrierte Kamera sendet<br />
die Bilder direkt zum Fotohändler.<br />
Die Publikation von mult<strong>im</strong>edialen Inhalten, die benutzeradäquat (barrierefrei) bereitgestellt<br />
<strong>und</strong> semantisch sinnvoll verknüpft werden <strong>und</strong> die Verlagerung der Prozesse ins <strong>Internet</strong> sind<br />
essentieller Bestandteil der aktuellen <strong>und</strong> zukünftigen Forschung zum <strong>Internet</strong>.<br />
Literatur<br />
Becker, J.: <strong>Internet</strong> & Co: Historie, Technik <strong>und</strong> Geschäftsmodelle für den Handel. In: <strong>Internet</strong><br />
& Co. <strong>im</strong> Handel. Hrsg. Ahlert, D. Berlin u.a. 1999. S. 81-110.<br />
Becker, J.; Ehlers, L. H.; Schütte, R.: Gr<strong>und</strong>sätze ordnungsmäßiger Modellierung. Konzeption,<br />
Vorgehensmodell, technische Realisierung, Nutzen. In: Grote, U. (Hrsg.): Statusseminar<br />
des BMBF. Softwaretechnologie. Bonn 1998. S. 63-93.<br />
Becker, J.; Schütte, R.: Handelsinformationssysteme. 2. Auflage. Berlin u.a. 2004.<br />
Berners-Lee, T.: Der Web-Report. Ulm 2003.
Berners-Lee, T.; Hendler J.; Lassila, O.: The Semantic Web.<br />
http://www.scientificamerican.com/article.cfm?articleID=00048144-10D2-1C70-<br />
84A9809EC588EF21&catID=2. Abrufdatum 15.02.2004.<br />
Brelage, C.; Ehlers, L.; Thygs, M.: Unterstützung von CRM durch Content Management-<br />
Systeme am Beispiel von <strong>Internet</strong>portalen. In: Customer Relationship Management<br />
<strong>im</strong> Handel. Strategien, Konzepte, Erfahrungen. Hrsg.: Ahlert u.a. Berlin u.a. 2002.<br />
Duden. Die deutsche Rechtschreibung. Auf der Gr<strong>und</strong>lage der neuen amtlichen Rechtschreibregeln.<br />
Mannhe<strong>im</strong> 2002.<br />
Ehlers, L. H.: Content Mangement Anwendungen. Spezifikation von <strong>Internet</strong>-Anwendungen<br />
auf Basis von Content Management Systemen. Berlin 2003.<br />
Hansen, H. R.; Neuman, G.: Wirtschaftsinformatik I. 8. Auflage. Stuttgart 2001.<br />
Stahlknecht, P; Hasenkamp, U.: Einführung in die Wirtschaftsinformatik. 10. Auflage. Berlin<br />
u.a. 2001.<br />
Zerdick, A. u.a.: Die <strong>Internet</strong>-Ökonomie. Strategien für die digitale Wirtschaft. 3. Auflage.<br />
Berlin u.a. 2001.