02.12.2012 Aufrufe

Archiving websites Archivierungskonzept für das Intranet der Dresdner

Archiving websites Archivierungskonzept für das Intranet der Dresdner

Archiving websites Archivierungskonzept für das Intranet der Dresdner

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Fachhochschule Potsdam<br />

University of Applied Sciences<br />

Fachbereich Informationswissenschaften<br />

Diplomarbeit<br />

zur Erlangung des Titels Diplom-Archivarin (FH)<br />

Vorgelegt von:<br />

Antje Schlieter<br />

Matr. Nr. 3128<br />

Käthe-Kollwitz-Str. 19<br />

01477 Arnsdorf<br />

Email: schliet@gmx.de<br />

<strong>Archiving</strong> <strong>websites</strong><br />

<strong>Archivierungskonzept</strong> <strong>für</strong> <strong>das</strong> <strong>Intranet</strong><br />

Gutachter:<br />

1. Prof. Dr. Volker Schockenhoff<br />

2. Prof. Dr. Hartwig Walberg<br />

<strong>der</strong> <strong>Dresdner</strong> Bank AG<br />

Bearbeitungszeitraum: 1. April – 1. Juli 2003


Vorwort<br />

Die Entwicklung des <strong>Archivierungskonzept</strong>s ist ein Ergebnis <strong>der</strong> guten<br />

Zusammenarbeit sowohl zwischen den Archiven als auch zwischen dem<br />

Historischem Archiv, <strong>der</strong> <strong>Intranet</strong>redaktion und <strong>der</strong> IT-Abteilung in <strong>der</strong><br />

<strong>Dresdner</strong> Bank.<br />

Einen ganz beson<strong>der</strong>en Dank geht an folgende Personen:<br />

- Wolfgang Richter (Historisches Archiv)<br />

- Dirk Lixfeld (Leiter <strong>der</strong> <strong>Intranet</strong>redaktion)<br />

- Alexan<strong>der</strong> Wolf (Leiter des IT-Support´s)<br />

- Bruno Pasqualotto (Mitarbeiter in <strong>der</strong> <strong>Intranet</strong>redaktion)<br />

- Daniel Oehler (Entwickler des HTML-XML-Konverters)<br />

- Rudolf Schmitz (Archiv <strong>der</strong> sozialen Demokratie in Bonn)<br />

Die vorliegende Diplomarbeit wurde im Auftrag des Historischen Archivs<br />

<strong>der</strong> <strong>Dresdner</strong> Bank AG geschrieben. Die Nutzungsrechte <strong>der</strong><br />

Arbeitsergebnisse liegen uneingeschränkt bei dem Unternehmen.


Inhaltsverzeichnis<br />

1. Einleitung...............................................................................................1<br />

2. Das Historische Archiv <strong>der</strong> <strong>Dresdner</strong> Bank und die<br />

Archivierung des <strong>Intranet</strong>s ................................................................2<br />

2.1 Ein Beispiel......................................................................................2<br />

2.2 Das Projekt.......................................................................................3<br />

3. Die Durchführung ................................................................................5<br />

3.1 Vorbereitung....................................................................................5<br />

3.1.1 Das Projekt "Internet Archiv" im Archiv <strong>der</strong> sozialen<br />

Demokratie .............................................................................6<br />

3.2 Analyse und Tests in <strong>der</strong> <strong>Intranet</strong>redaktion.....................................8<br />

3.3 Abschlussbesprechung.....................................................................9<br />

4. Archivierung von Webseiten ..........................................................10<br />

4.1 Allgemeines ...................................................................................10<br />

4.2 Projekte ..........................................................................................10<br />

4.3 Herangehensweisen .......................................................................11<br />

4.4 Metadaten ......................................................................................12<br />

4.5 Technische Fragen.........................................................................14<br />

5. Das <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank AG.............................................15<br />

5.1 Definition des Begriffes <strong>Intranet</strong> ...................................................15<br />

5.2 Bedeutung des <strong>Intranet</strong>s <strong>für</strong> die <strong>Dresdner</strong> Bank ............................15<br />

5.3 Entwicklung...................................................................................16<br />

5.4 Verantwortlichkeiten .....................................................................17<br />

5.5 Angebote im intranet <strong>der</strong> <strong>Dresdner</strong> Bank ......................................18<br />

5.5.1 Das Portal..............................................................................18<br />

5.6 Verwaltung <strong>der</strong> Informationen......................................................20<br />

5.7 Publikation <strong>der</strong> Webcontents.........................................................20<br />

5.7.1 Contents des <strong>Intranet</strong>s...........................................................20<br />

5.7.2 Webpublishing-Prozess mit dem Content-Management-<br />

System...................................................................................22<br />

5.7.3 Das CMS "infosite" ..............................................................24<br />

5.8 Der <strong>Intranet</strong>-Styleguide .................................................................24<br />

5.8.1 Der Styleguide 2.1 ................................................................25<br />

5.8.3 Der Styleguide 3.0 ................................................................27<br />

5.9 Schlussfolgerung............................................................................28<br />

6. Ablauf <strong>der</strong> Archivierung ..................................................................30<br />

6.1. Archivierungsstrategien <strong>für</strong> <strong>das</strong> <strong>Intranet</strong> .......................................30<br />

6.2 Ablauf <strong>der</strong> Archivierung des <strong>Intranet</strong>s <strong>der</strong> <strong>Dresdner</strong> Bank ...........34<br />

7. Die Bewertung.....................................................................................39<br />

7.1 Ziel <strong>der</strong> Bewertung ........................................................................39<br />

7.2 Bewertungsrichtlinien in Archiven................................................40<br />

7.3 Bewertungsrichtlinien <strong>für</strong> (Teile von) Websites............................43<br />

7.3.1 Auswahlkriterien <strong>für</strong> Online-Publikationen.........................43<br />

7.3.2 Risikoeinschätzung...............................................................47<br />

7.4 Bewertungsstrategien.....................................................................51<br />

I


7.5 Bewertung des <strong>Intranet</strong>s <strong>der</strong> <strong>Dresdner</strong> Bank AG ..........................51<br />

7.5.1 Allgemeines ..........................................................................51<br />

7.5.2 Bewertungskriterien..............................................................52<br />

7.5.3 Spiegelungsintervalle............................................................58<br />

7.5.4 Spiegelungstiefe....................................................................60<br />

7.5.5 Bewertung von CC UK........................................................ 61<br />

7.6 Zusammenfassung .........................................................................64<br />

8. Die Spiegelung.....................................................................................66<br />

8.1 Teleport Pro ...................................................................................67<br />

8.1.1 Zusammenfassung <strong>der</strong> Tests mit Teleport Pro .....................68<br />

8.2 HTTrack.........................................................................................69<br />

8.2.1 Zusammenfassung <strong>der</strong> Tests mit HTTrack...........................70<br />

8.2.2 Fazit ......................................................................................71<br />

8.3 Ansicht im Browserfenster ............................................................71<br />

8.4 Offene Fragen................................................................................72<br />

9. Sicherung und Erhaltung des <strong>Intranet</strong>-Archivs ...........................74<br />

9.1 Allgemeines ...................................................................................74<br />

9.2 Dateiformate <strong>für</strong> die Archivierung ................................................76<br />

9.2.1 Archivierung von Daten mit XML.......................................77<br />

9.3 Archivierungsstrategien.................................................................81<br />

9.3.1 Migration von webbasierten Aufzeichnungen......................82<br />

9.3.2 HTML-XML-Konverter .......................................................83<br />

9.4 Fazit................................................................................................85<br />

10. Zusammenfassung .............................................................................86<br />

10.1 Empfehlungen <strong>für</strong> den Styleguide 3.0 ...........................................88<br />

10.2 Fazit ...............................................................................................89<br />

Glossar........................................................................................................90<br />

Literatur- und Quellenverzeichnis .......................................................93<br />

Quellen im <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank ..................................................98<br />

Anhang………...................................................................................99<br />

II


Abkürzungsverzeichnis<br />

BRAIN Bankwide Resources And Information Network „dresdner<br />

brain“<br />

BINGO Business Information Goes Online<br />

CC Corporate Center (<strong>der</strong> <strong>Dresdner</strong> Bank AG)<br />

CC UK Corporate Center Unternehmenskommunikation<br />

CC UK IK Corporate Center Unternehmenskommunikation Interne<br />

Kommunikation<br />

CC UK IT Corporate Center Unternehmenskommunikation<br />

Informationstechnologie<br />

CD-ROM Compact Disc Read Only Memory<br />

CMS Content-Management-System<br />

CSS Cascading Style Sheets<br />

DVD Digital Versatile Disc<br />

HTML Hypertext Mark-up Language<br />

MIS Markinformationssystem<br />

SGML Standardized Generalized Mark-up Language<br />

TCP/IP Transmission Control Protocol/Internet Protocol<br />

URI Uniform Resource Identifier<br />

URL Uniform Resource Locator<br />

XSL Extensible Stylesheet Language<br />

XML Extenxible Mark-up Language<br />

XHTML Extensible Hypertext Mark-up Language<br />

W3C Word Wide Web Consortium<br />

III


Tabellen- und Abbildungsverzeichnis<br />

Tab. 1 - <strong>Archiving</strong> <strong>websites</strong> – Projekte 99<br />

Tab. 2 - Tabellarische Übersicht zur Darstellung und<br />

Verwaltung <strong>der</strong> <strong>Intranet</strong>angebote<br />

102<br />

Abb. 1 - Metadata-Elemente des Dublin Core-Standards 104<br />

Abb. 2 - Das <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank – <strong>das</strong> erste Portal 105<br />

Abb. 3 - Wie kommen meine Informationen ins Netz? 106<br />

Abb. 4 - Das <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank – <strong>das</strong> Portal 107<br />

Abb. 5 - Das <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank - diverse<br />

108<br />

Screenshots<br />

Abb. 6 - Schema des Webpublishing´s mit einem CMS 110<br />

Abb. 7 - Funktionsweise von Vorlagen (Templates) 110<br />

Abb. 8 - Content Life Cycle 110<br />

Abb. 9 - Meta-Tags im Styleguide 2.1 und <strong>der</strong>en Anwendung 111<br />

Abb. 10 - Auszüge aus dem Styleguide 3.0 112<br />

Abb. 11 - Archivierungsablauf <strong>für</strong> <strong>das</strong> <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong><br />

Bank AG<br />

113<br />

Abb. 12 - Stadsarchief Antwerpen: Metadataschema voor<br />

gearchiveerte <strong>websites</strong> (NL/ [D])<br />

114<br />

Abb. 13 - Beispiele <strong>für</strong> die Online-Benutzung von<br />

115<br />

Webarchiven<br />

Abb. 14 - Zuständigkeiten <strong>der</strong> National Library of Australia<br />

und <strong>der</strong> National Archives of Australia bei <strong>der</strong><br />

Archivierung webbasierter Aufzeichnungen<br />

Abb. 15 - Faktoren <strong>für</strong> die Risikoanalyse <strong>der</strong> National<br />

Archives of Australia<br />

Abb. 16 - Corporate Center Unternehmenskommunikation -<br />

Grafische Darstellung <strong>der</strong> Bewertung nach <strong>der</strong><br />

Besprechung mit Herrn Pasqualotto<br />

Abb. 17 - Corporate Center Unternehmenskommunikation –<br />

Grafische Darstellung über die Umsetzung <strong>der</strong><br />

Bewertung nach <strong>der</strong> Spiegelung<br />

120<br />

Abb. 18 - Corporate Center Unternehmenskommunikation im<br />

<strong>Intranet</strong> – Screenshots zur Spiegelung mit HTTrack<br />

122<br />

Abb. 19 - Teleport Pro – Screenshots <strong>der</strong> „Project Properties“ 123<br />

Abb. 20 - HTTrack - diverse Screenshots 124<br />

Abb. 21 - Das <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank – <strong>das</strong> gespiegelte<br />

Portal<br />

125<br />

Abb. 22 - Vergleich zwischen HTML- und XML-Dokumenten 126<br />

Abb. 23 - Der Ablauf des HTML-XML-Konverters 127<br />

116<br />

117<br />

118<br />

IV


Einleitung<br />

1. Einleitung<br />

Die Entwicklung <strong>der</strong> Webtechnologie bringt neue Perspektiven mit, die<br />

auch auf die Archive zukommen und Teil <strong>der</strong> überlieferungsbildenden<br />

Aufzeichnungen darstellen. Bisher wird jedoch die Archivierung von<br />

Websites nur von wenigen Archiven bzw. Bibliotheken durchgeführt.<br />

Dieser Herausfor<strong>der</strong>ung will sich <strong>das</strong> Historische Archiv <strong>der</strong> <strong>Dresdner</strong> Bank<br />

stellen und mit <strong>der</strong> dauerhaften Bewahrung des <strong>Intranet</strong>s, dem internen<br />

Informationsnetzwerk des Unternehmens, beginnen.<br />

Im Rahmen <strong>der</strong> vorliegenden Diplomarbeit wurde ein Ablauf zur<br />

Archivierung des <strong>Intranet</strong>s <strong>der</strong> <strong>Dresdner</strong> Bank AG entwickelt.<br />

Softwareprodukte wurden zusammen mit den Mitarbeitern aus <strong>der</strong><br />

<strong>Intranet</strong>redaktion sowie <strong>der</strong> IT-Abteilung getestet und ausgewählt.<br />

Bewertungskriterien wurden entwickelt und <strong>der</strong>en Umsetzung mit <strong>der</strong><br />

Anwendung des Softwareproduktes nachverfolgt.<br />

Für die Erhaltung <strong>der</strong> webbasierten Aufzeichnungen über einen längeren<br />

Zeitraum wird eine Migrationsmethode vorgestellt, die im Auftrag <strong>der</strong><br />

Allianz AG entwickelt wurde und <strong>für</strong> Webseiten des <strong>Intranet</strong>s angepasst<br />

werden könnte.<br />

Mit <strong>der</strong> Darstellung <strong>der</strong> Untersuchungsergebnisse werden Empfehlungen <strong>für</strong><br />

die Archivierung des <strong>Intranet</strong>s gegeben. Nicht alle Arbeitsschritte, die <strong>für</strong><br />

die da<strong>für</strong> erfor<strong>der</strong>lich sind, können mit <strong>der</strong> vorliegenden Arbeit eindeutig<br />

geklärt werden. Denn die Archivierung von Websites bietet noch viele<br />

Möglichkeiten <strong>für</strong> weitere Entwicklungen auf diesem Fachgebiet.<br />

1


Das Historische Archiv <strong>der</strong> <strong>Dresdner</strong> Bank und die Archivierung des <strong>Intranet</strong>s<br />

2. Das Historische Archiv <strong>der</strong> <strong>Dresdner</strong> Bank und<br />

die Archivierung des <strong>Intranet</strong>s<br />

Das <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank besteht seit 1996. Es enthält in den mehr als<br />

600.000 Webseiten zunehmend Informationen, die nach Ansicht des<br />

Historischen Archivs Archivwert besitzen. Zu beobachten ist, <strong>das</strong>s<br />

Nachrichten, Pressemittelungen, aktuelle Geschäftsinformationen sowie<br />

interne Rundschreiben, die bisher vollständig im Archiv aufbewahrt<br />

wurden, mittlerweile nur noch online über <strong>das</strong> <strong>Intranet</strong> verfügbar sind.<br />

Hybridüberlieferungen 1 sind vor allem bei den Rundschreiben,<br />

Geschäftsinformationen und Nachrichten am wenigsten zu erwarten. Es<br />

kann nicht davon ausgegangen werden, <strong>das</strong>s die einzelnen<br />

Unternehmensbereiche, die <strong>für</strong> die Inhalte bestimmter <strong>Intranet</strong>angebote<br />

selbst verantwortlich sind, diese auch selbst verwalten und dauerhaft<br />

sichern.<br />

Wie kommen nun die Informationen in <strong>das</strong> Historische Archiv <strong>der</strong> <strong>Dresdner</strong><br />

Bank?<br />

Theoretisch könnten diese digitalen Informationen nach Ablauf <strong>der</strong><br />

gesetzlichen Aufbewahrungsfrist von den Abteilungen des Unternehmens<br />

dem Archiv angeboten werden. Die Abteilungen sind jedoch gesetzlich<br />

nicht dazu verpflichtet. Demnach besteht <strong>für</strong> <strong>das</strong> Archiv die Gefahr, erst<br />

nach mehreren Jahren nicht mehr interpretierbare, unvollständige o<strong>der</strong> gar<br />

keine digitale Informationen zu bekommen. Schließlich existiert auch <strong>das</strong><br />

Problem rückwirkend die Informationen in den ursprünglichen<br />

Zusammenhang darzustellen. Technisch ist dies nur mit einem sehr hohen<br />

Aufwand verbunden, <strong>das</strong> noch keine Garantie <strong>für</strong> eine authentische<br />

Überlieferung ist. Deshalb muss <strong>das</strong> Archiv bereits während <strong>der</strong><br />

Publikationsphase im <strong>Intranet</strong> agieren!<br />

2.1. Ein Beispiel<br />

Ein Beispiel aus <strong>der</strong> jüngsten Vergangenheit soll <strong>das</strong> Dilemma künftiger<br />

Nutzer verdeutlichen. Seit Mitte <strong>der</strong> 90er Jahre führte die <strong>Dresdner</strong> Bank<br />

1 Bei Hybridüberlieferungen existieren sowohl analoge als auch digitale<br />

Aufbewahrungsformen nebeneinan<strong>der</strong>.<br />

2


Das Historische Archiv <strong>der</strong> <strong>Dresdner</strong> Bank und die Archivierung des <strong>Intranet</strong>s<br />

Fusionsgespräche mit verschiedenen Kreditinstituten, die jedoch scheiterten.<br />

Im März 2001 bestätigten die Allianz und die <strong>Dresdner</strong> Bank, Gespräche<br />

zur Schaffung eines integrierten Finanzdienstleisters zu führen. Im Juli<br />

übernahm dann die Allianz Group die Mehrheit des Aktienkapitals <strong>der</strong><br />

<strong>Dresdner</strong> Bank.<br />

Zu dieser Zeit bestand <strong>das</strong> <strong>Intranet</strong> bereits. Es gab Auskunft über den<br />

aktuellen Stand <strong>der</strong> Verhandlungen. Wäre es <strong>für</strong> die Forschung nicht<br />

interessant zu wissen, wie die aktuelle Situation intern den Mitarbeitern im<br />

<strong>Intranet</strong> vermittelt wurde und wie sich die Reaktionen darauf gestalteten?<br />

Im <strong>Intranet</strong> sind sicherlich unter <strong>der</strong> Rubrik „Archiv“ Informationen zu dem<br />

Thema aus Nachrichten, Presseschau, Web-TV und „inside“ 2 verfügbar. Sie<br />

stehen aber nicht im damaligen Kontext des <strong>Intranet</strong>s. Obwohl die<br />

Informationen des „Archivs“ seit 2001 in dem jetzigen Content-<br />

Management-System noch vorliegen, ist es z. B. nicht möglich die<br />

vergangenen Nachrichten mit dem damaligen Börsenkurs anzuzeigen. Die<br />

ursprünglichen Zusammenhänge sind nicht wie<strong>der</strong> herstellbar.<br />

2.2. Das Projekt<br />

Die Bemühungen <strong>für</strong> die dauerhafte Aufbewahrung des <strong>Intranet</strong>s bestanden<br />

seitens des Historischen Archivs seit dem Frühjahr/Sommer 2002. Es<br />

existierten bisher jedoch keine genauen Vorstellungen, wie dieses Vorhaben<br />

realisiert werden sollte. Dazu soll diese Diplomarbeit einen entscheidenden<br />

Teil dazu beitragen, um Methoden und Lösungswege aufzuzeichnen.<br />

Ziel des Archivs ist es, <strong>das</strong>s die Charakteristik des Mediums erhalten bleibt,<br />

so <strong>das</strong>s eine Navigation und Recherche innerhalb des archivierten Teils des<br />

<strong>Intranet</strong>s möglich ist. Die archivierten Aufzeichnungen müssen authentisch,<br />

zuverlässig, lesbar und interpretierbar sein. Das heißt, es muss gewährleistet<br />

sein, <strong>das</strong>s die ursprünglichen strukturellen Zusammenhänge, die<br />

Kontextinformationen und <strong>der</strong> Inhalt dem originalen <strong>Intranet</strong>auftritt<br />

2 „inside“ ist eine Zeitschrift, die während <strong>der</strong> Fusionsgespräche publiziert wurde.<br />

3


Das Historische Archiv <strong>der</strong> <strong>Dresdner</strong> Bank und die Archivierung des <strong>Intranet</strong>s<br />

entspricht 3 und im Zuge <strong>der</strong> Archivierung nicht geän<strong>der</strong>t wird bzw.<br />

manipulierbar ist. Technische Angaben über erfor<strong>der</strong>liche Hardware- und<br />

Softwarekomponenten <strong>für</strong> die Lesbarkeit und Interpretation <strong>der</strong><br />

Informationen müssen zusätzlich verfügbar sein. Deshalb sind weitere<br />

Metadaten sowohl aus dem Quellcode <strong>der</strong> Webseiten in Form <strong>der</strong> Meta-<br />

Tags als auch während des Archivierungsprozesses unbedingt notwendig.<br />

Für die Archivierung des <strong>Intranet</strong>s soll auch die Migrationsstrategie eine<br />

wichtige Rolle spielen. Primär soll vorerst nichtkorrektes HTML in<br />

XHTML umgewandelt werden. Zur Realisierung von Migrationen bestehen<br />

allerdings noch keine Erfahrungen im Archiv <strong>der</strong> Bank.<br />

Für die Benutzung gibt es noch keine genaueren Vorstellungen. Herr<br />

Richter, Ansprechpartner im Historischen Archiv, schlug vor, <strong>das</strong>s die<br />

Snapshots über <strong>das</strong> <strong>Intranet</strong> <strong>für</strong> die Mitarbeitern <strong>der</strong> <strong>Dresdner</strong> Bank abrufbar<br />

sein könnten. Die einzelnen Optionen <strong>für</strong> <strong>das</strong> Online-Webarchiv müssten<br />

aber noch abgesprochen werden. Fest steht, <strong>das</strong>s eine Benutzung im<br />

Historischen Archiv möglich sein soll. Anregungen können sich aus denn<br />

bestehenden Webarchiven entnommen werden.<br />

Der Archivierungsprozess setzt die Festlegung von Abläufen und<br />

Verantwortlichkeiten voraus. Beides ergibt sich nach <strong>der</strong> Diplomarbeit. Das<br />

<strong>Archivierungskonzept</strong> sollte zudem so entwickelt werden, <strong>das</strong>s es auch <strong>für</strong><br />

die Archivierung des Internets anwendbar ist.<br />

Wie aus den einzelnen Ideen und Vorstellungen des Historischen Archivs<br />

ein realisierbarer Ablauf <strong>für</strong> die Archivierung des <strong>Intranet</strong>s <strong>der</strong> <strong>Dresdner</strong><br />

Bank AG entstand, wird in den kommenden Kapiteln näher beschrieben.<br />

3 Vgl. Kapitel 7.2. „Characteristics of a record“ (ISO 15489-1, 2001, S. 7). Nach dem ICA<br />

Guide bestehen elektronische Aufzeichnungen aus Inhalt, Kontext und Strukturangaben,<br />

die zusammen die Geschäftstätigkeit beweisen. „A record is recorded information produced<br />

or received in the initiation, conduct or completion of an institutional or individual activity<br />

and that comprises content, context and structure to provide evidence of the activity.”<br />

(Kapitel 2.1. in: ICA, Guide, 1997)<br />

4


Die Durchführung<br />

3.1 Vorbereitung<br />

3. Die Durchführung<br />

Um dem beschriebenen Archivierungsziel näher zu kommen, fanden im<br />

Vorfeld Besprechungen mit Herrn Richter aus dem Historischen Archiv im<br />

September 2002 statt. Im November wurde ein weiteres Treffen zusammen<br />

mit dem Leiter <strong>der</strong> <strong>Intranet</strong>redaktion, Herr Lixfeld und dem Leiter <strong>für</strong> den<br />

IT-Support, Herrn Wolf, durchgeführt. In den Gesprächen wurden Ziele,<br />

Probleme und Lösungsansätze des Projektes benannt und diskutiert.<br />

Angesprochen wurden die Probleme <strong>der</strong> Datenverwaltung und <strong>der</strong><br />

Speicherformate, vor allem HTML und XHTML. Schwerpunktmäßig sollte<br />

<strong>für</strong> die Diplomarbeit vorerst die „dresdner brain“ analysiert, bewertet und<br />

archiviert werden.<br />

Um die nötigen Untersuchungen durchzuführen, war ich eine Woche in <strong>der</strong><br />

<strong>Intranet</strong>redaktion tätig. Während <strong>der</strong> Untersuchung hat sich <strong>der</strong><br />

Schwerpunkt durch den Einsatz funktionsreicher Spiegelungssoftware auf<br />

den Ablauf <strong>der</strong> Archivierung verlagert.<br />

Als Vorbereitung <strong>für</strong> die Untersuchung in <strong>der</strong> <strong>Intranet</strong>redaktion informierte<br />

ich mich über bereits laufende Projekte zur Archivierung von Websites, um<br />

genauere Vorstellung über die Vorgehensweisen zu bekommen. Die<br />

überwiegende Mehrheit solcher Projekte wird von Bibliotheken betreut, die<br />

entwe<strong>der</strong> nur Teile von Webseiten (z. B. elektronische Publikationen) o<strong>der</strong><br />

Webseiten eines län<strong>der</strong>spezifischen Teils des Internets auf Dauer sichern.<br />

Einzelne ausgewählte Websites werden in den wenigsten Fällen archiviert.<br />

Im deutschsprachigen Raum sind fast gar keine Projekte solcher Art zu<br />

finden. In <strong>der</strong> Fachzeitschrift Der Archivar wurde über <strong>das</strong> Projekt „Internet<br />

Archiv“ im Archiv <strong>der</strong> sozialen Demokratie in Bonn berichtet 4 . Nach<br />

meiner Auffassung ist es <strong>der</strong>zeit <strong>das</strong> einzige Webarchivierungsprojekt in<br />

Deutschland. Dieses konnte ich vor Ort anschauen.<br />

4 Vgl. Schmitz, Archivierung, 2002.<br />

5


Die Durchführung<br />

3.1.1 Das Projekt „Internet Archiv“ im Archiv <strong>der</strong> sozialen<br />

Demokratie<br />

Das Projekt „Internet Archiv“ besteht seit 1998 im Archiv <strong>der</strong> sozialen<br />

Demokratie, Abteilung Digitale Sammlung. Das Ziel des Projektes ist, die<br />

Internetauftritte <strong>der</strong> SPD zu archivieren und diese auf Dauer zu sichern.<br />

Dazu gehören die Auftritte <strong>der</strong> SPD auf Bundesebene, <strong>der</strong><br />

Bundestagsfraktion und <strong>der</strong> 16 Landesverbände mit ihren<br />

Unterglie<strong>der</strong>ungen sowie die Webauftritte <strong>der</strong> Friedrich-Ebert-Stiftung, u.a.<br />

mit <strong>der</strong> Son<strong>der</strong>seite zur Europawahl und des Archivs <strong>der</strong> sozialen<br />

Demokratie. Um die Charakteristik <strong>der</strong> Webtechnologie beizubehalten, so<br />

<strong>das</strong>s die Funktionalitäten <strong>der</strong> Navigation, Javascripten, Links und an<strong>der</strong>e<br />

Beson<strong>der</strong>heiten erhalten bleiben, wird <strong>der</strong> gesamte Internetauftritt mit<br />

Teleport Pro gespiegelt 5 . Bei <strong>der</strong> Auswahl <strong>der</strong> Archivierungsmethode war<br />

<strong>für</strong> <strong>das</strong> Archiv wichtig, <strong>das</strong>s, im Gegensatz zu einem einfachen Download<br />

o<strong>der</strong> <strong>der</strong> Kopie von Dateien, die ursprünglichen Zusammenhänge erhalten<br />

bleiben. Die Kriterien <strong>für</strong> die Spiegelungsintervalle und –tiefe sind noch<br />

nicht festgelegt. Beson<strong>der</strong>s die Spiegelungsintervalle sind Ziele, die noch im<br />

Rahmen eines Projektes angestrebt werden. Bisher wurden die<br />

Internetauftritte auf Bundesebene dreimal, auf Landesebene zweimal<br />

gespiegelt, die mit individuell festgelegten Terminen (z. B. bei<br />

Wahlkämpfen) ergänzt werden. Die Spiegelungstiefe richtet sich in erster<br />

Linie nach <strong>der</strong> zu spiegelnden Ausgangsseite. Allgemein wird davon<br />

ausgegangen, <strong>das</strong>s bei <strong>der</strong> Spiegelung <strong>der</strong> Startseite eine tiefergehende<br />

Linkebene gewählt wird. Innerhalb des selben Pfades wird <strong>für</strong> die Startseite<br />

von www.spd.de eine Linktiefe von sieben Ebenen angegeben. Die<br />

Spiegelung dauert je nach Einstellung nur wenige Minuten. Das<br />

heruntergeladene Ergebnis wird auf Links überprüft, die von <strong>der</strong> Software<br />

nicht weiter verfolgt wurden. Da Teleport Pro selbst keine<br />

Protokollmöglichkeit bietet, wird <strong>der</strong> Archivierungsprozess analog<br />

protokolliert.<br />

Im folgenden Schritt werden die Dateien <strong>für</strong> <strong>das</strong> Brennen aufbereitet. Von<br />

dem gespiegelten Internetauftritt wird ein Index erstellt, <strong>der</strong> mit den Daten<br />

5 Zum Begriff „Spiegelung“ siehe S. 11f. und S. 67.<br />

6


Die Durchführung<br />

anschließend auf CD-ROM geschrieben wird. Das Ergebnis auf CD-ROM<br />

wird abschließend mit <strong>der</strong> gespiegelten Datenmenge verglichen. Das<br />

ausgewählte Speichermediums bereitet einige Schwierigkeiten, da<br />

zusätzliche und zeitaufwendige Arbeitsschritte erfor<strong>der</strong>lich sind 6 . Nach<br />

Ansicht von Herrn Schmitz stellt nicht die Speicherkapazität 7 des<br />

Speichermediums <strong>das</strong> Problem dar, son<strong>der</strong>n die begrenzte Länge <strong>der</strong><br />

Verzeichnungskette. Die Begrenzung verhin<strong>der</strong>t <strong>das</strong> Abspeichern von<br />

Dateien mit langen Pfadnamen. Deshalb wird eine Komprimierung <strong>der</strong><br />

Datenmenge, die auf <strong>das</strong> Medium gebrannt werden soll, durchgeführt. Denn<br />

die Dateien werden anschließend als Ganzes betrachtet, so <strong>das</strong>s die Länge<br />

<strong>der</strong> Dateinamen kein Problem mehr darstellt.<br />

Für die Präsentation wird vor die archivierte Website eine Eingangsseite<br />

gestellt. Sie enthält: Name, Signatur, Datum sowie die Funktionen „Seite<br />

anzeigen“, „Recherche in <strong>der</strong> Seite“ und „Beenden“. Für die Darstellung <strong>der</strong><br />

archivierten Seiten wird <strong>der</strong> entsprechende Browser und <strong>für</strong> die<br />

eingebundenen Formate die entsprechenden Programme benötigt (Acrobat<br />

Rea<strong>der</strong>, Word o.a.). Wird die Rechercheoption ausgewählt, erscheint dem<br />

Benutzer ein gewohntes Bild, wie es bei Suchmaschinen üblich ist. Die<br />

Treffer werden in einem Ranking mit dem Link angezeigt.<br />

Eine Migrationstrategie besteht zur Zeit noch nicht. Ferner werden die<br />

archivierten Snapshots nicht mit einer Archivsoftware verwaltet. Sie werden<br />

einerseits über die Verzeichnungsstruktur auf <strong>der</strong> Festplatte verwaltet und<br />

an<strong>der</strong>erseits auf CD-ROM gespeichert.<br />

Um eine genaue Vorstellung von dem Spiegelungsprozess zu bekommen,<br />

hat Herr Schmitz einen Test von dem Internetauftritt <strong>der</strong> <strong>Dresdner</strong> Bank AG<br />

www.dresdner-bank.com durchgeführt. Für die Spiegelung wurde<br />

eingestellt: eine Linktiefe von 3 Ebenen, alle Arten vorhandener Inhalte<br />

sowie ein externer Link. Die Spiegelung war nach ungefähr fünf Minuten<br />

6 Nach Meinung von Herrn Schmitz würde er aus heutiger Sicht nicht mehr CD als<br />

Speichermedium empfehlen, son<strong>der</strong>n Magnetbän<strong>der</strong> (Streamer) verwenden.<br />

7 Die Speicherkapazität einer CD-ROM beträgt ca. 650 MB (Stichwort „CD-ROM“ in:<br />

Barnert, Brockhaus, 2003). Eine Spiegelung vom 22.11.01 umfasste 486 MB. (SCHMITZ,<br />

S. 136)<br />

7


Die Durchführung<br />

abgeschlossen. Im Ergebnis wurden von 1440 gefundenen Dateien 1332<br />

angenommen, die insgesamt knapp 100 MB umfassten. Was mit den<br />

restlichen Dateien passiert, konnte nicht geklärt werden.<br />

Die Präsentation des Projektes und die Durchführung einer Spiegelung<br />

waren sehr hilfreich <strong>für</strong> <strong>das</strong> weitere Vorgehen, <strong>für</strong> die Untersuchung in <strong>der</strong><br />

<strong>Intranet</strong>redaktion <strong>der</strong> <strong>Dresdner</strong> Bank.<br />

3.2 Analyse und Tests in <strong>der</strong> <strong>Intranet</strong>redaktion<br />

Vom 10.-14. Februar 2003 führte ich daraufhin Untersuchungen in <strong>der</strong><br />

<strong>Intranet</strong>redaktion <strong>der</strong> <strong>Dresdner</strong> Bank AG durch, um mich genauer mit dem<br />

<strong>Intranet</strong>, dessen Aufbau, <strong>der</strong>en Verantwortlichkeiten, <strong>der</strong> eingesetzten<br />

Technik und <strong>der</strong> Verwaltung von <strong>Intranet</strong>inhalten auseinan<strong>der</strong> zu setzen 8 .<br />

Daraus waren Bewertungsentscheidungen und eine Archivierungsmethode<br />

abzuleiten.<br />

Herr Pasqualotto (Ansprechpartner in <strong>der</strong> <strong>Intranet</strong>redaktion <strong>für</strong> <strong>das</strong><br />

Publizieren <strong>der</strong> Inhalte mit dem CMS) führte mich in die Komplexität des<br />

<strong>Intranet</strong>s ein. Er zeigte mir an einem Beispiel, wie die Inhalte über <strong>das</strong><br />

Content-Management-System (CMS)„infosite“ publiziert werden.<br />

Neben <strong>der</strong> Bewertung des gesamten <strong>Intranet</strong>auftrittes und <strong>der</strong>en Kategorien<br />

wurde an einem Einzelbeispiel, dem <strong>Intranet</strong>auftritt von dem Corporate<br />

Center Unternehmenskommunikation (CC UK), Bewertungskriterien aus<br />

archivischer Sicht mit denen des IT-Fachpersonals verglichen und<br />

schließlich <strong>der</strong>en Umsetzung mit <strong>der</strong> ausgewählten Spiegelungssoftware<br />

verfolgt. Die Ergebnisse werden im Kapitel „Bewertung“ ausführlich<br />

dargestellt.<br />

Die Auswahl <strong>der</strong> Spiegelungssoftware wurde gemeinsam mit den Kollegen<br />

<strong>der</strong> <strong>Intranet</strong>redaktion (Herr Pasqualotto), des IT-Bereichs (Herr Wolf) und<br />

des Historischen Archivs (Herr Richter) durchgeführt. Zur Auswahl standen<br />

die am häufigsten gewählten Softwareprodukte, die bereits in<br />

8 Die dargestellten Ergebnisse sind aus dem Zeitraum <strong>der</strong> Untersuchung. Än<strong>der</strong>ungen im<br />

<strong>Intranet</strong>, die später durchgeführt worden sind, werden nicht mehr berücksichtigt.<br />

8


Die Durchführung<br />

Webarchivierungsprojekten angewendet werden. Das sind Teleport Pro und<br />

HTTrack. Nach mehreren Testläufen mit <strong>der</strong> Startseite des <strong>Intranet</strong>s wurde<br />

sich <strong>für</strong> HTTrack entschieden. Anschließend wurden mit HTTrack<br />

Spiegelungstests mit verschiedenen Einstelllungen durchgeführt. Detaillierte<br />

Ausführungen sind im Kapitel „Spiegelung“ nachzulesen.<br />

Ein weiterer Schwerpunkt <strong>der</strong> Untersuchung lag in <strong>der</strong> Frage, wie die<br />

gespiegelten Dateien dauerhaft gesichert und erhalten werden können. Mit<br />

dem Ziel, diese Informationen den kommenden Generationen zur<br />

Verfügung zu stellen, ging es um <strong>das</strong> Problem, wie HTML-Dateien nach<br />

XHTML konvertiert werden können. Die Migration sollte ohne bzw. mit<br />

sehr geringem Informationsverlust schnell durchführbar sein. Das ist nach<br />

Ansicht von Herrn Oehler möglich. Er ist Entwickler eines HTML-XML-<br />

Konverters, <strong>der</strong> im Auftrag <strong>der</strong> Allianz AG entstand. Den<br />

Konvertierungsprozess konnte ich zusammen mit Herrn Richter anschauen.<br />

Genaueres ist im Kapitel „Sicherung und Erhaltung von Webseiten“ zu<br />

erfahren.<br />

3.3 Abschlussbesprechung<br />

Nachdem die Ergebnisse <strong>der</strong> Untersuchung <strong>für</strong> <strong>das</strong> Projekt zur Archivierung<br />

des <strong>Intranet</strong>s <strong>der</strong> <strong>Dresdner</strong> Bank in einem Entwurf <strong>der</strong> Diplomarbeit<br />

zusammengetragen und weiterentwickelt wurden, fand abschließend eine<br />

Besprechung mit den Verantwortlichen aus dem Historischen Archiv und<br />

des IT-Support´s statt. Demnach wird <strong>das</strong> Projekt nach <strong>der</strong><br />

Untersuchungsphase fortgeführt. Das entwickelte <strong>Archivierungskonzept</strong>, <strong>der</strong><br />

Archivierungsablauf <strong>für</strong> <strong>das</strong> <strong>Intranet</strong> und die Bewertungskriterien sind <strong>für</strong><br />

die <strong>Dresdner</strong> Bank umsetzbar.<br />

9


Archivierung von Webseiten<br />

4.1 Allgemeines<br />

4. Archivierung von Webseiten<br />

Die Webtechnologie hat sich seit Anfang <strong>der</strong> 90er Jahre des vergangenen<br />

Jahrhun<strong>der</strong>ts rapide entwickelt. Es werden immer mehr Informationen über<br />

<strong>das</strong> Web verteilt und sind einer immer breiter werdende Masse an Benutzern<br />

zugänglich. Die Informationen verschwinden sehr schnell. Im Internet<br />

än<strong>der</strong>n sich Webseiten durchschnittlich alle zwei bis fünf bzw. zwei bis<br />

sechs Monate 9 . Die Computertechnologie wechselt so schnell, <strong>das</strong>s nach<br />

Meinung <strong>der</strong> National Library of Australia die Schnittstellen zwischen den<br />

Systemen, die technischen Standards und die Dateistrukturen alle 20 Jahre<br />

völlig an<strong>der</strong>s sind als heutzutage 10 .<br />

Das for<strong>der</strong>t Bibliothekare und Archivare heraus. Denn auch diese<br />

Informationen sollten nicht nur <strong>für</strong> die Gegenwart son<strong>der</strong>n auch <strong>für</strong><br />

zukünftigen Generationen erhalten bleiben. Rhetorisch stellt Johan<br />

Mannerheim die Frage, ob nicht auch historisches Interesse an wertvollen<br />

Informationen bestehe, die im World Wide Web (bzw. hier im <strong>Intranet</strong>) zu<br />

finden sind. Deshalb ermutigt er Bibliothekare mit seinem Tagungsbeitrag<br />

„The WWW and our digital heritage – the new preservation tasks of the<br />

library community“ zur dauerhaften Aufbewahrung von Webseiten 11 .<br />

4.2 Projekte<br />

Der Anstoß <strong>für</strong> die Archivierung von Webseiten kam aus dem<br />

Bibliotheksbereich, wie die Projekte 12 zeigen. Mitte <strong>der</strong> 90er Jahre des<br />

vorigen Jahrhun<strong>der</strong>ts begannen einige Bibliotheken mit <strong>der</strong> Sicherung von<br />

Online-Publikationen. Auf dieser Grundlage entstanden Projekte <strong>für</strong> die<br />

Archivierung von einzelnen Websites. Zu nennen ist hier beson<strong>der</strong>s <strong>das</strong><br />

PANDORA-Projekt (Preserving and Accessing Networked Documentary<br />

Resources of Australia) <strong>der</strong> National Library of Australia. Die National<br />

Archives of Australia archivieren dabei Websites <strong>der</strong> Commonwealth-<br />

Regierung. Weitere Meilensteine sind die Archivierung von Internetseiten<br />

9<br />

Die Angaben zur durchschnittlichen Lebensdauer variieren ein wenig. Vgl. 2-6 Monate<br />

nach: Masanès, Web <strong>Archiving</strong>, 2002; 3-5 Monate nach: Mannerheim, heritage, 2000.<br />

10<br />

Vgl. NLA, PANDORA, 2001.<br />

11<br />

Mannerheim, heritage, 2000.<br />

12<br />

Vgl. Tab. 1: <strong>Archiving</strong> <strong>websites</strong> – Projekte.<br />

10


Archivierung von Webseiten<br />

durch „The Internet Archive“, die Archivierung des schwedischen Internets<br />

im Kulturarw3-Projekt, sowie die Gründung <strong>der</strong> Vereinigung EWA<br />

(European Web Archive) und <strong>der</strong> Vereinigung europäischer nationaler<br />

Bibliotheken NEDLIB (Networked European Deposit LIBrary) zur<br />

Entwicklung einer Infrastruktur <strong>für</strong> digitale Publikationen. Aus diesen<br />

Projekten <strong>der</strong> Zusammenarbeit gehen weitere Projekte hervor. Archive sind<br />

auf dem Fachgebiet noch eindeutig unterrepräsentiert. Es ist aber auch<br />

festzustellen, <strong>das</strong>s die Archivierung <strong>der</strong> Websites immer mehr zum Thema<br />

wird 13 .<br />

4.3 Herangehensweisen<br />

In den bereits laufenden Projekten zur Archivierung von Webseiten wird<br />

zwischen zwei Vorgehensweisen unterschieden. Die eine wird oft als<br />

„comprehensive approach“ 14 (vollständige Herangehensweise), die an<strong>der</strong>e<br />

als „selective approach“ (auswählende Herangehensweise) bezeichnet 15 .<br />

Die vollständige Herangehensweise stellt die Sichtweise von<br />

Computerfachleuten dar, <strong>der</strong>en Schwerpunkt es ist, eine Technologie zu<br />

benutzen, um Informationen zu verlinken. Hierbei liegt <strong>der</strong> Fokus auf <strong>der</strong><br />

Entwicklung von Suchmaschinen. Diese Strategie setzt bereits vorhandene<br />

Technik ein, die bei Suchmaschinen wie Google o<strong>der</strong> Altavista angewendet<br />

werden. Auf eine Anfrage des Benutzers wird mit einem „Web crawler“,<br />

auch „Web harvester“ (Engl: Ernter, von „Ernten“ abgeleitet) genannt, <strong>das</strong><br />

gesamte Web nach einem vordefinierten „web space“ durchsucht, z. B. *.de,<br />

*.com, *.dresdner.net. Das Ergebnis wird in einem Ranking dargestellt.<br />

Diese URL-Seiten werden „geholt“ und auf eingebettete Links analysiert.<br />

Das „Ernten“ von Webseiten wird erst beendet, wenn alle URLs des<br />

vordefinierten Bereichs abgefragt wurden.<br />

13 Vgl. Schmitz, Archivierung, 2002. Auch auf <strong>der</strong> Jahrestagung 2003 <strong>der</strong> Vereinigung<br />

deutscher Wirtschaftsarchivare e.V. berichtete Frau Dr. Helen Müller, <strong>das</strong>s <strong>das</strong> Historische<br />

Archiv <strong>der</strong> Bertelsmann AG sich mit dieser Problematik auseinan<strong>der</strong>setzen muss.<br />

14 Im Englischen wird diese Herangehensweise bezeichnet als „comprehensive approach“<br />

o<strong>der</strong> auch „bulk approach“. Julien Masanès beschreibt diese Strategie als eine „automatic<br />

harvesting policies“ (automatisch erntende Strategie). (Masanès, Web <strong>Archiving</strong>, 2001)<br />

15 Vgl. Masanès, Web <strong>Archiving</strong>, 2001; Lyman, <strong>Archiving</strong> WWW, 2002; Mannerheim,<br />

heritage, 2000.<br />

11


Archivierung von Webseiten<br />

Die auswählende Herangehensweise ist aus <strong>der</strong> Sicht von Bibliothekaren<br />

bzw. Archivaren entstanden. Der Bestand (des Webarchivs) setzt sich aus<br />

einer Reihe von Snapshots 16 <strong>der</strong> Website zusammen, die erkennen lassen,<br />

<strong>das</strong>s sich <strong>der</strong> Webauftritt über einen bestimmten Zeitraum geän<strong>der</strong>t hat 17 .<br />

Die Snapshots werden mit einer Spiegelungssoftware erzeugt. Der Vorgang<br />

wird als Spiegelung bezeichnet und setzt Bewertungsentscheidungen nach<br />

Archivierungsintervallen und –tiefe, sowie Ein- bzw. Ausschluss von Links<br />

voraus.<br />

Aus <strong>der</strong> Sicht von Peter Lyman liegt <strong>der</strong> Fokus dieser Strategie auf dem<br />

Inhalt <strong>der</strong> Website und <strong>der</strong> Entwicklung von Katalogisierungsstrategien, wie<br />

z. B. MARC Records o<strong>der</strong> Dublin Core. Mit <strong>der</strong> Aufnahme bzw.<br />

Verzeichnung wird eine hohe Qualität des Bestandes gewährleistet. Den<br />

Bestand bilden ausgewählte Themenbereiche, die als archivwürdig<br />

betrachtet wurden. Die Bewertung erfolgt nach <strong>der</strong> historischen Tragweite<br />

und nach dem speziellen Wert <strong>der</strong> Informationen. Diese sollten bei einer<br />

intellektuellen Erschließung erfasst (z. B. in Form <strong>der</strong> Metadaten) und<br />

recherchierbar gemacht 18 .<br />

4.4 Metadaten<br />

Die Erfassung von Metadaten ist <strong>das</strong> zentrale Element <strong>für</strong> die Verwaltung<br />

und Erhaltung authentischer webbasierter Aufzeichnungen.<br />

„The application of metadata is central to the successful<br />

management of all records including records of web-based<br />

activity.“ 19<br />

„A successful preservation process relies to a large extent on<br />

description of the nature and history of the archival resources: on<br />

metadata, in short. Metadata is also required to guide the way<br />

archived objects are ren<strong>der</strong>ed to and un<strong>der</strong>stood by users.” 20<br />

Metadaten zum Kontext und zur Struktur <strong>der</strong> Aufzeichnungen sind dabei<br />

notwendig, um die Aufzeichnungen zu verstehen und zu benutzen.<br />

16 Definition des Begriffes “Snapshot”:“Full and accurate record copies of an agency´s<br />

public web resources captured at particular points in time.” (NAA, Guidelines, 2001, S. 9)<br />

17 Vgl. NLA, PANDORA, 2001.<br />

18 Vgl. Lyman, <strong>Archiving</strong> WWW, 2002.<br />

19 NAA, Guidelines, 2001, S. 17 f.<br />

20 NLA, PANDORA, 2001.<br />

12


Archivierung von Webseiten<br />

„[…] This is an important concept for electronic records because<br />

metadata about the context and structure of a record is needed to<br />

make the record un<strong>der</strong>standable and usable. As stated in the concept<br />

of a record, information about context is one of the necessary<br />

elements in providing evidence of the activity the record<br />

represents.” 21<br />

Es existieren bereits Metadatenkonzepte, welche von Webpublishern und<br />

welche bei <strong>der</strong> Archivierung verwendet werden können. Für die<br />

Erschließung von Internetquellen gibt es den Bibliotheksstandard Dublin<br />

Core, <strong>der</strong>en Metadata-Elemente in den Meta-Tags <strong>der</strong> Quellcodes<br />

Anwendung finden können 22 . Für die Archivierung werden jedoch nicht<br />

ausreichend Metadaten mit geliefert. Es müssten Ergänzungen<br />

vorgenommen werden, die sowohl die technische Beschreibung <strong>der</strong><br />

webbasierten Aufzeichnungen als auch den Archivierungs- und<br />

Spiegelungsablauf betreffen. Auf diesem Fachgebiet gibt es bereits einige<br />

Projekte 23 .<br />

Nach den Guidelines <strong>der</strong> National Archives of Australia sollten die<br />

Metadaten <strong>für</strong> webbasierte Aufzeichnungen im Webarchiv folgendes<br />

beschreiben 24 :<br />

Allgemeine beschreibende Metadaten<br />

- Titel, URL, (Erst-)Erstelldatum, Än<strong>der</strong>ungsdatum; Von wem erstellt,<br />

geän<strong>der</strong>t o<strong>der</strong> verbessert (Webpublisher, Webdesigner)<br />

- Signatur<br />

- organisatorischer Kontext<br />

- Verwaltungsgeschichte <strong>der</strong> Aufzeichnung<br />

Metadaten, die den Archivierungsprozess betreffen<br />

- Datum und Zeit <strong>der</strong> Erfassung, Erfasser<br />

- Links zur URI mit Versionen und Datum des Links auf die URI<br />

21 Kapitel 2.2 in: ICA, Guide, 1997.<br />

22 Abb. 1: Metadata-Elemente des Dublin Core.<br />

23 Vgl. NEDLIB “Metadata for long term-preservation“ (Lupovici, Metadata, 2000); The<br />

Nordic Metadata Projects. Es liegt nicht im Rahmen dieser Diplomarbeit ein<br />

Metadatenkonzept <strong>für</strong> <strong>das</strong> <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank zu entwickeln.<br />

13


Archivierung von Webseiten<br />

- Technische Details über <strong>das</strong> Design <strong>der</strong> Website<br />

- Details über benutzte Software zur Publikation <strong>der</strong> Webquelle<br />

- Details über enthaltene Anwendungen (MS Office-Programme, o.ä.)<br />

- Details über die Clientsoftware, die zur Ansicht <strong>der</strong> Website benötigt<br />

wird<br />

Angaben zur Archivierung<br />

- Datum und Zeit <strong>der</strong> Archivierung bzw. Spiegelung, Von wem<br />

durchgeführt?<br />

- Än<strong>der</strong>ungen, Fehlermeldungen o.ä.<br />

- Anzahl <strong>der</strong> gespiegelten Dateien, Verzeichnisse<br />

4.5 Technische Fragen<br />

Welche Technologie ist nun nötig, um die Informationen in einem<br />

authentischen Zusammenhang zugänglich zu machen und wie<strong>der</strong>herstellen?<br />

Peter Lyman stellt <strong>für</strong> diese Problematik drei Lösungsansätze vor. Das ist<br />

erstens die Überführung <strong>der</strong> Informationen auf eine neue Plattform<br />

(Migration), zweitens die Überführung <strong>der</strong> Informationen in ein neues<br />

standardisiertes Dateiformat und drittens die Auswahl des<br />

Speichermediums. Denn nach seiner Ansicht wurden die digitalen<br />

Aufzeichnungen nicht <strong>für</strong> die dauerhafte Aufbewahrung, son<strong>der</strong>n eher <strong>für</strong><br />

den vorrübergehenden Gebrauch erstellt. Sie werden schnell ungültig, nicht<br />

mehr lesbar o<strong>der</strong> verschwinden ganz. Die Technologie <strong>für</strong> die Erhaltung <strong>der</strong><br />

Informationen, so be<strong>für</strong>chtet Lyman, wird demnach sehr komplex und teuer<br />

sein werden 25 .<br />

24 Vgl. NAA, Guidelines, 2001, S. 17 f.; Lyman, <strong>Archiving</strong> WWW, 2002.<br />

25 Lyman, <strong>Archiving</strong> WWW, 2002.<br />

14


Das <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank AG<br />

5. Das <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank AG<br />

5.1 Definition des Begriffes „<strong>Intranet</strong>“<br />

Der Begriff des <strong>Intranet</strong>s wird im Allgemeinen wie folgt definiert:<br />

„A site, internal to an organisation, which uses the same network<br />

technology and protocols as a public website, but is for internal or<br />

restricted external use only.” 26<br />

Das <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank AG ist ein unternehmensinternes Netzwerk,<br />

auf <strong>das</strong> nur die Mitarbeiter als definierte Benutzergruppe Zugriff über <strong>das</strong><br />

Log-in o<strong>der</strong> den PC-Benutzerausweis haben. Das Netzwerk ist<br />

ausschließlich <strong>für</strong> die interne Nutzung bestimmt, wobei eine<br />

Kommunikation zwischen <strong>Intranet</strong> und Internet möglich ist. Das erfor<strong>der</strong>t<br />

im hohen Maße Sicherheitsmechanismen, da je<strong>der</strong> <strong>Intranet</strong>-Benutzer (<strong>der</strong><br />

<strong>Dresdner</strong> Bank) auch gleichzeitig Internet-Nutzer ist und umgekehrt 27 .<br />

Das <strong>Intranet</strong> beruht auf dem gleichen technischen Grundlagen wie <strong>das</strong><br />

Internet 28 . Internet- und <strong>Intranet</strong>kommunikation haben die gleiche<br />

Infrastruktur und nutzen identische Client-Software wie z. B. Webbrowser.<br />

Mit dem Browser werden die Informationen dem Nutzer am Bildschirm<br />

sichtbar gemacht. Die Netzwerkkonzepte des Internets und <strong>Intranet</strong>s,<br />

basieren auf dem Protokoll TCP/IP und nutzen alle weiteren<br />

Standardprotokolle des Internets. Die Informationen werden z. Zt.<br />

überwiegend in <strong>der</strong> Dokumentenbeschreibungssprache HTML abgebildet.<br />

Denn HTML wird bereits in einigen Fällen im Internet durch die<br />

Dokumentenspezifikation XML von XHTML ersetzt.<br />

5.2 Bedeutung des <strong>Intranet</strong>s <strong>für</strong> die <strong>Dresdner</strong> Bank<br />

Für die Mitarbeiter hat sich <strong>das</strong> <strong>Intranet</strong> zu einer <strong>der</strong> wichtigsten<br />

Informationsplattform <strong>der</strong> internen Kommunikation entwickelt. Über <strong>das</strong><br />

26 Vgl. NLA, Policy, 2002, S. 5.<br />

27 Lienemann, <strong>Intranet</strong>s, 2003, S. 6.<br />

28 Ebd., S. 5.<br />

15


Das <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank AG<br />

<strong>Intranet</strong> werden die Mitarbeiter schnell, gezielt und umfassend zu wichtigen<br />

Themen, Produkten und Services informiert.<br />

Ziel des <strong>Intranet</strong>s ist es, <strong>das</strong>s <strong>das</strong> Unternehmen und seine Beschäftigten<br />

optimal mit Unternehmensinformationen je<strong>der</strong> Art versorgt werden. Da <strong>das</strong><br />

<strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank keine geheimen Unternehmensinformationen<br />

enthält, wird es auch als „die interne Öffentlichkeit“ bezeichnet. Es werden<br />

über <strong>das</strong> <strong>Intranet</strong> allgemeine Informationen aus Wirtschaft, Politik und dem<br />

Unternehmen veröffentlicht. Daneben enthält es auch plattformüber-<br />

greifende Anwendungen <strong>für</strong> <strong>das</strong> Personalwesen, Marketing, Mitarbeit- und<br />

Kundenservice sowie <strong>der</strong> Datenverarbeitung, die teils durch Passwort-<br />

zugang geschützt sind. Unabhängig von <strong>der</strong> Rechner- und<br />

Betriebssystemarchitektur können diese Anwendungen <strong>für</strong> verschiedene<br />

Systeme zur Verfügung gestellt werden. Das ermöglicht die TCP/IP<br />

basierende Kommunikationstechnologie 29 .<br />

Auf <strong>das</strong> <strong>Intranet</strong> haben weltweit alle Mitarbeiter <strong>der</strong> <strong>Dresdner</strong> Bank Zugang,<br />

die über einen PC verfügen und einen Anschluss an <strong>das</strong> „Corporate<br />

Network“ haben. Sie können auf über 600.000 statische Seiten zugreifen.<br />

Nach einer Statistik vom Juli 2002 gibt es pro Tag ungefähr 220.000<br />

Zugriffe auf <strong>das</strong> <strong>Intranet</strong> 30 .<br />

5.3 Entwicklung<br />

Wie viele Unternehmen erkannte auch die <strong>Dresdner</strong> Bank Mitte <strong>der</strong> 90er<br />

Jahre nicht nur die Vorteile und Potentiale einer Website im Internet,<br />

son<strong>der</strong>n begann die Internet- und Webtechnologie in den<br />

unternehmensinternen Netzen einzubeziehen. Seit Inbetriebnahme des<br />

Telefonverzeichnisses im Juli 1996 hat sich daraus sehr schnell <strong>das</strong> <strong>Intranet</strong><br />

entwickelt.<br />

Zu den weiteren Meilensteinen gehört die Einführung des<br />

Marktinformationsservices (MIS) 1997. Ein Jahr später wurde die erste<br />

Version des Styleguide´s 1.0 gültig und <strong>das</strong> Nachrichtenforum sowie <strong>der</strong><br />

PRIMA-Stellenmarkt entstand. Seit 1999 gibt es die Corporate News. Im<br />

Jahr 2000 gab es die zweite Version des Styleguide´s. Das<br />

29 Vgl. Lienemann, <strong>Intranet</strong>s, 2003, S. 6f.<br />

16


Das <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank AG<br />

Diskussionsforum, BINGO (Geschäftsinformationen und interne<br />

Rundschreiben) und <strong>das</strong> Publishing System wurden eingeführt. Im Jahr<br />

2001 wurde <strong>das</strong> Informationsportal <strong>der</strong> „dresdner brain“ mit dem Styleguide<br />

2.1 an die neuen Corporate Design-Vorgaben angepasst 31 .<br />

Der erste <strong>Intranet</strong>auftritt <strong>der</strong> <strong>Dresdner</strong> Bank stellt eine virtuelle Filiale dar 32 .<br />

Die Informationstafeln in <strong>der</strong> virtuellen Filiale sind weiterführende Links,<br />

die mit den heutigen Rubriken inhaltlich nur noch teilweise identisch sind:<br />

- Firmenkunden (heute: Private Kunden und Geschäftskunden)<br />

- Privatkunden (heute: Private Kunden und Geschäftskunden)<br />

- Investmentbanking<br />

- Assetmanagement (heute: Allianz)<br />

- Mitarbeiter (früher: CC Personal, heute: CC Flächenmanagement)<br />

- Information (heute: externe Dienst MIS)<br />

- Technologie (heute: CC IT)<br />

- Kommunikation<br />

- Einheiten des Konzerns (heute: nur Geschäftsbereiche).<br />

Die Nachrichten gab es nur in <strong>der</strong> Form eines Tickers. Die Presseschau im<br />

<strong>Intranet</strong> existierte dagegen noch nicht. Die <strong>Intranet</strong>seiten wurden extern,<br />

nicht intern wie heute, publiziert. Das Design hatte sich bis zur Einführung<br />

von dem ersten Styleguide 1.0 (Frühjahr 1998) äußerlich kaum geän<strong>der</strong>t.<br />

Eine Rekonstruktion des damaligen <strong>Intranet</strong>auftrittes ist nicht mehr möglich,<br />

son<strong>der</strong>n liegt optisch nur noch als Screenshot vor.<br />

5.4 Verantwortlichkeiten<br />

Die Verantwortlichkeiten <strong>für</strong> <strong>das</strong> <strong>Intranet</strong> sind sowohl zentral als auch<br />

dezentral gelagert 33 . Die übergreifende Leitung liegt im<br />

Unternehmensbereich CC UK IK Redaktion <strong>Intranet</strong> (kurz: <strong>Intranet</strong>-<br />

redaktion). Sie sind Ansprechpartner bei Fragen zum Design. Zusammen<br />

mit dem Unternehmensbereich CC IT werden die technischen<br />

Anfor<strong>der</strong>ungen abgestimmt und realisiert.<br />

30 Vgl. Lienemann, <strong>Intranet</strong>s, 2003, S. 6f.<br />

31 CC UK, Factsheet, 2002.<br />

32 Abb. 2: Das <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank – <strong>das</strong> erste Portal (Screenshot ohne Datum).<br />

33 Abb. 3: „Wie kommen meine Informationen ins Netz?“<br />

17


Das <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank AG<br />

Die Verantwortung <strong>für</strong> die einzelnen <strong>Intranet</strong>auftritte <strong>der</strong><br />

Unternehmensbereiche ist dezentral angelegt. Für die inhaltliche<br />

Darstellung <strong>der</strong> <strong>Intranet</strong>auftritte sind Koordinatoren und <strong>der</strong>en technischen<br />

Umsetzung (nach Styleguide) sind Webpublisher <strong>der</strong> einzelnen<br />

Unternehmensbereiche verantwortlich. Der Publishing-Prozess kann auch<br />

auf Wunsch einzelner Unternehmensbereiche von den Mitarbeitern <strong>der</strong><br />

<strong>Intranet</strong>redaktion durchgeführt werden 34 .<br />

5.5 Angebote im <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank<br />

Die bankübergreifende Startseite wird als die „dresdner brain“, kurz<br />

BRAIN, bezeichnet. Dazu gehört <strong>das</strong> Informationsportal, <strong>der</strong><br />

Konzernavigator, A-Z Index, über die Startseite zugängliche spezielle<br />

Angebote sowie auch solche, die sich in den Rubriken rechts von <strong>der</strong><br />

Inhaltsseite befinden 35 . Das <strong>Intranet</strong>portal ermöglicht einen schnellen<br />

Einstieg zu bankrelevanten Unternehmensnachrichten, zur Presseschau mit<br />

übergreifenden Inhalten 36 , sowie Wirtschaftsmeldungen und Newsticker mit<br />

Links zu weiterführenden Hintergrundinformationen.<br />

Beson<strong>der</strong>s im <strong>Intranet</strong>auftritt <strong>der</strong> <strong>Dresdner</strong> Bank kommt die Fusion mit <strong>der</strong><br />

Allianz zur Geltung. Ehemalige Unternehmensbereiche <strong>der</strong> <strong>Dresdner</strong> Bank,<br />

die zum größten Teil <strong>der</strong> Allianz angeglie<strong>der</strong>t wurden, haben im Titel eine<br />

grün-blaue Färbung.<br />

5.5.1 Das Portal<br />

Das <strong>Intranet</strong>portal besteht aus einer Metanavigationsleiste mit den Links zur<br />

Startseite, zum Telefonbuch und zur Suchfunktion.<br />

Über die vertikale Navigationsleiste kann direkt auf den Konzernnavigator<br />

und dessen Bestandteile die Corporate Centers, Corporate Services,<br />

Corporate & Markets, „Private Kunden und Geschäftskunden“ zugegriffen<br />

werden. Außerdem werden über diese Navigationsleiste folgende<br />

34<br />

Zum Beispiel wird <strong>der</strong> <strong>Intranet</strong>auftritt des Historischen Archivs über die<br />

<strong>Intranet</strong>redaktion eingepflegt.<br />

35<br />

Abb. 4: Das <strong>Intranet</strong> <strong>der</strong> Dresdener Bank – <strong>das</strong> Portal, Abb. 5: Das <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong><br />

Bank – diverse Screenshots vom 12.02.2003.<br />

18


Das <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank AG<br />

Dienstleitungen angeboten: A-Z-Index, BINGO, Business Travel Service,<br />

MIS (aktuelle Börsennachrichten), Mitarbeiter und PRIMA (interner<br />

Stellenmarkt).<br />

Die horizontale Navigationsleiste enthält die Rubriken Nachrichten,<br />

Presseschau, Webmail, Web-TV, Archiv und Forum. Über Webmail kann<br />

<strong>der</strong> Nutzer seine Emails durch sein persönliches Log-in abrufen. Das Web-<br />

TV stellt Videoaufzeichnungen zu relevanten Themen <strong>der</strong> <strong>Dresdner</strong> Bank,<br />

Stellungnahmen und Interviews digital zur Verfügung. Zu beson<strong>der</strong>en<br />

Anlässen werden sie auch live übertragen. Alle Beiträge sind ab 2001 im<br />

Web-TV-Archiv o<strong>der</strong> über die Rubrik Archiv zu finden. Über den Link<br />

Archiv kann auf die zurückliegenden Beiträge <strong>der</strong> Nachrichten,<br />

Presseschau, Web-TV, von „inside“ und auf Mitteilungen des<br />

Bundesverbandes deutscher Banken e.V. zugegriffen werden. Der Zugriff<br />

auf die hinterlegten Informationen erfolgt nicht über eine Datenbankabfrage,<br />

son<strong>der</strong>n über eine Verlinkung des Datums o<strong>der</strong> <strong>der</strong> Edition.<br />

Das <strong>Intranet</strong> ist auch eine Plattform, die den Dialog und <strong>das</strong> Feedback<br />

ermöglicht. Das Diskussionsforum (kurz: Forum) bietet die Möglichkeit des<br />

internen Dialogs. Es gehört zum Forum <strong>der</strong> Allianz Group und ist im<br />

Rahmen des Projektes <strong>Intranet</strong> Deutschland Forum in einem an<strong>der</strong>en<br />

Styleguide erstellt worden.<br />

Weitere Möglichkeiten des Dialogs bieten diverse Newsgroups, um sich<br />

über spezifische Themen zu informieren und mit Kollegen Meinungen<br />

austauschen zu können. Über die Mailbox „offen gesagt“ 37 kann <strong>der</strong><br />

Mitarbeiter Missstände im Unternehmen nennen, die durch eine neutrale<br />

Stelle weiter bearbeitet werden.<br />

Im Inhaltsframe des Informationsportals werden die aktuellen Nachrichten<br />

und Presseschau mit einer kurzen Einleitung (Teaser) angedeutet. Rechts<br />

davon befinden sich mehrere Infoboxen. Dazu zählten zur Zeit <strong>der</strong><br />

Untersuchung: Turnaround-Programm, MIS-News (einschließlich mit<br />

36 Die Presseschau ist unterglie<strong>der</strong>t in <strong>Dresdner</strong> Bank, Allianz AG, Banken und<br />

Versicherungen, Wirtschafts- und Konjunkturpolitik, Politik und Wirtschafts -TV.<br />

37 Vgl. CC UK IK, Plattform, 2002.<br />

19


Das <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank AG<br />

Börsendiagramm), Allianz.com News, Sicherheitshinweise und Gallileo<br />

(Informationsseite zum neuen <strong>Dresdner</strong> Bank-Hochaus „Gallileo“).<br />

5.6 Verwaltung <strong>der</strong> Informationen<br />

Es kann keine allgemeingültige Aussage getroffen werden, wie die<br />

Informationen des gesamten <strong>Intranet</strong>auftrittes abgelegt werden. Denn die<br />

Verantwortlichkeiten liegen in den einzelnen Fachbereichen selbst. Es<br />

können nur Aussagen getroffen werden über die Contents <strong>der</strong> BRAIN 38 und<br />

teilweise von CC UK, die im Zuständigkeitsbereich <strong>der</strong> <strong>Intranet</strong>redaktion<br />

liegen bzw. eingepflegt werden.<br />

Nach Schätzungen von Herrn Lixfeld und Herrn Wolf liegen ca. 20-30 %<br />

<strong>der</strong> Inhalte in Content-Management-Systemen 39 . Die Inhalte <strong>der</strong> „dresdner<br />

brain“ und Teile des <strong>Intranet</strong>auftrittes von CC UK werden über <strong>das</strong> CMS<br />

„infosite“ <strong>der</strong> Firma Sitepark GmbH 40 von verschiedenen Redakteuren<br />

eingepflegt.<br />

Die Serverstruktur ist sehr vielfältig. Es wird davon ausgegangen, <strong>das</strong>s eine<br />

dreistellige Anzahl von Servern existiert. Die <strong>Intranet</strong>redaktion hat nur auf<br />

eine begrenzte Anzahl von Servern Zugriff. Auf dem zentralen Server des<br />

<strong>Intranet</strong>s (BRAIN-Server) sind mehr als 45.000 Seiten abgelegt 41 . Im<br />

Anhang befindet sich eine Übersicht zur Verwaltung <strong>der</strong> <strong>Intranet</strong>angebote 42 .<br />

5.7 Publikation <strong>der</strong> Webcontents<br />

5.7.1 Contents des <strong>Intranet</strong>s<br />

Die Informationen im <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank werden als HTML<br />

dargestellt. Darüber hinaus werden externe Dateien in verschiedenen<br />

Formaten eingebunden (v.a. .gif, .jpg, .pdf, .doc, .wmv 43 sowie vereinzelt<br />

.mpg und .ppt). Für die Formatierung <strong>der</strong> <strong>Intranet</strong>seiten entsprechend<br />

Styleguide werden Vorlagen nach den Cascading Style Sheets (CSS) online<br />

38 Siehe S. 18.<br />

39 Mündliche Auskunft von D. Lixfeld und A.Wolf.<br />

40 Vgl. auch http://www.infosite.de/reference/dresdner.html .<br />

41 Konzernweit sind es etwa 250 Server (mündl. Auskunft von D. Lixfeld und A. Wolf).<br />

42 Vgl. Tab. 2: Tabellarische Übersicht zur Darstellung und Verwaltung <strong>der</strong><br />

<strong>Intranet</strong>angebote.<br />

43 Windows Media Format - .wmv<br />

20


Das <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank AG<br />

bereitgestellt. Dynamische Informationen und Interaktionen werden<br />

teilweise mit Skriptsprachen ausgeführt, z. B. mit Javascript 44 .<br />

Die Webseiten sind überwiegend in Frames gestaltet, so <strong>das</strong>s mehrere<br />

HTML-Dokumente eine Webseite bilden. Innerhalb einer URL können<br />

verschiedene HTML-Dokumente aufgerufen werden.<br />

Der <strong>Intranet</strong>auftritt enthält überwiegend statische Webseiten.<br />

Charakteristisch <strong>für</strong> statische Webseiten ist, <strong>das</strong>s sie genau einen Zustand<br />

nach ihrer Erstellung besitzen 45 . Dazu können die Nachrichten o<strong>der</strong><br />

Pressemitteilungen, Eingangsseiten, „Philosophie und Zielsetzung“ von<br />

einzelnen Corporate Centers, technische Dokumentationen o<strong>der</strong> auch<br />

Standards wie <strong>der</strong> Styleguide zählen.<br />

Nur vereinzelte Webseiten o<strong>der</strong> Informationsangebote werden dynamisch<br />

generiert. Sie unterliegen einem hohen Grad an Aktualität, <strong>der</strong> mit einem<br />

hohen Anspruch an die Verarbeitung und Verwaltung gebunden ist 46 . Dazu<br />

zählen auch Webseiten, <strong>der</strong>en inhaltliche Darstellung durch Nutzerangaben<br />

bestimmt werden. Die Ausgabe jener Inhalte erfolgt durch Datenbanken, in<br />

denen die Dokumente als Objekte hinterlegt sind. Zu den dynamischen<br />

Informationseinheiten des <strong>Intranet</strong>s gehören u.a. <strong>das</strong> Telefonbuch, die<br />

Suchfunktion, <strong>der</strong> Börsenkurs und Newsticker, MIS, Webmail 47 , vereinzelte<br />

<strong>Intranet</strong>auftritte von Unternehmensbereichen (z. B. von CC<br />

Risikocontrolling) und <strong>das</strong> Bildarchiv (Recherche in <strong>der</strong> hinterlegten<br />

Bilddatenbank). Zum Beispiel werden <strong>für</strong> eine Kundenberatung<br />

Anwendungen des <strong>Intranet</strong>s verwendet, die aus einer hinterlegten<br />

Datenbank von dem Unternehmensbereich „Private Kunden und<br />

Geschäftskunden“ bereit gestellt werden.<br />

44<br />

Javascript wurde 1998 als Standard verabschiedet und ist in seinen westlichen<br />

Funktionen und Eigenschaften in den Browserversionen von Mircosoft, Netscape<br />

Communicator und Opera Software verfügbar. (Lienemann, <strong>Intranet</strong>s, 2003, S. 170)<br />

45<br />

Vgl. Büchner, WCM, 2001, S. 29 ff.<br />

46<br />

Ebd.<br />

47<br />

Um die persönliche Email abrufen zu können, benötigt <strong>der</strong> Benutzer kein separates<br />

Programm. Eine HTML-basierte Benutzerschnittstelle stellt alle Funktionen innerhalb <strong>der</strong><br />

Website zur Verfügung. Die Email selbst stellt als Einzeldokument eine statische<br />

Informationseinheit dar. Der gesamte Inhalt <strong>der</strong> Mailbox ist jedoch Än<strong>der</strong>ungen<br />

unterworfen und zählt demnach zu einer dynamisch generierten Informationseinheit.<br />

(Büchner, WCM, 2001, S. 32)<br />

21


Das <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank AG<br />

Eine Mischform aus statischen und dynamischen Seiten sind sogenannte<br />

semidynamische Webseiten. Sie haben überwiegend statischen Charakter<br />

und än<strong>der</strong>n sich unter bestimmten Bedingungen. Dazu können zählen<br />

Telefonlisten, Organigramme o<strong>der</strong> Veranstaltungskalen<strong>der</strong>.<br />

5.7.2 Webpublishing-Prozess mit dem Content-Management-System<br />

Allgemeines zu Content-Management-Systemen<br />

Mit einem Content-Management-System (CMS) können nahezu sämtliche<br />

Administrationsprozesse von Webseiten vollständig übernommen werden.<br />

Sie repräsentieren den gesamten Publikationsablauf und stellen da<strong>für</strong><br />

umfangreiche Funktionen 48 , je nach Anfor<strong>der</strong>ungen, zur Verfügung. Der<br />

Ablauf beginnt mit <strong>der</strong> Informationsrecherche, <strong>der</strong> Zusammenstellung <strong>der</strong><br />

Informationen, Einbettung von Layoutkomponenten, Versionskontrolle,<br />

Auslösung und Steuerung <strong>der</strong> Aktualisierungsprozess bis hin zur<br />

Veröffentlichung <strong>der</strong> Contents.<br />

Die einzelnen Bestandteile <strong>der</strong> Webinhalte liegen in bestimmten Dateien<br />

vor. Neben den herkömmlichen Contents - wie Texte, Bil<strong>der</strong> o<strong>der</strong> Grafiken -<br />

treten auch multimediale, applikationsgebundene, transaktionelle und<br />

Community-Contents auf. Die einzelnen Contents werden gesammelt,<br />

strukturiert und dargestellt. Sie werden getrennt gespeichert und sind<br />

dadurch sehr flexibel weiter zu verwenden 49 .<br />

Das Hauptcharakteristikum von CMS ist die Trennung von Inhalt-, Struktur-<br />

und Layoutangaben 50 . Die Informationen werden separat gespeichert und<br />

verwaltet. Das erhöht die Qualität <strong>der</strong> Website, da die einzelnen Seiten<br />

leichter, besser und schneller aktualisiert werden können. Im<br />

48 Zugangskontrolle und Protokollfunktionen, Datensicherungs- und Rollback-Funktionen,<br />

Mehrplatzfähigkeit, Check-In/ Check-Out <strong>für</strong> die Bearbeitung von Contents, vordefinierte<br />

und (benutzerdefinierte) Metainformationen sowie Festlegung von<br />

Verwaltungsfunktionalitäten, Anfragefunktionalitäten und die Fähigkeit zur Durchführung<br />

von Massenoperationen. Bei umfangreicheren Webauftritten sollte <strong>das</strong> CMS weitere<br />

Funktionen wie Bearbeitung und Verifikation (Prüfung), Aufzeichnung atomarer<br />

Än<strong>der</strong>ungen, Aggregierung und Beziehungen, Versionsverwaltung, Mehrsprachigkeit,<br />

Workflow, Gestaltung, Verarbeitungsfunktionen und die Fremdformatumwandlung<br />

aufweisen. (Rothfuss, CMS, 2001, S. 63 ff)<br />

49 Büchner, WCM, 2001, S. 85 f.<br />

50 Büchner, WCM, 2001, S. 90 f, 101.<br />

22


Das <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank AG<br />

Publikationsprozess ohne CMS nimmt <strong>der</strong> Webmaster eine zentrale Stellung<br />

ein, die bei starken Än<strong>der</strong>ungen sich nachteilig auswirkt und zum<br />

„Flaschenhals“ im Publikationsprozess wird. Mit dem CMS erfolgt <strong>der</strong><br />

Prozess nun unabhängig von <strong>der</strong> Website-Programmierung 51 , so <strong>das</strong>s<br />

Personen ohne technisches Hintergrundwissen einfach Webseiten<br />

publizieren können. Mehrere Redakteure können gleichzeitig publizieren.<br />

Die Arbeitsabläufe und Verantwortlichkeiten werden durch Workflow-<br />

Funktion automatisch gesteuert und verwaltet 52 .<br />

Zum Publizieren werden die Contents in die Vorlagen, den sogenannten<br />

Templates geladen und anschließend in HTML bzw. XHTML generiert 53 .<br />

Bei statischen Webseiten wird die komplette Seite gespeichert. Werden<br />

dagegen dynamische Seiten aufgerufen, werden die Inhalte erst dann in die<br />

Templates geladen und publiziert.<br />

Content Life Cycle<br />

Jede Art von Content durchläuft den Content Life Cycle in den folgenden<br />

Etappen 54 :<br />

- Erstellung <strong>der</strong> Inhalte in verschiedenen Dateiformaten<br />

- Kontrolle durch autorisierte Mitarbeiter<br />

- Freigabe zur Veröffentlichung bzw. Wie<strong>der</strong>vorlage an den Publisher<br />

- Publikation im <strong>Intranet</strong> 55<br />

- Archivierung <strong>der</strong> Contents nach Ablauf <strong>der</strong> Publikationszeit (Sie<br />

werden nicht im archivischen Sinn bewertet, son<strong>der</strong>n sind nicht<br />

mehr verän<strong>der</strong>bar bzw. überschreibbar und werden <strong>für</strong> eine<br />

bestimmte Dauer abgelegt.<br />

51 Büchner, WCM, 2001, S. 90.<br />

52 Abb. 6: Schema des Webpublishing´s.<br />

53 Abb. 7: Laden in Templates.<br />

54 Abb. 8: Content Life Cycle. Vgl. Büchner, WCM, 2001, S. 83 ff.<br />

55 Wird eine Seite aufgerufen, werden die dazugehörigen Vorlagen und die jeweiligen<br />

Contents geöffnet. Die Contents werden in die Templates geladen und dargestellt. Bei<br />

statischen Informationen wird die komplette HTML-Seite auf <strong>der</strong> Festplatte des Web-<br />

Servers hinterlegt, die dieser dann bei Abfrage ohne Rückgriff auf <strong>das</strong> CMS ausliefern<br />

kann. Inhalte einer dynamischen Webseite werden erst durch Anfrage eines Benutzers<br />

zusammengestellt (Büchner, WCM, 2001, S. 107; Bager, CMS, 2002, S. 173). Diese<br />

ausführliche Darstellung des Publikationsprozesse könne bei <strong>der</strong> Auswahl <strong>der</strong><br />

Archivierungsmethode eine Rolle spielen. Um die Web-Contents über eine Schnittstelle aus<br />

dem CMS in ein Archivsystem zu exportieren, muss dabei in Betracht gezogen werden,<br />

23


Das <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank AG<br />

- „Archivierte“ Contents können als Vorlage neu zu publizieren<strong>der</strong><br />

Webseiten dienen<br />

5.7.3 Das CMS „infosite“<br />

Die <strong>Intranet</strong>redaktion arbeitet seit Anfang 2001 mit dem CMS „infosite“ <strong>der</strong><br />

Sitepark GmbH. Mit „infosite“ arbeiten verschiedene Redakteure <strong>der</strong><br />

<strong>Intranet</strong>redaktion. Damit können Inhalte leicht bearbeitet und verän<strong>der</strong>t<br />

werden. Mit <strong>der</strong> Funktion „Verschlagwortung“ werden (Publikations- bzw.<br />

Än<strong>der</strong>ungs-) Datum und Titel <strong>für</strong> die Suchmaschine eingeben. Das System<br />

bietet nicht die Möglichkeit <strong>der</strong> inhaltlichen Verschlagwortung. Über diese<br />

Funktion können ausschließlich <strong>der</strong> Dokumententyp und dessen Platzierung<br />

auf <strong>der</strong> Webseite definiert werden. Welche Inhalte mit „infosite“ eingepflegt<br />

werden, ist in <strong>der</strong> Tabelle 2 ersichtlich 56 .<br />

5.8 Der <strong>Intranet</strong>-Styleguide<br />

Mit <strong>der</strong> Einführung des Styleguide´s im Frühjahr 1998 wurden erstmals<br />

Regeln und Empfehlungen <strong>für</strong> die Strukturierung, die optische Gestaltung<br />

und die technische Umsetzung von <strong>Intranet</strong>angeboten geschaffen 57 . Mit<br />

zunehmen<strong>der</strong> Nutzung des <strong>Intranet</strong>s als Informations- und Dialogplattform<br />

war eine Anpassung hinsichtlich <strong>der</strong> Bedienbarkeit, Transparenz und<br />

Zugriffsgeschwindigkeit notwendig geworden 58 . Der Styleguide wurde in<br />

Zusammenarbeit von Kommunikationsfachleuten, Technikern, Produzenten<br />

und Nutzern gemeinsam überarbeitet und weiterentwickelt. Neu angepasst<br />

und standardisiert wurden Design-Vorgaben, die Technik sowie die<br />

Funktionalitäten. Dieses sollte <strong>für</strong> den Nutzer zu einer besseren<br />

Orientierung innerhalb des <strong>Intranet</strong>s beitragen. Die Erstellung <strong>der</strong> Seiten<br />

sollte <strong>für</strong> die Webpublisher erleichtert werden. Die Design-Vorgaben <strong>für</strong><br />

<strong>das</strong> <strong>Intranet</strong> sollten zu mehr Einheitlichkeit und Unterstützung <strong>der</strong> Corporate<br />

Identity nach innen führen.<br />

Im Mai 2001 wurde <strong>das</strong> neue Corporate Design <strong>der</strong> <strong>Dresdner</strong> Bank<br />

vorgestellt. Im Zuge <strong>der</strong> bankweiten einheitlichen Umsetzung wurde die<br />

<strong>das</strong>s die dynamischen Inhalte nicht in dem CMS vorliegen und auch nur bedingt auf dem<br />

BRAIN-Server abgelegt sein können.<br />

56 Vgl. Tab. 2.<br />

57 Vgl. CC UK IK, Styleguide 2.1, 2001, S. 2.<br />

58 Vgl. CC UK, <strong>Intranet</strong>-Styleguide, 2002.<br />

24


Das <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank AG<br />

Überarbeitung des Styleguide´s notwendig. Das Ergebnis war die noch<br />

heute aktuelle Version, <strong>der</strong> Styleguide 2.1. Diese Version ist seit dem<br />

28. September 2001 gültig und behielt überwiegend Bestandteile <strong>der</strong><br />

Vorgängerversion bei. Die Än<strong>der</strong>ungen betrafen in erster Linie die<br />

Präsentation <strong>der</strong> Marke. Alle Seiten, die nach <strong>der</strong> Vorgängerversion<br />

gestaltet wurden, mussten bis zum 1. Mai 2002 angepasst werden. Das<br />

betraf eine Reihe allgemeingültiger Dateien, die ausgetauscht werden sollten<br />

(CSS, Javascript, Icons, Logo etc).<br />

Die neuen <strong>Intranet</strong>seiten müssen nach Styleguide 2.1 unter Verwendung <strong>der</strong><br />

online verfügbaren Vorlagen publiziert werden.<br />

5.8.1 Der Styleguide 2.1<br />

In dem Styleguide 2.1 werden drei verschiedene Arten <strong>der</strong> Navigation 59<br />

definiert, Richtlinien <strong>für</strong> die Gestaltung <strong>der</strong> Inhalte sowie <strong>für</strong> die technische<br />

Beschreibung gegeben. Darin ist u.a. enthalten, <strong>das</strong>s die Vorlagen sowohl<br />

<strong>für</strong> die Icons als auch <strong>für</strong> die Logos im GIF-Format vorliegen. Ferner wird<br />

empfohlen, Grafiken mit einer maximalen Größe von 10 KB und im GIF-<br />

Format einzubinden 60 . Die Dokumentenbeschreibungssprache ist HTML 61 ,<br />

wobei ein HTML-Standard nach dem W3C nicht verbindlich vorgegeben<br />

wird. Für Formatierungen und Objekteigenschaften werden einige<br />

Möglichkeiten von den Cascading Style Sheets Standards des W3Cs,<br />

Standards CCS 1 und CCS 2, verwendet. Entsprechend dem Corporate<br />

Design wurden mit CSS Vorlagedateien gestaltet 62 .<br />

Der Standard-Browser <strong>der</strong> <strong>Dresdner</strong> Bank ist im Styleguide 2.1 <strong>der</strong> Internet<br />

Explorer 5.x 63 .<br />

59<br />

Die sogenannte I-Navigation besteht aus <strong>der</strong> Metanavigationsleiste (grüne Farbe, Logo,<br />

Links: Home, Suche, Telefonbuch), Bereichsbezeichnung, <strong>der</strong> Navigationsleiste links und<br />

dem Inhaltsframe. Die sogenannte L-Navigation besteht aus <strong>der</strong> Metanavigation,<br />

Bereichsbezeichnungen, einer horizontalen und vertikalen Navigationsleiste und dem<br />

Inhaltsframe. Die Portale enthalten die Metanavigation, Bereichsbezeichnung und den<br />

Navigationsbereich. ( CC UK IK, Styleguide 2.1, 2001, S. 6 ff)<br />

60<br />

CC UK IK, Styleguide 2.1, 2000, S. 19, 28 f., 51.<br />

61<br />

Ebd. S. 32.<br />

62<br />

Ebd. S. 45.<br />

63<br />

Ebd. S. 46. Der Internet Explorer 5.x ist bereits in <strong>der</strong> Lage XML zu interpretieren.<br />

25


Das <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank AG<br />

Metainformation im Meta-Tag<br />

Nach dem Styleguide 2.1 ist eine Einbindung von neun Meta-Tags in die<br />

HTML-Seiten vorgesehen. Die Angaben <strong>der</strong> Metadaten dienen primär dazu,<br />

die Rechercheeffektivität von <strong>der</strong> Suchmaschine im <strong>Intranet</strong> zu verbessern 64 .<br />

Die Umsetzung des Styleguide´s 2.1<br />

Die Untersuchung des <strong>Intranet</strong>s hat ergeben, <strong>das</strong>s die Richtlinien und<br />

Empfehlungen, die mit dem Styleguide 2.1 vorliegen, sehr unterschiedlich<br />

umgesetzt werden.<br />

Überwiegend werden die Vorgaben zum Corporate Design verwendet. Für<br />

wenige <strong>Intranet</strong>angebote werden eigene Style Sheets verwendet 65 .<br />

Die Analyse <strong>der</strong> Dateiformate ergab, <strong>das</strong>s die Webseiten nicht nach einem<br />

HTML-Standard produziert worden waren. Es werden verschiedene<br />

Versionen von HTML verwendet, bei denen nicht nachzuprüfen war, ob sie<br />

den W3C-Standards folgen. Ursache liegt in <strong>der</strong> Akzeptanz <strong>der</strong> Browser, die<br />

auch nicht-korrektes HTML anzeigen können. Logos und Icons liegen, wie<br />

im Styleguide beschrieben, im GIF-Format vor. Bei <strong>der</strong> Einbindung von<br />

Bil<strong>der</strong>n und Fotos wird zunehmend JPEG verwendet. Die Formate <strong>für</strong><br />

Videoaufzeichnungen sind nicht im Styleguide festgehalten. Nach Auskunft<br />

von Herrn Boenke (Redaktion Web-TV, Corporate Publishing) werden die<br />

Beitrage des Web-TV´s im Windows Media Format gespeichert. An<strong>der</strong>e<br />

Videopräsentationen liegen sowohl im Real als auch im Windows Media<br />

Format vor. Vereinzelt sind PowerPoint-Präsentationen im PPT-Format zu<br />

finden.<br />

Es werden zur Zeit nur in Einzelfällen ausführliche Metadaten über die<br />

Meta-Tags eingepflegt 66 . Zum Beispiel weist die <strong>Intranet</strong>seite des<br />

Historischen Archivs diese neun Meta-Tags auf. Sie wurden per Hand in die<br />

Templates des CMS „infosite" eingepflegt.<br />

64<br />

Vgl. Abb. 9: Meta-Tags im Styleguide und <strong>der</strong>en Anwendung, Abb. 9.1: Vorgaben von<br />

Meta-Tags im Styleguide 2.1.<br />

65<br />

CC Risikocontrolling, Corporate & Markets <strong>Intranet</strong>, Tochtergesellschaften/<br />

Beteiligungen, Geschäftsfeld/ Zahlungsverkehrsservice.<br />

26


Das <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank AG<br />

5.8.2 Der Styleguide 3.0<br />

Der kommende Styleguide 3.0 befindet sich zur Zeit in Entwicklung und<br />

wird noch in dem Jahr 2003 eingeführt. Der Anlass <strong>für</strong> die Anpassung des<br />

Styleguide´s waren:<br />

- Verbesserungswünsche aus einer Nutzerbefragung <strong>der</strong> Internen<br />

Kommunikation<br />

- Ergebnisse einer Nutzungsuntersuchung von dem TÜV-Rheinland<br />

- Berücksichtigung <strong>der</strong> gesetzlichen Anfor<strong>der</strong>ungen zur<br />

Barrierefreiheit <strong>für</strong> die Benutzung des Webs durch Behin<strong>der</strong>te<br />

Die Än<strong>der</strong>ungen betreffen einmal <strong>das</strong> Verständnis des <strong>Intranet</strong>s selbst. Das<br />

<strong>Intranet</strong> soll weniger zur Selbstdarstellung genutzt werden. Es soll als ein<br />

aufgabenorientiertes Arbeitsmedium betrachtet werden. Übergreifende<br />

Informationen <strong>der</strong> <strong>Dresdner</strong> Bank sollen immer verfügbar sein. Die<br />

Unterscheidung nach verschiedenen Navigationstypen fällt weg. Alle Seiten<br />

haben den gleichen Aufbau. Navigationspfade, Sitemaps 67 sowie<br />

Neuordnung und Vereinheitlichung <strong>der</strong> Navigation sollen zur Verbesserung<br />

<strong>der</strong> Orientierung beitragen. Die unterschiedlichen Seitentypen resultieren<br />

aus den unterschiedlichen Anfor<strong>der</strong>ungen <strong>für</strong> die Darstellung <strong>der</strong><br />

Informationen. Die visuelle Kennzeichnung soll durch Reduktion verbessert<br />

werden. Das <strong>Intranet</strong> soll browser- und plattformunabhängig zugänglich<br />

sein. Die Realisierung soll standardmäßig durch <strong>das</strong> CMS NPS 5.2 <strong>der</strong><br />

Infopark AG erfolgen. Die interne Kommunikationssprache dieses CMS ist<br />

XML 68 . Zudem soll die Suchmaschine verbessert bzw. ausgetauscht<br />

werden 69 . In den Präsentationsunterlagen des technischen Arbeitskreises<br />

werden bereits einige Beispiele angeführt 70 .<br />

66<br />

Vgl. Abb. 9.2: Meta-Tags im Quellcode des <strong>Intranet</strong>portals (Inhaltsframe); Abb. 9.3:<br />

Meta-Tag im Quellcode <strong>der</strong> Presseschau.<br />

67<br />

In den Sitemaps werden die Contents in <strong>der</strong> Mappenstruktur angelegt, ähnlich <strong>der</strong><br />

Anordnung von Karteikarten. Sie geben einen schnellen Überblick über die Struktur und<br />

Inhalte, die unter einer Webadresse zu finden sind.<br />

68<br />

Weiter Informationen zum CMS NPS 5.2 sind in dem Datenblatt nachzulesen. (NPS 5.2,<br />

Datenblatt, 2002)<br />

69<br />

Techn. Arbeitskreis, Styleguide 3, 2003, S. 2-4.<br />

70<br />

Vgl. Abb. 10: Auszüge aus dem Styleguide 3.0.<br />

27


Das <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank AG<br />

5.9 Schlussfolgerung<br />

Die Analyse des <strong>Intranet</strong>s hat ergeben, <strong>das</strong>s die Verantwortlichkeiten<br />

sowohl zentral bei <strong>der</strong> <strong>Intranet</strong>redaktion als auch dezentral bei<br />

Verantwortlichen <strong>der</strong> Unternehmensbereiche liegen. Die <strong>Intranet</strong>redaktion<br />

hat keine Übersicht über die Verwaltung einzelner Angebote des <strong>Intranet</strong>s,<br />

die außerhalb ihres Zuständigkeitsbereichs liegen.<br />

Ferner werden die Inhalte nicht zentral über ein CMS verwaltet und auf<br />

einem Server abgelegt. Die abgelegten Inhalte auf dem BRAIN-Server sind<br />

nicht identisch mit den Inhalten im CMS „infosite“. Die <strong>Intranet</strong>redaktion<br />

hat keine Übersicht, welche <strong>Intranet</strong>angebote wie und mit welchen CMS<br />

publiziert werden. Das Beispiel von „infosite“ zeigt, <strong>das</strong>s ein CMS keine<br />

Dauerlösung darstellt und nach wenigen Jahren durch die technische<br />

Entwicklung überholt ist. Es ist davon auszugehen, <strong>das</strong>s auch an<strong>der</strong>e<br />

Unternehmensbereiche ihre Technik entsprechend <strong>der</strong> Entwicklung än<strong>der</strong>n.<br />

Der Technikeinsatz <strong>für</strong> die Publikation von <strong>Intranet</strong>seiten ist Än<strong>der</strong>ungen<br />

unterworfen.<br />

Es ist eine große Anzahl von Webservern vorhanden, <strong>der</strong>en Dokumente <strong>der</strong><br />

<strong>Intranet</strong>redaktion zu einem geringen Teil zugänglich sind. Von <strong>der</strong> <strong>Intranet</strong>-<br />

Redaktion werden mehrere Server gleichzeitig verwaltet.<br />

Das <strong>Intranet</strong> besteht überwiegend aus statischen, weniger aus dynamisch<br />

generierten Webseiten. Die Inhalte werden in HTML ausgegeben. Es ist<br />

nicht festzustellen, inwiefern die W3C-Standards <strong>für</strong> diese<br />

Dokumentenbeschreibung umgesetzt werden. Vielmehr muss damit gerecht<br />

werden, <strong>das</strong>s bei <strong>der</strong> hohen Anzahl an Webseiten (> 600.000) viele davon in<br />

nicht-korrektem bzw. älterem HTML-Standards vorliegen. Im Hinblick auf<br />

die Archivierung muss in Betracht gezogen werden, <strong>das</strong>s diese Webseiten<br />

nach kürzerer Zeit nicht mehr gelesen werden könnten. Das ist eine<br />

Tatsache, die allgemein <strong>für</strong> digitale Aufzeichnungen zutrifft, die nicht in<br />

einem Standardformat abgespeichert sind. Das erfor<strong>der</strong>t einen zusätzlichen<br />

Migrationsschritt.<br />

28


Das <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank AG<br />

Die Vorgaben des Styleguide´s sind <strong>für</strong> <strong>das</strong> <strong>Intranet</strong> verbindlich, werden<br />

jedoch nicht von allen Publizierenden 100%ig angewandt. Es ist<br />

festzustellen, <strong>das</strong>s nur im geringem Umfang Metadaten in Meta-Tags<br />

aufgenommen werden. Nur wenige Metadaten liegen über die Herstellung<br />

einer Webseite vor, so <strong>das</strong>s sie keine Basis <strong>für</strong> die Archivierung des<br />

<strong>Intranet</strong>s bilden.<br />

Die <strong>Intranet</strong>redaktion kann aus Zeitgründen die Aufgabe nicht übernehmen,<br />

alle Beiträge des <strong>Intranet</strong>s auf ihre Konformität zu den Styleguide-Vorgaben<br />

zu überprüfen.<br />

Das CMS NPS 5.2, als Standard im Styleguide 3.0 enthalten, wird sich<br />

vorteilhaft auf die Archivierung des <strong>Intranet</strong>s auswirken, da die Datenbasis<br />

bereits im XML vorliegt und in XHTML ausgegeben werden kann. Mit dem<br />

CMS NPS 5.2 können Metadaten besser verwaltet und angewendet werden.<br />

Es ist festzustellen, <strong>das</strong>s <strong>der</strong> neue Styleguide 3.0 nicht nur den Benutzern<br />

son<strong>der</strong>n auch den archivischen Belangen entgegen kommt und sich<br />

vorteilhaft <strong>für</strong> die Archivierung des <strong>Intranet</strong>s auswirken kann. Es besteht<br />

noch die Möglichkeit, Ergänzungen im Entwurf von dem Styleguide 3.0<br />

vorzunehmen 71 .<br />

71 Ergänzung <strong>für</strong> den Styleguide 3.0 werden in <strong>der</strong> Zusammenfassung <strong>der</strong> Diplomarbeit<br />

genannt. (Siehe S. 88)<br />

29


Ablauf <strong>der</strong> Archivierung<br />

6. Ablauf <strong>der</strong> Archivierung<br />

Die Entwicklung des folgenden Ablaufes zur Archivierung des <strong>Intranet</strong>s <strong>der</strong><br />

<strong>Dresdner</strong> Bank ergab sich aus den Ergebnissen <strong>der</strong> Voruntersuchung.<br />

Das Ziel des Archivierungsablaufes ist es, die Charakteristik des Mediums,<br />

die Inhalte, <strong>der</strong>en Struktur und damit verbundene Kontextinformationen<br />

dauerhaft zu sichern und Benutzern zugänglich zu machen. Seitens des<br />

Historischen Archivs war von Bedeutung, <strong>das</strong>s <strong>der</strong> gesamte Prozess wenig<br />

Zeit in Anspruch nimmt, einfach zu handhaben ist und ein authentisches<br />

Archivierungsergebnis des <strong>Intranet</strong>s liefert.<br />

6.1. Archivierungsstrategien <strong>für</strong> <strong>das</strong> <strong>Intranet</strong><br />

Zur Bildung eines sogenannten „<strong>Intranet</strong>archivs“, einem Bestand aus<br />

Snapshots des <strong>Intranet</strong>s, ist es erfor<strong>der</strong>lich, organisatorische Strategien zu<br />

entwickeln, um diesen Prozess zu managen 72 .<br />

Im Fall des <strong>Intranet</strong>s <strong>der</strong> <strong>Dresdner</strong> Bank stehen drei Archivierungsstrategien<br />

zur Diskussion:<br />

1. Datenexport aus dem CMS „infosite“ o<strong>der</strong> von dem BRAIN-Server<br />

über eine XML-Schnittstelle in <strong>das</strong> Archivsystem (FAUST) bzw. auf<br />

den Archivserver<br />

2. Verwendung von Web Crawlern zur vollständigen Archivierung des<br />

<strong>Intranet</strong>s<br />

3. Verwendung einer Spiegelungssoftware zur selektiven Archivierung<br />

des <strong>Intranet</strong>s<br />

72 Vgl. Lyman, <strong>Archiving</strong> WWW, 2002.<br />

30


Ablauf <strong>der</strong> Archivierung<br />

1. Datenexport aus dem CMS infosite o<strong>der</strong> von dem BRAIN-Server<br />

über eine (XML-) Schnittstelle in <strong>das</strong> Archivsystem (FAUST) bzw.<br />

auf den Archivserver<br />

Mit dem Datenaustausch über eine (XML-) Schnitstelle des CMS bzw. vom<br />

BRAIN-Server in <strong>das</strong> Archivsystem könnte die vollständige Übernahme <strong>der</strong><br />

enthaltenen Contents ohne großen Zeitaufwand gewährleistet werden.<br />

Nachteilig jedoch ist, <strong>das</strong>s nicht alle archivwürdigen <strong>Intranet</strong>angebote in<br />

dem CMS bzw. auf dem Server vorliegen. Viele Inhalte und Anwendungen,<br />

wie MIS o<strong>der</strong> BINGO, wären nicht verfügbar, da sie externe Dienste sind.<br />

Es steht die Frage, ob <strong>der</strong> <strong>Intranet</strong>auftritt dann noch authentisch erscheint,<br />

da <strong>der</strong> Zusammenhang <strong>der</strong> Informationen verloren gehen würde. Demnach<br />

wäre es z. B. nicht möglich, Nachrichten und Pressemitteilungen im<br />

Zusammenhang mit den Börsenwerten erscheinen zu lassen. Ein Vorteil des<br />

Mediums, verschiedene extern gespeicherte Informationen miteinan<strong>der</strong> zu<br />

verbinden, wäre mit dieser Archivierungsstrategie nicht möglich.<br />

Zudem ergibt sich ein weiteres Problem. Das Archivsystem ist nicht alleine<br />

in <strong>der</strong> Lage, die Contents in die Templates zu laden. Dazu müsste entwe<strong>der</strong><br />

ein Emulator <strong>für</strong> „infosite“ entwickelt o<strong>der</strong> aber <strong>das</strong> gesamte Programm<br />

archiviert werden. Eine Emulation ist sehr fehleranfällig und erfor<strong>der</strong>t eine<br />

offengelegte Programmdokumentation. Die Entwicklung des Emulators ist<br />

sehr zeit- und kostenaufwendig. Emulationstests unter <strong>der</strong> Leitung von Jeff<br />

Rothenberg zeigen zwar, <strong>das</strong>s diese Archivierungsstrategie <strong>für</strong> die<br />

Archivierung digitaler Informationen anwendbar ist 73 . Aber bisher gibt es<br />

noch keine praktischen Erfahrungen und ist daher abzulehnen.<br />

Zudem ist eine Archivierung des CMSs prinzipiell abzulehnen, da <strong>für</strong> die<br />

dauerhafte Erhaltung und Sicherung <strong>der</strong> Aufzeichnungen immer eine<br />

nichtproprietäre Lösung gewählt werden sollte.<br />

73 Bischoff, Emulation, 1999, S. 18 ff; Rothenberg, Emulation, 2000, S. VI, 83-84.<br />

31


Ablauf <strong>der</strong> Archivierung<br />

2. Verwendung von „Web crawlers“ zur vollständigen Archivierung<br />

des <strong>Intranet</strong>s<br />

„The goal is to collect everything on the Internet by means of<br />

automatic software.“ 74<br />

Die „Web crawlers“ ermöglichen <strong>das</strong> vollständige, automatische<br />

Archivieren von bestimmten Webbereichen 75 . Sie finden vorwiegend<br />

Anwendung bei Projekten 76 , die <strong>das</strong> Ziel verfolgen, <strong>das</strong> gesamte Web, o<strong>der</strong><br />

einen bestimmten Bereich des Webs bzw. eine bestimmte Top-Level-<br />

Domäne 77 , „vollständig“ und regelmäßig zu archivieren. 78<br />

Ich teile die Meinung von Julien Masanès und sehe „Web crawler“ als nicht<br />

geeignet an, um einzelne, individuelle Websites zu archivieren und die<br />

Archivierungsfrequenz anzupassen. Denn einmal müssen <strong>für</strong> den Einsatz<br />

bestimmte Begriffe, Themen o<strong>der</strong> Pfadnamen ausgewählt werden, die den<br />

Wert einer historischen Überlieferung entsprechen könnten. Im Fall des<br />

<strong>Intranet</strong>s <strong>der</strong> <strong>Dresdner</strong> Bank ist dies sehr schwierig, da es thematisch nicht<br />

überschaubar ist und eine Vielzahl an Pfadnamen enthält, die<br />

eingeschlossen werden müssten. Die Gefahr wichtige Informationen zu<br />

verlieren, die nicht dem definierten Raum entsprechen, wäre sehr hoch.<br />

Es könne aber auch die URL des <strong>Intranet</strong>portals eingegeben werden. Von<br />

diesem Pfadnamen aus würden alle weiterführenden URLs weiterverfolgt<br />

kopiert und heruntergeladen werden. Die Grenze zwischen <strong>Intranet</strong> und<br />

Internet könne nicht eingehalten werden, da einige <strong>Intranet</strong>seiten Links zu<br />

Internetauftritten aufweisen, z. B. Online-Publikationen. Die fehlenden F<br />

Filtermöglichkeiten stellen ein weiteres Problem dar, denn aus archivischer<br />

Sicht sind nicht alle aufrufbaren Informationen archivwürdig 79 .<br />

Nachteilig ist ferner, <strong>das</strong>s die Dauer des „Erntens“ nicht abzuschätzen ist.<br />

Denn <strong>der</strong> Kopiervorgang wird erst abgebrochen, wenn alle Dateien aus dem<br />

74 Vgl. Arms, Minerva, 2001.<br />

75 Vgl. Hakala, NEDLIB, 2001.<br />

76 Vgl. Tab. 1 – Projekte: „The Internet Archive“, „Kulturarw3“, „EWA“, „NWA“.<br />

77 Zum Beispiel: .se <strong>für</strong> Schweden, .fr <strong>für</strong> Frankreich, .com<br />

78 Vgl. Lyman, <strong>Archiving</strong> WWW, 2002.<br />

79 Vgl. Kapitel „Bewertung“.<br />

32


Ablauf <strong>der</strong> Archivierung<br />

definierten Bereich gefunden wurden. Schwierig gestaltet sich zudem die<br />

Darstellung des Ergebnisses. Alle gefundenen Informationen werden in<br />

einem Ranking angezeigt und würden nicht in ihrem ursprünglichen<br />

Zusammenhang des <strong>Intranet</strong>s stehen. Das wi<strong>der</strong>spricht dem Ansatz zur<br />

Archivierung von digitalen Aufzeichnungen, <strong>der</strong>en Inhalt,<br />

Kontextinformationen und strukturelle Zusammenhänge zu erhalten 80 .<br />

3. Verwendung einer Spiegelungssoftware zur selektiven<br />

Archivierung des <strong>Intranet</strong>s<br />

„… there is the selective approach where documents deemed<br />

worthy of preservation are selected by humans.“ 81<br />

Bei einer auswählenden Herangehensweise werden archivwürdige<br />

Dokumente durch die intellektuelle Bewertung <strong>für</strong> die Archivierung mittels<br />

einer Spiegelungssoftware ausgewählt. Dieses Vorgehensweise eignet sich,<br />

um den Archivierungsbereich bereits ausgewählte Websites einzugrenzen 82 .<br />

Mit <strong>der</strong> Software werden alle Dateien einer URL bis in eine bestimmte<br />

Verzeichnungsstufe kopiert und heruntergeladen. Es können verschiedene<br />

Filtereinstellungen vorgenommen werden. Die Spiegelung dauert nur<br />

wenige Minuten.<br />

Nachteilig ist, <strong>das</strong>s es mit <strong>der</strong> Software schwer möglich sein wird,<br />

umfangreiche Websites vollständig zu archivieren. Eine Spiegelung ist nicht<br />

geeignet <strong>für</strong> Websites mit interaktiven und überwiegend dynamischen<br />

Webseiten.<br />

Während <strong>der</strong> Untersuchung und Testphase <strong>für</strong> die Archivierung des<br />

<strong>Intranet</strong>s im Februar 2003 schien <strong>für</strong> <strong>das</strong> <strong>Intranet</strong> die auswählende<br />

Herangehensweise mit einer Spiegelungssoftware am geeignetsten. Aus<br />

80 „The preservation of electronic records poses new and demanding challenges for<br />

archivists [...] for records to srve as evidence, the content, context and structure of the<br />

records - which in the electronic environment are independent of the medium – must be<br />

retained. („Records Preservation“ in:: ICA, Guide, 1997)<br />

81 Arvison, Kulturarw3Project, 2000.<br />

82 “A selective approach based on pre-selection, capture and cataloguing of individual Web<br />

sites.” (Masanès, Web <strong>Archiving</strong>, 2002)<br />

33


Ablauf <strong>der</strong> Archivierung<br />

diesem Ansatz heraus resultieren die weiteren Ausführungen zum Ablauf<br />

<strong>der</strong> Archivierung des <strong>Intranet</strong>s.<br />

6.2 Ablauf <strong>der</strong> Archivierung des <strong>Intranet</strong>s <strong>der</strong> <strong>Dresdner</strong><br />

Bank<br />

Im folgenden werden die einzelnen Stationen zum Ablauf <strong>der</strong> Archivierung<br />

des <strong>Intranet</strong>s, wie sie im Schema 83 zu erkennen sind, kurz beschreiben. In<br />

weiteren Kapiteln werden die Bewertung, die Spiegelung sowie <strong>der</strong><br />

Migrationsschritt genauer betrachtet.<br />

<strong>Intranet</strong><br />

Das <strong>Intranet</strong>portal ist <strong>der</strong> Einstieg zu verschiedenen Informationen, die<br />

sowohl innerhalb als auch außerhalb des Intraents (<strong>Intranet</strong>x) sich befinden<br />

können.<br />

Bewertung<br />

Da nicht <strong>das</strong> Ziel ist alle enthaltenen Informationen zu archivieren, müssen<br />

Auswahlkriterien getroffen werden. Die Bewertungsentscheidungen sind zu<br />

protokollieren und ständig zu überprüfen.<br />

Spiegelung<br />

Mit dem Einsatz <strong>der</strong> Spiegelungssoftware werden die<br />

Bewertungsentscheidungen umgesetzt. Es werden demnach bestimmte Filter<br />

gesetzt und die Spiegelungstiefe angegeben. Vor je<strong>der</strong> Spiegelung muss ein<br />

neues Verzeichnis im Computer angelegt werden. Das Programm lädt<br />

entsprechend <strong>der</strong> Einstellung alle Dateien und Ordner <strong>der</strong> <strong>Intranet</strong>seiten in<br />

dieses Verzeichnis nach <strong>der</strong> originalen Datenstruktur ab. Nach wenigen<br />

Minuten liegt ein Snapshot des <strong>Intranet</strong>s (<strong>Intranet</strong>y1) auf <strong>der</strong> Festplatte bzw.<br />

dem Server vor. Die ausgewählte Spiegelungssoftware HTTrack erstellt zu<br />

je<strong>der</strong> Spiegelung eine Protokolldatei im ASCII-Format, die im gleichen<br />

Verzeichnis automatisch gespeichert wird. Anschließend muss <strong>der</strong> Snapshot<br />

mit dem originalen <strong>Intranet</strong>auftritt verglichen und kontrolliert werden. Je<strong>der</strong><br />

weitere Snapshot (<strong>Intranet</strong>y1+ n) wird in einem neuen Verzeichnis abgelegt.<br />

34


Ablauf <strong>der</strong> Archivierung<br />

XML-Dokument mit Metadaten<br />

Metadaten stellen ein wichtiges Element <strong>für</strong> die Archivierung webbasierter<br />

Aufzeichnungen dar. In einer XML-Datei müssen Kontext- und<br />

Strukturangaben angegeben werden. Die Datei wird im gleichen<br />

Verzeichnis wie die Dateien des Snapshot´s abgelegt. Vorbereitende<br />

Dokumente können als Ergänzung <strong>für</strong> die Dokumentation dienen (z. B.<br />

Struktur <strong>der</strong> Website/Webseite, Installationsrichtlinien, System-<br />

beschreibung, Richtlinien <strong>für</strong> den Administrator, Styleguide, o.ä.) 84 .<br />

Für die Erfassung <strong>der</strong> Metadaten kann eine Vorlagedatei, ein XML-<br />

Dokument, verwendet werden. Im Anhang ist eine solche Vorlagedatei auf<br />

Nie<strong>der</strong>ländisch zu finden 85 .<br />

Die fehlenden Metadaten aus dem Quellcode können jedoch nicht<br />

rückwirkend ergänzt werden. Deshlab ist es wichtig, bereits bei <strong>der</strong><br />

Erstellung <strong>der</strong> Webseiten aussagekräftige Metadaten anzugeben!<br />

Migration<br />

Die Migration betrifft in erster Linie HTML-Dateien, da nicht-korrektes<br />

HTML <strong>für</strong> die dauerhafte Archivierung ungeeignet ist. Es wurde bereits<br />

erwähnt, <strong>das</strong> Herr Oehler einen HTML-XML-Konverter entwickelt hat, <strong>der</strong><br />

<strong>für</strong> die Umwandlung von HTML-Seiten des <strong>Intranet</strong>s in XHTML angepasst<br />

werden könnte. Der Vorgang könnte im Anschluss an die Spiegelung<br />

durchgeführt werden, da die Dateien liegen dort bereits in einer<br />

Ordnerstruktur vor.<br />

Drohen an<strong>der</strong>e Text-, Grafik-, Audio- o<strong>der</strong> Videodateiformate zu veralten,<br />

müssen schließlich auch <strong>für</strong> diese Formate Migrationsmethoden angewendet<br />

werden. Da<strong>für</strong> gibt es aber noch keine Lösungsansätze.<br />

Das Ergebnis ist ein Snapshot des <strong>Intranet</strong>s mit migrierten Dateien<br />

(<strong>Intranet</strong>y1´)<br />

83 Vgl. Abb. 11: Archivierungsablauf <strong>für</strong> <strong>das</strong> <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank.<br />

84 “Houd binnen elke versiemap een XML-bestand met de historiek van de website bij<br />

(metadata_versie_X_Y.xml). Vul de metadata aan bij elke wijziging [Verän<strong>der</strong>ung] aan de<br />

website (niet de gekoppelde toepassingen zoals databanken). Met behulp van dit XMLbestand<br />

documenteer je de historiek van de website en kun je achteraf achterhalen waneer<br />

welke webpagina on line was. [Mit Hilfe des XML-Bestandes wird die Geschichte <strong>der</strong><br />

Website dokumentierte und kann später ermittelt werden, wann welche Webseite online<br />

war.]” (Broudrez, David Nr. 5, 2002, S. 5 f.)<br />

85 Abb. 12: Stadsarchief Antwerpen: Metadataschema voor gearchiveerte <strong>websites</strong><br />

(NL/[D]).<br />

35


Ablauf <strong>der</strong> Archivierung<br />

Indexierung<br />

Von <strong>der</strong> gespiegelten und migrierten <strong>Intranet</strong>seite (und evtl. von <strong>der</strong> XML-<br />

Datei mit den Metadaten) wird ein Index (Indexy1´) mittels einer<br />

Indexierungssoftware erstellt. Es besteht bereits eine Vielzahl von<br />

Softwareproduktenzur Indexierung des Webs. Erfahrungen zu dieser<br />

Thematik gibt es bereits aus dem Projekt <strong>der</strong> Nordic Web Archives 86 . Ein<br />

Produkt wurde bisher noch nicht ausgewählt.<br />

Der Index wird auf <strong>das</strong> Archivierungs- und Benutzungsmedium gepseichert.<br />

Damit wird eine Suche innerhalb dieses Mediums möglich.<br />

Recherche und Zugang<br />

Für die Auswahl eines bestimmten Snapshot´s muss eine Suche über die<br />

gesamten Indizes durchgeführt werden. Die Anzahl <strong>der</strong> gesamten Indizes<br />

ergibt sich aus <strong>der</strong> Summe <strong>der</strong> Indizes jedes Indizes eines<br />

Spiegelungsprojektes (Indexy1´ + Indexy2´ + Indexy1+n´). Über die eindeutige<br />

Identifikation des Mediums kann anschließend auf den Snapshot des<br />

<strong>Intranet</strong>s bzw. auf <strong>das</strong> Speichermedium zugegriffen werden.<br />

Archivierungs- bzw. Speichermedium<br />

Für die Archivierung ist ein Speichermedium auszuwählen, <strong>das</strong>s handhabbar<br />

ist, eine lange Lebensdauer aufweist und <strong>für</strong> eine Benutzung geeignet<br />

erscheint. Als Archivierungs- und Benutzungsmedium entschied sich <strong>das</strong><br />

Historische Archiv <strong>für</strong> die CD-ROM. Sie bietet folgende Vorteile:<br />

- Die CD-ROM ist sehr weit verbreitet und eignet sich als<br />

Benutzungsmedium.<br />

- Das Auszeichnungsformat ist in <strong>der</strong> Norm ISO 9660 festgelegt.<br />

- Die Zugriffszeit ist im Vergleich zu Magnetbän<strong>der</strong>n sehr kurz.<br />

- Die durchschnittliche Lebensdauer beträgt ca. 30 Jahre.<br />

- Die Speicherkapazität <strong>der</strong> CD-ROM liegt bei ungefähr 650 MB. Durch<br />

die Weiterentwicklung gibt es bereits CD-ROMs mit einer<br />

Speicherkapazität von 700 o<strong>der</strong> aber auch 850 MBV. Die<br />

86 Vgl. http://nwa.no/aboutNwaT.php<br />

36


Ablauf <strong>der</strong> Archivierung<br />

Speicherkapazität ist demnach ausreichend <strong>für</strong> einen Snapshot des<br />

<strong>der</strong>zeitigen <strong>Intranet</strong>s 87 .<br />

Die Einschränkung <strong>für</strong> die Länge <strong>der</strong> Verzeichnungskette, die dem Archiv<br />

<strong>der</strong> sozialen Demokratie Schwierigkeiten bereitete, kann nach Ansicht von<br />

Herrn Wolf auch durch bestimmte Einstellungen an <strong>der</strong><br />

Spiegelungssoftware verhin<strong>der</strong>t werden. Welche konkreten zusätzlichen<br />

Arbeitsschritte tatsächlich notwendig sind, um den Snapshot mit dem Index<br />

auf <strong>das</strong> Medium zu brennen, wird die Praxis zeigen.<br />

Die Nachfolgetechnologie <strong>der</strong> CD-ROM, die DVD, wird vorerst nicht<br />

verwendet, da die höhere Speicherkapazität von 4,7 GB <strong>für</strong> die <strong>der</strong>zeitigen<br />

Snapshots des <strong>Intranet</strong>s nicht relevant sind. Wohl aber könnten mehrere<br />

Snapshots auf ein Medium gespeichert werden und so eine snapshot-<br />

übergreifende Recherche ermöglichen.<br />

Das Medium sollte regelmäßig kontrolliert und erneuert werden.<br />

Präsentation<br />

Abschließend muss <strong>das</strong> Medium <strong>für</strong> die Präsentation aufbereitet werden.<br />

Für die Benutzung im Historischen Archiv müsste eine Eingangsseite<br />

gestaltet werden, die die Signatur, den Titel, <strong>das</strong> Datum <strong>der</strong> Spiegelung und<br />

die Optionen „Recherche“ und „Sitzung beenden“ enthalten. Für die<br />

Nutzung über <strong>das</strong> <strong>Intranet</strong> müsste eine an<strong>der</strong>e Präsentationsform gewählt<br />

werden, da nur in Auszügen archivierte <strong>Intranet</strong>auftritte zur Verfügung<br />

gestellt werden sollen. Auch da<strong>für</strong> muss eine Webseite gestaltet werden.<br />

Anregungen dazu können aus bereits bestehenden Projekten entnommen<br />

werden 88 . Festzuhalten ist, <strong>das</strong>s <strong>der</strong> Bestand des Webarchivs von dem<br />

Stadsarchief Antwerpen online tabellarisch präsentiert wird und eine gute<br />

Übersicht darstellt. Der Benutzer kann die Metadaten über einen Link<br />

87 Vgl. Spiegelungstest <strong>der</strong> BRAIN. Sie umfassten 100-200 MB. Die Testergebnisse sind<br />

aber nur vorläufig und sollten nach Festlegung <strong>der</strong> Bewertungsentscheidung nochmals<br />

durchgeführt werden. Es ist aber auch zu vermuten, <strong>das</strong>s die maximale Speicherkapazität<br />

<strong>der</strong> CD-ROM nicht überschritten wird.<br />

88 Abb. 13: Beispielge <strong>für</strong> die Online-Benutzung von Webarchiven.<br />

37


Ablauf <strong>der</strong> Archivierung<br />

einsehen. Im Projekt „Nordic Web Archiv“ kann <strong>der</strong> Nutzer über einen<br />

Zeitstrahl die Versionen einer Website einsehen und vergleichen. Beide<br />

Präsentationen sind sehr komfortabel.<br />

Zu beachten ist auch, <strong>das</strong>s die PCs mit <strong>der</strong> entsprechenden Hardware- und<br />

Software ausgestattet sein müssen, damit die Inhalte und Anwendungen<br />

lesbar und interpretierbar bleiben. Dazu zählen u.a. <strong>der</strong> Browser sowie<br />

Text-, Bild- und Videoverarbeitungsprogramme.<br />

38


Die Bewertung<br />

7. Die Bewertung<br />

Nach <strong>der</strong> auswählenden Archivierungsstrategie, die mit einer<br />

Spiegelungssoftware durchgeführt wird, muss nun ein Bewertungskonzepts<br />

entwickelt werden, nachdem eine authentische Überlieferung gebildet<br />

werden kann.<br />

Im Rahmen <strong>der</strong> Untersuchung in <strong>der</strong> <strong>Intranet</strong>redaktion <strong>der</strong> <strong>Dresdner</strong> Bank<br />

wurden die Richtlinien <strong>für</strong> die Auswahl bestimmter <strong>Intranet</strong>auftritte<br />

erarbeitet. Diese Kriterien wurden an dem Beispiel des Corporate Centers<br />

Unternehmenskommunikation angewendet, mit Herrn Pasqualotto (Content<br />

Manager) besprochen und <strong>der</strong>en Umsetzung mit <strong>der</strong> Spiegelungssoftware<br />

HTTrack beobachtet.<br />

Die Bewertung findet bereits im vorarchivischen Aufgabenfeld, während<br />

<strong>der</strong> Publikationsphase <strong>der</strong> <strong>Intranet</strong>seiten, statt. Im Archivierungsablauf <strong>für</strong><br />

<strong>das</strong> <strong>Intranet</strong> steht die Bewertung am Anfang. Denn daraus ergeben sich die<br />

Spiegelungsintervalle und –tiefe, sowie die Einbeziehung und <strong>der</strong><br />

Ausschluss bestimmter Links, Pfade o<strong>der</strong> Domänenbezeichnungen.<br />

7.1. Ziel <strong>der</strong> Bewertung<br />

Bereits am Anfang wurde beschrieben, welche Ziele <strong>das</strong> Historische Archiv<br />

mit dem Projekt verfolgt 89 . Das <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank soll dauerhaft<br />

gesichert und aufbewahrt werden. Es ist nicht <strong>das</strong> Ziel, <strong>das</strong> gesamte <strong>Intranet</strong><br />

zu archivieren. Deshalb müssen Auswahlkriterien entwickelt werden.<br />

Ein Ergebnis <strong>der</strong> Bewertung ist die Erhaltung <strong>der</strong> Beweiskraft von<br />

aufgezeichneten Aufgaben, Prozessen, Aktivitäten und Vorgängen die von<br />

dem Unternehmen bzw. <strong>der</strong>en Beschäftigten ausgeführt werden. Ein an<strong>der</strong>es<br />

zielt darauf hin, die Aufgaben und Funktionen des Registraturbildners<br />

wie<strong>der</strong>zugeben.<br />

Für die National Archives of Australia kann <strong>der</strong> Beweiswert <strong>für</strong> die<br />

Geschäftstätigkeit in Form eines Snapshots des <strong>Intranet</strong>s sein o<strong>der</strong> in<br />

Dokumenten liegen, die sich im <strong>Intranet</strong> befinden.<br />

89 Siehe „Das Projekt“, S. 3<br />

39


Die Bewertung<br />

„An internal agency document which provides evidence of business<br />

activity (it may be a document on an intranet, a snapshot of an<br />

intranet, an internal draft of a publication, a record of a transaction<br />

carried out through a website, an email message, or some other form<br />

of electronic document)” 90<br />

William G. LeFurgy stellt jedoch auf Grund <strong>der</strong> Flüchtigkeit <strong>der</strong><br />

Informationen und <strong>der</strong>en Technik fest, <strong>das</strong>s <strong>der</strong> Beweiswert nicht in<br />

webbasierten Auszeichnungen, son<strong>der</strong>n in an<strong>der</strong>en elektronischen Systemen<br />

o<strong>der</strong> in Papierdokumenten liegen müsste.<br />

„And while things may change in the future, the critical<br />

documentary evidence of an organization’s activities most often<br />

reside somewhere others than the web, such as in other electronic<br />

systems or in paper documents.” 91<br />

Trotz <strong>der</strong> Kontroversen über <strong>das</strong>, was Bewertung wie<strong>der</strong>geben sollte, steht<br />

<strong>für</strong> <strong>das</strong> Historische Archiv <strong>der</strong> <strong>Dresdner</strong> Bank fest, <strong>das</strong>s <strong>das</strong> <strong>Intranet</strong><br />

Informationen beinhaltet, die evident <strong>für</strong> <strong>das</strong> Unternehmen sind. Dazu<br />

zählen vor allem die internen Rundschreiben und aktuellen<br />

Geschäftsinformationen, die über BINGO ausschließlich digital zur<br />

Verfügung stehen.<br />

Ein weiteres Ziel <strong>der</strong> Bewertung ist, <strong>das</strong>s die einzelnen <strong>Intranet</strong>inhalte im<br />

ursprünglichen Zusammenhang erscheinen und <strong>für</strong> eine spätere Nutzung<br />

lesbar und interpretierbar sind.<br />

Ferner sollen die Bewertungsansätze aus Sicht <strong>der</strong> Arbeitsökonomie ohne<br />

großen Zeit- und Personalaufwand gut umsetzbar sein.<br />

7.2. Bewertungsrichtlinien in Archiven<br />

Charakteristisch <strong>für</strong> <strong>das</strong> <strong>Intranet</strong> ist, <strong>das</strong>s es den Mitarbeitern firmeninterne<br />

und –externe Informationen bereitstellt. In <strong>der</strong> Papierwelt entspräche es<br />

einer umfassenden, regelmäßig erscheinenden Unternehmenspublikation,<br />

90 NAA, Policy, 2002, S. 10.<br />

91 LeFurgy, Management, 2001.<br />

40


Die Bewertung<br />

<strong>der</strong>en Ausgaben vollständig vorliegen sollte 92 . Denn die Publikation gibt<br />

Auskunft über Ziele und Schwerpunkte <strong>der</strong> Unternehmenstätigkeit, mit <strong>der</strong><br />

sich häufig Zuständigkeiten und Organisation des Unternehmens än<strong>der</strong>n.<br />

Dazu zählen u.a. Beteiligungen, Tochtergesellschaften und Fusionen.<br />

Publikationen, öffentliche Verlautbarungen des Unternehmens,<br />

Geschäftsberichte, Image- und Produktbroschüren, Pressemittelungen und<br />

interne Rundschreiben stellen eine wichtige Quelle <strong>für</strong> die spätere<br />

Forschung dar 93 . Diese sind vollständig dauerhaft aufzubewahren.<br />

Die Ausführungen von Renate Köhne-Lindenlaub im „Handbuch <strong>für</strong><br />

Wirtschaftsarchive“ über archivwürdige Materialien, sind mit denen des<br />

Historischen Archivs <strong>der</strong> <strong>Dresdner</strong> Bank identisch 94 .<br />

Im <strong>Intranet</strong> befindet sich eine Vielzahl <strong>der</strong> genannten Publikationsarten. Da<br />

die Archivierung des gesamten <strong>Intranet</strong>s nicht im Sinne des Historischen<br />

Archivs ist, müssen Bewertungsentscheidungen nach formalen,<br />

systematisch-inhaltlichen und nachfrageorientierten Kriterien getroffen<br />

werden. Sie werden <strong>für</strong> die Bewertung von Akten verwendet.<br />

Ein Ziel <strong>der</strong> Kriterien ist, Doppelüberlieferungen zu vermeiden. Das betrifft<br />

zum Beispiel Online-Publikationen, die in gedruckter Form vorliegen.<br />

Auswahlkriterien da<strong>für</strong> wurden im Rahmen des PANDORA-Projektes<br />

entwickelt 95 . Weitere Kriterien sind <strong>der</strong> Aggregierungsgrad <strong>der</strong> dargestellten<br />

Informationen, die Lesbarkeit, die Interpretierbarkeit, die Zugänglichkeit,<br />

die Aufbewahrungsfristen (z. B. <strong>für</strong> aktuelle Geschäftsinformationen/<br />

92<br />

Köhne-Lindenlaub, Bewertung, 1998, S. 118f.<br />

93<br />

Ebd.<br />

94<br />

Archivwürdige Materialien sind <strong>für</strong> <strong>das</strong> Historischen Archiv: Geschäftsberichte, Hausund<br />

Kundenzeitschriften, Festschriften zu Jubiläen, Gebäude- und Zweigstelleneinweihungen<br />

und Fusionen, Dokumentationen, veröffentlichte Artikel, Vorträge, Bücher von<br />

Mitglie<strong>der</strong>n <strong>der</strong> Vorstände o<strong>der</strong> sonstiger Leitungsorgane, Presseverlautbarungen, und<br />

Werbematerialien.<br />

95<br />

Vgl. NLA, Selection, 2001.<br />

41


Die Bewertung<br />

Rundschreiben 96 ) sowie die zu erwartende interne als auch externe<br />

Nutzernachfrage 97 .<br />

Für die praktische Umsetzung <strong>der</strong> Bewertung gibt es vier<br />

Bewertungskategorien:<br />

- eindeutig archivwürdig<br />

- eindeutig nicht archivwürdig<br />

- Grenzfälle<br />

- prinzipiell archivwürdig mit Reduzierung bei großen<br />

Überlieferungen<br />

Die Bewertungskriterien, die eben genannten Kategorien und die<br />

Protokollführung zu dem Bewertungsprozess können in <strong>der</strong> digitalen<br />

Umgebung übernommen werden 98 . Denn die Bewertung digitaler<br />

Aufzeichnungen folgt den gleichen Prinzipien. Sie müssen aber,<br />

entsprechend <strong>der</strong> Charakteristik digitaler Informationen, angepasst werden.<br />

Allgemeine Richtlinien <strong>für</strong> die archivische Bewertung digitaler<br />

Informationen sind in Preserving Digital Information aufgeführt. Es ist <strong>das</strong><br />

Ergebnis <strong>der</strong> Arbeitsgruppe Task Force on <strong>Archiving</strong> of Digital Information<br />

und bildet die Grundlage <strong>für</strong> verschiedene Projekte, die sich mit <strong>der</strong><br />

Archivierung von einzelnen Websites befassen 99 . Darin heißt es, <strong>das</strong>s<br />

Auswahlkriterien eine Bewertung beinhalten nach dem Inhalt des Objektes<br />

in Beziehung zum Sammlungsziel des digitalen Archivs, <strong>der</strong> Qualität und<br />

<strong>der</strong> Einzigartigkeit des Objektes:<br />

„In general, selection criteria include an appraisal of the content of<br />

the object – its subject and discipline – in relation to the collection<br />

96<br />

Die gesetzliche Aufbewahrungsfrist <strong>für</strong> interne Rundschreiben als Arbeitsanweisungen<br />

o<strong>der</strong> Organisationsunterlagen [die] zum Verständnis <strong>der</strong> Buchführung erfor<strong>der</strong>lich“ ist,<br />

beträgt 10 Jahre. (Dauen, Aufbewahrungspflichten, 2002, S. 92) Auch die <strong>Dresdner</strong> Bank<br />

besitzt einen internen Fristenkatalog. Inwiefern die Aufbewahrungsfristen <strong>für</strong> <strong>Intranet</strong>angebote<br />

durch die verantwortlichen Unternehmensbereiche eingehalten werden, kann nicht<br />

kontrolliert werden. Da Rundschreiben und Geschäftsberichte <strong>für</strong> <strong>das</strong> Archiv sowieso<br />

archivwürdig sind, hat <strong>das</strong> dieses Kriterium keine Auswirkungen bei <strong>der</strong> Auswahl <strong>der</strong><br />

<strong>Intranet</strong>angebote.<br />

97<br />

Köhne-Lindenlaub, Bewertung, 1998, S. 109.<br />

98<br />

Ebd. S. 116.<br />

99<br />

Vgl. Lyman, <strong>Archiving</strong> WWW, 2002.<br />

42


Die Bewertung<br />

goals of the digital archives, the quality and uniqueness of the<br />

object.“ 100<br />

7.3. Bewertungsrichtlinien <strong>für</strong> (Teile von) Websites<br />

Für die Bewertung von Webseiten müssen die allgemeinen Richtlinien in<br />

Preserving Digital Information <strong>für</strong> Hypertextdokumente angepasst bzw.<br />

umgesetzt werden.<br />

Ausgehend vom Ziel des Projektes, werden erste<br />

Bewertungsentscheidungen getroffen, die von <strong>der</strong> Herangehensweise<br />

abhängen. Projekte <strong>der</strong> vollständigen Herangehensweise definieren die Top-<br />

Level-Domain 101 , um diese mittels „Web crawler“ in einem regelmäßigen<br />

Zyklus zu archivieren. Sie führen eine Bewertung auf Makroebene durch.<br />

Projekte <strong>der</strong> auswählenden Herangehensweise wählen z. B. elektronische<br />

Publikationen, Diskussionslisten, einzelne Websites o<strong>der</strong> nur eine Website<br />

aus. Für die auswählende Archivierungsmethode gibt es Richtlinien zur<br />

Auswahl von Online-Publikationen und <strong>für</strong> die Einschätzung des<br />

(Archivierungs-)Risikos, die als Grundlage <strong>für</strong> die Spiegelungstiefe,<br />

Archivierungsintervalle und den Einsatz bestimmter Filter dienen.<br />

7.3.1. Auswahlkriterien <strong>für</strong> Online-Publikationen<br />

In Guidelines for the Selection of Online Australia Publications Intended for<br />

Preservation by the National Library of Australia 102 werden Richtlinien zur<br />

Auswahl von Online-Publikationen gegeben. Die Nationalbibliothek<br />

verfolgt <strong>das</strong> Ziel, nur australische Online-Publikationen auf Dauer<br />

zugänglich zu machen. Dazu zählen die traditionellen Sammlungsobjekte<br />

von Bibliotheken (Bücher, Magazine, Zeitschriften, Zeitungen u.ä.), die<br />

öffentlich über <strong>das</strong> Internet in elektronischer Form zugänglich sind.<br />

Organisatorische Aufzeichnungen o<strong>der</strong> einzelne Materialien, die im<br />

Zuständigkeitsbereich von Archiven liegen, werden von den National<br />

Archives of Australia bewertet und archiviert 103 .<br />

100<br />

Task Force, Preserving Information, 1996, S. 21.<br />

101<br />

Zum Beispiel: „The Internet Archive“ - .com; „Kulturarw3-Projekt“ - .se<br />

102<br />

NLA, Selection, 2001.<br />

103<br />

Abb. 14: Zuständigkeiten <strong>der</strong> National Library of Australia und <strong>der</strong> National Archives of<br />

Australia bei <strong>der</strong> Archivierung webbasierter Aufzeichnungen.<br />

43


Die Bewertung<br />

Die National Library of Australia erklärt die Notwendigkeit von<br />

Auswahlkriterien damit, <strong>das</strong>s nicht alle Versionen bzw. Editionen<br />

aufbewahrt werden können. Diese Vorgehensweise gleicht <strong>der</strong> <strong>für</strong> die<br />

Auswahl von Printausgaben. Die Festlegung <strong>der</strong> Archivierungsintervalle<br />

hängt ab von dem Publikationsmuster, <strong>der</strong> Bedeutung enthaltener<br />

Informationen sowie <strong>der</strong> Stabilität <strong>der</strong> Website. So sollten einige „Titel“ so<br />

vollständig wie möglich vorliegen. Bei an<strong>der</strong>en dagegen würden einige<br />

Snapshots ausreichen.<br />

„The National Library will not attempt for preserve all<br />

versions/editions of a selected online title, just as we do not attempt<br />

to preserve all stages of a print loose item. In the online<br />

environment, publications can and often do change frequently and it<br />

is not feasible to capture all instances of change. A decision will be<br />

made on the frequency of capture of the information, and the<br />

stability of the site will be factors that affect this decision. Some titles<br />

will be captured as comprehensively as possible, while others may<br />

have a just a one off ‘snapshot’ taken of them.” 104<br />

Liegt die australische Online-Publikation in an<strong>der</strong>en Speichermedien vor,<br />

wie z. B. in Papierform o<strong>der</strong> auf Mikrofilm, wird die Online-Version nur<br />

aufbewahrt, wenn sie wichtige zusätzliche Informationen o<strong>der</strong> Bedeutung<br />

hat. Sonst wird generell die gedruckte Form bevorzugt. Sind die gleichen<br />

Informationen sowohl online als auch auf CD-ROM o<strong>der</strong> auf Diskette<br />

verfügbar, wird die Online-Version bevorzugt.<br />

Eine hohe Priorität haben maßgebliche Publikationen mit einem hohen zu<br />

erwartenden Nachfragewert. In <strong>der</strong> weiteren Ausführung zu „authoritative<br />

publication“ wird erklärt, <strong>das</strong>s zu einem authentischen Titel sowohl die<br />

Organisation bzw. Person, die <strong>für</strong> die Publikation verantwortlich ist, als<br />

auch die Qualifikation des Webpublishers bekannt sein sollte.<br />

„High priority is given to authoritative publications with long term<br />

research value. […] In or<strong>der</strong> to determine the authority of a title, it<br />

should be clear which organization or individual is responsible for<br />

104 Vgl. Kapitel 3.5 in: NLA, Selection, 2001.<br />

44


Die Bewertung<br />

producing it and what the qualifications or expertise of the creator/s<br />

are. Ideally, background information about the organisation or<br />

individual should be available.” 105<br />

Entspricht die Online-Publikation nicht den genannten Kriterien zur<br />

Authentizität und Nachfrage, wird sie auch nicht archiviert.<br />

Publikationen mit einem geringem Aggregierungsgrad, <strong>der</strong>en Informationen<br />

bereits woan<strong>der</strong>s vorliegen, werden nicht aufbewahrt.<br />

„Where an online publication provides a superficial view of information<br />

which is readily available elsewhere, either electronically or in print, it<br />

will not be selected for preservation.” 106<br />

Informationen über Sponsoren o<strong>der</strong> sonstige Unterstützungen können die<br />

Bewertung zur Auswahl positiv beeinflussen.<br />

Auch innovative Beispiele von Internetpublikationen, die <strong>für</strong> die spätere<br />

Forschung interessant sein könnten, werden <strong>für</strong> die dauerhafte<br />

Aufbewahrung ausgewählt.<br />

„Innovative examples of types of Internet publications that may have<br />

future research value because of experimental use of new technology<br />

may be selected.“ 107<br />

Die Auswahl nach thematischen Gesichtspunkten dient nur dazu, die<br />

gedruckte Sammlung zu ergänzen bzw. mit weiterreichenden Informationen<br />

zu vervollständigen. Für Australien werden die Beispiele <strong>der</strong> Aborigines<br />

und <strong>der</strong> Olympischen Spiele genannt.<br />

„The intention is not to duplicate the print collections, but to<br />

complement them by providing the broa<strong>der</strong> context.“ 108<br />

105 Kapitel 4.3.1 in: NLA, Selection, 2001.<br />

106 Kapitel 4.3.3 in: ebd.<br />

107 Kapitel 4.3.5 in: ebd.<br />

108 Kapitel 4.4 in: ebd.<br />

45


Die Bewertung<br />

Wichtig <strong>für</strong> die Auswahl von Websites ist es, die Grenzen zu definieren. So<br />

sollten nur interne Links archiviert werden.<br />

„If a publication has a number of internal or external links, the<br />

boundaries of the publication need to be decided. Internal links only<br />

are archived.” 109<br />

Größere Websites sollten in einzelne Komponenten zerlegt und diese dann<br />

nach den einzelnen Bewertungskriterien ausgewählt werden. Können die<br />

Komponenten dagegen nicht separat betracht werden, sollte die Website als<br />

Ganzes archiviert werden.<br />

„However, sometimes the components of larger publications or sites<br />

do not stand well on their own but together do form a valuable<br />

source of information. In this case, if it fits the guidelines, the site<br />

should be selected for archiving as an entity.” 110<br />

Neben den allgemeinen Auswahlrichtlinien gibt es auch Regeln <strong>für</strong> spezielle<br />

Publikationsformen, wie Jahresberichte, digitalisierte Materialien o<strong>der</strong> aber<br />

auch Zeitungen.<br />

Für online-verfügbare Jahresberichte gilt, <strong>das</strong>s diese nur dann ausgewählt<br />

werden, wenn sie nicht in gedruckter Form vorliegen o<strong>der</strong> nicht regelmäßig<br />

in an<strong>der</strong>en Publikationsformen (wie CD-ROM o<strong>der</strong> Diskette) erscheinen.<br />

Bei Zeitungen und Zeitschriften wird ähnlich wie bei Jahresberichten<br />

vorgegangen. Online-Publikationen werden nicht aufbewahrt, wenn die<br />

Informationen <strong>der</strong> gedruckten Ausgabe nur dupliziert werden.<br />

Digitalisierte Materialen, <strong>der</strong>en Original z. B. in Papierform vorliegt,<br />

werden generell nicht aufbewahrt, da die National Library of Australia<br />

davon ausgeht, <strong>das</strong>s die Abteilungen ihre eigenen digitalen Materialien<br />

sichern. Es gibt aber auch Ausnahmefälle, die die Bewertungsentscheidung<br />

beeinflussen. Demnach werden digitalisierte Materialien ausgewählt, wenn<br />

es sich erstens um historische Dokumente handelt und <strong>der</strong>en Archivierung<br />

unterstützt werden soll und zweitens, wenn die Webseite mehr als eine<br />

digitalisierte Kopie enthält.<br />

109 Kapitel 4.5.1 in NLA, Selection, 2001.:<br />

46


Die Bewertung<br />

Im Unterschied zum archivischen Aufgabenfeld, <strong>das</strong>s von den National<br />

Archives of Australia bearbeitet wird, wählt die National Library of<br />

Australia keine organisatorischen und persönlichen Seiten aus. Gleiches gilt<br />

<strong>für</strong> Entwürfe und Arbeiten, die noch im Prozess sind. Denn es sollen<br />

möglichst nur vollständige, komplette Dokumente ausgewählt werden.<br />

7.3.2. Einschätzung des Risikos<br />

Für die Bewertung von einzelnen Webauftritten ist nach dem Guidelines for<br />

Keeping Records of Web-based Activity in the Commonwealth und <strong>der</strong><br />

Publikation An Approach to Managing Internet and <strong>Intranet</strong> Information for<br />

Long Term Access and Accountability eine Risikoanalyse <strong>der</strong> Webseiten<br />

entscheidend. Wie oft ein Snapshot einer Website durchgeführt werden soll,<br />

hängt von dem Ergebnis <strong>der</strong> Einschätzung ab.<br />

Bei <strong>der</strong> Risikoanalyse wird mit Blick auf die dauerhafte Aufbewahrung des<br />

Snapshots untersucht, welche Probleme auftreten, warum und was dagegen<br />

getan werden kann. Das Risiko bezieht sich auf den Verlust <strong>der</strong> Daten und<br />

dem Verwaltungsaufwand, um dies zu vermeiden. Man spricht auch von<br />

„risk management“.<br />

„Risk management is defined as the systematic application of<br />

policies, procedures and practices to the tasks of identifying,<br />

analysing, evaluating, and monitoring risk. Essentially it involves<br />

anticipating what can go wrong, why and what can be done.” 111<br />

Wird <strong>das</strong> Risiko hoch eingeschätzt, müssen mehr Anstrengungen <strong>für</strong> die<br />

Bewahrung und Erhaltung <strong>der</strong> digitalen Aufzeichnungen unternommen<br />

werden. Dies beeinflusst die Festlegung <strong>der</strong> Archivierungsintervalle und die<br />

Auswahl bestimmter Websites o<strong>der</strong> einzelner Webseiten.<br />

Risikoeinschätzung <strong>der</strong> National Archives of Australia<br />

Die Richtlinien zur Einschätzung des Risikos durch die Abteilungen <strong>der</strong><br />

Commonwealth-Regierung werden ausführlich in Guidelines for Keeping<br />

Records of Web-based Activity in the Commonwealth beschrieben. Darin<br />

110 Kapitel 4.5.2 in: NLA, Selection, 2001.<br />

111 Appendix 11 – Risk analysis in DIRKS, in: NAA, DIRKS, 2003.<br />

47


Die Bewertung<br />

heißt es, <strong>das</strong>s die Bewertung <strong>das</strong> Ergebnis einer Risikoanalyse ist. Sie wird<br />

von <strong>der</strong> entsprechenden Abteilung, die <strong>für</strong> die Inhalte <strong>der</strong> Webseite<br />

verantwortlich ist, durchgeführt.<br />

„`Any commonwealth agency that administers a website must assess<br />

the business risk it faces in maintaining an online presence…´ The<br />

policy does not explicitly prescribe the extent of recordkeeping<br />

required, because the result of a risk assessment will guide agencies´<br />

selection of recordkeeping strategies. Where an agency faces high<br />

levels of risk exposure, comprehensive records will need to be<br />

captured and maintained, possibly over long period of time.” 112<br />

“This policy does not dictate how often agencies should make<br />

records of their web resources […]. Such decisions can only be<br />

made intelligently in the context of an agency´s particular business<br />

risk environment.” 113<br />

Das Ergebnis <strong>der</strong> Risikoeinschätzung ist zu dokumentieren und soll zu einer<br />

Strategie <strong>für</strong> webbasierte Aufzeichnung in <strong>der</strong> Abteilung bzw. Behörde<br />

führen.<br />

Wird ein hohes Risiko ermittelt, müssen die Aufzeichnungen <strong>für</strong> eine<br />

dauerhafte Aufbewahrung vollständig erfasst werden. Im Hintergrund<br />

liegende Informationen müssen freigelegt und verfügbar sein (z. B.<br />

Informationen aus Datenbanken).<br />

Für die Einschätzung des Risikos werden von den National Archives of<br />

Australia vier Faktoren genannt 114 :<br />

1. Sichtweise <strong>der</strong> Öffentlichkeit auf die Behörde<br />

Das öffentliche Profil wird beeinflusst durch die Aufgaben <strong>der</strong><br />

Behörde und <strong>der</strong>en Wechselwirkung mit <strong>der</strong> Öffentlichkeit. Das<br />

heißt, <strong>das</strong>s frei zugängliche Informationen einer Abteilung, die mehr<br />

112 Australian Standard AS 4390.5-1996, Records Management, 6.3 (zit. aus: NAA,<br />

Guidelines, 20001, S. 20), NAA, Guidelines, 2001, S. 20.<br />

113 NAA, Policy, 2002, S. 15.<br />

114 Vgl. NAA, Guidelines, 2001, S. 20-23; Abb. 15: Faktoren <strong>für</strong> die Risikoanalyse <strong>der</strong><br />

National Archives of Australia.<br />

48


Die Bewertung<br />

im Blick <strong>der</strong> Öffentlichkeit steht, in eine höhere Risikogruppe<br />

einzuordnen ist, als jene Abteilung, die überwiegend im Hintergrund<br />

ihre Geschäftstätigkeit ausführt. Zur hohen Risikogruppe gehören<br />

auch Webseiten, auf denen Verän<strong>der</strong>ungen von Sachverhalten<br />

direkt angezeigt werden (z. B. in <strong>der</strong> Organisation o<strong>der</strong> bei<br />

Funktionen).<br />

2. Ziel <strong>der</strong> Website<br />

Auf Websites werden eine Vielzahl von Informationen und<br />

Funktionen bereitgestellt, mit denen verschiedene Absichten verfolgt<br />

werden. Dazu zählen die Veröffentlichung von Informationen, die<br />

Kommunikation, die Kooperation, <strong>das</strong> Anbieten von<br />

Dienstleistungen und den Zugang zu Produkten. Eine<br />

Risikoeinschätzung zum Ziel <strong>der</strong> Website wird im Zusammenhang<br />

mit <strong>der</strong> Funktion <strong>der</strong> Abteilung und <strong>der</strong>en öffentlichen Profil<br />

getroffen.<br />

3. Komplexität <strong>der</strong> Website<br />

Je komplexer die Website ist, desto größer ist <strong>das</strong><br />

Archivierungsrisiko. Ein geringes Risiko besteht bei statischen o<strong>der</strong><br />

dokumentorientierten Webseiten. Dynamisch generierte und<br />

anwendungsbasierte Webseiten weisen ein viel höheres Risiko auf.<br />

Denn <strong>der</strong> Aufwand, die Informationen zu selektieren, zu sichern,<br />

lesbar und interpretierbar zu behalten, ist höher als bei statischen<br />

Webseiten.<br />

4. Häufigkeit und Regelmäßigkeit <strong>der</strong> inhaltlichen Än<strong>der</strong>ungen<br />

Häufig än<strong>der</strong>nde Webseiten sind nach den National Archives of<br />

Australia Seiten, <strong>der</strong>en Inhalte innerhalb von drei Monaten<br />

gewechselt werden. Än<strong>der</strong>ungen, die nach mehr als drei Monaten<br />

stattfinden, werden dagegen als weniger häufig eingeschätzt. Ein<br />

weiteres Kriterium ist die Frage, ob die Inhalte in regelmäßigen<br />

Zeitintervallen geän<strong>der</strong>t werden. Ein hohes Risiko liegt vor bei<br />

49


Die Bewertung<br />

Webseiten, <strong>der</strong>en Inhalte entwe<strong>der</strong> nicht häufig aber regelmäßig o<strong>der</strong><br />

häufig aber nicht regelmäßig durchgeführt werden.<br />

Risikoeinschätzung des Information Management Forums<br />

In den Richtlinien An Approach to Managing Internet and <strong>Intranet</strong><br />

Information for Long Term Access and Accountability des Information<br />

Management Forums 115 wird <strong>das</strong> Risiko nach ähnlichen Faktoren, wie eben<br />

genannt, eingeschätzt. Das Risiko wird in drei Niveaus (hoch, mittel,<br />

gering) nach folgenden Kriterien eingeteilt:<br />

- Evidenz- und Informationswert <strong>der</strong> dargestellten Informationen<br />

- angemessene Umgebung <strong>der</strong> bestehenden Verwaltungsstrukturen <strong>der</strong><br />

Website<br />

- Existenz grundlegen<strong>der</strong> Verwaltungsstrukturen, wie Daten-<br />

verwaltung und Klassifikationsschemen<br />

- Än<strong>der</strong>ungsintervalle und –häufigkeit<br />

Die Einteilung basiert auf einem Model <strong>der</strong> Autoren Charles R. McClure<br />

und J. Timothy Sprehe 116 .<br />

Ein geringes Risiko liegt vor, wenn die Inhalte einer Website unter einer<br />

wirkungsvollen Kontrolle publiziert werden. Dies ist auch <strong>der</strong> Fall, wenn<br />

die Website überwiegend aus statischen Seiten und wenigen interaktiven<br />

Element besteht, die Inhalte alle im Datenhaltungssystem vorliegen (z. B.<br />

CMS) und enthaltene Online-Publikationen noch in an<strong>der</strong>en<br />

Speichermedien publiziert werden.<br />

Ein mittleres Risiko besteht bei Websites, <strong>der</strong>en Kontrolle nicht ausreichend<br />

bei einer wachsenden Anzahl von Webseiten ist. Die Webseiten sind teils<br />

statisch teils dynamisch, mit einer zunehmenden interaktiven Funktion. Die<br />

Contents liegen nicht alle im Datenhaltungssystem vor und <strong>für</strong> Online-<br />

Publikationen existiert nicht immer eine äquivalente Printausgabe.<br />

Bei Websites mit einem hohen Risiko spitzt sich die Situation zu. Eine<br />

Kontrolle über die Inhalte ist nur sehr schwer möglich. Die Webseiten sind<br />

115 Vgl. IM Forum, Approach, 1999.<br />

116 Vgl. McClure, Analysis, 1998 (zit. aus: IM Forum, Approach, 1999).<br />

50


Die Bewertung<br />

dynamischen und interaktiven Charakters, liegen überwiegend nicht im<br />

Datenhaltungssystem vor und viele Online-Publikationen haben keine<br />

gedruckte Ausgabe mehr.<br />

7.4. Bewertungsstrategie<br />

Für die Umsetzung <strong>der</strong> Bewertungskriterien werden von den National<br />

Archives of Australia zwei Bewertungsstrategien 117 , „object-driven“<br />

(objektgesteuert) o<strong>der</strong> „event-driven“ (ereignisgesteuert), vorgeschlagen.<br />

Für welche <strong>der</strong> beiden sich entschieden werden sollte, hängt ab von <strong>der</strong><br />

Komplexität <strong>der</strong> Webquelle, <strong>der</strong> Art <strong>der</strong> webbasierten Interaktionen, von<br />

dem Ergebnis <strong>der</strong> Risikoeinschätzung sowie <strong>der</strong> Analyse <strong>für</strong> die<br />

Anfor<strong>der</strong>ungen an die Datenhaltung. Eine Kombination <strong>der</strong> beiden<br />

Strategien wird jedoch empfohlen 118 .<br />

Die objektgesteuerte Bewertungsstrategie ist geeignet <strong>für</strong> statische<br />

Websites, die eine Sammlung von HTML-Dokumenten umfassen und keine<br />

komplexen Interaktionen enthalten. Folglich könnten Snapshots in<br />

periodischen Zeitabständen von <strong>der</strong> Website gemacht werden.<br />

Die ereignisgesteuerte Bewertungsstrategie wird empfohlen <strong>für</strong><br />

Webauftritte, die aus einer Reihe von interaktiven o<strong>der</strong> dynamisch<br />

generierten Webseiten bestehen. Sie liefern eine Antwort unikaten<br />

Charakters auf eine bestimmte Anfrage. Diese Vorgehensweise ist<br />

Bestandteil einer funktionalen Bewertung <strong>für</strong> die Geschäftstätigkeit einer<br />

Abteilung. Denn damit werden auch Ereignisse o<strong>der</strong> Transaktionen erfasst,<br />

die zwischen <strong>der</strong> Webseite und dem Nutzer stattfinden 119 .<br />

7.5. Bewertung des <strong>Intranet</strong>s<br />

7.5.1. Allgemeines<br />

Die Gesamtheit <strong>der</strong> aufgeführten Bewertungskriterien können nicht 1:1 <strong>für</strong><br />

die Bewertung des <strong>Intranet</strong>s übertragen werden. Die Grundprinzipien <strong>der</strong><br />

117 Vgl. NAA, Guidelines, 2001, S. 24.<br />

118 „Agencies may consi<strong>der</strong> object-driven or event-driven approaches or, better still, a<br />

combination of the two.“ (NAA, Guidelines, 2001, S. 24)<br />

119 Dazu gehört: Benutzerprofil, Style Sheets, Suchmaschinen, Skripte und Programme,<br />

regelmäßige Snapshots <strong>der</strong> Datenbank selbst und Datenbanktransaktionsprotokolle<br />

(„database transaction logs“).<br />

51


Die Bewertung<br />

Bewertung, dargestellt im „Handbuch <strong>für</strong> Wirtschaftarchive“, müssen an<br />

<strong>das</strong> digitale Medium angepasst werden. Die Risikoanalyse, wie sie von den<br />

National Archives of Australia und des IM Forums vorgeschlagen wird, hat<br />

<strong>für</strong> die Bewertung des <strong>Intranet</strong>s nur <strong>für</strong> <strong>das</strong> Kriterium <strong>der</strong> „Zugänglichkeit<br />

und Erhaltungszustand“ <strong>der</strong> Aufzeichnungen eine Bedeutung. Aus diesem<br />

Grund wird auf eine ausführliche Einschätzung des Risikos <strong>für</strong> <strong>das</strong> <strong>Intranet</strong><br />

verzichtet.<br />

7.5.2. Bewertungskriterien<br />

Aus den verschiedenen Bewertungsansätzen kristallisierten sich folgende<br />

Bewertungskriterien heraus:<br />

1. Ziel <strong>der</strong> Archivierung<br />

2. archivischer Zuständigkeitsbereich des Historischen Archivs <strong>der</strong><br />

<strong>Dresdner</strong> Bank<br />

3. Gesamtfunktion <strong>der</strong> Abteilung bzw. des <strong>Intranet</strong>angebotes im<br />

Unternehmen<br />

4. Evidenzwert <strong>für</strong> die <strong>Dresdner</strong> Bank<br />

5. Aggregierungsgrad <strong>der</strong> enthaltenen Informationen<br />

6. Häufigkeit und Regelmäßigkeit <strong>der</strong> Än<strong>der</strong>ungen<br />

7. Redundanzen vermeiden<br />

8. Recherche- und Nachfragewert<br />

9. Zugänglichkeit und Erhaltungszustand<br />

10. Benutzung<br />

Einzelne <strong>Intranet</strong>angebote wurden daraufhin analysiert und <strong>das</strong> Ergebnis<br />

schriftlich festgehalten 120 .<br />

1. Ziel <strong>der</strong> Archivierung<br />

Wie bereits erwähnt, ist <strong>das</strong> Ziel <strong>der</strong> Archivierung <strong>das</strong> <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong><br />

Bank. Für die Anwendung <strong>der</strong> Spiegelungssoftware HTTrack reicht es<br />

120 Die schriftlich festgehaltene Analyse, die in <strong>der</strong> vorliegenden Diplomarbeit, präsentiert<br />

wird, kann als ein Protokoll <strong>für</strong> die durchzuführende Bewertung betrachtet werden. Es<br />

ersetzt aber nicht <strong>das</strong> Protokoll, <strong>das</strong>s während des Archivierungsprozesses erstellt werden<br />

sollte. „Über die durchgeführte Bewertung ist ein Protokoll zu schreiben. Darin wird <strong>der</strong><br />

gesamte Ablauf <strong>der</strong> Aktion geschil<strong>der</strong>t [...] damit die Benutzer, aber auch die späteren<br />

52


Die Bewertung<br />

jedoch nicht aus, nur den Link <strong>der</strong> Startseite http://brain.dresdner.net/ bis in<br />

eine bestimmte Tiefe 121 zu spiegeln. Denn nur ein geringer Teil des<br />

<strong>Intranet</strong>angebotes ist unter dem genannten Pfad zu finden. Deshalb muss<br />

auch eine externe Spiegelungstiefe mit angegeben werden. Links, die<br />

außerhalb des <strong>Intranet</strong>s <strong>der</strong> <strong>Dresdner</strong> Bank liegen, müssen in <strong>der</strong><br />

Voreinstellung ausgeschlossen werden. Dazu zählen neben den<br />

Internetauftritten von <strong>der</strong> <strong>Dresdner</strong> Bank o<strong>der</strong> von einzelnen<br />

Unternehmensbereichen auch Internet bzw. <strong>Intranet</strong> <strong>der</strong><br />

Tochtergesellschaften und Beteiligungen. Domän- bzw. Pfadnamen von <strong>der</strong><br />

Allianz können direkt ausgeschlossen werden. Hierbei muss jedoch beachtet<br />

werden, <strong>das</strong>s <strong>das</strong> Diskussionsforum unter dem Pfad <strong>der</strong> Allianz Group läuft.<br />

Dieser Link sollte entsprechend den Archivierungsintervallen wie<strong>der</strong><br />

eingeschlossen werden.<br />

2. Zuständigkeitsbereich<br />

Der Zuständigkeitsbereich des Historischen Archivs <strong>der</strong> <strong>Dresdner</strong> Bank<br />

kann im <strong>Intranet</strong> relativ klar abgetrennt werden. Theoretisch liegen alle<br />

Angebote des <strong>Intranet</strong>s <strong>der</strong> <strong>Dresdner</strong> Bank im Zuständigkeitsbereich.<br />

Ausnahmen bilden Schnittstellen zum Mutterunternehmen Allianz AG.<br />

Zunehmend werden Unternehmensbereiche <strong>der</strong> <strong>Dresdner</strong> Bank <strong>der</strong> Allianz<br />

zugeordnet 122 . Als Hilfestellung dient hierbei <strong>der</strong> Domänname und die<br />

Zuordnung im Konzernnavigator zu <strong>der</strong> Rubrik „Allianz“ o<strong>der</strong> den an<strong>der</strong>en<br />

Rubriken, die zur <strong>Dresdner</strong> Bank gehören.<br />

3. Gesamtfunktion im Unternehmen<br />

Das <strong>Intranet</strong>angebot wird nach <strong>der</strong> Gesamtfunktion im Unternehmen<br />

bewertet. Das betrifft die Auftritte <strong>der</strong> zentralen Abteilungen und <strong>der</strong><br />

Corporate Centers, <strong>der</strong> Filialen bzw. Nie<strong>der</strong>lassungen sowie <strong>der</strong><br />

Tochtergesellschaften und Beteiligungen. Hohe Priorität haben die zentralen<br />

Abteilungen und die Corporate Centers. Danach folgen die Filialen/<br />

Archivare wissen, wie <strong>der</strong> archivierte Bestand gebildet wurde.“ (Köhne-Lindenlaub,<br />

Bewertung, 1998, S. 117)<br />

121 Die Spiegelungssoftware unterscheidet zwischen einer internen- und ext ernen<br />

Verzeichnungstiefe. Die interne Verzeichnungstiefe geht von <strong>der</strong> angegebenen URL als<br />

Startpunkt aus. Verzeichnungsnamen, die nicht die URL enthalten, können unter Angabe<br />

einer externen Verzeichnungstiefe mitgespiegelt werden.<br />

53


Die Bewertung<br />

Nie<strong>der</strong>lassungen und schließlich die Tochtergesellschaften und die<br />

Beteiligungen.<br />

Mit Blick auf die Spiegelung wurden bei <strong>der</strong> Analyse des <strong>Intranet</strong>s die<br />

relevanten Verzeichnungsebenen <strong>der</strong> einzelnen Corporate Centers ermittelt.<br />

Deren <strong>Intranet</strong>auftritte sind überwiegend in Frames aufgebaut, so <strong>das</strong>s<br />

wenige Verzeichnungsebenen ausreichen, um den wesentlichen Inhalt <strong>der</strong><br />

<strong>Intranet</strong>auftritte wie<strong>der</strong>zugeben. Die Angaben schwanken zwischen <strong>der</strong><br />

zweiten und sechsten Verzeichnungsebene, wobei überwiegend die zweite<br />

und dritte Ebene ausreicht. Die Zuordnung erfolgt entlang des<br />

Konzernnavigators, <strong>der</strong> die Struktur und die Organisation des Unternehmens<br />

wie<strong>der</strong>gibt. Die Präsentation bzw. <strong>das</strong> Publikationsmuster wird durch den<br />

<strong>Intranet</strong>-Styleguide vorgeschrieben und im Regelfall umgesetzt.<br />

4. Evidenzwert <strong>für</strong> <strong>das</strong> Unternehmen<br />

Es wurde bereits erwähnt, <strong>das</strong>s <strong>der</strong> Evidenzwert nicht unbedingt in<br />

Webseiten zu erwarten ist. Für <strong>das</strong> Archiv enthält jedoch <strong>das</strong> <strong>Intranet</strong><br />

Angebote, die diese Funktion einnehmen. Diese enthalten die<br />

Unternehmensstruktur, Informationen zur Unternehmensentwicklung,<br />

Rundschreiben und Geschäftsinformationen, öffentliche Verlautbarungen,<br />

geben Auskunft über die Aufgaben und Funktion <strong>der</strong> einzelnen<br />

Unternehmensbereiche. Dazu können im einzelnen Informationen zählen,<br />

die über <strong>das</strong> Informationsportal direkt angezeigt werden.<br />

Das sind u.a.: Konzernnavigator, Nachrichten, Presseschau, Web-TV,<br />

Archiv, Corporate & Markets <strong>Intranet</strong>, Corporate Service, MIS und BINGO.<br />

Auch die Organigramme <strong>der</strong> Abteilungen haben evidenzwert.<br />

Die archivierten <strong>Intranet</strong>seiten sind erst evident, wenn neben dem Inhalt<br />

auch strukturelle Zusammenhänge und Kontextinformationen abgebildet<br />

werden. Unter dem Aspekt <strong>der</strong> Evidenz müssen auch die Zugänglichkeit,<br />

Lesbarkeit und Interpretierbarkeit <strong>der</strong> Informationen betrachtet werden.<br />

Denn <strong>das</strong> Ziel ist, es authentische Aufzeichnungen zu archivieren.<br />

122 Siehe S. 18.<br />

54


Die Bewertung<br />

5. Aggregierungsgrad <strong>der</strong> enthaltenen Informationen<br />

Entscheidend <strong>für</strong> die Bewertung von <strong>Intranet</strong>angeboten ist <strong>der</strong>en<br />

Informationsgrad 123 . Es ist dabei zu beachten, <strong>das</strong>s die gleichen<br />

Informationen nicht mehrfach vorliegen und demnach die Webseiten<br />

auszuwählen sind, die den höchsten Aggregierungsgrad besitzen. Treten die<br />

selben Informationen an an<strong>der</strong>er Stelle ausführlicher auf, sollte diese<br />

Webseite bevorzugt werden. Das bedeutet, <strong>das</strong>s z. B. die einleitende Seite<br />

(auch Teaser genannt) <strong>für</strong> darauffolgende Seiten bei Nachrichten und<br />

Presseschau nicht mit archiviert werden muss. Unter „Archiv“ werden die<br />

Beiträge ohne Teaser gesammelt abgelegt. Dieser Rubrik kommt daher eine<br />

hohe Bedeutung zu.<br />

6. Häufigkeit und Regelmäßigkeit <strong>der</strong> Än<strong>der</strong>ungen<br />

Än<strong>der</strong>ungen von <strong>Intranet</strong>angeboten können von <strong>der</strong> <strong>Intranet</strong>redaktion nur<br />

pauschal bestimmt werden, da sie nur <strong>für</strong> einen Teil <strong>der</strong> Inhalte<br />

verantwortlich ist. Diese könnten wie folgt in vier Gruppen unterteilt<br />

werden:<br />

1. Ständige Aktualisierung (dynamisch generierte Webseiten)<br />

z. B. Börsenkurse, Newsticker, Suche<br />

2. tägliche Aktualisierung<br />

z. B. Nachrichten, Presseschau, Archiv, BINGO<br />

3. wöchentliche o<strong>der</strong> monatliche Aktualisierung<br />

z. B. Veranstaltungskalen<strong>der</strong>, PRIMA-Stellenmarkt<br />

4. Aktualisierung zwischen 2-6 Monaten<br />

z. B. <strong>Intranet</strong>auftritte von einzelnen Unternehmensbereichen<br />

„Ansprechpartner“, Publikationen, Projekte, Werbe-<br />

materialien, Vorlagen u.ä.<br />

5. Aktualisierung mehr als 6 Monate 124<br />

z. B. <strong>Intranet</strong>auftritte von einzelnen Unternehmensbereichen<br />

„Philosophie und Zielsetzung“, anwendungsbasierte<br />

Webseiten (z. B. Reisekostenabrechnung)<br />

123 Aggregierungsgrad: Grad <strong>der</strong> enthaltenen Informationen.<br />

124 Herr Pasqualotto geht davon aus, <strong>das</strong>s die meisten statischen Webseiten innerhalb von<br />

sechs Monaten mindestens einmal geän<strong>der</strong>t werden.<br />

55


Die Bewertung<br />

7. Redundanzen vermeiden<br />

Zur Vermeidung von Redundanzen liefern die ausgeführten Guidelines for<br />

the Selection of Online Australian Publications <strong>der</strong> National Library of<br />

Australia eine gute Grundlage.<br />

Werbematerialien bzw. Kataloge über verfügbare Produkte 125 sind über <strong>das</strong><br />

<strong>Intranet</strong> verfügbar und können heruntergeladen werden. In den meisten<br />

Fällen liegen sie noch in Papierform o<strong>der</strong> auf einem an<strong>der</strong>en<br />

Speichermedium 126 vor und brauchen deshalb nicht archiviert werden. Um<br />

Doppelüberlieferungen zu ermeiden, sollten Online-Publikationen wie<br />

„dresdner banker“ o<strong>der</strong> „dresdner dwm“, die auch analog vorliegen, nicht<br />

archiviert werden. Es ist die Papierform zu bevorzugen. Ebenso sollte bei<br />

digitalisierten Materialien, wie Fotos, vorgegangen werden. Sind aber<br />

historisch wertvolle Dokumente digitalisiert worden, können die online<br />

vorliegenden Aufzeichnungen <strong>für</strong> die Bestandserhaltung verwendet werden.<br />

Der <strong>Intranet</strong>auftritt des Historischen Archivs enthält eine Vielzahl<br />

digitalisierter Materialien. Einerseits ist es nicht notwendig, diese noch<br />

einmal zu archivieren, da sie bereits im Archiv digital vorliegen.<br />

An<strong>der</strong>erseits ist es nicht sinnvoll auswählend vorzugehen, da <strong>der</strong> Kontext<br />

und <strong>der</strong> strukturelle Zusammenhang verloren gehen kann, bzw. schwer<br />

wie<strong>der</strong>herstellbar ist.<br />

8. Recherche- und Nachfragewert<br />

Einfluss auf Bewertungsentscheidungen nimmt <strong>der</strong> Aspekt <strong>der</strong> späteren<br />

internen als auch externen Nachnutzung. Lei<strong>der</strong> gibt es noch keine<br />

Benutzererfahrung auf Zugriffe von sogenannten „Web Archives“. Über <strong>das</strong><br />

<strong>Intranet</strong> gibt es aber (Benutzungs-)Statistiken, die regelmäßig durchgeführt<br />

werden. Demnach sollten die häufig aufgerufenen <strong>Intranet</strong>angebote<br />

regelmäßig und eventuell vollständig archiviert werden. Dazu zählen die<br />

Nachrichten und Pressemittelungen, <strong>das</strong> Web-TV und <strong>das</strong><br />

Diskussionsforum. Aus archivischer Sicht sollten diese speziellen<br />

<strong>Intranet</strong>angebote ergänzt werden durch solche, die sowohl vom historischen<br />

125<br />

Das sind zum Beispiel Kataloge mit Kundengeschenken, Drucksachen, Broschüren und<br />

Videoclips laufen<strong>der</strong> Werbeaktionen.<br />

126<br />

Es werden zum Beispiel die Videoaufzeichnungen des Web-TV´s nach Aussage von<br />

Herrn Boenke (Ansprechpartner <strong>für</strong> <strong>das</strong> Web-TV) gelegentlich auf CD-ROM aber immer<br />

auf Betacam-SP gespeichert.<br />

56


Die Bewertung<br />

Interesse <strong>für</strong> <strong>das</strong> Unternehmens als auch <strong>für</strong> die spätere Wissenschaft und<br />

Forschung sind. Zu den bereits genannten archivwürdigen<br />

<strong>Intranet</strong>angeboten sollten auch Funktionalitäten, Animationen o. ä.<br />

archiviert werden, die die Charakteristik von Webseiten unterstreichen<br />

(z. B. Ticker, Interaktionen, Kommunikations- und Dialogmöglichkeiten).<br />

In den kommenden Jahren ist zu erwarten, <strong>das</strong>s funktionale<br />

Bewertungsentscheidungen zunehmen werden und ein Konzept <strong>für</strong> die<br />

ereignisgesteuerte Archivierung erfor<strong>der</strong>t.<br />

In den kommenden Jahren werden in <strong>der</strong> Benutzung sicherlich online-<br />

verfügbaren Publikationen eher bevorzugt werden als Printausgaben.<br />

Deshalb sollte <strong>der</strong> Aspekt bei Doppelüberlieferungen, nachdem nur die<br />

gedruckten Ausgaben zu bevorzugen und <strong>der</strong>en Online-Publikationen<br />

auszuschließen sind, mit Blick auf die Benutzung nochmals überlebt<br />

werden. Die Online-Ausgaben könnten separat mit <strong>der</strong> Spiegelungssoftware<br />

heruntergeladen und abgespeichert werden.<br />

Ein Son<strong>der</strong>fall ist sicherlich auch <strong>das</strong> online-verfügbare Telefonbuch. In <strong>der</strong><br />

Papierwelt haben Telefonbücher nicht dauerhaften Archivwert.<br />

Informationen des Online-Telefonbuchs werden aus hinterlegten<br />

Datenbanken je nach Abfrage unterschiedlich dynamisch generiert. Nach<br />

Wunsch des Historischen Archivs soll es jedoch archiviert werden. Folglich<br />

müsse ein Konzept <strong>für</strong> die Archivierung dieser Daten aus den Datenbanken<br />

entwickelt werden.<br />

9. Zugänglichkeit und Erhaltungszustand<br />

Die digitalen Informationen müssen <strong>für</strong> die Archivierung zugänglich sein.<br />

Werden <strong>für</strong> bestimmte interne Bereiche, die mit archiviert werden sollen,<br />

Passwörter benötigt (z. B. „UK-info“ ist ein geschützter<br />

Informationsbereich <strong>für</strong> Mitarbeiter), müssen diese verfügbar sein, so <strong>das</strong>s<br />

dieser Bereich des <strong>Intranet</strong>s gespiegelt werden kann. Das Ziel, eine<br />

vollständige und genaue Kopie <strong>der</strong> Website von einem bestimmten<br />

Zeitpunkt aus <strong>der</strong> Vergangenheit zur Verfügung zu stellen, stößt an<br />

Grenzen, wenn Fehlermeldungen auftreten. Mit <strong>der</strong> Spiegelungssoftware<br />

HTTrack besteht die Möglichkeit, die Spiegelung zu einem an<strong>der</strong>en<br />

57


Die Bewertung<br />

Zeitpunkt mit den gleichen Voreinstellungen zu wie<strong>der</strong>holen und die nicht<br />

verfügbaren Seiten zu ergänzen. Än<strong>der</strong>t sich in <strong>der</strong> Zeit die Webseite, kann<br />

aber nicht mehr von einem authentischen Ergebnis ausgegangen werden.<br />

Denn <strong>der</strong> neue Inhalt wurde in <strong>der</strong> bereits archivierten Website eingefügt<br />

und entspricht nicht dem Ist-Zustand <strong>der</strong> ersten Spiegelung. Eine<br />

Möglichkeit, mit dem Problem umzugehen, ist es, die Fehlermeldungen als<br />

Teil <strong>der</strong> Momentaufnahme zu betrachten und als ein Ergebnis<br />

mitzuspiegeln.<br />

Ferner sollten die enthaltenen Informationen lesbar und interpretierbar sein.<br />

Liegen die Informationen nicht in einem Standardformat vor, sollte<br />

entsprechend dem Informationsgehalt entschieden werden, ob es sich lohnt,<br />

diese zu archivieren und ggf. zu migrieren. Hierbei denke ich beson<strong>der</strong>s an<br />

Text-, Grafik-, Sound- und Videoformate die nicht plattformunabhängig<br />

sind und von wenigen Anwendungen unterstützt werden.<br />

10. Benutzung<br />

Mit Blick auf die Benutzung sollte darauf geachtet werden, <strong>das</strong>s die<br />

<strong>Intranet</strong>seiten navigierbar und recherchierbar bleiben.<br />

„The archive must be organised in such a way that navigation in the<br />

material (surfing the historic web) is easy. […] Free-text is the next<br />

access method to be added. Here a lot of commercial and non-<br />

commercial software exists.” 127<br />

Entsprechend müssen die Benutzer-PCs mit Software- und<br />

Hardwarekomponenten ausgestattet werden.<br />

7.5.3. Spiegelungsintervalle<br />

Als Grundlage <strong>für</strong> die Definition <strong>der</strong> Archivierungsintervalle wird die<br />

objektgesteuerte Vorgehensweise <strong>der</strong> National Archives of Australia 128<br />

empfohlen. Ausschlaggebend ist <strong>das</strong> Resultat <strong>der</strong> Bewertungskriterien. Der<br />

primäre Gedanke ist, <strong>das</strong>s nicht alle Än<strong>der</strong>ung archiviert werden können.<br />

Von den sich ständig än<strong>der</strong>nden Inhalten können nur Momentaufnahmen<br />

127 Arvidson, Kulturarw3Project, 2000.<br />

128 Vgl. NAA, S. 24.<br />

58


Die Bewertung<br />

zum Zeitpunkt <strong>der</strong> Spiegelung gemacht werden. Deshalb sollten<br />

Archivierungsintervalle so gewählt werden, <strong>das</strong> die wesentlichen<br />

Än<strong>der</strong>ungen erfasst werden sowie im Rahmen <strong>der</strong> finanziellen und<br />

personellen Ressourcen liegen. Vollständig archiviert werden<br />

Rundschreiben und Geschäftsinformationen, die durch BINGO bereitgestellt<br />

werden ebenso Nachrichten, Pressemitteilungen und die Web-TV-Beiträge.<br />

Da die Än<strong>der</strong>ungsintervalle unterschiedliche sind, könnten auch<br />

verschiedene Archivierungsintervalle festgelegt werden. Es könnte z. B. ein<br />

Hauptarchivierungsintervall gewählt werden. Die Archivierung könnte<br />

demnach z. B. vor und/o<strong>der</strong> nach jeden Quartalsbericht o<strong>der</strong> aber auch<br />

monatlich erfolgen. Ein kürzerer Intervall müsse z. B. bei BINGO gewählt<br />

werden. Denn die Informationen werden ca. 14 Tage vorgehalten und sind<br />

später über eine Suche recherchierbar. Um eine ereignisorientierte<br />

Archivierungsstrategie zu vermeiden, könnte die URL von BINGO<br />

wöchentlich o<strong>der</strong> 14-tägig gespiegelt werden. Eine höhere Frequenz ist <strong>für</strong><br />

weniger relevante bzw. sich seltener än<strong>der</strong>nde Informationen geeignet. Zwar<br />

än<strong>der</strong>n sich sehr häufig Nachrichten, Presseschau und Beiträge von dem<br />

Web-TV, eine Spiegelung einmal pro Jahre würde hier bereits ausreichen.<br />

Denn die Beiträge unter <strong>der</strong> Rubrik „Archiv“ sind schon seit mehreren<br />

Jahren vollständig abrufbar.<br />

Die regelmäßigen Archivierungsintervallen sollten durch zusätzliche<br />

Spiegelungen ergänzt werden. Das können wichtige, anstehende o<strong>der</strong> auch<br />

plötzliche Ereignisse im Unternehmen, in <strong>der</strong> Politik o<strong>der</strong> in <strong>der</strong> Wirtschaft<br />

sein.<br />

Nach Ansicht von Herrn Wolf besteht auch die Möglichkeit, sogenannten<br />

Zeitfenstern einzusetzen. Darunter versteht man, <strong>das</strong>s permanent die<br />

Spiegelung durchgeführt und in einem festgelegten Zeitrahmen von<br />

mehreren Tagen bis eine Woche gehalten wird bzw. mitläuft. Werden in<br />

periodischen Abständen entsprechend den Archivierungsintervallen<br />

Snapshots archiviert, bietet die Verwendung von Zeitfenstern die<br />

59


Die Bewertung<br />

Möglichkeit, während und nach dem gewählten Archivierungszeitpunkt<br />

Reaktionen im <strong>Intranet</strong> zu archivieren.<br />

Ein Vorschlag über verschiedene Spiegelungsintervalle:<br />

Wöchentlich o<strong>der</strong> 14-tägig<br />

- BINGO<br />

Vierteljährlich (fast alles, was direkt über die Startseite aufrufbar ist)<br />

- Startseite http://brain.dresdner.net/, MIS, Gallileo, einzelne<br />

Corporate Centers<br />

Jährlich<br />

- Regionen und Nie<strong>der</strong>lassungen, Tochtergesellschaften/<br />

Beteiligungen, Archiv (Nachrichten, Presseschau, Web-TV-<br />

Beiträge, etc.), Business Travel Service, Geschäftsfeld und<br />

Zahlungsverkehr, Forum <strong>der</strong> Allianz Group<br />

Grenzfälle<br />

- Corporate & Markets <strong>Intranet</strong>, „Private Kunden und<br />

Geschäftskunden“, Mitarbeiter, PRIMA (identisch mit CC Personal),<br />

Telefonbuch<br />

7.5.4. Spiegelungstiefe<br />

Mit dem Einsatz von HTTrack kann sowohl eine interne als auch externe<br />

Spiegelungstiefe eingestellt werden. Demnach bestehen zwei Möglichkeiten<br />

zur Festlegung <strong>der</strong> Spiegelungstiefen:<br />

Die erste Variante besteht darin, eine mittlere Verzeichnungstiefe von vier<br />

bis fünf Ebenen <strong>für</strong> die Startseite des <strong>Intranet</strong>s auszuwählen. Da diese<br />

Einstellung <strong>der</strong> Spiegelungstiefe nicht alle relevanten <strong>Intranet</strong>angebote<br />

einschließt, müssen bestimmte Pfade, Links, Domänen o.ä. eingeschlossen<br />

werden. Die URL´s tieferliegen<strong>der</strong> <strong>Intranet</strong>auftritte müsste als Startseite <strong>für</strong><br />

weitere Spiegelungen genommen werden (zum Beispiel die einzelnen<br />

URL´s <strong>der</strong> Corporate Centers).<br />

Der Vorteil hierbei ist, <strong>das</strong>s <strong>das</strong> Portal und die <strong>Intranet</strong>auftritte <strong>der</strong> einzelnen<br />

Unternehmensbereiche vollständig mit wenig Ballast verfügbar sind.<br />

Nachteilig ist jedoch, <strong>das</strong>s <strong>der</strong> Zusammenhang im <strong>Intranet</strong> verloren geht.<br />

60


Die Bewertung<br />

Denn eine Navigation zwischen den einzelnen Corporate Centers wird nicht<br />

möglich sein.<br />

Bei <strong>der</strong> zweiten Variante werden <strong>für</strong> die Startseite des <strong>Intranet</strong>s sehr hohe<br />

interne als auch externe Verzeichnungstiefen (>7) eingestellt, so <strong>das</strong>s die<br />

tieferliegenden <strong>Intranet</strong>angebote mitgespiegelt werden. Der Vorteil ist, <strong>das</strong>s<br />

nur eine Spiegelung <strong>für</strong> einen Snapshot des <strong>Intranet</strong>s durchgeführt wird. Es<br />

ist aber mit einem höheren Ballast zu rechnen, <strong>der</strong> nur durch den Ausschluss<br />

mehrerer Links verringert werden kann.<br />

Beide Varianten sollten noch einmal getestet werden, um den<br />

Anfor<strong>der</strong>ungen des Historischen Archivs gerecht zu werden.<br />

7.5.5. Bewertung des <strong>Intranet</strong>auftrittes von CC UK<br />

Der <strong>Intranet</strong>auftritt des Corporate Center Unternehmenskommunikation (CC<br />

UK) wurde als Beispiel ausführlich in mehreren Schritten bewertet und die<br />

Umsetzung getestet:<br />

1. Bewertungsvorschlag<br />

2. Abgleich des Bewertungsvorschlages mit dem Content Manager<br />

(Herrn Pasqualotto)<br />

3. Umsetzung <strong>der</strong> Bewertungsvorschläge mit <strong>der</strong> Spiegelungssoftware<br />

HTTrack<br />

Der erste Vorschlag <strong>für</strong> die Bewertung von CC UK umfasst alle<br />

dargestellten Rubriken und Unterrubriken des <strong>Intranet</strong>auftrittes. Eindeutig<br />

archivwürdige Webseiten wurden mit gelb, eindeutig nicht archivwürdige<br />

Webseiten mit rot, Grenzfälle mit grün markiert.<br />

Der überwiegende Teil wurde als archivwürdig empfunden. Dazu zählen<br />

<strong>das</strong> Portal von CC UK als grafische Darstellung <strong>der</strong> Struktur des<br />

Unternehmensbereichs und alle <strong>Intranet</strong>auftritte <strong>der</strong> dazugehörigen<br />

Abteilungen mit <strong>der</strong>en Unterrubriken. Im Detail handelte es sich<br />

überwiegend um die „Philosophie und Zielsetzung“ <strong>der</strong> Abteilungen,<br />

Organigramme, Richtlinien sowie um bereichsspezifische Themen und<br />

Produkte.<br />

61


Die Bewertung<br />

Eindeutig nicht archivwürdig waren Online-Publikationen 129 (außer<br />

Eingangsseite, aber nicht die Publikation selbst), Ansprechpartner (nur<br />

wenn ein Organigramm vorhanden war), externe Links, Blanco- bzw.<br />

Online-Formulare sowie Feedback-, Kommunikations- und<br />

Dialogfunktionen.<br />

Grenzfälle waren z. B. nicht verfügbare Seiten, <strong>der</strong> online-verfügbare<br />

Geschäftsbericht sowie themenbezogene Rubriken, <strong>der</strong>en Unterrubriken aus<br />

internen Links einzelner Abteilungen von CC UK darstellten („<strong>Intranet</strong> und<br />

Informationsdienste“ enthielt Links zu „Public Relations“ und „Public<br />

Affairs“. „Produkte und Medien“ enthielt Links zu „Corporate Publishing“,<br />

„Corporate Sustainability“ und „Interne Kommunikation“).<br />

Nach dem Gespräch mit Herrn Pasqualotto gingen keine wesentlichen<br />

Än<strong>der</strong>ungen hervor 130 . Die Grenzfälle bezüglich <strong>der</strong> Verweisung interner<br />

Links wurden aufgehoben, da die Links bereits in den einzelnen Auftritten<br />

<strong>der</strong> Abteilungen als archivwürdig mit eingeschlossen wurden. Allerdings<br />

erwähnte Herr Pasqualotto, <strong>das</strong>s es schwierig sein wird, einzelne Links<br />

auszugrenzen. Denn die Webseiten von CC UK sind überwiegend in Frames<br />

aufgebaut sind. Die einzelnen HTML-Seiten eines Frame lassen keine<br />

separate URL im Browserfenster erkennen, die zum Ausschluss in die<br />

Voreinstellung übernommen werden kann.<br />

Bei <strong>der</strong> Spiegelung von http://cc-uk.bww.dresdner.net\index.html wurde in<br />

<strong>der</strong> Voreinstellung eine interne Verzeichnungstiefe von vier Ebenen und<br />

eine externe von drei Ebenen vorgegeben sowie bestimmte Links bzw.<br />

Pfadnamen ausgeschlossen. Einzelne Webseiten über Ansprechpartner,<br />

Feedback o.ä., die in Frames enthalten sind, wurden nicht extra ausgegrenzt,<br />

da <strong>der</strong> Aufwand zur Ermittlung <strong>der</strong> individuellen URL zu groß war.<br />

Die Spiegelung dauerte nur wenige Sekunden. Abschließend wurde von<br />

HTTrack ein Fehlerprotokoll erstellt. Das Ergebnis wird auf <strong>der</strong> Festplatte<br />

gespeichert und im Browser angezeigt.<br />

129 „dresdner banker“ und „dresdner dwm“.<br />

130 Vgl. Abb. 16: Corporate Center Unternehmenskommunikation - Bewertungsbeispiel –<br />

Darstellung des Bewertungsansatzes nach <strong>der</strong> Besprechung mit Herrn Pasqualotto.<br />

62


Die Bewertung<br />

Innerhalb <strong>der</strong> gespiegelten Seite kann in den ersten zwei bis drei<br />

Hierarchieebenen, abhängig von den Frames, navigiert werden. Alle<br />

Contents innerhalb eines Frames werden angezeigt. Der Ausschluss von<br />

bestimmten Links bzw. Pfadnamen wurde umgesetzt, so <strong>das</strong>s z. B. die<br />

Online-Publikationen nicht mitgespiegelt wurden 131 .<br />

Viele <strong>Intranet</strong>auftritte verweisen auf die Portalseite von CC UK. Oft sind<br />

diese als statische Links vorgegeben. Wird dieser Link auf <strong>der</strong> gespiegelten<br />

Website benutzt, gelangt man automatisch auf die originale <strong>Intranet</strong>adresse.<br />

Die URL im Browserfenster verweist nicht mehr auf <strong>das</strong> lokale Verzeichnis.<br />

Dieses Problem kann beseitigt werden, indem im Quellcode <strong>der</strong><br />

<strong>Intranet</strong>seite <strong>der</strong> statische durch einen relativen Link ersetzt wird.<br />

Ergebnis<br />

Obwohl aus Zeitgründen nur eine Spiegelung von CC UK vorgenommen<br />

wurde, kann man mit dem Ergebnis recht zufrieden sein. Der <strong>Intranet</strong>auftritt<br />

von CC UK konnte fast vollständig kopiert werden. Bestimmte externe<br />

Links waren ausschließbar. Gleiche Webseiten, die über verschiedene<br />

Rubriken aufrufbar sind und auf den ersten Blick mehrfach vorlagen,<br />

konnten nicht reduziert werden. Denn es handelte sich um eine Verweisung<br />

auf die gleiche URL. Wäre dieser Link ausgeschlossen, gingen automatisch<br />

auch die an<strong>der</strong>en Webseiten verloren.<br />

Interne Links, die Teil eines Frames sind, wurden nicht separat<br />

ausgeschlossen. Es besteht aber auch die Möglichkeit über „Datei-Menü-<br />

Eigenschaften“ die URL einer einzelnen HTML-Seite aus dem Frame<br />

anzuzeigen, diese zu kopieren und als ausschließenden Links in die<br />

Voreinstellung von HTTrack einzufügen. Für mehrere einzelne HTML-<br />

Seiten aus Frames, wäre dieser Arbeitsschritt sehr aufwendig.<br />

131 Abb. 17: Corporate Center Unternehmenskommunikation – Grafische Darstellung über<br />

die Umsetzung <strong>der</strong> Bewertung nach <strong>der</strong> Spiegelung.<br />

Abb. 18: Corporate Center Unternehmenskommunikation im <strong>Intranet</strong> – Screenshots zur<br />

Spiegelung mit HTTrack.<br />

63


Die Bewertung<br />

7.6. Zusammenfassung<br />

Für die Bewertung von <strong>Intranet</strong>seiten sind die Kriterien aus dem „Handbuch<br />

<strong>für</strong> Wirtschaftsarchive“ im allgemeinen anwendbar. Für die Auswahl von<br />

Online-Publikationen gibt es die Richtlinien <strong>der</strong> National Library of<br />

Australia. Eine Einschätzung des Risikos Informationen zu verlieren, wird<br />

<strong>für</strong> <strong>das</strong> <strong>Intranet</strong> vorerst nicht vorgenommen. Das Risiko kann sicherlich als<br />

gering eingestuft werden.<br />

Die Software bietet die Möglichkeit, Bewertungskriterien umzusetzen.<br />

Unterschiedliche Archivierungsintervalle mit verschiedenen Einstellungen<br />

können schnell und einfach durchgeführt werden. Bei <strong>der</strong> Archivierung zu<br />

einem bestimmten Zeitpunkt kann außerdem entschieden werden, eine<br />

komplette Spiegelung durchzuführen o<strong>der</strong> aber die Voreinstellungen bereits<br />

durchgeführter Spiegelungsprojekte beizubehalten und nur geän<strong>der</strong>te<br />

Dateien herunterzuladen. Unverän<strong>der</strong>te Dateien werden <strong>für</strong> <strong>das</strong> neu<br />

gestartete Spiegelungsprojekt kopiert und verän<strong>der</strong>te Webseiten durch die<br />

neuen Dateien ersetzt. Verschiedene Ausgangsseiten in verschiedenen<br />

Verzeichnungsebenen können gespiegelt werden. Umfangreiche Funktionen<br />

zum Einschluss bzw. Ausschluss von Links, Pfaden o<strong>der</strong> Domänen sind<br />

vorhanden und können einfach bedient werden.<br />

Schließlich steht sich die Frage, ob es sinnvoll ist, eine ausführliche<br />

Voreinstellung vorzunehmen, die arbeits- und zeitaufwendiger ist, jedoch<br />

mit Blick auf die zur Verfügung stehende ausreichende Speicherkapazität<br />

nicht notwendig erscheint. Die verschiedenen Tests sowohl mit <strong>der</strong><br />

Startseite des <strong>Intranet</strong>s als auch mit <strong>der</strong> des Corporate Centers<br />

Unternehmenskommunikation zeigten, <strong>das</strong>s auch bei wenigen<br />

Filteranwendungen die Grenze von 650 MB, was <strong>der</strong> heutigen<br />

Speicherkapazität einer CD-ROM entspricht, bei weitem nicht überschritten<br />

wurde (< 200 MB). Auch wenn <strong>der</strong> Speicherplatzbedarf nur knapp die<br />

Einschränkung unterschreiten sollte, müsste auch in Betracht gezogen<br />

werden, <strong>das</strong>s die Speichermedien weiterentwickelt werden und in Zukunft<br />

mehr Speicherplatz zur Verfügung stellen. Ein weiterer Gesichtspunkt, <strong>der</strong><br />

diese Bewertungsmethode bestärkt, ist, <strong>das</strong>s Speicherplatz immer weniger<br />

64


Die Bewertung<br />

kostenintensiv wird und demnach kein Problem darstellt. Deshalb könnten<br />

auch die Archivierungsintervalle kleiner gewählt werden, z. B. wöchentlich<br />

o<strong>der</strong> monatlich, so <strong>das</strong>s größere Intervalle wegfallen würden.<br />

Eine weitere Frage stellt sich bei <strong>der</strong> Auswahl von Online-Publikationen.<br />

Denn werden zukünftige Nutzer nicht eher die digitale Version bevorzugen?<br />

Die elektronischen Publikationen müssten in einem separaten<br />

Spiegelungsvorgang gesichert werden, da sie über <strong>das</strong> Internet verfügbar<br />

sind.<br />

Aber ist <strong>das</strong> archivische Bewertung? - Nein!<br />

Die Bewertung von Webseiten beschränkt sich am Ende auf die<br />

Spiegelungstiefe, - intervalle und dem Ausschluss von bestimmten externen<br />

Links, wie *allianz*, www.dresdner-bank.com und/o<strong>der</strong> *telefonbuch*<br />

sowie dem Einschluss bestimmter Links, die sonst verloren gehen würden.<br />

Ziel <strong>der</strong> Bewertung von Webseiten ist schließlich auch, den Arbeitsaufwand<br />

und die Kosten gering zu halten. Denn auch bei <strong>der</strong> Bewertung analoger<br />

Aufzeichnungen wird in <strong>der</strong> Regel eine Einzelblattkassation nicht<br />

durchgeführt.<br />

65


Die Spiegelung<br />

8. Die Spiegelung<br />

Das <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank wird mit einer Spiegelungssoftware kopiert.<br />

Die Software kopiert entsprechend <strong>der</strong> Voreinstellung automatisch alle<br />

Dateien <strong>der</strong> Website bis hin zu einer bestimmten Verzeichnungsebene zu<br />

einem bestimmten Zeitpunkt. Dabei extrahiert <strong>das</strong> Programm alle Links, die<br />

auf <strong>der</strong> selben Website platziert sind. Die einzelnen Webseiten werden von<br />

dem Webserver auf einen Computer <strong>für</strong> <strong>das</strong> Webarchiv heruntergeladen, bis<br />

die Website vollständig kopiert wurde. Alle kopierten Dateien, die zu dem<br />

Snapshot gehören - eingeschlossen Text, Grafiken, Videos, Style Sheets,<br />

verfügbare Programme, Javascript u.a. Skriptsprachen 132 - werden auf <strong>der</strong><br />

lokalen Festplatte des PCs in einem separaten Verzeichnis gespeichert. In<br />

dem Verzeichnis sollten zusätzlich (XML-)Dateien mit Metadaten abgelegt<br />

werden. Snapshots einer Website sollten regelmäßig durchgeführt werden,<br />

so <strong>das</strong>s eine vollständige Reihe an Snapshots vorliegt, die <strong>das</strong> Webarchiv<br />

bilden.<br />

„Snapshots are taken periodically, so that the archive has a<br />

sequence of snapshots for each site. Each snapshot is stored with<br />

provenance metadata, such as the date on which the snapshot was<br />

taken.” 133<br />

Der Snapshot kann alle Dateien und Unterverzeichnisse <strong>der</strong> Site enthalten.<br />

Bei umfangreichen Websites sollten Filter bei <strong>der</strong> Voreinstellung verwendet<br />

werden, mit dem Risiko, vielleicht auch wichtige Materialien zu verlieren.<br />

Dieses Risiko soll mit den Bewertungsentscheidungen jedoch gering<br />

gehalten werden.<br />

„Snapshots should include all files that are part of a site, but<br />

sometimes it pays to be selective. Much of the complexity of Web<br />

sites lies in the files that contain executable computer programs, and<br />

many of the largest files are in special formats, such as audio and<br />

132 Skriptsprachen repräsentieren leistungsfähige Entwicklungswerkzeuge zur Darstellung<br />

dynamischer Informationen und Interaktionen im Internet bzw., <strong>Intranet</strong>. Je nachdem, wo<br />

<strong>der</strong> Skriptcode ausgeführt werden soll, spricht man von Client-side o<strong>der</strong> Server-side<br />

Scripting. Die Ausführung von JavaScript kann sowohl auf dem Webserver als auch<br />

innerhalb des Intern-Browsers erfolgen. (Lienemann, <strong>Intranet</strong>s, 2003, S. 169)<br />

133 Arms, Minerva, 2001.<br />

66


Die Spiegelung<br />

video files. Ignoring these files greatly simplifies the task of<br />

collecting Web sites, but at the cost of losing important<br />

materials.” 134<br />

Im Rahmen <strong>der</strong> Untersuchung in <strong>der</strong> <strong>Intranet</strong>redaktion <strong>der</strong> <strong>Dresdner</strong> Bank<br />

wurden zwei verschiedene Spiegelungssoftwareprodukte, Teleport Pro und<br />

HTTrack, getestet. Laut Erfahrungen des Archivs <strong>der</strong> sozialen Demokratie<br />

bieten diese Softwarelösungen die größten Spezifikationen an, da sie auf die<br />

einzelnen Projekte zugeschnitten werden können. Beide Lösungen finden<br />

Anwendung bei Archivierungsprojekten 135 .<br />

Die Entscheidung, welche Software den Bedürfnissen <strong>der</strong> <strong>Dresdner</strong> Bank<br />

am ehesten entspricht, wurde zusammen von den Verantwortlichen <strong>für</strong><br />

Inhalt, Technik und Archiv zusammen getroffen. Nach verschiedenen<br />

Spiegelungstests wurde HTTrack ausgewählt. Sie unterscheiden sich durch<br />

die Bedienung und <strong>das</strong> gesamte Leistungsspektrum. Beide<br />

Softwarelösungen bieten aber die gleichen Grundfunktionen an:<br />

- Kopieren einer Website, Wie<strong>der</strong>holung eines Spiegelungsprojektes<br />

mit den selben Voreinstellungen<br />

- Angabe <strong>der</strong> Spiegelungstiefe (wobei HTTrack zwischen internen<br />

und externen Ebenen unterscheidet)<br />

- Filterungsmöglichkeiten (z. B. Schlagwörter in Dateinamen, Links<br />

o<strong>der</strong> im Quellcode; Dateiformate, Scriptsprachen, Links, Domänen,<br />

Pfadnamen, Speichergröße, Umfang <strong>der</strong> Dateien)<br />

8.1 Teleport Pro<br />

Entsprechend dem Vorschlag des Archivs <strong>der</strong> sozialen Demokratie in Bonn<br />

wurde <strong>der</strong> Website-Kopierer Teleport Pro Version 1.29 <strong>der</strong> Firma tenmax<br />

getestet. Verschiedene Spiegelungen wurden mit <strong>der</strong> Testversion<br />

durchgeführt, die über die Homepage zur Verfügung gestellt wird. Mit <strong>der</strong><br />

Demoversion können maximal 500 Dateien pro Projekt gespiegelt werden.<br />

134 Arms, Minerva, 2001.<br />

135 HTTrack: Archiveringsproject partijsites (Documentatiecentrum Ne<strong>der</strong>landse Politieke<br />

Partijn, Universiteitsbibliotheek van de Rijksuniversiteit Groningen), Minerva (Library of<br />

Congress), PANDORA (Library of Australia, National Archives of Australia), DAVID-<br />

Project (Stadsarchief Antwerpen). Teleport Pro: Internet Archiv (Archiv <strong>der</strong> sozialen<br />

Demokratie).<br />

67


Die Spiegelung<br />

Erst mit dem käuflichen Erwerb <strong>der</strong> Software und <strong>der</strong> verbundenen<br />

Registrierung wird die Beschränkung aufgehoben. Das Programm ist in<br />

englischer Sprache und enthält eine ausführliche Hilfsfunktion zu den<br />

einzelnen Einstellungsmöglichkeiten. Die Funktionalitäten werden nach<br />

dem Menüauswahlverfahren eingestellt.<br />

8.1.1 Zusammenfassung <strong>der</strong> Tests mit Teleport Pro<br />

Bei <strong>der</strong> Einstellung größerer Linktiefen wurde <strong>der</strong> Spiegelungsvorgang mit<br />

<strong>der</strong> Demoversion nach Erreichen <strong>der</strong> Einschränkung abgebrochen, so <strong>das</strong>s<br />

keine genaue Einschätzung über die Spiegelungsqualität getroffen werden<br />

konnte.<br />

Die Einstellung von Filtern ist bei Teleport Pro auf den ersten Blick etwas<br />

unübersichtlich, wohl aber bietet die Software auch die Möglichkeit, über<br />

Exclusion Webseiten nach Schlagwörtern, Dateinamen, Dateiformaten,<br />

Domänen o<strong>der</strong> bestimmten Linkadressen auszuwählen. Die Filter <strong>für</strong> den<br />

Einschluss von bestimmten Dateien sind unter File Retrieval einzugeben,<br />

insbeson<strong>der</strong>e Dateigröße o<strong>der</strong> Dateiformate 136 . Bei <strong>der</strong> Durchführung<br />

verschiedener Tests schienen uns die Funktionalitäten und die<br />

Filtermöglichkeiten im Vergleich zu HTTrack geringer sowie nicht modular<br />

zusammenstellbar.<br />

Ferner konnte während des Spiegelungsvorganges nicht direkt<br />

nachvollzogen werden, welche Dateien gerade kopiert wurden. Es war nicht<br />

einsehbar, welche Dateien sehr umfangreich sind, dem Prozess viel Zeit<br />

kosten und demnach ausgeschlossen werden könnten. Es wurde kein<br />

Protokoll erstellt.<br />

Im Ergebnis wurden die gesamten kopierten Dateien von Teleport Pro in<br />

eine Datenstruktur gebracht. Für den Content Manager war es nicht<br />

ersichtlich, ob die ursprüngliche Datenstruktur beibehalten wurde. Die<br />

Datenstruktur ist ein wichtiges Hilfsmittel, um zu kontrollieren, welche(s)<br />

Dateien/Verzeichnis kopiert bzw. ausgelassen worden sind/ist.<br />

136 Abb. 19: Teleport Pro – Screenshots <strong>der</strong> „Project Properties“.<br />

68


Die Spiegelung<br />

8.2 HTTrack<br />

HTTrack wird von <strong>der</strong> gleichnamigen Firma frei über die Homepage zur<br />

Verfügung gestellt und liegt zur Zeit in <strong>der</strong> Version 3.2.3 (08/03/2003) vor.<br />

Es können verschiedene Programmsprachen eingestellt werden, u.a. auch<br />

Deutsch. Die Bedienung des Programms ist eine step-by-step-Abfrage.<br />

Mit HTTrack können zahlreichere Einstellungen vorgenommen werden. Es<br />

bestehen mehr Filtermöglichkeiten zum Einschluss bzw. Ausschluss von<br />

Webseiten, <strong>für</strong> <strong>der</strong>en Recherche, sowie <strong>für</strong> die Einstellung <strong>der</strong> Dateistruktur.<br />

Die Standardeinstellung entspricht <strong>der</strong> vorgegebenen Struktur des<br />

Webservers. Als Spiegelungstiefe kann sowohl eine interne als auch externe<br />

Linktiefe gewählt werden. Während <strong>der</strong> Spiegelung kann <strong>der</strong> Nutzer<br />

verfolgen, welche Dateien kopiert werden, welche sehr umfangreich sind<br />

und viel Zeit in Anspruch nehmen. Über einen Button können diese<br />

Webseiten ausgeschaltet werden. Das ist sehr nützlich, um zu erkennen<br />

welche Links bzw. Pfade bei einer folgenden Spiegelung ausgeschlossen<br />

werden sollten.<br />

Als Teil <strong>der</strong> Spiegelung werden technische Metadaten über die Spiegelung<br />

von <strong>der</strong> Software in einer Protokolldatei im ASCII-Format gesammelt, <strong>das</strong><br />

in dem gleichen Verzeichnis des Snapshots abgelegt wird. Festgehalten<br />

werden Datum und Uhrzeit <strong>der</strong> Spiegelung, die Voreinstellungen sowie<br />

eine Liste <strong>der</strong> Fehlermeldungen. Die Protokollfunktion stellt ein<br />

ausschlaggebendes Kriterium zur Entscheidung <strong>für</strong> HTTrack dar 137 .<br />

Ein Nachteil von HTTrack ist, <strong>das</strong>s kaum Hilfsfunktionen angeboten<br />

werden. Über die Homepage wird die Bedienung von HTTrack im<br />

Allgemeinen erklärt. Im Vergleich zu Teleport Pro ist es jedoch<br />

unzureichend, um eine Feineinstellung vorzunehmen. Die<br />

deutschsprachigen Ausführungen können die vorzunehmenden<br />

Einstellungen aber erleichtern.<br />

137 Abb. 20: HTTrack - diverse Screenshots.<br />

69


Die Spiegelung<br />

8.2.1 Zusammenfassung <strong>der</strong> Tests mit HTTrack<br />

Im ersten Schritt wurden verschiedene Einstellungen <strong>für</strong> die Spiegelung <strong>der</strong><br />

Startseite http://brain.dresdner.net ausprobiert 138 . Die interne<br />

Verzeichnungstiefe wurde höher/ o<strong>der</strong> gleich <strong>der</strong> externen angegeben. Bei<br />

einer internen Verzeichnungstiefe von fünf Ebenen dauerte <strong>der</strong><br />

Spiegelungsvorgang sehr lange und wurde aus Zeitgründen nach einer<br />

halben Stunde abgebrochen. Bei einer geringeren Spiegelungstiefe betrugt<br />

<strong>der</strong> gesamte Prozess ungefähr fünf Minuten. Verschiedene Einstellungen<br />

zum Ein- bzw. Ausschluss von Webadressen, Pfadnamen o.ä. wurden<br />

ausprobiert. Mit <strong>der</strong> Zunahme an Tests nahm auch <strong>der</strong> Ausschluss<br />

bestimmter Pfadnamen zu. Denn durch die Protokollfunktion von HTTrack<br />

konnte nachverfolgt werden, welche Links kopiert werden. Demnach<br />

wurden ausgeschlossen: Links zu den Internetauftritten <strong>der</strong> <strong>Dresdner</strong> Bank,<br />

<strong>der</strong> Allianz sowie <strong>das</strong> Online-Telefonbuch.<br />

Bei <strong>der</strong> Spiegelung mit einer hohen Verzeichnungstiefe wurden die<br />

<strong>Intranet</strong>auftritte <strong>der</strong> Corporate Centers, die Nie<strong>der</strong>lassungen sowie<br />

Tochtergesellschaften/ Beteiligungen, aber auch <strong>der</strong>en Internetauftritte bis<br />

in die 2./3. Hierarchieebene mitgespiegelt wurden. Nachteilig war bei dieser<br />

Einstellung, <strong>das</strong>s <strong>der</strong> Spiegelungsprozess länger dauerte.<br />

Die überwiegende Darstellung <strong>der</strong> <strong>Intranet</strong>seiten in Frames hat den Vorteil,<br />

<strong>das</strong>s bei einer Spiegelung keine zu hohe Linktiefe eingestellt werden muss.<br />

Schwierig wird es jedoch bei <strong>der</strong> Selektion einzelner HTML-Seiten, da die<br />

individuelle URL nur über Menü-Datei-Eigenschaften angezeigt und kopiert<br />

werden könne.<br />

Eine Orientierung während <strong>der</strong> Spiegelungstest war <strong>der</strong> <strong>Intranet</strong>auftritt des<br />

Historischen Archivs, eine Unterrubrik des Corporate Centers<br />

Unternehmenskommunikation. Ein gutes Spiegelungsergebnis lag vor, wenn<br />

<strong>der</strong> <strong>Intranet</strong>auftritt des Archivs vollständig kopiert wurde und die<br />

Bil<strong>der</strong>galerie aufrufbar war 139 .<br />

138 Abb. 21: Das <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank – gespiegeltes Portal.<br />

139 Vgl. Abb. 18.<br />

70


Die Spiegelung<br />

8.2.2 Fazit<br />

Trotz verschiedener Test kann jetzt noch keine endgültige Empfehlung zu<br />

den Einstellungen geben werden. Es ist erfor<strong>der</strong>lich, <strong>das</strong>s verschiedene<br />

Möglichkeiten entsprechend <strong>der</strong> Archivierungsintervalle und <strong>der</strong><br />

Umsetzung <strong>der</strong> Bewertungsvorschläge von den verantwortlichen Personen<br />

selbst noch einmal getestet werden. In <strong>der</strong> begrenzten und kurzen Zeit, die<br />

<strong>für</strong> die Analyse des <strong>Intranet</strong>s in <strong>der</strong> <strong>Intranet</strong>redaktion zur Verfügung stand,<br />

war es <strong>für</strong> mich nicht möglich die idealste Voreinstellung mit HTTrack zu<br />

definieren.<br />

Wie bereits bei den Bewertungsvorschlägen und <strong>der</strong>en Umsetzung<br />

angedeutet wurde, muss die <strong>Dresdner</strong> Bank entscheiden, welchen Weg sie<br />

wählt. Entwe<strong>der</strong> wird eine hohe interne Spiegelungstiefe <strong>für</strong> die<br />

<strong>Intranet</strong>startseite gewählt und damit versucht, externe Links <strong>der</strong><br />

<strong>Intranet</strong>auftritte <strong>der</strong> Corporate Centers, Nie<strong>der</strong>lassungen/ Filialen,<br />

Tochtergesellschaften/ Beteiligungen u.ä. einzuschließen. O<strong>der</strong> es wird <strong>für</strong><br />

die <strong>Intranet</strong>startseite eine geringere Spiegelungstiefe gewählt und einzelne<br />

<strong>Intranet</strong>auftritte extra gespiegelt. Das erfor<strong>der</strong>t jedoch mehr Arbeitsschritte,<br />

wobei als Ergebnis die Webseiten vollständig vorliegen könnten bzw. auch<br />

besser kontrollierbar wären. Nachteilig ist dabei, <strong>das</strong>s innerhalb <strong>der</strong><br />

gespiegelten <strong>Intranet</strong>auftritte es nicht möglich wäre, zwischen<br />

verschiedenen Angeboten hin und her zu navigieren bzw. auf die Startseite<br />

des <strong>Intranet</strong>s zuzugreifen.<br />

8.3 Ansicht im Browserfenster<br />

Wenn man den gespiegelten <strong>Intranet</strong>auftritt bzw. einen Ausschnitt dessen<br />

im Browserfenster betrachtet, ist auf den ersten Blick kein Unterschied<br />

erkennbar 140 . Die Grafiken sind sichtbar, die Banner funktionieren, <strong>der</strong><br />

Newsticker erscheint und <strong>das</strong> Web-TV arbeitet. Betrachtet man <strong>das</strong><br />

Ergebnis genauer, ist zu erkennen, <strong>das</strong> die URL auf <strong>das</strong> lokale Verzeichnis<br />

verweist (C:\\...). Das zeigt dem Betrachter, <strong>das</strong>s die Informationen lokal<br />

geladen werden.<br />

140 Vgl. Abb. 21: Das <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank – <strong>das</strong> gespiegelte Portal.<br />

71


Die Spiegelung<br />

Bei dem Aufruf statischer Links wird automatisch auf die originale Internet-<br />

bzw. <strong>Intranet</strong>seite verwiesen 141 .<br />

Ein Problem, was bisher nicht erklärt werden konnte, ist die Anzeige <strong>der</strong><br />

horizontalen Navigationsleiste und bestimmter Icons. Wird die gespiegelte<br />

<strong>Intranet</strong>seite aufgerufen, werden keine Wörter auf <strong>der</strong> Navigationsleiste<br />

bzw. Icons in <strong>der</strong> rechten Infobox angezeigt. Erst wenn <strong>der</strong> Cursor über die<br />

leeren Elemente bewegt wird, erscheinen die Wörter. Dieses Phänomen<br />

wird nach Ansicht von Herrn Wolf und Herrn Pasqualotto mit Javascript in<br />

Verbindung gesetzt.<br />

8.4 Offene Fragen<br />

Das Ergebnis kann bei guter Voreinstellung den Bewertungsvorstellungen<br />

entsprechen, wohlwissend, <strong>das</strong>s auch in <strong>der</strong> analogen Bewertungspraxis<br />

keine Einzelblattkassation vorgenommen wird. Die internen Links<br />

funktionieren und gewährleisten eine Navigation innerhalb <strong>der</strong> gespiegelten<br />

<strong>Intranet</strong>seite. Entscheidend ist die Einstellung <strong>der</strong> Filter.<br />

Was passiert aber bei nicht verfügbaren <strong>Intranet</strong>seiten? Ist <strong>das</strong> Ergebnis<br />

dann auch authentisch? Das Archiv <strong>der</strong> sozialen Demokratie betrachtet <strong>das</strong><br />

Problem als ein Bestandteil des Snapshots zu einem bestimmten Zeitpunkt.<br />

So ist eine nicht anzeigbare Webseite ist ein Teil des Ergebnisses. Als<br />

Lösung bieten beide Softwaremöglichkeiten an, den Spiegelungsvorgang<br />

mit den vorgenommenen Einstellung zu wie<strong>der</strong>holen bzw. fehlende Seiten<br />

zu ergänzen. Wurde die Webseite in <strong>der</strong> Zwischenzeit geän<strong>der</strong>t und<br />

anschließend bei <strong>der</strong> wie<strong>der</strong>holten Spiegelung in den ursprünglichen<br />

Kontext eingebaut, entsteht die Frage, ob dieses Ergebnis noch authentisch<br />

<strong>für</strong> den vorangegangen Zeitpunkt ist.<br />

„A deficiency of this approach is that a snapshot only provides a<br />

picture of a website at a particular point in time. If snapshots are<br />

captured in the absence of other records of web-based activity, it<br />

will be impossible to reconstruct the site together with its<br />

functionality at any other point in time.” 142<br />

141 Siehe S. 63.<br />

142 NAA, Guidelines, 2001, S. 26.<br />

72


Die Spiegelung<br />

Es wurde bereits erwähnt, <strong>das</strong>s sich Snapshots mit einer<br />

Spiegelungssoftware nicht <strong>für</strong> dynamische, interaktive Webseiten o<strong>der</strong><br />

Quellen aus Datenbanken o<strong>der</strong> Transaktionen eignen. Aus diesem Grund<br />

wird es schwer möglich sein, diese Seiten mit ihren Funktionalitäten zu<br />

einem bestimmten Zeitpunkt zu rekonstruieren. Deshalb ist eine<br />

Protokollierung zum <strong>Intranet</strong>auftritt bzw. zu den Funktionalitäten unbedingt<br />

erfor<strong>der</strong>lich und sollte in einer (XML-)Datei festgehalten werden. Sicherlich<br />

wird die Protokollierung zukünftig nicht ausreichen. Um die Funktionalität<br />

<strong>für</strong> die Nachwelt zu erhalten, muss eine neue, ereignisgesteuerte<br />

Archivierungsmethode angewendet werden.<br />

73


Sicherung und Erhaltung des <strong>Intranet</strong>-Archivs<br />

9. Sicherung und Erhaltung des <strong>Intranet</strong>-Archivs<br />

9.1 Allgemeines<br />

Die Snapshots des <strong>Intranet</strong>s liegen nach <strong>der</strong> Spiegelung auf <strong>der</strong> Festplatte im<br />

Archiv vor. Sie sollen nun auf Dauer gesichert und erhalten werden. Die<br />

kurze Lebensdauer <strong>der</strong> physikalischen Speichermedien und die schnelle<br />

Entwicklung von Hard- und Software erfor<strong>der</strong>n weitere<br />

Archivierungsstrategien. Sie ist eng verbunden mit dem Archivierungsziel –<br />

warum die Snapshots aufbewahrt werden sollten 143 . Es wird dabei zwischen<br />

drei Schwerpunkten unterschieden:<br />

1. „Preservation of bits“ - Ziel ist es, die exakte Bitsequenz zu<br />

erhalten, wie sie im Original vorliegt<br />

2. „Preservation of content“ – Ziel ist es, den Inhalt jedoch nicht die<br />

volle interaktive Natur <strong>der</strong> Website zu erhalten (z. B. Text, Grafiken,<br />

Audio)<br />

3. Preservation of experience“ – Ziel ist es, <strong>das</strong> vollständige Erlebnis<br />

<strong>der</strong> Interaktionen mit dem digitalen Material zu bewahren,<br />

einschließlich dem Sehen und Fühlen sowie den Ausführungen von<br />

dynamischen Elementen<br />

Der Fokus des Historischen Archivs <strong>der</strong> <strong>Dresdner</strong> Bank liegt auf <strong>der</strong><br />

Erhaltung des Inhalts <strong>der</strong> Webseiten, so <strong>das</strong>s eine authentische Kopie des<br />

<strong>Intranet</strong>s zur Verfügung steht.<br />

Um die Informationen in einem authentischen Kontext wie<strong>der</strong>herzustellen,<br />

sind neben den Metadaten auch die entsprechenden Hardware- und<br />

Softwarekomponenten erfor<strong>der</strong>lich 144 .<br />

143 Arms, Minverva, 2001.<br />

144 „Technologies to reproduce the Web object – however defined – must be preserved,<br />

including the hardware and software necessary to access the information in an authentic<br />

context or to recreate is. This is difficult in the best of cases.“ (Lyman, Archivierung<br />

WWW, 2002)<br />

74


Sicherung und Erhaltung des <strong>Intranet</strong>-Archivs<br />

Welche Komponenten die Funktionalität <strong>der</strong> Snapshots beeinflusst, werden<br />

von den National Archives of Australia zusammengefasst 145 . Dazu gehören:<br />

- Verwendung von unterschiedlichen Versionen und Typen von<br />

HTML, die auch verschiedene Funktionalitäten besitzen<br />

- Plattformabhängigkeit von Software, Suchmaschinen o<strong>der</strong><br />

datenbankbasierte Fragetools<br />

- Korrekte Einbettung und Verlinkung von verschiedenen Versionen<br />

von Anwendungen, die <strong>für</strong> <strong>der</strong>en Funktionalitäten inklusive<br />

Applets, JavaScript und software plug-ins gebraucht werden<br />

- Beschränkungen von einigen (älteren) Browsern<br />

- Geschätzte physikalische und/o<strong>der</strong> kommerzielle Lebensdauer des<br />

Mediums, auf dem die Snapshots und die Metadaten gespeichert<br />

sind<br />

- Langzeitverfügbarkeit <strong>der</strong> Hardware und <strong>der</strong> Plattform des<br />

Betriebsystems, die notwendig ist, um den Zugang zu den<br />

gespeicherten Aufzeichnungen auf verschiedenen Medientypen zu<br />

erhalten<br />

Zum Aspekt <strong>der</strong> dauerhaften Erhaltung webbasierter Aufzeichnungen<br />

gehören 146 :<br />

- Auswahl <strong>der</strong> Archivierungsstrategien; <strong>das</strong> regelmäßige Überprüfen<br />

und Erneuern <strong>der</strong> Speichermedien sowie die Migration,<br />

- Verwendung von weit verbreiteten Standards, nicht allein <strong>für</strong> die<br />

Datenformate, son<strong>der</strong>n auch <strong>für</strong> Programme und Softwaretools;<br />

Umsetzung nichtproprietärer Lösungen<br />

- Einführung von Sicherheitsmerkmalen gegen bewusste o<strong>der</strong><br />

unbewusste Än<strong>der</strong>ungen<br />

- Verwendung von dauerhaften Identifikationen/ Signaturen<br />

- Sicherung von Kontroll- und Überwachungsmechanismen über die<br />

Umwelteinflüsse<br />

- Auswahl des Speichermediums<br />

145 Vgl. NAA, Guidelines, 2001, S. 32.<br />

146 Vgl. Ebd., S. 33 f.<br />

75


Sicherung und Erhaltung des <strong>Intranet</strong>-Archivs<br />

9.2 Dateiformate <strong>für</strong> die Archivierung<br />

Damit bei einer Migration keine Informationen verloren gehen und <strong>das</strong><br />

Dokument authentisch bleibt, muss ein standardisiertes Speicherformat<br />

ausgewählt werden, <strong>das</strong> folgenden Anfor<strong>der</strong>ungen gerecht wird 147 :<br />

- Verfügbarkeit<br />

- Strukturierbarkeit<br />

- Konvertierbarkeit, Austauschbarkeit<br />

- Recherchierbarkeit<br />

- Präsentation<br />

- Standardisierung<br />

- Archivierbarkeit 148<br />

Das gilt nicht nur <strong>für</strong> den Archivierungsprozess, son<strong>der</strong>n sollte schon im<br />

Vorfeld, bei <strong>der</strong> Erstellung <strong>der</strong> Webseiten, Anwendung finden.<br />

Für die dauerhafte Bewahrung <strong>der</strong> webbasierten Aufzeichnungen gelten im<br />

Prinzip die gleichen Grundsätze wie <strong>für</strong> an<strong>der</strong>e digitale Aufzeichnungen.<br />

Nach Mannerheim ist die Situation jedoch etwas einfacher, da 95% <strong>der</strong><br />

Dateien in standardisierten Formaten vorliegen.<br />

„Long-term preservation of web publications is in principle not<br />

different from long-term preservation of any other digital<br />

information. Maybe the situation is a little easier because over 95<br />

percent of the files, HTML and image files, are in standardised<br />

formats. So the prospect of having software reading them in the<br />

future is better than in other areas using proprietary software.” 149<br />

Für die Archivierung von Hyperlink-Dokumenten wird SGML und zu <strong>der</strong>en<br />

Präsentation HTML empfohlen. Mit Blick auf die Weiterentwicklung steht<br />

147<br />

Ohst, Dateiformate, 1998. Der Schwerpunkt <strong>der</strong> Studienarbeit von Daniel Ohst liegt auf<br />

Dateiformaten <strong>für</strong> <strong>das</strong> elektronische Publizieren.<br />

148<br />

„Günstige Vorraussetzungen <strong>für</strong> eine längerfristige Archivierbarkeit sind eine hohe<br />

Strukturierung des Dokuments, die Verwendung offener Standards und gute<br />

Konvertierungsmöglichkeiten. [...] Falls verwendete Dateiformate, Speichermedien o<strong>der</strong><br />

Progra mme wesentlich än<strong>der</strong>n sollten, sind die Dokumente möglichst verlustfrei in ein<br />

neues Format zu konvertieren.“ (Ohst, Dateiformate, 1998)<br />

149<br />

Mannerheim, heritage, 2000.<br />

76


Sicherung und Erhaltung des <strong>Intranet</strong>-Archivs<br />

aus heutiger Sich die Kombination bei<strong>der</strong> Standards in XHTML zur<br />

Verfügung.<br />

Bei <strong>der</strong> Auswahl von Grafik-, Audio- und Videodateiformaten sind, sowohl<br />

<strong>für</strong> die Archivierung als auch <strong>für</strong> <strong>das</strong> Publizieren im <strong>Intranet</strong>, neben <strong>der</strong><br />

Verfügbarkeit, Konvertierbarkeit, Standardisierung, Recherchierbarkeit und<br />

Archivierbarkeit auch die Dateigröße, Qualität und Authentizitätsmerkmale<br />

<strong>der</strong> Datei entscheidend 150 . Auf diese Thematik kann jedoch im Rahmen<br />

dieser Diplomarbeit nicht weiter eingegangen werden.<br />

9.2.1 Archivierung von Daten mit XML<br />

Die Extensible Mark-up Language, abgekürzt XML, ist eine Metasprache<br />

zur Beschreibung <strong>der</strong> grammatischen Struktur von gleichförmig<br />

aufgebauten Textdokumenten. Sie ist keine Auszeichnungssprache, son<strong>der</strong>n<br />

ein Regelwerk zur Schaffung solcher Sprachen 151 . Als Teilmenge des<br />

Standards SGML ist <strong>der</strong> XML-Standard bzw. die XML-Standardfamilie<br />

schlanker und modularer aufgebaut. Im Gegensatz zum HTML-Standards,<br />

welcher auch ein Subset von SGML ist, besteht bei XML die Möglichkeit,<br />

selbst definierte DTDs zu benutzen und zu erweitern. Die Möglichkeit<br />

DTDs zu benutzen bestand schon bei SGML, wobei <strong>der</strong>en Anwendung viel<br />

komplizierter ist.<br />

Die reine Spezifikation XML 1.0 beschreibt aber keinen<br />

Hypermedienmechanismus und enthält keine Formatierungsangaben 152 . Sie<br />

können mit an<strong>der</strong>en (XML-basierten) Standards, z. B. CSS o<strong>der</strong> XSL, gelöst<br />

werden. Das bedeutet, obwohl CSS nicht XML-basiert ist, kann es mit XML<br />

kombiniert werden. Nachteilig ist dann jedoch, <strong>das</strong>s die XML-Vorteile nicht<br />

genutzt werden können.<br />

Der Standard ist beson<strong>der</strong>s gut geeignet <strong>für</strong> die Strukturierung von Daten.<br />

Das XML-Dokument kann somit nach inhaltlichen Kriterien analysiert,<br />

bearbeitet und nach einzelnen Datenbestandteilen durchsucht werden.<br />

Metadaten können zusätzlich erfasst werden.<br />

150 Vgl. Büttner, Formate, 2002.<br />

151 Vgl. Becker, XML, 2002.<br />

152 Abb. 22: Vergleich zwischen HTML- und XML-Dokumenten.<br />

77


Sicherung und Erhaltung des <strong>Intranet</strong>-Archivs<br />

XML ist plattformunabhängig, rein textbasiert, modularisierbar und<br />

erweiterbar und trennt Inhalt, Struktur sowie Layoutangaben. Durch die<br />

strengen Regeln wird die Validisierung <strong>der</strong> XML-Dokumente, an die auch<br />

die Softwareproduzenten gebunden sind, gewährt.<br />

Ferner wird bei <strong>der</strong> Erstellung eines XML-Dokuments in <strong>der</strong> Deklaration<br />

eine Zeichenkodierung angegeben, nach <strong>der</strong> die Daten zu interpretieren<br />

sind. Die internationale Zeichenkodierung erfolgt auf <strong>der</strong> Basis <strong>der</strong> ISO/EC-<br />

20646-Norm (Unicode). Damit wird es möglich fast alle wichtigen<br />

Sprachen, ohne Gefahr <strong>der</strong> Doppelbelegung <strong>der</strong> Codes, darzustellen.<br />

Mit <strong>der</strong> Cross-Media-Fähigkeit von XML können archivierte XML-<br />

Dokumente in verschiedene Formate (z. B. .pdf, .rtf, .html, .xhtml) und<br />

Medien ausgegeben werden.<br />

XML ist datenorientiert und leicht maschienenlesbar. Deshalb eignet es sich<br />

sowohl als technisches Format <strong>für</strong> die Erfassung als auch als<br />

Datenaustauschformat (<strong>für</strong> den Import von zu archivierenden Daten). So<br />

entstehen bei <strong>der</strong> Konvertierung von Informationen aus externen<br />

Datenbanken kaum Informationsverluste. Das liegt daran, <strong>das</strong>s inhaltliche<br />

Beschreibungen von den Rohdaten getrennt gespeichert sind. So können<br />

auch Metadaten vollständig übernommen werden. Wurde ein Dokument auf<br />

einer XML-basierten Sprache beschrieben, lassen sich Vokabeln bzw.<br />

Grammatik verstehen und verarbeiten, denn alle XML-Applikationen haben<br />

die selben grundlegenden Aufgaben 153 :<br />

- <strong>das</strong> Laden von XML-Dokumenten<br />

- <strong>das</strong> Parsen <strong>der</strong> Dokumentenstruktur<br />

- <strong>das</strong> zur Verfügung stellen <strong>der</strong> Inhalte des Dokuments in<br />

strukturierter Form und<br />

- eventuell die Ausgabe von Daten als XML-Datei<br />

Dokument Typ Definition (DTD)<br />

Die XML-Dateien werden in einer sogenannten XML-DTD mit eigener<br />

Syntax definiert. Sie gibt die Struktur und die Elemente verbindlich vor.<br />

Damit können Strukturierungsschablonen, ein Templates o<strong>der</strong><br />

Dokumentvorlagen <strong>für</strong> eine Klasse von Dokumenten festgelegt werden. Die<br />

153 Rothfuss, CMS, 2001, S. 227.<br />

78


Sicherung und Erhaltung des <strong>Intranet</strong>-Archivs<br />

DTD stellt sicher, <strong>das</strong>s alle XML-Dokumente gleichermaßen klassiert<br />

werden.<br />

Nur wohlgeformte XML-Dokumente, <strong>der</strong>en Syntax <strong>der</strong> DTD entsprechen,<br />

können von XML-Prozessoren geparst, d. h. <strong>für</strong> gültig empfunden und<br />

angezeigt werden. Im Fall von HTML werden auch Dokumente von den<br />

Browsern akzeptiert, die nicht exakt dem HTML-Standard folgen. XML-<br />

Anwendungen werden von Browsern erst mit den neueren Versionen<br />

gelesen (Internet Explorer ab 5.x, Netscape ab 6.x).<br />

XHTML<br />

Wesentliche Anfor<strong>der</strong>ungen können von HTML nicht bzw. unzureichend<br />

erfüllt werden. In HTML sind Struktur- und Layoutangaben miteinan<strong>der</strong><br />

verbunden. Ferner steht durch die begrenzte Anzahl von Tags nur ein fest<br />

definiertes Set von Strukturierungen zur Verfügung. Es besteht demnach<br />

nicht die Möglichkeit <strong>das</strong> HTML-Dokument nach inhaltlichen Kriterien zu<br />

analysieren, zu recherchieren und zu bearbeiten 154 .<br />

XHTML 1.0 ist die Neuformulierung von HTML 4.01 in einer XML-<br />

Anwendung und liegt seit Januar 2000 als Empfehlung des W3Cs vor. Die<br />

vorhandenen Tags und Attribute von HTML 4.01 werden übernommen. Als<br />

eine XML-Sprache ist XHTML syntaktisch 100%ig kompatibel mit an<strong>der</strong>en<br />

XML-Anwendungen.<br />

Der Arbeitsentwurf <strong>der</strong> neuen Version XHTML 2.0 liegt vom 6. Mai 2003<br />

vor. Damit wurden missbillige Elemente und Attribute herausgelassen. So<br />

ist ein Hyperlink nicht mehr an <strong>das</strong> Anker-Element gebunden, son<strong>der</strong>n wird<br />

durch <strong>das</strong> Attribut `href ´ vielen Elementen zugeordnet 155 .<br />

Für DTD stehen drei Versionen zur Verfügung<br />

1. XHTML-1.0-Strict<br />

Die Version <strong>der</strong> DTD ist geeignet <strong>für</strong> Dokumente, die den strengen<br />

XHTML-Regeln genügen. Elemente, die aus älteren HTML-Versionen<br />

154 Vgl. Endres, Bibliotheken, 2000, S. 243.<br />

155 http://www.w3.org/TR/xhtml1/, http://www.w3.org/TR/xhtml12/<br />

79


Sicherung und Erhaltung des <strong>Intranet</strong>-Archivs<br />

bekannt sind aber nicht mehr empfohlen werden, können in <strong>der</strong> strikten<br />

Version nicht angewendet werden.<br />

2. XHTML-1.0-Transitional<br />

Der DTD Transitional ist eine Version, die den Übergang vom normalen<br />

HTML nach XHTML begünstigt. Demnach könnten sich die meisten<br />

HTML-Dokumente ohne weitere Konvertierungen o<strong>der</strong> Verän<strong>der</strong>ungen<br />

an diese XHTML-DTD anpassen lassen 156 .<br />

3. XHTML-1.0-Frameset<br />

Die Version <strong>der</strong> XHTML-DTD beinhaltet die Definition von Framesets<br />

und sollte von Dokumenten, die Framesets verwenden, angewendet<br />

werden.<br />

Für die Migration von HTML 4.01 nach XHTML 1.0 müssen folgende<br />

Anpassungen vorgenommen werden 157 .<br />

- Einfügen <strong>der</strong> XML-Deklaration <strong>für</strong> die Verarbeitung vom Browser<br />

sowie die Angabe des Dokumententyps<br />

Beispiel:<br />

<br />

<br />

- Namenraumangabe im HTML-Wurzelelement<br />

<br />

<br />

<br />

- Korrektes Verschachteln von Elementen, falsch eingebettete Tags<br />

sind verboten<br />

- Kleinschreibung von Element- und Attributnamen<br />

- Schlusstags <strong>für</strong> alle Elemente<br />

- Leere Elemente müssen abgeschlossen werden (z. B. o<strong>der</strong><br />

, )<br />

156 Pott, xml, 2000, S. 300.<br />

157 Vgl. Münz, html, 2001.<br />

80


Sicherung und Erhaltung des <strong>Intranet</strong>-Archivs<br />

- Optionale Tags, die in HTML möglich sind, müssen Anfangs- und<br />

Schluss-Tag haben<br />

- Attributwerte in Anführungszeichen setzen<br />

- Attributnamen dürfen nicht minimiert werden (z. B. in HTML<br />

möglich, in XHTML muss <strong>das</strong> Attribut einen<br />

Wert besitzen )<br />

- Verwendung von speziellen Attributen „id“ und „name“ <strong>für</strong><br />

Verweise zu Ankern<br />

- Für die Anzeige <strong>der</strong> verwendeten Sprache muss <strong>das</strong> Attribut<br />

xml:lang (statt in HTML „LANG“) verwendet werden<br />

- Behandlung von Leerzeichen innerhalb von Werten <strong>für</strong> die<br />

Attribute ist genau definiert. Mehrere Leerzeichen einschließlich<br />

Zeilenumbrüche sollten vermieden werden, denn sie werden mit<br />

genau einem Leerzeichen ersetzt.<br />

- Spezielle Zeichen, die im HTML Kontext verboten sind, außer<br />

wenn sie als Teil eines Markierungstags verwendet werden, sind in<br />

XHTML ebenfalls verboten, auch in eingebetteten Script- und<br />

Style Sheets-Bereichen, wie ,&[]´. Alternativ können diese in<br />

<strong>der</strong> DTD platziert o<strong>der</strong> in einer externen Datei abgelegt werden.<br />

9.3 Archivierungsstrategien<br />

Die Lesbarkeit und die Zugänglichkeit <strong>der</strong> Informationen hängt nicht zuletzt<br />

von Archivierungsstrategien wie Emulation o<strong>der</strong> Migration ab. In allen<br />

Archivierungsprojekten <strong>für</strong> Websites wird <strong>der</strong> Weg <strong>der</strong> Migration gewählt,<br />

wobei die Vorgehensweise auch kritisch betrachtet wird 158 . Die Migration<br />

ist ein ständig fortlaufen<strong>der</strong> Prozess, <strong>der</strong> mehr Personal erfor<strong>der</strong>t und hohe,<br />

permanente Kosten verursacht. Ein schwerwiegen<strong>der</strong> Nachteil <strong>der</strong><br />

Migration ist, <strong>das</strong>s dabei oft Informationen verloren gehen.<br />

„...it is not always possible to make an exact digital copy or replica<br />

of a database or other informational object as hardware and<br />

158 Bei <strong>der</strong> Emulation werden Programme (Emulatoren) entwickelt, die auf zukünftigen<br />

Systemen, <strong>das</strong> Verhalten veralteter Betriebssysteme nachahmen. Mit <strong>der</strong> Migration werden<br />

die Daten entwe<strong>der</strong> von einer Hardware/Software-Konfiguration auf die Nächste o<strong>der</strong> aber<br />

sie werden von einer Generation <strong>der</strong> Computertechnologie auf die darauffolgende<br />

übertragen. (nach: Task Force, Preserving Information, 1996, S. 4 f.), Vgl. NLA,<br />

PANDORA, 2001.<br />

81


Sicherung und Erhaltung des <strong>Intranet</strong>-Archivs<br />

software change and still maintain the compatibility of the object<br />

with the new generation of technology. ”159<br />

Die Migration stellt aber <strong>für</strong> alle bisherigen Projekte die einzige umsetzbare<br />

Archivierungsstrategie dar. Zwar gibt es noch <strong>das</strong> „Refreshing“, bei dem die<br />

Informationen auf ein neues Medium kopiert werden. Die Informationen<br />

sind aber nur so lange lesbar, bis die Hard- und Software nicht mehr zur<br />

Verfügung steht. „Refreshing“ kann nur eine Lösung <strong>für</strong> kurze Zeit sein 160 .<br />

9.3.1 Migration von webbasierten Aufzeichnungen<br />

Wenn <strong>der</strong> Datentyp veraltet o<strong>der</strong> nicht <strong>für</strong> die Archivierung geeignet<br />

erscheint, muss es auf einen neuen, equivalenten Datentyp konvertiert<br />

werden. Die Migration muss bei <strong>der</strong> hohen Anzahl von Dateien, die zu<br />

einem gespiegelten <strong>Intranet</strong>auftritt gehören, automatisch <strong>für</strong> jede einzelne<br />

Datei durchgeführt werden. Um eine vollständige Webseite zu konvertieren,<br />

muss nicht nur die Dokumentenbeschreibungssprache HTML, son<strong>der</strong>n auch<br />

alle eingebunden Text-, Grafik- und Videodateien sowie Style Sheets und<br />

Skriptsprachen migriert werden.<br />

Zum Beispiel: HTML 3.2 HTML 4.0 XHTML 1.0, CSS 1.0 CSS 2.0 XSL<br />

1.0, Java 1.0 Java 2.0.<br />

Theoretisch wird in den meisten Fällen <strong>der</strong> Inhalt konvertiert. Es kann aber<br />

auch die Darstellung bzw. <strong>das</strong> Ergebnis konvertiert werden 161 .<br />

Die Migration <strong>der</strong> Dateien sollte so oft wie nötig durchgeführt werden 162 .<br />

Dabei ist zu achten, <strong>das</strong>s die originalen Dateien immer erhalten bleiben, da<br />

eine Migration häufig mit Informationsverlusten verbunden ist.<br />

Zum Ablauf <strong>der</strong> Migration ist ein Protokoll anzufertigen und mit in dem<br />

Verzeichnis des durchgeführten Spiegelungsprojektes abzulegen ist.<br />

159<br />

Task Force, Preserving Information, 1996, S. 5.<br />

160<br />

„Refreshing thus cannot serve as a general solution for preserving digital information.“<br />

(Ebd., S. 4)<br />

161<br />

Vgl. Arms, Minerva, 2001.<br />

162<br />

„Web-based records and their associated metadata should be migrated as often as<br />

necessary to avoid technological obsolescence for as long a the records are required.”<br />

(NAA, Guidelines, 2001, S. 33)<br />

82


Sicherung und Erhaltung des <strong>Intranet</strong>-Archivs<br />

9.3.2 HTML-XML-Konverter<br />

Die Umwandlung von HTML 4.01 zu XHTML 1.0 ist theoretisch einfach<br />

durchzuführen, da XHTML ja bekanntlich eine Umformulierung von<br />

HTML 4.01 ist. Um Probleme bei <strong>der</strong> Validierung zu XHTML zu<br />

vermeiden, müssen die HTML-Dokumente gefiltert und korrigiert werden,<br />

da sonst viele Einbettungsfehler und Probleme bei XHTML auftreten<br />

können. Für die eigentliche Umwandlung existieren bereits automatische<br />

Konverter-Tools, die über <strong>das</strong> Internet aufrufbar sind. Sie enthalten Tidy 163 ,<br />

eine Anwendung, die HTML-Codes überprüft und korrigiert wird. Darüber<br />

können jedoch nur einzelne Webseiten korrigiert und transformiert werden.<br />

Auf Grund <strong>der</strong> hohen Anzahl von HTML-Dateien, die nach einer<br />

Spiegelung vorliegen, ist ein Konverter erfor<strong>der</strong>lich, <strong>der</strong> automatisch<br />

mehrere HTML-Dateien korrigiert und in XHTML umwandelt.<br />

Herr Oehler, Mitarbeiter <strong>der</strong> <strong>Dresdner</strong> Bank - Bereich STA Software-<br />

Technologie und –Architektur <strong>für</strong> die Allianz Gruppe Deutschland –<br />

Content Management hat einen HTML-XML-Konverter im Auftrag <strong>der</strong><br />

Allianz entwickelt, <strong>der</strong> diese Anfor<strong>der</strong>ungen erfüllt. Damit ist es möglich,<br />

ein Verzeichnis mit mehreren unkorrekten HTML-Dateien in reine XML-<br />

Dateien umzuwandeln. Der Prozess kann zwischen wenigen Sekunden bis<br />

ein paar Minuten dauern. Das hängt von <strong>der</strong> Anzahl <strong>der</strong> HTML-Dateien im<br />

Verzeichnis und dem Grad <strong>der</strong> Fehler in HTML ab.<br />

Ablauf<br />

Mit Hilfe von Batch-Dateien werden auf DOS-Ebene die einzelnen<br />

Arbeitsschritte nacheinan<strong>der</strong> durchgeführt 164 .<br />

Bevor <strong>der</strong> Konvertierungsablauf beginnt, werden die Dateien in einem<br />

Verzeichnis abgelegt, <strong>das</strong> in den folgenden Schritten immer als Gesamtheit<br />

betrachtet wird. Es werden ferner Verzeichnisse und Protokolldateien <strong>für</strong><br />

die Ergebnisse angelegt. Im ersten Schritt wird <strong>der</strong> HTML-Code <strong>der</strong> Dateien<br />

gefiltert, um nicht 100%ige korrekte HTML-Codes auf die Anwendung von<br />

Tidy vorzubereiten. Dazu gehören die Kleinsetzung von HTML-Tags sowie<br />

die Entfernung definierter Tags. An dieser Stelle tritt <strong>der</strong><br />

163 Tidy: http://www.w3.org/People/Raggett/tidy/<br />

83


Sicherung und Erhaltung des <strong>Intranet</strong>-Archivs<br />

Informationsverlust auf, wenn im Vorfeld nicht festgelegt wurde, wie die<br />

Tags ersetzt werden. Die gefilterten HTML-Dateien werden nun von Tidy<br />

geprüft und korrigiert. Die Quellcodes <strong>der</strong> HTML-Dateien werden auf<br />

Übereinstimmung mit den HTML-Standards 4.0 des W3C überprüft. Es<br />

werden die fehlenden Abschlusstags ergänzt und falsch geschachtelte<br />

Elemente richtig umgestellt. Als Ergebnis liegt korrektes HTML vor.<br />

Anschließend wird <strong>der</strong> HTML-Code in einen XHTML-Code umgewandelt.<br />

Dabei wird z. B. die ausgetauscht und bestimmte, vereinbarte<br />

Tags geän<strong>der</strong>t. Abschließend werden die XHTML-Codes mit Hilfe einer<br />

XSL-Datei in XML umgewandelt. Da<strong>für</strong> werden ein Parser und ein XSLT-<br />

Prozessor benutzt.<br />

Notwendige Anpassungen <strong>für</strong> die Konvertierung von HTML-Codes <strong>der</strong><br />

Snapshots<br />

Die Entwicklung von Herrn Oehler könnte bei <strong>der</strong> Migration von Webseiten<br />

des <strong>Intranet</strong>s <strong>der</strong> <strong>Dresdner</strong> Bank Anwendung finden. Das Programm müsste<br />

<strong>für</strong> die Migration von <strong>Intranet</strong>seiten wie folgt angepasst werden 165 .<br />

1. Anpassung des Filters: Es müssen Vereinbarungen getroffen werden,<br />

die über <strong>das</strong> Verbleiben veralteter HTML-Tags entscheiden, damit<br />

<strong>der</strong> Informationsverlust vermieden wird.<br />

2. Übergabe <strong>der</strong> CSS-Dateien an die Java-Parser und Erstellen einer<br />

XSL-Datei. Bei verschiedenen Styleguide-Versionen müssten<br />

eventuell auch verschiedene XSL-Dateien erstellt werden.<br />

3. Anpassung des Konverters mit folgendem Ablauf:<br />

a. Der Code <strong>der</strong> HTML-Datei wird erst einmal gefiltert. Eine<br />

Datei mit geän<strong>der</strong>tem Dateinamen wird erzeugt.<br />

b. Der HTML-Code des ersten Zwischenergebnisses wird mit<br />

Tidy korrigiert, entsprechend des HTML 4.01 -Standards.<br />

Der Dateiname bleibt gleich.<br />

c. Der HTML-Code des zweiten Zwischenergebnisses wird zu<br />

XHTML transformiert und erhält einen neuen Dateinamen.<br />

d. Das dritte Zwischenergebnis wird mittels XSL-Dateien im<br />

Browser dargestellt.<br />

164 Vgl. Abb. 23: Der Ablauf des HTML-XML-Konverters.<br />

84


Sicherung und Erhaltung des <strong>Intranet</strong>-Archivs<br />

Über den finanziellen Aufwand, <strong>der</strong> <strong>für</strong> <strong>das</strong> Historische Archiv anfallen<br />

würde, konnte Herr Oehler noch keine genaue Auskunft geben.<br />

9.4 Fazit<br />

Die Entwicklung von Herrn Oehler bietet eine automatische Umwandlung<br />

von HTML zu XHTML. Der Migrationsprozess nimmt wenig Zeit in<br />

Anspruch und könnte im Anschluss an je<strong>der</strong> Spiegelung durchgeführt<br />

werden, um die HTML-Dateien in ein zukünftiges Standardformat zu<br />

migrieren.<br />

Ein archivisches Problem war mit <strong>der</strong> Frage verbunden, welche<br />

Informationen bzw. Funktionalitäten bei einer Migration von vielleicht<br />

unkorrekten HTML nach XHTML verloren gehen. Nach Herrn Oehler wird<br />

die Migration kaum Verluste haben, wenn die <strong>Intranet</strong>seiten styleguide-<br />

konform sind und entsprechende XSL-Dateien erstellt werden. Was mit<br />

veralteten HTML-Tags geschieht, könne vereinbart werden, so <strong>das</strong>s <strong>der</strong><br />

erwartete Informatiosnverlust ausbleibt. Denn es können zum Beispiel<br />

Gestaltungsanweisungen in Stylesheets abgelegt werden.<br />

Für <strong>das</strong> Historische Archiv sind zur Zeit auch finanzielle Aspekte<br />

ausschlaggebend. Sprengt <strong>der</strong> Kostenvoranschlag <strong>das</strong> zur Verfügung<br />

stehende Budget, so lässt sich daraus schließen, <strong>das</strong>s <strong>der</strong> Migrationsprozess<br />

ausgelassen und später nachgeholt wird.<br />

165 Nach: Gespräch vom 13.02.2003, Email vom 26.03.2003.<br />

85


Zusammenfassung<br />

10. Zusammenfassung<br />

Die vorliegende Diplomarbeit beschreibt die Erarbeitung eines Konzeptes<br />

zur Archivierung des <strong>Intranet</strong>s <strong>der</strong> <strong>Dresdner</strong> Bank, <strong>das</strong> im Auftrag des<br />

Historischen Archivs des Unternehmens durchgeführt wurde.<br />

Im Rahmen <strong>der</strong> Voruntersuchung wurden Gespräche mit Verantwortlichen<br />

aus Archiv, <strong>Intranet</strong>redaktion sowie <strong>der</strong> Technikabteilung durchgeführt und<br />

die Ziele definiert sowie Probleme und Methoden argumentiert.<br />

Die Auseinan<strong>der</strong>setzung mit <strong>der</strong> Charakteristik des Mediums von Webseiten<br />

bzw. des <strong>Intranet</strong>s sind unumgänglich gewesen, um Archivierungs-<br />

maßnahmen beurteilen zu können. Webseiten/ <strong>Intranet</strong>seiten sind sehr<br />

kurzlebig und unterliegen <strong>der</strong> schnellen technischen Entwicklung im<br />

Bereich des Webs. Dadurch wird <strong>der</strong> Vorgang erschwert, Webseiten<br />

einzufangen und auf Dauer zu sichern.<br />

Berichte über bereits laufendende bzw. durchgeführte<br />

Archivierungsprojekte von Websites sind primäre Quellen <strong>für</strong> <strong>das</strong> weitere<br />

Vorgehen betreffs des <strong>Intranet</strong>s gewesen. Von beson<strong>der</strong>er Bedeutung war<br />

die Präsentation des Projekts „Internet Archiv“ durch Herrn Schmitz, aus<br />

<strong>der</strong> sich weitere Maßnahmen <strong>für</strong> <strong>das</strong> <strong>Intranet</strong> ergaben.<br />

Im Februar 2003 wurden innerhalb einer Woche Untersuchungen in <strong>der</strong><br />

<strong>Intranet</strong>redaktion durchgeführt. Es wurde analysiert die Datenhaltung, die<br />

Datenverwaltung und die Umsetzung von dem Styleguide 2.1. Ferner wurde<br />

eine Spiegelungssoftware ausgewählte, die <strong>für</strong> die Archivierung des<br />

<strong>Intranet</strong>s als geeignet erschien. Daraus wurde ein Ablauf zur Archivierung<br />

des <strong>Intranet</strong>s mit den folgenden Schritten entwickelt:<br />

1. Bewertung<br />

2. Spiegelung mit HTTrack<br />

3. XML-Dokument <strong>für</strong> Metadaten<br />

4. Migration von HTML nach XHTML<br />

5. Indexierung des migierten Snapshots<br />

6. Aufbereitung <strong>für</strong> <strong>das</strong> Archivierungs- und Benutzungsmedium<br />

86


Zusammenfassung<br />

7. Brennen <strong>der</strong> Dateien des Snapshots und des Indexes auf die CD-<br />

ROM<br />

8. Aufbereitung <strong>der</strong> CD-ROM <strong>für</strong> die Benutzung<br />

9. Benutzung<br />

10. Recherche und Zugriff auf den Snapshot bzw. auf die CD-ROM über<br />

die gesamte Anzahl <strong>der</strong> Indizes<br />

Zuständigkeiten im Archivierungsablauf wurden noch nicht eindeutig<br />

festgelegt.<br />

Mit HTTrack kann die Bewertung in Form <strong>der</strong> Festlegung von<br />

Spiegelungstiefe und -intervalle sowie mit Ein- und Ausschluss von Links,<br />

Pfadnamen, Dateinamen etc. erfolgen. Die Bewertungskriterien orientieren<br />

sich an denen von Renate Köhne-Lindenlaub aus dem „Handbuch <strong>für</strong><br />

Wirtschaftsarchive“. Die Umsetzung <strong>der</strong> Kriterien wird auf Grund <strong>der</strong><br />

ausreichenden Speicherkapazität des Archivierungs- und<br />

Benutzungsmediums in Frage gestellt. Welche Einstellungen mit HTTrack<br />

und wie häufig die Spiegelung schließlich vorgenommen werden sollen,<br />

muss von den Verantwortlichen <strong>für</strong> die Archivierung des <strong>Intranet</strong>s <strong>der</strong><br />

<strong>Dresdner</strong> Bank in weiteren Tests definiert und festgehalten werden. Diese<br />

Voreinstellungen sollten in regelmäßigen Abständen überprüft und ggf. neu<br />

definiert werden.<br />

Metadaten sind <strong>für</strong> die Archivierung unumgänglich, aber im Quellcode <strong>der</strong><br />

<strong>Intranet</strong>seiten nicht ausreichend mitgeliefert. Es muss ein Metadatenschema<br />

<strong>für</strong> die Publikation und <strong>für</strong> die Archivierung <strong>der</strong> <strong>Intranet</strong>seiten definiert<br />

werden. Genauere Vorschläge werden im Rahmen <strong>der</strong> Diplomarbeit nicht<br />

bearbeitet. Die Metadaten sollten in einem XML-Dokument gespeichert<br />

werden.<br />

Nach dem Spiegelungsablauf sollte im Anschluss die Migration <strong>der</strong> Dateien<br />

erfolgen. Dazu kann <strong>der</strong> entwickelte HTML-XML-Konverter angepasst<br />

werden, um gespiegelte HTML-Seiten des <strong>Intranet</strong>s in XHTML<br />

umzuwandeln. Bisher wurde seitens des Historischen Archivs aber noch<br />

87


Zusammenfassung<br />

keine Entscheidung getroffen, diese Möglichkeit <strong>der</strong> Migration im<br />

Archivierungsablauf anzuwenden.<br />

Genaue Vorstellungen zur Indexierung <strong>der</strong> webbasierten Aufzeichnungen<br />

bestehen noch nicht. Als Benutzungs- und Archivierungsmedium wurde die<br />

CD-ROM ausgewählt. Die Art und Weise <strong>der</strong> Benutzung ist jedoch noch<br />

ungeklärt.<br />

Ferner ist noch ungeklärt, wie die archivierten Snapshots mit den Metadaten<br />

verwaltet werden. Zur Zeit wird <strong>das</strong> Archivprogramm FAUST 3 verwendet.<br />

Mit <strong>der</strong> neuen Version FAUST 5 bestehe die Möglichkeit HTML-Seiten zu<br />

verwalten. Tests mit <strong>der</strong> Demo-Version konnten <strong>das</strong> Archiv nicht eindeutig<br />

überzeugen.<br />

Das vorgestellte <strong>Archivierungskonzept</strong> ist nach dem technischen Stand des<br />

<strong>Intranet</strong>s im Februar 2003 gut und schnell realisierbar. Die Komplexität <strong>der</strong><br />

Webseiten wird jedoch immer mehr zunehmen und eine Anpassung <strong>der</strong><br />

Archivierungsstrategie erfor<strong>der</strong>n.<br />

10.1. Empfehlungen <strong>für</strong> den Styleguide 3.0<br />

Aus den Ergebnissen <strong>der</strong> Untersuchung und <strong>der</strong> Entwicklung des<br />

Archivierungsablaufes ergeben sich Vorschläge 165 , die noch in den<br />

Styleguide 3.0 integriert werden können. Die Umsetzung dieser<br />

Empfehlungen würde die Archivierung des <strong>Intranet</strong>s zukünftig erleichtern.<br />

- Umsetzung <strong>der</strong> Styleguide-Vorgaben sollte als Unterstützung <strong>für</strong><br />

die zukünftige Archivierung des <strong>Intranet</strong>s betont werden<br />

- Verwendung von standardisierten, offenen, nichtproprietären<br />

Dateiformaten <strong>für</strong> Text, Bild, Grafik, Audio und Video<br />

- Verwendung von HTML 4.0, besser XHTML als Dokumenten-<br />

beschreibungssprache, ggf. sollten Tests mit Online-Validatoren<br />

durchgeführt werden<br />

- Verwendung einfacher Dateiformate, komplizierte Elemente und<br />

Anwendungen sollten vermieden werden<br />

165 Anregungen aus: NLA, Guidelines, 2001.<br />

88


Zusammenfassung<br />

10.2. Fazit<br />

- Obligatorische Anwendung vollständiger Metadatenkonzepte,<br />

z. B. auf <strong>der</strong> Grundlage von Dublin Core; ggf. sollten Metadaten-<br />

Elemente genauer definiert werden, um Missverständnissen<br />

vorzubeugen<br />

- Statische Links sollten durch relative ersetzt werden<br />

- Online-Quellen sollten auf neuen Browsern lesbar sein<br />

Abschließend ist zu festzustellen, <strong>das</strong>s die Archivierung von Webseiten<br />

bzw. <strong>Intranet</strong>seiten bereits praktiziert wird und in <strong>der</strong> Umsetzung weniger<br />

Aufwand bedarf als erwartet. Es wird aber auch deutlich, <strong>das</strong> sich an die<br />

Archivierung von Websites bisher nur wenige Archive gewagt haben. Aber<br />

enthält nicht auch <strong>der</strong> Internet- bzw. <strong>Intranet</strong>auftritt einer Behörde,<br />

Organisation, Institution o<strong>der</strong> eines Unternehmens wichtige Informationen,<br />

die <strong>für</strong> die zukünftigen Nutzer von Interesse sein könnten. Spiegeln sie nicht<br />

einen wichtigen Teil unserer heutigen Informationsgesellschaft wie<strong>der</strong>?<br />

Die Diplomarbeit zeigt, <strong>das</strong>s es sich lohnt ein neues Gebiet <strong>der</strong><br />

Archivierung zu betreten. Archivare sollten nicht davor zurückschrecken<br />

neue Informationsformen zu archivieren, sich mit <strong>der</strong> Technik auseinan<strong>der</strong><br />

zusetzen und über Archiv- und Län<strong>der</strong>grenzen hinweg zu kooperieren.<br />

89


Glossar<br />

BINGO<br />

Mit BINGO werden aktuelle Geschäftsinformationen und interne<br />

Rundschreiben im <strong>Intranet</strong> dargestellt. Über die Datenbankabfrage können<br />

Geschäftsinformationen ab den 31.03.1994 und Rundschreiben ab den<br />

16.08.2000 aufgerufen werden.<br />

Batch-Dateien<br />

Batch-Dateien bieten einfache, begrenzte Möglichkeiten <strong>der</strong><br />

Programmierung. (HTML-XML-Konverter, S. 8)<br />

Browser<br />

Der Browser ist ein Anwendungsprogramm, mit dem im Internet/<strong>Intranet</strong><br />

Dateien aufgerufen und angezeigt werden.<br />

Client-Programme<br />

Ein Programm, <strong>das</strong> auf eine Dienstleistung eines Servers zugreifen kann,<br />

bezeichnet man als Client-Programm.<br />

Content<br />

Umfasst die eigentlichen Informationen eines Online-Angebots, technisch<br />

dadurch gekennzeichnet, <strong>das</strong>s sie sich zwischen <strong>der</strong> Anfangs- und<br />

Endmarkierung in einem Element eines HTML- o<strong>der</strong> SGML-Dokuments<br />

befinden.<br />

CD-ROM<br />

Die CD ist ein optisches Speichermedium und in verschiedenen Typen<br />

vorhanden, <strong>der</strong>en gemeinsame Grundlage <strong>für</strong> <strong>das</strong> Aufzeichnungsformat in<br />

<strong>der</strong> Norm ISO 9660 festgelegt ist. Ein Typ davon ist die CD-ROM, die nur<br />

einmal beschrieben werden kann. Die Speicherkapazität liegt bei<br />

ca. 650 MB.<br />

Domäne<br />

Im Internet wird unter Domäne ein Bereich verstanden, <strong>der</strong> durch<br />

gemeinsame Merkmale gekennzeichnet ist. Meist versteht man darunter eine<br />

Gruppe von Computern mit gemeinsamen Namensbestandteilen. Der<br />

kleinste gemeinsame Namenbestandteil heißt Top-Level-Domain und<br />

ist z. B. <strong>das</strong> Län<strong>der</strong>kürzel .de o<strong>der</strong> an<strong>der</strong>e Kürzel wie *. com, *.org.<br />

DVD<br />

Die DVD ist ein optisches Speichermedium mit den Abmessungen und<br />

Funktionen einer CD, aber mit einer wesentlich höheren Speicherkapazität.<br />

Sie kann zwischen 4,7 GB (zum eigenen Brennen geeignet) bis 17 GB (nur<br />

ab Presswerke erhältlich) betragen. Es existieren verschiedene Typen wie<br />

bei <strong>der</strong> CD, z. B. auch eine DVD-ROM. Es besteht aber noch keine<br />

einheitliche Norm. Denn die Entwicklung ist noch nicht abgeschlossen.<br />

Verschiedene Herstellergruppen bestehen mit z. T. unterschiedlichen<br />

Produkten und Formaten nebeneinan<strong>der</strong>.<br />

90


Frame<br />

Ein abgetrennter Bereich auf einer Webseite, in dem eigene Inhalte o<strong>der</strong><br />

aber auch fremde Webseiten angezeigt werden, wird als Frame bezeichnet.<br />

Migration<br />

Die Migration ist eine Methode zur Erhaltung elektronischer<br />

Aufzeichnungen, bei <strong>der</strong> die Informationen auf eine neue Plattform<br />

überführt werden.<br />

Parser<br />

Parser sind Programme, die Dokumente o<strong>der</strong> Programmquelltexte nach<br />

vorgegebenen Kriterien syntaktisch analysieren und in einzelne Bestandteile<br />

aufglie<strong>der</strong>n. Sie erkennen die grammatische Struktur von Sätzen.<br />

Anschließend ersetzen sie die Textteile durch Anweisungen, Code o<strong>der</strong><br />

an<strong>der</strong>e geeignete Elemente.<br />

Server<br />

Ein Server ist ein Computer, <strong>der</strong> in einem Netzwerk seine Dienste an<strong>der</strong>en<br />

Computern (den sog. Clients) zur Verfügung stellt.<br />

Style Sheets<br />

Style Sheets sind Formatvorlagen, nach denen die Darstellung eines<br />

Dokuments gesteuert werden kann. Strukturierungen und Formatierungen<br />

des Dokumentes lassen sich dadurch besser voneinan<strong>der</strong> trennen. Damit<br />

ermöglichen sie ein effektiveres Gestalten und Umgestalten von<br />

Dokumenten. Für die Auszeichnungssprache HTML besteht CSS, <strong>der</strong> in<br />

XML Anwendung finden kann. Jedoch können nicht alle Vorteile von XML<br />

genutzt werden. Für die Darstellung von XML-Dokumenten besteht <strong>der</strong><br />

XML-basierte Style Sheet XSL.<br />

Spiegelung<br />

Die Spiegelung ist ein Verfahren, um Webseiten nach einer auswählenden<br />

Vorgehensweise einzufangen. Die Software kopiert automatisch alle<br />

Dateien <strong>der</strong> Website bis hin zu einer bestimmten Verzeichnungsebene zu<br />

einem bestimmten Zeitpunkt. Es extrahiert dabei alle Links, die auf<br />

<strong>der</strong>selben Website platziert sind. Die Tiefe <strong>der</strong> Verzeichnungsebenen wird<br />

als Spiegelungstiefe bezeichnet. Für die regelmäßige Durchführung muss<br />

ein Spiegelungsintervall festgelegt werden.<br />

URI (Uniform Resource Identifier)<br />

Die URI ist eine eindeutige Zeichenfolge, die ein Objekt im Web eindeutig<br />

identifiziert und beschreibt.<br />

URL (Uniform Resource Locator)<br />

Die URL ist die häufigste Form <strong>der</strong> URI, die zur Lokalisierung von Rechner<br />

und Speicherort einer Datei dient.<br />

Validisierung<br />

Bezeichnet die Überprüfung <strong>der</strong> strukturellen Gültigkeit <strong>der</strong> zu<br />

verarbeitenden Daten.<br />

91


Webseite<br />

Die Webseite ist eine einzelne Seite eines Informationsanbieters im Internet/<br />

<strong>Intranet</strong>.<br />

Website<br />

Eine Website besteht aus einer Gruppe hierarchisch angeordneter<br />

Webseiten. Die einzelnen Seiten einer Website sind durch Hyperlinks<br />

miteinan<strong>der</strong> verbunden.<br />

World Wide Web Consortium (W3C)<br />

Das W3C ist eine nicht staatliche und nicht kommerzielle Organisation,<br />

<strong>der</strong>en Aufgabe es ist offenen Standards zu entwickeln und zu publizieren,<br />

durch die ein allgemeiner Informationsaustausch im Internet/<strong>Intranet</strong><br />

möglich ist.<br />

92


Literatur- und Quellenverzeichnis<br />

(letzte Zugriffe am 05.06.2003)<br />

Arms, William Y. [u.a.] [zit. Arms, Minerva, 2001]:<br />

Collecting and Preserving the Web: The Minerva Prototype, in:<br />

RLG DigiNews (2001), Vol. 5., No. 2<br />

<br />

Arvidson, Allan [u.a.] [zit. Arvidson, Kulturarw3Project, 2000]:<br />

The Kulturarw3Project, The Royal Swedish Web Archiw3e –<br />

An example of “complete” collection of web pages, in:<br />

Conference Proceedings, 66 th IFLA council and General<br />

Conference, Jerusalem 13-18 August 2000<br />

<br />

Australian Standard AS 4390.5-1996, Records Management, 6.3 (zit. aus:<br />

NAA, Guidelines, 20001, S. 20)<br />

Bager, Jo [zit. Bager, CMS, 2002]:<br />

Hüter <strong>der</strong> Inhalte, Websites mit Content-Management-Systemen<br />

verwalten, in: c´t magazin <strong>für</strong> computer technik (2002), Heft 20,<br />

S. 178 – 183<br />

Barnert, Silvia [u.a.] [zit. Barnert, Brockhaus, 2003]:<br />

Der Brockhaus, Computer- und Informationstechnologie,<br />

Hardware, Software, Multimedia, Internet, Telekommunikation,<br />

Leipzig, Mannheim 2003<br />

Becker, Oliver [zit. Becker, XML, 2002]:<br />

Informationsmethodik III: XML, Vorlesungsmaterialien, FH<br />

Potsdam, Berlin 2002<br />

<br />

Bischoff, Frank [zit. Bischoff, Emulation, 1999]:<br />

Emulation – <strong>das</strong> <strong>Archivierungskonzept</strong> <strong>der</strong> Zukunft?, in:<br />

Digitale Herausfor<strong>der</strong>ungen <strong>für</strong> Archive, 3. Tagung des<br />

Arbeitskreises „Archivierung von Unterlagen aus digitalen<br />

Systemen“ am 22. und 23. März 1999 im Bundesarchiv in<br />

Koblenz, hrsg. von Michael Wettengel, Koblenz 1999, S. 15-23<br />

Boudrez, Filip [zit. Bodrez, David Nr. 5, 2002]:<br />

Digitale ArchivVering: rIchtlijn & aDvies nr. 5, Websitesbeheer<br />

voor archivering, Antwerpen 2002<br />

<br />

Büchner, Heino [u.a.] [zit. Büchner, WCM, 2001]:<br />

Web Content Management, Websites professionell betreiben, Bonn 2001<br />

93


Büttner, Stephan [zit. Büttner, Formate, 2002]:<br />

Digitale Bibliothek, Elektronisches Publizieren: Formate,<br />

Vorlesungsmaterialien an <strong>der</strong> FH Potsdam, Potsdam SS 2002.<br />

Dauen, Sabine [zit. Dauen, Aufbewahrungspflichten, 2002]:<br />

Aufbewahrungspflichten, von Originaldokumenten bis zur<br />

elektronischen Archivierung, Vorschriften, Fristen,<br />

Nachweisepflichten, Vernichtung, Freiburg im Breisgau 2002<br />

Endres, Albert; Fellner, Dieter W. [zit. Endres, Bibliotheken, 2000]:<br />

Digitale Bibliotheken: Informatiklösungen <strong>für</strong> globale<br />

Wissensmärkte, Heidelberg 2000<br />

Hakala, Juha [zit. Hakala, NEDLIB, 2001]:<br />

Collecting and Preserving the Web: Developing and Testing the<br />

NEDLIB Harvester, in: RLG DigiNews (2001), Vol. 5, No. 2<br />

<br />

HTTrack Website Copier 3.2.3. [zit. HTTrack 3.2.3]<br />

<br />

Infopark AG, NPS 5.2, Datenblatt [zit. NPS 5.2, Datenblatt, 2002]<br />

<br />

IM (Information Management) Forum Internet and <strong>Intranet</strong> Working<br />

Group [zit. IM Forum, Approach, 1999]:<br />

An Approach to Managing Internet and <strong>Intranet</strong> Information for<br />

Long Term Access and Accountability, 24. September 1999<br />

<br />

International Council on Archives [zit. ICA, Guide, 1997]:<br />

Guide for managing electronic records from an archival<br />

perspective, hrsg. Vom committee on Electronic Records, Paris<br />

1997 (ICA Studies; 8)<br />

<br />

ISO 15489-1 [zit. ISO 15489-1, 2001]:<br />

Information and documentation – Records management – Part 1:<br />

General, 2001<br />

LeFurgy, William G. [zit. LeFurgy, Management, 2001]:<br />

Records and Archival Management of World Wide Web Sites<br />

<br />

Lienemann, Gerhard; Dördelmann, Frauke [zit. Lienemann, <strong>Intranet</strong>s,<br />

2003]:<br />

<strong>Intranet</strong>s, Konzeption, Sicherheit und Realisierung, Zutphen<br />

2003<br />

94


Lixfeld, Dirk [zit. Lixfeld, brain, 2003]:<br />

dresdner brain, Das <strong>Intranet</strong> <strong>der</strong> Unternehmenskommunikation,<br />

PowerPoint-Präsentation, Frankfurt/M. Februar 2003<br />

Köhne-Lindenlaub, Renate [zit. Köhne-Lindenlaub, Bewertung, 1998]:<br />

Erfassen, Bewerten, Übernehmen, in: Handbuch <strong>der</strong><br />

Wirtschaftsarchive, Theorie und Praxis, hrsg. von Evelyn<br />

Kroker [u.a.], München 1998<br />

Lupovici, Catherine; Masanès, Julien [zit. Lupovici, Metadata, 2000]:<br />

Metadata for long term-preservation, hrsg. NEDLIB, Den Haag<br />

2000 (Report series; 2)<br />

<br />

Lyman, Peter [zit. Lyman, <strong>Archiving</strong> WWW, 2002]:<br />

<strong>Archiving</strong> the World Wide Web, in: Building a National<br />

Strategy for Digital Preservation: Issues in Digital Media<br />

<strong>Archiving</strong>, copublished by the Council on Library and<br />

Information Resources and the Library of Congress, Washington<br />

2002<br />

<br />

Mannerheim, Johan [zit. Mannerheim, heritage, 2000]:<br />

The WWW and our digital heritage – the new preservation tasks<br />

of the library community (66 th IFLA council and Conference,<br />

Conference Proceedings, Jerusalem 13-18 August 2000<br />

<br />

Masanès, Julien [zit. Masanès, Web <strong>Archiving</strong>, 2002]:<br />

Towards Continuous Web <strong>Archiving</strong>, First Results and Agenda<br />

for the Future, in: D-Lib Magazine, December 2002, Vol. 8 No.<br />

12<br />

<br />

McClure, C. R.; Sprehe, J. T.[zit. McClure, Analysis, 1998]:<br />

Analysis and Development of Model Quality Guidelines for<br />

Electronic Records Management on State and Fe<strong>der</strong>al Websites,<br />

1998 (zit. aus: IM Forum, Approach, 1999)<br />

Münz, Stefan [Münz, html, 2001]:<br />

Selfhtml Version 8.0 vom 27.10.2001<br />

<br />

National Archives of Australia [zit. NAA, DIRKS, 2003]:<br />

Risk analysis in DIRKS, in: DIRKS Manual, 2003<br />

<br />

95


National Archives of Australia [zit. NAA, Policy, 2002]:<br />

<strong>Archiving</strong> Web Resources: A Policy for Keeping Records of<br />

Web-based Activity in the Commonwealth Government, revised<br />

January 2002<br />

<br />

National Archives of Australia [zit. NAA, Guidelines, 2001]:<br />

<strong>Archiving</strong> Web Resources: Guidelines for Keeping Records of<br />

Web-based Activity in the Commonwealth Government,<br />

Canberra 2001 <br />

National Library of Australia [zit. NLA, PANDORA, 2001]:<br />

<strong>Archiving</strong> the Web: The PANDORA Archive at the National<br />

Library of Australia, Canberra 2001<br />

<br />

National Library of Australia [zit. NLA, Selection, 2001]:<br />

National Library of Australia: Guidelines for Selection of<br />

Online Australian Publications Intended for Preservation by the<br />

National Library of Australia, Canberra 2001<br />

<br />

National Library of Australia [zit. NLA, Guidlines, 2001]:<br />

Safeguarding Australian´s web resources: Guidelines for<br />

creators and publishers, Canberra 2001<br />

<br />

Nordic Web Archives (NWA):<br />

NWA, About the Toolset (letzte Än<strong>der</strong>ung 05.09.2002)<br />

<br />

Oehler, Daniel [zit.Oehler, Konverter, 2002]:<br />

HTML-XML-Konverter, PowerPoint-Präsentation, Frankfurt/M.<br />

5.11.2002<br />

Ohst, Daniel [zit. Ohst, Dateiformate, 1998]:<br />

Dateiformate <strong>für</strong> <strong>das</strong> elektronische Publizieren, (Studienarbeit,<br />

Humboldt-Universität zu Berlin, Institut <strong>für</strong> Informatik), Berlin<br />

1998<br />

<br />

Pott, Oliver; Wielage, Gunter [zit. POTT, xml, 2000]:<br />

xml, praxis und referenz, 2.erw. und akt. Aufl., München 2000<br />

(Markt & Technik; 25737)<br />

Sitepark GmbH [zit. Sitepark, <strong>Dresdner</strong>]:<br />

Die <strong>Dresdner</strong> Bank (Referenz)<br />

<br />

96


Stadsarchief Antwerpen:<br />

Metadataschema voor gearchiveerde <strong>websites</strong>, Antwerpen<br />

<br />

Website-Archief<br />

<br />

Rothenberg, Jeff [Rothenberg, Emulation, 2000]:<br />

An Experiment in Using Emulation to preserve Digital<br />

Publications, hrsg. NEDLIB, Den Haag 2000 (Report Series; 1)<br />

<br />

Rothfuss, Gunther; Ried, Christian [zit. Rothfuss, CMS, 2001]:<br />

Content Management mit XML: Grundlagen und<br />

Anwendungen, Berlin [u.a.] 2001<br />

Rusch-Feja, Diann (Übers.)[zit. Rusch-Feja, Dublin Core,1997]:<br />

Metadata-Tags zur Erschließung von Internetquellen, hrsg. von<br />

Bibliothek und Wissenschaftliche Dokumentation, Max-Planck-<br />

Institut <strong>für</strong> Bildungsforschung, Stand 18.12.1996, [Berlin] 1997<br />

<br />

Schmitz, Rudolf [zit. Schmitz, Archivierung, 2002]:<br />

Archivierung von <strong>Intranet</strong>seiten, Spiegelungsprojekt im Archiv<br />

<strong>der</strong> sozialen Demokratie (AdsD), in: Der Archivar 55 (2002),<br />

S. 135-136<br />

Task Force on <strong>Archiving</strong> of Digital Information (Hrsg.) [zit. Task Force,<br />

Preserving Information, 1996]:<br />

Preserving digital Information, Report of the Task Force on<br />

<strong>Archiving</strong> of Digital Information, commissioned by The<br />

Commission on Preservation and Access and The Research<br />

Libraries Group, 1996<br />

<br />

Teleport Pro Offline Browsing Webspi<strong>der</strong> [zit. Teleport Pro]<br />

<br />

Tidy - <br />

World Wide Web Consortium [zit.: W3C]<br />

<br />

97


Quellen im <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank<br />

(letzte Zugriffe am 31.03.2003)<br />

Corporate Center Unternehmenskommunikation [zit. CC UK, Factsheet,<br />

2002] :<br />

<strong>Intranet</strong> Factsheet (letzte Än<strong>der</strong>ung 27.08.2002)<br />

<br />

Corporate Center Unternehmenskommunikation [zit. CC UK, <strong>Intranet</strong>-<br />

Styleguide, 2002]:<br />

<strong>Intranet</strong>-Styleguide (Intro) 2.1 (letzte Än<strong>der</strong>ung 23.5.2002)<br />

<br />

Corporate Center Unternehmenskommunikation - Historisches Archiv [zit.<br />

<strong>Intranet</strong> HistArchiv, Archivwürdig, 2002]:<br />

Archivwürdiges Material (letzte Än<strong>der</strong>ung 4.6.2002)<br />

<br />

Corporate Center Unternehmenskommunikation - Interne Kommunikation<br />

CC Unternehmenskommunikation (letzte Än<strong>der</strong>ung 27.11.2002)<br />

<br />

Corporate Center Unternehmenskommunikation - Interne Kommunikation<br />

[zit. CC UK IK, Plattform, 2002]:<br />

Unsere Plattform (letzte Än<strong>der</strong>ung 27.08.2002)<br />

<br />

Corporate Center Unternehmenskommunikation - Interne Kommunikation,<br />

Redaktion <strong>Intranet</strong> [zit. CC UK IK, Styleguide 2.1, 2001]:<br />

<strong>Intranet</strong>-Styleguide <strong>für</strong> die <strong>Dresdner</strong> Bank, Version 2.1., Stand<br />

15.10.2001<br />

<br />

Corporate Center Unternehmenskommunikation - Interne Kommunikation,<br />

Redaktion <strong>Intranet</strong><br />

Willkommen auf den <strong>Intranet</strong>seiten <strong>der</strong> <strong>Dresdner</strong> Bank (letzte<br />

Än<strong>der</strong>ung 31.03.2002)<br />

<br />

Technischer Arbeitskreis des <strong>Intranet</strong>s [zit. Techn. Arbeitskreis, Styleguide<br />

3, 2003]<br />

[Styleguide 3.0], Auszug, PowerPoint-Präsentation, Frankfurt<br />

16.01.2003<br />

<br />

98


99<br />

Tab. 1: <strong>Archiving</strong> <strong>websites</strong> – Projekte<br />

Projekte, die im Zusammenhang mit <strong>der</strong> Archivierung von Websites stehen<br />

Name des Projektes Start Verantwortliche Beschreibung Informationen<br />

EPPP (Electronic<br />

Publication Pilot Project)<br />

1994 National Library of Canada Sicherung elektronischer Publikationen, u.a. Online-<br />

Publikationen („selective approach“)<br />

Occasio 1995 International Institute of Social<br />

History (Amsterdam); Antenna<br />

(Amsterdam)<br />

PANDORA (Preserving and<br />

Accessing Networked<br />

Documentary Resources of<br />

Australia)<br />

Beginn mit <strong>der</strong> Archivierung von<br />

newsmessages/newsgroups <strong>der</strong> „Association for<br />

Progressive Communication“ durch Antenna; Fortführung<br />

vom IISH; Überlegungen zur Speicherung von relevanter<br />

Websites („selective approach“)<br />

06/1996 National Library of Australia Sicherung australischer Online-Publikationen („selective<br />

approach“); Entwicklung <strong>der</strong> Software PANDAS <strong>für</strong> die<br />

Verwaltung archivierter webbasierter Dokumente;<br />

bestimmte webbasierte Aufzeichnungen und Websites<br />

werden von den National Archives of Australia archiviert<br />

(„selective approach“ mit HTTrack)<br />

The Internet Archive 10/1996 Internet Archive (San Fransisco),<br />

Grün<strong>der</strong> Brewster Kahle<br />

Sicherung weltweiter Websites des Internets in großer<br />

Anzahl („comprehensive approach“)<br />

Kulturarw3 04/1997 The Royal Library of Sweden Sicherung schwedischer Webseiten des Internets<br />

(„comprehensive approach“)<br />

EWA (European Web<br />

Archive)<br />

NEDLIB (Networked<br />

European Deposit LIBrary)<br />

06/1997 Konsortium aus 10 Bibliotheken,<br />

10 Universitäten und Research<br />

Centers sowie 5 Firmen<br />

01/1998 Zusammenschluss europäischer<br />

Bibliotheken<br />

Ziele (nach „comprehensive approach“):<br />

- Entwicklung eines Datenhaltungssystems<br />

- „best practice reports and standards“<br />

- training material<br />

- state-of-the –art research<br />

Entwicklung einer grundlegenden Infrastruktur <strong>für</strong> digitale<br />

Publikationen; bisherige Ergebnisse:<br />

http://www.nlc -<br />

bnc.ca/9/8/index-e.html<br />

http://www.iisg.nl/occasio/<br />

http://pandora.nla.gov.au/<br />

index.html;<br />

http://www.naa.gov.au/record<br />

keeping/er/web-resords/<br />

intro.htm<br />

http://www.archive.org<br />

http://www.kb.se/kw3/<br />

http://www.erpanet.org/www/<br />

products/urbino/Presentations/<br />

RauberErpanet02.pdf<br />

http://www.kb.nl/coop/ nedlib/


100<br />

The Nordic Metadata<br />

Projects<br />

- Entwicklung und Test des Web Crawlers „NEDLIB<br />

harvester“ („comprehensive approach“)<br />

- Entwicklung von Metadaten <strong>für</strong> die dauerhafte<br />

Aufbewahrung<br />

- Entwicklung von Indexierungs- und Recherchetools<br />

im Rahmen des NWA-Projektes<br />

05/1998 National Library of Norway Im Zusammenhang mit <strong>der</strong> Sicherung norwegischer<br />

Webseiten im Internet seit 05/1998 („comprehensive<br />

approach“); „The Nordic Metadata Project“ (Teil 1: 1996-<br />

1998, Teil 2: 1999-2000):<br />

Internet Archiv 1998 Archiv <strong>der</strong> sozialen Demokratie<br />

(Bonn)<br />

Archipol -<br />

Archiveringsproject<br />

ne<strong>der</strong>landse partijsites<br />

01/2000<br />

(-12/2002)<br />

Minerva 03/2000-<br />

06/2001<br />

Documentatiecentrum Ne<strong>der</strong>landse<br />

Politieke Partijn,<br />

Universiteitsbibliotheek van de<br />

Rijksuniversiteit Groningen<br />

- Erweiterung <strong>der</strong> Dublin Core-Elemente,<br />

Implementierung in XML/RDF<br />

- Entwicklung eines Dublin Core-MARC-Konverters<br />

- Benutzungsrichtlinie <strong>für</strong> Dublin Core<br />

Archivierung von Websites <strong>der</strong> SPD im Internet<br />

(„selective approach“ mit Teleport Pro)<br />

Archivierung von Websites nie<strong>der</strong>ländischer, politischer<br />

Parteien und <strong>der</strong>en Nebeneinrichtungen im Internet<br />

(„selective approach“ mit HTTrack); Ziele:<br />

- Entwicklung von Archivierungsstandards betreffs<br />

Intervallen,<br />

- Entwicklung von einer Infrastruktur <strong>für</strong> die<br />

Verwaltung archivierter Websites<br />

- Entwicklung von einer Migrationsstrategie<br />

- Gestaltung einer Website <strong>für</strong> <strong>das</strong> Projekt; z. Zt. noch<br />

keine Ergebnisse verfügbar<br />

Library of Congress (Washington) Archivierung bestimmter, einzelner Websites („selective<br />

approach“ mit HTTrack)<br />

http://www.lib.helsinki.fi/<br />

meta/<br />

Vgl. Schmitz, Archivierung,<br />

2002<br />

http://www.archipol.nl/<br />

http://www.loc.gov/minerva;<br />

http://www.rlg.org/preserv/dig<br />

inews/diginews5-<br />

2.html#feature1


101<br />

NWA (Nordic Web<br />

Archive)<br />

11/2000-<br />

07/2002<br />

National Library of Norway,<br />

Nordunet2<br />

Ist ein Forum <strong>für</strong> die Koordination und den Austausch von<br />

Erfahrungen auf dem Gebiet des Herunterladens<br />

(„comprehensive approach“), und des Archivierens von<br />

Webdokumenten, Schwerpunkte:<br />

- Entwicklung einer Software <strong>für</strong> <strong>das</strong> Herunterladen<br />

von Webdokumenten<br />

- Entwicklung des „NWA toolset“ als Lösung <strong>für</strong> die<br />

Suche und Navigation von Beständen archivierter<br />

Webdokumente. Neues Projekt 03/2003-04/ 2004:<br />

Weiterentwicklung <strong>der</strong> „NWA toolset“<br />

“Archiviering van <strong>websites</strong>” 2001 Stadsarchief Antwerpen Archivierung <strong>der</strong> Website von <strong>der</strong> Stadt Antwerpen:<br />

Richtlinien <strong>für</strong> die Archivierung von Websites („selective<br />

approach“), im Rahmen von DAVID (Digitale<br />

Archivering in Vlaamse Instellingen en Diensten),<br />

Verwaltung über die Verzeichnisstruktur, XML-<br />

Metadatenschema, Online-Nutzung nur in dem Archiv<br />

Netarchive 08/2001-<br />

07/2002<br />

Quelle: Eigene Zusammenstellung<br />

Royal Library of Denmark, The<br />

State and University Library<br />

(Aarhus), centre for Internet<br />

Research at the University of<br />

Aarhus, Denmark´s Electronic<br />

Research Library<br />

Sicherung dänischer Webseiten im Internet<br />

(„comprehensive approach“)<br />

http://nwa.nb.no/,<br />

XML-Schema <strong>für</strong> Metadaten<br />

mit Beispiel über:<br />

http://nwa.nb.no/aboutNwaT.p<br />

hp<br />

http://www.antwerpen.be/<br />

david/nl/text_<strong>websites</strong>. htm<br />

http://www.netarchive.dk


102<br />

Tab. 2: Tabellarische Übersicht zur Darstellung und Verwaltung <strong>der</strong> <strong>Intranet</strong>angebote<br />

<strong>Intranet</strong>angebote Styleguide 2.1 Verantwortliche Externe Datenhaltung – wo? CMS „infosite“ BRAIN-Server<br />

Nachrichten Ja CC UK IK - Ja Ja<br />

Presseschau Ja CC UK IK CC UK Medienanalyse, CC<br />

Volkswirtschaft<br />

Teilweise Teilweise<br />

Webmail Ja CC UK IK - Ja Ja<br />

Web-TV Ja CC UK Corporate Publishing Redaktion<br />

Web-TV<br />

CC UK Corporate Publishing Redaktion<br />

Web-TV<br />

Archiv Ja CC UK IK CC UK Corporate Publishing Redaktion<br />

Web-TV<br />

Forum, <strong>Intranet</strong><br />

Deutschland Forum<br />

Konzernnavigator<br />

(Oberfläche)<br />

Regionen/<br />

Nie<strong>der</strong>lassungen<br />

Tochtergesellschaften<br />

/ Beteiligungen<br />

Nein Nein<br />

Teilweise Teilweise<br />

Nein CC UK IK - Ja Ja<br />

Ja CC UK IK - Ja Ja<br />

Teilweise Regionen/ Nie<strong>der</strong>lassungen Keine Aussage möglich (Contents <strong>der</strong><br />

Rhein-Main-Region teilweise bei CC UK<br />

IK)<br />

Nein (nur teilweise<br />

Rhein-Main-<br />

Region)<br />

Nein Tochtergesellschaften/ Beteiligungen Keine Aussage möglich Nein Nein<br />

Allianz AG Nein Allianz AG Allianz Group Nein Nein<br />

Corporate Center<br />

(CC)<br />

Nein (nur teilweise<br />

Rhein-Main-<br />

Region)<br />

Überwiegend Einzelne Corporate Centers Nur vereinzelt bei den CCs Überwiegend Überwiegend<br />

Corporate Services Ja Corporate Services - Nein Nein<br />

Corporate Markets Nein Corporate Markets Keine Aussage möglich Nein Nein


103<br />

Private Kunden und<br />

Geschäftskunden<br />

Ja „Private Kunden und Geschäftskunden“ Keine Aussage möglich Nein Nein<br />

A-Z Index Ja CC UK IK - Ja Ja<br />

BINGO Nein „Private Kunden und Geschäftskunden“ Private Kunden und Geschäftskunden Nein Nein<br />

Business Travel<br />

Service<br />

Nein Flächenmanagement Flächenmanagement Nein Nein<br />

MIS Nein Fa. DREMIS Fa. DREMIS Nein Nein<br />

Mitarbeiter Ja CC Personal Keine Aussage möglich Nein Nein<br />

PRIMA Ja CC Personal Keine Aussage möglich Nein Nein<br />

Turnaround-<br />

Programm<br />

Ja CC UK IK - Ja Ja<br />

Allianz.com News Nein Allianz Group Allianz Group Nein Nein<br />

Gallileo Ja CC UK IK - Ja Ja<br />

Telefonbuch Nein ISSTA (Allianz Group) Sehr zerstreut Nein Nein<br />

Quelle: Eigene Zusammenstellung


Abb. 1: Metadata-Elemente des Dublin Core-Standards<br />

1. Titel (DC. CREATOR)<br />

2. Verfasser o<strong>der</strong> Urheber (DC.CREATOR)<br />

3. Thema und Schlagwörter (DC.SUBJECT)<br />

4. Inhaltliche Beschreibung (DC.DESCRITION)<br />

5. Herausgeber (DC.PUBLISHER)<br />

6. Weitere beteiligte Personen und Körperschaften<br />

(DC.CONSTRIBUTORS)<br />

7. Datum (DC.DATE) (erweiterbar)<br />

a. Datum <strong>der</strong> ersten Veröffentlichung (DC.CREATION<br />

b. Datum <strong>der</strong> letzten Än<strong>der</strong>ung (DC.LASTMODIFIED)<br />

8. Ressourcenart (DC.TYPE)<br />

9. Format (DC.FORMAT)<br />

10. Ressourcen-Identifikation (DC.IDENTIFIER)<br />

11. Quelle (DC.SOURCE)<br />

12. Sprache (DC.LANGUAGE)<br />

13. Beziehung zu an<strong>der</strong>en Ressourcen (DC.RELATION)<br />

14. Räumliche und zeitliche Maßnahmen (DC.COVERAGE)<br />

15. Rechtliche Bestimmungen (DC.RIGHTS)<br />

Quelle: Rusch-Feja, Diann (Übers.): Metadata-Tags zur Erschließung von<br />

Internetquellen, hrsg. von Bibliothek und Wissenschaftliche<br />

Dokumentation, Max-Planck Institut <strong>für</strong> Bildungsforschung, Stand<br />

18.12.1996, [Berlin] 1997<br />

<br />

104


105<br />

Abb. 2: Das <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank – <strong>das</strong> erste Portal (Screenshot ohne Datum)<br />

Quelle: Lixfeld, Dirk: dresdner brain, Das <strong>Intranet</strong> <strong>der</strong> Unternehmenskommunikation,<br />

PowerPoint-Präsentation, Frankfurt/M. Februar 2003 [keine Folienangabe vorhanden])


106<br />

Abb. 3: „Wie kommen meine Informationen ins Netz?“<br />

Publisher<br />

Technik<br />

Design<br />

Corporate<br />

Center IT<br />

Corporate<br />

Center UK<br />

Aktivierung<br />

<strong>Intranet</strong> <strong>der</strong><br />

<strong>Dresdner</strong><br />

Bank<br />

Quelle: <strong>Dresdner</strong> Bank CC UK IK Redaktion <strong>Intranet</strong>: <strong>Intranet</strong>-Styleguide <strong>für</strong> die <strong>Dresdner</strong> Bank, Version 2.1., Stand 15.10.200, S. 56


107<br />

Abb. 4: Das <strong>Intranet</strong> <strong>der</strong> Dresdener Bank – <strong>das</strong> Portal<br />

Quelle: Screenshot vom 12.02.2000


Abb. 5: Das <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank - diverse Screenshots vom<br />

12.02.2003<br />

Konzernnavigator -<br />

bietet einen direkten<br />

Einstieg zu den<br />

Unternehmensbereichen<br />

Corporate Centers <strong>der</strong><br />

<strong>Dresdner</strong> Bank AG<br />

BINGO mit<br />

Aktuellen<br />

Geschäftsinformationen<br />

und<br />

internen<br />

Rundschreiben<br />

108


Web-TV – Archiv<br />

„Archiv“<br />

Diskussionsforum<br />

(kurz: Forum) mit<br />

eigenem Styleguide<br />

109


Abb. 6: Schema des Webpublishing´s mit einem CMS<br />

Quelle: Büchner, Heino: Web Content Management, Websites professionell<br />

betreiben, Bonn 2001, S. 108<br />

Abb. 7: Funktionsweise von Vorlagen (Templates)<br />

Nach: Büchner, Heino: Web Content Management, Websites<br />

professionell betreiben, Bonn 2001, S. 85<br />

Abb. 8: Content Life Cycle<br />

Quelle: Büchner, Heino: Web Content Management, Websites<br />

professionell betreiben, Bonn 2001, S. 92<br />

110


Abb. 9: Meta-Tags im Styleguide 2.1 und <strong>der</strong>en Anwendung<br />

Abb. 9.1: Vorgaben von Meta-Tags im Styleguide 2.1<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

...<br />

<br />

...<br />

<br />

Quelle: <strong>Dresdner</strong> Bank CC UK IK Redaktion <strong>Intranet</strong>: <strong>Intranet</strong>-Styleguide<br />

<strong>für</strong> die <strong>Dresdner</strong> Bank, Version 2.1., Stand 15.10.2001, S. 42<br />

Abb. 9.2: Meta-Tags im Quellcode des <strong>Intranet</strong>portals (Inhaltsframe)<br />

<br />

<br />

BRAIN<br />

<br />

<br />

....<br />

<br />

...<br />

<br />

Quelle: Quellcode http://brain.dresdner.net/index.htm vom 12.02.2003<br />

Abb. 9.3: Meta-Tags im Quellcode <strong>der</strong> Presseschau<br />


Abb. 10: Auszüge aus dem Styleguide 3.0<br />

Abb. 10.1: Gleicher Grundaufbau <strong>für</strong> alle Seitentypen (ob Brain-Home,<br />

Bereichs-Home, Navigationsseite o<strong>der</strong> Contentseite)<br />

Übergreifende<br />

Navigation<br />

Bereichsbezeichnung<br />

mit typischem<br />

Bild<br />

Subnavigation<br />

Contentbereich<br />

Quelle: <strong>Dresdner</strong> Bank AG, Technischer Arbeitskreis <strong>Intranet</strong>: [Styleguide<br />

3.0], Auszug, PowerPoint-Präsentation, Frankfurt 16.01.2003,<br />

Folie 5<br />

Abb. 10.2: Beispiel eines „Bereichs-Home“<br />

„These:<br />

Das `Bereichs-Home´ ist<br />

<strong>der</strong> Einstieg in ein<br />

organisatorisch<br />

abgegrenztes<br />

Informationsangebot.<br />

Aufbau und Gestaltung<br />

sind weitgehend analog<br />

<strong>der</strong> BRAIN.<br />

Items je Bereich:<br />

– Bereichs-Home<br />

– Services<br />

– News<br />

– Organisation“<br />

Hauptnavigation<br />

Navigationspfad<br />

Marginalspalte<br />

mit Infoboxen<br />

Quelle: <strong>Dresdner</strong> Bank AG, Technischer Arbeitskreis <strong>Intranet</strong>: [Styleguide<br />

3.0], Auszug, PowerPoint-Präsentation, Frankfurt 16.01.2003,<br />

Folie 8<br />

112


113<br />

Abb. 11: Archivierungsablauf <strong>für</strong> <strong>das</strong> <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank AG<br />

<strong>Intranet</strong>x<br />

Benutzung<br />

Bewertung Spiegelung<br />

Recherche<br />

Aufbereitung<br />

Anzahl n<br />

<strong>der</strong> = yi´<br />

Indizes i=1<br />

Indexy1´<br />

Indexy2´<br />

Indexy1+n´<br />

Archivierungsmedium<br />

<strong>Intranet</strong> y1 +<br />

Index y1<br />

XML-<br />

Datei<br />

Festplatte<br />

<strong>Intranet</strong> y1<br />

+<br />

Metadaten<br />

Aufbereitung<br />

Migration zu<br />

<strong>Intranet</strong> y1´<br />

HTML XHTML<br />

Festplatte<br />

Index y1´<br />

<strong>Intranet</strong> y1´


Abb. 12: Stadsarchief Antwerpen: Metadataschema voor gearchiveerde<br />

<strong>websites</strong> [Metadatenschema <strong>für</strong> archivierte Websites] (NL/ [D])<br />

1. Algemeen<br />

- Titel:<br />

- Versie:<br />

- Archiefvormer [Archivbildner]:<br />

- On<strong>der</strong>werp [Schlagwort]/ Abstract:<br />

- URL:<br />

- IP-Adres:<br />

- Webmaster:<br />

- Webdesign:<br />

- Inhoudsverantwoordelijken:<br />

- Openbaarheid [Öffentlichkeit]:<br />

- Online Versies:<br />

- Talen [Sprachen]:<br />

- Tellerstand bij online plaatsing [Zählstand bei Onlineplatzierung]:<br />

- Tellerstand bij offline plaatsing [Zählstand bei Offlineplatzierung]:<br />

- Datum online beschikbaar [Datum, ab wann die URL online verfügbar war]:<br />

- Wijzigingen [Än<strong>der</strong>ungen]/ Updates:<br />

- Datum Verwij<strong>der</strong>ing [Entfernen] van webserver:<br />

- Datum archivering:<br />

2. Webserver<br />

- Hardware:<br />

- Besturingssysteem [Verwaltungssystem]:<br />

- Webserverconfiguratie:<br />

- Scripts:<br />

- Uitvoerbare programma´s [ausführbare Programme]:<br />

- Koppeling met toepassingen [Verbindung mit Anwendungen]:<br />

- Inhoud logbestanden:<br />

- Frequentie logbestanden:<br />

3. Mirror [Spiegelung]/ Snapshot<br />

3.1 Algemeen<br />

- Gearchiveerde versie(s) [archivierte Versionen]:<br />

- Aanpassingen bij archivering:<br />

- Ontbrekende on<strong>der</strong>delen [fehlende Bestandteile]:<br />

3.2. Technische gegevens [technische Angaben]:<br />

- Startpagina [Startseite]:<br />

- Aantal bestanden [Anzahl <strong>der</strong> Bestände]:<br />

- Aantal mappen [Anzahl <strong>der</strong> Mappen/Verzeichnisse]:<br />

- Totale bestandsomvang:<br />

- Paswoorden:<br />

3.3. Bestandsformaten en versies<br />

- (X)HTML-Versie:<br />

- Tekstbestanden:<br />

- Audiobestanden:<br />

- Videobestanden:<br />

- Afbeeldingsbestanden:<br />

- Animatietoepassingen [Animationsanwendungen]:<br />

- Downloads:<br />

- Clientscripts:<br />

3.4. Software bij raadpleging [notwendige Software <strong>für</strong> die Ansicht]:<br />

- Webbrowser:<br />

- Plug-ins:<br />

4. Fouten en opmerkingen [Fehler und Anmerkungen]:<br />

- Fouten:<br />

- Opmerkingen:<br />

Quelle:<br />

114


Abb.13: Beispiele <strong>für</strong> die Online-Benutzung von Webarchiven<br />

Abb. 13.1:<br />

Stadsarchief<br />

Antwerpen –<br />

„Website Archief“<br />

Online-Nutzung nur<br />

im Lesesaal des<br />

Stadtarchivs<br />

Antwerpen möglich<br />

Quelle: <br />

Abb. 13.2: Nordic Web Archives (NWA)<br />

Quelle: <br />

Bespiel einer<br />

archivierten<br />

Webseite mit<br />

einem integrierten<br />

Zeitstrahl.<br />

Darstellung <strong>der</strong><br />

Rechercheergebnisse<br />

Quelle: <br />

115


Abb. 14: Zuständigkeiten <strong>der</strong> National Library of Australia und <strong>der</strong><br />

National Archives of Australia bei <strong>der</strong> Archivierung<br />

webbasierter Aufzeichnungen<br />

Quelle: National Archives of Australia: <strong>Archiving</strong> Web Resources: A Policy<br />

for Keeping Records of Web-based Activity in the Commonwealth<br />

Government, revised January 2002, S. 10<br />

<br />

116


Abb. 15: Faktoren <strong>für</strong> die Risikoanalyse <strong>der</strong> National Archives of<br />

Australia<br />

Quelle: National Archives of Australia: <strong>Archiving</strong> Web Resources:<br />

Guidelines for Keeping Records of Web-based Activity in the<br />

Commonwealth Government, Canberra 2001, S. 23<br />

<br />

117


Abb. 16: Corporate Center Unternehmenskommunikation -<br />

Grafische Darstellung <strong>der</strong> Bewertung nach <strong>der</strong> Besprechung<br />

mit Herrn Pasqualotto<br />

Legende:<br />

Archivwürdig nicht archivwürdig Grenzfall<br />

Portal, Struktur<br />

Organisation (regelmäßig spiegeln)<br />

o Leitung<br />

- Philosophie und Zielsetzung, Ihr Ansprechpartner, Organigramm<br />

o Corporate Publishing<br />

- Philosophie und Zielsetzung, dresdner banker (Online-Publikatin im<br />

Internet), dresdner dwm (Online-Publikation im Internet), web-tv,<br />

Stakehol<strong>der</strong> Report (Lin k führt zum Internetauftritt), Geschäftsbericht<br />

(Dokument nicht verfügbar), Frankfurt aktuell, Rechtschreibung,<br />

Ansprechpartner<br />

o Corporate Sustainability (nur kommende Seite)<br />

- Nachhaltigkeit, Aktuelles/ Best Practice, Umweltmanagement nach ISO<br />

14001, Umweltmanagementhandbuch (nur kommende Seite, wenn es<br />

gedruckt vorliegt), Klimaschutz, Produktökologie, Betriebsökologie,<br />

Meilensteine, Partner, Dokumente (mit Dokumenten), Links,<br />

Organisation (Zentrale und Regionen),Ihr Ansprechpartner (wenig<br />

informativ)<br />

o Gremienbetreuung und Protokoll<br />

- Ihr Ansprechpartner, Organigramm, Ihr Feedback<br />

o Historisches Archiv<br />

- Allgemeines, Standorte, Entwicklung, Eugen-Gutmann-Gesellschaft<br />

(Flyer und Beitrittsformular), Chronik, Aktenbestände, Unterlagen <strong>der</strong><br />

Altbank, Sammlungen (digitalisierte Bil<strong>der</strong> nicht notwendig), Bibliothek<br />

(Literatur zur Geschichte <strong>der</strong> <strong>Dresdner</strong> Bank ist nicht unbedingt<br />

erfor<strong>der</strong>lich), Service, Kontakt und Mitarbeiter<br />

o Innenleitung<br />

- Philosophie und Zielsetzung, Ihr Ansprechpartner, Organigramm<br />

o Interne Kommunikation<br />

- Philosophie und Zielsetzung, Dialog (nur Eingangsseite), Lea<strong>der</strong>ship,<br />

Communication & Identity Management, dresdner banker, <strong>Intranet</strong> (alle<br />

Links <strong>der</strong> weiteren Rubriken), Internet (alle Links <strong>der</strong> weiteren<br />

Rubriken), Wissensmanagement, Hausbücherei (nur Einleitung und evtl.<br />

Aktionen, falls vorhanden), Kommunikations-IT<br />

o Kunst und Wissenschaft (alles, außer externer Link zu Jürgen-Ponto-Stiftung)<br />

- Philosophie und Zielsetzung, Historie, Aufgabengebiete, Partner &<br />

Kunden, Organisation & Struktur, Zahlen & Statistiken, Service,<br />

Ansprechpartner, Organigramm<br />

o Marketing-Kommunikation<br />

- Philosophie und Zielsetzung, Corporate Design Standards (nur<br />

Eingangsseite, Blancovorlagen), Aktuelle Kampagnen / Anzeigen<br />

(einzelne *pdf-Dateien), Bilddatenbank (www.dresdner-bankimage.info),<br />

Veröffentlichungen und Werbemittel, Service,<br />

Ansprechpartner, Organigramm<br />

o Marktforschung und Medienanalyse<br />

- Philosophie und Zielsetzung, Marktforschung (ganz), Presseschau/<br />

Medienanalyse (Eingangsseite, evtl. nur Ansprache von Eizenstat,<br />

Veranstaltungskalen<strong>der</strong>), Monitoring-Service, Communicative Risk<br />

Management, Ansprechpartner, Organigramm<br />

- Presse<br />

• Philosophie und Zielsetzung, Ansprechpartner<br />

- Public Relations/ Public Affairs<br />

• Philosophie und Zielsetzung, Bildung, Der Euro, Die Zukunft<br />

<strong>der</strong> europäischen Union, Frauenkirche Dresden,<br />

118


Gesellschaftspolitisches Engagement, Initiativen <strong>für</strong> Demokratie<br />

und Völkerverständigung, Ihr Ansprechpartner, Organigramm<br />

- Strategische Kommunikationsplanung<br />

• Philosophie und Zielsetzung, Integrationsprojektbüro,<br />

Unternehmenskommunikation, Veranstaltungskalen<strong>der</strong>,<br />

Presseschau (noch im Aufbau, Links zur BRAIN-Startseite?),<br />

Archiv: Reden, Präsentationen, Artikel/ Publikationen (noch im<br />

Aufbau), Kampagnen (nur Verweise), Ihr Ansprechpartner, Ihr<br />

Feedback, Organigramm<br />

Kontakt- und Dialog (nur im Portal)<br />

o Ihr Ansprechpartner (deckt sich mit den Ansprechpartnern in den jeweiligen<br />

Bereichen), Ihr Feedback, “offen gesagt”,Diskussionsforum<br />

<strong>Intranet</strong> und Internet Informationsdienste (nur Übersicht, Verweise zu Links von CC-<br />

UK, 1-2x jährlich)<br />

o Bildungspolitik: Bildungspaket Bayern (ist Link zu Publ. Rel.), Frankfurt Aktuell<br />

(ist Link zu Publ. Rel.), Presseschau (nur Verweis), Rund um den Euro (ist Link<br />

zu Public Affairs), Wissenswertes zu Europa (ist Link zu Publ. Rel.)<br />

Produkte und Medien (nur Übersicht, Verweise zu Links von CC-UK, nur 1-2x<br />

jährlich)<br />

o dresdner banker, dwm, Geschäftsbericht (ist Link zu Corp. Publ.), Nachhaltigkeit<br />

(nur erste Seite, ist Link zu Corp. Subst.), Print Kampagnen (alles), Publikationen<br />

2001, Internet (ist Link zu CC IK Internet), <strong>Intranet</strong> (ist Link zu CC IK <strong>Intranet</strong>),<br />

TV-Kampagnen (keine verfügbar), Unternehmensvideo, <strong>Dresdner</strong> Web-TV (ist<br />

Link zu Corp. Publ.)<br />

Richtlinien (deckt sich mit CC IK, 1-2x jährlich)<br />

Service (nur Übersicht, 1-2x jährlich)<br />

Themenreihe und Aktionen (auf jeden Fall die Übersicht, wenig Än<strong>der</strong>ung: 1-2x<br />

jährlich ausreichend)<br />

o Diskussionsforum “Verantwortung Zukunft” (nicht verfügbar), Euro-Gewinnspiel<br />

(mit Fragen), Veranstaltungsreihe: Wertorientierte Wachstum (nicht verfügbar),<br />

Victor Klemperer Judendwettbewerb (Link zu Internetseite)<br />

UK-Info (nur erste Seite)<br />

Quelle: Eigene Zusammenstellung<br />

119


Abb. 17: Corporate Center Unternehmenskommunikation –<br />

Grafische Darstellung über die Umsetzung <strong>der</strong> Bewertung<br />

nach <strong>der</strong> Spiegelung vom 12.02.2003<br />

Voreinstellungen:<br />

max. interne Tiefe 4, max. externe Tiefe 3<br />

Mit folgenden Ausgrenzungen: -*/*allianz*/* -*/*telefonbuch*/* -<br />

*www.dresdner-bank.com/* -*www.allianz.com/* -*www.eugengutmann-gesellschaft.de/*<br />

-*www.dresdner- bank.de/dresdnerbanker/* -<br />

*www.dresdner-bank.de/dwm*<br />

Legende:<br />

funktioniert funktioniert nicht<br />

Portal, Struktur<br />

Organisation<br />

o Leitung<br />

- Philosophie und Zielsetzung, Ihr Ansprechpartner, Organigramm<br />

o Corporate Publishing<br />

- Philosophie und Zielsetzung, dresdner banker, (Eingangsseite,<br />

Internetlinks), dresdner dwm (Eingangsseite, einzelne Beiträge), web-tv<br />

(besteht nur aus <strong>der</strong> Eingangseite), Stakehol<strong>der</strong> Report (Eingangsseite,<br />

Internetlinks), Geschäftsbericht (nur Eingangsseite, Internetlink),<br />

Frankfurt aktuell (mit *pdf-Datei), Rechtschreibung (Eingangsseite und<br />

Liste), Ansprechpartner<br />

o Corporate Sustainability (nur kommende Seite)<br />

- Nachhaltigkeit (Eingangsseite und Links auf <strong>der</strong> Seite), Aktuelles/ Best<br />

Practice (Eingangsseite, interne Link, Internetlinks), Umweltmanagement<br />

nach ISO 14001 (Eingangsseite + Dokumente), Umweltmanagementhandbuch<br />

(Eingangsseite, interne Links, Dokument), Klimaschutz<br />

(Eingangsseite, interne Links), Produktökologie (Eingangsseite, interne<br />

Links), Betriebsökologie (Eingangsseite, Dokument), Meilensteine<br />

(Meilensteine, Links, Dokument), Partner (Meilensteine, interne Links),<br />

Dokumente (mit Dokumenten), Links (nur Eingangsseite), Organisation<br />

(Zentrale und Regionen), Ihr Ansprechpartner<br />

o Gremienbetreuung und Protokoll<br />

- Ihr Ansprechpartner, Organigramm, Ihr Feedback<br />

o Historisches Archiv<br />

- Allgemeines, Standorte, Entwicklung, Eugen-Gutmann-Gesellschaft<br />

(Internetlink zur Eugen-Gutmann-Gesellschaft, Flyer und<br />

Beitrittsformular), Chronik, Aktenbestände, Unterlagen <strong>der</strong> Altbang (mit<br />

Dokument), Sammlungen (mit Galerie), Bibliothek, Service, Kontakt und<br />

Mitarbeiter<br />

o Innenleitung<br />

- Philosophie und Zielsetzung, Ihr Ansprechpartner, Organigramm<br />

o Interne Kommunikation<br />

- Philosophie und Zielsetzung, Dialog (alle internen Links, vollst. Archiv),<br />

Lea<strong>der</strong>ship, Communication & Identity Management, dresdner banker<br />

(Eingansseite, Link von Cor. Pub.), <strong>Intranet</strong> (alle Links, Styleguide),<br />

Internet (alle Links, Styleguide), Wissensmanagement, Hausbücherei (mit<br />

Dokument, Kommunikations-IT)<br />

o Kunst und Wissenschaft (alles, Link zur Jürgen-Ponto-Stiftung)<br />

- Philosophie und Zielsetzung, Historie, Aufgabengebiete (alle internen<br />

Links), Partner & Kunden, Organisation & Struktur (mit Jürgen-Ponto-<br />

Stiftung, Kulturstiftung Dresden), Zahlen & Statistiken, Service (alle<br />

internen Links), Ansprechpartner, Organigramm<br />

o Marketing-Kommunikation<br />

- Philosophie und Zielsetzung, Corporate Design Standards (nur<br />

Eingangsseite, Blancovorlagen (im Frame)), Aktuelle Kampagnen /<br />

120


Anzeigen (*pdf, *mpg-Dateien), Bilddatenbank (www.dresdner-bankimage.info),<br />

Veröffentlichungen und Werbemittel, Service,<br />

Ansprechpartner, Organigramm<br />

o Marktforschung und Medienanalyse<br />

- Philosophie und Zielsetzung, Marktforschung (interne Links),<br />

Presseschau/ Medienanalyse (interne Links), Monitoring-Service,<br />

Communicative Risk Management, Ansprechpartner, Organigramm<br />

o Presse<br />

- Philosophie und Zielsetzung, Ansprechpartner<br />

o Public Relations/ Public Affairs (bis in die 3. Hierarchiestufe)<br />

- Philosophie und Zielsetzung, Bildung (Dokumente einer Publikation),<br />

Der Euro, Die Zukunft <strong>der</strong> europäischen Union, Frauenkirche Dresden,<br />

Gesellschaftspolitisches Engagement (mit Dokument), Initiativen <strong>für</strong><br />

Demokratie und Völkerverständigung, Ihr Ansprechpartner,<br />

Organigramm<br />

o Strategische Kommunikationsplanung<br />

- Philosophie und Zielsetzung, Integrationsprojektbüro,<br />

Unternehmenskommunikation, Veranstaltungskalen<strong>der</strong> (mit Dokument),<br />

Presseschau (weiterführende Links zur Presseschautestseite), Archiv<br />

(Links funktionieren nicht), Ihr Ansprechpartner, Ihr Feedback,<br />

Organigramm<br />

Kontakt- und Dialog, vollständig bis in 2. Hierarchieebene<br />

o Ihr Ansprechpartner, Ihr Feedback, “offen gesagt”, Diskussionsforum<br />

<strong>Intranet</strong> und Internet Informationsdienste (bis in 2. Hierarchieebene)<br />

o Bildungspolitik: Bildungspaket Bayern, Frankfurt Aktuell, Presseschau, Rund um<br />

den Euro, Wissenswertes zu Europa<br />

Produkte und Medien (Links innerhalb von CC UK funktionieren)<br />

o dresdner banker, dwm (nur Eingangsseiten, Internetlinks), Geschäftsbericht (nur<br />

Eingangsseite), Nachhaltigkeit, Print Kampagnen, Publikationen 2001, Internet,<br />

<strong>Intranet</strong>, TV-Kampagnen, Unternehmensvideo (downloadbar), <strong>Dresdner</strong> Web-TV<br />

Richtlinien<br />

o (CD-Manual, Domainrichtlinien, CD-Rom-Bemaßung, Internet-Styleguide,<br />

<strong>Intranet</strong>-Styleguide, Zertifizierung ISO 14001)<br />

Service<br />

o (Hausbücherei, Corporate Branding, Infomanagement, Lea<strong>der</strong>ship Communication<br />

& Identitx Management, Marktforschung, Messen, Monitoring-Services, Neue<br />

Rechtschreibung, Präsentationslayout <strong>für</strong> PowerPoint, Print-Produktion,<br />

Sponsoring, Umweltmanagement, Werbegeschenke 2002, incl. Werbegeschenke<br />

zum Downloaden, Wissensmanagement, bis in die 3. Hierarchiestufe)<br />

Themenreihe und Aktionen (auf jeden Fall die Übersicht,)<br />

o Diskussionsforum “Verantwortung Zukunft” (nicht verfügbar), Euro-Gewinnspiel<br />

(mit Fragen, Link zur BRAIN-Presseschau), Veranstaltungsreihe: Wertorientierte<br />

Wachstum (nicht verfügbar), Victor Klemperer Jugendwettbewerb (Eingangsseite,<br />

Internetseite)<br />

UK-Info (nur erste Seite) (kein Passwort eingegeben)<br />

Quelle: Eigene Zusammenstellung<br />

121


122<br />

Abb. 18: Corporate Center Unternehmenskommunikation im <strong>Intranet</strong> – Screenshots zur Spiegelung mit HTTrack vom 12.02.2003<br />

Das CC UK-Portal<br />

im Original<br />

Filtereinstellung bei<br />

HTTrack <strong>für</strong> die<br />

Spiegelung von<br />

http://cc-uk.bww.<br />

dresdner.net<br />

Gespiegelter<br />

<strong>Intranet</strong>auftritt<br />

Die Galerie des<br />

Historischen<br />

Archivs wurde<br />

mitgespiegelt


123<br />

Abb. 19: Teleport Pro – Screenshots <strong>der</strong> „Project Properties“<br />

Einschlussoptionen<br />

von<br />

Dateien<br />

Einstellmöglichkeiten<br />

<strong>für</strong> die<br />

Durchführung <strong>der</strong><br />

Spiegelung<br />

Ausschlussoptionen<br />

von<br />

Links/<br />

Pfadnamen<br />

Zusammenfassung<br />

<strong>der</strong><br />

Spiegelungsergebnisse


124<br />

Abb. 20: HTTrack – diverse Screenshots (12.02.2003)<br />

Auswahl <strong>der</strong><br />

Aktionen zu<br />

Beginn <strong>der</strong><br />

Spiegelung<br />

Kontrolle und<br />

Stoppmöglichkeiten<br />

während des<br />

Spiegelungsprozesses<br />

Umfangreiche<br />

Optionen unter<br />

„Einstellungen“<br />

Nach <strong>der</strong><br />

Spiegelung<br />

erstellt HTTrack<br />

ein Protokoll


125<br />

Abb. 21: Das <strong>Intranet</strong> <strong>der</strong> <strong>Dresdner</strong> Bank – <strong>das</strong> gespiegelte Portal<br />

Im lokalen<br />

Verzeichnis<br />

gespeichert<br />

Quelle: Spiegelung und Screenshot vom 12.02.2003


Abb. 22: Vergleich zwischen HTML- und XML-Dokumenten<br />

Abb. 22.1.: Im HTML-Dokument sind alle Bestandteile <strong>der</strong> Seite integriert:<br />

<br />

Dokument<br />

Textinformation<br />

Quelle: Pott, Oliver: xml, praxis und referenz, München 2000, S. 18<br />

Abb. 22.2: Strukturierungs- und Formatierungsangaben zur Darstellung des<br />

Inhaltes eines XML-Dokuments werden getrennt realisiert. Diese<br />

können auch in einer Datei gespeichert werden<br />

Struktur<br />

Inhalt<br />

Grafik<br />

Sound<br />

Video<br />

Format<br />

Quelle: Pott, Oliver: xml, praxis und referenz, München 2000, S. 19<br />

126


127<br />

[Druckvorlage]<br />

Abb. 23: Der Ablauf des HTML-XML-Konverters<br />

Quelle: Oehler, Daniel: HTML-XML-Konverter, PowerPoint-Präsentation, Frankfurt/M. 5.11.2001, Folie 1

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!