nestor: obstor/rost. BSB 3.11.2008

files.dnb.de

nestor: obstor/rost. BSB 3.11.2008

obstor/rost

Heinz Werner Kramski:

Anforderungen aus der Praxis der

Gedächtnisorganisationen –

Deutsches Literaturarchiv Marbach

BSB München, 3.11.2008


Obstor/Rost

Heinz Werner Kramski:

Anforderungen aus der Praxis der

Gedächtnisorganisationen –

Deutsches Literaturarchiv Marbach

BSB München, 3.11.2008


DLA Marbach – Campus

Träger: Deutsche Schillergesellschaft e.V. (ca. 3.500 Mitglieder)

Name: Deutsches Literaturarchiv Marbach

Gebäude: Schiller-Nationalmuseum, Deutsches Literaturarchiv,

Collegienhaus, Literaturmuseum der Moderne

Finanzierung: Zuwendungsempfänger von Bund und Land B.-W.

(je rund 45%)

Mitarbeiter: 99 Planstellen mit rund 180 Mitarbeitern

Benutzer 2007: ca. 9.000 Benutzungen aus 40 Ländern in beiden

Lesesälen; ca. 35.500 Museumsbesucher

Auftrag: Sammlung und Erschließung literarischer Quellen in

handschriftlicher und gedruckter, bildlicher und gegenständlicher,

audiovisueller und digitaler Form seit 1750.


Schiller-Nationalmuseum

Eröffnung 1903

Derzeit geschlossen wegen Innensanierung (Klimatisierung usw.)

Wiedereröffnung 2009 zum Schillerjahr

Neuer Schwerpunkt: 18. und 19. Jahrhundert


Archiv

Gründung 1955 im Schiller-Nationalmuseum

1973 Neubau als eigenes Gebäude

1994 Erweiterungbau


Collegienhaus

Neubau 1993 aus mäzenatischen Mitteln

Unterkunft für forschende Gäste


Literaturmuseum der Moderne

Eröffnung 2006

Schwerpunkt: 20. und 21. Jahrhundert


Ca. 760.000 Bände

(ca. 1,5 Mio. unselbständige Beiträge?)

Zeitungsausschnitte, Rundfunk- und

Fernsehmanuskripte, Theaterprogramme, Tonund

Bildträger

Bibliothek


Handschriftenabteilung und Cotta-Archiv

Ca. 1.200 Nachlässe (und Vorlässe), Sammlungen,

Zeitschriften- und Verlagsarchive

Ca. 50.000 Einzelautographen

(ca. 10. Mio. Blatt?)


Kunstsammlungen

Ca. 200.000 bildliche und gegenständliche Sammlungsobjekte


EDV-Referat/EDV-Ausstattung

Vier Mitarbeiter

Ca. 12 Server (Suse-Linux, Tru64-Unix)

EVA4000 Enterprise Virtual Array, derzeit ca. 6 TB

Ca. 200 PCs (Windows)

Ca. 50 Tablet-PCs

Hauptanwendungen (neben Office, Internet usw.): Integrierte

Bestandsverwaltung Kallías (auf Oracle-Basis), Typo3, Medien

in den Museen, Retrokonversion der Kataloge,

Digitalisierungsprojekte


Obstor/Rost

Heinz Werner Kramski:

Anforderungen aus der Praxis der

Gedächtnisorganisationen –

Deutsches Literaturarchiv Marbach

BSB München, 3.11.2008


Digitale Nachlassteile: Abgrenzung

Digitale Dokumente:

1. Volltexte, die durch Transkription oder Edition analoger Quellen

gewonnen werden

• Standardverfahren

• planbar

• analoge bzw. schriftliche Quelle existiert parallel und bleibt

erhalten

2. Digitalisate analoger Quellen (Scans, Audiodigitalisate)

• siehe 1.

‣ Langzeitarchivierung der digitalen Formen mit verringertem

Risiko


Digitale Nachlassteile: Abgrenzung

3. Digitale Dokumente, die online oder offline publiziert werden

(Netzliteratur, CD-ROMs)

• digitally born

• nicht unikal

• kooperative und redundante Sammlung möglich

4. Digitale Nachlassteile

• digitale Unikate

• „Ingest“ nicht mittels vereinbarter, kontrollierter Verfahren,

sondern ungeplant

• Datenträger und Datenformate von physischem Zerfall bzw.

Obsoleszenz bedroht

‣ besondere Verantwortung für langfristige Erhaltung


Digitale Nachlassteile: Mengen

Testfall: Nachlass von Thomas Strittmatter (erworben 2000)

19 Archivkästen mit konventionellem Material

Ein Atari Mega ST2 (betriebsfähig)

Eine Festplatte Atari Megafile 30 (defekt, aber Backup-Disketten

vorhanden)

43 Disketten (Atari 3,5" einseitig, 360 KB; Atari 3,5" doppelseitig,

720 KB; Mac 3,5" 400 KB Zone Bit Recording; Mac, 3,5", 1,4

MB)

Aktueller Bestand: (F.C. Delius, Norbert Elias, Hermann Lübbe,

Ernst Schnabel, ...) 107 Disketten 3,5“ PC, 66 5,25“ PC, ca. 46

Apple, 3 CD-ROMs (ca. 40% bearbeitet)


Digitale Nachlassteile: Arbeitsschritte

Gemeinsamer Leitfaden EDV/Handschriftenabteilung (HSA):

1. Erwerbung wie konventionelles Material (HSA)

2. Beschriftung mit Bleistift: Bestand, Zugangsnummer, „Disk 01“

usw. (HSA)

3. Identifizierung offenkundiger physischer Dubletten (alle

Datenträger bleiben jedoch als potentielle Ausstellungsstücke

erhalten)

4. Image-Kopie (sofern Disketten), dabei Erfassung elementarer

Metadaten (Beschreibung des Datenträgers, technische Daten),

MD5-Prüfsumme (Raw-Device/Image), rekursives Dateilisting,

Ablage im Filesystem als „0_Original-Disk/disk01“ usw.

Tools: ddrescue etc. (Cygwin), eigene Scripte


Digitale Nachlassteile: Arbeitsschritte

5. Kopie der Originaldateien, Ablage im Filesystem als

„1_Original/disk01 usw.“ (Änderungsdatum bleibt unverändert).

Tools: Original-Hardware (Atari ST, Mac mit Superdrive), Virtual

Floppy Drive, Transmac, Gemulator Explorer

6. Konversion der Originaldateien nach .rtf, .csv, .pdf, .xml. Ablage

im Filesystem als „2_Konvertiert/disk01“.

Tools: Original-Software, Tools in der Original-Umgebung, z.T.

in Emulator, aktuelle Tools/Software


Digitale Nachlassteile: Arbeitsschritte

7. Übergabe einer Kopie von

„2_Konvertiert“ als

„3_Geordnet“ an die HSA (die

nur dort Schreibrechte besitzt)

8. Darin Auflösen der „disknn“-

Hierachie zugunsten einer

Ablagestruktur nach dem

Hausregelwerk („Memo“),

Ergänzung aussagekräftiger

Dateinamen (HSA)


Digitale Nachlassteile: Arbeitsschritte

9. Anlegen von Multimedia-Sätzen in Kallías als Verknüpfungen

auf Dateien im Ordner „3_Geordnet“ (HSA/EDV)

10.Katalogisierung der digitalen Dokumente wie üblich (HSA)

11.Verknüpfungen von Multimedia-Sätzen und Katalogisaten

(HSA)

12.Zugriff für Benutzer nur vermittelt über Mitarbeiter, da keine

differenzierte Zugriffsrechtesteuerung besteht.


Obstor/Rost

Heinz Werner Kramski:

Anforderungen

‣wird fortgesetzt um 14:30 Uhr


obstor/rost

Heinz Werner Kramski:

Anforderungen und Ziele einer Hardware-Registry

BSB München, 3.11.2008


Anforderungen/Probleme aus der Praxis

Die beschriebene Praxis im DLA ist in vielen Punkten verbesserungsfähig

(DMS statt Filesystem, differenzierte Zugriffsrechte, technische

Metadaten usw.) Hier sollen am Ende aber Anforderungen (und

Probleme) stehen, die sich verallgemeinern lassen:

1. Die Bearbeitung, insbesondere die Konvertierung ist sehr

zeitaufwendig (87 ‚einfache‘ PC-Disketten & 1 CD-ROM: ca. 60

Arbeitsstunden).

‣ Evtl. Erleichterung durch besser Tools. Gewisse Tendenz zu erhöhter

Interoperabilität zwischen den Herstellern?

2. Disketten können auf diese Weise bewältigt werden, USB-Sticks und

(portable) Festplatten lassen für die Zukunft Schlimmes erwarten...

‣ Datenmenge nimmt weiter zu, sammlungsrelevante Privatvideos in

exotischen Codecs von Autoren werden kommen.


Anforderungen/Probleme aus der Praxis

3. Die Konvertierung muss oft stattfinden, bevor eine fundierte Auswahl

der Archivalien getroffen werden kann. (Strittmatters 400-KB-Disketten

enthielten nur dublette Dateien...).

‣ Möglichst bewusste Auswahl in der Erwerbungsphase.

4. Erwerbungsverhandlungen und -Vorgänge müssen die verwendete

Rechnerumgebung mit berücksichtigen (Kennwörter für webbasierte

(Mail-)dienste!)

‣ Hausintern Bewusstsein schärfen und EDV-Know-How stärken.

5. Für die erstmalige Übernahme und Konvertierung wird idR. die

Original-Hardware und -Software benötigt und das Know-How, damit

umzugehen. Hardware, Software und Know-How sind zum Zeitpunkt

der Erwerbung jedoch häufig obsoleszent oder obsolet.

obstor/rost (OBsolescent STOrage Registry/Register Obsoleszenter

SpeicherTechniken)


Anforderungen/Probleme aus der Praxis

6. Die erfreulich fortgeschrittene Diskussion um LZA berücksichtigt den

singulären, kritischen Vorgang der ersten Datenübernahme in

(Literatur-)Archiven zu wenig, da Bibliotheken idR. mit aktuellen (eher

zu avantgardistischen) Techniken konfrontiert sind.

nestor, obstor/rost(?)

7. Für die (technische) Beschreibung von Datenträgern und Lesegeräten

(verwendet das DLA | gibt es) kein einschlägiges standardisiertes

Metadatenformat. (KoLibRI/METS: Ingest von Dateien, nicht von

Datenträgern)

nestor, obstor/rost(?)

8. Tools zur automatischen Ermittlung technischer Metadaten (DROID,

JHOVE) und Format-Registries berücksichtigen Office-Formate zu

wenig (das Linux „file“-Kommando identifiziert weitaus mehr).

nestor, obstor/rost(?)


Grundidee obstor/rost

Wenn eine potentielle Archivalie als Offline-Datenträger/ Speichermedium

vorliegt, so muss diese für jede weitere Form der Verarbeitung/Langzeitarchivierung

zunächst auf einer elementaren Stufe gelesen werden

können. Voraussetzung für diesen elementaren Lesevorgang ist ein

funktionsfähiges Lesegerät in einer lauffähigen Umgebung.

Während sich für Dateiformate eine Infrastruktur bildet (PRONOM etc.),

fehlt unseres Wissens ein vergleichbares Register für die Hardware-

Ebene. Da der Archivierungsvorgang in vielen Fällen erst erfolgen wird,

wenn Speichermedien und Lesegeräte ungebräuchlich und schwer

verfügbar geworden sind, ist aber ein zentrales Register obsoleszenter

Speicher ein Desiderat, dass im Rahmen der nestor-AG Kooperative

Langzeitarchivierung angeregt oder betrieben werden könnte.


„If you think big enough, you‘ll never have to do it.“

(Reissner's Rule of Conceptual Inertia)

Deshalb:

Stufe 1: Kontaktbörse (Biete-Suche) und Auflistung von Experten und

Betreibern obsoleszenter Lesegeräte, die über Know-how verfügen

und kooperativ konkrete Hilfe leisten können. Community-Aufbau und -

Pflege. Exemplarisches eigenes Hilfsangebot.

Stufe 2: Datenbank von Datenträgern, Lesegeräten und ihrer typischen

Betriebsumgebung, um den technischen Aufwand des Einlesens und

das Obsoleszenzrisiko einschätzen zu können. Ggf. Online-

Expertensystem zur Identifizierung unbekannter Datenträger.

Stufe 3: Formale Ontologie und Infrastruktur für eine obstor-ID für

Speichermedien (ähnlich einer PRONOM-ID für Dateiformate);

Integration von PRONOM und ähnlichen Initiativen. Ausweitung auf

Audio- und Videoträger und analoge Speichertechniken.


Datenmodell (Fragment)

PK

Hersteller

HS_ID

Kurzbezeichnung

Bezeichnung

Beschreibung

Datenträger

Rechnersystem

Experte

PK

DT_ID

PK

RS_ID

PK

EX_ID

FK1

FK2

Kurzbezeichnung

Bezeichnung

Beschreibung

Verwendung von

Verwendung bis

Kapazität (KB)

Physische Abmessungen

Schnittstelle (ggf.)

Bandlänge (ggf.)

Bandbreite (ggf.)

[...]

LZA-Risiko

LG_ID

HS_ID

FK1

FK2

Kurzbezeichnung

Bezeichnung

Beschreibung

Verwendung von

Verwendung bis

HS_ID

EX_ID

PK

SY_ID

Name

Kontaktdaten

Systematik

PK

FK1

FK2

FK3

Lesegerät

LG_ID

Kurzbezeichnung

Bezeichnung

Beschreibung

Verwendung von

Verwendung bis

Schnittstellle

Stromversorgung

RS_ID

HS_ID

EX_ID

FK2

FK3

Ebene

Kurzbezeichnung

Bezeichnung

Beschreibung

Übergeordneter_Eintrag

LG_ID

DT_ID


Systematik/Ontologie (Fragment)


Einige offene Fragen

Zielgruppe mit konkretem Bedarf?

- Archivare, Bibliothekare oder Kuratoren und ggf. deren IT-

Kollegen, die in ihrer Tätigkeit mit der Langzeitarchivierung von

digitalen Offline-Datenträgern befasst sind.

Betriebsmodell, Trägerschaft, wissenschaftliche Begleitung?

Redaktionell betreutes System vs. Wikimodell?

Streben nach Vollständigkeit vs. anlassbezogene Einträge?

Mehrsprachigkeit?

Kooperationen und nutzbare Vorarbeiten?

Technische Basis?

Weiteres Vorgehen?

Projektname ;-)


Schlusswort

„Es füllt sich der Speicher mit

köstlicher Habe...“

(Friedrich Schiller, Das Lied von

der Glocke)

Sorgen wir dafür, das wir auch

morgen noch problemlos zugreifen

können!


heinz.werner.kramski@dla-marbach.de

Deutsche Schillergesellschaft e.V.

Schiller-Nationalmuseum

Deutsches Literaturarchiv

Literaturmuseum der Moderne

www.dla-marbach.de

Weitere Magazine dieses Users
Ähnliche Magazine