01.03.2013 Aufrufe

Volltext als PDF - Dr. Torsten Kupfer

Volltext als PDF - Dr. Torsten Kupfer

Volltext als PDF - Dr. Torsten Kupfer

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Fachhochschule Potsdam<br />

Institut für Information und Dokumentation<br />

Abschlussarbeit<br />

im Rahmen der Fortbildung zum<br />

Wissenschaftlichen Dokumentar / Information Specialist<br />

DIF. Universelle Darstellung und Austausch<br />

geowissenschaftlicher Metadaten mit dem<br />

Directory Interchange Format<br />

von<br />

<strong>Torsten</strong> <strong>Kupfer</strong><br />

Gutachter<br />

Sven Hirsch<br />

Thematischer Schwerpunkt: Entwurf von Informationssystemen<br />

Kurs B 2004<br />

Berlin, 20. August 2004


Abstract<br />

Die Studie untersucht die Zukunftsfähigkeit des Directory Interchange Formats (DIF) für die<br />

Beschreibung von geowissenschaftlichen Forschungsdaten im GeoForschungsZentrum Potsdam<br />

(GFZ). Dargestellt werden die historische Entstehung des Formats, seine technische Ausformung,<br />

seine Stellung im Bereich der geowissenschaftlichen Information, seine Verflechtung<br />

mit dem Global Change Master Directory der NASA sowie seine Vorzüge im Vergleich<br />

zu den verwandten und konkurrierenden Metadatenformaten FGDC-CSDGM, GeoMIS.Bund,<br />

CERA, Dublin Core und ISO 19115.<br />

Im Ergebnis der Bewertung des Formats und der kritischen Hinterfragung der bisherigen Metadatenerstellung<br />

am GeoForschungsZentrum Potsdam werden Empfehlungen für die dortige<br />

weitere Behandlung der Metadatenproblematik gegeben.<br />

The study is examining the Directory Interchange Format (DIF) and its future for describing<br />

geoscientific research data at the GeoForschungsZentrum Potsdam (GFZ – geoscientific research<br />

center). It outlines the origin of the format, its technical shape, its standing in the area<br />

of geoscientific information, its interconnection with NASA’s Global Change Master Directory<br />

as well as its advantages in comparison to the related and competitor metadata formats<br />

FGDC-CSDGM, GeoMIS.Bund, CERA, Dublin Core and ISO 19115.<br />

As a result of evaluation of the format and critical investigation of producing metadata at the<br />

GeoForschungsZentrum Potsdam until now, recommendations are given for further metadata<br />

activities there.


Inhaltsverzeichnis<br />

1. Problemstellung.............................................................................................................4<br />

2. Die internationale Bedeutung des Directory Interchange Formats für die<br />

Beschreibung geowissenschaftlicher Metadaten...............................................................9<br />

2.1. Historische Entstehung.........................................................................................9<br />

2.2. Technische Beschreibung...................................................................................11<br />

2.3. Die Stellung des DIF-Standards auf dem Feld des geowissenschaftlichen<br />

Metadatenaustausches ...............................................................................................14<br />

2.4. Die technische Ausformung konkurrierender Metadatenstandards im<br />

Vergleich zum DIF-Standard ....................................................................................17<br />

2.4.1. FGDC-Standard (CSDGM)....................................................................17<br />

2.4.2. GeoMIS.Bund ........................................................................................18<br />

2.4.3. Climate and Environmental Data Retrieval and Archive<br />

System (CERA)................................................................................................20<br />

2.4.4. Dublin Core Metadata Initiative (DCMI)...............................................21<br />

2.4.5. ISO 19115 ..............................................................................................24<br />

3. Die Darstellung geowissenschaftlicher Metadaten am GeoForschungsZentrum<br />

Potsdam mit dem Directory Interchange Format ............................................................25<br />

4. Schlussfolgerungen .....................................................................................................28<br />

5. Anhang ........................................................................................................................31<br />

5.1. Dokumente und Übersichten..............................................................................31<br />

5.2. Quellen und Literatur .........................................................................................56<br />

5.3. Abkürzungen ......................................................................................................58<br />

Erklärung ........................................................................................................................60


1. Problemstellung<br />

Das Leben jedes Bewohners der westlichen Industrieländer wird Tag für Tag von einer<br />

großen Menge von Metadaten tangiert, die Steuerungsprozesse seines Lebens werden<br />

weitestgehend mit Metadaten abgewickelt. Er selbst realisiert diese Abhängigkeit in der Regel<br />

nicht und weiß in der Regel auch nicht, was „Metadaten“ eigentlich sind und es wäre ihm<br />

auch nur schwer verständlich zu machen. Und doch, ohne die Präsenz von Metadaten könnte<br />

er nicht das umfangreiche Angebot großer Handelsketten nutzen, keinen Neuwagen in<br />

speziellen Konfigurationen bestellen, kein Buch in der Bibliothek ausleihen, nicht <strong>als</strong><br />

Pauschaltourist in den Urlaub fliegen, nicht nach einem Umzug seine neue Wohnung<br />

anmelden, keine Steuererklärung abgeben, nicht kranken-, arbeitslosen- und rentenversichert<br />

sein.<br />

Was sind nun „Metadaten“? Der im englischen Sprachraum wesentlich gebräuchlichere Begriff<br />

meint schlicht „Daten über Daten“, Daten, die aus einer Überblicksperspektive heraus<br />

andere – detailliertere und umfangreichere – Daten beschreiben. 1 Sehr oft machen erst Meta-<br />

daten aus Daten verwertbare Informationen.<br />

Die Existenz von Metadaten ist deutlich älter <strong>als</strong> der Begriff selbst; jeder Karteikarten-<br />

Bibliothekskatalog stellt den klassischen Fall eines Metadatensatzes dar. Auch bei ihm handelt<br />

es sich um Daten, die einer vorab definierten Struktur unterliegen und mit deren Hilfe<br />

vorliegende Informationen (im konkreten Fall: Bücher aller Art) beschrieben werden und dadurch<br />

vom interessierten Nutzer einerseits überhaupt erst gefunden und andererseits auch ohne<br />

direkte Einsichtnahme schon bewertet werden können. Die auf Tim Berners-Lee, den „Erfinder“<br />

des Internet, zurückgehende Auffassung, dass es sich bei Metadaten ausschließlich um<br />

maschinenlesbare Daten handele, geht deshalb etwas in die Irre. Nichtsdestotrotz liegen aufgrund<br />

der Entwicklung der Informationstechnologie in den letzten beiden Jahrzehnten Metadaten<br />

fast ausschließlich in maschinenlesbarer Form, <strong>als</strong> Computerdateien vor.<br />

Das Anlegen von Metadaten und ihre kontinuierliche Pflege ist mit einem hohen Arbeitsaufwand<br />

verbunden. Sie entstehen deshalb zuerst dort, wo der größte Handlungsdruck vorhanden,<br />

wo aus einer großen Menge relativ gleichartiger Daten in kurzer Zeit und mit großer Ge-<br />

1 Die Rückführung auf den griechischen Ursprung „metá“ (= inmitten, zwischen; nach; hinter) gelingt angesichts<br />

des aktuellen Gebrauchs nur noch unvollkommen. Die Suche mit der Internet-Suchmaschine „google“ zum Terminus<br />

„metadata“präsentiert mehr <strong>als</strong> viereinhalb Millionen Treffer.


Problemstellung 5<br />

nauigkeit die benötigte Information selektiert werden soll und der erfolgreiche Suchvorgang<br />

sich unmittelbar in einem Gewinn an Zeit und/oder Geld ausweist. Zudem hat sich in der jün-<br />

geren Vergangenheit gezeigt, dass bereits bei einem Wechsel von Mitarbeitern, Softwarepro-<br />

dukten oder Systemplattformen die Weiternutzung bestehender, aber nicht ausreichend do-<br />

kumentierter Datenbestände beeinträchtigt oder gar unmöglich wird. Neben dem erschwerten<br />

Arbeiten ist in einer mangelhaften Daten-Dokumentation deshalb ein hohes finanzielles Risi-<br />

ko zu sehen, welches mit der stark wachsenden Datenmenge an Brisanz gewinnt. Damit<br />

wächst zwangsläufig auch die Gefahr, dass diese Datenbestände durch nicht angelegte oder<br />

verlorengegangene Metadaten zu anonymen und damit wertlosen „Datenfriedhöfen“ verkommen.<br />

Damit Metadaten für den an einer bestimmten Information Interessierten überhaupt von Nutzen<br />

sein können haben sie formale und inhaltliche Anforderungen zu erfüllen. An erster Stelle<br />

stehen hier die allgemeine Zugänglichkeit und – daraus folgernd – ihre Präsentation vor der<br />

Nutzung der Informationsressource (Datei oder Gruppe von Dateien, Buch, Bild etc.) selbst.<br />

Weiterhin haben Metadaten – und das ist ihre eigentliche Funktion – den Inhalt der Informationsressource<br />

auf das wesentliche reduziert abzubilden. Erst an dieser Stelle ergibt sich für den<br />

Nutzer der intendierte Gewinn an Zeit und materiellem Aufwand bzw. überhaupt erst die<br />

Möglichkeit, die entsprechende Informationsressource sinnvoll nutzen zu können. Dies gelingt<br />

aber nur, wenn die gegebene reduzierte Metainformation nach einem offengelegten Verfahren<br />

strukturiert wurde.<br />

Als wesentliche Anforderungen an Metadaten können somit Zugänglichkeit, Reduziertheit,<br />

Inhaltsadäquanz, Strukturiertheit und Transparenz festgehalten werden.<br />

Ob die Metainformation dabei direkt mit der Informationsressource verbunden ist – z. B. auf<br />

dem Titelblatt eines Buches oder im Header einer Datei – oder aber <strong>als</strong> gesonderter Metadatensatz<br />

getrennt von der Informationsressource existiert, bleibt praktischen Erwägungen unterworfen.<br />

Aus Nutzersicht ist das Anlegen von Metadatensätzen zu favorisieren; allerdings<br />

verlangt dies wiederum in jedem Falle gesonderte technische Vorkehrungen und erhöhten<br />

materiellen wie personellen Einsatz.<br />

Moderne Metadaten liegen fast ausschließlich <strong>als</strong> von den eigentlichen Daten getrennte Metadatensätze<br />

vor. Für den Eigentümer bzw. Verbreiter von Daten liegen die Vorteile dieses Verfahrens<br />

in einer besseren Handhabbarkeit und der Erzielung einer potentiell höheren Publizität.<br />

Angesichts ständig steigender Datenmengen und der daraus resultierenden


Problemstellung 6<br />

Unübersichtlichkeit des gesamten Datenbestandes wäre es für den Nutzer kaum noch prakti-<br />

kabel, die Metainformation in Eigenregie aus dem Header jeder einzelnen Datei zu entneh-<br />

men. Mit der Existenz eines vorab zu sichtenden Metadatensatzes „erledigen“ sich eine Reihe<br />

von Nutzungsfällen von selbst, die Daten brauchen für den Fall, dass sich für den Nutzer<br />

wahrscheinlich kein befriedigendes Ergebnis erzielen lassen würde, nicht mehr „angefasst“ zu<br />

werden, was wiederum auch zu einer spürbaren Entlastung der betroffenen IT-Stellen bzw.<br />

Datenzentren führen kann.<br />

Ein Zugewinn an Publizität, und damit verbunden auch an Nutzerfreundlichkeit, lässt sich<br />

durch die Reproduktion von Metadatensätzen und Hinterlegung an einer Vielzahl von Stellen<br />

bei nach wie vor nur einem einzigen bestehenden Grunddatenbestand – in der Regel verbunden<br />

mit der Präsentation im Internet – erzielen.<br />

Im Gegensatz zu fest mit den eigentlichen Daten verbundenen Metainformationen lässt sich<br />

mit Metadatensätzen zudem der Zugang zu Metainformationen einerseits und Daten andererseits<br />

– wo dies erforderlich sein sollte – differenziert steuern.<br />

Sowohl das Bemühen, Inhalte so weit <strong>als</strong> möglich adäquat abzubilden, wie auch bestehende<br />

Konkurrenzverhältnisse haben zu einer unüberschaubaren Zahl von Metadaten-Standards ge-<br />

führt. 2 Zumal für einen Informatiker ein „Standard“ nicht – wie landläufig darunter verstan-<br />

den – ein allgemein anerkanntes und verwendetes Format darstellt, sondern lediglich ein eindeutig<br />

definiertes Format.<br />

Gegen diese Vielgestaltigkeit – und damit verbunden oft auch Beliebigkeit – gibt es Anstrengungen<br />

zur Vereinheitlichung, um die mit den wuchernden Formaten wachsenden Informationshemmnisse<br />

abzubauen. Einerseits geschieht dies auf dem Wege der Forcierung allgemeiner,<br />

alle Gebiete umschließender Standards, andererseits auf dem Wege der Definition von<br />

Mindestanforderungen, an denen sich Standards orientieren sollten. Allgemeine Standards<br />

haben den Nachteil der schlechten Handhabbarkeit und geringen Trennschärfe bei speziellen<br />

Fragestellungen. Die Zukunft dürfte daher Standards mittlerer Reichweite gehören, die sich an<br />

ISO-Normen orientieren und für ein gesamtes Wissens/Fachgebiet noch eine hinreichende<br />

Genauigkeit erzielen lassen. Eine wachsende Rolle wird der Auszeichnungssprache XML<br />

bzw. XMI dort zukommen, wo noch neue Standards geschaffen werden. In den Bereichen<br />

allerdings, wo sich bereits ein Standard eindeutig etabliert hat, ist mittelfristig mit dessen Ablösung<br />

nicht zu rechnen. XML/XMI käme dort lediglich eine Übersetzerfunktion zu.<br />

2<br />

Was den Informatiker Andrew S. Tannenbaum zu der vielzitierten Bemerkung veranlasste: „The nice thing<br />

about standards is that there are so many to choose from.“


Problemstellung 7<br />

Wissenschaftliche Arbeit ist auf fast allen Gebieten ohne die Nutzung von Metadatensätzen<br />

nicht mehr möglich. Eine Vorreiterrolle in der Nutzung von Metadaten haben hierbei jene<br />

Wissenschaftsgebiete gespielt, in denen eine große Masse an Experimental- und Messdaten<br />

sowie die internationale Vernetzung des Forschungsgeschehens schon frühzeitig nach deren<br />

strukturierter Dokumentation und anwendungsbereiter Vorhaltung verlangten. Zu diesen Wissenschaftsgebieten<br />

zählen die Geowissenschaften in ihrer wechselseitigen Verschränkung von<br />

Bergbau, Bodenkunde, Fernerkundung, Geochemie, Geodäsie, Geographie, Geologie, Geomorphologie,<br />

Geophysik, Geotektonik, Glaziologie, Hydrogeologie, Hydrologie, Ingenieurgeologie,<br />

Kartographie, Klimatologie, Kristallographie, Lagerstättenkunde, Landschafts- bzw.<br />

Geoökologie, Meteorologie, Mineralogie, Ozeanographie, Paläontologie, Petrologie, Stratigraphie,<br />

Strukturgeologie, Tektonik u. a..<br />

Trotz diverser Überschneidungen sind a) geowissenschaftliche Daten und b) Geodaten zu<br />

unterscheiden. Geodaten – in grober Vereinfachung: Karten in digitaler Form – stellen durch<br />

ihre geringere Varianz nicht gleichermaßen hohe Anforderungen an die Formulierung von<br />

Metadatenstandards <strong>als</strong> geowissenschaftliche Daten, sind nichtsdestoweniger aber von höhe-<br />

rem und unmittelbarerem wirtschaftlichen Interesse. 3 Wie noch zu zeigen sein wird orientiert<br />

sich die Formulierung von Metadatenstandards daher in erster Linie an den Bedürfnissen der<br />

Erzeuger und Nutzer von Geodaten. Gerade der Bestand an georeferenzierbaren Daten und<br />

Sachinformationen steigt stark an. Die Archivierung, das Wiederauffinden und die Verteilung<br />

dieser Daten erfordert deshalb eher noch <strong>als</strong> im Falle von geowissenschaftlichen Daten die<br />

standardisierte Katalogisierung der Datenbestände mittels Metadaten, die die Grundlage für<br />

spezielle Datenkataloge und IT-Katalogservices bilden. Demgegenüber leidet die Schaffung<br />

von Metadatenservern bzw. Clearinghouses für geowissenschaftliche Daten an vergleichsweise<br />

geringer Finanzierung und institutioneller Förderung. Die Folge ist eine Reihe abgebrochener<br />

bzw. nur sehr langsam fortschreitender Projekte.<br />

Ziel dieser Arbeit, die während eines elfwöchigen Praktikums am GeoForschungsZentrum<br />

Potsdam (GFZ) entstand, ist es, eine Entscheidungshilfe für die zukünftige dortige Behandlung<br />

der Metadatenproblematik zu geben. Die Erstellung von geowissenschaftlichen Metadaten<br />

am GFZ, das einen alle Disziplinen der Wissenschaften der festen Erde von der Geodäsie<br />

3 Vgl. Wolfgang Czegka, Metadaten von Geo-Daten. Mit einem Fallstudie für Metadaten geowissenschaftlicher<br />

Geo-Daten nach ISO/TC 19115 am Beispiel des Katalogsystems des LGRB, Abschlussarbeit FH Potsdam 2001,<br />

v. a. S. 1-9.


Problemstellung 8<br />

über die Geophysik, Geologie und Mineralogie bis zur Geochemie umfassenden multidiszi-<br />

plinären Forschungsverbund verkörpert, orientiert sich bislang stark an einem in den Geowis-<br />

senschaften weit verbreiteten Metadatenformat, dem Directory Interchange Format (DIF). Im<br />

Kern muß daher auf folgende Fragen eine eindeutige Antwort gegeben werden:<br />

1. Soll seitens des Daten- und Rechenzentrums den an den einzelnen wissenschaftlichen<br />

Projekten Beteiligten weiterhin empfohlen werden, ihre Projekte im Directory Interchange<br />

Format zu beschreiben?<br />

2. Soll innerhalb der vom Daten- und Rechenzentrum direkt verwalteten Datenbestände<br />

dieses Format weiterhin verwendet werden?<br />

3. Muß die Migration zu anderen verbreiteteren und/oder inhaltsadäquateren Formaten<br />

vorbereitet werden?<br />

Im Untersuchungsgang ist demzufolge das Directory Interchange Format in seiner Struktur,<br />

seiner historischen Entwicklung, seiner Stellung in der Wissenschaftswelt und in seinen Perspektiven<br />

darzustellen sowie dessen bisherige praktische Anwendung am GeoForschungsZentrum<br />

Potsdam kritisch zu hinterfragen und ein innerhalb des GFZ allgemein zu empfehlendes<br />

Metadatenschema zu entwickeln.


2. Die internationale Bedeutung des Directory Interchange Formats für die<br />

Beschreibung geowissenschaftlicher Metadaten<br />

2.1. Historische Entstehung<br />

Das Directory Interchange Format (DIF) wurde <strong>als</strong> Metadaten-Austauschformat unter Feder-<br />

führung der NASA geschaffen und beanspruchte ursprünglich vor allem für das Gebiet der<br />

Erdfernerkundung Relevanz. Seine Geburtsstunde lässt sich auf den Februar 1987 festlegen,<br />

<strong>als</strong> ein Earth Science and Applications Data Systems Workshop (ESADS) zu Fragen der Interoperabilität<br />

von Katalogen empfahl, Schritte zu unternehmen, die es externen Nutzern ermöglichen<br />

sollten, Informationen über die im jeweiligen Datensystem vorhandenen Daten zu<br />

erlangen. Daraufhin legte im Sommer 1987 die Catalog Interoperability Working Group, zusammengesetzt<br />

aus verschiedenen US-Bundes- und internationalen Agenturen, die konkrete<br />

Struktur des Datenaustauschformates fest. Seit September desselben Jahres wurde dieses<br />

Format genutzt, um den Prototypen des NASA's Master Directory (NMD) mit Inhalten zu<br />

füllen; Ende Dezember 1987 schließlich waren dort schon mehr <strong>als</strong> 100 Einträge verfügbar.<br />

Nach weiterer Vorstellung und Erprobung durch die scientific community wurde das Directory<br />

Interchange Format auf einem Katalog-Interoperabilitäts-Workshop durch eine CI science<br />

advisory group 1988 formal bestätigt und angenommen. In den Jahren 1989 und 1990 begannen<br />

das Committee on Earth Observation Satellites (CEOS) und die Interagency Working<br />

Group on Data Management for Global Change (IWGDMGC) – auf Aufforderung des dahinter<br />

stehenden Earth System Science Committee (ESSC) – sich an der Diskussion um die Ausformung<br />

des Standards zu beteiligen und ihn zu verwenden. Augenscheinlich in Folge der<br />

veränderten Schwerpunktsetzung wurde danach das NASA's Master Directory (NMD) in<br />

Global Change Master Directory (GCMD) umbenannt.<br />

Das Global Change Master Directory 4 beschränkt sich in der Funktion eines Service-<br />

Providers darauf, die Metadaten zu sammeln und bereitzustellen, vermittelt aber keinen direkten<br />

Zugang zu den Daten selbst. Um diesen muß sich der Nutzer anhand der bei Aufruf des<br />

Projektes bzw. Datensatzes im GCMD sichtbaren Kontaktinformationen selbst bemühen.<br />

4 . Siehe auch Screenshot des Eingangsbildschirms im Anhang. Die Angabe<br />

aller Internetadressen in dieser Untersuchung bezieht sich auf das Datum 31. Juli 2004. Im Folgenden wird<br />

darauf nicht mehr Bezug genommen.


internationale Bedeutung des DIF 10<br />

Diese Grundkonstellation des mit vorwiegend geospatialen Metadaten von Projekten und<br />

Missionen aus aller Welt im Directory Interchange Format gefüllten Global Change Master<br />

Directory, institutionell angesiedelt bei der NASA, besteht unverändert. Allerdings ist der<br />

DIF-Standard seitdem einer ständigen Weiterentwicklung unterworfen und liegt seit Mai 2004<br />

in der Version 9.0 vor. Die Gründe für diese Weiterentwicklung liegen in der Anpassung an<br />

sich neu ergebende wissenschaftliche und (US-amerikanische) administrative Erfordernisse.<br />

Die Version 9.0 ist mit der ISO-Norm 19115:2003 (Geographic information — Metadata)<br />

kompatibel.<br />

In Deutschland forderte 1994 die Deutsche Agentur für Raumfahrtangelegenheiten (DARA)<br />

das Deutsche Fernerkundungsdatenzentrum (DFD) der Deutschen Forschungsanstalt für Luftund<br />

Raumfahrt (DLR) auf, in ihrem Auftrag im Rahmen eines Projektes Metadatensätze über<br />

die in Deutschland verfügbaren Daten erdbeobachtender Satelliten einschließlich Zusatzdaten<br />

zu erstellen und deren Implementierung im International Directory Network (IDN) 5 des<br />

Committee of Earth Observation Satellites (CEOS) vorzubereiten. Obwohl die Resonanz vorerst<br />

eher zögerlich blieb konnten im ersten Anlauf bis Mitte 1995 48 DIF-Beiträge von zur<br />

Mitarbeit bereiten Institutionen bezogen werden. Im unmittelbaren Anschluss daran beteiligte<br />

sich das DFD an einem analogen Projekt auf europäischer Ebene. 6<br />

Gegenwärtig (15.07.2004) sind in dem die Metadatenbasis des IDN bildenden und vor allem<br />

die US-amerikanische Forschungslandschaft abbildenden Global Change Master Directory 17<br />

deutsche Institutionen mit 511 DIF-Einträgen vertreten. Diese Zahlen sind insofern unvollständig<br />

<strong>als</strong> die Beteiligung an internationalen Projekten mit DIF-Verzeichnung nicht korrekt<br />

widergespiegelt wird und auch die interne Verwendung des Formates außerhalb der Betrachtung<br />

bleibt. Weiterhin sollten einige Projekte des GeoForschungsZentrums Potsdam (80-90<br />

DIF-Einträge) erst nach Abschluss dieser Arbeit zur Anmeldung im GCMD kommen.<br />

5 Das International Directory Network versucht, einen zielgerichteten Direktzugriff auf Forschungsdaten zu<br />

ermöglichen. Vgl. . Problematisch bei diesem Vorhaben ist, dass sich der Zugang zum IDN<br />

für kleinere Organisationen und Institutionen, die nicht dem Committee of Earth Observation Satellites angehören,<br />

schwierig gestaltet.<br />

6 Vgl. Deutsche IDN-Einträge im DIF-Format – Abschlussbericht -, Manuskript Weßling 1995, S. 1-10. [Stand-<br />

ort: UB/TIB Hannover]


internationale Bedeutung des DIF 11<br />

2.2. Technische Beschreibung<br />

In der Intention seiner Schöpfer, der CEOS IDN Interoperability group, soll das Directory<br />

Interchange Format nicht zur Beschreibung einzelner Dateien, sondern – wie der gewählte<br />

Name bereits impliziert – zur Beschreibung von „data sets“, von Gruppen relativ gleichartiger<br />

Dateien, die einem gemeinsamen (Forschungs-)Zusammenhang unterliegen.<br />

Ein „DIF“ – die Abkürzung wird allgemein auch <strong>als</strong> Synonym für eine dif-Datei benutzt –<br />

besteht in der Version 9.0 aus maximal 36 Inhaltskategorien. Sechs dieser Kategorien (Entry<br />

ID, Entry Title, Science Keywords, ISO Topic Category, Data Center, Summary) sind obligatorisch<br />

anzugeben („required“), die restlichen 30 dienen der weiteren Spezifizierung („optional“),<br />

ihre Inanspruchnahme wird vom konkreten Gegenstand und vom Ermessen des DIF-<br />

Autors bestimmt. 7<br />

Einer Reihe von Kategorien ist ein verbindliches konkrolliertes Vokabular („Valid Keyword<br />

Lists“) hinterlegt. Dieses wird auf Anregung von Usern hin (Beantragung per email) ständig<br />

aktualisiert und abgeglichen; die alleinige Entscheidungsgewalt über dessen Ausformung liegt<br />

jedoch bei den Mitarbeitern des Global Change Master Directory. Dieses Verfahren birgt den<br />

Vorteil einer größeren Kontinuität und einer schnellen Bearbeitung im Vergleich zu Gremien-<br />

entscheidungen. 8<br />

Auch für Kategorien, deren Inhalt in freier Textwahl wiedergegeben werden kann, wird im<br />

Standard eine bestimmte Art der Darstellung entweder vorgeschrieben oder empfohlen.<br />

Die im Standard enthaltene optional zu verwendende Kategorie „Parent DIF“ erlaubt die Abbildung<br />

von Hierarchien in Suchsystemen. Untergeordnete DIF-Einträge (Child DIF) verweisen<br />

auf das jeweils in der Hierarchie über ihnen stehende DIF, das Parent DIF. Somit ist – wie<br />

auch in der Bildschirmdarstellung des Global Change Master Directory umgesetzt – eine<br />

Verweisung über mehrere Ebenen möglich, beispielsweise von der Forschungsinstitution zu<br />

dessen einzelnen Forschungsprojekten und von diesen wiederum auf die den Projekten zugeordneten<br />

Experimente einschließlich ihrer Forschungsdaten.<br />

7 Vgl. auch die Aufstellung „DIF fields in derVersion 9.0” im Anhang. Eine autorisierte Beschreibung des<br />

Standards ist einzig auf der NASA-Website verfügbar .<br />

Nur dort finden sich auch die entsprechenden Erläuterungen („Definition“, „Syntax“, „Specifications“, „Recommendations“,<br />

„Examples“)<br />

8 Vgl. .


internationale Bedeutung des DIF 12<br />

Ein weiterer Vorteil ist durch die Hard- und Softwareunabhängigkeit gegeben; ein DIF ist<br />

eine txt-Datei, die sich lediglich der Dateiendung „dif“ bedient und somit in jedem Texteditor<br />

geöffnet und geändert werden kann. Zusätzlich ist eine inhaltlich identische Ausgabe <strong>als</strong><br />

XML-Datei möglich. 9 Der Datenaustausch und die Anlage von Metadatenservern wird somit<br />

vor keinerlei Probleme gestellt.<br />

Zu kritisieren am DIF-Standard ist in erster Linie die mit der Aufteilung in „required“ und<br />

„optional“ fields einhergehende Inkonsistenz in der Darstellung. Angesichts der Überschaubarkeit<br />

der Kategorienanzahl wäre es durchaus angebracht, alle Kategorien <strong>als</strong> required fields<br />

auszuführen und für auftretende Fehlanzeigen den eindeutigen Parameter „None“ zu verwenden.<br />

Weiterhin wirkt sich ungünstig aus, dass das GCMD – neben der Möglichkeit der online-<br />

Erstellung von DIF's – kein Softwaretool zur lokalen Generierung von DIF’s (ggf. mit onlineoder<br />

Update-Zugriff auf die im GCMD gepflegten Schlagwortlisten) anbietet.<br />

Insgesamt stellt die Kombination aus DIF-Standard und Global Change Master Directory ein<br />

stark reglementiertes, straff administriertes, dialogorientiertes und aus diesen Gründen auch<br />

effektives System dar.<br />

Eine Anmeldung von wissenschaftlichen Projekten im Global Change Master Directory bzw.<br />

die Modifizierung einer Anmeldung erfolgt entweder online unter Nutzung einer<br />

komfortablen, alle Konventionen berücksichtigenden Eingabemaske 10 oder durch Zusendung<br />

fertiger DIF’s per email, die nachträglich einer Kontrolle auf Standardkonformität durch die<br />

GCMD-Mitarbeiter unterliegen. Aus Anmeldersicht gestaltet sich der erste Weg für einzelne<br />

Datensätze günstiger, während es bei großen Metadatenmengen vorteilhafter sein kann, diese<br />

offline zu erstellen und dem GCMD zuzusenden.<br />

Die Wiedergabe des Inhalts der Schlüsselkategorien über ein kontrolliertes Vokabular bildet<br />

die Grundlage der Darstellung im Global Change Master Directory. Mit Hilfe der keywords<br />

ist für den Nutzer eine zielgenaue Suche nach wissenschaftlichen Projekten möglich, die dem<br />

9<br />

Siehe die im Anhang wiedergegebene dtd.<br />

10<br />

,<br />

(siehe auch Screenshot im Anhang).


internationale Bedeutung des DIF 13<br />

gewählten keyword entsprechen. Im Idealfall kann so eine schnelle Entscheidung über Relevanz<br />

oder Nichtrelevanz der jeweiligen Daten getroffen werden.<br />

Die angestrebte Zusammenfassung aller weltweit anfallenden geowissenschaftlichen Forschungen<br />

im Global Change Master Directory erlaubt den mit dessen Suchmaschine nach<br />

„Data Centers“, „Locations“, „Instruments“, „Platforms/Sources“, „Projects“ oder auch spezifischer<br />

suchenden Wissenschaftlern eine erhebliche Zeitersparnis und größere Trefferausbeu-<br />

te. 11 Voraussetzung ist jedoch auch hier, dass der DIF-Autor zuvor den Sinn des Verfahrens<br />

verstanden und inhaltsadäquate keyword-Kombinationen aus dem verbindlichen kontrollierten<br />

Vokabular bzw. <strong>als</strong> Freitext gewählt hat.<br />

Die aktuellen Nutzungszahlen belegen die hohe Akzeptanz des GCMD und des mit ihm verbundenen<br />

Metadatenstandards DIF in der Wissenschaftswelt: Ende 2003 beinhaltete das nach<br />

wie vor stark wachsende Global Change Master Directory einen Bestand von 14.049 Datensatzbeschreibungen,<br />

unterstützte über 80.000 Links zu Datensätzen und anderen Ressourcen<br />

und verzeichnete für das Jahr 2003 mehr <strong>als</strong> 7,5 Millionen Zugriffe. 12<br />

11<br />

Vgl , .<br />

12<br />

The State of the GCMD - CY 2003, S. 6, 10f., .


internationale Bedeutung des DIF 14<br />

2.3. Die Stellung des DIF-Standards auf dem Feld des geowissenschaftlichen<br />

Metadatenaustausches<br />

Auf ihrer Website betonen die Mitarbeiter des GCMD, dass der DIF-Standard nicht mit ande-<br />

ren Metadatenstandards konkurrieren würde. 13 Tatsächlich aber konkurriert ein Standard<br />

schon durch die Tatsache seiner Existenz mit anderen Standards und erfahrungsgemäß schaf-<br />

fen sich einflussreiche Institutionen – wie z. B. die NASA – schon aus Eigeninteresse eigene<br />

Standards. So ist denn auch diese Aussage <strong>als</strong> beschwichtigende Rhetorik einzuschätzen, de-<br />

ren Hintergrund die tatsächlich vorhandene starke Konkurrenz zwischen dem DIF-Standard<br />

und dem CSDGM-Standard bildet.<br />

Das US-amerikanische Federal Geographic Data Committee (FGDC) verabschiedete 1998<br />

einen Content Standard for Digital Geospatial Metadata (CSDGM). Dieser stellt – abgesichert<br />

durch die Präsidentenorder 12906 aus dem Jahre 1994 – den verbindlichen Metadatenstandard<br />

für alle staatlichen Stellen dar, 14 worunter auch die NASA und ihr Global Change Master Di-<br />

rectory (GCMD) einschließlich des dort verwendeten DIF-Standards zu fassen sind. Das<br />

GCMD entzieht sich der drohenden Vereinheitlichung durch einen Kunstgriff; einerseits bie-<br />

tet es auf einer Unterseite eine Konkordanz zwischen DIF und „FGDC Metadata Standard “<br />

an, 15 anderseits hat es sich <strong>als</strong> Datenknoten („node“) in das gesamtnationale Geodaten-<br />

Netzwerk („FGDC Clearinghouse“ 16 ) einbinden lassen. Im Global Change Master Directory<br />

selbst finden sich nur relativ wenige DIF-Einträge, die auf im FGDC-Standard (CSDGM) erfasste<br />

Projekte verweisen. Die Konkurrenz zwischen beiden Standards führt dazu, dass Projekte<br />

oft parallel für die Erfassung in beiden Systemen mit Metadaten versehen werden. 17<br />

Soweit ersichtlich scheint der DIF-Standard seine stärkste Verbreitung im Bereich der geospa-<br />

13<br />

Vgl. .<br />

14<br />

Vgl. ,<br />

.<br />

15<br />

Allerdings erfolgt nur eine Beschreibung der Umformung von FDGC-Metadaten in das DIF-Format, nicht<br />

jedoch umgekehrt. Vgl. .<br />

16<br />

.<br />

17<br />

Vgl. ,<br />

. Das GCMD erleichtert dies durch die Möglichkeit,<br />

DIF’s online auf seiner Website erstellen zu können und die fertigen Dateien sich per email zuschicken zu lassen.<br />

Dieses Verfahren ist aus der Sicht des Nutzers allerdings dann nicht nutzbar, wenn es sich um Massendaten<br />

handelt oder aber Inhalte durch DIF’s beschrieben werden sollen, die der Geheimhaltung unterliegen.


internationale Bedeutung des DIF 15<br />

tialen Daten zu finden, währenddessen der FGDC-Standard (CSDGM) im Bereich der geo-<br />

graphischen Informationssysteme und –projekte dominierend ist. 18<br />

Als bedeutsamer Unterschied zwischen beiden ist zudem die Tatsache anzusehen, dass der<br />

FGDC-Standard (CSDGM) lediglich von (US-amerikanischer und kanadischer) nationaler<br />

Bedeutung ist, der DIF-Standard hingegen inzwischen eine breite internationale Akzeptanz in<br />

seinem Wissenschaftsgebiet erlangt hat. Letzteres hängt unmittelbar mit der kontinuierlichen<br />

Pflege und dem Ausbau des Global Change Master Directory zu einer „ersten Anlaufadresse“<br />

bei der Suche nach relevanten Forschungen zusammen. Da der Zugang zum GCMD grundsätzlich<br />

offen für jedermann ist, können hier schnell und effektiv Informationen über Projekte<br />

erlangt werden, für die es ansonsten angesichts des meist restriktiv gehandhabten Datenzugangs<br />

langwieriger und umständlicher Autorisierungs- bzw. Zulassungsverfahren bedürfte.<br />

Diese Internationalität und Offenheit ist denn auch die „Lebensversicherung“ des GCMD und<br />

des DIF-Standards.<br />

Nur wenn mit dem FGDC-Standard (CSDGM) eine ähnliche Genauigkeit und Handhabbarkeit<br />

der wissenschaftlichen Information sowie eine ähnliche Qualität, Offenheit und Interna-<br />

tionalität des FGDC-Clearinghouses 19 erreicht werden sollte, könnte dieser den DIF-Standard<br />

ablösen resp. verdrängen.<br />

Auf europäischer Ebene sind die Standardisierungsbemühungen noch weniger ausgeprägt <strong>als</strong><br />

in den USA. Die Schaffung eines eigenen Metadatenstandards innerhalb der European Spatial<br />

Metadata Infrastructure (ESMI) scheint nur langsam voranzuschreiten. 20 Zudem stellt sich die<br />

Frage, wie sinnvoll ein solches Unterfangen ist, und ob es nicht angesichts der bestehenden<br />

internationalen Forschungsverknüpfung einerseits und sehr spezieller Wissenschaftsgebiete<br />

andererseits sachdienlicher wäre, internationale Standards mittlerer Reichweite unterhalb der<br />

ISO-Norm 19115 zu pflegen.<br />

18 Doch auch hier besteht auf staatlicher Seite mit dem Spatial Data Transfer Standard (SDTS) schon ein älterer<br />

eingeführter Metadaten-Standard für Geoinformationen. Es bleibt abzuwarten, ob es mit dem Content Standard<br />

for Digital Geospatial Metadata (CSDGM) gelingen wird, die verschiedenen konkurrierenden Formate und die<br />

dahinter stehenden Organisationen zu integrieren.<br />

19 Da das FDGC-Clearinghouse den Zugang zu den Metadaten nur vermittelt, sie aber nicht selbst vorhält, ist<br />

die Darstellungsweise der Suchergebnisse sehr uneinheitlich und die Suche selbst auf Basisfunktionen unter<br />

Ausblendung jeglicher Zielgenauigkeit reduziert. Vgl.<br />

.<br />

20 Vgl. .


internationale Bedeutung des DIF 16<br />

In Deutschland versucht der Interministerielle Ausschuss für Geoinformationswesen<br />

(IMAGI), angesiedelt im Bundesamt für Kartographie und Geodäsie, steuernd zu wirken. Wie<br />

schon die institutionelle Anbindung deutlich macht, sind dessen Aktivitäten – die Etablierung<br />

eines Metainformationssystems für Geodaten des Bundes (GeoMIS.Bund) und eines Geoda-<br />

tenport<strong>als</strong> des Bundes (GeoPortal.Bund) – allein auf das Territorium der Bundesrepublik fo-<br />

kussiert und tangieren den Bereich der geowissenschaftlichen Forschung nur teilweise. Ziel-<br />

richtung ist nicht die Schaffung von Infrastruktur für Wissenschaft, sondern - analog zum US-<br />

amerikanischen FGDC-Standard (CSDGM) 21 wie auch zur European Spatial Data Infrastruc-<br />

ture (ESDI) und zur Initiative Infrastructure for Spatial Information in Europe (INSPIRE) –<br />

die Schaffung von Infrastruktur für Wirtschaft und Verwaltung.<br />

In Entsprechung dessen bedienen sich die verschiedenen geowissenschaftlichen Institutionen<br />

unterschiedlichster Metadatenstandards. Das Deutsche Zentrum für Luft- und Raumfahrt<br />

(DLR) mit dem ihm angeschlossenen Deutschen Fernerkundungsdatenzentrum (DFD) hat<br />

sich dem Standard der Data Documentation Initiative (DDI) 22 auf XML-Basis angeschlossen,<br />

das GeoForschungsZentrum Potsdam verwendet hauptsächlich den DIF-Standard, für das<br />

GeodatenMetaInformationsSystem des Bundes (GeoMIS.Bund) wurde ein eigener Metada-<br />

tenstandard entwickelt, 23 das Potsdam-Institut für Klimafolgenforschung (PIK), das Deutsche<br />

Klimarechenzentrum (DKRZ) und das Alfred-Wegener-Institut für Polar- und Meeresforschung<br />

(AWI) verwenden einen gemeinsam geschaffenen Standard Climate and Environmen-<br />

tal Data Retrieval and Archive System (CERA), 24 das Nord- und Ostsee-<br />

KüstenInformationsSystems (NOKIS) und der an der Staats- und Universitätsbibliothek Göttingen<br />

angesiedelte und geowissenschaftliche Forschungsprojekte im WWW dokumentieren-<br />

de „Geo-Guide“ wiederum bedienen sich Dublin Core-Metadaten. 25 Relevante Bestrebungen,<br />

sich US-amerikanische nationale Standards – insbesondere CSDGM – zu eigen zu machen,<br />

sind nicht festzustellen.<br />

21<br />

Vgl. (Schaffung einer National Spatial Data Infrastructure (NSDI)).<br />

22<br />

.<br />

23<br />

Vgl. . Die Bundesländer<br />

sind nicht an diesen Standard gebunden und treiben teilweise eigene Projekte voran.<br />

24<br />

.<br />

25<br />

Vgl. , .


internationale Bedeutung des DIF 17<br />

2.4. Die technische Ausformung konkurrierender Metadatenstandards im Vergleich<br />

zum DIF-Standard<br />

2.4.1. FGDC-Standard (CSDGM)<br />

Der DIF-Standard weist auch in der Version 9.0 nach wie vor eine übersichtliche Struktur mit<br />

lediglich 36 Inhaltskategorien („fields“) auf. Sechs dieser „fields“ sind <strong>als</strong> „required“ gekenn-<br />

zeichnet, die übrigen 30 <strong>als</strong> „optional“. Eine weitere Strukturierung der abzubildenden Anga-<br />

ben findet nur insofern statt <strong>als</strong> pro „field“ in der Regel mehrere Werte einzutragen sind; an-<br />

sonsten sind lediglich Wiederholungen einiger „fields“ bzw. Wiederholungen innerhalb<br />

einiger „fields“ möglich.<br />

Der FGDC-Standard (CSDGM) hingegen zeigt – ausgehend von sieben Hauptgruppen – eine<br />

hierarchisch verschachtelte Struktur, die sich im Extremfall auf bis zu sechs Hierarchieebenen<br />

erstreckt. Die jeweiligen Felder sind mit den Merkmalen „mandatory“, „mandatory if applica-<br />

ble“ und „optional“ belegt, wobei diese auf den einzelnen Hierarchieebenen jeweils neu ver-<br />

geben werden. 26 Mit reellen Angaben in Form von Daten oder Freitext werden nur die Felder<br />

auf der jeweils untersten Hierarchieebene belegt, alles darüberstehende stellt lediglich eine<br />

strukturierende Klammer dar.<br />

Das zu verwendende Vokabular weist im Vergleich zum kontrollierten Vokabular des DIF-<br />

Standards nur geringe Einschränkungen auf; zwingend zu benutzende Listen von Schlagwörtern<br />

und Abkürzungen sind hier nicht vorgesehen, eine große Zahl von Feldern sind <strong>als</strong> Freitext<br />

ausgewiesen.<br />

Zudem handelt es sich – wie im Falle der DIF’s – auch um keinen „Container“ in Dateiform,<br />

sondern lediglich um eine Vorschrift, wie Metadatenbanken zu strukturieren sind. Das bedeutet,<br />

da die Informationen nicht <strong>als</strong> ständige Datei abrufbereit sind, eine erschwerte Abgabe der<br />

Metadaten. Eine räumliche Trennung von Daten und Metadaten sowie deren Vervielfältigung<br />

scheint nicht intendiert zu sein.<br />

Ein DIF ist ohne maschinelle Darstellung lesbar und für den mit dem Fachgebiet Vertrauten<br />

auch verständlich. Im Falle einer CSDGM-Darstellung der Metadaten ist dies aufgrund der<br />

ständigen Wiederholung von gleichen Werten in Gruppen kaum noch möglich. Bei einer<br />

Ausweisung im FGDC-Standard (CSDGM) kann für die Darstellung der gleichen Sachverhal-<br />

26 Beispiel: Die Hauptgruppe 2. Data Quality Information ist <strong>als</strong> „mandatory if applicable“ gekennzeichnet,<br />

während die nachgeordnete Gruppe 2.3 Completeness Report den Status „mandatory“ und die Gruppe 2.6 Cloud<br />

Cover den Status „optional“ besitzt. Das bedeutet, sollte 2. genutzt werden muss unter 2.3 unbedingt eine Angabe<br />

gemacht werden, unter 2.6 jedoch nicht zwingend.


internationale Bedeutung des DIF 18<br />

te durchaus die sechsfache Zeichen-Menge gegenüber dem DIF-Standard anfallen. 27 DIF<br />

wirkt daher wesentlich gestraffter, ohne dass ein ersichtlicher Informationsverlust auftritt.<br />

Ein weiterer wesentlicher Vorteil des DIF-Formats ist dessen nutzerfreundliche Erstellung.<br />

Während der User beim Besuch der GCMD-Webpräsenz mit einem DIF Writer’s Guide „an<br />

die Hand genommen“ und ihm die Erstellung von DIF’s so weit <strong>als</strong> möglich erleichtert wird,<br />

bedarf es im Falle des CSDGM einer größeren Vorbildung, um das Verfahren beherrschen zu<br />

können. 28 Angesichts der Tatsache, dass nicht Informatiker, sondern zumeist Wissenschaftler<br />

der Fachdisziplinen diese Arbeiten „nebenbei“ ausführen müssen, dürfte sich auch dies nega-<br />

tiv auf die Akzeptanz des Formats auswirken.<br />

Alles in allem wirkt der FGDC-Standard (CSDGM) praxisfremd, nutzerunfreundlich und verspielt.<br />

Im Zusammenspiel aller irgendwie betroffenen US-Bundes-Institutionen wurde versucht,<br />

einen universellen Standard zu kreieren, der zwar alles erfassen, kaum etwas aber nutzerfreundlich<br />

wiedergeben kann. DIF versucht, die wesentlichen Elemente möglichst exakt zu<br />

erfassen, CSDGM will Vollständigkeit zu Lasten der Vergleichbarkeit.<br />

2.4.2. GeoMIS.Bund 29<br />

Das Metainformationssystem für Geodaten des Bundes (GeoMIS.Bund) bedient sich wie DIF<br />

9.0 ohne weitere hierarchische Gliederung einer überschaubaren Menge von 36 Inhaltskategorien<br />

und ist gleichfalls zum ISO-Standard 19115 kompatibel. Sieben dieser 36 Inhaltskategorien<br />

sind <strong>als</strong> „mandatory“ ausgewiesen, die übrigen <strong>als</strong> „conditional“ bzw. „optional“. In Entsprechung<br />

dieser strukturellen Ähnlichkeit zu DIF erweist sich auch die Handhabung von<br />

GeoMIS.Bund <strong>als</strong> ähnlich nutzerfreundlich. Allerdings wird das Vorhandensein einer ISO<br />

19115-Lizenz und die Kenntnis von deren Inhalt beim Nutzer vorausgesetzt – eine Arbeit, die<br />

im Falle von DIF dem Nutzer durch die Einarbeitung sämtlicher relevanten Angaben in die<br />

über das Web abrufbare Struktur des Standards bereits abgenommen worden ist.<br />

Auch inhaltlich weist GeoMIS.Bund starke Übereinstimmungen mit DIF 9.0 auf, doch fehlen<br />

gerade Entsprechungen für jene mit einem kontrollierten Vokabular hinterlegte Kategorien, 30<br />

27<br />

Beispielhaft ermittelt anhand der parallelen Darstellung des gleichen Sachverhalts in beiden Formaten in<br />

.<br />

28<br />

Zumindest eine gute Visualisierung bietet die Seite „An Image Map of the Content Standard for Digital Geospatial<br />

Metadata Version 2 - 1998 (FGDC-STD-001 June 1998)“<br />

. Für eine vollständige Dokumentation siehe<br />

.<br />

29<br />

Das Metadatenschema wurde zur Verfügung gestellt von Hern Jürgen Walther, Bundesamt für Kartographie<br />

und Geodäsie (BKG), Frankfurt am Main, 23.07.2004. Ein öffentlicher Zugang zum Standard existiert nicht.


internationale Bedeutung des DIF 19<br />

die die Spezifik von DIF ausmachen. Damit stehen für die spezifische Beschreibung geowis-<br />

senschaftlicher Daten jenseits von geograpischen Koordinaten etc. in GeoMIS.Bund lediglich<br />

die Kategorien „keyword“ (frei wählbar), „Abstract describing the dataset“ (frei wählbar) und<br />

„Dataset topic category“ (CodeList B.5.27 aus ISO 19115) zur Verfügung. Die letztgenannte<br />

Kategorie ist aus Gründen der Kompatibilität zum ISO-Standard unter der Bezeichnung „ISO<br />

Topic Category“ inhaltlich identisch auch in DIF 9.0 enthalten und erlaubt nur eine sehr allgemeine<br />

Beschreibung; die zugrundeliegende CodeList B.5.27 enthält lediglich 19 Werte. Zur<br />

Verdeutlichung: Die im Global Change Master Directory erfassten geowissenschaftlichen<br />

Projekte lassen sich nahezu vollständig mit lediglich zwei dieser Werte, entweder „climatologyMeteorologyAtmosphere“<br />

oder „geoscientificInformation“, beschreiben. 31<br />

Ein weiterer wesentlicher Unterschied zu DIF besteht darin, dass die GeoMIS.Bund-<br />

Metadaten nicht <strong>als</strong> eigenständige Dateien bestehen, eine räumliche Trennung von Daten und<br />

Metadaten ist zwar perspektivisch vorgesehen, jedoch noch nicht realisiert. Momentan soll –<br />

ähnlich wie im Falle des US-amerikanischen FGDC – über das im Aufbau befindliche Geodatenportal<br />

des Bundes (GeoPortal.Bund) und mittels des vorgegebenen Metadatenschemas lediglich<br />

ein externer Zugriff nach Mindeststandards auf die Daten gewährleistet werden. Außerdem<br />

sind die Länder, deren Metadaten schrittweise einbezogen werden, in der Erstellung<br />

ihrer Metadaten nicht an das Metadatenschema von GeoMIS.Bund gebunden. Schon aus diesem<br />

Grunde muss mit Inkonsistenzen und Informationsverlusten gerechnet werden – das Land<br />

Niedersachsen verwendet für seine Geodaten z. B. das Metadatenschema des Umweltdatenkataloges<br />

(UDK).<br />

GeoMIS.Bund ist zur Erfassung geowissenschaftlicher Metadaten generell geeignet, doch<br />

müssen hierbei im Vergleich zu DIF Einbußen an Genauigkeit und Nutzerfreundlichkeit hingenommen<br />

werden.<br />

30<br />

„Science Keywords”, “Instrument”, “Platform”, “Project”.<br />

31<br />

Vgl. International Standard ISO 19115. First edition 2003-05-01. Geographic information – Metadata, S.<br />

102f. (B.5.27 MD_TopicCategoryCode >).<br />

Das im Aufbau befindliche und gewisse Ähnlichkeiten zu GeoMIS.Bund und DIF aufweisende „Metadaten-<br />

Informationssystem für die Küstenforschung und das Küsteningenieurwesen“ innerhalb des Nord- und Ostsee-<br />

KüstenInformationsSystems (NOKIS) versucht den entgegengesetzten Weg zu gehen und größere Genauigkeit<br />

über eine expansive Beschreibung in (deutschsprachigen) Freitextfeldern zu erzielen, andererseits aber alle Beteiligten<br />

zur Verwendung international üblicher Termini aus anerkannten Thesauri – darunter auch den Listen<br />

des GCMD – anzuhalten. Vgl. und Unterseiten.


internationale Bedeutung des DIF 20<br />

2.4.3. Climate and Environmental Data Retrieval and Archive System (CERA)<br />

Der inzwischen unter der Versions-Nr. 2.5 vorliegende und in verschiedenen Versionen im<br />

Potsdam-Institut für Klimafolgenforschung (PIK), im Deutschen Klimarechenzentrum<br />

(DKRZ) und im Alfred-Wegener-Institut für Polar- und Meeresforschung (AWI) zur Anwendung<br />

kommende Metadatenstandard wurde 1995 auf der Basis der damaligen DIF-Definition<br />

geschaffen. Seither wurde der Standard den Bedürfnissen der Anwender (v. a. genaueste Wiedergabe<br />

von raumzeitlichen Koordinaten) angepasst und weiterentwickelt, so dass inzwischen<br />

starke Abweichungen von der aktuellen DIF-Version bestehen. Von diesen Unterschieden<br />

sind jedoch lediglich optionale Felder des DIF-Standards betroffen. Zudem besteht bei der<br />

Implementierung von CERA-2 die Möglichkeit, individuell Felder, bzw. „Cartridges“ einzufügen,<br />

um das Modell an die lokalen Anforderungen anzupassen. Mit diesem Hilfsmittel ließe<br />

sich erneut eine vollständige Abbildung von DIF auf CERA erreichen. Daher ist CERA-2<br />

nach wie vor <strong>als</strong> „Dialekt“ des DIF-Standards anzusehen. 32<br />

Desweiteren verfügt CERA-2 über eine unbegrenzte modulare Erweiterbarkeit; zu einem obligatorischen<br />

Core-Modul können optionale Module entsprechend den Nutzerbedürfnissen<br />

installiert werden, die Anzahl möglicher Inhaltskategorien bleibt undefiniert.<br />

Im Unterscheid zu DIF ist Core jedoch kein Dateiformat, sondern lediglich eine Datenbankstruktur,<br />

eine Ausgabe in Dateiform findet nicht statt. Dem entsprechend differiert auch die<br />

Darstellungsweise, die Datenbankmasken-Darstellung von CERA erscheint etwas übersichtlicher<br />

<strong>als</strong> die an Darstellung in Texteditoren orientierte DIF-Darstellung ausserhalb des<br />

GCMD.<br />

Das Gebiet, auf dem CERA und DIF sich am weitesten voneinander entfernt haben, ist das<br />

des Vokabulars. CERA verwendet – im völligen Gegensatz zu DIF, für dessen Performance<br />

dies unabdingbar ist – keinerlei verbindliches kontrolliertes Vokabular, es werden lediglich<br />

Beispiele angeboten. Begründet wird dies mit der Heterogenität der Forschungsgegenstände;<br />

vermutet werden kann jedoch, dass für die aufwendige Pflege eines solchen kontrollierten<br />

Vokabulars nicht ausreichende personelle Ressourcen mobilisiert werden könnten. 33<br />

32 Für eine ausführliche Beschreibung siehe v.a und<br />

. Siehe auch das Konvertierungsbeispiel<br />

in .<br />

33 Zumal ersichtlich wird, dass man gern kontrolliertes Vokabular verwenden würde: „Instead, the use of some<br />

of the lists given at GCMD/DIF or FGDC/CSDGM is recommended to speak a common language.”<br />

.


internationale Bedeutung des DIF 21<br />

Insgesamt ist CERA durch seine Erweiterbarkeit umfangreicher <strong>als</strong> DIF und erlaubt – auch<br />

durch den Wegfall des bei DIF vorgeschriebenen kontrollierten Vokabulars – ein besseres<br />

Eingehen auf die Intentionen des Datenerstellers. Erkauft wird dies durch einen Trend zur<br />

Unübersichtlichkeit und zur Aufweichung der Begrifflichkeit bzw. der Recherchegenauigkeit.<br />

2.4.4. Dublin Core Metadata Initiative (DCMI)<br />

Die 1995 gegründete internationale Dublin Core Metadata Initiative (DCMI) 34 hat ein Kate-<br />

gorienschema zur Beschreibung von Internetquellen geschaffen, das sich auch auf die formale<br />

Beschreibung von Dokumenten aller Art anwenden lässt. Ziel der Initiative ist die Schaffung<br />

eines einheitlichen Vokabulars zur Beschreibung vielfältiger Ressourcen, wobei ein internationaler<br />

und interdisziplinärer Konsens über die zu verwendenden Elemente angestrebt wird,<br />

um eine möglichst breite Anwendbarkeit der Dublin Core-Elemente zu gewährleisten.<br />

Die Dublin Core Metadata Initiative hat für die Beschreibung der jeweiligen Informationsres-<br />

source ein Set von 15 Kernelementen 35 festgelegt (Dublin Core Metadata Element Set -<br />

„Simple Dublin Core“). Darüber hinaus ist es möglich, zur weiteren Spezifizierung sogenannte<br />

„Qualifier“ zusätzlich einzubinden, mit denen die Bedeutung der Kernelemente verfeinert<br />

werden kann, um die Ressource detaillierter beschreiben zu können.<br />

Im Gegensatz zu DIF kennt DC keine genauen Regeln für die Belegung der einzelnen Felder,<br />

sondern bildet lediglich eine Art „kleinsten gemeinsamen Nenner“ für den Austausch von<br />

Metadaten. Auch ein kontrolliertes Vokabular ist nicht vorgesehen. Daher stellt die geringe<br />

Erschließungstiefe hinsichtlich der Anwendung in hochspezifischen Gebieten wie z. B. den<br />

Geowissenschaften den entscheidenden Nachteil des Dublin Core-Standards dar.<br />

Weil das DC-Format über keine hierarchische Tiefe verfügt ist es – analog zum DIF-Format –<br />

leicht handhabbar. Zudem lässt es sich durch seine Textbasiertheit – ähnlich wie DIF – in unterschiedlichsten<br />

Umgebungen darstellen, sowohl in Datenbanken <strong>als</strong> auch im Header einer<br />

HTML-Datei, <strong>als</strong> eigenständige HTML-, XML- oder TXT-Datei. Eine Überführung von DIF-<br />

Daten in das DC-Format gestaltet sich angesichts des analogen Aufbaus relativ einfach. Jedoch<br />

müssen in der Regel mehrere DIF-Felder in ein DC-Feld übernommen werden. Demge-<br />

34<br />

Siehe .<br />

35<br />

Title, Creator, Subject and Keywords, Description, Publisher, Contributor, Date, Resource Type, Format,<br />

Identifier, Source, Language, Relation, Coverage, Rights.


internationale Bedeutung des DIF 22<br />

genüber ist eine sinnvolle Übernahme von DC-Daten in das DIF-Format wegen dessen stren-<br />

gerer Ausformung nicht möglich. 36<br />

Unabhängig davon, welche Verbreitung das Dublin Core-Format in der Zukunft – ggf. in ei-<br />

ner engen Verbindung mit dem Open Archives Initiative Protocol for Metadata Harvesting<br />

(OAI-PMH) – auf anderen Gebieten erlangen wird, erscheint es für die Erstellung geowissen-<br />

schaftlicher Metadaten aus einer Reihe von Gründen nicht geeignet:<br />

1. International wie in der Regel auch national sind bereits Metadatenformate für die<br />

verschiedensten Anwendungsgebiete etabliert.<br />

2. Syntax und Vokabular des DC-Formats erfahren kaum Begrenzungen, was einer<br />

exakten Benennung von Sachverhalten jenseits allgemeiner Angaben entgegensteht.<br />

3. Der Anspruch einer allgemeingültigen Darstellung lässt nur wenig Raum für spezifische<br />

Problemstellungen. Eine Gruppe, die sich mit der Anpassung von DC an die<br />

Bedürfnisse der Geowissenschaften befasst, existiert nicht.<br />

4. Die Datenproduzenten sind innerhalb der jeweiligen Institutionen in der Regel<br />

nicht mit der Erstellung bzw. Aktualisierung der Website oder mit Dokumentationsaufgaben<br />

befasst. Daher dürfte auch nur selten ein Bewusstsein für die Notwendigkeit<br />

der Einfügung von DC-Metadatenelementen vorhanden sein.<br />

5. Die Verwendung des DC-Formats wäre vor allem dann sinnvoll, wenn auf das<br />

Abgreifen dieses Formates spezialisierte Suchmaschinen das Web scannen und automatisch<br />

spezielle Datenbanken aus den abgegriffenen Metadaten generieren<br />

würden. Momentan existieren jedoch kaum entsprechende Seiten mit DC-<br />

Metadaten und auch kaum DC-Suchmaschinen. Der normale Weg ist gegenwärtig<br />

daher der, eine Seite mit DC-Metadaten zu erstellen und diese bei einem spezialisierten<br />

Verzeichnis anzumelden. Gegenüber anderen Erschließungsverfahren ist<br />

somit kein Vorteil ersichtlich, weder für den Datenproduzenten noch für den Datenbankbetreiber.<br />

6. Das auf die Erschließung von (frei zugänglichen) Internet-Quellen fokussierte DC-<br />

Format ist in einer Wissenschaftslandschaft, die den Datenzugang restriktiv handhabt,<br />

nicht praktikabel. Da die relevanten spezifizierten Metadaten sich in der Regel<br />

hinter der Zutrittsschranke befinden bedürfte es einer internationalen „Datenanmeldestelle“<br />

(analog zum Global Change Master Directory oder zum FGDC-<br />

36 Vgl. .


internationale Bedeutung des DIF 23<br />

Clearinghouse), für die die Initiative nicht über ausreichende personelle und mate-<br />

rielle Ressourcen verfügt.<br />

In Deutschland wendet der an der Staats- und Universitätsbibliothek Göttingen angesiedelte<br />

„Geo-Guide“ das DC-Format zur Dokumentation geowissenschaftlicher Forschungsprojekte<br />

im WWW an. 37 Die dortige Erfassung von Projekten bleibt im Vergleich zum Global Change<br />

Master Directory relativ unspezifisch und von geringer Eindringtiefe gekennzeichnet. 38 Zu-<br />

dem erscheinen auch im Geo-Guide nur die im Web präsenten Forschungsprojekte, die von<br />

den mit den Forschungen befassten Wissenschaftlern selbst angemeldet worden sind, eine<br />

selbständige Suche und Verzeichnung scheint nicht stattzufinden. Im Ergebnis dessen beste-<br />

hen bedeutende Fehlstellen und eine Reihe „toter“ Links.<br />

Die Problematik der Nutzung von Dublin Core-Metadaten im Umfeld eines solchen Port<strong>als</strong><br />

lässt sich exemplarisch anhand der Suchergebnisse nach dem Begriff „GeoForschungsZen-<br />

trum Potsdam“ im Geo-Guide verdeutlichen (23.07.2004): Der Geo-Guide warf im Ergebnis<br />

der „Simple Search“ 20 Treffer aus, die entweder dem GeoForschungsZentrum Potsdam<br />

selbst oder verbundenen Organisationen bzw. Projekten zugeordnet sind. Auf den ersten Blick<br />

fällt das Fehlen wichtiger, vom GFZ betriebener Projekte, wie z. B. der Satellitenmissionen<br />

GRACE und CHAMP auf. Offensichtlich hat es seitens der mit diesen Projekten befassten<br />

Wissenschaftler keinen Versuch der Anmeldung beim Geo-Guide gegeben. Bei einer eigenständigen<br />

Suche seitens des Geo-Guide wären diese erheblichen Fehlstellen auffällig und geschlossen<br />

worden (beide Missionen besitzen eigene Web-Auftritte). 39<br />

Lediglich drei der 20 Seiten, die vom Geo-Guide <strong>als</strong> Treffer ausgeworfen wurden, verfügen<br />

im Quelltext über Metadaten im Dublin Core-Format. Auch innerhalb des GFZ selbst, dem<br />

zwei dieser drei Seiten zuzuordnen sind, ist die Handhabung uneinheitlich; die Bibliothek und<br />

ein Forschungsprojekt verfügen über Dublin Core-Metadaten, 40 alle anderen nicht. Diese<br />

Stichprobe zeigt, dass die Zusammenarbeit mit einem Dublin Core-Metadaten verwendenden<br />

37<br />

Vgl. . Der Geo-Guide vermittelt keinen direkten Zugang zu den Daten, sondern<br />

verweist den Nutzer auf die jeweilige URL.<br />

38<br />

Vgl. auch das Metadatenschema unter .<br />

39<br />

Siehe die Projekt-Webseiten und .<br />

Nach Schönfeld würde in erster Linie ein Team aus Geowissenschaftlern und Bibliothekaren nach eigener Recherche<br />

im Internet über die Aufnahme eines Projektes entscheiden; die Eigenmeldung von Wissenschaftlerseite<br />

über die Homepage des Geo-Guide wäre dem nachgeordnet. Wenn dem wirklich so sein sollte ist das Fehlen<br />

nahezu sämtlicher GFZ-Projekte um so unverständlicher. Vgl. Frank Schönfeld, Der Nutzen von Metadaten für<br />

fachspezifische Informationssysteme im WWW am Beispiel des Projektes „Geo-Guide“ der Staats- und Universitätsbibliothek<br />

Göttingen, Abschlussarbeit FH Potsdam 1999, S. 12f.<br />

40<br />

Vgl. , .


internationale Bedeutung des DIF 24<br />

Portal deren Verbreitung nicht zwingend fördert. Selbst die Möglichkeit, die für die Verwen-<br />

dung im Geo-Guide erstellten DC-Metadaten im wesentlichen unverändert zu übernehmen<br />

und in den eigenen Seitenquelltext zu kopieren, wird nicht genutzt, es besteht kein Interesse<br />

daran.<br />

2.4.5. ISO 19115<br />

Die ISO-Norm 19115 (verabschiedet Juni 2003) beinhaltet Angaben zur eindeutigen Identifi-<br />

kation, zur Ausdehnung, zur Qualität, zum räumlichen und zeitlichen Schema, zum Referenzsystem<br />

und zur Nutzbarmachung von Daten. Insgesamt wurden 409 Metadatenelemente definiert,<br />

die in der Regel schon aufgrund spezifischer Inhalte aber nicht vollständig genutzt<br />

werden können. Ein Minimaldatensatz an verpflichtenden („mandatory“) Metainformationen<br />

umfasst gut 20 Elemente. Die Metadatenelemente gruppieren sich in Metadatenentitäten, deren<br />

weitere Unterteilung in 14 Hauptmetadatenpakete erfolgt.<br />

Der aktuelle DIF-Standard 9.0 (verabschiedet Mai 2004) wurde in erster Linie zur Herstellung<br />

einer Kompatibilität zu ISO 19115 notwendig. 41 DIF 9.0 erfüllt damit vorgegebene interna-<br />

tionale Mindestanforderungen. Dieser Vorgang macht deutlich, dass ISO 19115 eher die<br />

Funktion eines Metastandards zukommt, der Anforderungen an Standards definiert. Vorgegeben<br />

werden lediglich ein Daten- und Hierarchiemodell sowie ausführliche Beschreibungen<br />

der Elemente und Attribute. Die konkrete Ausgestaltung in Form von Formaten bleibt den<br />

jeweiligen Anwendergruppen vorbehalten.<br />

Eine Verzeichnung geowissenschaftlicher Metadaten direkt nach der ISO 19115 selbst wäre<br />

auf XML-Basis zwar technisch möglich, jedoch angesichts eines Gebildes, das nur Spezialisten<br />

überschauen können, vollkommen praxisfremd. In jedem Falle ist ein erheblicher Einarbeitungsaufwand<br />

gegeben. 42<br />

41<br />

Es wurden <strong>als</strong> Inhaltskategorien („fields“) neu aufgenommen: „ISO Topic Category“, „Metadata_Name“,<br />

„Metadata_Version“.<br />

42<br />

Vgl. Stefan Glatz, Chancen und Probleme der Standardisierung von Metadaten am Beispiel des ISO-<br />

Standards 19115 (Geographic Information – Metadata), Abschlussarbeit FH Potsdam 2003, S. 24.


3. Die Darstellung geowissenschaftlicher Metadaten am GeoForschungs-<br />

Zentrum Potsdam mit dem Directory Interchange Format<br />

Erstaunlicherweise verfügt das GeoForschungsZentrum Potsdam über kein verbindliches Me-<br />

tadatenkonzept. Demzufolge bleibt es den Wissenschaftlern bzw. Projektgruppen überlassen,<br />

ob und in welcher Weise sie die von ihnen erhobenen Daten mit Metadaten versehen und welchen<br />

Grad der Publizität und des Datenaustausches sie für ihr Projekt anstreben. Ein einheitlicher<br />

Zugriff auf die einzelnen Projekte, Daten und Metadaten des GFZ ist nicht gegeben. Die<br />

gegenwärtige (Juli 2004) Situation lässt sich folgendermaßen beschreiben:<br />

1. Die große Mehrzahl der Projekte verfügt über eigene Webpräsenzen. 43 Strukturierte<br />

Metadaten werden über diese nicht ausgegeben.<br />

2. Zwei Projekte sind beim Göttinger „Geo-Guide“ angemeldet, der Metadaten im Dublin<br />

Core-Format benutzt.<br />

3. Einige Projekte sind mit ihren Metadaten im Global Change Master Directory auf der<br />

Basis des DIF-Standards verzeichnet. 44<br />

4. Ausgewählte Schwerpunktprojekte des GFZ besitzen für die Recherche und den Da-<br />

tendownload jeweils einen eigenen ISDC 45 -Zugang, der vom Daten- und Rechenzen-<br />

trum des GFZ betrieben wird. Deren ständig auflaufende Daten werden für interne<br />

Zwecke mit Metadaten auf der Grundlage einer Modifizierung des DIF-Standards an-<br />

gereichert. 46<br />

Die Anmeldung dieser Projekte beim Global Change Master Directory mit Metadaten<br />

im DIF-Standard 9.0 steht unmittelbar bevor. 47<br />

5. Eine unbekannte Anzahl von Projekten dürfte ohne öffentlichen Datenzugriff, Metadaten<br />

und Publizität bestehen.<br />

Zur Vereinheitlichung des Datenzugriffs plant das Daten- und Rechenzentrum in Eigeninitiative<br />

die Implementierung eines Metadatenservers für alle GFZ-Daten.<br />

Trotz aller Uneinheitlichkeit stellt sich das Directory Interchange Format somit <strong>als</strong> das verbreitetste<br />

Metadatenformat im GFZ dar. Seine Einführung erfolgte 1994/95 mit dem im Kapitel<br />

2.1 beschriebenen initialisierenden Projekt des Deutschen Fernerkundungsdatenzentrums<br />

43<br />

Vgl. .<br />

44<br />

Entry-ID im GCMD: GFZ_RED_BEDS_MOROCCO, GFZ-GPS, GFZ-High_Res._Earth_Grav_Models,<br />

GFZ-GRIM4-S, GFZ-GRIM4-C, GFZ-GRIM4_C3T_SSTOP, GFZ-SLR.<br />

45<br />

Information System and Data Center.<br />

46<br />

Vgl. Beispiel eines extended DIF’s im Anhang.<br />

47<br />

Vgl. Beispiele für DIF’s im DIF-9.0-Format im Anhang.


DIF am GeoForschungsZentrum Potsdam 26<br />

(DFD). In diesem ersten Anlauf kam es zur Ausweisung von acht DIF’s, die das Data-Center<br />

resp. das GFZ selbst, 48 einen Sensor und sechs Datensätze beschrieben. 49 Gegenwärtig (Juli<br />

2004) finden sich Metadaten über sieben Projekte des GFZ im GCMD. Hier noch nicht ent-<br />

halten sind die erst vor der Anmeldung stehenden Projekt- und Datensatzbeschreibungen der<br />

Schwerpunktprojekte Challenging Mini-Satellite Payload (CHAMP), Gravity Recovery And<br />

Climate Experiment (GRACE), Global Atmosphere Sounding Project (GASP), Global Navigation<br />

Satellite System (GNSS).<br />

Schon seit dem Jahre 2000 werden die Daten dieser über einen ISDC-Zugang verfügenden<br />

Schwerpunktprojekte im GFZ für Zwecke der Recherche und des Downloads intern mit Metadaten<br />

nach dem Vorbild des DIF-Standards angereichert. Doch erfüllen diese Metadaten<br />

weder formal noch inhaltlich die Anforderungen des DIF-Standards 9.0.<br />

Die formale Abweichung dieser „extended DIF’s“ vom DIF-Standard besteht darin, dass nicht<br />

– wie die Bezeichnung Directory Interchange Format nahelegt – Verzeichnisse, Datensätze<br />

oder Gruppen von Dateien mittels Metadaten beschrieben werden, sondern die detaillierten<br />

Forschungsdaten selbst. Jeder Datendatei ist eine Metadatendatei zugeordnet, die allerdings<br />

erst zum Zeitpunkt der Abarbeitung einer Rechercheabfrage aus der Datenbank selbst generiert<br />

wird. Diese modifizierten DIF-Dateien lassen sich einzeln aufrufen und erlauben eine<br />

Voraborientierung über den Inhalt der Datendateien vor dem Download. Neben der Darstellung<br />

<strong>als</strong> DIF werden die Metadaten gleichzeitig inhaltlich identisch im XML-Format ausgegeben.<br />

Anders <strong>als</strong> bei der Schaffung des Standards intendiert kommt den Metadaten hier nicht<br />

nur eine Präsentationsfunktion zu, sondern sie werden unmittelbar dazu genutzt, den Recherche-<br />

und Downloadvorgang zu steuern. Der Vorteil für Daten- und Rechenzentrum und Nutzer<br />

liegt darin, dass nicht unnötigerweise umfangreiche Verzeichnisse zu laden sind wenn<br />

lediglich spezielle Daten benötigt werden.<br />

Insgesamt stellt diese formale Abweichung vom DIF-Standard noch keine Inkompatibilität,<br />

sondern lediglich eine modernisierende Anpassung an die konkreten Bedingungen der Datenverwaltung<br />

dar. Allerdings würde es das GCMD wohl aus Kapazitäts- und Übersichtlichkeitsgründen<br />

ablehnen, DIF’s für jede einzelne Datei zu übernehmen. Zumal im konkreten<br />

Fall auch noch keine übergreifenden Beschreibungen („parent DIF’s“) im GCMD vorliegen.<br />

48<br />

Auch im Juli 2004 noch in der nach wie vor unbearbeiteten Fassung des Jahres 1995 im GCMD vorhanden.<br />

49<br />

Vgl. IDN-Einträge, S. 107-127.


DIF am GeoForschungsZentrum Potsdam 27<br />

Inkompatibilitäten entstehen erst mit inhaltlichen Abweichungen, die einen neuen „Dialekt“<br />

einer Metadatensprache kennzeichnen. Im GFZ ist dies der Fall. Für die aktuelle Ausprägung<br />

dieser intern <strong>als</strong> „extended DIF“ 50 bezeichneten Abweichungen gegenüber dem DIF-Standard<br />

9.0 zeichnen drei GFZ-interne Entwicklungen verantwortlich:<br />

a) Gegenüber dem Stand zur Zeit seiner Einführung hat sich der DIF-Standard selbst<br />

weiterentwickelt. Das ist vom GFZ nur unzureichend beobachtet und umgesetzt worden.<br />

b) Die an den Projekten beteiligten und für die Eintragung der Werte im Zuge der Datengenerierung<br />

verantwortlichen Wissenschaftler sind – insbesondere was die Verwendung<br />

des kontrollierten Vokabulars angeht – entweder nicht über die Vorgaben des<br />

Standards informiert oder missachten sie bewusst und setzen ihnen passend erscheinende<br />

Werte ein.<br />

c) In Abstimmung mit dem Datacenter wurden besondere – nicht dem Standard entsprechende<br />

– Parameter „CHAMP-ISDC“, „GRACE-ISDC“ etc. eingeführt. Die Absicht<br />

lag darin, die Suchbarkeit bestimmter Merkmale zu ermöglichen, die teilweise durch<br />

das vorgegebene kontrollierte Vokabular des originalen DIF-Standards nicht abgedeckt<br />

werden. Der gesuchte Vorteil, das zielgenaue Auswerfen der gesuchten Forschungsdaten,<br />

wird in jedem Falle auch erreicht. Der Nachteil liegt allerdings darin,<br />

dass diese Metadaten nur im GFZ selbst bearbeitet werden können. Die externe maschinelle<br />

Verarbeitung ist durch die Einführung der besonderen Parameter blockiert.<br />

Der selbst geschaffene „extended DIF“-Standard hat die Verwaltung der Daten und die Arbeitsabläufe<br />

im Daten- und Rechenzentrum inzwischen in einem solchen Maße strukturiert,<br />

dass eine Rücknahme oder Migration der die Forschungsdaten auf der untersten Ebene beschreibenden<br />

Metadaten in einen anderen Standard – DIF 9.0 eingeschlossen – nur für den<br />

Preis eines unverhältnismässig hohen Aufwandes möglich erscheint.<br />

50 Vgl. das Beispiel einer Erfassung <strong>als</strong> „extended DIF“ im Anhang.


4. Schlussfolgerungen<br />

Das in der Nutzung von Metadaten verborgene große Potential zur Strukturierung wachsender<br />

Datenmengen und Informationsströme wird gegenwärtig bei weitem nicht ausgeschöpft. In<br />

verkürzter Perspektive kann gesagt werden, dass erst dann, wenn der „Leidensdruck“ groß<br />

genug ist, wenn Behinderungen in der Kommunikation, Daten- und ökonomische Verluste<br />

eingetreten sind, die Beschäftigung mit Metadatenkonzepten beginnt. Gegenwärtig sind daher<br />

in erster Linie Insellösungen anzutreffen, die langsam mit Hilfe übergreifender Standards angeglichen<br />

werden und somit Kommunikationsfähigkeit erlangen.<br />

Die Entwicklung von adäquaten Metadatenkonzepten wird von mehreren Seiten behindert:<br />

a) Ineffiziente Entscheidungsprozesse bestätigen zwar die Notwendigkeit der Erstellung<br />

und Vorhaltung von Daten, nicht aber die analoge Erstellung und Vorhaltung<br />

von Metadaten.<br />

b) Damit im Zusammenhang stehend verzögert mangelndes wissenschaftliches 51 und<br />

administratives Interesse die Entwicklung inhaltsadäquater Metadatenstandards.<br />

c) Für die Erstellung von Metadaten schaffen sich Institutionen, Gremien, Projekte<br />

etc. für ihren eigenen Machtbereich eigene Standards. Ein Anschluss an andere<br />

Standards wird oft <strong>als</strong> Herabsetzung der eigenen Bedeutung wahrgenommen. 52<br />

Sicher ist, dass aktiv angewendete Standards gleich „korrespondierenden Röhren“ Datenströme<br />

modifizieren und lenken, dass sie deren Richtung und die Art der abgerufenen Daten ändern<br />

und die Geschwindigkeit des Informationsaustausches zu erhöhen vermögen. Das heisst,<br />

wo bisher aufgrund einer „Insellösung“ mit nur wenigen Anfragen gerechnet werden musste<br />

kann nach Umstellung auf einen anerkannten Standard das Datenaustauschvolumen erheblich<br />

anwachsen, was wiederum erhöhte Anforderungen an die Qualität und kontinuierliche Pflege<br />

der Metadaten stellt und die Bereitstellung materieller wie personeller Ressourcen verlangt.<br />

In der Implementierung eines Metadatenstandards stellt sich das Problem, dass je umfassender<br />

ein Standard bzw. eine Norm zu sein versucht, desto beliebiger auch der Inhalt der erfass-<br />

51 Exemplarisch: Markus Lusti, Data Warehousing und Data Mining. Eine Einführung in entscheidungsunterstützende<br />

Systeme, zweite, überarbeitete und erweiterte Auflage, Berlin u. a. 2002, behandelt in einem 444 Seiten<br />

umfassenden Werk die Rolle von Metadaten auf lediglich drei Seiten, und das unter ausschließlich technischem<br />

Blickwinkel. Vgl. ebenda, S. 194-196.<br />

52 Die darüberhinaus allgemein festzustellende profilneurotische Angewohnheit, ständig neue Bezeichnungen<br />

und Abkürzungen zu kreieren – und dies in der Regel ohne Verweis auf institutionelle Abhängigkeiten bzw.<br />

Verflechtungen –, trägt nicht zur Übersichtlichkeit des Wissenschaftsgebietes insgesamt bei.


Schlussfolgerungen 29<br />

ten Metadaten sein wird. Soll <strong>als</strong>o – sofern keine Bindung an administrative Vorgaben besteht<br />

– dem im Wissenschaftsgebiet am weitesten verbreiteten oder dem inhaltsadäquatesten Stan-<br />

dard der Vorzug gegeben werden? Allgemein hat die Zwecksetzung der zu kreierenden Meta-<br />

daten maßgeblich für die Auswahl des Standards zu sein. Sollen die Metadaten vor allem zur<br />

Ermöglichung bzw. Erleichterung des Datenaustausches dienen wäre dem verbreitetsten Format<br />

der Vorzug zu geben. Wenn jedoch in erster Linie eine Präsentation eigener Projekte intendiert<br />

ist wird der inhaltsadäquatere Standard diesen Zweck besser erfüllen. Die Frage der<br />

Handhabbarkeit des jeweiligen Standards wird in diesen Überlegungen erst dann relevant,<br />

wenn ein eigentlich zu wählender Standard nicht erfüllbare Anforderungen an die Bearbeiter<br />

bzw. die Institution stellt.<br />

Die Untersuchung hat gezeigt, dass das Directory Interchange Format in der Version 9.0 im<br />

direkten Vergleich mit anderen zur Auswahl stehenden Standards hinsichtlich Inhaltsadäquatheit,<br />

allgemeiner Verbreitung, Handhabbarkeit und zu erzielender Publizität die „erste Wahl“<br />

für die Erstellung geowissenschaftlicher Metadaten im GeoForschungsZentrum Potsdam darstellt.<br />

Für seinen perspektivischen Bestand ist zudem bedeutsam, dass mit der NASA bzw.<br />

dem CEOS über eine große „Marktmacht“ verfügende Institutionen diesen Standard favorisieren<br />

und weiterentwickeln. Unter Einbeziehung des Global Change Master Directory ist es in<br />

der Vergangenheit gelungen, einen ein zielgenaues Retrieval erlaubenden, stark abgegrenzten<br />

homogenen Datenraum zu bilden. Vorrangig für Zwecke der Erfassung von Geo-Metadaten<br />

geschaffene Standards wie CSDGM und GeoMis.Bund stellen unter inhaltlichen Gesichtspunkten<br />

keine ernsthafte Konkurrenz resp. Alternative zu DIF dar.<br />

Eine Entscheidung für DIF bedeutet jedoch auch eine eindeutige Bindung an dieses Format,<br />

dessen Inhalte sich – jenseits eingehaltener ISO-Mindestanforderungen – wegen seiner strengen,<br />

an ein kontrolliertes Vokabular gebundenen Ausformung nur schwer in andere Formate<br />

übertragen lassen.<br />

Für eine einheitliche Darstellung, Publizität und Zugänglichkeit der Datenbestände des Geo-<br />

ForschungsZentrums Potsdam werden unter Zugrundelegung des vorab festgestellten folgende<br />

Maßnahmen empfohlen: 53<br />

1. Alle laufenden und abgeschlossenen Projekte des GFZ sowie vom GFZ datentech-<br />

nisch verwaltete internationale Projekte 54 sind obligatorisch mittels jeweils eines<br />

53<br />

Vgl. auch „In der Umsetzung befindliches allgemeines Metadatenschema des GeoForschungsZentrums Potsdam“<br />

im Anhang.


Schlussfolgerungen 30<br />

DIF’s im aktuellen DIF-Standard 9.0 zu beschreiben. Die so entstehende Daten-<br />

bank ist auf der Website des GFZ an hervorragender Stelle zu plazieren oder ein<br />

vorkonfigurierter Link zum Global Change Master Directory anzubieten, bei dem<br />

die Projekte anzumelden sind. Gleichfalls hat ein Link auf jeder Projekt-Website<br />

auf diese Metadatenbasis zu verweisen.<br />

2. Parallel zur Anmeldung beim GCMD sind alle Projekte beim Göttinger Geo-Guide<br />

anzumelden und die bei der Anmeldung generierten Metadaten im Dublin Core-<br />

Format für den Quelltext der jeweiligen Projekt-Webseite zu übernehmen.<br />

3. Sofern innerhalb der Projekte umfangreiche qualitativ unterschiedliche Datensätze<br />

bestehen sollten diese mittels eigener „child DIF’s“ beschrieben und gleichfalls<br />

beim GCMD angemeldet werden.<br />

4. Die Beschreibung des GFZ im GCMD ist zu aktualisieren.<br />

5. Eine wesentliche Änderung in der Erfassung der „extended-DIF’s“ auf der untersten<br />

Metadatenebene ist aus Gründen der Wahrung der Einheitlichkeit der Datenbestände<br />

nicht anzustreben. Hinzuzufügen ist lediglich der Verweis auf die nunmehr<br />

bestehenden „parent-DIF’s“ der nächsthöheren Metadatenebene.<br />

6. Sämtliche intern und extern zugänglichen Datenbestände des GFZ sind unter einer<br />

einheitlichen Oberfläche im zu schaffenden Metadatenserver zu vereinigen.<br />

7. Zur Überwindung der bisherigen Sprunghaftigkeit in der Bearbeitung und zur Herstellung<br />

einer dauerhaften Publizität auf hohem Niveau ist ein Mitarbeiter allein<br />

mit dem Aufbau und der Pflege der Metadaten bzw. ihrer Strukturierung sowie mit<br />

der Erhöhung der Publizität der Datenbestände zu beauftragen („Metadatenbeauftragter“).<br />

Eine Übernahme dieser Aufgabe durch die Wissenschaftler selbst bzw.<br />

die Beschäftigten des Daten- und Rechenzentrums „nebenbei“ scheidet aufgrund<br />

der Spezifik des Aufgabenfeldes und seiner permanenten Modifizierung aus.<br />

Die Durchsetzung dieser Maßnahmen liegt zu einem großen Teil nicht im Ermessen des Daten-<br />

und Rechenzentrums selbst. Eindeutige Weisungen seitens der Leitung des GFZ erweisen<br />

sich daher <strong>als</strong> notwendig.<br />

54 Z. B. das Global Geodynamic Project (GGP), .


Inhalt:<br />

5. Anhang<br />

5.1. Dokumente und Übersichten<br />

Eingangsbildschirm des Global Change Master Directory.............................................32<br />

Eingabemaske zur online-Erstellung von DIF’s im Global Change Master Directory...33<br />

DIF fields in derVersion 9.0............................................................................................34<br />

DIF Template (text version)............................................................................................35<br />

Directory Interchange Format 9.0 in XML-Darstellung (DTD) .....................................38<br />

Beschreibung einer Daten-Datei durch ein extended DIF im GFZ Potsdam..................44<br />

Beschreibung eines Datensatzes durch ein DIF in der Version 9.0 im GFZ Potsdam....47<br />

Beschreibung eines Schwerpunktprojektes durch ein DIF in der Version 9.0 im<br />

GFZ Potsdam...................................................................................................................51<br />

In der Umsetzung befindliches allgemeines Metadatenschema des<br />

GeoForschungsZentrums Potsdam..................................................................................55


Eingangsbildschirm des Global Change Master Directory<br />

Anhang 32


Anhang 33<br />

Eingabemaske zur online-Erstellung von DIF’s im Global Change Master Directory 55<br />

55 Erreichbar unter bzw.<br />

.


DIF fields in derVersion 9.0<br />

Anhang 34<br />

Anmerkungen 56 Abweichungen der Versionen<br />

7 und 8 57<br />

Entry ID required Benennung: Directory Entry<br />

Identifier<br />

Entry Title required Benennung: Directory Entry<br />

Title<br />

Science Keywords required, valids list Benennung: Parameters<br />

ISO Topic Category required, valids list nicht enthalten<br />

Data Center required, valids list<br />

Summary required<br />

Personnel optional field<br />

Data Set Citation optional field<br />

Instrument optional field, valids list Benennung: Sensor Name<br />

Platform optional field, valids list Benennung: Source Name<br />

Temporal Coverage optional field<br />

Paleo-Temporal Coverage optional field<br />

Data Set Progress optional field, (valids list)<br />

Spatial Coverage optional field<br />

Location optional field, valids list<br />

Data Resolution optional field<br />

Project optional field, valids list<br />

Keyword optional field<br />

Quality optional field<br />

Access Constraints optional field<br />

Use Constraints optional field<br />

Data Set Language optional field<br />

Originating Center optional field<br />

Distribution optional field<br />

Multimedia Sample optional field<br />

Reference optional field<br />

Discipline optional field<br />

Related URL optional field, valids list<br />

Parent DIF optional field<br />

Metadata_Name optional field, valids list nicht enthalten<br />

Metadata_Version optional field, valids list nicht enthalten<br />

IDN Node optional field, valids list<br />

DIF Creation Date optional field<br />

Last DIF Revision Date optional field<br />

DIF Revision History optional field<br />

Future DIF Review Date optional field<br />

56<br />

Der Standard sieht auch eine Begrenzung der jeweiligen Feldlänge vor. Diese bleibt hier unberücksichtigt.<br />

Vgl. .<br />

57<br />

Die Benennungen der Kategorien (fields) werden von der NASA selbst uneinheitlich gebraucht. Während auf<br />

der Startseite die aktuellen Bezeichnungen genutzt werden<br />

finden sich auf nachgeordneten Seiten immer noch synonyme ältere Benennungen (z. B. instrument <br />

sensor).


DIF Template (text version) 58<br />

Entry_ID:<br />

Entry_Title:<br />

Group: Data_Set_Citation<br />

Dataset_Creator:<br />

Dataset_Title:<br />

Dataset_Series_Name:<br />

Dataset_Release_Date:<br />

Dataset_Release_Place:<br />

Dataset_Publisher:<br />

Version:<br />

Issue_Identification:<br />

Data_Presentation_Form:<br />

Other_Citation_Details:<br />

Online_Resource:<br />

End_Group<br />

Group: Personnel<br />

Role: [Personnel Role Valid]<br />

First_Name:<br />

Middle_Name:<br />

Last_Name:<br />

Email:<br />

Phone:<br />

FAX:<br />

Group: Contact_Address<br />

+Address:<br />

City:<br />

Province_Or_State:<br />

Postal_Code:<br />

Country:<br />

End_Group<br />

End_Group<br />

Discipline:<br />

Group: Parameters<br />

Category:<br />

Topic:<br />

Term:<br />

Variable:<br />

Detailed_Variable:<br />

End_Group<br />

ISO_Topic_Category:<br />

Keyword:<br />

Sensor_Name:<br />

Source_Name:<br />

Anhang 35<br />

58 Quelle: . Einige Gruppen bzw. Felder innerhalb<br />

einer Gruppe können zur Darstellung differierender Angaben wiederholt werden.


Group: Temporal_Coverage<br />

Start_Date:<br />

Stop_Date:<br />

End_Group<br />

Group: Paleo_Temporal_Coverage<br />

Paleo_Start_Date:<br />

Paleo_Stop_Date:<br />

Chronostratigraphic_Unit:<br />

End_Group<br />

Data_Set_Progress:<br />

Group: Spatial_Coverage<br />

Southernmost_Latitude:<br />

Northernmost_Latitude:<br />

Westernmost_Longitude:<br />

Easternmost_Longitude:<br />

Minimum_Altitude:<br />

Maximum_Altitude:<br />

Minimum_Depth:<br />

Maximum_Depth:<br />

End_Group<br />

Location:<br />

Group: Data_Resolution<br />

Latitude_Resolution:<br />

Longitude_Resolution:<br />

Altitude_Resolution:<br />

Depth_Resolution:<br />

Temporal_Resolution:<br />

End_Group<br />

Project:<br />

Group: Quality<br />

[…]<br />

End_Group<br />

Group: Access_Constraints<br />

[…]<br />

End_Group<br />

Group: Use_Constraints<br />

[…]<br />

End_Group<br />

Data_Set_Language:<br />

Originating_Center:<br />

Group: Data_Center<br />

Data_Center_Name:<br />

Data_Center_URL:<br />

Data_Set_ID:<br />

Group: Personnel<br />

Role: [Personnel Role Valid]<br />

First_Name:<br />

Middle_Name:<br />

Last_Name:<br />

Email:<br />

Phone:<br />

Anhang 36


FAX:<br />

Group: Contact_Address<br />

+Address:<br />

City:<br />

Province_Or_State:<br />

Postal_Code:<br />

Country:<br />

End_Group<br />

End_Group<br />

Group: Distribution<br />

Distribution_Media:<br />

Distribution_Size:<br />

Distribution_Format:<br />

Fees:<br />

End_Group<br />

Group: Multimedia_Sample<br />

File:<br />

URL:<br />

Format:<br />

Caption:<br />

Group: Description<br />

[…]<br />

End_Group<br />

End_Group<br />

Group: Reference<br />

[…]<br />

End_Group<br />

Group: Summary<br />

[…]<br />

End_Group<br />

Group: Related_URL<br />

URL_Content_Type:<br />

URL:<br />

Group: Description<br />

[…]<br />

End_Group<br />

End_Group<br />

Parent_DIF:<br />

Metadata_Name:<br />

Metadata_Version:<br />

IDN_Node:<br />

DIF_Creation_Date:<br />

Last_DIF_Revision_Date:<br />

Group: DIF_Revision_History<br />

[…]<br />

End_Group<br />

Future_DIF_Review_Date:<br />

Anhang 37


Directory Interchange Format 9.0 in XML-Darstellung (DTD) 59<br />

<br />

Anhang 38<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

59 Quelle: .


<br />

<br />

<br />

<br />

<br />

<br />

<br />

Anhang 39<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />


<br />

<br />

Anhang 40<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />


Anhang 41<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />


<br />

<br />

<br />

Anhang 42<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />


Anhang 43<br />

<br />

<br />

<br />

<br />

<br />


Anhang 44<br />

Beschreibung einer Daten-Datei durch ein extended DIF im GFZ Potsdam (Bildschirmdarstellung)<br />

60<br />

CH-ME-2-PLP+2004-07-31_1<br />

Entry_ID: CH-ME-2-PLP+2004-07-31_1<br />

Entry_Title: Preprocessed Planar Langmuir Probe Data<br />

Sensor_Name: DIDM > Planar Langmuir Probe<br />

Keyword: particles<br />

> electric field<br />

Source_Name: CHAMP<br />

Project: CHAMP > German Minisatellite Mission for Geopotential and Atmospheric Research<br />

Data_Set_Progress: COMPLETE<br />

DIF_Revision_Date: 2004-08-03 12:12:43<br />

Storage_Medium: Hard Disc<br />

Storage_Medium: Tape<br />

Storage_Medium: CD-ROM<br />

Aggregated: No<br />

Originating_Center: GFZ Potsdam<br />

Group: Quality<br />

This data passed successfully the quality control procedure.<br />

End_Group<br />

Group: Access_Constraints<br />

For standard data-processing only<br />

End_Group<br />

Group: Use_Constraints<br />

For standard data-processing only<br />

End_Group<br />

Group: Data_Center<br />

Data_Center_Name: CHAMP-ISDC > CHAMP Information System and Data Center<br />

Data_Center_URL: http://www.gfz-potsdam.de<br />

Data_Set_ID: CH-ME-2-PLP<br />

Group: Data_Center_Contact<br />

First_Name: Joachim<br />

Last_Name: Wächter<br />

Email: INTERNET > wae@gfz-potsdam.de<br />

Phone: 049-331-288-1680<br />

Phone: FAX 049-331-288-1703<br />

Group: Address<br />

Joachim Wächter<br />

DRZ<br />

GFZ Potsdam<br />

Telegrafenberg<br />

14473 Potsdam<br />

End_Group<br />

End_Group<br />

End_Group<br />

Group: Investigator<br />

First_Name: Hermann<br />

Last_Name: Lühr<br />

Email: INTERNET > hluehr@gfz-potsdam.de<br />

Phone: 049-331-288-1270<br />

Phone: FAX 049-331-288-1235<br />

Group: Address<br />

Prof. <strong>Dr</strong>. Hermann Lühr<br />

GFZ Potsdam<br />

Telegrafenberg<br />

D-14473 Potsdam<br />

End_Group<br />

End_Group<br />

Group: Technical_Contact<br />

60 Abrufbar unter < http://isdc.gfz-potsdam.de/champ/> nach vorheriger bestätigter Anmeldung.


First_Name: Wolfgang<br />

Last_Name: Mai<br />

Email: INTERNET > wepmai@gfz-potsdam.de<br />

Phone: 049-331-288-1238<br />

Phone: FAX 049-331-288-1235<br />

Group: Adress<br />

Wolfgang Mai<br />

GFZ Potsdam<br />

Telegrafenberg<br />

D-14473 Potsdam<br />

End_Group<br />

End_Group<br />

Group: DIF_Author<br />

First_Name: Wolfgang<br />

Last_Name: Mai<br />

Email: INTERNET > wepmai@gfz-potsdam.de<br />

Phone: 049-331-288-1238<br />

Phone: FAX 049-331-288-1235<br />

Group: Address<br />

Wolfgang Mai<br />

GFZ Potsdam<br />

Telegrafenberg<br />

D-14473 Potsdam<br />

End_Group<br />

End_Group<br />

Group: Distribution<br />

Distribution_Media: electronic<br />

Distribution_Size: 450041<br />

Byte<br />

Distribution_Format: ASCII<br />

End_Group<br />

Group: Data_Set_Citation<br />

Originator: Mai, Wolfgang<br />

Title: CH-ME-2-PLP<br />

Publication_Date: 2004-08-03<br />

Publication_Place: Potsdam, Germany<br />

Edition: 2<br />

Publisher: GFZ Potsdam, Div. 2.3<br />

Data_Presentation_Form: digital timeseries<br />

URL: http://isdc.gfz-potsdam.de/champ/CH-ME-2-PLP<br />

End_Group<br />

Group: Parameters<br />

Category: EARTH SCIENCE<br />

Topic: SOLID EARTH<br />

Term: GEOPHYSICAL<br />

FIELDS<br />

Variable: ELECTRIC FIELD<br />

End_Group<br />

Group: Parameters<br />

Category: CHAMP-ISDC<br />

Variable: datetime<br />

Topic: start date<br />

Term: 2004-07-31 00:00:5.000<br />

End_Group<br />

Group: Parameters<br />

Category: CHAMP-ISDC<br />

Variable: datetime<br />

Topic: stop date<br />

Term: 2004-07-31 23:59:50.000<br />

End_Group<br />

Group: Parameters<br />

Category: CHAMP-ISDC<br />

Topic: delta-t<br />

Term: 15<br />

Variable: real<br />

End_Group<br />

Group: Parameters<br />

Category: CHAMP-ISDC<br />

Topic: operation mode<br />

Term: PLP<br />

Variable: varchar(3)<br />

End_Group<br />

Anhang 45


Group: Parameters<br />

Category: CHAMP-ISDC<br />

Topic: accuracy<br />

Term: 3<br />

Variable: real<br />

End_Group<br />

Group: Parameters<br />

Category: CHAMP-ISDC<br />

Topic: mission<br />

Term: CHAMP<br />

Variable: varchar(5)<br />

End_Group<br />

Group: Parameters<br />

Category: CHAMP-ISDC<br />

Topic: satellite ID<br />

Term: 0003902<br />

Variable: varchar(7)<br />

End_Group<br />

Group: Parameters<br />

Category: CHAMP-ISDC<br />

Topic: processing facility<br />

Term: GFZ<br />

Variable: varchar(3)<br />

End_Group<br />

Group: Parameters<br />

Category: CHAMP-ISDC<br />

Topic: generation date<br />

Term: 2004-08-03<br />

12:12:43<br />

Variable: datetime<br />

End_Group<br />

Group: Parameters<br />

Category: CHAMP-ISDC<br />

Topic: software package<br />

Term: PROCPLP<br />

2002-05-13<br />

Variable: varchar(80)<br />

End_Group<br />

Group: Parameters<br />

Category: CHAMP-ISDC<br />

Topic: revision<br />

Term: 1<br />

Variable: int<br />

End_Group<br />

Group: Parameters<br />

Category: CHAMP-ISDC<br />

Topic: data access<br />

Term: public<br />

Variable: varchar(20)<br />

End_Group<br />

Group: Summary<br />

Product is derived from CHAMP PLP<br />

End_Group<br />

Parent_DIF: 61 CH-ME-2-PLP<br />

Anhang 46<br />

61 Das Feld „Parent DIF“ ist gegenwärtig noch nicht enthalten, sollte aber nach der Installierung der Metadaten<br />

auf der nächsthöheren Ebene (Beschreibung des Datensatzes) ergänzt werden.


Anhang 47<br />

Beschreibung eines Datensatzes durch ein DIF in der Version 9.0 im GFZ Potsdam<br />

(Vorschlag) 62<br />

Entry_ID: CH-ME-2-PLP<br />

Entry_Title: CHAMP – Preprocessed Planar Langmuir Probe Data<br />

Group: Parameters<br />

Category: Earth Science<br />

Topic: Sun-earth Interactions<br />

Term: Ionosphere/Magnetosphere Particles<br />

Variable: Particle Density<br />

End_Group<br />

ISO_Topic_Category: geoscientificinformation<br />

Group: Data_Center<br />

Data_Center_Name: DE/GFZ > Geo Research Center Potsdam, Germany<br />

Data_Center_URL: http://dcc.gfz-potsdam.de/<br />

Data_Set_ID: CH-ME-2-PLP > Preprocessed Planar Langmuir Probe Data<br />

Group: Personnel<br />

Role: Data Center Contact<br />

First_Name: Bernd<br />

Middle_Name:<br />

Last_Name: Ritschel<br />

Email: rit@gfz-potsdam.de<br />

Phone: +49-(331)-288-1685<br />

FAX: +49-(331)-288-1703<br />

Group: Contact_Address<br />

Address: GeoForschungsZentrum Potsdam, Telegrafenberg<br />

City: Potsdam<br />

Province_Or_State: Brandenburg<br />

Postal_Code: 14473<br />

Country: Germany<br />

End_Group<br />

End_Group<br />

End_Group<br />

Group: Summary<br />

End_Group<br />

Group: Personnel<br />

Role: Investigator<br />

First_Name: Hermann<br />

Middle_Name:<br />

Last_Name: Luehr<br />

Email: hluehr@gfz-potsdam.de<br />

Electron density record by Planar Langmuir Probe onboard the<br />

CHAMP satellite.<br />

62 Bei linksseitig rot markierten Kategorien handelt es sich um required fields. Es werden nicht alle optional<br />

fields genutzt. Nicht genutzte Zeilen innerhalb einzelner groups wurden nicht gelöscht.


Phone: +49-331-288-1270<br />

FAX: +49-331-288-1235<br />

Group: Contact_Address<br />

Address: GFZ Potsdam, Div. 1, Telegrafenberg<br />

City: Potsdam<br />

Province_Or_State:<br />

Postal_Code: 14473<br />

Country: Germany<br />

End_Group<br />

End_Group<br />

Group: Personnel<br />

Role: Technical Contact<br />

First_Name: Wolfgang<br />

Middle_Name:<br />

Last_Name: Mai<br />

Email: wepmai@gfz-potsdam.de<br />

Phone: +49-331-288-1238<br />

FAX: +49-331-288-1235<br />

Group: Contact_Address<br />

Address: GFZ Potsdam, Div. 1, Telegrafenberg<br />

City: Potsdam<br />

Province_Or_State:<br />

Postal_Code: 14473<br />

Country: Germany<br />

End_Group<br />

End_Group<br />

Anhang 48<br />

Group: Personnel<br />

Role: DIF Author<br />

First_Name: Bernd<br />

Middle_Name:<br />

Last_Name: Ritschel<br />

Email: rit@gfz-potsdam.de<br />

Phone: +49-(331)-288-1685<br />

FAX: +49-(331)-288-1703<br />

Group: Contact_Address<br />

Address: GeoForschungsZentrum Potsdam, Telegrafenberg<br />

City: Potsdam<br />

Province_Or_State: Brandenburg<br />

Postal_Code: 14473<br />

Country: Germany<br />

End_Group<br />

Group: Personnel<br />

Role: DIF Author<br />

First_Name: Wolfgang<br />

Middle_Name:<br />

Last_Name: Mai<br />

Email: wepmai@gfz-potsdam.de<br />

Phone: +49-331-288-1238<br />

FAX: +49-331-288-1235<br />

Group: Contact_Address<br />

Address: GFZ Potsdam, Div. 1, Telegrafenberg<br />

City: Potsdam<br />

Province_Or_State:


Postal_Code: 14473<br />

Country: Germany<br />

End_Group<br />

Anhang 49<br />

Group: Data_Set_Citation<br />

Dataset_Creator:<br />

Wolfgang Mai<br />

Dataset_Title: Preprocessed Planar Langmuir Probe Data<br />

Dataset_Series_Name: GFZ CHAMP-ISDC<br />

Dataset_Release_Date: 2001-<br />

Dataset_Release_Place: Potsdam<br />

Dataset_Publisher:<br />

Version:<br />

Issue_Identification:<br />

GFZ Potsdam/Data Center<br />

Data_Presentation_Form:<br />

Other_Citation_Details:<br />

Table<br />

Online_Resource:<br />

End_Group<br />

http://isdc.gfz-potsdam.de/champ/<br />

Sensor_Name: PLP > Planar Langmuir Probe<br />

Source_Name: CHAMP > Challenging Minisatellite Payload<br />

Group: Temporal_Coverage<br />

Start_Date: 2001-05-13<br />

Stop_Date:<br />

End_Group<br />

Data_Set_Progress: In Work<br />

Location:<br />

Ionosphere<br />

Project: CHAMP > Challenging Minisatellite Payload<br />

Keyword: particles > electric field<br />

Group: Quality<br />

End_Group<br />

Group: Access_Constraints<br />

End_Group<br />

Group: Use_Constraints<br />

End_Group<br />

Originating_Center: GFZ<br />

This data passed successfully the quality control procedure.<br />

According to the access permission of the user.<br />

Data may not be used for commercial applications.<br />

Group: Distribution<br />

Distribution_Media: Online (FTP) uncompressed<br />

Distribution_Size:<br />

Distribution_Format: ASCII<br />

Fees: [Preis in $] free<br />

End_group


Group: Multimedia_Sample<br />

File:<br />

URL: http://isdc.gfz-potsdam.de/champ/<br />

Format:<br />

Caption:<br />

Group: Description<br />

End_group<br />

End_group<br />

Anhang 50<br />

Discipline: Earth Science > Sun-earth Interactions > Ionosphere/Magnetosphere<br />

Particles - Particle Density<br />

Group: Related_URL<br />

URL_Content_Type: ASSOCIATED DATA SET(S)<br />

URL: http://isdc.gfz-potsdam.de/champ/<br />

Group: Description<br />

The CHAMP-Information System and Data Center (CHAMP-ISDC) is<br />

an independent but essential and integrated part of the whole Geo-<br />

ForschungsZentrum (GFZ) driven CHAMP satellite mission project.<br />

The CHAMP-ISDC applications are designed for the management of<br />

all - from CHAMP satellite raw data and ground-based devices derived<br />

and processed - geoscientific products. Each of these products<br />

exists as a couple of files consisting of a metadata and a data file.<br />

End_group<br />

End_group<br />

Parent_DIF: CHAMP_GFZ<br />

Metadata_Name: CEOS IDN DIF<br />

Metadata_Version: 9.0<br />

DIF_Creation_Date: 2004-08-20<br />

Last_DIF_Revision_Date: 2004-08-20


Anhang 51<br />

Beschreibung eines Schwerpunktprojektes durch ein DIF in der Version 9.0 im GFZ<br />

Potsdam (Vorschlag) 63<br />

Entry_ID: CHAMP<br />

Entry_Title: Challenging Minisatellite Payload (CHAMP) data at GFZ Potsdam<br />

Group: Parameters<br />

Category: Earth Science<br />

Topic: Sun-earth Interactions<br />

Term: Ionosphere/Magnetosphere Particles<br />

Variable: Particle Density<br />

Detailed_Variable:<br />

End_Group<br />

Group: Parameters<br />

Category: Earth Science<br />

Topic: SOLID EARTH<br />

Term: Geodetics/Gravity<br />

Variable: Gravitational Field<br />

Detailed_Variable:<br />

End_Group<br />

Group: Parameters<br />

Category: Earth Science<br />

Topic: SOLID EARTH<br />

Term: Geodetics/Gravity<br />

Variable: Satellite Orbits<br />

Detailed_Variable:<br />

End_Group<br />

ISO_Topic_Category: geoscientificinformation<br />

ISO_Topic_Category: climatologyMeteorologyAtmosphere<br />

Group: Data_Center<br />

Data_Center_Name: DE/GFZ > Geo Research Center Potsdam, Germany<br />

Data_Center_URL: http://dcc.gfz-potsdam.de/<br />

Data_Set_ID: CHAMP > Challenging Minisatellite Payload<br />

Group: Personnel<br />

Role: Data Center Contact<br />

First_Name: Bernd<br />

Middle_Name:<br />

Last_Name: Ritschel<br />

Email: rit@gfz-potsdam.de<br />

Phone: +49-(331)-288-1685<br />

FAX: +49-(331)-288-1703<br />

Group: Contact_Address<br />

Address: GeoForschungsZentrum Potsdam, Telegrafenberg<br />

City: Potsdam<br />

Province_Or_State: Brandenburg<br />

Postal_Code: 14474<br />

63 Bei linksseitig rot markierten Kategorien handelt es sich um required fields. Es werden nicht alle optional<br />

fields genutzt. Nicht genutzte Zeilen innerhalb einzelner groups wurden nicht gelöscht.


Country: Germany<br />

End_Group<br />

End_Group<br />

End_Group<br />

Group: Summary<br />

End_Group<br />

Anhang 52<br />

CHAMP (CHAllenging Minisatellite Payload) is a German small satellite<br />

mission for geoscientific and atmospheric research and applications,<br />

managed by GFZ. With its highly precise, multifunctional and complementary<br />

payload elements (magnetometer, accelerometer, star sensor,<br />

GPS receiver, laser retro reflector, ion drift meter) and its orbit characteristics<br />

(near polar, low altitude, long duration) CHAMP will generate<br />

for the first time simultaneously highly precise gravity and magnetic<br />

field measurements over a 5 years period. This will allow to detect besides<br />

the spatial variations of both fields <strong>als</strong>o their variability with time.<br />

The CHAMP mission will open a new era in geopotential research and<br />

will become a significant contributor to the Decade of Geopotenti<strong>als</strong>. In<br />

addition with the radio occultation measurements onboard the spacecraft<br />

and the infrastructure developed on ground, CHAMP will become<br />

a pilot mission for the pre-operational use of space-borne GPS observations<br />

for atmospheric and ionospheric research and applications in<br />

weather prediction and space weather monitoring.<br />

Group: Personnel<br />

Role: Investigator<br />

First_Name: Christoph<br />

Middle_Name:<br />

Last_Name: Reigber<br />

Email: reigber@gfz-potsdam.de<br />

Phone: +49-331288-1100<br />

FAX: +49-331288-1111<br />

Group: Contact_Address<br />

Address: GFZ Potsdam, Div. 1, Telegrafenberg<br />

City: Potsdam<br />

Province_Or_State:<br />

Postal_Code: 14473<br />

Country: Germany<br />

End_Group<br />

End_Group<br />

Group: Personnel<br />

Role: DIF Author<br />

First_Name: Bernd<br />

Middle_Name:<br />

Last_Name: Ritschel<br />

Email: rit@gfz-potsdam.de<br />

Phone: +49-(331)-288-1685<br />

FAX: +49-(331)-288-1703<br />

Group: Contact_Address<br />

Address: GeoForschungsZentrum Potsdam, Telegrafenberg<br />

City: Potsdam<br />

Province_Or_State: Brandenburg<br />

Postal_Code: 14474<br />

Country: Germany<br />

End_Group


Anhang 53<br />

Source_Name: CHAMP > Challenging Minisatellite Payload<br />

Group: Temporal_Coverage<br />

Start_Date: 2000-07-01<br />

Stop_Date:<br />

End_Group<br />

Data_Set_Progress: In Work<br />

Location:<br />

Ionosphere<br />

Project: CHAMP > Challenging Minisatellite Payload<br />

Group: Quality<br />

End_Group<br />

Group: Access_Constraints<br />

End_Group<br />

Group: Use_Constraints<br />

End_Group<br />

Originating_Center: GFZ<br />

The project contains data in all quality levels.<br />

According to the access permission of the user.<br />

Data may not be used for commercial applications.<br />

Group: Multimedia_Sample<br />

File:<br />

URL: http://isdc.gfz-potsdam.de/champ/<br />

Format:<br />

Caption:<br />

Group: Description<br />

End_group<br />

End_group<br />

Group: Reference<br />

End_Group<br />

http://op.gfz-potsdam.de/champ/more/index_MORE.html<br />

Group: Related_URL<br />

URL_Content_Type: ASSOCIATED DATA SET(S)<br />

URL: http://isdc.gfz-potsdam.de/champ/<br />

Group: Description<br />

The CHAMP-Information System and Data Center (CHAMP-ISDC) is<br />

an independent but essential and integrated part of the whole GeoForschungsZentrum<br />

(GFZ) driven CHAMP satellite mission project. The<br />

CHAMP-ISDC applications are designed for the management of all -<br />

from CHAMP satellite raw data and ground-based devices derived and<br />

processed - geoscientific products. Each of these products exists as a<br />

couple of files consisting of a metadata and a data file.<br />

End_group<br />

End_group<br />

Parent_DIF: DE/GFZ


Metadata_Name: CEOS IDN DIF<br />

Metadata_Version: 9.0<br />

IDN_Node:<br />

DIF_Creation_Date: 2004-08-20<br />

Last_DIF_Revision_Date: 2004-08-20<br />

Anhang 54


In der Umsetzung befindliches allgemeines 64 Metadatenschema des GeoForschungsZentrums Potsdam<br />

Anhang 55<br />

GFZ ---------> Projekte ---------> Datensätze ("Produkttypen") ---------> Daten ("Produkte")<br />

DIF 9.0 DIF 9.0 DIF 9.0 extended DIF<br />

1 mindestens 100 ca. 1.000 ca. 50-100 Mio 65<br />

im GCMD zu<br />

korrigieren<br />

im GCMD<br />

anzumelden<br />

im GCMD<br />

anzumelden<br />

interner Nutzung<br />

vorbehalten<br />

64 „Allgemein“ bedeutet in diesem Zusammenhang, dass das Daten- und Rechenzentrum versucht, diese Struktur an die Datenproduzenten heranzutragen. Das Daten- und Rechenzentrum<br />

verfügt über keinerlei Mittel zu deren Durchsetzung. Für kleinere Projekte ohne eigenen ISDC-Zugang ist die unterste Stufe (extended DIF) zudem gegenstandslos.<br />

65 Diese Zahl bezeichnet alle potentiell mit extended DIF’s beschreibbaren Daten im GFZ. Momentan bestehen etwa 10 Millionen extended DIF’s.


Anhang 56<br />

5.2. Quellen und Literatur 66<br />

An Image Map of the Content Standard for Digital Geospatial Metadata Version 2 - 1998<br />

(FGDC-STD-001 June 1998), .<br />

Bibliothek des Wissenschaftsparks Albert Einstein [Potsdam]; .<br />

Braune, Stephan u.a., Anwendungen ISO-19115-konformer Metadaten in Katalogsystemen<br />

aus dem Bereich umwelt- und geowissenschaftlicher Geofachdaten, in: Zeitschrift für Geologische<br />

Wissenschaften, Berlin, 31 (2003) 1, S. 37-44.<br />

Content Standard for Digital Geospatial Metadata. Metadata Ad Hoc Working Group – Federal<br />

Geographic Data Committee, Reston (Virginia) 1998,<br />

.<br />

CONTINENT - High-resolution CONTINENTal paleoclimate record in Lake Baikal,<br />

.<br />

Czegka, Wolfgang, Metadaten von Geo-Daten. Mit einem Fallstudie für Metadaten geowissenschaftlicher<br />

Geo-Daten nach ISO/TC 19115 am Beispiel des Katalogsystems des LGRB,<br />

Abschlussarbeit FH Potsdam 2001.<br />

Data Documentation Initiative, .<br />

Deutsche IDN-Einträge im DIF-Format – Abschlussbericht –, Manuskript, Weßling 1995.<br />

[Standort: UB/TIB Hannover]<br />

Dublin Core Metadata Initiative, .<br />

Engelhardt, Nicole, Das Clearinghouse System DBClear im Kontext aktueller Entwicklungslinien<br />

in der Fachinformationslandschaft, Abschlussarbeit FH Potsdam 2003.<br />

EuroGeographics, EuroMapFinder – Metadata,<br />

<br />

Federal Geographic Data Committee Metadata and Global Change Master Directory DIF for<br />

GLOBE, .<br />

Federal Geographic Data Committee, .<br />

GCMD – Global Change Master Directory. A directory of Earth science data and services,<br />

.<br />

GeoForschungsZentrum Potsdam in der Helmholtz-Gemeinschaft, .<br />

Geo-Guide, .<br />

GeoMIS.Bund – Geodatensuche, .<br />

GFZ Potsdam, Department 1, The CHAMP Mission, .<br />

GFZ Potsdam, Department 1, The GRACE Mission, <br />

66 Revisionsdatum sämtlicher Internetadressen: 31. Juli 2004.


Anhang 57<br />

Glatz, Stefan, Chancen und Probleme der Standardisierung von Metadaten am Beispiel des<br />

ISO-Standards 19115 (Geographic Information – Metadata), Abschlussarbeit FH Potsdam<br />

2003.<br />

Heyna, Arne, Marc Briede und Ulrich Schmidt, Datenformate im Medienbereich, Leipzig<br />

2003.<br />

Information vernetzen – Wissen aktivieren. Strategisches Positionspapier des Bundesministeriums<br />

für Bildung und Forschung zur Zukunft der wissenschaftlichen Information in Deutschland,<br />

Bonn 2002, .<br />

International Directory Network, .<br />

International Standard ISO 19115. First edition 2003-05-01. Geographic information – Metadata.<br />

Lenk, Martin, Metadaten in Deutschland und Europa: Der Aufbau der Geodateninfrastruktur<br />

des Bundes und der Länder (11. Mai 2004),<br />

<br />

Lusti, Markus, Data Warehousing und Data Mining. Eine Einführung in entscheidungsunterstützende<br />

Systeme, zweite, überarbeitete und erweiterte Auflage, Berlin u. a. 2002.<br />

Metadaten-Informationssystem für die Küstenforschung und das Küsteningenieurwesen,<br />

.<br />

Miller, Paul, Metadata for the masses, in: Ariadne. The Web Version, Issue 5, September<br />

1996, .<br />

NSDI [National Spatial Data Infrastructure], .<br />

Piepel, Carsten, Datenhaltung und Datenzugriff für interoperable Geodatenkataloge, Diplomarbeit<br />

Münster 2001, .<br />

Ritschel, Bernd u. a., CHAMP-ISDC – Informationssystem und Datenzentrum für geowissenschaftliche<br />

Produkte des CHAMP-Satellitenprojekts, in: Zeitschrift für Geologische Wissenschaften,<br />

Berlin, 31 (2003) 1, S. 21-30.<br />

SEDAC – socioeconomic data and applications center, Metadata Overview,<br />

.<br />

The CERA Central Page, .<br />

The State of the GCMD - CY 2003, .<br />

Toussaint, Frank, Wissenschaftliches Datenmanagement. Das CERA-2 Daten- und Metadatenmodell,<br />

.<br />

Umweltdatenkatalog des Bundes und der Länder, .<br />

Zukunft der wissenschaftlichen und technischen Information in Deutschland. Schlussbericht.<br />

Erstellt im Auftrag des Bundesministeriums für Bildung und Forschung durch: Arthur D. Little<br />

GmbH und Gesellschaft für Innovationsforschung und Beratung mbH, Bonn 2002,<br />

.


Anhang 58<br />

5.3 Abkürzungen<br />

AWI Alfred-Wegener-Institut für Polar- und Meeresforschung<br />

CEOS Committee on Earth Observation Satellites<br />

CERA Climate and Environmental Data Retrieval and Archive System<br />

CHAMP Challenging Mini-Satellite Payload<br />

CSDGM Content Standard for Digital Geospatial Metadata<br />

DARA Deutsche Agentur für Raumfahrtangelegenheiten<br />

DC Dublin Core<br />

DDI Data Documentation Initiative<br />

DFD Deutsches Fernerkundungsdatenzentrum<br />

DIF Directory Interchange Format<br />

DKRZ Deutsches Klimarechenzentrum<br />

DLR Deutsche Forschungsanstalt für Luft- und Raumfahrt<br />

ESADS Earth Science and Applications Data Systems Workshop<br />

ESDI European Spatial Data Infrastructure<br />

ESSC Earth System Science Committee<br />

FGDC Federal Geographic Data Committee<br />

GASP Global Atmosphere Sounding Project<br />

GCMD Global Change Master Directory<br />

GeoMIS.Bund GeodatenMetaInformationsSystem des Bundes<br />

GeoPortal.Bund Geodatenportal des Bundes<br />

GGP Global Geodynamic Project<br />

GNSS Global Navigation Satellite System<br />

GRACE Gravity Recovery And Climate Experiment<br />

IDN International Directory Network<br />

INSPIRE Initiative Infrastructure for Spatial Information in Europe<br />

ISDC Information System and Data Center<br />

ISO International Organization for Standardization<br />

IWGDMGC Interagency Working Group on Data Management for Global Change<br />

NASA National Aeronautics and Space Administration<br />

NMD NASA's Master Directory<br />

NSDI National Spatial Data Infrastructure<br />

OAI-PMH Open Archives Initiative Protocol for Metadata Harvesting


PIK Potsdam-Institut für Klimafolgenforschung<br />

UDK Umweltdatenkatalog<br />

URL uniform resource locator<br />

XMI XML Metadata Interchange<br />

XML extensible markup language<br />

Anhang 59


Erklärung<br />

Ich erkläre, die Arbeit selbstständig und unter Verwendung keiner anderen <strong>als</strong> der angegebe-<br />

nen Quellen und Hilfsmittel angefertigt zu haben.<br />

Berlin, 20.08.2004

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!