Volltext als PDF - Dr. Torsten Kupfer
Volltext als PDF - Dr. Torsten Kupfer
Volltext als PDF - Dr. Torsten Kupfer
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Fachhochschule Potsdam<br />
Institut für Information und Dokumentation<br />
Abschlussarbeit<br />
im Rahmen der Fortbildung zum<br />
Wissenschaftlichen Dokumentar / Information Specialist<br />
DIF. Universelle Darstellung und Austausch<br />
geowissenschaftlicher Metadaten mit dem<br />
Directory Interchange Format<br />
von<br />
<strong>Torsten</strong> <strong>Kupfer</strong><br />
Gutachter<br />
Sven Hirsch<br />
Thematischer Schwerpunkt: Entwurf von Informationssystemen<br />
Kurs B 2004<br />
Berlin, 20. August 2004
Abstract<br />
Die Studie untersucht die Zukunftsfähigkeit des Directory Interchange Formats (DIF) für die<br />
Beschreibung von geowissenschaftlichen Forschungsdaten im GeoForschungsZentrum Potsdam<br />
(GFZ). Dargestellt werden die historische Entstehung des Formats, seine technische Ausformung,<br />
seine Stellung im Bereich der geowissenschaftlichen Information, seine Verflechtung<br />
mit dem Global Change Master Directory der NASA sowie seine Vorzüge im Vergleich<br />
zu den verwandten und konkurrierenden Metadatenformaten FGDC-CSDGM, GeoMIS.Bund,<br />
CERA, Dublin Core und ISO 19115.<br />
Im Ergebnis der Bewertung des Formats und der kritischen Hinterfragung der bisherigen Metadatenerstellung<br />
am GeoForschungsZentrum Potsdam werden Empfehlungen für die dortige<br />
weitere Behandlung der Metadatenproblematik gegeben.<br />
The study is examining the Directory Interchange Format (DIF) and its future for describing<br />
geoscientific research data at the GeoForschungsZentrum Potsdam (GFZ – geoscientific research<br />
center). It outlines the origin of the format, its technical shape, its standing in the area<br />
of geoscientific information, its interconnection with NASA’s Global Change Master Directory<br />
as well as its advantages in comparison to the related and competitor metadata formats<br />
FGDC-CSDGM, GeoMIS.Bund, CERA, Dublin Core and ISO 19115.<br />
As a result of evaluation of the format and critical investigation of producing metadata at the<br />
GeoForschungsZentrum Potsdam until now, recommendations are given for further metadata<br />
activities there.
Inhaltsverzeichnis<br />
1. Problemstellung.............................................................................................................4<br />
2. Die internationale Bedeutung des Directory Interchange Formats für die<br />
Beschreibung geowissenschaftlicher Metadaten...............................................................9<br />
2.1. Historische Entstehung.........................................................................................9<br />
2.2. Technische Beschreibung...................................................................................11<br />
2.3. Die Stellung des DIF-Standards auf dem Feld des geowissenschaftlichen<br />
Metadatenaustausches ...............................................................................................14<br />
2.4. Die technische Ausformung konkurrierender Metadatenstandards im<br />
Vergleich zum DIF-Standard ....................................................................................17<br />
2.4.1. FGDC-Standard (CSDGM)....................................................................17<br />
2.4.2. GeoMIS.Bund ........................................................................................18<br />
2.4.3. Climate and Environmental Data Retrieval and Archive<br />
System (CERA)................................................................................................20<br />
2.4.4. Dublin Core Metadata Initiative (DCMI)...............................................21<br />
2.4.5. ISO 19115 ..............................................................................................24<br />
3. Die Darstellung geowissenschaftlicher Metadaten am GeoForschungsZentrum<br />
Potsdam mit dem Directory Interchange Format ............................................................25<br />
4. Schlussfolgerungen .....................................................................................................28<br />
5. Anhang ........................................................................................................................31<br />
5.1. Dokumente und Übersichten..............................................................................31<br />
5.2. Quellen und Literatur .........................................................................................56<br />
5.3. Abkürzungen ......................................................................................................58<br />
Erklärung ........................................................................................................................60
1. Problemstellung<br />
Das Leben jedes Bewohners der westlichen Industrieländer wird Tag für Tag von einer<br />
großen Menge von Metadaten tangiert, die Steuerungsprozesse seines Lebens werden<br />
weitestgehend mit Metadaten abgewickelt. Er selbst realisiert diese Abhängigkeit in der Regel<br />
nicht und weiß in der Regel auch nicht, was „Metadaten“ eigentlich sind und es wäre ihm<br />
auch nur schwer verständlich zu machen. Und doch, ohne die Präsenz von Metadaten könnte<br />
er nicht das umfangreiche Angebot großer Handelsketten nutzen, keinen Neuwagen in<br />
speziellen Konfigurationen bestellen, kein Buch in der Bibliothek ausleihen, nicht <strong>als</strong><br />
Pauschaltourist in den Urlaub fliegen, nicht nach einem Umzug seine neue Wohnung<br />
anmelden, keine Steuererklärung abgeben, nicht kranken-, arbeitslosen- und rentenversichert<br />
sein.<br />
Was sind nun „Metadaten“? Der im englischen Sprachraum wesentlich gebräuchlichere Begriff<br />
meint schlicht „Daten über Daten“, Daten, die aus einer Überblicksperspektive heraus<br />
andere – detailliertere und umfangreichere – Daten beschreiben. 1 Sehr oft machen erst Meta-<br />
daten aus Daten verwertbare Informationen.<br />
Die Existenz von Metadaten ist deutlich älter <strong>als</strong> der Begriff selbst; jeder Karteikarten-<br />
Bibliothekskatalog stellt den klassischen Fall eines Metadatensatzes dar. Auch bei ihm handelt<br />
es sich um Daten, die einer vorab definierten Struktur unterliegen und mit deren Hilfe<br />
vorliegende Informationen (im konkreten Fall: Bücher aller Art) beschrieben werden und dadurch<br />
vom interessierten Nutzer einerseits überhaupt erst gefunden und andererseits auch ohne<br />
direkte Einsichtnahme schon bewertet werden können. Die auf Tim Berners-Lee, den „Erfinder“<br />
des Internet, zurückgehende Auffassung, dass es sich bei Metadaten ausschließlich um<br />
maschinenlesbare Daten handele, geht deshalb etwas in die Irre. Nichtsdestotrotz liegen aufgrund<br />
der Entwicklung der Informationstechnologie in den letzten beiden Jahrzehnten Metadaten<br />
fast ausschließlich in maschinenlesbarer Form, <strong>als</strong> Computerdateien vor.<br />
Das Anlegen von Metadaten und ihre kontinuierliche Pflege ist mit einem hohen Arbeitsaufwand<br />
verbunden. Sie entstehen deshalb zuerst dort, wo der größte Handlungsdruck vorhanden,<br />
wo aus einer großen Menge relativ gleichartiger Daten in kurzer Zeit und mit großer Ge-<br />
1 Die Rückführung auf den griechischen Ursprung „metá“ (= inmitten, zwischen; nach; hinter) gelingt angesichts<br />
des aktuellen Gebrauchs nur noch unvollkommen. Die Suche mit der Internet-Suchmaschine „google“ zum Terminus<br />
„metadata“präsentiert mehr <strong>als</strong> viereinhalb Millionen Treffer.
Problemstellung 5<br />
nauigkeit die benötigte Information selektiert werden soll und der erfolgreiche Suchvorgang<br />
sich unmittelbar in einem Gewinn an Zeit und/oder Geld ausweist. Zudem hat sich in der jün-<br />
geren Vergangenheit gezeigt, dass bereits bei einem Wechsel von Mitarbeitern, Softwarepro-<br />
dukten oder Systemplattformen die Weiternutzung bestehender, aber nicht ausreichend do-<br />
kumentierter Datenbestände beeinträchtigt oder gar unmöglich wird. Neben dem erschwerten<br />
Arbeiten ist in einer mangelhaften Daten-Dokumentation deshalb ein hohes finanzielles Risi-<br />
ko zu sehen, welches mit der stark wachsenden Datenmenge an Brisanz gewinnt. Damit<br />
wächst zwangsläufig auch die Gefahr, dass diese Datenbestände durch nicht angelegte oder<br />
verlorengegangene Metadaten zu anonymen und damit wertlosen „Datenfriedhöfen“ verkommen.<br />
Damit Metadaten für den an einer bestimmten Information Interessierten überhaupt von Nutzen<br />
sein können haben sie formale und inhaltliche Anforderungen zu erfüllen. An erster Stelle<br />
stehen hier die allgemeine Zugänglichkeit und – daraus folgernd – ihre Präsentation vor der<br />
Nutzung der Informationsressource (Datei oder Gruppe von Dateien, Buch, Bild etc.) selbst.<br />
Weiterhin haben Metadaten – und das ist ihre eigentliche Funktion – den Inhalt der Informationsressource<br />
auf das wesentliche reduziert abzubilden. Erst an dieser Stelle ergibt sich für den<br />
Nutzer der intendierte Gewinn an Zeit und materiellem Aufwand bzw. überhaupt erst die<br />
Möglichkeit, die entsprechende Informationsressource sinnvoll nutzen zu können. Dies gelingt<br />
aber nur, wenn die gegebene reduzierte Metainformation nach einem offengelegten Verfahren<br />
strukturiert wurde.<br />
Als wesentliche Anforderungen an Metadaten können somit Zugänglichkeit, Reduziertheit,<br />
Inhaltsadäquanz, Strukturiertheit und Transparenz festgehalten werden.<br />
Ob die Metainformation dabei direkt mit der Informationsressource verbunden ist – z. B. auf<br />
dem Titelblatt eines Buches oder im Header einer Datei – oder aber <strong>als</strong> gesonderter Metadatensatz<br />
getrennt von der Informationsressource existiert, bleibt praktischen Erwägungen unterworfen.<br />
Aus Nutzersicht ist das Anlegen von Metadatensätzen zu favorisieren; allerdings<br />
verlangt dies wiederum in jedem Falle gesonderte technische Vorkehrungen und erhöhten<br />
materiellen wie personellen Einsatz.<br />
Moderne Metadaten liegen fast ausschließlich <strong>als</strong> von den eigentlichen Daten getrennte Metadatensätze<br />
vor. Für den Eigentümer bzw. Verbreiter von Daten liegen die Vorteile dieses Verfahrens<br />
in einer besseren Handhabbarkeit und der Erzielung einer potentiell höheren Publizität.<br />
Angesichts ständig steigender Datenmengen und der daraus resultierenden
Problemstellung 6<br />
Unübersichtlichkeit des gesamten Datenbestandes wäre es für den Nutzer kaum noch prakti-<br />
kabel, die Metainformation in Eigenregie aus dem Header jeder einzelnen Datei zu entneh-<br />
men. Mit der Existenz eines vorab zu sichtenden Metadatensatzes „erledigen“ sich eine Reihe<br />
von Nutzungsfällen von selbst, die Daten brauchen für den Fall, dass sich für den Nutzer<br />
wahrscheinlich kein befriedigendes Ergebnis erzielen lassen würde, nicht mehr „angefasst“ zu<br />
werden, was wiederum auch zu einer spürbaren Entlastung der betroffenen IT-Stellen bzw.<br />
Datenzentren führen kann.<br />
Ein Zugewinn an Publizität, und damit verbunden auch an Nutzerfreundlichkeit, lässt sich<br />
durch die Reproduktion von Metadatensätzen und Hinterlegung an einer Vielzahl von Stellen<br />
bei nach wie vor nur einem einzigen bestehenden Grunddatenbestand – in der Regel verbunden<br />
mit der Präsentation im Internet – erzielen.<br />
Im Gegensatz zu fest mit den eigentlichen Daten verbundenen Metainformationen lässt sich<br />
mit Metadatensätzen zudem der Zugang zu Metainformationen einerseits und Daten andererseits<br />
– wo dies erforderlich sein sollte – differenziert steuern.<br />
Sowohl das Bemühen, Inhalte so weit <strong>als</strong> möglich adäquat abzubilden, wie auch bestehende<br />
Konkurrenzverhältnisse haben zu einer unüberschaubaren Zahl von Metadaten-Standards ge-<br />
führt. 2 Zumal für einen Informatiker ein „Standard“ nicht – wie landläufig darunter verstan-<br />
den – ein allgemein anerkanntes und verwendetes Format darstellt, sondern lediglich ein eindeutig<br />
definiertes Format.<br />
Gegen diese Vielgestaltigkeit – und damit verbunden oft auch Beliebigkeit – gibt es Anstrengungen<br />
zur Vereinheitlichung, um die mit den wuchernden Formaten wachsenden Informationshemmnisse<br />
abzubauen. Einerseits geschieht dies auf dem Wege der Forcierung allgemeiner,<br />
alle Gebiete umschließender Standards, andererseits auf dem Wege der Definition von<br />
Mindestanforderungen, an denen sich Standards orientieren sollten. Allgemeine Standards<br />
haben den Nachteil der schlechten Handhabbarkeit und geringen Trennschärfe bei speziellen<br />
Fragestellungen. Die Zukunft dürfte daher Standards mittlerer Reichweite gehören, die sich an<br />
ISO-Normen orientieren und für ein gesamtes Wissens/Fachgebiet noch eine hinreichende<br />
Genauigkeit erzielen lassen. Eine wachsende Rolle wird der Auszeichnungssprache XML<br />
bzw. XMI dort zukommen, wo noch neue Standards geschaffen werden. In den Bereichen<br />
allerdings, wo sich bereits ein Standard eindeutig etabliert hat, ist mittelfristig mit dessen Ablösung<br />
nicht zu rechnen. XML/XMI käme dort lediglich eine Übersetzerfunktion zu.<br />
2<br />
Was den Informatiker Andrew S. Tannenbaum zu der vielzitierten Bemerkung veranlasste: „The nice thing<br />
about standards is that there are so many to choose from.“
Problemstellung 7<br />
Wissenschaftliche Arbeit ist auf fast allen Gebieten ohne die Nutzung von Metadatensätzen<br />
nicht mehr möglich. Eine Vorreiterrolle in der Nutzung von Metadaten haben hierbei jene<br />
Wissenschaftsgebiete gespielt, in denen eine große Masse an Experimental- und Messdaten<br />
sowie die internationale Vernetzung des Forschungsgeschehens schon frühzeitig nach deren<br />
strukturierter Dokumentation und anwendungsbereiter Vorhaltung verlangten. Zu diesen Wissenschaftsgebieten<br />
zählen die Geowissenschaften in ihrer wechselseitigen Verschränkung von<br />
Bergbau, Bodenkunde, Fernerkundung, Geochemie, Geodäsie, Geographie, Geologie, Geomorphologie,<br />
Geophysik, Geotektonik, Glaziologie, Hydrogeologie, Hydrologie, Ingenieurgeologie,<br />
Kartographie, Klimatologie, Kristallographie, Lagerstättenkunde, Landschafts- bzw.<br />
Geoökologie, Meteorologie, Mineralogie, Ozeanographie, Paläontologie, Petrologie, Stratigraphie,<br />
Strukturgeologie, Tektonik u. a..<br />
Trotz diverser Überschneidungen sind a) geowissenschaftliche Daten und b) Geodaten zu<br />
unterscheiden. Geodaten – in grober Vereinfachung: Karten in digitaler Form – stellen durch<br />
ihre geringere Varianz nicht gleichermaßen hohe Anforderungen an die Formulierung von<br />
Metadatenstandards <strong>als</strong> geowissenschaftliche Daten, sind nichtsdestoweniger aber von höhe-<br />
rem und unmittelbarerem wirtschaftlichen Interesse. 3 Wie noch zu zeigen sein wird orientiert<br />
sich die Formulierung von Metadatenstandards daher in erster Linie an den Bedürfnissen der<br />
Erzeuger und Nutzer von Geodaten. Gerade der Bestand an georeferenzierbaren Daten und<br />
Sachinformationen steigt stark an. Die Archivierung, das Wiederauffinden und die Verteilung<br />
dieser Daten erfordert deshalb eher noch <strong>als</strong> im Falle von geowissenschaftlichen Daten die<br />
standardisierte Katalogisierung der Datenbestände mittels Metadaten, die die Grundlage für<br />
spezielle Datenkataloge und IT-Katalogservices bilden. Demgegenüber leidet die Schaffung<br />
von Metadatenservern bzw. Clearinghouses für geowissenschaftliche Daten an vergleichsweise<br />
geringer Finanzierung und institutioneller Förderung. Die Folge ist eine Reihe abgebrochener<br />
bzw. nur sehr langsam fortschreitender Projekte.<br />
Ziel dieser Arbeit, die während eines elfwöchigen Praktikums am GeoForschungsZentrum<br />
Potsdam (GFZ) entstand, ist es, eine Entscheidungshilfe für die zukünftige dortige Behandlung<br />
der Metadatenproblematik zu geben. Die Erstellung von geowissenschaftlichen Metadaten<br />
am GFZ, das einen alle Disziplinen der Wissenschaften der festen Erde von der Geodäsie<br />
3 Vgl. Wolfgang Czegka, Metadaten von Geo-Daten. Mit einem Fallstudie für Metadaten geowissenschaftlicher<br />
Geo-Daten nach ISO/TC 19115 am Beispiel des Katalogsystems des LGRB, Abschlussarbeit FH Potsdam 2001,<br />
v. a. S. 1-9.
Problemstellung 8<br />
über die Geophysik, Geologie und Mineralogie bis zur Geochemie umfassenden multidiszi-<br />
plinären Forschungsverbund verkörpert, orientiert sich bislang stark an einem in den Geowis-<br />
senschaften weit verbreiteten Metadatenformat, dem Directory Interchange Format (DIF). Im<br />
Kern muß daher auf folgende Fragen eine eindeutige Antwort gegeben werden:<br />
1. Soll seitens des Daten- und Rechenzentrums den an den einzelnen wissenschaftlichen<br />
Projekten Beteiligten weiterhin empfohlen werden, ihre Projekte im Directory Interchange<br />
Format zu beschreiben?<br />
2. Soll innerhalb der vom Daten- und Rechenzentrum direkt verwalteten Datenbestände<br />
dieses Format weiterhin verwendet werden?<br />
3. Muß die Migration zu anderen verbreiteteren und/oder inhaltsadäquateren Formaten<br />
vorbereitet werden?<br />
Im Untersuchungsgang ist demzufolge das Directory Interchange Format in seiner Struktur,<br />
seiner historischen Entwicklung, seiner Stellung in der Wissenschaftswelt und in seinen Perspektiven<br />
darzustellen sowie dessen bisherige praktische Anwendung am GeoForschungsZentrum<br />
Potsdam kritisch zu hinterfragen und ein innerhalb des GFZ allgemein zu empfehlendes<br />
Metadatenschema zu entwickeln.
2. Die internationale Bedeutung des Directory Interchange Formats für die<br />
Beschreibung geowissenschaftlicher Metadaten<br />
2.1. Historische Entstehung<br />
Das Directory Interchange Format (DIF) wurde <strong>als</strong> Metadaten-Austauschformat unter Feder-<br />
führung der NASA geschaffen und beanspruchte ursprünglich vor allem für das Gebiet der<br />
Erdfernerkundung Relevanz. Seine Geburtsstunde lässt sich auf den Februar 1987 festlegen,<br />
<strong>als</strong> ein Earth Science and Applications Data Systems Workshop (ESADS) zu Fragen der Interoperabilität<br />
von Katalogen empfahl, Schritte zu unternehmen, die es externen Nutzern ermöglichen<br />
sollten, Informationen über die im jeweiligen Datensystem vorhandenen Daten zu<br />
erlangen. Daraufhin legte im Sommer 1987 die Catalog Interoperability Working Group, zusammengesetzt<br />
aus verschiedenen US-Bundes- und internationalen Agenturen, die konkrete<br />
Struktur des Datenaustauschformates fest. Seit September desselben Jahres wurde dieses<br />
Format genutzt, um den Prototypen des NASA's Master Directory (NMD) mit Inhalten zu<br />
füllen; Ende Dezember 1987 schließlich waren dort schon mehr <strong>als</strong> 100 Einträge verfügbar.<br />
Nach weiterer Vorstellung und Erprobung durch die scientific community wurde das Directory<br />
Interchange Format auf einem Katalog-Interoperabilitäts-Workshop durch eine CI science<br />
advisory group 1988 formal bestätigt und angenommen. In den Jahren 1989 und 1990 begannen<br />
das Committee on Earth Observation Satellites (CEOS) und die Interagency Working<br />
Group on Data Management for Global Change (IWGDMGC) – auf Aufforderung des dahinter<br />
stehenden Earth System Science Committee (ESSC) – sich an der Diskussion um die Ausformung<br />
des Standards zu beteiligen und ihn zu verwenden. Augenscheinlich in Folge der<br />
veränderten Schwerpunktsetzung wurde danach das NASA's Master Directory (NMD) in<br />
Global Change Master Directory (GCMD) umbenannt.<br />
Das Global Change Master Directory 4 beschränkt sich in der Funktion eines Service-<br />
Providers darauf, die Metadaten zu sammeln und bereitzustellen, vermittelt aber keinen direkten<br />
Zugang zu den Daten selbst. Um diesen muß sich der Nutzer anhand der bei Aufruf des<br />
Projektes bzw. Datensatzes im GCMD sichtbaren Kontaktinformationen selbst bemühen.<br />
4 . Siehe auch Screenshot des Eingangsbildschirms im Anhang. Die Angabe<br />
aller Internetadressen in dieser Untersuchung bezieht sich auf das Datum 31. Juli 2004. Im Folgenden wird<br />
darauf nicht mehr Bezug genommen.
internationale Bedeutung des DIF 10<br />
Diese Grundkonstellation des mit vorwiegend geospatialen Metadaten von Projekten und<br />
Missionen aus aller Welt im Directory Interchange Format gefüllten Global Change Master<br />
Directory, institutionell angesiedelt bei der NASA, besteht unverändert. Allerdings ist der<br />
DIF-Standard seitdem einer ständigen Weiterentwicklung unterworfen und liegt seit Mai 2004<br />
in der Version 9.0 vor. Die Gründe für diese Weiterentwicklung liegen in der Anpassung an<br />
sich neu ergebende wissenschaftliche und (US-amerikanische) administrative Erfordernisse.<br />
Die Version 9.0 ist mit der ISO-Norm 19115:2003 (Geographic information — Metadata)<br />
kompatibel.<br />
In Deutschland forderte 1994 die Deutsche Agentur für Raumfahrtangelegenheiten (DARA)<br />
das Deutsche Fernerkundungsdatenzentrum (DFD) der Deutschen Forschungsanstalt für Luftund<br />
Raumfahrt (DLR) auf, in ihrem Auftrag im Rahmen eines Projektes Metadatensätze über<br />
die in Deutschland verfügbaren Daten erdbeobachtender Satelliten einschließlich Zusatzdaten<br />
zu erstellen und deren Implementierung im International Directory Network (IDN) 5 des<br />
Committee of Earth Observation Satellites (CEOS) vorzubereiten. Obwohl die Resonanz vorerst<br />
eher zögerlich blieb konnten im ersten Anlauf bis Mitte 1995 48 DIF-Beiträge von zur<br />
Mitarbeit bereiten Institutionen bezogen werden. Im unmittelbaren Anschluss daran beteiligte<br />
sich das DFD an einem analogen Projekt auf europäischer Ebene. 6<br />
Gegenwärtig (15.07.2004) sind in dem die Metadatenbasis des IDN bildenden und vor allem<br />
die US-amerikanische Forschungslandschaft abbildenden Global Change Master Directory 17<br />
deutsche Institutionen mit 511 DIF-Einträgen vertreten. Diese Zahlen sind insofern unvollständig<br />
<strong>als</strong> die Beteiligung an internationalen Projekten mit DIF-Verzeichnung nicht korrekt<br />
widergespiegelt wird und auch die interne Verwendung des Formates außerhalb der Betrachtung<br />
bleibt. Weiterhin sollten einige Projekte des GeoForschungsZentrums Potsdam (80-90<br />
DIF-Einträge) erst nach Abschluss dieser Arbeit zur Anmeldung im GCMD kommen.<br />
5 Das International Directory Network versucht, einen zielgerichteten Direktzugriff auf Forschungsdaten zu<br />
ermöglichen. Vgl. . Problematisch bei diesem Vorhaben ist, dass sich der Zugang zum IDN<br />
für kleinere Organisationen und Institutionen, die nicht dem Committee of Earth Observation Satellites angehören,<br />
schwierig gestaltet.<br />
6 Vgl. Deutsche IDN-Einträge im DIF-Format – Abschlussbericht -, Manuskript Weßling 1995, S. 1-10. [Stand-<br />
ort: UB/TIB Hannover]
internationale Bedeutung des DIF 11<br />
2.2. Technische Beschreibung<br />
In der Intention seiner Schöpfer, der CEOS IDN Interoperability group, soll das Directory<br />
Interchange Format nicht zur Beschreibung einzelner Dateien, sondern – wie der gewählte<br />
Name bereits impliziert – zur Beschreibung von „data sets“, von Gruppen relativ gleichartiger<br />
Dateien, die einem gemeinsamen (Forschungs-)Zusammenhang unterliegen.<br />
Ein „DIF“ – die Abkürzung wird allgemein auch <strong>als</strong> Synonym für eine dif-Datei benutzt –<br />
besteht in der Version 9.0 aus maximal 36 Inhaltskategorien. Sechs dieser Kategorien (Entry<br />
ID, Entry Title, Science Keywords, ISO Topic Category, Data Center, Summary) sind obligatorisch<br />
anzugeben („required“), die restlichen 30 dienen der weiteren Spezifizierung („optional“),<br />
ihre Inanspruchnahme wird vom konkreten Gegenstand und vom Ermessen des DIF-<br />
Autors bestimmt. 7<br />
Einer Reihe von Kategorien ist ein verbindliches konkrolliertes Vokabular („Valid Keyword<br />
Lists“) hinterlegt. Dieses wird auf Anregung von Usern hin (Beantragung per email) ständig<br />
aktualisiert und abgeglichen; die alleinige Entscheidungsgewalt über dessen Ausformung liegt<br />
jedoch bei den Mitarbeitern des Global Change Master Directory. Dieses Verfahren birgt den<br />
Vorteil einer größeren Kontinuität und einer schnellen Bearbeitung im Vergleich zu Gremien-<br />
entscheidungen. 8<br />
Auch für Kategorien, deren Inhalt in freier Textwahl wiedergegeben werden kann, wird im<br />
Standard eine bestimmte Art der Darstellung entweder vorgeschrieben oder empfohlen.<br />
Die im Standard enthaltene optional zu verwendende Kategorie „Parent DIF“ erlaubt die Abbildung<br />
von Hierarchien in Suchsystemen. Untergeordnete DIF-Einträge (Child DIF) verweisen<br />
auf das jeweils in der Hierarchie über ihnen stehende DIF, das Parent DIF. Somit ist – wie<br />
auch in der Bildschirmdarstellung des Global Change Master Directory umgesetzt – eine<br />
Verweisung über mehrere Ebenen möglich, beispielsweise von der Forschungsinstitution zu<br />
dessen einzelnen Forschungsprojekten und von diesen wiederum auf die den Projekten zugeordneten<br />
Experimente einschließlich ihrer Forschungsdaten.<br />
7 Vgl. auch die Aufstellung „DIF fields in derVersion 9.0” im Anhang. Eine autorisierte Beschreibung des<br />
Standards ist einzig auf der NASA-Website verfügbar .<br />
Nur dort finden sich auch die entsprechenden Erläuterungen („Definition“, „Syntax“, „Specifications“, „Recommendations“,<br />
„Examples“)<br />
8 Vgl. .
internationale Bedeutung des DIF 12<br />
Ein weiterer Vorteil ist durch die Hard- und Softwareunabhängigkeit gegeben; ein DIF ist<br />
eine txt-Datei, die sich lediglich der Dateiendung „dif“ bedient und somit in jedem Texteditor<br />
geöffnet und geändert werden kann. Zusätzlich ist eine inhaltlich identische Ausgabe <strong>als</strong><br />
XML-Datei möglich. 9 Der Datenaustausch und die Anlage von Metadatenservern wird somit<br />
vor keinerlei Probleme gestellt.<br />
Zu kritisieren am DIF-Standard ist in erster Linie die mit der Aufteilung in „required“ und<br />
„optional“ fields einhergehende Inkonsistenz in der Darstellung. Angesichts der Überschaubarkeit<br />
der Kategorienanzahl wäre es durchaus angebracht, alle Kategorien <strong>als</strong> required fields<br />
auszuführen und für auftretende Fehlanzeigen den eindeutigen Parameter „None“ zu verwenden.<br />
Weiterhin wirkt sich ungünstig aus, dass das GCMD – neben der Möglichkeit der online-<br />
Erstellung von DIF's – kein Softwaretool zur lokalen Generierung von DIF’s (ggf. mit onlineoder<br />
Update-Zugriff auf die im GCMD gepflegten Schlagwortlisten) anbietet.<br />
Insgesamt stellt die Kombination aus DIF-Standard und Global Change Master Directory ein<br />
stark reglementiertes, straff administriertes, dialogorientiertes und aus diesen Gründen auch<br />
effektives System dar.<br />
Eine Anmeldung von wissenschaftlichen Projekten im Global Change Master Directory bzw.<br />
die Modifizierung einer Anmeldung erfolgt entweder online unter Nutzung einer<br />
komfortablen, alle Konventionen berücksichtigenden Eingabemaske 10 oder durch Zusendung<br />
fertiger DIF’s per email, die nachträglich einer Kontrolle auf Standardkonformität durch die<br />
GCMD-Mitarbeiter unterliegen. Aus Anmeldersicht gestaltet sich der erste Weg für einzelne<br />
Datensätze günstiger, während es bei großen Metadatenmengen vorteilhafter sein kann, diese<br />
offline zu erstellen und dem GCMD zuzusenden.<br />
Die Wiedergabe des Inhalts der Schlüsselkategorien über ein kontrolliertes Vokabular bildet<br />
die Grundlage der Darstellung im Global Change Master Directory. Mit Hilfe der keywords<br />
ist für den Nutzer eine zielgenaue Suche nach wissenschaftlichen Projekten möglich, die dem<br />
9<br />
Siehe die im Anhang wiedergegebene dtd.<br />
10<br />
,<br />
(siehe auch Screenshot im Anhang).
internationale Bedeutung des DIF 13<br />
gewählten keyword entsprechen. Im Idealfall kann so eine schnelle Entscheidung über Relevanz<br />
oder Nichtrelevanz der jeweiligen Daten getroffen werden.<br />
Die angestrebte Zusammenfassung aller weltweit anfallenden geowissenschaftlichen Forschungen<br />
im Global Change Master Directory erlaubt den mit dessen Suchmaschine nach<br />
„Data Centers“, „Locations“, „Instruments“, „Platforms/Sources“, „Projects“ oder auch spezifischer<br />
suchenden Wissenschaftlern eine erhebliche Zeitersparnis und größere Trefferausbeu-<br />
te. 11 Voraussetzung ist jedoch auch hier, dass der DIF-Autor zuvor den Sinn des Verfahrens<br />
verstanden und inhaltsadäquate keyword-Kombinationen aus dem verbindlichen kontrollierten<br />
Vokabular bzw. <strong>als</strong> Freitext gewählt hat.<br />
Die aktuellen Nutzungszahlen belegen die hohe Akzeptanz des GCMD und des mit ihm verbundenen<br />
Metadatenstandards DIF in der Wissenschaftswelt: Ende 2003 beinhaltete das nach<br />
wie vor stark wachsende Global Change Master Directory einen Bestand von 14.049 Datensatzbeschreibungen,<br />
unterstützte über 80.000 Links zu Datensätzen und anderen Ressourcen<br />
und verzeichnete für das Jahr 2003 mehr <strong>als</strong> 7,5 Millionen Zugriffe. 12<br />
11<br />
Vgl , .<br />
12<br />
The State of the GCMD - CY 2003, S. 6, 10f., .
internationale Bedeutung des DIF 14<br />
2.3. Die Stellung des DIF-Standards auf dem Feld des geowissenschaftlichen<br />
Metadatenaustausches<br />
Auf ihrer Website betonen die Mitarbeiter des GCMD, dass der DIF-Standard nicht mit ande-<br />
ren Metadatenstandards konkurrieren würde. 13 Tatsächlich aber konkurriert ein Standard<br />
schon durch die Tatsache seiner Existenz mit anderen Standards und erfahrungsgemäß schaf-<br />
fen sich einflussreiche Institutionen – wie z. B. die NASA – schon aus Eigeninteresse eigene<br />
Standards. So ist denn auch diese Aussage <strong>als</strong> beschwichtigende Rhetorik einzuschätzen, de-<br />
ren Hintergrund die tatsächlich vorhandene starke Konkurrenz zwischen dem DIF-Standard<br />
und dem CSDGM-Standard bildet.<br />
Das US-amerikanische Federal Geographic Data Committee (FGDC) verabschiedete 1998<br />
einen Content Standard for Digital Geospatial Metadata (CSDGM). Dieser stellt – abgesichert<br />
durch die Präsidentenorder 12906 aus dem Jahre 1994 – den verbindlichen Metadatenstandard<br />
für alle staatlichen Stellen dar, 14 worunter auch die NASA und ihr Global Change Master Di-<br />
rectory (GCMD) einschließlich des dort verwendeten DIF-Standards zu fassen sind. Das<br />
GCMD entzieht sich der drohenden Vereinheitlichung durch einen Kunstgriff; einerseits bie-<br />
tet es auf einer Unterseite eine Konkordanz zwischen DIF und „FGDC Metadata Standard “<br />
an, 15 anderseits hat es sich <strong>als</strong> Datenknoten („node“) in das gesamtnationale Geodaten-<br />
Netzwerk („FGDC Clearinghouse“ 16 ) einbinden lassen. Im Global Change Master Directory<br />
selbst finden sich nur relativ wenige DIF-Einträge, die auf im FGDC-Standard (CSDGM) erfasste<br />
Projekte verweisen. Die Konkurrenz zwischen beiden Standards führt dazu, dass Projekte<br />
oft parallel für die Erfassung in beiden Systemen mit Metadaten versehen werden. 17<br />
Soweit ersichtlich scheint der DIF-Standard seine stärkste Verbreitung im Bereich der geospa-<br />
13<br />
Vgl. .<br />
14<br />
Vgl. ,<br />
.<br />
15<br />
Allerdings erfolgt nur eine Beschreibung der Umformung von FDGC-Metadaten in das DIF-Format, nicht<br />
jedoch umgekehrt. Vgl. .<br />
16<br />
.<br />
17<br />
Vgl. ,<br />
. Das GCMD erleichtert dies durch die Möglichkeit,<br />
DIF’s online auf seiner Website erstellen zu können und die fertigen Dateien sich per email zuschicken zu lassen.<br />
Dieses Verfahren ist aus der Sicht des Nutzers allerdings dann nicht nutzbar, wenn es sich um Massendaten<br />
handelt oder aber Inhalte durch DIF’s beschrieben werden sollen, die der Geheimhaltung unterliegen.
internationale Bedeutung des DIF 15<br />
tialen Daten zu finden, währenddessen der FGDC-Standard (CSDGM) im Bereich der geo-<br />
graphischen Informationssysteme und –projekte dominierend ist. 18<br />
Als bedeutsamer Unterschied zwischen beiden ist zudem die Tatsache anzusehen, dass der<br />
FGDC-Standard (CSDGM) lediglich von (US-amerikanischer und kanadischer) nationaler<br />
Bedeutung ist, der DIF-Standard hingegen inzwischen eine breite internationale Akzeptanz in<br />
seinem Wissenschaftsgebiet erlangt hat. Letzteres hängt unmittelbar mit der kontinuierlichen<br />
Pflege und dem Ausbau des Global Change Master Directory zu einer „ersten Anlaufadresse“<br />
bei der Suche nach relevanten Forschungen zusammen. Da der Zugang zum GCMD grundsätzlich<br />
offen für jedermann ist, können hier schnell und effektiv Informationen über Projekte<br />
erlangt werden, für die es ansonsten angesichts des meist restriktiv gehandhabten Datenzugangs<br />
langwieriger und umständlicher Autorisierungs- bzw. Zulassungsverfahren bedürfte.<br />
Diese Internationalität und Offenheit ist denn auch die „Lebensversicherung“ des GCMD und<br />
des DIF-Standards.<br />
Nur wenn mit dem FGDC-Standard (CSDGM) eine ähnliche Genauigkeit und Handhabbarkeit<br />
der wissenschaftlichen Information sowie eine ähnliche Qualität, Offenheit und Interna-<br />
tionalität des FGDC-Clearinghouses 19 erreicht werden sollte, könnte dieser den DIF-Standard<br />
ablösen resp. verdrängen.<br />
Auf europäischer Ebene sind die Standardisierungsbemühungen noch weniger ausgeprägt <strong>als</strong><br />
in den USA. Die Schaffung eines eigenen Metadatenstandards innerhalb der European Spatial<br />
Metadata Infrastructure (ESMI) scheint nur langsam voranzuschreiten. 20 Zudem stellt sich die<br />
Frage, wie sinnvoll ein solches Unterfangen ist, und ob es nicht angesichts der bestehenden<br />
internationalen Forschungsverknüpfung einerseits und sehr spezieller Wissenschaftsgebiete<br />
andererseits sachdienlicher wäre, internationale Standards mittlerer Reichweite unterhalb der<br />
ISO-Norm 19115 zu pflegen.<br />
18 Doch auch hier besteht auf staatlicher Seite mit dem Spatial Data Transfer Standard (SDTS) schon ein älterer<br />
eingeführter Metadaten-Standard für Geoinformationen. Es bleibt abzuwarten, ob es mit dem Content Standard<br />
for Digital Geospatial Metadata (CSDGM) gelingen wird, die verschiedenen konkurrierenden Formate und die<br />
dahinter stehenden Organisationen zu integrieren.<br />
19 Da das FDGC-Clearinghouse den Zugang zu den Metadaten nur vermittelt, sie aber nicht selbst vorhält, ist<br />
die Darstellungsweise der Suchergebnisse sehr uneinheitlich und die Suche selbst auf Basisfunktionen unter<br />
Ausblendung jeglicher Zielgenauigkeit reduziert. Vgl.<br />
.<br />
20 Vgl. .
internationale Bedeutung des DIF 16<br />
In Deutschland versucht der Interministerielle Ausschuss für Geoinformationswesen<br />
(IMAGI), angesiedelt im Bundesamt für Kartographie und Geodäsie, steuernd zu wirken. Wie<br />
schon die institutionelle Anbindung deutlich macht, sind dessen Aktivitäten – die Etablierung<br />
eines Metainformationssystems für Geodaten des Bundes (GeoMIS.Bund) und eines Geoda-<br />
tenport<strong>als</strong> des Bundes (GeoPortal.Bund) – allein auf das Territorium der Bundesrepublik fo-<br />
kussiert und tangieren den Bereich der geowissenschaftlichen Forschung nur teilweise. Ziel-<br />
richtung ist nicht die Schaffung von Infrastruktur für Wissenschaft, sondern - analog zum US-<br />
amerikanischen FGDC-Standard (CSDGM) 21 wie auch zur European Spatial Data Infrastruc-<br />
ture (ESDI) und zur Initiative Infrastructure for Spatial Information in Europe (INSPIRE) –<br />
die Schaffung von Infrastruktur für Wirtschaft und Verwaltung.<br />
In Entsprechung dessen bedienen sich die verschiedenen geowissenschaftlichen Institutionen<br />
unterschiedlichster Metadatenstandards. Das Deutsche Zentrum für Luft- und Raumfahrt<br />
(DLR) mit dem ihm angeschlossenen Deutschen Fernerkundungsdatenzentrum (DFD) hat<br />
sich dem Standard der Data Documentation Initiative (DDI) 22 auf XML-Basis angeschlossen,<br />
das GeoForschungsZentrum Potsdam verwendet hauptsächlich den DIF-Standard, für das<br />
GeodatenMetaInformationsSystem des Bundes (GeoMIS.Bund) wurde ein eigener Metada-<br />
tenstandard entwickelt, 23 das Potsdam-Institut für Klimafolgenforschung (PIK), das Deutsche<br />
Klimarechenzentrum (DKRZ) und das Alfred-Wegener-Institut für Polar- und Meeresforschung<br />
(AWI) verwenden einen gemeinsam geschaffenen Standard Climate and Environmen-<br />
tal Data Retrieval and Archive System (CERA), 24 das Nord- und Ostsee-<br />
KüstenInformationsSystems (NOKIS) und der an der Staats- und Universitätsbibliothek Göttingen<br />
angesiedelte und geowissenschaftliche Forschungsprojekte im WWW dokumentieren-<br />
de „Geo-Guide“ wiederum bedienen sich Dublin Core-Metadaten. 25 Relevante Bestrebungen,<br />
sich US-amerikanische nationale Standards – insbesondere CSDGM – zu eigen zu machen,<br />
sind nicht festzustellen.<br />
21<br />
Vgl. (Schaffung einer National Spatial Data Infrastructure (NSDI)).<br />
22<br />
.<br />
23<br />
Vgl. . Die Bundesländer<br />
sind nicht an diesen Standard gebunden und treiben teilweise eigene Projekte voran.<br />
24<br />
.<br />
25<br />
Vgl. , .
internationale Bedeutung des DIF 17<br />
2.4. Die technische Ausformung konkurrierender Metadatenstandards im Vergleich<br />
zum DIF-Standard<br />
2.4.1. FGDC-Standard (CSDGM)<br />
Der DIF-Standard weist auch in der Version 9.0 nach wie vor eine übersichtliche Struktur mit<br />
lediglich 36 Inhaltskategorien („fields“) auf. Sechs dieser „fields“ sind <strong>als</strong> „required“ gekenn-<br />
zeichnet, die übrigen 30 <strong>als</strong> „optional“. Eine weitere Strukturierung der abzubildenden Anga-<br />
ben findet nur insofern statt <strong>als</strong> pro „field“ in der Regel mehrere Werte einzutragen sind; an-<br />
sonsten sind lediglich Wiederholungen einiger „fields“ bzw. Wiederholungen innerhalb<br />
einiger „fields“ möglich.<br />
Der FGDC-Standard (CSDGM) hingegen zeigt – ausgehend von sieben Hauptgruppen – eine<br />
hierarchisch verschachtelte Struktur, die sich im Extremfall auf bis zu sechs Hierarchieebenen<br />
erstreckt. Die jeweiligen Felder sind mit den Merkmalen „mandatory“, „mandatory if applica-<br />
ble“ und „optional“ belegt, wobei diese auf den einzelnen Hierarchieebenen jeweils neu ver-<br />
geben werden. 26 Mit reellen Angaben in Form von Daten oder Freitext werden nur die Felder<br />
auf der jeweils untersten Hierarchieebene belegt, alles darüberstehende stellt lediglich eine<br />
strukturierende Klammer dar.<br />
Das zu verwendende Vokabular weist im Vergleich zum kontrollierten Vokabular des DIF-<br />
Standards nur geringe Einschränkungen auf; zwingend zu benutzende Listen von Schlagwörtern<br />
und Abkürzungen sind hier nicht vorgesehen, eine große Zahl von Feldern sind <strong>als</strong> Freitext<br />
ausgewiesen.<br />
Zudem handelt es sich – wie im Falle der DIF’s – auch um keinen „Container“ in Dateiform,<br />
sondern lediglich um eine Vorschrift, wie Metadatenbanken zu strukturieren sind. Das bedeutet,<br />
da die Informationen nicht <strong>als</strong> ständige Datei abrufbereit sind, eine erschwerte Abgabe der<br />
Metadaten. Eine räumliche Trennung von Daten und Metadaten sowie deren Vervielfältigung<br />
scheint nicht intendiert zu sein.<br />
Ein DIF ist ohne maschinelle Darstellung lesbar und für den mit dem Fachgebiet Vertrauten<br />
auch verständlich. Im Falle einer CSDGM-Darstellung der Metadaten ist dies aufgrund der<br />
ständigen Wiederholung von gleichen Werten in Gruppen kaum noch möglich. Bei einer<br />
Ausweisung im FGDC-Standard (CSDGM) kann für die Darstellung der gleichen Sachverhal-<br />
26 Beispiel: Die Hauptgruppe 2. Data Quality Information ist <strong>als</strong> „mandatory if applicable“ gekennzeichnet,<br />
während die nachgeordnete Gruppe 2.3 Completeness Report den Status „mandatory“ und die Gruppe 2.6 Cloud<br />
Cover den Status „optional“ besitzt. Das bedeutet, sollte 2. genutzt werden muss unter 2.3 unbedingt eine Angabe<br />
gemacht werden, unter 2.6 jedoch nicht zwingend.
internationale Bedeutung des DIF 18<br />
te durchaus die sechsfache Zeichen-Menge gegenüber dem DIF-Standard anfallen. 27 DIF<br />
wirkt daher wesentlich gestraffter, ohne dass ein ersichtlicher Informationsverlust auftritt.<br />
Ein weiterer wesentlicher Vorteil des DIF-Formats ist dessen nutzerfreundliche Erstellung.<br />
Während der User beim Besuch der GCMD-Webpräsenz mit einem DIF Writer’s Guide „an<br />
die Hand genommen“ und ihm die Erstellung von DIF’s so weit <strong>als</strong> möglich erleichtert wird,<br />
bedarf es im Falle des CSDGM einer größeren Vorbildung, um das Verfahren beherrschen zu<br />
können. 28 Angesichts der Tatsache, dass nicht Informatiker, sondern zumeist Wissenschaftler<br />
der Fachdisziplinen diese Arbeiten „nebenbei“ ausführen müssen, dürfte sich auch dies nega-<br />
tiv auf die Akzeptanz des Formats auswirken.<br />
Alles in allem wirkt der FGDC-Standard (CSDGM) praxisfremd, nutzerunfreundlich und verspielt.<br />
Im Zusammenspiel aller irgendwie betroffenen US-Bundes-Institutionen wurde versucht,<br />
einen universellen Standard zu kreieren, der zwar alles erfassen, kaum etwas aber nutzerfreundlich<br />
wiedergeben kann. DIF versucht, die wesentlichen Elemente möglichst exakt zu<br />
erfassen, CSDGM will Vollständigkeit zu Lasten der Vergleichbarkeit.<br />
2.4.2. GeoMIS.Bund 29<br />
Das Metainformationssystem für Geodaten des Bundes (GeoMIS.Bund) bedient sich wie DIF<br />
9.0 ohne weitere hierarchische Gliederung einer überschaubaren Menge von 36 Inhaltskategorien<br />
und ist gleichfalls zum ISO-Standard 19115 kompatibel. Sieben dieser 36 Inhaltskategorien<br />
sind <strong>als</strong> „mandatory“ ausgewiesen, die übrigen <strong>als</strong> „conditional“ bzw. „optional“. In Entsprechung<br />
dieser strukturellen Ähnlichkeit zu DIF erweist sich auch die Handhabung von<br />
GeoMIS.Bund <strong>als</strong> ähnlich nutzerfreundlich. Allerdings wird das Vorhandensein einer ISO<br />
19115-Lizenz und die Kenntnis von deren Inhalt beim Nutzer vorausgesetzt – eine Arbeit, die<br />
im Falle von DIF dem Nutzer durch die Einarbeitung sämtlicher relevanten Angaben in die<br />
über das Web abrufbare Struktur des Standards bereits abgenommen worden ist.<br />
Auch inhaltlich weist GeoMIS.Bund starke Übereinstimmungen mit DIF 9.0 auf, doch fehlen<br />
gerade Entsprechungen für jene mit einem kontrollierten Vokabular hinterlegte Kategorien, 30<br />
27<br />
Beispielhaft ermittelt anhand der parallelen Darstellung des gleichen Sachverhalts in beiden Formaten in<br />
.<br />
28<br />
Zumindest eine gute Visualisierung bietet die Seite „An Image Map of the Content Standard for Digital Geospatial<br />
Metadata Version 2 - 1998 (FGDC-STD-001 June 1998)“<br />
. Für eine vollständige Dokumentation siehe<br />
.<br />
29<br />
Das Metadatenschema wurde zur Verfügung gestellt von Hern Jürgen Walther, Bundesamt für Kartographie<br />
und Geodäsie (BKG), Frankfurt am Main, 23.07.2004. Ein öffentlicher Zugang zum Standard existiert nicht.
internationale Bedeutung des DIF 19<br />
die die Spezifik von DIF ausmachen. Damit stehen für die spezifische Beschreibung geowis-<br />
senschaftlicher Daten jenseits von geograpischen Koordinaten etc. in GeoMIS.Bund lediglich<br />
die Kategorien „keyword“ (frei wählbar), „Abstract describing the dataset“ (frei wählbar) und<br />
„Dataset topic category“ (CodeList B.5.27 aus ISO 19115) zur Verfügung. Die letztgenannte<br />
Kategorie ist aus Gründen der Kompatibilität zum ISO-Standard unter der Bezeichnung „ISO<br />
Topic Category“ inhaltlich identisch auch in DIF 9.0 enthalten und erlaubt nur eine sehr allgemeine<br />
Beschreibung; die zugrundeliegende CodeList B.5.27 enthält lediglich 19 Werte. Zur<br />
Verdeutlichung: Die im Global Change Master Directory erfassten geowissenschaftlichen<br />
Projekte lassen sich nahezu vollständig mit lediglich zwei dieser Werte, entweder „climatologyMeteorologyAtmosphere“<br />
oder „geoscientificInformation“, beschreiben. 31<br />
Ein weiterer wesentlicher Unterschied zu DIF besteht darin, dass die GeoMIS.Bund-<br />
Metadaten nicht <strong>als</strong> eigenständige Dateien bestehen, eine räumliche Trennung von Daten und<br />
Metadaten ist zwar perspektivisch vorgesehen, jedoch noch nicht realisiert. Momentan soll –<br />
ähnlich wie im Falle des US-amerikanischen FGDC – über das im Aufbau befindliche Geodatenportal<br />
des Bundes (GeoPortal.Bund) und mittels des vorgegebenen Metadatenschemas lediglich<br />
ein externer Zugriff nach Mindeststandards auf die Daten gewährleistet werden. Außerdem<br />
sind die Länder, deren Metadaten schrittweise einbezogen werden, in der Erstellung<br />
ihrer Metadaten nicht an das Metadatenschema von GeoMIS.Bund gebunden. Schon aus diesem<br />
Grunde muss mit Inkonsistenzen und Informationsverlusten gerechnet werden – das Land<br />
Niedersachsen verwendet für seine Geodaten z. B. das Metadatenschema des Umweltdatenkataloges<br />
(UDK).<br />
GeoMIS.Bund ist zur Erfassung geowissenschaftlicher Metadaten generell geeignet, doch<br />
müssen hierbei im Vergleich zu DIF Einbußen an Genauigkeit und Nutzerfreundlichkeit hingenommen<br />
werden.<br />
30<br />
„Science Keywords”, “Instrument”, “Platform”, “Project”.<br />
31<br />
Vgl. International Standard ISO 19115. First edition 2003-05-01. Geographic information – Metadata, S.<br />
102f. (B.5.27 MD_TopicCategoryCode >).<br />
Das im Aufbau befindliche und gewisse Ähnlichkeiten zu GeoMIS.Bund und DIF aufweisende „Metadaten-<br />
Informationssystem für die Küstenforschung und das Küsteningenieurwesen“ innerhalb des Nord- und Ostsee-<br />
KüstenInformationsSystems (NOKIS) versucht den entgegengesetzten Weg zu gehen und größere Genauigkeit<br />
über eine expansive Beschreibung in (deutschsprachigen) Freitextfeldern zu erzielen, andererseits aber alle Beteiligten<br />
zur Verwendung international üblicher Termini aus anerkannten Thesauri – darunter auch den Listen<br />
des GCMD – anzuhalten. Vgl. und Unterseiten.
internationale Bedeutung des DIF 20<br />
2.4.3. Climate and Environmental Data Retrieval and Archive System (CERA)<br />
Der inzwischen unter der Versions-Nr. 2.5 vorliegende und in verschiedenen Versionen im<br />
Potsdam-Institut für Klimafolgenforschung (PIK), im Deutschen Klimarechenzentrum<br />
(DKRZ) und im Alfred-Wegener-Institut für Polar- und Meeresforschung (AWI) zur Anwendung<br />
kommende Metadatenstandard wurde 1995 auf der Basis der damaligen DIF-Definition<br />
geschaffen. Seither wurde der Standard den Bedürfnissen der Anwender (v. a. genaueste Wiedergabe<br />
von raumzeitlichen Koordinaten) angepasst und weiterentwickelt, so dass inzwischen<br />
starke Abweichungen von der aktuellen DIF-Version bestehen. Von diesen Unterschieden<br />
sind jedoch lediglich optionale Felder des DIF-Standards betroffen. Zudem besteht bei der<br />
Implementierung von CERA-2 die Möglichkeit, individuell Felder, bzw. „Cartridges“ einzufügen,<br />
um das Modell an die lokalen Anforderungen anzupassen. Mit diesem Hilfsmittel ließe<br />
sich erneut eine vollständige Abbildung von DIF auf CERA erreichen. Daher ist CERA-2<br />
nach wie vor <strong>als</strong> „Dialekt“ des DIF-Standards anzusehen. 32<br />
Desweiteren verfügt CERA-2 über eine unbegrenzte modulare Erweiterbarkeit; zu einem obligatorischen<br />
Core-Modul können optionale Module entsprechend den Nutzerbedürfnissen<br />
installiert werden, die Anzahl möglicher Inhaltskategorien bleibt undefiniert.<br />
Im Unterscheid zu DIF ist Core jedoch kein Dateiformat, sondern lediglich eine Datenbankstruktur,<br />
eine Ausgabe in Dateiform findet nicht statt. Dem entsprechend differiert auch die<br />
Darstellungsweise, die Datenbankmasken-Darstellung von CERA erscheint etwas übersichtlicher<br />
<strong>als</strong> die an Darstellung in Texteditoren orientierte DIF-Darstellung ausserhalb des<br />
GCMD.<br />
Das Gebiet, auf dem CERA und DIF sich am weitesten voneinander entfernt haben, ist das<br />
des Vokabulars. CERA verwendet – im völligen Gegensatz zu DIF, für dessen Performance<br />
dies unabdingbar ist – keinerlei verbindliches kontrolliertes Vokabular, es werden lediglich<br />
Beispiele angeboten. Begründet wird dies mit der Heterogenität der Forschungsgegenstände;<br />
vermutet werden kann jedoch, dass für die aufwendige Pflege eines solchen kontrollierten<br />
Vokabulars nicht ausreichende personelle Ressourcen mobilisiert werden könnten. 33<br />
32 Für eine ausführliche Beschreibung siehe v.a und<br />
. Siehe auch das Konvertierungsbeispiel<br />
in .<br />
33 Zumal ersichtlich wird, dass man gern kontrolliertes Vokabular verwenden würde: „Instead, the use of some<br />
of the lists given at GCMD/DIF or FGDC/CSDGM is recommended to speak a common language.”<br />
.
internationale Bedeutung des DIF 21<br />
Insgesamt ist CERA durch seine Erweiterbarkeit umfangreicher <strong>als</strong> DIF und erlaubt – auch<br />
durch den Wegfall des bei DIF vorgeschriebenen kontrollierten Vokabulars – ein besseres<br />
Eingehen auf die Intentionen des Datenerstellers. Erkauft wird dies durch einen Trend zur<br />
Unübersichtlichkeit und zur Aufweichung der Begrifflichkeit bzw. der Recherchegenauigkeit.<br />
2.4.4. Dublin Core Metadata Initiative (DCMI)<br />
Die 1995 gegründete internationale Dublin Core Metadata Initiative (DCMI) 34 hat ein Kate-<br />
gorienschema zur Beschreibung von Internetquellen geschaffen, das sich auch auf die formale<br />
Beschreibung von Dokumenten aller Art anwenden lässt. Ziel der Initiative ist die Schaffung<br />
eines einheitlichen Vokabulars zur Beschreibung vielfältiger Ressourcen, wobei ein internationaler<br />
und interdisziplinärer Konsens über die zu verwendenden Elemente angestrebt wird,<br />
um eine möglichst breite Anwendbarkeit der Dublin Core-Elemente zu gewährleisten.<br />
Die Dublin Core Metadata Initiative hat für die Beschreibung der jeweiligen Informationsres-<br />
source ein Set von 15 Kernelementen 35 festgelegt (Dublin Core Metadata Element Set -<br />
„Simple Dublin Core“). Darüber hinaus ist es möglich, zur weiteren Spezifizierung sogenannte<br />
„Qualifier“ zusätzlich einzubinden, mit denen die Bedeutung der Kernelemente verfeinert<br />
werden kann, um die Ressource detaillierter beschreiben zu können.<br />
Im Gegensatz zu DIF kennt DC keine genauen Regeln für die Belegung der einzelnen Felder,<br />
sondern bildet lediglich eine Art „kleinsten gemeinsamen Nenner“ für den Austausch von<br />
Metadaten. Auch ein kontrolliertes Vokabular ist nicht vorgesehen. Daher stellt die geringe<br />
Erschließungstiefe hinsichtlich der Anwendung in hochspezifischen Gebieten wie z. B. den<br />
Geowissenschaften den entscheidenden Nachteil des Dublin Core-Standards dar.<br />
Weil das DC-Format über keine hierarchische Tiefe verfügt ist es – analog zum DIF-Format –<br />
leicht handhabbar. Zudem lässt es sich durch seine Textbasiertheit – ähnlich wie DIF – in unterschiedlichsten<br />
Umgebungen darstellen, sowohl in Datenbanken <strong>als</strong> auch im Header einer<br />
HTML-Datei, <strong>als</strong> eigenständige HTML-, XML- oder TXT-Datei. Eine Überführung von DIF-<br />
Daten in das DC-Format gestaltet sich angesichts des analogen Aufbaus relativ einfach. Jedoch<br />
müssen in der Regel mehrere DIF-Felder in ein DC-Feld übernommen werden. Demge-<br />
34<br />
Siehe .<br />
35<br />
Title, Creator, Subject and Keywords, Description, Publisher, Contributor, Date, Resource Type, Format,<br />
Identifier, Source, Language, Relation, Coverage, Rights.
internationale Bedeutung des DIF 22<br />
genüber ist eine sinnvolle Übernahme von DC-Daten in das DIF-Format wegen dessen stren-<br />
gerer Ausformung nicht möglich. 36<br />
Unabhängig davon, welche Verbreitung das Dublin Core-Format in der Zukunft – ggf. in ei-<br />
ner engen Verbindung mit dem Open Archives Initiative Protocol for Metadata Harvesting<br />
(OAI-PMH) – auf anderen Gebieten erlangen wird, erscheint es für die Erstellung geowissen-<br />
schaftlicher Metadaten aus einer Reihe von Gründen nicht geeignet:<br />
1. International wie in der Regel auch national sind bereits Metadatenformate für die<br />
verschiedensten Anwendungsgebiete etabliert.<br />
2. Syntax und Vokabular des DC-Formats erfahren kaum Begrenzungen, was einer<br />
exakten Benennung von Sachverhalten jenseits allgemeiner Angaben entgegensteht.<br />
3. Der Anspruch einer allgemeingültigen Darstellung lässt nur wenig Raum für spezifische<br />
Problemstellungen. Eine Gruppe, die sich mit der Anpassung von DC an die<br />
Bedürfnisse der Geowissenschaften befasst, existiert nicht.<br />
4. Die Datenproduzenten sind innerhalb der jeweiligen Institutionen in der Regel<br />
nicht mit der Erstellung bzw. Aktualisierung der Website oder mit Dokumentationsaufgaben<br />
befasst. Daher dürfte auch nur selten ein Bewusstsein für die Notwendigkeit<br />
der Einfügung von DC-Metadatenelementen vorhanden sein.<br />
5. Die Verwendung des DC-Formats wäre vor allem dann sinnvoll, wenn auf das<br />
Abgreifen dieses Formates spezialisierte Suchmaschinen das Web scannen und automatisch<br />
spezielle Datenbanken aus den abgegriffenen Metadaten generieren<br />
würden. Momentan existieren jedoch kaum entsprechende Seiten mit DC-<br />
Metadaten und auch kaum DC-Suchmaschinen. Der normale Weg ist gegenwärtig<br />
daher der, eine Seite mit DC-Metadaten zu erstellen und diese bei einem spezialisierten<br />
Verzeichnis anzumelden. Gegenüber anderen Erschließungsverfahren ist<br />
somit kein Vorteil ersichtlich, weder für den Datenproduzenten noch für den Datenbankbetreiber.<br />
6. Das auf die Erschließung von (frei zugänglichen) Internet-Quellen fokussierte DC-<br />
Format ist in einer Wissenschaftslandschaft, die den Datenzugang restriktiv handhabt,<br />
nicht praktikabel. Da die relevanten spezifizierten Metadaten sich in der Regel<br />
hinter der Zutrittsschranke befinden bedürfte es einer internationalen „Datenanmeldestelle“<br />
(analog zum Global Change Master Directory oder zum FGDC-<br />
36 Vgl. .
internationale Bedeutung des DIF 23<br />
Clearinghouse), für die die Initiative nicht über ausreichende personelle und mate-<br />
rielle Ressourcen verfügt.<br />
In Deutschland wendet der an der Staats- und Universitätsbibliothek Göttingen angesiedelte<br />
„Geo-Guide“ das DC-Format zur Dokumentation geowissenschaftlicher Forschungsprojekte<br />
im WWW an. 37 Die dortige Erfassung von Projekten bleibt im Vergleich zum Global Change<br />
Master Directory relativ unspezifisch und von geringer Eindringtiefe gekennzeichnet. 38 Zu-<br />
dem erscheinen auch im Geo-Guide nur die im Web präsenten Forschungsprojekte, die von<br />
den mit den Forschungen befassten Wissenschaftlern selbst angemeldet worden sind, eine<br />
selbständige Suche und Verzeichnung scheint nicht stattzufinden. Im Ergebnis dessen beste-<br />
hen bedeutende Fehlstellen und eine Reihe „toter“ Links.<br />
Die Problematik der Nutzung von Dublin Core-Metadaten im Umfeld eines solchen Port<strong>als</strong><br />
lässt sich exemplarisch anhand der Suchergebnisse nach dem Begriff „GeoForschungsZen-<br />
trum Potsdam“ im Geo-Guide verdeutlichen (23.07.2004): Der Geo-Guide warf im Ergebnis<br />
der „Simple Search“ 20 Treffer aus, die entweder dem GeoForschungsZentrum Potsdam<br />
selbst oder verbundenen Organisationen bzw. Projekten zugeordnet sind. Auf den ersten Blick<br />
fällt das Fehlen wichtiger, vom GFZ betriebener Projekte, wie z. B. der Satellitenmissionen<br />
GRACE und CHAMP auf. Offensichtlich hat es seitens der mit diesen Projekten befassten<br />
Wissenschaftler keinen Versuch der Anmeldung beim Geo-Guide gegeben. Bei einer eigenständigen<br />
Suche seitens des Geo-Guide wären diese erheblichen Fehlstellen auffällig und geschlossen<br />
worden (beide Missionen besitzen eigene Web-Auftritte). 39<br />
Lediglich drei der 20 Seiten, die vom Geo-Guide <strong>als</strong> Treffer ausgeworfen wurden, verfügen<br />
im Quelltext über Metadaten im Dublin Core-Format. Auch innerhalb des GFZ selbst, dem<br />
zwei dieser drei Seiten zuzuordnen sind, ist die Handhabung uneinheitlich; die Bibliothek und<br />
ein Forschungsprojekt verfügen über Dublin Core-Metadaten, 40 alle anderen nicht. Diese<br />
Stichprobe zeigt, dass die Zusammenarbeit mit einem Dublin Core-Metadaten verwendenden<br />
37<br />
Vgl. . Der Geo-Guide vermittelt keinen direkten Zugang zu den Daten, sondern<br />
verweist den Nutzer auf die jeweilige URL.<br />
38<br />
Vgl. auch das Metadatenschema unter .<br />
39<br />
Siehe die Projekt-Webseiten und .<br />
Nach Schönfeld würde in erster Linie ein Team aus Geowissenschaftlern und Bibliothekaren nach eigener Recherche<br />
im Internet über die Aufnahme eines Projektes entscheiden; die Eigenmeldung von Wissenschaftlerseite<br />
über die Homepage des Geo-Guide wäre dem nachgeordnet. Wenn dem wirklich so sein sollte ist das Fehlen<br />
nahezu sämtlicher GFZ-Projekte um so unverständlicher. Vgl. Frank Schönfeld, Der Nutzen von Metadaten für<br />
fachspezifische Informationssysteme im WWW am Beispiel des Projektes „Geo-Guide“ der Staats- und Universitätsbibliothek<br />
Göttingen, Abschlussarbeit FH Potsdam 1999, S. 12f.<br />
40<br />
Vgl. , .
internationale Bedeutung des DIF 24<br />
Portal deren Verbreitung nicht zwingend fördert. Selbst die Möglichkeit, die für die Verwen-<br />
dung im Geo-Guide erstellten DC-Metadaten im wesentlichen unverändert zu übernehmen<br />
und in den eigenen Seitenquelltext zu kopieren, wird nicht genutzt, es besteht kein Interesse<br />
daran.<br />
2.4.5. ISO 19115<br />
Die ISO-Norm 19115 (verabschiedet Juni 2003) beinhaltet Angaben zur eindeutigen Identifi-<br />
kation, zur Ausdehnung, zur Qualität, zum räumlichen und zeitlichen Schema, zum Referenzsystem<br />
und zur Nutzbarmachung von Daten. Insgesamt wurden 409 Metadatenelemente definiert,<br />
die in der Regel schon aufgrund spezifischer Inhalte aber nicht vollständig genutzt<br />
werden können. Ein Minimaldatensatz an verpflichtenden („mandatory“) Metainformationen<br />
umfasst gut 20 Elemente. Die Metadatenelemente gruppieren sich in Metadatenentitäten, deren<br />
weitere Unterteilung in 14 Hauptmetadatenpakete erfolgt.<br />
Der aktuelle DIF-Standard 9.0 (verabschiedet Mai 2004) wurde in erster Linie zur Herstellung<br />
einer Kompatibilität zu ISO 19115 notwendig. 41 DIF 9.0 erfüllt damit vorgegebene interna-<br />
tionale Mindestanforderungen. Dieser Vorgang macht deutlich, dass ISO 19115 eher die<br />
Funktion eines Metastandards zukommt, der Anforderungen an Standards definiert. Vorgegeben<br />
werden lediglich ein Daten- und Hierarchiemodell sowie ausführliche Beschreibungen<br />
der Elemente und Attribute. Die konkrete Ausgestaltung in Form von Formaten bleibt den<br />
jeweiligen Anwendergruppen vorbehalten.<br />
Eine Verzeichnung geowissenschaftlicher Metadaten direkt nach der ISO 19115 selbst wäre<br />
auf XML-Basis zwar technisch möglich, jedoch angesichts eines Gebildes, das nur Spezialisten<br />
überschauen können, vollkommen praxisfremd. In jedem Falle ist ein erheblicher Einarbeitungsaufwand<br />
gegeben. 42<br />
41<br />
Es wurden <strong>als</strong> Inhaltskategorien („fields“) neu aufgenommen: „ISO Topic Category“, „Metadata_Name“,<br />
„Metadata_Version“.<br />
42<br />
Vgl. Stefan Glatz, Chancen und Probleme der Standardisierung von Metadaten am Beispiel des ISO-<br />
Standards 19115 (Geographic Information – Metadata), Abschlussarbeit FH Potsdam 2003, S. 24.
3. Die Darstellung geowissenschaftlicher Metadaten am GeoForschungs-<br />
Zentrum Potsdam mit dem Directory Interchange Format<br />
Erstaunlicherweise verfügt das GeoForschungsZentrum Potsdam über kein verbindliches Me-<br />
tadatenkonzept. Demzufolge bleibt es den Wissenschaftlern bzw. Projektgruppen überlassen,<br />
ob und in welcher Weise sie die von ihnen erhobenen Daten mit Metadaten versehen und welchen<br />
Grad der Publizität und des Datenaustausches sie für ihr Projekt anstreben. Ein einheitlicher<br />
Zugriff auf die einzelnen Projekte, Daten und Metadaten des GFZ ist nicht gegeben. Die<br />
gegenwärtige (Juli 2004) Situation lässt sich folgendermaßen beschreiben:<br />
1. Die große Mehrzahl der Projekte verfügt über eigene Webpräsenzen. 43 Strukturierte<br />
Metadaten werden über diese nicht ausgegeben.<br />
2. Zwei Projekte sind beim Göttinger „Geo-Guide“ angemeldet, der Metadaten im Dublin<br />
Core-Format benutzt.<br />
3. Einige Projekte sind mit ihren Metadaten im Global Change Master Directory auf der<br />
Basis des DIF-Standards verzeichnet. 44<br />
4. Ausgewählte Schwerpunktprojekte des GFZ besitzen für die Recherche und den Da-<br />
tendownload jeweils einen eigenen ISDC 45 -Zugang, der vom Daten- und Rechenzen-<br />
trum des GFZ betrieben wird. Deren ständig auflaufende Daten werden für interne<br />
Zwecke mit Metadaten auf der Grundlage einer Modifizierung des DIF-Standards an-<br />
gereichert. 46<br />
Die Anmeldung dieser Projekte beim Global Change Master Directory mit Metadaten<br />
im DIF-Standard 9.0 steht unmittelbar bevor. 47<br />
5. Eine unbekannte Anzahl von Projekten dürfte ohne öffentlichen Datenzugriff, Metadaten<br />
und Publizität bestehen.<br />
Zur Vereinheitlichung des Datenzugriffs plant das Daten- und Rechenzentrum in Eigeninitiative<br />
die Implementierung eines Metadatenservers für alle GFZ-Daten.<br />
Trotz aller Uneinheitlichkeit stellt sich das Directory Interchange Format somit <strong>als</strong> das verbreitetste<br />
Metadatenformat im GFZ dar. Seine Einführung erfolgte 1994/95 mit dem im Kapitel<br />
2.1 beschriebenen initialisierenden Projekt des Deutschen Fernerkundungsdatenzentrums<br />
43<br />
Vgl. .<br />
44<br />
Entry-ID im GCMD: GFZ_RED_BEDS_MOROCCO, GFZ-GPS, GFZ-High_Res._Earth_Grav_Models,<br />
GFZ-GRIM4-S, GFZ-GRIM4-C, GFZ-GRIM4_C3T_SSTOP, GFZ-SLR.<br />
45<br />
Information System and Data Center.<br />
46<br />
Vgl. Beispiel eines extended DIF’s im Anhang.<br />
47<br />
Vgl. Beispiele für DIF’s im DIF-9.0-Format im Anhang.
DIF am GeoForschungsZentrum Potsdam 26<br />
(DFD). In diesem ersten Anlauf kam es zur Ausweisung von acht DIF’s, die das Data-Center<br />
resp. das GFZ selbst, 48 einen Sensor und sechs Datensätze beschrieben. 49 Gegenwärtig (Juli<br />
2004) finden sich Metadaten über sieben Projekte des GFZ im GCMD. Hier noch nicht ent-<br />
halten sind die erst vor der Anmeldung stehenden Projekt- und Datensatzbeschreibungen der<br />
Schwerpunktprojekte Challenging Mini-Satellite Payload (CHAMP), Gravity Recovery And<br />
Climate Experiment (GRACE), Global Atmosphere Sounding Project (GASP), Global Navigation<br />
Satellite System (GNSS).<br />
Schon seit dem Jahre 2000 werden die Daten dieser über einen ISDC-Zugang verfügenden<br />
Schwerpunktprojekte im GFZ für Zwecke der Recherche und des Downloads intern mit Metadaten<br />
nach dem Vorbild des DIF-Standards angereichert. Doch erfüllen diese Metadaten<br />
weder formal noch inhaltlich die Anforderungen des DIF-Standards 9.0.<br />
Die formale Abweichung dieser „extended DIF’s“ vom DIF-Standard besteht darin, dass nicht<br />
– wie die Bezeichnung Directory Interchange Format nahelegt – Verzeichnisse, Datensätze<br />
oder Gruppen von Dateien mittels Metadaten beschrieben werden, sondern die detaillierten<br />
Forschungsdaten selbst. Jeder Datendatei ist eine Metadatendatei zugeordnet, die allerdings<br />
erst zum Zeitpunkt der Abarbeitung einer Rechercheabfrage aus der Datenbank selbst generiert<br />
wird. Diese modifizierten DIF-Dateien lassen sich einzeln aufrufen und erlauben eine<br />
Voraborientierung über den Inhalt der Datendateien vor dem Download. Neben der Darstellung<br />
<strong>als</strong> DIF werden die Metadaten gleichzeitig inhaltlich identisch im XML-Format ausgegeben.<br />
Anders <strong>als</strong> bei der Schaffung des Standards intendiert kommt den Metadaten hier nicht<br />
nur eine Präsentationsfunktion zu, sondern sie werden unmittelbar dazu genutzt, den Recherche-<br />
und Downloadvorgang zu steuern. Der Vorteil für Daten- und Rechenzentrum und Nutzer<br />
liegt darin, dass nicht unnötigerweise umfangreiche Verzeichnisse zu laden sind wenn<br />
lediglich spezielle Daten benötigt werden.<br />
Insgesamt stellt diese formale Abweichung vom DIF-Standard noch keine Inkompatibilität,<br />
sondern lediglich eine modernisierende Anpassung an die konkreten Bedingungen der Datenverwaltung<br />
dar. Allerdings würde es das GCMD wohl aus Kapazitäts- und Übersichtlichkeitsgründen<br />
ablehnen, DIF’s für jede einzelne Datei zu übernehmen. Zumal im konkreten<br />
Fall auch noch keine übergreifenden Beschreibungen („parent DIF’s“) im GCMD vorliegen.<br />
48<br />
Auch im Juli 2004 noch in der nach wie vor unbearbeiteten Fassung des Jahres 1995 im GCMD vorhanden.<br />
49<br />
Vgl. IDN-Einträge, S. 107-127.
DIF am GeoForschungsZentrum Potsdam 27<br />
Inkompatibilitäten entstehen erst mit inhaltlichen Abweichungen, die einen neuen „Dialekt“<br />
einer Metadatensprache kennzeichnen. Im GFZ ist dies der Fall. Für die aktuelle Ausprägung<br />
dieser intern <strong>als</strong> „extended DIF“ 50 bezeichneten Abweichungen gegenüber dem DIF-Standard<br />
9.0 zeichnen drei GFZ-interne Entwicklungen verantwortlich:<br />
a) Gegenüber dem Stand zur Zeit seiner Einführung hat sich der DIF-Standard selbst<br />
weiterentwickelt. Das ist vom GFZ nur unzureichend beobachtet und umgesetzt worden.<br />
b) Die an den Projekten beteiligten und für die Eintragung der Werte im Zuge der Datengenerierung<br />
verantwortlichen Wissenschaftler sind – insbesondere was die Verwendung<br />
des kontrollierten Vokabulars angeht – entweder nicht über die Vorgaben des<br />
Standards informiert oder missachten sie bewusst und setzen ihnen passend erscheinende<br />
Werte ein.<br />
c) In Abstimmung mit dem Datacenter wurden besondere – nicht dem Standard entsprechende<br />
– Parameter „CHAMP-ISDC“, „GRACE-ISDC“ etc. eingeführt. Die Absicht<br />
lag darin, die Suchbarkeit bestimmter Merkmale zu ermöglichen, die teilweise durch<br />
das vorgegebene kontrollierte Vokabular des originalen DIF-Standards nicht abgedeckt<br />
werden. Der gesuchte Vorteil, das zielgenaue Auswerfen der gesuchten Forschungsdaten,<br />
wird in jedem Falle auch erreicht. Der Nachteil liegt allerdings darin,<br />
dass diese Metadaten nur im GFZ selbst bearbeitet werden können. Die externe maschinelle<br />
Verarbeitung ist durch die Einführung der besonderen Parameter blockiert.<br />
Der selbst geschaffene „extended DIF“-Standard hat die Verwaltung der Daten und die Arbeitsabläufe<br />
im Daten- und Rechenzentrum inzwischen in einem solchen Maße strukturiert,<br />
dass eine Rücknahme oder Migration der die Forschungsdaten auf der untersten Ebene beschreibenden<br />
Metadaten in einen anderen Standard – DIF 9.0 eingeschlossen – nur für den<br />
Preis eines unverhältnismässig hohen Aufwandes möglich erscheint.<br />
50 Vgl. das Beispiel einer Erfassung <strong>als</strong> „extended DIF“ im Anhang.
4. Schlussfolgerungen<br />
Das in der Nutzung von Metadaten verborgene große Potential zur Strukturierung wachsender<br />
Datenmengen und Informationsströme wird gegenwärtig bei weitem nicht ausgeschöpft. In<br />
verkürzter Perspektive kann gesagt werden, dass erst dann, wenn der „Leidensdruck“ groß<br />
genug ist, wenn Behinderungen in der Kommunikation, Daten- und ökonomische Verluste<br />
eingetreten sind, die Beschäftigung mit Metadatenkonzepten beginnt. Gegenwärtig sind daher<br />
in erster Linie Insellösungen anzutreffen, die langsam mit Hilfe übergreifender Standards angeglichen<br />
werden und somit Kommunikationsfähigkeit erlangen.<br />
Die Entwicklung von adäquaten Metadatenkonzepten wird von mehreren Seiten behindert:<br />
a) Ineffiziente Entscheidungsprozesse bestätigen zwar die Notwendigkeit der Erstellung<br />
und Vorhaltung von Daten, nicht aber die analoge Erstellung und Vorhaltung<br />
von Metadaten.<br />
b) Damit im Zusammenhang stehend verzögert mangelndes wissenschaftliches 51 und<br />
administratives Interesse die Entwicklung inhaltsadäquater Metadatenstandards.<br />
c) Für die Erstellung von Metadaten schaffen sich Institutionen, Gremien, Projekte<br />
etc. für ihren eigenen Machtbereich eigene Standards. Ein Anschluss an andere<br />
Standards wird oft <strong>als</strong> Herabsetzung der eigenen Bedeutung wahrgenommen. 52<br />
Sicher ist, dass aktiv angewendete Standards gleich „korrespondierenden Röhren“ Datenströme<br />
modifizieren und lenken, dass sie deren Richtung und die Art der abgerufenen Daten ändern<br />
und die Geschwindigkeit des Informationsaustausches zu erhöhen vermögen. Das heisst,<br />
wo bisher aufgrund einer „Insellösung“ mit nur wenigen Anfragen gerechnet werden musste<br />
kann nach Umstellung auf einen anerkannten Standard das Datenaustauschvolumen erheblich<br />
anwachsen, was wiederum erhöhte Anforderungen an die Qualität und kontinuierliche Pflege<br />
der Metadaten stellt und die Bereitstellung materieller wie personeller Ressourcen verlangt.<br />
In der Implementierung eines Metadatenstandards stellt sich das Problem, dass je umfassender<br />
ein Standard bzw. eine Norm zu sein versucht, desto beliebiger auch der Inhalt der erfass-<br />
51 Exemplarisch: Markus Lusti, Data Warehousing und Data Mining. Eine Einführung in entscheidungsunterstützende<br />
Systeme, zweite, überarbeitete und erweiterte Auflage, Berlin u. a. 2002, behandelt in einem 444 Seiten<br />
umfassenden Werk die Rolle von Metadaten auf lediglich drei Seiten, und das unter ausschließlich technischem<br />
Blickwinkel. Vgl. ebenda, S. 194-196.<br />
52 Die darüberhinaus allgemein festzustellende profilneurotische Angewohnheit, ständig neue Bezeichnungen<br />
und Abkürzungen zu kreieren – und dies in der Regel ohne Verweis auf institutionelle Abhängigkeiten bzw.<br />
Verflechtungen –, trägt nicht zur Übersichtlichkeit des Wissenschaftsgebietes insgesamt bei.
Schlussfolgerungen 29<br />
ten Metadaten sein wird. Soll <strong>als</strong>o – sofern keine Bindung an administrative Vorgaben besteht<br />
– dem im Wissenschaftsgebiet am weitesten verbreiteten oder dem inhaltsadäquatesten Stan-<br />
dard der Vorzug gegeben werden? Allgemein hat die Zwecksetzung der zu kreierenden Meta-<br />
daten maßgeblich für die Auswahl des Standards zu sein. Sollen die Metadaten vor allem zur<br />
Ermöglichung bzw. Erleichterung des Datenaustausches dienen wäre dem verbreitetsten Format<br />
der Vorzug zu geben. Wenn jedoch in erster Linie eine Präsentation eigener Projekte intendiert<br />
ist wird der inhaltsadäquatere Standard diesen Zweck besser erfüllen. Die Frage der<br />
Handhabbarkeit des jeweiligen Standards wird in diesen Überlegungen erst dann relevant,<br />
wenn ein eigentlich zu wählender Standard nicht erfüllbare Anforderungen an die Bearbeiter<br />
bzw. die Institution stellt.<br />
Die Untersuchung hat gezeigt, dass das Directory Interchange Format in der Version 9.0 im<br />
direkten Vergleich mit anderen zur Auswahl stehenden Standards hinsichtlich Inhaltsadäquatheit,<br />
allgemeiner Verbreitung, Handhabbarkeit und zu erzielender Publizität die „erste Wahl“<br />
für die Erstellung geowissenschaftlicher Metadaten im GeoForschungsZentrum Potsdam darstellt.<br />
Für seinen perspektivischen Bestand ist zudem bedeutsam, dass mit der NASA bzw.<br />
dem CEOS über eine große „Marktmacht“ verfügende Institutionen diesen Standard favorisieren<br />
und weiterentwickeln. Unter Einbeziehung des Global Change Master Directory ist es in<br />
der Vergangenheit gelungen, einen ein zielgenaues Retrieval erlaubenden, stark abgegrenzten<br />
homogenen Datenraum zu bilden. Vorrangig für Zwecke der Erfassung von Geo-Metadaten<br />
geschaffene Standards wie CSDGM und GeoMis.Bund stellen unter inhaltlichen Gesichtspunkten<br />
keine ernsthafte Konkurrenz resp. Alternative zu DIF dar.<br />
Eine Entscheidung für DIF bedeutet jedoch auch eine eindeutige Bindung an dieses Format,<br />
dessen Inhalte sich – jenseits eingehaltener ISO-Mindestanforderungen – wegen seiner strengen,<br />
an ein kontrolliertes Vokabular gebundenen Ausformung nur schwer in andere Formate<br />
übertragen lassen.<br />
Für eine einheitliche Darstellung, Publizität und Zugänglichkeit der Datenbestände des Geo-<br />
ForschungsZentrums Potsdam werden unter Zugrundelegung des vorab festgestellten folgende<br />
Maßnahmen empfohlen: 53<br />
1. Alle laufenden und abgeschlossenen Projekte des GFZ sowie vom GFZ datentech-<br />
nisch verwaltete internationale Projekte 54 sind obligatorisch mittels jeweils eines<br />
53<br />
Vgl. auch „In der Umsetzung befindliches allgemeines Metadatenschema des GeoForschungsZentrums Potsdam“<br />
im Anhang.
Schlussfolgerungen 30<br />
DIF’s im aktuellen DIF-Standard 9.0 zu beschreiben. Die so entstehende Daten-<br />
bank ist auf der Website des GFZ an hervorragender Stelle zu plazieren oder ein<br />
vorkonfigurierter Link zum Global Change Master Directory anzubieten, bei dem<br />
die Projekte anzumelden sind. Gleichfalls hat ein Link auf jeder Projekt-Website<br />
auf diese Metadatenbasis zu verweisen.<br />
2. Parallel zur Anmeldung beim GCMD sind alle Projekte beim Göttinger Geo-Guide<br />
anzumelden und die bei der Anmeldung generierten Metadaten im Dublin Core-<br />
Format für den Quelltext der jeweiligen Projekt-Webseite zu übernehmen.<br />
3. Sofern innerhalb der Projekte umfangreiche qualitativ unterschiedliche Datensätze<br />
bestehen sollten diese mittels eigener „child DIF’s“ beschrieben und gleichfalls<br />
beim GCMD angemeldet werden.<br />
4. Die Beschreibung des GFZ im GCMD ist zu aktualisieren.<br />
5. Eine wesentliche Änderung in der Erfassung der „extended-DIF’s“ auf der untersten<br />
Metadatenebene ist aus Gründen der Wahrung der Einheitlichkeit der Datenbestände<br />
nicht anzustreben. Hinzuzufügen ist lediglich der Verweis auf die nunmehr<br />
bestehenden „parent-DIF’s“ der nächsthöheren Metadatenebene.<br />
6. Sämtliche intern und extern zugänglichen Datenbestände des GFZ sind unter einer<br />
einheitlichen Oberfläche im zu schaffenden Metadatenserver zu vereinigen.<br />
7. Zur Überwindung der bisherigen Sprunghaftigkeit in der Bearbeitung und zur Herstellung<br />
einer dauerhaften Publizität auf hohem Niveau ist ein Mitarbeiter allein<br />
mit dem Aufbau und der Pflege der Metadaten bzw. ihrer Strukturierung sowie mit<br />
der Erhöhung der Publizität der Datenbestände zu beauftragen („Metadatenbeauftragter“).<br />
Eine Übernahme dieser Aufgabe durch die Wissenschaftler selbst bzw.<br />
die Beschäftigten des Daten- und Rechenzentrums „nebenbei“ scheidet aufgrund<br />
der Spezifik des Aufgabenfeldes und seiner permanenten Modifizierung aus.<br />
Die Durchsetzung dieser Maßnahmen liegt zu einem großen Teil nicht im Ermessen des Daten-<br />
und Rechenzentrums selbst. Eindeutige Weisungen seitens der Leitung des GFZ erweisen<br />
sich daher <strong>als</strong> notwendig.<br />
54 Z. B. das Global Geodynamic Project (GGP), .
Inhalt:<br />
5. Anhang<br />
5.1. Dokumente und Übersichten<br />
Eingangsbildschirm des Global Change Master Directory.............................................32<br />
Eingabemaske zur online-Erstellung von DIF’s im Global Change Master Directory...33<br />
DIF fields in derVersion 9.0............................................................................................34<br />
DIF Template (text version)............................................................................................35<br />
Directory Interchange Format 9.0 in XML-Darstellung (DTD) .....................................38<br />
Beschreibung einer Daten-Datei durch ein extended DIF im GFZ Potsdam..................44<br />
Beschreibung eines Datensatzes durch ein DIF in der Version 9.0 im GFZ Potsdam....47<br />
Beschreibung eines Schwerpunktprojektes durch ein DIF in der Version 9.0 im<br />
GFZ Potsdam...................................................................................................................51<br />
In der Umsetzung befindliches allgemeines Metadatenschema des<br />
GeoForschungsZentrums Potsdam..................................................................................55
Eingangsbildschirm des Global Change Master Directory<br />
Anhang 32
Anhang 33<br />
Eingabemaske zur online-Erstellung von DIF’s im Global Change Master Directory 55<br />
55 Erreichbar unter bzw.<br />
.
DIF fields in derVersion 9.0<br />
Anhang 34<br />
Anmerkungen 56 Abweichungen der Versionen<br />
7 und 8 57<br />
Entry ID required Benennung: Directory Entry<br />
Identifier<br />
Entry Title required Benennung: Directory Entry<br />
Title<br />
Science Keywords required, valids list Benennung: Parameters<br />
ISO Topic Category required, valids list nicht enthalten<br />
Data Center required, valids list<br />
Summary required<br />
Personnel optional field<br />
Data Set Citation optional field<br />
Instrument optional field, valids list Benennung: Sensor Name<br />
Platform optional field, valids list Benennung: Source Name<br />
Temporal Coverage optional field<br />
Paleo-Temporal Coverage optional field<br />
Data Set Progress optional field, (valids list)<br />
Spatial Coverage optional field<br />
Location optional field, valids list<br />
Data Resolution optional field<br />
Project optional field, valids list<br />
Keyword optional field<br />
Quality optional field<br />
Access Constraints optional field<br />
Use Constraints optional field<br />
Data Set Language optional field<br />
Originating Center optional field<br />
Distribution optional field<br />
Multimedia Sample optional field<br />
Reference optional field<br />
Discipline optional field<br />
Related URL optional field, valids list<br />
Parent DIF optional field<br />
Metadata_Name optional field, valids list nicht enthalten<br />
Metadata_Version optional field, valids list nicht enthalten<br />
IDN Node optional field, valids list<br />
DIF Creation Date optional field<br />
Last DIF Revision Date optional field<br />
DIF Revision History optional field<br />
Future DIF Review Date optional field<br />
56<br />
Der Standard sieht auch eine Begrenzung der jeweiligen Feldlänge vor. Diese bleibt hier unberücksichtigt.<br />
Vgl. .<br />
57<br />
Die Benennungen der Kategorien (fields) werden von der NASA selbst uneinheitlich gebraucht. Während auf<br />
der Startseite die aktuellen Bezeichnungen genutzt werden<br />
finden sich auf nachgeordneten Seiten immer noch synonyme ältere Benennungen (z. B. instrument <br />
sensor).
DIF Template (text version) 58<br />
Entry_ID:<br />
Entry_Title:<br />
Group: Data_Set_Citation<br />
Dataset_Creator:<br />
Dataset_Title:<br />
Dataset_Series_Name:<br />
Dataset_Release_Date:<br />
Dataset_Release_Place:<br />
Dataset_Publisher:<br />
Version:<br />
Issue_Identification:<br />
Data_Presentation_Form:<br />
Other_Citation_Details:<br />
Online_Resource:<br />
End_Group<br />
Group: Personnel<br />
Role: [Personnel Role Valid]<br />
First_Name:<br />
Middle_Name:<br />
Last_Name:<br />
Email:<br />
Phone:<br />
FAX:<br />
Group: Contact_Address<br />
+Address:<br />
City:<br />
Province_Or_State:<br />
Postal_Code:<br />
Country:<br />
End_Group<br />
End_Group<br />
Discipline:<br />
Group: Parameters<br />
Category:<br />
Topic:<br />
Term:<br />
Variable:<br />
Detailed_Variable:<br />
End_Group<br />
ISO_Topic_Category:<br />
Keyword:<br />
Sensor_Name:<br />
Source_Name:<br />
Anhang 35<br />
58 Quelle: . Einige Gruppen bzw. Felder innerhalb<br />
einer Gruppe können zur Darstellung differierender Angaben wiederholt werden.
Group: Temporal_Coverage<br />
Start_Date:<br />
Stop_Date:<br />
End_Group<br />
Group: Paleo_Temporal_Coverage<br />
Paleo_Start_Date:<br />
Paleo_Stop_Date:<br />
Chronostratigraphic_Unit:<br />
End_Group<br />
Data_Set_Progress:<br />
Group: Spatial_Coverage<br />
Southernmost_Latitude:<br />
Northernmost_Latitude:<br />
Westernmost_Longitude:<br />
Easternmost_Longitude:<br />
Minimum_Altitude:<br />
Maximum_Altitude:<br />
Minimum_Depth:<br />
Maximum_Depth:<br />
End_Group<br />
Location:<br />
Group: Data_Resolution<br />
Latitude_Resolution:<br />
Longitude_Resolution:<br />
Altitude_Resolution:<br />
Depth_Resolution:<br />
Temporal_Resolution:<br />
End_Group<br />
Project:<br />
Group: Quality<br />
[…]<br />
End_Group<br />
Group: Access_Constraints<br />
[…]<br />
End_Group<br />
Group: Use_Constraints<br />
[…]<br />
End_Group<br />
Data_Set_Language:<br />
Originating_Center:<br />
Group: Data_Center<br />
Data_Center_Name:<br />
Data_Center_URL:<br />
Data_Set_ID:<br />
Group: Personnel<br />
Role: [Personnel Role Valid]<br />
First_Name:<br />
Middle_Name:<br />
Last_Name:<br />
Email:<br />
Phone:<br />
Anhang 36
FAX:<br />
Group: Contact_Address<br />
+Address:<br />
City:<br />
Province_Or_State:<br />
Postal_Code:<br />
Country:<br />
End_Group<br />
End_Group<br />
Group: Distribution<br />
Distribution_Media:<br />
Distribution_Size:<br />
Distribution_Format:<br />
Fees:<br />
End_Group<br />
Group: Multimedia_Sample<br />
File:<br />
URL:<br />
Format:<br />
Caption:<br />
Group: Description<br />
[…]<br />
End_Group<br />
End_Group<br />
Group: Reference<br />
[…]<br />
End_Group<br />
Group: Summary<br />
[…]<br />
End_Group<br />
Group: Related_URL<br />
URL_Content_Type:<br />
URL:<br />
Group: Description<br />
[…]<br />
End_Group<br />
End_Group<br />
Parent_DIF:<br />
Metadata_Name:<br />
Metadata_Version:<br />
IDN_Node:<br />
DIF_Creation_Date:<br />
Last_DIF_Revision_Date:<br />
Group: DIF_Revision_History<br />
[…]<br />
End_Group<br />
Future_DIF_Review_Date:<br />
Anhang 37
Directory Interchange Format 9.0 in XML-Darstellung (DTD) 59<br />
<br />
Anhang 38<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
59 Quelle: .
<br />
<br />
<br />
<br />
<br />
<br />
<br />
Anhang 39<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
Anhang 40<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
Anhang 41<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
Anhang 42<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
Anhang 43<br />
<br />
<br />
<br />
<br />
<br />
Anhang 44<br />
Beschreibung einer Daten-Datei durch ein extended DIF im GFZ Potsdam (Bildschirmdarstellung)<br />
60<br />
CH-ME-2-PLP+2004-07-31_1<br />
Entry_ID: CH-ME-2-PLP+2004-07-31_1<br />
Entry_Title: Preprocessed Planar Langmuir Probe Data<br />
Sensor_Name: DIDM > Planar Langmuir Probe<br />
Keyword: particles<br />
> electric field<br />
Source_Name: CHAMP<br />
Project: CHAMP > German Minisatellite Mission for Geopotential and Atmospheric Research<br />
Data_Set_Progress: COMPLETE<br />
DIF_Revision_Date: 2004-08-03 12:12:43<br />
Storage_Medium: Hard Disc<br />
Storage_Medium: Tape<br />
Storage_Medium: CD-ROM<br />
Aggregated: No<br />
Originating_Center: GFZ Potsdam<br />
Group: Quality<br />
This data passed successfully the quality control procedure.<br />
End_Group<br />
Group: Access_Constraints<br />
For standard data-processing only<br />
End_Group<br />
Group: Use_Constraints<br />
For standard data-processing only<br />
End_Group<br />
Group: Data_Center<br />
Data_Center_Name: CHAMP-ISDC > CHAMP Information System and Data Center<br />
Data_Center_URL: http://www.gfz-potsdam.de<br />
Data_Set_ID: CH-ME-2-PLP<br />
Group: Data_Center_Contact<br />
First_Name: Joachim<br />
Last_Name: Wächter<br />
Email: INTERNET > wae@gfz-potsdam.de<br />
Phone: 049-331-288-1680<br />
Phone: FAX 049-331-288-1703<br />
Group: Address<br />
Joachim Wächter<br />
DRZ<br />
GFZ Potsdam<br />
Telegrafenberg<br />
14473 Potsdam<br />
End_Group<br />
End_Group<br />
End_Group<br />
Group: Investigator<br />
First_Name: Hermann<br />
Last_Name: Lühr<br />
Email: INTERNET > hluehr@gfz-potsdam.de<br />
Phone: 049-331-288-1270<br />
Phone: FAX 049-331-288-1235<br />
Group: Address<br />
Prof. <strong>Dr</strong>. Hermann Lühr<br />
GFZ Potsdam<br />
Telegrafenberg<br />
D-14473 Potsdam<br />
End_Group<br />
End_Group<br />
Group: Technical_Contact<br />
60 Abrufbar unter < http://isdc.gfz-potsdam.de/champ/> nach vorheriger bestätigter Anmeldung.
First_Name: Wolfgang<br />
Last_Name: Mai<br />
Email: INTERNET > wepmai@gfz-potsdam.de<br />
Phone: 049-331-288-1238<br />
Phone: FAX 049-331-288-1235<br />
Group: Adress<br />
Wolfgang Mai<br />
GFZ Potsdam<br />
Telegrafenberg<br />
D-14473 Potsdam<br />
End_Group<br />
End_Group<br />
Group: DIF_Author<br />
First_Name: Wolfgang<br />
Last_Name: Mai<br />
Email: INTERNET > wepmai@gfz-potsdam.de<br />
Phone: 049-331-288-1238<br />
Phone: FAX 049-331-288-1235<br />
Group: Address<br />
Wolfgang Mai<br />
GFZ Potsdam<br />
Telegrafenberg<br />
D-14473 Potsdam<br />
End_Group<br />
End_Group<br />
Group: Distribution<br />
Distribution_Media: electronic<br />
Distribution_Size: 450041<br />
Byte<br />
Distribution_Format: ASCII<br />
End_Group<br />
Group: Data_Set_Citation<br />
Originator: Mai, Wolfgang<br />
Title: CH-ME-2-PLP<br />
Publication_Date: 2004-08-03<br />
Publication_Place: Potsdam, Germany<br />
Edition: 2<br />
Publisher: GFZ Potsdam, Div. 2.3<br />
Data_Presentation_Form: digital timeseries<br />
URL: http://isdc.gfz-potsdam.de/champ/CH-ME-2-PLP<br />
End_Group<br />
Group: Parameters<br />
Category: EARTH SCIENCE<br />
Topic: SOLID EARTH<br />
Term: GEOPHYSICAL<br />
FIELDS<br />
Variable: ELECTRIC FIELD<br />
End_Group<br />
Group: Parameters<br />
Category: CHAMP-ISDC<br />
Variable: datetime<br />
Topic: start date<br />
Term: 2004-07-31 00:00:5.000<br />
End_Group<br />
Group: Parameters<br />
Category: CHAMP-ISDC<br />
Variable: datetime<br />
Topic: stop date<br />
Term: 2004-07-31 23:59:50.000<br />
End_Group<br />
Group: Parameters<br />
Category: CHAMP-ISDC<br />
Topic: delta-t<br />
Term: 15<br />
Variable: real<br />
End_Group<br />
Group: Parameters<br />
Category: CHAMP-ISDC<br />
Topic: operation mode<br />
Term: PLP<br />
Variable: varchar(3)<br />
End_Group<br />
Anhang 45
Group: Parameters<br />
Category: CHAMP-ISDC<br />
Topic: accuracy<br />
Term: 3<br />
Variable: real<br />
End_Group<br />
Group: Parameters<br />
Category: CHAMP-ISDC<br />
Topic: mission<br />
Term: CHAMP<br />
Variable: varchar(5)<br />
End_Group<br />
Group: Parameters<br />
Category: CHAMP-ISDC<br />
Topic: satellite ID<br />
Term: 0003902<br />
Variable: varchar(7)<br />
End_Group<br />
Group: Parameters<br />
Category: CHAMP-ISDC<br />
Topic: processing facility<br />
Term: GFZ<br />
Variable: varchar(3)<br />
End_Group<br />
Group: Parameters<br />
Category: CHAMP-ISDC<br />
Topic: generation date<br />
Term: 2004-08-03<br />
12:12:43<br />
Variable: datetime<br />
End_Group<br />
Group: Parameters<br />
Category: CHAMP-ISDC<br />
Topic: software package<br />
Term: PROCPLP<br />
2002-05-13<br />
Variable: varchar(80)<br />
End_Group<br />
Group: Parameters<br />
Category: CHAMP-ISDC<br />
Topic: revision<br />
Term: 1<br />
Variable: int<br />
End_Group<br />
Group: Parameters<br />
Category: CHAMP-ISDC<br />
Topic: data access<br />
Term: public<br />
Variable: varchar(20)<br />
End_Group<br />
Group: Summary<br />
Product is derived from CHAMP PLP<br />
End_Group<br />
Parent_DIF: 61 CH-ME-2-PLP<br />
Anhang 46<br />
61 Das Feld „Parent DIF“ ist gegenwärtig noch nicht enthalten, sollte aber nach der Installierung der Metadaten<br />
auf der nächsthöheren Ebene (Beschreibung des Datensatzes) ergänzt werden.
Anhang 47<br />
Beschreibung eines Datensatzes durch ein DIF in der Version 9.0 im GFZ Potsdam<br />
(Vorschlag) 62<br />
Entry_ID: CH-ME-2-PLP<br />
Entry_Title: CHAMP – Preprocessed Planar Langmuir Probe Data<br />
Group: Parameters<br />
Category: Earth Science<br />
Topic: Sun-earth Interactions<br />
Term: Ionosphere/Magnetosphere Particles<br />
Variable: Particle Density<br />
End_Group<br />
ISO_Topic_Category: geoscientificinformation<br />
Group: Data_Center<br />
Data_Center_Name: DE/GFZ > Geo Research Center Potsdam, Germany<br />
Data_Center_URL: http://dcc.gfz-potsdam.de/<br />
Data_Set_ID: CH-ME-2-PLP > Preprocessed Planar Langmuir Probe Data<br />
Group: Personnel<br />
Role: Data Center Contact<br />
First_Name: Bernd<br />
Middle_Name:<br />
Last_Name: Ritschel<br />
Email: rit@gfz-potsdam.de<br />
Phone: +49-(331)-288-1685<br />
FAX: +49-(331)-288-1703<br />
Group: Contact_Address<br />
Address: GeoForschungsZentrum Potsdam, Telegrafenberg<br />
City: Potsdam<br />
Province_Or_State: Brandenburg<br />
Postal_Code: 14473<br />
Country: Germany<br />
End_Group<br />
End_Group<br />
End_Group<br />
Group: Summary<br />
End_Group<br />
Group: Personnel<br />
Role: Investigator<br />
First_Name: Hermann<br />
Middle_Name:<br />
Last_Name: Luehr<br />
Email: hluehr@gfz-potsdam.de<br />
Electron density record by Planar Langmuir Probe onboard the<br />
CHAMP satellite.<br />
62 Bei linksseitig rot markierten Kategorien handelt es sich um required fields. Es werden nicht alle optional<br />
fields genutzt. Nicht genutzte Zeilen innerhalb einzelner groups wurden nicht gelöscht.
Phone: +49-331-288-1270<br />
FAX: +49-331-288-1235<br />
Group: Contact_Address<br />
Address: GFZ Potsdam, Div. 1, Telegrafenberg<br />
City: Potsdam<br />
Province_Or_State:<br />
Postal_Code: 14473<br />
Country: Germany<br />
End_Group<br />
End_Group<br />
Group: Personnel<br />
Role: Technical Contact<br />
First_Name: Wolfgang<br />
Middle_Name:<br />
Last_Name: Mai<br />
Email: wepmai@gfz-potsdam.de<br />
Phone: +49-331-288-1238<br />
FAX: +49-331-288-1235<br />
Group: Contact_Address<br />
Address: GFZ Potsdam, Div. 1, Telegrafenberg<br />
City: Potsdam<br />
Province_Or_State:<br />
Postal_Code: 14473<br />
Country: Germany<br />
End_Group<br />
End_Group<br />
Anhang 48<br />
Group: Personnel<br />
Role: DIF Author<br />
First_Name: Bernd<br />
Middle_Name:<br />
Last_Name: Ritschel<br />
Email: rit@gfz-potsdam.de<br />
Phone: +49-(331)-288-1685<br />
FAX: +49-(331)-288-1703<br />
Group: Contact_Address<br />
Address: GeoForschungsZentrum Potsdam, Telegrafenberg<br />
City: Potsdam<br />
Province_Or_State: Brandenburg<br />
Postal_Code: 14473<br />
Country: Germany<br />
End_Group<br />
Group: Personnel<br />
Role: DIF Author<br />
First_Name: Wolfgang<br />
Middle_Name:<br />
Last_Name: Mai<br />
Email: wepmai@gfz-potsdam.de<br />
Phone: +49-331-288-1238<br />
FAX: +49-331-288-1235<br />
Group: Contact_Address<br />
Address: GFZ Potsdam, Div. 1, Telegrafenberg<br />
City: Potsdam<br />
Province_Or_State:
Postal_Code: 14473<br />
Country: Germany<br />
End_Group<br />
Anhang 49<br />
Group: Data_Set_Citation<br />
Dataset_Creator:<br />
Wolfgang Mai<br />
Dataset_Title: Preprocessed Planar Langmuir Probe Data<br />
Dataset_Series_Name: GFZ CHAMP-ISDC<br />
Dataset_Release_Date: 2001-<br />
Dataset_Release_Place: Potsdam<br />
Dataset_Publisher:<br />
Version:<br />
Issue_Identification:<br />
GFZ Potsdam/Data Center<br />
Data_Presentation_Form:<br />
Other_Citation_Details:<br />
Table<br />
Online_Resource:<br />
End_Group<br />
http://isdc.gfz-potsdam.de/champ/<br />
Sensor_Name: PLP > Planar Langmuir Probe<br />
Source_Name: CHAMP > Challenging Minisatellite Payload<br />
Group: Temporal_Coverage<br />
Start_Date: 2001-05-13<br />
Stop_Date:<br />
End_Group<br />
Data_Set_Progress: In Work<br />
Location:<br />
Ionosphere<br />
Project: CHAMP > Challenging Minisatellite Payload<br />
Keyword: particles > electric field<br />
Group: Quality<br />
End_Group<br />
Group: Access_Constraints<br />
End_Group<br />
Group: Use_Constraints<br />
End_Group<br />
Originating_Center: GFZ<br />
This data passed successfully the quality control procedure.<br />
According to the access permission of the user.<br />
Data may not be used for commercial applications.<br />
Group: Distribution<br />
Distribution_Media: Online (FTP) uncompressed<br />
Distribution_Size:<br />
Distribution_Format: ASCII<br />
Fees: [Preis in $] free<br />
End_group
Group: Multimedia_Sample<br />
File:<br />
URL: http://isdc.gfz-potsdam.de/champ/<br />
Format:<br />
Caption:<br />
Group: Description<br />
End_group<br />
End_group<br />
Anhang 50<br />
Discipline: Earth Science > Sun-earth Interactions > Ionosphere/Magnetosphere<br />
Particles - Particle Density<br />
Group: Related_URL<br />
URL_Content_Type: ASSOCIATED DATA SET(S)<br />
URL: http://isdc.gfz-potsdam.de/champ/<br />
Group: Description<br />
The CHAMP-Information System and Data Center (CHAMP-ISDC) is<br />
an independent but essential and integrated part of the whole Geo-<br />
ForschungsZentrum (GFZ) driven CHAMP satellite mission project.<br />
The CHAMP-ISDC applications are designed for the management of<br />
all - from CHAMP satellite raw data and ground-based devices derived<br />
and processed - geoscientific products. Each of these products<br />
exists as a couple of files consisting of a metadata and a data file.<br />
End_group<br />
End_group<br />
Parent_DIF: CHAMP_GFZ<br />
Metadata_Name: CEOS IDN DIF<br />
Metadata_Version: 9.0<br />
DIF_Creation_Date: 2004-08-20<br />
Last_DIF_Revision_Date: 2004-08-20
Anhang 51<br />
Beschreibung eines Schwerpunktprojektes durch ein DIF in der Version 9.0 im GFZ<br />
Potsdam (Vorschlag) 63<br />
Entry_ID: CHAMP<br />
Entry_Title: Challenging Minisatellite Payload (CHAMP) data at GFZ Potsdam<br />
Group: Parameters<br />
Category: Earth Science<br />
Topic: Sun-earth Interactions<br />
Term: Ionosphere/Magnetosphere Particles<br />
Variable: Particle Density<br />
Detailed_Variable:<br />
End_Group<br />
Group: Parameters<br />
Category: Earth Science<br />
Topic: SOLID EARTH<br />
Term: Geodetics/Gravity<br />
Variable: Gravitational Field<br />
Detailed_Variable:<br />
End_Group<br />
Group: Parameters<br />
Category: Earth Science<br />
Topic: SOLID EARTH<br />
Term: Geodetics/Gravity<br />
Variable: Satellite Orbits<br />
Detailed_Variable:<br />
End_Group<br />
ISO_Topic_Category: geoscientificinformation<br />
ISO_Topic_Category: climatologyMeteorologyAtmosphere<br />
Group: Data_Center<br />
Data_Center_Name: DE/GFZ > Geo Research Center Potsdam, Germany<br />
Data_Center_URL: http://dcc.gfz-potsdam.de/<br />
Data_Set_ID: CHAMP > Challenging Minisatellite Payload<br />
Group: Personnel<br />
Role: Data Center Contact<br />
First_Name: Bernd<br />
Middle_Name:<br />
Last_Name: Ritschel<br />
Email: rit@gfz-potsdam.de<br />
Phone: +49-(331)-288-1685<br />
FAX: +49-(331)-288-1703<br />
Group: Contact_Address<br />
Address: GeoForschungsZentrum Potsdam, Telegrafenberg<br />
City: Potsdam<br />
Province_Or_State: Brandenburg<br />
Postal_Code: 14474<br />
63 Bei linksseitig rot markierten Kategorien handelt es sich um required fields. Es werden nicht alle optional<br />
fields genutzt. Nicht genutzte Zeilen innerhalb einzelner groups wurden nicht gelöscht.
Country: Germany<br />
End_Group<br />
End_Group<br />
End_Group<br />
Group: Summary<br />
End_Group<br />
Anhang 52<br />
CHAMP (CHAllenging Minisatellite Payload) is a German small satellite<br />
mission for geoscientific and atmospheric research and applications,<br />
managed by GFZ. With its highly precise, multifunctional and complementary<br />
payload elements (magnetometer, accelerometer, star sensor,<br />
GPS receiver, laser retro reflector, ion drift meter) and its orbit characteristics<br />
(near polar, low altitude, long duration) CHAMP will generate<br />
for the first time simultaneously highly precise gravity and magnetic<br />
field measurements over a 5 years period. This will allow to detect besides<br />
the spatial variations of both fields <strong>als</strong>o their variability with time.<br />
The CHAMP mission will open a new era in geopotential research and<br />
will become a significant contributor to the Decade of Geopotenti<strong>als</strong>. In<br />
addition with the radio occultation measurements onboard the spacecraft<br />
and the infrastructure developed on ground, CHAMP will become<br />
a pilot mission for the pre-operational use of space-borne GPS observations<br />
for atmospheric and ionospheric research and applications in<br />
weather prediction and space weather monitoring.<br />
Group: Personnel<br />
Role: Investigator<br />
First_Name: Christoph<br />
Middle_Name:<br />
Last_Name: Reigber<br />
Email: reigber@gfz-potsdam.de<br />
Phone: +49-331288-1100<br />
FAX: +49-331288-1111<br />
Group: Contact_Address<br />
Address: GFZ Potsdam, Div. 1, Telegrafenberg<br />
City: Potsdam<br />
Province_Or_State:<br />
Postal_Code: 14473<br />
Country: Germany<br />
End_Group<br />
End_Group<br />
Group: Personnel<br />
Role: DIF Author<br />
First_Name: Bernd<br />
Middle_Name:<br />
Last_Name: Ritschel<br />
Email: rit@gfz-potsdam.de<br />
Phone: +49-(331)-288-1685<br />
FAX: +49-(331)-288-1703<br />
Group: Contact_Address<br />
Address: GeoForschungsZentrum Potsdam, Telegrafenberg<br />
City: Potsdam<br />
Province_Or_State: Brandenburg<br />
Postal_Code: 14474<br />
Country: Germany<br />
End_Group
Anhang 53<br />
Source_Name: CHAMP > Challenging Minisatellite Payload<br />
Group: Temporal_Coverage<br />
Start_Date: 2000-07-01<br />
Stop_Date:<br />
End_Group<br />
Data_Set_Progress: In Work<br />
Location:<br />
Ionosphere<br />
Project: CHAMP > Challenging Minisatellite Payload<br />
Group: Quality<br />
End_Group<br />
Group: Access_Constraints<br />
End_Group<br />
Group: Use_Constraints<br />
End_Group<br />
Originating_Center: GFZ<br />
The project contains data in all quality levels.<br />
According to the access permission of the user.<br />
Data may not be used for commercial applications.<br />
Group: Multimedia_Sample<br />
File:<br />
URL: http://isdc.gfz-potsdam.de/champ/<br />
Format:<br />
Caption:<br />
Group: Description<br />
End_group<br />
End_group<br />
Group: Reference<br />
End_Group<br />
http://op.gfz-potsdam.de/champ/more/index_MORE.html<br />
Group: Related_URL<br />
URL_Content_Type: ASSOCIATED DATA SET(S)<br />
URL: http://isdc.gfz-potsdam.de/champ/<br />
Group: Description<br />
The CHAMP-Information System and Data Center (CHAMP-ISDC) is<br />
an independent but essential and integrated part of the whole GeoForschungsZentrum<br />
(GFZ) driven CHAMP satellite mission project. The<br />
CHAMP-ISDC applications are designed for the management of all -<br />
from CHAMP satellite raw data and ground-based devices derived and<br />
processed - geoscientific products. Each of these products exists as a<br />
couple of files consisting of a metadata and a data file.<br />
End_group<br />
End_group<br />
Parent_DIF: DE/GFZ
Metadata_Name: CEOS IDN DIF<br />
Metadata_Version: 9.0<br />
IDN_Node:<br />
DIF_Creation_Date: 2004-08-20<br />
Last_DIF_Revision_Date: 2004-08-20<br />
Anhang 54
In der Umsetzung befindliches allgemeines 64 Metadatenschema des GeoForschungsZentrums Potsdam<br />
Anhang 55<br />
GFZ ---------> Projekte ---------> Datensätze ("Produkttypen") ---------> Daten ("Produkte")<br />
DIF 9.0 DIF 9.0 DIF 9.0 extended DIF<br />
1 mindestens 100 ca. 1.000 ca. 50-100 Mio 65<br />
im GCMD zu<br />
korrigieren<br />
im GCMD<br />
anzumelden<br />
im GCMD<br />
anzumelden<br />
interner Nutzung<br />
vorbehalten<br />
64 „Allgemein“ bedeutet in diesem Zusammenhang, dass das Daten- und Rechenzentrum versucht, diese Struktur an die Datenproduzenten heranzutragen. Das Daten- und Rechenzentrum<br />
verfügt über keinerlei Mittel zu deren Durchsetzung. Für kleinere Projekte ohne eigenen ISDC-Zugang ist die unterste Stufe (extended DIF) zudem gegenstandslos.<br />
65 Diese Zahl bezeichnet alle potentiell mit extended DIF’s beschreibbaren Daten im GFZ. Momentan bestehen etwa 10 Millionen extended DIF’s.
Anhang 56<br />
5.2. Quellen und Literatur 66<br />
An Image Map of the Content Standard for Digital Geospatial Metadata Version 2 - 1998<br />
(FGDC-STD-001 June 1998), .<br />
Bibliothek des Wissenschaftsparks Albert Einstein [Potsdam]; .<br />
Braune, Stephan u.a., Anwendungen ISO-19115-konformer Metadaten in Katalogsystemen<br />
aus dem Bereich umwelt- und geowissenschaftlicher Geofachdaten, in: Zeitschrift für Geologische<br />
Wissenschaften, Berlin, 31 (2003) 1, S. 37-44.<br />
Content Standard for Digital Geospatial Metadata. Metadata Ad Hoc Working Group – Federal<br />
Geographic Data Committee, Reston (Virginia) 1998,<br />
.<br />
CONTINENT - High-resolution CONTINENTal paleoclimate record in Lake Baikal,<br />
.<br />
Czegka, Wolfgang, Metadaten von Geo-Daten. Mit einem Fallstudie für Metadaten geowissenschaftlicher<br />
Geo-Daten nach ISO/TC 19115 am Beispiel des Katalogsystems des LGRB,<br />
Abschlussarbeit FH Potsdam 2001.<br />
Data Documentation Initiative, .<br />
Deutsche IDN-Einträge im DIF-Format – Abschlussbericht –, Manuskript, Weßling 1995.<br />
[Standort: UB/TIB Hannover]<br />
Dublin Core Metadata Initiative, .<br />
Engelhardt, Nicole, Das Clearinghouse System DBClear im Kontext aktueller Entwicklungslinien<br />
in der Fachinformationslandschaft, Abschlussarbeit FH Potsdam 2003.<br />
EuroGeographics, EuroMapFinder – Metadata,<br />
<br />
Federal Geographic Data Committee Metadata and Global Change Master Directory DIF for<br />
GLOBE, .<br />
Federal Geographic Data Committee, .<br />
GCMD – Global Change Master Directory. A directory of Earth science data and services,<br />
.<br />
GeoForschungsZentrum Potsdam in der Helmholtz-Gemeinschaft, .<br />
Geo-Guide, .<br />
GeoMIS.Bund – Geodatensuche, .<br />
GFZ Potsdam, Department 1, The CHAMP Mission, .<br />
GFZ Potsdam, Department 1, The GRACE Mission, <br />
66 Revisionsdatum sämtlicher Internetadressen: 31. Juli 2004.
Anhang 57<br />
Glatz, Stefan, Chancen und Probleme der Standardisierung von Metadaten am Beispiel des<br />
ISO-Standards 19115 (Geographic Information – Metadata), Abschlussarbeit FH Potsdam<br />
2003.<br />
Heyna, Arne, Marc Briede und Ulrich Schmidt, Datenformate im Medienbereich, Leipzig<br />
2003.<br />
Information vernetzen – Wissen aktivieren. Strategisches Positionspapier des Bundesministeriums<br />
für Bildung und Forschung zur Zukunft der wissenschaftlichen Information in Deutschland,<br />
Bonn 2002, .<br />
International Directory Network, .<br />
International Standard ISO 19115. First edition 2003-05-01. Geographic information – Metadata.<br />
Lenk, Martin, Metadaten in Deutschland und Europa: Der Aufbau der Geodateninfrastruktur<br />
des Bundes und der Länder (11. Mai 2004),<br />
<br />
Lusti, Markus, Data Warehousing und Data Mining. Eine Einführung in entscheidungsunterstützende<br />
Systeme, zweite, überarbeitete und erweiterte Auflage, Berlin u. a. 2002.<br />
Metadaten-Informationssystem für die Küstenforschung und das Küsteningenieurwesen,<br />
.<br />
Miller, Paul, Metadata for the masses, in: Ariadne. The Web Version, Issue 5, September<br />
1996, .<br />
NSDI [National Spatial Data Infrastructure], .<br />
Piepel, Carsten, Datenhaltung und Datenzugriff für interoperable Geodatenkataloge, Diplomarbeit<br />
Münster 2001, .<br />
Ritschel, Bernd u. a., CHAMP-ISDC – Informationssystem und Datenzentrum für geowissenschaftliche<br />
Produkte des CHAMP-Satellitenprojekts, in: Zeitschrift für Geologische Wissenschaften,<br />
Berlin, 31 (2003) 1, S. 21-30.<br />
SEDAC – socioeconomic data and applications center, Metadata Overview,<br />
.<br />
The CERA Central Page, .<br />
The State of the GCMD - CY 2003, .<br />
Toussaint, Frank, Wissenschaftliches Datenmanagement. Das CERA-2 Daten- und Metadatenmodell,<br />
.<br />
Umweltdatenkatalog des Bundes und der Länder, .<br />
Zukunft der wissenschaftlichen und technischen Information in Deutschland. Schlussbericht.<br />
Erstellt im Auftrag des Bundesministeriums für Bildung und Forschung durch: Arthur D. Little<br />
GmbH und Gesellschaft für Innovationsforschung und Beratung mbH, Bonn 2002,<br />
.
Anhang 58<br />
5.3 Abkürzungen<br />
AWI Alfred-Wegener-Institut für Polar- und Meeresforschung<br />
CEOS Committee on Earth Observation Satellites<br />
CERA Climate and Environmental Data Retrieval and Archive System<br />
CHAMP Challenging Mini-Satellite Payload<br />
CSDGM Content Standard for Digital Geospatial Metadata<br />
DARA Deutsche Agentur für Raumfahrtangelegenheiten<br />
DC Dublin Core<br />
DDI Data Documentation Initiative<br />
DFD Deutsches Fernerkundungsdatenzentrum<br />
DIF Directory Interchange Format<br />
DKRZ Deutsches Klimarechenzentrum<br />
DLR Deutsche Forschungsanstalt für Luft- und Raumfahrt<br />
ESADS Earth Science and Applications Data Systems Workshop<br />
ESDI European Spatial Data Infrastructure<br />
ESSC Earth System Science Committee<br />
FGDC Federal Geographic Data Committee<br />
GASP Global Atmosphere Sounding Project<br />
GCMD Global Change Master Directory<br />
GeoMIS.Bund GeodatenMetaInformationsSystem des Bundes<br />
GeoPortal.Bund Geodatenportal des Bundes<br />
GGP Global Geodynamic Project<br />
GNSS Global Navigation Satellite System<br />
GRACE Gravity Recovery And Climate Experiment<br />
IDN International Directory Network<br />
INSPIRE Initiative Infrastructure for Spatial Information in Europe<br />
ISDC Information System and Data Center<br />
ISO International Organization for Standardization<br />
IWGDMGC Interagency Working Group on Data Management for Global Change<br />
NASA National Aeronautics and Space Administration<br />
NMD NASA's Master Directory<br />
NSDI National Spatial Data Infrastructure<br />
OAI-PMH Open Archives Initiative Protocol for Metadata Harvesting
PIK Potsdam-Institut für Klimafolgenforschung<br />
UDK Umweltdatenkatalog<br />
URL uniform resource locator<br />
XMI XML Metadata Interchange<br />
XML extensible markup language<br />
Anhang 59
Erklärung<br />
Ich erkläre, die Arbeit selbstständig und unter Verwendung keiner anderen <strong>als</strong> der angegebe-<br />
nen Quellen und Hilfsmittel angefertigt zu haben.<br />
Berlin, 20.08.2004