03.02.2013 Aufrufe

UMTHES in SKOS - innoQ Deutschland GmbH

UMTHES in SKOS - innoQ Deutschland GmbH

UMTHES in SKOS - innoQ Deutschland GmbH

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />

Editor:<br />

<strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong><br />

Modellierung und Serialisierung des Umweltthesaurus <strong>in</strong> e<strong>in</strong>er formalen Sprache des<br />

Semantic Web.<br />

Projekt:<br />

Spezifikation, mit OWL/RDFS Schema und komplexen Beispielen.<br />

Thomas Bandholtz (tb), <strong>in</strong>noQ <strong>Deutschland</strong> <strong>GmbH</strong><br />

Erweiterung von SNS … AZ …<br />

Auftraggeber:<br />

Verteiler:<br />

www.umweltbundesamt.de<br />

Willem van Kerkhof (wvk), <strong>in</strong>noQ <strong>Deutschland</strong> <strong>GmbH</strong><br />

Joachim Fock (fo), Umweltbundesamt <strong>Deutschland</strong><br />

Jens Wissmann (jw), Forschungszentrum Informatik (FZI)<br />

Versionen reviewed by:<br />

03 25. Mai 2009<br />

wvk fo jw<br />

V 03 Umweltbundesamt S. 1


SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />

Inhalt<br />

1 E<strong>in</strong>leitung ......................................................................................................................................... 3<br />

2 <strong>SKOS</strong> Architektur aus der Sicht von <strong>UMTHES</strong> ............................................................................... 6<br />

2.1 Concept und Label .................................................................................................................. 6<br />

2.2 Identität und Referenz ............................................................................................................. 9<br />

2.2.1 Aus Sicht der Migration ................................................................................................... 9<br />

2.2.2 Aus Sicht des URI Designs ........................................................................................... 10<br />

2.2.3 <strong>UMTHES</strong> Namensraum ................................................................................................. 10<br />

2.3 Semantische Beziehungen zwischen Concepts .................................................................... 10<br />

2.4 (Ke<strong>in</strong>e) Spezialisierung von skos:Concept ........................................................................... 11<br />

2.5 (Ke<strong>in</strong>e) Concept Collections .................................................................................................. 11<br />

2.6 Concept Scheme ................................................................................................................... 12<br />

2.7 Mapp<strong>in</strong>g Properties ............................................................................................................... 12<br />

3 Lexical Properties .......................................................................................................................... 15<br />

3.1 E<strong>in</strong>fache <strong>SKOS</strong> Eigenschaften .............................................................................................. 15<br />

3.1.1 Lexical Labels ................................................................................................................ 15<br />

3.1.2 Notation vs. Enumeration .............................................................................................. 15<br />

3.2 XL Labels ............................................................................................................................... 17<br />

3.2.1 Eigenschaften von skosxl:Label .................................................................................... 17<br />

3.2.2 Asymmetrische Mehrsprachigkeit .................................................................................. 20<br />

3.2.3 Koord<strong>in</strong>ation ................................................................................................................... 21<br />

4 Documentation Properties ............................................................................................................. 23<br />

4.1 <strong>SKOS</strong> Note Typenübersicht .................................................................................................. 23<br />

4.2 DCTERMS <strong>in</strong> Documentation Properties .............................................................................. 25<br />

4.3 Datentypen für <strong>UMTHES</strong> Notes ............................................................................................ 27<br />

4.3.1 Alle Texttypen ................................................................................................................ 27<br />

4.3.2 usageNote ..................................................................................................................... 27<br />

4.3.3 expirationNote ................................................................................................................ 28<br />

4.3.4 editorialState .................................................................................................................. 28<br />

4.3.5 exportNote ..................................................................................................................... 29<br />

5 <strong>UMTHES</strong> Entitäten <strong>in</strong> <strong>SKOS</strong>..........................................................................................30<br />

V 03 Umweltbundesamt S. 2


SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />

1 E<strong>in</strong>leitung<br />

Warum e<strong>in</strong> <strong>SKOS</strong> Schema für <strong>UMTHES</strong>, und zunächst e<strong>in</strong>mal, was ist <strong>SKOS</strong>?<br />

„Das Simple Knowledge Organisation System (<strong>SKOS</strong>, frei übersetzt „e<strong>in</strong>faches System zur<br />

Organisation von Wissen“) ist e<strong>in</strong>e auf dem Resource Description Framework basierende<br />

formale Sprache zur Kodierung von Dokumentationssprachen wie Thesauri, Klassifikationen<br />

oder andere kontrollierte Vokabulare. Mit <strong>SKOS</strong> soll die e<strong>in</strong>fache Veröffentlichung und<br />

Komb<strong>in</strong>ation kontrollierter, strukturierter und masch<strong>in</strong>enlesbarer Vokabulare für das<br />

Semantische Web ermöglicht werden.“ (Wikipedia).<br />

<strong>SKOS</strong> ist für uns zunächst die formale Sprache für e<strong>in</strong> Modell, das nicht viel mehr se<strong>in</strong> will<br />

als e<strong>in</strong> logisches Datenmodell für <strong>UMTHES</strong>. Diese Sprache gibt e<strong>in</strong> abstraktes Modell vor,<br />

mit dem wir die tatsächlichen Strukturen von <strong>UMTHES</strong> formal beschreiben (Schema). Mit<br />

Bezug auf dieses Schema kann jedes e<strong>in</strong>zelne Datenelement zutreffend und vollständig<br />

beschrieben werden.<br />

Bei dieser Modellierung von <strong>UMTHES</strong> geht es um drei Schwerpunkte:<br />

(1) Die abstrakten Modelle von <strong>UMTHES</strong> und <strong>SKOS</strong> s<strong>in</strong>d zwar ähnlich, erfordern aber<br />

e<strong>in</strong>en strukturellen (auch gedanklichen) Transformationsschritt (Kap. 2, <strong>SKOS</strong><br />

Architektur aus der Sicht von <strong>UMTHES</strong>).<br />

(2) Die <strong>in</strong> <strong>SKOS</strong> vordef<strong>in</strong>ierten lexikalischen Eigenschaften müssen und können für<br />

<strong>UMTHES</strong> erweitert werden (Kap.3, Lexical Properties).<br />

(3) <strong>SKOS</strong> ermöglicht e<strong>in</strong>e striktere Typisierung der Dokumentation (<strong>UMTHES</strong><br />

„Bemerkungen“), die optional genutzt werden kann (Kap. 4 Documentation<br />

Properties).<br />

Das Resource Description Framework (RDF) und die darauf aufbauenden formalen<br />

Sprachen (z.B. <strong>SKOS</strong>) verfügen darüberh<strong>in</strong>aus über e<strong>in</strong>e masch<strong>in</strong>enlesbare Syntax. Dies<br />

gilt sowohl für das Schema (die konkrete Architektur e<strong>in</strong>es Vokabulars) als auch für das<br />

Vokabular selbst. Daraus ergeben sich vielfältige Möglichkeiten der masch<strong>in</strong>ellen Nutzung.<br />

Im gegebenen Kontext wird die Masch<strong>in</strong>enlesbarkeit von RDF/<strong>SKOS</strong> zunächst im S<strong>in</strong>ne<br />

e<strong>in</strong>es Austauschformats genutzt. <strong>SKOS</strong> hat sich <strong>in</strong> der Europäischen Umweltterm<strong>in</strong>ologie<br />

seit 2004 <strong>in</strong> dieser Rolle etabliert, daher ist <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> schon für sich alle<strong>in</strong> e<strong>in</strong><br />

Dienst im S<strong>in</strong>ne der Datenbereitstellung.<br />

Der erste Migrationsschritt des Vorhabens ist e<strong>in</strong> Export der Quelldaten aus dem<br />

Bibliothekssystem <strong>in</strong> das hier beschriebene <strong>SKOS</strong> Format. Die geplante SNS Erweiterung<br />

wird aktuelle und künftige <strong>UMTHES</strong> Daten <strong>in</strong> genau demselben Format über Services<br />

bereitstellen. Daher ist das <strong>UMTHES</strong>/<strong>SKOS</strong> Schema e<strong>in</strong> strategischer Bauste<strong>in</strong> dieses<br />

Vorhabens, gleichermaßen für das Modell und die Implementierung der Schnittstellen.<br />

V 03 Umweltbundesamt S. 3


SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />

Die feste Adresse der <strong>SKOS</strong> Standardisierung ist:<br />

� <strong>SKOS</strong>: http://www.w3.org/2004/02/skos/<br />

Die hier verwendete <strong>SKOS</strong> Version ist die<br />

� <strong>SKOS</strong> Reference W3 Candidate Recommendation, 17 March 2009<br />

http://www.w3.org/TR/2009/CR-skos-reference-20090317/.<br />

Dazu gehört e<strong>in</strong>e lesenswerte E<strong>in</strong>führung für „Anfänger“:<br />

� <strong>SKOS</strong> Primer, Work<strong>in</strong>g Draft, 17 March 2009:<br />

http://www.w3.org/TR/2009/WD-skos-primer-20090317/<br />

Es kann se<strong>in</strong>, dass sich beim Übergang von der W3C Candidate Recommendation zur W3C<br />

Recommendation noch Änderungen ergeben, aber der Workflow des W3C löst <strong>in</strong> aller Regel<br />

die kritischen Fragen zuerst, daher s<strong>in</strong>d im abschließenden Schritt eher Detailklärungen zu<br />

erwarten. Diese werden gegebenenfalls <strong>in</strong> e<strong>in</strong>e neue Version dieses Konzepts e<strong>in</strong>gearbeitet.<br />

Für die Beispiele <strong>in</strong> den folgenden Kapiteln kommen mehrere gängige RDF/OWL Syntaxen<br />

<strong>in</strong> Frage 1 , zwei XML-Varianten, N3 oder Turtle. Die <strong>SKOS</strong> Spezifikation und der Primer<br />

verwenden die für Menschen am leichtesten lesbare Turtle Syntax, dies wird hier<br />

übernommen. Turtle schreibt die RDF Tripple etwa <strong>in</strong> nachstehender Weise (leicht<br />

vere<strong>in</strong>facht).<br />

Katze ist-e<strong>in</strong> Tier;<br />

frisst (Maus Fisch Gras);<br />

hasst Hund;<br />

hatBe<strong>in</strong>e 4;<br />

gehört Mensch.<br />

Hund ist-e<strong>in</strong> Tier;<br />

frisst (Wurst Chips Katze);<br />

hasst Katze;<br />

hatBe<strong>in</strong>e 4.<br />

gehört Mensch.<br />

Daraus folgt (mit e<strong>in</strong>igen zusätzlichen Annahmen):<br />

Mensch liebt (Katze Hund);<br />

braucht (Maus Fisch Gras Wurst Chips);<br />

beschützt Katze;<br />

hatBe<strong>in</strong>e 2.<br />

Wenn Sie das jetzt mitlesen konnten, haben Sie Turtle schon verstanden. Natürlich folgt<br />

Mensch hatBe<strong>in</strong>e 2 ke<strong>in</strong>esfalls aus dem zuvor gesagten. Auch die Katzenfreundlichkeit<br />

des Besitzers ist spekulativ, aber man kann sich an diese formale Ausdrucksweise<br />

gewöhnen.<br />

In RDF (und auch <strong>in</strong> der Turtle Syntax) werden die Bezeichner (wie „Katze“, „ist-e<strong>in</strong>“, „Tier“<br />

im obigen Beispiel) durch e<strong>in</strong> Präfix ihrem jeweiligen Namensraum zugeordnet. Beispiele:<br />

1 http://www.w3.org/TR/2009/WD-owl2-primer-20090421/#OWL_Syntaxes<br />

V 03 Umweltbundesamt S. 4


SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />

Beispiele Namensraum<br />

rdf:type ist <strong>in</strong> RDF def<strong>in</strong>iert<br />

rdfs:label ist <strong>in</strong> RDF Schema def<strong>in</strong>iert<br />

skos:Concept ist <strong>in</strong> <strong>SKOS</strong> def<strong>in</strong>iert<br />

skosxl:Label ist <strong>in</strong> der <strong>SKOS</strong> Extension for Labels def<strong>in</strong>ert<br />

dct:date ist als Dubl<strong>in</strong> Core Term def<strong>in</strong>iert<br />

umt:date<br />

umt:<strong>in</strong>flectional<br />

umt:useNarrower<br />

:abgas<br />

:00000456<br />

s<strong>in</strong>d <strong>in</strong> der <strong>SKOS</strong> Erweiterung durch <strong>UMTHES</strong> („umt:“) def<strong>in</strong>iert<br />

Leeres Präfix (nur Doppelpunkt) - s<strong>in</strong>d im lokalen Namensraum<br />

def<strong>in</strong>iert.<br />

Tabelle 1 Verwendete Namensraum – Präfixe <strong>in</strong> diesem Dokument<br />

V 03 Umweltbundesamt S. 5


SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />

2 <strong>SKOS</strong> Architektur aus der Sicht von <strong>UMTHES</strong><br />

<strong>UMTHES</strong> muss e<strong>in</strong> wenig Umdenken. Das grobe Modell von <strong>UMTHES</strong> lässt sich<br />

beschreiben als:<br />

{ Thesaurus [ Deskriptor, Nicht-Deskriptor] } { Wörterliste }<br />

Dagegen wirkt <strong>SKOS</strong> auf den ersten Blick vere<strong>in</strong>fachend:<br />

{ Concept } { Label }<br />

Dass <strong>SKOS</strong> nicht vere<strong>in</strong>facht sieht man, wenn man auch die Beziehungen zwischen diesen<br />

Elementen betrachtet.<br />

Abbildung 1 Strukturelle Unterschiede zwischen <strong>UMTHES</strong> und <strong>SKOS</strong><br />

2.1 Concept und Label<br />

Die Semantik von skos:Concept stimmt weitgehend mit der von Deskriptor übere<strong>in</strong>. Die<br />

Unterschiede rühren eher daher, dass es <strong>in</strong> <strong>SKOS</strong> ke<strong>in</strong>e entsprechend äquivalente Klasse<br />

für Nicht-Deskriptor gibt. Das Äquivalent zur USE Beziehung (skosxl:altLabel)<br />

verweist sozusagen direkt auf e<strong>in</strong> „Wort“ <strong>in</strong> der Wörterliste.<br />

V 03 Umweltbundesamt S. 6


SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />

Lexikalische Eigenschaften (siehe Kap. 3 Lexical Properties) der Worte werden nicht direkt<br />

im Concept beschrieben, sondern sie bilden e<strong>in</strong>e eigene Klasse (3.2 XL Labels). Diese<br />

entspricht grob den E<strong>in</strong>trägen <strong>in</strong> der <strong>UMTHES</strong> Wörterliste. E<strong>in</strong> solches Label ist per se weder<br />

Deskriptor noch Synonym oder E<strong>in</strong>zelbegriff usw., dies ergibt sich erst aus dem Vorliegen<br />

und dem Typ e<strong>in</strong>er Zuordnung zu e<strong>in</strong>em Concept (skosxl:preLabel,<br />

skosxl:altLabel, skosxl:hiddenLabel).<br />

Aus Sicht von <strong>UMTHES</strong> „fehlt“ <strong>in</strong> <strong>SKOS</strong> der Nicht-Deskriptor. Aber <strong>SKOS</strong> braucht ihn nicht,<br />

denn er ist lediglich die Fassade e<strong>in</strong>es Worts, ohne eigenständige Semantik. Diese Semantik<br />

liegt alle<strong>in</strong> <strong>in</strong> der Beziehung zum Deskriptor (Concept). <strong>SKOS</strong> stellt diese Beziehung direkt<br />

zum Wort (Label) her.<br />

:00000577 rdf:type skos:Concept;<br />

skosxl:prefLabel :abgasre<strong>in</strong>igung;<br />

skosxl:altLabel :abgasre<strong>in</strong>igungsanlage.<br />

:abgasre<strong>in</strong>igung rdf:type skosxl:Label;<br />

skosxl:lexicalForm „Abgasre<strong>in</strong>igung“@de.<br />

:abgasre<strong>in</strong>igungsanlage rdf:type skosxl:Label;<br />

skosxl:lexicalForm „Abgasre<strong>in</strong>igungsanlage“@de.<br />

Codebeispiel 1 USE Beziehung ohne Nicht-Deskriptor im <strong>SKOS</strong> Modell<br />

Labels werden durch die Art ihrer Verwendung klassifiziert, und nicht von vorn here<strong>in</strong>.<br />

� Nicht-Deskriptoren im S<strong>in</strong>ne von <strong>UMTHES</strong> s<strong>in</strong>d die Untermenge aller Wörter (Label),<br />

die wenigstens e<strong>in</strong>e altLabel, aber ke<strong>in</strong>e prefLabel Beziehung zu irgende<strong>in</strong>em<br />

Concept haben. Diese Untermenge lässt sich jederzeit masch<strong>in</strong>ell identifizieren, und<br />

<strong>SKOS</strong> hebt sie nicht durch e<strong>in</strong>e explizite Klasse hervor.<br />

� Ähnlich für <strong>UMTHES</strong> E<strong>in</strong>zelbegriffe: das s<strong>in</strong>d alle Labels, die ke<strong>in</strong>erlei direkte<br />

Beziehung zu irgende<strong>in</strong>em Concept haben.<br />

Nähere Festlegungen s<strong>in</strong>d möglich, bedürfen aber e<strong>in</strong>er (zulässigen) Erweiterung des <strong>SKOS</strong><br />

Modells.<br />

H<strong>in</strong>sichtlich dieser Architektur bef<strong>in</strong>det sich <strong>SKOS</strong> <strong>in</strong> Übere<strong>in</strong>stimmung mit der<br />

gegenwärtigen Aktualisierung des ISO Standards. Leonard Will berichtete am 13.02.2009 <strong>in</strong><br />

der öffentlichen <strong>SKOS</strong> Mail<strong>in</strong>gliste:<br />

“I write as Chair of the „Data Model<strong>in</strong>g, Exchange Formats and Protocols‟ subgroup of the<br />

ISO work<strong>in</strong>g group SC9WG8/Project 25964, currently revis<strong>in</strong>g the ISO standard for thesauri<br />

for <strong>in</strong>formation retrieval, but as these standards are still <strong>in</strong> draft form anyth<strong>in</strong>g I say here is<br />

my own <strong>in</strong>terpretation of the way we are go<strong>in</strong>g, and is not authoritative”. … “The ISO model<br />

is firmly based on relationships between concepts, not terms. Terms are used as labels for<br />

concepts, as <strong>in</strong> <strong>SKOS</strong>”. 2<br />

2 http://lists.w3.org/Archives/Public/public-esw-thes/2009Feb/0033.html<br />

V 03 Umweltbundesamt S. 7


SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />

Abbildung 2 ISO UML Modell (draft) work<strong>in</strong>g group SC9WG8/Project 25964<br />

V 03 Umweltbundesamt S. 8


SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />

Die Anlage enthält e<strong>in</strong> UML Diagramm (Abbildung 2), <strong>in</strong> dem dies detailliert wird. Die<br />

Modellierung ist sehr ähnlich wie <strong>in</strong> <strong>SKOS</strong>, die Äquivalenzbeziehungen preferred und nonpreferred<br />

term verlaufen zwischen ThesaurusConcept und ThesaurusTerm, und es gibt<br />

ke<strong>in</strong>e Klasse für Nicht-Deskriptoren.<br />

Da sich die Nicht-Deskriptoren durch e<strong>in</strong>e e<strong>in</strong>fache formale Regel als Untermenge der<br />

Wörter (Label oder Term) ableiten lassen, kann <strong>UMTHES</strong> semantisch verlustfrei <strong>in</strong> beiden<br />

Modellen (<strong>SKOS</strong> und ISO) abgebildet werden.<br />

2.2 Identität und Referenz<br />

<strong>UMTHES</strong> hat heute zwei parallele Schlüsselsysteme: die THSISN <strong>in</strong> der Basistabelle und die<br />

WLISN <strong>in</strong> der Wörterliste.<br />

Wenn, wie im vorigen Kapitel erläutert, die Nicht-Deskriptoren als Klasse ganz entfallen, so<br />

entfallen auch die THSISN ihrer Instanzen (vgl. Abbildung 1). Die den Nicht-Deskriptoren<br />

äquivalente Untermenge der Label enthält E<strong>in</strong>träge aus der Wörterliste, die mit e<strong>in</strong>er WLISN<br />

identifiziert werden. Die USE / USEDFOR Beziehung <strong>in</strong> <strong>UMTHES</strong> verwendet aber an beiden<br />

Enden THISN. Die hier beteiligten Nichtdeskriptoren verweisen ihrerseits <strong>in</strong> die Wörterliste<br />

(WLISN). Beim Übergang zu <strong>SKOS</strong> kann diese Indirektion über die Nicht-Deskriptor-<br />

„Fassade“ kurzgeschlossen werden. Die neue altLabel Beziehung verweist nun direkt von<br />

der THSISN des Deskriptors auf die WLISN des dem ehemaligen Nicht-Deskriptor<br />

zugeordneten Worts.<br />

Dieses Vorgehen erlaubt e<strong>in</strong>e semantisch verlustfreie, reproduzierbare Transformation aus<br />

dem aDis Datenmodell <strong>in</strong> <strong>SKOS</strong>, aber es gibt ke<strong>in</strong>e verlustfreie Rekonstruktion der<br />

Quelldaten, da die THSISN der Nicht-Deskriptoren nicht mehr vorliegen. Dies erschwert die<br />

Qualitätssicherung der Datenmigration, und es würde jede spätere Aktualisierung des aDis<br />

Datenbestands aus dem <strong>SKOS</strong> Modell von SNS stark e<strong>in</strong>schränken. Daher wird<br />

vorgeschlagen, alle THSISN und WLISN der Quelle <strong>in</strong> e<strong>in</strong>er historyNote<br />

(umt:exportNote) mitzuführen wie näher unter (4.3.5) bei den Documentation Properties<br />

beschrieben.<br />

Für das <strong>UMTHES</strong>/<strong>SKOS</strong> Modell ergibt sich die Frage, welche ID für Concept und Label<br />

verwendet wird. Aus technischer Sicht ist dies unerheblich, solange die Transformation<br />

fehlerfrei und die Schlüssel e<strong>in</strong>deutig s<strong>in</strong>d.<br />

2.2.1 Aus Sicht der Migration<br />

Die Concepts s<strong>in</strong>d durch die THSISN der Deskriptoren identifiziert, die Labels durch die<br />

WLISN der Wörterliste. Da aber beide Schlüssel nicht untere<strong>in</strong>ander e<strong>in</strong>deutig se<strong>in</strong> müssen,<br />

wird e<strong>in</strong>e Unterscheidung benötigt, z.B. durch e<strong>in</strong> Präfix.<br />

Beispiele für solche URIs könnten se<strong>in</strong>:<br />

http://www.semantic-network.de/umthes/2009/concept/00004711<br />

http://www.semantic-network.de/umthes/2009/label/00004711<br />

oder<br />

http://www.semantic-network.de/umthes/2009/concept4711<br />

http://www.semantic-network.de/umthes/2009/label4711<br />

V 03 Umweltbundesamt S. 9


SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />

Hier ist unterstellt, dass <strong>in</strong> THSISN und WLISN zufällig der gleiche Schlüssel 00004711<br />

vergeben wurde. (E<strong>in</strong>e URI ist immer als Ganzes zu sehen: „Semantik Network kennt im<br />

<strong>UMTHES</strong> 2009 e<strong>in</strong> Concept Nr. 00004711“. Die Nummer alle<strong>in</strong> braucht nicht e<strong>in</strong>deutig se<strong>in</strong>).<br />

Dies ist nur e<strong>in</strong>e Möglichkeit, die URIs auf Basis der bisherigen THSISN und WLISN zu<br />

gestalten, sie ist ke<strong>in</strong>eswegs zw<strong>in</strong>gend, wenn alle THSISN und WLISN <strong>in</strong> exportNotes<br />

mitgeführt werden.<br />

2.2.2 Aus Sicht des URI Designs<br />

In den nachstehenden Code Beispielen werden für Labels „sprechende“ IDs verwendet, wie<br />

z.B. „:abgas“ als ID für das Label „Abgas“ anstelle der WLISN 00025534. E<strong>in</strong>e solche<br />

(technisch normalisierte) Ableitung der ID aus dem Namen ist im Semantic Web weit<br />

verbreitet, da sie sehr gut menschenlesbar ist. Solange die Namen selbst h<strong>in</strong>reichend<br />

e<strong>in</strong>deutig s<strong>in</strong>d (Vorlageform), ist dies auch technisch e<strong>in</strong>fach zu realisieren.<br />

Für Concepts, die ja unabhängig von den ihnen zugewiesenen Labels existieren, ist e<strong>in</strong>e<br />

abstrakte ID angemessen. In den Beispielen wird hier meist die THSISN verwendet.<br />

http://www.semantic-network.de/umthes/2009/00000577<br />

http://www.semantic-network.de/umthes/2009/abgasre<strong>in</strong>igung<br />

http://www.semantic-network.de/umthes/2009/abgasre<strong>in</strong>igungsanlage<br />

2.2.3 <strong>UMTHES</strong> Namensraum<br />

<strong>UMTHES</strong>/<strong>SKOS</strong> benötigt e<strong>in</strong>en autonomen Namensraum. Dieser beg<strong>in</strong>nt <strong>in</strong> den<br />

vorausgegangenen Beispielen bei http://www.semantic-network.de/umthes/.<br />

Die URI dieses Namensraums kann sich aus Datensicht jederzeit ändern, es werden <strong>in</strong>tern<br />

nur relative URIs verwendet. Für diese relativen URIs gelten E<strong>in</strong>deutigkeit und Persistenz<br />

lediglich <strong>in</strong>nerhalb des Namensraums.<br />

Zur Persistenz der gesamten URI gehört auch die des Namensraums. Dies fällt <strong>in</strong> die<br />

organisatorische Zuständigkeit und kann nicht aus de<strong>in</strong>em Datenformat heraus sichergestellt<br />

werden.<br />

2.3 Semantische Beziehungen zwischen Concepts<br />

Dies me<strong>in</strong>t ausschließlich Relationen zwischen jeweils zwei Concepts, Labels spielen hier<br />

gar ke<strong>in</strong>e Rolle. Die Äquivalenz-Beziehungen (USE / USED FOR) f<strong>in</strong>den sich nicht unter den<br />

Semantic Relations, denn dies s<strong>in</strong>d Beziehungen zwischen Concept und Label, nicht<br />

zwischen Concept und Concept. Siehe dazu unter (3.2) XL Labels.<br />

<strong>SKOS</strong> enthält vordef<strong>in</strong>ierte hierarchische und Verwandtschaftsbeziehungen.<br />

skos:semanticRelation<br />

skos:broaderTransitive<br />

skos:broader<br />

skos:narrowerTransitive<br />

skos:narrower<br />

skos:related<br />

<strong>UMTHES</strong> benötigt hier derzeit ke<strong>in</strong>e Erweiterung.<br />

V 03 Umweltbundesamt S. 10


SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />

Für die Hierarchie wird nicht die von <strong>SKOS</strong> angebotene transitive Variante verwendet.<br />

:abgas rdf:type skos:Concept;<br />

skos:narrower :abgasanlage.<br />

:anlage rdf:type skos:Concept;<br />

skos:narrower :abgasanlage.<br />

:abgasanlage rdf:type skos:Concept;<br />

skos:broader :abgas;<br />

skos:broader :anlage.<br />

Codebeispiel 2 <strong>SKOS</strong> Semantic Relations: Hierarchie<br />

In <strong>SKOS</strong> schließen sich hierarchische und related Beziehungen zwischen denselben<br />

Concepts gegenseitig aus (disjo<strong>in</strong>t). Im Beispiel open wäre :abgas skos:related<br />

:abgasanlage nicht gleichzeitig möglich.<br />

2.4 (Ke<strong>in</strong>e) Spezialisierung von skos:Concept<br />

<strong>SKOS</strong> fordert ausdrücklich dazu auf, von der Klasse Concept spezialisierte Unterklassen<br />

abzuleiten. Dies ist (2004) bei GEMET für die Groups und Themes verfolgt worden.<br />

Unterklassen „erben“ zunächst alle Eigenschaften ihrer Oberklassen. Das bedeutet, dass<br />

auch gemet:Group und gemet:Theme e<strong>in</strong>e Hierarchie bilden können wie skos:Concept.<br />

(Das illustriert nebenbei, warum e<strong>in</strong>e Unterklasse von Concept ke<strong>in</strong> Äquivalent zu den<br />

<strong>UMTHES</strong> Nicht-Deskriptoren se<strong>in</strong> kann: sie würden damit alle Beziehungstypen von<br />

Deskriptoren erben.)<br />

Zusätzlich wurden spezifische semantische Relationen zwischen skos:Concept und<br />

gemet:Group und gemet:Theme ergänzt.<br />

Im <strong>UMTHES</strong> haben wir die sog. Ordnungsbegriffe und die Top-Terms. Beiden ist<br />

geme<strong>in</strong>sam, dass sie wegen ihrer großen Allgeme<strong>in</strong>heit nicht für die Indexierung empfohlen<br />

werden, sie enthalten sprechende Namenszusätze wie „Benutze Unterbegriffe“. Ansonsten<br />

verhalten sie sich wie gewöhnliche Deskriptoren. Es gibt auch ke<strong>in</strong>e speziellen Relationen <strong>in</strong><br />

diesem Zusammenhang. Daher ersche<strong>in</strong>t e<strong>in</strong>e spezialisierte Klasse <strong>in</strong> beiden Fällen<br />

unangemessen.<br />

Zur Kennzeichnung von Top-Terms sieht <strong>SKOS</strong> e<strong>in</strong>e hasTopConcept-Relation zwischen<br />

dem (2.6) ConceptScheme und den betreffenden Concepts vor.<br />

Für Ordnungsbegriffe wurden auch (2.5) Concept Collections erwogen, aber schließlich fiel<br />

die Entscheidung für die umt:usageNote unter den (3.2) Documentation Properties. In<br />

dieser Note kann der Verwendungsh<strong>in</strong>weis angemessen codiert werden.<br />

2.5 (Ke<strong>in</strong>e) Concept Collections<br />

Neben der Hierarchie e<strong>in</strong> weiteres von <strong>SKOS</strong> angebotenes Strukturelement für Concepts.<br />

Wird <strong>in</strong> <strong>UMTHES</strong> bisher nicht explizit verwendet.<br />

V 03 Umweltbundesamt S. 11


SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />

Das Pr<strong>in</strong>zip ist <strong>in</strong> e<strong>in</strong>em verbreiteten Struktur-Beispiel dargestellt (ke<strong>in</strong>e Turtle Syntax):<br />

und <br />

============================================<br />

w<strong>in</strong>es<br />

<br />

red w<strong>in</strong>es<br />

Burgundy<br />

rose w<strong>in</strong>es<br />

white w<strong>in</strong>es<br />

Chardonnay<br />

Chablis<br />

Chen<strong>in</strong> Blanc<br />

Johannisberg Riesl<strong>in</strong>g<br />

Sauvignon Blanc<br />

<br />

sweet w<strong>in</strong>es<br />

Chen<strong>in</strong> Blanc<br />

Johannisberg Riesl<strong>in</strong>g<br />

dry w<strong>in</strong>es<br />

Chardonnay<br />

Chablis<br />

Sauvignon Blanc<br />

=================================================<br />

Abbildung 3 Beispiel für Collections<br />

Die Collections stehen hier <strong>in</strong> spitzen Klammern.<br />

2.6 Concept Scheme Beispiel <strong>UMTHES</strong> und Umweltklassifikation<br />

E<strong>in</strong> Concept Scheme bezeichnet e<strong>in</strong> komplettes Vokabular, also hier z.B. „<strong>UMTHES</strong>“. Es<br />

können im selben <strong>SKOS</strong> Graphen auch mehrere Vokabulare vorkommen, die Zuordnung der<br />

Concepts (nicht der Labels!) erfolgt über skos:<strong>in</strong>Scheme, für Top Terms mit<br />

skos:topConceptOf.<br />

Es besteht die Option, z.B. die Umweltklassifikation als eigenes Concept Scheme und jede<br />

Umweltklasse als Concept zu modellieren, die dann mit Mapp<strong>in</strong>g Properties auf <strong>UMTHES</strong><br />

Concepts bezogen werden. E<strong>in</strong>e e<strong>in</strong>fachere Alternative ist unter (3.1.2) Notation vs.<br />

Enumeration beschrieben.<br />

Der Umgang mit mehreren ConceptSchemes ist im Vorhaben nicht ausdrücklich gefordert<br />

oder angeboten, würde aber der Umweltklassifikation zu mehr „Prom<strong>in</strong>enz“ verhelfen, es<br />

gäbe dann e<strong>in</strong>e gepflegte Referenzadresse mit allen Zugriffsmöglichkeiten für Menschen und<br />

Masch<strong>in</strong>en. E<strong>in</strong> Beispiel f<strong>in</strong>det sich im folgenden Kapitel.<br />

2.7 Mapp<strong>in</strong>g Properties<br />

Diese dienen zum Querverweis zwischen Concepts, die verschiedenen ConceptSchemes<br />

angehören.<br />

Es gibt hier verschiedene Ausprägungen, darunter auch Querverweise auf andere<br />

Hierarchieebenen. Fe<strong>in</strong>e Unterschiede können mit exact, close oder related differenziert<br />

werden.<br />

V 03 Umweltbundesamt S. 12


SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />

skos:mapp<strong>in</strong>gRelation<br />

skos:closeMatch<br />

skos:exactMatch<br />

skos:broadMatch<br />

skos:narrowMatch<br />

skos:relatedMatch<br />

Wenn die Umweltklassifikation als eigenes ConceptScheme modelliert wird, dann erfolgt die<br />

Zuordnung der <strong>UMTHES</strong> Concepts über Mapp<strong>in</strong>g Properties.<br />

Zunächst werden mit uk:uklass und umt:umthes die beiden ConceptSchemes def<strong>in</strong>iert.<br />

uk:uklass rdf:type skos:ConceptScheme;<br />

dct:title "Umweltklassifikation"@de.<br />

umt:umthes rdf:type skos:ConceptScheme;<br />

dct:title "Umweltthesaurus"@de.<br />

Dann wird beispielhaft e<strong>in</strong>e Umweltklasse (uk:ab54) als skos:Concept <strong>in</strong> uk:uklass<br />

<strong>in</strong>itialisiert. Sie erhält e<strong>in</strong> (e<strong>in</strong>faches) skos:prefLabel <strong>in</strong> Deutsch, das durch e<strong>in</strong> englisches<br />

ergänzt werden kann.<br />

uk:ab54 rdf:type skos:Concept;<br />

skos:prefLabel "AB 54 Abfallbeseitigung"@de;<br />

skos:<strong>in</strong>Scheme uk:uklass.<br />

Abschließend wird beispielhaft e<strong>in</strong> Deskriptor (umt:00000477) als skos:Concept <strong>in</strong><br />

umt:umthes <strong>in</strong>itialisiert. Dieser verweist auf e<strong>in</strong> skosxl:Label umt:abgasre<strong>in</strong>igung und ist<br />

mit skos:closeMatch der Umweltklasse uk:ab54 zugordnet.<br />

:00000477 rdf:type skos:Concept;<br />

skosxl:prefLabel umt:abgasre<strong>in</strong>igung;<br />

skos:<strong>in</strong>Scheme umt:umthes<br />

skos:closeMatch uk:ab54.<br />

Codebeispiel 3 Mapp<strong>in</strong>g Properties am Beispiel <strong>UMTHES</strong> und Umweltklassifikation<br />

Die Adm<strong>in</strong>istration mehrerer skos:ConceptScheme <strong>in</strong> e<strong>in</strong>em geme<strong>in</strong>samen Graphen<br />

erfordert weitergehende Klärungen, z.B. ob es für jedes Scheme getrennte Hierarchien<br />

geben soll. Mit <strong>SKOS</strong> ist lediglich gesagt, dass Mapp<strong>in</strong>g Properties und Semantic Relations<br />

disjunkt s<strong>in</strong>d. Aber e<strong>in</strong> noch nicht vernetztes Concept lässt sich dennoch ohne Weiteres<br />

falsch <strong>in</strong>itialisieren. Hier sche<strong>in</strong>en Erweiterungen des <strong>SKOS</strong> Modells erforderlich, wenn man<br />

die beabsichtige Logik <strong>in</strong> der formalen Sprache ausdrücken will. E<strong>in</strong>e e<strong>in</strong>fachere Variante<br />

zum Umgang mit der Umweltklassifikation f<strong>in</strong>det sich <strong>in</strong> Kap. 3.1.2, Notation vs.<br />

Enumeration.<br />

Die Zuordnung zu GEMET ist e<strong>in</strong> Mapp<strong>in</strong>g zu e<strong>in</strong>em vollständig externen Vokabular. Es ist<br />

nicht ganz korrekt, hier die Mapp<strong>in</strong>g Properties zu verwenden, wenn man damit auf die<br />

jeweilige EEA-Webseite zeigt. Das Ziel e<strong>in</strong>er Mapp<strong>in</strong>g Property ist selbst e<strong>in</strong> <strong>SKOS</strong> Concept.<br />

Die <strong>SKOS</strong> Repräsentation von GEMET ist aber nicht über die dar<strong>in</strong> enthaltenen URI<br />

erreichbar (diese leiteten um auf die jeweilige Webseite). Letzeres ist aus formaler Sicht ke<strong>in</strong><br />

H<strong>in</strong>derungsgrund, der e<strong>in</strong>en Verweis verbieten würde. Die im <strong>SKOS</strong> GEMET verwendeten<br />

V 03 Umweltbundesamt S. 13


SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />

URI s<strong>in</strong>d die von der Autorität vergebenen Resource-IDs und als solche gültig, auch wenn<br />

sie nicht unmittelbar dereferenziert werden können.<br />

<strong>UMTHES</strong> hat jedoch Interesse, die EUA auf diesen Sachstand h<strong>in</strong>zuweisen. Die<br />

Bereitstellung von GEMET ist aus Sicht des Semantic Web unvollständig und entspricht nicht<br />

dem Stand der Technik [CoolURI].<br />

:00000477 rdf:type skos:Concept;<br />

skosxl:prefLabel umt:abgasre<strong>in</strong>igung;<br />

skos:<strong>in</strong>Scheme umt:umthes<br />

skos:closeMatch uk:ab54<br />

skos:closeMatch http://www.eionet.europa.eu/gemet/concept/9080<br />

Codebeispiel 4 Mapp<strong>in</strong>g Properties für <strong>UMTHES</strong> und GEMET<br />

Alle derartigen Zuordnungen im <strong>UMTHES</strong> können zunächst mit skos:closeMatch<br />

abgebildet werden, wenn e<strong>in</strong>e automatische Unterscheidung zwischen den Varianten nicht<br />

möglich ersche<strong>in</strong>t.<br />

V 03 Umweltbundesamt S. 14


SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />

3 Lexical Properties<br />

Jedem Concept werden Wörter (Label) zugeordnet. Jedes Wort wird durch e<strong>in</strong>en Namen<br />

repräsentiert.<br />

In natürlicher Sprache tauchen <strong>in</strong> erster L<strong>in</strong>ie Wortformen auf. Dies können grammatisch<br />

begründete (also Mehrzahl, Genitiv, Vergangenheit usw.) oder andere Varianten wie z.B.<br />

Abkürzungen se<strong>in</strong>, die oft une<strong>in</strong>heitlich s<strong>in</strong>d. Diese ganze “Wolke” von Zeichenketten, durch<br />

die e<strong>in</strong> Wort repräsentiert ist, wird als se<strong>in</strong>e „lexikalische Form“ bezeichnet: „A lexical form is<br />

an abstract unit represent<strong>in</strong>g a set of wordforms differ<strong>in</strong>g only <strong>in</strong> <strong>in</strong>flection and not <strong>in</strong> core<br />

mean<strong>in</strong>g.” 3<br />

In e<strong>in</strong>em etwas erweiterten S<strong>in</strong>n reden wir auch von lexikalischen Eigenschaften (lexical<br />

properties).<br />

3.1 E<strong>in</strong>fache <strong>SKOS</strong> Eigenschaften<br />

3.1.1 Lexical Labels<br />

Ausgangspunkt ist e<strong>in</strong> sehr generisches rdfs:Label, mit dem sich jeder beliebigen Instanz<br />

irgend e<strong>in</strong>er Klasse Namen zuweisen lassen. Dabei wird Mehrsprachigkeit durch e<strong>in</strong>en<br />

Language Code unterstützt. Der Wert e<strong>in</strong>es rdfs:Label muss nicht e<strong>in</strong>e Zeichenkette se<strong>in</strong>,<br />

es handelt sich um e<strong>in</strong>en RDF literal value, was viele Möglichkeiten eröffnet. Meist wird aber<br />

e<strong>in</strong>fach der Name angegeben, mit dem das Objekt angezeigt werden soll („Vorlageform“).<br />

Für RDF Tools ist es heute e<strong>in</strong> Standardverhalten, neben der ID (URL) e<strong>in</strong>er Instanz auch<br />

ihren Namen (rdfs:label) anzuzeigen, unter Berücksichtigung der aktuellen Sprache.<br />

<strong>SKOS</strong> hat dieses Modell zunächst semantisch untergliedert <strong>in</strong> skos:prefLabel,<br />

skos:altLabel und skos:hiddenLabel.<br />

:00000577 rdf:type skos:Concept;<br />

skos:prefLabel „Abgasre<strong>in</strong>igung“@de;<br />

skos:altLabel „Abgasre<strong>in</strong>igungsanlage“@de.<br />

Codebeispiel 5 E<strong>in</strong>fache Lexical Labels<br />

Schließlich hat man darüber h<strong>in</strong>aus die Schwäche e<strong>in</strong>er e<strong>in</strong>fachen Wertzuweisung erkannt<br />

und <strong>SKOS</strong> um XL Labels erweitert. Erst diese Erweiterung ermöglicht e<strong>in</strong>e angemessene<br />

Modellierung unter E<strong>in</strong>beziehung aller <strong>in</strong> <strong>UMTHES</strong> gepflegten lexikalischen Eigenschaften.<br />

Siehe dazu näher <strong>in</strong> (3.2) XL Labels.<br />

3.1.2 Notation vs. Enumeration<br />

Zwei gebräuchliche Methoden, um den Wertebereich von Lexical Lables zu formalisieren.<br />

Notationen s<strong>in</strong>d Zeichenketten mit Angabe e<strong>in</strong>es „Datentyps“. E<strong>in</strong> Beispiel wäre<br />

skos:notation "K"^^<br />

3 http://www.sil.org/l<strong>in</strong>guistics/GlossaryOfL<strong>in</strong>guisticTerms/WhatIsALexicalForm.htm<br />

V 03 Umweltbundesamt S. 15


SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />

ist hier der „Datentyp“. Er wird durch e<strong>in</strong>e URL angegeben.<br />

Diese URL könnte zum Look-Up für den Wertevorrat führen, dies ist aber nicht ausdrücklich<br />

standardisiert.<br />

Man könnte sich nun vorstellen:<br />

:concept4711 rdf:type skos:Concept;<br />

skos:notation "AB10"^^<br />

In diesem Modell können jedoch weder Codierung noch Wortgut oder Hierarchie der<br />

Umweltklassifikation formal beschrieben werden. Letztlich besteht hier jede Notation aus<br />

zwei beliebigen Zeichenketten, es fehlt e<strong>in</strong> Referenzsystem gültiger Umweltklassen.<br />

Das <strong>in</strong> (2.6) Concept Scheme angesprochene Vorgehen über Mapp<strong>in</strong>g Properties ist<br />

wesentlich aussagekräftiger (aber auch aufwändiger).<br />

E<strong>in</strong> Kompromiss, der das Wortgut berücksichtigt, wenn auch nicht e<strong>in</strong>e formale Hierarchie,<br />

liegt <strong>in</strong> e<strong>in</strong>er Referenz auf e<strong>in</strong>e flache Wertetabelle (Enumeration).<br />

Im Schema:<br />

(1) Die Wertetabelle umt:UmweltklasseEnum, jeder zugehörige Wert wird durch e<strong>in</strong><br />

„Individual“ aufgezählt (owl:oneof).<br />

umt:UmweltklasseEnum owl:equivalentClass [<br />

rdf:type owl:Class ;<br />

owl:oneOf (umt:ab umt:ab10 umt:ab20 usw.… )<br />

] .<br />

(2) Jeder Wert erhält mehrsprachige Bezeichner.<br />

umt:ab rdfs:label „AB Abfall“@de;<br />

rdfs:label „AB Waste“@en.<br />

umt:ab10 rdfs:label „AB10 Abfallentstehung, Abfallaufkommen, …“@de;<br />

rdfs:label „AB10 Types and occurrence of waste“@en.<br />

usw. für jede Umweltklasse.<br />

(3) E<strong>in</strong>e Property (z.B. umt:classified) def<strong>in</strong>ieren und deren Wert mit der Wertetabelle<br />

h<strong>in</strong>terlegen.<br />

umt:classified rdf:type rdfs:ObjectProperty;<br />

rdfs:range umt:UmweltklasseEnum.<br />

In der Anwendung:<br />

:concept4711 rdf:type skos:Concept;<br />

umt:classified umt:ab10.<br />

Codebeispiel 6 Umweltklassifikation als Enumeration<br />

V 03 Umweltbundesamt S. 16


SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />

3.2 XL Labels<br />

<strong>SKOS</strong> eXtension for Labels (XL) ist als optionale Erweiterung im Standard enthalten. Sie<br />

erlaubt komplexere lexikalische Modelle, <strong>in</strong> denen Labels selbst attributiert und mite<strong>in</strong>ander<br />

<strong>in</strong> Beziehung gebracht werden können.<br />

skosxl:Label ist e<strong>in</strong>e eigenständige Klasse. <strong>SKOS</strong> XL gibt ihr e<strong>in</strong> e<strong>in</strong>ziges vordef<strong>in</strong>iertes<br />

Attribut skosxl:literalForm, das semantisch dem rdfs:label entspricht.<br />

Da wir es aber nun mit e<strong>in</strong>er Label-Klasse zu tun haben, können wir jedes Label um<br />

zusätzlich Attribute erweitern und Labels zue<strong>in</strong>ander <strong>in</strong> Beziehung setzten.<br />

Dennoch können wir Concept und Label wie gewohnt verknüpfen: <strong>SKOS</strong> XL kennt drei<br />

Relationen von skos:Concept zu skosxl:Label<br />

skosxl:prefLabel - Vorzugsbegriff<br />

skosxl:altLabel - Synonymverweis<br />

skosxl:hiddenLabel – Interner Begriff, der nicht nach außen sichtbar se<strong>in</strong> soll.<br />

Dies entspricht semantisch den e<strong>in</strong>fachen <strong>SKOS</strong> Label Properties, aber hier wird der Wert<br />

durch e<strong>in</strong>e Referenz auf e<strong>in</strong> Label Objekt angegeben, nicht direkt als e<strong>in</strong>facher „Name“ des<br />

Concepts.<br />

Das schon verwendete Beispiel:<br />

:00000577 rdf:type skos:Concept;<br />

skos:prefLabel „Abgasre<strong>in</strong>igung“@de;<br />

skos:altLabel „Abgasre<strong>in</strong>igungsanlage“@de.<br />

… liest sich <strong>in</strong> <strong>SKOS</strong> XL:<br />

:00000577 rdf:type skos:Concept;<br />

skosxl:prefLabel :abgasre<strong>in</strong>igung;<br />

skosxl:altLabel :abgasre<strong>in</strong>igungsanlage.<br />

:abgasre<strong>in</strong>igung rdf:type skosxl:Label;<br />

skosxl:lexicalForm „Abgasre<strong>in</strong>igung“@de.<br />

:abgasre<strong>in</strong>igungsanlage rdf:type skosxl:Label;<br />

skosxl:lexicalForm „Abgasre<strong>in</strong>igungsanlage“@de.<br />

Codebeispiel 7 skos:Concept und skosxl:Label<br />

Das macht so noch ke<strong>in</strong>en erkennbaren S<strong>in</strong>n, denn es sagt nicht mehr als die e<strong>in</strong>fachere<br />

skos: Variante. Die zusätzlichen Möglichkeiten ergeben sich aber daraus, dass sich nun<br />

weitere Eigenschaften e<strong>in</strong>es Labels beschreiben lassen als lediglich „der Name auf dem<br />

Etikett“.<br />

3.2.1 Eigenschaften von skosxl:Label<br />

Das vordef<strong>in</strong>ierte skosxl:Label kennt ausschließlich e<strong>in</strong>e (1) lexikalische Form:<br />

skosxl:literalForm – (genau 1) entspricht der „Vorlageform“, also z.B. mit<br />

Qualifier oder Benutzungsh<strong>in</strong>weis.<br />

V 03 Umweltbundesamt S. 17


SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />

Für <strong>UMTHES</strong> ergänzen wir jedes Label (bzw. dessen Vorlageform) um weitere Attribute:<br />

� Kodierung des Endungsmusters:<br />

umt:baseForm – „Ansetzungsform“.<br />

umt:<strong>in</strong>flectionalCode – Endungscode.<br />

� Aufzählung lexikalischer Varianten:<br />

umt:lexicalVariant – (mehrfach) lexikalische Variante der Vorlageform.<br />

Diese hat drei Formen:<br />

E<strong>in</strong> konstruiertes Beispiel:<br />

umt:<strong>in</strong>flectional –e<strong>in</strong>zelne, ausgeschriebene Flexionsformen.<br />

umt:acronym – optional abgekürzte Schreibweisen.<br />

umt:cultural – optional kulturell abweichende Schreibweisen.<br />

:fernsehen rdf:type skosxl:Label;<br />

skosxl:literalForm “Fernsehen“@de;<br />

umt:baseForm “Fernsehe“;<br />

umt:<strong>in</strong>flectionalCode “xyz”<br />

umt:<strong>in</strong>flectional “Fernsehen”;<br />

umt:<strong>in</strong>flectional “Fernsehens”;<br />

umt:<strong>in</strong>flectional “Fernseher”;<br />

umt:<strong>in</strong>flectional “Fernsehern”;<br />

umt:acronym “TV”;<br />

umt:cultural “Glotze”.<br />

Abbildung 4 Erweiterte e<strong>in</strong>fache Properties von skosxl:Label<br />

Label-zu-Label Relationen können grundsätzlich beliebige Beziehungen zwischen Labels<br />

ausdrücken. Der <strong>SKOS</strong> Primer erläutert dies am Beispiel von Abkürzungen. Da wir die<br />

Abkürzung aber als e<strong>in</strong> Attribut der zugehörigen Vorlageform ansehen, folgen wir diesem<br />

Beispiel nicht. Die Abkürzung ist aus unserer Sicht ke<strong>in</strong> eigenes Label, da sie ke<strong>in</strong>e weiteren<br />

Eigenschaften hat, die beschrieben werden müssten. Auch Varianten e<strong>in</strong>er Abkürzung<br />

können ohne Weiteres durch mehrfaches umt:acronym ausgedrückt werden.<br />

Andererseits hätte man im obigen Beispiel aus „Glotze“ e<strong>in</strong> eigenes Label mit allen<br />

zugehörigen Varianten machen können. Dies hängt letztlich von den jeweiligen Ressourcen<br />

und Prioritäten ab. Aus formaler Sicht gilt:<br />

Die Entscheidung für e<strong>in</strong>e Label Relation fällt immer dann, wenn beide Beteiligte außer<br />

ihrem jeweiligen Namen weitere eigenständige lexikalische Eigenschaften mitführen. In<br />

diesem Fall <strong>in</strong>stantiiert man zwei Labels und verb<strong>in</strong>det sie mir e<strong>in</strong>er …<br />

skosxl:labelRelation – zunächst unspezifische Relation zwischen zwei Labels,<br />

dient lediglich als Erweiterungspunkt für spezifische Relationen.<br />

<strong>UMTHES</strong>-Anwendungen:<br />

V 03 Umweltbundesamt S. 18


SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />

umt:translation – hier als direkte Beziehung zwischen Labels, nicht vermittelt<br />

über e<strong>in</strong> geme<strong>in</strong>sames Concept, dem Labels <strong>in</strong> mehreren Sprachen zugewiesen s<strong>in</strong>d.<br />

Letzteres sagt nicht ausdrücklich, welches Label welches andere Label übersetzt,<br />

daher ist die direkte Zuordnung zwischen Labels präziser. Daraus kann nicht<br />

abgeleitet werden, dass e<strong>in</strong> Label se<strong>in</strong>em Concept zwangsläufig e<strong>in</strong>en Schwarm ihm<br />

zugeordneter Übersetzungen „vererbt“. Beides ist unabhängig zu sehen.<br />

umt:compoundFrom – e<strong>in</strong> zusammengesetztes Label zeigt auf e<strong>in</strong>e Liste se<strong>in</strong>er<br />

Komponenten (die selbst Labels s<strong>in</strong>d), kann mehrfach vorkommen.<br />

umt:hasQualifier – Ist die lexicalForm e<strong>in</strong> Homograph („Weide“), dann wird sie<br />

mit e<strong>in</strong>em Namenszusatz (=qualifier) ergänzt („Weide [Salix]“). Dieser Qualifier<br />

(„Salix“) ist selbst e<strong>in</strong> Label.<br />

umt:lexicalExtension – Wenn es für Labels lexikalische Varianten mit eigenen<br />

Beugungsformen gibt, soll für jede dieser Varianten e<strong>in</strong> eigenes Label verwendet<br />

werden. Dies gilt z.B. für alte und neue deutsche Rechtschreibung (:schiffahrt<br />

:schifffahrt), aber möglicherweise auch für substantivische und Verbform<br />

(:re<strong>in</strong>igung :re<strong>in</strong>igen).<br />

Labels können darüber h<strong>in</strong>aus alle <strong>SKOS</strong> Documentation Properties verwenden. Dazu mehr<br />

<strong>in</strong> Kap. 4 Documentation Properties.<br />

Abschließend das Beispiel Abgasre<strong>in</strong>igungsanlage aus dieser Sicht. Zunächst die drei<br />

elementaren Labels:<br />

:abgas rdf:type skosxl:Label;<br />

skosxl:literalForm “Abgas“@de;<br />

umt:baseForm “Abgas“;<br />

umt:<strong>in</strong>flectionalCode “CC”<br />

umt:<strong>in</strong>flectional “Abgase”;<br />

umt:<strong>in</strong>flectional “Abgases”;<br />

umt:<strong>in</strong>flectional “Abgasen”.<br />

:re<strong>in</strong>igung rdf:type skosxl:Label;<br />

skosxl:literalForm “Re<strong>in</strong>igung“@de;<br />

umt:baseForm “Re<strong>in</strong>igung“;<br />

umt:<strong>in</strong>flectionalCode “D0”<br />

umt:<strong>in</strong>flectional “Re<strong>in</strong>igungen”.<br />

:anlage rdf:type skosxl:Label;<br />

skosxl:literalForm “Anlage“@de;<br />

umt:baseForm “Anlage“;<br />

umt:<strong>in</strong>flectionalCode “D3”<br />

umt:<strong>in</strong>flectional “Anlagen”.<br />

E<strong>in</strong>e beispielhafte Übersetzung:<br />

:wasteGas rdf:type skosxl:Label;<br />

skosxl:literalForm “waste gas“@en;<br />

… weitere Properties …<br />

umt:translation :abgas.<br />

E<strong>in</strong>e (experimentelle) lexicalExtension als Option:<br />

V 03 Umweltbundesamt S. 19


SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />

:re<strong>in</strong>igen rdf:type skosxl:Label;<br />

skosxl:literalForm “re<strong>in</strong>igen“@de;<br />

umt:baseForm “re<strong>in</strong>ig“;<br />

umt:<strong>in</strong>flectionalCode “??”<br />

umt:<strong>in</strong>flectional “re<strong>in</strong>ige”;<br />

umt:<strong>in</strong>flectional “re<strong>in</strong>igen”;<br />

umt:<strong>in</strong>flectional “re<strong>in</strong>igte”;<br />

umt:<strong>in</strong>flectional “gere<strong>in</strong>igt”;<br />

umt:<strong>in</strong>flectional “gere<strong>in</strong>igte”;<br />

umt:<strong>in</strong>flectional “gere<strong>in</strong>igter”;<br />

umt:<strong>in</strong>flectional “gere<strong>in</strong>igtes”;<br />

umt:<strong>in</strong>flectional “re<strong>in</strong>igend”;<br />

umt:<strong>in</strong>flectional “re<strong>in</strong>igende”;<br />

umt:<strong>in</strong>flectional “re<strong>in</strong>igender”;<br />

umt:<strong>in</strong>flectional “re<strong>in</strong>igendes”.<br />

:re<strong>in</strong>igung umt:lexicalExtension :re<strong>in</strong>igen.<br />

E<strong>in</strong>fache Zusammensetzungen, wie z.B. „Abgasre<strong>in</strong>igung“.<br />

:abgasre<strong>in</strong>igung rdf:type skosxl:Label;<br />

skosxl:literalForm “Abgasre<strong>in</strong>igung“@de;<br />

umt:baseForm “Abgasre<strong>in</strong>igung“;<br />

umt:<strong>in</strong>flectionalCode “D0”<br />

umt:<strong>in</strong>flectional “Abgasre<strong>in</strong>igungen”;<br />

umt:compoundFrom (:abgas :re<strong>in</strong>igung).<br />

Komplexere Zusammensetzungen lassen sich mehrfach auflösen:<br />

:abgasre<strong>in</strong>igungsanlage rdf:type skosxl:Label;<br />

skosxl:literalForm “Abgasre<strong>in</strong>igungsanlage“@de;<br />

umt:baseForm “Abgasre<strong>in</strong>igungsanlage“;<br />

umt:<strong>in</strong>flectionalCode “D3”<br />

umt:<strong>in</strong>flectional “Abgasre<strong>in</strong>igunganlagen”;<br />

umt:compoundFrom (:abgas :re<strong>in</strong>igungsanlage);<br />

umt:compoundFrom (:abgasre<strong>in</strong>igung :anlage).<br />

Nutzung im Concept.<br />

:00000477 rdf:type skos:Concept;<br />

skosxl:prefLabel :abgasre<strong>in</strong>igung;<br />

skosxl:altLabel :abgasre<strong>in</strong>igungsanlage.<br />

Codebeispiel 8 Wortformen und Dekomposition<br />

3.2.2 Asymmetrische Mehrsprachigkeit<br />

<strong>SKOS</strong> ist mit Blick aus symmetrische Mehrsprachigkeit entstanden: e<strong>in</strong> Konzept kann<br />

prefLabels <strong>in</strong> mehreren Sprachen haben, aber nur e<strong>in</strong>es je Sprache. Das Concept selbst hat<br />

ke<strong>in</strong>e „eigene“ Sprache, es wird angenommen, dass dieses Concept <strong>in</strong> allen Sprachen<br />

bekannt ist.<br />

Bei asymmetrischer Mehrsprachigkeit geht man davon aus, dass auch die Concepts<br />

sprachspezifisch s<strong>in</strong>d (es gibt ke<strong>in</strong>e vollständig exakte Übersetzung), daher sollte e<strong>in</strong><br />

Concept hier nur e<strong>in</strong> e<strong>in</strong>ziges prefLabel haben, und dessen Sprache entscheidet über die<br />

Sprache des Concepts. Man könnte daraus auch explizite Unterklassen GermanConcept<br />

und EnglishConcept ableiten.<br />

V 03 Umweltbundesamt S. 20


SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />

Was macht e<strong>in</strong> sprachabhängiges Concept überhaupt aus: nicht nur die Sprache des<br />

zugeordneten Labels, sondern möglicherweise auch sprachabhängige Beziehungen, also<br />

z.B. eigenständige Hierarchien <strong>in</strong> jeder Sprache. Diese Fragen s<strong>in</strong>d bisher nicht vollständig<br />

erschlossen und für <strong>UMTHES</strong> nicht ausgeführt, alle englischen Begriffe s<strong>in</strong>d Nicht-<br />

Deskriptoren. Daraus folgt, dass sie ausschließlich als skos:altLabel Verwendung f<strong>in</strong>den:<br />

also wird es ausschließlich deutsche Concepts <strong>in</strong> <strong>UMTHES</strong> 4 geben.<br />

Als skosxl:altLabel können Label aller Sprachen une<strong>in</strong>geschränkt an Concepts gebunden<br />

werden. Dies sagt nur aus, dass all diese Wörter ungefähr dieses Concept beschreiben,<br />

nicht aber welches von ihnen e<strong>in</strong>e Übersetzung des Vorzugsbegriffs (skosxl:prefLabel) ist.<br />

Auch Übersetzungsbeziehungen <strong>in</strong>nerhalb der mehrsprachigen altLabels s<strong>in</strong>d so nicht<br />

erkennbar.<br />

Daraus ergeben sich zwei Anforderungen:<br />

(1) Labels s<strong>in</strong>d e<strong>in</strong>sprachig, und<br />

(2) Explizite Übersetzungsbeziehungen (wenn gewollt) werden zwischen den Labels<br />

direkt e<strong>in</strong>gerichtet, nicht aus geme<strong>in</strong>samen Concepts abgeleitet.<br />

Letztlich ist für die Zukunft auch die Möglichkeit zu betrachten, dass e<strong>in</strong> Vokabular sowohl<br />

sprachspezifische als auch symmetrische mehrsprachige Concepts enthält.<br />

:abfall rdf:type skosxl:Label;<br />

skosxl:literalForm “Abfall“@de.<br />

:waste rdf:type skosxl:Label;<br />

skosxl:literalForm “waste“@en;<br />

umt:translation :abfall.<br />

Symmetrisch:<br />

:00000112 rdf:type skos:Concept;<br />

skosxl:prefLabel :abfall;<br />

skosxl:prefLabel :waste.<br />

Aymmetrisch:<br />

:00000112 rdf:type skos:Concept;<br />

skosxl:prefLabel :abfall;<br />

:00000xyz rdf:type skos:Concept;<br />

skosxl:prefLabel :waste.<br />

Codebeispiel 9 Mehrsprachigkeit<br />

3.2.3 Koord<strong>in</strong>ation<br />

Dieses Strukturelement wird <strong>in</strong> <strong>UMTHES</strong> “Benutze Komb<strong>in</strong>ation” genannt. Man will z.B.<br />

sagen:<br />

4 SNS hat 2007 damit experimentiert, englische Deskriptoren und e<strong>in</strong>e englische Hierarchie aus den<br />

bestehenden Daten abzuleiten.<br />

V 03 Umweltbundesamt S. 21


SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />

Und nicht<br />

Rauchgasentschwefelung USE (Rauchgas UND Abgasentschwefelung)<br />

Rauchgasentschwefelung USE (Rauchgas ODER Abgasentschwefelung).<br />

In <strong>SKOS</strong> 5 <strong>in</strong>stanziieren wir zunächst zwei Concepts (Deskriptoren) :00020299 und<br />

:00020299, die beide auf :rauchgasentschwefelung als altLabel verweisen.<br />

:00020299 rdf:type skos:Concept;<br />

skosxl:prefLabel :rauchgas;<br />

skosxl:altLabel :rauchgasentschwefelung.<br />

:00000442 rdf:type skos:Concept;<br />

skosxl:prefLabel :abgasentschwefelung;<br />

skosxl:altLabel :rauchgasentschwefelung.<br />

Dies alle<strong>in</strong> ist e<strong>in</strong> H<strong>in</strong>weis, dass :rauchgasentschwefelung mit beiden Deskriptoren zu<br />

tun haben kann. Zwischen den Deskriptoren besteht e<strong>in</strong>e nicht-ausschließliche ODER-<br />

Beziehung. Koord<strong>in</strong>ation oder Benutze-Komb<strong>in</strong>ation führt UND-Beziehungen zwischen<br />

benannten Deskriptoren e<strong>in</strong>. (Es kann auch vorkommen, dass e<strong>in</strong>em Label drei Deskriptoren<br />

zugeordnet s<strong>in</strong>d, aber nicht alle tauchen <strong>in</strong> e<strong>in</strong>er Koord<strong>in</strong>ation auf).<br />

Dies lässt sich als Relation vom Label auf e<strong>in</strong>e RDF Liste von koord<strong>in</strong>ierten Deskriptoren<br />

ausdrücken wie <strong>in</strong> nachstehendem Beispiel.<br />

:rauchgasentschwefelung rdf:type skosxl:Label;<br />

umt:coord<strong>in</strong>ationOf (:00020299 :00000442).<br />

Codebeispiel 10 Koord<strong>in</strong>ation<br />

5 Das folgende übernimmt im Wesentlichen e<strong>in</strong> Beispiel aus dem <strong>SKOS</strong> Primer.<br />

V 03 Umweltbundesamt S. 22


SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />

4 Documentation Properties<br />

Diese Eigenschaften s<strong>in</strong>d von owl:AnnotationProperty abgeleitet und unterscheiden sich<br />

lediglich nach der im Namen angedeuteten Aufgabe, nicht aber h<strong>in</strong>sichtlich ihrer <strong>in</strong>neren<br />

Struktur.<br />

4.1 <strong>SKOS</strong> Note Typenübersicht<br />

--- FUSSNOTE1 Umt:Deskriptor erfordert als Äquivalent zu skos:Concept als wesentlichem Inhalt e<strong>in</strong>e<br />

Begriffsdef<strong>in</strong>ition. Diese wird als Def<strong>in</strong>ition oder als scopeNote abgelegt. In <strong>UMTHES</strong> liegen<br />

Begriffsdef<strong>in</strong>itionen derzeit für etwa von 11 493 Deskriptoren vor (Stand 22.5.2009). Vorübergehend<br />

könnte e<strong>in</strong>e möglichst e<strong>in</strong>deutige Begriffsbenennung an Stelle e<strong>in</strong>er Def<strong>in</strong>ition stehen. BK-NDs <strong>in</strong><br />

<strong>UMTHES</strong> stellen eigene Begriffe dar …<br />

� Die <strong>UMTHES</strong> Bemerkungs-Typen<br />

T0808 „role“ nach TI808-Schlüssel gekennzeichnet übernehmen<br />

� Weitere Quellattribute<br />

b Def<strong>in</strong>ition<br />

a Quelle der Anregung<br />

c Benutzungsh<strong>in</strong>weise<br />

d red. Bemerkung<br />

V 03 Umweltbundesamt S. 23


SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />

In der folgenden Übersicht über die vordef<strong>in</strong>ierten skos:Note Klassen s<strong>in</strong>d Def<strong>in</strong>itionen<br />

(skos:def<strong>in</strong>ition) aus dem <strong>SKOS</strong> RDF Schema <strong>in</strong> kursiv angegeben.<br />

Note <strong>SKOS</strong> <strong>UMTHES</strong><br />

skos:note A general note, for any purpose. Verwendung generell so nicht empfohlen.<br />

Alle Notes erhalten Datum und<br />

Bearbeiterkürzel.<br />

semantisch:<br />

skos:def<strong>in</strong>ition A statement or formal explanation<br />

of the mean<strong>in</strong>g of a concept.<br />

skos:example An example of the use of a<br />

concept.<br />

skos:scopeNote A note that helps to clarify the<br />

mean<strong>in</strong>g and/or the use of a<br />

concept.<br />

redaktionell:<br />

skos:changeNote A note about a modification to a<br />

concept.<br />

skos:editorialNote A note for an editor, translator or<br />

ma<strong>in</strong>ta<strong>in</strong>er of the vocabulary.<br />

skos:historyNote A note about the past<br />

state/use/mean<strong>in</strong>g of a concept.<br />

erweitert:<br />

Tabelle 2 skos:Note Unterklassen und <strong>UMTHES</strong> Dokumentation<br />

(Text) Typ b. Liegen für die meisten<br />

Deskriptoren vor. Teilweise aber im S<strong>in</strong>ne<br />

von Scope Notes.<br />

Bisher nicht ausgewiesen.<br />

(Text) Eventuell Typ c. Kann aber auch als<br />

Typ b vorkommen?<br />

(Text) Datum und Bearbeiter kommen aus<br />

anderen Feldern. Notes dazu wohl unter Typ<br />

d? siehe Tabelle …<br />

(Text) Typ d.<br />

(Text) Wenn dann bisher unter Typ d.<br />

umt:exportNote --- Strukturierte Daten, WLISN und THSISN<br />

umt:sourceNote --- (Text) Typ a.<br />

umt:usageNote --- Typ c?<br />

Enumeration, z.B. Kennzeichnung von OD.<br />

Beispiel: umt:00041004<br />

umt:usageNote umt:useLower;<br />

umt:editorialState --- Quelle kennt mehrere Stati, siehe Tabelle<br />

…<strong>in</strong> Kap. 3<br />

umt:expirationNote --- Strukturierte Daten<br />

V 03 Umweltbundesamt S. 24


SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />

Weder OWL noch <strong>SKOS</strong> machen irgende<strong>in</strong>e E<strong>in</strong>schränkung zum Wertebereich (range) von<br />

Notes. Der <strong>SKOS</strong> Primer beschreibt aber drei empfohlene Patterns 6 :<br />

� "documentation as an RDF literal",<br />

� "documentation as a related resource description”<br />

� "documentation as a document reference"<br />

Hier e<strong>in</strong> Beispiel für Related Resource Description aus dem <strong>SKOS</strong> Primer:<br />

ex:tomato skos:changeNote [<br />

rdf:value "Moved from under 'fruits' to under 'vegetables'"@en;<br />

dct:creator ex:HoraceGray;<br />

dct:date "1999-01-23"<br />

].<br />

Codebeispiel 11 related resource description<br />

Mit diesen e<strong>in</strong>fachen Mitteln kann man buchstäblich Alles zu Allem anmerken. Die <strong>in</strong> (2.2)<br />

Identität und Referenz begründete exportNote (historyNote) kann dann z.B. so aussehen:<br />

:abgas umt:exportNote [<br />

umt:source ;<br />

umt:wlisn “00025534”;<br />

umt:ndThsisn “00000426”;<br />

dct:date "2009-05-23"<br />

].<br />

Dieses Beispiel enthält die WLISN (umt:wlisn) und die THSISN des ehemals zugehörigen<br />

Nicht-Deskriptors (umt:ndThsisn) für e<strong>in</strong> Label mit neuer ID umt:abgas.<br />

Wir wollen die Nachrichtendaten aber etwas genauer typisieren.<br />

4.2 DCTERMS <strong>in</strong> Documentation Properties<br />

Es ist gute Praxis, bei der Dokumentation Dubl<strong>in</strong> Core Terms (dct:) zu verwenden,<br />

<strong>in</strong>sbesondere e<strong>in</strong>e Auswahl aus den “Properties <strong>in</strong> the /terms/ namespace” 7 :<br />

abstract, accessRights, accrualMethod, accrualPeriodicity, accrualPolicy,<br />

alternative, audience, available, bibliographicCitation, conformsTo,<br />

contributor, coverage, created, creator, date, dateAccepted,<br />

dateCopyrighted, dateSubmitted, description, educationLevel, extent,<br />

format, hasFormat, hasPart, hasVersion, identifier, <strong>in</strong>structionalMethod,<br />

isFormatOf, isPartOf, isReferencedBy, isReplacedBy, isRequiredBy, issued,<br />

isVersionOf, language, license, mediator, medium, modified, provenance,<br />

publisher, references, relation, replaces, requires, rights, rightsHolder,<br />

source, spatial, subject, tableOfContents, temporal, title, type, valid.<br />

Infrage kommen z.B.:<br />

6 http://www.w3.org/TR/skos-primer/#secadvanceddocumentation<br />

7 http://dubl<strong>in</strong>core.org/documents/dcmi-terms/#H2<br />

V 03 Umweltbundesamt S. 25


SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />

dct:created Date of creation of the resource.<br />

dct:creator An entity primarily responsible for mak<strong>in</strong>g the resource.<br />

dct:date A po<strong>in</strong>t or period of time associated with an event <strong>in</strong> the lifecycle<br />

of the resource.<br />

dct:dateSubmitted Date of submission of the resource.<br />

dct:dateAccepted Date of acceptance of the resource.<br />

dct:isReplacedBy A related resource that supplants, displaces, or supersedes the<br />

described resource.<br />

dct:modified Date on which the resource was changed.<br />

dct:source A related resource from which the described resource is derived.<br />

Tabelle 3 Ausgewählte Dubl<strong>in</strong> Core Terms<br />

Allen geme<strong>in</strong>sam ist es, dass sie e<strong>in</strong>e “resource” beschreiben, die im Kontext der<br />

skos:Note nicht mehr e<strong>in</strong>deutig sche<strong>in</strong>t: handelt es sich um die Note selbst oder um das,<br />

was die Note annotiert? E<strong>in</strong> dct:created <strong>in</strong> e<strong>in</strong>er Note würde üblicherweise auf die Note<br />

selbst bezogen werden, denn diese ersche<strong>in</strong>t <strong>in</strong> der Rolle der resource. Wenn das<br />

dct:created e<strong>in</strong>es Concepts geme<strong>in</strong>t ist, dem die Note zugordnet ist, würde man<br />

erwarten, dass dieses dct:created dem Concept selbst zugewiesen wird und nicht der<br />

Note.<br />

Um diese Ambivalenz aufzulösen, wird folgendes empfohlen:<br />

(1) Alle Notes können mit DCT attributiert werden, diese beschreiben dann die Note selbst.<br />

(2) DCT, die das Zielobjekt (Concept oder Label) der Note beschreiben, müssen diesem<br />

selbst zugewiesen se<strong>in</strong>. Dies wird hier aber nicht empfohlen.<br />

(3) Stattdessen wird zu jedem benötigten DCT e<strong>in</strong>e gleichnamige subProperty im <strong>UMTHES</strong><br />

Namensraum („umt“) def<strong>in</strong>iert. Diese subProperty beschreibt <strong>in</strong> der Note nicht die Note,<br />

sondern das Zielobjekt. (OWL 2 „Property Cha<strong>in</strong>“).<br />

Beispiel im Schema:<br />

umt:created rdfs:subPropertyOf dct:created.<br />

Anwendung im lokalen Namensraum “umt” wie nachstehend:<br />

:abgas rdf:type skosxl:Label;<br />

skos:historyNote :thisNote<br />

:thisNote: dct:created „2009-05-25“;<br />

umt:created „1999-01-01“.<br />

Codebeispiel 12 Beschreibung von Note und Zielobjekt<br />

Diese Note wurde am „2009-05-25“ angelegt und sagt uns, dass das Label :abgas am „1999-<br />

01-01“ entstanden ist.<br />

V 03 Umweltbundesamt S. 26


SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />

4.3 Datentypen für <strong>UMTHES</strong> Notes<br />

Wenn man die Freiheiten der Related Resource Description durch typisierte Eigenschaften<br />

zügeln möchte, so kann man spezialisierte „Dokument-Typen“ für die e<strong>in</strong>zelnen<br />

Ausprägungen von skos:Note def<strong>in</strong>ieren und diese nach dem Muster „Documentation as a<br />

document reference“ verwenden.<br />

Nachstehend e<strong>in</strong>ige Entwürfe für solche Dokument-Typen.<br />

4.3.1 Alle Texttypen<br />

Geeignete Note-Typen s<strong>in</strong>d etwa:<br />

skos:def<strong>in</strong>ition<br />

skos:example<br />

skos:scopeNote<br />

skos:changeNote<br />

skos:editorialNote<br />

skos:historyNote<br />

Diese Notes erhalten e<strong>in</strong>en Freitext-Attribut umt:content und können zusätzlich Dubl<strong>in</strong><br />

Core Terms verwenden.<br />

:00000112 rdf:type skos:Concept;<br />

skosxl:prefLabel:abfall;<br />

skos:def<strong>in</strong>ition :tb-2009-05-23.<br />

:tb-2009-05-23 rdf:type umt:TextNoteData;<br />

umt:content „ Bewegliche Sachen deren sich der Besitzer entledigen<br />

will”;<br />

dct:source „1000 schnelle Def<strong>in</strong>itionen”;<br />

dct:created „2009-05-23”;<br />

dct:creator :tb.<br />

Codebeispiel 13 Texttyp für Notes<br />

4.3.2 usageNote<br />

Doma<strong>in</strong>: nur skos:Concept<br />

Range: umt:UsageNoteEnum<br />

Die <strong>UMTHES</strong> Erweiterung „usageNote“ (siehe 2.4) erhält e<strong>in</strong>e Aufzählung („Enumeration“)<br />

der gültigen Werte, die dem heutigen Namenszusatz von Ordnungsbegriffen entspricht, also<br />

z.B. „Benutze Unterbegriffe“ wie <strong>in</strong> den Beispielen für Abfall als Ordnungsbegriff (oben) und<br />

als Deskriptor (unten).<br />

Schema:<br />

umt:UsageNoteEnum owl:equivalentClass [<br />

rdf:type owl:Class ;<br />

owl:oneOf ( umt:useNarrower umt:useNarrowerRelated )<br />

] .<br />

Anwendung Ordnungsbegriff:<br />

:00041004 rdf:type skos:Concept;<br />

V 03 Umweltbundesamt S. 27


SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />

umt:usageNote umt:useNarrower;<br />

skosxl:prefLabel :abfall.<br />

Anwendung Deskriptor (ke<strong>in</strong>e usageNote):<br />

:00000112 rdf:type skos:Concept;<br />

skosxl:prefLabel :abfall.<br />

Codebeispiel 14 usageNote<br />

E<strong>in</strong> ausführlicheres Beispiel für e<strong>in</strong>e Enumeration siehe Codebeispiel 6 Umweltklassifikation<br />

als Enumeration, S. 16.<br />

4.3.3 expirationNote<br />

Doma<strong>in</strong>: skos:Concept oder skosxl:Label<br />

Range: umt:ExpirationNoteData<br />

:00000112 rdf:type skos:Concept;<br />

skosxl:prefLabel:abfall;<br />

umt:expirationNote :tb-2009-05-23.<br />

:tb-2009-05-23 rdf:type:ExpirationNoteData;<br />

dct:created „2009-05-23”;<br />

dct:created :tb;<br />

umt:bestBefore „2009-06-01”;<br />

umt:f<strong>in</strong>al „2010-01-01”;<br />

umt:reason „Some Reason”;<br />

umt:isReplacedBy umt:12345678.<br />

Codebeispiel 15 expirationNote<br />

Wäre am Ende des Beispiels nicht umt:isReplacedBy, sondern dct:isReplacedBy<br />

verwendet, so würde die Note ersetzt und nicht das verfallende Concept.<br />

4.3.4 editorialState<br />

Doma<strong>in</strong>: skos:Concept oder skosxl:Label<br />

Range: umt:EditorialStateData<br />

:00000112 rdf:type skos:Concept;<br />

skosxl:prefLabel:abfall;<br />

umt:editorialState :tb-2009-05-23.<br />

:tb-2009-05-23 rdf:type :EditorialStateData;<br />

dct:created „2009-05-23”;<br />

dct:created :tb;<br />

umt:state umt:onEdit;<br />

umt:rem<strong>in</strong>der „2010-01-01”;<br />

umt:editor :tb;<br />

umt:reviewer :fo<br />

umt:remark „Hello”@en.<br />

Für umt:state gibt es se<strong>in</strong>e Werteauswahl<br />

umt:EditorialStateEnum owl:equivalentClass [<br />

rdf:type owl:Class ;<br />

owl:oneOf ( umt:onEdit umt:editClosed umt:onReview umt:approved )<br />

] .<br />

V 03 Umweltbundesamt S. 28


SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />

umt:rem<strong>in</strong>der (optional) gilt als “Wiedervorlagedatum”.<br />

Codebeispiel 16 editorialState<br />

4.3.5 exportNote<br />

Doma<strong>in</strong>: skos:Concept oder skosxl:Label<br />

Range: umt:ExportNoteData<br />

In Kap. 2.2, Identität und Referenz wurde begründet, warum Concepts und Labels die bisher<br />

<strong>in</strong> vergebenen ISN mitführen sollten. Dies ist hier umgesetzt. Zusätzlich e<strong>in</strong><br />

Verweise auf die Quelle, so dass mehrere gleichartige Quellen unterstützt werden können.<br />

:abgas rdf:type skosxl:Label;<br />

skosxl:lexicalForm “Abgas”@de;<br />

umt:exportNote :ex-2009-05-23.<br />

:ex-2009-05-23 rdf:type umt:ExportNoteData<br />

dct:created „2009-05-23”;<br />

dct:creator :auto;<br />

umt:source ;<br />

umt:wlisn “00025534”;<br />

umt:ndThsisn “00000426”.<br />

Codebeispiel 17 exportNote<br />

Welche Verweise im e<strong>in</strong>zelnen genutzt werden sollten, ist nachstehender Tabelle zu<br />

entnehmen.<br />

ISN Referenz Anwendung<br />

umt:wlisn Alle Label. (Unabhängig von e<strong>in</strong>er Konvention h<strong>in</strong>sichtlich der Label<br />

URI).<br />

umt:thsisn Alle Concept. (Unabhängig von e<strong>in</strong>er Konvention h<strong>in</strong>sichtlich der<br />

Concept URI).<br />

umt:ndThsisn Alle Labels die <strong>in</strong> aDis auf Nicht-Deskriptoren zeigen, geben deren<br />

THSISN hier an. Er würde sonst im <strong>SKOS</strong> Format verloren gehen.<br />

Tabelle 4 Verweise aus umt:exportNote auf die ISN<br />

V 03 Umweltbundesamt S. 29


SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />

5 <strong>UMTHES</strong> Entitäten <strong>in</strong> <strong>SKOS</strong><br />

Dies ist die Checkliste, ob alle benötigten <strong>UMTHES</strong> Daten im (erweiterten) <strong>SKOS</strong> Modell<br />

berücksichtigt worden s<strong>in</strong>d.<br />

Zurzeit noch externes EXCEL <strong>in</strong> Arbeit.<br />

V 03 Umweltbundesamt S. 30

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!