UMTHES in SKOS - innoQ Deutschland GmbH
UMTHES in SKOS - innoQ Deutschland GmbH
UMTHES in SKOS - innoQ Deutschland GmbH
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />
Editor:<br />
<strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong><br />
Modellierung und Serialisierung des Umweltthesaurus <strong>in</strong> e<strong>in</strong>er formalen Sprache des<br />
Semantic Web.<br />
Projekt:<br />
Spezifikation, mit OWL/RDFS Schema und komplexen Beispielen.<br />
Thomas Bandholtz (tb), <strong>in</strong>noQ <strong>Deutschland</strong> <strong>GmbH</strong><br />
Erweiterung von SNS … AZ …<br />
Auftraggeber:<br />
Verteiler:<br />
www.umweltbundesamt.de<br />
Willem van Kerkhof (wvk), <strong>in</strong>noQ <strong>Deutschland</strong> <strong>GmbH</strong><br />
Joachim Fock (fo), Umweltbundesamt <strong>Deutschland</strong><br />
Jens Wissmann (jw), Forschungszentrum Informatik (FZI)<br />
Versionen reviewed by:<br />
03 25. Mai 2009<br />
wvk fo jw<br />
V 03 Umweltbundesamt S. 1
SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />
Inhalt<br />
1 E<strong>in</strong>leitung ......................................................................................................................................... 3<br />
2 <strong>SKOS</strong> Architektur aus der Sicht von <strong>UMTHES</strong> ............................................................................... 6<br />
2.1 Concept und Label .................................................................................................................. 6<br />
2.2 Identität und Referenz ............................................................................................................. 9<br />
2.2.1 Aus Sicht der Migration ................................................................................................... 9<br />
2.2.2 Aus Sicht des URI Designs ........................................................................................... 10<br />
2.2.3 <strong>UMTHES</strong> Namensraum ................................................................................................. 10<br />
2.3 Semantische Beziehungen zwischen Concepts .................................................................... 10<br />
2.4 (Ke<strong>in</strong>e) Spezialisierung von skos:Concept ........................................................................... 11<br />
2.5 (Ke<strong>in</strong>e) Concept Collections .................................................................................................. 11<br />
2.6 Concept Scheme ................................................................................................................... 12<br />
2.7 Mapp<strong>in</strong>g Properties ............................................................................................................... 12<br />
3 Lexical Properties .......................................................................................................................... 15<br />
3.1 E<strong>in</strong>fache <strong>SKOS</strong> Eigenschaften .............................................................................................. 15<br />
3.1.1 Lexical Labels ................................................................................................................ 15<br />
3.1.2 Notation vs. Enumeration .............................................................................................. 15<br />
3.2 XL Labels ............................................................................................................................... 17<br />
3.2.1 Eigenschaften von skosxl:Label .................................................................................... 17<br />
3.2.2 Asymmetrische Mehrsprachigkeit .................................................................................. 20<br />
3.2.3 Koord<strong>in</strong>ation ................................................................................................................... 21<br />
4 Documentation Properties ............................................................................................................. 23<br />
4.1 <strong>SKOS</strong> Note Typenübersicht .................................................................................................. 23<br />
4.2 DCTERMS <strong>in</strong> Documentation Properties .............................................................................. 25<br />
4.3 Datentypen für <strong>UMTHES</strong> Notes ............................................................................................ 27<br />
4.3.1 Alle Texttypen ................................................................................................................ 27<br />
4.3.2 usageNote ..................................................................................................................... 27<br />
4.3.3 expirationNote ................................................................................................................ 28<br />
4.3.4 editorialState .................................................................................................................. 28<br />
4.3.5 exportNote ..................................................................................................................... 29<br />
5 <strong>UMTHES</strong> Entitäten <strong>in</strong> <strong>SKOS</strong>..........................................................................................30<br />
V 03 Umweltbundesamt S. 2
SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />
1 E<strong>in</strong>leitung<br />
Warum e<strong>in</strong> <strong>SKOS</strong> Schema für <strong>UMTHES</strong>, und zunächst e<strong>in</strong>mal, was ist <strong>SKOS</strong>?<br />
„Das Simple Knowledge Organisation System (<strong>SKOS</strong>, frei übersetzt „e<strong>in</strong>faches System zur<br />
Organisation von Wissen“) ist e<strong>in</strong>e auf dem Resource Description Framework basierende<br />
formale Sprache zur Kodierung von Dokumentationssprachen wie Thesauri, Klassifikationen<br />
oder andere kontrollierte Vokabulare. Mit <strong>SKOS</strong> soll die e<strong>in</strong>fache Veröffentlichung und<br />
Komb<strong>in</strong>ation kontrollierter, strukturierter und masch<strong>in</strong>enlesbarer Vokabulare für das<br />
Semantische Web ermöglicht werden.“ (Wikipedia).<br />
<strong>SKOS</strong> ist für uns zunächst die formale Sprache für e<strong>in</strong> Modell, das nicht viel mehr se<strong>in</strong> will<br />
als e<strong>in</strong> logisches Datenmodell für <strong>UMTHES</strong>. Diese Sprache gibt e<strong>in</strong> abstraktes Modell vor,<br />
mit dem wir die tatsächlichen Strukturen von <strong>UMTHES</strong> formal beschreiben (Schema). Mit<br />
Bezug auf dieses Schema kann jedes e<strong>in</strong>zelne Datenelement zutreffend und vollständig<br />
beschrieben werden.<br />
Bei dieser Modellierung von <strong>UMTHES</strong> geht es um drei Schwerpunkte:<br />
(1) Die abstrakten Modelle von <strong>UMTHES</strong> und <strong>SKOS</strong> s<strong>in</strong>d zwar ähnlich, erfordern aber<br />
e<strong>in</strong>en strukturellen (auch gedanklichen) Transformationsschritt (Kap. 2, <strong>SKOS</strong><br />
Architektur aus der Sicht von <strong>UMTHES</strong>).<br />
(2) Die <strong>in</strong> <strong>SKOS</strong> vordef<strong>in</strong>ierten lexikalischen Eigenschaften müssen und können für<br />
<strong>UMTHES</strong> erweitert werden (Kap.3, Lexical Properties).<br />
(3) <strong>SKOS</strong> ermöglicht e<strong>in</strong>e striktere Typisierung der Dokumentation (<strong>UMTHES</strong><br />
„Bemerkungen“), die optional genutzt werden kann (Kap. 4 Documentation<br />
Properties).<br />
Das Resource Description Framework (RDF) und die darauf aufbauenden formalen<br />
Sprachen (z.B. <strong>SKOS</strong>) verfügen darüberh<strong>in</strong>aus über e<strong>in</strong>e masch<strong>in</strong>enlesbare Syntax. Dies<br />
gilt sowohl für das Schema (die konkrete Architektur e<strong>in</strong>es Vokabulars) als auch für das<br />
Vokabular selbst. Daraus ergeben sich vielfältige Möglichkeiten der masch<strong>in</strong>ellen Nutzung.<br />
Im gegebenen Kontext wird die Masch<strong>in</strong>enlesbarkeit von RDF/<strong>SKOS</strong> zunächst im S<strong>in</strong>ne<br />
e<strong>in</strong>es Austauschformats genutzt. <strong>SKOS</strong> hat sich <strong>in</strong> der Europäischen Umweltterm<strong>in</strong>ologie<br />
seit 2004 <strong>in</strong> dieser Rolle etabliert, daher ist <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> schon für sich alle<strong>in</strong> e<strong>in</strong><br />
Dienst im S<strong>in</strong>ne der Datenbereitstellung.<br />
Der erste Migrationsschritt des Vorhabens ist e<strong>in</strong> Export der Quelldaten aus dem<br />
Bibliothekssystem <strong>in</strong> das hier beschriebene <strong>SKOS</strong> Format. Die geplante SNS Erweiterung<br />
wird aktuelle und künftige <strong>UMTHES</strong> Daten <strong>in</strong> genau demselben Format über Services<br />
bereitstellen. Daher ist das <strong>UMTHES</strong>/<strong>SKOS</strong> Schema e<strong>in</strong> strategischer Bauste<strong>in</strong> dieses<br />
Vorhabens, gleichermaßen für das Modell und die Implementierung der Schnittstellen.<br />
V 03 Umweltbundesamt S. 3
SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />
Die feste Adresse der <strong>SKOS</strong> Standardisierung ist:<br />
� <strong>SKOS</strong>: http://www.w3.org/2004/02/skos/<br />
Die hier verwendete <strong>SKOS</strong> Version ist die<br />
� <strong>SKOS</strong> Reference W3 Candidate Recommendation, 17 March 2009<br />
http://www.w3.org/TR/2009/CR-skos-reference-20090317/.<br />
Dazu gehört e<strong>in</strong>e lesenswerte E<strong>in</strong>führung für „Anfänger“:<br />
� <strong>SKOS</strong> Primer, Work<strong>in</strong>g Draft, 17 March 2009:<br />
http://www.w3.org/TR/2009/WD-skos-primer-20090317/<br />
Es kann se<strong>in</strong>, dass sich beim Übergang von der W3C Candidate Recommendation zur W3C<br />
Recommendation noch Änderungen ergeben, aber der Workflow des W3C löst <strong>in</strong> aller Regel<br />
die kritischen Fragen zuerst, daher s<strong>in</strong>d im abschließenden Schritt eher Detailklärungen zu<br />
erwarten. Diese werden gegebenenfalls <strong>in</strong> e<strong>in</strong>e neue Version dieses Konzepts e<strong>in</strong>gearbeitet.<br />
Für die Beispiele <strong>in</strong> den folgenden Kapiteln kommen mehrere gängige RDF/OWL Syntaxen<br />
<strong>in</strong> Frage 1 , zwei XML-Varianten, N3 oder Turtle. Die <strong>SKOS</strong> Spezifikation und der Primer<br />
verwenden die für Menschen am leichtesten lesbare Turtle Syntax, dies wird hier<br />
übernommen. Turtle schreibt die RDF Tripple etwa <strong>in</strong> nachstehender Weise (leicht<br />
vere<strong>in</strong>facht).<br />
Katze ist-e<strong>in</strong> Tier;<br />
frisst (Maus Fisch Gras);<br />
hasst Hund;<br />
hatBe<strong>in</strong>e 4;<br />
gehört Mensch.<br />
Hund ist-e<strong>in</strong> Tier;<br />
frisst (Wurst Chips Katze);<br />
hasst Katze;<br />
hatBe<strong>in</strong>e 4.<br />
gehört Mensch.<br />
Daraus folgt (mit e<strong>in</strong>igen zusätzlichen Annahmen):<br />
Mensch liebt (Katze Hund);<br />
braucht (Maus Fisch Gras Wurst Chips);<br />
beschützt Katze;<br />
hatBe<strong>in</strong>e 2.<br />
Wenn Sie das jetzt mitlesen konnten, haben Sie Turtle schon verstanden. Natürlich folgt<br />
Mensch hatBe<strong>in</strong>e 2 ke<strong>in</strong>esfalls aus dem zuvor gesagten. Auch die Katzenfreundlichkeit<br />
des Besitzers ist spekulativ, aber man kann sich an diese formale Ausdrucksweise<br />
gewöhnen.<br />
In RDF (und auch <strong>in</strong> der Turtle Syntax) werden die Bezeichner (wie „Katze“, „ist-e<strong>in</strong>“, „Tier“<br />
im obigen Beispiel) durch e<strong>in</strong> Präfix ihrem jeweiligen Namensraum zugeordnet. Beispiele:<br />
1 http://www.w3.org/TR/2009/WD-owl2-primer-20090421/#OWL_Syntaxes<br />
V 03 Umweltbundesamt S. 4
SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />
Beispiele Namensraum<br />
rdf:type ist <strong>in</strong> RDF def<strong>in</strong>iert<br />
rdfs:label ist <strong>in</strong> RDF Schema def<strong>in</strong>iert<br />
skos:Concept ist <strong>in</strong> <strong>SKOS</strong> def<strong>in</strong>iert<br />
skosxl:Label ist <strong>in</strong> der <strong>SKOS</strong> Extension for Labels def<strong>in</strong>ert<br />
dct:date ist als Dubl<strong>in</strong> Core Term def<strong>in</strong>iert<br />
umt:date<br />
umt:<strong>in</strong>flectional<br />
umt:useNarrower<br />
:abgas<br />
:00000456<br />
s<strong>in</strong>d <strong>in</strong> der <strong>SKOS</strong> Erweiterung durch <strong>UMTHES</strong> („umt:“) def<strong>in</strong>iert<br />
Leeres Präfix (nur Doppelpunkt) - s<strong>in</strong>d im lokalen Namensraum<br />
def<strong>in</strong>iert.<br />
Tabelle 1 Verwendete Namensraum – Präfixe <strong>in</strong> diesem Dokument<br />
V 03 Umweltbundesamt S. 5
SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />
2 <strong>SKOS</strong> Architektur aus der Sicht von <strong>UMTHES</strong><br />
<strong>UMTHES</strong> muss e<strong>in</strong> wenig Umdenken. Das grobe Modell von <strong>UMTHES</strong> lässt sich<br />
beschreiben als:<br />
{ Thesaurus [ Deskriptor, Nicht-Deskriptor] } { Wörterliste }<br />
Dagegen wirkt <strong>SKOS</strong> auf den ersten Blick vere<strong>in</strong>fachend:<br />
{ Concept } { Label }<br />
Dass <strong>SKOS</strong> nicht vere<strong>in</strong>facht sieht man, wenn man auch die Beziehungen zwischen diesen<br />
Elementen betrachtet.<br />
Abbildung 1 Strukturelle Unterschiede zwischen <strong>UMTHES</strong> und <strong>SKOS</strong><br />
2.1 Concept und Label<br />
Die Semantik von skos:Concept stimmt weitgehend mit der von Deskriptor übere<strong>in</strong>. Die<br />
Unterschiede rühren eher daher, dass es <strong>in</strong> <strong>SKOS</strong> ke<strong>in</strong>e entsprechend äquivalente Klasse<br />
für Nicht-Deskriptor gibt. Das Äquivalent zur USE Beziehung (skosxl:altLabel)<br />
verweist sozusagen direkt auf e<strong>in</strong> „Wort“ <strong>in</strong> der Wörterliste.<br />
V 03 Umweltbundesamt S. 6
SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />
Lexikalische Eigenschaften (siehe Kap. 3 Lexical Properties) der Worte werden nicht direkt<br />
im Concept beschrieben, sondern sie bilden e<strong>in</strong>e eigene Klasse (3.2 XL Labels). Diese<br />
entspricht grob den E<strong>in</strong>trägen <strong>in</strong> der <strong>UMTHES</strong> Wörterliste. E<strong>in</strong> solches Label ist per se weder<br />
Deskriptor noch Synonym oder E<strong>in</strong>zelbegriff usw., dies ergibt sich erst aus dem Vorliegen<br />
und dem Typ e<strong>in</strong>er Zuordnung zu e<strong>in</strong>em Concept (skosxl:preLabel,<br />
skosxl:altLabel, skosxl:hiddenLabel).<br />
Aus Sicht von <strong>UMTHES</strong> „fehlt“ <strong>in</strong> <strong>SKOS</strong> der Nicht-Deskriptor. Aber <strong>SKOS</strong> braucht ihn nicht,<br />
denn er ist lediglich die Fassade e<strong>in</strong>es Worts, ohne eigenständige Semantik. Diese Semantik<br />
liegt alle<strong>in</strong> <strong>in</strong> der Beziehung zum Deskriptor (Concept). <strong>SKOS</strong> stellt diese Beziehung direkt<br />
zum Wort (Label) her.<br />
:00000577 rdf:type skos:Concept;<br />
skosxl:prefLabel :abgasre<strong>in</strong>igung;<br />
skosxl:altLabel :abgasre<strong>in</strong>igungsanlage.<br />
:abgasre<strong>in</strong>igung rdf:type skosxl:Label;<br />
skosxl:lexicalForm „Abgasre<strong>in</strong>igung“@de.<br />
:abgasre<strong>in</strong>igungsanlage rdf:type skosxl:Label;<br />
skosxl:lexicalForm „Abgasre<strong>in</strong>igungsanlage“@de.<br />
Codebeispiel 1 USE Beziehung ohne Nicht-Deskriptor im <strong>SKOS</strong> Modell<br />
Labels werden durch die Art ihrer Verwendung klassifiziert, und nicht von vorn here<strong>in</strong>.<br />
� Nicht-Deskriptoren im S<strong>in</strong>ne von <strong>UMTHES</strong> s<strong>in</strong>d die Untermenge aller Wörter (Label),<br />
die wenigstens e<strong>in</strong>e altLabel, aber ke<strong>in</strong>e prefLabel Beziehung zu irgende<strong>in</strong>em<br />
Concept haben. Diese Untermenge lässt sich jederzeit masch<strong>in</strong>ell identifizieren, und<br />
<strong>SKOS</strong> hebt sie nicht durch e<strong>in</strong>e explizite Klasse hervor.<br />
� Ähnlich für <strong>UMTHES</strong> E<strong>in</strong>zelbegriffe: das s<strong>in</strong>d alle Labels, die ke<strong>in</strong>erlei direkte<br />
Beziehung zu irgende<strong>in</strong>em Concept haben.<br />
Nähere Festlegungen s<strong>in</strong>d möglich, bedürfen aber e<strong>in</strong>er (zulässigen) Erweiterung des <strong>SKOS</strong><br />
Modells.<br />
H<strong>in</strong>sichtlich dieser Architektur bef<strong>in</strong>det sich <strong>SKOS</strong> <strong>in</strong> Übere<strong>in</strong>stimmung mit der<br />
gegenwärtigen Aktualisierung des ISO Standards. Leonard Will berichtete am 13.02.2009 <strong>in</strong><br />
der öffentlichen <strong>SKOS</strong> Mail<strong>in</strong>gliste:<br />
“I write as Chair of the „Data Model<strong>in</strong>g, Exchange Formats and Protocols‟ subgroup of the<br />
ISO work<strong>in</strong>g group SC9WG8/Project 25964, currently revis<strong>in</strong>g the ISO standard for thesauri<br />
for <strong>in</strong>formation retrieval, but as these standards are still <strong>in</strong> draft form anyth<strong>in</strong>g I say here is<br />
my own <strong>in</strong>terpretation of the way we are go<strong>in</strong>g, and is not authoritative”. … “The ISO model<br />
is firmly based on relationships between concepts, not terms. Terms are used as labels for<br />
concepts, as <strong>in</strong> <strong>SKOS</strong>”. 2<br />
2 http://lists.w3.org/Archives/Public/public-esw-thes/2009Feb/0033.html<br />
V 03 Umweltbundesamt S. 7
SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />
Abbildung 2 ISO UML Modell (draft) work<strong>in</strong>g group SC9WG8/Project 25964<br />
V 03 Umweltbundesamt S. 8
SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />
Die Anlage enthält e<strong>in</strong> UML Diagramm (Abbildung 2), <strong>in</strong> dem dies detailliert wird. Die<br />
Modellierung ist sehr ähnlich wie <strong>in</strong> <strong>SKOS</strong>, die Äquivalenzbeziehungen preferred und nonpreferred<br />
term verlaufen zwischen ThesaurusConcept und ThesaurusTerm, und es gibt<br />
ke<strong>in</strong>e Klasse für Nicht-Deskriptoren.<br />
Da sich die Nicht-Deskriptoren durch e<strong>in</strong>e e<strong>in</strong>fache formale Regel als Untermenge der<br />
Wörter (Label oder Term) ableiten lassen, kann <strong>UMTHES</strong> semantisch verlustfrei <strong>in</strong> beiden<br />
Modellen (<strong>SKOS</strong> und ISO) abgebildet werden.<br />
2.2 Identität und Referenz<br />
<strong>UMTHES</strong> hat heute zwei parallele Schlüsselsysteme: die THSISN <strong>in</strong> der Basistabelle und die<br />
WLISN <strong>in</strong> der Wörterliste.<br />
Wenn, wie im vorigen Kapitel erläutert, die Nicht-Deskriptoren als Klasse ganz entfallen, so<br />
entfallen auch die THSISN ihrer Instanzen (vgl. Abbildung 1). Die den Nicht-Deskriptoren<br />
äquivalente Untermenge der Label enthält E<strong>in</strong>träge aus der Wörterliste, die mit e<strong>in</strong>er WLISN<br />
identifiziert werden. Die USE / USEDFOR Beziehung <strong>in</strong> <strong>UMTHES</strong> verwendet aber an beiden<br />
Enden THISN. Die hier beteiligten Nichtdeskriptoren verweisen ihrerseits <strong>in</strong> die Wörterliste<br />
(WLISN). Beim Übergang zu <strong>SKOS</strong> kann diese Indirektion über die Nicht-Deskriptor-<br />
„Fassade“ kurzgeschlossen werden. Die neue altLabel Beziehung verweist nun direkt von<br />
der THSISN des Deskriptors auf die WLISN des dem ehemaligen Nicht-Deskriptor<br />
zugeordneten Worts.<br />
Dieses Vorgehen erlaubt e<strong>in</strong>e semantisch verlustfreie, reproduzierbare Transformation aus<br />
dem aDis Datenmodell <strong>in</strong> <strong>SKOS</strong>, aber es gibt ke<strong>in</strong>e verlustfreie Rekonstruktion der<br />
Quelldaten, da die THSISN der Nicht-Deskriptoren nicht mehr vorliegen. Dies erschwert die<br />
Qualitätssicherung der Datenmigration, und es würde jede spätere Aktualisierung des aDis<br />
Datenbestands aus dem <strong>SKOS</strong> Modell von SNS stark e<strong>in</strong>schränken. Daher wird<br />
vorgeschlagen, alle THSISN und WLISN der Quelle <strong>in</strong> e<strong>in</strong>er historyNote<br />
(umt:exportNote) mitzuführen wie näher unter (4.3.5) bei den Documentation Properties<br />
beschrieben.<br />
Für das <strong>UMTHES</strong>/<strong>SKOS</strong> Modell ergibt sich die Frage, welche ID für Concept und Label<br />
verwendet wird. Aus technischer Sicht ist dies unerheblich, solange die Transformation<br />
fehlerfrei und die Schlüssel e<strong>in</strong>deutig s<strong>in</strong>d.<br />
2.2.1 Aus Sicht der Migration<br />
Die Concepts s<strong>in</strong>d durch die THSISN der Deskriptoren identifiziert, die Labels durch die<br />
WLISN der Wörterliste. Da aber beide Schlüssel nicht untere<strong>in</strong>ander e<strong>in</strong>deutig se<strong>in</strong> müssen,<br />
wird e<strong>in</strong>e Unterscheidung benötigt, z.B. durch e<strong>in</strong> Präfix.<br />
Beispiele für solche URIs könnten se<strong>in</strong>:<br />
http://www.semantic-network.de/umthes/2009/concept/00004711<br />
http://www.semantic-network.de/umthes/2009/label/00004711<br />
oder<br />
http://www.semantic-network.de/umthes/2009/concept4711<br />
http://www.semantic-network.de/umthes/2009/label4711<br />
V 03 Umweltbundesamt S. 9
SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />
Hier ist unterstellt, dass <strong>in</strong> THSISN und WLISN zufällig der gleiche Schlüssel 00004711<br />
vergeben wurde. (E<strong>in</strong>e URI ist immer als Ganzes zu sehen: „Semantik Network kennt im<br />
<strong>UMTHES</strong> 2009 e<strong>in</strong> Concept Nr. 00004711“. Die Nummer alle<strong>in</strong> braucht nicht e<strong>in</strong>deutig se<strong>in</strong>).<br />
Dies ist nur e<strong>in</strong>e Möglichkeit, die URIs auf Basis der bisherigen THSISN und WLISN zu<br />
gestalten, sie ist ke<strong>in</strong>eswegs zw<strong>in</strong>gend, wenn alle THSISN und WLISN <strong>in</strong> exportNotes<br />
mitgeführt werden.<br />
2.2.2 Aus Sicht des URI Designs<br />
In den nachstehenden Code Beispielen werden für Labels „sprechende“ IDs verwendet, wie<br />
z.B. „:abgas“ als ID für das Label „Abgas“ anstelle der WLISN 00025534. E<strong>in</strong>e solche<br />
(technisch normalisierte) Ableitung der ID aus dem Namen ist im Semantic Web weit<br />
verbreitet, da sie sehr gut menschenlesbar ist. Solange die Namen selbst h<strong>in</strong>reichend<br />
e<strong>in</strong>deutig s<strong>in</strong>d (Vorlageform), ist dies auch technisch e<strong>in</strong>fach zu realisieren.<br />
Für Concepts, die ja unabhängig von den ihnen zugewiesenen Labels existieren, ist e<strong>in</strong>e<br />
abstrakte ID angemessen. In den Beispielen wird hier meist die THSISN verwendet.<br />
http://www.semantic-network.de/umthes/2009/00000577<br />
http://www.semantic-network.de/umthes/2009/abgasre<strong>in</strong>igung<br />
http://www.semantic-network.de/umthes/2009/abgasre<strong>in</strong>igungsanlage<br />
2.2.3 <strong>UMTHES</strong> Namensraum<br />
<strong>UMTHES</strong>/<strong>SKOS</strong> benötigt e<strong>in</strong>en autonomen Namensraum. Dieser beg<strong>in</strong>nt <strong>in</strong> den<br />
vorausgegangenen Beispielen bei http://www.semantic-network.de/umthes/.<br />
Die URI dieses Namensraums kann sich aus Datensicht jederzeit ändern, es werden <strong>in</strong>tern<br />
nur relative URIs verwendet. Für diese relativen URIs gelten E<strong>in</strong>deutigkeit und Persistenz<br />
lediglich <strong>in</strong>nerhalb des Namensraums.<br />
Zur Persistenz der gesamten URI gehört auch die des Namensraums. Dies fällt <strong>in</strong> die<br />
organisatorische Zuständigkeit und kann nicht aus de<strong>in</strong>em Datenformat heraus sichergestellt<br />
werden.<br />
2.3 Semantische Beziehungen zwischen Concepts<br />
Dies me<strong>in</strong>t ausschließlich Relationen zwischen jeweils zwei Concepts, Labels spielen hier<br />
gar ke<strong>in</strong>e Rolle. Die Äquivalenz-Beziehungen (USE / USED FOR) f<strong>in</strong>den sich nicht unter den<br />
Semantic Relations, denn dies s<strong>in</strong>d Beziehungen zwischen Concept und Label, nicht<br />
zwischen Concept und Concept. Siehe dazu unter (3.2) XL Labels.<br />
<strong>SKOS</strong> enthält vordef<strong>in</strong>ierte hierarchische und Verwandtschaftsbeziehungen.<br />
skos:semanticRelation<br />
skos:broaderTransitive<br />
skos:broader<br />
skos:narrowerTransitive<br />
skos:narrower<br />
skos:related<br />
<strong>UMTHES</strong> benötigt hier derzeit ke<strong>in</strong>e Erweiterung.<br />
V 03 Umweltbundesamt S. 10
SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />
Für die Hierarchie wird nicht die von <strong>SKOS</strong> angebotene transitive Variante verwendet.<br />
:abgas rdf:type skos:Concept;<br />
skos:narrower :abgasanlage.<br />
:anlage rdf:type skos:Concept;<br />
skos:narrower :abgasanlage.<br />
:abgasanlage rdf:type skos:Concept;<br />
skos:broader :abgas;<br />
skos:broader :anlage.<br />
Codebeispiel 2 <strong>SKOS</strong> Semantic Relations: Hierarchie<br />
In <strong>SKOS</strong> schließen sich hierarchische und related Beziehungen zwischen denselben<br />
Concepts gegenseitig aus (disjo<strong>in</strong>t). Im Beispiel open wäre :abgas skos:related<br />
:abgasanlage nicht gleichzeitig möglich.<br />
2.4 (Ke<strong>in</strong>e) Spezialisierung von skos:Concept<br />
<strong>SKOS</strong> fordert ausdrücklich dazu auf, von der Klasse Concept spezialisierte Unterklassen<br />
abzuleiten. Dies ist (2004) bei GEMET für die Groups und Themes verfolgt worden.<br />
Unterklassen „erben“ zunächst alle Eigenschaften ihrer Oberklassen. Das bedeutet, dass<br />
auch gemet:Group und gemet:Theme e<strong>in</strong>e Hierarchie bilden können wie skos:Concept.<br />
(Das illustriert nebenbei, warum e<strong>in</strong>e Unterklasse von Concept ke<strong>in</strong> Äquivalent zu den<br />
<strong>UMTHES</strong> Nicht-Deskriptoren se<strong>in</strong> kann: sie würden damit alle Beziehungstypen von<br />
Deskriptoren erben.)<br />
Zusätzlich wurden spezifische semantische Relationen zwischen skos:Concept und<br />
gemet:Group und gemet:Theme ergänzt.<br />
Im <strong>UMTHES</strong> haben wir die sog. Ordnungsbegriffe und die Top-Terms. Beiden ist<br />
geme<strong>in</strong>sam, dass sie wegen ihrer großen Allgeme<strong>in</strong>heit nicht für die Indexierung empfohlen<br />
werden, sie enthalten sprechende Namenszusätze wie „Benutze Unterbegriffe“. Ansonsten<br />
verhalten sie sich wie gewöhnliche Deskriptoren. Es gibt auch ke<strong>in</strong>e speziellen Relationen <strong>in</strong><br />
diesem Zusammenhang. Daher ersche<strong>in</strong>t e<strong>in</strong>e spezialisierte Klasse <strong>in</strong> beiden Fällen<br />
unangemessen.<br />
Zur Kennzeichnung von Top-Terms sieht <strong>SKOS</strong> e<strong>in</strong>e hasTopConcept-Relation zwischen<br />
dem (2.6) ConceptScheme und den betreffenden Concepts vor.<br />
Für Ordnungsbegriffe wurden auch (2.5) Concept Collections erwogen, aber schließlich fiel<br />
die Entscheidung für die umt:usageNote unter den (3.2) Documentation Properties. In<br />
dieser Note kann der Verwendungsh<strong>in</strong>weis angemessen codiert werden.<br />
2.5 (Ke<strong>in</strong>e) Concept Collections<br />
Neben der Hierarchie e<strong>in</strong> weiteres von <strong>SKOS</strong> angebotenes Strukturelement für Concepts.<br />
Wird <strong>in</strong> <strong>UMTHES</strong> bisher nicht explizit verwendet.<br />
V 03 Umweltbundesamt S. 11
SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />
Das Pr<strong>in</strong>zip ist <strong>in</strong> e<strong>in</strong>em verbreiteten Struktur-Beispiel dargestellt (ke<strong>in</strong>e Turtle Syntax):<br />
und <br />
============================================<br />
w<strong>in</strong>es<br />
<br />
red w<strong>in</strong>es<br />
Burgundy<br />
rose w<strong>in</strong>es<br />
white w<strong>in</strong>es<br />
Chardonnay<br />
Chablis<br />
Chen<strong>in</strong> Blanc<br />
Johannisberg Riesl<strong>in</strong>g<br />
Sauvignon Blanc<br />
<br />
sweet w<strong>in</strong>es<br />
Chen<strong>in</strong> Blanc<br />
Johannisberg Riesl<strong>in</strong>g<br />
dry w<strong>in</strong>es<br />
Chardonnay<br />
Chablis<br />
Sauvignon Blanc<br />
=================================================<br />
Abbildung 3 Beispiel für Collections<br />
Die Collections stehen hier <strong>in</strong> spitzen Klammern.<br />
2.6 Concept Scheme Beispiel <strong>UMTHES</strong> und Umweltklassifikation<br />
E<strong>in</strong> Concept Scheme bezeichnet e<strong>in</strong> komplettes Vokabular, also hier z.B. „<strong>UMTHES</strong>“. Es<br />
können im selben <strong>SKOS</strong> Graphen auch mehrere Vokabulare vorkommen, die Zuordnung der<br />
Concepts (nicht der Labels!) erfolgt über skos:<strong>in</strong>Scheme, für Top Terms mit<br />
skos:topConceptOf.<br />
Es besteht die Option, z.B. die Umweltklassifikation als eigenes Concept Scheme und jede<br />
Umweltklasse als Concept zu modellieren, die dann mit Mapp<strong>in</strong>g Properties auf <strong>UMTHES</strong><br />
Concepts bezogen werden. E<strong>in</strong>e e<strong>in</strong>fachere Alternative ist unter (3.1.2) Notation vs.<br />
Enumeration beschrieben.<br />
Der Umgang mit mehreren ConceptSchemes ist im Vorhaben nicht ausdrücklich gefordert<br />
oder angeboten, würde aber der Umweltklassifikation zu mehr „Prom<strong>in</strong>enz“ verhelfen, es<br />
gäbe dann e<strong>in</strong>e gepflegte Referenzadresse mit allen Zugriffsmöglichkeiten für Menschen und<br />
Masch<strong>in</strong>en. E<strong>in</strong> Beispiel f<strong>in</strong>det sich im folgenden Kapitel.<br />
2.7 Mapp<strong>in</strong>g Properties<br />
Diese dienen zum Querverweis zwischen Concepts, die verschiedenen ConceptSchemes<br />
angehören.<br />
Es gibt hier verschiedene Ausprägungen, darunter auch Querverweise auf andere<br />
Hierarchieebenen. Fe<strong>in</strong>e Unterschiede können mit exact, close oder related differenziert<br />
werden.<br />
V 03 Umweltbundesamt S. 12
SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />
skos:mapp<strong>in</strong>gRelation<br />
skos:closeMatch<br />
skos:exactMatch<br />
skos:broadMatch<br />
skos:narrowMatch<br />
skos:relatedMatch<br />
Wenn die Umweltklassifikation als eigenes ConceptScheme modelliert wird, dann erfolgt die<br />
Zuordnung der <strong>UMTHES</strong> Concepts über Mapp<strong>in</strong>g Properties.<br />
Zunächst werden mit uk:uklass und umt:umthes die beiden ConceptSchemes def<strong>in</strong>iert.<br />
uk:uklass rdf:type skos:ConceptScheme;<br />
dct:title "Umweltklassifikation"@de.<br />
umt:umthes rdf:type skos:ConceptScheme;<br />
dct:title "Umweltthesaurus"@de.<br />
Dann wird beispielhaft e<strong>in</strong>e Umweltklasse (uk:ab54) als skos:Concept <strong>in</strong> uk:uklass<br />
<strong>in</strong>itialisiert. Sie erhält e<strong>in</strong> (e<strong>in</strong>faches) skos:prefLabel <strong>in</strong> Deutsch, das durch e<strong>in</strong> englisches<br />
ergänzt werden kann.<br />
uk:ab54 rdf:type skos:Concept;<br />
skos:prefLabel "AB 54 Abfallbeseitigung"@de;<br />
skos:<strong>in</strong>Scheme uk:uklass.<br />
Abschließend wird beispielhaft e<strong>in</strong> Deskriptor (umt:00000477) als skos:Concept <strong>in</strong><br />
umt:umthes <strong>in</strong>itialisiert. Dieser verweist auf e<strong>in</strong> skosxl:Label umt:abgasre<strong>in</strong>igung und ist<br />
mit skos:closeMatch der Umweltklasse uk:ab54 zugordnet.<br />
:00000477 rdf:type skos:Concept;<br />
skosxl:prefLabel umt:abgasre<strong>in</strong>igung;<br />
skos:<strong>in</strong>Scheme umt:umthes<br />
skos:closeMatch uk:ab54.<br />
Codebeispiel 3 Mapp<strong>in</strong>g Properties am Beispiel <strong>UMTHES</strong> und Umweltklassifikation<br />
Die Adm<strong>in</strong>istration mehrerer skos:ConceptScheme <strong>in</strong> e<strong>in</strong>em geme<strong>in</strong>samen Graphen<br />
erfordert weitergehende Klärungen, z.B. ob es für jedes Scheme getrennte Hierarchien<br />
geben soll. Mit <strong>SKOS</strong> ist lediglich gesagt, dass Mapp<strong>in</strong>g Properties und Semantic Relations<br />
disjunkt s<strong>in</strong>d. Aber e<strong>in</strong> noch nicht vernetztes Concept lässt sich dennoch ohne Weiteres<br />
falsch <strong>in</strong>itialisieren. Hier sche<strong>in</strong>en Erweiterungen des <strong>SKOS</strong> Modells erforderlich, wenn man<br />
die beabsichtige Logik <strong>in</strong> der formalen Sprache ausdrücken will. E<strong>in</strong>e e<strong>in</strong>fachere Variante<br />
zum Umgang mit der Umweltklassifikation f<strong>in</strong>det sich <strong>in</strong> Kap. 3.1.2, Notation vs.<br />
Enumeration.<br />
Die Zuordnung zu GEMET ist e<strong>in</strong> Mapp<strong>in</strong>g zu e<strong>in</strong>em vollständig externen Vokabular. Es ist<br />
nicht ganz korrekt, hier die Mapp<strong>in</strong>g Properties zu verwenden, wenn man damit auf die<br />
jeweilige EEA-Webseite zeigt. Das Ziel e<strong>in</strong>er Mapp<strong>in</strong>g Property ist selbst e<strong>in</strong> <strong>SKOS</strong> Concept.<br />
Die <strong>SKOS</strong> Repräsentation von GEMET ist aber nicht über die dar<strong>in</strong> enthaltenen URI<br />
erreichbar (diese leiteten um auf die jeweilige Webseite). Letzeres ist aus formaler Sicht ke<strong>in</strong><br />
H<strong>in</strong>derungsgrund, der e<strong>in</strong>en Verweis verbieten würde. Die im <strong>SKOS</strong> GEMET verwendeten<br />
V 03 Umweltbundesamt S. 13
SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />
URI s<strong>in</strong>d die von der Autorität vergebenen Resource-IDs und als solche gültig, auch wenn<br />
sie nicht unmittelbar dereferenziert werden können.<br />
<strong>UMTHES</strong> hat jedoch Interesse, die EUA auf diesen Sachstand h<strong>in</strong>zuweisen. Die<br />
Bereitstellung von GEMET ist aus Sicht des Semantic Web unvollständig und entspricht nicht<br />
dem Stand der Technik [CoolURI].<br />
:00000477 rdf:type skos:Concept;<br />
skosxl:prefLabel umt:abgasre<strong>in</strong>igung;<br />
skos:<strong>in</strong>Scheme umt:umthes<br />
skos:closeMatch uk:ab54<br />
skos:closeMatch http://www.eionet.europa.eu/gemet/concept/9080<br />
Codebeispiel 4 Mapp<strong>in</strong>g Properties für <strong>UMTHES</strong> und GEMET<br />
Alle derartigen Zuordnungen im <strong>UMTHES</strong> können zunächst mit skos:closeMatch<br />
abgebildet werden, wenn e<strong>in</strong>e automatische Unterscheidung zwischen den Varianten nicht<br />
möglich ersche<strong>in</strong>t.<br />
V 03 Umweltbundesamt S. 14
SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />
3 Lexical Properties<br />
Jedem Concept werden Wörter (Label) zugeordnet. Jedes Wort wird durch e<strong>in</strong>en Namen<br />
repräsentiert.<br />
In natürlicher Sprache tauchen <strong>in</strong> erster L<strong>in</strong>ie Wortformen auf. Dies können grammatisch<br />
begründete (also Mehrzahl, Genitiv, Vergangenheit usw.) oder andere Varianten wie z.B.<br />
Abkürzungen se<strong>in</strong>, die oft une<strong>in</strong>heitlich s<strong>in</strong>d. Diese ganze “Wolke” von Zeichenketten, durch<br />
die e<strong>in</strong> Wort repräsentiert ist, wird als se<strong>in</strong>e „lexikalische Form“ bezeichnet: „A lexical form is<br />
an abstract unit represent<strong>in</strong>g a set of wordforms differ<strong>in</strong>g only <strong>in</strong> <strong>in</strong>flection and not <strong>in</strong> core<br />
mean<strong>in</strong>g.” 3<br />
In e<strong>in</strong>em etwas erweiterten S<strong>in</strong>n reden wir auch von lexikalischen Eigenschaften (lexical<br />
properties).<br />
3.1 E<strong>in</strong>fache <strong>SKOS</strong> Eigenschaften<br />
3.1.1 Lexical Labels<br />
Ausgangspunkt ist e<strong>in</strong> sehr generisches rdfs:Label, mit dem sich jeder beliebigen Instanz<br />
irgend e<strong>in</strong>er Klasse Namen zuweisen lassen. Dabei wird Mehrsprachigkeit durch e<strong>in</strong>en<br />
Language Code unterstützt. Der Wert e<strong>in</strong>es rdfs:Label muss nicht e<strong>in</strong>e Zeichenkette se<strong>in</strong>,<br />
es handelt sich um e<strong>in</strong>en RDF literal value, was viele Möglichkeiten eröffnet. Meist wird aber<br />
e<strong>in</strong>fach der Name angegeben, mit dem das Objekt angezeigt werden soll („Vorlageform“).<br />
Für RDF Tools ist es heute e<strong>in</strong> Standardverhalten, neben der ID (URL) e<strong>in</strong>er Instanz auch<br />
ihren Namen (rdfs:label) anzuzeigen, unter Berücksichtigung der aktuellen Sprache.<br />
<strong>SKOS</strong> hat dieses Modell zunächst semantisch untergliedert <strong>in</strong> skos:prefLabel,<br />
skos:altLabel und skos:hiddenLabel.<br />
:00000577 rdf:type skos:Concept;<br />
skos:prefLabel „Abgasre<strong>in</strong>igung“@de;<br />
skos:altLabel „Abgasre<strong>in</strong>igungsanlage“@de.<br />
Codebeispiel 5 E<strong>in</strong>fache Lexical Labels<br />
Schließlich hat man darüber h<strong>in</strong>aus die Schwäche e<strong>in</strong>er e<strong>in</strong>fachen Wertzuweisung erkannt<br />
und <strong>SKOS</strong> um XL Labels erweitert. Erst diese Erweiterung ermöglicht e<strong>in</strong>e angemessene<br />
Modellierung unter E<strong>in</strong>beziehung aller <strong>in</strong> <strong>UMTHES</strong> gepflegten lexikalischen Eigenschaften.<br />
Siehe dazu näher <strong>in</strong> (3.2) XL Labels.<br />
3.1.2 Notation vs. Enumeration<br />
Zwei gebräuchliche Methoden, um den Wertebereich von Lexical Lables zu formalisieren.<br />
Notationen s<strong>in</strong>d Zeichenketten mit Angabe e<strong>in</strong>es „Datentyps“. E<strong>in</strong> Beispiel wäre<br />
skos:notation "K"^^<br />
3 http://www.sil.org/l<strong>in</strong>guistics/GlossaryOfL<strong>in</strong>guisticTerms/WhatIsALexicalForm.htm<br />
V 03 Umweltbundesamt S. 15
SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />
ist hier der „Datentyp“. Er wird durch e<strong>in</strong>e URL angegeben.<br />
Diese URL könnte zum Look-Up für den Wertevorrat führen, dies ist aber nicht ausdrücklich<br />
standardisiert.<br />
Man könnte sich nun vorstellen:<br />
:concept4711 rdf:type skos:Concept;<br />
skos:notation "AB10"^^<br />
In diesem Modell können jedoch weder Codierung noch Wortgut oder Hierarchie der<br />
Umweltklassifikation formal beschrieben werden. Letztlich besteht hier jede Notation aus<br />
zwei beliebigen Zeichenketten, es fehlt e<strong>in</strong> Referenzsystem gültiger Umweltklassen.<br />
Das <strong>in</strong> (2.6) Concept Scheme angesprochene Vorgehen über Mapp<strong>in</strong>g Properties ist<br />
wesentlich aussagekräftiger (aber auch aufwändiger).<br />
E<strong>in</strong> Kompromiss, der das Wortgut berücksichtigt, wenn auch nicht e<strong>in</strong>e formale Hierarchie,<br />
liegt <strong>in</strong> e<strong>in</strong>er Referenz auf e<strong>in</strong>e flache Wertetabelle (Enumeration).<br />
Im Schema:<br />
(1) Die Wertetabelle umt:UmweltklasseEnum, jeder zugehörige Wert wird durch e<strong>in</strong><br />
„Individual“ aufgezählt (owl:oneof).<br />
umt:UmweltklasseEnum owl:equivalentClass [<br />
rdf:type owl:Class ;<br />
owl:oneOf (umt:ab umt:ab10 umt:ab20 usw.… )<br />
] .<br />
(2) Jeder Wert erhält mehrsprachige Bezeichner.<br />
umt:ab rdfs:label „AB Abfall“@de;<br />
rdfs:label „AB Waste“@en.<br />
umt:ab10 rdfs:label „AB10 Abfallentstehung, Abfallaufkommen, …“@de;<br />
rdfs:label „AB10 Types and occurrence of waste“@en.<br />
usw. für jede Umweltklasse.<br />
(3) E<strong>in</strong>e Property (z.B. umt:classified) def<strong>in</strong>ieren und deren Wert mit der Wertetabelle<br />
h<strong>in</strong>terlegen.<br />
umt:classified rdf:type rdfs:ObjectProperty;<br />
rdfs:range umt:UmweltklasseEnum.<br />
In der Anwendung:<br />
:concept4711 rdf:type skos:Concept;<br />
umt:classified umt:ab10.<br />
Codebeispiel 6 Umweltklassifikation als Enumeration<br />
V 03 Umweltbundesamt S. 16
SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />
3.2 XL Labels<br />
<strong>SKOS</strong> eXtension for Labels (XL) ist als optionale Erweiterung im Standard enthalten. Sie<br />
erlaubt komplexere lexikalische Modelle, <strong>in</strong> denen Labels selbst attributiert und mite<strong>in</strong>ander<br />
<strong>in</strong> Beziehung gebracht werden können.<br />
skosxl:Label ist e<strong>in</strong>e eigenständige Klasse. <strong>SKOS</strong> XL gibt ihr e<strong>in</strong> e<strong>in</strong>ziges vordef<strong>in</strong>iertes<br />
Attribut skosxl:literalForm, das semantisch dem rdfs:label entspricht.<br />
Da wir es aber nun mit e<strong>in</strong>er Label-Klasse zu tun haben, können wir jedes Label um<br />
zusätzlich Attribute erweitern und Labels zue<strong>in</strong>ander <strong>in</strong> Beziehung setzten.<br />
Dennoch können wir Concept und Label wie gewohnt verknüpfen: <strong>SKOS</strong> XL kennt drei<br />
Relationen von skos:Concept zu skosxl:Label<br />
skosxl:prefLabel - Vorzugsbegriff<br />
skosxl:altLabel - Synonymverweis<br />
skosxl:hiddenLabel – Interner Begriff, der nicht nach außen sichtbar se<strong>in</strong> soll.<br />
Dies entspricht semantisch den e<strong>in</strong>fachen <strong>SKOS</strong> Label Properties, aber hier wird der Wert<br />
durch e<strong>in</strong>e Referenz auf e<strong>in</strong> Label Objekt angegeben, nicht direkt als e<strong>in</strong>facher „Name“ des<br />
Concepts.<br />
Das schon verwendete Beispiel:<br />
:00000577 rdf:type skos:Concept;<br />
skos:prefLabel „Abgasre<strong>in</strong>igung“@de;<br />
skos:altLabel „Abgasre<strong>in</strong>igungsanlage“@de.<br />
… liest sich <strong>in</strong> <strong>SKOS</strong> XL:<br />
:00000577 rdf:type skos:Concept;<br />
skosxl:prefLabel :abgasre<strong>in</strong>igung;<br />
skosxl:altLabel :abgasre<strong>in</strong>igungsanlage.<br />
:abgasre<strong>in</strong>igung rdf:type skosxl:Label;<br />
skosxl:lexicalForm „Abgasre<strong>in</strong>igung“@de.<br />
:abgasre<strong>in</strong>igungsanlage rdf:type skosxl:Label;<br />
skosxl:lexicalForm „Abgasre<strong>in</strong>igungsanlage“@de.<br />
Codebeispiel 7 skos:Concept und skosxl:Label<br />
Das macht so noch ke<strong>in</strong>en erkennbaren S<strong>in</strong>n, denn es sagt nicht mehr als die e<strong>in</strong>fachere<br />
skos: Variante. Die zusätzlichen Möglichkeiten ergeben sich aber daraus, dass sich nun<br />
weitere Eigenschaften e<strong>in</strong>es Labels beschreiben lassen als lediglich „der Name auf dem<br />
Etikett“.<br />
3.2.1 Eigenschaften von skosxl:Label<br />
Das vordef<strong>in</strong>ierte skosxl:Label kennt ausschließlich e<strong>in</strong>e (1) lexikalische Form:<br />
skosxl:literalForm – (genau 1) entspricht der „Vorlageform“, also z.B. mit<br />
Qualifier oder Benutzungsh<strong>in</strong>weis.<br />
V 03 Umweltbundesamt S. 17
SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />
Für <strong>UMTHES</strong> ergänzen wir jedes Label (bzw. dessen Vorlageform) um weitere Attribute:<br />
� Kodierung des Endungsmusters:<br />
umt:baseForm – „Ansetzungsform“.<br />
umt:<strong>in</strong>flectionalCode – Endungscode.<br />
� Aufzählung lexikalischer Varianten:<br />
umt:lexicalVariant – (mehrfach) lexikalische Variante der Vorlageform.<br />
Diese hat drei Formen:<br />
E<strong>in</strong> konstruiertes Beispiel:<br />
umt:<strong>in</strong>flectional –e<strong>in</strong>zelne, ausgeschriebene Flexionsformen.<br />
umt:acronym – optional abgekürzte Schreibweisen.<br />
umt:cultural – optional kulturell abweichende Schreibweisen.<br />
:fernsehen rdf:type skosxl:Label;<br />
skosxl:literalForm “Fernsehen“@de;<br />
umt:baseForm “Fernsehe“;<br />
umt:<strong>in</strong>flectionalCode “xyz”<br />
umt:<strong>in</strong>flectional “Fernsehen”;<br />
umt:<strong>in</strong>flectional “Fernsehens”;<br />
umt:<strong>in</strong>flectional “Fernseher”;<br />
umt:<strong>in</strong>flectional “Fernsehern”;<br />
umt:acronym “TV”;<br />
umt:cultural “Glotze”.<br />
Abbildung 4 Erweiterte e<strong>in</strong>fache Properties von skosxl:Label<br />
Label-zu-Label Relationen können grundsätzlich beliebige Beziehungen zwischen Labels<br />
ausdrücken. Der <strong>SKOS</strong> Primer erläutert dies am Beispiel von Abkürzungen. Da wir die<br />
Abkürzung aber als e<strong>in</strong> Attribut der zugehörigen Vorlageform ansehen, folgen wir diesem<br />
Beispiel nicht. Die Abkürzung ist aus unserer Sicht ke<strong>in</strong> eigenes Label, da sie ke<strong>in</strong>e weiteren<br />
Eigenschaften hat, die beschrieben werden müssten. Auch Varianten e<strong>in</strong>er Abkürzung<br />
können ohne Weiteres durch mehrfaches umt:acronym ausgedrückt werden.<br />
Andererseits hätte man im obigen Beispiel aus „Glotze“ e<strong>in</strong> eigenes Label mit allen<br />
zugehörigen Varianten machen können. Dies hängt letztlich von den jeweiligen Ressourcen<br />
und Prioritäten ab. Aus formaler Sicht gilt:<br />
Die Entscheidung für e<strong>in</strong>e Label Relation fällt immer dann, wenn beide Beteiligte außer<br />
ihrem jeweiligen Namen weitere eigenständige lexikalische Eigenschaften mitführen. In<br />
diesem Fall <strong>in</strong>stantiiert man zwei Labels und verb<strong>in</strong>det sie mir e<strong>in</strong>er …<br />
skosxl:labelRelation – zunächst unspezifische Relation zwischen zwei Labels,<br />
dient lediglich als Erweiterungspunkt für spezifische Relationen.<br />
<strong>UMTHES</strong>-Anwendungen:<br />
V 03 Umweltbundesamt S. 18
SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />
umt:translation – hier als direkte Beziehung zwischen Labels, nicht vermittelt<br />
über e<strong>in</strong> geme<strong>in</strong>sames Concept, dem Labels <strong>in</strong> mehreren Sprachen zugewiesen s<strong>in</strong>d.<br />
Letzteres sagt nicht ausdrücklich, welches Label welches andere Label übersetzt,<br />
daher ist die direkte Zuordnung zwischen Labels präziser. Daraus kann nicht<br />
abgeleitet werden, dass e<strong>in</strong> Label se<strong>in</strong>em Concept zwangsläufig e<strong>in</strong>en Schwarm ihm<br />
zugeordneter Übersetzungen „vererbt“. Beides ist unabhängig zu sehen.<br />
umt:compoundFrom – e<strong>in</strong> zusammengesetztes Label zeigt auf e<strong>in</strong>e Liste se<strong>in</strong>er<br />
Komponenten (die selbst Labels s<strong>in</strong>d), kann mehrfach vorkommen.<br />
umt:hasQualifier – Ist die lexicalForm e<strong>in</strong> Homograph („Weide“), dann wird sie<br />
mit e<strong>in</strong>em Namenszusatz (=qualifier) ergänzt („Weide [Salix]“). Dieser Qualifier<br />
(„Salix“) ist selbst e<strong>in</strong> Label.<br />
umt:lexicalExtension – Wenn es für Labels lexikalische Varianten mit eigenen<br />
Beugungsformen gibt, soll für jede dieser Varianten e<strong>in</strong> eigenes Label verwendet<br />
werden. Dies gilt z.B. für alte und neue deutsche Rechtschreibung (:schiffahrt<br />
:schifffahrt), aber möglicherweise auch für substantivische und Verbform<br />
(:re<strong>in</strong>igung :re<strong>in</strong>igen).<br />
Labels können darüber h<strong>in</strong>aus alle <strong>SKOS</strong> Documentation Properties verwenden. Dazu mehr<br />
<strong>in</strong> Kap. 4 Documentation Properties.<br />
Abschließend das Beispiel Abgasre<strong>in</strong>igungsanlage aus dieser Sicht. Zunächst die drei<br />
elementaren Labels:<br />
:abgas rdf:type skosxl:Label;<br />
skosxl:literalForm “Abgas“@de;<br />
umt:baseForm “Abgas“;<br />
umt:<strong>in</strong>flectionalCode “CC”<br />
umt:<strong>in</strong>flectional “Abgase”;<br />
umt:<strong>in</strong>flectional “Abgases”;<br />
umt:<strong>in</strong>flectional “Abgasen”.<br />
:re<strong>in</strong>igung rdf:type skosxl:Label;<br />
skosxl:literalForm “Re<strong>in</strong>igung“@de;<br />
umt:baseForm “Re<strong>in</strong>igung“;<br />
umt:<strong>in</strong>flectionalCode “D0”<br />
umt:<strong>in</strong>flectional “Re<strong>in</strong>igungen”.<br />
:anlage rdf:type skosxl:Label;<br />
skosxl:literalForm “Anlage“@de;<br />
umt:baseForm “Anlage“;<br />
umt:<strong>in</strong>flectionalCode “D3”<br />
umt:<strong>in</strong>flectional “Anlagen”.<br />
E<strong>in</strong>e beispielhafte Übersetzung:<br />
:wasteGas rdf:type skosxl:Label;<br />
skosxl:literalForm “waste gas“@en;<br />
… weitere Properties …<br />
umt:translation :abgas.<br />
E<strong>in</strong>e (experimentelle) lexicalExtension als Option:<br />
V 03 Umweltbundesamt S. 19
SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />
:re<strong>in</strong>igen rdf:type skosxl:Label;<br />
skosxl:literalForm “re<strong>in</strong>igen“@de;<br />
umt:baseForm “re<strong>in</strong>ig“;<br />
umt:<strong>in</strong>flectionalCode “??”<br />
umt:<strong>in</strong>flectional “re<strong>in</strong>ige”;<br />
umt:<strong>in</strong>flectional “re<strong>in</strong>igen”;<br />
umt:<strong>in</strong>flectional “re<strong>in</strong>igte”;<br />
umt:<strong>in</strong>flectional “gere<strong>in</strong>igt”;<br />
umt:<strong>in</strong>flectional “gere<strong>in</strong>igte”;<br />
umt:<strong>in</strong>flectional “gere<strong>in</strong>igter”;<br />
umt:<strong>in</strong>flectional “gere<strong>in</strong>igtes”;<br />
umt:<strong>in</strong>flectional “re<strong>in</strong>igend”;<br />
umt:<strong>in</strong>flectional “re<strong>in</strong>igende”;<br />
umt:<strong>in</strong>flectional “re<strong>in</strong>igender”;<br />
umt:<strong>in</strong>flectional “re<strong>in</strong>igendes”.<br />
:re<strong>in</strong>igung umt:lexicalExtension :re<strong>in</strong>igen.<br />
E<strong>in</strong>fache Zusammensetzungen, wie z.B. „Abgasre<strong>in</strong>igung“.<br />
:abgasre<strong>in</strong>igung rdf:type skosxl:Label;<br />
skosxl:literalForm “Abgasre<strong>in</strong>igung“@de;<br />
umt:baseForm “Abgasre<strong>in</strong>igung“;<br />
umt:<strong>in</strong>flectionalCode “D0”<br />
umt:<strong>in</strong>flectional “Abgasre<strong>in</strong>igungen”;<br />
umt:compoundFrom (:abgas :re<strong>in</strong>igung).<br />
Komplexere Zusammensetzungen lassen sich mehrfach auflösen:<br />
:abgasre<strong>in</strong>igungsanlage rdf:type skosxl:Label;<br />
skosxl:literalForm “Abgasre<strong>in</strong>igungsanlage“@de;<br />
umt:baseForm “Abgasre<strong>in</strong>igungsanlage“;<br />
umt:<strong>in</strong>flectionalCode “D3”<br />
umt:<strong>in</strong>flectional “Abgasre<strong>in</strong>igunganlagen”;<br />
umt:compoundFrom (:abgas :re<strong>in</strong>igungsanlage);<br />
umt:compoundFrom (:abgasre<strong>in</strong>igung :anlage).<br />
Nutzung im Concept.<br />
:00000477 rdf:type skos:Concept;<br />
skosxl:prefLabel :abgasre<strong>in</strong>igung;<br />
skosxl:altLabel :abgasre<strong>in</strong>igungsanlage.<br />
Codebeispiel 8 Wortformen und Dekomposition<br />
3.2.2 Asymmetrische Mehrsprachigkeit<br />
<strong>SKOS</strong> ist mit Blick aus symmetrische Mehrsprachigkeit entstanden: e<strong>in</strong> Konzept kann<br />
prefLabels <strong>in</strong> mehreren Sprachen haben, aber nur e<strong>in</strong>es je Sprache. Das Concept selbst hat<br />
ke<strong>in</strong>e „eigene“ Sprache, es wird angenommen, dass dieses Concept <strong>in</strong> allen Sprachen<br />
bekannt ist.<br />
Bei asymmetrischer Mehrsprachigkeit geht man davon aus, dass auch die Concepts<br />
sprachspezifisch s<strong>in</strong>d (es gibt ke<strong>in</strong>e vollständig exakte Übersetzung), daher sollte e<strong>in</strong><br />
Concept hier nur e<strong>in</strong> e<strong>in</strong>ziges prefLabel haben, und dessen Sprache entscheidet über die<br />
Sprache des Concepts. Man könnte daraus auch explizite Unterklassen GermanConcept<br />
und EnglishConcept ableiten.<br />
V 03 Umweltbundesamt S. 20
SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />
Was macht e<strong>in</strong> sprachabhängiges Concept überhaupt aus: nicht nur die Sprache des<br />
zugeordneten Labels, sondern möglicherweise auch sprachabhängige Beziehungen, also<br />
z.B. eigenständige Hierarchien <strong>in</strong> jeder Sprache. Diese Fragen s<strong>in</strong>d bisher nicht vollständig<br />
erschlossen und für <strong>UMTHES</strong> nicht ausgeführt, alle englischen Begriffe s<strong>in</strong>d Nicht-<br />
Deskriptoren. Daraus folgt, dass sie ausschließlich als skos:altLabel Verwendung f<strong>in</strong>den:<br />
also wird es ausschließlich deutsche Concepts <strong>in</strong> <strong>UMTHES</strong> 4 geben.<br />
Als skosxl:altLabel können Label aller Sprachen une<strong>in</strong>geschränkt an Concepts gebunden<br />
werden. Dies sagt nur aus, dass all diese Wörter ungefähr dieses Concept beschreiben,<br />
nicht aber welches von ihnen e<strong>in</strong>e Übersetzung des Vorzugsbegriffs (skosxl:prefLabel) ist.<br />
Auch Übersetzungsbeziehungen <strong>in</strong>nerhalb der mehrsprachigen altLabels s<strong>in</strong>d so nicht<br />
erkennbar.<br />
Daraus ergeben sich zwei Anforderungen:<br />
(1) Labels s<strong>in</strong>d e<strong>in</strong>sprachig, und<br />
(2) Explizite Übersetzungsbeziehungen (wenn gewollt) werden zwischen den Labels<br />
direkt e<strong>in</strong>gerichtet, nicht aus geme<strong>in</strong>samen Concepts abgeleitet.<br />
Letztlich ist für die Zukunft auch die Möglichkeit zu betrachten, dass e<strong>in</strong> Vokabular sowohl<br />
sprachspezifische als auch symmetrische mehrsprachige Concepts enthält.<br />
:abfall rdf:type skosxl:Label;<br />
skosxl:literalForm “Abfall“@de.<br />
:waste rdf:type skosxl:Label;<br />
skosxl:literalForm “waste“@en;<br />
umt:translation :abfall.<br />
Symmetrisch:<br />
:00000112 rdf:type skos:Concept;<br />
skosxl:prefLabel :abfall;<br />
skosxl:prefLabel :waste.<br />
Aymmetrisch:<br />
:00000112 rdf:type skos:Concept;<br />
skosxl:prefLabel :abfall;<br />
:00000xyz rdf:type skos:Concept;<br />
skosxl:prefLabel :waste.<br />
Codebeispiel 9 Mehrsprachigkeit<br />
3.2.3 Koord<strong>in</strong>ation<br />
Dieses Strukturelement wird <strong>in</strong> <strong>UMTHES</strong> “Benutze Komb<strong>in</strong>ation” genannt. Man will z.B.<br />
sagen:<br />
4 SNS hat 2007 damit experimentiert, englische Deskriptoren und e<strong>in</strong>e englische Hierarchie aus den<br />
bestehenden Daten abzuleiten.<br />
V 03 Umweltbundesamt S. 21
SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />
Und nicht<br />
Rauchgasentschwefelung USE (Rauchgas UND Abgasentschwefelung)<br />
Rauchgasentschwefelung USE (Rauchgas ODER Abgasentschwefelung).<br />
In <strong>SKOS</strong> 5 <strong>in</strong>stanziieren wir zunächst zwei Concepts (Deskriptoren) :00020299 und<br />
:00020299, die beide auf :rauchgasentschwefelung als altLabel verweisen.<br />
:00020299 rdf:type skos:Concept;<br />
skosxl:prefLabel :rauchgas;<br />
skosxl:altLabel :rauchgasentschwefelung.<br />
:00000442 rdf:type skos:Concept;<br />
skosxl:prefLabel :abgasentschwefelung;<br />
skosxl:altLabel :rauchgasentschwefelung.<br />
Dies alle<strong>in</strong> ist e<strong>in</strong> H<strong>in</strong>weis, dass :rauchgasentschwefelung mit beiden Deskriptoren zu<br />
tun haben kann. Zwischen den Deskriptoren besteht e<strong>in</strong>e nicht-ausschließliche ODER-<br />
Beziehung. Koord<strong>in</strong>ation oder Benutze-Komb<strong>in</strong>ation führt UND-Beziehungen zwischen<br />
benannten Deskriptoren e<strong>in</strong>. (Es kann auch vorkommen, dass e<strong>in</strong>em Label drei Deskriptoren<br />
zugeordnet s<strong>in</strong>d, aber nicht alle tauchen <strong>in</strong> e<strong>in</strong>er Koord<strong>in</strong>ation auf).<br />
Dies lässt sich als Relation vom Label auf e<strong>in</strong>e RDF Liste von koord<strong>in</strong>ierten Deskriptoren<br />
ausdrücken wie <strong>in</strong> nachstehendem Beispiel.<br />
:rauchgasentschwefelung rdf:type skosxl:Label;<br />
umt:coord<strong>in</strong>ationOf (:00020299 :00000442).<br />
Codebeispiel 10 Koord<strong>in</strong>ation<br />
5 Das folgende übernimmt im Wesentlichen e<strong>in</strong> Beispiel aus dem <strong>SKOS</strong> Primer.<br />
V 03 Umweltbundesamt S. 22
SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />
4 Documentation Properties<br />
Diese Eigenschaften s<strong>in</strong>d von owl:AnnotationProperty abgeleitet und unterscheiden sich<br />
lediglich nach der im Namen angedeuteten Aufgabe, nicht aber h<strong>in</strong>sichtlich ihrer <strong>in</strong>neren<br />
Struktur.<br />
4.1 <strong>SKOS</strong> Note Typenübersicht<br />
--- FUSSNOTE1 Umt:Deskriptor erfordert als Äquivalent zu skos:Concept als wesentlichem Inhalt e<strong>in</strong>e<br />
Begriffsdef<strong>in</strong>ition. Diese wird als Def<strong>in</strong>ition oder als scopeNote abgelegt. In <strong>UMTHES</strong> liegen<br />
Begriffsdef<strong>in</strong>itionen derzeit für etwa von 11 493 Deskriptoren vor (Stand 22.5.2009). Vorübergehend<br />
könnte e<strong>in</strong>e möglichst e<strong>in</strong>deutige Begriffsbenennung an Stelle e<strong>in</strong>er Def<strong>in</strong>ition stehen. BK-NDs <strong>in</strong><br />
<strong>UMTHES</strong> stellen eigene Begriffe dar …<br />
� Die <strong>UMTHES</strong> Bemerkungs-Typen<br />
T0808 „role“ nach TI808-Schlüssel gekennzeichnet übernehmen<br />
� Weitere Quellattribute<br />
b Def<strong>in</strong>ition<br />
a Quelle der Anregung<br />
c Benutzungsh<strong>in</strong>weise<br />
d red. Bemerkung<br />
V 03 Umweltbundesamt S. 23
SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />
In der folgenden Übersicht über die vordef<strong>in</strong>ierten skos:Note Klassen s<strong>in</strong>d Def<strong>in</strong>itionen<br />
(skos:def<strong>in</strong>ition) aus dem <strong>SKOS</strong> RDF Schema <strong>in</strong> kursiv angegeben.<br />
Note <strong>SKOS</strong> <strong>UMTHES</strong><br />
skos:note A general note, for any purpose. Verwendung generell so nicht empfohlen.<br />
Alle Notes erhalten Datum und<br />
Bearbeiterkürzel.<br />
semantisch:<br />
skos:def<strong>in</strong>ition A statement or formal explanation<br />
of the mean<strong>in</strong>g of a concept.<br />
skos:example An example of the use of a<br />
concept.<br />
skos:scopeNote A note that helps to clarify the<br />
mean<strong>in</strong>g and/or the use of a<br />
concept.<br />
redaktionell:<br />
skos:changeNote A note about a modification to a<br />
concept.<br />
skos:editorialNote A note for an editor, translator or<br />
ma<strong>in</strong>ta<strong>in</strong>er of the vocabulary.<br />
skos:historyNote A note about the past<br />
state/use/mean<strong>in</strong>g of a concept.<br />
erweitert:<br />
Tabelle 2 skos:Note Unterklassen und <strong>UMTHES</strong> Dokumentation<br />
(Text) Typ b. Liegen für die meisten<br />
Deskriptoren vor. Teilweise aber im S<strong>in</strong>ne<br />
von Scope Notes.<br />
Bisher nicht ausgewiesen.<br />
(Text) Eventuell Typ c. Kann aber auch als<br />
Typ b vorkommen?<br />
(Text) Datum und Bearbeiter kommen aus<br />
anderen Feldern. Notes dazu wohl unter Typ<br />
d? siehe Tabelle …<br />
(Text) Typ d.<br />
(Text) Wenn dann bisher unter Typ d.<br />
umt:exportNote --- Strukturierte Daten, WLISN und THSISN<br />
umt:sourceNote --- (Text) Typ a.<br />
umt:usageNote --- Typ c?<br />
Enumeration, z.B. Kennzeichnung von OD.<br />
Beispiel: umt:00041004<br />
umt:usageNote umt:useLower;<br />
umt:editorialState --- Quelle kennt mehrere Stati, siehe Tabelle<br />
…<strong>in</strong> Kap. 3<br />
umt:expirationNote --- Strukturierte Daten<br />
V 03 Umweltbundesamt S. 24
SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />
Weder OWL noch <strong>SKOS</strong> machen irgende<strong>in</strong>e E<strong>in</strong>schränkung zum Wertebereich (range) von<br />
Notes. Der <strong>SKOS</strong> Primer beschreibt aber drei empfohlene Patterns 6 :<br />
� "documentation as an RDF literal",<br />
� "documentation as a related resource description”<br />
� "documentation as a document reference"<br />
Hier e<strong>in</strong> Beispiel für Related Resource Description aus dem <strong>SKOS</strong> Primer:<br />
ex:tomato skos:changeNote [<br />
rdf:value "Moved from under 'fruits' to under 'vegetables'"@en;<br />
dct:creator ex:HoraceGray;<br />
dct:date "1999-01-23"<br />
].<br />
Codebeispiel 11 related resource description<br />
Mit diesen e<strong>in</strong>fachen Mitteln kann man buchstäblich Alles zu Allem anmerken. Die <strong>in</strong> (2.2)<br />
Identität und Referenz begründete exportNote (historyNote) kann dann z.B. so aussehen:<br />
:abgas umt:exportNote [<br />
umt:source ;<br />
umt:wlisn “00025534”;<br />
umt:ndThsisn “00000426”;<br />
dct:date "2009-05-23"<br />
].<br />
Dieses Beispiel enthält die WLISN (umt:wlisn) und die THSISN des ehemals zugehörigen<br />
Nicht-Deskriptors (umt:ndThsisn) für e<strong>in</strong> Label mit neuer ID umt:abgas.<br />
Wir wollen die Nachrichtendaten aber etwas genauer typisieren.<br />
4.2 DCTERMS <strong>in</strong> Documentation Properties<br />
Es ist gute Praxis, bei der Dokumentation Dubl<strong>in</strong> Core Terms (dct:) zu verwenden,<br />
<strong>in</strong>sbesondere e<strong>in</strong>e Auswahl aus den “Properties <strong>in</strong> the /terms/ namespace” 7 :<br />
abstract, accessRights, accrualMethod, accrualPeriodicity, accrualPolicy,<br />
alternative, audience, available, bibliographicCitation, conformsTo,<br />
contributor, coverage, created, creator, date, dateAccepted,<br />
dateCopyrighted, dateSubmitted, description, educationLevel, extent,<br />
format, hasFormat, hasPart, hasVersion, identifier, <strong>in</strong>structionalMethod,<br />
isFormatOf, isPartOf, isReferencedBy, isReplacedBy, isRequiredBy, issued,<br />
isVersionOf, language, license, mediator, medium, modified, provenance,<br />
publisher, references, relation, replaces, requires, rights, rightsHolder,<br />
source, spatial, subject, tableOfContents, temporal, title, type, valid.<br />
Infrage kommen z.B.:<br />
6 http://www.w3.org/TR/skos-primer/#secadvanceddocumentation<br />
7 http://dubl<strong>in</strong>core.org/documents/dcmi-terms/#H2<br />
V 03 Umweltbundesamt S. 25
SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />
dct:created Date of creation of the resource.<br />
dct:creator An entity primarily responsible for mak<strong>in</strong>g the resource.<br />
dct:date A po<strong>in</strong>t or period of time associated with an event <strong>in</strong> the lifecycle<br />
of the resource.<br />
dct:dateSubmitted Date of submission of the resource.<br />
dct:dateAccepted Date of acceptance of the resource.<br />
dct:isReplacedBy A related resource that supplants, displaces, or supersedes the<br />
described resource.<br />
dct:modified Date on which the resource was changed.<br />
dct:source A related resource from which the described resource is derived.<br />
Tabelle 3 Ausgewählte Dubl<strong>in</strong> Core Terms<br />
Allen geme<strong>in</strong>sam ist es, dass sie e<strong>in</strong>e “resource” beschreiben, die im Kontext der<br />
skos:Note nicht mehr e<strong>in</strong>deutig sche<strong>in</strong>t: handelt es sich um die Note selbst oder um das,<br />
was die Note annotiert? E<strong>in</strong> dct:created <strong>in</strong> e<strong>in</strong>er Note würde üblicherweise auf die Note<br />
selbst bezogen werden, denn diese ersche<strong>in</strong>t <strong>in</strong> der Rolle der resource. Wenn das<br />
dct:created e<strong>in</strong>es Concepts geme<strong>in</strong>t ist, dem die Note zugordnet ist, würde man<br />
erwarten, dass dieses dct:created dem Concept selbst zugewiesen wird und nicht der<br />
Note.<br />
Um diese Ambivalenz aufzulösen, wird folgendes empfohlen:<br />
(1) Alle Notes können mit DCT attributiert werden, diese beschreiben dann die Note selbst.<br />
(2) DCT, die das Zielobjekt (Concept oder Label) der Note beschreiben, müssen diesem<br />
selbst zugewiesen se<strong>in</strong>. Dies wird hier aber nicht empfohlen.<br />
(3) Stattdessen wird zu jedem benötigten DCT e<strong>in</strong>e gleichnamige subProperty im <strong>UMTHES</strong><br />
Namensraum („umt“) def<strong>in</strong>iert. Diese subProperty beschreibt <strong>in</strong> der Note nicht die Note,<br />
sondern das Zielobjekt. (OWL 2 „Property Cha<strong>in</strong>“).<br />
Beispiel im Schema:<br />
umt:created rdfs:subPropertyOf dct:created.<br />
Anwendung im lokalen Namensraum “umt” wie nachstehend:<br />
:abgas rdf:type skosxl:Label;<br />
skos:historyNote :thisNote<br />
:thisNote: dct:created „2009-05-25“;<br />
umt:created „1999-01-01“.<br />
Codebeispiel 12 Beschreibung von Note und Zielobjekt<br />
Diese Note wurde am „2009-05-25“ angelegt und sagt uns, dass das Label :abgas am „1999-<br />
01-01“ entstanden ist.<br />
V 03 Umweltbundesamt S. 26
SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />
4.3 Datentypen für <strong>UMTHES</strong> Notes<br />
Wenn man die Freiheiten der Related Resource Description durch typisierte Eigenschaften<br />
zügeln möchte, so kann man spezialisierte „Dokument-Typen“ für die e<strong>in</strong>zelnen<br />
Ausprägungen von skos:Note def<strong>in</strong>ieren und diese nach dem Muster „Documentation as a<br />
document reference“ verwenden.<br />
Nachstehend e<strong>in</strong>ige Entwürfe für solche Dokument-Typen.<br />
4.3.1 Alle Texttypen<br />
Geeignete Note-Typen s<strong>in</strong>d etwa:<br />
skos:def<strong>in</strong>ition<br />
skos:example<br />
skos:scopeNote<br />
skos:changeNote<br />
skos:editorialNote<br />
skos:historyNote<br />
Diese Notes erhalten e<strong>in</strong>en Freitext-Attribut umt:content und können zusätzlich Dubl<strong>in</strong><br />
Core Terms verwenden.<br />
:00000112 rdf:type skos:Concept;<br />
skosxl:prefLabel:abfall;<br />
skos:def<strong>in</strong>ition :tb-2009-05-23.<br />
:tb-2009-05-23 rdf:type umt:TextNoteData;<br />
umt:content „ Bewegliche Sachen deren sich der Besitzer entledigen<br />
will”;<br />
dct:source „1000 schnelle Def<strong>in</strong>itionen”;<br />
dct:created „2009-05-23”;<br />
dct:creator :tb.<br />
Codebeispiel 13 Texttyp für Notes<br />
4.3.2 usageNote<br />
Doma<strong>in</strong>: nur skos:Concept<br />
Range: umt:UsageNoteEnum<br />
Die <strong>UMTHES</strong> Erweiterung „usageNote“ (siehe 2.4) erhält e<strong>in</strong>e Aufzählung („Enumeration“)<br />
der gültigen Werte, die dem heutigen Namenszusatz von Ordnungsbegriffen entspricht, also<br />
z.B. „Benutze Unterbegriffe“ wie <strong>in</strong> den Beispielen für Abfall als Ordnungsbegriff (oben) und<br />
als Deskriptor (unten).<br />
Schema:<br />
umt:UsageNoteEnum owl:equivalentClass [<br />
rdf:type owl:Class ;<br />
owl:oneOf ( umt:useNarrower umt:useNarrowerRelated )<br />
] .<br />
Anwendung Ordnungsbegriff:<br />
:00041004 rdf:type skos:Concept;<br />
V 03 Umweltbundesamt S. 27
SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />
umt:usageNote umt:useNarrower;<br />
skosxl:prefLabel :abfall.<br />
Anwendung Deskriptor (ke<strong>in</strong>e usageNote):<br />
:00000112 rdf:type skos:Concept;<br />
skosxl:prefLabel :abfall.<br />
Codebeispiel 14 usageNote<br />
E<strong>in</strong> ausführlicheres Beispiel für e<strong>in</strong>e Enumeration siehe Codebeispiel 6 Umweltklassifikation<br />
als Enumeration, S. 16.<br />
4.3.3 expirationNote<br />
Doma<strong>in</strong>: skos:Concept oder skosxl:Label<br />
Range: umt:ExpirationNoteData<br />
:00000112 rdf:type skos:Concept;<br />
skosxl:prefLabel:abfall;<br />
umt:expirationNote :tb-2009-05-23.<br />
:tb-2009-05-23 rdf:type:ExpirationNoteData;<br />
dct:created „2009-05-23”;<br />
dct:created :tb;<br />
umt:bestBefore „2009-06-01”;<br />
umt:f<strong>in</strong>al „2010-01-01”;<br />
umt:reason „Some Reason”;<br />
umt:isReplacedBy umt:12345678.<br />
Codebeispiel 15 expirationNote<br />
Wäre am Ende des Beispiels nicht umt:isReplacedBy, sondern dct:isReplacedBy<br />
verwendet, so würde die Note ersetzt und nicht das verfallende Concept.<br />
4.3.4 editorialState<br />
Doma<strong>in</strong>: skos:Concept oder skosxl:Label<br />
Range: umt:EditorialStateData<br />
:00000112 rdf:type skos:Concept;<br />
skosxl:prefLabel:abfall;<br />
umt:editorialState :tb-2009-05-23.<br />
:tb-2009-05-23 rdf:type :EditorialStateData;<br />
dct:created „2009-05-23”;<br />
dct:created :tb;<br />
umt:state umt:onEdit;<br />
umt:rem<strong>in</strong>der „2010-01-01”;<br />
umt:editor :tb;<br />
umt:reviewer :fo<br />
umt:remark „Hello”@en.<br />
Für umt:state gibt es se<strong>in</strong>e Werteauswahl<br />
umt:EditorialStateEnum owl:equivalentClass [<br />
rdf:type owl:Class ;<br />
owl:oneOf ( umt:onEdit umt:editClosed umt:onReview umt:approved )<br />
] .<br />
V 03 Umweltbundesamt S. 28
SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />
umt:rem<strong>in</strong>der (optional) gilt als “Wiedervorlagedatum”.<br />
Codebeispiel 16 editorialState<br />
4.3.5 exportNote<br />
Doma<strong>in</strong>: skos:Concept oder skosxl:Label<br />
Range: umt:ExportNoteData<br />
In Kap. 2.2, Identität und Referenz wurde begründet, warum Concepts und Labels die bisher<br />
<strong>in</strong> vergebenen ISN mitführen sollten. Dies ist hier umgesetzt. Zusätzlich e<strong>in</strong><br />
Verweise auf die Quelle, so dass mehrere gleichartige Quellen unterstützt werden können.<br />
:abgas rdf:type skosxl:Label;<br />
skosxl:lexicalForm “Abgas”@de;<br />
umt:exportNote :ex-2009-05-23.<br />
:ex-2009-05-23 rdf:type umt:ExportNoteData<br />
dct:created „2009-05-23”;<br />
dct:creator :auto;<br />
umt:source ;<br />
umt:wlisn “00025534”;<br />
umt:ndThsisn “00000426”.<br />
Codebeispiel 17 exportNote<br />
Welche Verweise im e<strong>in</strong>zelnen genutzt werden sollten, ist nachstehender Tabelle zu<br />
entnehmen.<br />
ISN Referenz Anwendung<br />
umt:wlisn Alle Label. (Unabhängig von e<strong>in</strong>er Konvention h<strong>in</strong>sichtlich der Label<br />
URI).<br />
umt:thsisn Alle Concept. (Unabhängig von e<strong>in</strong>er Konvention h<strong>in</strong>sichtlich der<br />
Concept URI).<br />
umt:ndThsisn Alle Labels die <strong>in</strong> aDis auf Nicht-Deskriptoren zeigen, geben deren<br />
THSISN hier an. Er würde sonst im <strong>SKOS</strong> Format verloren gehen.<br />
Tabelle 4 Verweise aus umt:exportNote auf die ISN<br />
V 03 Umweltbundesamt S. 29
SNS <strong>UMTHES</strong> <strong>in</strong> <strong>SKOS</strong> DRAFT<br />
5 <strong>UMTHES</strong> Entitäten <strong>in</strong> <strong>SKOS</strong><br />
Dies ist die Checkliste, ob alle benötigten <strong>UMTHES</strong> Daten im (erweiterten) <strong>SKOS</strong> Modell<br />
berücksichtigt worden s<strong>in</strong>d.<br />
Zurzeit noch externes EXCEL <strong>in</strong> Arbeit.<br />
V 03 Umweltbundesamt S. 30