279.TIROL - November 2021
Ausgabe 2, November 2020
Ausgabe 2, November 2020
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
86 tirol.wissen<br />
tirol.wissen<br />
87<br />
Semantische Technologien –<br />
Wissensmanagement der Zukunft<br />
AUTOREN<br />
ELIAS KÄRLE, BSC MSC &<br />
DR. DIETER FENSEL<br />
Semantic Technology Institut der<br />
Universität Innsbruck (STI)<br />
Die Suche nach Information hat sich innerhalb<br />
weniger Jahre mehrfach gewandelt.<br />
Die Rolle, die ursprünglich Bücher, Zeitschriften,<br />
Printmedien, Television und<br />
Radio einnahmen, wurde sehr schnell von<br />
Computer oder Handy übernommen. Die<br />
Information beziehen diese neuen Medien<br />
aus dem Internet, oder genauer, dem World<br />
Wide Web. Das Web, wie es kurz genannt<br />
wird, ist auch die Informationsquelle für<br />
die neueste Entwicklung in der Informationsbeschaffung,<br />
nämlich die Suche durch<br />
intelligente Assistenten, wie Alexa, Google<br />
Home, Siri oder diverse Chatbots. Doch die<br />
Intelligenz dieser Systeme ist begrenzt, und<br />
die Messlatte dafür ist die Verfügbarkeit<br />
von relevanten Informationen, von digitalisiertem<br />
Wissen.<br />
Semantische Technologien, die auf Daten<br />
angewandt werden, um daraus Wissen<br />
zu machen, helfen Assistenzsystemen<br />
Wissen zu verstehen und entsprechend<br />
weiterzugeben. Dieses Wissen kann zum<br />
Beispiel auf klassischen Webseiten eingebunden<br />
oder in explizit dafür konzipierten<br />
Datenbanken, den Knowledge Graphs,<br />
gespeichert werden.<br />
Die dafür nötigen technischen Voraussetzungen<br />
werden gesammelt als semantische<br />
Technologien bezeichnet. Zum Beispiel<br />
Ontologien, das sind Sammlungen<br />
von Typen und deren Eigenschaften, um<br />
Datensätze maschinenlesbar zu beschreiben.<br />
Knowledge Graphs sind graph-basierte<br />
Speicherstrukturen, die auf die Speicherung<br />
semantisch angereicherter Daten spezialisiert<br />
sind. Oder auch Systeme, die Webseiten<br />
und Knowledge Graphs durchsuchen<br />
und automatisch mit den dort gefundenen<br />
Daten umgehen können. Letztere sind<br />
unter anderem, wie oben genannt, intelligente<br />
Sprachassistenten und Chatbots.<br />
UM WISSEN MIT<br />
SEMANTISCHEN TECH-<br />
NOLOGIEN ANZUREI-<br />
CHERN, ZU BEREINIGEN,<br />
ZU SPEICHERN UND<br />
DANN WEITER ZU PUB-<br />
LIZIEREN, GIBT ES VIER<br />
SCHRITTE.<br />
In diesem Beitrag wollen wir erklären,<br />
wie Wissen, basierend auf semantischen<br />
Technologien, so verwaltet werden kann,<br />
dass es maschinell besser und einfacher<br />
verarbeitet und verstanden wird und wie<br />
semantische Technologien dazu beitragen,<br />
das Web lesbarer und verständlicher zu<br />
machen. Um Wissen mit semantischen<br />
Technologien anzureichern, zu bereinigen,<br />
zu speichern und dann weiter zu publizieren,<br />
beschreiben die Autoren des Buches<br />
„Knowledge Graphs“ [Fensel et al., 2020]<br />
den Knowledge Management Lifecycle. Dieser<br />
besteht aus vier Schritten: Knowledge<br />
Creation (Wissenserzeugung), Knowledge<br />
Hosting (Wissensspeicherung), Knowledge<br />
Curation (Wissensaufbereitung) und Knowledge<br />
Deployment (Wissensverbreitung).<br />
Jeder dieser vier Schritte benötigt in seiner<br />
Anwendung ein hohes Maß an Aufmerksamkeit<br />
und in seiner Umsetzung einen<br />
hohen Level an Know-how und technologischen<br />
Grundlagen.<br />
Bei der Knowledge Creation zum Beispiel<br />
ist es wichtig, dass die Daten mit einer<br />
möglichst weit verbreiteten „semantischen<br />
Sprache“, einer Ontologie, beschrieben<br />
werden. Hier bietet sich schema.org,<br />
aufgrund seiner weltweiten Verbreitung,<br />
sehr gut an. Beim Knowledge Hosting ist<br />
es wichtig, dass die semantisch annotierten<br />
Daten in einem speziellen Format<br />
gespeichert werden, um den vollen Funktionsumfang,<br />
den semantische Technologien<br />
mit sich bringen, zum Beispiel das<br />
effiziente Abarbeiten komplizierter Anfragen,<br />
abrufbar zu machen. Die Knowledge<br />
Curation, der wohl schwierigste Schritt<br />
im Knowledge Management Lifecycle,<br />
beschäftigt sich mit der Qualität der<br />
Daten. Duplikate müssen eliminiert oder<br />
integriert werden, fehlerhafte Informationen<br />
erkannt und bestenfalls behoben<br />
werden – und das möglichst automatisiert,<br />
da beim Knowledge Management<br />
mitunter Milliarden von Datensätzen<br />
betrachtet werden. Schließlich gilt es beim<br />
Knowledge Deployment, die semantisch<br />
annotierten Daten einer möglichst breiten<br />
Anwenderschicht einfach und effizient zur<br />
Verfügung zu stellen, um damit nützliche<br />
Anwendungen zu bauen.<br />
In der Praxis gibt es dazu viele Anwendungsbeispiele,<br />
in denen die Verwendung semantisch<br />
annotierter Daten gegenwärtig oder<br />
zukünftig zum Einsatz kommt. Neben den<br />
angesprochenen Chatbots oder intelligenten<br />
Assistenzsystemen wie Alexa, Google Home<br />
oder Siri sind semantische Technologien vor<br />
allem in der Publikation von Open Data von<br />
großer Bedeutung. Klassisches Open Data, wie<br />
zum Beispiel Open Government Data, ist meist<br />
nicht oder nur bedingt maschinenlesbar, und<br />
zur Verwendung müssen Daten mühsam von<br />
Hand aufbereitet werden. Bei der Publikation<br />
der Daten als „5 Sterne Linked Open Data“<br />
jedoch, werden Daten so mit semantischen<br />
Annotationen angereichert, dass sie implizit<br />
maschinenlesbar und -verständlich sind.<br />
GemNova arbeitet derzeit mit dem Semantic<br />
Technology Institute der Universität Innsbruck<br />
an einem Projekt, das sich mit semantisch<br />
annotierten Daten beschäftigt. Dabei wird<br />
der Knowledge Management Lifecycle auf den<br />
Themenbereich Pflege angewandt. Daten zum<br />
Thema Bedarf, Bedürfnisse, Personal, Qualifikationen<br />
und Verfügbarkeiten werden erfasst,<br />
semantisch aufbereitet, in einem teilweise offenen<br />
Knowledge Graph gespeichert und dann in<br />
einer Matchmaking-Plattform zur Anwendung<br />
gebracht. Letztere nutzt die hervorragenden<br />
Eigenschaften semantisch angereicherter<br />
Daten hinsichtlich des Semantic Matchmakings,<br />
des Verknüpfens zweier Datensätze, hier<br />
des Pflegebedarfs und der Deckung durch das<br />
passende Pflegepersonal.<br />
Zukünftig werden wir immer mehr auf semantische<br />
Technologien zurückgreifen und vertrauen<br />
können. Neben semantisch annotierten<br />
Daten werden auch semantisch annotierte<br />
Services verfügbar sein. Diese bringen<br />
dann Maschinen in die Lage, Verkaufs- und<br />
Buchungsschnittstellen auf Webseiten oder in<br />
Knowledge Graphs selbstständig zu finden und<br />
eigenständig darauf zu handeln. Dadurch könnten<br />
große Aggregationsplattformen wie Amazon<br />
oder Booking.com deutlich an Marktmacht<br />
verlieren und kleine Anbieter von Produkten<br />
und Services wieder mehr an Sichtbarkeit und<br />
somit Wichtigkeit gewinnen.<br />
STI und GemNova<br />
arbeiten aktuell an<br />
einem Projekt mit<br />
semantisch<br />
annotierten Daten<br />
im Pflegebereich.<br />
BILD:<br />
Das intelligente Assistenzsystem<br />
„Alexa“ als<br />
Beispiel für die Anwendung<br />
von semantischen<br />
Technologien. (© Jan<br />
Antonin Kolar/unsplash)<br />
1<br />
https://schema.org . 2 http://data.gv.at . 3 https://5stardata.info/de/<br />
Fensel, D., Şimşek, U., Angele, K., Huaman, E., Kärle, E., Panasiuk, O., Toma, I., Umbrich,<br />
J. & Wahler, A. (2020). Knowledge Graphs. Springer International Publishing.