01.12.2020 Aufrufe

279.TIROL - November 2021

Ausgabe 2, November 2020

Ausgabe 2, November 2020

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

86 tirol.wissen<br />

tirol.wissen<br />

87<br />

Semantische Technologien –<br />

Wissensmanagement der Zukunft<br />

AUTOREN<br />

ELIAS KÄRLE, BSC MSC &<br />

DR. DIETER FENSEL<br />

Semantic Technology Institut der<br />

Universität Innsbruck (STI)<br />

Die Suche nach Information hat sich innerhalb<br />

weniger Jahre mehrfach gewandelt.<br />

Die Rolle, die ursprünglich Bücher, Zeitschriften,<br />

Printmedien, Television und<br />

Radio einnahmen, wurde sehr schnell von<br />

Computer oder Handy übernommen. Die<br />

Information beziehen diese neuen Medien<br />

aus dem Internet, oder genauer, dem World<br />

Wide Web. Das Web, wie es kurz genannt<br />

wird, ist auch die Informationsquelle für<br />

die neueste Entwicklung in der Informationsbeschaffung,<br />

nämlich die Suche durch<br />

intelligente Assistenten, wie Alexa, Google<br />

Home, Siri oder diverse Chatbots. Doch die<br />

Intelligenz dieser Systeme ist begrenzt, und<br />

die Messlatte dafür ist die Verfügbarkeit<br />

von relevanten Informationen, von digitalisiertem<br />

Wissen.<br />

Semantische Technologien, die auf Daten<br />

angewandt werden, um daraus Wissen<br />

zu machen, helfen Assistenzsystemen<br />

Wissen zu verstehen und entsprechend<br />

weiterzugeben. Dieses Wissen kann zum<br />

Beispiel auf klassischen Webseiten eingebunden<br />

oder in explizit dafür konzipierten<br />

Datenbanken, den Knowledge Graphs,<br />

gespeichert werden.<br />

Die dafür nötigen technischen Voraussetzungen<br />

werden gesammelt als semantische<br />

Technologien bezeichnet. Zum Beispiel<br />

Ontologien, das sind Sammlungen<br />

von Typen und deren Eigenschaften, um<br />

Datensätze maschinenlesbar zu beschreiben.<br />

Knowledge Graphs sind graph-basierte<br />

Speicherstrukturen, die auf die Speicherung<br />

semantisch angereicherter Daten spezialisiert<br />

sind. Oder auch Systeme, die Webseiten<br />

und Knowledge Graphs durchsuchen<br />

und automatisch mit den dort gefundenen<br />

Daten umgehen können. Letztere sind<br />

unter anderem, wie oben genannt, intelligente<br />

Sprachassistenten und Chatbots.<br />

UM WISSEN MIT<br />

SEMANTISCHEN TECH-<br />

NOLOGIEN ANZUREI-<br />

CHERN, ZU BEREINIGEN,<br />

ZU SPEICHERN UND<br />

DANN WEITER ZU PUB-<br />

LIZIEREN, GIBT ES VIER<br />

SCHRITTE.<br />

In diesem Beitrag wollen wir erklären,<br />

wie Wissen, basierend auf semantischen<br />

Technologien, so verwaltet werden kann,<br />

dass es maschinell besser und einfacher<br />

verarbeitet und verstanden wird und wie<br />

semantische Technologien dazu beitragen,<br />

das Web lesbarer und verständlicher zu<br />

machen. Um Wissen mit semantischen<br />

Technologien anzureichern, zu bereinigen,<br />

zu speichern und dann weiter zu publizieren,<br />

beschreiben die Autoren des Buches<br />

„Knowledge Graphs“ [Fensel et al., 2020]<br />

den Knowledge Management Lifecycle. Dieser<br />

besteht aus vier Schritten: Knowledge<br />

Creation (Wissenserzeugung), Knowledge<br />

Hosting (Wissensspeicherung), Knowledge<br />

Curation (Wissensaufbereitung) und Knowledge<br />

Deployment (Wissensverbreitung).<br />

Jeder dieser vier Schritte benötigt in seiner<br />

Anwendung ein hohes Maß an Aufmerksamkeit<br />

und in seiner Umsetzung einen<br />

hohen Level an Know-how und technologischen<br />

Grundlagen.<br />

Bei der Knowledge Creation zum Beispiel<br />

ist es wichtig, dass die Daten mit einer<br />

möglichst weit verbreiteten „semantischen<br />

Sprache“, einer Ontologie, beschrieben<br />

werden. Hier bietet sich schema.org,<br />

aufgrund seiner weltweiten Verbreitung,<br />

sehr gut an. Beim Knowledge Hosting ist<br />

es wichtig, dass die semantisch annotierten<br />

Daten in einem speziellen Format<br />

gespeichert werden, um den vollen Funktionsumfang,<br />

den semantische Technologien<br />

mit sich bringen, zum Beispiel das<br />

effiziente Abarbeiten komplizierter Anfragen,<br />

abrufbar zu machen. Die Knowledge<br />

Curation, der wohl schwierigste Schritt<br />

im Knowledge Management Lifecycle,<br />

beschäftigt sich mit der Qualität der<br />

Daten. Duplikate müssen eliminiert oder<br />

integriert werden, fehlerhafte Informationen<br />

erkannt und bestenfalls behoben<br />

werden – und das möglichst automatisiert,<br />

da beim Knowledge Management<br />

mitunter Milliarden von Datensätzen<br />

betrachtet werden. Schließlich gilt es beim<br />

Knowledge Deployment, die semantisch<br />

annotierten Daten einer möglichst breiten<br />

Anwenderschicht einfach und effizient zur<br />

Verfügung zu stellen, um damit nützliche<br />

Anwendungen zu bauen.<br />

In der Praxis gibt es dazu viele Anwendungsbeispiele,<br />

in denen die Verwendung semantisch<br />

annotierter Daten gegenwärtig oder<br />

zukünftig zum Einsatz kommt. Neben den<br />

angesprochenen Chatbots oder intelligenten<br />

Assistenzsystemen wie Alexa, Google Home<br />

oder Siri sind semantische Technologien vor<br />

allem in der Publikation von Open Data von<br />

großer Bedeutung. Klassisches Open Data, wie<br />

zum Beispiel Open Government Data, ist meist<br />

nicht oder nur bedingt maschinenlesbar, und<br />

zur Verwendung müssen Daten mühsam von<br />

Hand aufbereitet werden. Bei der Publikation<br />

der Daten als „5 Sterne Linked Open Data“<br />

jedoch, werden Daten so mit semantischen<br />

Annotationen angereichert, dass sie implizit<br />

maschinenlesbar und -verständlich sind.<br />

GemNova arbeitet derzeit mit dem Semantic<br />

Technology Institute der Universität Innsbruck<br />

an einem Projekt, das sich mit semantisch<br />

annotierten Daten beschäftigt. Dabei wird<br />

der Knowledge Management Lifecycle auf den<br />

Themenbereich Pflege angewandt. Daten zum<br />

Thema Bedarf, Bedürfnisse, Personal, Qualifikationen<br />

und Verfügbarkeiten werden erfasst,<br />

semantisch aufbereitet, in einem teilweise offenen<br />

Knowledge Graph gespeichert und dann in<br />

einer Matchmaking-Plattform zur Anwendung<br />

gebracht. Letztere nutzt die hervorragenden<br />

Eigenschaften semantisch angereicherter<br />

Daten hinsichtlich des Semantic Matchmakings,<br />

des Verknüpfens zweier Datensätze, hier<br />

des Pflegebedarfs und der Deckung durch das<br />

passende Pflegepersonal.<br />

Zukünftig werden wir immer mehr auf semantische<br />

Technologien zurückgreifen und vertrauen<br />

können. Neben semantisch annotierten<br />

Daten werden auch semantisch annotierte<br />

Services verfügbar sein. Diese bringen<br />

dann Maschinen in die Lage, Verkaufs- und<br />

Buchungsschnittstellen auf Webseiten oder in<br />

Knowledge Graphs selbstständig zu finden und<br />

eigenständig darauf zu handeln. Dadurch könnten<br />

große Aggregationsplattformen wie Amazon<br />

oder Booking.com deutlich an Marktmacht<br />

verlieren und kleine Anbieter von Produkten<br />

und Services wieder mehr an Sichtbarkeit und<br />

somit Wichtigkeit gewinnen.<br />

STI und GemNova<br />

arbeiten aktuell an<br />

einem Projekt mit<br />

semantisch<br />

annotierten Daten<br />

im Pflegebereich.<br />

BILD:<br />

Das intelligente Assistenzsystem<br />

„Alexa“ als<br />

Beispiel für die Anwendung<br />

von semantischen<br />

Technologien. (© Jan<br />

Antonin Kolar/unsplash)<br />

1<br />

https://schema.org . 2 http://data.gv.at . 3 https://5stardata.info/de/<br />

Fensel, D., Şimşek, U., Angele, K., Huaman, E., Kärle, E., Panasiuk, O., Toma, I., Umbrich,<br />

J. & Wahler, A. (2020). Knowledge Graphs. Springer International Publishing.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!