08.12.2012 Aufrufe

Modulhandbuch Wirtschaftsinformatik | B.Sc. und M.Sc.

Modulhandbuch Wirtschaftsinformatik | B.Sc. und M.Sc.

Modulhandbuch Wirtschaftsinformatik | B.Sc. und M.Sc.

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Unstructured Information Management<br />

20-00-0539<br />

Gebiet: Data Knowledge Engineering<br />

Modulverantwortlicher: Prof. Dr.-techn. Johannes Fürnkranz<br />

Kreditpunkte: 9 Dauer: 1 Semester Turnus: In der Regel jedes Semester<br />

Zeit gesamt: 270 h davon Präsenz: 60 h davon eigenständig: 210 h<br />

Lehrveranstaltung:<br />

Unstructured Information Management<br />

Dozenten:<br />

Projektpraktikum 6 SWS<br />

Modulbeschreibung:<br />

Lehrinhalte<br />

Obwohl heutzutage eine beachtliche Menge von Wissen bereits in strukturierter Form in<br />

Datenbanken oder im Semantic Web vorliegt, ist der Großteil unsers Wissens noch immer in<br />

unstrukturierter Form niedergelegt, als natürlich-sprachliche Textdokumente, Video- oder<br />

Audioaufnahmen. Das ursprünglich von IBM entwickelte Unstructured Information Management<br />

(UIMA) Framework bietet eine Entwicklungsplatform zur Analyse solcher unstrukturierter Daten <strong>und</strong><br />

ermöglicht damit die Extraktion von Wissen aus unstrukturierten Quellen. In diesem Projekt werden<br />

wechselnde Themen aus den Bereichen natürliche Sprachverarbeitung, Informationsextraktion,<br />

Information Retrieval <strong>und</strong> semantische Wissensverarbeitung behandelt. Zum Beispiel: •Text aus<br />

unstrukturierten Quellen extrahieren<br />

•Extrahierten Text indizieren <strong>und</strong> darauf suchen<br />

•Für einige typische Suchanfragen manuell eine Liste relevanter Ergebnisse erstellen, welche als<br />

Basis für eine Evaluierung dienen kann<br />

•Verschiedene Techniken von einfachen Wörterbüchern bis zu semantischen Wissenquellen<br />

heranziehen um die Abfrageergebnisse zu verbessern<br />

•Ergebnisse geeignet visualisieren<br />

•Ergebnisse evaluieren Das durch das UKP Lab bereitgestellte Darmstadt Knowledge Processing<br />

Software Repository (DKPro) bietet einen Satz von Java-basierten Softwarekomponenten zur Analyse<br />

<strong>und</strong> Indizierung von Texten. Das Projekt wird auf dessen Basis <strong>und</strong> damit auf Basis des Apache<br />

Unstructured Information Management (UIMA) Frameworks entwickelt.<br />

Kompetenzen<br />

•Methoden der natürlichen Sprachverarbeitung (NLP) verstehen <strong>und</strong> anwenden<br />

•Methoden des Information Retrieval (IR) verstehen <strong>und</strong> anwenden<br />

<strong>Modulhandbuch</strong> Informatik 112

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!