COMPLEX - Visus Technology Transfer GmbH
COMPLEX - Visus Technology Transfer GmbH
COMPLEX - Visus Technology Transfer GmbH
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
werden können. Der folgende Fall soll den Nutzen<br />
verdeutlichen: Patientin Maier hatte einen<br />
Unfall, bei dem sie sichden Fuß brach. Nach<br />
der Einlieferung im Unfallkrankenhaus wurde<br />
ihr Fuß geröntgt. Anschließend wurde der<br />
Fuß operiert. Alle Behandlungsschritte, Therapien<br />
und Medikamente wurden in einem<br />
Dokument zusammengefasst. Die multi-label<br />
Klassifikation ermöglicht die Zuordnung des<br />
Dokuments zu dessen medizinischrelevanten<br />
Fachbereichen Radiologie und Chirurgie.<br />
Abb. 2zeigt den Klassifikationsprozess.<br />
Ausden 18 000 klinischen Freitextdokumenten<br />
wurden zufällig 1500 Dokumente ausgewählt.<br />
Weiters wurden acht medizinische Fachbereiche<br />
als Kategorien definiert. Ein Fachexperte<br />
(Internist) wies aufgrund des Inhalts jedem<br />
Dokument einen oder mehrere Fachbereiche<br />
zu. Der manuell kategorisierte Dokumentensatz<br />
wurde anschließend in einen Trainings- und einen<br />
Testdokumentsatz geteilt. Vier unterschiedliche<br />
Klassifikationsalgorithmen -– J48 Tree Classifier,<br />
Support Vector Machines (SMO),<br />
k-Nearest Neighbor (k-NN) Classifier,und Naïve<br />
Bayes [4-7] –wurden mit diesen Datensätzen<br />
trainiert bzw.evaluiert. Der Einfluss vonText-<br />
Vorverarbeitung (z.B.Stoppwortentfernung,<br />
Stemming, Kleinschreibung) auf das Klassifikationsergebnis<br />
wurde untersucht. Die F-Measure [8] wurde als Erfolgsmaßzahl<br />
verwendet. J48, der Klassifikator mit dem besten Evaluationsergebnis,wurde<br />
schließlichimInformation Retrieval System<br />
verwendet um die restlichen klinischen Textdokumente automatisiert<br />
zu klassifizieren.<br />
Indexierungs- und Such-Modul: Für die Entwicklung des<br />
Indexierungs- bzw.Suchmechanismus wurde das etablierte<br />
Open-Source Text-Information-Retrieval-Framework Apache<br />
Lucene [9] verwendet. Lucene stellt Funktionalität zum Analysieren,<br />
Indexieren und Suchen vonTextdokumenten zur Verfügung.<br />
Weiters können Dokumente nachRelevanz sortiert<br />
werden. Lucene bietet auchdie Möglichkeit einen „boost factor“<br />
zu setzen, um die Relevanz vonDokumenten durchMetadaten<br />
zu beeinflussen. Im Falle des klinischen IR-Systems wird<br />
Dokumenten, die medizinischen Fachbereichen zugeordnet<br />
wurden, bei der Auswahl dieser Fachbereiche in der Suchmaske<br />
eine höhere Relevanz zugewiesen als Dokumenten, die nicht<br />
in diese Fachbereiche klassifiziert wurden.<br />
J2EE Webanwendung: Die Konzeption des klinischen<br />
IR-Systems als J2EE-Webanwendung erlaubt, neben Plattformunabhängigkeit,<br />
Modularität, Erweiterbarkeit und Datenschutzfunktionen,<br />
einen einfachen Zugriff auf das IR-System.<br />
Mediziner –und in Zukunft möglicherweise auch<br />
Patienten –können somit über einen Webbrowser auf die<br />
Abb. 1–Systemarchitektur des Prototyps eines klinischen<br />
Information Retrieval Systems<br />
Beispielhafte Anwendung des klinischen IR-Systems<br />
Der folgende Anwendungsfall demonstriert anhand<br />
eines konkreten Beispiels die Funktionalität des Systems:<br />
Aufgrund von Schmerzen im Brustbereich kommt ein Patient<br />
auf die Interne Abteilung. Der Patient erzählt, dass er<br />
schon mehrmals am Herzen behandelt worden sei. Die<br />
diensthabende Internistin möchte sich daher einen Überblick<br />
über die bisherige Krankengeschichte des Patienten<br />
machen. Vorallem ist sie an bisherigen Behandlungen am<br />
Herzeninteressiert. Also gibt sie „Herz*“ in die Suchmaske<br />
ein. Der „*“ ist Platzhalter für beliebige weitere Zeichen nach<br />
dem Wort „Herz“. Neben medikamentösen Therapien sind<br />
auchmögliche Operationen vonBedeutung. Sie sucht daher<br />
nach Dokumenten der Fachbereiche „Innere Medizin“ sowie<br />
„Chirurgie“, und setzt daher in der Suchmaskeeine Marke<br />
für diese Fachbereiche.<br />
Nach der Übermittlung der Suchanfrage, ermittelt das<br />
klinische IR-System alle Dokumente die das Wort „Herz“<br />
beinhalten. Zusätzlichwird die Relevanz dieser Dokumente<br />
bezüglichder Suchanfrage berechnet. Im nächsten Schritt<br />
werden jene Dokumente, die vom Klassifikationsalgorithmus<br />
in die Kategorien „Innere Medizin“ bzw. „Chirurgie“<br />
klassifiziert wurden mit einem höheren Relevanz-Faktor gewichtet,<br />
als jene, die nicht in diese Kategorien fallen. Höher<br />
gewichtete Dokumente erscheinen in der Ergebnisliste vor<br />
Patientenakte zugreifen. niedriger gewichteten. Dokumente, die zwar das Wort „Herz“ ><br />
EHEALTHCOM 57