03.01.2013 Aufrufe

COMPLEX - Visus Technology Transfer GmbH

COMPLEX - Visus Technology Transfer GmbH

COMPLEX - Visus Technology Transfer GmbH

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

werden können. Der folgende Fall soll den Nutzen<br />

verdeutlichen: Patientin Maier hatte einen<br />

Unfall, bei dem sie sichden Fuß brach. Nach<br />

der Einlieferung im Unfallkrankenhaus wurde<br />

ihr Fuß geröntgt. Anschließend wurde der<br />

Fuß operiert. Alle Behandlungsschritte, Therapien<br />

und Medikamente wurden in einem<br />

Dokument zusammengefasst. Die multi-label<br />

Klassifikation ermöglicht die Zuordnung des<br />

Dokuments zu dessen medizinischrelevanten<br />

Fachbereichen Radiologie und Chirurgie.<br />

Abb. 2zeigt den Klassifikationsprozess.<br />

Ausden 18 000 klinischen Freitextdokumenten<br />

wurden zufällig 1500 Dokumente ausgewählt.<br />

Weiters wurden acht medizinische Fachbereiche<br />

als Kategorien definiert. Ein Fachexperte<br />

(Internist) wies aufgrund des Inhalts jedem<br />

Dokument einen oder mehrere Fachbereiche<br />

zu. Der manuell kategorisierte Dokumentensatz<br />

wurde anschließend in einen Trainings- und einen<br />

Testdokumentsatz geteilt. Vier unterschiedliche<br />

Klassifikationsalgorithmen -– J48 Tree Classifier,<br />

Support Vector Machines (SMO),<br />

k-Nearest Neighbor (k-NN) Classifier,und Naïve<br />

Bayes [4-7] –wurden mit diesen Datensätzen<br />

trainiert bzw.evaluiert. Der Einfluss vonText-<br />

Vorverarbeitung (z.B.Stoppwortentfernung,<br />

Stemming, Kleinschreibung) auf das Klassifikationsergebnis<br />

wurde untersucht. Die F-Measure [8] wurde als Erfolgsmaßzahl<br />

verwendet. J48, der Klassifikator mit dem besten Evaluationsergebnis,wurde<br />

schließlichimInformation Retrieval System<br />

verwendet um die restlichen klinischen Textdokumente automatisiert<br />

zu klassifizieren.<br />

Indexierungs- und Such-Modul: Für die Entwicklung des<br />

Indexierungs- bzw.Suchmechanismus wurde das etablierte<br />

Open-Source Text-Information-Retrieval-Framework Apache<br />

Lucene [9] verwendet. Lucene stellt Funktionalität zum Analysieren,<br />

Indexieren und Suchen vonTextdokumenten zur Verfügung.<br />

Weiters können Dokumente nachRelevanz sortiert<br />

werden. Lucene bietet auchdie Möglichkeit einen „boost factor“<br />

zu setzen, um die Relevanz vonDokumenten durchMetadaten<br />

zu beeinflussen. Im Falle des klinischen IR-Systems wird<br />

Dokumenten, die medizinischen Fachbereichen zugeordnet<br />

wurden, bei der Auswahl dieser Fachbereiche in der Suchmaske<br />

eine höhere Relevanz zugewiesen als Dokumenten, die nicht<br />

in diese Fachbereiche klassifiziert wurden.<br />

J2EE Webanwendung: Die Konzeption des klinischen<br />

IR-Systems als J2EE-Webanwendung erlaubt, neben Plattformunabhängigkeit,<br />

Modularität, Erweiterbarkeit und Datenschutzfunktionen,<br />

einen einfachen Zugriff auf das IR-System.<br />

Mediziner –und in Zukunft möglicherweise auch<br />

Patienten –können somit über einen Webbrowser auf die<br />

Abb. 1–Systemarchitektur des Prototyps eines klinischen<br />

Information Retrieval Systems<br />

Beispielhafte Anwendung des klinischen IR-Systems<br />

Der folgende Anwendungsfall demonstriert anhand<br />

eines konkreten Beispiels die Funktionalität des Systems:<br />

Aufgrund von Schmerzen im Brustbereich kommt ein Patient<br />

auf die Interne Abteilung. Der Patient erzählt, dass er<br />

schon mehrmals am Herzen behandelt worden sei. Die<br />

diensthabende Internistin möchte sich daher einen Überblick<br />

über die bisherige Krankengeschichte des Patienten<br />

machen. Vorallem ist sie an bisherigen Behandlungen am<br />

Herzeninteressiert. Also gibt sie „Herz*“ in die Suchmaske<br />

ein. Der „*“ ist Platzhalter für beliebige weitere Zeichen nach<br />

dem Wort „Herz“. Neben medikamentösen Therapien sind<br />

auchmögliche Operationen vonBedeutung. Sie sucht daher<br />

nach Dokumenten der Fachbereiche „Innere Medizin“ sowie<br />

„Chirurgie“, und setzt daher in der Suchmaskeeine Marke<br />

für diese Fachbereiche.<br />

Nach der Übermittlung der Suchanfrage, ermittelt das<br />

klinische IR-System alle Dokumente die das Wort „Herz“<br />

beinhalten. Zusätzlichwird die Relevanz dieser Dokumente<br />

bezüglichder Suchanfrage berechnet. Im nächsten Schritt<br />

werden jene Dokumente, die vom Klassifikationsalgorithmus<br />

in die Kategorien „Innere Medizin“ bzw. „Chirurgie“<br />

klassifiziert wurden mit einem höheren Relevanz-Faktor gewichtet,<br />

als jene, die nicht in diese Kategorien fallen. Höher<br />

gewichtete Dokumente erscheinen in der Ergebnisliste vor<br />

Patientenakte zugreifen. niedriger gewichteten. Dokumente, die zwar das Wort „Herz“ ><br />

EHEALTHCOM 57

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!