16.12.2012 Aufrufe

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

8 Evaluation<br />

Evaluation: Das Unwichtigste läßt sich am genauesten messen.<br />

Aber wie stellt man fest, was wichtig ist?<br />

Es ist das, was übrigbleibt, wenn alles gemessen wurde.<br />

(Rainer Kohlmayer)<br />

Ziel dieses Kapitels ist es, die Evaluation der Leistungsfähigkeit des in dieser Arbeit entwickelten<br />

Handschriftsuchsystems zu beschreiben. Hierzu werden im ersten Abschnitt (8.1) die<br />

grundlegenden Größen erklärt, die für eine solche Evaluation <strong>von</strong> Interesse sind. Insbesondere<br />

handelt es sich hierbei um eine Reihe <strong>von</strong> Qualitätsmaßen. Im sich daran anschließenden<br />

Abschnitt 8.2 wird die für die Evaluation benötigte Datenbasis dargestellt und Abschnitt 8.3<br />

schließlich beschreibt das konkrete Vorgehen bei der Ermittlung der Leistungsfähigkeit des in<br />

dieser Arbeit entwickelten Systems. Die Resultate dieser Evaluation finden sich im folgenden<br />

Kapitel 9.<br />

8.1 Grundlagen<br />

Im Bereich des Information Retrieval gibt es eine Reihe <strong>von</strong> Qualitätsmaßen zur Beurteilung<br />

unterschiedlicher Systeme in Hinblick auf ihre Leistungsfähigkeit, relevante Dokumente<br />

aufzufinden. Häufig verwendete Quälitätsmaße sind die Treffergenauigkeit (engl. precision)<br />

und die Vollständigkeit der Treffer (engl. recall). Ein weiteres relevantes Qualitätsmaß ist der<br />

Fallout-Wert [Rij79, Fra92, MKSW99, Sch04].<br />

Die Grundlage dieser Qualitätsmaße bildet die Überlegung, dass ein Retrievalsystem auf<br />

eine Suchanfrage für die Menge D aller durchsuchten Dokumenten eine Ergebnismenge A (A ⊂<br />

D) aller Treffer liefert. Aus Sicht des Benutzers existiert eine Menge B (B ⊂ D) der für diese<br />

Suchanfrage relevanten, das heißt, erwarteten Dokumente. Die Komplemente der Mengen A<br />

und B, also die Menge der nicht gefundenen beziehungsweise nicht relevanten Dokumente,<br />

werden mit Ā und ¯B bezeichnet. Die oben erwähnten Qualitätsmaße Precision, Recall und<br />

Fallout lassen sich mit Mitteln der Mengenlehre wie folgt formulieren:<br />

precision =<br />

|A ∩ B|<br />

|A|<br />

recall =<br />

|A ∩ B|<br />

|B|<br />

f allout = |A ∩ ¯B|<br />

|¯B|<br />

= |A\B|<br />

|¯B|<br />

(8.1)<br />

(8.2)<br />

(8.3)<br />

Diese drei Werte bewegen sich im Intervall [0...1] und werden bisweilen auch als Prozentwerte<br />

angegeben. Die Precision beschreibt das Verhältnis der Anzahl korrekter Treffer<br />

99

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!