16.12.2012 Aufrufe

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

8.3 Vorgehen bei der Evaluation<br />

8.3.3 Automatische Bestimmung individueller Schwellwerte<br />

Die in Abschnitt 8.1 beschriebenen Qualitätsgrößen Precision und Recall sowie die aus ihnen<br />

abgeleiteten Werte AUC und F1 werden typischerweise dadurch ermittelt, dass ein System mit<br />

denselben Schwellwerteinstellungen für die Suchanfragen aller Benutzer evaluiert wird. Es<br />

wird also global für alle Benutzer der Einfluss des Ähnlichkeitsschwellwertes auf die Precision<br />

und den Recall untersucht. In Abbildung 8.9 sind die individuellen Precision- und Recallkurven<br />

als Funktionen des Ähnlichkeitsschwellwertes für 13 Schreiber der in dieser Arbeit<br />

verwendeten Handschriftdatenbank dargestellt. Wie zu erkennen ist, gibt es keinen einzelnen<br />

Schwellwert, der für die Suchanfragen aller Personen optimale Werte liefert. Stattdessen ergeben<br />

sich für jenen Schwellwert, welcher insgesamt der beste für alle 13 Personen ist (der<br />

Schnittpunkt der als gepunktete Linien dargestellten Kurven in Abbildung 8.9), für einzelne<br />

Personen individuell sehr schlechte Resultate.<br />

precision, recall<br />

1<br />

0.9<br />

0.8<br />

0.7<br />

0.6<br />

0.5<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

0<br />

user: all<br />

user: 2<br />

user: 3<br />

user: 5<br />

user: 6<br />

user: 9<br />

user: 10<br />

user: 12<br />

user: 16<br />

user: 24<br />

user: 27<br />

user: 29<br />

user: 30<br />

user: 31<br />

o<br />

o<br />

o o<br />

o o<br />

o<br />

o<br />

o<br />

0.4 0.42 0.44 0.46 0.48 0.5 0.52 0.54 0.56 0.58 0.6 0.62 0.64 0.66<br />

o<br />

similarity threshold<br />

Abbildung 8.9: Precision und Recall als Funktion des Ähnlichkeitsschwellwertes, individuell<br />

für 13 Personen aus der Testdatenbasis dargestellt<br />

Durch das Auffinden individueller optimaler Ähnlichkeitsschwellwerte könnte die Gesamtperformanz<br />

des Systems verbessert werden. Für eine Dokumentdatenbank einer begrenzten<br />

Anzahl <strong>von</strong> Personen wäre es trivial, anhand <strong>von</strong> individuellen Precision-Recall-Schwellwert-<br />

Kurvenpaaren den lokalen optimalen Schwellwert manuell einzustellen. Dies setzt jedoch das<br />

Vorhandensein <strong>von</strong> entsprechendem a priori Wissen (Ground-Truth-Informationen) für die<br />

o<br />

o<br />

o<br />

113

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!