16.12.2012 Aufrufe

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Abbildung 8.4: Ground-Truth-Manager Modul des Retrievalsystems<br />

8.2 Datenbank<br />

ner Datenbank separat <strong>von</strong> den Handschriftrohdaten gespeichert (siehe Anhang C). Die für<br />

die Evaluation verwendete Datenbasis besteht aus 181 Dokumenten <strong>von</strong> 23 Personen (siehe<br />

Tabelle 8.1). Die Dokumente enthalten insgesamt 21.894 Wörter sowie 173 Symbole. 83 der<br />

Dokumente sind in deutscher, 51 in englischer Sprache und 41 in Urdu [Mah07], einer in<br />

Indien und Pakistan verwendeten Sprache. 158 verschiedene Begriffe oder Wortgruppen in<br />

insgesamt 1.632 Wiederholungen wurden mittels des Moduls aus Abbildung 8.4 manuell ausgezeichnet<br />

und für die Suche als Query sowie als Ground-Truth verwendet. Die Suche fand<br />

dabei personenweise separat statt, das heißt, es wurde nur innerhalb der Dokumente jeweils<br />

eines Benutzers gesucht.<br />

In Abbildung 8.5 ist das Systemschema aus Kapitel 4 (Abbildung 4.1) zu sehen, welches<br />

für die Evaluation um die entsprechenden Module erweitert wurde.<br />

ioPen DigiMemo Notes Taker gesamt<br />

Anzahl Schreiber 13 4 9 23<br />

Anzahl Dokumente 72 22 87 181<br />

Anzahl Worte 10.607 2.176 9.111 21.894<br />

Anzahl Symbole 173 0 0 173<br />

Anzahl der Suchanfragen 527 113 992 1.632<br />

Wortgruppen und Symbolen<br />

Tabelle 8.1: Übersicht der Evaluationsdatenbasis<br />

107

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!