Zusammenfassung - Otto-von-Guericke-Universität Magdeburg
Zusammenfassung - Otto-von-Guericke-Universität Magdeburg
Zusammenfassung - Otto-von-Guericke-Universität Magdeburg
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
9 Diskussion der Resultate<br />
Dieses Kapitel präsentiert die Resultate, die bei der Evaluation des in dieser Arbeit entwickelten<br />
Handschriftretrievalsystems unter Verwendung der im vorangegangenen Kapitel beschriebenen<br />
Testdaten ermittelt wurden. Hierfür wurden die in Kapitel 5 vorgestellten Merkmalstypen<br />
mit einer Vielzahl <strong>von</strong> Parametereinstellungen untersucht.<br />
Zunächst sollen die Resultate für die Merkmalstypen separat dargestellt und diskutiert werden.<br />
Im Anschluss daran werden die verschiedenen in Kapitel 7 diskutierten Fusionsstrategien<br />
hinsichtlich der durch sie erreichten Verbesserungen untersucht.<br />
9.1 Resultate der Suche ohne Fusion<br />
Dieser Abschnitt betrachtet die Ergebnisse, die für die verschiedenen Merkmalstypen bei unterschiedlichen<br />
Parametrisierungen erzielt wurden, wobei hier zunächst auf jegliche Fusionierung<br />
verzichtet wurde.<br />
9.1.1 Quadratische Gitter<br />
Der Merkmalstyp, basierend auf quadratischen Gittern, verfügt über einen Parameter: die Gitterweite.<br />
Die Tests dieses Merkmalstyps wurden für Gitterweiten zwischen sieben und 35<br />
Längeneinheiten durchgeführt. Eine kleine Gitterweite korrespondiert mit langen, eine große<br />
Gitterweite mit kurzen Merkmalszeichenketten. Es wurde angenommen, dass die geometrische<br />
Gestalt einer Stifteingabe umso besser durch eine Abfolge <strong>von</strong> Gittermerkmalen angenähert<br />
werden kann, je kleiner die Gitterweite gewählt wird. Somit würde eine kleinere Gitterweite<br />
besser geeignet sein für die Suche als größere Gitterweiten. Dieser Zusammenhang<br />
zwischen der Gitterweite und der Leistungsfähigkeit des Suchsystems kann in Abbildung 9.1<br />
tatsächlich beobachtet werden. Dargestellt sind die Precision-Recall-Kurven für quadratische<br />
Gittermerkmale bei Gitterweiten <strong>von</strong> 7, 10, 15, 20, 25, 30 und 35 Längeneinheiten, ermittelt<br />
mit dem Gerätetyp ioPen. Die besten Resultate stellen sich zumeist bei einer Gitterweite <strong>von</strong> 7<br />
Längeneinheiten ein; die Precision beträgt 84,8 %, der Recall 87,0 %, woraus sich ein F1-Maß<br />
<strong>von</strong> 0,859 ergibt. Die Fläche unter der Precision-Recall-Kurve beträgt 0,926.<br />
In Tabelle 9.1 sind die Daten des Diagramms aus Abbildung 9.1 zusammengefasst in Form<br />
<strong>von</strong> Precision- und Recallwerten sowie als F1-Maße und als AUC (area under curve). Des<br />
Weiteren findet sich hier auch die durchschnittliche Dauer für die Bearbeitung einer Suchanfrage<br />
in Millisekunden pro Dokument 1 . Diese Bearbeitungszeit ist umso länger, je kleiner die<br />
Gitterweite und je länger die resultierenden Merkmalszeichenketten sind. Zusätzlich finden<br />
1 Für die Tests wurde das Retrievalsystem in Java (1.5.0) implementiert und lief auf einem Desktop-PC mit<br />
AMD-Athlon-Prozessor (2,8 GHz) mit 1 GB Arbeitsspeicher unter dem Linux-Betriebssystem (2.6.13).<br />
117