16.12.2012 Aufrufe

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

9 Diskussion der Resultate<br />

Dieses Kapitel präsentiert die Resultate, die bei der Evaluation des in dieser Arbeit entwickelten<br />

Handschriftretrievalsystems unter Verwendung der im vorangegangenen Kapitel beschriebenen<br />

Testdaten ermittelt wurden. Hierfür wurden die in Kapitel 5 vorgestellten Merkmalstypen<br />

mit einer Vielzahl <strong>von</strong> Parametereinstellungen untersucht.<br />

Zunächst sollen die Resultate für die Merkmalstypen separat dargestellt und diskutiert werden.<br />

Im Anschluss daran werden die verschiedenen in Kapitel 7 diskutierten Fusionsstrategien<br />

hinsichtlich der durch sie erreichten Verbesserungen untersucht.<br />

9.1 Resultate der Suche ohne Fusion<br />

Dieser Abschnitt betrachtet die Ergebnisse, die für die verschiedenen Merkmalstypen bei unterschiedlichen<br />

Parametrisierungen erzielt wurden, wobei hier zunächst auf jegliche Fusionierung<br />

verzichtet wurde.<br />

9.1.1 Quadratische Gitter<br />

Der Merkmalstyp, basierend auf quadratischen Gittern, verfügt über einen Parameter: die Gitterweite.<br />

Die Tests dieses Merkmalstyps wurden für Gitterweiten zwischen sieben und 35<br />

Längeneinheiten durchgeführt. Eine kleine Gitterweite korrespondiert mit langen, eine große<br />

Gitterweite mit kurzen Merkmalszeichenketten. Es wurde angenommen, dass die geometrische<br />

Gestalt einer Stifteingabe umso besser durch eine Abfolge <strong>von</strong> Gittermerkmalen angenähert<br />

werden kann, je kleiner die Gitterweite gewählt wird. Somit würde eine kleinere Gitterweite<br />

besser geeignet sein für die Suche als größere Gitterweiten. Dieser Zusammenhang<br />

zwischen der Gitterweite und der Leistungsfähigkeit des Suchsystems kann in Abbildung 9.1<br />

tatsächlich beobachtet werden. Dargestellt sind die Precision-Recall-Kurven für quadratische<br />

Gittermerkmale bei Gitterweiten <strong>von</strong> 7, 10, 15, 20, 25, 30 und 35 Längeneinheiten, ermittelt<br />

mit dem Gerätetyp ioPen. Die besten Resultate stellen sich zumeist bei einer Gitterweite <strong>von</strong> 7<br />

Längeneinheiten ein; die Precision beträgt 84,8 %, der Recall 87,0 %, woraus sich ein F1-Maß<br />

<strong>von</strong> 0,859 ergibt. Die Fläche unter der Precision-Recall-Kurve beträgt 0,926.<br />

In Tabelle 9.1 sind die Daten des Diagramms aus Abbildung 9.1 zusammengefasst in Form<br />

<strong>von</strong> Precision- und Recallwerten sowie als F1-Maße und als AUC (area under curve). Des<br />

Weiteren findet sich hier auch die durchschnittliche Dauer für die Bearbeitung einer Suchanfrage<br />

in Millisekunden pro Dokument 1 . Diese Bearbeitungszeit ist umso länger, je kleiner die<br />

Gitterweite und je länger die resultierenden Merkmalszeichenketten sind. Zusätzlich finden<br />

1 Für die Tests wurde das Retrievalsystem in Java (1.5.0) implementiert und lief auf einem Desktop-PC mit<br />

AMD-Athlon-Prozessor (2,8 GHz) mit 1 GB Arbeitsspeicher unter dem Linux-Betriebssystem (2.6.13).<br />

117

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!