Zusammenfassung - Otto-von-Guericke-Universität Magdeburg
Zusammenfassung - Otto-von-Guericke-Universität Magdeburg
Zusammenfassung - Otto-von-Guericke-Universität Magdeburg
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
4 Aufbau des Systems<br />
[CLM95, SNC + 95, S. 50], welches etwa bei bildschirmbasierten Stiftsystemen auftritt 1 . Zudem<br />
ist den meisten Schreibern aktuell das haptische Empfinden bei Verwendung <strong>von</strong> Stift<br />
und Papier vertrauter als beim Schreiben mit speziellen Stiften mit Plastikmine auf Glasoder<br />
Plastikbildschirmoberflächen, wie dies unter anderem bei TabletPC-Geräten der Fall ist<br />
[PW07].<br />
4.2 Modulbeschreibung<br />
Die Daten (Rohdaten), die durch die Geräte zur on-line Erfassung <strong>von</strong> Schreibbewegungen<br />
gewonnen werden, bestehen aus Sequenzen <strong>von</strong> Koordinaten der Stiftposition zum Zeitpunkt<br />
der jeweiligen Abtastung. Neben den reinen Positionsdaten liefern alle drei untersuchten Geräte<br />
zusätzliche Informationen über den Status der Stiftspitze auf der Schreiboberfläche, der<br />
ioPen in Form eines Druckwertes im Bereich <strong>von</strong> 0 bis 126, die Geräte DigiMemo und Notes<br />
Taker als binären Wert, welcher angibt, ob der Stift die Schreiboberfläche berührt.<br />
Für das Ziel der Suche in den solchermaßen erfassten Handschriftdaten ist es nötig, diese<br />
zu normalisieren und aus ihnen bestimmte Merkmale zu extrahieren. Dieses Vorgehen ist<br />
analog zum Vorgehen bei anderen Problemen, etwa aus den Gebieten der Biometrie oder der<br />
Mustererkennung. Im Bereich der off-line Texterkennung beispielsweise wird zumeist in einem<br />
ersten Verarbeitungsschritt eine Filterung vorgenommen, um jenen Bildanteil zu entfernen,<br />
der keine Schreibinformationen enthält. Weitere typische Schritte sind das Entfernen <strong>von</strong><br />
Rauschen sowie die Segmentierung der Schrift in Zeilen, Worte und Buchstaben [PS00]. Diese<br />
Verarbeitungsschritte werden als die Vorverarbeitung bezeichnet. Ihr schließt sich zumeist<br />
die Extraktion <strong>von</strong> Merkmalen an, auf deren Basis die eigentliche Erkennung erfolgt.<br />
Abbildung 4.1 zeigt den prinzipiellen Aufbau des in dieser Arbeit entwickelten Systems.<br />
Zu erkennen sind die drei Module Vorverarbeitung, Merkmalsextraktion und Suche als Teile<br />
des Kernsystems. Der Ablauf gestaltet sich so, dass für eine konkrete Suchanfrage dem System<br />
die Rohdaten (als Sequenz <strong>von</strong> Abtastpunkten) sowohl des Suchbegriffes als auch aller<br />
zu durchsuchenden Dokumente übergeben werden. Im System erfolgt die Vorverarbeitung getrennt<br />
für die Anfrage- und die Dokumentendaten. Im Merkmalsextraktionsmodul werden aus<br />
den vorverarbeiteten Schreibdaten verschiedene Merkmale (engl. features) gewonnen, welche<br />
in unterschiedlicher Weise die geometrische Gestalt der Schrift repräsentieren. Diese Repräsentationen<br />
liegen in der Form <strong>von</strong> so genannten Kettencodes oder Merkmalssequenzen (engl.<br />
feature strings) vor. Die Suche erfolgt, indem mittels Stringähnlichkeiten innerhalb der Merkmalssequenzen<br />
der Dokumentdaten die etwaigen Vorkommen der Merkmalssequenz der Anfragedaten<br />
bestimmt werden. Die Ausgabe der Suche ist eine Menge <strong>von</strong> Textstellen, an denen<br />
der jeweilige Suchbegriff vorkommt.<br />
Dieses Kernsystem wird vervollständigt durch die Systemteile für die Benutzerinteraktion<br />
und die Datenspeicherung. Beide werden im Rahmen der vorliegenden Arbeit jedoch nicht<br />
näher betrachtet und dienen lediglich als Werkzeug für das Kernsystem. Durch den modularen<br />
Aufbau ist es möglich, zum Zwecke der Evaluation (siehe Kapitel 8) des in dieser Arbeit<br />
1 »Then, because of the angle at which the screen is observed, a parallax error occured: when the eye, the tip<br />
of the pen, and a point on the screen are aligned, the pen actually points at a zone located a few millimeters<br />
below that point.« [CLM95]<br />
46