16.12.2012 Aufrufe

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

4 Aufbau des Systems<br />

[CLM95, SNC + 95, S. 50], welches etwa bei bildschirmbasierten Stiftsystemen auftritt 1 . Zudem<br />

ist den meisten Schreibern aktuell das haptische Empfinden bei Verwendung <strong>von</strong> Stift<br />

und Papier vertrauter als beim Schreiben mit speziellen Stiften mit Plastikmine auf Glasoder<br />

Plastikbildschirmoberflächen, wie dies unter anderem bei TabletPC-Geräten der Fall ist<br />

[PW07].<br />

4.2 Modulbeschreibung<br />

Die Daten (Rohdaten), die durch die Geräte zur on-line Erfassung <strong>von</strong> Schreibbewegungen<br />

gewonnen werden, bestehen aus Sequenzen <strong>von</strong> Koordinaten der Stiftposition zum Zeitpunkt<br />

der jeweiligen Abtastung. Neben den reinen Positionsdaten liefern alle drei untersuchten Geräte<br />

zusätzliche Informationen über den Status der Stiftspitze auf der Schreiboberfläche, der<br />

ioPen in Form eines Druckwertes im Bereich <strong>von</strong> 0 bis 126, die Geräte DigiMemo und Notes<br />

Taker als binären Wert, welcher angibt, ob der Stift die Schreiboberfläche berührt.<br />

Für das Ziel der Suche in den solchermaßen erfassten Handschriftdaten ist es nötig, diese<br />

zu normalisieren und aus ihnen bestimmte Merkmale zu extrahieren. Dieses Vorgehen ist<br />

analog zum Vorgehen bei anderen Problemen, etwa aus den Gebieten der Biometrie oder der<br />

Mustererkennung. Im Bereich der off-line Texterkennung beispielsweise wird zumeist in einem<br />

ersten Verarbeitungsschritt eine Filterung vorgenommen, um jenen Bildanteil zu entfernen,<br />

der keine Schreibinformationen enthält. Weitere typische Schritte sind das Entfernen <strong>von</strong><br />

Rauschen sowie die Segmentierung der Schrift in Zeilen, Worte und Buchstaben [PS00]. Diese<br />

Verarbeitungsschritte werden als die Vorverarbeitung bezeichnet. Ihr schließt sich zumeist<br />

die Extraktion <strong>von</strong> Merkmalen an, auf deren Basis die eigentliche Erkennung erfolgt.<br />

Abbildung 4.1 zeigt den prinzipiellen Aufbau des in dieser Arbeit entwickelten Systems.<br />

Zu erkennen sind die drei Module Vorverarbeitung, Merkmalsextraktion und Suche als Teile<br />

des Kernsystems. Der Ablauf gestaltet sich so, dass für eine konkrete Suchanfrage dem System<br />

die Rohdaten (als Sequenz <strong>von</strong> Abtastpunkten) sowohl des Suchbegriffes als auch aller<br />

zu durchsuchenden Dokumente übergeben werden. Im System erfolgt die Vorverarbeitung getrennt<br />

für die Anfrage- und die Dokumentendaten. Im Merkmalsextraktionsmodul werden aus<br />

den vorverarbeiteten Schreibdaten verschiedene Merkmale (engl. features) gewonnen, welche<br />

in unterschiedlicher Weise die geometrische Gestalt der Schrift repräsentieren. Diese Repräsentationen<br />

liegen in der Form <strong>von</strong> so genannten Kettencodes oder Merkmalssequenzen (engl.<br />

feature strings) vor. Die Suche erfolgt, indem mittels Stringähnlichkeiten innerhalb der Merkmalssequenzen<br />

der Dokumentdaten die etwaigen Vorkommen der Merkmalssequenz der Anfragedaten<br />

bestimmt werden. Die Ausgabe der Suche ist eine Menge <strong>von</strong> Textstellen, an denen<br />

der jeweilige Suchbegriff vorkommt.<br />

Dieses Kernsystem wird vervollständigt durch die Systemteile für die Benutzerinteraktion<br />

und die Datenspeicherung. Beide werden im Rahmen der vorliegenden Arbeit jedoch nicht<br />

näher betrachtet und dienen lediglich als Werkzeug für das Kernsystem. Durch den modularen<br />

Aufbau ist es möglich, zum Zwecke der Evaluation (siehe Kapitel 8) des in dieser Arbeit<br />

1 »Then, because of the angle at which the screen is observed, a parallax error occured: when the eye, the tip<br />

of the pen, and a point on the screen are aligned, the pen actually points at a zone located a few millimeters<br />

below that point.« [CLM95]<br />

46

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!