Zusammenfassung - Otto-von-Guericke-Universität Magdeburg
Zusammenfassung - Otto-von-Guericke-Universität Magdeburg
Zusammenfassung - Otto-von-Guericke-Universität Magdeburg
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
5 Merkmalsgewinnung<br />
das bereits aus Kapitel 4 bekannte Blockschema des in dieser Arbeit entwickelten Handschriftsuchsystems<br />
sowie, durch eine gestrichelte Umrandung besonders hervorgehoben, die<br />
in diesem Kapitel betrachteten Systemteile.<br />
5.1 Datenvorverarbeitung<br />
Die Vorverarbeitung der Rohdaten, welche durch die Stiftgeräte beziehungsweise die jeweiligen<br />
Gerätetreiber ausgegeben werden, umfasst die Bereinigung der Bewegungssignale <strong>von</strong><br />
Störungen (Rauschen) sowie eine Aufbereitung der Signale (Neuabtastung) für die weiteren<br />
Verarbeitungsschritte der Merkmalsgewinnung.<br />
Die Daten der Stifteingaben während des Schreibvorgangs können als analoge zeitabhängige<br />
Signale x(t) und y(t) der horizontalen und vertikalen Stiftposition sowie z(t) der Druckinformation<br />
zum Zeitpunkt t aufgefasst werden. Durch die Abtastung der Signale, das heißt,<br />
die zeitliche Quantisierung, entsteht eine Sequenz <strong>von</strong> so genannten Abtastpunkten pi:<br />
pi = (xi,yi,zi,ti) (5.1)<br />
Hierbei sind xi, yi und zi die Koordinaten der Stiftspitze beziehungsweise die Druckinformation<br />
zum Zeitpunkt ti. Es gilt also:<br />
xi = x(ti), yi = y(ti), zi = z(ti) (5.2)<br />
Diese Abtastung der Signale x(t), y(t) und p(t) realisiert also eine Analog-Digital-Umwandlung.<br />
Im Rahmen dieser Arbeit wird angenommen, die Stiftkoordinaten xi und yi sowie<br />
die Druckinformation zi seien positiv 2 und ganzzahlig. Ebenso wird die Zeitinformation 3 ti<br />
als ganzzahlig betrachtet. Damit gilt für jeden Abtastpunkt pi:<br />
pi ∈ P mit i ∈ {1,...,n}, P = N 4<br />
(5.3)<br />
Eine handschriftliche Eingabe wird als Sequenz P <strong>von</strong> n = |P| Abtastpunkten beschrieben.<br />
P entspricht dabei beispielsweise einem geschriebenen Wort oder Symbol, einem Teil da<strong>von</strong>,<br />
Gruppen mehrerer Wörter bis hin zu kompletten Dokumenten. Für eine Sequenz P bestehend<br />
aus n Abtastpunkten gilt:<br />
P ∈ P n<br />
P = p1 p2 p3 ... pn<br />
(5.4)<br />
(5.5)<br />
In Abbildung 5.2 sind die Signale xi und yi der horizontalen und vertikalen Stiftbewegung<br />
in Abhängigkeit <strong>von</strong> der Schreibzeit ti während des Schreibens <strong>von</strong> zwei Zeilen Text zu erkennen.<br />
Das Schriftbild, das heißt die Projektion der Punkte (xi,yi) in die Ebene, ist zum<br />
2 Für die Notes Taker-Geräte [Peg06] gilt dies nicht automatisch, da sich bei diesen der Koordinatenursprung<br />
mittig am oberen Rand der erfassbaren Eingabefläche befindet. Jedoch kann dieser Koordinatenursprung auf<br />
arithmetischem Wege verschoben werden, sodass gilt xi,yi ≥ 0<br />
3 Die Zeitinformation wird in der Regel als Anzahl der Millisekunden, beginnend zu einem festen Zeitpunkt,<br />
50<br />
ausgedrückt.