Zusammenfassung - Otto-von-Guericke-Universität Magdeburg
Zusammenfassung - Otto-von-Guericke-Universität Magdeburg
Zusammenfassung - Otto-von-Guericke-Universität Magdeburg
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
2.1 Fremde Suchansätze<br />
33 Personen in drei über mehrere Wochen verteilten Durchgängen). Die Tests mit dieser auf<br />
Adressbucheinträge beschränkten Datenbank ergaben Erkennungsraten <strong>von</strong> 84,4 bis 99,8 %,<br />
wobei durch die Kombination der Einzelverfahren jeweils die besten Ergebnisse erzielt wurden.<br />
2.1.4 Scribbler<br />
Im Jahr 1995 veröffentlichten Alex Poon, Karon Weber und Todd Cass ihren Beitrag Scribbler:<br />
A Tool for Searching Digital Ink [PWC95]. Der Suchalgorithmus <strong>von</strong> Scribbler war eingebettet<br />
in ein System namens Marquee [WP94] zur stiftbasierten Annotation <strong>von</strong> Videoaufzeichnungen.<br />
Benutzer <strong>von</strong> Marquee konnten zu ablaufenden Videofilmen digitale Notizen anfertigen,<br />
die über eine Synchronisation mit den jeweiligen Zeitpunkten innerhalb der Videofilme<br />
verknüpft wurden. Das Ziel war die einfachere Navigation innerhalb der Filme anhand dieser<br />
handgeschriebenen Markierungsinformationen. Das System Scribbler sollte das spätere Auffinden<br />
<strong>von</strong> relevanten Markierungsinformationen ermöglichen, mittels erneuter Stifteingabe<br />
durch den Benutzer und einer Ähnlichkeitssuche innerhalb der gespeicherten Annotationen.<br />
Für die Suche wird für die Stiftdaten der Annotationen sowie der Suchanfrage, das heißt,<br />
für die Sequenzen <strong>von</strong> Abtastpunkten, eine Strokesegmentierung sowie für jeden Stroke eine<br />
Neuabtastung durchgeführt, mit dem Ziel, die Abstände aufeinanderfolgender Abtastpunkte<br />
zu vereinheitlichen. Anschließend werden Gruppen nahe beieinanderliegender Strokes gebildet,<br />
wodurch gewissermaßen eine Wortsegmentierung erreicht wird. Die Sequenz der Abtastpunkte<br />
der Suchanfrage wird mit den Sequenzen aller Strokegruppen mittels Dynamic Time<br />
Warping verglichen; mithilfe eines Schwellwertes werden die Treffer bestimmt.<br />
Das Verfahren wurde für die Suche nach Text sowie nach Symbolen getestet. Die Suchgenauigkeit<br />
wurde in [PWC95] angegeben mit 75,2 % für einen ersten Test mit Daten <strong>von</strong> sechs<br />
Personen.<br />
2.1.5 Automatische Indexgenerierung für Handschrift<br />
Anders als die zuvor beschriebenen Systeme verfolgt das Verfahren in [UW99] <strong>von</strong> Shingo<br />
Uchihashi und Lynn Wilcox nicht das Ziel, Ähnlichkeiten zwischen handgeschriebenen Daten<br />
zu bestimmen oder solche Daten in handschriftlichen Dokumenten zu finden. Vielmehr ist<br />
ihr Ziel, in Handschriftdokumenten solche Worte zu bestimmen, deren Vorkommen auf den<br />
Seiten des Dokumentes eher selten ist, um damit einen Index zu schaffen, welcher Verknüpfungen<br />
mit den Stellen des jeweiligen Vorkommens im Dokument enthält und somit einen<br />
einfachen Zugriff im Dokument ermöglicht.<br />
Nach einer wortweisen Segmentierung der Dokumente erfolgt eine Neuabtastung der Daten<br />
der Schreibbewegung mit dem Ziel, eine feste Abtastfrequenz zu erlangen (der Zeitabstand<br />
zweier aufeinanderfolgender Punkte ist konstant). Für die Abtastpunkte werden der Tangentenwinkel<br />
θ an der Schriftkurve, die erste und zweite Ableitung <strong>von</strong> θ sowie der Sinus und<br />
Cosinus <strong>von</strong> θ als Merkmale bestimmt. Mittels dynamischer Programmierung wird auf Basis<br />
dieser fünf Merkmale die paarweise Ähnlichkeit aller im Dokument vorkommenden Worte<br />
berechnet. Mithilfe hierarchischen Clusterings werden solche Worte zusammengefasst, deren<br />
Ähnlichkeit einen bestimmten Schwellwert übersteigt. Cluster, die nur eine kleine Anzahl<br />
13