16.12.2012 Aufrufe

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

2.1 Fremde Suchansätze<br />

33 Personen in drei über mehrere Wochen verteilten Durchgängen). Die Tests mit dieser auf<br />

Adressbucheinträge beschränkten Datenbank ergaben Erkennungsraten <strong>von</strong> 84,4 bis 99,8 %,<br />

wobei durch die Kombination der Einzelverfahren jeweils die besten Ergebnisse erzielt wurden.<br />

2.1.4 Scribbler<br />

Im Jahr 1995 veröffentlichten Alex Poon, Karon Weber und Todd Cass ihren Beitrag Scribbler:<br />

A Tool for Searching Digital Ink [PWC95]. Der Suchalgorithmus <strong>von</strong> Scribbler war eingebettet<br />

in ein System namens Marquee [WP94] zur stiftbasierten Annotation <strong>von</strong> Videoaufzeichnungen.<br />

Benutzer <strong>von</strong> Marquee konnten zu ablaufenden Videofilmen digitale Notizen anfertigen,<br />

die über eine Synchronisation mit den jeweiligen Zeitpunkten innerhalb der Videofilme<br />

verknüpft wurden. Das Ziel war die einfachere Navigation innerhalb der Filme anhand dieser<br />

handgeschriebenen Markierungsinformationen. Das System Scribbler sollte das spätere Auffinden<br />

<strong>von</strong> relevanten Markierungsinformationen ermöglichen, mittels erneuter Stifteingabe<br />

durch den Benutzer und einer Ähnlichkeitssuche innerhalb der gespeicherten Annotationen.<br />

Für die Suche wird für die Stiftdaten der Annotationen sowie der Suchanfrage, das heißt,<br />

für die Sequenzen <strong>von</strong> Abtastpunkten, eine Strokesegmentierung sowie für jeden Stroke eine<br />

Neuabtastung durchgeführt, mit dem Ziel, die Abstände aufeinanderfolgender Abtastpunkte<br />

zu vereinheitlichen. Anschließend werden Gruppen nahe beieinanderliegender Strokes gebildet,<br />

wodurch gewissermaßen eine Wortsegmentierung erreicht wird. Die Sequenz der Abtastpunkte<br />

der Suchanfrage wird mit den Sequenzen aller Strokegruppen mittels Dynamic Time<br />

Warping verglichen; mithilfe eines Schwellwertes werden die Treffer bestimmt.<br />

Das Verfahren wurde für die Suche nach Text sowie nach Symbolen getestet. Die Suchgenauigkeit<br />

wurde in [PWC95] angegeben mit 75,2 % für einen ersten Test mit Daten <strong>von</strong> sechs<br />

Personen.<br />

2.1.5 Automatische Indexgenerierung für Handschrift<br />

Anders als die zuvor beschriebenen Systeme verfolgt das Verfahren in [UW99] <strong>von</strong> Shingo<br />

Uchihashi und Lynn Wilcox nicht das Ziel, Ähnlichkeiten zwischen handgeschriebenen Daten<br />

zu bestimmen oder solche Daten in handschriftlichen Dokumenten zu finden. Vielmehr ist<br />

ihr Ziel, in Handschriftdokumenten solche Worte zu bestimmen, deren Vorkommen auf den<br />

Seiten des Dokumentes eher selten ist, um damit einen Index zu schaffen, welcher Verknüpfungen<br />

mit den Stellen des jeweiligen Vorkommens im Dokument enthält und somit einen<br />

einfachen Zugriff im Dokument ermöglicht.<br />

Nach einer wortweisen Segmentierung der Dokumente erfolgt eine Neuabtastung der Daten<br />

der Schreibbewegung mit dem Ziel, eine feste Abtastfrequenz zu erlangen (der Zeitabstand<br />

zweier aufeinanderfolgender Punkte ist konstant). Für die Abtastpunkte werden der Tangentenwinkel<br />

θ an der Schriftkurve, die erste und zweite Ableitung <strong>von</strong> θ sowie der Sinus und<br />

Cosinus <strong>von</strong> θ als Merkmale bestimmt. Mittels dynamischer Programmierung wird auf Basis<br />

dieser fünf Merkmale die paarweise Ähnlichkeit aller im Dokument vorkommenden Worte<br />

berechnet. Mithilfe hierarchischen Clusterings werden solche Worte zusammengefasst, deren<br />

Ähnlichkeit einen bestimmten Schwellwert übersteigt. Cluster, die nur eine kleine Anzahl<br />

13

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!