16.12.2012 Aufrufe

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

6 Suche mit Fehlern<br />

Auch der Erfinder der Schrift hat Schreibfehler gemacht<br />

(aus Japan)<br />

Wie in Kapitel 5 beschrieben, können aus den Bewegungssignalen handschriftlicher Eingaben<br />

Merkmale gewonnen beziehungsweise extrahiert werden, welche die Form <strong>von</strong> Zeichenketten<br />

(feature strings) haben. Das Problem der Suche in handschriftlichen Dokumenten kann<br />

gelöst werden, indem eine Suche mit Mitteln des Fachgebietes der Stringology, das heißt der<br />

Textalgorithmen, innerhalb dieser Zeichenketten durchgeführt wird 1 .<br />

Mehrere Faktoren führen dazu, dass zwei handschriftliche Realisierungen desselben Wortes<br />

fast nie genau die gleichen Zeichenketten ergeben. So tritt, wie bei jeder Umwandlung <strong>von</strong><br />

analogen Signalen in digitale Daten, ein Quantisierungsfehler auf, der die Daten verfälscht.<br />

Das gleiche geschieht, in noch größerem Umfang, bei der Merkmalsextraktion, die ebenfalls<br />

eine Quantisierung der Daten beinhaltet. Der wichtigste Grund ist jedoch, dass der Mensch<br />

nicht in der Lage ist, ein Wort wiederholt exakt gleich zu schreiben.<br />

Such−<br />

anfrage<br />

Daten−<br />

speicherung<br />

Vorverarbeitung<br />

Merkmals−<br />

extraktion<br />

Suche<br />

Kernsystem<br />

Benutzerschnittstelle<br />

Abbildung 6.1: Schematischer Aufbau des Handschriftsuchsystems<br />

Aus diesen Gründen ist eine exakte Suche 2 innerhalb der Merkmalszeichenketten nicht<br />

zielführend. Stattdessen ist ein Suchverfahren nötig, das eine gewisse Toleranz gegenüber<br />

1 »The term stringology is a popular nickname for string algorithms as well as for text algorithms. Usually text<br />

and string have the same meaning. More formally, a text is a sequence of symbols.« [CR03]<br />

2 Für die exakte Suche in Zeichenketten existiert eine Reihe verschiedener Algorithmen, beispielsweise Knuth-<br />

Morris-Pratt, Boyer-Moore, Boyer-Moore-Horspool, Shift-OR und Karp-Rabin, auf die hier nicht näher eingegangen<br />

werden soll. Es sei stattdessen auf die Literatur verwiesen [BY92, Gus97].<br />

Visualisierung<br />

71

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!