16.12.2012 Aufrufe

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Die Gewichte wĉ0 bis wĉ13 werden wie folgt berechnet 4 :<br />

13<br />

wĉ j = ∑<br />

i=1<br />

2.1 Fremde Suchansätze<br />

(Σ −1 )i j ¯fĉi mit 1 ≤ j ≤ 13 (2.5)<br />

wĉ0 = − 1<br />

2<br />

13<br />

∑ wĉi<br />

i=1<br />

¯fĉi<br />

(2.6)<br />

Hierbei ist Σ −1 das Inverse der gemeinsamen Kovarianzmatrix aller Klassen.<br />

Rubine gibt in [Rub91a] die Erkennungsgüte seines Systems mit 98 % an bei bis zu 15 verschiedene<br />

Klassen <strong>von</strong> Gesten und mindestens 15 Beispielgesten pro Klasse. Bei 30 Klassen<br />

mit jeweils 40 Beispielen erhält er 97 % und mit nur 15 Beispielen 96 % korrekte Erkennungen.<br />

Dieser bereits 1991 veröffentlichte Algorithmus ist auch heutzutage noch relevant. Dies<br />

zeigt sich zum einen an der großen Zahl aktueller Veröffentlichungen, die auf Rubines Algorithmus<br />

verweisen und zum anderen in seiner weitverbreiteten Verwendung zur Lösung<br />

<strong>von</strong> Problemen der stiftbasierten Mustererkennung [LM01, TBBB02, BC02, Bou02, CMP05,<br />

HL06].<br />

2.1.2 ScriptSearch<br />

Der ScriptSearch-Algorithmus wurde <strong>von</strong> Daniel Lopresti und Andrew Tomkins 1994 in ihrem<br />

Aufsatz »On the Searchability of Electronic Ink« veröffentlicht [LT94]. Ihr Ziel war unter anderem<br />

die Suche nach handgezeichneten und handgeschriebenen Stifteingaben. Die Idee der<br />

Suche nach handgezeichneten Eingaben war es, Dateien auf PDA-Geräten mit Piktogrammen<br />

anstelle <strong>von</strong> Dateinamen zu versehen und die Dateien mittels erneuter Eingabe des jeweiligen<br />

Piktogramms automatisch wiederzufinden [LT93]. Die Suche nach handgeschriebenen Stifteingaben<br />

verfolgte das selbe Ziel wie die vorliegende Arbeit: nämlich die benutzerabhängige<br />

Suche nach Textstellen mit einem bestimmten Wortvorkommen.<br />

Im Falle des SkriptSearch-Algorithmus erfolgte eine Zerlegung der Texte in so genannte<br />

Strokes, die in [LT94] dadurch definiert waren, dass sie durch zwei aufeinanderfolgende vertikale<br />

Minima der Stiftbewegung begrenzt sind. Für jeden dieser Strokes wurde mittels des<br />

Algorithmus <strong>von</strong> Rubine [Rub91a] ein Merkmalsvektor mit 13 Elementen bestimmt (siehe<br />

Abschnitt 2.1.1). Der dadurch definierte 13-dimensionale Vektorraum wurde mittels Vektorquantisierung<br />

in 64 Cluster aufgeteilt und somit jedem Stroke einer dieser Cluster zugewiesen.<br />

Auf Basis der Abfolge <strong>von</strong> Clusterbezeichnungen aller Strokes eines Piktogramms oder<br />

Wortes wurde die Suche dadurch realisiert, dass die Editierabstände (siehe Abschnitt 6.1)<br />

zwischen dem gesuchten Piktogramm und denen im System bestimmt wurden. Für die Suche<br />

in Dokumenten, bestehend aus größeren Mengen an Worten, wurde eine Zerlegung der<br />

Texte in Zeilen und Worte durchgeführt und die Suche mittels Editierabstand auf Basis der<br />

segmentierten Worte durchgeführt.<br />

4 »[. . . ] it is assumed that all gesture classes are equally likely to occur. The constant term wĉ0 may be adjusted<br />

if the a priori probabilities of each gesture class are known in advance.« [Rub91b, S. 59]<br />

11

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!