19.01.2015 Aufrufe

Projektgruppe Visual Analytics - Medieninformatik und Multimedia ...

Projektgruppe Visual Analytics - Medieninformatik und Multimedia ...

Projektgruppe Visual Analytics - Medieninformatik und Multimedia ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

3.3 Gesten <strong>und</strong> ihre Erkennung 59<br />

Die Funktion (3.1) berechnet rekursiv die Linearisierung mit Hilfe von dynamischer<br />

Programmierung. λ(i,y) ist hierbei der kumulative Abstand von i <strong>und</strong> j.<br />

λ(i, j) = d(q,c) + min{λ(i − 1, j − 1),λ(i − 1, j),λ(i, j − 1)} (3.1)<br />

Falls es keine großen Abweichungen mehr gibt, kann davon ausgegangen werden, dass<br />

beide Sequenzen zur gleichen Geste gehören.<br />

Künstliche neuronale Netze<br />

Eine weitere Möglichkeit zur Erkennung von Gesten ist die Nutzung von künstlichen<br />

neuronalen Netzen (KNN). Diese Vorgehensweise entstammt der Idee, die Funktionsweise<br />

des menschlichen Gehirns nach zu bilden.<br />

Künstliche neuronale Netze sind dazu in der Lage, Muster zu erkennen <strong>und</strong> wichtige<br />

Merkmale der Eingabedaten zu extrahieren. Als Ergebnis erhält man eine Klassifikation.<br />

Diese gibt an, ob es sich bei einer Eingabe um eine entsprechende Geste gehandelt hat,<br />

oder nicht.<br />

Zur Veranschaulichung der Vorgehensweise wird ein Beispiel zur Rechnung mit der inklusive<br />

oder-Operation aus [Str97] verwendet. Hier gibt es zwei binäre Eingabevariablen<br />

X 1 <strong>und</strong> X 2 . Die jeweiligen Ergebnisse der Variablenpaare (3.3) sind bekannt <strong>und</strong> können<br />

für den Lernprozess des KNN verwendet werden. In diesem Lernprozess passt das KNN<br />

nach <strong>und</strong> nach die so genannten Eingangsgewichte (w i ) an, bis die Eingabewerte die<br />

erwartete Ausgabe ergeben. Das Ergebnis eines Durchlaufs ergibt sich aus der Funktion<br />

net = w 1 x 1 + w 2 x 2 (3.2)<br />

wofür anschließend ein Schwellenwert Θ eingeführt werden muss, um als Ausgabewert<br />

nur zwei Klassen zuzulassen. Hier wird Θ = 0,5 gesetz,t um je eine Klasse für Eins <strong>und</strong><br />

Null zu erhalten, da alle Ausgangswerte < 0,5 Null ergeben <strong>und</strong> alle Ausgangswerte<br />

0,5 Eins ergeben.<br />

0 ∪ 0 = 0<br />

0 ∪ 1 = 1<br />

1 ∪ 0 = 1<br />

1 ∪ 1 = 1<br />

(3.3)<br />

Als Gewichtungen werden zufällige oder manuell vorgegebene Werte eingesetzt <strong>und</strong><br />

der Lernprozess beginnt. Falls bei einem Test einer Eingabe mit erwarteter Ausgabe (∆)

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!