Projektgruppe Visual Analytics - Medieninformatik und Multimedia ...
Projektgruppe Visual Analytics - Medieninformatik und Multimedia ...
Projektgruppe Visual Analytics - Medieninformatik und Multimedia ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
3.3 Gesten <strong>und</strong> ihre Erkennung 59<br />
Die Funktion (3.1) berechnet rekursiv die Linearisierung mit Hilfe von dynamischer<br />
Programmierung. λ(i,y) ist hierbei der kumulative Abstand von i <strong>und</strong> j.<br />
λ(i, j) = d(q,c) + min{λ(i − 1, j − 1),λ(i − 1, j),λ(i, j − 1)} (3.1)<br />
Falls es keine großen Abweichungen mehr gibt, kann davon ausgegangen werden, dass<br />
beide Sequenzen zur gleichen Geste gehören.<br />
Künstliche neuronale Netze<br />
Eine weitere Möglichkeit zur Erkennung von Gesten ist die Nutzung von künstlichen<br />
neuronalen Netzen (KNN). Diese Vorgehensweise entstammt der Idee, die Funktionsweise<br />
des menschlichen Gehirns nach zu bilden.<br />
Künstliche neuronale Netze sind dazu in der Lage, Muster zu erkennen <strong>und</strong> wichtige<br />
Merkmale der Eingabedaten zu extrahieren. Als Ergebnis erhält man eine Klassifikation.<br />
Diese gibt an, ob es sich bei einer Eingabe um eine entsprechende Geste gehandelt hat,<br />
oder nicht.<br />
Zur Veranschaulichung der Vorgehensweise wird ein Beispiel zur Rechnung mit der inklusive<br />
oder-Operation aus [Str97] verwendet. Hier gibt es zwei binäre Eingabevariablen<br />
X 1 <strong>und</strong> X 2 . Die jeweiligen Ergebnisse der Variablenpaare (3.3) sind bekannt <strong>und</strong> können<br />
für den Lernprozess des KNN verwendet werden. In diesem Lernprozess passt das KNN<br />
nach <strong>und</strong> nach die so genannten Eingangsgewichte (w i ) an, bis die Eingabewerte die<br />
erwartete Ausgabe ergeben. Das Ergebnis eines Durchlaufs ergibt sich aus der Funktion<br />
net = w 1 x 1 + w 2 x 2 (3.2)<br />
wofür anschließend ein Schwellenwert Θ eingeführt werden muss, um als Ausgabewert<br />
nur zwei Klassen zuzulassen. Hier wird Θ = 0,5 gesetz,t um je eine Klasse für Eins <strong>und</strong><br />
Null zu erhalten, da alle Ausgangswerte < 0,5 Null ergeben <strong>und</strong> alle Ausgangswerte<br />
0,5 Eins ergeben.<br />
0 ∪ 0 = 0<br />
0 ∪ 1 = 1<br />
1 ∪ 0 = 1<br />
1 ∪ 1 = 1<br />
(3.3)<br />
Als Gewichtungen werden zufällige oder manuell vorgegebene Werte eingesetzt <strong>und</strong><br />
der Lernprozess beginnt. Falls bei einem Test einer Eingabe mit erwarteter Ausgabe (∆)