09.02.2015 Aufrufe

Positionsvorhersage von bewegten Objekten in gro ... - FIAS

Positionsvorhersage von bewegten Objekten in gro ... - FIAS

Positionsvorhersage von bewegten Objekten in gro ... - FIAS

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

allgeme<strong>in</strong> <strong>von</strong> dem k-NN Verfahren gesprochen; damit ist dann die fur Sequenzen modizierte<br />

Version des 9{Nearest-Neighbor Verfahrens mit Nachbarn aus beliebigen Sequenzen<br />

und dem Durchschnittsbereich = 1 geme<strong>in</strong>t [4].<br />

Die Abbildung 4 zeigt l<strong>in</strong>ks zwei reale Sequenzen und rechts die dazugehorigen Voraussagen.<br />

Die Gesichter s<strong>in</strong>d auf jedem Bild durch e<strong>in</strong> Rechteck markiert. Zur Ubersichtlichkeit<br />

wurde nur fur die Start- und Endposition das komplette Rechteck e<strong>in</strong>gezeichnet.<br />

Von den anderen wurden jeweils immer die zue<strong>in</strong>ander gehorigen Ecken verbunden. Diese<br />

Darstellung soll e<strong>in</strong>en E<strong>in</strong>druck der zeitlichen Reihenfolge vermitteln.<br />

5 Die Ergebnisse<br />

Damit e<strong>in</strong> Gesicht uberhaupt <strong>von</strong> dem e<strong>in</strong>gesetzten Gesichtsnder [2] gefunden werden<br />

kann, mu es sich e<strong>in</strong>erseits komplett <strong>in</strong> dem vorhergesagten Ausschnitt benden, andererseits<br />

darf es nicht zu nah am Rand se<strong>in</strong>. Daher wird die Flache des Ausschnitts vervierfacht,<br />

<strong>in</strong>dem die Breite und Hohe jeweils verdoppelt werden; der Mittelpunkt bleibt<br />

unverandert.<br />

Die zwei <strong>in</strong> der Abbildung 5 dargestellten Bildfolgen s<strong>in</strong>d ausgewahlte Teilstucke der<br />

durchgefuhrten Experimente. Das erste und das letzte Bild zeigen noch e<strong>in</strong>mal die komplette<br />

Szene zu Beg<strong>in</strong>n und zum Ende des Teilstucks. Direkt daneben ist die Vorhersage<br />

fur diesen Zeitpunkt und <strong>in</strong> der Vorhersage das Ergebnis des Gesichtsnders zu sehen.<br />

Die Abbildung zeigt Ausschnitte zweier Sequenzen mit e<strong>in</strong>er Versuchsperson, die gerade<br />

dabei ist, <strong>in</strong> die Hocke zu gehen. Die erste Person ist zu schnell, die Bewegung der<br />

zweiten wird richtig vorhergesagt, obwohl die Gesichter teilweise nicht gefunden werden.<br />

Aus der Abbildung wird ersichtlich, da die Vorhersagen sehr tolerant gegenuber Fehlern<br />

und Ungenauigkeiten des e<strong>in</strong>gesetzten Gesichtsnders s<strong>in</strong>d.<br />

Der Gesichtsnder berechnet e<strong>in</strong>e lokale Kontrastnormalisierung fur die Ausschnitte<br />

bevor die Gesichtserkennung stattndet, daher wirken sie etwas kontrastarm. Diese Transformation<br />

wurde durchgefuhrt, um Helligkeitsschwankungen auszugleichen, die durch die<br />

Beleuchtung entstehen (z. B. Neon- und Gegenlicht).<br />

Die Teilstucke wurden ausgewahlt, um <strong>in</strong>teressante Situationen zu dokumentieren. Alle<br />

<strong>in</strong> den Bildfolgen dargestellten Ausschnitte haben e<strong>in</strong>en sehr schwierigen H<strong>in</strong>tergrund,<br />

der viele gesichtsahnliche Strukturen enthalt. Die Ergebnisse des Gesichtsnders auf den<br />

Bildern s<strong>in</strong>d daher nicht als reprasentativ e<strong>in</strong>zustufen. Uber alle Testsequenzen gesehen<br />

liefert er viel bessere Ergebnisse und kommt auf den vorhergesagten Ausschnitten auf e<strong>in</strong>e<br />

Erkennungsrate <strong>von</strong> 95,17 %.<br />

Generell ist die Erkennungsrate auf den vorhergesagten Bildausschnitten deutlichhoher<br />

als auf der kompletten Szene, wie die bisherigen Versuche mit e<strong>in</strong>em konkreten Gesichtsnder<br />

[2] ergeben haben. Diese Leistungssteigerung geht Hand <strong>in</strong> Hand mit e<strong>in</strong>er verr<strong>in</strong>gerten<br />

Rechenzeit, da statt geschatzter neun Reprasentationen nur drei benotigt werden (e<strong>in</strong>e Reprasentation<br />

ist e<strong>in</strong>e gelernte Darstellung e<strong>in</strong>es Gesichts). Die Reprasentationen konnen<br />

reduziert werden, da auf den Ausschnitten die Kopf<strong>gro</strong>e im wesentlichen immer gleich<br />

bleibt.<br />

Die Tabelle 1 gibt e<strong>in</strong>e Ubersicht uber die mit dem konkreten Gesichtsnder erzielten<br />

Ergebnisse. Die erste Spalte beschreibt die Untersuchung, die zweite Spalte gibt die<br />

Erfolgsquote der gefundenen Gesichter an, die nachste Spalte listet die Anzahl der be-

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!