22.09.2013 Aufrufe

Workshopband als PDF - Mpc.belwue.de

Workshopband als PDF - Mpc.belwue.de

Workshopband als PDF - Mpc.belwue.de

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Abbildung 1: Schritte zur Berechnung <strong>de</strong>s HOG-Deskriptors<br />

Abbildung 2: Einteilung <strong>de</strong>s Gradientenwinkels in Bins und<br />

Quadranten<br />

Ansatz zum Einsatz. Bei diesem wird nicht erst <strong>de</strong>r<br />

komplette Deskriptor eines Fensters bestimmt, son<strong>de</strong>rn<br />

<strong>de</strong>r Deskriptor wird erst bei <strong>de</strong>r Auswertung<br />

durch die SVM aus einzelnen Zellen zusammengesetzt.<br />

Des Weiteren ist auch die Realisierung einer Multiskalenerkennung<br />

Gegenstand <strong>de</strong>r Implementierung.<br />

Diese ist für eine Fußgängererkennung in <strong>de</strong>r Praxis<br />

unerlässlich, da verschie<strong>de</strong>ne Körpergrößen und Entfernungen<br />

zur Kamera abzu<strong>de</strong>cken sind. Während die<br />

meisten <strong>de</strong>r oben genannten FPGA-Implementierungen<br />

auf eine Skalenstufe beschränkt sind, soll<br />

hier eine Skalenanzahl von etwa 20 Stufen, wie sie bei<br />

CPU- und GPU-Implementierungen üblich ist, ermöglicht<br />

wer<strong>de</strong>n. Dies wie<strong>de</strong>rum erfor<strong>de</strong>rt eine ressourcenschonen<strong>de</strong><br />

Umsetzung <strong>de</strong>s Algorithmus, um die<br />

parallele Verarbeitung mehrerer Skalen zu ermöglichen,<br />

ohne dabei die oben genannten Echtzeitbedingungen<br />

zu verletzen. Einer <strong>de</strong>r Kernpunkte für die<br />

Ressourcenschonung ist hier die Verwendung einer<br />

Taktverdoppelung, wodurch an vielen Stellen Ressourcen<br />

eingespart wer<strong>de</strong>n können.<br />

Da jedoch auch große FPGAs nur über begrenzte<br />

Ressourcen verfügen, wird ein Zeitmultiplexverfahren<br />

vorgestellt, das es ermöglicht, mehr Skalenstufen zu<br />

berechnen <strong>als</strong> parallel mit <strong>de</strong>n vorhan<strong>de</strong>nen Ressourcen<br />

implementierbar sind.<br />

D. Überblick<br />

Im Kapitel II wird zunächst grundlegend die Theorie<br />

zum HOG- und SVM-Algorithmus erläutert. Anschließend<br />

wird im Kapitel III ein kurzer Überblick<br />

über die Implementierung und die darin enthaltenen<br />

Module gegeben, welche darauf folgend im Detail<br />

beschrieben wer<strong>de</strong>n. Kapitel IV stellt die Ergebnisse<br />

hinsichtlich Ressourcenbedarf, Echtzeitverhalten und<br />

58<br />

ERKENNUNG VON FUSSGÄNGERN IN ECHTZEIT AUF FPGAS<br />

Abbildung 3: Einteilung <strong>de</strong>s HOG-Klassifikationsfensters in<br />

Blöcke und Zellen<br />

Erkennungsgenauigkeit dar. Abschließend wird die<br />

Arbeit im Kapitel V zusammengefasst.<br />

II. ALGORITHMUS<br />

Die bildbasierte Detektion von Personen erfolgt<br />

nach <strong>de</strong>m sogenannten Sliding Window-Prinzip, bei<br />

<strong>de</strong>m immer nur ein Ausschnitt <strong>de</strong>s Bil<strong>de</strong>s mit fester<br />

Größe (hier: 64 x 128 Pixel) betrachtet wird. Durch<br />

Verschieben dieses Fensters von links oben nach<br />

rechts unten wird nach und nach das gesamte Bild<br />

ausgewertet.<br />

Die Erkennung setzt sich dabei aus drei Teilen zusammen:<br />

Zunächst wird für je<strong>de</strong>s Fenster ein Deskriptor<br />

berechnet. Dies erfolgt in diesem Fall mit Hilfe <strong>de</strong>s<br />

HOG-Algorithmus. Anschließend wird <strong>de</strong>r Deskriptor<br />

durch einen Klassifikator bewertet. Für diese Klassifikation<br />

wird eine SVM verwen<strong>de</strong>t. Überlappen<strong>de</strong> Erkennungen<br />

wer<strong>de</strong>n im letzten Schritt mit einer Non-<br />

Maxima Supression (NMS) zusammengefasst. Da die<br />

NMS jedoch nicht Teil dieser FPGA-Implementierung<br />

ist, wird sie nachfolgend nicht näher erläutert.<br />

A. Histograms of Oriented Gradients-Deskriptor<br />

In Abbildung 1 sind die einzelnen Schritte, die für<br />

die Berechnung <strong>de</strong>s HOG-Deskriptors notwendig sind,<br />

dargestellt. Zunächst wird das Eingangsbild

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!