Workshopband als PDF - Mpc.belwue.de
Workshopband als PDF - Mpc.belwue.de
Workshopband als PDF - Mpc.belwue.de
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Abbildung 1: Schritte zur Berechnung <strong>de</strong>s HOG-Deskriptors<br />
Abbildung 2: Einteilung <strong>de</strong>s Gradientenwinkels in Bins und<br />
Quadranten<br />
Ansatz zum Einsatz. Bei diesem wird nicht erst <strong>de</strong>r<br />
komplette Deskriptor eines Fensters bestimmt, son<strong>de</strong>rn<br />
<strong>de</strong>r Deskriptor wird erst bei <strong>de</strong>r Auswertung<br />
durch die SVM aus einzelnen Zellen zusammengesetzt.<br />
Des Weiteren ist auch die Realisierung einer Multiskalenerkennung<br />
Gegenstand <strong>de</strong>r Implementierung.<br />
Diese ist für eine Fußgängererkennung in <strong>de</strong>r Praxis<br />
unerlässlich, da verschie<strong>de</strong>ne Körpergrößen und Entfernungen<br />
zur Kamera abzu<strong>de</strong>cken sind. Während die<br />
meisten <strong>de</strong>r oben genannten FPGA-Implementierungen<br />
auf eine Skalenstufe beschränkt sind, soll<br />
hier eine Skalenanzahl von etwa 20 Stufen, wie sie bei<br />
CPU- und GPU-Implementierungen üblich ist, ermöglicht<br />
wer<strong>de</strong>n. Dies wie<strong>de</strong>rum erfor<strong>de</strong>rt eine ressourcenschonen<strong>de</strong><br />
Umsetzung <strong>de</strong>s Algorithmus, um die<br />
parallele Verarbeitung mehrerer Skalen zu ermöglichen,<br />
ohne dabei die oben genannten Echtzeitbedingungen<br />
zu verletzen. Einer <strong>de</strong>r Kernpunkte für die<br />
Ressourcenschonung ist hier die Verwendung einer<br />
Taktverdoppelung, wodurch an vielen Stellen Ressourcen<br />
eingespart wer<strong>de</strong>n können.<br />
Da jedoch auch große FPGAs nur über begrenzte<br />
Ressourcen verfügen, wird ein Zeitmultiplexverfahren<br />
vorgestellt, das es ermöglicht, mehr Skalenstufen zu<br />
berechnen <strong>als</strong> parallel mit <strong>de</strong>n vorhan<strong>de</strong>nen Ressourcen<br />
implementierbar sind.<br />
D. Überblick<br />
Im Kapitel II wird zunächst grundlegend die Theorie<br />
zum HOG- und SVM-Algorithmus erläutert. Anschließend<br />
wird im Kapitel III ein kurzer Überblick<br />
über die Implementierung und die darin enthaltenen<br />
Module gegeben, welche darauf folgend im Detail<br />
beschrieben wer<strong>de</strong>n. Kapitel IV stellt die Ergebnisse<br />
hinsichtlich Ressourcenbedarf, Echtzeitverhalten und<br />
58<br />
ERKENNUNG VON FUSSGÄNGERN IN ECHTZEIT AUF FPGAS<br />
Abbildung 3: Einteilung <strong>de</strong>s HOG-Klassifikationsfensters in<br />
Blöcke und Zellen<br />
Erkennungsgenauigkeit dar. Abschließend wird die<br />
Arbeit im Kapitel V zusammengefasst.<br />
II. ALGORITHMUS<br />
Die bildbasierte Detektion von Personen erfolgt<br />
nach <strong>de</strong>m sogenannten Sliding Window-Prinzip, bei<br />
<strong>de</strong>m immer nur ein Ausschnitt <strong>de</strong>s Bil<strong>de</strong>s mit fester<br />
Größe (hier: 64 x 128 Pixel) betrachtet wird. Durch<br />
Verschieben dieses Fensters von links oben nach<br />
rechts unten wird nach und nach das gesamte Bild<br />
ausgewertet.<br />
Die Erkennung setzt sich dabei aus drei Teilen zusammen:<br />
Zunächst wird für je<strong>de</strong>s Fenster ein Deskriptor<br />
berechnet. Dies erfolgt in diesem Fall mit Hilfe <strong>de</strong>s<br />
HOG-Algorithmus. Anschließend wird <strong>de</strong>r Deskriptor<br />
durch einen Klassifikator bewertet. Für diese Klassifikation<br />
wird eine SVM verwen<strong>de</strong>t. Überlappen<strong>de</strong> Erkennungen<br />
wer<strong>de</strong>n im letzten Schritt mit einer Non-<br />
Maxima Supression (NMS) zusammengefasst. Da die<br />
NMS jedoch nicht Teil dieser FPGA-Implementierung<br />
ist, wird sie nachfolgend nicht näher erläutert.<br />
A. Histograms of Oriented Gradients-Deskriptor<br />
In Abbildung 1 sind die einzelnen Schritte, die für<br />
die Berechnung <strong>de</strong>s HOG-Deskriptors notwendig sind,<br />
dargestellt. Zunächst wird das Eingangsbild