01.03.2014 Aufrufe

Download - FWF

Download - FWF

Download - FWF

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

START-Preisträger 2013<br />

THOMAS POCK<br />

BILEVEL LERNEN IN DER COMPUTER VISION<br />

Durch die rasante Entwicklung von Bildaufnahmesystemen, wie zum Beispiel hochauflösende<br />

Digitalkameras, medizinische Scanner, aber auch Smartphones, ist die Computer Vision mittlerweile<br />

ein zentrales Thema in Forschung und Industrie geworden. Fast jeder Mensch hat heutzutage eine<br />

Videokamera und einen leistungsstarken Rechner in Form eines Smartphones in der Tasche. Ultra<br />

hochauflösende Digitalkameras erlauben ganze Städte aus der Luft aufzunehmen und dann mit<br />

Hilfe der Methoden der Computer Vision dreidimensional zu rekonstruieren. Auch in der<br />

Verkehrssicherheit spielt das maschinelle Sehen eine zunehmend größere Rolle. Die neuesten<br />

Autos der Oberklasse sind bereits mit einem Fahrerassistenzsystem ausgestattet, welches<br />

überwiegend auf Methoden der Computer Vision beruht.<br />

Die Probleme der Computer Vision gehören zu den sogenannten inversen Problemen, das<br />

bedeutet, dass man aus den beobachteten Bildern, die zuvor durch eine Projektion der<br />

dreidimensionalen Welt auf die zweidimensionale Bildebene entstanden sind, wieder auf<br />

Eigenschaften der dreidimensionalen Welt rückschließen möchte. Da diese Probleme im<br />

Allgemeinen keine eindeutige Lösung haben, muss ein gewisser Grad an Vorwissen eingebracht<br />

werden.<br />

Als großes Vorbild fungiert hier das menschliche visuelle System, welches selbst unter widrigsten<br />

Umständen im Stande ist, wichtige Eigenschaften der Welt zu erkennen (z.B. Autofahren bei Regen<br />

und Dunkelheit). Um solches Vorwissen effizient in die Problemformulierung einzubringen, stellt<br />

man diese Aufgabe sehr häufig als mathematisches Optimierungsproblem dar. Man betrachtet<br />

dabei ein sogenanntes Variationsmodell welches bewertet wie sehr eine Lösung dem Vorwissen<br />

entspricht und wie gut die beobachteten Daten (Bilder) erklärt werden.<br />

Ziel ist es, jene Lösung zu finden, welche das Variationsmodell minimiert, also den besten<br />

Kompromiss zwischen Vorwissen und Datentreue liefert. Dabei variiert man die Lösung des Modells<br />

so lange, bis man die minimale Lösung gefunden hat.<br />

Bestehende Variationsmodelle in der Computer Vision wurden bis jetzt überwiegend von Hand<br />

entworfen und basieren daher auf relativ einfachen Eigenschaften von Bildern. In vielen praktischen<br />

Anwendungen zeigt sich aber, dass diese Modelle viel zu grob sind und dem menschlichen<br />

visuellen System noch deutlich unterlegen sind.<br />

Wir werden daher in diesem Projekt deutlich komplexere Variationsmodelle entwickeln die wir mit<br />

Methoden der Bilevel Optimierung lernen werden. Die Grundidee diese Bilevel<br />

Optimierungsansatzes ist es, die Modellparameter so zu wählen, dass das Variationsmodell<br />

angewandt auf Bilder einer Trainingsdatenbank zu bestmöglichen Ergebnissen führt. Unser<br />

Hauptziel ist es, die Methoden der Bilevel Optimierung so weit zu entwickeln, dass sie für eine<br />

Vielzahl von Problemen in der Computer Vision verwendet werden können.<br />

Die Erkenntnisse aus diesem Projekt werden zu fundamental neuen Modellen führt, welche<br />

hinsichtlich spezieller Anwendungen und Bilddaten optimiert werden können, und verglichen mit<br />

bestehenden Variationsmodellen zu deutlich besseren Ergebnissen in praktischen Anwendungen<br />

führen werden.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!