Download - FWF
Download - FWF
Download - FWF
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
START-Preisträger 2013<br />
THOMAS POCK<br />
BILEVEL LERNEN IN DER COMPUTER VISION<br />
Durch die rasante Entwicklung von Bildaufnahmesystemen, wie zum Beispiel hochauflösende<br />
Digitalkameras, medizinische Scanner, aber auch Smartphones, ist die Computer Vision mittlerweile<br />
ein zentrales Thema in Forschung und Industrie geworden. Fast jeder Mensch hat heutzutage eine<br />
Videokamera und einen leistungsstarken Rechner in Form eines Smartphones in der Tasche. Ultra<br />
hochauflösende Digitalkameras erlauben ganze Städte aus der Luft aufzunehmen und dann mit<br />
Hilfe der Methoden der Computer Vision dreidimensional zu rekonstruieren. Auch in der<br />
Verkehrssicherheit spielt das maschinelle Sehen eine zunehmend größere Rolle. Die neuesten<br />
Autos der Oberklasse sind bereits mit einem Fahrerassistenzsystem ausgestattet, welches<br />
überwiegend auf Methoden der Computer Vision beruht.<br />
Die Probleme der Computer Vision gehören zu den sogenannten inversen Problemen, das<br />
bedeutet, dass man aus den beobachteten Bildern, die zuvor durch eine Projektion der<br />
dreidimensionalen Welt auf die zweidimensionale Bildebene entstanden sind, wieder auf<br />
Eigenschaften der dreidimensionalen Welt rückschließen möchte. Da diese Probleme im<br />
Allgemeinen keine eindeutige Lösung haben, muss ein gewisser Grad an Vorwissen eingebracht<br />
werden.<br />
Als großes Vorbild fungiert hier das menschliche visuelle System, welches selbst unter widrigsten<br />
Umständen im Stande ist, wichtige Eigenschaften der Welt zu erkennen (z.B. Autofahren bei Regen<br />
und Dunkelheit). Um solches Vorwissen effizient in die Problemformulierung einzubringen, stellt<br />
man diese Aufgabe sehr häufig als mathematisches Optimierungsproblem dar. Man betrachtet<br />
dabei ein sogenanntes Variationsmodell welches bewertet wie sehr eine Lösung dem Vorwissen<br />
entspricht und wie gut die beobachteten Daten (Bilder) erklärt werden.<br />
Ziel ist es, jene Lösung zu finden, welche das Variationsmodell minimiert, also den besten<br />
Kompromiss zwischen Vorwissen und Datentreue liefert. Dabei variiert man die Lösung des Modells<br />
so lange, bis man die minimale Lösung gefunden hat.<br />
Bestehende Variationsmodelle in der Computer Vision wurden bis jetzt überwiegend von Hand<br />
entworfen und basieren daher auf relativ einfachen Eigenschaften von Bildern. In vielen praktischen<br />
Anwendungen zeigt sich aber, dass diese Modelle viel zu grob sind und dem menschlichen<br />
visuellen System noch deutlich unterlegen sind.<br />
Wir werden daher in diesem Projekt deutlich komplexere Variationsmodelle entwickeln die wir mit<br />
Methoden der Bilevel Optimierung lernen werden. Die Grundidee diese Bilevel<br />
Optimierungsansatzes ist es, die Modellparameter so zu wählen, dass das Variationsmodell<br />
angewandt auf Bilder einer Trainingsdatenbank zu bestmöglichen Ergebnissen führt. Unser<br />
Hauptziel ist es, die Methoden der Bilevel Optimierung so weit zu entwickeln, dass sie für eine<br />
Vielzahl von Problemen in der Computer Vision verwendet werden können.<br />
Die Erkenntnisse aus diesem Projekt werden zu fundamental neuen Modellen führt, welche<br />
hinsichtlich spezieller Anwendungen und Bilddaten optimiert werden können, und verglichen mit<br />
bestehenden Variationsmodellen zu deutlich besseren Ergebnissen in praktischen Anwendungen<br />
führen werden.