Masterarbeit Corinna Harmening Raum-zeitliche Segmentierung ...
Masterarbeit Corinna Harmening Raum-zeitliche Segmentierung ...
Masterarbeit Corinna Harmening Raum-zeitliche Segmentierung ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
3.5 <strong>Raum</strong>-<strong>zeitliche</strong> <strong>Segmentierung</strong>sverfahren<br />
anderen Frame zusammenhängend segmentiert werden. Daraus ergibt sich zum einen eine<br />
starke Veränderung der Größe und eine Verlagerung des Schwerpunktes des Segmentes,<br />
zum anderen besitzt nicht jedes Segment genau ein Partnersegment in der zeitlich folgenden<br />
Aufnahme [Brendel u. Todorovic (2009)].<br />
Dieses Problem lässt sich mit sogenannten Shape-Matching-Verfahren umgehen, die die<br />
Ähnlichkeit verschiedener Segmente aufgrund der Form beurteilen. Gegenüber dem Vergleich<br />
von z. B. Größe oder Position besitzt diese Beurteilung den entscheidenden Vorteil,<br />
dass Segmentgrenzen zwischen einzelnen Frames kaum durch das oben beschriebene Aufsplitten<br />
oder Zusammenfügen verändert werden.<br />
Brendel u. Todorovic (2009) stellen ein Shape-Matching-Verfahren für Videos vor, das<br />
zwei Objektgrenzen mit Hilfe des Dynamic Time Warping (DTW) bestmöglich ineinander<br />
überführt.<br />
Da in der vorliegenden Arbeit ebenfalls ein auf DTW basierender Shape-Matching-Algorithmus<br />
verwendet wird, werden die für das Verständnis benötigten Grundlagen im Anschluss<br />
an den hier gegebenen Überblick ausführlicher behandelt (siehe Abschnitt 3.5.3).<br />
3.5.2 <strong>Segmentierung</strong> eines raum-<strong>zeitliche</strong>n Volumens<br />
Neben den Trackingverfahren existieren Verfahren, die die <strong>zeitliche</strong> und räumliche Dimension<br />
während der <strong>Segmentierung</strong> nicht voneinander trennen. Die gesamte Datenmenge<br />
wird dabei im Falle eines Videos als ein dreidimensionales (bzw. 2D + t) und im Falle<br />
einer in <strong>zeitliche</strong>n Abständen aufgenommenen Punktwolke als ein vierdimensionales (bzw.<br />
3D + t) Volumen interpretiert. Üblicherweise wird die <strong>Segmentierung</strong> in diesen Fällen entweder<br />
graphbasiert oder mit Hilfe eines Clusterings durchgeführt [DeMenthon u. Megret<br />
(2002)].<br />
3.5.2.1 Graphbasierte raum-<strong>zeitliche</strong> <strong>Segmentierung</strong><br />
Die graphbasierte raum-<strong>zeitliche</strong> <strong>Segmentierung</strong> unterscheidet sich kaum von den in Abschnitt<br />
3.4.1.2 vorgestellten Verfahren. Der einzige Unterschied liegt in der Konstruktion<br />
des Graphen, dessen Kanten nicht nur Knoten einer Aufnahme, sondern auch Knoten<br />
unterschiedlicher Aufnahmen miteinander verbinden. Wird ein Grid-Graph verwendet, so<br />
entsteht im Falle einer Videosegmentierung ein dreidimensionaler Würfel (siehe Abbildung<br />
43