Inkrementelle Akquisition von 3D-Objektmodellen - Institut für ...
Inkrementelle Akquisition von 3D-Objektmodellen - Institut für ...
Inkrementelle Akquisition von 3D-Objektmodellen - Institut für ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
24 IR-INI 2006–01, c○ 2006 <strong>Institut</strong> <strong>für</strong> Neuroinformatik, Ruhr-Universität Bochum, FRG<br />
5.2 Tracking eines Punktes<br />
Voraussetzung da<strong>für</strong>, dass ein Punkt zufriedenstellend verfolgt werden kann, ist, dass sich seine<br />
Position zwischen zwei Bildern nicht sehr verändert hat. Daher darf die Schrittweite beim Abfilmen<br />
des Objektes nicht zu groß sein, zufriedenstellende Ergebnisse brachte etwa eine Drehung des<br />
Objektes um 2 ◦ zwischen aufeinander folgenden Aufnahmen.<br />
5.2.1 Grobe Abschätzung<br />
Bekannt sei ein Punkt x = (x 1 , x 2 ) T im ersten Bild. Gesucht ist der korrespondierende Punkt<br />
x ′ = (x ′ 1, x ′ 2) T im zweiten Bild.<br />
Als Erstes können wir die Koordinaten grob schätzen. Da die Position sich nicht sehr verändert<br />
hat, ist eine Schätzung ˆx ′ = x meist ausreichend. Es kann aber auch berücksichtigt werden, wie<br />
sich die Position des Punktes in vorhergehenden Trackingschritten verändert hat, und die letzten<br />
Positionsveränderungen als Prognose <strong>für</strong> die jetzige Änderung benutzt werden. Sei also ∆x die<br />
Differenz <strong>von</strong> x zu den Koordinaten im vorhergehenden Bild, so könnten wir ˆx ′ = x+∆x schätzen.<br />
Nun wird in der näheren Umgebung des Bildpunktes ˆx ′ die tatsächliche Position x ′ des mit x<br />
korrespondierenden Punktes gesucht.<br />
Es ist nicht möglich, diese Position anhand einfacher Informationen wie der Farbwerte der Pixel<br />
zu identifizieren. Stattdessen sind komplexere lokale Bildinformationen“, also Beschreibungen des<br />
”<br />
Bildpunktes, nötig. Hierzu wird am Bildpunkt x eine Gabor Wavelet Transformation durchgeführt.<br />
5.2.2 Gabor Wavelet Transformation<br />
Mit einer Fourier-Transformation lässt sich ein Bild in seine räumlichen Frequenzen zerlegen.<br />
Erläuterungen hierzu siehe [FP03]. Es lässt sich damit feststellen, welche Frequenzen im Bild<br />
vorhanden sind. Dies sind globale Informationen, die also das gesamte Bild betreffen. Mit Gabor-<br />
Wavelets lässt sich eine lokale Frequenzanalyse durchführen, das heißt es lässt sich feststellen,<br />
welche räumliche Frequenzen in einem bestimmten Bereich des Bildes auftreten. Dies ist die lokale<br />
Information, die wir benutzen, um den Bildpunkt x ′ zu identifizieren. Die folgende Beschreibung<br />
der Gabor Wavelet Transformation orientiert sich an [FP03] und [Pet02].<br />
Beispiele <strong>für</strong> Gabor-Wavelets sind in Abbildung 5.1 zu sehen. Ein Gabor-Wavelet stellt eine bestimmte<br />
räumliche Frequenz in einer bestimmten Ausrichtung dar. Die Grundlage eines Gabor-<br />
Wavelets ist also ein Grauwertbild, dessen Intensitäten in einer Richtung konstant sind und in<br />
orthogonaler Richtung durch eine Sinus- bzw. Cosinuskurve mit besagter Frequenz bestimmt werden.<br />
Dieses wird mit einer Gaußglocke multipliziert. Das Benutzen der Sinuskurve führt zu einem<br />
antisymmetrischen Wavelet, das Benutzen der Cosinuskurve zu einem symmetrischen Wavelet.<br />
Meistens werden beide Varianten in Paaren benutzt.<br />
Ein Gabor-Wavelet kann also beschrieben werden durch die Gleichungen<br />
)<br />
G symmetrisch (x) = cos(k T x) exp<br />
(− x2<br />
2σ 2 (5.1)<br />
und<br />
)<br />
G antisymmetrisch (x) = sin(k T x) exp<br />
(− x2<br />
2σ 2<br />
(5.2)<br />
Hier gibt x = (x 1 , x 2 ) T die Bildkoordinaten an, der Parameter k = (k 1 , k 2 ) T bestimmt die Orientierung<br />
und Frequenz des Wavelets, σ ist die Varianz der Gaußfunktion und bestimmt somit die<br />
Skalierung des Filters (siehe unten). Je größer σ ist, desto größer ist der Bildbereich, der Einfluß