05.11.2013 Aufrufe

Inkrementelle Akquisition von 3D-Objektmodellen - Institut für ...

Inkrementelle Akquisition von 3D-Objektmodellen - Institut für ...

Inkrementelle Akquisition von 3D-Objektmodellen - Institut für ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

24 IR-INI 2006–01, c○ 2006 <strong>Institut</strong> <strong>für</strong> Neuroinformatik, Ruhr-Universität Bochum, FRG<br />

5.2 Tracking eines Punktes<br />

Voraussetzung da<strong>für</strong>, dass ein Punkt zufriedenstellend verfolgt werden kann, ist, dass sich seine<br />

Position zwischen zwei Bildern nicht sehr verändert hat. Daher darf die Schrittweite beim Abfilmen<br />

des Objektes nicht zu groß sein, zufriedenstellende Ergebnisse brachte etwa eine Drehung des<br />

Objektes um 2 ◦ zwischen aufeinander folgenden Aufnahmen.<br />

5.2.1 Grobe Abschätzung<br />

Bekannt sei ein Punkt x = (x 1 , x 2 ) T im ersten Bild. Gesucht ist der korrespondierende Punkt<br />

x ′ = (x ′ 1, x ′ 2) T im zweiten Bild.<br />

Als Erstes können wir die Koordinaten grob schätzen. Da die Position sich nicht sehr verändert<br />

hat, ist eine Schätzung ˆx ′ = x meist ausreichend. Es kann aber auch berücksichtigt werden, wie<br />

sich die Position des Punktes in vorhergehenden Trackingschritten verändert hat, und die letzten<br />

Positionsveränderungen als Prognose <strong>für</strong> die jetzige Änderung benutzt werden. Sei also ∆x die<br />

Differenz <strong>von</strong> x zu den Koordinaten im vorhergehenden Bild, so könnten wir ˆx ′ = x+∆x schätzen.<br />

Nun wird in der näheren Umgebung des Bildpunktes ˆx ′ die tatsächliche Position x ′ des mit x<br />

korrespondierenden Punktes gesucht.<br />

Es ist nicht möglich, diese Position anhand einfacher Informationen wie der Farbwerte der Pixel<br />

zu identifizieren. Stattdessen sind komplexere lokale Bildinformationen“, also Beschreibungen des<br />

”<br />

Bildpunktes, nötig. Hierzu wird am Bildpunkt x eine Gabor Wavelet Transformation durchgeführt.<br />

5.2.2 Gabor Wavelet Transformation<br />

Mit einer Fourier-Transformation lässt sich ein Bild in seine räumlichen Frequenzen zerlegen.<br />

Erläuterungen hierzu siehe [FP03]. Es lässt sich damit feststellen, welche Frequenzen im Bild<br />

vorhanden sind. Dies sind globale Informationen, die also das gesamte Bild betreffen. Mit Gabor-<br />

Wavelets lässt sich eine lokale Frequenzanalyse durchführen, das heißt es lässt sich feststellen,<br />

welche räumliche Frequenzen in einem bestimmten Bereich des Bildes auftreten. Dies ist die lokale<br />

Information, die wir benutzen, um den Bildpunkt x ′ zu identifizieren. Die folgende Beschreibung<br />

der Gabor Wavelet Transformation orientiert sich an [FP03] und [Pet02].<br />

Beispiele <strong>für</strong> Gabor-Wavelets sind in Abbildung 5.1 zu sehen. Ein Gabor-Wavelet stellt eine bestimmte<br />

räumliche Frequenz in einer bestimmten Ausrichtung dar. Die Grundlage eines Gabor-<br />

Wavelets ist also ein Grauwertbild, dessen Intensitäten in einer Richtung konstant sind und in<br />

orthogonaler Richtung durch eine Sinus- bzw. Cosinuskurve mit besagter Frequenz bestimmt werden.<br />

Dieses wird mit einer Gaußglocke multipliziert. Das Benutzen der Sinuskurve führt zu einem<br />

antisymmetrischen Wavelet, das Benutzen der Cosinuskurve zu einem symmetrischen Wavelet.<br />

Meistens werden beide Varianten in Paaren benutzt.<br />

Ein Gabor-Wavelet kann also beschrieben werden durch die Gleichungen<br />

)<br />

G symmetrisch (x) = cos(k T x) exp<br />

(− x2<br />

2σ 2 (5.1)<br />

und<br />

)<br />

G antisymmetrisch (x) = sin(k T x) exp<br />

(− x2<br />

2σ 2<br />

(5.2)<br />

Hier gibt x = (x 1 , x 2 ) T die Bildkoordinaten an, der Parameter k = (k 1 , k 2 ) T bestimmt die Orientierung<br />

und Frequenz des Wavelets, σ ist die Varianz der Gaußfunktion und bestimmt somit die<br />

Skalierung des Filters (siehe unten). Je größer σ ist, desto größer ist der Bildbereich, der Einfluß

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!