Entwicklung eines portablen Stereo-Videoaufnahmesystems für die ...

TECHNISCHE UNIVERSITÄT DRESDEN 

FAKULTÄT INFORMATIK 

INSTITUT FÜR SOFTWARE- UND MULTIMEDIATECHNIK 

PROFESSUR FÜR COMPUTERGRAPHIK UND VISUALISIERUNG 

PROF. DR. STEFAN GUMHOLD 

Diplomarbeit 

zur Erlangung des akademischen Grades 

Diplom-Medieninformatiker 

Entwicklung eines portablen 

Stereo-Videoaufnahmesystems für die Präsentation 

auf einer Stereoprojektionswand. 

Norbert Blenn 

(Geboren am 26. März 1981 in Burgstädt) 

Betreuer: Prof. Dr. rer. nat. Stefan Gumhold 

Dresden, 17. Juli 2007

Aufgabenstellung 

Ziel der Diplomarbeit ist die Entwicklung eines portablen Stereo-Videoaufnahmesystems für die 

Präsentation auf der Stereoprojektionswand des Lehrstuhls für Computergraphik und Visualisie- 

rung. Dazu sollen vorhandene Lösungen recherchiert und eine Stereo-Videokamera entwickelt 

werden. Die aufgenommenen Stereo-Videos sollen in einem passenden Datenformat gespeichert 

und wiedergegeben werden. Um dies zu realisieren sollte ein Framework geschaffen werden, wel- 

ches in weiteren Arbeiten am Lehrstuhl genutzt werden kann. Im Einzelnen sollen folgende Punkte 

in der Diplomarbeit verwirklicht werden: 

• Recherche existierender Stereo-Videoaufnahmesysteme, 

• Entwurf und Bau einer kostengünstigen Stereo-Videokamera, 

• Entwicklung einer effizienten Lösung zum Datentransfer von einer Stereo-Videokamera in 

ein Stereovideoformat, 

• Entwicklung eines Stereo-Videoplayers zur weiteren Nutzung am Lehrstuhl Computergra- 

phik und Visualisierung und 

• Aufnahme von Beispielstereovideos.

Selbstständigkeitserklärung 

Hiermit erkläre ich, dass ich die von mir am heutigen Tag dem Prüfungsausschuss der Fakultät 

Informatik eingereichte Diplomarbeit zum Thema: 

Entwicklung eines portablen Stereo-Videoaufnahmesystems für die Präsentation auf einer 

Stereoprojektionswand. 

vollkommen selbstständig verfasst und keine anderen als die angegebenen Quellen und Hilfsmittel 

benutzt sowie Zitate kenntlich gemacht habe. 

Dresden, den 17. Juli 2007 

Norbert Blenn

Kurzfassung 

In dieser Diplomarbeit wurde ein Aufnahmesystem für die Produktion stereoskopischer Videos 

entwickelt und erprobt. Basierend auf zwei Highdefinition Video-Camcordern wurde eine mobile 

Stereokamera konstruiert, welche eine hohe Bildqualität liefert. Die technischen Möglichkeiten 

und Einschränkungen dieses Aufnahmesystems wurden dabei genau untersucht. Weiterhin thema- 

tisiert diese Arbeit die Nachbearbeitung, Speicherung und Wiedergabe stereoskopischer Videos 

sowie Möglichkeiten des wissenschaftlichen Einsatzes der entwickelten Kamera. 

Zusätzlich wurden die zum Bildeindruck beitragenden physiologischen und geometrischen Para- 

meter untersucht und daraus die Grundlagen für die Entwicklung des Aufnahmesystems abgeleitet. 

Diese beinhaltet Aufnahmetechniken, Bildgestaltungsregeln, Schnittverfahren und Wiedergabe- 

hinweise. Durch die vorgestellten Grundlagen zur Erzeugung von stereoskopischen Videos soll es 

den Nutzern des Aufnahmesystems ermöglicht werden, solche Videos mit einer hohen Betrach- 

tungsqualität und vielen Weiterverarbeitungsmöglichkeiten zu erstellen. 

Abstract 

In this diploma thesis a recording system for stereoscopic video has been developed and proven. 

Based on two highdefinition video-camcorder a mobile stereo camera with a high image quality 

has been constructed. The technical abilities and restrictions of this recording system had been 

exactly analyzed. Furthermore topics of this thesis are the post processing, storage and playback 

of stereoscopic videos as well as the abilities of supervision work with the camera. 

The physiological and geometric parameters for the image perception have been evolved and rules 

for the production of stereo video are discussed. These rules contain image layout, recording 

techniques, procedures for cutting and hints for playback of stereoscopic video. This should allow 

the user of the recording system to produce stereoscopic video with a high image quality and many 

abilities for processing these videos.

Inhaltsverzeichnis 

1 Einleitung 5 

1.1 Aufbau dieser Arbeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 

1.2 Die Stereoprojektionsleinwand des Lehrstuhls für Computergrafik und Visualisie- 

rung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 

1.3 Begriffserklärungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 

2 Wahrnehmung, Aufnahme und Wiedergabe 10 

2.1 Vorgang der visuellen Wahrnehmung . . . . . . . . . . . . . . . . . . . . . . . . 10 

2.1.1 Ursache der räumlichen Wahrnehmung . . . . . . . . . . . . . . . . . . 11 

2.1.2 Berechnung der Parallaxe . . . . . . . . . . . . . . . . . . . . . . . . . 13 

2.1.3 Weitere optische Effekte . . . . . . . . . . . . . . . . . . . . . . . . . . 13 

2.2 Verfahren der Aufnahme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 

2.2.1 Die Scheinfensterregel . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 

2.2.2 Wahl der Stereobasis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 

2.2.3 Aufnahmemethoden . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 

2.2.3.1 Die Verschiebetechnik . . . . . . . . . . . . . . . . . . . . . . 17 

2.2.3.2 Strahlenteilermethode . . . . . . . . . . . . . . . . . . . . . . 18 

2.2.3.3 Die Stereokamera . . . . . . . . . . . . . . . . . . . . . . . . 19 

2.2.3.4 Einsatz Binokularer Kameras . . . . . . . . . . . . . . . . . . 19 

2.3 Wiedergabe stereoskopischer Bildinhalte . . . . . . . . . . . . . . . . . . . . . . 20 

2.3.1 Durch Konvergenz notwendige Schrägprojektion . . . . . . . . . . . . . 22 

2.3.1.1 Epipolargeometrie . . . . . . . . . . . . . . . . . . . . . . . . 23 

2.3.1.2 Schrägprojektion bei bekanntem Konvergenzwinkel . . . . . . 23 

2.3.1.3 Schrägprojektion bei unbekanntem Konvergenzwinkel . . . . . 29 

2.3.2 Berechnung des virtuellen Abstandes . . . . . . . . . . . . . . . . . . . 30 

2.3.3 Berechnung der virtuellen Tiefe . . . . . . . . . . . . . . . . . . . . . . 31 

2.3.4 Berechnung der Betrachterposition . . . . . . . . . . . . . . . . . . . . . 32 

2.3.5 Wiedergabemethoden . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 

2.3.5.1 Head Mounted Displays . . . . . . . . . . . . . . . . . . . . . 32 

2.3.5.2 Polarisation . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 

2.3.5.3 Schieltechniken . . . . . . . . . . . . . . . . . . . . . . . . . 33 

2.3.5.4 Stereoskop . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 

2.3.5.5 LCDShutter-Brille . . . . . . . . . . . . . . . . . . . . . . . . 34 

2.3.5.6 Prismenbrille . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 

2.3.5.7 Interferenzfiltertechnik . . . . . . . . . . . . . . . . . . . . . 35 

1

2.3.5.8 Prismen-Oberfläche . . . . . . . . . . . . . . . . . . . . . . . 35 

2.3.5.9 Anaglyphen Verfahren . . . . . . . . . . . . . . . . . . . . . . 36 

2.3.5.10 Pulfrich-Verfahren . . . . . . . . . . . . . . . . . . . . . . . . 36 

2.3.6 Mögliche Bildstörungen in stereoskopischem Video . . . . . . . . . . . 36 

2.3.6.1 Höhenfehler . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 

2.3.6.2 Randlichtabfall . . . . . . . . . . . . . . . . . . . . . . . . . 37 

2.3.6.3 Verzeichnung . . . . . . . . . . . . . . . . . . . . . . . . . . 37 

2.3.6.4 Aberration . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 

2.3.6.5 Krümmung der Tiefenebene . . . . . . . . . . . . . . . . . . . 38 

2.3.6.6 Nicht linearer Tiefeneindruck . . . . . . . . . . . . . . . . . . 39 

3 Existierende Aufnahmesysteme 40 

3.1 Kameras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 

3.1.1 Stereovideokamera . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 

3.1.1.1 21st Century 3DVX3 . . . . . . . . . . . . . . . . . . . . . . 40 

3.1.1.2 Pace Fusion 3d . . . . . . . . . . . . . . . . . . . . . . . . . . 41 

3.1.1.3 TMP S3R 1080i 3D . . . . . . . . . . . . . . . . . . . . . . . 41 

3.1.2 Binokulare Kameras . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 

3.1.2.1 Camcorder . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 

3.1.2.2 Industriekameras . . . . . . . . . . . . . . . . . . . . . . . . . 43 

3.1.3 Strahlenteiler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 

3.2 Existierende Software . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 

3.2.1 Aufnahme & Enkodierung . . . . . . . . . . . . . . . . . . . . . . . . . 44 

3.2.1.1 3DCombine . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 

3.2.1.2 Stereoscopic Multiplexer . . . . . . . . . . . . . . . . . . . . 45 

3.2.1.3 Stereo Movie Maker . . . . . . . . . . . . . . . . . . . . . . . 45 

3.2.2 Wiedergabe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 

3.2.2.1 Stereo Movie Player . . . . . . . . . . . . . . . . . . . . . . . 46 

3.2.2.2 Stereoscopic Player . . . . . . . . . . . . . . . . . . . . . . . 46 

3.2.2.3 More3D SoftwareSuite . . . . . . . . . . . . . . . . . . . . . 46 

3.2.3 Weiterverarbeitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 

4 Aufnahmesystem 48 

4.1 Kriterien zur Kameraauswahl . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 

4.1.1 Digitale Formate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 

4.1.2 Synchronisierung der Kameras . . . . . . . . . . . . . . . . . . . . . . . 50 

4.1.2.1 Genlock . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 

4.1.2.2 LANC TM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 

4.1.2.3 Control M . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 

4.1.3 Anschlussmöglichkeit für Sensoren . . . . . . . . . . . . . . . . . . . . 52 

4.1.3.1 Kodierung der Daten in einen Audiostrom . . . . . . . . . . . 52 

4.1.3.2 Kodierung der Daten in das Bild . . . . . . . . . . . . . . . . 52 

2

4.1.3.3 Kodierung der Daten in das Videoformat . . . . . . . . . . . . 53 

4.1.3.4 Aufnahme von Raumklang . . . . . . . . . . . . . . . . . . . 54 

4.1.4 Abmaße der Kameras . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 

4.2 Genutzte Kameras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 

4.3 Befestigung zur Aufnahme und Justierung von zwei Kameras . . . . . . . . . . . 57 

4.3.1 Existierende Halterungen . . . . . . . . . . . . . . . . . . . . . . . . . . 57 

4.3.2 Verwendete Halterung . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 

4.3.3 Justierung der Stereokamera . . . . . . . . . . . . . . . . . . . . . . . . 61 

4.4 Fernbedienung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 

4.4.1 Existierende Bedieneinheiten . . . . . . . . . . . . . . . . . . . . . . . . 63 

4.4.2 Verwendeter Controller . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 

4.4.3 Messung der Synchonität . . . . . . . . . . . . . . . . . . . . . . . . . . 66 

4.5 GPS-Empfänger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 

4.6 Kameraparameter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 

4.6.1 Interne Parameter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 

4.6.2 Externe Parameter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 

4.6.3 Stereokalibrierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 

4.6.4 Selbstkalibrierung von Stereokameras . . . . . . . . . . . . . . . . . . . 75 

5 Datenverarbeitung 76 

5.1 DirectShow . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 

5.1.1 Genutztes Videoformat . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 

5.1.2 Rektifikation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 

5.1.3 Transformation in das Stereovideoformat . . . . . . . . . . . . . . . . . 83 

5.1.4 Anaglyphe Wiedergabe . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 

5.1.4.1 Echte Rot-Blau und Rot-Cyan Anaglyphen . . . . . . . . . . . 85 

5.1.4.2 Graustufen Anaglyphen . . . . . . . . . . . . . . . . . . . . . 86 

5.1.4.3 Farbige Anaglyphen . . . . . . . . . . . . . . . . . . . . . . . 86 

5.1.5 Zweibildschirm Wiedergabe . . . . . . . . . . . . . . . . . . . . . . . . 88 

5.1.6 Wiedergabe über den NVIDIA TM 3D Stereo Treiber . . . . . . . . . . . 89 

5.2 Gps-Daten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 

5.3 Nachbearbeitung von Stereovideos . . . . . . . . . . . . . . . . . . . . . . . . . 90 

5.3.1 Einblenden von Titeln . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 

5.3.2 Anwenden von Blend-Effekten . . . . . . . . . . . . . . . . . . . . . . . 91 

5.3.3 Überlagern von Stereovideo mit Videoinhalten . . . . . . . . . . . . . . 91 

5.3.4 Kompression von Stereovideo . . . . . . . . . . . . . . . . . . . . . . . 92 

6 Fazit 94 

6.1 Zusammenfassung der Arbeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 

6.2 Mögliche Erweiterungen der Stereokamera . . . . . . . . . . . . . . . . . . . . 95 

6.2.1 Aufnahme von Stereopanoramen . . . . . . . . . . . . . . . . . . . . . . 96 

6.2.2 Bedieneinheit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 

3

6.2.3 Halterung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 

6.2.4 Sensordaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 

6.3 Forschungsfragen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 

6.3.1 Datenverarbeitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 

6.3.1.1 Aufnahme von Stereovideodaten . . . . . . . . . . . . . . . . 99 

6.3.1.2 Verarbeitung von Stereovideodaten . . . . . . . . . . . . . . . 100 

6.3.1.3 Speicherung von Stereovideodaten . . . . . . . . . . . . . . . 100 

6.3.1.4 Sensordaten . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 

6.3.2 Verwendung stereoskopischer Aufnahmen . . . . . . . . . . . . . . . . . 101 

A Anhang I 

A.1 Hinweise zur Bedienung der Stereovideokamera . . . . . . . . . . . . . . . . . . I 

A.1.1 Aufnahmeregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . I 

A.1.2 Bedieneinheit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . I 

A.1.2.1 Stromversorgung . . . . . . . . . . . . . . . . . . . . . . . . II 

A.1.2.2 Einstellen des Konvergenzwinkels . . . . . . . . . . . . . . . II 

A.1.2.3 Anschluss der Einzelkameras . . . . . . . . . . . . . . . . . . II 

A.1.3 Anschluss eines Sensors . . . . . . . . . . . . . . . . . . . . . . . . . . II 

A.1.3.1 Funktionsübersicht der Fernbedienung . . . . . . . . . . . . . III 

A.1.4 Anschluss an einen PC . . . . . . . . . . . . . . . . . . . . . . . . . . . III 

A.1.4.1 Programmierung der Fernbedienung . . . . . . . . . . . . . . IV 

A.2 LANC Protokoll . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . VI 

A.3 Messung der Synchronität der Camcorder . . . . . . . . . . . . . . . . . . . . . VIII 

A.4 Kostenaufstellung für die entwickelte Stereovideokamera . . . . . . . . . . . . . IX 

Abkürzungsverzeichnis X 

Literaturverzeichnis XII 

Abbildungsverzeichnis XVII 

Tabellenverzeichnis XX 

4

1 Einleitung 

„Mit dem Zweiten sieht man besser.“ 

Zitat des Zweiten Deutschen Fernsehens 

Menschen besitzen zwei Augen, mit welchen die Welt um sie herum wahrgenommen wird. Ein 

zweites Auge erweitert das Blickfeld des Menschen sehr stark. 

Durch den Abstand der Augen und deren Lage werden Objekte um uns herum aus zwei leicht 

verschiedenen Perspektiven wahrgenommen, da wir im Gegensatz zu einigen Tieren ein stereo- 

skopisches Blickfeld haben. Dies bedeutet, dass sich das Blickfeld unserer zwei Augen um ca. 

120 Grad überschneidet, wodurch unser Gehirn in der Lage ist, aus resultierenden perspektivi- 

schen Differenzen, die Entfernung von Gegenständen und deren Tiefe abzuschätzen. 

Diese Tatsache ist bereits Euklid von Alexandria 1 , 300 Jahre v. Chr. aufgefallen, der Maßbezie- 

hungen für die drei Dimensionen aufstellte. Circa 150 Jahre n. Chr. hat Galen 2 wohl als erster eine 

Erklärung des Zusammenwirkens beider Augen für die Entstehung des stereoskopischen Sehens 

gegeben. Wobei, „Stereo“ aus dem griechischen kommt und für „räumlich“ steht und „skopein“ 

sich vom griechischen Wort für „Sehen“ ableitet. 

Mit der Erfindung der Fotographie konnte erstmals von echter „Stereografie“ gesprochen werden, 

wobei „graphein“ für schreiben steht. Es wurde von Malern des 16. und 17. Jahrhunderts, wel- 

che sich eingehend mit Perspektive und Raum befasst haben, mit meist unzureichenden Mitteln 

versucht, stereoskopische Halbbilder zu zeichnen. Jedoch erst die Fotographie ermöglichte eine 

exakte Darstellung. 

Nachdem am 19. August 1839 in der Akademie der Wissenschaften zu Paris das Daguerre’sche 

Verfahren zur Herstellung photographischer Bilder auf Silberschichten öffentlich bekannt gegeben 

war, lag es nahe, auch Doppelaufnahmen herzustellen. Die erste Deutsche Publikation stammt von 

Ludwig Moser, aus Königsberg, welcher über die neue Technik folgendes schrieb: 

„Als ich vor einigen Jahren mir dergleichen Bilder [Stereoskopien] anfertigte, war 

ich doch anfangs über deren Effekt im Stereoskop ungewiss. Da diese Bilder schon 

einzeln einen so guten perspektivischen Eindruck machen, so schien mir, dass derselbe 

hier nicht erheblich gesteigert werden könnte. Allein der erste Versuch hat mich eines 

Andern belehrt; der perspektivische Eindruck auch des besten Bildes kommt kaum in 

Betracht gegen denjenigen, welchen zwei entsprechende Bilder im Stereoskop machen 

[Sch07]“. 

1 

griechisch: Eukleides; lateinisch Euclidus; * ca. 365 v. Chr. vermutlich in Alexandria oder Athen; †ca. 300 v. Chr., 

griechischer Mathematiker. 

2 

Galenos von Pergamon (dt. Galen, lat. Claudius Galenus; * um 129 in Pergamon, †um 216 in Rom) war griechischer 

Arzt und Anatom. 

5

1.1. AUFBAU DIESER ARBEIT 6 

Diese Begeisterung für Stereobilder existiert noch heute, was der Ansturm auf „3D-Kinos“ und die 

Verbreitung dieser zeigt. Durch die Erfindung des Computers wurde die Möglichkeit geschaffen 

irreale Gegenstände wie sie nur die Malerei und Zeichnung hervorbrachten, mathematisch perfekt 

darzustellen. Somit ist es uns heutzutage möglich, virtuelle Objekte stereoskopisch darzustellen. 

Gerade im Bereich der Videospiele, Trick- und Animationsfilme ist diese Technik weit verbreitet. 

1.1 Aufbau dieser Arbeit 

Diese Arbeit gliedert sich durch die Einzelanforderungen der Aufgabenstellung in sechs Kapitel. 

Ein einführendes Kapitel enthält die Motivation, einige Begriffserläuterungen, welche für 

das Verständnis der Arbeit von Bedeutung sind, sowie die Beschreibung der Stereoprojekti- 

onsleinwand des Lehrstuhls für Computergrafik und Visualisierung. 

Das zweite Kapitel stellt Grundlagen der menschlichen Wahrnehmung, der Aufnahme und 

der Wiedergabe stereoskopischer Bildinhalte vor. In diesem Kapitel werden physikalische 

Größen bestimmt, welche den Sehvorgang beschreiben und auf technische Kameraparame- 

ter abgebildet. Es werden existierende stereoskopische Aufnahme und Wiedergabemetho- 

den vorgestellt sowie Probleme bei der Aufnahme und Wiedergabe erläutert. 

Das dritte Kapitel widmet sich der Erläuterung von existierenden Aufnahmesystemen und 

der Verifikation dieser gegenüber der Aufgabenstellung. Es werden aktuelle Stereokameras 

und deren Funktionen vorgestellt. Ebenfalls wird existierende Software zur Bearbeitung und 

Wiedergabe von bewegten Raumbildern erläutert. 

Im vierten Kapitel wird das entwickelte Aufnahmesystem erläutert. Dabei wird beschrieben, 

welche Art einer Stereokamera entworfen wurde und wie deren Einzelkameras ausgewählt 

wurden. Die Synchronisation und Verarbeitung von Sensorinformationen des Stereosystems 

sowie die Entwicklung der Halterung wird beschrieben. Abschließend wird erläutert, wie 

Kameraparameter bestimmt werden können und Beispielwerte gegeben. 

Im darauffolgenden Kapitel wird die Erstellung der Software beschrieben, die zur Verarbei- 

tung von Stereovideoaufnahmen entwickelt wurde. Es wird beschrieben wie verschiedene 

Stereovideoformate berechnet und verarbeitet werden können. Weiterhin wird der Umgang 

mit Sensordaten beschrieben und Empfehlungen für den Umgang mit Stereovideos gegeben. 

Ebenfalls wird ein Verfahren zur Komprimierung von Raumbildpaaren vorgestellt. 

Im Fazit wird die hier vorliegende Arbeit zusammengefasst und Anregungen für weiterfüh- 

rende Arbeiten gegeben. Mögliche Modifikationen und Erweiterungen der Stereovideoka- 

mera werden beschrieben und deren Einsatzmöglichkeiten erläutert. 

Der Anhang enthält Hinweise zur Bedienung der Stereovideokamera und eine Beschreibung 

des LANC Protokolls, welches von der entworfenen Fernbedienung genutzt wird sowie eine 

Kostenaufstellung.

1.2. DIE STEREOPROJEKTIONSLEINWAND DES LEHRSTUHLS FÜR 

COMPUTERGRAFIK UND VISUALISIERUNG 7 

1.2 Die Stereoprojektionsleinwand des Lehrstuhls für 

Computergrafik und Visualisierung 

Bei der im Lehrstuhl Computergrafik und Visualisierung der Informatikfakultät an der Techni- 

schen Universität Dresden eingesetzten Stereoprojektionsleinwand handelt es sich um eine polari- 

sationserhaltende Rückprojektionsleinwand, mit einer möglichen Bilddiagonale von ca. 122 Zoll 

(ca. 310 cm), auf der mit Hilfe von zwei Beamern projiziert wird, welche übereinander angeord- 

net und mit um 90 Grad verdrehten Polarisationsfiltern ausgestattet sind. Diese „Christie DS+26“ 

Projektoren arbeiten mit einer Auflösung von 1400 × 1050 Pixel. Über einen Spiegel werden die 

Bilder von hinten auf die in Abbildung 1.2 gezeigte Leinwand projiziert. 

Der verwendete Computer welcher die Projektoren ansteuert verfügt über einen 2,4Ghz DualCore 

Prozessor, der mit zwei Gigabyte Hauptspeicher und dem Betriebssystem „Microsoft Windows 

XP“ arbeitet. Bei den eingesetzten Grafikkarten werden zwei NVIDA Geforce 8800 GTX mit je- 

weils 768 Megabyte Speicher eingesetzt. 

Projiziert wird ein so genanntes Vektographenbild 3 . Dabei handelt es sich um ein Stereobild mit 

ortsgleich überlagerten Bildern, die gegensinnig polarisiert sind. Das Vektographenbild ist das 

polarisationsoptische Gegenstück zum Anaglyphenbild (Rot-Grün Bild) welches in Kapitel 2.3.5.9 

beschrieben wird. 

Abbildung 1.1: Abbildung der Stereoprojektionsleinwand des Lehrstuhls Computergrafik und Visualisierung 

3 Vektographenbilder werden mitunter auch dichroitische Jodbilder genannt.

1.3. BEGRIFFSERKLÄRUNGEN 8 

Abbildung 1.2: Abbildung der zwei Projektoren mit Polarisationsfiltern 

1.3 Begriffserklärungen 

Sehvokabular 

• Akkommodation: Optische Anpassung des Auges an verschiedene Entfernungen. Dabei 

wird mittels Muskeln die Form der Augenlinse, und damit ihre Brechkraft, zum Scharfstel- 

len verändert. Die Akkommodation entspricht der Entfernungseinstellung bei Kameras. 

• Disparität, auch retinale Disparität (Disparation), bedeutet Ungleichheit, Verschiedenheit 

von Bildpunkten welche durch Objekte, deren Position im Raum weiter oder näher als die 

Fixationsentfernung ist, auf „disparaten“ (seitlich verschobenen) Netzhautstellen abgebildet 

werden. 

• Fovea: Netzhautgrube, die Stelle des schärfsten Sehens im Auge. 

• Halbbild: Einzelbild eines Stereobildes. 

• Höhenfehler: Deckungsfehler entsprechender Halbbildpunke in senkrechter Erstreckung. 

• Korrespondenz: Netzhautpunkte, die im fusionierten Binokularsehen das gleiche Objekt in 

Fixationsentfernung im Sehfeld abbilden, heissen korrespondierende Netzhautstellen. Stellt 

man sich die Netzhäute beider Augen so übereinanderliegend vor, dass sich die beiden Fo- 

veae decken, dann liegen korrespondierende Netzhautstellen genau übereinander. 

• Raumbild: Stereofoto oder Bild mit räumlichen Tiefeneindruck. 

• Stereobild: Bildpaar, zusammengestellt aus zwei parallaktisch verschiedenen, größtenteils 

inhaltsgleichen, stereoskopisch aufgenommen Halbbildern.

1.3. BEGRIFFSERKLÄRUNGEN 9 

• Stereosehen: Tiefensehen oder räumliches Sehen, das auf der Auswertung der Disparität 

beruht. 

• Strabismus: Schielen; beständige oder ab und zu auftretende Fehlstellung der Augen. 

• Deviation: bezeichnet den horizontalen Abstand gleicher Bildelemente auf beiden Halbbil- 

dern eines Raumbildes zueinander. Stellt damit die Abbildung der Parallaxe dar. 

• Parallaxe: bezeichnet den Winkel zwischen zwei Geraden, die von verschiedenen Stand- 

orten auf einen Punkt (ein Objekt) gerichtet sind. 

• Vergenz: Gegensinnige Bewegung der Augen, um ein Sehobjekt auf korrespondierenden 

Netzhautstellen abzubilden. 

• Konvergenz: Augenbewegung zueinander hin zum Nahsehen, extrem beim einwärtigen 

Schielen

2 Wahrnehmung, Aufnahme und Wiedergabe 

In diesem Kapitel werden Grundlagen und verschiedene Verfahren zur Aufnahme- und Wiederga- 

be stereoskopischer Bildinhalte vorgestellt und zusammenfassend für den Einsatz im Stereo-Video 

Bereich verglichen. 

2.1 Vorgang der visuellen Wahrnehmung 

Das natürliche Sehen, die visuelle Wahrnehmung, basiert auf der Reizung lichtempfindlicher Zel- 

len auf den Photorezeptoren der Netzhaut durch Lichtstrahlen, welche von Objekten ausgesandt, 

gebeugt oder reflektiert werden. Bei den existierenden zwei Typen von Photorezeptoren sind Stäb- 

chen für Hell-Dunkel-Wahrnehmung und Zapfen für die Farbwahrnehmung zuständig. Betrachtet 

man nun ein Objekt, konvergieren die Achsen der Augen auf den fixierten Gegenstand (Konver- 

genzpunkt). Dabei drehen sich die Augen so, dass das Bild des fixierten Gegenstandes in die Fovea 

(Netzhautgrube) fällt, wo die für die Sehschärfe verantwortliche Zäpfchendichte am höchsten ist. 

Gekoppelt mit der Konvergenz ist die Akkomodation 1 der Augenlinsen auf den fixierten Gegen- 

stand. Konvergieren die Augen auf einen Gegenstand in einer anderen Tiefenebene, so ändert sich 

auch die Akkomodationsentfernung [Hes10]. 

Durch Akkomodation und Konvergenz nimmt beim Betrachten eines Objektes jedes Auge einen 

geringfügig anderen Winkel ein. Das heißt, je weiter ein Objekt entfernt ist, desto paralleler sind 

die Augenachsen, wobei sich bei nahen Objekten diese kreuzen (Vergenz). 

Am dem Prozess der Tiefenwahrnehmung sind mehrere Faktoren beteiligt. Erfahrungswerte wie 

die Größe oder Verdeckung von Objekten, sowie physiologische Prozesse der Augen (Konver- 

genz) und retinale Prozesse (Disparation) sind die Hauptfaktoren, die vom Gehirn interpretiert 

werden, um eine Wahrnehmung von Tiefe zu erreichen. 

Tiefenwahrnehmung kann durch monokulare und binokulare Faktoren beschrieben werden. Dabei 

zeichnen sich monokulare Tiefeninformationen durch: 

• Überlappungen von Objekten, 

• Perspektivische Verzerrungen, d.h. Unterschiede bekannter Größenverhältnisse und die re- 

lative Lage zum Horizont, 

• Atmosphärische Perspektive, d.h. Nebel oder Dunst in der Ferne, 

• Schattenwurf von Objekten, 

1 Veränderung der Dicke der Linse durch den Ziliarmuskel, um von Objekten in verschiedener Distanz ein scharfes 

Bild zu erzeugen. 

10

2.1. VORGANG DER VISUELLEN WAHRNEHMUNG 11 

aus. 

• Oberflächenstuktur von Objekten, 

• Bewegungsparallaxe (entfernte Objekte bewegen sich scheinbar langsamer als nahe) 

Binokulare Tiefeninformationen werden von Gehirn durch folgende Faktoren wahrgenommen: 

• den Augenabstand und die durch diesen bedingte 

• Disparation (perspektivischer Unterschied zweier Bilder auf der Netzhaut) 

• Konvergenz. 

Diese binokularen Tiefeninformationen werden in der Stereoskopie genutzt um Raumbilder dar- 

zustellen und zu verarbeiten. Dabei werden über geometrische Beziehungen, welche im weiteren 

beschrieben werden, die einzelnen Parameter bestimmt. 

2.1.1 Ursache der räumlichen Wahrnehmung 

Die optischen Achsen der Augen konvergieren wie in Abbildung 2.1 dargestellt in der Konver- 

genzebene in Punkt N welcher im Auge auf der sogenannten Netzhautgrube bei N ′ dargestellt 

wird. Der Punkt N ′ wird dabei unter dem Konvergenzwinkel α1 wahrgenommen und alle ande- 

ren Punkte welche unter diesem Konvergenzwinkel gesehen werden, sind auf korrespondierenden 

Netzhautstellen abgebildet. Da der Punkt F ′ unter einem anderen Konvergenzwinkel gesehen wird 

(α2) wird dieser (F ′ ) auf nicht korrespondierenden Netzhautstellen abgebildet. 

Die Strecken qr, ql bilden den Abstand von F ′ − N ′ dar und werden als Querdisparation be- 

zeichnet. Man unterscheidet zwischen gekreuzter und nicht gekreuzter Querdisparation. Bei einer 

gekreuzten Querdisparation liegen betrachtete Objekte vor dem Horopter 2 und somit auf dem 

äußeren Randbereich der Netzhaut. Dies sind Punkte, welche hinter dem betrachteten Punkt lie- 

gen. Von ungekreuzter Querdisparation spricht man, wenn Objekte hinter der Horopterlinie liegen. 

Diese liegen auf den Betrachter bezogen näher als der Konvergenzpunkt und fallen somit auf den 

inneren Randbereich der Netzhaut. Die Querdisparation stellt keine direkt messbare Größe dar und 

wird daher über die stereoskopische Parallaxe definiert. 

2 Der Horopter ist definiert als der geometrische Ort für alle einfach gesehenen Raumpunkte


b 0 

F’ 

d’ l 

N’ 

F’ 

d’r 

N’ 

rechtes 

Auge 

linkes 

Auge 

f 0 

 

2 

 

2 

a Fokussierte Entfernung 

α1, α2 Konvergenzwinkel 

d ′ r, d ′ l 

b0 Augenabstand 

δ Winkel der stereoskopischen Parallaxe 

Nahpunkt 

Konvergenzebene 

1 N 2 F 

p r 

e t 

a 

Objekt 

Abbildung 2.1: Querdisparation und Parallaxe 

Querdisparation linkes und rechtes Auge 

e Entfernung zum Nahpunkt 

f0 Brennweite 

F Fernpunkt 

F ′ Abbildung des Fernpunkt auf der Netzhaut 

N Nahpunkt in der Konvergenzebene (Konvergenzpunkt) 

N ′ Abbildung des Nahpunkt auf der Netzhaut 

pr, pl Deviation zwischen Nah- und Fernpunkt in der Konvergenzebene 

t räumliche Tiefe des Objektes 

p l 

Fernpunkt


2.1.2 Berechnung der Parallaxe 

Die Parallaxe stellt den Winkel zwischen Nah- und Fernpunkt dar, der im Auge des Betrachters, 

die in Abbildung 2.1 dargestelle Disparation auf der Netzhaut erzeugt. Somit ist die Parallaxe eine 

messbare Größe für die Tiefenwahrnehmung. 

Für die Parallaxe (δ = α + β), welche als Winkel zwischen zwei Geraden (Blickachsen), die von 

verschiedenen Blickpunkten auf einen Punkt gerichtet sind, ergibt sich unter der Näherung für 

kleine Winkel: tan(α + β) = tan(α) + tan(β), nach Abbildung 2.1: 

tan(δ) = b0 

e 

− b0 

e + t , tan(δ) = b0 · t 

e 2 + e · t 

Durch Anwendung eines Strahlensatzes in Abbildung 2.1 ist die Deviation p = pl + pr durch 

Gleichung 2.2 gegeben. 

An diesen Gleichungen ist zu sehen, dass: 

p = b0 

2 

b0 ( 2 · e) 

− 

e + t 

• die Genauigkeit der Tiefenunterscheidung δ mit der Größe des Abstandes b0 zunimmt 

• die Genauigkeit der Tiefenunterscheidung δ quadratisch mit der Entfernung e abnimmt 

• im Nahbereich die Tiefenwahrnehmung δ am größten ist 

(2.1) 

(2.2) 

• wenn der Abstand e → ∞ geht, ein räumliches Unterscheidungsvermögen nicht mehr ge- 

geben ist. 

Theoretisch können nach Formel 2.1 Gegenstände, die weit entfernt liegen (nahe ∞) noch räum- 

lich wahrgenommen werden. Praktisch ist die Tiefenwahrnehmung jedoch durch ein Mindestauflö- 

sungsvermögen von δ begrenzt, welches durch die Anzahl der auf der „Fovea Centralis“ 3 vorhandenen 

Zapfen gegeben ist. Nach Otto Vierling [Vie65] ist ein Wert von höchstens 5 minarc (ca. 0,0833 

Grad) realistisch, was bedeutet, dass bis zu einer Entfernung von ca. 50 Metern d ′ r und d ′ l ausge- 

wertet werden können. 

2.1.3 Weitere optische Effekte 

Durch die Möglichkeit bei Kameras die Stereobasis, die den Abstand beider Objektive darstellt, 

zu vergrößern, können durch den in Kaptitel 2.3.2 beschriebenen virtuellen Abstand zwei Effekte 

entstehen. Diese werden Liliputismus und Gigantismus genannt. 

Liliputismus tritt auf, wenn die Stereobasis vergrößert, und die virtuelle Entfernung dadurch gerin- 

ger wird. Das Objekt verschiebt sich in den Vordergrund und erscheint kleiner, da die Abbildungs- 

fläche auf der Netzhaut gleich bleibt. Es kommt also zu einer modellhaften Wirkung der Szenerie. 

Anwendung findet dieser Effekt in der Astronomie, um Entfernungen von Sternen zu berechnen, 

wobei die größte nutzbare Stereobasis, nämlich derzeit die zweier astronomischer Einheiten, dem 

3 Fovea Centralis (auch Netzhautgrube) Stelle des schärfsten Sehens

2.2. VERFAHREN DER AUFNAHME 14 

doppelten Abstand der Erde von der Sonne genutzt wird, um Parallaxen von Sternbildern aufzu- 

nehmen. 

Praktisch wird das Prinzip, bei der Aufnahme von weit entfernten Objekten, wie z.B. Gebirgen, 

genutzt. Hierbei zeigt eine Stereobasis im Augenabstand aus den in Kapitel 2.1.2 beschriebenen 

Gründen keinen Effekt. 

Bei Gigantismus handelt es sich um das Gegenteil von Liliputismus, wobei die Stereobasen klei- 

ner als der Augenabstand gewählt werden, hierdurch wird der Tiefeneindruck in den Hintergrund 

gebracht und die Tiefe sowie die Größe verstärkt. Somit können im Makrobereich eindrucksvolle 

Bilder erzeugt werden, da z.B. die Länge eines Grashalmes mehrere Meter zu haben scheint. Aus 

diesem Grund existieren Stereomikroskope, welche sehr plastische Ansichten von beispielsweise 

Zellstrukturen erlauben[Her07]. 

2.2 Verfahren der Aufnahme 

Um Bilder mit räumlicher Wirkung aufzunehmen, wird das „Sehen“ der menschlichen Augen 

nachgeahmt. Es werden zwei horizontal versetzte Bilder abgelichtet, wobei von zwei Kategorien 

der Aufnahme gesprochen werden kann. Einerseits wird mit einem Objektiv gearbeitet, welches 

auf einer Aufnahmefläche (z.B. Film oder Bildsensor) zwei Bilder nebeneinander darstellt (Mo- 

nokulare Aufnahme). Die zweite Variante ist die Verwendung von horizontal versetzt fixierten 

Kameras (Binokulare Aufnahme). 

2.2.1 Die Scheinfensterregel 

Bei der Wiedergabe von stereoskopischen Bildinhalten sieht der Zuschauer durch die Begrenzun- 

gen des Wiedergabegerätes (Fernseher, Monitor, Projektionswand) durch ein sogenanntes Schein- 

fenster. Durch die Ecken dieses Fensters und dem Betrachtungspunkt entsteht eine umgekippte 

Pyramide dargestellt in Abbildung 2.2, innerhalb dieser Objekte als realistisch wahrgenommen 

werden. 

Das eigentliche Scheinfenster ist bei der Wiedergabe nicht unbedingt auf der Projektionsfläche, 

sondern die Ebene in der die parallaktische Verschiebung der Einzelbilder Null ist. Bei der Auf- 

nahme ist dies die Ebene in der sich die Achsen der Kameras schneiden. Dabei tritt der Effekt 

auf, dass Objekte vor dem Scheinfenster eine positive und hinter dem Scheinfenster eine negative 

parallaktische Verschiebung aufweisen, was bedeutet, dass bei paralleler Ausrichtung der Kameras 

das Scheinfenster in theoretisch unendlicher 4 Entfernung liegt. Die „Scheinfensterregel“ besagt, 

dass alle Objekte in stereoskopischen Bildern aus ästhetischen Gründen hinter diesem Fenster 

liegen sollten, wobei Objekte ausgenommen sind, welche die Begrenzungen der Pyramide nicht 

überschreiten. 

4 Begrenzt durch das Auflösungsvermögen der Kameras


Objekt vor 

Scheinfenster mit 

positiver Parallaxe 

Objekt auf 

Scheinfenster 

Abbildung 2.2: Stereoskopisches Scheinfenster 

Objekt hinter 

Scheinfenster mit 

negativer Parallaxe 

Da diese Regel bei einer parallelen Aufnahme verletzt wird, werden die so aufgenommenen Bil- 

der links- oder rechtsseitig beschnitten, um bei der Wiedergabe das Fenster in den Vordergrund zu 

schieben. Dabei bleibt die Lage des Scheinfensters in Hinsicht auf die Objekte der abgelichteten 

Szene immer unverändert. 

In der Stereofotografie wird diese Nachbearbeitung in Kauf genommen, da die bei der Aufnahme 

mit konvergierenden Kameraachsen entstehenden Effekte meist unerwünscht sind. Neben Trapez- 

verzerrungen kommt es bei dieser Aufnahmemethode dazu, dass Objekte die weit vor oder hinter 

der Konvergenzlinie liegen eine sehr große Deviation aufweisen, die beim Betrachten als unange- 

nehm empfunden wird. 

Bei Filmaufnahmen wird diese Methode jedoch öfters verwendet, um einen Auflösungsverlust 

aufgrund der Beschneidung zu vermeiden. Allerdings muß darauf geachtet werden, dass die ver- 

zerrungsbedingte vertikale Differenz so gering wie möglich gehalten wird. 

2.2.2 Wahl der Stereobasis 

Um bereits bei der Aufnahme korrekte Raumbilder erzeugen zu können, müssen Regeln der Wie- 

dergabe, welche in Kapitel 2.3.4 beschrieben werden berücksichtigt werden. Betrachter mit ei- 

nem durchschnittlichen „nomalen“ Augenabstand von 6,5 cm nehmen bei der Projektion lieber 

einen etwas übertriebenen aber nicht zu großen Tiefeneindruck wahr. Der zu große Tiefenein-


druck entsteht, wenn die in Abbildung 2.1 angegeben Winkel α1 und α2 eine maximale Differenz 

δ = α1 − α2 überschreiten, wodurch korrespondierende Netzhautpunkte nichtmehr als solche 

wahrgenommen werden. Diese Regel der maximal zulässigen Parallaxe wird „70 Minuten Bedin- 

gung“ genannt [Her07]. Sie besagt, dass δ ≤ 70 ′ (70 ′ ≡ 1.17 ◦ ), also die Winkeldifferenz δ kleiner 

als 70 Bogenminuten sein sollte. Zur Berechnung wird hier Bildbreite wP in das Verhältnis zum 

Betrachtungsabstand eP mit Hilfe der Deviation auf dem Bildsensor pk gesetzt. 

pk 

wP 

= δ · eP 

Die Deviation auf dem Bildsensor pk ergibt sich nach Abbildung 2.1, da das Bild in einer Kamera 

auf einen ungekrümmten Bildsensor fällt, durch Anwendung des Strahlensatzes zu: 

wP 

pk = bk · fk 

e − bk · fk 

(e + t) = bk 

t 

· fk · 

(e + t) · e 

Durch umstellen dieser Formel nach bk und Hinzunahme der Bildsensorbreite wk ergibt sich: 

bk = pk 

· 

fk 

(e + t) · e 

t 

= pk 

· 

wk 

wk e 

· 

fk 1 − ( e 

e+t ) 

Durch Studien über von Probanden angenehm empfundene Betrachterpositionen wurden Werte für 

eP gefunden, die durch das Verhältnis in Formel 2.3 unter der 70 Minuten Bedingung (α ≤ 1.17 ◦ ) 

einen Wert für die maximale Deviation im Bild von wP 

30 ergaben [Wim04][Mad07]. Die Deviation 

in einem projizierten Raumbild sollte maximal 33,3% der Bildbreite betragen. Daraus ergibt sich 

nach Formel 2.5 für die Wahl der Stereobasis: 

bk = 1 wk e 

· · 

30 fk 1 − e 

e+t 

wobei wk die Größe des Bildsensors und fk die Kamerabrennweite darstellt. 

Wenn der Horizont im Bild enthalten ist, also (e + t) → ∞ kann diese Formel zu: 

vereinfacht werden. 

bk = 1 

30 · wk · e 

fk 

Formel 2.6 und 2.7 entsprechen der BERCOVITZ Formel [Ber98] welche eine Fokussierungsent- 

fernung a berücksichtigt: 

bk = dMOF D · ( 

(e + t) · e 

) · ( 

t 

1 

fk 

(2.3) 

(2.4) 

(2.5) 

(2.6) 

(2.7) 

− 1 

) (2.8) 

a 

Bei dieser Formel ist dMOF D 5 die maximale Deviation auf dem Bildsensor oder dem Film, welche 

mit 1,2 mm als üblicher Wert für Kleinbildfotografie angegeben wird. Die BERCOVITZ Formel 

basiert auf der Vergrößerung der Tiefenschärfe („Depth of Field“). Hier wird die Kamera auf 

einen Punkt zwischen Nah- und Fernpunkt fokussiert, typischerweise die Entfernung a, um das 

5 MOF D Maximum on Film Deviation


Objekt mit möglichst gleichmäßiger Unschärfe in N ′ k und F ′ k 

darzustellen. Für den Fall, dass der 

Fernpunkt den Horizont enthält wird in Formel 2.8 e + t = ∞ und es ergibt sich, da für die 

fokussierte Entfernung a das Doppelte der Entfernung zum Nahpunkt e angenommen wird, um 

Nah- und Fernpunkt gleich unscharf darzustellen: 

bk = dMOF D · ( e 

fk 

− 1 

) (2.9) 

2 

In diesem Fall kann es allerdings eine bessere Lösung sein, auf den Nahpunkt zu fokussieren. 

Unter der Annahme der Fernpunkt liegt immer im Unendlichen wird Formel 2.8 zu: 

bk = dMOF D · e · ( 1 

umformuliert wird, in diesem Fall ist a = e und somit: 

bk = dMOF D · ( e 

2.2.3 Aufnahmemethoden 

fk 

fk 

− 1 

) (2.10) 

a 

− 1) (2.11) 

Um stereoskopische Bilder aufzunehmen, existieren verschiedene Methoden, welche nachfolgend 

näher erläutert werden. Es existieren 4 Methoden Raumbilder zu erzeugen: 

1. die Verschiebetechnik, 

2. die Spiegeltechnik, 

3. die Verwendung einer Stereokamera und 

4. die „Montage“ zweier monokularer Kameras. 

2.2.3.1 Die Verschiebetechnik 

Bei dieser Technik werden mit einer Kamera und einem Objektiv zwei Bilder nacheinander aufge- 

nommen. Hierbei wird die Kamera nach Aufnahme des ersten Bildes um eine bestimmte Länge, 

die Stereobasis b0, verschoben bevor das zweite Bild aufgenommen wird. 

Die Vorteile dieser Technik sind: 

• es sind keine zusätzlichen Hilfsmittel nötig (Verschiebeschlitten und Stativ sind allerdings 

von Vorteil) 

• es ist jede Kamera einsetzbar 

• die Stereobasis ist frei wählbar (kleine Stereobasen bei Makroaufnahmen und größere bei 

Landschaftsaufnahmen) 

Die Nachteile sind: 

• bewegte Objekte (Sport, Personen etc.) können nicht abgelichtet werden, da die große Auf- 

nahmedauer, welche durch das Verschieben der Kamera resultiert, keine Momentaufnahmen 

ermöglicht 

• beide Bilder sind eventuell nicht passgenau und erfordern eine Nachbearbeitung.


2.2.3.2 Strahlenteilermethode 

Bei dieser Technik wird vor dem Objektiv der Kamera ein Strahlenteiler, meist aus mehreren 

Spiegeln bestehend, befestigt. Durch diesen wird in einer Kamera auf dem Speichermedium direkt 

ein Stereobildpaar produziert. 

Die Vorteile dieser Technik: 

• eventuell vorhandene Spiegelreflex- oder Digitalkameras mit Filtergewinde können genutzt 

werden 

• bewegte Objekte stellen kein Problem dar 

• geringer finanzieller Aufwand 

• es kann aus jedem aufgenommenen Bild ein Raumbild erzeugt werden 

• die Kalibrierung der Kameras gestaltet sich einfacher, da nur eine Brennweite und ein 

Hauptpunkt existiert 

Die Nachteile sind hingegen: 

• da ein horizontaler Versatz bei der Wiedergabe von Raumbildern gefordert ist, sind nur 

Hochkantbilder möglich. Wenn die Kamera gedreht und eine vertikale Deviation erzeugt 

wird, um Querformatige Bilder zu erzeugen, müssen diese Bilder mit einer horizontalen 

Deviation betrachtet werden. Dies bedeutet, dass das Raumbild um 90 ◦ gedreht werden 

muss. 

• es können Schatten, Aufhellungen und Spiegelungen entstehen 

• Bildpaare sind evtl. nicht gleich groß bzw. zeigen nicht zu 100% den gleichen Ausschnitt 

• eine Nachbearbeitung kann notwendig sein 

Radiale Spiegel Bei dieser Methode, welche einen Sonderfall der Strahlenteiler darstellt, wird 

ein konischer Spiegel am Objektiv befestigt. In der Mitte des aufgenommenen Bildes wird dadurch 

das fokussierte Objekt und gleichzeitig kreisförmig zum Rand eine radial verzerrte Aufnahme 

dieses Objekts abgebildet (siehe Abbildung 2.3). 

Die Stereobasis stellt hierbei das Doppelte des Abstands, des kleineren Kegelradius zum Objektiv 

dar. Durch diese Methode ist man nicht an Hochkantformate gebunden. Jedoch ist eine Aufnahme 

im Kleinbildformat nur durch Beschneidung des entstehenden Bildes möglich. Des Weiteren kön- 

nen so entstandene Bilder nicht direkt nach der Entwicklung, oder Übertragung auf einem Compu- 

ter betrachtet werden, da immer eine aufwendige Entzerrung notwendig ist. Allerdings können bei 

dieser Methode drei Bilder abgegriffen werden, wodurch es möglich wird diese Aufnahmetechnik 

in bildverarbeitenden Systemen zur Generierung von dreidimensionalen Flächen einzusetzen.


Abbildung 2.3: Radialer Spiegelvorsatz und aufgenommenes Bild mit eingezeichneten Strahlengängen 

aus [Naj05] 

2.2.3.3 Die Stereokamera 

Bei einer Stereokamera handelt es sich um eine Kamera mit zwei Objektiven. So werden bei 

Geräten, die einen Film nutzen, jeweils nebeneinander liegende Negative belichtet. Diese können 

nach der Entwicklung direkt mit einem Stereoskop betrachtet werden. Bei der Aufnahme von 

Stereobildern mit digitaler Fototechnik sind zwei Bildsensoren erforderlich, die nach dem gleichen 

Prinzip wirken. Die Vorteile sind: 

• es kann wenig „falsch“ gemacht werden, da die Bedienung analog einer monokularen Ka- 

mera stattfindet und somit eine Justierung der optischen Achsen entfällt. 

• es wird ein Raumbild erzeugt, das direkt nach der Entwicklung oder Übertragung auf einen 

Computer stereoskopisch wahrgenommen werden kann, ohne vorherige Entzerrung. 

• die Geräte sind handlich, robust und kompakt 


Die Nachteile von Stereokameras sind: 

• eine meist nicht veränderbare Stereobasis 

• im Vergleich zu monokularen Kameras meist relativ preisintensiv 

• Bei einigen Bildformaten ist teilweise keine Laborentwicklung möglich, wodurch die Ent- 

wicklung höhere Kosten verursacht. Beim Einsatz von Digitalkameras stellt dies kein Pro- 

blem dar. 

2.2.3.4 Einsatz Binokularer Kameras 

Bei dieser Methode handelt es sich um die gebräuchlichste, da 2 Kameras nebeneinander montiert 

werden, was folgende Vorteile bringt:

2.3. WIEDERGABE STEREOSKOPISCHER BILDINHALTE 20 

• Da prinzipiell alle Systeme möglich sind kann eine Stereoaufnahme in genau der gewünsch- 

ten Qualität, zu den gewünschten Kosten realisiert werden. 

• Die Stereobasis kann variabel gewählt werden 


• Quer- und Hochformataufnahmen sind möglich 

Die Nachteile sind: 

• Meist gestaltet sich das gleichzeitige Auslösen beider Kameras problematisch 

• eine Stereobasis unter 6cm ist bei vielen Systemen, bedingt durch die Außenmaße der Ka- 

meras, nicht möglich. 

2.3 Wiedergabe stereoskopischer Bildinhalte 

Die Wiedergabe der Stereobilder, egal mit welchem Verfahren sie aufgenommen wurden, zielt 

immer darauf ab, jedem Auge ein Bild zu zuführen. Dies muss in der richtigen Reihenfolge ge- 

schehen, also das linke Bild dem linken Auge und das rechte Bild dem rechten Auge, um den 

Stereo-Effekt wahrzunehmen. 

Man unterscheidet hier zwischen Verfahren ohne Hilfsmittel, wie dem Parallelblick oder dem 

Kreuzblick und den Methoden welche Hilfsmittel in Form von Brillen oder Spiegeln benötigen. 

Hierzu zählen: die Anaglyphenverfahren, der Pulfrich-Effekt, der Einsatz von Shutter- und polari- 

sierten Brillen. 

Um bestimmen zu können, wie ein virtuelles Objekt bei der Wiedergabe erscheint, werden im Fol- 

genden verschiedene Größen berechnet. In Abbildung 2.4 auf Seite 21, wird der gesamte Vorgang 

der Aufnahme und Wiedergabe skizziert ist und die zugehörigen Größen dargestellt. 

Die in Abbildung 2.4 gezeigten Größen sind: 

F Fernpunkt 

N Nahpunkt / Konvergenzpunkt 

pl, pr Deviation zwischen Nah- und Fernpunkt in der Konvergenzebene 

N ′ lk , N ′ rk 

F ′ 

lk , F ′ rk 

t Tiefe des Objektes 

a Abstand zum Objekt 

e Entfernung zum Nahpunkt / Konvergenzpunkt 

δ Winkel der Parallaxe 

bk Stereobasis der Kameras 

γ Konvergenzwinkel 

Abbild des Nahpunktes in der linken und rechten Kamera 

Abbild des Fernpunktes in der linken und rechten Kamera


Aufnahme 

der Kameras 

Projektion auf 

Wiedergabemedium 

Abbildung 

im Auge 

Bildsensorebene 

linke 

Kamera 

Projektionsfläche 

linkes 

Auge 

Netzhaut 

N’ lk 

N’ lkt 

N’ l 

F’ 

lk 

l 

2 

N 

F P 

N P 

bk 

b 

F 

2 

1 

2 

F’ 

rk 

N’ rk 

N’ 

d’ F’ 

F’ r d’ r N’r 

l 

Abbildung 2.4: Stereoskopische Aufnahme und Wiedergabe 

p r 

 

dk 2 

pP 2 

0 

p l 

eP 

rkt 

t 

e 

kf 

k 

f P 

a 

rechte 

Kamera 

tvirt 

evirt 

f 0 

a P 

rechtes 

Auge 

avirt


N ′ lkt , N ′ rkt 

Transformierter Nahpunkt in der linken und rechten Kamera 

dk Deviation in der Aufnahmeebene 

fk Brennweite der Kameras 

fP Brennweite des Projektors 

aP Abstand Projektor, Projektionsfläche 

α2, α1 Konvergenzwinkel des Nah und Fernpunktes 

tvirt virtuelle Tiefe des projizierten Bildes 

FP projizierter Fernpunkt 

NP projizierter Nahpunkt 

pP Deviation im projizierten Bild 

eP Abstand Betrachter Projektionsfläche 

evirt virtuelle Entfernung zum Konvergenzpunkt 

avirt virtueller Abstand des Objektes 

b0 Stereobasis der menschlichen Augen 

f0 Brennweite der menschlichen Augen 

N ′ l , N ′ r Abbildung des Nahpunktes auf der linken und rechten Netzhaut 

N ′ l , F ′ r Abbildung des Fernpunktes auf der linken und rechten Netzhaut 

d ′ l , d′ r Disparation im linken und rechten Auge des Betrachters 

In dieser Abbildung stellen N und F den Nah- und Fernpunkt dar, die mittels eines Lochkame- 

ramodells 6 auf der Bildsensorebene abgebildet werden. Dabei stellt γ den Konvergenzwinkel der 

Kameras dar, welcher für die Berechnung einer im Folgenden beschriebenen Berichtigungsfunk- 

tion notwendig ist. Die Berichtigung, auch Rektifikation genannt basiert auf den Grundlagen der 

Epipolargeometrie. Dabei wird das aufgenommene Bild in der Bildsensorebene soweit transfor- 

miert, dass eine anschliessende parallele Projektion mit Hilfe von zwei Projektoren auf die Pro- 

jektionsfläche erfolgen kann. Auf dieser wird das Raumbild mit den virtuellen Größen (die Werte 

mit Indizies: virt) dargestellt. Im unteren Teil der Darstellung ist die Abbildung im menschlichen 

Auge schematisch dargestellt. 

2.3.1 Durch Konvergenz notwendige Schrägprojektion 

Aus Abbildung 2.4 ist an der Bildsensorebene ersichtlich, dass bei konvergierender Ausrichtung 

der Kameraachsen ein Winkel γ entsteht welcher zur Folge hat, dass zum einen das Scheinfenster, 

beschrieben in Kapitel 2.2.1, in der Tiefe der Konvergenzline (Konvergenzebene bei paralleler 

Aufnahme) auftritt und zum anderen das aufgenomme Bild trapezförmig verzerrt werden muss 

6 Eine Lochkamera ist das einfachste Gerät, mit dem sich optische Abbildungen erzeugen lassen


(Schrägprojektion). Die Notwendigkeit für diese „Entzerrung“ liegt darin begründet, dass die Tra- 

pezverzerrung welche durch konvergierende Kameraachsen entsteht, einen Höhenfehler erzeugt, 

welcher aus Abbildung 2.6a) ersichtlich wird. Dieser erzeugt ein Unbehagen beim Betrachter. 

2.3.1.1 Epipolargeometrie 

Bei konvergenter Aufnahme bezeichnet man die geometrischen Grundlagen der räumlichen An- 

ordnung der Kameras und des aufzunehmenden Objekts als Epipolargeometrie. In diesem Teil- 

gebiet der projektiven Geometrie werden, wie in Abbildung 2.5 dargestellt, Geraden auf welchen 

korrespondierende Bildpunkte liegen als Epipolare Linien und die, durch die Kamerapositionen 

und den Raumpunkt aufgespannte Ebene als Epipolarebene bezeichnet. Hier fließen intrinsische 

und extrinsische Parameter wie Brennweite der Kamera, Bildzentrum, Rotation und Translation 

der Bildebenen ein. 

Diese Geometrie dient dem Ziel, korrespondierende Bildpunkte zu finden und durch Berechnung 

deren Deviation, Entfernungen und Winkel aus dem Raumbild zu erhalten. So kann zum Beispiel 

ein Tiefenbild erzeugt werden. 

Grundgedanke der Epipolargeometrie ist, dass ein dreidimensionaler Punkt M in den Bildebenen 

S1 und S2 die Abbildungen m1 und m2 liefert. Weiterhin liegt für jeden Punkt auf dem optischen 

Strahl von m1 nach M der korrespondierende Punkt auf der Epipolarlinie I1. 

Durch diese Tatsache reduziert sich die Suche nach korrespondierenden Bildpunkten auf eine li- 

neare Suche entlang der Epipolarlinie. Wenn die Epipolarlinien berechnet werden ergibt sich ein 

weiterer Vorteil, welcher das Problem der Schrägprojektion löst. Liegen alle Epipolarlinien im 

Bild parallel, kann dieses wieder parallel projiziert werden. 

Abgesehen von radialen und anderen Verzerrungen bei Aufnahme von Raumbildern entstehen bei 

der parallelen Justage der Kameras Bilder in denen die Epipolarlinien parallel sind. Bei konver- 

genter Aufnahme müssen diese Bilder jedoch transformiert werden. Hier spricht man von einer 

Rektifikation. 

Da es an der, in dieser Arbeit entwickelten Kamera möglich ist den Konvergenzwinkel zu bestim- 

men, wird im Folgenden eine Rektifikation für bekannte Konvergenzwinkel beschrieben. Für den 

Fall, dass der Konvergenzwinkel nicht bekannt ist, kann dieser durch Suchen der Punkte m1 und 

m2 und bestimmen der Epipolarlinie berechnet werden. 

2.3.1.2 Schrägprojektion bei bekanntem Konvergenzwinkel 

In [Lac95], [Yan95] und [Koc93] ist der Effekt der Schrägprojektion (Keystoning) beschrieben 

und Lösungen wie ihm entgegengewirkt werden kann werden erläutert. 

Das Problem besteht nun darin, wie die Pixel der originalen Aufnahmeebene S in die korrigierte


M 

m 

1 

K 

1 

Abbildung 2.5: Epipolargeometrie nach [ATV00] 

Ebene S ′ transformiert werden müssen. Dabei werden folgende Transformationen der Koordina- 

tensysteme, wie in Abbildung 2.4 zu sehen, benötigt: 

(X0, Y0, Z0) → (Xk (l,r) , Yk (l,r) ) → (X S ′ (l,r) , Y S ′ (l,r) ) → (Xp (l,r) , Yp (l,r) ) → (Xv, Yv, Zv) (2.12) 

Dabei stehen X,Y und Z für Koordinaten im Raum, und die Indizes 0 für reale Größen, kl und kr 

für Koordinaten der linken und rechten Kamera (siehe Abbildung 2.7), pl für die Bildkoordinaten 

im linken projizierten und pr im rechten projizierten Bild, sowie v für die virtuellen Größen im 

Raumbild. 

Vorerst werden Bildstörungen durch die Optik der Kameras und der Projektoren, wie z.B. radiale 7 

oder tangentiale 8 Verzerrungen, nicht betrachtet. 

Für die erste Transformation aus dem Objektraum in Koordinaten der Bildsensoren sei fk die 

Brennweite, bk die Stereobasis und γ der Konvergenzwinkel. 

Sei Z0 die Entfernung zum Objektpunkt, X0 der horizontale Abstand des Objektpunktes von der 

7 

Durch sphärische Oberfläche der Linsen und dem dadurch entstehenden Unterschied der Brennweite zum Rand des 

Bildes, resultierende Verzerrung. 

8 

Im Vergleich zur radialen Verzerrung sehr geringe, durch Dezentralisierung der Objektivlinsen hervorgerufene Ver- 

zerrung. 

I1 

S 

1 

m 

2 

S 

2 

K 

2


a) 

c) 

Z 

k 

X k 

linke 

Kamera 

F’ 

lk 

p r 

N 

α β 

bk 

F 

δ Z0 δ 

2 

2 

N’ lk F’ 

γ 

d k 

2 

p l 

X 0 

rk 

vertikale 

Parallaxe 

N’ 

linkes 

Bild 

rechtes 

Bild 

rk 

t 

e 

kf 

k 

a 

rechte 

Kamera 

S 

S 

rechtes 

Bild 

linkes 

Bild 

Z 

k 

b) 

d) 

X k 

linke 

Kamera 

N’ lk 

F’ 

lk 

p r 

N 

bk 

F 

α β 

δ Z0 δ 

2 

2 

dk 2 

p l 

X 0 

h 

F’ 

rk 

N’ 

rk 

linkes 

Bild 

rechtes 

Bild 

t 

e 

kf 

k 

a 

rechte 

Kamera 

Abbildung 2.6: Aufnahme mit konvergierenden und parallelen Kameraachsen a) Abbildung der 

konvergenten Aufnahme, b) Abbildung der parallelen Aufnahme, c) Konvergente 

Kameraachsen (Epipolargeometrie), d) parallele Kameraachsen (Standard Stereogeometrie) 

optischen Achse der Stereokamera 9 und Y0 die Höhe des Objektpunktes. Die Winkel α und β 

(siehe Abbildung 2.6c) und d)) ergeben den Konvergenzwinkel α1 = α + β eines Objektpunktes 

und werden wie folgt berechnet: 

bk 

2 α = arctan 

bk 

2 β = arctan 

+ X0 

, (2.13) 

Z0 

− X0 

. (2.14) 

Da der Winkel ∠ICOkl = ∠F CG = α − γ ist, kann Xkl direkt über die trigonometrische Bezie- 

hung des Tangens berechnet werden. 

Weiterhin ist Ykl 

Y0 

Z0 

IC 

Z0 

= und CG = 

CG cosα . Die Abbildung des Objektpunktes auf dem Bildsensor 

wird durch folgende Gleichungen gegeben: 

9 Die optische Achse der Stereokamera liegt senkrecht zur Stereobasis genau bei b K 

2


S 

I 

Ykl 

m 

X 

kl 

O 

kl 

C 

 

F 

M 

E 

O X 

 

Y0 

G Z 

H 

Abbildung 2.7: Bestimmung der Koordinaten eines Objektpunktes für den linken Bildsensor nach 

[Lac95] wobei COkl = fk, CH = X0, MG = Y0, GH = Z0, ∠CEO = 

∠CGH = α und ∠CF O = γ ist. 

Xkl = fk · tan(α − γ), (2.15) 

Xkr = fk · tan(β − γ), (2.16) 

Ykl = Y0 · fk · cosα 

, 

Z0 · cos(α − γ) 

(2.17) 

Ykr = Y0 · fk · cosβ 

Z0 · cos(β − γ) 

(2.18) 

Die Indizies kl und kr beschreiben den Bildsensor der linken, beziehungsweise der rechten Kame- 

ra. 

Die Transformation in Projektionskoordinaten erfolgt über die Multiplikation mit dem Vergröße- 

rungsfaktor der Projektoren welcher sich durch die Projektorbrennweite fP und den Abstand zur 

Projektionsfläche aP durch Formel 2.19 ergibt. 

V = aP 

fP 

0 

0 

(2.19) 

Xpl = V · XS (2.20) 

Xpr = V · XS (2.21) 

Ypl = V · YS (2.22) 

Ypr = V · YS (2.23)


Des Weiteren fehlt hier eine Funktion g1(Xkl,r , Ykl,r , Zkl,r ), um die ermittelten Koordinaten des 

Ok(X, Y ) in das Op(X, Y ) Koordinatensystem zu transformieren die sicherstellt, dass auch bei 

konvergenter Aufnahme keine vertikale Parallaxe auftritt. Im Einzelnen müssen XS ′ und YS ′, also 

die Koordinaten der berichtigten Kamerasensordaten, welche in OPr,l (X, Y )10 liegen ermittelt 

werden. 

Hierfür kann das in [Lac95] beschriebene Verfahren mit bekanntem Konvergenzwinkel γ, gezeigt 

in Abbildung 2.8, genutzt werden. Dabei transformiert eine Projektion das Bild in diese zur Ste- 

reobasis parallele Ebene und eine Skalierung bewirkt eine Korrektur der Breite des Bildes. 

a) b) 

ω 

H 

B 

F 

O 

C C 

γ 

O’ 

A 

G 

E 

S 

S’ 

Q’ Q 

Abbildung 2.8: Finden der linken korrigierten Ebene S’ bei Schrägprojektion (nach [Lac95]), 

a)zweidimensionale Abbildung b)dreidimensionale Abbildung 

Die Breite des Bildsensors sei wk, fk die Kamerabrennweite und 2ϖ der Öffnungswinkel der 

Kamera. Da der Öffnungswinkel der Kamera von der Brennweite abhängt, gilt die Beziehung: 

ω 

X 

F 

O’ 

γ 

O 

P’ 

ϖ = arctan( wk 

) (2.24) 

2 · fk 

Die korrigierte Ebene und die optische Achse der Kamera treffen sich bei O ′ . Daraus resultierend 

gelten die nachfolgenden Verhältnisse, da die Breite des in die korrigierte Bildebene projizierten 

Bildes (EF ) gleich der Sensorbreite wk ist. 

10 Der Index Pr,l beschreibt die linke oder rechte Diaebene des Projektors oder bei Beamern die Ebene der TFT- oder 

LCD-Matrix. 

A 

P 

E


OG = wk · cos(ϖ) 

2 · cos(γ + ϖ) 

OH = wk · cos(ϖ) 

2 · cos(γ − ϖ) 

GH = wk 

2 

(2.25) 

(2.26) 

1 

· cosϖ · ( 

cos(γ + ϖ) + 

1 

) (2.27) 

cos(γ − ϖ) 

Die Breite des berichtigten Bildes EF in S ′ ist gleich der Bildsensorbreite, weswegen der Abstand 

zu dieser Ebene CO ′ wie folgt berechnet wird: 

CO ′ 2 · fk 

= 

1 cosϖ( cos(ϖ+γ) + 

1 

cos(ϖ−γ) ) 

(2.28) 

Unter der Vorraussetzung, dass die Sensorebene in OS und die Projektor-TFT-Ebene in OS ′ die 

korrigierte Ebene darstellt, gilt für die Projektion gegen den Uhrzeigersinn (des linken Bildes) 

folgende Beziehung: 

YS ′ 

YS 

= XS ′ · cosγ 

XS ′ = 

YS ′ = 

= 

XS 

CO′ − XS ′ · sinγ 

fk 

CO ′ 

· XS 

(2.30) 

fK · cosγ + XS · sinγ 

CO ′ · cosγ 

· YS 

(2.31) 

fK · cosγ + XS · sinγ 

Dieses System ist identisch zu einem parallelen System, mit einer theoretischen Brennweite 

f ′ = CO ′ · cosγ, weswegen keine vertikale Parallaxe auftritt. 

(2.29) 

Wie in Abbildung 2.8 zu sehen, ist O ′ nicht mehr in der Mitte der korrigierten Ebene. Durch diesen 

Umstand müssen die „neuen“ Koordinaten der Bildgrenzen X 1 und X 2 errechnet werden. 

X 1 kl = 

X 2 kl = 

CO ′ · wk 

2(fk · cosγ − wk 

2 · sinγ) 

CO ′ · wk 

2(fk · cosγ + wk 

2 · sinγ) 

(2.32) 

(2.33) 

Die berichtigte Abbildung S ′ hat eine Deviation (dk), welche durch die Position der Ebene, der 

Brennweite, der Breite der Sensoren und dem Winkel zwischen korrigierter und Aufnahme-Ebene, 

bestimmt ist. 

dk = CO ′ · cosγ + 

4 · f 2 k 

Im Weiteren tritt durch Formel 2.28 die Beschränkung 

auf. 

CO ′ · w2 k · tanγ 

cosγ(1 + tanϖtanγ)(1 − tanϖtanγ) 

γ + ϖ = π 

2 

(2.34) 

(2.35)


Für die finale Transformation in Raumbildkoordinaten ergibt sich durch den Augenabstand des 

Betrachters (b0) und der Deviaton im Bild pP (vgl. Abbildung 2.4): 

Xv = b0 · (Xpl + Xpr) 

2 · (b0 − (pP )) 

Yv = b0 · YS 

b0 − pP 

Zv = b0 · V 

b0 − pP 

2.3.1.3 Schrägprojektion bei unbekanntem Konvergenzwinkel 

(2.36) 

(2.37) 

(2.38) 

Im Fall, dass der Konvergenzwinkel nicht bekannt ist oder in nicht ausreichender Genauigkeit zur 

Verfügung steht, kann dieser über das im Folgenden dargestelle Verfahren ermittelt werden. 

Für jeden Punkt m1 des linken Bildes liegt der Punkt m2 (vgl. Kapitel 2.3.1.1) im rechten Bild auf 

der Epipolarlinie I1. Um den Konvergenzwinkel γ bestimmen zu können, wird zu dem bekannten 

Punkt m1 über eine ähnlichkeitsfunktion F (m1, m2) der Punkt im rechten Bild gesucht [Ber04]. 

Diese Funktion kann beispielsweise nach Ähnlichen Farbwerten oder Helligkeitswerten suchen. 

Der Punkt m2 ist dabei der, der die Funktion F (m1, m2) minimiert. Die Summe der Funktion 

F (m1, m2) über alle Punke im linken Bild wird geringer, wenn γ ′ nahe des Konvergenzwinkels γ 

liegt. Somit ist der optimale Konvergenzwinkel durch Gleichung 2.39 bestimmbar. 

γ ′ 

= argminγ F (m1, m2(γ)) (2.39) 

m1 

Diese Funktion kann beschleunigt werden, indem nicht zu jedem Punkt m1 der passende Punkt 

m2 gesucht wird, sondern nur bestimmte Regionen des Bildes „abgesucht“ werden. 

Für diesen Ansatz existieren [Ber04, nach] zwei prinzipielle Methoden: 

1. Merkmalbasierte Methoden 

2. Flächenbasierte Methoden 

Bei den merkmalbasierten Methoden werden in den Einzelbildern des Stereobildpaares Merkmale 

gesucht, welche: 

• Kanten, 

• Kurven, 

• und Ecken 

sein können. Die Identifizierung dieser Merkmale ist robuster gegenüber dem Finden von Intensi- 

täten. 

Die flächenbasierten Methoden vergleichen Regionen aufgrund von Farb- und Helligkeitswerten. 

Diese Variante eigenet sich besonders für Landschaftskarten, Satellitenaufnahmen und anderen


Bildinformationen, bei welchen vorrangig weiche Übergänge zwischen Farbflächen auftreten. 

Ein weiterer Ansatz zur Bestimmung des Konvergenzwinkels nutzt die später in Kapitel 4.6 be- 

schriebene Stereokamerakalibrierung, bei der durch eine Kalibrierung beider Einzelkameras die 

Weltkoordinatensysteme in die Kamerkoordinatensysteme überführt werden. In diesem Fall geben 

die externen Parameter der Kalibrierung die Lage der Camcorder zueinander an. Dieser Ansatz er- 

fordert allerdings bei Änderung des Konvergenzwinkels während der Aufnahme eine Kalibrierung 

für jede mögliche Brennweite, was sehr umfangreich ist und somit zur Auffindung von Epipolar- 

linien nur in begrenztem Maße zu empfehlen ist. Dies bedeutet, für eine festgelegte Brennweite 

und Fokussierung ist diese Art der Bestimmung von γ erfolgreich. 

2.3.2 Berechnung des virtuellen Abstandes 

Der virtuelle Abstand eines Objektes bei der Wiedergabe gibt an, in welcher Entfernung sich das 

virtuelle Objekt (siehe Abbildung 2.9) zu befinden scheint. 

virtuelles 

Objekt 

Wiedergabeebene 

Projektor Projektor 

dk 

p P 

b 0 

dk 

2 2 

Abbildung 2.9: Schematische Darstellung der Projektion eines virtuellen Objektes. 

Dieser Abstand hängt von mehreren Faktoren ab und ist in der Regel nicht gleich der Entfernung 

des Objektes von der Kamera bei der Aufnahme. Um diesen zu berechnen kann Abbildung 2.1 

genutzt werden, da hierbei die Abbildung auf dem Bildsensor der Kamera analog der im mensch- 

lichen Auge verläuft [Her07]. 

Die virtuelle Entfernung (avirt) hängt von der Größe der Projektion ab. Dabei sei der Abstand des 

Betrachters zum Wiedergabemedium eP , der Augenabstand b0 und die Deviation der wiedergege- 

eP 

t 

f 0 

virt 

a 

virt


benen Bilder pP wodurch sich die Beziehung in Formel 2.40 ergibt. 

avirt = b0 · eP 

2 · pP 

(2.40) 

Zur Berechnung der Deviation der projizierten Bilder (pP ) wird der Vergrößerungsfaktor (V ) aus 

Formel 2.19 benötigt, welcher das Größenverhältnis zwischen Wiedergabeabbildung und Abbil- 

dung auf dem Bildsensor einer Kamera angibt. 

Die Deviation dk auf den Bildsensoren der Kameras errechnet sich durch 

dk = bk · fk 

2 · a 

wodurch die Deviation pP auf der Projektionfläche 

pP = V · dk = aP 

ist. Werden diese Formeln nun in Formel 2.40 eingesetzt, ergibt sich als virtueller Abstand 

avirt = b0 · eP 

2 · pP 

2.3.3 Berechnung der virtuellen Tiefe 

fP 

· dk 

= b0 · fP · eP 

bk · fk · aP 

(2.41) 

(2.42) 

· a (2.43) 

Die virtuelle Tiefe beschreibt, wie groß der Tiefeneindruck des dargestellten Objektes ist. Bei- 

spielsweise sollen meist bei der Darstellung von Kugeln oder anderen runden Objekten diese nicht 

durch eine übertriebene Tiefenwirkung, elliptisch dargestellt werden. 

Ausgehend von der Abbildungsgröße des Objektes im Auge des Betrachters h0 und nach Abbil- 

dung 2.9 kann die virtuelle Objektgröße gvirt über die Höhe h0 und die virtuelle Tiefe tvirt über 

die Deviation beschrieben werden. 

Es sei 

· gobj 

(2.44) 

a 

die Höhe der Objektabbildung im Auge des Betrachters wobei hobj die reale Objekthöhe bezeich- 

h0 = f0 

net. Durch Umstellen dieser Formel für virtuelle Werte ergibt sich: 

h0 = f0 

· gvirt 

avirt 

was sich durch den Vergleich mit den Formeln 2.40, 2.19, 2.41, 2.42 und 2.43 zu: 

gvirt = fk · avirt · aP 

fP · eP · a · gobj = b0 

umstellen läßt. Die virtuelle Objekttiefe tvirt kann durch 

d = b0 · f0 

a 2 virt 

also der Deviation ermittelt werden, welche sich nach: 

umstellen lässt. 

· tvirt 

tvirt = bk · fk · a 2 virt 

bK 

· gobj 

(2.45) 

(2.46) 

(2.47) 

· aP 

b0 · fP · eP · a2 · t (2.48)


2.3.4 Berechnung der Betrachterposition 

Für den optimalen Betrachtungsabstand vom projizierten Stereobild, welcher theoretisch jener ist, 

bei dem dargestellte Objekte gleich wahrgenommen werden, existieren zwei Ansätze. 

Zum einen der orthostereoskopische, also formtreue und zum anderen der Ansatz der form- und 

größentreuen Abbildung, auch tautostereoskopische Abbildung genannt [Her07]. 

Dabei tritt eine tautostereoskopische Abbildung nur auf, wenn b0 = bk und gleichzeitig 

fP · eP 

fk · aP 

= eP 

V · fk 

= 1 (2.49) 

gilt. Um prinzipiell gleiche Winkel δ zu erreichen muss die Aufnahmebasis bk gleich dem Augen- 

abstand sein. Desweiteren, wie in Formel 2.49 gezeigt, muss das Verhältnis der Entfernungen von 

Projektor und Betrachter zur Projektionsebene stimmen. So lässt sich der Betrachtungsabstand 

einer tautostereoskopischen Abbildung ePtauto nach Formel 2.50 bestimmen. 

ePtauto = fk · aP 

fP 

Für eine orthostereoskopische Abbildung gilt: 

fP · eP 

fk · aP 

= V · fk 

(2.50) 

= 1 (2.51) 

da hier die Bedingung für die Stereobasis nicht zu beachten ist. Dies liegt darin begründet, dass bei 

Veränderungen der Stereobasis, wie in Kapitel 2.1.3 beschrieben, eine Größenveränderung auftritt, 

jedoch keine Formveränderung. Weiter bedeutet dies, dass Personen, die weiter von der Projek- 

tionsfläche entfernt sind, eine größere virtuelle Tiefe wahrnehmen, da die virtuelle Größe gleich 

bleibt. Ebenso wie Personen, die sich näher an der Projektionsfläche befinden, einen flacheren 

Tiefeneindruck erfahren. 

In der Praxis stellte sich jedoch heraus, dass subjektive Kriterien einfließen [Pas87]. 

2.3.5 Wiedergabemethoden 

Die Wiedergabe stereoskopischer Bildinhalte kann über vielfältige Methoden realisiert werden 

welche hier der Vollständigkeit halber gegeben werden sollen. Da die Wiedergabe der Stereovi- 

deos mit der entwickelten Stereovideokamera ein Teil der Aufgabenstellung dieser Diplomarbeit 

darstellt. 

Im Allgemeinen wird zwischen der Wiedergabe auf einem Bildschirm und der auf mehreren Bild- 

schirmen (mit Hilfe von Projektoren) unterschieden. Diese Varianten werden im Folgenden kurz 

erläutert. 

2.3.5.1 Head Mounted Displays 

Bei Head Mounted Displays (HMD), oder auch Videobrille genannt, handelt es sich um ein tragba- 

res Gerät ähnlich einer Brille, welches mit Hilfe von zwei kleinen Bildschirmen Raumbilder dar- 

stellt. Moderne HMDs sind mit einem Virtual retinal display (VRD) ausgestattet. Diese Technik


projiziert ein Bild direkt auf die Netzhaut. Zusammen mit einer transparenten bzw. transluzenten 

Brille kann das Auge die Umgebung sowie die Darstellungen der Brille gleichzeitig erfassen. Ein 

weiterer Vorteil ist, dass das Bild skaliert werden kann und somit das gesamte Blickfeld ausgenutzt 

wird [Wik07b]. 

2.3.5.2 Polarisation 

Die Polarisationstechnik unterscheidet sich durch den Einsatz von linearer und zirkularer Polari- 

sation. 

Bei der linearen Polarisation werden Bilder mit einem Stereo-Diaprojektor oder zwei Beamern 

auf eine Leinwand projiziert, wobei beide Objektive mit um 90 Grad versetzten Polarisations- 

filtern bestückt werden. Die Zuschauer bekommen Polarisationsbrillen, die beide Bilder wieder 

voneinander trennen. Dabei können die Einzelbilder leicht abgedunkelt durch die Filter, ohne 

Farbeinschränkungen betrachtet werden. Es wird keinerlei Übung benötigt, um den Stereoeffekt 

wahrzunehmen. Allerdings verschwindet der Stereoeffekt, wenn der Kopf geneigt wird, da die 

Bilder in diesem Fall nicht mehr getrennt werden. Diese Projektionsmethode ist heutzutage die 

am weitesten verbreitetste. Zum einen, da polarisierte Brillen relativ preisgünstig erhältlich sind 

zum anderen, da die Verwendung von zirkularer Polarisation nur in den mittleren Wellenlängen 

des sichtbaren Lichtes optimal eingesetzt werden kann. Bei relativ hohen, oder niedrigen Wellen- 

längen müssen hier Geisterbilder in Kauf genommen werden. 

Zirkulare Polarisation wird erreicht, indem eine linear polarisierte Lichtwelle durch einen Kristall 

geleitet wird, in welchem die Fortpflanzungsgeschwindigkeit des Lichtes von der Schwingungs- 

achse eines elektrischen Feldes abhängt. Ist das Licht vor dem Kristall parallel oder waagrecht 

zur optischen Achse polarisiert, so geschieht entweder gar nichts oder es wird die gesamte Welle 

etwas gebremst. Schwingt das Licht im 45 ◦ -Winkel zur optischen Achse, so ergibt sich rechtszir- 

kulares Licht. Beim Winkel von −45 ◦ dreht sich das Licht genau in die andere Richtung, es wird 

also linkszirkular [Weh07]. 

2.3.5.3 Schieltechniken 

Parallelblick Bei dem Parallelblick wird versucht mit den Augen auf einen weit entfernten 

Punkt zu konvergieren, sodaß die Augenachsen nahezu parallel verlaufen. In diesem Zustand muss 

der Betrachter nun auf zwei Bilder vor sich akkomodieren (scharfstellen) und es ergibt sich ein vir- 

tuelles drittes Bild zwischen den beiden betrachteten, welches über stereoskopische Tiefe verfügt. 

Dieses Methode ist durch die unnatürliche Betrachtungsweise sehr unangenehm und kann nicht 

über längere Zeit vollzogen werden. Außerdem muss diese Methode trainiert werden, was bei 

erfolgreicher Erlernung den Vorteil bietet, ohne jegliche Hilfsmittel Raumbilder wahrzunehmen. 

Kreuzblick Ähnlich dem Parallelblick ist die Methode des Kreuzblickes. Dabei konvergieren 

die Augen des Betrachters auf einen sehr nahen Punkt und akkomodieren auf einen weiter weg


liegenden Punkt. So sieht das linke Auge das rechte Bild und das rechte Auge das linke Bild. 

Auch bei dieser Methode entsteht ein drittes virtuelles Raumbild in der Mitte. 

2.3.5.4 Stereoskop 

Das Stereoskop ist vergleichbar mit einem Feldstecher, in dem die Bilder als Positivfilme (Dia) 

eingelegt werden. Durch Linsen werden die Bilder etwas vergrößert und jedes Auge sieht genau 

ein Bild. Dieses Hilfsmittel ist eines der ältesten Geräte zur Betrachtung von stereoskopischen 

Aufnahmen, welches die Methode des Parallelblickes realisiert und diese unterstützt. 

2.3.5.5 LCDShutter-Brille 

Eine Shutterbrille ist ein zur Betrachtung von Stereographiken auf einem Monitor eingesetztes 

Gerät. Der Computer gibt abwechselnd das linke und rechte Bild aus und steuert eine Brille mit 

Flüssigkristallscheiben an. Dabei wird im gleichen Takt der Bilder jeweils eine Seite undurchsich- 

tig. Dieses Verfahren reduziert die Bildwiederholrate effektiv auf die Hälfte. Die Auflösung des 

Monitors kann voll genutzt werden und man benötigt keinerlei Übung. Bei Bildwiederholraten von 

mehr als 100 Hz. ist eine flimmerfreie Wiedergabe möglich, worin die Einsatzbegrenzung liegt, 

da z.Zt. lediglich Röhrenmonitore einen ausreichend schnellen Bildaufbau ermöglichen um Shut- 

terbrillen einzusetzen. Bei LCD Bildschirmen reagieren die Flüssigkristalle nicht schnell genug 

auf den Wechsel zwischen rechtem und linkem Bild, was Störbilder zur Folge hat. Shutterbrillen 

können im Pageflipping Modus betrieben werden, dabei wird abwechselnd ein linkes- und rechtes 

Vollbild dargestellt. Ein weiterer Modus dieser Technik ist der Interlaced Modus, wobei auf Röh- 

renmonitoren der Bildaufbau durch Halbbilder genutzt wird. Es wird hier immer ein linkes und 

rechtes Halbbild abwechselnd dargestellt, wobei die Auflösung pro dargestelltem Bild halbiert 

wird, aber eine Bildwiederholrate von ca. 60 Hz. ausreicht um Raumbilder darzustellen. Wenn die 

Wiedergabe im Interlaced Modus nicht unterstützt wird, kann das Lineblanking Verfahren genutzt 

werden, bei dem in ein Vollbild verschachtelte Halbbilder der zwei Ansichten kodiert werden, der 

Controller der Shutterbrille übernimmt die Interlaced-Darstellung. Als viertes Verfahren existiert 

das Synchdoubling Verfahren wobei die Halbbilder der linken und rechten Ansicht übereinan- 

der an den Shuttercontroller gesendet werden, welcher nach der Darstellung des oberen Teils ein 

Synchronsignal sendet, wodurch der Elektronenstrahl wieder an den Nullpunkt der Monitorröhre 

gebracht wird und das untere Halbbild darstellt. Dabei kann durch fehlerhafte Synchronsignale ein 

Höhenversatz entstehen, was zur Folge hat, daß das System nicht verbreitet eingesetzt wird. 

2.3.5.6 Prismenbrille 

Bei dem Einsatz von Prismenbrillen, auch KMQ nach den Initialen der Erfinder 11 genannt, werden 

beide Bilder übereinander gelegt. Vorteil dieser Technik ist, dass keine Filter benötigt werden und 

auch keine besondere Projektionsfläche notwendig ist. Eine Prismenbrille, die das Licht auf beiden 

11 Dr. Christoph Koschnitzke, Reiner Mehnert und Dr. Peter Quick


Seiten unterschiedlich bricht führt jedem Auge ein Bild zu. Dabei werden diese allerdings leicht 

gestaucht und es können an kontrastreichen Stellen des Bildes farbige Säume entstehen. Außerdem 

ist ein fest definierter Abstand zum Bild einzuhalten, der von Größe und Abstand der Stereobilder 

abhängt [Qui07]. 

2.3.5.7 Interferenzfiltertechnik 

Die Interferenzfiltertechnik oder Wellenlängenmultiplex arbeitet nach einem Farbbandpass Ver- 

fahren mit kammartig verschachtelten Bandpässen (siehe Abbildung 2.10). Hierbei werden die 

Bilder für das linke und rechte Auge mit Grundfarben unterschiedlicher Wellenlänge projiziert 

z.B. 

linkes Auge: rot 629nm, grün 532nm, blau 446nm 

rechts Auge: rot 615nm, grün 518nm, blau 432nm 

Abbildung 2.10: Funktionsprinzip der Infitec Interferenzfiltertechnik aus [Dai07] 

Bei dieser Betrachtungstechnik ist der Kopf beliebig neigbar und es wird keine Spezial-Leinwand 

benötigt. Die Brillen und Filter sind jedoch vergleichsweise teuer und man muss leichte Farbver- 

fälschungen je Auge (rosa/hellgrün) in Kauf nehmen [Dai07]. 

2.3.5.8 Prismen-Oberfläche 

Eine Prismen-Oberfläche, auch Lenticular genannt, wird z.B. bei Stereopostkarten eingesetzt. Bei- 

de Bilder werden spaltenversetzt nebeneinander unter einer geriffelten Folie platziert. Dabei wird 

immer zwischen Spalten des linken und rechten Bildes gewechselt. Durch die schmalen Prismen


schaut das rechte Auge auf die Streifen des rechten Bildes, analog das linke Auge. Diese Tech- 

nik wird meist mit mehr als zwei Bildern noch verbessert. So existieren beispielsweise Monitore, 

welche fünf Ansichten, meist von synthetischen Bildinhalten, darstellen. Nachteil ist, dass bei Pro- 

jektion von Stereofotos drei Zwischenbilder interpoliert werden. Das führt zu Qualitätseinbußen 

und somit zu einer geringeren darstellbaren Auflösung der Bildschirme [Inc07b]. 

2.3.5.9 Anaglyphen Verfahren 

Beim anaglyphen Verfahren werden die Teilbilder unterschiedlich eingefärbt und übereinander 

gelegt. Die Trennung der Bilder für jedes Auge wird durch Farbfolien realisiert, wobei die Primär- 

farben Rot, Blau, oder Grün verwendet werden. Anaglyphen sind mit jedem Medium kompatibel, 

werden aber durch entstehende Farbverfälschungen nicht im Videobereich genutzt. Hier kommt 

hinzu, dass Farbkodierungsverfahren, welche im Fernseh- und Videobereich verwendet werden, 

nicht für die Darstellung von Anaglyphen geeignet sind. Meist werden Rot-Blau-, oder Rot-Grün- 

Brillen eingesetzt, wobei die Kanaltrennung bei Rot-Blau Brillen durch die größere Farbdifferenz 

effizienter ist. 

Echte Anaglyphenbilder können keine Farben reproduzieren, deshalb dienen hierbei meist Grau- 

stufenbilder als Vorlage. 

Zum zweiten existieren graue Anaglyphen, die sich durch die Verwendung aller drei Primärfarben 

auszeichnen. Für das rechte Bild werden grüner und blauer Kanal genutzt und mit einem Cyan 

Filter betrachtet. Für das linke Bild wird der rote Kanal verwendet. Dadurch wird das Raumbild 

heller und farbneutraler, enthält aber auch geringe Störbilder. 

Als drittes existieren farbige Anaglyphen, welche eine geringe Farbwiedergabe erlauben. Dabei 

werden grüne und blaue Farbanteile gut wahrgenommen, da sie einem Auge zugeführt werden, 

und rote eher schwach gesehen. 

2.3.5.10 Pulfrich-Verfahren 

Bei dem Pulfrich Verfahren handelt es sich um ein quasistereoskopisches Verfahren, welches eine 

Dunkel-Hell-Brille nutzt. Durch den Effekt, dass das Gehirn dunkle Bilder später wahrnimmt als 

helle und die rechte Seite der Brille abgedunkelt ist, wirkt eine Filmsequenz, bei der sich die Ka- 

mera von rechts nach links bewegt, durch die Brille betrachtet, dreidimensional. Das linke Auge 

sieht das aktuelle Bild, während das rechte Auge ein dunkleres Bild sieht, welches zeitversetzt 

wahrgenommen wird. Diese auch von diversen Fernsehsendern präsentierte Variante funktioniert 

nur bei seitlichen Kamerafahrten. Bewegt sich die Kamera nicht, wird kein Raumbild wahrgenom- 

men. 

2.3.6 Mögliche Bildstörungen in stereoskopischem Video 

Zu der im Kapitel 2.3.1 beschriebenen Korrektur von konvergenten Aufnahmen kommen noch 

andere Störungen hinzu, welche nachfolgend erwähnt und kurz erläutert werden sollen.


2.3.6.1 Höhenfehler 

Höhenfehler entstehen wenn die Stereokamera bei der Aufnahme nicht Horizontal ausgerichtet 

wurde oder die ptischen Achsen der Stereokamera vertikal divergieren. Sie resultieren in Raum- 

bildern welche stereoscopisch nicht wahrgenommen werden können, da ein „normalsehendes“ 

menschliches Auge und das „verarbeitende“ Gehirn bei vertikalen Differenzen korrespondieren- 

der Bildpunkte keine Zuordnung dieser treffen kann. 

Zur Eliminierung von Höhenfehlern ist ein Filtermechanismus denkbar, welcher die bei der Auf- 

nahme eventuell entstandenen Höhenfehler zur Laufzeit korrigiert. Dazu müsste ein Algorithmus 

implementiert werden, der markante Bereiche in beiden Bildern sucht und deren Höhe angleicht. 

Dieser Algorithmus könnte Höhenfehler durch Verkippung eliminieren. Für den Fall, dass die 

optischen Kameraachsen bei der Aufnahme nicht vertikal parallel ausgerichtet sind kann dieser 

Algorithmus keine Lösung liefern da bei diesen Aufnahmen der Höhenfehler abhängig von der 

Entfernung des Objektpunktes ist. 

2.3.6.2 Randlichtabfall 

Weiterhin sollten Fehler bei der Projektion behoben werden. Beispielsweise entsteht bei jeder Pro- 

jektion ein heller Fleck, der durch den natürlichen Randlichtabfall bedingt ist. Dies bedeutet, dass 

um die Achse, die zwischen Betrachter und Projektor entsteht, ein helleres Bild projiziert wird. 

Das sogenannte „Cos 4 -Gesetz“, siehe [DAK06], beschreibt diesen Effekt, der in Abbildung 2.11 

gezeigt ist. Die Eliminierung eines solchen Randlichtabfalls erfolgt über eine transparente Maske, 

welche den helleren Bereich so abdunkelt, dass das komplette Bild eine gleichmäßige Helligkeit 

hat. Die einfachste Methode solch eine Maske zu generieren, besteht in der Aufnahme einer Pro- 

jektion eines weißen Bildes mit einer analogen Kamera. Das Negativ dieses Fotos wird nach der 

Entwicklung vor eine Projektor-Bildebene gebracht und eliminiert somit den Randlichteffekt. Bei 

Nutzung eines Computers kann diese Maske als Alphamaske über das zu projizierende Bild ge- 

legt werden. Allerdings tritt der Effekt, wie erwähnt, relativ zum Betrachter auf, weswegen eine 

optimale Transformation nur durch Tracking des Betrachters möglich ist. 

2.3.6.3 Verzeichnung 

Bei Verzeichnung handelt es sich um Abbildungsfehler optischer Systeme welche durch die un- 

terschiedliche Dicke der Linsen zustande kommt. Da konvexe Linsen zum Rand hin dünner sind 

als in der Mitte (und konkave Linsen zum Rand hin dicker als in der Mitte) kommt es zu Brenn- 

weitenunterschieden. Diese bewirken eine kissenförmige (oder tonnenförmige) Verzeichnung. 

Zur Berichtigung dieser Verzerrungen wird ein kalibriertes Muster benötigt, welches nach der Ab- 

lichtung mit dem aufgenommenen Bild verglichen wird. Bei der Elimination von Verzeichnungen 

von Projektoren kann diese Methode ebenfalls verwendet werden. So kann eine Transformation


a) b) c) 

Abbildung 2.11: Randlichtabfall bei Nutzung von Projektoren. a) Mittige Projektion b) Schrägprojektion 

c) Schrägprojektion auf spezielle Leinwand 

aufgestellt werden, die eine Kamera „kalibriert“. Hier wird ein bekanntes Muster projiziert und 

von einer bereits kalibrierten Kamera wieder aufgenommen. 

2.3.6.4 Aberration 

Aberration beschreibt den Effekt, dass Lichtstrahlen sich hinter einer Linse nicht in einem Punkt 

treffen. Dabei unterscheidet man zwischen chromatischer Aberration und sphärischer Aberration. 

Die chromatische Aberration (auch Farbsaum) ist ein Abbildungsfehler optischer Linsen welcher 

von der Wellenlänge des Lichtes abhängt. Licht verschiedener Wellenlängen wird, durch unter- 

schiedliche Brechung in einer Linse, in verschiedenen Punkten fokussiert. 

Eine Korrektur dieses Effektes ist nur während der Aufnahme möglich indem Linsen verschiede- 

ner Glassorten verwendet werden und so, durch die unterschiedlichen Brechzahlen der Linsen, die 

Farbanteile zusammenfallen. 

Bei der sphärischen Aberration tritt der Effekt auf, dass bei Linsenoberflächen, welche eine Ku- 

gelfläche beschreiben, die Bündelung parallel eintreffender Strahlen in einem Brennpunkt nur für 

achsennahe Lichtstrahlen gegeben ist. Dadurch wird das scharfe „Kernbild“ von einem unscharfen 

Bild überlagert. Dieser Effekt kann ebenfalls nur bei der Aufnahme durch Wählen einer „größe- 

ren“ Blende oder dem Einsatz von asphärischen Linsen mit parabelförmigem Querschnitt behoben 

werden. 

2.3.6.5 Krümmung der Tiefenebene 

Bei konvergenter Aufnahme von Stereovideos kommt es, wie in Abbildung 2.12 a) dargestellt zu 

einer Krümmung der Tiefenebenen. Das Resultat dieser Verzerrung führt dazu, dass Objekte am


c) 

Zi (m) 

a) b) 

8 9 

Zo (m) 

Abbildung 2.12: Schematische Darstellung einer a) konvergenten Aufnahme, b) parallelen Aufnahme 

und des c) nicht linearen Tiefeneindruck. Nach [Koc93] 

Rand der Szene weiter entfernt als Objekte in der Mitte dargestellt werden. Bei Bewegungen der 

Kamera kann dieser Effekt sehr unangenehm wirken. Im Vergleich dazu ist in Abbildung 2.12 b) 

eine parallel aufgenommene Szene schematisch dargestellt, bei welcher die Tiefenebenen parallel 

zur Projektionsebene abgelichtet werden. 

2.3.6.6 Nicht linearer Tiefeneindruck 

In Abbildung 2.12 c) ist der Zusammenhang zwischen Objektabstand und Bildabstand für die in 

Abbildung 2.12 a) und b) dargestellten Situationen gezeigt. Dabei ist die Konvergenzebene bzw. 

Konvergenzlinie bei einem Meter aufgetragen. Bei dem Vergleich der schematischen Darstellun- 

gen 2.12 a), b) und c) ist zu erkennen, dass der Tiefeneindruck vor dem Konvergenzpunkt gedehnt 

und hinter diesem, bis ins unendliche, gestaucht wird. Daraus resultiert ein Fehleindruck in der 

räumlichen Tiefe und der Geschwindigkeitswahrnehmung.

3 Existierende Aufnahmesysteme 

Im Bereich der Stereovideokameras existieren verschiedene kommerzielle Produkte, die in diesem 

Kapitel vorgestellt werden. Dabei wird auf existierende Kamerahardware und Software eingegan- 

gen. 

3.1 Kameras 

Die existierenden Kameras zur Aufnahme von stereoskopischen Videos sind, wie in Kapitel 2.2.3.3 

beschrieben, in zwei Gruppen einzuteilen: 

• Stereovideokameras, welche zwei Objektive in einem Kamerakörper besitzen und 

• Kamerasysteme, welche aus zwei oder mehreren Einzelkameras bestehen, die zusammen 

als Stereoaufnahmesystem arbeiten und als binokulare Kameras bezeichnet werden. 

3.1.1 Stereovideokamera 

Wie in Kapitel 2.2.3.3 beschrieben, handelt es sich bei einer Stereovideokamera um eine Kamera 

mit 2 Objektiven. Einige Produkte dieser Kategorie werden im Folgen genannt und erklärt. 

3.1.1.1 21st Century 3DVX3 

„21st Century 3D“ entwickelte 2004 eine Kamera namens „3DVX3“. Diese verfügt über zwei 100 

Gigabyte Festplatten, auf welchen circa eine Stunde unkomprimierte Videodaten aufgezeichnet 

werden können. 

Diese werden mit 10 Bit pro Farbkanal, 24 Vollbildern pro Sekunde und einer maximalen Auf- 

lösung von 1280 × 720 Pixeln pro Stereoteilbild gespeichert. Die interne Aufnahme erfolgt mit 

jeweils 3 CCD 1 Chips, die ihre Daten an zwei interne MacOS X 2,8 Ghz Prozessoren weitergeben. 

Diese Prozessoren besitzen zwei Gigabyte Arbeitsspeicher und zur Zwischenpufferung der Daten 

acht Gigabyte Flashspeicher [CD07]. 

Zum Einsatz am Lehrstuhl Computergrafik und Visualisierung ist diese Kamera ungeeignet, da 

die maximale Auflösung der Kamera trotz des hohen technischen Aufwands geringer ist als die 

1 Ein „Charge-coupled Device“ (ladungsgekoppeltes Bauteil) ist ein elektronisches Bauteil, welches wie ein Schieberegister 

arbeitet. Das einfallende Licht überträgt durch einen inneren photoelektrischen Effekt seine Energie auf die 

Elektronen eines Halbleiters wodurch es möglich wird ein digitales Bild abzugreifen. 

40

3.1. KAMERAS 41 

Abbildung 3.1: 21st Century 3DVX3 Kamera [CD07] 

in der Aufgabenstellung geforderte High Definition Video Auflösung von 1440 × 1050 Pixel. Im 

Weiteren ist es, wie bei allen Stereovideokameras dieser Katergorie, nicht möglich die Stereobasis 

zu verändern. 

3.1.1.2 Pace Fusion 3d 

Das „Pace Fusion 3D“ wird zur Zeit genutzt, um Sportereignisse, wie zum Beispiel die „Natio- 

nal Basketball League“ in den USA, in „3D High Definition“ aufzunehmen. Die Fähigkeit, den 

Konvergenzwinkel der Objektive zu verändern, bezeichnet Pace als „Dynamic Convergence R○ “. 

Dabei sind geringe Konvergenzwinkel von 0 ◦ bis 5 ◦ durch manuelles Justieren möglich. Eine Ver- 

stellung der Stereobasis ist bei dieser Kamera nicht möglich [Pac07]. 

3.1.1.3 TMP S3R 1080i 3D 

Die von der „TMP Media Group“ angebotene Schulterkamera „S3R 1080i 3D“ unterstützt das 

High Definition Video Format in der 1080i Spezifikation. Dies bedeutet, dass die Kamera mit ei- 

ner Auflösung von 1440 × 1080 Pixel und 50 Bildern pro Minute Interlaced Bilddaten speichern 

kann. 

Die Stereobasis sowie der Konvergenzwinkel können nicht variabel eingestellt werden. 

Eine weitere Betrachtung der Eignung im Sinne der Aufgabenstellung erübrigt sich, da der ange- 

gebene Preis der Kamera mit 70.000 Euro nicht als preisgünstig im Rahmen der Aufgabenstellung 

bezeichnet werden kann [Med07]. Die Preise der anderen genannten Stereovideokameras konnten 

nicht ermittelt werden. Da diese Geräte allerdings nur in Verbindung mit Personal gemietet wer- 

den können liegt die Annahme nicht fern, dass der angegebene Preis von 70.000 Euro die untere 

Grenze der Preislage bildet. 2 

2 Annahme des Autors


Abbildung 3.2: Stereokamera basierend auf zwei Mini-DV Camcordern [DFS07] 

3.1.2 Binokulare Kameras 

Bei der Verwendung von zwei separaten Kameras in einem Stereovideosystem spricht man von 

einem binokularen Stereosystem. Diese Katergorie besteht aus zwei Gruppen, welche sich in der 

Bauart der verwendeten Kameras unterscheiden. In der einen Gruppe werden handelsübliche Cam- 

corder verwendet und in der anderen sogenannte Industriekameras. 

3.1.2.1 Camcorder 

Camcorder besitzen den Nachteil, daß bei hoher Auflösung wie z.B. High Definition Video die 

Video- sowie Audiodaten komprimiert werden, um diese auf dem Speichermedium unterbringen 

zu können. Bei den verwendeten Kompressionsformaten handelt es sich immer um verlustbehaf- 

tete Verfahren, welche die Bildqualität vermindern. Als weiterer Nachteil von Camcordern wird 

die Technik zur Synchronisation gesehen, da die Genlocktechnologie (siehe Kapitel 4.1.2.1) nur 

an hochwertigen somit preisintensiven und in den Abmaßen großen Kameras zu finden ist. 

Die existierenden binokularen Stereovideo Kamerassysteme nutzen daher Sony- Digital Videoka- 

meras welche über das in Kapitel 4.1.2.2 beschriebene LANC TM Protokoll verfügen. In Abbildung 

3.2 ist eine solche binokulare Stereokamera dargestellt. 

Diese Kamera basiert auf zwei über das „LANC“ Protokoll synchronisierte Sony DCR-HC96E 

Camcorder. Durch die feste Montage dieser auf eine Metallplatte ist keine Änderung der Stereoba- 

sis oder der Konvergenz möglich. Dieser Aufbau ist aufgrund der Bauweise typisch für binokulare 

Stereokameras zum Einsatz im Heimbereich, da eine einmalig beim Bau der Kamera ausgeführte 

Justierung nur im Rahmen von Materialtoleranzen schwankt. Umso mehr Freiheitsgrade für die 

Justierung der Kameras geschaffen werden, desto schwieriger und komplizierter wird der Um- 

gang mit dieser. Da für fast alle Einstellungen bei der Aufnahme stereoskopischer Videos, die


Standardgeometrie, sprich die parallele Ausrichtung der Kameras genutzt wird, stellt dies keine 

schwerwiegende Einschränkung dar. 

Für den wissenschaftlichen Einsatz im Rahmen der Aufgabenstellung dieser Arbeit und der wei- 

teren Verwendung der Kamera sollten jedoch so viele Freiheitsgrade wie möglich an der Kamera 

realisiert werden. 

3.1.2.2 Industriekameras 

Industriekameras haben den Nachteil, dass sie keine Speicherung der Daten in der Kamera ermög- 

lichen, sodaß externe Speichermedien verwendet werden müssen. Ebenfalls wird der Ton nicht 

direkt von der Kamera aufgenommen. Deswegen ist es notwendig, bei einem mobilen Einsatz ein 

Aufnahmegerät für die Videodaten, sowie ein weiteres für die Speicherung von Audiodaten mitzu- 

führen. Zusätzlich muss eine Stromversorgung für diese Geräte und die Kameras vorhanden sein. 

Ein weiterer Nachteil liegt in den Objektiven von Industriekameras, die meist manuell bedient 

werden müssen, um die Brennweite und die Fokussierung einzustellen. Somit müssen hier weitere 

Aufwendungen zur Synchronisierung dieser Werte getroffen werden. 

Als Vorteil der Industriekameras ist zu sehen, dass eine Synchronisierung der Aufnahme durch 

einfaches Verbinden der Kameras oder durch Anlegen eines Synchronisationssignales erledigt ist. 

Weiterhin sind Industriekameras in ihren Abmaßen, im Vergleich zu Camcordern, verhältnismäßig 

klein, was geringe Stereobasen ermöglicht. 

Abbildung 3.3: Stereokamera basierend auf zwei Industriekameras [Rub07] 

Durch die Nachteile bei der Speicherung der Daten und die dadurch entstehenden Probleme im 

mobilen Einsatz wird hier nicht weiter auf Industriekameras eingegangen.

3.2. EXISTIERENDE SOFTWARE 44 

3.1.3 Strahlenteiler 

Der Einsatz von Strahlenteilern, welche in Kapitel 2.2.3.2 beschrieben werden, wird im Video- 

bereich durch den Verlust der halben Auflösung bei der Verwendung einer Kamera nicht genutzt. 

Eine effektivere Variante bildet ein Vorsatz für ein Objektiv, welcher die Aufnahme von linker 

und rechter Ansicht eines Stereobildpaares nacheinander ermöglicht. Dabei rotiert ein Spiegel vor 

dem Objektiv, der das Lichtstahlenbündel jedes zweiten Bildes über einen zweiten Spiegel lenkt. 

Die Stereobasis stellt dabei der Abstand der beiden Spiegel dar. In Abbildung 3.4 ist ein solcher 

Adapter der Firma „NuView“ dargestellt. 

Abbildung 3.4: NuView Adapter zur zeitsequentiellen Aufnahme von Stereobildpaaren [IDS07] 

Der Nachteil dieser Methode ist durch die halbierte Bildrate begründet. Halbierung der Bildrate 

bei Aufnahme im Interlaced 3 Modus bedeutet weitergehend, daß die Auflösung in vertikaler Rich- 

tung halbiert wird. Bei Aufnahme im progressiven 4 Modus kann solch ein Adapter nicht genutzt 

werden, da die Bildwiederholrate zu gering ist. Das Aufzeichnen von Einzelbildern ist mit diesem 

Gerät nicht möglich. Die Stereobasis kann nicht verändert werden, jedoch kann die Konvergenz 

der optischen Achsen durch Verschieben des Spiegels eingestellt werden. 

3.2 Existierende Software 

Aus dem Bereich der Software zur Ver- und Bearbeitung von stereoskopischen Videos werden im 

Folgenden einige Programme vorgestellt und deren Funktionen beschrieben. 

3.2.1 Aufnahme & Enkodierung 

Da die Aufnahme von stereoskopischen Videos auf verschiedene Arten erfolgen kann (siehe Ka- 

pitel 2.2) sind zur Umkodierung in die jeweiligen Betrachtungsformate (siehe Kapitel 2.3.5) ver- 

schiedene Anwendungen verfügbar. Gerade im Bereich der Stereofotografie existiert eine Vielzahl 

3 Bei Aufnahme im Interlaced Modus wird jede zweite Zeile des Bildes mit doppelter Bildfrequenz aufgezeichnet. 

4 Bei progressiver Aufnahme werden Vollbilder aufgenommen.


von Softwareprodukten zur Erstellung von Anaglyphenbildern. Im Videobereich begrenzt sich die 

Produktvielfalt Menge auf vier Anwendungen. Diese sind der „Stereoscopic Multiplexer“ von 

der Firma „WimmerSoft“ [Wim07], „Stereo Movie Maker“ [Sut07], „3DCombine“ [inc07a] und 

„More3D SoftwareSuite“ [Gmb07]. Diese werden im Weiteren genauer beschrieben. 

3.2.1.1 3DCombine 

3DCombine wird als eine „Shareware“ 5 vertrieben, welche das .AVI-Format lesen und Stereovi- 

deos im Anaglyph, Side-by-Side (Nebeneinander) und Übereinander Format erzeugen kann. Eine 

spezielle Funktion dieser Software ist die Erstellung von Tiefenkarten [inc07a]. 

Die Software ist allerdings nicht ausreichend robust, da es des öfteren zu Fehlern und Program- 

mabstürzen kommt. Dies liegt an der Inkompatibilität mit verschiedenen Videocodecs und Bild- 

formaten. 

3.2.1.2 Stereoscopic Multiplexer 

Bei dem „Stereoscopic Multiplexer“ Version 0.5.2 der Firma „WimmerSoft“ handelt es sich um 

einen lizenzpflichtigen Treiber 6 zur Aufnahme stereoskopischer Videos. Dieser nimmt von ver- 

schiedenen Eingabequellen (Digital Video, Firewire, USB Kameras oder Videodateien) Daten 

entgegen und gibt sie im Side-by-Side (Nebeneinander) Format weiter. Die Software arbeitet sehr 

robust und hat bei Tests keine Fehler gezeigt. 

3.2.1.3 Stereo Movie Maker 

Bei dem „Stereo Movie Maker“ Version 0.93 handelt es sich um eine Freeware 7 , welche separa- 

te oder Stereovideos öffnen und anschließend umkodieren kann. Dabei wird die Erstellung von 

Anaglyph-, Side-by-Side-, Übereinander- sowie Interlaced Formaten unterstützt. Der Anschluss 

zweier Kameras wird nicht unterstützt. 

3.2.2 Wiedergabe 

Bei der Wiedergabe stereoskopischer Videos können je nach Stereovideoformat verschiedene An- 

wendungen genutzt werden. So kann ein im Anaglyphenformat abgespeichertes Video ohne spe- 

zielle Software abgespielt werden. Die Wiedergabe von Videos im Side-by-Side Format auf zwei 

übereinander justierten Beamern bedingt bei Verwendung von Grafikkarten, welche das Erweitern 

des Desktops und des dazugehörigen Overlayspeichers 8 erlauben, keiner weiteren Vorverarbei- 

tung. 

5 Shareware eine Vertriebsform von Software, bei der die jeweilige Software vor dem Kauf getestet werden kann. 

6 Bei einem Treiber handelt es sich um eine Software zum Zugriff auf Hardwarekomponenten. 

7 Freeware bezeichnet Software welche für Privatanwendungen kostenlos zu nutzen ist. 

8 Overlayspeicher wird der Teil des Physikalischen Speichers eines Computers genannt in welchem Bildinformation ( 

meist in dem Bildwiederholspeicher der Grafikkarte) geschrieben werden um diese direkt auf ein Projektionsgerät 

auszugeben.


Da nicht vorhergesehen werden kann, in welchem Format der Endverbraucher Stereovideos ab- 

spielt, werden diese Videos meist im Side-by-Side oder Übereinanderformat gespeichert, da in 

diesen Formaten keine Qualitätseinbußen entstehen. Aus diesem Grund ist es bei der Wiederga- 

be von Stereovideos erforderlich eine Konvertierung in die in Kapitel 2.3.5 dargestellten Formate 

durchzuführen. Einige, zu diesem Zweck nutzbare Software, wird im Folgenden erläutert. 

3.2.2.1 Stereo Movie Player 

Der „Stereo Movie Player, Version 0.27“, [Sut07] wird von dem gleichen Autor als Freeware 

zur Verfügung gestellt, der den „Stereo Movie Maker“ entwickelt hat. Dieser Player unterstützt 

als Eingabevideoformate das Side-by-Side, Übereinander und Interlaced Format. Die Ausgabe 

ist hierbei als Anaglyphen, Parallelblick, Kreuzblick, Interlaced (vertikal) für 3D Monitore und 

Zeitsequentiell für Shutterbrillen möglich. 

Beim Test dieses Players erzeugte die Software einige Fehler. So wurden beispielsweise zwei 

Monitore nicht erkannt und verschiedene Videoformate konnten nicht abgespielt werden. 

3.2.2.2 Stereoscopic Player 

Bei der lizenzpflichtigen Software „Stereoscopic Player“ Version 1.1 [Wim07], welche von Peter 

Wimmer [Wim04] in Rahmen einer Diplomarbeit erstellt wurde, handelt es sich um einen robusten 

Player, der alle z.Zt. existierenden Darstellungsformen von Stereovideo unterstützt. So werden 

Eingabeformate im Side-by-Side, Übereinander, Interlaced Format und in separaten Videodateien 

bei der Wiedergabe in Anaglyphen, Zweibildschirmausgabe, vertikal oder horizontal Interlaced 

oder für den NVIDIA R○ Stereotreiber transformiert. 

3.2.2.3 More3D SoftwareSuite 

Bei der komerziellen Software „More3d SoftwareSuite“ handelt es sich um eine Lizenzpflichtige 

Software, welche es ermöglicht bei OpenGL und DirectX basierter Software direkt Stereoansich- 

ten zu gernerieren und diese anzuzeigen. Diese SoftwareSuite enthält „moreVideo“, eine Software 

zur Wiedergabe von Stereovideos. Laut Webseite [Gmb07] handelt es sich dabei um ein univer- 

selles Programm zur Wiedergabe von 3D-Filmen unterschiedlichster Formate. Unterstützt werden 

das Side-by-Side, Übereinander, Interlaced-Format und in separaten Videodateien abgespeicherte 

Ansichten. 

3.2.3 Weiterverarbeitung 

Für das Gebiet der Verarbeitung von stereoskopischen Videos existieren aktuell, außer kleineren 

Softwareprojekten von Universitäten und herkömmlicher Software für die Videobearbeitung, kei- 

ne Anwendungen. Der Nachteil der herkömmlichen Videobearbeitungssoftware ist, dass die in der


Stereoskopie notwendigen Bearbeitungsoperationen, wie beispielsweise das Ändern der Deviati- 

on im Bild oder das Hinzufügen eines Titels, nicht unterstützt werden und nur sehr umständlich 

durchgeführt werden können. 

Ideal wäre hier die Entwicklung einer Videobearbeitungsanwendung, die ein direktes Manipu- 

lieren von Stereovideos erlaubt und die in Kapitel 5.3 genannten Richtlinien zur Editierung von 

Stereovideos einhält.

4 Aufnahmesystem 

Aufgabe im Rahmen dieser Arbeit ist die kostengünstige Entwicklung einer Stereovideokamera. 

Die dazu durchgeführten Aufwendungen werden in diesem Kapitel erläutert. Es wird beschrieben, 

welche Kriterien der Auswahl der Kameras vorangegangen sind. Diese werden gegeneinander und 

gegenüber der Aufgabenstellung verifiziert und verglichen. 

4.1 Kriterien zur Kameraauswahl 

Für die Auswahl der Kameras wurden aufgrund der Aufgabenstellung und den technischen Mög- 

lichkeiten der Wiedergabe auf der Stereoprojektionswand des Lehrstuhls CGV folgende Kriterien 

festgesetzt: 

• digitale Speicherung der Bilddaten, 

• Eine Auflösung von 1400 Pixel × 1050 Pixel (SXGA+ 1 ), 

• Möglichkeit der Synchronisierung beider Kameras, 

• Anschlussmöglichkeit für Sensoren, 

• preisgünstige, aber leistungsfähige Kameras, 

• möglichst kleine Abmaße der Kameras. 

4.1.1 Digitale Formate 

Die Speicherung der Daten wird bei aktuellen Kameras fast ausschließlich digital angeboten, wo- 

bei Unterschiede bei den verwendeten Aufnahmemedien, sowie der Komprimierung der Daten be- 

stehen. Es kommen zur Zeit Digital Betacam, DV-Kassetten, Flashdrives, Festplatten oder DVD’s 

zum Einsatz, wobei das am meisten genutzte Komprimierungsverfahren MPEG2 ist. Eine Auf- 

listung der von den verschiedenen Datenträgern genutzten Komprimierung ist in Tabelle 4.1 er- 

sichtlich. 

Die Auflösung von 1400 × 1050 Pixel entspricht der Auflösung der zur Wiedergabe eingesetzten 

Beamer. Diese Rasterung ist ähnlich den im Folgenden beschriebenen „High Definition“-Formaten 

(HD-Formaten). 

1 Super Extended Graphics Array Plus 

48

4.1. KRITERIEN ZUR KAMERAAUSWAHL 49 

Format Datenträger Kompression Datenrate Kompressionsrate 

HDV DV-Kassetten MPEG2 25 Mbps MP@H-14 

DVD bei 1080i Sampling: 

Flashdrives 19 Mbps 4:2:0 

Festplatten bei 720p 

Digital DV mittels eines 3,125 MByte/sec 5:1 

Video Mini-DV JPEG-ähnlichen (25 Mbit/se) 

DVCAM Verfahren einzeln 

Digital8 codierte Bilder 

AVCHD Festplatte MPEG-4 25 Mbps 

DVD, Blue-ray AVC/H.264 

Flash-Speicher 

Betacam SX Metall- MPEG-2 44 Mbps 10:1 

partikel- Sampling:4:2:2 

band 8-Bit-Auflösung 

Profile@MainLevel 

(4:2:2P@ML) 

DVCAM DV MPEG2 24 MBit/s 5:1 

(bzw. mini-DV) 

Digital Video Magnetbänder MPEG-2 28,2 Mbit/s 

Home System 

HDCAM HDCAM-Band YCbCr311, 440 Mbit/s 8-Bit-3:1:1 

HDCAM-SR Band YCbCr 422 

Festplatte RGB444->MPEG4. 

Tabelle 4.1: HDV taugliche Aufnahmemedien und deren Formate. 

• „High Definition Video“, kurz HDV stellt eine Entwicklung von Sony und JVC dar. Es han- 

delt sich um ein Videoformat für gehobene Ansprüche im Amateurbereich, da die Nachbear- 

beitung und Speicherung der Datenraten von ca. 19Mbps für Standard-PCs noch realisierbar 

sind. Die Aufzeichnung erfolgt in einem der zwei möglichen Formate: 

1. HDV 720p: 1280 × 720 Pixel mit den Frameraten 25p 2 , 30p, 50p oder 60p sowie 

optional 24p 

2. HDV 1080i: 1440 × 1080 Pixel mit den Frameraten 50i 3 und 60i sowie optional 24p, 

25p oder 30p. 

• „Digital Video“ (DV) ist der Oberbegriff für den DV-Standard, der 1994 eingeführt wurde. 

Seit der Markteinführung 1996 entwickelte sich DV durch einen großen Markt an Endge- 

räten rasant, wobei sich ein sehr gutes Preis-Leistungs-Verhältnis gebildet hat. Vor allem 

Mini-DV etablierte sich für den Heim- und semiprofessionellen Bereich. 

• „Advanced Video Codec High Definition“ (AVCHD) stellt ein digitales Aufzeichnungsfor- 

mat für Camcorder dar. Dieser Standard wurde gemeinsam von Panasonic und SONY am 

11. Mai 2006 vorgestellt und wird bereits von vielen Produkten eingesetzt. Zur Kompression 

der Videosignale wird der hocheffiziente MPEG-4 AVC/H.264 Standard zur Videokompres- 

sion verwendet. 

• „Betacam SX“ ist ein professionelles digitales Videoformat, das mit einer Datenreduktion 

2 p steht für Progressiv und bezeichnet eine Speicherung von Vollbildern 

3 i steht für Interlaced und bezeichnet eine Speicherung von Halbbildern


im Faktor 10:1 nach MPEG-2 die abgetasteten Komponentensignale komprimiert. Das For- 

mat ist eine Weiterentwicklung von Betacam SP, dem heutzutage meistgenutzten analogen, 

professionellen 1/2 Zoll MAZ 4 -Format. 

• „DVCAM“ ist eine von Sony hergestellte professionelle Variante von DV (Digital Video). 

Die veränderten Merkmale, gegenüber dem im Amateurbereich eingesetzten Digital Video, 

sind die Spurbreite von 10 µm auf 15 µm und eine nahezu doppelte Bandgeschwindigkeit 

(2,8 cm/s gegenüber DV mit 1,9 cm/s), woraus eine verkürzte Kassettenlaufzeit resultiert 

aber auch eine geringere Fehlerquote auf den Bändern. Daraus ergibt sich, dass die gleichen 

Informationen auf ca. doppelt so viel Band geschrieben werden können. 

• „Digital Video Home System“ (kurz DVHS) ist ein Nachfolger von VHS 5 . Die Aufzeich- 

nung erfolgt digital im MPEG-2 Format auf einer DVHS Kassette welche 44,4 Gigabyte 

Daten speichern kann. Neben den üblichen Fernsehauflösungen NTSC und PAL beherrscht 

DVHS auch die Aufzeichnung von HDTV-Filmen. Das Format wurde 1997 von JVC in 

Zusammenarbeit mit Hitachi, Matsushita und Philips entwickelt. 

• „HDCAM“ wurde 1997 von Sony entwickelt und ist der HD-Nachfolger von Digital Be- 

tacam (Betacam SX). Das Format etablierte sich schnell und wird vor allem als Ersatz 

für 35mm Filme in Serien- und Kinoproduktionen eingesetzt. HDCAM Kameras zeichnen 

1920×1080 Pixel bei 24, 25, 30 und 100 Bildern/Sekunde auf. 

4.1.2 Synchronisierung der Kameras 

Die Synchronisierung der Kameras ist in Hinsicht auf die Weiterverarbeitung der digitalen Daten 

im Rechner und bei der Wiedergabe dieser wichtig, um unötigen Aufwand bei der Nachbearbei- 

tung der Bilddaten zu verhindern. Dies bedeutet, dass die Daten von Kameras, welche zum Bei- 

spiel nicht synchron gestartet wurden, im nachhinein bearbeitet werden müssen, um den exakten 

Startzeitpunkt für die Wiedergabe zu finden. Desweiteren führen Fertigungstoleranzen dazu, dass 

die kamerainternen Oszillatoren, welche für die Aufnahmegeschwindigkeit zuständig sind, leicht 

divergieren. Dadurch kommt es zu dem Effekt, dass die Kameras unterschiedlich viele Bilder in 

der gleichen Zeit aufnehmen. Diese Disparität S kann mit der nachstehenden Formel 4.1 berech- 

net werden. Hierbei seien: f1 die Frequenz der ersten Kamera und f2 die Frequenz der zweiten 

Kamera, t sei die Zeit in der die Kameras parallel laufen, und S0 die Differenz der Einschaltzeit- 

punkte. 

S = f1 − f2 

t + S0 

(4.1) 

f1 

Unter der Annahme, dass Kamera 1 mit 25,000 Hz und Kamera 2 mit 25,001 Hz läuft und beide 

exakt zeitgleich gestartet wurden, beträgt die Differenz beider Kameraoszillatoren nach einer Mi- 

nute 2,4 ms. Nach 17 Minuten würde demzufolge ein Unterschied von 40,8 ms auftreten, woraus 

man schließen kann, daß Kamera 2 ein Bild mehr aufgenommen hätte. 

Die Auswirkungen dieser Synchronisationsfehler stellen sich in diesem Fall so dar, dass bei der 

4 MAZ- Magnetische Aufzeichnung 

5 VHS- Video Home System


Nachbearbeitung immer auf Synchronität der Datenströme zu achten ist, da sonst gegebenenfalls 

Audiospuren nicht mehr synchron zum Video ablaufen und der Tiefeneindruck der Stereoprojek- 

tion verloren geht. 

Um dies zu vermeiden wird in Studio-Umgebungen das GENLOCK (Generator Locking) System 

einsetzt. 

4.1.2.1 Genlock 

Dieses System ermöglicht es Videosignalquellen durch einen äußeren Takt zu steuern. Ohne diese 

Synchronisation würde das Umschalten zwischen den Geräten zu einer kurzen Bildunstabilität 

führen, wie sie z.B. beim Umschalten eines Fernsehsenders auftritt. Der Fernseher benötigt hierbei 

eine geringe Zeit um sich auf die Frequenz des Videosignals einzustellen. 

Die vier Hauptaufgaben, die man mit dem Genlock-System erreichen kann sind: 

• vertikale Synchronisation, 

• horizontale Synchronisation, 

• Bildsynchronisation, 

• und Farbsynchronisation. 

4.1.2.2 LANC TM 

Ein weiteres System, welches zwar ursprünglich nicht zur Synchronisation, sondern vornehmlich 

zur Fernsteuerung von Kameras gedacht war, ist das LANC TM (auch „control L“ genannt) Pro- 

tokoll. Es handelt sich um ein von Sony entwickeltes Protokoll, welches den gleichnamigen An- 

schluss an Sony Kameras nutzt und zur kabelgebunden Kommunikation zwischen Fernbedienung 

und Kamera konzipiert ist. Einsatz findet es meist in Unterwassergehäusen oder an Helmkameras. 

Desweiteren existieren zusätzlich das Sony Infrared Remote Control System (SIRCS/CTRL-S), 

das die Funktion der Fernbedienung über Infrarot ermöglicht, und das S-LINK/CTRL-A(II) Sy- 

stem, das ein zweiadriges bidirektionales Bussystem darstellt, an das mehrere Geräte gleichzeitig 

angeschlossen sein können. 

Über die LANC TM Schnittstelle erhält der Camcorder Steuerbefehle und gibt Zählerstand, Lauf- 

werkstatus und andere Daten zurück [Boe07]. 

Alle Einstellungen der Firmware eines Camcorders, können durch Verändern von Informationen, 

welche auf 16 Seiten (0-F) im Speicher bestehend aus 256 Adressen (00-FF) mit 8-Bit Daten ab- 

gelegt werden, erreicht werden. Im Anhang auf Seite VIII in Tabelle A.1 sind die Parameter dieses 

Protokolls dargestellt. 

So kann bei Kameras, die diese Funktion unterstützen der interne Oszillator der Kamera und damit 

die Frequenz auf einer bestimmten Seite und Adresse abgefragt und teilweise eingestellt werden. 

Außerdem können „normale“ Ferndienungsbefehle an die Kamera gesendet werden, so beispiels- 

weise Signale zum Ein und Ausschalten, Zoom, Aufnahme und zur Veränderung der Fokussierung.


4.1.2.3 Control M 

Das „Control M“ Protokoll ist von Panasonic entwickelt worden und arbeitet prinzipiell nach dem 

gleichen Prinzip wie das LANC TM Protokoll. Trotzdem sind beide zueinander inkompatibel, da 

der Datensatz des „Control M“ Protokolls nicht alle Funktionen der Camcorder Firmware unter- 

stützt. Die Kommunikation mit der Kamera, welche bei „Control M“ über einen 5 poligen Stecker 

und beim „LANC TM “ über einen 2,5mm Klinkenstecker vollzogen wird, unterscheidet sich bis 

auf das Vorhandensein eines Anschlusses für Steuersignale zwischen der Fernbedienung und der 

Kamera, welche bei Panasonic nicht existieren. 

4.1.3 Anschlussmöglichkeit für Sensoren 

Die zu entwickelnde Stereovideokamera soll über eine Anschlussmöglichkeit für weitere Senso- 

ren verfügen. Vorstellbar sind hier Möglichkeiten zur Nutzung von GPS- oder Höhensensoren, 

Kompass oder Beschleunigungsmessern. 

Da es bei einer mobilen Kamera nicht empfehlenswert ist, einen PC mitzuführen, wäre die Mög- 

lichkeit, Daten in einen Audiokanal in Videobildern oder in das Kompressionsformat zu schreiben, 

neben der externen Speicherung direkt im Sensor, auf einem PDA oder Mobiltelefon, zu erwägen. 

Dabei hat die Speicherung im Aufnahmevideo den Vorteil, dass dieses ohne zusätzliche Bearbei- 

tung weitergegeben werden kann. Bei einer externen Speicherung müssen demgegenüber Video 

und Sensordaten stets nachträglich zusammengeführt werden. Dabei ergibt sich als weiteres Pro- 

blem, dass es sehr aufwendig ist, Video, Audio und Sensordaten zu synchronisieren. 

Die verschiedenen Varianten der Speicherung direkt im Aufnahmevideo werden nachfolgend kurz 

erläutert. 

4.1.3.1 Kodierung der Daten in einen Audiostrom 

In Abbildung 4.1 ist eine Möglichkeit ersichtlich, welche über einen sogenannten „Datenschuh“ 

die von einem GPS Sensor gelieferten Informationen und die Ausrichtung des Kompasses an einen 

digitalen Audiokanal der Kamera übergibt. Diese Daten werden anschließend nach der Übertra- 

gung auf einen Computer wieder entschlüsselt und können weiter verwendet werden. 

Wenn nach der Aufnahme die Audiospur abgespielt wird, erkennt man sehr große Ähnlichkeiten 

mit dem Geräusch, welches ein Modem zur Übertragung von Daten erzeugt. Auf diese Art und 

Weise können verschiedene Arten von Sensoren an den Kameras befestigt werden und ihre Daten 

in einen der Audiokanäle kodieren, welche in einem Nachbereitungsverfahren wieder dekodiert 

werden können. 

4.1.3.2 Kodierung der Daten in das Bild 

Bei dieser Methode werden, wie in Abbildung 4.2 gezeigt, Daten als „Bild im Bild“ dargestellt. 

Der Nachteil dieser Variante ist, daß diese Information ohne Bildverluste nicht wieder entfernt


Abbildung 4.1: VMS-X: Aufnahme der GPS Informationen durch einen „Active Interface 

Shoe R○ “ [RHS07] 

werden können und Videoinformationen „hinter“ der Schrift verloren gehen. Ebenfalls ist nach- 

trägliche Nutzung der Daten sehr kompliziert, da diese, wie erwähnt, als Bild im Bild gespeichert 

werden. Zur Auswertung dieser Daten müsste bei der vollautomatischen Nachbearbeitung eine 

Texterkennung erfolgen, welche sehr rechenintensiv ist. 

Abbildung 4.2: Model VED-M: Annotieren von Videobildern mit GPS Informationen [PS07] 

4.1.3.3 Kodierung der Daten in das Videoformat 

Bei der Kodierung in das Videoformat wird ausgenutzt, dass aktuelle Kameras das aufgenommene 

HD-Video nach der Aufnahme immer in verschiedene Codecs komprimieren. (vgl. Tabelle 4.1) 

Dabei kann beim MPEG-4 Containerformat, Teil 17 (nach ISO/IEC 14496-17 [ISO04]) das „Ti- 

med Text subtitle format“ genutzt werden. Dieses erlaubt im Gegensatz zum MPEG-2 oder MPEG-


1 Standard Untertitel als textbasierte Daten im Container zu speichern, anstatt diese in einer sepa- 

raten bildbasierten Datei abzulegen. 

Bei dieser Variante muss an dem zwischen der aufnehmenden und der speichernden Instanz lie- 

genden Komprimierungsalgorithmus angesetzt werden. Hierin liegt das Hauptproblem dieser Va- 

riante, dass eine Hardwareimplementierung des Algorithmus in einer Kamera nicht realisierbar 

ist. 

4.1.3.4 Aufnahme von Raumklang 

Für die Aufnahme von Raumklang wurde im Rahmen dieser Arbeit ein Aufnahmesystem ent- 

wickelt, welches über vier Kondensatormikrofone verfügt. Diese sind in einer Styroporschicht mit 

Akustikdämmung eingepasst wie in Abbildung 4.3 zu sehen ist. Dazu werden die Audiodaten des 

linken und rechten Kanals in den Stereo-Eingang der linken Kamera und die Informationen des 

vorderen und hinteren Mikrofons in die rechte Kamera eingespielt und im Audiokanal des Video- 

containerformates gespeichert. Bei der Übertragung der Daten auf einen PC können diese Daten 

wieder als Raumklang zusammengeführt werden. 

Abbildung 4.3: Vierkanal Surround Mikrofon (Eigenentwicklung) 

4.1.4 Abmaße der Kameras 

Um mit der Stereovideokamera Aufnahmen zu ermöglichen, welche einen kurzen Objektabstand 

benötigen, muss es möglich sein, die Stereobasis klein wählen zu können. Dazu wurden die in 

Tabelle 4.2 angegebenen Werte für Höhe, Breite und Länge gegeneinander verglichen. Wie in Ka- 

pitel 2.2.2 erklärt, beträgt die „normale“ Stereobasis ca. 6cm. Dieser Wert wird von den jeweili- 

gen Mittelpunkten der Kameraobjektive bestimmt. Ideal wäre also zwei Kameras deren Objektive 

einen kleinen Radius besitzen und die es ermöglicht die Objektive ohne Abstand nebeneinander 

zu montieren. Das heißt im weiteren sollten, sofern austauschbare Datenträger genutzt werden, die 

Wechselmedien von jeweils gegenübergesetzten Seiten, oder von oben / unten in den Camcorder 

eingelegt werden können.

4.2. GENUTZTE KAMERAS 55 

4.2 Genutzte Kameras 

Zu den erwähnten Kriterien sollte der Kostenfaktor noch hinzugezogen werden, da dieser bei der 

Anschaffung von zwei identischen Kameras einen wesentlichen Einfluss besitzt. Es können durch 

den Kauf zweier Kameras aus dem Consumer-Bereich Einsparungen getroffen werden, da diese 

zwar in Fertigung und Funktionen nicht den Ansprüchen von professionellen Kameras entspre- 

chen, jedoch der Aufgabenstellung dieser Arbeit durchaus gerecht werden. 

Professionelle Videokameralösungen wurden durch die erwähnten Kriterien fast alle ausgeschlos- 

sen, da zum einen der Preisfaktor und zum anderen die Abmaße dieser Systeme, auch unter den 

Vorteilen der höheren Funktionalität, besseren Verarbeitung und höheren Qualität, mit den am An- 

fang dieses Kapitels getroffenen Kriterien unvereinbar sind. Dies hat zur Auswirkung, dass eine 

Synchronisation über das Genlock System nicht realisiert werden konnte, da lediglich die profes- 

sionellen Kameras über eine solche Schnittstelle verfügen. Aus diesem Grund wurden Camcorder 

im semi-professionellen Bereich gesucht, wobei lediglich die Produkte von Sony über eine Mög- 

lichkeit der Synchronisierung über LANC TM verfügen. Die HDV-Kameras von Panasonic verfü- 

gen nicht über den in Kapitel 4.1.2.3 beschriebenen 5-Pin Anschluss. 

Zur Auswahl standen folgende Sony Camcorder: 

– mit Mini-DV/HDV Band Aufnahme: HDR-HC1, HDR-HC3, HDR-HC5, HDR-HC7, 

– mit Festplatten Aufnahme: HDR-SR1, 

– und mit DVD Aufnahme: HDR-UX1, UX3, UX7. 

Beim Vergleich der Camcorder wurden die am Anfang (siehe Kapitel 4.1) aufgezeigten Kriterien 

gegenüber den Kameras genauer verifiziert und vertieft. 

So wurde z.B. die Aufnahmedauer in HDV Auflösung als Kriterium hinzugezogen. Wie in Tabel- 

le 4.2 zu sehen besitzen nicht alle Kameras einen Mikrofonanschluss. Dieser ist jedoch für die 

Aufnahme von Surround Sound durch die Nutzung des selbst entwickelten kostengünstigen Mi- 

krofons, welches in Kapitel 4.1.3.4 beschrieben ist, notwendig. 

Des Weiteren ist das AVCHD Format sehr rechenintensiv. Laut der Bedienungsanleitung der Sony 

HDR-SR1 ist ein Pentium 4 mit mindestens 2,8 GHz für das Betrachten von High Definition 

Video im Advanced Video Codec die Mindestanforderung. Empfohlen wird ein Pentium 4 mit 

mindestens 3,6 Ghz oder ein Intel CoreDuo 1,66 Ghz. Zu beachten ist, dass diese Angaben für 

die Wiedergabe eines Videos gelten und nicht für eine Bearbeitung der aufgenommen Daten. Um 

diese Berechnungen in einer angenehmen Geschwindigkeit durchzuführen ist eine höhere Perfor- 

manz des Verarbeitungssystems notwendig. 

So kann es nicht als Vorteil angesehen werden, dass Videodaten nicht mehr von dem Camcorder 

überspielt werden müssen, wie es bei DV oder Mini-DV der Fall ist, sondern über einen USB2.0 

Anschluss kopiert werden können. Der Einsatz von Kameras mit der Möglichkeit auf DVDs auf- 

zunehmen empfiehlt sich ebenfalls nicht, da hier die begrenzte Aufnahmedauer in High Definition 

Video dem Einsatzgebiet der Stereoskopie nicht entsprechen. Weiterhin ist es mit den vorgestellten 

DVD-Rekordern nicht möglich einen Farbabgleich der Kameras zu realisieren.

4.2. GENUTZTE KAMERAS 56 

HDR- HDR- HDR- HDR- HDR- HDR- HDR- HDR- 

HC1 HC3 HC5 HC7 SR1 UX1 UX3 UX7 

Videoformate MiniDV / MiniDV / MiniDV / MiniDV / AVCHD AVCHD AVCHD AVCHD 

HDV HDV HDV HDV 

Aufzeichnungs- MiniDV/ MiniDV/ MiniDV/ MiniDV/ eingebaute MiniDVD/ MiniDVD/ MiniDVD/ 

medium HDV- HDV- HDV- HDV- Festplatte MiniDVD- MiniDVD- MiniDVD- 

Band Band Band Band 

DL 8cm DL 8cm DL 8cm 

Aufnahmedauer Sony Sony Sony Sony 30 GB MiniDVD- MiniDVD- MiniDVDvon 

High DVM 63 DVM 63 DVM 63 DVM 63 Festplatte DL, ca.30- DL, ca.30- DL, ca.30- 

Quality HDV HDV - HDV - HDV - HDV- - ca. vier Minuten Minuten Minuten 

auf Medium ca. 63 ca. 63 ca. 63 ca. 63 Stunden 

Minuten Minuten Minuten Minuten 

Video- HDV HDV HDV HDV AVCHD AVCHD AVCHD AVCHD 

auflösungen 1440×1080 1440×1080 1440×1080 1440×1080 1440×1080 1440×1080 1440×1080 1440×1080 

MiniDV MiniDV MiniDV MiniDV MPEG2 SD SD SD 

720×576 720×576 720×576 720×576 720×756 720×576 720×576 720×576 

Maximale 

Bitrate 

25 MBit/s 25 MBit/s 25 MBit/s 25 MBit/s 15 MBit/s 12 MBit/s 12 MBit/s 12 MBit/s 

Kompressions- DV DV DV DV MPEG2 MPEG4 MPEG4 MPEG4 

format MPEG2 MPEG2 MPEG2 MPEG2 MPEG4 

Bildstabilisator elektronisch elektronisch elektronisch optisch elektronisch elektronisch elektronisch optisch 

effektive Pixel 1.486.000 1.067.000 1.080.000 1.710.000 1.076.000 1.076.000 1.080.000 1.710.000 

4:3 Pixel Pixel Pixel Pixel Pixel Pixel Pixel Pixel 

effektive Pixel 1.983.000 1.434.000 1.434.000 2.280.000 1.434.000 1.434.000 1.430.000 2.280.000 

16:9 Pixel Pixel Pixel Pixel Pixel Pixel Pixel Pixel 

Minimale 

Shutterzeit 1 

10.000 automatisch automatisch automatisch 425 425 800 500 

t 

Schärfe 

regelbar 

Ja Ja Ja Ja Nein Nein Nein Nein 

Farbe regelbar Ja Ja Ja Ja Nein Nein Nein Nein 

HDMI Ausgang Nein Ja Ja Ja Ja Ja Ja Ja 

USB USB 1.1 USB 2.0 USB 2.0 USB 2.0 USB 2.0 USB 2.0 USB 2.0 USB 2.0 

Mikrofon/ 

Audio-In 

Miniklinke Nein Nein Miniklinke Miniklinke Miniklinke Nein Nein 

Kopfhörer Miniklinke Nein Miniklinke Miniklinke Miniklinke Miniklinke Nein Nein 

LANCTM Ja Ja Ja Ja Ja Ja Ja Ja 

Gewicht (mit 

Akku) 

780 g 600 g 600 g 550 g 740 g 740 g 740 g 650 g 

Höhe 71 mm 82 mm 82 mm 82 mm 78 mm 76 mm 87 mm 82 mm 

Breite 94 mm 78 mm 82 mm 82 mm 84 mm 89 mm 72 mm 82 mm 

Tiefe 188 mm 139 mm 134 mm 138 mm 165 mm 165 mm 142 mm 138 mm 

Manuelle 

Blende 

Ja Ja Ja Ja Ja Ja Nein Ja 

Focus- 

Umschalter 

Ja Ja Ja Ja Nein Nein Nein Nein 

Blende 

Feststellen 

Ja Nein Nein Nein Nein Nein Nein Nein 

Audioformate 2×48kHz 2×48kHz 2×48kHz 2×48kHz AC-3 Dol- AC-3 Dol- AC-3 Dol- AC-3 Dol- 

bei HD 16bit 16bit 16bit 16bit by Digital by Digital by Digital by Digital 

Aufnahme MPEG 1 MPEG 1 MPEG 1 MPEG 1 5.1 640 5.1 640 5.1 640 5.1 640 

kbit max. kbit max. kbit max. kbit max. 

Manuelle 

Audio 

Aussteuerung 

Ja Nein Nein Nein Nein Nein Nein Nein 

Tabelle 4.2: Vergleich von Sony Camcordern. 

Die Wahl fiel auf Kameras mit festplattenbasierter Aufnahme „Sony HDR-SR1“, da „HDR-HC3“ 

und „HDR-HC5“ keinen analogen Mikrofoneingang bieten. Gegenüber der „HDR-HC1“ über- 

zeugt diese Kamera durch ein geringeres Gewicht (beim Einsatz von 2 Kameras insgesamt 300 

Gramm), eine höhere Anzahl von effektiven Pixeln und ein durch ACVHD komprimiertes Bild, 

welches weniger Artefakte als MPEG-2 kodierte Daten aufweist.

4.3. BEFESTIGUNG ZUR AUFNAHME UND JUSTIERUNG VON ZWEI KAMERAS 57 

4.3 Befestigung zur Aufnahme und Justierung von zwei 

Kameras 

An die Befestigung der Kameras stellten sich folgende Anforderungen: 

• Die Kameras sollten genau justiert werden können 

• es soll möglich sein größere Stereobasen einzustellen (b0 > 7cm) 

• Möglichkeit der Einstellung der Konvergenz der Camcorder 

• weistestgehende Maximierung der Portabilität 

• Vorhandensein einer Reihe von Befestigungspunkten für weitere Sensoren, wie z.B. Mikro- 

fon oder GPS-Empfänger 

• Anschlussmöglichkeit für einen genormten Stativkopf 

Im Folgenden wird erläutert welche Lösungen im kommerziellen Bereich existieren und wie sich 

diese auf die Anforderungen bezogen eignen. Es wird eine selbstentwickelte Halterung vorgestellt 

und eine eigenentworfene Software zur Justierung und Messung vorgestellt. 

4.3.1 Existierende Halterungen 

Im Bereich der Stereofotografie existieren eine Reihe von Befestigungssystemen, welche kurz 

vorgestellt werden. 

• Heavy Duty Slide Bars [Pro07c] 

• Fixed - Twin Vertical Mount [Pro07b] 

• Adjustable - Twin Vertical Mount [Pro07a] 

• ste-fra R○ CAM (Abbildung 4.4) [Blo07] 

• Twin Camera Bar [PTJE07] 

• 3D Camera Slidebar [GMR07] 

• SpaceBar [Sta07] 

Die genannten Systeme bieten alle eine Befestigung zweier Kameras nebeneinander, wobei bei 

dem „Fixed - Twin Vertical Mount“ und der „3D Camera Slidebar“ die Kameras im Hochformat 

nebeneinander justiert werden. Die anderen Lösungen ermöglichen horizontale Ausrichtungen. 

Die Befestigung wird bei allen Halterungen durch Stativschrauben realisiert. Wie in Abbildung 

4.4 zu sehen ist, sind die meisten existierenden Halterungen nicht für einen portablen Einsatz kon- 

zipiert. 

Deswegen und um eine große Variabilität der Aufnahmesituationen zu begünstigen, wurde eine 

Halterung selbst entworfen, wobei Wert auf eine variable Stereobasis, die Montagemöglichkeit 

der Camcorder in vertikaler sowie horizontaler Lage und die Portabilität gelegt wurde. Diese Hal- 

terung ist in Abbildung 4.8 zu sehen.


4.3.2 Verwendete Halterung 

Abbildung 4.4: ste-fra R○ CAM: Halterung für 2 Kameras 

Die maximale Stereobasis der entwickelten Fassung ist durch die Portabilität begrenzt und wurde 

mit einem Bereich von 6 cm bis 60 cm so gewählt, dass nach Formel 4.2 Aufnahmen mit guter 

Tiefenwirkung bei einer Brennweite von 50 mm zwischen 0,5 und 1000 Meter möglich sind. 

b0 = d 

f · 

aN 

1 − aN 

aF 

Hierbei stellt b0 die Stereobasis, d die Deviation, f die Brennweite, aN den Abstand zum Nah- 

punkt und aF den Abstand zum Fernpunkt dar (vgl. [Her07]). 

Um Stereobasen unter 8,2 cm nutzen zu können, muss die linke Kamera um 90 Grad nach rechts 

und die rechte um -90 Grad nach links gedreht werden, sodaß die optischen Achsen genau ent- 

gegengesetzt stehen. Anschliessend wird eine prototypische Spiegelkonstruktion zwischen den 

Kameras eingesetzt, welche geringere Stereobasen ermöglicht. Die geringste Stereobasis, bei wel- 

cher Stereoteilbilder mit einer Auflösung von 1440×1080 Pixeln abgelichtet werden können, liegt 

bei minimaler Brennweite von 5,1mm, bei 6cm, begründet durch den Objektivdurchmesser von 3 

cm. Diese Justierung ist in Abbildung 4.6 schematisch dargestellt. Ein in dieser Konstellation auf- 

genommenes Stereobildpaar ist in Abbildung 4.7 dargestellt. 

Für diese Justierung der Kameras, ist es notwendig die Konvergenz sehr genau einstellen zu kön- 

nen. Deswegen wurde eine Halterung entworfen, welche einen Spielwinkel von maximal 20 ′ also 

0, 33 ◦ (nach [IG07]) aufweist. In Abbildung 4.5 ist dieser Halterungsenturf dargestellt. 

Diese Halterung würde eine sehr genaue Justierung der Stereovideokamera erlauben. Jedoch wie- 

gen die Winkelgetriebe je ca. 2,77kg was der Portabilität der Kamera entgegenspricht. Im Weiteren 

liegt der Preis der abgebildeten Teile der Halterung bei 1536,59 Euro. Aus diesen Gründen mus- 

ste eine Alternative gefunden werden, welche auf Kosten der Jusitierungsgenauigkeit über zwei 

Servomotoren verfügt. Diese Motoren wiegen je 146 Gramm, kosten zusammen 129,90 Euro und 

haben eine Winkelgenauigkeit von 0,85 Grad. 

Durch die elektronische Steuerung dieser Motoren ergibt sich wiederum der Vorteil, dass in even- 

(4.2)


Abbildung 4.5: Entwurf einer Kamerahalterung mit Winkelgetrieben. 

tuellen Erweiterungen der Stereovideokamera die Ansteuerung der Servos in Kombination mit 

der Fokusierungselektronik der Kameras geschehen kann, wodurch der menschliche Sehvorgang 

optimaler nachgebildet werden kann. 

b 0 

Kamera 1 Spiegel 

Kamera 2 

Abbildung 4.6: Schematische Darstellung der Justierung um Stereobasen unter 8,2 cm zu erreichen. 

Die Halterung ist in Abbildung 4.8 gezeigt. 

Des Weiteren verfügt die Halterung über zwei Griffe, welche einen sehr guten Umgang mit der 

Stereokamera ermöglichen sowie einen Gurt, der das Gewicht der Kamera gleichmäßig auf die 

Schultern des Nutzers verteilt. Sensoren sowie die Bedieneinheit sind gut erreichbar auf der Vor-


Abbildung 4.7: Abbildung eines Stereobildpaares mit einer Stereobasis von 6 cm. 

Abbildung 4.8: Halterung der Einzelkameras an der Stereokamera und Bedieneinheit 

derseite angeordnet. Über der Bedieneinheit befindet sich eine Wasserwaage, die eine genaue ho- 

rizontale Ausrichtung der Kamera ermöglicht. 

Als Erweiterung dieser Halterung wird die Benutzung einer sogenannten „Steadycam“, also ei- 

nem „tragbaren Schwebe-Kamera-Stabilisier-Systems“, empfohlen. Das Prinzip dieses Systems 

ist durch ein Gegengewicht, welches dem der Kameras entspricht und einem frei gelagerten Hand- 

griff, die Kameras „schwebend“ von eventuellem Zittern der kameranutzenden Person zu trennen.


4.3.3 Justierung der Stereokamera 

Es ist darauf zu achten, dass die Kameraachsen sich in der gleichen horizontalen Ebene befinden. 

Nach [Alb92] ist eine maximale Bildhöhendiffernenz von 1% zulässig. Diese kann durch Formel 

4.3 berechnet werden. 

αkipp = arctan( hSensor/100 

) (4.3) 

bKamera 

Nach dieser Formel ergibt sich für eine Sensorhöhe von 5,08mm und einer Stereobasis von 68,5mm 

ein maximaler Verkippungswinkel von ca. 0, 04 ◦ . Dies bedeutet, dass auf eine exakte horizontale 

Ausrichtung der Kamera geachtet werden muss. 

In dieser Formel ist, bKamera die Stereobasis, hSensor die Höhe des Bildsensors und αkipp der 

berechnete maximale Kippwinkel. Ein Kippen der einzelnen Kameras auf der Halterung ist aus 

Gründen der Stabilität nicht möglich. 

Zur exakt parallelen Justierung der Camcorder wurde eine Software entwickelt, welche auf einem 

Monitor oder der Stereoprojektionswand ein Linienraster erzeugt. Die Ausgabe des Programms ist 

in Abbildung 4.9 zu sehen. Als Eingabe wird die Stereobasis sowie entweder die Breite und Höhe 

oder die Länge der Bildschirmdiagonale in Zoll benötigt. 

Mit diesen Eingaben wird ein 10 mm Raster erzeugt, sowie zwei Kreuze, die im exakten Ab- 

stand der Stereobasis mittig dargestellt werden. Die Stereokamera wird nun vor diesem Rasterbild 

aufgestellt und so justiert, dass die Mittelpunkte der Kreuze bei jeder Brennweite, jeweils den 

Mittelpunkten der von den Kameras erfassten Bilder entsprechen. Ist dies der Fall und liegen die 

optischen Achsen in gleicher Höhe verlassen die Linien des jeweiligen Kreuzes das Bild in den 

„Ecken“ der Kamerasucher. 

Zusätzlich wird am linken und rechten Rand der Projektionsfläche ein 5 Pixel Raster erzeugt, 

welches dazu verwendet werden kann, um die Synchronität der Grafikkartenausgänge und der 

Camcorder zu testen. In Abbildung 4.10 ist eine Aufnahme zweier Monitore zu sehen, welche 

synchron angesteuert werden. 

Um dies durchzuführen wird das Programm ausgeführt, wärend die Ausgänge der Grafikkarte 

„geklont“ werden. Das bedeutet, dass auf beiden Ausgängen ein und dasselbe Bild ausgegeben 

wird. Als Ausgabemedium müssen nun zwei Röhrenmonitore oder -fernseher angeschlossen wer- 

den, um den technischen Bildaufbau, mittels Zeilensprung der Elektronenröhre, nutzen zu können. 

Nun kann das Bild der beiden Monitore mit einer Digitalkamera oder einem Camcorder abfoto- 

grafiert werden, wobei die Belichtungszeit der Aufnahme mindestens so groß wie das Doppelte 

der Frequenz der Monitore sein sollte. Empfohlen wird ein Wert von ca. vierfacher Frequenz. So 

sollte beispielsweise bei einem Fernseher mit 50 Hz die Belichtungszeit kleiner als 1 

200s sein. 

Genutzt wird der Effekt der „Balkenbildung“ beim Abfilmen der Röhrengeräte, da die Monitore 

sich auf die Frequenz der Grafikkarte einstellen. Sind die Ausgänge dieser Grafikkarte synchron,


Abbildung 4.9: Ausgabe des Justierungsprogrammes 

Abbildung 4.10: Anwendung des Tesprogramms um die synchronität der Grafikkartenausgänge 

zu testen. 

befinden sich die Grenzen der Balken auf gleicher Höhe im Bild. Falls Asynchronität besteht, sind 

die Balken auf unterschiedlichen Höhen zu sehen. Durch Zählen der Pixelstreifen kann mit Formel 

4.4 näherungsweise bestimmt werden, wie groß die Asynchonität ist.

4.4. FERNBEDIENUNG 63 

ta ≈ 

1 

f 

hm 

Hierbei ist ta die Zeitdifferenz der Bilder, f die Frequenz des Ausgabegerätes, hm die Anzahl ver- 

tikaler Bildpunkte und hz die Differenz der Balken in Pixeln. Allerdings muss beachtet werden, 

dass nur geringe Differenzen bestimmt werden können. Für den Fall von ta ≥ 1 

f 

falsche Ergebnisse. 6 

· hz 

(4.4) 

liefert Formel 4.4 

Sollte die Grafikkarte eine Differenz im Bildaufbau erzeugen, kann dies durch Einstellen des ver- 

tikalen Synchronisierungssignals Vsynch) behoben werden. Eventuell sollten Parameter der Auf- 

lösung und Bildwiederholrate gesenkt werden. 

Zur Messung der Synchronität der Kameras, kann dieser Aufbau ebenfalls genutzt werden. Wenn 

die Belichtungsdauer unter der Dauer eines Bildaufbauzykluses liegt ( 2 

f ), sind auf dem aufgenommenen 

Video schwarze Balken sichtbar. Sind beide Kameras synchonisiert, ist auf beiden 

Aufnahmen der Balken auf gleicher Höhe des Monitors sichtbar, ansonsten kann aus dem Hö- 

henunterschied der Balken auf die zeitlichen Differenz der Aufnahmezeitpunkte rückgerechnet 

werden. 

4.4 Fernbedienung 

Zur synchronen Bedienung der Kameras wurde eine Bedieneinheit benötigt. Die Kriterien, welche 

an die Funktionalität dieser Fernbedienung gestellt werden, sind nachfolgend aufgezählt. 

• Möglichkeit des parallelen Einschalten der Camcorder, um die internen Oszillatoren mög- 

lichst synchron betreiben zu können 

• ein halbbildgenaues Auslösen der Aufnahme und Wiedergabe um bei der Nachbearbeitung 

keine Kosten zur Behebung von Asynchronität aufwenden zu müssen und um die Fotofunk- 

tion der Kameras nutzen zu können, 

• die Bedienung von Fokussierung, Blenden und Zoom mittels der Fernsteuerung 

• Anzeige der Asynchronität (da es technisch nicht möglich ist, zwei getrennte Geräte 100% 

zu synchronisieren, sollten Unterschiede der „timing-signale“ visualisiert werden) 

Wie im Kapitel 4.1.2 beschrieben existieren mehrere Ansätze eine solche Fernbedienung zu reali- 

sieren. 

4.4.1 Existierende Bedieneinheiten 

Wie im Kapitel 4.2 beschrieben wird die Synchronisierung der Camcorder über das Sony LANC TM 

Protokoll angestrebt. 

6 Man kann annehmen, dass ein Versatz von mehr als einem Bild technisch nicht möglich ist, wodurch der Fall ta ≥ 1 

f 

nicht auftritt.


Abbildung 4.11: LANC Shepherd: Fernbedienung zur Steuerung zweier Kameras über das LANC 

Protokoll [Cro07] 

Produkte die dieses System unterstützen sind Folgende: 

• stefra R○ LANC [Die07], 

• LANC Shepherd [Cro07], 

• und 3D LANC Master [Vra06]. 

Bei allen Lösungen handelt es sich um kabelgebundene Fernbedienungen, die sich in ihren Funk- 

tionen ähneln. So bieten alle ein zeitgleiches Einschalten der Camcorder, paralleles Auslösen der 

Aufnahme und die Bedienung der Brennweitenveränderung. 

Besonderheiten von „stefra R○ LANC“ sind: 

• 8 Zoomgeschwindigkeiten mit sanftem Anfahren und Abbremsen 

• Autofocus ein/aus - Push Autofokus und Manueller Fokus 

• Modus-Wechsel zwischen Camcorder und Fotokamera 

• Zeitrafferaufnahme bei Nutzung der Fotofunktion 

„LANC Shepherd“ (Abbildung 4.11) hat folgende Funktionen: 

• Display zur Anzeige der Timingunterschiede in Millisekunden, 

• Einstellen der Belichtungszeit und eine sehr einfache Bedienung. 

„3D LANC Master“ bietet die umfangreichsten Funktionen, die alle vorher genannten einschlie- 

ßen. Desweiteren kann dieses Gerät die Synchronität bei älteren Camcordern im Betrieb beein- 

flussen. Das bedeutet, dass beim Betrieb bestimmter Sony Kameras mit diesem Controller die 

Möglichkeit besteht, die internen Oszillatoren zu beeinflussen, wodurch das Problem, dass die 

Oszillatoren nicht synchron arbeiten, umgangen werden kann.


Abbildung 4.12: 3DLANCMaster: selbst entwickelte Fernbedienung nach Anleitung von [Vra06] 

4.4.2 Verwendeter Controller 

Aus den im vorherigen Kapitel genannten Gründen sowie der Tatsache, dass „3D LANC Master“ 

[Vra06] ein Open Source Projekt, mit frei verfügbaren Bau- und Entwicklungsplänen sowie der 

Firmware als Quellcode darstellt und somit erhebliche Anschaffungskosten vermindert werden 

konnten, wurde diese Fernbedienung entwickelt. 

Dabei wurde in der Fakultätswerkstatt für Elektrotechnik eine Leiterplatte angefertigt und ansch- 

liessend bestückt. Die in Abbildung 4.12 dargestellte Fernbedienung wird über zwei Kabel mit 

2,5mm Klinkensteckern mit den Kameras verbunden. 

Der Funktionsumfang der Fernbedienung umfasst für beide Kameras folgende Eigenschaften: 

• Veränderung der Brennweite 

• synchrones Auslösen der Foto- und Videoaufnahme 

• anzeigen der zeitlichen Differenz beider Camcorder in µ Sekunden 

• anzeigen einer empfohlenen Belichtungszeit in 1 

s 

• synchrones Ein- und Ausschalten der Kameras 

• Veränderung der Fokussierung 

• Anzeige des Batteriestandes der Fernbedienung 

Da die Ansteuerung der Stellmotoren für Zoom und Fokus nicht in der Lage sind Werte wie weit 

fokussiert oder gezoomt werden soll zu verarbeiten, können diese lediglich synchron gestartet und 

gestoppt werden. Durch Fabrikationstoleranzen tritt allerdings der Fall auf, dass bei zeitlich gleich 

langer Aktivierung dieser Motoren ein unterschiedlicher Endwert auftritt. Daher sollten für den 

Fall, dass manuell fokussiert oder die Brennweite verändert wird, diese Motoren immer wieder in 

Grundposition gebracht werden. So kann verhindert werden, dass die erwähnten geringen Fehler 

sich summieren und erheblicher Aufwand bei der Nachbearbeitung, oder im schlimmsten Fall bei


schlecht fokussierten Aufnahmen der Totalausfall der Aufnahme vermieden wird. 

Zusätzlich ist es möglich die Fernbedienung an den seriellen Port eines PC anzuschließen, wobei 

einerseits eine zeitliche Differenz beider Camcorder grafisch dargestellt werden kann. Anderer- 

seits können interne Einstellungen der Fernbedienung und der Kameras verändert werden. Die 

Veränderung von Kameraparametern wird nicht empfohlen, da dadurch die Funktion der Camcor- 

der nichtmehr sichergestellt werden kann. Dieser Fall kann auftreten, da bei jedem Einschalten 

einer Kamera, diese einen Hashwert 7 über der internen Firmware bildet, und somit Veränderun- 

gen erkennt. Wird solch eine Änderung erkannt, symbolisiert die Kamera dieses durch die Anzeige 

eines Fehlercodes und stellt ihre Funktion ein, was eine Reparatur des Camcorders in einer Ser- 

vicezentrale erforderlich macht. 

Zur Änderung von Fernbedienungsparametern solle die im Anhang auf Seite VIII abgedruckte 

Tabelle mit Parametern des LANC R○ Protokoll hinzugezogen werden. So kann über die Software 

„3D LANC Communicator“, welche sich auf der, der Arbeit beiliegenden CD befindet, die Dauer 

des Einschaltimpulses, eine Verzögerung des Einschaltimpulses, die Zoomgeschwindigkeit und 

die Dauer des Ausschaltimpulses verändert werden. Das verzögerte Einschalten übernimmt die 

Funktion der korrektur von Asynchronitäten der Kameras durch verzögertes Einschalten. 

Es besteht ebenfalls die Möglichkeit die Fernbedienung mit eigenen Kommandos zu program- 

mieren. Dazu müssen Steuerbefehle die in Tabelle A.1 ersichtlich sind, auf die Variablen „Com- 

mand[X]: Camcorder“, {X | 1,2,3,4}, geschrieben werden. 

Eine Änderung des Quellcodes der Fernbedienung ist möglich, wird aber aus dem oben beschrie- 

ben Grund, der Änderung von Firmwareparametern, nicht empfohlen. Dazu muss das Gehäuse der 

Fernsteuerung geöffnet werden und über ein Programmierinterface, das an der Fernsteuerungs- 

platine angebracht wird, kann der Mikroprozessor durch eine Programmierschnittstelle, die im 

Anhang auf Seite IV in Kapitel A.1.4.1 beschrieben wird, überschrieben werden. 

4.4.3 Messung der Synchonität 

Die entwickelte Fernbedienung unterstützt die Funktion, über eine Nullmodemverbindung mit ei- 

nem Computer Daten über die Synchronität der Einzelkameras auszuwerten. 

Für die genutzten Kameras ist in Abbildung 4.13 ein Diagramm zu sehen, bei welchem die Or- 

dinate den Differenzwert der timing Signale beider Kameras in Mikrosekunden und die Abszisse 

die Zeitachse in Sekunden darstellt. 

1 

Hier ist zu sehen, dass ein zeitlicher Versatz von 3600 µ-Sekunden (0,0036s = 277,78s) nach 3000 

Sekunden (50 Minuten) auftritt. 

Da die Aufnahmedauer maximal 1 

50 Sekunden bei Aufnahme im Format „HDV-1080 50i“ beträgt, 

ist dieser Wert bei der Aufnahme von langsamen Bewegungen akzeptabel, da bei einer Belichtungszeit 

von 1 

60 Sekunden, also einer Zeitspanne von 0,016s, beide Bilder bei der Differenz (+/- 

7 Eine Hash-Funktion erzeugt zu einer großen Eingabemenge eine kleine Zielmenge.

4.5. GPS-EMPFÄNGER 67 

Abbildung 4.13: Diagramm des zeitlichen Verlaufs der Synchronität beider Camcorder. Die X- 

Achse stellt die abgelaufene Zeit in Sekunden und die Y-Achse die Differenz der 

Timingsignale zwischen den Camcordern in µ-Sekunden dar. 

0,0036s) innerhalb dieser liegen und somit die Bildinformationen in beiden Bildern zu finden sind. 

Im Weiteren ist bei der Nutzung der Standardstromversorgung der Camcorder (Akkumulator vom 

Typ „Sony NP-FM50“ mit 1180 mAh) die Kapazität bei ausgeklapptem Bildschirm nach ca. einer 

Stunde so startk verringert, dass der Camcorder seine Funktion einstellt. Aus diesem Grund wurde 

die Messung nach 70 Minuten gestoppt. Einige Werte der Messung sind im Anhang auf Seite VIII 

in Tabelle A.2 dargestellt. 

4.5 GPS-Empfänger 

Um Sensordaten synchron in einem Stereo-Video unterzubringen, wurden Lösungen gesucht, wel- 

che: 

• die Daten, entweder in einem MPEG-4 Standard, z.B. dem „Timed Text subtitle format“ 

oder in einem Audiokanal des Videos speichern und es ermöglichen 

• die Daten den Einzelbildern des Filmes zuzuordnen und nachträglich zu verarbeiten. 

Wie in Kapitel 4.1.3 beschrieben existieren verschiedene Varianten der Speicherung von Daten. 

Begründet dadurch, dass eine Kodierung in das Videobild unerwünscht ist und die Kodierung in 

das MPEG Format technisch nicht möglich ist, wurde die Kodierung in einen Audiokanal der 

Kamera genutzt. Da durch diese Nutzung ein für Audiodaten nutzbarer Kanal der beiden Kame- 

ras wegfällt, kann das 4 Kanal Surround Mirkofon bei Anschluss eines Sensors nicht mehr voll 

genutzt werden. Um diesen Nachteil zu beheben kann in späteren Arbeiten ein Verfahren der En- 

kodierung von Audio und Sensordaten in einen Kanal geschaffen werden oder die Nutzung eines 

digitalen „Daten-Schuh“ (vgl. Kapitel 4.1.3.1) erwogen werden. 

Ein System, welches GPS-Daten in einen Audiokanal kodieren kann, ist in Abbildung 4.1 zu se- 

hen. Allerdings ist die gezeigte Lösung „VMS-X“ nur in der Lage GPS-Daten von einer begrenz- 

ten Anzahl von GPS-Empfangsgeräten zu verarbeiten, weswegen die nachfolgend beschriebene

4.6. KAMERAPARAMETER 68 

Variante zur Anwendung kommt. 

Um nicht „Global Positioning“ Daten als alleinige Sensorinformationen nutzen zu können, wurde 

eine Lösung gesucht, welche jegliche Art serieller Daten in einen Audiokanal kodieren kann. Zur 

Bewältigung dieses Problems fand sich im Amateurfunk eine Lösung, welche genutzt wird um 

serielle Daten ohne Verbindungsaufbau über vorhandene Funksysteme zu senden. Dieses System 

ist weitläufig als „Packet Radio“ bekannt. Dabei werden digitale Informationen in kleine Pakete 

aufgeteilt und über handelsübliche UKW-Funkgeräte ausgesandt. 

Die Kodierung der Daten übernimmt ein Mikroprozessor, der eingehende Daten ähnlich eines 

DTMF-Modulators 8 in verschiedene Frequenzen übersetzt. Von diesem können Daten mit 4800 

Baud verarbeitet werden. In Abbildung 4.14 ist dieser Übersetzer in montierter Form zu sehen. 

Abbildung 4.14: TinyTrak3: Konverter zur Transformation serieller Daten in Audiodaten. 

Dieser Aufbau ermöglicht den Anschluss jeglicher Sensorik, welche serielle Daten ausgibt. Der in 

dieser Arbeit genutzte GPS-Empfänger (siehe Abbildung 4.15) liefert Daten in dieser Form. Da- 

bei werden genormte „NMEA 9 “ Daten vom Empfänger an den Mikrochip übergeben und von die- 

sem umgewandelt. Die Dekodierung erfolgt indem ein Soundkartenmodem installiert wird. Dieses 

kann die Audiodaten direkt aus der Audiodatei oder über die Soundkarte des PC dekodieren und 

an eine Anwendung als serielle Daten weitergeben. In weiteren Arbeiten kann eine Möglichkeit 

geschaffen werden diese Daten bei der Videonachbearbeitung direkt zu verarbeiten. 

4.6 Kameraparameter 

Zur weiteren Verarbeitung der Kameradaten, sind Kalibrierungsgrößen von Interesse, die hier dar- 

gestellt werden. Es werden die Abbildungseigenschaften der Kameras und die internen und exter- 

8 

DTMF-Modulatoren finden meist Anwendung in Telefonen zur Realisierung des Tonwahlverfahrens/Mehrfrequenzwahlverfahren. 

9 

Der NMEA Standard spezifiziert Übertragungsrichtlinien. Hauptanwendung ist die Weitergabe von Positionsdaten.


Abbildung 4.15: GPS-Maus: serieller Global Positioning System Empfänger. 

nen Parameter bestimmt. 

Externe Parameter geben die Lage der Kamera bezüglich eines globalen Koordinatensystems an, 

wohingegen interne Parameter die Abbildung der Weltkoordinatenpunkte vom lokalen Kamerako- 

ordinatensystem in das Bild beschreiben. 

4.6.1 Interne Parameter 

Die internen Parameter der Kamera: 

• die Brennweite f, 

• der Hauptpunkt px, py(Punkt auf dem Bildsensor welcher auf der optischen Achse der Ka- 

mera liegt) 

• die Kippung s0 (Der Winkel zwischen den Achsen der Pixel in X und Y Richtung. Dieser 

ist durch die industrielle Fertigung von CCD oder CMOS Sensoren gleich Null) 

• die Verzerrungen (radiale und tangentiale) 

• ein Pixelfehler (der Fehler zwischen homogenen Pixelkoordinaten) 

Diese inneren Parameter lassen sich nach Formel 4.5 bestimmen. 

⎛ ⎞ 

⎛ ⎞ ⎡ 

⎤ XK 

˜x fx s0 px 0 ⎜ ⎟ 

⎜ ⎟ ⎢ 

⎥ ⎜YK 

⎟ 

⎝ ˜y ⎠ = ⎣ 0 fy py 0⎦ 

· ⎜ ⎟ 

⎜ ⎟ 

⎝ZK 

⎠ 

˜w 0 0 1 0 

1 

, xb = ˜x 

˜w , yb = ˜y 

˜w 

(4.5)


Diese Formel wird durch den in Verhältnis 4.6 gezeigten Strahlensatz gebildet, welcher den drei- 

dimensionalen Punkt (XK, YK, ZK) T im Kamerakoordinatensystem in den Bildpunkt (xb, yb) T 

transformiert: 

YK 

ZK 

XK 

ZK 

= yb 

fk 

= xb 

fk 

Da der Mittelpunkt des Bildkoordinatensystems, der Punkt in welchem die optische Achse senk- 

recht auf der Bildebene steht, in Pixelkoordinaten nicht bei (0, 0) T liegt, werden in Formel 4.5 

die Verschiebung des sogenannten Hauptpunktes um px und py eingeführt. Die zwei Brennweiten 

fx und fy können durch die Kamerabrennweite fk und das Seitenverhältnis des aufgenommenen 

Bildes ersetzt werden. 

In Abbildung 4.16 ist die Kalibrieriung nach [Zha98] für eine der beiden Einzelkameras des Ste- 

reosystems dargestellt. 

Abbildung 4.16: Kamerakalibrierung nach [Zha98] der linken Kamera des Stereosystems für die 

geringste Brennweite. 

Es wurden aus einem Video 12 Bilder extrahiert, auf denen das abgebildete Schachbrettmuster in 

verschiedenen Winkeln zu sehen ist. Aus diesen ergaben sich für die Matrix in Formel 4.5: 

• fx - 1675.564 

• fy - 2435.8177 

• s0 - 4.51 

• px - 726.42 

(4.6) 

(4.7)


• py - 620.15 

Wenn diese Werte interpretiert werden, ist zu erkennen, dass der Hauptpunkt der Kamera nicht ge- 

nau in der Mitte des Sensors bei pm(x, y) = p(720, 540), sondern bei pH(x, y) = p ′ (726.42, 620.15) 

zu finden ist. 

Der Wert für s0, die Verdrehung der Ordinate gegen die Abszisse, berechnet sich zu vier Grad, 

was technisch nicht möglich ist, da bei der industriellen Fertigung von Bildsensoren keine solche 

Verdrehung auftritt. Diese Fehlberechnung tritt auf, da sich das Verfahren nach [Zha98] iterativ 

an die korrekten Werte annähert. Im Weiteren kann nicht exakt bestimmt werden, ob das zur Be- 

rechnung genutzte Muster in den Bilddaten in ausreichend verschiedenen Positionen abgelichtet 

wurde. 

Die Brennweiten in X und Y Richtung ergeben ein Seitenverhältnis, welches mit ca. 13 : 9 zwi- 

schen dem 16 : 9 und 4 : 3 Format liegt. Dies ist der Fall, da im Breitbildformat 16 : 9 aufgenom- 

men wird, allerdings mit einer geringeren Auflösung in horizontaler Richtung als in vertikaler. Da 

die Kameras Videobilder mit 1440 × 1080 Bildpunkten im 16 : 9 Format speichern, kommt es zu 

diesem Format. 

Die in Abbildung 4.16 dargestellten Werte für k0 und k1 können genutzt werden, um Parameter 

der radialen und tangentialen Bildverzerrungen, welche durch die Linsen im Objektiv entstehen 

können, zu berechnen. 

4.6.2 Externe Parameter 

Zur Kalibrierung der Kamera werden Werte benötigt, von denen sowohl die dreidimensionalen als 

auch die zweidimensionalen Koordinaten bekannt sind. Somit gehört zu einer Kamerakalibrierung 

die Transformation zwischen dem Kamerakoordinatensystem und dem in Weltkoordinaten befind- 

lichen Kalibrierkörper. 

Die externen Kameraparamter sind: 

• die drei Rotationen Rx, Ry, Rz zwischen den Weltkoordinaten und dem Kamerakoordina- 

tensystem, 

• und die drei Translationen Tx, Ty, Tz zur Transformation der Weltkoordinaten in das Kame- 

rakoordinatensystem. 

In homogenen Koordinaten ist die Beziehung zwischen Weltkoordinaten (X, Y, Z) und den Koor- 

dinaten im Kamerasystem durch: 

⎛ ⎞ ⎛ ⎞ ⎛ 

XK 

˜ 

X − Xc 

⎜ 

⎝ ˜ ⎟ ⎜ ⎟ ⎜ 

⎠ = R · ⎝ Y − Yc ⎠ , C = ⎝ 

Z − Zc 

YK 

˜ 

ZK 

Xc 

Yc 

Zc 

⎞ 

⎟ 

⎠ (4.8)


gegeben. Gleichung 4.5 erweitert sich damit zu: 

⎛ ⎞ ⎡ 

˜x fx 

⎜ ⎟ ⎢ 

⎝ ˜y ⎠ = ⎣ 0 

˜w 0 

0 

fy 

0 

px 

py 

1 

⎛ ⎞ 

⎤ 

X 

0 

⎜ ⎟ 

⎥ 

⎜ 

0⎦ 

· R[I − C] ⎜ 

Y ⎟ 

⎜ 

⎝Z 

⎟ 

⎠ 

0 

1 

Wobei I die 3 × 3 Einheitsmatrix, R ∈ SO3 die Rotationsmatrix und C das Zentrum, genauer den 

Mittelpunkt des Aufnahmesensors, darstellt. 

In Abbildung 4.17 sind alle bei der Abbildung beteiligten Koordinatensysteme dargestellt. 

Z 

K 

C 

R,t 

X 

K 

zi 

xi 

y 

b 

x b 

f 

p 

Z 

Abbildung 4.17: Koordinatensysteme bei der Abbildung nach [Som05] 

4.6.3 Stereokalibrierung 

Zur Kalibrierung der einzelnen Camcorder der Stereokamera wird das Verfahren von Zhang [Zha98] 

verwendet, welches in der „Open Computer Vision Library“ [Int06] als Implementierung zur Ver- 

fügung steht. Dabei wird als Kalibriermuster eine Ebene verwendet, welche in mehreren Ori- 

entierungen aufgenommen wird. Auf dieser Ebene ist ein Schachbrettmuster angebracht, dessen 

Kreuzungspunkte detektiert und in eine Reihenfolge gebracht werden, sodaß die 3D Koordina- 

ten einfach zugewiesen werden können. Für eine genauere Beschreibung des Verfahrens sei auf 

[Zha98] verwiesen. 

Z 

Y 

K 

X 

(4.9)


Abbildung 4.18: Kalibrierungsaufnahme mit Schachbrettmuster einer Einzelkamera des Stereosystems. 

Bei der Kamerakalibrierung liegt das globale Koordinatensystem für jedes aufgenommene Bild in 

einer Ecke des Kalibriermusters (Schachbrettmuster). Dies ist für den Einsatz bei Stereokameras 

ungünstig, da in diesem Fall nur die Beschreibung der Transformation zwischen den einzelnen 

Kamerabildern von Relevanz ist. 

Bei dem in [Mü02] verwendeten Verfahren wird deswegen das globale Koordinatensystem so 

transformiert, dass es mit dem Kamerakoordinatensystem einer Kamera übereinstimmt. Ist dies 

der Fall entsprechen die externen Parameter der jeweils anderen Kamera der Transformation zwi- 

schen beiden Kameras. 

Wird die linke Kamera als Bezugssystem gewählt ergibt sich die Transformation wie in Abbildung 

4.19 gezeigt zu: 

X ′ = RLX + tL 

(4.10) 

Das transformierte Koordinatensystem der linken Kamera X ′ berechnet sich durch Rotation RL 

und Translation tL aus dem ermittelten globalen Koordinatensystem. Dadurch ergeben sich für die 

Kamerakoordinaten: 

XL = KL(RLX + tL) (4.11) 

= KLX ′ 

(4.12)


R , t 

L0 L0 

R , t 

L1 L1 

R , t 

R0 R0 

X X 

R , t 

R1 R1 

R , t 

L1 L1 

R , t 

L0 L0 

R , t 

RL RL 

Abbildung 4.19: Transformation des globalen Koordinatensystems in das Koordinatensystem der 

linken Kamera (nach [Mü02]) 

und 

XR = KR(RRX + tR) (4.13) 

= KR(RRR −1 

L (X′ − tl) + tR) (4.14) 

= KR(RRR −1 

L X′ + tR − RRR −1 

L tL) (4.15) 

Die daraus ableitbare Rotation und Translation zwischen den Kameras ist: 

RRL = RRR −1 

L 

tRL = tR − RRR −1 

L tL 

(4.16) 

(4.17) 

Da sich die gemessenen Werte von Bildpaar zu Bildpaar aufgrund der Auflösungseinschränkung 10 

leicht unterscheiden, sollten sie aus mehreren Paaren gemittelt werden. Dabei können die Trans- 

lationsvektoren komponentenweise gemittelt werden. Von Rotationsmatrizen kann kein Mittel ge- 

bildet werden, weshalb die minimalen Parameter, also die Vektoren für X−, Y − und Z−Richtung 

gemittelt und anschliessend wieder in Matrizenform gebracht werden müssen. 

Im einzelnen erfolgt die Stereokalibrierung nach [Mü02] in folgenden Schritten: 

1. Aufnahme von n Stereobildern 

2. Getrennte Kalibrierung der linken und rechten Kamera mit dem Algorithmus nach [Zha98] 

3. Bestimmung der Transformation zwischen den einzelnen Kameras der Stereokamera 

10 Auflösungseinschränkung bedeutet, dass Aufgrund von Pixelgröße und Anzahl der Pixel keine genauen Messungen 

im Bild erfolgen können.


4. Optimierung über alle Parameter der Kalibrierung mit Hilfe eines linearen Fehlerminimierungs- 

algorithmus aufgrund der Auflösungsbeschränkungen 

5. Ausgabe der Kalibrierungsmatrizen der Kamera 

4.6.4 Selbstkalibrierung von Stereokameras 

Bei der Selbstkalibrierung wird eine Kamera ohne Objektrauminformationen (im vorangestellten 

Unterkapitel stellte dies das Schachbrett dar) kalibriert. Dazu können werden unter der Annahme, 

dass sich es sich bei den zwei Aufnahmen eines Stereobildpaares um Bilder handelt, welche mit 

identischen Kameras und weiter mit identischen Kameraparametern aufgenommen sind, korre- 

spondierende Bildpunkte gesucht und weiterverarbeitet. 

Da es sehr kompliziert und umständlich sein kann, korrespondierende Bildpunkte zu finden, ohne 

diese zu markieren, setzt [AP95] darauf, einen bewegten Punkt in einer Stereoszenerie zu erfassen 

und diesen bei seiner Bewegung durch das Stereobildpaar zu verfolgen. Dadurch können alle ge- 

forderten Parameter durch eine Schnittpunktanalyse der Strahlenschnitte generiert werden. 

Diese Variante der Kalibrierung ist somit nur für Situationen einsetzbar, in denen erfassbare Be- 

wegungen ablaufen. Da in dieser Arbeit der Konvergenzwinkel bestimmbar und die Änderung des 

Konvergenzwinkels wärhend der Aufnahme möglich ist wird diese Art der Kalibrierung in dieser 

Diplomarbeit nicht genutzt, da die Kalibrierung der Einzelkameras nach [Zha98] sehr rechenin- 

tensiv ist. Die Änderung des Konvergenzwinkels bei der Aufnahme von Stereovideos kann durch 

diese Kalibrierung nicht in Echtzeit erfolgen, weswegen diese Methode nicht angewendet wurde.

5 Datenverarbeitung 

In diesem Kapitel wird auf Techniken und Algorithmen der Datenverarbeitung von Stereovideos 

eingegangen und es werden diese erläutert. Es werden Implementationen der notwendigen Trans- 

formationen, wie in Kapitel 2.3.1 beschrieben, erläutert und genauer auf die Videobearbeitung im 

Betriebsystem Windows eingegangen. 

Unter Windows existieren aktuell zwei Programmierschnittstellen um Video zu bearbeiten. Diese 

sind „Video for Windows“ (VfW) und „DirectShow“ (auch DShow). 

Video for Windows ist eine Programmierschnittstelle, welche es erlaubt Videosignale zu ko- 

dieren und zu dekodieren, sowie Daten von Aufnahmegeräten einzulesen [Wik07a]. Diese Schnitt- 

stelle wurde Anfang der 90’er Jahre entwickelt und ist somit relativ alt. Sie wird, auch da die 

Anbindung an Aufnahmegeräte immer mehr durch WDM-Treiber geregelt wird, von der neueren 

DirectShow API abgelöst. Die VfW-Schnittstelle verfügt über keine Pufferung der Daten und kei- 

ner Synchronisation zwischen Audio- und Videodaten, was zu einer ruckelnden Wiedergabe und 

Jitter 1 führt. 

DirectShow ist eine Schnittstelle über welche Audio und Video Daten Verarbeitet werden kön- 

nen. Diese wurde ursprünglich als „ActiveMovie“ und später über „DirectX“ vertrieben, wobei es 

sich um eine Sammlung von Schnittstellen handelt, die für multimediaintensive Anwendungen 

entwickelt wurden. Mittlerweile ist DirectShow Bestandteil der „Windows Platform-SDK“ und 

verdrängt immer mehr die VfW-Schnittstelle. 

5.1 DirectShow 

DirectShow ersetzt, wie beschrieben, die ältere „Video for Windows“ Schnittstelle und basiert auf 

dem Component Object Model (COM). Basierend auf Filtern können über diese API Mediendaten 

verarbeitet werden. Das Pendant von DirectShow für MacOS ist Apple’s QuickTime. 

Durch auf Filtern basierende Architektur ist es möglich Graphen zu erstellen, bei denen Filter 

die Position von Transitionen einnehmen. Es kann also ähnlich der Modellierung mit Petrinetzen 

1 Jitter (engl. „Fluktuation“ oder „Schwankung“) durch Ungenauigkeiten in der synchronen Abtastung von Signalen 

entstehende Schwankung der Signalamplitude. 

76

5.1. DIRECTSHOW 77 

ein Abarbeitungsworkflow erstellt werden. In Abbildung 5.1 ist solch ein Graph dargestellt, der 

eine Mediendatei als Eingabe nutzt. Diese Eingabe, ebenfalls als DirectShow Filter implementiert, 

öffnet die Datei und übergibt deren Inhalt an den nächstfolgenden Filter. 

Abbildung 5.1: Darstellung eines DirectShow Filtergraphen im Programm Graphedit. 

In diesem Beispiel nimmt der „AVI Splitter“ Filter die Daten entgegen und trennt den Bildinforma- 

tionsstrom vom Audiostrom. Die Bildinformationen werden daraufhin von einem Filter dekodiert, 

nachfolgend in ein Anaglyphenbild umgewandelt und nach Konvertierung in die aktuelle Farbqua- 

lität der Windowsoberfläche von einem Render Filter ausgegeben. Der Audiostrom wird ebenfalls 

dekodiert und an die Soundkarte übergeben. 

Wie in Abbildung 5.1 zu sehen ist, besitzen Filter sogenannte Pins, welche zur Ein- und Ausgabe 

der Daten genutzt werden. 

Es existieren grundsätzlich drei Arten von DirectShow Filtern: 

1. Quellfilter 

2. Verarbeitungsfilter 

3. Ausgabefilter 

Quellfilter besitzen einen oder mehrere Ausgabepins, aber keinen Eingabepin. Sie werden genutzt, 

um Daten von Medienquellen zu beziehen, wie z.B. einer TV-Karte, einer Videodatei, eines Stre- 

ams über das Internet, oder sie generieren einen Medienstrom, wie z.B. ein Visualisierungsfilter, 

welcher Farbsignale generiert. 

Verarbeitungsfilter besitzen sowohl Eingabe- wie auch Ausgabepins. Ihre Aufgabe ist es, Daten zu 

manipulieren, zu teilen oder zusammenzuführen und diese anschließend weiterzugeben. 

Ausgabefilter besitzen einen oder mehrere Eingabe- aber keine Ausgabepins, da ihre Hauptaufga- 

be darin besteht, Daten an Hardware, wie z.B. die Grafikkarte, die Soundkarte oder die Festplatte 

weiterzuleiten.


Um Filter in einer Anwendung nutzen zu können existiert der „Filtergraph Manager“. Diese Struk- 

tur kontrolliert den Datenfluss und fügt, falls benötigt, automatisch passende Filter ein. Dabei 

werden installierte Filter anhand ihrer Ein- und Ausgabepins, welche akzeptierte Datentypen spe- 

zifizieren, gesucht und eingefügt. 

Dieser Filtergraph Manager bietet nach außen hin die zwei Interfaces „IMediaControl“ und „IMe- 

diaSeeking“, zum Steuern des Medienstroms (Start, Stop, Pause, an Punkt springen, ...). 

Die eigentlichen Mediendaten werden dabei durch „IMediaSample“ referenziert, welches einen 

Pointer zum Speicherbereich der Mediendaten darstellt und Informationen zu diesen Daten ent- 

hält. Dieses Sample wird durch den Filtergraphen „gereicht“, was im weiteren bedeutet, dass die 

Daten in ihrem Speicherbereich verbleiben und so ein unnötiges und zeitaufwendiges Kopieren 

vermieden werden kann. 

Wenn sich zwei Filter, das heisst der Ausgabepin des vorgeschalteten und ein Eingabepin des nach- 

geschalteten Filters, verbinden, tauschen die Pins der beiden Filter die unterstützten Medientypen 

über eine „AM_MEDIA_TYPE“ Struktur aus. Diese Typen sind in Klassen eingeteilt, so zum 

Beispiel Video oder Audio. Diese Klassen auch „major media type“ genannt besitzen Unterklas- 

sen, die „sub media types“ genannt werden, wie z.B. bei der Oberklasse Video, RGB-8, RGB-24, 

RGB-32, YVUV. So kann genau spezifiziert werden, welches Ein und Ausgabeformat ein Filter 

unterstützt. Das Medientypenkonstrukt besitzt im Weiteren Informationen über die Kompression, 

die Größe eines Mediensamples, den Typ der Medien (z.B. DVINFO oder MPEG2), sowie einen 

Zeiger auf den Speicherbereich der Mediendaten. 

Wenn eine Verbindung aufgebaut werden soll, listet ein Pin seine bevorzugten Medientypen auf 

und fordert die Typen des anderen Pins an. Mit diesen Informationen wird versucht eine Verbin- 

dung aufzubauen. Dabei können auch Verbindungen aufgebaut werden, die nicht auf den bevor- 

zugten Medienypen basieren. 

In Abbildung 5.2 sind alle am Medientypenaustausch beteiligten Objekte dargestellt. 

Der Datentransport zwischen DirectShow Filtern kann auf zwei verschiedene Arten durchgeführt 

werden. Einerseits wird vom „lokalen Speichertransport“ und zum anderen vom „Hardware Trans- 

port“ gesprochen. 

„Lokaler Speichertransport“ bedeutet, dass der Speicher, in welchem die vom Filter genutzten und 

benötigten Daten abgelegt werden, sich im Hauptspeicher des Rechners oder im Hauptspeicher 

der Grafikkarte befindet. 

Von „Hardware Transport“ spricht man, wenn Mediendaten in Speicherbereichen auf diverser 

Hardware, wie zum Beispiel einer Fernsehkarte, verbleiben. 

Die am häufigsten genutzte Transportvariante ist der Lokale Speichertransport, bei welchem Spei- 

cheradressen über die Pins (Anschlüsse) verschiedener Filter übergeben werden. In diesem Sinne 

spricht man von dem „Push-Modell“, wenn Zeiger auf Speicherbereiche weitergereicht werden 

und von dem „Pull-Modell“, wenn der Empfänger-Filter diese anfordert. Der Speicherbereich, in 

welchem die sogenannten „Media Sample’s“ liegen, wird vom Ausgabepin des im Graph vorher 

liegenden Filters alloziert.


Filter A Outpit Pin Input Pin Filter B 

IMediaSample 

GetMediaType() 

GetPointer() 

GetSitze() 

(...) 

BYTE** ppBuffer 

Medien Daten 

(Bild/Audio Samples) 

0100101000110010 

0101011101001001 

1010011110100111 

Memory Allocator 

(Speicherverwaltung) 

Media Sample 

(IMediaSample) 

Media Sample 

(IMediaSample) 

Memory Buffer Memory Buffer 

AM_MEDIA_TYPE Struktur 

GUID majortype; 

GUID subtype; 

BOOL bFixedSizeSamples; 

BOOL bTemporalCompression; 

ULONG ISampleSitze; 

GUID Formattype; 

ULONG cbFormat; 

BYTE pbFormat; 

VIDEOINFOHEADER Struktur 

BITMAPINFOHEADER bmiHeader; 

BITMAPINFOHEADER Struktur 

LONG biWidth; 

LONG biHeight; 

DWORD biCompression; 

(...) 

oder 

WAVEFORMATEX Struktur 

WORD wFormatTag; 

WORD mChannels; 

WORD wBitsPerSample; 

(...) 

MEDIATYPE_Audio 

MEDIATYPE_Video 

MEDIATYPE_Midi 

MEDIATYPE_Text 

... 

GUID_NULL 

MEDIASUBTYPE_IJPG 

MEDIASUBTYPE_QTMovie 

MEDIASUBTYPE_RGB555 

... 

GUID_NULL 

MEDIASUBTYPE_PCM 

MEDIASUBTYPE_MPEG2_AUDIO 

MEDIASUBTYPE_DOLBY_AC3 

... 

GUID_NULL 

GUID_NULL 

Abbildung 5.2: Darstellung der Speicherverwaltung und Medientypenvermittlung nach [Lüd05] 

5.1.1 Genutztes Videoformat 

Voraussetzung einer Wiedergabe stereoskopischer Bildinhalte ist immer das Vorhandensein von 

der linken und rechten Ansicht eines Objektes. In der Datenverarbeitung werden demzufolge Me- 

diendaten benötigt, welche diese beiden Ansichten enthalten oder separate Mediendateien, welche 

in Referenz stehen, um ein Raumbild zu erzeugen. 

Grundlage sollte ein Format sein welches den Zugriff auf beide Ansichten des Stereobildpaares 

ermöglicht und gut zu verarbeiten ist. Durch diesen Fakt ist das Anaglyphenformat absolut unge- 

eignet. Anaglyphen beinhalten zwar beide Ansichten aber ein nachträglicher Zugriff auf die linke 

oder die rechte Ansicht des Raumbildes ist nicht voll möglich. Weitergehend kann ein Anaglyphen 

Format nur schlecht komprimiert werden, da die meisten Codecs eine Farbraumreduzierung durch- 

führen welche den Raumeindruck im Anaglyphenbild vermindern oder gar ganz zerstören können. 

Der Einsatz separater Mediendateien ist für die direkte Wiedergabe geeignet, da diese unmittelbar 

von den genutzten Kameras (vgl. Kapitel 4.2) bezogen und den Projektoren zugeführt werden kön- 

nen. Bei einer verarbeitenden Instanz zwischen Medienströmen und Projektoren ist Mehraufwand 

erforderlich, um mehrere separate Daten zu verwalten.


Wie in Kapitel 5.3 beschrieben ist ein Stereovideoformat, welches die rechte und die linke Ansicht 

in einem Datenstrom vereint, gut geeignet falls eine Nachbearbeitung gewünscht ist. Für dieses 

Format sind verschiedene Anordnungen der Ansichten denkbar, wie zum Beispiel ein „übereinan- 

der“ Format, bei welchem linke und rechte Ansicht übereinander in einer Video Datei gespeichert 

sind. Oder ein „Side-by-Side“ Format bei welchem linke und rechte Ansicht nebeneinander ange- 

ordnet sind. In diesem Format kann, wenn die linke Ansicht, rechts und die rechte Ansicht links 

gespeichert wird, das Format im Kreuzblick betrachtet werden. Ist die Anordnung andersherum, 

also linkes Video links und rechtes Video rechts kann das Stereobildpaar im Parallelblick betrach- 

tet werden. 

Desweiteren können bei Ursprungsvideos im interlaced Format diese in ein progressives Format 

(„doppeltes Interlaced“) gebracht werden, in welchem z.B. gerade Zeilen das linke Bild und unge- 

rade Zeilen das rechte Bild enthalten. Diese Variante ist besonders für das Betrachten der Raum- 

bilder mit einer Shutterbrille (vgl. Kapitel 2.3.5.5) geeignet. Dabei wird der Zeilensprung eines 

Röhrenfernsehers genutzt, bei dem funktionsbedingt die Halbbilder nacheinander gezeigt werden. 

Der Nachteil des Interlacedverfahren besteht im weiteren in der Komprimierung des Formates, da 

nur verlustfreie Codecs oder Kompressionsverfahren, die gerade und ungerade Bildzeilen trennen, 

zur Anwendung kommen dürfen. 

In den in dieser Arbeit geschaffenen Implementierungen wurde ein „Side-by-Side Format“, zu 

sehen in Abbildung 5.3, genutzt, welches zum einen leichter und schneller zu verarbeiten ist als 

das Interlaced Format und zum anderen die volle Auflösung der Videos ermöglicht. 

Abbildung 5.3: Darstellung des „Side-by-Side Formates“. 

Bei diesem Format sind das linke und rechte Videobild in einer Mediendatei mit doppelter hori- 

zontaler Breite gespeichert. Dies ermöglicht die Ver- und Bearbeitung einer Stereovideosequenz, 

analog eines monoskopischen Videos. 

Weiter ist dieses Format auch ohne Raumbildtechnik betrachtbar, da es im Gegensatz zum Zei- 

lenweise verschachtelten „doppelten Interlaced“-Video möglich ist, durch Skalierung jeweils das 

linke oder rechte Videobild einzeln darzustellen.


5.1.2 Rektifikation 

Die Rektifikation des Tiefenbildes geschieht nach den in Kapitel 2.3.1 genannten Formeln. Dabei 

wird durch Nutzung des Aufnahmewinkels der Kameras das Original einer Trapezverzerrung un- 

terzogen. Die Berechnungsvorschrift für Pixel des linken berichtigten Bildes ergeben sich durch 

die Formeln 2.30 und 2.31aus Kapitel 2.3.1.2 welche zur Übersicht nocheinmal dargestellt sind. 

XS ′ l = 

YS ′ l = 

und die des rechten Bildes durch: 

Dabei sind 

XS ′ r = 

YS ′ r = 

2·fK 

1 

cosϖ( cos(ϖ+γ) + 

1 


fK · cosγ + XSl · sinγ 

2·fK 

1 


1 

cos(ϖ−γ) 

· XSl 

(5.1) 

· cosγ 

) 

· YSl 

fK · cosγ + XSl · sinγ 

2·fK 

1 


1 


· XSr 

(5.3) 

fK · cosγ − XSr · sinγ 

2·fK 

1 


1 

cos(ϖ−γ) 

· cosγ 

) 

· YSr 

fK · cosγ − XSr · sinγ 

• XS ′ l und YS ′ l, die Koordinaten des zu projizierenden Bildes 

• XSl und YSr, die Koordinaten des aufgenommenen Bildes 

• fK, die Brennweite der Kameras 

• ϖ, der Öffnungswinkel der Kameras 

• γ, der Konvergenzwinkel der Kameras 

Der Unterschied zwischen den Formeln 5.1 und 5.3 liegt in der Drehrichtung der Bilder begründet. 

Zur Entzerrung konvergent aufgenommener Stereobilder muss das linke Bild gegen den Uhrzei- 

gersinn und das rechte Bild im Uhrzeigersinn gedreht werden. Wie zu sehen ist, handelt es sich bei 

dieser Transformation um eine Funktion, welche eine lineare Komplexität besitzt, wodurch diese 

zur Laufzeit der Software durchgeführt werden kann. 

In Abbildung 5.4 (oben) ist eine rektifizierte Szenerie zu sehen, welche mit 12 Grad Konvergenz 

aufgenommen wurde. Der Konvergenzpunkt liegt auf der Pflanze. In Abbildung 5.4 (unten), ist 

die gleiche Szenerie ohne Berichtigung dargestellt. 

Der Einsatz des entwickelten Transformationsfilters ist in Abbildung 5.5 bei der Nutzung mit dem 

Programm „Graphedit“ dargstellt. 

Es wird ein Stereovideo im Side-by-Side Format durch den ersten Filter geöffnet und nach dem 

Trennen der Audiokanäle vom Videostrom und der Dekoprimierung der Daten an den ZRektFilter 

(5.2) 

(5.4)


Abbildung 5.4: Berichtigte (oben) und originale Szenerie (unten) einer konvergenten Aufnahme 

mit 12 Grad Konvergenzwinkel in Anaglyphentechnik (Rot-Grün) 

übergeben. Dieser wendet die oben beschriebene Transformation mit Hilfe der im Eigenschaften- 

dialog angegebenen Parameter an und übergibt das Resultat an einen Videoausgabefilter.


Abbildung 5.5: Darstellung des Filtergraphen bei Verwendung des Rektifizierungsfilters. 

5.1.3 Transformation in das Stereovideoformat 

Um ein Stereovideo von Webkameras oder den Videodaten der Kameras im Side-by-Side Format 

zu erzeugen, ist ein DirectShow Filter notwendig, welcher über zwei Eingabe- und einen Aus- 

gabepin verfügt. Diesem werden über die Eingabepins die Mediendaten der rechten und linken 

Videoquelle übergeben, die anschließend in das gewünschte Format geschrieben werden. 

In Abbildung 5.6 ist dieser Vorgang anhand des Filtergraphen dargstellt. 

Abbildung 5.6: Darstellung des Filtergraphen bei Verwendung eines dualen Eingabefilters. 

Hierbei werden die linke und rechte Datei von Directshow-Filtern geöffnet und nach der Tren- 

nung von Audio- und Videostrom und Dekomprimierung der Videodaten dem dualen Eingabe-


filter übergeben. Dieser erzeugt die Ausgabe von einem Videobild, in dem die Eingabedaten im 

Stereovideoformat vereint sind. Dieses kann nachfolgend weiterverarbeitet, gespeichert oder wie- 

dergegeben werden. 

5.1.4 Anaglyphe Wiedergabe 

Für die Wiedergabe von anaglyphen Bildern wurde ein Filter entwickelt, welcher ein Stereovideo 

im Side-by-Side Format (linkes Videobild links, rechtes Videobild rechts) als Eingabe akzeptiert 

und ein Anaglyphbild ausgibt. 

Dieser Filter ermöglicht es über den in Abbildung 5.7 gezeigten Dialog: 

• in Rot-Cyan, 

– echte-, 

– graue- und 

– farbige Anaglyphen darzustellen, 

• in Rot-Blau ebenfalls, 

– echte Anaglyphen, 

• sowie in Blau-Gelb 

– echte Anaglyphen darzustellen. 

Abbildung 5.7: Darstellung des Filtergraphen zur Nutzung des Anaglyph Transform Filters und 

dessen Einstellungsdialog.


Der Anaglyphtransformationsfilter erwartet als Eingabe ein Stereovideo im „Side-by-Side For- 

mat“ und erzeugt ein anaglyphes Ausgabebild je nach Einstellung im Eigenschaftendialog des 

Filters. 

Dabei wurden die erzeugten Daten nach folgenden Formeln berechnet: 

5.1.4.1 Echte Rot-Blau und Rot-Cyan Anaglyphen 

Für eine Konvertierung der Echtfarbenvideobilder in Graustufenbilder wird aufgrund der unter- 

schiedlichen Empfindlichkeit der Augen auf die Grundfarben die folgende Berechnung nach [Bar07] 

genutzt: 

Y = 0, 2990 · R + 0, 5870 · G + 0, 1140 · B (5.5) 

Hier ist Y die Luminanz (Helligkeitswert) und R,G,B die Farbwerte des Echtfarbenbildes. Diese 

Berechnung entspricht der ITU-R 2 Empfehlung 601, welche Standards zur Berechnung von Hel- 

ligkeitswerten spezifiziert. Es existieren des weiteren die SMPTE 3 240 M Empfehlung, dargestellt 

in Formel 5.6, und die ITU-R Empfehlung 709, die in Formel 5.7 dargestellt wird. 

Y = 0, 2120 · R + 0, 7010 · G + 0, 0870 · B (5.6) 

Y = 0, 2125 · R + 0, 7145 · G + 0, 0721 · B (5.7) 

Da echte Anaglyphen keine Farben enthalten, werden sie durch diese Berechnung in Graustu- 

fenbilder umgewandelt und zusammengefügt. Somit ergibt sich für Anaglyphen in Rot-Blau- 

Kodierung unter Nutzung von Formel 5.5: 

⎛ 

⎜ 

⎝ 

ra 

ga 

ba 

⎞ ⎛ 

⎞ ⎛ 

0, 299 0, 587 0, 114 

⎟ ⎜ 

⎟ ⎜ 

⎠ = ⎝ 0 0 0 ⎠ · ⎝ 

0 0 0 

r1 

g1 

b1 

⎞ 

⎛ 

⎟ ⎜ 

⎠ + ⎝ 

0 0 0 

0 0 0 

0, 299 0, 587 0, 114 

⎞ 

⎛ 

⎟ ⎜ 

⎠ · ⎝ 

Wobei die Indizes a für Anaglyph stehen, 1 und 2 für das Linke und Rechte Ausgangsbild. 

r2 

g2 

b2 

⎞ 

⎟ 

⎠ (5.8) 

Zur Erstellung von echten Rot-Cyan-Anaglyphen wird eine ähnliche Formel genutzt, welche nach 

gleichem Prinzip arbeitet: 

⎛ ⎞ ⎛ 

ra 0, 299 

⎜ ⎟ ⎜ 

⎝ ⎠ = ⎝ 0 

0, 587 

0 

⎞ ⎛ 

0, 114 

⎟ ⎜ 

0 ⎠ · ⎝ 

ga 

ba 

0 0 0 

r1 

g1 

b1 

⎞ ⎛ 

⎞ ⎛ 

0 0 0 

⎟ ⎜ 

⎟ ⎜ 

⎠ + ⎝0, 

299 0, 587 0, 114⎠ 

· ⎝ 

0 0 0 

r2 

g2 

b2 

⎞ 

⎟ 

⎠ (5.9) 

2 Die „International Telecommunikation Union - Radiocommunication“ (Internationale Fernmeldeunion) ist eine Unterorganisation 

der Vereinten Nationen und die einzige Organisation, die sich offiziell und weltweit mit technischen 

Aspekten der Telekommunikation beschäftigt. 

3 Die „Society of Motion Picture and Television Engineers“ ist ein internationaler Verband aus dem Bereich der professionellen 

Film- und vor allem Videotechnik in welchem fast alle Herstellerfirmen aus dem Bereich der Videotechnik 

Mitglied sind.


5.1.4.2 Graustufen Anaglyphen 

Abbildung 5.8: Echtes Rot-Cyan Anaglyphenbild 

Graustufen Anaglyphen erleichtern die Betrachtung, da alle Farben verwendet werden und das 

Anaglyphenbild dadurch heller erscheint. Nach Formel 5.5 ergibt sich: 

⎛ 

⎜ 

⎝ 

ra 

ga 

ba 

⎞ ⎛ 

⎞ ⎛ 

0, 299 0, 587 0, 114 

⎟ ⎜ 

⎟ ⎜ 

⎠ = ⎝ 0 0 0 ⎠ · ⎝ 

0 0 0 

r1 

g1 

b1 

⎞ ⎛ 

⎞ ⎛ 

0 0 0 

⎟ ⎜ 

⎟ ⎜ 

⎠ + ⎝0, 

299 0, 587 0, 114⎠ 

· ⎝ 

0, 299 0, 587 0, 114 

r2 

g2 

b2 

⎞ 

⎟ 

⎠ (5.10) 

Durch diese Berechnung steigt allerdings auch der Anteil an Geisterbildern, da keine 100% Ka- 

naltrennung erfolgt. 

5.1.4.3 Farbige Anaglyphen 

Farbige Anaglyphen erlauben eine Wiedergabe, die nicht in Echtfarben aber mit geringfügig rea- 

lerer Wirkung als Echte-Anaglyphenbilder wirkt. Dafür können die jeweiligen Farbanteile direkt 

zusammengeführt werden. Hier tritt der oben beschriebenen Effekt auf, dass durch die unterschied- 

liche Sensitivität des Auges für Grundfarben diese bei Betrachtung eines Anaglyphenbildes nicht 

korrekt aufgenommen werden können. Im speziellen werden rote Farbtöne nur gering wahrge- 

nommen, weswegen es sich anbietet den Rotanteil eines Bildes, aus dem Blau- und Grünanteil zu 

ermitteln. Dabei werden die Farbwerte addiert und das geometrische Mittel gebildet. Somit ergibt 

sich:


⎛ 

⎜ 

⎝ 

ra 

ga 

ba 

Abbildung 5.9: Graues Anaglyphen Bild. 

⎞ ⎛ 

⎞ ⎛ 

0 0, 831 0, 161 

⎟ ⎜ 

⎟ ⎜ 

⎠ = ⎝0 

0 0 ⎠ · ⎝ 

0 0 0 

r1 

g1 

b1 

⎞ ⎛ ⎞ ⎛ 

0 0 0 

⎟ ⎜ ⎟ ⎜ 

⎠ + ⎝0 

1 0⎠ 

· ⎝ 

0 0 1 

Abbildung 5.10: Farbiges Anaglyphen Bild. 

r2 

g2 

b2 

⎞ 

⎟ 

⎠ (5.11)


5.1.5 Zweibildschirm Wiedergabe 

Bei der Zweibildschirm Wiedergabe muss unterschieden werden unter den in Kapitel 2.3.5 darge- 

stellten Methoden, zwischen: 

• Headmounted Displays und 

• der Polarisationstechnik. 

Die Unterschiede finden sich in der technischen Realisierung. So sollte z.B. beim Einsatz von 

zwei Projektoren welche ein linkes und ein rechtes Bild „übereinander“ projizieren eine Korrektur 

des in Kapitel 2.3.6 beschriebenen Randlichtabfalls erfolgen. Dies kann beim Einsatz von Head 

Mounted Display (HMD) vernachlässigt werden, da hier die beiden Diplays nur wenig bis gar 

keinen Randlichtabfall erzeugen. 

Allgemein müssen bei der Zweibildschirmausgabe und einer konvergenten Aufnahme, die Bilder 

rektifiziert werden und anschließend an die Grafikkarte übergeben werden. Hierbei ist es notwen- 

dig, dass eine Grafikkarte mit mehreren Ausgängen oder zwei Grafikkarten im Rechnersystem 

vorhanden sind. Dabei wird das linke Bild im Vollbildmodus auf dem linken Projektor ausgege- 

ben und das rechte Bild auf dem rechten. 

Unter Nutzung von DirektShow wurde ein Renderingfilter implementiert, welcher als Eingabe 

ein Stereovideo im Side-by-Side Format akzeptiert und dieses so aufbearbeitet, dass die oben 

beschriebene Vorraussetzungen erfüllt sind. Um diesen „ZStereoRenderer“ genannten Filter zu 

nutzen muss der Treiber der Grafikkarte auf „Horizontal Span“ gestellt werden, sodaß auf beiden 

Projektoren oder Bildschirmen ein gemeinsamer Abreitsplatz eingerichtet ist. Die Verwendung des 

Stereorenderer-Filters ist in Abbildung 5.11 dargestellt. Hier ist zu sehen, wie der Transformations- 

zusammen mit dem Wiedergabefilter arbeitet. 

Abbildung 5.11: Darstellung eines Filtergraphen bei Verwendung des Stereowiedergabefilters

5.2. GPS-DATEN 89 

5.1.6 Wiedergabe über den NVIDIA TM 3D Stereo Treiber 

Eine weitere Möglichkeit der Wiedergabe stereoskopischer Bildinhalte, die mit sehr hoher Ge- 

schwindigkeit genutzt werden kann, ist die einzelnen Ansichten eines Raumbildes direkt über die 

Grafikkarte darzustellen. Dabei liegt der Vorteil darin, dass Berechnungen nicht auf dem Haupt- 

prozessor (CPU) sondern auf dem Grafikprozessor (GPU) durchgeführt werden und somit die Ka- 

pazitäten des Computers besser verteilt werden. Zu diesem Zweck existiert von NVIDIA TM ein 

Treiberaufsatz, welcher für Direct3D R○ oder OpenGL R○ basierte Grafiken Raumbilder erzeugen 

kann. Für die Installation, Bedienung und Einstellung dieses Treibers sei auf [NVI01] verwiesen. 

Die Kompatibilität dieses Treiberaufsatzes ist auf einige wenige NVIDIA TM Grafikkarten be- 

schränkt, weshalb bei der Implementation auf diesen verzichtet wurde. 

5.2 Gps-Daten 

GPS-Daten werden von dem in Kapitel 4.5 beschriebenen Aufbau in einen Audiokanal kodiert 

und per Software wieder dekodiert. Diese Daten sind im NMEA Format, welches im Folgenden 

kurz erläutert wird, gespeichert. 

Eine Sequenz der Daten im NMEA-Format hat folgenden Aufbau: 

$GPRMC,hhmmss.ss,A,llll.ll,a,yyyyy.yy,a,x.x,x.x,ddmmyy,x.x,E,a*hh 

1. = Uhrzeit der Positionsbestimmung (hhmmss.ss), 

2. = Empfängerwarnung (A = Daten OK, V = Warnung), 

3. = Breitengrad (llll.ll), 

4. = Nördlich oder Südlich (a), 

5. = Längengrad (yyyyy.yy), 

6. = Östlicher oder Westlicher Breitengrad (a), 

7. = Geschwindigkeit über Grund (Knoten x.x), 

8. = wahrer Kurs (ohne Bewegung 0 x.x), 

9. = Datum (ddmmyy), 

10. = magnetische Deklination in Grad (x.x), 

11. = Ost oder West (E), 

12. = Modus (a,d,e,n,s) * 

13. = Prüfsumme (hh)

5.3. NACHBEARBEITUNG VON STEREOVIDEOS 90 

Um dieses Format aus dem Audiokanal der Kamera wieder zu extrahieren wird die, auf der dieser 

Arbeit beiliegenden CD enthalte Software „Flexnet32-soundmodem“ genutzt. Diese freie Softwa- 

re emuliert ein 4800 Baud Modem über die Soundkarte des Computers. Dabei werden die Ge- 

räusche, welche durch „Tiny-Trak 3 Plus“ (siehe Kapitel 4.5) in einen Audiokanal kodiert wurden 

durch die Soundkarte abgespielt und von dem „emulierten Modem“ dekodiert. In Abbildung 5.12 

ist die Oberfläche dieser Software beim Dekodieren gezeigt. 

Abbildung 5.12: Screenshot der Anwendung Flexnet-Soundmodem 

Hier sind im oberen Teil der Anwendung die empfangenen Global Positioning Daten dargestellt 

sowie allgemeine statistische Metadaten. Diese ermöglichen es Probleme, die beispielsweise bei 

der Zwischenkomprimierung aufgetreten sind zu erkennen. In solch einem „Fehlerfall“ werden 

erkennbare Bitmuster gebildet welche im unteren Teil der Anwendung zu sehen sind. Wenn bei- 

spielsweise die Aufnahmelautstärke zu gering war, werden keine Daten dekodiert und nur Nullen 

dargestellt. 

5.3 Nachbearbeitung von Stereovideos 

Da sich gezeigt hat, dass die Nachbearbeitung von Stereovideos im Gegensatz zur Bearbeitung 

„einfacher“ Videodaten sehr komplex ist, wird hier eine Vorgehensweise beschrieben, die den 

Aufwand so gering als möglich gestalten soll. 

Als erstes sollten die zwei Videostöme in ein Side-by-Side, oder übereinander Format gebracht 

werden. Damit ist sichergestellt, dass später durch weiteres Bearbeiten kein Höhenversatz oder 

Änderungen der Deviation auftreten können. Desweiteren reduzieren sich Probleme beim Schnitt 

der Videodaten, da nicht zwei, sondern lediglich eine Datei geschnitten wird. Diese Vorgehens- 

weise hat sich auch bei längeren und damit größeren Videos bewährt, da der zusätzliche Zeitauf-


wand durch Verarbeiten eines Videoformates mit doppelter Breite oder Höhe, geringer als bei, der 

Editierung zweier Videos ist. Zudem ist in jedem Verarbeitungsschritt eine Kontrolle des stereo- 

skopischen Effektes möglich. 

Ein zweiter Vorteil dieser Herangehensweise ist, dass alle virtuellen Größen im Vorfeld fixiert 

werden. Im Allgemeinen kann im Vorfeld, selbst bei sehr großem Vertrauen in die Halterung und 

die Fernbedienung der Kameras nicht vorhergesehen werden, ob und wie groß die Justierungspa- 

rameter der Einzelvideos bezogen auf Höhenversatz und Deviation im Stereovideo sind. 

5.3.1 Einblenden von Titeln 

Beim Einblenden von Titeln muss darauf geachtet werden, dass diese nicht ungewollt von vir- 

tuellen Objekten durchstoßen werden. Deswegen ist für einfache Titel eine Platzierung vor weit 

entfernten, unbewegten Objekten am sinnvollsten. 

Titel werden durch Erstellen von Bilddaten erzeugt, die über alpha-Werte oder Bluescreen Techni- 

ken über Einzelbilder des Videos gelegt werden. Dabei sollte das Titelbild die gleiche Auflösung 

und Größe des Stereovideos besitzen, um Fehler bei der Justierung zu vermeiden. Wenn virtuelle 

Tiefe im Titel erwünscht ist, wird empfohlen, dies mit Renderingprogrammen wie z.B. „3D Studio 

Max“, „Maya“, „Blender“ oder „POV-ray“ zu realisieren und durch Videobearbeitungssoftware zu 

bearbeiten. 

5.3.2 Anwenden von Blend-Effekten 

In vielen Situationen beim Schnitt von Videodaten ist es erwünscht, Szenenübergänge durch den 

Einsatz von Blenden zu realisieren. Dabei ist zu beachten, dass ein Stereovideo vom Schnittpro- 

gramm als „normales Video“ behandelt wird. Das bedeutet bei Blendeffekten, welche rechts oder 

linksseitiges „fahren“ oder „schieben“ realisieren, können leicht Fehler im Raumbild erzeugt wer- 

den. 

Keine Fehler treten bei der Nutzung von diffusen Blenden oder je nach Stereoformat genutzte 

Überblendeffekte, welche senkrecht zur Anordnung der Bilder im Stereovideo eingesetzt werden, 

auf. Im weiteren bedeutet dies, dass ein Überblenden von links oder rechts bei einem Stereovideo 

im übereinander Format eingesetzt werden kann, jedoch im nebeneinander Format (Side-by-Side) 

einen für den Betrachter unangenehmen Effekt erzielt. 

5.3.3 Überlagern von Stereovideo mit Videoinhalten 

Prinzipiell kann in einem Stereovideo genauso verfahren werden, wie in monoskopischem Video. 

Bluescreen Elemente können genutzt werden genauso wie Alphablenden. Es ist darauf zu achten, 

das nachträglich eingefügte Elemente die Grundregeln der Stereoskopie, wie z.B. die 70 Minuten 

Regel (Kapitel 2.2.2) nicht verletzen oder Höhenversatz erzeugen. Veränderungen der virtuellen 

Tiefe, der Stereobasis oder anderen filmerischen Techniken ist keine Beschränkung gesetzt. 

Zur Realisierung beispielsweise einer Bluescreen Einblendung wird ebenfalls empfohlen, den


Abbildung 5.13: Kodierung von mehreren Ansichten eines Bildes durch eine Tiefenkarte aus 

[Gir01], a) Erzeugung der Tiefenkarte b) Berechnung einer Ansicht durch eine 

Tiefenkarte 

Inhalt nicht in die einzelnen Videoströme für das linke und rechte Bild einzufügen, sondern 

hier Stereovideo- in Stereovideo einzufügen. Die dadurch verlängerte Bearbeitungszeit durch den 

Schnittplatz steht in geringerem Kontrast als die Ausrichtung der Einzelvideos, da deren nachträg- 

liche Ausrichtung im Stereoformat nicht exakt vorhergesehen werden kann. 

5.3.4 Kompression von Stereovideo 

Stereoskopische Videos können in separaten Mediendateien, im Side-by-Side oder übereinander 

Format mit jedem beliebigen Videocodec komprimiert werden. Ein für Stereobildpaare optimier- 

ter frei zugänglicher Codec existiert jedoch nicht, weswegen ein Kompressionsverfahren welches 

ausnutzt, dass sich die rechte und linke Ansicht des Stereobildpaares stark ähneln, hier erwünscht 

wäre. 

Einer der ersten Ansätze mehrere Ansichten einer Szenerie zu kodieren nutzte eine Differenzkar- 

te, sodaß ein Bild und diese Karte gespeichert werden mussten und nicht zwei Vollfarbenbilder 

[Mic86]. Dieser Ansatz findet sich in vielen aktuellen Arbeiten wieder. In Abbildung 5.13 ist ei- 

ne Abbildung aus [Gir01] zu sehen, welche das Prinzip der En- und Dekodierung von mehreren 

Ansichten verdeutlicht. 

Dieser Algorithmus macht sich zu Nutze, dass in stereoskopischen Ansichten viele Punkte der 

abgelichteten Szenerie in beiden Bildern an verschiedenen Positionen vorhanden sind. Aus dieser 

Differenz, welche der Deviation entspricht kann ein Tiefenbild berechnet werden. In [Gir01] wer- 

den dazu die Bilder in Blöcke aufgeteilt und miteinander verglichen. Das entstandene Tiefenbild 

muss anschließend verlustfrei gespeichert werden. Hier bietet sich durch die Aufteilung in Blöcke 

eine Lauflängenkodierung an. Bei der Dekodierung kann aus einer Ansicht und dem Tiefenbild 

die zweite Ansicht rekonstruiert werden. 

Der Kompressionsfaktor kann noch erhöht werden, wenn nicht nur die räumlichen Differenzen 

betrachtet werden, sondern auch die temporalen [Vik03]. Wenn eine MPEG Kodierung zur Hilfe 

genommen wird, bei der das erste I-Bild unabhängig komprimiert wird und im folgenden durch


pixelweise Subtraktion vom ersten nur die Differenzen gespeichert werden (P-Bild), können P- 

Bilder höher komprimiert werden als I-Bilder. Eine noch höhere Kompressionsrate wird erzielt, 

wenn nicht Differenzen sondern Bewegungsvektoren gespeichert werden, die angeben in welche 

Richtung sich ein Pixel „bewegt“. Im MPEG-2 Standard wird noch eine dritte Art von Bildern ge- 

nutzt (B-Bild), welche typischerweise zwei Referenzen speichern. Eine zum vorherigen Bild, und 

eine zum nachfolgenden Bild. Dadurch kann der Enkodierer die optimale Vorhersage für jeden 

Block treffen, was die Effizienz steigert. 

Somit ist das Verfahren der temporalen Komprimierung ähnlich des der räumlichen Komprimie- 

rung. 

Linke 

Ansicht 

Rechte 

Ansicht 

I 

B 

B B 

B 

P B B P 

B B 

B B 

Abbildung 5.14: Folge von I,P, und B- Bildern bei der Kompression von stereoskopischen Video 

(nach [Vik03]) 

In Abbildung 5.14 ist der Aufbau des in [Vik03] entwickelten Codecs dargestellt. Die linke Ansicht 

wird dabei in herkömmlicher Weise komprimiert, wohingegen die rechte Ansicht durch B-Bilder 

repräsentiert wird. Diese können am höchsten komprimiert werden und ermöglichen die Referen- 

zierung von Bildern der linken und rechten Ansicht. 

Die „Motion Picture Experts Group“ stellt einen freien Codec für Bildungszwecke zur Verfügung. 

Dieser heißt „Test Model 5“ (TM5) und kann von der Webseite der MPEG [MPE01] bezogen 

werden. Eine Implementation des Codecs von [Vik03] ist auf der, dieser Arbeit beiliegenden CD 

zu finden. 

B

6 Fazit 

In diesem Kapitel werden die Ergebnisse dieser Diplomarbeit in einem Überblick zusammenge- 

fasst und mögliche Erweiterungen der Kamera vorgestellt. 

6.1 Zusammenfassung der Arbeit 

Als Ergebnis der Arbeit existieren verschiedene DirectShow Filter zur Be- und Verarbeitung von 

Stereovideos, sowie Beispielvideos, welche auf der beiliegenden CD zu finden sind und die in 

Kapitel 4 beschriebene Kamera, welche sich durch eine hohe Anzahl an Freiheitsgraden in Hin- 

sicht auf stereoskopische Bilderstellung auszeichnet. Beispielsweise kann neben der synchronen 

Aufnahmefunktion 

• die Stereobasis verändert werden, 

• die Ausrichtung der optischen Achsen der Einzelkameras bei der Aufnahme verändert wer- 

den, 

• synchron gezoomt und fokussiert werden 

• Sensorinformationen Bildsynchron gespeichert werden und 

• die Stereokamera mobil eingesetzt werden. 

Durch diese Funktionen wurde eine mobile Stereovideokamera erschaffen, die im Vergleich mit 

den in Kapitel 3.1 vorgestellten Systemen, einen höheren Funktionsumfang bei geringerem Ko- 

stenaufwand realisiert. 

Eine Aufstellung der Kosten für die Stereovideokameras ist im Anhang dieser Diplomarbeit auf 

Seite IX in Tabelle A.3 dargestellt. Die dort angegebenen Kosten liegen im Vergleich, zu den im 

Kapitel 3.1 vorgestellten Stereovideokameras, welche 70.000 Euro und mehr 1 kosten, deutlich 

niedriger. 

Der Vergleich mit den vorgestellten binokularen Kameras ist nicht direkt möglich. Durch den oben 

beschriebenen, deutlich höheren Funktionsumfang und höhere Auflösung des entwickelten Stereo- 

videokamera Systems. 

Durch die entwickelte Stereovideokamera (vgl. Abbildung 6.1) ist es möglich den menschlichen 

Sehvorgang sehr naturgetreu nachzuempfinden. Die Möglichkeit den Konvergenzwinkel bei der 

1 Annahme des Autors, da nur der Preis von „TMP S3R 1080i 3D“ ermittelt werden konnte. Da die anderen Systeme, 

“Pace Fusion 3d“ und „21st Century 3DVX3“ nur mit Bedienpersonal gemietet werden können wird der Anschaffungspreis 

als sehr hoch angenommen. 

94

6.2. MÖGLICHE ERWEITERUNGEN DER STEREOKAMERA 95 

Abbildung 6.1: Abbildung des Sterovideokamerasystems 

Aufnahme von Sterovideos zu ändern und die Projektion auf der Stereoprojektionleinwand des 

Lehrstuhls Computergrafik und Visualisierung, welche durch die große Bilddiagonale die Projek- 

tion in Originalgröße ermöglicht, wird die Möglichkeit geboten originale Eindrücke zu vermitteln. 

Zusammen mit der entwickelten Software, welche die Berichtigung und Projektion, von konver- 

gent und parallel aufgenommenen Szenarien für die parallele Projektion ermöglicht, ist somit ein 

Stereovideosystem entstanden, das in dieser Art aktuell einzigartig ist. 

Durch die Annotation von Videodaten mit GPS Informationen wurden weitere Wissenschaftliche 

Arbeiten ermöglicht. 

Die entwickelten DirectShow Filter (siehe Kapitel 5.1) sind auf der, der Arbeit beiliegenden CD 

inklusive dem benötigten Quelltext enthalten. Dieser Quellcode kann im Sinne der Aufgabenstel- 

lung von weiteren Arbeiten genutzt werden. Eine einfache Anwendung, welche den Einsatz von 

Filtern demonstriert ist ebenfalls auf der beiliegenden CD zu finden. 

6.2 Mögliche Erweiterungen der Stereokamera 

An der entwickelten Stereokamera können im Rahmen weiterer Arbeiten die im Folgenden be- 

schriebenen Erweiterungen getroffen werden. Diese stellen lediglich einen Teil der denkbaren 

Modifikationen dar, welche in erster Linie zur Nachempfindung des menschlichen Sehvorgangs 

genutzt werden können.


6.2.1 Aufnahme von Stereopanoramen 

Die Aufnahme von Panoramen erfolgt heutzutage meist nur als Fotografien, da der Herstellungs- 

prozess als auch die Wiedergabe dieser Rundblicke sehr aufwendig ist. Für die Wiedergabe auf 

einer planen Fläche, wie beispielsweise einem Monitor, existieren so genannte Schaufenster- 

Ansichten von Panoramen, bei welchen der Betrachter einen Teil des Bildes sieht, und in diesem 

in drei Richtungen navigieren kann. Dabei kann nach rechts und links oder oben und unten „ge- 

schaut“ und durch Pixelvergrößerungsalgorithmen gezoomt werden. Das flache Panorama, das zur 

korrekten Wiedergabe kugelförmig um den Betrachter herum projiziert werden müsste, erscheint 

über die Beschneidung durch das „Schaufenster“ korrekt. 

Somit ist es möglich 360 ◦ × 180 ◦ Panoramen wiederzugeben. Die Aufnahme solcher Panoramen 

erfolgt in der Fotografie entweder durch Erzeugen von Ablichtungen, welche sich in einem be- 

stimmten Bereich überlappen und später durch Softwarelösungen „zusammenmontiert“ werden, 

oder durch Nutzung einer Panoramakugel wie in Abbildung 6.2 dargestellt. 

Abbildung 6.2: Panorama Aufnahme mit Hilfe einer gestauchten Halbkugel (nach [Naj05]) 

Bei dieser handelt es sich um eine gestauchte Halbkugel, welche 360 ◦ × 90 ◦ Panoramen durch 

spätere Entzerrung ermöglicht. Bei dem Einsatz einer Vollkugel kann ein ca. 360 ◦ × 130 ◦ Pan- 

orama (auch Sphärisches Panorama genannt) erzeugt werden. Die Bildinformation am „Rand“ der 

abgelichteten Kugel ist sehr hoch, weshalb der Einsatz von Digitalkameras durch die meist zu ge- 

ringe Auflösung keine guten Ergebnisse produziert. 

Ein entzerrtes Bild dieser abgelichteten Sphären wird „equirectangulares Bild“ genannt, welches 

die doppelte Breite des aufgenommenen Bildes hat, und eine Rundumsicht ermöglicht. Die be- 

kannteste Anwendung einer equirectangularen Projektion ist die Abbildung der „Weltkarte“ auf 

einer ebenen Fläche. Für eine genauere Beschreibung der Equirectangularen Projektion sei auf 

[Eli07] verwiesen. 

Als Erweiterung der Stereokamera könnten durch Anbringen zweier Kugeln vor den Objekti-


ven Stereovideopanoramen aufgenommen werden, die gerade in der Terrainvisualisierung oder 

in Computerspielen eingesetzt werden könnten. In Computerspielen würde dadurch ein sehr ho- 

her Grad an Realismus erreicht und die Modellierung der Spielfläche wird erleichtert, da eine 

Aufwendige Modellierung des Spielfeldes im Besonderen in Randbereichen in denen ein Avatar 

(Spielfigur) nicht agieren kann, vermieden wird. 

Stereopanoramen als Videos hätten einen besonderen Reiz wenn sie in Rundumprojektionsräu- 

men, wiedergegeben (Cave) werden. 

6.2.2 Bedieneinheit 

Die Bedieneinheit kann in der Hinsicht verbessert werden, dass eine Ansteuerung der Servomo- 

toren, z.B. beim Ändern der Fokussierung, über die Fernbedienung gelöst werden könnte. Der 

entstehende Effekt beschreibt den menschlichen Sehvorgang besser, bei dem die Achsen der Au- 

gen ebenfalls auf das fokussierte Objekt konvergieren. Zur Realisierung dieser Erweiterung müs- 

ste der in der Bedieneinheit vorhandene „Servo-Differenzierbaustein 2 “, sowie der ebenfalls in der 

Bedieneinheit angeordnete Generator für das Steuersignal der Servomotoren, mit der Hauptpla- 

tine der Fernbedienung gekoppelt werden. Eventuell ist eine Neukonzipierung des Layoutes der 

Platine in Betracht zu ziehen. 

Weiterhin wäre eine Erweiterung der Bedieneinheit um die Funktion des Vergrößern oder Ver- 

kleinern der Stereobasis denkbar, die ebenfalls eine Layoutänderung der Fernbedienungsplatine 

erfordert. Diese Funktion erfordert weiterhin eine Veränderung der Kamerahalterung um Steue- 

rungsmöglichkeiten der Stereobasis wie in Kapitel 6.2.3 beschrieben wird. Hintergrund dieser 

Modifikation ist es, einerseits die Stereobasis während der Aufnahme zu verändern und anderer- 

seits diese an bestehende Funktionen wie z.B. die Fokussierung oder die Brennweitenänderung 

zu koppeln. Dadurch ist es möglich beim Vergrößern und Verkleinern der Stereobasis zusammen 

mit der Ansteuerung der Fokussierung, die Konvergenzlinie bei konvergenter Aufnahme gleich zu 

halten. 

Somit könnten multiperspektivische Aufnahmen von einem Objekt durchgeführt werden. 

6.2.3 Halterung 

An der Halterung der beiden Einzelkameras der Stereokamera können zum einen Verbesserungen 

in Hinsicht auf Bedienbarkeit und Portabilität zum anderen Erweiterungen der Funktionalität ge- 

troffen werden. 

Die Portabilität der Stereokamera kann neben der Reduzierung des Gewichtes, z.B. durch das 

Tragen der Stromversorgung in einem Rucksack, durch Nutzung eines „Steadycam“ Systemes 

2 Der „Servo-Differenzierbaustein“ ermöglicht die gegensätzliche Ansteuerung und eine Differenzierung der Schritt- 

weite der Servomotoren


(auch Schwebestativ genannt) wie in Abbildung 6.3 gezeigt, verbessert werden. Dieses nutzt das 

Trägheitsmoment einer großen Masse (der Stereokamera), um Kipp- und Neigestabilität zu ga- 

rantieren. Außerdem wird die direkte Verbindung zwischen der kameraführenden Person und der 

Kamera entkoppelt. 

Abbildung 6.3: Schwebestativ 

Da ein Kameraschwebestativ wie in Abbildung 6.3 gezeigt ist, sehr preisintensiv ist (ca. 17.000 

Euro [Vid07]), kann dies auch selbst entwickelt werden. Dazu sei auf die Anleitung in [Eng07] 

verwiesen. 

Eine weitere praktische Modifikation der Halterung kann durch das Befestigen eines Kontroll- 

monitors an der Halterung erreicht werden. An diesem müssten über eine Schaltung die Kameras 

angeschlossen werden, über die die aufgenommenen Bilder direkt, z.B. in Anaglyphendarstellung, 

betrachtet werden können. Die dafür notwendige Schaltung müsste die Signale der Farbkompo- 

nenten beider Kameras als Eingabe verwenden und ein Anaglyphenbild ausgeben. Dieses kann 

anschließend beispielsweise mit einem portablen TFT-Monitor betrachtet werden. 

Eine Verringerung des Kameragewichts ist durch Modifikation der Halterung möglich. Beispiels- 

weise kann die Halterung aus Kohlefasern gefertigt werden. Im Rahmen dieser Diplomarbeit wur- 

de auf solch eine Halterung aus Kostengründen verzichtet. 

6.2.4 Sensordaten 

Für den Einsatz von Sensordaten, welche synchron zu Videoteilbildern gespeichert werden, könn- 

ten verschiedene Anpassungen durchgeführt werden. 

Falls eine genauere Positionsbestimmung der Stereokamera gewünscht ist, kann das „Differential 

Global Positioning System“ (DGPS) genutzt werden. Dieses bezeichnet das Verfahren, zwei oder 

mehr GPS-Empfänger zur Steigerung der absoluten Positionsgenauigkeit einzusetzen. Es werden 

die Koordinatendifferenzen zwischen den Empfangsstationen bestimmt, wodurch ein Großteil der 

Fehlereinflüsse eliminiert werden kann. Durch dieses Verfahren ist es möglich, die Genauigkeit

6.3. FORSCHUNGSFRAGEN 99 

der Positionsbestimmung auf unter einen Zentimeter zu steigern. 

Mit DGPS-Empfängern können ortsfeste Referenzstationen genutzt werden, von welchen die geo- 

grafische Position mit sehr hoher Genauigkeit bekannt ist. Der gemessene Entfernungsfehler zum 

Satelliten und dessen zeitliche Änderung wird für jeden empfangenen GPS-Satelliten von dieser 

Station bestimmt und an alle DGPS-Empfänger der Region übermittelt. Zur Kalibrierung dieses 

Systems in Deutschland wird meist der Satellitenpositionierungsdienst der deutschen Landesver- 

messung (SAPOS) verwendet, welcher Korrekturdaten über verschiedene Netze, wie beispiels- 

weise GSM, Funk, Telefon oder Internet zur Verfügung stellt. 

Zur Nutzung anderer Sensordaten müssten die Anschlussmöglichkeiten an das in Kapitel 4.5 vor- 

gestellte „TinyTrak3“ verändert und die Firmware des Mikroprozessors angepasst werden. Zu 

diesem Zweck sei auf das „OpenTracker+“ Projekt [N1V05] verwiesen, bei welchem Firmwa- 

re und Platinenlayout zur Verfügung gestellt werden. OpenTracker+ arbeitet nach dem gleichen 

Prinzip wie TinyTrak3 und wird als OpenSource Projekt geführt. In weiteren Arbeiten könnte eine 

Firmware entwickelt werden, die es durch Komprimierung oder Umkodierung der Sensordaten 

ermöglicht, Daten von zwei oder mehr Sensoren in den Audiokanal zu kodieren oder diese mit 

den vom Mikrofon aufgenommen Audiodaten mischt, um die Verwendung von allen vier Audio- 

kanälen zu garantieren. 

6.3 Forschungsfragen 

Mit der entwickelten Kamera können viele verschiedene wissenschaftliche Arbeiten durchgeführt 

werden. Diese beziehen sich auf das komplette Gebiet der stereoskopischen Aufnahme, Verarbei- 

tung und Wiedergabe von Daten. 

Einige notwendige Arbeiten werden nachfolgend vorgestellt und sollen einen Anstoß für eventuell 

folgende Arbeiten bilden. 

6.3.1 Datenverarbeitung 

Im Rahmen der Datenverarbeitung stereoskopischer Bildinhalte und der Verarbeitung von Sensor- 

daten existieren keine oder nur unzulängliche Softwarelösungen. 

6.3.1.1 Aufnahme von Stereovideodaten 

Die Aufnahme von Stereovideos erfolgt aktuell meist nach Standardgeometrie, also der paralle- 

len Ausrichtung der optischen Kameraachsen. Wie in Kapitel 2.2.1 beschrieben, muss bei dieser 

Justierung das entstandene Raumbild rechts und links beschnitten werden. Bei einer konvergen- 

ten Aufnahme ist dies nicht der Fall, allerdings muss hier eine Schrägprojektion, wie in Kapitel 

2.3.1 beschrieben, durchgeführt werden. In dieser Arbeit wurde vorgestellt, wie diese anhand eines 

bekannten Konvergenzwinkels durchgeführt wird. Da der Konvergenzwinkel bei einer Schrägpro- 

jektion (auch Rektifizierung genannt) nicht immer bekannt ist, existieren Verfahren, welche die-


sen Winkel anhand von Bilddaten errechnen. Die echtzeitfähige Anwendung dieser Verfahren ist 

aktuell nicht möglich und sollte, gerade bei einem sich ändernden Konvergenzwinkel erforscht 

werden. Die in solch einer Arbeit entstehenden Grundlagen sind für den Bereich der Photogame- 

trie im Zusammenhang mit multiperspektivischen Bildern sehr interessant, da zur Erzeugung von 

Tiefenkarten rektifizierte Bildinformationen die Ausgangslage bilden. 

6.3.1.2 Verarbeitung von Stereovideodaten 

Gerade im Bereich der Videobildverarbeitung von Raumbildern wird Software benötigt die, das 

Schneiden und Bearbeiten der verschiedenen Stereovideoformate unterstützt. Wie in Kapitel 5.3 

beschrieben, ist die Verwendung von herkömmlichen Videobearbeitungsprogrammen für den Ein- 

satz an Raumbildinformationen unzulänglich. 

Wünschenswert wären Lösungen, die folgende Punkte verwirklichen. 

• die Synchronisierung von Stereovideos anhand verschiedener Algorithmen vereinfacht (z.B. 

durch Kantenfindungsverfahren) 

• das Hinzufügen von Titeln mit Unterstützung der Positionierung in der Tiefe 

• die Erstellung von Tiefenkarten realisiert, um künstliche Objekte oder weitere Raumbilder 

mit den aufgenommenen Daten zusammenzuführen können 

• die Verwendung von Blenden jeglicher Art unterstützt 

• die Komprimierung von Stereovideos nach dem im Kapitel 5.3.4 vorgestellten Verfahren 

realisiert 

• die Abbildung von Sensordaten ermöglicht, beispielsweise von GPS-Daten als Mini-Landkarte 

im Bild 

6.3.1.3 Speicherung von Stereovideodaten 

Die Speicherung von Stereobildpaaren wird aktuell durch die gleichen Verfahren realisiert wie 

die Speicherung von monoskopischem Video. Wie in Kapitel 5.3.4 erläutert, kann dies effektiver 

durch Ausnutzung von Similaritäten in den Einzelbildern des Stereobildpaares erfolgen. In dieser 

Hinsicht sollten Komprimierungs- und Dekomprimierungsalgorithmen entworfen werden, welche 

die Speicherung und damit auch die Übertragung von stereo- und multiperspektivischem Video 

optimieren. 

6.3.1.4 Sensordaten 

In Bezug auf die Datenverarbeitung und die Einbettung von Daten in Videoströme sind sehr viele 

Forschungsansätze denkbar. So zum Beispiel die Annotierung von Videos durch weitere Informa- 

tionen nach Ansätzen der Augmented Reality. Hier könnten Sensordaten genutzt werden, um auf 

den Anwendungsfall passende Daten anzuzeigen. So könnte ein Navigationsystem, welches ein


Sportler für das Training zu einem Fahrradmarathon verwendet, durch Daten über den physischen 

Zustand des Nutzers eine schwerere oder leichtere Streckenführung berechnet. 

Durch stereoskopische Bildinformationen könnte in diesem Fall im Vorfeld die Oberfläche der 

Straße und deren Breite bestimmt werden, wodurch die Navigation noch exakter zugeschnitten 

werden kann. 

Um dieses futuristische Szenario realisieren zu können sind dem Stand der Forschung noch einige 

Arbeiten vorausgesetzt. Bei diesen sollten Filtermechanismen entwickelt werden, die die aufge- 

nommenen Daten in der gewünschten Darstellungsvariante verarbeiten und visualisieren. 

6.3.2 Verwendung stereoskopischer Aufnahmen 

Stereoskopische oder multiperspektivische Aufnahmen können in vielen Einsatzbereichen hilf- 

reich sein. So werden Multisensorsysteme beispielsweise aktuell in der Automobilproduktion 

in Prototypen eingesetzt, die ohne Einwirkung des Fahrers Einparken, Warnungen signalisieren, 

wenn die Fahrspur verlassen wird oder sich gar gänzlich ohne Fahrer im öffentlichen Raum bewe- 

gen. 

Desweiteren kann die in Raumbildern enthaltene Tiefeninformation genutzt werden, um Personen 

oder Gesten [Hof05] zu erkennen, was im Bereich der Mensch-Computer-Interaktion ein großes 

Forschungsgebiet darstellt. In diesem Zusammenhang ist die Visualisierung von dreidimensiona- 

len Daten und die Interaktion mit diesen ein großes Forschungsgebiet. 

Die Anwendungen einer Stereokamera im Bereich dieses Erfassens von räumlichen Informationen 

liegen auf der Hand. Die durch stereoskopische Aufnahmen gesammelten Tiefenbilder könnten 

beispielsweise über die Verknüpfung mit GPS-Daten dreidimensionale Abbildungen der aufge- 

nommenen Szenarios erzeugen und im Bereich der Terrainmodellierung eingesetzt werden. Die 

Erstellung von dreidimensionalen Punktwolken durch die Verarbeitung von Stereovideoinforma- 

tionen können bei der Berechnung physikalischer Eigenschaften von beispielsweise Stoffen, Pa- 

pier, Flüssigkeiten oder Gasen genutzt werden. Auch die GPS-Navigation kann durch Unterstüt- 

zung von stereoskopischen Ansichten verbessert werden. So wäre ein System vorstellbar, welches 

nach dem Ansatz der Augmented Reality stereoskopische Ansichten, die durch stereoskopisches 

Video erzeugt werden könnten, direkt zur Navigation von Fahrzeugen und Fußgängern eingesetzt 

werden. 

Aufgrund dieser und weiterer Nutzungsmöglichkeiten für Stereovideokameras ist das Gebiet der 

multiperspektivischen Sensordatenerfassung, -verarbeitung und -speicherung ein interessantes The- 

ma für weitere Arbeiten.

A Anhang 

A.1 Hinweise zur Bedienung der Stereovideokamera 

Die Bedienung der entwickelten Stereovideokamera unterscheidet sich im technischen Verständ- 

nis nicht von der Handhabung eines Camcorders. Allerdings sind einige Aufnahmeregeln, welche 

an verschiedenen Stellen in der Diplomarbeit genannt wurden, zu beachten. Diese werden hier 

neben einigen Hinweisen zur Bedienung und Handhabung genannt. 

Vor der Benutzung der Stereovideokamera ist die Bedienungsanleitung der Einzelkameras, sowie 

diese Diplomarbeit zu konsultieren. 

A.1.1 Aufnahmeregeln 

Bei der Aufnahme von stereoskopischen Bildern ist zu beachten, dass die Tiefeninformation in 

einem Raumbild bestimmte Grenzen nicht überschreiten darf. 

Da das menschliche Gehirn nur begrenzte Tiefeninformationen verarbeiten kann, begrenzt sich 

die in einem Stereobild enthaltene Tiefe. Eine Verletzung dieser Regel kann dazu führen, dass 

ein Tiefenbild nicht mehr als dieses wahrgenommen werden kann, sondern beide Einzelbilder zu 

sehen sind, was ein großes Unbehagen erzielt. 

Wie in Kapitel 2.1 beschrieben wird der Wert, welcher die Tiefeninformation beschreibt, Deviation 

genannt. Diese sollte nicht größer als 1 

30 der Bildbreite sein. Dieser Wert folgt der 70′ Minutenregel 

welche in Kapitel 2.2.2 beschrieben wird. Aus dieser kann eine einfache Bedingung abgeleitet 

werden, sodaß bei paralleler Ausrichtung der Kameras diese Regel immer eingehalten wird. Diese 

ist in Formel A.1 

Entfernung zum Nahpunkt ≥ Stereobasis · Brennweite (A.1) 

Die einzelnen Größen sind in Abbildung 2.4 erläutert. 

A.1.2 Bedieneinheit 

Die Bedieneinheit besteht aus der Fernbedienung für die Stereokamera, dem Gerät zur Verarbei- 

tung der Sensordaten und der Steuerungseinheit für die Servomotoren. 

I

A.1. HINWEISE ZUR BEDIENUNG DER STEREOVIDEOKAMERA II 

A.1.2.1 Stromversorgung 

Beide Geräte (Fernbedienung und Sensorverarbeitungsbaustein) besitzen eigenständige Stomver- 

sorgungen. So wird die Fernbedienung durch drei Batterien vom Typ AAA (LR03), und das GPS- 

Datenverarbeitende Gerät durch einen 9V Block versorgt. Da die Fernbedienung, wenn sie an die 

Kameras angeschlossen ist, durch Betätigen des Schalters für die externe Stromversorgung von 

den Kameras gespeist wird, ist ein Batteriewechsel nicht allzu oft notwendig. Deswegen sind die 

drei Batterien der Fernbedienung, in der Bedieneinheit unter dem Display zufinden. 

Da der GPS-Empfänger einen höheren Stromverbrauch hat, ist dessen 9V-Block im Batteriefach 

am gut zugänglichen Tragegurt der Kamera angebracht. 

Die Servomotoren zur Steuerung der Kamerastellung werden über vier AA (LR06) Batterien be- 

trieben, die ebenfalls am Gurt der Kamera befestigt sind. Der Einsatz von wiederaufladbaren Ak- 

kus ist möglich und wird aufgrund der Kostenfaktoren von Batterien empfohlen. 

A.1.2.2 Einstellen des Konvergenzwinkels 

Der Konvergenzwinkel der Stereokamera kann durch Betätigung des Drehreglers auf der Be- 

dieneinheit verändert werden. Dabei ist darauf zu achten, dass bei geringen Stereobasen ab be- 

stimmten Konvergenzwinkeln die Kameras zusammenstoßen können. Da die Servomotoren eine 

hohe Leistung von 190N/cm besitzen, d.H. eine Kraft von 19 KG im Drehradius von einem Zen- 

timeter, können durch diese Kräfte die Einzelkameras beschädigt werden. 

Aus diesem Grund sollte vor jeder Inbetriebnahme der Drehregler auf der Bedieneinheit maximal 

in Uhrzeigerrichtung gereht werden. 

A.1.2.3 Anschluss der Einzelkameras 

Der Anschluss der Einzelkameras an die Bedieneinheit erfolgt über ein Y-förmiges Kabel, dass 

an einem Ende einen D-SUB9 Stecker und auf der anderen Seite zwei 2,5mm Klinkenstecker be- 

sitzt. Die Klinkenstecker werden in die mit „Remote“ gekennzeichneten Buchsen an den Kameras 

gesteckt und der D-SUB9 Stecker wird an der Bedieneinheit mit dem, mit „Kameras“ gekenn- 

zeichneten Anschluss, verbunden. 

Es ist darauf zu achten, daß dieses Kabel nicht mit dem Anschluss des GPS-Sensors verbunden 

wird, da dieser mit einer höheren Spannung betrieben wird, welche Fehlfunktionen in den Kame- 

ras auslösen kann. 

A.1.3 Anschluss eines Sensors 

Der GPS-Empfänger wird mit dem DSub9 Stecker an der Bedieneinheit mit dem, mit GPS- 

Empfänger bezeichneten Anschluss, verbunden. Wenn der Schalter an der rechten Seite der Be- 

dieneinheit betätigt wird, leuchtet eine Status-LED durch eine Öffnung auf der Oberfläche der

A.1. HINWEISE ZUR BEDIENUNG DER STEREOVIDEOKAMERA III 

Bedieneinheit, welche mit Power gekennzeichnet ist. Die darunter befindlichen Anzeigen signali- 

sieren: 

• Trägersignal erkannt (wird nicht verwendet) 

• gültige GPS- Daten werden empfangen 

• Daten werden in den Audiokanal geschrieben. 

A.1.3.1 Funktionsübersicht der Fernbedienung 

Die Handhabnung der Fernbedienung erfolgt nach dem Einschalten durch den „AN/AUS“ Schal- 

ter durch die vier Taster über dem Display. 

Im Display werden in der oberen Zeile die Funktionen angezeigt, und bei verbundenen Kameras 

in der zweiten Zeile die zeitliche Differenz (Shift) der Kamerasoszillatoren in µ Sekunden. In der 

zweiten Zeile auf der rechten Seite wird angezeigt, wie der Ladestand der Fernbedienungsbatteri- 

en ist. Dabei bedeutet ein Wert über fünf, dass die Batterien voll sind, ein Wert von drei oder vier 

bedeutet eine normale Kapazität und ein geringerer Wetr als drei deutet auf leere Batterien hin. 

Falls die Kapazität zu gering wird, wird in der oberen Zeile „empty battery“ angezeigt. 

Die Funktionen der Fernbedienung werden durch das Drücken der vier Taster ausgeführt. Da- 

bei sind die linken drei Taster Funktionstaster, der rechte Knopf wechselt Programme und besitzt 

eine Shift Funktion. Das bedeuet, das die initial existierenden Funktionen von Hereinzoomen, 

Herauszoomen und Aufnahme starten/beenden durch Drücken des rechten Knopfes gewechselt 

werden können. Durch einmaliges Drücken werden die Funktionen umgestellt und mit den drei 

linken Tastern können die Menüfunktionen der Kameras ausgewählt werden. Durch zweimaliges 

Drücken werden selbst belegbare Funktionen aktiviert. In jeder Programmauswahlstufe ist durch 

ein Drücken und Halten des rechten Tasters die Shiftfunktion aktiv, welche weitere Funktionen 

wie beispielsweise im Initialzustand das Ein/Ausschalten ermöglicht. Eine ebenfalls hinter der 

Shiftfunktion verborgene Resetfunktion kann genutzt werden, um die Einzelkameras kurz aus- 

und gleich wieder einzuschalten, um den Synchronlauf der Camcorder zu starten. 

Die weiteren Funktionen sind in der Bedienungsanleitung welche sich auf der, der Arbeit beilie- 

genden CD befindet, beschrieben. 

A.1.4 Anschluss an einen PC 

Über ein serielles Nullmodemkabel kann die Bedieneinheit mit einem PC verbunden werden. 

Wenn Änderungen an der Fernbedienung wie beispielsweise die Konfiguration der frei belegba- 

ren Funktionen oder das Auslesen von Daten sowie die grafische Darstellung einer Kurve, welche 

zeitabhängig die Synchronität der Kameras anzeigt, gewünscht wird, kann das Nullmodemkabel 

auf der rechten Seite der Bedieneinheit mit dem, mit PC gekennzeichneten Anschluss verbunden 

werden. Über die Software „3D-Lanc Communicator“ können dann die erwünschten Modifikatio- 

nen durchgeführt werden.

A.1. HINWEISE ZUR BEDIENUNG DER STEREOVIDEOKAMERA IV 

Soll die Kodierung der GPS-Daten verändert werden, kann ein Nullmodemkabel mit dem An- 

schluss des GPS-Empfängers verbunden werden und über die Software „TinyTrakConfig“ ver- 

schiedene Einstellungen getroffen werden. 

Die notwendigen Anwendungen befinden sich auf der CD, welche dieser Arbeit beiliegt. 

A.1.4.1 Programmierung der Fernbedienung 

Es besteht die Möglichkeit einzelne Funktionen der Fernbedienung zu verändern. Der dazu benö- 

tigte Quellcode der Fernbedienung befindet sich auf der der Arbeit beiliegenden CD. Die Program- 

mierung erfolgt über ein der Kamera beiliegendes Programmierkabel (vgl. Abbildung A.1.4.1), 

welches an den parallelen Anschluss eines Computers und an die Programmierschnittstelle der 

Fernbedienungsplatine angeschlossen wird. Um an die Programmierschnittstelle der Fernbedie- 

nungsplatine zu gelangen müssen die vier Schrauben, welche an den Ecken des Displays zu finden 

sind, gelöst werden und die Leiterplatte samt Display und Schaltern aus der Bedieneinheit genom- 

men werden. Die Programmierschnittstelle befindet sich rechts auf der Platine, wobei der strom- 

führende Pin der unterste ist. Es ist darauf zu achten, dass es sich um eine ISP-Programmierung 

handelt, bei der der Mikrokontroller nicht über den Programmieranschluss, sondern über die eige- 

ne Stomversorgung versorgt wird. 

Abbildung A.1: Abbildung des Programmierkabels zum Ändern der Fernbedienungsfirmware

A.1. HINWEISE ZUR BEDIENUNG DER STEREOVIDEOKAMERA V 

Epilepsiewarnung 

Bei einem sehr geringen Anteil der Bevölkerung können Fernsehbilder oder 

Videospiele, die Lichtblitze enthalten, epileptische Anfälle auslösen. 

Folgende Personenkreise sollten vor der Benutzung eines Stereoskopiesystems 

ärztlichen Rat einholen: 

• Kinder unter 5 Jahren 

• Personen, in deren Verwandtschaft bereits Fälle von Epilepsie aufgetreten sind 

• oder die selber an Epilepsie leiden 

• Personen, bei denen das Betrachten von Lichtblitzeffekten in der Vergangenheit 

schon einmal epileptische Anfälle oder Sinnesstörungen ausgelöst hat.

A.2. LANC PROTOKOLL VI 

A.2 LANC Protokoll 

Sony LANC TM Protokoll Parameter 

Adresse Wert Adresse Wert 

0 program 1 78 AUX 

2 program 2 7A slow + 

4 program 3 7C slow - 

6 program 4 7E 

8 program 5 80 

0A program 6 82 display mode 

0C program 7 84 menu up 

0E program 8 86 menu down 

10 program 9 88 tracking/fine + 

12 program 0 (10: SL-HF950 MKII) 8A tracking/fine - 

14 program 11 (SL-HF950 MKII) 8C counter reset 

16 enter, program 12 (SL-HF950 MKII) 8E zero mem 

18 program 13 90 index mark 

1A program 14 92 index erase 

1C program 15 94 shuttle edit + 

1E program 16 96 shuttle edit - 

20 program + 98 data code or goto 

22 program - 99 data code or recording parameters 

24 9A menu 

28 x2 9E input select 

2A power (or viewfinder) off A0 

2B photo write A2 execute 

2C eject A4 quick timer 

2E main/sub A6 index 

30 stop A8 

32 pause AA 

33 start/stop AC index search + 

34 play AE index search - 

35 tele (only CCD-V90) B0 tape speed 

36 rew B2 goto zero / tape return (not DV) 

37 wide (only CCD-V90) B4 counter display, data screen 

38 fwd B6 open/close (SL-HF950), replay (FauHaEss) 

39 photo capture B8 timer display 

3A rec BA 

3C rec-pause (some devices) BC 

3E BD date display off 

40 still BE 

42 BF date display on 

44 x1/10 C0 timer set 

46 x1/5 (sometimes: vis. scan) C2 menu right, next 

48 C4 menu left 

4A x14 C6 timer clear 

4C x9 C8 timer check 

4E tracking auto/manual CA timer record 

50 search - CC 

52 search + CE 

54 TV/VTR D0 audio dub 

58 D4 edit assemble 

5A VTR D6 edit mark 

5B date search / photo search / photo scan D8 synchro edit 

5E power off DC digital off (VCR), print (DV) 

60 rev frame DE speed + 

62 fwd frame E0 speed - 

64 E2 stop motion 

65 edit-search - E4 

66 x1 E6 

67 edit-search + E8 channel scan / flash motion 

69 rec-review (not i.e. TR-2200) EC voice boost 

6C sleep F0 

6E tracking normal F2 

74 rew+play F8 digital scan 

Auf nächster Seite fortgesetzt. . .

A.2. LANC PROTOKOLL VII 



76 FA high-speed-rew 

FC still/shuttle (EV-S880) 

Sub-Command in Byte 0: 

0010 1000 (bin) 

The following table shows the actual 

Command-Codes to the device. 

Only valid with the corresponding Sub- 

Command in Byte 0. 

0 variable speed zoom Tele: slowest speed 

2 variable speed zoom Tele: faster than 00 




0A variable speed zoom Tele: faster than 08 

0C variable speed zoom Tele: faster than 0A 

0E variable speed zoom Tele: fastest speed 

10 variable speed zoom Wide: slowest speed 

12 variable speed zoom Wide: faster than 10 




1A variable speed zoom Wide: faster than 18 

1C variable speed zoom Wide: faster than 1A 

1E variable speed zoom Wide: fastest speed 

25 Fader 

27 rec start (DV) 

29 rec stop (DV) 

30 variable speed zoom Tele (avoiding digital 

zoom, some cameras): slowest speed 


zoom, some cameras): faster than 30 



35 Zoom Tele slow (working all cameras since 

approx. 1996) 



37 Zoom Wide slow (working all cameras since 

approx. 1996) 



39 Zoom Tele fast (working all cameras since 

approx. 1996) 

3A variable speed zoom Tele (avoiding digital 


3B Zoom Wide fast (working all cameras since 

approx. 1996) 

3C variable speed zoom Tele (avoiding digital 

zoom, some cameras): faster than 3A 

3E variable speed zoom Tele (avoiding digital 

zoom, some cameras): fastest speed 

41 Auto-Focus on/off (not if there is a real 

switch at the camera) 

45 Focus manual far 

47 Focus manual near 

49 White balance toggle (not if white balance is 

selected via menu) 

4B Backlight (not DV) 

51 Backlight (DV) 

53 Exposure 

61 Shutter 

77 White balance reset (not if white balance is 

selected via menu) 

85 Memory impose (models of the early 90’s) 

Auf nächster Seite fortgesetzt. . .

A.3. MESSUNG DER SYNCHRONITÄT DER CAMCORDER VIII 



87 Color / Mode (models of the early 90’s) 

89 Superimpose (models of the early 90’s) 

Tabelle A.1: Steuerbefehle des LANC Protokoll nach [Boe07] 

Abbildung A.2: LANC Belegung des 2,5mm Klinken Steckers und LANC Symbol 

A.3 Messung der Synchronität der Camcorder 

Zeit Versatz Zeit Versatz 

s µs s µs 

0 19 660 278 

10 17 900 446 

20 28 1200 710 

30 28 1500 1043 

40 29 1800 1440 

50 32 2100 1892 

60 36 2400 2410 

90 36 2700 2987 

120 45 3000 3626 

180 63 3300 4325 

240 84 3600 5044 

300 98 3900 5743 

420 156 4200 6467 

540 208 

Tabelle A.2: Messdaten der Synchronität der Camcorder (Auszug)

A.4. KOSTENAUFSTELLUNG FÜR DIE ENTWICKELTE STEREOVIDEOKAMERA IX 

A.4 Kostenaufstellung für die entwickelte Stereovideokamera 

Anzahl Preis 

Kameras Sony HDR-SR1E 2 2499,98 Euro 

Halterung: 

Halterungsrahmen 1 61,22 Euro 

Servomotoren 2 129,90 Euro 

Servo Differenzierbaustein 1 24,20 Euro 

Aluminium Platten 2 3,38 Euro 

diverse Schrauben ca. 60 22,7 Euro 

Winkel und Griffe je 2 11,87 Euro 

Befestigungsmaterial 2,76 Euro 

Schnellwechseladapter 2 121,55 Euro 

Bedieneinheit: 

Wendelpotentiometer: 1 

Audiokabel und Stecker 3 10,47 Euro 

Verlängerungskabel 2 6,98 Euro 

TinyTrak3Plus Bausatz 1 83,40 Euro 

GPS-Empfänger 1 49,95 Euro 

Adapterkabel fuer GPS Empfänger 1 11,45 Euro 

Bauelemente der Fernbedienung ca. 90 89,23 Euro 

Diverse Batterien 12 16,9 Euro 

Summe: 3145,94 Euro 

Tabelle A.3: Kosten für die Stereovideokamera incl. 19% MwSt.

A.4. KOSTENAUFSTELLUNG FÜR DIE ENTWICKELTE STEREOVIDEOKAMERA X 

Abkürzungsverzeichnis 

µs Mikrosekunde 

AP I Advanced Programming Interface (Programmierschnittstelle) 

AP RS Automatic Positioning/Packet Reporting System 

AV CHD Advanced Video Codec High Definition 

BAS Bild Austast-Synchron Signal 

bspw. beispielsweise 

ca. circa 

cm Zentimeter 

CP U Central Processing Unit, (Hauptprozessor) 

DivX Digital Video Express 

DT MF Dual Tone Multiple Frequency (Doppeltonmehrfequenz, Mehrfrequenz- 

wahlverfahren) 

DV Digital Video 

DV B Digital Video Broadcasting 

DV I Digital Visual Interface 

EXIF Exchangeable Image File Format 

F BAS Farb-Bild-Austast-Synchron-Signal 

ggf. gegebenenfalls 

GHz Giga Herz 

GP S Global Positioning System 

GP U Graphic Processing Unit, (Grafikprozessor) 

HDMI High Definition Multimedia Interface 

HDT V High Definition Television 

HDV High Definition Video 

Hz Herz (Einheit der Frequenz) 

ISO International Organization for Standardization 

IT U International Telecommunikation Union 

IT U − R International Telecommunikation Union - Radiocommunication 

kbit Kilobit 

LANC Local Application Control Bus System 

LP/SP Aufnahme long play/standard play (Bandgeschwindigkeit bei der Aufnahme) 

m Meter 

MAZ Magnetische Aufzeichnung 

Mbps Megabit pro Sekunde (Datenübertragungsrate)

A.4. KOSTENAUFSTELLUNG FÜR DIE ENTWICKELTE STEREOVIDEOKAMERA XI 

MOF D Maximum on film deviation, Maximale Deviation auf dem Film (Bild- 

sensor) 

MP 3 MPEG-1 Audio Layer 3 (Dateiformat zur verlustbehafteten Audiokom- 

pression) 

MP EG Moving Picture Experts Group 

MP EG − 4 Standardisiertes Containerformat der MPEG 

ms Millisekunde 

NMEA National Marine Electronics Association 

NT SC National Television System Committee 

Ogg Container Dateiformat für Multimedia-Dateien 

OGM Ogg Media 

P AL Phase Alternating Line 

P C Personal Computer 

P DA Personal Digital Assistant 

S − V ideo Separate Video 

SCART Syndicat des Constructeurs d’Appareils Radiorécepteurs et Téléviseurs 

SDI Serial Digital Interface 

SMP T E Society of Motion Picture and Television Engineers 

T BC Time Base Corrector 

UKW Ultrakurzwelle 

V CR Video Cassette Recorder 

V DR Video Disk Rekorder (Harddiskrekorder, Festplattenrekorder) 

V ESA Video Electronics Standards Association 

V fW Video for Windows 

vgl. vergleiche 

V HS Video Home System 

V T R Video Tape Recorder 

W DM Windows Driver Model - (Treiberschnittstelle) 

XML Extendet Markup Language 

z.B. zum Beispiel 

z.Zt. zur Zeit

Literaturverzeichnis XII 

Literaturverzeichnis 

[Alb92] ALBERT, S. Pastoor M. Wöpking J. Fournier T.: Digital stereoscopic imaging & app- 

lications. 1992. – Report of a DISTIMA Project, RACE 2- R2045, DISTIMA Deliver- 

able 26 

[AP95] AZARBAYEJANI, A. ; PENTLAND, A.: Camera selfcalibration from one point cor- 

respondence. 1995. – MIT media laboratory, perceptual computing technical report 

Nr.341, 1995. 

[ATV00] A. FUSIELLO ; TRUCCO, E. ; VERRI, A.: A Compact Algorithm for Rectification of 

Stereo Pairs. In: Machine Vision and Applications 12 (2000), Nr. 1, S. 16–22 

[Bar07] BARTHEL, Prof. Dr. Kai U.: Farbsysteme (2). PDF. 2007. – http: 

//www.f4.fhtw-berlin.de/~barthel/veranstaltungen/SS07/ 

Mete1/vorlesungen/Farbsysteme.pdf [Stand:21.05.2007] 

[Ber98] BERCOVITZ, J.: Image-Side Perspective and Stereoscopy. Paper. 1998. – in Stereos- 

copic Displays and Virtual Reality Systems V, S. Fisher, J. Merritt, M. Bolas, Editors, 

Proceedings of the SPIE vol. 3295, Lawrence Berkeley National Laboratory, Berkeley, 

CA 

[Ber04] BERGER, Klaus: Einführender Vergleich in die Korrespondenzanalyse. 2004. – For- 

schungsbericht. Technische Universität Wien, Proseminar „Grundlagen wissenschaft- 

lichen Arbeitens“ 

[Blo07] BLOOS, Werner: ste-fra R○CAM. Webseite. 2007. – http://www.digi-dat.de/ 

produkte/ [Stand:12.05.2007] 

[Boe07] BOEHMEL, Manfred: SONY Protokolle. Webseite. 2007. – http://www. 

boehmel.de/protocl.htm [Stand:12.02.2007] 

[CD07] 21ST CENTURY 3D: 21st Century 3D: 3DVX3.5, Adds Hyperstereo and Solid 

State Recording. (2007). – http://www.21stcentury3d.com/press/ 

pr-070130-3dvx35.html [Stand:02.06.2007] 

[Cro07] CROCKETT, R.: LANC Shepherd, Wired Remote for Stereo Video and Digital Stereo 

Photography. Webseite. 2007. – http://www.ledametrix.com/lancshep/ 

index.html [Stand:10.04.2007] 

[Dai07] DAIMLERCHRYSLER, Infitec: DaimlerChrysler, Infitec, Wellenlängenmultiplex Vi- 

sualisierungssysteme, 2007. – http://www.infitec.net/infitec.pdf 

[Stand:02.04.2007]

Literaturverzeichnis XIII 

[DAK06] DOUGLAS A. KERR, P.E. Derivation of the „Cosine Fourth“ Law for Falloff of Illu- 

minance Across a Camera Image. Paper. 2006 

[DFS07] 3D-FOTO-SHOP: 3D Foto Shop, 3D- Ausrüstungen, 3D Grafiken, 3D Bil- 

der, 3D-Kameras. Webseite. 2007. – http://www.3d-foto-shop.de/ 

pi-615054883.htm?categoryId=7 [Stand:02.06.2007] 

[Die07] DIENSTLEISTUNGEN, Digi D.: Digi Dat, Dienstleistungen - Anlagen - Technik. 

Webseite. 2007. – http://www.digi-dat.de/produkte/index.html# 

stefraLANC [Stand:10.04.2007] 

[Eli07] ELIASON, Eric: The EQUIRECTANGULAR projection. Webseite. 2007. 

– http://hirise-pds.lpl.arizona.edu/PDS/CATALOG/DSMAP.CAT 

[Stand: 20.06.2007] 

[Eng07] ENGLUND, Malin: The Ultimate Homebuild Stabilizers. Webseite. 2007. – http: 

//www.cafepress.com/stabilizer [Stand: 12.06.2007] 

[Gir01] GIRODB, Marcus Magnora Peter Eiserta B.: Multi-View Image Coding with Depth 

Maps and 3-D Geometry for Prediction, 2001. – Telecommunications Laboratory, Uni- 

versity of Erlangen-Nuremberg, Informations Systems Laboratory, Stanford University 

[Gmb07] MORE3D GMBH: More3d SoftwareSuite, MoreVideo. Webseite. 2007. – http: 

//www.more3d.de/german/morevideo_d.htm [Stand:15.05.2007] 

[GMR07] GRAPHIC MEDIA RESEARCH, Cannon F.: 3D Camera Slidebar. Webseite. 2007. – 

http://www.pokescope.com/cameras/ [Stand:12.05.2007] 

[Her07] HERBIG, Gerhard P.: Infos rund um die Stereoskopie und Stereofotografie. Websei- 

te. 2007. – http://www.herbig-3d.de/german/stereofotografie_ 

frame.htm?own [Stand:30.03.2007] 

[Hes10] HESS, Carl: Die Reaktion und Akkomodation des menschlichen Auges und ihre Anoma- 

lien. 3. neubearb. Auflage. 1910 

[Hof05] HOFMANN, O.P. Burmeister M.G. Litza M. Nitschke U.: Synchronous stereo-video and 

biosignal recording - a basic setup for Human-Computer-Interface applications. 2005. 

– In: IEEE Proceedings of the 2nd Int’l Conference on Neural Engineering 

[IDS07] IO DISPLAY SYSTEMS, LLC: NuView Camcorder Adapter. Webseite. 

2007. – http://i-glassesonline.stores.yahoo.net/nuview.html 

[Stand:15.06.2007] 

[IG07] ITEM INDUSTRIETECHNIK GMBH: item, Online Katalog, Winkelgetriebe WG 180 ◦ D. 

2007. – http://catalog.item-international.com/Onlinekatalog/ 

?sprache=DE [Stand:25.06.2007] 

[inc07a] INC., 3DCombine: 3DCombine. Webseite. 2007. – http://www.3dcombine. 

com/ [Stand:12.06.2007]

Literaturverzeichnis XIV 

[Inc07b] INC., Spatial V.: Spatial View, SVI 19” Series - the Affordable. PDF. 2007. 

– http://www.spatialview.com/products.cfm?cat=100&id=190 

[Stand:02.04.2007] 

[Int06] INTEL, Corporation: Open Source Computer Vision Library. Webseite. 2006. 

– http://www.intel.com/technology/computing/opencv/index. 

htm, [Stand 20.06.2007] 

[ISO04] ISO/IEC 14496, Information technology – Coding of audio-visual objects, 2004. 

– http://www.iso.org/iso/en/StandardsQueryFormHandler. 

StandardsQueryFormHandler?scope=CATALOGUE&sortOrder= 

ISO&committee=ALL&isoDocType=ALL&title=true&keyword=14496 

[Stand: 08.06.2007] 

[Koc93] KOCH, A. Woods T. Docherty R.: Image Distortions in Stereoscopic Video Systems. 

1993. – in Stereoscopic Displays and Applications IV, John O. Merrit, Scott S. Fisher, 

Editors, Proc. SPIE 1915, pp. 36-48, 1993. 

[Lac95] LACOTTE, B.: Elimination of keystone and crosstalk effects in stereoscopic video, 

1995. – in stereoscopic video, Tech. Rep. 95-31, INRS-Telecommunications, Universite 

du Quebec, Institut national de la recherche scientique 

[Lüd05] LÜDTKE, Robin: Multimediaschnittstelle Microsoft DirectShow, Bergakademie Frei- 

berg, Diplomarbeit, 2005 

[Mad07] MADDY, R.: PuppetKites.net,Depth of Field/Circle of Confusion an Indicator of Op- 

timum Deviation? Webseite. 2007. – http://www.puppetkites.net/blog/ 

archives/31 [Stand:02.04.2007] 

[Med07] MEDIAGROUP, TMP: TMP Mediagroup 3D Produktion in 3D Stereo- Virtuelle 

Realität- 3D Filmproduktion- Powerwall. Webseite. 2007. – http://www. 

tmp-mediagroup.de/ [Stand:02.06.2007] 

[Mic86] MICHAEL, Lukacs: Predictive coding of multi-viewpoint image sets. 1986. – Proc. on 

ICASSP 86 

[MPE01] MPEG.ORG: Motion Picture Experts Group, Test Model 5. 2001. – http://www. 

mpeg.org/MPEG/MSSG/#source [Stand:4.06.2007] 

[Mü02] MÜHLMANN, Dipl.-Ing. K.: Design und Implementierung eines Systems zur schnellen 

Rekonstruktion dreidimensionaler Modelle aus Stereobildern, Diss., 2002. – Universi- 

tät Mannheim, Fakultät für Mathematik und Informatik 

[N1V05] N1VG.NET: OpenTracker Projekt. Webseite. 2005. – http://n1vg.net/ 

opentracker/ [Stand:19.06.2007] 

[Naj05] NAJAR, K.: Computational Cameras: Convergence of Optics and Software, 2005. – 

International Conference on Computer Graphics and Interactive Techniques, Boston, 

Massachusetts, Article No. 6

Literaturverzeichnis XV 

[NVI01] NVIDIA, Corporation: DRIVERS FOR WINDOWS, NVIDIA 3D Stereo User’s Guide, 

Revision 2.0. (NVIDIA Webseite). 2001. – http://www.nvidia.de/object/ 

LO_20011212_3592.html [Stand:29.05.2007] 

[Pac07] PACE: Pace Fusion 3d camera system. Webseite. 2007. – http://www.pacehd. 

com/ [Stand:02.06.2007] 

[Pas87] PASTOOR, Siegmund: Bevorzugte Betrachtungsbedingungen bei großformatigem 2D- 

und 3D-Standbildern. Psychooptische Begründung für einen 3DTV Standard. 1.Aufla- 

ge. 1987 

[Pro07a] PRODUCTS, Berezin Stereo P.: Adjustable - Twin Vertical Mount. Websei- 

te. 2007. – http://www.berezin.com/3d/slidebars.htm#Photo3D 

[Stand:12.05.2007] 

[Pro07b] PRODUCTS, Berezin Stereo P.: Fixed - Twin Vertical Mount. Webseite. 2007. – http: 

//www.berezin.com/3d/slidebars.htm#Photo3D [Stand:12.05.2007] 

[Pro07c] PRODUCTS, Berezin Stereo P.: Heavy Duty Slide Bars. Webseite. 2007. – http: 

//www.berezin.com/3d/slidebars.htm#Photo3D [Stand:12.05.2007] 

[PS07] PHOTO-SONICS, Inc.: Photo-Sonics Inc., V-Data Video Accessories. Webseite. 2007. 

– http://photosonics.com/Sales_HTLM/Downloads/VED-M_Data_ 

Sheet.pdf [Stand:13.02.2007] 

[PTJE07] PHOTO TOOLS JASPER ENGINEERING, California: Twin Camera Bar. Websei- 

te. 2007. – http://www.stereoscopy.com/jasper/twin-bar.html 

[Stand:12.05.2007] 

[Qui07] QUICK, Dr. P.: KMQ In die 3. Dimension. Webseite. 2007. – http:// 

www.kmq3d.de/In_die_3__Dimension/in_die_3__dimension.html 

[Stand:02.04.2007] 

[RHS07] RED HEN SYSTEMS, Inc.: Red Hen Systems, Video Collection Hardware - VMS-X. 

Webseite. 2007. – http://www.redhensystems.com/products/video_ 

collection_hardware/default.asp?sm=1 [Stand:12.02.2007] 

[Rub07] RUBIO, David: DR-3D Home, David Rubio Discussion Forum. Webseite. 2007. – 

http://www.davidrubio3d.com/ [Stand:02.06.2007] 

[Sch05] SCHÖNFELD, Jochen: Die Stereoskopie, Zu ihrer Geschichte und ihrem medialen Kon- 

text, Fakultät für Kulturwissenschaften der Universität Tübingen, Kunsthistorisches In- 

stitut, Diplomarbeit, 2005 

[Sch07] SCHULTE, D.: Welt der Stereoskopie. Webseite. 2007. – http://www. 

stereoskopie.com/Stereoskopie__Theorie_und_Prax/Aus_der_ 

Fruhgeschichte_der_Ste/body_aus_der_fruhgeschichte_der_ 

ste.html [Stand:13.04.2007]

Literaturverzeichnis XVI 

[Som05] SOMIESKI, Katharina: Aufbau eines Forschungsplatzes für die geometrische Stereo- 

analyse, Technische Universität Dresden, Institut für künstliche Intelligenz, Lehrstuhl 

Erkennende Systeme und Bildverarbeitung, Diplomarbeit, 2005 

[Sta07] STARKS, Michael: SpaceBar. Webseite. 2007. – http://www.3dmagic.com/ 

catalog/solidcamhd.html [Stand:12.05.2007] 

[Sut07] SUTO, Masuji: StereoMovie Maker. Webseite. 2007. – http://stereo.jpn. 

org/eng/stvmkr/ [Stand:12.06.2007] 

[Vid07] VIDEO, B&H P.: Steadicam F24VLBHS Flyer-24 Camera Stabilizer (NTSC/PAL) with 

V-Lock Mount. 2007. – 

B&H Photo Video New York, N.Y. 10001http://www.bhphotovideo.com/c/ 

product/446403-REG/Steadicam_F24VLBHS_F24VLBHS_Flyer_24_ 

Camera_Stabilizer.html/kw/STF24IDXBPCV [Stand: 12.06.2007] 

[Vie65] VIERLING, Otto: Die Stereoskopie in der Photographie und Kinematographie. 1.Auf- 

lage. 1965 

[Vik03] VIKTOR, Nordling: Efficient Compression of Stereoscopic Video Using the MPEG 

Standard, Royal Institute of Technology, SE-100 44 Stockholm, Sweden, Diplomarbeit, 

2003 

[Vra06] VRANCIC, D.: 3D Lanc Master, LANC remote controller for stereoscopic camcorders 

/ still cameras, Department of Systems and Control, J. Stefan Institute, Ljubljana, Di- 

plomarbeit, 2006 

[Weh07] WEHRLI, P.: Polarisation von Licht. Webseite. 2007. – http: 

//homepage.hispeed.ch/philipp.wehrli/Physik/Klassische_ 

Physik/Polarisation_von_Licht/polarisation_von_licht.html 

[Stand:02.04.2007] 

[Wik07a] WIKIPEDIA: Wikipedia, Die freie Enzyklopädie, Video for Windows. Webseite. 

2007. – http://de.wikipedia.org/w/index.php?title=Video_for_ 

Windows&oldid=19305333 [Stand:15.05.2007] 

[Wik07b] WIKIPEDIA: Wikipedia, Die freie Enzyklopädie, VR-Helm. Webseite. 2007. 

– http://de.wikipedia.org/w/index.php?title=VR-Helm&oldid= 

27012018 [Stand:02.04.2007] 

[Wim04] WIMMER, Dipl. Ing. P.: Aufnahme und Wiedergabe stereoskopischer Videos im Anwen- 

dungsbereich der Telekooperation, Johannes Kepler Universität Linz, Diss., 2004 

[Wim07] WIMMER, Peter: 3dtv.at, Stereoscopic Multiplexer und Stereoscopic Player. Webseite. 

2007. – http://www.3dtv.at [Stand:12.06.2007] 

[Yan95] YANG, Cheng H.: Geometric Models in Stereoscopic Video, 1995. – Universite du 

Quebec, Institut national de la recherche scientifique, in INRS-Telecommunications 

[Zha98] ZHANG, Zhengyou: A Flexible New Technique for Camera Calibration., 1998. – Tech- 

nischer Bericht MSR-TR-98-71, Microsoft Research

Abbildungsverzeichnis XVII 

Abbildungsverzeichnis 

1.1 Abbildung der Stereoprojektionsleinwand des Lehrstuhls Computergrafik und Vi- 

sualisierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 

1.2 Abbildung der zwei Projektoren mit Polarisationsfiltern . . . . . . . . . . . . . . 8 

2.1 Querdisparation und Parallaxe . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 

2.2 Stereoskopisches Scheinfenster . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 

2.3 Radialer Spiegelvorsatz und aufgenommenes Bild mit eingezeichneten Strahlen- 

gängen aus [Naj05] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 

2.4 Stereoskopische Aufnahme und Wiedergabe . . . . . . . . . . . . . . . . . . . . 21 

2.5 Epipolargeometrie nach [ATV00] . . . . . . . . . . . . . . . . . . . . . . . . . . 24 

2.6 Aufnahme mit konvergierenden und parallelen Kameraachsen . . . . . . . . . . 25 

2.7 Bestimmung der Koordinaten eines Objektpunktes für den linken Bildsensor nach 

[Lac95] wobei COkl = fk, CH = X0, MG = Y0, GH = Z0, ∠CEO = 

∠CGH = α und ∠CF O = γ ist. . . . . . . . . . . . . . . . . . . . . . . . . . 26 

2.8 Finden der linken korrigierten Ebene S’ bei Schrägprojektion (nach [Lac95]), 

a)zweidimensionale Abbildung b)dreidimensionale Abbildung . . . . . . . . . . 27 

2.9 Schematische Darstellung der Projektion eines virtuellen Objektes. . . . . . . . . 30 

2.10 Funktionsprinzip der Infitec Interferenzfiltertechnik aus [Dai07] . . . . . . . . . 35 

2.11 Randlichtabfall bei Nutzung von Projektoren. a) Mittige Projektion b) Schrägpro- 

jektion c) Schrägprojektion auf spezielle Leinwand . . . . . . . . . . . . . . . . 38 

2.12 Schematische Darstellung einer a) konvergenten Aufnahme, b) parallelen Aufnah- 

me und des c) nicht linearen Tiefeneindruck. Nach [Koc93] . . . . . . . . . . . 39 

3.1 21st Century 3DVX3 Kamera [CD07] . . . . . . . . . . . . . . . . . . . . . . . 41 

3.2 Stereokamera basierend auf zwei Mini-DV Camcordern [DFS07] . . . . . . . . . 42 

3.3 Stereokamera basierend auf zwei Industriekameras [Rub07] . . . . . . . . . . . 43 

3.4 NuView Adapter zur zeitsequentiellen Aufnahme von Stereobildpaaren [IDS07] . 44 

4.1 VMS-X: Aufnahme der GPS Informationen durch einen „Active Interface Shoe R○ “ 

[RHS07] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 

4.2 Model VED-M: Annotieren von Videobildern mit GPS Informationen [PS07] . . 53 

4.3 Vierkanal Surround Mikrofon (Eigenentwicklung) . . . . . . . . . . . . . . . . . 54 

4.4 ste-fra R○ CAM: Halterung für 2 Kameras . . . . . . . . . . . . . . . . . . . . . 58 

4.5 Entwurf einer Kamerahalterung mit Winkelgetrieben. . . . . . . . . . . . . . . . 59 

4.6 Schematische Darstellung der Justierung um Stereobasen unter 8,2 cm zu erreichen. 59

Abbildungsverzeichnis XVIII 

4.7 Abbildung eines Stereobildpaares mit einer Stereobasis von 6 cm. . . . . . . . . 60 

4.8 Halterung der Einzelkameras an der Stereokamera und Bedieneinheit . . . . . . . 60 

4.9 Ausgabe des Justierungsprogrammes . . . . . . . . . . . . . . . . . . . . . . . . 62 

4.10 Anwendung des Tesprogramms um die synchronität der Grafikkartenausgänge zu 

testen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 

4.11 LANC Shepherd: Fernbedienung zur Steuerung zweier Kameras über das LANC 

Protokoll [Cro07] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 

4.12 3DLANCMaster: selbst entwickelte Fernbedienung nach Anleitung von [Vra06] . 65 

4.13 Diagramm des zeitlichen Verlaufs der Synchronität beider Camcorder. Die X- 

Achse stellt die abgelaufene Zeit in Sekunden und die Y-Achse die Differenz der 

Timingsignale zwischen den Camcordern in µ-Sekunden dar. . . . . . . . . . . . 67 

4.14 TinyTrak3: Konverter zur Transformation serieller Daten in Audiodaten. . . . . . 68 

4.15 GPS-Maus: serieller Global Positioning System Empfänger. . . . . . . . . . . . 69 

4.16 Kamerakalibrierung nach [Zha98] der linken Kamera des Stereosystems für die 

geringste Brennweite. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 

4.17 Koordinatensysteme bei der Abbildung nach [Som05] . . . . . . . . . . . . . . . 72 

4.18 Kalibrierungsaufnahme mit Schachbrettmuster einer Einzelkamera des Stereosy- 

stems. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 

4.19 Transformation des globalen Koordinatensystems in das Koordinatensystem der 

linken Kamera (nach [Mü02]) . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 

5.1 Darstellung eines DirectShow Filtergraphen im Programm Graphedit. . . . . . . 77 

5.2 Darstellung der Speicherverwaltung und Medientypenvermittlung nach [Lüd05] . 79 

5.3 Darstellung des „Side-by-Side Formates“. . . . . . . . . . . . . . . . . . . . . . 80 

5.4 Berichtigte (oben) und originale Szenerie (unten) einer konvergenten Aufnahme 

mit 12 Grad Konvergenzwinkel in Anaglyphentechnik (Rot-Grün) . . . . . . . . 82 

5.5 Darstellung des Filtergraphen bei Verwendung des Rektifizierungsfilters. . . . . . 83 

5.6 Darstellung des Filtergraphen bei Verwendung eines dualen Eingabefilters. . . . . 83 

5.7 Darstellung des Filtergraphen zur Nutzung des Anaglyph Transform Filters und 

dessen Einstellungsdialog. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 

5.8 Echtes Rot-Cyan Anaglyphenbild . . . . . . . . . . . . . . . . . . . . . . . . . 86 

5.9 Graues Anaglyphen Bild. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 

5.10 Farbiges Anaglyphen Bild. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 

5.11 Darstellung eines Filtergraphen bei Verwendung des Stereowiedergabefilters . . . 88 

5.12 Screenshot der Anwendung Flexnet-Soundmodem . . . . . . . . . . . . . . . . . 90 

5.13 Kodierung von mehreren Ansichten eines Bildes durch eine Tiefenkarte aus [Gir01], 

a) Erzeugung der Tiefenkarte b) Berechnung einer Ansicht durch eine Tiefenkarte 92 

5.14 Folge von I,P, und B- Bildern bei der Kompression von stereoskopischen Video 

(nach [Vik03]) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 

6.1 Abbildung des Sterovideokamerasystems . . . . . . . . . . . . . . . . . . . . . 95 

6.2 Panorama Aufnahme mit Hilfe einer gestauchten Halbkugel (nach [Naj05]) . . . 96

Abbildungsverzeichnis XIX 

6.3 Schwebestativ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 

A.1 Abbildung des Programmierkabels zum Ändern der Fernbedienungsfirmware . . IV 

A.2 LANC Belegung des 2,5mm Klinken Steckers und LANC Symbol . . . . . . . . VIII

Tabellenverzeichnis XX 

Tabellenverzeichnis 

4.1 HDV taugliche Aufnahmemedien und deren Formate. . . . . . . . . . . . . . . . 49 

4.2 Vergleich von Sony Camcordern. . . . . . . . . . . . . . . . . . . . . . . . . . . 56 

A.1 Steuerbefehle des LANC Protokoll nach [Boe07] . . . . . . . . . . . . . . . . . VIII 

A.2 Messdaten der Synchronität der Camcorder (Auszug) . . . . . . . . . . . . . . . VIII 

A.3 Kosten für die Stereovideokamera incl. 19% MwSt. . . . . . . . . . . . . . . . . IX

Danksagung 

XXI 

Hiermit möchte ich mich bei allen Beteiligten für die Unterstützung im Zeitraum der Erstellung 

der Diplomarbeit bedanken. 

Besonderer Dank gilt Herrn Prof. Dr. Gumhold für die interessante Aufgabenstellung und die Be- 

treuung dieser Arbeit. 

Weiteren Dank möchte ich dem Lehrstuhl Computergrafik und Visualisierung an der Informatik- 

fakultät der TU-Dresden für die Möglichket der Realisierung der Diplomarbeit sowie der Bereit- 

stellung der Technik aussprechen. 

Einen besonderen Dank an Thomas Melde und Robert Weser, dien mich in elektrotechnischen 

Fragen unterstützt haben. 

Nicht zuletzt danke ich meinen Eltern, die mir das Studium erst ermöglicht haben, meinem Bru- 

der und allen meinen Freunden für ihre Unterstützung und ihr Verständnis dafür, dass ich in den 

letzten Monaten nicht immer Zeit für sie hatte.

Erklärungen zum Urheberrecht 

XXII 

• „ACVHD“ und das „ACVHD“- Logo sind Markenzeichen der Matsushita Electric Industrial 

Co., Ltd und der Sony Corporation. 

• „Dolby“ und das Doppel-D-Symbol sind Marken von Dolby Laboraties. 

• „Microsoft“, „Windows“, „DirectX“ und „DirectShow“ sind Markenzeichen oder eingetra- 

gene Markenzeichen der Microsoft Corporation in den USA und in anderen Ländern. 

• „MacOS“ und „QuickTime“ sind Markenzeichen oder eingetragene Markenzeichen der Ap- 

ple Inc. in den USA und in anderen Ländern. 

• „HDMI“, das HDMI-Logo und „High-Definition Multimedia Interface“ sind Markenzei- 

chen oder eingetragene Markenzeichen von HDMI Licensing LLC. 

• „Intel“, „Intel Core“ und „Pentium“ sind Markenzeichen der Intel Corporation oder ihrer 

Tochtergesellschaften in den USA und anderen Ländern. 

• „Adobe“ und „Adobe Reader“ sind Markenzeichen der Adobe Systems Incorporated. 

• „Christie“ und „Christie DS+26“ sind Markenzeichen oder eingetragene Markenzeichen der 

Christie Digital Systems, Inc. 

• „3D Studio Max“, „3ds Max“ und „Maya“ sind Markenzeichen oder eingetragene Marken- 

zeichen der Autodesk Incorporated in den USA und in anderen Ländern. 

• „NVIDIA“, das NVIDIA-Logo, „Forceware“ und „Quadro“ sind Markenzeichen oder ein- 

getragene Markenzeichen der NVIDIA Corporation. 

• “Wrigley’s“ und „Wirgley’s Spearmint“ sind Markenzeichen oder eingetragene Markenzei- 

chen der Wirgley Corporation oder ihrer Tochtergesellschaften in den USA und anderen 

Ländern. 

Alle anderen in diesem Dokument erwähnten Produktnamen können Markenzeichen oder einge- 

tragene Markenzeichen der jeweiligen Eigentümer sein. Nicht alle Markenzeichen und eingetra- 

gene Markenzeichen sind mit R○ oder TM gekennzeichnet, was nicht zu der Annahme berechtigt, 

diese Namen seien im Sinne der Warenzeichen- und Markenschutz- Gesetzgebung als frei zu be- 

trachten und dürften daher von jedermann benutzt werden.

Entwicklung eines portablen Stereo-Videoaufnahmesystems für die ...

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?