27.01.2015 Views

ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΠΑΤΡΩΝ - Nemertes

ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΠΑΤΡΩΝ - Nemertes

ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΠΑΤΡΩΝ - Nemertes

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Κεφάλαιο 8: Τρισδιάστατη ανακατασκευή<br />

Κεφάλαιο 8: Τρισδιάστατη ανακατασκευή<br />

8.1 Εισαγωγή<br />

Στο προηγούμενο κεφάλαιο αναπτύξαμε αναλυτικά τη διαδικασία εκτίμησης του βάθους<br />

της σκηνής. Το βάθος είναι το πιο σημαντικό στοιχείο, αφού ‘αποτελεί’ την τρίτη διάσταση της<br />

φωτογραφίας. Πρακτικά λοιπόν, συνδυάζοντας τις φωτογραφίες που έχουμε από την πειραματική<br />

διαδικασία και τα αποτελέσματα για το βάθος, μπορούμε να αναπαραστήσουμε την τρισδιάστατη<br />

πλέον εικόνα.<br />

Βασική προϋπόθεση της τρισδιάστατης ανακατασκευής είναι η διόρθωση των εικόνων<br />

(image rectification). Έχει αναφερθεί ότι στην παρούσα εργασία αυτή η διαδικασία δε θα έπρεπε να<br />

μας απασχολήσει αφού θεωρούμε τη μετατόπιση στον άξονα των y μηδενική. Εντούτοις, όπως<br />

αποδείχτηκε και από τα αποτελέσματα των πειραμάτων, αυτό είναι πρακτικά αδύνατο όταν<br />

χρησιμοποιείται μία κάμερα για τη λήψη των φωτογραφιών. Επομένως είμαστε υποχρεωμένοι να<br />

διορθώσουμε τη δεξιά εικόνα σε σχέση με την αριστερή, ώστε να αναιρέσουμε οποιοδήποτε<br />

σφάλμα έχει δημιουργηθεί στον κατακόρυφο άξονα.<br />

Με τις εικόνες πλέον διορθωμένες, τους κατάλληλους αλγορίθμους και τις κατάλληλες<br />

μεθόδους διόρθωσης σφαλμάτων, μπορούμε να αναπαραστήσουμε ένα μεγάλο μέρος της σκηνής<br />

που απεικονίζεται σε ένα ζεύγος φωτογραφιών. Δε θα αναφερθούμε στον τρόπο λειτουργίας των<br />

αλγορίθμων αυτών καθώς η πολυπλοκότητά τους είναι μεγάλη και φεύγει από τα πλαίσια αυτής της<br />

εργασίας.<br />

8.2 Διόρθωση εικόνων<br />

Η στερεοσκοπική όραση χρησιμοποιεί την τριγωνοποίηση βάσει της επιπολικής γεωμετρίας<br />

για να καθορίσει την απόσταση ενός αντικειμένου. Έχει προαναφερθεί ότι το δυσκολότερο σημείο<br />

της διαδικασίας της τρισδιάστατης ανακατασκευής είναι η αντιστοίχιση των σωστών σημείων<br />

μεταξύ των δύο εικόνων. Οι αλγόριθμοι μπορούν να ψάχνουν και στις δύο διαστάσεις x και y.<br />

Επειδή όμως στο στάδιο της ανακατασκευής, η έρευνα αυτή γίνεται pixel-to-pixel, το υπολογιστικό<br />

κόστος είναι τεράστιο. Επομένως για να περιορίσουμε τόσο το κόστος, όσο και τα δεδομένα,<br />

μετατρέπουμε το δισδιάστατο αλγόριθμο σε μονοδιάστατο ώστε να ψάχνει για σωστές<br />

αντιστοιχίσεις μόνο κατά μήκος του οριζόντιου άξονα. Για αυτό το λόγο είναι απαραίτητο οι<br />

φωτογραφίες να είναι απόλυτα ευθυγραμμισμένες μεταξύ τους, το οποίο επιτυγχάνεται με<br />

μετασχηματισμό των συντεταγμένων της δεξιάς εικόνας, σε σχέση με την αριστερή.<br />

Αν δεν υπάρχουν γεωμετρικές παραμορφώσεις λόγω του φακού, αυτός ο μετασχηματισμός<br />

είναι γραμμικός. Ουσιαστικά μετακινείται η δεξιά εικόνα στους άξονες x,y ώστε να βρεθεί στο ίδιο<br />

επίπεδο με την αριστερή εικόνα και αν έχουν διαφορετικό μέγεθος, αλλάζει κλίμακα ώστε να είναι<br />

ισομεγέθεις. Στη συνέχεια περιστρέφονται τα pixel γύρω από τον άξονα των z και με την εφαρμογή<br />

του συντελεστή απόκλισης, ευθυγραμμίζονται απευθείας. Επειδή όμως οι κάμερες έχουν<br />

γεωμετρικές παραμορφώσεις, ο μετασχηματισμός είναι πιο πολύπλοκος. Ουσιαστικά<br />

ευθυγραμμίζει τις επιπολικές ευθείες όλων των σημείων οι οποίες εντέλει είναι παράλληλες με τον<br />

οριζόντιο άξονα και τα επίπολα των δύο καμερών βρίσκονται στο άπειρο (σχήμα 8.1).<br />

80

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!