06.05.2013 Views

Pełen tekst pracy (~3,8MB)

Pełen tekst pracy (~3,8MB)

Pełen tekst pracy (~3,8MB)

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

ROZDZIA̷L 3. PROBLEMY PRZETWARZANIA OBRAZU 37<br />

Algorytm wymaga ustalenia warto´sci dla dwóch zmiennych: MIN HAND SURFACE<br />

i MAX FACE SURFACE. Pierwsza oznacza minimalna↩ powierzchnie↩ binarnego obiektu<br />

odpowiadajacego ↩ d̷loni. Warto´sć te↩ ustalono eksperymentalnie, obserwujac ↩ binarne<br />

obrazy odpowiadajace ↩ d̷loniom dla wszystkich rozwa˙zanych gestów. Przyjeto, ↩<br />

˙ze MIN HAND SURFACE bedzie ↩ równe powierzchni najmniejszego obrazu d̷loni,<br />

pomniejszonej jeszcze o 5%. Wszystkie obiekty o powierzchniach mniejszych od tej<br />

sta̷lej traktowane sa↩ jako zak̷lócenia. MAX FACE SURFACE jest maksymalna↩ powierzchnia↩<br />

binarnego obiektu odpowiadajacego ↩ twarzy. Warto´sć ta zosta̷la ustalona<br />

podczas “przedstawiania si ↩ e” u˙zytkownika w fazie generowania modelu (podrozdzia̷l<br />

3.1). Po obliczeniu parametrów modelu wykorzystano go do wygenerowania<br />

binarnego obrazu twarzy u˙zytkownika i przyj ↩ eto, ˙ze MAX FACE SURFACE b ↩ edzie<br />

równa powierzchni otrzymanego obiektu binarnego powi ↩ ekszonej jeszcze o 5%, aby<br />

uwzglednić ↩ ewentualne wahania rozmiaru w kolejnych klatkach. Wszystkie obiekty o<br />

powierzchniach wiekszych ↩ od MAX FACE SURFACE traktowane sa↩ jako zetkniecie ↩<br />

twarzy i d̷loni dominujacej. ↩<br />

W przypadku gestów rozpoczynajacych ↩ sie↩ od zetkniecia ↩ lub skrzy˙zowania d̷loni,<br />

algorytm rozpoczyna swe dzia̷lanie jeszcze przed rozpoczeciem ↩ wykonywania w̷la´sciwego<br />

gestu, gdy d̷lonie i twarz nie stykaja↩ sie, ↩ d̷loń prawa jest po prawej a lewa<br />

po lewej stronie cia̷la. Przeprowadzone eksperymenty wykaza̷ly, ˙ze dla rozwa˙zanego<br />

s̷lownika gestów PJM, przy typowym tempie wykonywania i predko´sci ↩ przetwarzania<br />

25 ramek/s, opisywany algorytm poprawnie identyfikuje obiekty w obrazie binarnym.<br />

3.3 Stereowizja<br />

Statyczna konfiguracja d̷loni i jej ruch maja↩ charakter przestrzenny. W wyniku<br />

dokonywanej przez uk̷lad obrazujacy ↩ projekcji do p̷laszczyzny obrazu spora cze´sć ↩<br />

informacji 3D zostaje utracona. Pomimo, i˙z cze´sciowa ↩ informacja o sk̷ladowej ruchu<br />

zgodnej z osia↩ optyczna↩ kamery przekazywana jest w postaci zmieniajacych ↩ sie↩ rozmiarów d̷loni, zdecydowano sie↩ na wzbogacenie wektora cech o informacje↩ 3D.<br />

Do wyznaczenia mapy dysparycji wykorzystywano monochromatyczne obrazy o wymiarach<br />

320 × 240 pikseli, zarejestrowane z wykorzystaniem stereowizyjnego uk̷ladu<br />

kamer firmy Videre Design (rys. 3.8).<br />

Gwarantuje on, ˙ze obrazy z obu kamer sa↩ rejestrowane równocze´snie, co ma du˙ze<br />

znaczenie w przypadku szybko zmieniajacej ↩ sie↩ sceny. Kalibracje↩ uk̷ladu kamer<br />

przeprowadzono prezentujac ↩ przygotowana↩ specjalnie plansze↩ w pieciu ↩ ró˙znych pozycjach<br />

(rys. 3.9). Wykorzystano procedury z biblioteki Small Vision System, dostarczanej<br />

wraz z kamera↩ stereowizyjna ↩ [42]. Parametry wewnetrzne ↩ i zewnetrzne ↩<br />

uk̷ladu stereowizyjnego wyznaczane by̷ly za pomoca↩ metody opartej o algorytm Tsai<br />

[48, 73]. Znajomo´sć tych parametrów potrzebna jest do dokonania tzw. rektyfikacji<br />

obrazów stereo, czyli sprowadzenia ich do takiej formy, jakby otrzymane by̷ly<br />

w idealnym kanonicznym uk̷ladzie stereowizyjnym, w którym osie optyczne kamer<br />

sa↩ równoleg̷le a obrazy le˙z a↩ na tej samej p̷laszczy´znie. Dla obrazów otrzymanych

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!