Pełen tekst pracy (~3,8MB)
Pełen tekst pracy (~3,8MB)
Pełen tekst pracy (~3,8MB)
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
ROZDZIA̷L 3. PROBLEMY PRZETWARZANIA OBRAZU 37<br />
Algorytm wymaga ustalenia warto´sci dla dwóch zmiennych: MIN HAND SURFACE<br />
i MAX FACE SURFACE. Pierwsza oznacza minimalna↩ powierzchnie↩ binarnego obiektu<br />
odpowiadajacego ↩ d̷loni. Warto´sć te↩ ustalono eksperymentalnie, obserwujac ↩ binarne<br />
obrazy odpowiadajace ↩ d̷loniom dla wszystkich rozwa˙zanych gestów. Przyjeto, ↩<br />
˙ze MIN HAND SURFACE bedzie ↩ równe powierzchni najmniejszego obrazu d̷loni,<br />
pomniejszonej jeszcze o 5%. Wszystkie obiekty o powierzchniach mniejszych od tej<br />
sta̷lej traktowane sa↩ jako zak̷lócenia. MAX FACE SURFACE jest maksymalna↩ powierzchnia↩<br />
binarnego obiektu odpowiadajacego ↩ twarzy. Warto´sć ta zosta̷la ustalona<br />
podczas “przedstawiania si ↩ e” u˙zytkownika w fazie generowania modelu (podrozdzia̷l<br />
3.1). Po obliczeniu parametrów modelu wykorzystano go do wygenerowania<br />
binarnego obrazu twarzy u˙zytkownika i przyj ↩ eto, ˙ze MAX FACE SURFACE b ↩ edzie<br />
równa powierzchni otrzymanego obiektu binarnego powi ↩ ekszonej jeszcze o 5%, aby<br />
uwzglednić ↩ ewentualne wahania rozmiaru w kolejnych klatkach. Wszystkie obiekty o<br />
powierzchniach wiekszych ↩ od MAX FACE SURFACE traktowane sa↩ jako zetkniecie ↩<br />
twarzy i d̷loni dominujacej. ↩<br />
W przypadku gestów rozpoczynajacych ↩ sie↩ od zetkniecia ↩ lub skrzy˙zowania d̷loni,<br />
algorytm rozpoczyna swe dzia̷lanie jeszcze przed rozpoczeciem ↩ wykonywania w̷la´sciwego<br />
gestu, gdy d̷lonie i twarz nie stykaja↩ sie, ↩ d̷loń prawa jest po prawej a lewa<br />
po lewej stronie cia̷la. Przeprowadzone eksperymenty wykaza̷ly, ˙ze dla rozwa˙zanego<br />
s̷lownika gestów PJM, przy typowym tempie wykonywania i predko´sci ↩ przetwarzania<br />
25 ramek/s, opisywany algorytm poprawnie identyfikuje obiekty w obrazie binarnym.<br />
3.3 Stereowizja<br />
Statyczna konfiguracja d̷loni i jej ruch maja↩ charakter przestrzenny. W wyniku<br />
dokonywanej przez uk̷lad obrazujacy ↩ projekcji do p̷laszczyzny obrazu spora cze´sć ↩<br />
informacji 3D zostaje utracona. Pomimo, i˙z cze´sciowa ↩ informacja o sk̷ladowej ruchu<br />
zgodnej z osia↩ optyczna↩ kamery przekazywana jest w postaci zmieniajacych ↩ sie↩ rozmiarów d̷loni, zdecydowano sie↩ na wzbogacenie wektora cech o informacje↩ 3D.<br />
Do wyznaczenia mapy dysparycji wykorzystywano monochromatyczne obrazy o wymiarach<br />
320 × 240 pikseli, zarejestrowane z wykorzystaniem stereowizyjnego uk̷ladu<br />
kamer firmy Videre Design (rys. 3.8).<br />
Gwarantuje on, ˙ze obrazy z obu kamer sa↩ rejestrowane równocze´snie, co ma du˙ze<br />
znaczenie w przypadku szybko zmieniajacej ↩ sie↩ sceny. Kalibracje↩ uk̷ladu kamer<br />
przeprowadzono prezentujac ↩ przygotowana↩ specjalnie plansze↩ w pieciu ↩ ró˙znych pozycjach<br />
(rys. 3.9). Wykorzystano procedury z biblioteki Small Vision System, dostarczanej<br />
wraz z kamera↩ stereowizyjna ↩ [42]. Parametry wewnetrzne ↩ i zewnetrzne ↩<br />
uk̷ladu stereowizyjnego wyznaczane by̷ly za pomoca↩ metody opartej o algorytm Tsai<br />
[48, 73]. Znajomo´sć tych parametrów potrzebna jest do dokonania tzw. rektyfikacji<br />
obrazów stereo, czyli sprowadzenia ich do takiej formy, jakby otrzymane by̷ly<br />
w idealnym kanonicznym uk̷ladzie stereowizyjnym, w którym osie optyczne kamer<br />
sa↩ równoleg̷le a obrazy le˙z a↩ na tej samej p̷laszczy´znie. Dla obrazów otrzymanych