Pełen tekst pracy (~3,8MB)

More documents

Recommendations

Info

$Positive stable realizations of fractional continuous-time linear systems$

ROZDZIA̷L 1. WST ↩ EP 7 segmentacji ciag̷lej ↩ sekwencji gestów. Pojedyncze wyrazy rozpoznawane by̷ly w pracach [2, 3, 10, 25, 26, 27, 30, 33, 41, 44, 49, 50, 62, 68, 69, 74, 77, 78, 80], ca̷le sekwencje natomiast w [2, 17, 44, 57, 61, 75, 77]. W pracach [10, 25, 26, 27, 33, 41, 44, 50, 68, 74] rozwa˙zano jedynie gesty wykonywane jedna↩ rek ↩ a, ↩ natomiast w pracach [2, 3, 17, 30, 49, 57, 61, 62, 69, 75, 77, 78, 80] uwzgl ↩ edniano tak˙ze gesty dwur ↩ eczne. Przy wyznaczaniu wektorów cech z wykorzystaniem uk̷ladów wizyjnych przyjmowano szereg za̷lo˙zeń wstepnych. ↩ Najcze´sciej ↩ zak̷ladano, ˙ze osoba wykonujaca ↩ gest ma ubranie z d̷lugim rekawem ↩ [2, 3, 27, 30, 61, 68, 69, 80]. Czesto ↩ osoba wykonujaca ↩ gest mia̷la kolorowe rekawice ↩ u̷latwiajace ↩ identyfikacje↩ d̷loni i poszczególnych palców w obrazie [2, 3, 26, 49]. Zak̷ladano, ˙ze t̷lo musi być jednorodne [2, 3, 26, 27, 49, 68, 80] albo z̷lo˙zone lecz stacjonarne [10, 30, 61, 69]. Przyjmowano tak˙ze, ˙ze g̷lowa osoby wykonujacej ↩ gest pozostaje nieruchoma, albo jej ruchy sa↩ znikome w porównaniu z ruchami d̷loni [10, 27, 30, 61, 68, 69]. W pracy [10] d̷lonie musza↩ być w ciag̷lym ↩ ruchu, natomiast w pracach [61, 69] musza↩ one przyjmować pewna↩ ustalona↩ pozycje↩ poczatkow ↩ a↩ przed rozpoczeciem ↩ nagrywania. W metodach [10, 27, 68] przyjeto, ↩ ˙ze kamera obserwuje tylko jedna↩ d̷loń. Kszta̷lty przyjmowane przez d̷lonie i ich ruchy maja↩ charakter przestrzenny. W wiekszo´sci ↩ dostepnych ↩ w literaturze rozwiazań ↩ do wyznaczania wektorów cech stosowano jednak uk̷lady wizyjne z jedna↩ kamera. ↩ Uk̷lad stereowizyjny wykorzystano w pracach [26, 49]. Klasyfikacje↩ przeprowadzano najcze´sciej ↩ za pomoca↩ ró˙znych wariantów sztucznych sieci neuronowych [27, 50, 62, 74, 80] i ukrytych modeli Markowa [2, 3, 17, 41, 44, 61, 69, 75, 77]. Sieci neuronowe wykorzystywano przede wszystkim do rozpoznawania kszta̷ltu d̷loni w gestach statycznych. Poniewa˙z wiekszo´sć ↩ znaków migowych to gesty dynamiczne, ich rozpoznawanie wia˙ze ↩ sie↩ z klasyfikacja↩ szeregów czasowych. Tu zastosowanie sieci neuronowych jest trudniejsze. Spotyka sie↩ podej´scia polegajace ↩ na uwzglednieniu ↩ na wej´sciu sieci danych reprezentatywnych tylko dla trzech etapów, tj. poczatkowej, ↩ ´srodkowej i końcowej fazy gestu [76]. Inne rozwiazania ↩ polegaja↩ na zastosowaniu sieci rekurencyjnej [50] lub sieci z opó´znieniem [80]. Jak widać z tab. 1.1, sieci neuronowe s̷lu˙zy̷ly raczej do rozpoznawania s̷lów. W przypadku zdań ko- nieczne jest uprzednie wyodr ↩ ebnienie poszczególnych s̷lów. Propozycj ↩ e segmentacji szeregu czasowego oparta↩ na detekcji zmiany kierunku ruchu d̷loni przedstawiono w pracy [57]. Przewa˙zajaca ↩ liczba prac wykorzystuje ukryte modele Markowa. Jest to miedzy ↩ innymi konsekwencja↩ do´swiadczeń wynikajacych ↩ z szerokiego stosowania tego narzedzia ↩ w systemach rozpoznawania mowy, które potwierdzaja, ↩ ˙ze ukryte modele Markowa dobrze sprawdzaja↩ sie↩ w zadaniach modelowania i rozpoznawania szeregów czasowych, wykazujac ↩ w̷la´sciwo´sci automatycznego dokonywania nieliniowej transformacji czasowej i segmentacji. Skuteczno´sci rozpoznawania uzyskane w uk̷ladach rozpoznawania jezyków ↩ migowych zestawiono w tab. 1.1. Na podstawie przegladu ↩ literatury mo˙zna sformu̷lować nastepuj ↩ ace ↩ wnioski. • Poza niektórymi intuicyjnymi znakami o uniwersalnym zastosowaniu jezyki ↩ migowe u˙zywane w ró˙znych krajach sa↩ znaczaco ↩ odmienne.
ROZDZIA̷L 1. WST ↩ EP 8 • W literaturze nie podaje sie↩ na ogó̷l wyczerpujacych ↩ informacji dotyczacych ↩ szczegó̷lów rozwiazań. ↩ Trudno te˙z a priori ocenić uniwersalno´sć rozwiazań ↩ publikowanych w odniesieniu do konkretnych jezyków. ↩ • Zachodzi potrzeba badań nad rozpoznawaniem jezyka ↩ migowego u˙zywanego w Polsce, a w pierwszej kolejno´sci zaproponowania metody pozwalajacej ↩ na rozpoznawanie izolowanych s̷lów i prostych zdań wykorzystywanych w typowej sytuacji ˙zyciowej i opracowania jej najistotniejszych elementów, popartego praktyczna↩ weryfikacja↩ w rzeczywistym systemie, najlepiej umo˙zliwiajacym ↩ bezpo´srednia↩ interakcje↩ u˙zytkownika z komputerem. Spo´sród istotnych za- ace: gadnień nale˙zy wskazać nast ↩ epuj ↩ – wybór i sposób wyznaczania wektora cech, – synteze↩ klasyfikatora rozpoznajacego ↩ pojedyncze wyrazy, – synteze↩ klasyfikatora zdań, z uwzglednieniem ↩ problemów przej´sć miedzy ↩ sasiednimi ↩ wyrazami i mo˙zliwo´sci rozpoznawania nowych, nieznanych zdań wykorzystujacych ↩ znane wyrazy, acej z jednej strony praktyczna↩ przydatno´sć rozwa˙zanego s̷lownika, z drugiej za´s mo˙zliwie szeroka↩ game↩ elementów rzutujacych ↩ na trudno´sć rozpoznawania, w̷l acznie ↩ z wykonywaniem gestów przez osoby biegle pos̷lugujace ↩ sie↩ jezykiem ↩ migowym, – przygotowanie reprezentatywnej bazy danych uwzgl ↩ edniaj ↩ – przygotowanie narzedzi ↩ programowych i uruchomienie stanowiska badawczego pozwalajacego ↩ na weryfikacje↩ zaproponowanych rozwiazań ↩ oraz stanowiacego ↩ baze↩ do kontynuacji badań, – zasygnalizowanie kierunków tych badań. 1.3 Cel i zakres pracy Celem pracy jest opracowanie i weryfikacja metody przybli˙zajacej ↩ zbudowanie systemu wizyjnego do rozpoznawania s̷lów i zdań Polskiego Jezyka ↩ Miganego (PJM), stanowiacego ↩ w Polsce podstawowa↩ forme↩ komunikacji osób z uszkodzeniem narzadu ↩ s̷luchu ze ´srodowiskiem s̷lyszacych. ↩ Jezyk ↩ ten powsta̷l w wyniku ujednolicenia znaków migowych stosowanych w ro˙znych regionach kraju i dodania zasad gramatyki jezyka ↩ polskiego [24, 65, 66]. W pracy po̷lo˙zono nacisk na wybór i wyznaczanie wektorów cech, konstrukcje↩ klasyfikatorów opartych na teorii ukrytych modeli Markowa oraz eksperymentalna↩ ocene↩ ich przydatno´sci. ´ Zród̷lo informacji stanowi̷ly obrazy ze stereowizyjnego uk̷ladu kamer kolorowych. Przyjeto, ↩ ˙ze nie bed ↩ a↩ wykorzystywane ˙zadne ´srodki pomocnicze (np. rekawice ↩ z ró˙znokolorowymi palcami). Za̷lo˙zono, ˙ze osoba wykonujaca ↩ gest stoi przodem do kamery w sta̷lej odleg̷lo´sci od niej, a w tle nie pojawiaja↩ sie↩ inne osoby. Skoncentrowano sie↩ na rozpoznawaniu zamknietego ↩ s̷lownika wyrazów i zdań wystepuj ↩ acych ↩ w wybranej sytuacji ˙zyciowej: u lekarza i na poczcie. W niniejszej pracy przyjeto, ↩ ˙ze gest uto˙zsamiany jest z przedstawieniem
Page 1 and 2: UNIWERSYTET ZIELONOG ÓRSKI WYDZIA
Page 3 and 4: Spis tre´sci 1 Wstep ↩ 1.1 Motyw
Page 5 and 6: Rozdzia̷l 1 Wst ↩ ep 1.1 Motywac
Page 7: ROZDZIA̷L 1. WST ↩ EP 6 Tab. 1.1
Page 11 and 12: ROZDZIA̷L 1. WST ↩ EP 10 Markowa
Page 13 and 14: Rozdzia̷l 2 Polski J ↩ ezyk Miga
Page 15 and 16: ROZDZIA̷L 2. POLSKI J ↩ EZYK MIG
Page 25 and 26: Rozdzia̷l 3 Problemy przetwarzania
Page 27 and 28: ROZDZIA̷L 3. PROBLEMY PRZETWARZANI
Page 51 and 52: ROZDZIA̷L 4. UKRYTE MODELE MARKOWA
Page 59 and 60:
ROZDZIA̷L 4. UKRYTE MODELE MARKOWA
Page 61 and 62:
Page 63 and 64:
Page 65 and 66:
Page 67 and 68:
Rozdzia̷l 5 Rozpoznawanie pojedync
Page 69 and 70:
ROZDZIA̷L 5. ROZPOZNAWANIE POJEDYN
Page 71 and 72:
Page 73 and 74:
Page 75 and 76:
Page 77 and 78:
Page 79 and 80:
Rozdzia̷l 6 Rozpoznawanie zdań Ro
Page 81 and 82:
ROZDZIA̷L 6. ROZPOZNAWANIE ZDAŃ 8
Page 83 and 84:
Page 85 and 86:
Page 87 and 88:
Page 89 and 90:
Page 91 and 92:
7. PODSUMOWANIE 90 - zale˙zno´sci
Page 93 and 94:
7. PODSUMOWANIE 92 PJM z wykorzysta
Page 95 and 96:
7. PODSUMOWANIE 94 kana̷ly odpowia
Page 97 and 98:
Dodatek A Stanowisko do rozpoznawan
Page 99 and 100:
A. STANOWISKO DO ROZPOZNAWANIA WYRA
Page 101 and 102:
Page 103 and 104:
Page 105 and 106:
Page 107 and 108:
Dodatek B Biblioteka funkcji przetw
Page 109 and 110:
B. BIBLIOTEKA FUNKCJI PRZETWARZANIA
Page 111 and 112:
C. APLIKACJA BAZY DANYCH 110 Rys. C
Page 113 and 114:
C. APLIKACJA BAZY DANYCH 112 Tab. C
Page 115 and 116:
C. APLIKACJA BAZY DANYCH 114 Tab. C
Page 117 and 118:
D. PRZEWODNIK U ˙ ZYTKOWNIKA HTK 1
Page 119 and 120:
Page 121 and 122:
Page 123 and 124:
Page 125 and 126:
Page 127 and 128:
Dodatek E Rozpoznawane wyrazy i zda
Page 129 and 130:
E. ROZPOZNAWANE WYRAZY I ZDANIA 128
Page 131 and 132:
E. ROZPOZNAWANE WYRAZY I ZDANIA 130
Page 133 and 134:
Literatura [1] S. Akyol and P. Alva
Page 135 and 136:
LITERATURA 134 [26] E. J. Holden, a
Page 137 and 138:
LITERATURA 136 [53] N. Otsu. A thre
Page 139:
LITERATURA 138 [81] S. Young, and a
show all

Pełen tekst pracy (~3,8MB)

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?