III WVC 2007 - Iris.sel.eesc.sc.usp.br - USP

More documents

Recommendations

Info

WVC'2007 - III Workshop de Visão Computacional, 22 a 24 de Outubro de 2007, São José do Rio Preto, SP.los ocultos de Markov em diversas aplicações. Na próximaseção, é apresentado o extrator de características das imagenssegmentadas. Na Seção 4, os principais conceitos ealgoritmos dos modelos ocultos de Markov são descritos.Na Seção 5, os experimentos realizados são mostrados commaiores detalhes. A Seção 6 apresenta os resultados obtidosseguido de uma análise. Finalmente, na Seção 7 sãomostradas a conclusão e os trabalhos futuros.2. Trabalhos CorrelatosOs modelos ocultos de Markov (HMMs) têm sido amplamenteutilizados em diversas áreas, principalmente em sistemaspara o reconhecimento de voz [10], reconhecimentode comportamentos [7] e textos manuscritos [6]. Em [5] oHMM é aplicado ao reconhecimento de objetos 2D em imagens.O HMM, juntamente com as características invariantesdo contorno, foram testados em quatro diferentes objetos.Para cada objeto, um HMM foi estimado com um conjuntode cinqüenta imagens de treinamento. A classificaçãofoi realizada utilizando dez imagens para cada objeto, resultandoem uma taxa de acerto de 75%.Starner e Pentland [14] descrevem um sistema para reconhecimentode sentenças da língua americana desinais utilizando HMM. A taxa de reconhecimento éde99.2% para palavras, no entanto, o conjunto de característicamostrou-se limitado, pois o sistema é treinadopara esperar certos gestos em certas posições espaciaisna imagem devido à utilização das posições não normalizadasdas mãos. Uma nova técnica para o reconhecimentode textos é apresentada em [1]. As características são extraídasde uma imagem em tons de cinza e um HMMé modelado para cada caractere. Durante o reconhecimento,a mais provável combinação de modelos é encontradapara cada palavra, pelo uso de programaçãodinâmica.Em [9] é descrito um HMM para reconhecimento defaces. A imagem contendo a face é dividida em cinco blocos(cabelo, testa, olhos, nariz e boca), onde cada bloco é representadocomo um estado no HMM. Os vetores de característicassão obtidos de cada bloco utilizando o coeficienteda transformada de Karhunen-Loeve.Os HMMs são frequentemente utilizados para descreveruma seqüência de padrões caracterizando um comportamento.Em [7] os comportamentos de seres humanos sãoidentificados. Esses comportamentos são atividades legais eilegais, capturadas por uma câmera, e realizadas em um sítioarqueológico. Para a identificação desses comportamentos,as imagens são segmentadas utilizando a detecção de movimentoseguida por um processamento de remoção de sombras.Em seguida, a postura realizada pelo ser humano éidentificada utilizando histogramas e medida de similaridadebaseada na distância de Manhattan. O reconhecimentodos comportamentos é realizado pelos HMMs, onde os estadosrepresentam as diferentes posturas. Os experimentosforam realizados na identificação de quatro comportamentoscom uma porcentagem média de classificação correta de86,87%.Em [3] um sistema de classificação de comportamentosde animais é apresentado. Esse sistema usa umacombinação de HMM e kNN para treinamento de algunsmovimentos. O sistema foi avaliado em diversas trajetóriasde abelhas extraídas de uma seqüência de vídeo de15 minutos. O sistema desenvolvido foi capaz de etiquetarmovimentos com uma exatidão de 81,5%.3. Momentos de ImagemUma imagem pode ser modelada como uma função 2Ddiscreta I, onde a intensidade de cada pixel é indexada comoI(x, y). A Equação 1 representa os momentos regulares deordem p, q de uma imagem.M pq =width∑x=1height∑y=1x p y q I(x, y) (1)Os momentos regulares podem ser utilizados para representaralgumas importantes propriedades de um objeto presenteem uma imagem, como a área do objeto, M 00 ,eoseucentro de massa, M10M 00, M01M 00, respectivamente.Os momentos centrais de imagens, definidos na Equação2, podem também ser utilizados para calcular outras interessantespropriedades dos objetos, como a sua variância noseixos XeY(Equação 3), direção (Equação 4) e excentricidade(Equação 5).u pq =width∑x=1∑(x − x) p (y − y) q I(x, y) (2)heighty=1σ 2 x = u 20m 00, σ 2 y = u 02m 00(3)θ = u 02 − u 20 − 2u 11 + λu 02 − u 20 +2u 11 − λ(4)e 2 = u 20 + u 02 + λ(5)u 20 + u 02 − λ√λ = (u 20 − u 02 ) 2 +4u 2 11 (6)Além das propriedades citadas acima, calculadas para todosos pixels pertences ao objeto, neste trabalho, seguindouma metodologia sugerida por Freeman [4], o objeto édivididoem 4 regiões iguais, e para cada uma dessas regiões, asmesmas propriedades dos momentos de imagens são calculadas.Desta maneira, o sistema pode combinar informaçõesglobais e locais durante a fase de classificação. A Figura 1325
WVC'2007 - III Workshop de Visão Computacional, 22 a 24 de Outubro de 2007, São José do Rio Preto, SP.ilustrada, usando uma ferramenta de visualização dos momentos,as propriedades extraídas de uma imagem contendouma serpente previamente segmentada e binarizada.Figura 1. Aplicação dos momentos de imagem.4. Modelos de Markov OcultosOs modelos ocultos de Markov (HMMs) são utilizadospara modelar um par de processos estocásticos complementares.O primeiro processo é representado por um conjuntode estados não observáveis, também chamados de estadosinternos ou ocultos. No caso especial de HMMs deprimeira ordem, o estado atual do sistema depende apenasdo estado anterior, e a distribuição de probabilidades quemodela a transição entre os estados é geralmente representadaatravés de uma matriz de transição A = {a ij }, coma ij = P (q t+1 = S j |q t = S i ) 1 ≤ i, j ≤ N (7)onde N éonúmero de estados, q t é o estado atual do sistemae S = {S 1 ,S 2 ,S 3 , ..., S N } é o conjunto de estadosocultos do modelo.O segundo processo estocástico modela a probabilidadede observação de alguns valores pré-determinados(os valores ou símbolos observados) dado que o sistemaestá em um estado específico (oculto). A seqüênciade T observações é representada por um conjuntoO = O 1 ,O 2 ,O 3 , ..., O T , onde cada elemento O t éummembro do conjunto de símbolos V = v 1 ,v 2 , ..., v M .A probabilidade de emissão ou observação de qualquersímbolo dado um estado oculto j é definida por umamatriz B = {b j (k)}, comb j (k) =P (O t = v k |q t = S j ) 1 ≤ j ≤ N, 1 ≤ k ≤ M(8)A probabilidade inicial de cada estado é representada porum conjunto π = {π i }, comπ i = P (q 1 = S i ) 1 ≤ i ≤ N, comN∑π i =1 (9)i=1Para a utilização dos HMMs em aplicações do mundoreal, é necessário a resolução de três problemas básicos.A resolução desses problemas, conhecidos como problemade avaliação, decodificação e aprendizagem, foram extensivamentedescritas em diversos trabalhos na literatura [10,14, 1]. Neste trabalho, são necessários e descritos apenas osproblemas de avaliação e aprendizagem.4.1. Problema de AvaliaçãoDado uma seqüência de observações O eumHMMλ =(A, B, π), o problema de avaliação é calcular P (O|λ). Umprocedimento que resolve este problema eficientemente,baseado em programação dinâmica, é conhecido como algoritmoForward-Backward. Este procedimento define umavariável α t (j) (a variável forward) que representa a probabilidadede uma seqüência de observações parciais (dotempo 0 até t) dado um estado S j (no tempo t) e o modeloλ. Avariável é atualizada incrementalmente usando oprocedimento recursivo defindo pelas Equações 10 e 11 atéque toda seqüência de observações seja alcançada e P (O|λ)pode ser facilmente calculada usando a Equação 12.α 1 (j) =π j b j (O 1 ), 1 ≤ j ≤ N. (10)[ N]∑α t+1 (j) = α t (i)a ij b j (O t+1 ), 1 ≤ t ≤ T − 1.i=1P (O|λ) =(11)N∑α T (j) (12)j=1Para calcular a variável backward β t (i), representando aprobabilidade de observações parciais de t +1até T dadoo estado S i no tempo t e um modelo λ, um procedimentosimilar é seguido, mas de uma maneira reversa. O procedimentoé resumido nas Equações 13, 14 e 15.β t (i) =β T (i) =1, 1 ≤ i ≤ N. (13)N∑a ij b j (O t+1 )β t+1 (j),t= T −1, ..., 1 1 ≤ i ≤ N.j=1P (O|λ) =(14)N∑π i b i (O 1 )β 1 (i) (15)i=1326
Page 1 and 2:
III Workshop de VisãoComputacional
Page 3 and 4:
Instituto de Biociências, Letras e
Page 5 and 6:
WVC 2007 - III Workshop de Visão C
Page 7 and 8:
ApresentaçãoA área de Visão Com
Page 10 and 11:
Automatic Pattern Recognition of Bi
Page 12 and 13:
WVC'2007 - III Workshop de Visão C
Page 14 and 15:
Page 16:
Page 19:
Page 22 and 23:
Page 24 and 25:
Page 26 and 27:
Page 28 and 29:
Page 30 and 31:
Page 33 and 34:
Page 35 and 36:
Page 37 and 38:
Page 39 and 40:
Page 41 and 42:
Page 43 and 44:
Page 45 and 46:
Page 47 and 48:
Page 49 and 50:
Page 51 and 52:
Page 53 and 54:
Page 55 and 56:
Page 57 and 58:
Page 59 and 60:
Page 61 and 62:
Page 63 and 64:
Page 65 and 66:
Page 67 and 68:
Page 69 and 70:
Page 71 and 72:
Page 73 and 74:
Page 75 and 76:
Page 77 and 78:
Page 79 and 80:
Page 81 and 82:
Page 83 and 84:
Page 85 and 86:
Page 87 and 88:
Page 89 and 90:
Page 91 and 92:
Page 93 and 94:
Page 95 and 96:
Page 97 and 98:
Page 99 and 100:
Page 101 and 102:
Page 103 and 104:
Page 105 and 106:
Page 107 and 108:
Page 109 and 110:
Page 111 and 112:
Page 113 and 114:
Page 115 and 116:
Page 117 and 118:
Page 119 and 120:
Page 121 and 122:
Page 123 and 124:
Page 125 and 126:
Page 127 and 128:
Page 129 and 130:
Page 131 and 132:
Page 133 and 134:
Page 135 and 136:
Page 137 and 138:
Page 139 and 140:
Page 141 and 142:
Page 143 and 144:
Page 145 and 146:
Page 147 and 148:
Page 149 and 150:
Page 151 and 152:
Page 153 and 154:
Page 155 and 156:
Page 157 and 158:
Page 159 and 160:
Page 161 and 162:
Page 163 and 164:
Page 165 and 166:
Page 167 and 168:
Page 169 and 170:
Page 171 and 172:
Page 173 and 174:
Page 175 and 176:
Page 177 and 178:
Page 179 and 180:
Page 181 and 182:
Page 183 and 184:
Page 185 and 186:
Page 187 and 188:
Page 189 and 190:
Page 191 and 192:
Page 193 and 194:
Page 195 and 196:
Page 197 and 198:
Page 199 and 200:
Page 201 and 202:
Page 203 and 204:
Page 205 and 206:
Page 207 and 208:
Page 209 and 210:
Page 211 and 212:
Page 213 and 214:
Page 215 and 216:
Page 217 and 218:
Page 219 and 220:
Page 221 and 222:
Page 223 and 224:
Page 225 and 226:
Page 227 and 228:
Page 229 and 230:
Page 231 and 232:
Page 233 and 234:
Page 235 and 236:
Page 237 and 238:
Page 239 and 240:
Page 241 and 242:
Page 243 and 244:
Page 245 and 246:
Page 247 and 248:
Page 249 and 250:
Page 251 and 252:
Page 253 and 254:
Page 255 and 256:
Page 257 and 258:
Page 259 and 260:
Page 261 and 262:
Page 263 and 264:
Page 265 and 266:
Page 267 and 268:
Page 269 and 270:
Page 271 and 272:
Page 273 and 274:
Page 275 and 276:
Page 277 and 278:
Page 279 and 280:
Page 281 and 282:
Page 283 and 284:
Page 285 and 286: WVC'2007 - III Workshop de Visão C
Page 335: WVC'2007 - III Workshop de Visão C
Page 363: WVC'2007 - III Workshop de Visão C
show all

III WVC 2007 - Iris.sel.eesc.sc.usp.br - USP

Create successful ePaper yourself

Delete template?

Save as template?