12.07.2015 Views

III WVC 2007 - Iris.sel.eesc.sc.usp.br - USP

III WVC 2007 - Iris.sel.eesc.sc.usp.br - USP

III WVC 2007 - Iris.sel.eesc.sc.usp.br - USP

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>WVC</strong>'<strong>2007</strong> - <strong>III</strong> Workshop de Visão Computacional, 22 a 24 de Outu<strong>br</strong>o de <strong>2007</strong>, São José do Rio Preto, SP.los ocultos de Markov em diversas aplicações. Na próximaseção, é apresentado o extrator de características das imagenssegmentadas. Na Seção 4, os principais conceitos ealgoritmos dos modelos ocultos de Markov são de<strong>sc</strong>ritos.Na Seção 5, os experimentos realizados são mostrados commaiores detalhes. A Seção 6 apresenta os resultados obtidosseguido de uma análise. Finalmente, na Seção 7 sãomostradas a conclusão e os trabalhos futuros.2. Trabalhos CorrelatosOs modelos ocultos de Markov (HMMs) têm sido amplamenteutilizados em diversas áreas, principalmente em sistemaspara o reconhecimento de voz [10], reconhecimentode comportamentos [7] e textos manu<strong>sc</strong>ritos [6]. Em [5] oHMM é aplicado ao reconhecimento de objetos 2D em imagens.O HMM, juntamente com as características invariantesdo contorno, foram testados em quatro diferentes objetos.Para cada objeto, um HMM foi estimado com um conjuntode cinqüenta imagens de treinamento. A classificaçãofoi realizada utilizando dez imagens para cada objeto, resultandoem uma taxa de acerto de 75%.Starner e Pentland [14] de<strong>sc</strong>revem um sistema para reconhecimentode sentenças da língua americana desinais utilizando HMM. A taxa de reconhecimento éde99.2% para palavras, no entanto, o conjunto de característicamostrou-se limitado, pois o sistema é treinadopara esperar certos gestos em certas posições espaciaisna imagem devido à utilização das posições não normalizadasdas mãos. Uma nova técnica para o reconhecimentode textos é apresentada em [1]. As características são extraídasde uma imagem em tons de cinza e um HMMé modelado para cada caractere. Durante o reconhecimento,a mais provável combinação de modelos é encontradapara cada palavra, pelo uso de programaçãodinâmica.Em [9] é de<strong>sc</strong>rito um HMM para reconhecimento defaces. A imagem contendo a face é dividida em cinco blocos(cabelo, testa, olhos, nariz e boca), onde cada bloco é representadocomo um estado no HMM. Os vetores de característicassão obtidos de cada bloco utilizando o coeficienteda transformada de Karhunen-Loeve.Os HMMs são frequentemente utilizados para de<strong>sc</strong>reveruma seqüência de padrões caracterizando um comportamento.Em [7] os comportamentos de seres humanos sãoidentificados. Esses comportamentos são atividades legais eilegais, capturadas por uma câmera, e realizadas em um sítioarqueológico. Para a identificação desses comportamentos,as imagens são segmentadas utilizando a detecção de movimentoseguida por um processamento de remoção de som<strong>br</strong>as.Em seguida, a postura realizada pelo ser humano éidentificada utilizando histogramas e medida de similaridadebaseada na distância de Manhattan. O reconhecimentodos comportamentos é realizado pelos HMMs, onde os estadosrepresentam as diferentes posturas. Os experimentosforam realizados na identificação de quatro comportamento<strong>sc</strong>om uma porcentagem média de classificação correta de86,87%.Em [3] um sistema de classificação de comportamentosde animais é apresentado. Esse sistema usa umacombinação de HMM e kNN para treinamento de algunsmovimentos. O sistema foi avaliado em diversas trajetóriasde abelhas extraídas de uma seqüência de vídeo de15 minutos. O sistema desenvolvido foi capaz de etiquetarmovimentos com uma exatidão de 81,5%.3. Momentos de ImagemUma imagem pode ser modelada como uma função 2Ddi<strong>sc</strong>reta I, onde a intensidade de cada pixel é indexada comoI(x, y). A Equação 1 representa os momentos regulares deordem p, q de uma imagem.M pq =width∑x=1height∑y=1x p y q I(x, y) (1)Os momentos regulares podem ser utilizados para representaralgumas importantes propriedades de um objeto presenteem uma imagem, como a área do objeto, M 00 ,eoseucentro de massa, M10M 00, M01M 00, respectivamente.Os momentos centrais de imagens, definidos na Equação2, podem também ser utilizados para calcular outras interessantespropriedades dos objetos, como a sua variância noseixos XeY(Equação 3), direção (Equação 4) e excentricidade(Equação 5).u pq =width∑x=1∑(x − x) p (y − y) q I(x, y) (2)heighty=1σ 2 x = u 20m 00, σ 2 y = u 02m 00(3)θ = u 02 − u 20 − 2u 11 + λu 02 − u 20 +2u 11 − λ(4)e 2 = u 20 + u 02 + λ(5)u 20 + u 02 − λ√λ = (u 20 − u 02 ) 2 +4u 2 11 (6)Além das propriedades citadas acima, calculadas para todosos pixels pertences ao objeto, neste trabalho, seguindouma metodologia sugerida por Freeman [4], o objeto édivididoem 4 regiões iguais, e para cada uma dessas regiões, asmesmas propriedades dos momentos de imagens são calculadas.Desta maneira, o sistema pode combinar informaçõesglobais e locais durante a fase de classificação. A Figura 1325

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!