12.07.2015 Views

III WVC 2007 - Iris.sel.eesc.sc.usp.br - USP

III WVC 2007 - Iris.sel.eesc.sc.usp.br - USP

III WVC 2007 - Iris.sel.eesc.sc.usp.br - USP

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>WVC</strong>'<strong>2007</strong> - <strong>III</strong> Workshop de Visão Computacional, 22 a 24 de Outu<strong>br</strong>o de <strong>2007</strong>, São José do Rio Preto, SP.2. Extração de características direcionaisAidéia do método proposto consiste em decomporaimagem em diversas partes menores e classificar cadauma delas com base em características, tais como orientaçãopredominante, nível de cinza médio, existênciade bordas, etc., que são de fato elementos que caracterizamos textons [6] e originam as texturas. Os elementosque caracterizam as texturas são encontradosindiretamente durante uma etapa de aprendizado.Asegmentação propriamente é precedida por umaetapa de aprendizado em queseapresentaaum algoritmode reconhecimento de padrõesdiversasamostrasdos vetores de características coletados de uma basedeimagens. Esses vetores são originados de acordo com oprocesso de extração de características apresentado naFigura 1Janela deslizanteImagemDFTBanco de filtrosFunção detransferência1 2 3 4Vetor deatributosdessa base as projeções no domínio da freqüência assumemuma disposição típica, o espectro da DFT normalmentetem valores significativos somente em algumasfreqüências mais comuns. Dado que muitos componentesda DFT contribuem com um peso insignificantena sua formação, a dimensão do padrão podepode ser seguramente reduzida sem prejuízoparaoalgoritmode reconhecimento. Uma forma usual de reduzira dimensão do vetor de características éatravés deAnálisedeComponentes Principais (PCA), que correspondea uma projeção no espaço de saída da matriz decovariância dos padrões, permutada em ordem decre<strong>sc</strong>entedos autovalores. Os vetores projetados neste novoespaço possuem componentes independentes entre si epodem ser de<strong>sc</strong>artados com base na análise desses autovalores.O cálculo de cada um dos componentes, quecorresponde ao produto interno do padrão de entradacom um vetor linha da matriz de projeção, equivale àrealização de uma filtragem no domínio da freqüência,representado na Figura 1 como Etapa 3. Existem tantosfiltrosquantoonúmerode componentes principais.ComponentesAmostrasFigura 1. Esquema simplificado do processo deextração de característicasDe acordo com aFigura1,aEtapa1consisteemrealizar o deslocamento de uma janela deslizante so<strong>br</strong>euma imagem. Utilizamos uma janeladedimensão 8×8pixels. A janela deslizante realiza uma amostragem localdo sinal luminoso em intervalos regulares. Duranteotreinamento essa janela dá saltosde16em 16 pixelsamostrando, portanto, regiões não contíguas da imagem.Essessaltossão realizados para diminuir a quantidadede vetores gerados para amostra, já que paraapenas uma imagem essa quantidade é grande.A Etapa 2 realiza a transformada de Fourier em 2dimensões (também conhecida como DFT–Di<strong>sc</strong>reteFourier Transform) eocálculo do logarítmo damagnitude.O espectro da DFT desta sub-imagem éentãolinearizado originando um vetor de 64 posições. Muita<strong>sc</strong>aracterísticas estruturais que formam umaimagemtípica da base de imagens de veículos são bem caracterizadasno domínio da freqüência, tais como asfalto,lataria, placa, bordas, etc. Nos experimentos que realizamos,observamos também que para imagens como asFigura 2. Subconjunto dos vetores de treinamentorepresentados como uma imagem emnível de cinzaOs componentes principais, preservados para uso futuro,carregam a maior parte da informação requeridapara a etapa de reconhecimento. Entretanto, se observarmosum subconjunto dos vetores de treinamento noespaço projetado (Figura 2) podemos constatar que emalgumas dimensõesospadrões estão muito próximos eque, portanto, são difíceis de serem agrupados apropriadamente.Pode ser facilmente atribuído a um mesmogrupo padrões que deveriam ser considerados distintos.Isso ocorre porque a variância em cada componentedecre<strong>sc</strong>e progressivamente do mais ao menos importante(Figura 3). Para melhorar a separabilidadeentre as classes, aplica-se a cada componente a funçãosigmóide, que possui a propriedade de mapear sua entradanointervalo(0,1). Se o ganho dessa função for122

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!