12.07.2015 Views

III WVC 2007 - Iris.sel.eesc.sc.usp.br - USP

III WVC 2007 - Iris.sel.eesc.sc.usp.br - USP

III WVC 2007 - Iris.sel.eesc.sc.usp.br - USP

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>WVC</strong>'<strong>2007</strong> - <strong>III</strong> Workshop de Visão Computacional, 22 a 24 de Outu<strong>br</strong>o de <strong>2007</strong>, São José do Rio Preto, SP.Neste artigo, uma aproximação para a recuperação deimagens baseada em semânticas de alto nível é apresentada.Dois aspectos importantes para a recuperação de imagenssão considerados: a recuperação de imagens que contenhamo maior número de regiões possuindo o(s) conceito(s)semântico(s) dado(s) pelo usuário e a fusão de diferente<strong>sc</strong>aracterísticas de baixo nível para dar à rede o conhecimentonecessário para reconhecer as regiões.2. Trabalhos CorrelatosPara tentar reduzir o gap-semântico existente entre opoder limitado de interpretação semântica pelas máquinase a rica subjetividade do pensamento humano alguns trabalhosbaseados em semânticas de alto nível têm sido proposto<strong>sc</strong>om o uso de ferramentas formais como técnicas deaprendizado supervisionado [8]. O objetivo do aprendizadosupervisionado é fornecer um resultado (por exemplo, umacategoria semântica à qual a consulta pertence) baseado emuma série de dados entrada [3]. Algumas técnicas, como oSupport Vector Machine (SVM) [9], podem ser utilizadaspara aprender conceitos de alto nível (como categoriassemânticas) através de características de baixo nível (comoatributos de cor, forma e textura).O SVM tem sido muito utilizado para reconhecimentode objetos, classificação de textos, e é considerado um bomcandidato para o aprendizado em sistemas de recuperaçãode imagens [13]. Tal técnica é utilizada para encontrarum hiperplano que separa os dados de entrada. Dentre ospossíveis hiperplanos, o plano separador ótimo (OSP) irámaximizar a distância entre o hiperplano e os pontos maispróximos de cada classe e utilizar esse separador para classificaras imagens [10].As redes neurais também podem ser utilizadas parase fazer a classificação de imagens. Nesse caso um considerávelnúmero de dados de treinamento (característicasde baixo nível) é inserido na rede neural para estabelecero vínculo entre os dados de entrada e suas categorias[14]. A classificação se dá na constituição defronteiras de decisão não lineares no espaço de característicasde baixo nível, adequando a imagem consulta aogrupo em que ela mais se aproxima.No artigo [16], Zhang propõe uma forma de recuperaçãode imagens em alto nível, através da divisão das imagens deinteresse em blocos de regiões uniformes e extraindo característicasde baixo nível (através de sete de<strong>sc</strong>ritores: CLD,CSD, DCD, EHD, TGF, GLC e HSV) para montar vetoresde características ponderados. A pesagem de cada termo édada pelo cálculo da matriz de distâncias do vetor para ocentróide do conjunto de vetores que caracterizam um conceitopré-e<strong>sc</strong>olhido. A recuperação é, então, feita atravésdesses vetores ponderados.Em [6] é proposto um sistema de recuperação de imagensatravés das redes neurais, onde cada imagem é caracterizadaem baixo nível (através da Transformada Di<strong>sc</strong>retado Co-seno) e associada à um ou mais conceitos presentesnesta. O vetores de características e seus respectivos rótulossão reunido em um conjunto para treinar a rede neural e estabelecero vínculo entre as características e os conceitospré-definidos. Os resultados mostram que as redes neuraispodem ser capazes de memorizar tais categorias mas, paraimagens compostas por vários conceitos semânticos os resultadosnão são satisfatórios. Motivado por essas idéias,esse trabalho propõe a divisão das imagens em regiões uniforme<strong>sc</strong>omo em [16], de forma que cada região contenhaum único conceito, para treinar uma rede neural dando aligação entre um vetor de características que represente ostrês atributos principais da recuperação de imagens (cor,forma e textura), tornando a rede mais robusta e a ligaçãoentre as características de baixo nível e seus respectivo<strong>sc</strong>onceitos ainda mais intrínseca.3. Recuperação de Imagens Baseada em ObjetosNa maioria dos cenários em recuperação de imagensos usuários sempre focam a atenção em simples objetos.As pessoas sempre tendem a procurar objetos deinterpretação semântica mais simples filtrando incon<strong>sc</strong>ientementeelementos ao redor da cena bem como outrosobjetos mais complexos. Entretanto, a segmentaçãode objetos não é di<strong>sc</strong>utida nesse trabalho, visto que asegmentação de uma imagem em objetos semanticamentesignificativos étão desafiante quanto o próprio problemado gap-semântico. A relação de objetos nesse trabalhoserá dada através do exame de pequenos blocosde tamanho fixo extraídos das imagens (também chamadosde regiões). O uso de tal técnica pode ser baseada naobservação de que os usuários estão interessados em encontrarobjetos nas imagens, não se importando o ambiente emque ela está inserida e de que as regiões caracterizam melhorum determinado objeto do que a caracterização de todaa imagem. A figura 1 mostra um exemplo que ilustra essasobservações. As regiões destacadas representam a<strong>sc</strong>ategorias semânticas: rochas, água e vegetação. Estes blocossão pequenos o suficiente para conter um únicoobjeto e grandes o bastante para carregar informação suficientena caracterização do objeto em questão.Ométodo proposto pode ser dividido em duas etapas:fase de treinamento e fase de consulta. Foram e<strong>sc</strong>olhido<strong>sc</strong>inco conceitos semânticos diferentes a serem representados:água, vegetação, nuvens, pedras e tigres. Para dar o conhecimentonecessário à rede neural e para que a mesmapossa reconhecer tais categorias nas imagens foram <strong>sel</strong>ecionadasmanualmente várias imagens contendo os referi-335

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!