12.07.2015 Views

III WVC 2007 - Iris.sel.eesc.sc.usp.br - USP

III WVC 2007 - Iris.sel.eesc.sc.usp.br - USP

III WVC 2007 - Iris.sel.eesc.sc.usp.br - USP

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>WVC</strong>'<strong>2007</strong> - <strong>III</strong> Workshop de Visão Computacional, 22 a 24 de Outu<strong>br</strong>o de <strong>2007</strong>, São José do Rio Preto, SP.possibilitam a recuperação de um conjunto finito deimagens similares a uma imagem exemplo, utilizandoinformações inerentes à própria imagem, similaridade essacom um nível de semelhança determinado pelo usuário.Os algoritmos que obtêm as características das imagensde forma automática são chamados de extratores efornecem como resultado um conjunto numéricorepresentando as características extraídas. Pode-se utilizarum ou mais extratores para representar uma imagem [2].Esta parte é um dos pontos mais sensíveis da recuperaçãode imagens por conteúdo, visto que sintetiza aspropriedades inerentes das imagens, que serão utilizadaspara a recuperação das mesmas [6].Outra etapa importante de sistemas CBIR é aindexação das características, que deve prever uma formaotimizada de armazenar os atributos a fim de fornecer aconsulta rápida e adequada a partir de um banco de dados[6]. A partir do vetor de características de espaço n-dimensional para o armazenamento dos atributos, arecuperação de imagens deve calcular a menor distânciaentre os vetores [1][2]. Pode ser realizada por meio deuma função que calcule a similaridade dos vetores e,conseqüentemente, das características armazenadas [2].A função de distância é um algoritmo que compara osvetores das imagens sob consulta, devendo satisfazeralgumas propriedades em um domínio métrico, retornandoum valor não negativo. Quanto menor esse valor, maisparecidas são as imagens comparadas [2].Uma vez definida a função de distância, pode-se fazeras consultas por similaridade. As funções mais utilizadassão: k-vizinhos mais próximos (k-nearest neighbor) ea<strong>br</strong>angência (range). A consulta pelos k-vizinhos maispróximos retorna os k valores mais próximos do ponto dereferência e a consulta por a<strong>br</strong>angência retorna os valorespertencentes ao raio de a<strong>br</strong>angência (raio de bu<strong>sc</strong>a), dadoque representa a distância de similaridade entre um pontode referência e a imagem em questão [3][2][7].3. Materiais e MétodosO trabalho aqui apresentado foi desenvolvidoutilizando a linguagem de programação Java e a API(Application Program Interface) JAI (Java AdvancedImaging) que possibilita a representação, o processamentoe a visualização de imagens [11]. Como SistemaGerenciador de Banco de Dados (SGBD) foi utilizado oDerby que utiliza o paradigma relacional, é gratuito einteiramente desenvolvido em Java.As imagens utilizadas neste projeto fazem parte de umbanco de imagens desenvolvido pelo LAPIMO(Laboratório de Processamento de Imagens Médicas eOdontológicas, da EESC/<strong>USP</strong>). A composição da base deimagens procurou obter a maior quantidade possível demamogramas, de forma a incluir imagens provenientes dediferentes hospitais. Na digitalização das imagens foramutilizados dois digitalizadores a laser, ambos da marcaLumisys (Lumi<strong>sc</strong>an 50 e Lumi<strong>sc</strong>an 75) e que, segundo ofa<strong>br</strong>icante, possibilitam obter imagens com até 12 bits deresolução de contraste (4096 níveis de cinza). O tamanhomédio das imagens é de 10,75 Megabytes e cada imagempossui em média 2048 linhas e 2750 colunas.Primeiramente foi implementado um algoritmo para aeliminação do fundo da imagem, uma vez que a<strong>sc</strong>aracterísticas obtidas das imagens devem ser computada<strong>sc</strong>onsiderando apenas a área da mama, e não a imageminteira.Para a composição do Banco de Dados foram criadastrês tabelas: IMAGEM, que armazena um código e o localde armazenamento da imagem; CARACTERISTICA, quearmazena um código e o nome referente à característica eIMAGEM_CARACTER, que faz o relacionamento entreas duas anteriores, armazenando o código da imagem, ocódigo da característica e também o valor associadoàquela característica da referida imagem. Portanto, atabela IMAGEM armazena todas as imagens pertencentesao banco, a tabela CARACTERISTICA guarda o cadastrode características possíveis e a tabelaIMAGEM_CARACTER guarda o valor de cadacaracterística em cada uma das imagens do banco,calculado quando é feita a primeira bu<strong>sc</strong>a utilizando areferida característica. O Diagrama Entidade-Relacionamento (DER) das tabelas apresentadas seencontra na Figura 1.Figura 1 – Diagrama Entidade-Relacionamento dastabelas do sistemaTambém foi desenvolvida uma estrutura genérica paraCBIR, de forma que futuramente as classesimplementadas possam ser aplicadas para outros tipos deimagens, uma vez que permite a inserção de novosextratores de características no sistema. Para este esquema(Figura 2), foram criadas quatro classes que servirão debase para o sistema:• ParameterBlock - contém objetos quefuncionam como um vetor de elementos que servirão deparâmetro para os extratores de características;• AbstractExtractor - serve de base para acriação dos extratores de características. Padroniza aimplementação de um construtor, um método para fazer acomparação de duas imagens (compare), outro paracalcular o valor da característica (computeValue) etambém permite ao programador definir os parâmetrospara o extrator (setParameters);248

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!