III WVC 2007 - Iris.sel.eesc.sc.usp.br - USP

More documents

Recommendations

Info

WVC'2007 - III Workshop de Visão Computacional, 22 a 24 de Outubro de 2007, São José do Rio Preto, SP.Implementação de uma Ferramenta para Recuperação de ImagensMamográficas Baseada em ConteúdoAna Paula O. Santos, Fátima L. S. Nunes, Márcio E. DelamaroCentro Universitário Eurípides de Marília – UNIVEMana.ps84@gmail.com, {fatima,delamaro}@univem.edu.brResumoEste trabalho apresenta a implementação de umsistema de recuperação de imagens baseada em conteúdopara aplicação em um banco de dados de imagensmamográficas, utilizado originalmente para apoiar odesenvolvimento e os testes de sistemas de auxílio aodiagnóstico. O sistema foi desenvolvido utilizando alinguagem de programação Java, juntamente com a APIJAI (Java Advanced Imaging).1. IntroduçãoEsquemas de diagnóstico auxiliado por computador(CAD – computer-aided diagnosis) têm sidodesenvolvidos por vários grupos de pesquisas, visando aauxiliar na detecção precoce do câncer de mama, pois ésabido que a descoberta da doença na fase inicial favorecea sua cura [4]. A maioria dos trabalhos nessa área édesenvolvida tendo as imagens geradas através demamografia por raios X como fonte de dados. EsquemasCAD podem ser úteis no sentido de emitir uma segundaopinião ao radiologista, chamando a atenção para áreassuspeitas da imagem. Entre essas áreas, estão, porexemplo, aquelas que podem conter agrupamentos demicrocalcificações (clusters) ou nódulos em formação.Uma das maiores dificuldades encontradas durante odesenvolvimento das técnicas utilizadas na construção desistemas CAD diz respeito à avaliação dos processos. Osresultados podem variar de acordo com o conjunto deimagens utilizado nos testes. Para se atestar a viabilidadedo uso de uma técnica são necessários testes com umvasto conjunto de imagens que tenham, preferencialmente,características de aquisição variadas e que atendam aosrequisitos da finalidade da técnica, isto é, conter asestruturas procuradas na detecção. Uma vez formada abase de imagens, outra dificuldade encontrada é buscardentro dela as imagens adequadas para testes de umadeterminada técnica. O usuário pode querer, por exemplo,somente imagens de mamas densas ou, ainda, imagens quecontenham um determinado achado radiológico, como umtumor benigno ou maligno. A inclusão de atributostextuais na base de dados poderia facilitar tal busca, masexigiria conhecimento prévio de cada imagem, fornecidopelos laudos, que nem sempre estão disponíveis.Dentro deste contexto a Recuperação de ImagensBaseada em Conteúdo (CBIR – Content-Based ImageRetrieval) pode oferecer uma solução eficaz. O conceitode CBIR consiste em uma busca feita por imagenssemelhantes a um determinado padrão fornecido. O quetorna isso possível é a comparação realizada entreaspectos da imagem dada e as imagens armazenadas nabase de dados. O interessante é a execução da busca porsemelhança a um caso específico (uma imagem fornecida)e não como no processo convencional de busca textualque compara parâmetros do usuário com valores deatributos armazenados [6]. Os critérios de similaridadesão obtidos a partir da extração de características daimagem como cor, textura e forma.Em trabalhos anteriores foi implementada umaferramenta para gerenciar uma base de imagensmamográficas usando a Internet. O objetivo eradisponibilizar um grande conjunto de imagensmamográficas digitalizadas e suas respectivasinformações, a fim de que seu uso pudesse contribuir naavaliação de esquemas CAD em mamografia. O sistemafoi implementado com tecnologia gratuita, permitindoacesso rápido, eficiente e sem custos adicionais aousuário. A base de imagens disponibilizada pode serusada também como ferramenta didática para o ensino detópicos relacionados à mamografia [9][10].Este trabalho apresenta a implementação de umsistema de recuperação de imagens mamográficas baseadaem conteúdo, a fim de auxiliar os testes de sistemas CAD.Um segundo objetivo é disponibilizar uma ferramentadidática para o ensino de áreas da saúde que utilizam asimagens médicas como material didático.2. Recuperação de Imagens Baseada emConteúdoEm CBIR a comparação entre as imagens é feitautilizando um conjunto de características que asdescrevem. Estas características podem ser obtidas porespecialistas ou utilizando-se algoritmos automáticos [2].Os algoritmos automáticos podem extrair atributosrelacionados a cor, textura ou forma, de acordo com aclasse de imagens e o interesse do usuário. Os atributossão agrupados em um vetor de características, querepresenta o conteúdo da imagem. Sistemas CBIR247
WVC'2007 - III Workshop de Visão Computacional, 22 a 24 de Outubro de 2007, São José do Rio Preto, SP.possibilitam a recuperação de um conjunto finito deimagens similares a uma imagem exemplo, utilizandoinformações inerentes à própria imagem, similaridade essacom um nível de semelhança determinado pelo usuário.Os algoritmos que obtêm as características das imagensde forma automática são chamados de extratores efornecem como resultado um conjunto numéricorepresentando as características extraídas. Pode-se utilizarum ou mais extratores para representar uma imagem [2].Esta parte é um dos pontos mais sensíveis da recuperaçãode imagens por conteúdo, visto que sintetiza aspropriedades inerentes das imagens, que serão utilizadaspara a recuperação das mesmas [6].Outra etapa importante de sistemas CBIR é aindexação das características, que deve prever uma formaotimizada de armazenar os atributos a fim de fornecer aconsulta rápida e adequada a partir de um banco de dados[6]. A partir do vetor de características de espaço n-dimensional para o armazenamento dos atributos, arecuperação de imagens deve calcular a menor distânciaentre os vetores [1][2]. Pode ser realizada por meio deuma função que calcule a similaridade dos vetores e,conseqüentemente, das características armazenadas [2].A função de distância é um algoritmo que compara osvetores das imagens sob consulta, devendo satisfazeralgumas propriedades em um domínio métrico, retornandoum valor não negativo. Quanto menor esse valor, maisparecidas são as imagens comparadas [2].Uma vez definida a função de distância, pode-se fazeras consultas por similaridade. As funções mais utilizadassão: k-vizinhos mais próximos (k-nearest neighbor) eabrangência (range). A consulta pelos k-vizinhos maispróximos retorna os k valores mais próximos do ponto dereferência e a consulta por abrangência retorna os valorespertencentes ao raio de abrangência (raio de busca), dadoque representa a distância de similaridade entre um pontode referência e a imagem em questão [3][2][7].3. Materiais e MétodosO trabalho aqui apresentado foi desenvolvidoutilizando a linguagem de programação Java e a API(Application Program Interface) JAI (Java AdvancedImaging) que possibilita a representação, o processamentoe a visualização de imagens [11]. Como SistemaGerenciador de Banco de Dados (SGBD) foi utilizado oDerby que utiliza o paradigma relacional, é gratuito einteiramente desenvolvido em Java.As imagens utilizadas neste projeto fazem parte de umbanco de imagens desenvolvido pelo LAPIMO(Laboratório de Processamento de Imagens Médicas eOdontológicas, da EESC/USP). A composição da base deimagens procurou obter a maior quantidade possível demamogramas, de forma a incluir imagens provenientes dediferentes hospitais. Na digitalização das imagens foramutilizados dois digitalizadores a laser, ambos da marcaLumisys (Lumiscan 50 e Lumiscan 75) e que, segundo ofabricante, possibilitam obter imagens com até 12 bits deresolução de contraste (4096 níveis de cinza). O tamanhomédio das imagens é de 10,75 Megabytes e cada imagempossui em média 2048 linhas e 2750 colunas.Primeiramente foi implementado um algoritmo para aeliminação do fundo da imagem, uma vez que ascaracterísticas obtidas das imagens devem ser computadasconsiderando apenas a área da mama, e não a imageminteira.Para a composição do Banco de Dados foram criadastrês tabelas: IMAGEM, que armazena um código e o localde armazenamento da imagem; CARACTERISTICA, quearmazena um código e o nome referente à característica eIMAGEM_CARACTER, que faz o relacionamento entreas duas anteriores, armazenando o código da imagem, ocódigo da característica e também o valor associadoàquela característica da referida imagem. Portanto, atabela IMAGEM armazena todas as imagens pertencentesao banco, a tabela CARACTERISTICA guarda o cadastrode características possíveis e a tabelaIMAGEM_CARACTER guarda o valor de cadacaracterística em cada uma das imagens do banco,calculado quando é feita a primeira busca utilizando areferida característica. O Diagrama Entidade-Relacionamento (DER) das tabelas apresentadas seencontra na Figura 1.Figura 1 – Diagrama Entidade-Relacionamento dastabelas do sistemaTambém foi desenvolvida uma estrutura genérica paraCBIR, de forma que futuramente as classesimplementadas possam ser aplicadas para outros tipos deimagens, uma vez que permite a inserção de novosextratores de características no sistema. Para este esquema(Figura 2), foram criadas quatro classes que servirão debase para o sistema:• ParameterBlock - contém objetos quefuncionam como um vetor de elementos que servirão deparâmetro para os extratores de características;• AbstractExtractor - serve de base para acriação dos extratores de características. Padroniza aimplementação de um construtor, um método para fazer acomparação de duas imagens (compare), outro paracalcular o valor da característica (computeValue) etambém permite ao programador definir os parâmetrospara o extrator (setParameters);248
Page 1 and 2:
III Workshop de VisãoComputacional
Page 3 and 4:
Instituto de Biociências, Letras e
Page 5 and 6:
WVC 2007 - III Workshop de Visão C
Page 7 and 8:
ApresentaçãoA área de Visão Com
Page 10 and 11:
Automatic Pattern Recognition of Bi
Page 12 and 13:
WVC'2007 - III Workshop de Visão C
Page 14 and 15:
Page 16:
Page 19:
Page 22 and 23:
Page 24 and 25:
Page 26 and 27:
Page 28 and 29:
Page 30 and 31:
Page 33 and 34:
Page 35 and 36:
Page 37 and 38:
Page 39 and 40:
Page 41 and 42:
Page 43 and 44:
Page 45 and 46:
Page 47 and 48:
Page 49 and 50:
Page 51 and 52:
Page 53 and 54:
Page 55 and 56:
Page 57 and 58:
Page 59 and 60:
Page 61 and 62:
Page 63 and 64:
Page 65 and 66:
Page 67 and 68:
Page 69 and 70:
Page 71 and 72:
Page 73 and 74:
Page 75 and 76:
Page 77 and 78:
Page 79 and 80:
Page 81 and 82:
Page 83 and 84:
Page 85 and 86:
Page 87 and 88:
Page 89 and 90:
Page 91 and 92:
Page 93 and 94:
Page 95 and 96:
Page 97 and 98:
Page 99 and 100:
Page 101 and 102:
Page 103 and 104:
Page 105 and 106:
Page 107 and 108:
Page 109 and 110:
Page 111 and 112:
Page 113 and 114:
Page 115 and 116:
Page 117 and 118:
Page 119 and 120:
Page 121 and 122:
Page 123 and 124:
Page 125 and 126:
Page 127 and 128:
Page 129 and 130:
Page 131 and 132:
Page 133 and 134:
Page 135 and 136:
Page 137 and 138:
Page 139 and 140:
Page 141 and 142:
Page 143 and 144:
Page 145 and 146:
Page 147 and 148:
Page 149 and 150:
Page 151 and 152:
Page 153 and 154:
Page 155 and 156:
Page 157 and 158:
Page 159 and 160:
Page 161 and 162:
Page 163 and 164:
Page 165 and 166:
Page 167 and 168:
Page 169 and 170:
Page 171 and 172:
Page 173 and 174:
Page 175 and 176:
Page 177 and 178:
Page 179 and 180:
Page 181 and 182:
Page 183 and 184:
Page 185 and 186:
Page 187 and 188:
Page 189 and 190:
Page 191 and 192:
Page 193 and 194:
Page 195 and 196:
Page 197 and 198:
Page 199 and 200:
Page 201 and 202:
Page 203 and 204:
Page 205 and 206:
Page 207 and 208: WVC'2007 - III Workshop de Visão C
Page 257: WVC'2007 - III Workshop de Visão C
Page 309 and 310:
Page 311 and 312:
Page 313 and 314:
Page 315 and 316:
Page 317 and 318:
Page 319 and 320:
Page 321 and 322:
Page 323 and 324:
Page 325 and 326:
Page 327 and 328:
Page 329 and 330:
Page 331 and 332:
Page 333 and 334:
Page 335 and 336:
Page 337 and 338:
Page 339 and 340:
Page 341 and 342:
Page 343 and 344:
Page 345 and 346:
Page 347 and 348:
Page 349 and 350:
Page 351 and 352:
Page 353 and 354:
Page 355 and 356:
Page 357 and 358:
Page 359 and 360:
Page 361 and 362:
Page 363:
show all

III WVC 2007 - Iris.sel.eesc.sc.usp.br - USP

Create successful ePaper yourself

Delete template?

Save as template?