28.11.2014 Views

Warp Metric Distance: Aprimorando o Uso de Histogramas de ... - SBIS

Warp Metric Distance: Aprimorando o Uso de Histogramas de ... - SBIS

Warp Metric Distance: Aprimorando o Uso de Histogramas de ... - SBIS

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Warp</strong> <strong>Metric</strong> <strong>Distance</strong>: <strong>Aprimorando</strong> o <strong>Uso</strong> <strong>de</strong> <strong>Histogramas</strong> <strong>de</strong> Intensida<strong>de</strong><br />

para Busca por Similarida<strong>de</strong> em Imagens Médicas<br />

Joaquim Cezar Felipe 1 , Agma Juci Machado Traina 2<br />

1 Departamento <strong>de</strong> Física e Matemática - Faculda<strong>de</strong> <strong>de</strong> Filosofia, Ciências e Letras <strong>de</strong> Ribeirão Preto<br />

Universida<strong>de</strong> <strong>de</strong> São Paulo (USP), Brasil<br />

2 Instituto <strong>de</strong> Ciências Matemáticas e <strong>de</strong> Computação (ICMC)<br />

Universida<strong>de</strong> <strong>de</strong> São Paulo (USP), Brasil<br />

Resumo – Este trabalho apresenta uma nova medida <strong>de</strong> distância (<strong>Warp</strong> <strong>Metric</strong> <strong>Distance</strong>) para histogramas <strong>de</strong><br />

intensida<strong>de</strong>s utilizados no processo <strong>de</strong> busca por conteúdo em imagens. No uso <strong>de</strong> histogramas, os chamados<br />

<strong>Histogramas</strong> Métricos representam uma opção eficiente e computacionalmente barata, <strong>de</strong>vido ao fato <strong>de</strong><br />

aplicarem uma redução do número <strong>de</strong> bins sobre os histogramas tradicionais. O método <strong>Warp</strong> <strong>Metric</strong> <strong>Distance</strong><br />

adapta e implementa a métrica <strong>Warp</strong>, proposta originalmente para a comparação entre séries temporais, como<br />

uma medida <strong>de</strong> distância para histogramas métricos. Os resultados obtidos com esse método, aplicado a busca<br />

por similarida<strong>de</strong> em imagens médicas, evi<strong>de</strong>nciam que o mesmo mostra-se superior ao se manipular imagens<br />

com variações <strong>de</strong> brilho e contraste, dada a sua flexibilida<strong>de</strong> em relação a esse tipo <strong>de</strong> irregularida<strong>de</strong>, além <strong>de</strong><br />

apresentar uma melhor compatibilida<strong>de</strong> com avaliações <strong>de</strong> similarida<strong>de</strong> realizadas com radiologistas.<br />

Palavras-chave: busca por conteúdo, imagens médicas, histograma <strong>de</strong> intensida<strong>de</strong>, distância warp<br />

Abstract – This work presents a new distance measure for intensity histograms - <strong>Warp</strong> <strong>Metric</strong> <strong>Distance</strong> - used in<br />

content-based image retrieval. The so-called <strong>Metric</strong> Histograms represent an efficient and cheap alternative to<br />

the use of histograms, since they apply a reduction on the number of bins of traditional histograms. <strong>Warp</strong> <strong>Metric</strong><br />

<strong>Distance</strong> method adapts and implements the <strong>Warp</strong> metric, originally proposed for the comparison of time series,<br />

as a distance measure between metric histograms. Results achieved by this method, when applied to similarity<br />

retrieval in medical images, <strong>de</strong>monstrate its superiority in analyzing images that present brightness and contrast<br />

disparities. This is a consequence of the flexibility of the <strong>de</strong>veloped method while <strong>de</strong>aling with this kind of<br />

irregularity. Moreover, these results match better with similarity evaluations performed by radiologists.<br />

Key-words: content-based retrieval, medical images, intensity histogram, warp distance<br />

Introdução<br />

Nas últimas décadas, com o surgimento dos<br />

sistemas PACS (Picture Archiving and<br />

Communication Systems) [1] [2], verifica-se um<br />

interesse crescente em integrar todas as informações<br />

relativas a pacientes (textos, imagens, gráficos,<br />

dados temporais, etc) em sistemas <strong>de</strong> informações<br />

hospitalares. A enorme quantida<strong>de</strong> <strong>de</strong> imagens<br />

digitais geradas em hospitais e centros <strong>de</strong> saú<strong>de</strong><br />

exige o <strong>de</strong>senvolvimento <strong>de</strong> mecanismos automáticos<br />

para o seu armazenamento e para a sua recuperação<br />

em bases <strong>de</strong> dados. Por isso, um PACS necessita<br />

incorporar recursos para recuperar as imagens <strong>de</strong><br />

forma a viabilizar o uso dos seus módulos <strong>de</strong> busca<br />

no ambiente do dia-a-dia. Além disso, para fornecer<br />

ajuda efetiva aos profissionais que analisam as<br />

imagens e geram diagnósticos, os mecanismos <strong>de</strong><br />

recuperação <strong>de</strong>vem retornar imagens compatíveis<br />

com os critérios estabelecidos pelos especialistas [3].<br />

Devido ao fato <strong>de</strong> a recuperação baseada em<br />

anotações textuais ser imprecisa e trabalhosa,<br />

atualmente tem crescido o interesse pela<br />

recuperação <strong>de</strong> imagens baseada em conteúdo<br />

(Content-Based Image Retrieval – CBIR). Técnicas<br />

<strong>de</strong> CBIR utilizam as características visuais<br />

intrínsecas das imagens, tais como cor, forma e<br />

textura, para a sua in<strong>de</strong>xação e recuperação [4], por<br />

meio do uso <strong>de</strong> <strong>de</strong>scritores. A incorporação <strong>de</strong><br />

funcionalida<strong>de</strong>s <strong>de</strong> CBIR aos sistemas PACS [5]<br />

empresta a estes maior po<strong>de</strong>r <strong>de</strong> auxiliar nas tarefas<br />

<strong>de</strong> diagnóstico, uma vez que estas funcionalida<strong>de</strong>s<br />

propiciam manipulação e organização mais<br />

eficientes das imagens médicas.<br />

Dentre as características <strong>de</strong> baixo nível das<br />

imagens médicas, as variações <strong>de</strong> cor (tons <strong>de</strong><br />

cinza nas imagens monocromáticas) assumem


<strong>de</strong>stacada importância, por permitirem a<br />

i<strong>de</strong>ntificação <strong>de</strong> <strong>de</strong>talhes dos tecidos e regiões<br />

analisadas.<br />

Cor é uma proprieda<strong>de</strong> relacionada com a<br />

capacida<strong>de</strong> dos objetos <strong>de</strong> refletir ondas<br />

eletromagnéticas <strong>de</strong> diferentes comprimentos, num<br />

espectro visível que varia aproximadamente <strong>de</strong> 400<br />

nm até 700 nm. A fim <strong>de</strong> se mapear numericamente<br />

o conjunto <strong>de</strong> cores do espectro visível, diversos<br />

mo<strong>de</strong>los (ou espaços <strong>de</strong> cores) – RGB (red, green,<br />

blue), CMY (cyan, magenta, yellow), YIQ, HSI (hue,<br />

saturation, intensity), CIELab – têm sido propostos e<br />

utilizados, cada qual com suas vantagens e<br />

aplicações específicas. A estrutura mais utilizada<br />

para a representação da distribuição global <strong>de</strong> cores<br />

<strong>de</strong> uma imagem é o chamado Histograma <strong>de</strong><br />

Intensida<strong>de</strong>s, que consiste na quantificação da<br />

freqüência com que ocorrem os diferentes valores<br />

<strong>de</strong> luminância apresentados pelos pixels da<br />

imagem. Dessa forma, o Histograma <strong>de</strong><br />

Intensida<strong>de</strong>s (juntamente com uma série <strong>de</strong><br />

operações executadas sobre o mesmo) po<strong>de</strong> ser<br />

utilizado para representar o conteúdo intrínseco da<br />

imagem, baseando-se no seu atributo <strong>de</strong> cor.<br />

O presente trabalho está focado na busca por<br />

similarida<strong>de</strong> entre imagens médicas, baseada nas<br />

suas distribuições <strong>de</strong> cores. Uma nova medida <strong>de</strong><br />

distância para histogramas – <strong>Warp</strong> <strong>Metric</strong> <strong>Distance</strong> –<br />

é apresentado, assim como alguns resultados<br />

obtidos com a sua utilização em "buscas aos<br />

vizinhos mais próximos" em uma base <strong>de</strong> imagens<br />

médicas gerais.<br />

A aquisição do histograma métrico, a partir <strong>de</strong><br />

um histograma convencional, é realizada da<br />

seguinte forma: o contorno original do histograma<br />

convencional é reduzido a uma seqüência <strong>de</strong><br />

segmentos <strong>de</strong> reta. O algoritmo utilizado i<strong>de</strong>ntifica<br />

pontos <strong>de</strong> máximo, pontos <strong>de</strong> mínimo e pontos<br />

intermediários significativos, com base em valores<br />

<strong>de</strong> gradiente. Esses pontos são chamados <strong>de</strong><br />

pontos <strong>de</strong> controle. Cada região <strong>de</strong>finida por um<br />

segmento, entre dois pontos <strong>de</strong> controle, é chamada<br />

<strong>de</strong> bucket. Um bucket correspon<strong>de</strong>ria, assim a um<br />

bin <strong>de</strong> um histograma normalizado, possuindo uma<br />

largura e valores <strong>de</strong> freqüência para os seus pontos<br />

inicial e final. A diferença é que a divisão <strong>de</strong> bins é<br />

pré-<strong>de</strong>terminada e igual para todas as imagens,<br />

enquanto a quantida<strong>de</strong> e a divisão dos buckets<br />

<strong>de</strong>pen<strong>de</strong> <strong>de</strong> cada imagem. Um bucket normalmente<br />

engloba vários bins e, <strong>de</strong>ssa forma, consegue-se<br />

manter o formato do histograma <strong>de</strong>ntro <strong>de</strong> limites<br />

confiáveis e, ao mesmo tempo reduzir drasticamente<br />

sua dimensionalida<strong>de</strong>. A Figura 1, adaptada <strong>de</strong> [6],<br />

mostra um exemplo <strong>de</strong> histograma métrico.<br />

Bins Bucket pontos <strong>de</strong> controle<br />

2 pontos <strong>de</strong> controle consecutivos<br />

<strong>de</strong>limitam 1 bucket<br />

Metodologia<br />

A seguir são discutidas as técnicas utilizadas<br />

neste trabalho para o processo <strong>de</strong> recuperação <strong>de</strong><br />

imagens por similarida<strong>de</strong>.<br />

Histograma Métrico. Em [6] é apresentado um<br />

novo tratamento matemático aplicado aos<br />

histogramas <strong>de</strong> intensida<strong>de</strong>, chamado Histograma<br />

Métrico, que consiste <strong>de</strong> modificações sobre os<br />

histogramas tradicionais, acompanhadas <strong>de</strong> uma<br />

nova forma <strong>de</strong> cálculo da distância. Os histogramas<br />

métricos permitem comparar imagens <strong>de</strong> tamanhos<br />

variados e mapeadas em diferentes faixas <strong>de</strong><br />

quantização, ou seja, além <strong>de</strong> serem – como os<br />

histogramas normalizados – invariantes a<br />

transformações geométricas nas imagens, os<br />

histogramas métricos são também invariantes com<br />

relação a transformações lineares <strong>de</strong> brilho.<br />

Para permitir consultas por similarida<strong>de</strong> a<br />

partir <strong>de</strong> estruturas <strong>de</strong> índices, foi necessário<br />

<strong>de</strong>senvolver uma nova métrica, que consi<strong>de</strong>ra a<br />

diferença <strong>de</strong> área entre pares <strong>de</strong> histogramas<br />

métricos no cálculo da distância entre os mesmos.<br />

Figura 1. Exemplo <strong>de</strong> histograma métrico<br />

Uma conseqüência importante <strong>de</strong>sse<br />

processo é que não existe uma dimensão pré<strong>de</strong>finida<br />

para o domínio do problema, já que cada<br />

imagem po<strong>de</strong> ter um número diferente <strong>de</strong> buckets.<br />

Dessa forma, as imagens não po<strong>de</strong>m ser<br />

representadas como pontos em um espaço<br />

dimensional e isso conduz à necessida<strong>de</strong> <strong>de</strong> se<br />

<strong>de</strong>finir também uma nova forma <strong>de</strong> cálculo da<br />

distância entre duas imagens, uma vez que tanto o<br />

número <strong>de</strong> buckets, quanto a sua distribuição em<br />

diferentes histogramas são variáveis.<br />

A distância proposta em [6] – Distância<br />

Métrica - para comparar histogramas métricos efetua<br />

a comparação entre as áreas dos mesmos. Partindo<br />

do princípio <strong>de</strong> que a similarida<strong>de</strong> entre dois


histogramas po<strong>de</strong> ser <strong>de</strong>finida pelo grau <strong>de</strong><br />

sobreposição das áreas <strong>de</strong> suas distribuições <strong>de</strong><br />

freqüência, a distância entre duas imagens é<br />

<strong>de</strong>terminada pela diferença entre as suas áreas:<br />

bm<br />

d M(Q,<br />

C) = M H(C,<br />

x) − M<br />

∫<br />

H<br />

(Q,<br />

x)dx<br />

0<br />

on<strong>de</strong>: bm é a largura máxima entre os dois<br />

histogramas;<br />

M H (imagem,x) é a função contínua que<br />

representa o histograma métrico da imagem.<br />

Experimentos realizados com bases <strong>de</strong> dados<br />

<strong>de</strong> imagens <strong>de</strong> tomografias mostraram que, para a<br />

maioria das imagens, o número <strong>de</strong> buckets ficou na<br />

faixa <strong>de</strong> 10-62, contrastando com os 256 bins que<br />

normalmente são utilizados em histogramas<br />

normalizados. Resultados semelhantes <strong>de</strong> conjuntos<br />

<strong>de</strong> imagens são obtidos usando histogramas métricos<br />

e histogramas convencionais associados à distância<br />

L 1 . Porém o histograma métrico apresenta ganhos<br />

significativos <strong>de</strong> <strong>de</strong>sempenho no processo <strong>de</strong><br />

in<strong>de</strong>xação.<br />

Dynamic Time <strong>Warp</strong>ing. Dentre as técnicas<br />

clássicas usadas para se comparar duas séries<br />

temporais, <strong>de</strong>staca-se a chamada Dynamic Time<br />

<strong>Warp</strong>ing (DTW), cujo principal benefício consiste na<br />

aproximação <strong>de</strong> séries que possuem<br />

<strong>de</strong>senvolvimentos semelhantes, porém <strong>de</strong>fasados<br />

ou "<strong>de</strong>formados" um em relação ao outro, ao longo<br />

do eixo temporal [7].<br />

A sensibilida<strong>de</strong> da técnica à <strong>de</strong>formação se<br />

<strong>de</strong>ve ao fato <strong>de</strong> que as comparações entre os<br />

pontos não se fazem rigidamente entre os pares<br />

localizados nas mesmas coor<strong>de</strong>nadas, mas com a<br />

flexibilida<strong>de</strong> <strong>de</strong> que um ponto <strong>de</strong> uma série possa<br />

ser comparado com pontos adjacentes da outra<br />

série, conforme mostrado na Figura 2.<br />

a) b)<br />

Figura 2. Comparação entre séries:<br />

a) convencional; b) com DTW<br />

(1)<br />

Suponhamos que temos duas séries Q=(q 1 ,<br />

q 2 , ... , q n ) e C=(c 1 , c 2 , ... , c m ), <strong>de</strong> tamanho n e m<br />

respectivamente. Para compará-las usando DTW,<br />

construímos uma matriz nxm cujo elemento (i,j)<br />

contém a distância d(q i ,c j ). Tipicamente é usada a<br />

distância Euclidiana. Cada elemento da matriz<br />

correspon<strong>de</strong> ao alinhamento entre os pontos nele<br />

representados.<br />

Um percurso <strong>de</strong> ajuste W=(w 1 , w 2 , ... , w k ) é<br />

um conjunto <strong>de</strong> elementos contíguos da matriz que<br />

<strong>de</strong>fine um mapeamento entre Q e C. O percurso <strong>de</strong><br />

ajuste <strong>de</strong>verá obe<strong>de</strong>cer às seguintes regras [8]:<br />

• Iniciar e terminar em células diagonalmente<br />

opostas da matriz, ou seja, w1=(1,1) e wk=(n,m);<br />

• A seqüência entre os elementos do percurso<br />

<strong>de</strong>verá conter elementos adjacentes da matriz<br />

(incluindo elementos diagonalmente<br />

posicionados);<br />

• A seqüência não po<strong>de</strong>rá "voltar" no caminho<br />

dos elementos da matriz.<br />

Há muitos possíveis percursos <strong>de</strong> ajuste,<br />

porém o percurso a ser escolhido é aquele que<br />

minimiza o custo da <strong>de</strong>formação, ou seja, cuja<br />

distância acumulada ao longo do mesmo é mínima:<br />

DTW ( Q,<br />

C)<br />

= min(<br />

K<br />

∑<br />

k = 1<br />

w k / K)<br />

(2)<br />

A DTW tem sido usada com sucesso em<br />

aplicações tais como: data mining, reconhecimento<br />

<strong>de</strong> gestos, robótica e processamento da fala [9].<br />

<strong>Warp</strong> <strong>Metric</strong> <strong>Distance</strong>. A proposta <strong>de</strong>ste trabalho é<br />

adaptar a DTW para se criar um método<br />

comparativo entre histogramas que seja menos<br />

sensível a distorções <strong>de</strong> brilho e contraste, problema<br />

comumente encontrado quando se manipulam<br />

imagens médicas, <strong>de</strong>vido a imprecisões e a<br />

variações <strong>de</strong> ajuste dos aparelhos <strong>de</strong> captura das<br />

mesmas. Decidiu-se trabalhar com os histogramas<br />

métricos, uma vez que eles geram resultados<br />

próximos dos histogramas convencionais, com a<br />

vantagem <strong>de</strong> reduzir o esforço computacional.<br />

Utilizando um aplicativo que realiza buscas <strong>de</strong><br />

vizinhança mais próxima, a partir do cálculo dos<br />

histogramas métricos, mostrando as imagens<br />

resultantes, foi implementada a <strong>Warp</strong> <strong>Metric</strong><br />

<strong>Distance</strong> (WMD), como uma adaptação da técnica<br />

DTW sobre os histogramas métricos. A Figura 3<br />

mostra dois histogramas métricos obtidos <strong>de</strong><br />

imagens médicas, assim como a matriz <strong>de</strong> ajuste<br />

entre eles, na qual aparece em <strong>de</strong>staque o percurso<br />

<strong>de</strong> ajuste W.


0.00 0.05 0.10 0.15 0.20 0.25 0.30<br />

A<br />

B<br />

0 2 4 6 8 10 12<br />

B 0 1 2 3 4 5 6 7 8 9 10 11 12<br />

A 24.0 5.0 13.0 10.0 13.0 20.0 7.2 3.0 2.0 0.5 1.0 1.3 0.0<br />

0 28.0 4.0 27.0 42.0 60.0 75.0 83.0 103 128 154 182 209 236 264<br />

1 7.0 21.0 6.0 12.0 15.0 21.0 34.0 34.2 38.2 43.2 49.7 55.7 61.4 68.4<br />

2 8.0 37.0 9.0 11.0 13.0 18.0 30.0 30.8 35.8 41.8 50.7 56.7 62.4 69.4<br />

3 12.0 49.0 16.0 10.0 12.0 22.0 26.0 30.8 39.8 45.8 53.3 61.7 67.4 74.4<br />

4 16.4 56.6 27.4 13.4 16.4 15.4 19.0 28.2 41.6 54.2 61.7 68.7 76.8 83.8<br />

5 15.0 65.6 37.4 15.4 18.4 17.4 20.4 26.8 38.8 51.8 66.3 75.7 82.4 91.8<br />

6 5.0 84.6 37.4 23.4 20.4 25.7 32.4 22.6 24.6 27.6 32.1 36.1 39.8 44.8<br />

7 2.0 106 40.4 34.4 28.4 31.4 43.7 27.8 23.6 23.6 25.1 26.1 26.8 28.8<br />

8 0.4 130 45.0 47.0 38.0 41.0 41.0 34.6 26.2 25.2 23.7 24.3 25.2 25.6<br />

9 5.0 149 45.0 53.0 43.0 46.0 56.0 36.8 28.2 28.2 28.2 27.7 28.0 30.2<br />

10 0.6 172 49.4 57.4 52.4 55.4 65.4 43.4 30.6 29.6 28.3 28.1 28.4 28.6<br />

11 0.6 196 53.8 66.2 61.8 64.8 74.8 50.0 33.0 31.0 28.4 28.5 28.8 29.0<br />

12 0.0 220 58.8 66.8 71.8 74.8 84.8 57.2 36.0 33.0 28.9 29.4 29.8 28.8<br />

Figura 3. Dois histogramas e a respectiva matriz <strong>de</strong> ajuste, com percurso <strong>de</strong> ajuste W em <strong>de</strong>staque.<br />

Resultados<br />

A fim <strong>de</strong> testar a precisão da WMD, foram<br />

realizados experimentos sobre uma base contendo<br />

4242 imagens gerais <strong>de</strong> regiões do corpo humano,<br />

oriundas <strong>de</strong> exames <strong>de</strong> tomografia computadorizada<br />

e ressonância magnética. Utilizou-se um aplicativo<br />

que realiza consultas aos vizinhos mais próximos a<br />

partir <strong>de</strong> uma imagem <strong>de</strong> referência e apresenta na<br />

tela miniaturas das imagens encontradas.<br />

Os experimentos foram <strong>de</strong> dois tipos: 1)<br />

comparações visuais dos resultados obtidos com<br />

uso da distância métrica e com uso da WMD em<br />

consultas às 40 imagens mais próximas a imagens<br />

<strong>de</strong> referência diversas; 2) comparações através do<br />

cálculo <strong>de</strong> precision x recall dos resultados obtidos<br />

com uso da distância métrica e com uso da WMD<br />

em relação a testes <strong>de</strong> vizinhos mais próximos<br />

realizados com médicos radiologistas.<br />

Experimento 1. Foram tomadas como referência<br />

diversas imagens <strong>de</strong> regiões tais como: cérebro,<br />

pescoço, coluna cervical, abdome e tórax. Foram<br />

executadas consultas aos 40 vizinhos mais<br />

próximos para cada imagem <strong>de</strong> referência, com<br />

ambas a distância métrica e a WMD.<br />

A Figura 4 ilustra os resultados obtidos para<br />

uma imagem <strong>de</strong> abdome inferior. Nela po<strong>de</strong>mos<br />

constatar que a WMD retornou um conjunto <strong>de</strong><br />

imagens com grau <strong>de</strong> semelhança (em relação à<br />

imagem <strong>de</strong> busca) bem maior do que a distância<br />

métrica. Isso se <strong>de</strong>ve ao fato <strong>de</strong> que várias das<br />

imagens capturadas com a WMD, embora bastante<br />

semelhantes à imagem <strong>de</strong> busca, possuíam<br />

distorções <strong>de</strong> brilho e contraste em relação a esta.<br />

Por causa disso, essas imagens acabaram sendo<br />

<strong>de</strong>scartadas pela distância métrica.<br />

Por outro lado, a WMD não apresentou<br />

resultados melhores nas consultas em que a<br />

imagem <strong>de</strong> busca era muito escura (com quantida<strong>de</strong><br />

<strong>de</strong> buckets abaixo <strong>de</strong> 10). Para essa situação, os<br />

poucos valores <strong>de</strong> níveis <strong>de</strong> cinza presentes fazem<br />

com que dois níveis vizinhos representem regiões<br />

distintas e específicas da imagem e, por isso, o<br />

efeito warp acaba por "confundir" essas regiões.<br />

Nesse caso, é melhor manter o uso da distância<br />

métrica nos cálculos <strong>de</strong> similarida<strong>de</strong>.


RADIOLOGISTA 1<br />

MÉTRICO<br />

WARP<br />

(a)<br />

precision<br />

1.0<br />

0.9<br />

0.8<br />

0.7<br />

0.6<br />

0.5<br />

0.4<br />

0.3<br />

0.0 0.2 0.4 0.6 0.8 1.0<br />

recall<br />

RADIOLOGISTA 2<br />

MÉTRICO<br />

WARP<br />

(b)<br />

Figura 4. Resultados <strong>de</strong> consulta aos vizinhos mais<br />

próximos: a) com a WMD; b) com a distância<br />

métrica. A imagem do canto superior esquerdo da<br />

tela é a imagem <strong>de</strong> busca. A seqüência é para a<br />

direita e para baixo.<br />

Experimento 2. Foi apresentado a dois médicos<br />

radiologistas um conjunto <strong>de</strong> 15 imagens relativas a<br />

cortes sagitais <strong>de</strong> cabeças humanas. Solicitou-se a<br />

eles que colocassem essas imagens em or<strong>de</strong>m<br />

<strong>de</strong>crescente <strong>de</strong> similarida<strong>de</strong> com relação a uma<br />

imagem escolhida.<br />

Executou-se o aplicativo <strong>de</strong> consulta aos<br />

vizinhos mais próximos sobre as 15 imagens, com<br />

ambas as distâncias WMD e métrica.<br />

Tomando a seqüência <strong>de</strong> cada radiologista<br />

como referência, foram calculados valores <strong>de</strong><br />

precision e recall para as sequências obtidas com<br />

as distâncias WMD e métrica: para cada possível<br />

quantida<strong>de</strong> <strong>de</strong> resultados (variando <strong>de</strong> 1 a 15) foi<br />

contabilizada a quantida<strong>de</strong> <strong>de</strong> imagens obtidas com<br />

a distância, que faziam parte do conjunto <strong>de</strong><br />

imagens escolhidas pelo radiologista.<br />

A Figura 5 mostra os gráficos <strong>de</strong> precision x<br />

recall resultantes.<br />

precision<br />

1.0<br />

0.9<br />

0.8<br />

0.7<br />

0.6<br />

0.5<br />

0.4<br />

0.3<br />

0.0 0.2 0.4 0.6 0.8 1.0<br />

recall<br />

Figura 5. Gráficos precision x recall obtidos com as<br />

distâncias métrica e WMD, tomando como referência<br />

as classificações <strong>de</strong> dois radiologistas.<br />

Po<strong>de</strong>mos ver que, apesar <strong>de</strong> as sequências<br />

fornecidas pelos dois radiologistas serem diferentes,<br />

para ambas a WMD gerou curvas <strong>de</strong> precisão<br />

melhores (valores mais próximos <strong>de</strong> 1) do que a<br />

distância métrica.<br />

Discussão e Conclusões<br />

Dos resultados obtidos com o Experimento 1<br />

po<strong>de</strong>mos verificar a superiorida<strong>de</strong> da <strong>Warp</strong> <strong>Metric</strong><br />

<strong>Distance</strong> (WMD) como medida <strong>de</strong> similarida<strong>de</strong> entre<br />

imagens médicas, principalmente nos casos em que<br />

a base <strong>de</strong> dados possui imagens oriundas <strong>de</strong><br />

diferentes equipamentos radiológicos, ou então que<br />

sofreram tratamentos por diferentes usuários. Em<br />

ambos os casos, as imagens provavelmente<br />

apresentarão variações <strong>de</strong> brilho e contraste e,


nesse caso, a WMD mostra-se mais flexível e<br />

menos sensível a essas variações.<br />

Para os casos em que os resultados da WMD<br />

não foram melhores do que os da distância métrica<br />

(imagens muito escuras), po<strong>de</strong>mos implementar<br />

uma adaptação no aplicativo, que permita ao<br />

programa alternar entre o uso das duas distâncias,<br />

<strong>de</strong> acordo com a quantida<strong>de</strong> <strong>de</strong> buckets do<br />

histograma da imagem <strong>de</strong> busca.<br />

Com relação à comparação com as<br />

avaliações realizadas por radiologistas no<br />

Experimento 2, po<strong>de</strong>mos concluir que a WMD<br />

apresenta resultados semanticamente mais<br />

precisos, sou seja, mais próximos daqueles que o<br />

usuário <strong>de</strong> um sistema PACS espera receber<br />

quando executar uma consulta baseada em<br />

similarida<strong>de</strong>.<br />

Uma observação interessante levantada<br />

durante o Experimento 2 é <strong>de</strong> que os dois<br />

radiologistas, ao explicar os critérios utilizados na<br />

avaliação, revelaram ter se baseado em parâmetros<br />

diferentes: enquanto o primeiro avaliou a<br />

similarida<strong>de</strong> focando na região mais importante das<br />

imagens, o segundo usou uma visão mais<br />

abrangente e generalizada como critério. Isto ilustra<br />

o alto grau <strong>de</strong> dificulda<strong>de</strong> enfrentado pelos sistemas<br />

automáticos quando tentam aproximar seus<br />

mecanismos <strong>de</strong> avaliação dos conceitos utilizados<br />

pelo analista humano.<br />

Agra<strong>de</strong>cimentos<br />

Os autores agra<strong>de</strong>cem aos médicos<br />

radiologistas Samuel Marcos G. Guacelli (CRM-SP<br />

14746) e Maria Cristina R. Guacelli (CRM-MG 38507)<br />

pelas avaliações realizadas para o Experimento 2.<br />

Referências<br />

[1] Marsh, A. (1997), "EUROMED - The Creation<br />

of a Telemedical Information Society",<br />

Proceedings of the 10 th<br />

IEEE Symposium on<br />

Computer Based Medical Systems, Maribor -<br />

Slovenia.<br />

[2] Siegel, E.L. (1999), "Current State of the Art<br />

and Future Trends in Filmless Radiology", E.L.<br />

Siegel and R.M. Kolodner, Editors, Springer<br />

Verlag, New York City - USA, p. 3-20.<br />

[3] Korn, F., Sidiropoulos, N., Faloutosos, C.,<br />

Siegel, E., Protopapas, Z. (1996), "Fast Nearest<br />

Neighbor Search in Medical Image Databases",<br />

Proceedings of the 22 th International<br />

Conference on Very Large Databases (VLDB),<br />

Bombay – India, p. 215-226.<br />

[4] Rubner, Y. and C. Tomasi (2001), "Perceptual<br />

<strong>Metric</strong>s for Image Database Navigation", The<br />

Kluwer International Series in Engineering and<br />

Computer Science.<br />

[5] Bueno, J. M., F. Chino, A. J. M. Traina, J. C.<br />

Traina and P. M. A. Marques (2002), "How to<br />

Add Content-based Image Retrieval Capability<br />

in a PACS", Proceedings of the 15 th<br />

IEEE<br />

International Conference on Computer Based<br />

Medical Systems - CBMS, Maribor - Slovenia.<br />

[6] Bueno, J. M., (2002) "Suporte à Recuperação<br />

<strong>de</strong> Imagens Médicas Baseada em Conteúdo<br />

Através <strong>de</strong> <strong>Histogramas</strong> Métricos". Tese <strong>de</strong><br />

Doutorado, Instituto <strong>de</strong> Ciências Matemáticas e<br />

<strong>de</strong> Computação, Universida<strong>de</strong> <strong>de</strong> São Paulo,<br />

São Carlos - Brasil.<br />

[7] Keogh, E. J. (2002), "A Tuturial on In<strong>de</strong>xing and<br />

Mining Time Series Data", Tutorial, XVII<br />

Simpósio Brasileiro <strong>de</strong> Banco <strong>de</strong> Dados,<br />

Gramado - Brasil, 14-16 out.<br />

[8] Keogh, E. (2002), "Exact In<strong>de</strong>xing of Dynamic<br />

Time <strong>Warp</strong>ing", Proceedings of the 28 th VLDB<br />

Conference, Hong Kong - China.<br />

[9] Keogh, E. J., Pazzani, M. J. (2001), "Derivative<br />

Dynamic Time <strong>Warp</strong>ing", Proceedings of the<br />

First SIAM International Conference on Data<br />

Mining, Chicago - USA, 5-7 abr.<br />

Contato<br />

Joaquim Cezar Felipe<br />

Departamento <strong>de</strong> Física e Matemática - Faculda<strong>de</strong><br />

<strong>de</strong> Filosofia, Ciências e Letras <strong>de</strong> Ribeirão Preto -<br />

Universida<strong>de</strong> <strong>de</strong> São Paulo.<br />

Fone: (16) 602 3779<br />

Email: jfelipe@ffclrp.usp.br

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!