Warp Metric Distance: Aprimorando o Uso de Histogramas de ... - SBIS
Warp Metric Distance: Aprimorando o Uso de Histogramas de ... - SBIS
Warp Metric Distance: Aprimorando o Uso de Histogramas de ... - SBIS
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
<strong>Warp</strong> <strong>Metric</strong> <strong>Distance</strong>: <strong>Aprimorando</strong> o <strong>Uso</strong> <strong>de</strong> <strong>Histogramas</strong> <strong>de</strong> Intensida<strong>de</strong><br />
para Busca por Similarida<strong>de</strong> em Imagens Médicas<br />
Joaquim Cezar Felipe 1 , Agma Juci Machado Traina 2<br />
1 Departamento <strong>de</strong> Física e Matemática - Faculda<strong>de</strong> <strong>de</strong> Filosofia, Ciências e Letras <strong>de</strong> Ribeirão Preto<br />
Universida<strong>de</strong> <strong>de</strong> São Paulo (USP), Brasil<br />
2 Instituto <strong>de</strong> Ciências Matemáticas e <strong>de</strong> Computação (ICMC)<br />
Universida<strong>de</strong> <strong>de</strong> São Paulo (USP), Brasil<br />
Resumo – Este trabalho apresenta uma nova medida <strong>de</strong> distância (<strong>Warp</strong> <strong>Metric</strong> <strong>Distance</strong>) para histogramas <strong>de</strong><br />
intensida<strong>de</strong>s utilizados no processo <strong>de</strong> busca por conteúdo em imagens. No uso <strong>de</strong> histogramas, os chamados<br />
<strong>Histogramas</strong> Métricos representam uma opção eficiente e computacionalmente barata, <strong>de</strong>vido ao fato <strong>de</strong><br />
aplicarem uma redução do número <strong>de</strong> bins sobre os histogramas tradicionais. O método <strong>Warp</strong> <strong>Metric</strong> <strong>Distance</strong><br />
adapta e implementa a métrica <strong>Warp</strong>, proposta originalmente para a comparação entre séries temporais, como<br />
uma medida <strong>de</strong> distância para histogramas métricos. Os resultados obtidos com esse método, aplicado a busca<br />
por similarida<strong>de</strong> em imagens médicas, evi<strong>de</strong>nciam que o mesmo mostra-se superior ao se manipular imagens<br />
com variações <strong>de</strong> brilho e contraste, dada a sua flexibilida<strong>de</strong> em relação a esse tipo <strong>de</strong> irregularida<strong>de</strong>, além <strong>de</strong><br />
apresentar uma melhor compatibilida<strong>de</strong> com avaliações <strong>de</strong> similarida<strong>de</strong> realizadas com radiologistas.<br />
Palavras-chave: busca por conteúdo, imagens médicas, histograma <strong>de</strong> intensida<strong>de</strong>, distância warp<br />
Abstract – This work presents a new distance measure for intensity histograms - <strong>Warp</strong> <strong>Metric</strong> <strong>Distance</strong> - used in<br />
content-based image retrieval. The so-called <strong>Metric</strong> Histograms represent an efficient and cheap alternative to<br />
the use of histograms, since they apply a reduction on the number of bins of traditional histograms. <strong>Warp</strong> <strong>Metric</strong><br />
<strong>Distance</strong> method adapts and implements the <strong>Warp</strong> metric, originally proposed for the comparison of time series,<br />
as a distance measure between metric histograms. Results achieved by this method, when applied to similarity<br />
retrieval in medical images, <strong>de</strong>monstrate its superiority in analyzing images that present brightness and contrast<br />
disparities. This is a consequence of the flexibility of the <strong>de</strong>veloped method while <strong>de</strong>aling with this kind of<br />
irregularity. Moreover, these results match better with similarity evaluations performed by radiologists.<br />
Key-words: content-based retrieval, medical images, intensity histogram, warp distance<br />
Introdução<br />
Nas últimas décadas, com o surgimento dos<br />
sistemas PACS (Picture Archiving and<br />
Communication Systems) [1] [2], verifica-se um<br />
interesse crescente em integrar todas as informações<br />
relativas a pacientes (textos, imagens, gráficos,<br />
dados temporais, etc) em sistemas <strong>de</strong> informações<br />
hospitalares. A enorme quantida<strong>de</strong> <strong>de</strong> imagens<br />
digitais geradas em hospitais e centros <strong>de</strong> saú<strong>de</strong><br />
exige o <strong>de</strong>senvolvimento <strong>de</strong> mecanismos automáticos<br />
para o seu armazenamento e para a sua recuperação<br />
em bases <strong>de</strong> dados. Por isso, um PACS necessita<br />
incorporar recursos para recuperar as imagens <strong>de</strong><br />
forma a viabilizar o uso dos seus módulos <strong>de</strong> busca<br />
no ambiente do dia-a-dia. Além disso, para fornecer<br />
ajuda efetiva aos profissionais que analisam as<br />
imagens e geram diagnósticos, os mecanismos <strong>de</strong><br />
recuperação <strong>de</strong>vem retornar imagens compatíveis<br />
com os critérios estabelecidos pelos especialistas [3].<br />
Devido ao fato <strong>de</strong> a recuperação baseada em<br />
anotações textuais ser imprecisa e trabalhosa,<br />
atualmente tem crescido o interesse pela<br />
recuperação <strong>de</strong> imagens baseada em conteúdo<br />
(Content-Based Image Retrieval – CBIR). Técnicas<br />
<strong>de</strong> CBIR utilizam as características visuais<br />
intrínsecas das imagens, tais como cor, forma e<br />
textura, para a sua in<strong>de</strong>xação e recuperação [4], por<br />
meio do uso <strong>de</strong> <strong>de</strong>scritores. A incorporação <strong>de</strong><br />
funcionalida<strong>de</strong>s <strong>de</strong> CBIR aos sistemas PACS [5]<br />
empresta a estes maior po<strong>de</strong>r <strong>de</strong> auxiliar nas tarefas<br />
<strong>de</strong> diagnóstico, uma vez que estas funcionalida<strong>de</strong>s<br />
propiciam manipulação e organização mais<br />
eficientes das imagens médicas.<br />
Dentre as características <strong>de</strong> baixo nível das<br />
imagens médicas, as variações <strong>de</strong> cor (tons <strong>de</strong><br />
cinza nas imagens monocromáticas) assumem
<strong>de</strong>stacada importância, por permitirem a<br />
i<strong>de</strong>ntificação <strong>de</strong> <strong>de</strong>talhes dos tecidos e regiões<br />
analisadas.<br />
Cor é uma proprieda<strong>de</strong> relacionada com a<br />
capacida<strong>de</strong> dos objetos <strong>de</strong> refletir ondas<br />
eletromagnéticas <strong>de</strong> diferentes comprimentos, num<br />
espectro visível que varia aproximadamente <strong>de</strong> 400<br />
nm até 700 nm. A fim <strong>de</strong> se mapear numericamente<br />
o conjunto <strong>de</strong> cores do espectro visível, diversos<br />
mo<strong>de</strong>los (ou espaços <strong>de</strong> cores) – RGB (red, green,<br />
blue), CMY (cyan, magenta, yellow), YIQ, HSI (hue,<br />
saturation, intensity), CIELab – têm sido propostos e<br />
utilizados, cada qual com suas vantagens e<br />
aplicações específicas. A estrutura mais utilizada<br />
para a representação da distribuição global <strong>de</strong> cores<br />
<strong>de</strong> uma imagem é o chamado Histograma <strong>de</strong><br />
Intensida<strong>de</strong>s, que consiste na quantificação da<br />
freqüência com que ocorrem os diferentes valores<br />
<strong>de</strong> luminância apresentados pelos pixels da<br />
imagem. Dessa forma, o Histograma <strong>de</strong><br />
Intensida<strong>de</strong>s (juntamente com uma série <strong>de</strong><br />
operações executadas sobre o mesmo) po<strong>de</strong> ser<br />
utilizado para representar o conteúdo intrínseco da<br />
imagem, baseando-se no seu atributo <strong>de</strong> cor.<br />
O presente trabalho está focado na busca por<br />
similarida<strong>de</strong> entre imagens médicas, baseada nas<br />
suas distribuições <strong>de</strong> cores. Uma nova medida <strong>de</strong><br />
distância para histogramas – <strong>Warp</strong> <strong>Metric</strong> <strong>Distance</strong> –<br />
é apresentado, assim como alguns resultados<br />
obtidos com a sua utilização em "buscas aos<br />
vizinhos mais próximos" em uma base <strong>de</strong> imagens<br />
médicas gerais.<br />
A aquisição do histograma métrico, a partir <strong>de</strong><br />
um histograma convencional, é realizada da<br />
seguinte forma: o contorno original do histograma<br />
convencional é reduzido a uma seqüência <strong>de</strong><br />
segmentos <strong>de</strong> reta. O algoritmo utilizado i<strong>de</strong>ntifica<br />
pontos <strong>de</strong> máximo, pontos <strong>de</strong> mínimo e pontos<br />
intermediários significativos, com base em valores<br />
<strong>de</strong> gradiente. Esses pontos são chamados <strong>de</strong><br />
pontos <strong>de</strong> controle. Cada região <strong>de</strong>finida por um<br />
segmento, entre dois pontos <strong>de</strong> controle, é chamada<br />
<strong>de</strong> bucket. Um bucket correspon<strong>de</strong>ria, assim a um<br />
bin <strong>de</strong> um histograma normalizado, possuindo uma<br />
largura e valores <strong>de</strong> freqüência para os seus pontos<br />
inicial e final. A diferença é que a divisão <strong>de</strong> bins é<br />
pré-<strong>de</strong>terminada e igual para todas as imagens,<br />
enquanto a quantida<strong>de</strong> e a divisão dos buckets<br />
<strong>de</strong>pen<strong>de</strong> <strong>de</strong> cada imagem. Um bucket normalmente<br />
engloba vários bins e, <strong>de</strong>ssa forma, consegue-se<br />
manter o formato do histograma <strong>de</strong>ntro <strong>de</strong> limites<br />
confiáveis e, ao mesmo tempo reduzir drasticamente<br />
sua dimensionalida<strong>de</strong>. A Figura 1, adaptada <strong>de</strong> [6],<br />
mostra um exemplo <strong>de</strong> histograma métrico.<br />
Bins Bucket pontos <strong>de</strong> controle<br />
2 pontos <strong>de</strong> controle consecutivos<br />
<strong>de</strong>limitam 1 bucket<br />
Metodologia<br />
A seguir são discutidas as técnicas utilizadas<br />
neste trabalho para o processo <strong>de</strong> recuperação <strong>de</strong><br />
imagens por similarida<strong>de</strong>.<br />
Histograma Métrico. Em [6] é apresentado um<br />
novo tratamento matemático aplicado aos<br />
histogramas <strong>de</strong> intensida<strong>de</strong>, chamado Histograma<br />
Métrico, que consiste <strong>de</strong> modificações sobre os<br />
histogramas tradicionais, acompanhadas <strong>de</strong> uma<br />
nova forma <strong>de</strong> cálculo da distância. Os histogramas<br />
métricos permitem comparar imagens <strong>de</strong> tamanhos<br />
variados e mapeadas em diferentes faixas <strong>de</strong><br />
quantização, ou seja, além <strong>de</strong> serem – como os<br />
histogramas normalizados – invariantes a<br />
transformações geométricas nas imagens, os<br />
histogramas métricos são também invariantes com<br />
relação a transformações lineares <strong>de</strong> brilho.<br />
Para permitir consultas por similarida<strong>de</strong> a<br />
partir <strong>de</strong> estruturas <strong>de</strong> índices, foi necessário<br />
<strong>de</strong>senvolver uma nova métrica, que consi<strong>de</strong>ra a<br />
diferença <strong>de</strong> área entre pares <strong>de</strong> histogramas<br />
métricos no cálculo da distância entre os mesmos.<br />
Figura 1. Exemplo <strong>de</strong> histograma métrico<br />
Uma conseqüência importante <strong>de</strong>sse<br />
processo é que não existe uma dimensão pré<strong>de</strong>finida<br />
para o domínio do problema, já que cada<br />
imagem po<strong>de</strong> ter um número diferente <strong>de</strong> buckets.<br />
Dessa forma, as imagens não po<strong>de</strong>m ser<br />
representadas como pontos em um espaço<br />
dimensional e isso conduz à necessida<strong>de</strong> <strong>de</strong> se<br />
<strong>de</strong>finir também uma nova forma <strong>de</strong> cálculo da<br />
distância entre duas imagens, uma vez que tanto o<br />
número <strong>de</strong> buckets, quanto a sua distribuição em<br />
diferentes histogramas são variáveis.<br />
A distância proposta em [6] – Distância<br />
Métrica - para comparar histogramas métricos efetua<br />
a comparação entre as áreas dos mesmos. Partindo<br />
do princípio <strong>de</strong> que a similarida<strong>de</strong> entre dois
histogramas po<strong>de</strong> ser <strong>de</strong>finida pelo grau <strong>de</strong><br />
sobreposição das áreas <strong>de</strong> suas distribuições <strong>de</strong><br />
freqüência, a distância entre duas imagens é<br />
<strong>de</strong>terminada pela diferença entre as suas áreas:<br />
bm<br />
d M(Q,<br />
C) = M H(C,<br />
x) − M<br />
∫<br />
H<br />
(Q,<br />
x)dx<br />
0<br />
on<strong>de</strong>: bm é a largura máxima entre os dois<br />
histogramas;<br />
M H (imagem,x) é a função contínua que<br />
representa o histograma métrico da imagem.<br />
Experimentos realizados com bases <strong>de</strong> dados<br />
<strong>de</strong> imagens <strong>de</strong> tomografias mostraram que, para a<br />
maioria das imagens, o número <strong>de</strong> buckets ficou na<br />
faixa <strong>de</strong> 10-62, contrastando com os 256 bins que<br />
normalmente são utilizados em histogramas<br />
normalizados. Resultados semelhantes <strong>de</strong> conjuntos<br />
<strong>de</strong> imagens são obtidos usando histogramas métricos<br />
e histogramas convencionais associados à distância<br />
L 1 . Porém o histograma métrico apresenta ganhos<br />
significativos <strong>de</strong> <strong>de</strong>sempenho no processo <strong>de</strong><br />
in<strong>de</strong>xação.<br />
Dynamic Time <strong>Warp</strong>ing. Dentre as técnicas<br />
clássicas usadas para se comparar duas séries<br />
temporais, <strong>de</strong>staca-se a chamada Dynamic Time<br />
<strong>Warp</strong>ing (DTW), cujo principal benefício consiste na<br />
aproximação <strong>de</strong> séries que possuem<br />
<strong>de</strong>senvolvimentos semelhantes, porém <strong>de</strong>fasados<br />
ou "<strong>de</strong>formados" um em relação ao outro, ao longo<br />
do eixo temporal [7].<br />
A sensibilida<strong>de</strong> da técnica à <strong>de</strong>formação se<br />
<strong>de</strong>ve ao fato <strong>de</strong> que as comparações entre os<br />
pontos não se fazem rigidamente entre os pares<br />
localizados nas mesmas coor<strong>de</strong>nadas, mas com a<br />
flexibilida<strong>de</strong> <strong>de</strong> que um ponto <strong>de</strong> uma série possa<br />
ser comparado com pontos adjacentes da outra<br />
série, conforme mostrado na Figura 2.<br />
a) b)<br />
Figura 2. Comparação entre séries:<br />
a) convencional; b) com DTW<br />
(1)<br />
Suponhamos que temos duas séries Q=(q 1 ,<br />
q 2 , ... , q n ) e C=(c 1 , c 2 , ... , c m ), <strong>de</strong> tamanho n e m<br />
respectivamente. Para compará-las usando DTW,<br />
construímos uma matriz nxm cujo elemento (i,j)<br />
contém a distância d(q i ,c j ). Tipicamente é usada a<br />
distância Euclidiana. Cada elemento da matriz<br />
correspon<strong>de</strong> ao alinhamento entre os pontos nele<br />
representados.<br />
Um percurso <strong>de</strong> ajuste W=(w 1 , w 2 , ... , w k ) é<br />
um conjunto <strong>de</strong> elementos contíguos da matriz que<br />
<strong>de</strong>fine um mapeamento entre Q e C. O percurso <strong>de</strong><br />
ajuste <strong>de</strong>verá obe<strong>de</strong>cer às seguintes regras [8]:<br />
• Iniciar e terminar em células diagonalmente<br />
opostas da matriz, ou seja, w1=(1,1) e wk=(n,m);<br />
• A seqüência entre os elementos do percurso<br />
<strong>de</strong>verá conter elementos adjacentes da matriz<br />
(incluindo elementos diagonalmente<br />
posicionados);<br />
• A seqüência não po<strong>de</strong>rá "voltar" no caminho<br />
dos elementos da matriz.<br />
Há muitos possíveis percursos <strong>de</strong> ajuste,<br />
porém o percurso a ser escolhido é aquele que<br />
minimiza o custo da <strong>de</strong>formação, ou seja, cuja<br />
distância acumulada ao longo do mesmo é mínima:<br />
DTW ( Q,<br />
C)<br />
= min(<br />
K<br />
∑<br />
k = 1<br />
w k / K)<br />
(2)<br />
A DTW tem sido usada com sucesso em<br />
aplicações tais como: data mining, reconhecimento<br />
<strong>de</strong> gestos, robótica e processamento da fala [9].<br />
<strong>Warp</strong> <strong>Metric</strong> <strong>Distance</strong>. A proposta <strong>de</strong>ste trabalho é<br />
adaptar a DTW para se criar um método<br />
comparativo entre histogramas que seja menos<br />
sensível a distorções <strong>de</strong> brilho e contraste, problema<br />
comumente encontrado quando se manipulam<br />
imagens médicas, <strong>de</strong>vido a imprecisões e a<br />
variações <strong>de</strong> ajuste dos aparelhos <strong>de</strong> captura das<br />
mesmas. Decidiu-se trabalhar com os histogramas<br />
métricos, uma vez que eles geram resultados<br />
próximos dos histogramas convencionais, com a<br />
vantagem <strong>de</strong> reduzir o esforço computacional.<br />
Utilizando um aplicativo que realiza buscas <strong>de</strong><br />
vizinhança mais próxima, a partir do cálculo dos<br />
histogramas métricos, mostrando as imagens<br />
resultantes, foi implementada a <strong>Warp</strong> <strong>Metric</strong><br />
<strong>Distance</strong> (WMD), como uma adaptação da técnica<br />
DTW sobre os histogramas métricos. A Figura 3<br />
mostra dois histogramas métricos obtidos <strong>de</strong><br />
imagens médicas, assim como a matriz <strong>de</strong> ajuste<br />
entre eles, na qual aparece em <strong>de</strong>staque o percurso<br />
<strong>de</strong> ajuste W.
0.00 0.05 0.10 0.15 0.20 0.25 0.30<br />
A<br />
B<br />
0 2 4 6 8 10 12<br />
B 0 1 2 3 4 5 6 7 8 9 10 11 12<br />
A 24.0 5.0 13.0 10.0 13.0 20.0 7.2 3.0 2.0 0.5 1.0 1.3 0.0<br />
0 28.0 4.0 27.0 42.0 60.0 75.0 83.0 103 128 154 182 209 236 264<br />
1 7.0 21.0 6.0 12.0 15.0 21.0 34.0 34.2 38.2 43.2 49.7 55.7 61.4 68.4<br />
2 8.0 37.0 9.0 11.0 13.0 18.0 30.0 30.8 35.8 41.8 50.7 56.7 62.4 69.4<br />
3 12.0 49.0 16.0 10.0 12.0 22.0 26.0 30.8 39.8 45.8 53.3 61.7 67.4 74.4<br />
4 16.4 56.6 27.4 13.4 16.4 15.4 19.0 28.2 41.6 54.2 61.7 68.7 76.8 83.8<br />
5 15.0 65.6 37.4 15.4 18.4 17.4 20.4 26.8 38.8 51.8 66.3 75.7 82.4 91.8<br />
6 5.0 84.6 37.4 23.4 20.4 25.7 32.4 22.6 24.6 27.6 32.1 36.1 39.8 44.8<br />
7 2.0 106 40.4 34.4 28.4 31.4 43.7 27.8 23.6 23.6 25.1 26.1 26.8 28.8<br />
8 0.4 130 45.0 47.0 38.0 41.0 41.0 34.6 26.2 25.2 23.7 24.3 25.2 25.6<br />
9 5.0 149 45.0 53.0 43.0 46.0 56.0 36.8 28.2 28.2 28.2 27.7 28.0 30.2<br />
10 0.6 172 49.4 57.4 52.4 55.4 65.4 43.4 30.6 29.6 28.3 28.1 28.4 28.6<br />
11 0.6 196 53.8 66.2 61.8 64.8 74.8 50.0 33.0 31.0 28.4 28.5 28.8 29.0<br />
12 0.0 220 58.8 66.8 71.8 74.8 84.8 57.2 36.0 33.0 28.9 29.4 29.8 28.8<br />
Figura 3. Dois histogramas e a respectiva matriz <strong>de</strong> ajuste, com percurso <strong>de</strong> ajuste W em <strong>de</strong>staque.<br />
Resultados<br />
A fim <strong>de</strong> testar a precisão da WMD, foram<br />
realizados experimentos sobre uma base contendo<br />
4242 imagens gerais <strong>de</strong> regiões do corpo humano,<br />
oriundas <strong>de</strong> exames <strong>de</strong> tomografia computadorizada<br />
e ressonância magnética. Utilizou-se um aplicativo<br />
que realiza consultas aos vizinhos mais próximos a<br />
partir <strong>de</strong> uma imagem <strong>de</strong> referência e apresenta na<br />
tela miniaturas das imagens encontradas.<br />
Os experimentos foram <strong>de</strong> dois tipos: 1)<br />
comparações visuais dos resultados obtidos com<br />
uso da distância métrica e com uso da WMD em<br />
consultas às 40 imagens mais próximas a imagens<br />
<strong>de</strong> referência diversas; 2) comparações através do<br />
cálculo <strong>de</strong> precision x recall dos resultados obtidos<br />
com uso da distância métrica e com uso da WMD<br />
em relação a testes <strong>de</strong> vizinhos mais próximos<br />
realizados com médicos radiologistas.<br />
Experimento 1. Foram tomadas como referência<br />
diversas imagens <strong>de</strong> regiões tais como: cérebro,<br />
pescoço, coluna cervical, abdome e tórax. Foram<br />
executadas consultas aos 40 vizinhos mais<br />
próximos para cada imagem <strong>de</strong> referência, com<br />
ambas a distância métrica e a WMD.<br />
A Figura 4 ilustra os resultados obtidos para<br />
uma imagem <strong>de</strong> abdome inferior. Nela po<strong>de</strong>mos<br />
constatar que a WMD retornou um conjunto <strong>de</strong><br />
imagens com grau <strong>de</strong> semelhança (em relação à<br />
imagem <strong>de</strong> busca) bem maior do que a distância<br />
métrica. Isso se <strong>de</strong>ve ao fato <strong>de</strong> que várias das<br />
imagens capturadas com a WMD, embora bastante<br />
semelhantes à imagem <strong>de</strong> busca, possuíam<br />
distorções <strong>de</strong> brilho e contraste em relação a esta.<br />
Por causa disso, essas imagens acabaram sendo<br />
<strong>de</strong>scartadas pela distância métrica.<br />
Por outro lado, a WMD não apresentou<br />
resultados melhores nas consultas em que a<br />
imagem <strong>de</strong> busca era muito escura (com quantida<strong>de</strong><br />
<strong>de</strong> buckets abaixo <strong>de</strong> 10). Para essa situação, os<br />
poucos valores <strong>de</strong> níveis <strong>de</strong> cinza presentes fazem<br />
com que dois níveis vizinhos representem regiões<br />
distintas e específicas da imagem e, por isso, o<br />
efeito warp acaba por "confundir" essas regiões.<br />
Nesse caso, é melhor manter o uso da distância<br />
métrica nos cálculos <strong>de</strong> similarida<strong>de</strong>.
RADIOLOGISTA 1<br />
MÉTRICO<br />
WARP<br />
(a)<br />
precision<br />
1.0<br />
0.9<br />
0.8<br />
0.7<br />
0.6<br />
0.5<br />
0.4<br />
0.3<br />
0.0 0.2 0.4 0.6 0.8 1.0<br />
recall<br />
RADIOLOGISTA 2<br />
MÉTRICO<br />
WARP<br />
(b)<br />
Figura 4. Resultados <strong>de</strong> consulta aos vizinhos mais<br />
próximos: a) com a WMD; b) com a distância<br />
métrica. A imagem do canto superior esquerdo da<br />
tela é a imagem <strong>de</strong> busca. A seqüência é para a<br />
direita e para baixo.<br />
Experimento 2. Foi apresentado a dois médicos<br />
radiologistas um conjunto <strong>de</strong> 15 imagens relativas a<br />
cortes sagitais <strong>de</strong> cabeças humanas. Solicitou-se a<br />
eles que colocassem essas imagens em or<strong>de</strong>m<br />
<strong>de</strong>crescente <strong>de</strong> similarida<strong>de</strong> com relação a uma<br />
imagem escolhida.<br />
Executou-se o aplicativo <strong>de</strong> consulta aos<br />
vizinhos mais próximos sobre as 15 imagens, com<br />
ambas as distâncias WMD e métrica.<br />
Tomando a seqüência <strong>de</strong> cada radiologista<br />
como referência, foram calculados valores <strong>de</strong><br />
precision e recall para as sequências obtidas com<br />
as distâncias WMD e métrica: para cada possível<br />
quantida<strong>de</strong> <strong>de</strong> resultados (variando <strong>de</strong> 1 a 15) foi<br />
contabilizada a quantida<strong>de</strong> <strong>de</strong> imagens obtidas com<br />
a distância, que faziam parte do conjunto <strong>de</strong><br />
imagens escolhidas pelo radiologista.<br />
A Figura 5 mostra os gráficos <strong>de</strong> precision x<br />
recall resultantes.<br />
precision<br />
1.0<br />
0.9<br />
0.8<br />
0.7<br />
0.6<br />
0.5<br />
0.4<br />
0.3<br />
0.0 0.2 0.4 0.6 0.8 1.0<br />
recall<br />
Figura 5. Gráficos precision x recall obtidos com as<br />
distâncias métrica e WMD, tomando como referência<br />
as classificações <strong>de</strong> dois radiologistas.<br />
Po<strong>de</strong>mos ver que, apesar <strong>de</strong> as sequências<br />
fornecidas pelos dois radiologistas serem diferentes,<br />
para ambas a WMD gerou curvas <strong>de</strong> precisão<br />
melhores (valores mais próximos <strong>de</strong> 1) do que a<br />
distância métrica.<br />
Discussão e Conclusões<br />
Dos resultados obtidos com o Experimento 1<br />
po<strong>de</strong>mos verificar a superiorida<strong>de</strong> da <strong>Warp</strong> <strong>Metric</strong><br />
<strong>Distance</strong> (WMD) como medida <strong>de</strong> similarida<strong>de</strong> entre<br />
imagens médicas, principalmente nos casos em que<br />
a base <strong>de</strong> dados possui imagens oriundas <strong>de</strong><br />
diferentes equipamentos radiológicos, ou então que<br />
sofreram tratamentos por diferentes usuários. Em<br />
ambos os casos, as imagens provavelmente<br />
apresentarão variações <strong>de</strong> brilho e contraste e,
nesse caso, a WMD mostra-se mais flexível e<br />
menos sensível a essas variações.<br />
Para os casos em que os resultados da WMD<br />
não foram melhores do que os da distância métrica<br />
(imagens muito escuras), po<strong>de</strong>mos implementar<br />
uma adaptação no aplicativo, que permita ao<br />
programa alternar entre o uso das duas distâncias,<br />
<strong>de</strong> acordo com a quantida<strong>de</strong> <strong>de</strong> buckets do<br />
histograma da imagem <strong>de</strong> busca.<br />
Com relação à comparação com as<br />
avaliações realizadas por radiologistas no<br />
Experimento 2, po<strong>de</strong>mos concluir que a WMD<br />
apresenta resultados semanticamente mais<br />
precisos, sou seja, mais próximos daqueles que o<br />
usuário <strong>de</strong> um sistema PACS espera receber<br />
quando executar uma consulta baseada em<br />
similarida<strong>de</strong>.<br />
Uma observação interessante levantada<br />
durante o Experimento 2 é <strong>de</strong> que os dois<br />
radiologistas, ao explicar os critérios utilizados na<br />
avaliação, revelaram ter se baseado em parâmetros<br />
diferentes: enquanto o primeiro avaliou a<br />
similarida<strong>de</strong> focando na região mais importante das<br />
imagens, o segundo usou uma visão mais<br />
abrangente e generalizada como critério. Isto ilustra<br />
o alto grau <strong>de</strong> dificulda<strong>de</strong> enfrentado pelos sistemas<br />
automáticos quando tentam aproximar seus<br />
mecanismos <strong>de</strong> avaliação dos conceitos utilizados<br />
pelo analista humano.<br />
Agra<strong>de</strong>cimentos<br />
Os autores agra<strong>de</strong>cem aos médicos<br />
radiologistas Samuel Marcos G. Guacelli (CRM-SP<br />
14746) e Maria Cristina R. Guacelli (CRM-MG 38507)<br />
pelas avaliações realizadas para o Experimento 2.<br />
Referências<br />
[1] Marsh, A. (1997), "EUROMED - The Creation<br />
of a Telemedical Information Society",<br />
Proceedings of the 10 th<br />
IEEE Symposium on<br />
Computer Based Medical Systems, Maribor -<br />
Slovenia.<br />
[2] Siegel, E.L. (1999), "Current State of the Art<br />
and Future Trends in Filmless Radiology", E.L.<br />
Siegel and R.M. Kolodner, Editors, Springer<br />
Verlag, New York City - USA, p. 3-20.<br />
[3] Korn, F., Sidiropoulos, N., Faloutosos, C.,<br />
Siegel, E., Protopapas, Z. (1996), "Fast Nearest<br />
Neighbor Search in Medical Image Databases",<br />
Proceedings of the 22 th International<br />
Conference on Very Large Databases (VLDB),<br />
Bombay – India, p. 215-226.<br />
[4] Rubner, Y. and C. Tomasi (2001), "Perceptual<br />
<strong>Metric</strong>s for Image Database Navigation", The<br />
Kluwer International Series in Engineering and<br />
Computer Science.<br />
[5] Bueno, J. M., F. Chino, A. J. M. Traina, J. C.<br />
Traina and P. M. A. Marques (2002), "How to<br />
Add Content-based Image Retrieval Capability<br />
in a PACS", Proceedings of the 15 th<br />
IEEE<br />
International Conference on Computer Based<br />
Medical Systems - CBMS, Maribor - Slovenia.<br />
[6] Bueno, J. M., (2002) "Suporte à Recuperação<br />
<strong>de</strong> Imagens Médicas Baseada em Conteúdo<br />
Através <strong>de</strong> <strong>Histogramas</strong> Métricos". Tese <strong>de</strong><br />
Doutorado, Instituto <strong>de</strong> Ciências Matemáticas e<br />
<strong>de</strong> Computação, Universida<strong>de</strong> <strong>de</strong> São Paulo,<br />
São Carlos - Brasil.<br />
[7] Keogh, E. J. (2002), "A Tuturial on In<strong>de</strong>xing and<br />
Mining Time Series Data", Tutorial, XVII<br />
Simpósio Brasileiro <strong>de</strong> Banco <strong>de</strong> Dados,<br />
Gramado - Brasil, 14-16 out.<br />
[8] Keogh, E. (2002), "Exact In<strong>de</strong>xing of Dynamic<br />
Time <strong>Warp</strong>ing", Proceedings of the 28 th VLDB<br />
Conference, Hong Kong - China.<br />
[9] Keogh, E. J., Pazzani, M. J. (2001), "Derivative<br />
Dynamic Time <strong>Warp</strong>ing", Proceedings of the<br />
First SIAM International Conference on Data<br />
Mining, Chicago - USA, 5-7 abr.<br />
Contato<br />
Joaquim Cezar Felipe<br />
Departamento <strong>de</strong> Física e Matemática - Faculda<strong>de</strong><br />
<strong>de</strong> Filosofia, Ciências e Letras <strong>de</strong> Ribeirão Preto -<br />
Universida<strong>de</strong> <strong>de</strong> São Paulo.<br />
Fone: (16) 602 3779<br />
Email: jfelipe@ffclrp.usp.br