An´ alise de T´ ecnicas de Visualizac ¸˜ ao e Sistemas aplicados a Colec ¸˜ oes de Imagens Laura Florian Cruz Instituto de Ciˆ encias Matem´ aticas e de Computac ¸˜ ao, Universidade de S˜ ao Paulo, S˜ ao Carlos/SP, Brasil Resumo—T´ ecnicas de visualizac ¸˜ ao de imagens s˜ ao frequen- temente utilizadas para possibilitar ao usu´ ario a an´ alise e explorac ¸˜ ao entre as imagens. Em uma representac ¸˜ ao visual, as t´ ecnicas de visualizac ¸˜ ao permitem aos usu´ arios buscar informac ¸˜ oes de maneira mais eficiente. Uma das alternativas para esta forma de representac ¸˜ ao ´ e a utilizac ¸˜ ao de projec ¸˜ oes e outra mencionada neste trabalho ´ e o uso de estruturas em ´ arvore, onde uma hierarquia ´ e imposta aos dados, baseada no mesmo crit´ erio da projec ¸˜ ao. Em primeiro lugar, a an´ alise de imagens e aplicac ¸˜ oes de processamento de imagens ´ e usada para calcular os vetores de caracter´ ısticas nestas. Estos conjun- tos de dados s˜ ao projetados s˜ ao os posicionados, como pontos, num plano onde proximidade entre eles sugere similaridade. Uma dificuldade comum ´ e o grande n´ umero de caracter´ ısticas que definem um espac ¸o de alta dimens˜ ao que afeta fortemente o desempenho na an´ alise visual. Lidar com esse problema normalmente exige reduc ¸˜ ao de dimens˜ ao. Existem ferramen- tas desenvolvidas para a visualizac ¸˜ ao aplicadas a colec ¸˜ oes de imagens, como as t´ ecnicas baseadas em projec ¸˜ ao: MDS, PCA, FastMap, Isomap, LSP e Neighboor Joining. At´ e agora existem muitos sistemas para a explorac ¸˜ ao, onde o objetivo principal ´ e fornecer ao usu´ ario uma maneira boa de explorar a visualizac ¸˜ ao. I. I NTRODUC ¸˜ AO Pesquisas atuais mostram como t´ ecnicas de visualizac ¸˜ ao e minerac ¸˜ ao de dados podem ajudar na explorac ¸˜ ao dessas bases de dados, que busca informac ¸˜ oes potencialmente ´ uteis. Assim, a ´ area de visualizac ¸˜ ao de informac ¸˜ ao centra-se no estudo como exibir essas colec ¸˜ oes de informac ¸˜ oes, como das imagens, ao usu´ ario em uma representac ¸˜ ao visual e permitem que os usu´ arios procurem informac ¸˜ oes de maneira mais eficiente. Por exemplo, Moghaddam et al. [1] mostram que ´ e poss´ ıvel utilizar t´ ecnicas de visualizac ¸˜ ao de informac ¸˜ ao, para propor- cionar maneiras de revelar informac ¸˜ oes escondidas (relac ¸˜ oes complexas) em uma representac ¸˜ ao visual e permitem que os usu´ arios procurem informac ¸˜ oes de maneira mais eficiente, e grac ¸as ` a capacidade visual humano para o aprendizagem e identificac ¸˜ ao de padr˜ oes, a visualizac ¸˜ ao ´ e uma boa alterna- tiva para lidar com este tipo de problemas. No entanto, a visualizac ¸˜ ao em si ´ e um problema dif´ ıcil, um dos principais desafios ´ e como encontrar de baixa dimensionalidade, representac ¸˜ oes simples que representam fielmente o conjunto de dados completo e as relac ¸˜ oes entre os objetos de dados Os t´ opicos que s˜ ao desenvolvidos neste trabalho s˜ ao: os m´ etodos de projec ¸˜ ao e explorac ¸˜ ao. A projec ¸˜ ao estudada a partir da maneira sobre como reduzir as altas dimensionali- dades das imagens originais em espac ¸os de baixa dimens˜ ao preservando sua estrutura original, mostrando as t´ ecnicas de visualizac ¸˜ ao aplicadas em colec ¸˜ oes de imagens. E a
14
Embed
Analise de T´ ecnicas de Visualizac´ ¸ao e Sistemas ...wiki.icmc.usp.br/images/4/47/Scc252(13)ImageVis.pdf · Analise de T´ ecnicas de Visualizac´ ¸ao e Sistemas aplicados a˜
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Analise de Tecnicas de Visualizacao e Sistemas aplicados a
Colecoes de Imagens
Laura Florian Cruz
Instituto de Ciencias Matematicas e de Computacao,
Universidade de Sao Paulo, Sao Carlos/SP, Brasil
Resumo—Tecnicas de visualizacao de imagens sao frequen-
temente utilizadas para possibilitar ao usuario a analise e
exploracao entre as imagens. Em uma representacao visual,
as tecnicas de visualizacao permitem aos usuarios buscar
informacoes de maneira mais eficiente. Uma das alternativas
para esta forma de representacao e a utilizacao de projecoes
e outra mencionada neste trabalho e o uso de estruturas em
arvore, onde uma hierarquia e imposta aos dados, baseada
no mesmo criterio da projecao. Em primeiro lugar, a analise
de imagens e aplicacoes de processamento de imagens e usada
para calcular os vetores de caracterısticas nestas. Estos conjun-
tos de dados sao projetados sao os posicionados, como pontos,
num plano onde proximidade entre eles sugere similaridade.
Uma dificuldade comum e o grande numero de caracterısticas
que definem um espaco de alta dimensao que afeta fortemente
o desempenho na analise visual. Lidar com esse problema
normalmente exige reducao de dimensao. Existem ferramen-
tas desenvolvidas para a visualizacao aplicadas a colecoes
de imagens, como as tecnicas baseadas em projecao: MDS,
PCA, FastMap, Isomap, LSP e Neighboor Joining. Ate agora
existem muitos sistemas para a exploracao, onde o objetivo
principal e fornecer ao usuario uma maneira boa de explorar
a visualizacao.
I. INTRODUCAO
Pesquisas atuais mostram como tecnicas de visualizacao e
mineracao de dados podem ajudar na exploracao dessas
bases de dados, que busca informacoes potencialmente uteis.
Assim, a area de visualizacao de informacao centra-se no
estudo como exibir essas colecoes de informacoes, como
das imagens, ao usuario em uma representacao visual e
permitem que os usuarios procurem informacoes de maneira
mais eficiente.
Por exemplo, Moghaddam et al. [1] mostram que e possıvel
utilizar tecnicas de visualizacao de informacao, para propor-
cionar maneiras de revelar informacoes escondidas (relacoes
complexas) em uma representacao visual e permitem que os
usuarios procurem informacoes de maneira mais eficiente, e
gracas a capacidade visual humano para o aprendizagem e
identificacao de padroes, a visualizacao e uma boa alterna-
tiva para lidar com este tipo de problemas.
No entanto, a visualizacao em si e um problema difıcil,
um dos principais desafios e como encontrar de baixa
dimensionalidade, representacoes simples que representam
fielmente o conjunto de dados completo e as relacoes entre
os objetos de dados
Os topicos que sao desenvolvidos neste trabalho sao: os
metodos de projecao e exploracao. A projecao estudada a
partir da maneira sobre como reduzir as altas dimensionali-
dades das imagens originais em espacos de baixa dimensao
preservando sua estrutura original, mostrando as tecnicas
de visualizacao aplicadas em colecoes de imagens. E a
exploracao que se concentra em como fornecer ao usuario
uma maneira de explorar a visualizacao, citando os sistemas
desenvolvidos em visualizacao de imagens.
II. VISUALIZACAO DE IMAGENS
Atualmente, tecnicas de visualizacao de imagens fornecem
uma boa alternativa de geracao de representacoes compactas
duma colecao de imagens digitais que tem informacoes
relevantes.
A estrutura do sistema proposto para a visualizacao de
grandes colecoes de imagens e mostrada na Figura 1.
Primeiro, um processo de extracao de caracterısticas e
realizado em conjunto de dados e algumas caracterısticas de
baixo nıvel sao extraıdas. Assim, cada imagem na colecao
corresponde a um ponto em um espaco de alta dimensao.
Em segundo lugar, para cada caracterıstica, uma metrica
e selecionada, a fim de comparar as imagens com base
nessa caracterıstica, essa comparacao fornece um numero
real que define como as imagens sao semelhantes (funcao de
similaridade). Em terceiro lugar, uma matriz de similaridade
entre todas as imagens e construıda e e transformada em uma
matriz de distancia. Finalmente, um algoritmo de projecao
considera so as k dimensoes baseada na matriz de distancia
obtida anteriormente. Neste caso, k e definido como 2 e as
duas dimensoes sao usadas como coordenadas (x, y) para a
visualizacao de cada imagem num espaco 2D [2].
A. Representacao das imagens
A principal caracterıstica do processo de extracao e identifi-
car e extrair informacoes relevantes a partir da imagem que
permite a discriminacao de classes diferentes da imagem,
onde cada imagem I da colecao e representada por um vetor
de caracterısticas f(I); por exemplo, histograma do cor ou
textura.
Figura 1. Etapas de processamento para visualizar a colecao de imagens.
As imagens sao tipicamente caracterizadas por atributos
intrınsecos de imagens, tais como cor, textura e forma como
e mencionado por diversos autores [3], [4], [5], etc..
As caracterısticas de baixo nıvel, tais como a cor e a
textura sao frequentemente utilizadas para representar o
conteudo visual das imagens, sendo os correlogramas de cor,
momentos de cor e histogramas de cor as caracterısticas mais
usadas [6].
Outros descrevem cada imagem pela mediana de sua cor
como faz [7], [8]. Por outro lado, in Visual Image Browsing
and Exploration (Vibe) feito por Grant et al. [9] usa a
correlacao de cores gradiente das imagens.
Assim, como as waveletes Gabor sao um exemplo de
textura, mas existem muitos metodos de analise de textura
disponıveis, e estas podem ser aplicadas tanto para realizar
a segmentacao da imagem, ou extrair as propriedades de
textura das regioes segmentadas ou de toda a imagem.
As caracterısticas de textura fornecem mais informacoes
espaciais ou relacionais do que as caracterısticas de cor a fim
de saber mais sobre o conteudo de uma imagem, portanto
uma imagem pode ser representada atraves da combinacao
de caracterısticas de cor e textura como e explorado em [4].
Figura 2. Tecnica de segmentacao automatica.
Figura 3. Ferramenta de rotulagem.
A Figura 2 citada por Yang et al. [5] usa uma imagem
segmentada de baixo nıvel para obter as regioes homogeneas
da imagem sobre a cor ou textura, usando uma tecnica de
segmentacao automatica da imagem.
Por outro lado, Fan et al. [10] usa uma ferramenta onde uma
imagem e rotulada pela supervisao do usuario como uma
forma de representar o conceito da imagem, alem e utilizado
para o reconhecimento e deteccao de objetos, os principais
objetos na imagem sao extraıdos automaticamente, mostra-
dos na Figura 3.
B. Recuperacao de Imagens por conteudo
Um numero de sistemas de recuperacao de imagens foi
desenvolvido ao longo dos ultimos anos, como importante
forma de entender o que implica a recuperacao de imagens
relevantes.
Simplesmente, a recuperacao de imagens baseada em
conteudo (CBIR) e automaticamente a tarefa de encontrar
imagens que se assemelham a imagem de consulta do
usuario a partir de grandes conjuntos de dados usando as
caracterısticas visuais inerentes a propria imagem[8]. No
domınio dos sistemas CBIR, tem-se as seguintes fases[11]:
1) Encontrar tecnicas adequadas para codificar o
conteudo duma imagem. A maioria dos atuais sistemas
CBIR para fins gerais usam caracterısticas primitivas,
ou seja, cor, textura e forma.
2) Depois de selecionar uma imagem de consulta pelo
usuario, o sistema calcula o vetor de caracterısticas
correspondentes e compara-lo com todos os vetores de
caracterısticas relacionadas com as imagens no banco
de dados.
3) Imagens com a distancia mınima, com a imagem de
consulta serao apresentados em ordem decrescente.
Portanto, os sistemas de CBIR (Content Based Image Retri-
eval) conseguem determinar relacoes de similaridade entre
imagens em uma determinada colecao. Porem, se os usuarios
destes sistemas possuem acesso a uma interface visual na
qual as relacoes de similaridade podem ser facilmente visu-
alizadas como distancias em um plano ou espaco tridimen-
sional, entao eles podem se beneficiar com estes sistemas.
C. Mineracao Visual de Imagens
Uma parte importante na visualizacao de imagens e que
depois de fazer a projecao, este e analisado, a fim de
revelar informacoes uteis para os usuarios, como a extracao
de conhecimento implıcito, o relacionamento de dados, ou
outros padroes que nao explicitamente esta armazenados nas
imagens[12] .
Infelizmente, e difıcil ou mesmo impossıvel para o ser
Figura 4. A proyecao conseguiu separar bem os quatro grupos, empregando
PCA.
humano descobrir o conhecimento subjacente e padroes na
imagem ao trabalhar com uma grande colecao de imagens.
Uma atividade importante relacionada ao processo de
mineracao de conjuntos de imagens e a classificacao ou
categorizacao. Esse processo consiste em separar as imagens
de uma colecao, colocando-as em grupos previamente defini-
dos, representando assim uma maneira de extrair informacao
em imagens para reconhecer padroes e objetos homogeneos.
Diversas tecnicas de agrupamento podem ser encontra-
das, tais como K-medias , Mapas auto-organizaveis (Self-
Organizing Maps)[9], modelos de Markov e algoritmos
de agrupamento hierarquico, dentre outras. Um exemplo e
mostrado, na Figura 4 .
III. TECNICAS DE VISUALIZACAO APLICADAS A
COLECOES DE IMAGEM
Para gerar uma visualizacao multidimensional atraves de
projecoes, em geral os dados sao convertidos num espaco
vetorial, onde cada item de dados (indivıduo) e descrito
por um conjunto de atributos ou caracterısticas, que define
suas coordenadas neste espaco. Sobre esses dados e possıvel
extrair relacionamentos, como, por exemplo, relacionamen-
tos de similaridade entre os indivıduos. Projecoes realizam
alguma forma de processamento que mapeia os dados em
2D ou 3D (espacos visuais) de forma que a proximidade
dos itens de dados nesses espacos indica alta correcao de
conteudo.
Figura 5. Arvore de similaridade.
Uma alternativa ao mapeamento de dados baseado em
projecoes e a imposicao de uma hierarquia sobre algum
relacionamento significativo sobre os dados, como, por
exemplo, a similaridade calculada sobre as coordenadas da
representacao vetorial. A hierarquia extraıda deste processo
e refletida na forma de uma arvore (daı o termo ”arvore
de similaridades”), que e visualizada atraves de algoritmos
apropriados de apresentacao de arvores.
A classe de tecnicas englobando as duas estrategias
(projecoes e arvores de similaridade), as quais representam
cada indivıduo como um sımbolo no plano, identificando
suas relacoes (principalmente de similaridade) por proximi-
dade ou por algum outro artifıcio visual (como os ramos
da arvore, por exemplo), chamado aqui coletivamente de
visualizacao por mapeamento de pontos no plano.
A Figura 5, apresenta visualizacoes baseadas em arvores
de similaridade na figura 6 de uma colecao de imagens
medicas.
Figura 6. Projecao.
A. Visualizacao baseada em Projecao
Existem diferentes metodos para reduzir a dimensionalidade
de um conjunto de dados. Geralmente, estes metodos sele-
cionam as dimensoes que melhor preservem a informacao
original. Metodos como Escalonamento Multidimensional
(MDS) [13], Analise de Componentes Principais (PCA) [14],