-
INPE-15239-TDI/1326
APLICACAO DE MAPA DE KOHONEN PARA
CLASSIFICACAO DE TEXTURAS EM IMAGENS SAR EM
AMBIENTE PARALELO
Thalita Biazzuz Veronese
Dissertacao de Mestrado do Curso de Pos-Graduacao em Computacao
Aplicada,
orientada pelo Dr. Lamartine Nogueira Frutuoso Guimaraes,
aprovada em 5 de fevereiro
de 2007.
O original deste documento esta disponvel em:
INPE
Sao Jose dos Campos
2008
http://urlib.net/sid.inpe.br/mtc-m17@80/2008/02.12.12.07
-
PUBLICADO POR:
Instituto Nacional de Pesquisas Espaciais - INPE
Gabinete do Diretor (GB)
Servico de Informacao e Documentacao (SID)
Caixa Postal 515 - CEP 12.245-970
Sao Jose dos Campos - SP - Brasil
Tel.:(012) 3945-6911/6923
Fax: (012) 3945-6919
E-mail: [email protected]
CONSELHO DE EDITORACAO:
Presidente:
Dr. Gerald Jean Francis Banon - Coordenacao Observacao da Terra
(OBT)
Membros:
Dra Maria do Carmo de Andrade Nono - Conselho de
Pos-Graduacao
Dr. Haroldo Fraga de Campos Velho - Centro de Tecnologias
Especiais (CTE)
Dra Inez Staciarini Batista - Coordenacao Ciencias Espaciais e
Atmosfericas (CEA)
Marciana Leite Ribeiro - Servico de Informacao e Documentacao
(SID)
Dr. Ralf Gielow - Centro de Previsao de Tempo e Estudos
Climaticos (CPT)
Dr. Wilson Yamaguti - Coordenacao Engenharia e Tecnologia
Espacial (ETE)
BIBLIOTECA DIGITAL:
Dr. Gerald Jean Francis Banon - Coordenacao de Observacao da
Terra (OBT)
Marciana Leite Ribeiro - Servico de Informacao e Documentacao
(SID)
Jefferson Andrade Ancelmo - Servico de Informacao e Documentacao
(SID)
Simone A. Del-Ducca Barbedo - Servico de Informacao e
Documentacao (SID)
REVISAO E NORMALIZACAO DOCUMENTARIA:
Marciana Leite Ribeiro - Servico de Informacao e Documentacao
(SID)
Marilucia Santos Melo Cid - Servico de Informacao e Documentacao
(SID)
Yolanda Ribeiro da Silva e Souza - Servico de Informacao e
Documentacao (SID)
EDITORACAO ELETRONICA:
Viveca SantAna Lemos - Servico de Informacao e Documentacao
(SID)
[email protected]
-
INPE-15239-TDI/1326
APLICACAO DE MAPA DE KOHONEN PARA
CLASSIFICACAO DE TEXTURAS EM IMAGENS SAR EM
AMBIENTE PARALELO
Thalita Biazzuz Veronese
Dissertacao de Mestrado do Curso de Pos-Graduacao em Computacao
Aplicada,
orientada pelo Dr. Lamartine Nogueira Frutuoso Guimaraes,
aprovada em 5 de fevereiro
de 2007.
O original deste documento esta disponvel em:
INPE
Sao Jose dos Campos
2008
http://urlib.net/sid.inpe.br/mtc-m17@80/2008/02.12.12.07
-
Dados Internacionais de Catalogacao na Publicacao (CIP)
V599a Veronese, Thalita Biazzuz.Aplicacao de Mapa de Kohonen
para classificacao de
texturas em imagens SAR em ambiente paralelo/ ThalitaBiazzuz
Veronese. Sao Jose dos Campos: INPE, 2008.
110p. ; (INPE-15239-TDI/1326)
1. Imagens SAR. 2. Atributos de textura. 3. Filtros Ga-bor. 4.
Classificacao de imagens. 5. Processamento paralelo.I. Ttulo.
CDU 621.376.5
Copyright c 2008 do MCT/INPE. Nenhuma parte desta publicacao
pode ser reprodu-zida, armazenada em um sistema de recuperacao, ou
transmitida sob qualquer forma ou
por qualquer meio, eletronico, mecanico, fotografico,
microflmico, reprografico ou outros,
sem a permissao escrita da Editora, com excecao de qualquer
material fornecido especifi-
camente no proposito de ser entrado e executado num sistema
computacional, para o uso
exclusivo do leitor da obra.
Copyright c 2008 by MCT/INPE. No part of this publication may be
reproduced, storedin a retrieval system, or transmitted in any form
or by any means, eletronic, mechanical,
photocopying, microfilming, recording or otherwise, without
written permission from the
Publisher, with the exception of any material supplied
specifically for the purpose of being
entered and executed on a computer system, for exclusive use of
the reader of the work.
-
Voce deve ser a propria mudanca que deseja ver no mundo.
Mohandas Karamchand Gandhi
-
querida Leninha, dedico.
-
AGRADECIMENTOS
Agradeco ao meu orientador Lamartine Nogueira Frutuoso
Guimaraes, pela oportu-
nidade de desenvolver este trabalho, e pela orientacao e suporte
em todas as fases
desta pesquisa de mestrado.
Ao Maj. Maurcio Pozzobon Martins, do Instituto de Estudos
Avancados, agradeco
pelo apoio irrestrito, empenhando-se incansavelmente em
possibilitar que este tra-
balho alcancasse os objetivos concretos a que se propunha, e
pela amizade e profis-
sionalismo exemplares dedicados desde o incio desta
pesquisa.
Ao Instituto Nacional de Pesquisas Espaciais, aos profissionais
do LAC, CAP e SPG,
pelo ingresso e manutencao neste programa de Mestrado. Agradeco,
em especial, aos
professores Demsio, Fernando e Stephan, pela participacao e
sugestoes na Defesa
de Proposta de Mestrado.
Ao Instituto de Estudos Avancados, em especial a Divisao de
Geointeligencia e a
Divisao de Energia Nuclear, por me receber e permitir usufruir
de seus recursos
computacionais e instalacoes, e aos administradores do cluster
BELIEVe Onofre
Felix de Lima Neto e Roberto Yuji Tanaka, pelo suporte prestado.
Aos funcionarios
que me receberam tao bem nesta insitituicao, expresso minha
profunda gratidao.
A Embrapa Monitoramento por Satelite, em especial aos
pesquisadores Gustavo
Souza Valladares e Evaristo Eduardo de Miranda, agradeco pela
confianca de-
positada neste trabalho, fornecendo os dados indispensaveis para
esta pesquisa de
mestrado, e pela hospitalidade ao me receber em sua sede em
Campinas.
A CAPES e ao CNPq, pelo suporte financeiro.
A meus pais Carlos Eduardo e Irene, as melhores pessoas que ja
conheci, que com seu
amor incondicional proporcionam estrutura, incentivo e apoio em
todos os momentos
da minha vida.
Ao meu marido Reinaldo, companheiro de todos os momentos,
agradeco simples-
mente por tudo. Por ser essa pessoa tao especial, pelo
imensuravel apoio, pelo pre-
sente que e te-lo ao meu lado.
A toda minha famlia, pela confianca, carinho e compreensao,
mesmo nos momentos
mais difceis.
-
A todos os meus amigos, que formam minha segunda famlia,
agradeco por me
permitirem participar de suas vidas.
A todos os professores que contriburam para a minha formacao,
que muitas vezes
foram mais do que simples profissionais e dedicaram tambem sua
valiosa amizade.
Por fim, a todos aqueles que colaboraram de alguma forma para
que eu chegasse ate
aqui, agradeco e espero algum dia poder retribuir a altura.
-
RESUMO
Ao longo das ultimas decadas, diversas tecnicas tem sido
desenvolvidas para clas-sificacao de imagens de sensoriamento
remoto. No caso de imagens geradas porsensores que atuam na faixa
de microondas (radar), novas pesquisas sao necessarias,ja que
muitas vezes tecnicas consagradas para a classificacao de imagens
opticas naoproduzem resultados satisfatorios quando aplicadas a
imagens radar. Isso acontecedevido as caractersticas peculiares
deste tipo de imagem - presenca de forte rudo,por exemplo. Na
regiao amazonica, as condicoes climaticas frequentemente favore-cem
a cobertura de nuvens, o que se apresenta como fator restritivo a
utilizacao desensores opticos, incapazes de transpor este obstaculo
naturalmente. Entretanto, ossensores SAR praticamente nao sao
afetados pela cobertura de nuvens, e portantotem se tornado os
principais responsaveis pela obtencao de dados, contribuindo
parasuprir a falta de informacao disponvel sobre esta regiao. Neste
trabalho, avalia-se aeficiencia de um classificador neural baseado
no mapa auto-organizavel de Kohonenpara classificacao de imagens
SAR do SIVAM (Sistema de Vigilancia da Amazonia),utilizando medidas
de textura obtidas por filtros Gabor. Na fase de extracao
deatributos, um processo de elevado custo computacional, foram
implementadas tec-nicas de processamento paralelo em rede de
computadores de baixo custo, a fim deavaliar o real ganho em
desempenho. As imagens utilizadas foram obtidas pelo sen-sor
SAR-SIVAM sobre Machadinho dOeste - RO, adquiridas em 13 de
Setembro de2004 pelo sensor SAR da aeronave de sensoriamento remoto
do SIVAM, gentilmentecedidas pela Divisao de Sensoriamento Remoto
do Instituto de Estudos Avancados(IEAv/CTA). Como referencia para a
identificacao visual de classes de texturas,serao utilizadas
imagens opticas SPOT e dados de campo cedidos pela EMBRAPA.
-
A KOHONENS MAP FOR SAR IMAGES TEXTURECLASSIFICATION IN PARALLEL
ENVIRONMENT
ABSTRACT
In the last decades, several techniques have been developed for
classification of re-mote sensing images. In the case of images
obtained from sensors that act in themicrowave regions (radar), new
researches are necessary, since often successfull tech-niques for
optical images classification do not produce satisfactory results
when ap-plied to radar images. This happens due to the peculiar
characteristics of this typeof image - e.g., the presence of strong
noise. In the Amazon region, the climaticconditions frequently
benefit clouds covering, what presents itself as a
restrictivefactor to the use of optical sensors, unable to
naturally cross this obstacles. How-ever, SAR sensors are
pratically not affected by the clouds covering, and thus havebecome
the main responsible for collection of data, contributing to supply
the lackof information about this region. In this work, we evaluate
the efficiency of a neuralclassifier based on the Kohonens
Self-Organizing Map for classifying SAR-SIVAMimages obtained from
Machadinho dOeste - RO, using Gabor texture features. Inthe feature
extraction phase, a high computational cost proccess, techniques of
par-allel processing were implemented in low cost computer network,
in order to analyzethe real performance improvement. The images for
testing were obtained in 2004September 13, by the SAR sensor of
SIVAMs remote sensing aircraft, kindly givenby Remote Sensing
Division of Advanced Studies Institute (IEAv/CTA). As refer-ence
for the visual identification of texture classes, SPOT optical
images and fieldinformation, given by EMBRAPA, are used.
-
SUMARIO
Pag.
LISTA DE FIGURAS
LISTA DE TABELAS
LISTA DE SIGLAS E ABREVIATURAS
CAPITULO 1 - INTRODUCAO 25
CAPITULO 2 - FUNDAMENTOS TEORICOS 29
2.1 - Imagens Obtidas por Radar de Abertura Sintetica (SAR) . .
. . . . . . . 29
2.1.1 - Geometria de Aquisicao de Imagens SAR . . . . . . . . .
. . . . . . . 31
2.1.2 - Equacao do Radar . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . 34
2.1.3 - Polarizacao . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . 38
2.1.4 - Reducao de Speckle . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . 39
2.2 - Atributos de Textura . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . 41
2.2.1 - Metodos para Extracao de Atributos de Textura . . . . .
. . . . . . . . 42
2.2.2 - A Transformada Discreta de Fourier . . . . . . . . . . .
. . . . . . . . 44
2.2.3 - Wavelets . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . 47
2.2.4 - Filtros Gabor . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . 48
2.2.5 - Representacao da Textura por Vetores de Atributos . . .
. . . . . . . . 50
2.3 - Classificadores Baseados em Redes Neurais Artificiais . .
. . . . . . . . . 51
2.3.1 - Fundamentos de Redes Neurais Artificiais . . . . . . . .
. . . . . . . . 53
2.3.2 - Mapa Auto-Organizavel de Kohonen (SOM) . . . . . . . . .
. . . . . . 58
2.3.3 - Aprendizagem por Quantizacao Vetorial (LVQ) . . . . . .
. . . . . . . 60
2.4 - Processamento Paralelo . . . . . . . . . . . . . . . . . .
. . . . . . . . . 63
2.4.1 - A Arquitetura Beowulf . . . . . . . . . . . . . . . . .
. . . . . . . . . . 64
2.4.2 - Conceitos Basicos de Paralelismo . . . . . . . . . . . .
. . . . . . . . . 67
2.4.3 - Analise de Eficiencia e Speedup . . . . . . . . . . . .
. . . . . . . . . . 69
CAPITULO 3 - MATERIAIS E METODOS 71
3.1 - Area de Estudo . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . 71
3.2 - O Sensor SAR/R-99B . . . . . . . . . . . . . . . . . . . .
. . . . . . . . 73
-
3.3 - O Projeto Believe . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . 74
3.4 - Matriz de Confusao e Indice Kappa . . . . . . . . . . . .
. . . . . . . . . 75
3.5 - Metodologia . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . 77
3.5.1 - Definicao da Area de Estudo . . . . . . . . . . . . . .
. . . . . . . . . 78
3.5.2 - Definicao das Classes de Estudo . . . . . . . . . . . .
. . . . . . . . . . 78
3.5.3 - Extracao das Amostras de Treinamento e Teste . . . . . .
. . . . . . . 79
3.5.4 - Extracao de Atributos . . . . . . . . . . . . . . . . .
. . . . . . . . . . 79
3.5.5 - Distribuicao dos Dados . . . . . . . . . . . . . . . . .
. . . . . . . . . . 81
3.5.6 - Treinamento da Rede SOM+LVQ . . . . . . . . . . . . . .
. . . . . . . 82
3.5.7 - Classificacao das Imagens . . . . . . . . . . . . . . .
. . . . . . . . . . 83
CAPITULO 4 - ANALISE DE RESULTADOS 87
4.1 - Treinamento da Rede . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . 87
4.1.1 - Combinacao de Bandas . . . . . . . . . . . . . . . . . .
. . . . . . . . 87
4.1.2 - Tamanho dos Filtros . . . . . . . . . . . . . . . . . .
. . . . . . . . . . 89
4.1.3 - Configuracao da Rede . . . . . . . . . . . . . . . . . .
. . . . . . . . . 90
4.2 - Classificacao das Imagens . . . . . . . . . . . . . . . .
. . . . . . . . . . 92
4.3 - Analise de desempenho e eficiencia . . . . . . . . . . . .
. . . . . . . . . 94
CAPITULO 5 - CONCLUSOES 99
REFERENCIAS BIBLIOGRAFICAS 101
APENDICE A - DISTRIBUICAO DO PROCESSAMENTO 107
-
LISTA DE FIGURAS
Pag.
2.1 Espectro de frequencias, destacando a faixa de microondas e
as bandas
de radar. . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . 29
2.2 Diferenca entre sensores ativos (a) e passivos (b). Sensores
passivos de-
pendem de uma fonte de energia geralmente o sol que ilumine o
alvo
para captar a energia refletida. . . . . . . . . . . . . . . . .
. . . . . . . 30
2.3 A ambiguidade no imageamento por radar com visada vertical.
. . . . . . 32
2.4 Alguns parametros basicos de um sistema SLAR. . . . . . . .
. . . . . . 33
2.5 A relacao entre o angulo de depressao e o efeito
sombreamento sobre a
imagem SAR. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . 36
2.6 Os efeitos de inversao e encurtamento sobre a imagem SAR. .
. . . . . . 37
2.7 Microondas polarizadas. . . . . . . . . . . . . . . . . . .
. . . . . . . . . 38
2.8 Imagem SAR distorcida por rudo speckle. . . . . . . . . . .
. . . . . . . 39
2.9 Processamento multilook. . . . . . . . . . . . . . . . . . .
. . . . . . . . . 40
2.10 Exemplos de textura. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . 42
2.11 Exemplo de imagens de diferentes frequencias. . . . . . . .
. . . . . . . . 45
2.12 Diagrama em blocos do processo de filtragem no domnio da
frequencia. . 45
2.13 Exemplo de transformacao FT e STFT. . . . . . . . . . . . .
. . . . . . 46
2.14 Sinal decomposto em wavelets de diferentes escalas e
posicoes. . . . . . . 47
2.15 Efeito da alteracao de escala em uma wavelet. . . . . . . .
. . . . . . . . 48
2.16 Banco de filtros ortogonais, apos aplicar a tecnica de
eliminacao de re-
dundancia. . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . 50
-
2.17 O conceito do classificador como uma conexao entre uma
imagem (a
esquerda) e um conjunto de rotulos de classe (a direita). . . .
. . . . . . 52
2.18 O neuronio e seus principais componentes . . . . . . . . .
. . . . . . . . 54
2.19 A sinapse. . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . 54
2.20 O neuronio artificial de McCulloch e Pitts. . . . . . . . .
. . . . . . . . . 55
2.21 Exemplos de arquiteturas (ou topologias) de redes neurais
artificiais. . . 56
2.22 Funcoes de ativacao. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . 57
2.23 Funcao de vizinhanca gaussiana. . . . . . . . . . . . . . .
. . . . . . . . . 59
2.24 Diagrama em blocos da classificacao SOM+LVQ. . . . . . . .
. . . . . . 60
2.25 Diagrama de Voronoi envolvendo quatro celulas. . . . . . .
. . . . . . . . 61
2.26 Visao logica de um cluster da classe Beowulf. . . . . . . .
. . . . . . . . 65
2.27 Cluster do projeto BELIEVe (IEAv/CTA). . . . . . . . . . .
. . . . . . . 66
2.28 Modelos computacionais SISD, SIMD e MISD. UC=Unidade de
Con-
trole; UP=Unidade de Processamento; M=Memoria; FI=Fluxo de
In-
strucoes; FD=Fluxo de Dados. . . . . . . . . . . . . . . . . . .
. . . . . 68
2.29 Modelos computacionais MIMD de memoria compartilhada (a) e
dis-
tribuda (b). UC=Unidade de Controle; UP=Unidade de Processa-
mento; M=Memoria; FI=Fluxo de Instrucoes; FD=Fluxo de Dados. . .
69
3.1 Localizacao do municpio de Machadinho dOeste. . . . . . . .
. . . . . . 71
3.2 Aeronave R-99B do SIVAM. . . . . . . . . . . . . . . . . . .
. . . . . . . 74
3.3 Metodologia. . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . 77
3.4 Imagem SAR (banda L VH polarizada) obtida sobre a area de
estudo,
destacando os recortes selecionados para analise. . . . . . . .
. . . . . . . 78
3.5 Interface do modulo de geracao de Filtros Gabor. . . . . . .
. . . . . . . 80
-
3.6 Interface de selecao de amostras e extracao de atributos. .
. . . . . . . . 81
3.7 Interface do modulo de treinamento da rede. . . . . . . . .
. . . . . . . . 83
3.8 Interface do modulo de classificacao das imagens. . . . . .
. . . . . . . . 84
4.1 Valores de Kappa obtidos para diferentes tamanhos de
filtros. . . . . . . 90
4.2 Graficos com ndices Kappa observados para diferentes
configuracoes da
rede SOM. . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . 91
4.3 Evolucao do treinamento em termos dos valores de Kappa. . .
. . . . . . 92
4.4 Recorte selecionado para analise e imagem resultante da
classificacao. . . 94
4.5 Medidas de speedup observadas. . . . . . . . . . . . . . . .
. . . . . . . . 96
4.6 Medidas de eficiencia observadas. . . . . . . . . . . . . .
. . . . . . . . . 97
-
LISTA DE TABELAS
Pag.
3.1 Caractersticas da aeronave R-99B do SIVAM. . . . . . . . . .
. . . . . . 73
3.2 Exemplo de matriz de confusao. . . . . . . . . . . . . . . .
. . . . . . . . 76
3.3 Numero de pixels de treinamento e teste para cada classe. .
. . . . . . . 79
3.4 Numero de pixels de treinamento para cada classe. . . . . .
. . . . . . . 84
4.1 Valores de kappa para cada banda. . . . . . . . . . . . . .
. . . . . . . . 87
4.2 Valores de Kappa para combinacoes entre bandas. . . . . . .
. . . . . . . 88
4.3 Valores de Kappa para X(HH) + L(VH) filtradas. . . . . . . .
. . . . . . 89
4.4 Matriz de confusao resultante da classificacao. . . . . . .
. . . . . . . . . 93
4.5 Medidas de speedup e eficiencia obtidas para o conjunto de
17.500 pixels. 94
4.6 Medidas de speedup e eficiencia obtidas para o conjunto de
52.500 pixels. 95
4.7 Medidas de speedup e eficiencia obtidas para o conjunto de
87.500 pixels. 95
-
LISTA DE SIGLAS E ABREVIATURAS
SAR Synthetic Aperture RadarSR Sensoriamento RemotoINSAR
Interferometria SARSIVAM Sistema de Vigilancia da AmazoniaSLAR Side
Looking Airbone RadarDFT Discrete Fourier TransformFFT Fast Fourier
TransformSTFT Short-Time Fourier TransformCWT Continuous Wavelet
TransformSOM Self-Organizing MapLVQ Learning Vector QuantizationPVM
Parallel Virtual MachineMPI Message-Passing InterfaceSISD
Single-Instruction Single-DataMISD Multiple-Instruction
Single-DataSIMD Single-Instruction Multiple-DataMIMD
Multiple-Instruction Multiple-Data
-
CAPITULO 1
INTRODUCAO
A classificacao de imagens de sensoriamento remoto consiste em
associar um rotulo
de classe a cada pixel, com base em medidas extradas da imagem -
geralmente do
proprio pixel ou de seus vizinhos. Uma imagem de sensoriamento
remoto totalmente
classificada e chamada de mapa tematico, pois possibilita a
identificacao geografica
das classes sobre a superfcie imageada (CROSTA, 1992). Ha
diversas aplicacoes para
a classificacao de imagens de sensoriamento remoto, como, por
exemplo, analise de
culturas agrcolas, monitoramento e controle ambiental,
planejamento urbano, etc.
Para classificacao de imagens geradas a partir de sensores
opticos, diversas tecnicas
tem sido desenvolvidas, aperfeicoadas e utilizadas ao longo das
ultimas decadas.
Entretanto, no caso das imagens obtidas a partir de sensores que
atuam na faixa de
microondas (radar), novas pesquisas sao necessarias, ja que
muitas vezes tecnicas de
classificacao consagradas para dados opticos nao produzem
resultados satisfatorios
quando aplicadas a imagens radar, devido as caractersticas
peculiares desse tipo de
imagem presenca de forte rudo, por exemplo.
Presente em todo tipo de imagem (HARALICK, 1979), a textura e um
atributo es-
pacial que reflete a impressao de aspereza ou suavidade criada
pela variacao de
tonalidade ou repeticao de padroes atraves de uma superfcie
(TSO; MATHER, 2001).
No contexto do sensoriamento remoto, atributos de textura
mostram-se eficazes ao
atuar como informacoes auxiliares na caracterizacao de classes,
melhorando muitas
vezes o resultado da classificacao. Em imagens de radar, a
incorporacao da textura ao
processo de classificacao e utilizada principalmente quando
aplicada a discrimacao
de diferentes tipos de florestas e variedades de culturas
agrcolas que nao se dis-
tinguem por apresentarem a mesma tonalidade (ou nvel de cinza
medio), mas que
podem ser discriminadas pela diferenca de textura (SILVA JUNIOR,
2001). Pesquisas
em psicologia mostram que o cerebro humano realiza uma analise
em frequencia das
imagens, e celulas simples no cortex visual podem ser modeladas
mediante as funcoes
Gabor (CAMPBELL; ROBSON, 1968; DAUGMAN, 1988). Esta propriedade,
associada
ao fato de as wavelets Gabor serem melhor localizadas no tempo e
na frequencia e
apresentarem maior numero de parametros, torna as funcoes Gabor
especialmente
apropriadas para a representacao de caractersticas locais das
imagens (CASTANON,
2003).
25
-
Em Manjunath e Ma (1996), e proposta uma metodologia na qual os
padroes de
textura sao caracterizados utilizando a transformada wavelet de
Gabor e medidas
estatsticas. Esta metodologia foi utilizada por Martins (2003)
para a implemen-
tacao de um classificador neural de atributos de textura,
baseado em dois tipos
de redes neurais artificiais integradas: mapa auto-organizavel
de Kohonen (SOM) e
aprendizagem por quantizacao vetorial (LVQ). A capacidade de
reconhecer padroes,
mesmo ao lidar com informacoes ruidosas ou incompletas (HAYKIN,
2001), contribui
para que as redes neurais artificiais atuem como ferramentas nos
mais diversos tipos
de problemas (FAUSETT, 1994). As redes neurais artificiais tem
sido cada vez mais
usadas no contexto de sensoriamento remoto nos ultimos 10 anos,
principalmente
para classificacao de imagens (TSO; MATHER, 2001).
Inaugurado em 25 de julho de 2002, o SIVAM (Sistema de
Vigilancia da Amazo-
nia) (http://www.sivam.gov.br) tem o proposito de zelar pela
Amazonia Legal
Brasileira. Esta area, considerada a maior reserva natural do
planeta, esta sujeita a
acoes predatorias realizadas por madeireiras e garimpeiros
ilegais, narcotraficantes e
diversos tipos de ilcito. Na regiao amazonica, as condicoes
climaticas frequentemente
sao caracterizadas por coberturas de nuvens, o que se apresenta
como fator restritivo
a utilizacao de sensores opticos. Assim, os sensores SAR
(Synthetic Aperture Radar)
tem se tornado os principais responsaveis pela obtencao de
dados, contribuindo para
suprir a falta de informacao disponvel sobre esta regiao. O
SIVAM dispoe de tres
aeronaves R-99B equipadas com sensores SAR para gerar imagens
radar da regiao.
Infelizmente, a facilidade em se produzir um grande volume de
dados nao e acompan-
hada pela velocidade de analise dos mesmos e a consequente
geracao de resultados
aplicaveis ao proposito do SIVAM. Portanto, metodologias em
Processamento de
Alto Desempenho devem ser consideradas a fim de otimizar a
manipulacao dessa
grande quantidade de dados.
Localizado a aproximadamente 400 km de Porto Velho, dentro da
Amazonia Legal
Brasileira1, o municpio de Machadinho dOeste - RO foi escolhido
por pesquisadores
da Embrapa e da organizacao nao-governamental ECOFORCA como
objeto de um
estudo de longo prazo, com o objetivo de obter informacoes que
proporcionem su-
porte aos projetos de sustentabilidade agrcola na Amazonia. Como
resultado de uma
cooperacao tecnica entre a Embrapa Monitoramento por Satelite e
o Instituto de
Estudos Avancados (IEAv) do Centro Tecnico Aeroespacial (CTA),
foram adquiri-
1A Amazonia Legal Brasileira compreende a regiao Norte do
Brasil, o estado do Mato Grossoe parte do estado do Maranhao.
26
http://www.sivam.gov.br
-
das imagens do municpio pelo sensor SAR da aeronave de
sensoriamento remoto
R99-B do SIVAM, para contribuir na caracterizacao e
monitoramento do uso do solo
e cobertura de terra da regiao.
Este trabalho tem como objetivo principal avaliar a eficiencia
do classificador de-
senvolvido por Martins (2003) na classificacao da cobertura de
terra e uso do solo
da regiao de Machadinho dOeste - RO, atraves de imagens obtidas
por radar de
abertura sintetica. Dados de uso do solo e cobertura de terra
verificados em campo
foram utilizados como amostras de treinamento para o
classificador neural. Devido
ao alto tempo de execucao gasto para realizar a extracao de
atributos de textura das
imagens, e necessario integrar tecnicas de processamento de alto
desempenho a esta
etapa. Assim, atraves do paralelismo de dados, as amostras e
imagens a serem anal-
isadas sao divididas entre varios processadores, que calculam os
vetores de atributos
independentemente. Este trabalho esta sendo desenvolvido em um
cluster baseado
no conceito de maquinas Beowulf. O ambiente utilizado faz parte
do projeto BE-
LIEVe, desenvolvido no Laboratorio de Engenharia Virtual do
Instituto de Estudos
Avancados (IEAv).
Este trabalho esta organizado da seguinte maneira. No Captulo 2
sao apresentadas
as fundamentacoes teoricas que servem como base para o
desenvolvimento deste
trabalho. Sao descritos inicialmente os principais conceitos
relacionados as imagens
obtidas por Radar de Abertura Sintetica; a seguir, discutem-se
os temas basicos rel-
ativos a representacao de texturas, introduzindo a metodologia
de extracao de atrib-
utos de textura por wavelets de Gabor (MANJUNATH; MA, 1996).
Para uma melhor
compreensao desta metodologia, e apresentado um breve resumo
sobre a transfor-
mada de Fourier e a teoria de wavelets. E apresentada tambem,
resumidamente, a
teoria de redes neurais artificiais e sua aplicacao no contexto
do reconhecimento de
padroes em sensoriamento remoto, abordando aspectos especficos
relativos as re-
des utilizadas para implementacao do classificador analisado
neste trabalho, SOM e
LVQ. Finalmente, sao discutidos os conceitos de processamento
paralelo, para uma
melhor compreensao das ferramentas de computacao de alto
desempenho utilizadas
no desenvolvimento desta pesquisa de mestrado.
O Captulo 3 descreve a area de estudo, os materiais utilizados e
a metodologia
empregada.
No Captulo 4 sao apresentados e discutidos os resultados obtidos
na classificacao
27
-
das imagens utilizando atributos de textura. Tambem sao
apresentados os resultados
obtidos com a analise de desempenho da implementacao distribuda
da extracao de
atributos de textura.
No Captulo 5 sao apresentadas as conclusoes e sugestoes de
pesquisas futuras.
28
-
CAPITULO 2
FUNDAMENTOS TEORICOS
2.1 Imagens Obtidas por Radar de Abertura Sintetica (SAR)
A palavra radar, derivada da expressao RAdio Detection And
Ranging, e usada para
denominar sensores que atuam na faixa de microondas do espectro
eletromagnetico.
A faixa de microondas compreende as bandas cuja frequencia varia
de 0.3 a 300
GHz, definindo assim comprimentos de onda entre 1 mm e 1 m
(ULABY et al., 1982),
como mostra a Figura 2.1.
(a) Espectro de frequencias.
(b) Faixa de microondas e bandas de radar.
FIGURA 2.1 - Espectro de frequencias, destacando a faixa de
microondas e as bandas de radar.
Os radares sao instrumentos que transmitem pulsos de microondas
a um determinado
objeto (alvo) e recebem dele um sinal refletido (eco). Com base
no tempo decorrido
entre a transmissao do sinal e seu retorno a antena, alem de
outras propriedades do
eco, e possvel inferir uma serie de informacoes acerca do alvo,
como por exemplo
sua distancia em relacao ao sensor. Os radares se distinguem dos
sensores opticos
por diversas razoes, dentre as quais destacam-se:
29
-
a) O sinal refletido permite obter informacoes adicionais
aquelas obtidas por
sistemas opticos e termicos, como aspereza e condutividade
eletrica do alvo.
b) As microondas possuem alto poder de penetracao em nuvens e
chuvas,
o que torna os radares ferramentes importantes para o
imageamento de
regioes onde as condicoes meteorologicas se apresentam como
fator restri-
tivo a utilizacao de sensores opticos.
c) Os radares imageadores sao sitemas ativos1, isto e,
independentes da ilumi-
nacao solar, podendo ser empregados no perodo diurno ou noturno,
sem
perda de desempenho (ULABY et al., 1982). A Figura 2.2 mostra a
diferenca
entre sensores ativos e passivos.
(a) Radares (sensoresativos).
(b) Radiometros (sensorespassivos).
FIGURA 2.2 - Diferenca entre sensores ativos (a) e passivos (b).
Sensores passivos dependem de umafonte de energia geralmente o sol
que ilumine o alvo para captar a energia refletida.FONTE: Sensing
(2002).
Por essas razoes, e crescente o numero de sistemas SAR
(Synthetic Aperture Radar)
em orbita atualmente, e e provavel que o imageamento por radar
exerca um papel
cada vez mais importante no conhecimento e monitoramento do meio
ambiente (TSO;
MATHER, 2001).
Entretanto, uma vez que a informacao gerada pelo radar e
diferente daquela obtida
por sensores opticos, e necessario tambem utilizar tecnicas
adequadas para tratar este
tipo de dado. Assim, a pesquisa e o desenvolvimento de novos
metodos e ferramen-
tas especficas tem se tornado essenciais para possibilitar a
analise dessa informacao.
1Sensores de microondas passivos (radiometros) detectam a
radiacao de microondas gerada peloalvo.
30
-
Diversos trabalhos tem sido realizados nesta direcao,
especialmente voltados para
tratar imagens SAR de regioes tropicais, como a Amazonia. Oliver
(2000) propoe a
aplicacao de metodos de segmentacao a atributos de textura para
classificar areas
da Amazonia entre as categorias floresta e nao-floresta,
utilizando imagens do Par-
que Nacional de Tapajos. Komarov et al. (1999) associa tecnicas
de redes neurais
artificiais a atributos de textura estatsticos para classificar
regioes de floresta us-
ando imagens SAR. Em Dutra et al. (2003), investiga-se a
utilizacao da metodologia
InSAR (Interferometria SAR) associada ao uso de conjuntos de
imagens SAR obtidas
de uma mesma regiao, num pequeno intervalo de tempo, como auxlio
a obtencao de
modelos de elevacao dos terrenos imageados. A eficacia de
metodos supervisionados
multidimensionais na classificacao de imagens SAR do SIVAM
pre-processadas por
filtros para reducao de speckle2 e avaliada por Maximo e
Fernandes (2005).
2.1.1 Geometria de Aquisicao de Imagens SAR
O radar de abertura sintetica foi projetado por Carl Wiley em
1952 com a finalidade
de melhorar a resolucao de radares aerotransportados (ULABY et
al., 1982). Para isso,
o tamanho da antena e sinteticamente aumentado, isto e, atraves
de uma complexa
tecnologia, modifica-se o processamento do sinal de forma a
simular uma antena
fisicamente longa. Assim, alem da reducao do tamanho real da
antena, obtem-se
como resultado uma melhor resolucao da imagem, independente da
distancia entre
o radar e o alvo, tornando viavel seu uso tanto em aeronaves
quanto em espaconaves.
O processo de aquisicao das imagens baseia-se na geometria de
visada lateral, carac-
terstica dos sensores SLAR (Side Looking Airbone Radar). Esta
tecnica foi desen-
volvida para solucionar o problema da ambiguidade presente nos
radares de visada
vertical. Este problema ocorre quando ecos provenientes de
diferentes alvos tem suas
posicoes confundidas em funcao da recepcao simultanea dos mesmos
pelo sistema
sensor, como mostra a Figura 2.3.
O sistema SLAR transmite e recebe energia na forma de microondas
usando uma
antena fixada na lateral da aeronave. A area imageada e, entao,
uma faixa do solo
paralela a trajetoria do voo (denominada direcao azimutal). A
resolucao das imagens,
que corresponde a area iluminada pelo pulso do radar num dado
instante de tempo,
depende principalmente da duracao do pulso e do raio da antena.
A duracao do
pulso afeta a resolucao transversal, enquanto a largura do raio
da antena controla a
2Speckle e um tipo de rudo caracterstico de imagens SAR, que
sera descrito na Subsecao 2.1.4.
31
-
FIGURA 2.3 - A ambiguidade no imageamento por radar com visada
vertical.FONTE: Adaptado de Ulaby et al. (1982)
resolucao azimutal, como pode ser observado nas Equacoes 2.1 e
2.2 (TSO; MATHER,
2001).
t =c
2sin ; (2.1)
a = R . (2.2)
Onde t e a indicam, respectivamente, as resolucoes transversal3
e azimutal; c cor-
responde a velocidade da luz; e a duracao do pulso; indica a
largura horizontal
do feixe; e R corresponde a distancia do sensor a linha de
visada. O angulo de in-
cidencia ou angulo de visada e definido como o angulo entre a
direcao da energia
emitida e uma linha perpendicular a superfcie imageada (Figura
2.4).
O angulo de depressao () e complementar ao angulo de incidencia
(), se assumir-
mos que a superfcie imageada seja plana. A largura horizontal do
feixe () esta
relacionada ao tamanho da antena (l) e ao comprimento de onda
(), como pode-
mos ver na Equacao 2.3.
=
l. (2.3)
3A resolucao transversal nada mais e do que a projecao da
resolucao na linha de visada no solorLV = c2 (ULABY et al.,
1982).
32
-
FIGURA 2.4 - Alguns parametros basicos de um sistema SLAR.FONTE:
Adaptado de Ulaby et al. (1982)
Pode-se inferir da Equacao 2.1 que quanto mais curta for a
duracao do pulso, mel-
hor sera a resolucao transversal. Essa dependencia, porem,
carrega uma limitacao:
quanto mais curto o pulso, maior a potencia de pico exigida pelo
sistema para que
se mantenha a mesma potencia media.
A distancia da linha de visada (R) e dada por:
R =h
cos , (2.4)
onde h e a altura de voo. Substituindo R na Equacao 2.2,
tem-se:
a =h
cos . (2.5)
Assim, gracas aos parametros sin e cos , as resolucoes em
azimute e transversal sao
funcao do angulo de incidencia () e, consequentemente, da linha
de visada. Logo,
t e degradada nas distancias menores, enquanto a e degradada nas
distancias
33
-
maiores. Isso faz com que a forma do pixel seja alongada na
direcao transversal
para pequenas distancias e na direcao longitudinal para longas
distancias (DAMIAO;
MAXIMO, 1998).
Para os sistemas SAR, as resolucoes transversal e em azimute sao
calculadas de forma
distinta da apresentada anteriormente. Os sistemas de abertura
sintetica utilizam,
em geral, pulsos de frequencia modulada (chirpped pulses), a fim
de obter uma
melhor resolucao transversal sem, entretanto, ter que recorrer a
pulsos muito curtos.
Assim, para imagens SAR, a resolucao transversal e calculada de
acordo com a
Equacao 2.6:
t =c
2Bsin , (2.6)
onde B e a largura de banda do pulso modulado linearmente em
frequencia e que
pode ser tao larga quanto necessaria, sem que para isso seja
requerida uma grande
potencia de pico. A resolucao em azimute, por sua vez, independe
teoricamente da
distancia entre a antena e o alvo, devido a construcao da antena
sintetica. A melhor
resolucao em azimute sintetica potencial (ap) e apresentada na
Equacao 2.7.
ap =L
2. (2.7)
As deducoes matematicas para a equacao acima podem ser
encontradas em Ulaby
et al. (1982). Elas nao serao apresentadas aqui, pois seu nvel
de complexidade foge
ao escopo deste trabalho.
2.1.2 Equacao do Radar
Equacao do radar e o nome dado a relacao entre as caractersticas
do radar, do alvo
e do sinal recebido pelo sensor (ULABY et al., 1982). Ha
diversas formas de apresentar
esta equacao, em funcao do tipo de radar utilizado ou do
parametro tomado como
referencia. Se assumirmos que a antena de transmissao e a mesma
de recepcao, o
radar e dito monostatico e a equacao do radar pode ser escrita
nas seguintes formas:
Pr =PtA
2e
42R4, (2.8)
34
-
definindo Pr em termos de area da antena, ou:
Pr =PtG
22
(4)3R4, (2.9)
definindo Pr em termos de ganho da antena. Onde:
Pr e a potencia irradiada na direcao do radar;
Pt a potencia transmitida pelo radar;
Ae e a area efetiva da antena;
e a secao transversal radar do alvo;
e o comprimento de onda do sinal;
R e a distancia entre o alvo e o radar;
G e o ganho da antena.
O ganho da antena corresponde a medida da potencia que e
aumentada na direcao
do alvo se comparada com a potencia que seria irradiada por uma
antena isotropica
(omnidirecional). Radares geralmente usam antenas anisotropicas
(diretivas), para
canalizar o maximo da potencia transmitida Pt em alguma direcao
particular. Dentre
os parametros apresentados acima, apenas esta relacionado as
propriedades da
superfcie imageada, determinando portanto o comportamento deste
alvo frente a
um sistema de radar. Quando um alvo e iluminado pelo radar,
parte da potencia
incidente tende a se espalhar em todas as direcoes, enquanto
outra parte retorna
na direcao do radar. Tal fenomeno e definido como
retroespalhamento e e uma
funcao complexa de parametros fsicos do alvo. A forma, o tamanho
e o material do
alvo sao fatores determinantes para o retroespalhamento da onda
eletromagnetica.
Para simplificar o equacionamento, todos esses fatores sao
aglutinados em um unico
parametro , definido como a secao transversal do alvo. A
descricao detalhada deste
parametro e dos fatores que o influenciam pode ser encontrada em
Ulaby et al.
(1982).
2.1.2.1 Efeitos Geometricos sobre a Imagem SAR
Alguns fatores inerentes a geometria de aquisicao descrita acima
podem afetar as
propriedades das imagens de modo a interferir na sua
interpretacao. As distorcoes
35
-
geometricas mais comuns presentes nas imagens radar serao
brevemente descritas
nesta secao.
Sombreamento (Shadowing)
Uma imagem radar e efetivamente uma representacao dos nveis de
energia refletidos
por um alvo relacionados ao tempo decorrido entre a emissao da
energia pela antena
e seu retorno a mesma. O efeito sombreamento corresponde a
ausencia de informacao
sobre uma determinada area da imagem que fica oculta pela
encosta de um objeto,
e e determinado pela altura do objeto e pelo angulo de depressao
(TSO; MATHER,
2001). A Figura 2.5 mostra como estes parametros podem distorcer
o imageamento.
No objeto A, o angulo b e menor do que o angulo de depressao
correspondente 1.
Consequentemente, a encosta do objeto A e iluminada pela energia
de microondas.
Entretanto, uma vez que o angulo b do objeto B e maior do que o
angulo de
depressao correspondente 2, a antena do radar nao recebera
nenhum sinal da regiao
localizada atras do alvo, gerando uma area de refletividade zero
ate que o ponto a
seja atingido.
FIGURA 2.5 - A relacao entre o angulo de depressao e o efeito
sombreamento sobre a imagem SAR.FONTE: Adaptado de Tso e Mather
(2001)
E possvel solucionar este problema atraves do princpio da visada
dupla, que consiste
na aquisicao de imagens a partir de duas direcoes diferentes de
visada. A obtencao
de imagens sob perspectivas distintas gera um maior volume de
dados disponveis,
revelando informacoes (especialmente feicoes lineares) que nao
sao aparentes numa
36
-
imagem de visada simples (DAMIAO; MAXIMO, 1998).
Encurtamento (Foreshortening)
A natureza do terreno causa ainda outros efeitos sobre a
interpretacao da imagem
relacionados a variacao da altura do terreno. Numa superfcie
perfeitamente plana,
os elementos mais proximos do ponto sub-nadir seriam iluminados
pelo feixe radar
e refletiriam o sinal antes daqueles elementos mais afastados.
Os sinais, portanto,
seriam refletidos progressivamente no tempo da menor para a
maior linha de visada.
Um elemento mais elevado do que os vizinhos, no entanto, devera
interceptar o
pulso radar mais cedo, logo sera projetado na imagem numa
posicao mais proxima
do ponto sub-nadir do que realmente esta. A Figura 2.6 mostra
como este efeito
provoca um encurtamento aparente, no plano da imagem radar, das
encostas cuja
parte inclinada esta voltada para o radar, ou seja, a encosta CD
aparece encurtada
na imagem como C D (DAMIAO; MAXIMO, 1998).
FIGURA 2.6 - Os efeitos de inversao e encurtamento sobre a
imagem SAR.FONTE: Adaptado de Damiao e Maximo (1998)
37
-
Inversao (Layover)
O efeito de inversao faz com que o topo de um alvo imageado seja
visto pelo radar
como a base, e a base seja registrada como o topo do objeto.
Este fenomeno ocorre
em casos extremos de encurtamento, quando o sinal leva menos
tempo para ir da
antena ao topo do alvo do que a sua base. Como mostra a Figura
2.6, a inversao so
ocorre quando o angulo formado entre o caminho da energia e a
encosta frontal do
objeto e maior do que 90 (TSO; MATHER, 2001).
2.1.3 Polarizacao
O retroespalhamento do sinal pode ainda ser influenciado pela
polarizacao da onda
incidente, relacionada as propriedades eletromagneticas e
geometricas do alvo. A
polarizacao descreve a orientacao do campo eletrico de uma onda
eletromagnetica,
que pode ser do tipo linear, circular ou elptica. A maioria dos
sistemas de radar
polarizam a energia lineamente, restringindo o campo eletrico a
um plano fixo per-
pendicular a direcao de propagacao da onda Figura 2.7. A onda
polarizada e entao
transmitida e recebida no plano horizontal (H) ou no plano
vertical (V), possibil-
itando quatro combinacoes de transmissao e recepcao: HH, VV, HV
e VH, onde
a primeira e a segunda letra indicam, respectivamente, a
polarizacao da radiacao
transmitida e a polarizacao da radiacao recebida pela antena.
Polarizacoes cruzadas
(HV e VH) geralmente produzem ecos mais fracos do que aqueles
gerados por config-
uracoes paralelas (HH e VV). Em sensoriamento remoto, e comum o
uso de radares
multipolarimetricos, capazes de coletar dados em qualquer uma
das quatro combi-
nacoes possveis.
FIGURA 2.7 - Microondas polarizadas.
38
-
2.1.4 Reducao de Speckle
Devido ao mecanismo de imageamento inerente, as imagens SAR sao
comumente
corrompidas por um rudo conhecido como speckle, provocando uma
distorcao ra-
diometrica cujo efeito visual e a aparencia granulosa
caracterstica deste tipo de
imagem, como pode ser observado na Figura 2.8. O speckle e
causado pela inter-
ferencia entre ondas refletidas de microscopicos difusores
dentro de cada celula de
resolucao, e e geralmente modelado como um rudo multiplicativo,
ou seja, propor-
cional a intensidade do sinal recebido.
FIGURA 2.8 - Imagem SAR distorcida por rudo speckle.
O efeito do speckle pode ser diminudo aplicando-se alguma forma
de pre-
processamento sobre a imagem, melhorando, assim, os resultados
de uma classi-
ficacao posterior. Duas abordagens podem ser adotadas com esta
finalidade: pro-
cessamento de multiplas visadas ou processamento multilook, e
filtragem espacial.
A primeira tecnica e incorporada ao processo de geracao da
imagem, enquanto a
39
-
segunda consiste na aplicacao de filtros sobre a imagem ja
formada.
2.1.4.1 Processamento Multilook
O processamento multilook consiste em dividir a abertura da
antena em varias sub-
aberturas, cada qual proporcionando uma visada (look)
independente sobre a su-
perfcie iluminada Figura 2.9. A imagem final e obtida
calculando-se a media entre
as imagens geradas por cada visada (SENSING, 2002).
FIGURA 2.9 - Processamento multilook.FONTE: Sensing (2002).
Embora o processamento multilook seja capaz de reduzir o efeito
do rudo, ele tam-
bem provoca a degradacao da resolucao espacial da imagem,
proporcionalmente ao
numero de visadas escolhido.
2.1.4.2 Filtragem Espacial
Os filtros para reducao de speckle podem ser de dois tipos:
adaptativos ou nao-
adaptativos. As tecnicas nao-adaptativas nao levam em
consideracao propriedades
locais do terreno imageado, bem como caractersticas relacionadas
a natureza do
sensor. Por essa razao, nao sao recomendadas quando se deseja
preservar o maximo
de informacao sobre a imagem de entrada. Sao exemplos conhecidos
de filtros nao-
adaptativos o filtro da Media e o da Mediana.
Nos filtros adaptativos, o grau de suavizacao se adapta a
medidas estatsticas locais
sobre o restroespalhamento do terreno, preservando melhor
detalhes como bordas e
40
-
areas de textura elevada (SENSING, 2002). Diversos metodos de
filtragem tem sido
propostos na tentativa de proporcionar maior reducao de speckle
associada a perda
mnima de informacao, como os filtros de Lee, Frost e RGMAP.
Filtro de Lee. Transforma o modelo multiplicativo em aditivo
atraves de uma lin-
earizacao por expansao em serie de Taylor, aplicada sobre a
multiplicacao
do sinal e do rudo em torno da media, eliminando, assim, a
dependencia
entre o rudo e o valor do pixel (SANTANNA et al., 2001). O sinal
sem rudo
e dado pela soma ponderada do valor do pixel observado (central)
e do valor
da media. O coeficiente de ponderacao e uma funcao da
heterogeneidade
local do alvo, medido atraves do coeficiente de variacao
(SENSING, 2002).
Utiliza estatsticas locais para minimizar o erro quadratico
medio atraves
do filtro de Wiener.
Filtro de Frost. E um filtro convolucional linear, derivado da
minimizacao do erro
quadratico medio sobre o modelo multiplicativo do rudo (SANTANNA
et al.,
2001). Estima-se o valor do sinal livre de speckle utilizando
uma sub-janela
da janela de processamento, cujo tamanho varia em funcao da
heterogenei-
dade local do alvo, medida atraves do coeficiente de variacao
(SENSING,
2002).
Filtro MAP Gama (Maximum a Posteriori Gama). Baseia-se na
premissa
de que o sinal livre de rudo da cena subjacente obedece a
distribuicao
Gama. Assim, o valor do pixel e obtido maximizando-se a funcao
den-
sidade de probabilidade a posteriori (Gama) com relacao ao sinal
real.
Dentro de cenas conhecidamente bem modeladas pela distribuicao
Gama,
como oceanos, florestas e areas agrcolas, e capaz de minimizar a
perda de
informacao textural melhor do que os filtros de Frost e de Lee
(SENSING,
2002).
2.2 Atributos de Textura
A interpretacao e analise de imagens e realizada com base em
atributos espectrais
e espaciais. Entendem-se por espectrais os atributos que
descrevem a tonalidade
(variacao do nvel de cinza) de um dado pixel em uma imagem,
enquanto os atributos
espaciais refletem a distribuicao espacial de tonalidades dentro
de uma regiao da
imagem. Ha dois tipos de relacao espacial: a textura, focada no
objeto de interesse,
41
-
representando sua estrutura; e o contexto, que analisa o objeto
em relacao ao restante
da cena.
Em termos visuais, Tso e Mather (2001) descrevem a textura como
a impressao de
aspereza ou suavidade criada pela variacao de tonalidade ou
repeticao de padroes
atraves de uma superfcie. Segundo Haralick (1979), a textura
esta presente em todo
tipo de imagem, desde aquelas obtidas por satelites e aeronaves
ate microscopicas
imagens de culturas celulares ou amostras de tecido. No contexto
de sensoriamento
remoto, atributos de textura mostram-se eficazes ao atuar como
informacoes auxil-
iares na caracterizacao de classes, melhorando muitas vezes o
resultado da classifi-
cacao.
(a) Padrao regular. (b) Padrao irregular.
FIGURA 2.10 - Exemplos de textura.FONTE: Wu et al. (2000)
A textura tem sido incorporada a classificadores de imagens SAR
na expectativa de
melhorar seu desempenho, especialmente para distinguir objetos
de mesma tonali-
dade ou cor. A crescente importancia e utilidade da textura em
metodos de classi-
ficacao de imagens SAR pode ser observada pelo grande numero de
trabalhos de-
senvolvidos nesta area nos ultimos anos (DOBSON et al., 1997;
KOMAROV et al., 1999;
DEKKER, 2001; GARCIA; PUIG, 2002; FLETCHER; EVANS, 2002; ACQUA;
GAMBA,
2003; KUPLICH et al., 2005; KANDASWAMY et al., 2005).
2.2.1 Metodos para Extracao de Atributos de Textura
As medidas de media e variancia sao definidas como os atributos
mais simples que
podem ser usados para caracterizar texturas de uma dada regiao
(TSO; MATHER,
42
-
2001). E possvel, no entanto, encontrar diferentes padroes de
textura que apresen-
tem a mesma media e variancia, mostrando que estes descritores
nao sao suficientes
para analise textural, e formalismos mais abrangentes sao
necessarios. Neste con-
texto, diversos metodos tem sido propostos na literatura, e
embora nao haja uma
definicao operacional ou formulacao matematica precisa para
quantificar as medidas
de textura de uma imagem, as principais abordagens dividem-se em
quatro catego-
rias: dimensoes fractais e multifractais; matriz de
co-ocorrencia; campo randomico
auto-regressivo multiplicativo; e filtragem no domnio da
frequencia (TSO; MATHER,
2001). A primeira utiliza o conceito de dimensao fractal como
medida para a quan-
tificacao da textura; superfcies complexas (alta dimensao
multifractal) representam
texturas grosseiras, enquanto superfcies simples (suaves)
possuem textura mais fina.
O modelo baseado em matriz de co-ocorrencia define a informacao
textural atraves
da dependencia espacial entre os nveis de cinza de uma imagem.
Em texturas gros-
seiras, observa-se uma ligeira mudanca na distribuicao dos
valores espectrais numa
determinada distancia, enquanto em texturas finas a distribuicao
muda rapidamente.
Nas tecnicas baseadas em campo randomico auto-regressivo
multiplicativo (MAR
Multiplicative Autoregressive Random Fields), a textura e
caracterizada pela uti-
lizacao de estimativas lineares do nvel de cinza de um pixel
relacionado aos nveis
de cinza de sua vizinhanca. Os coeficientes possuem grande
variacao em regioes de
texturas finas, enquanto texturas grosseiras apresentam
coeficientes similares.
Os metodos que aplicam a filtragem no domnio da frequencia tem
apresentado bons
resultados na tentativa de extrair informacoes de textura (TSO;
MATHER, 2001).
Em geral, texturas finas estao associadas a altas frequencias
espaciais, enquanto
em texturas grosseiras as frequencias baixas sao dominantes. Ha
muitos algoritmos
disponveis com o objetivo de transformar dados de imagem do
domnio espacial para
o domnio da frequencia, sendo o mais conhecido deles a
transformada de Fourier,
que decompoe um sinal em um conjunto de funcoes senos e cossenos
com diferentes
frequencias (MYLER; WEEKS, 1993). A metodologia adotada neste
trabalho para
extracao de atributos de textura nas imagens baseia-se na teoria
de filtros Gabor.
Para uma melhor compreensao desta teoria, uma breve descricao da
transformada
de Fourier e da transformada wavelet e apresentada a seguir.
43
-
2.2.2 A Transformada Discreta de Fourier
As transformacoes matematicas sao aplicadas a sinais para
extrair informacoes que
nao sao perceptveis de forma direta (MARTINS, 2003). Uma melhor
visualizacao
dos dados a fim de realcar determinadas caractersticas de
interesse requer, muitas
vezes, a mudanca do domnio temporal ou espacial para o domnio da
frequencia.
Em 1822, com o objetivo inicial de descrever a conducao de calor
e determinar
a distribuicao de temperatura ao longo de uma lamina, o
matematico frances Jean
Baptiste Joseph Fourier criou o conceito de series de Fourier,
mostrando que qualquer
funcao periodica pode ser representada como uma soma de funcoes
trigonometricas.
Desde entao, a analise de Fourier tem revolucionado os mais
diversos campos da
ciencia e engenharia, da radioastronomia a medicina (PRESS et
al., 1992).
Uma extensao a serie de Fourier, a transformada de Fourier
permite representar
funcoes nao-periodicas, ampliando assim a quantidade de
aplicacoes possveis. De
maior relevancia no contexto de processamento digital de
imagens, a versao discreta
da transformada de Fourier (DFT - Discrete Fourier Transform) e
definida sobre
uma grade discreta de pixels de uma imagem I = I(m,n) (SEUL et
al., 2000), de
acordo com a Equacao 2.10.
F (u, v) =1
MN
M1m=0
N1n=0
I(m,n) exp[i2
(umM
+vn
N
)], (2.10)
onde F (u, v) corresponde a representacao no domnio da
frequencia de I(m,n); i =1; u e v sao as amostras correspondentes
em frequencia as amostras espaciais
m e n. A faixa nos dois domnios e a mesma: 0 m M 1, 0 n N 1 e0 u
M 1, 0 v N 1. A DFT inversa e dada por:
I(m,n) =1
MN
M1u=0
N1v=0
F (u, v) exp[i2(umM
+vn
N
)]. (2.11)
O conceito de frequencia em uma imagem pode ser facilmente
interpretado pela
observacao dos detalhes espaciais ali contidos. A Figura 2.11
ilustra o conceito
de frequencia espacial atraves de duas figuras, com conjuntos
periodicos de ondas
quadradas em duas frequencias espaciais distintas. A razao
periodica das listras da
Figura 2.11(a) e de 2 ciclos/cm, contra 1 ciclo/cm na Figura
2.11(a).
44
-
(a) (b)
FIGURA 2.11 - Exemplo de imagens de diferentes
frequencias.FONTE: Adaptado de Myler e Weeks (1993).
A Transformada Rapida de Fourier (FFT Fast Fourier Transform)
consiste
numa implementacao eficiente da DFT, que pelo uso da estrategia
dividir-para-
conquistar4, e capaz de reduzir a complexidade computacional da
DFT da ordem
de N2 para apenas N log2N operacoes (GERSHENFELD, 1999). Em uma
imagem de
1024 x 1024 pixels, isso equivale a um ganho de 10:1 (SEUL et
al., 2000). A trans-
formada de Fourier e normalmente usada para filtragem no domnio
da frequencia
atraves da aplicacao sucessiva da FFT direta e inversa. Na
primeira etapa, a imagem
e transformada para o domnio da frequencia usando a FFT. O sinal
em frequencia
e entao filtrado, e em seguida submetido a FFT inversa para
voltar ao domnio es-
pacial, obtendo assim a imagem modificada. O diagrama em blocos
deste processo
e apresentado na Figura 2.12.
FIGURA 2.12 - Diagrama em blocos do processo de filtragem no
domnio da frequencia.
Em muitas aplicacoes, porem, nao basta conhecer as componentes
em frequencia
contidas no sinal, mas tambem a localizacao no domnio espacial
(ou temporal) em
que ocorre cada uma delas. Isso torna a transformada de Fourier
inadequada para
4No contexto de projeto de algoritmos, a abordagem
dividir-para-conquistar consiste em di-vidir um problema de difcil
solucao sucessivamente em subproblemas menores, resolve-los
recursi-vamente, e entao combinar estas solucoes para encontrar a
resposta para o problema original (AHOet al., 1974).
45
-
tratar sinais do tipo nao-estacionario, ou seja, cujo conteudo
em frequencia varia com
o tempo. Com o intuito de superar esta limitacao, Dennis Gabor,
em 1946, adaptou
a transformada de Fourier para analisar somente uma pequena
porcao de um sinal
de cada vez, criando uma tecnica chamada janelamento (windowing)
do sinal, como
mostra a Figura 2.13. A adaptacao de Gabor, chamada de
Transformada de Fourier
por Janelamento (Short-Time Fourier Transform STFT), mapeia o
sinal em uma
funcao bidimensional de tempo e frequencia (STARCK et al.,
1998).
(a)
(b)
FIGURA 2.13 - Exemplo de transformacao FT e STFT.FONTE: Adaptado
de Misiti et al. (2006).
Embora esta relacao entre a informacao do tempo e a frequencia
obtida pela STFT
seja bastante util, sua precisao e limitada pelo tamanho da
janela, fixo para todo o
conteudo em frequencias. Muitos sinais requerem uma avaliacao
mais flexvel, com
a possibilidade de variar o tamanho da janela para determinar a
relacao entre o
intervalo de tempo e a frequencia com melhor precisao (MISITI et
al., 2006). Nesta
situacao, a transformada wavelet pode ser mais apropriada.
46
-
2.2.3 Wavelets
Atraves da aplicacao de janelas de tempo com tamanhos variaveis
na decomposicao
de um sinal, a analise por wavelets permite o uso de longos
intervalos de tempo para
verificar com mais precisao informacoes de baixa frequencia, ou
de intervalos de
tempo menores quando se deseja maior precisao em informacoes de
alta frequencia
(GERSHENFELD, 1999).
O termo wavelet refere-se a um conjunto de funcoes em forma de
pequenas ondas
geradas por dilatacoes e translacoes de uma funcao simples (t)
denominada wavelet-
mae. A definicao da transformada wavelet contnua (CWT Continuous
Wavelet
Transform) e dada por:
W (a, b) =1a
inf inf
f(t) (t ba
)dx , (2.12)
onde os parametros a(> 0) e b correspondem as informacoes de
escala e posicao,
respectivamente. A Figura 2.14 representa graficamente a
decomposicao de um sinal
por wavelets de escalas e posicoes diferentes.
FIGURA 2.14 - Sinal decomposto em wavelets de diferentes escalas
e posicoes.FONTE: Misiti et al. (2006)
O fator escala esta relacionado com a frequencia do sinal e
consequentemente com
a capacidade da funcao wavelet em identificar detalhes finos ou
grosseiros de um
sinal (MISITI et al., 2006). Pequenas escalas correspondem a
wavelets comprimidas,
capazes de detectar melhor pequenos detalhes e variacoes
rapidas, enquanto escalas
maiores esticam as wavelets, proporcionando melhor representacao
para feicoes
grosseiras e variacoes lentas, como mostra a Figura 2.15.
Depois de consolidada a teoria da transformada wavelet, muitos
pesquisadores
47
-
FIGURA 2.15 - Efeito da alteracao de escala em uma
wavelet.FONTE: Adaptado de Misiti et al. (2006)
comecaram a estudar a aplicacao de wavelets a representacao de
texturas (MAR-
TINS, 2003). Ao avaliar o desempenho de atributos de textura
extrados por difer-
entes transformadas wavelet, incluindo ortogonais e
nao-ortogonais, tipo arvore es-
truturada e transformada de Gabor, Manjunath e Ma (1995)
observaram melhor
representacao para os padroes de teste quando aplicada a
transformada wavelet de
Gabor. A utilizacao de bancos de filtros Gabor para extracao de
atributos de textura
e descrita a seguir.
2.2.4 Filtros Gabor
Pesquisas em psicologia mostram que o cerebro humano realiza uma
analise em
frequencia das imagens, e celulas simples no cortex visual podem
ser modeladas
mediante as funcoes Gabor (CAMPBELL; ROBSON, 1968; DAUGMAN,
1988). Esta
propriedade, associada ao fato de as wavelets Gabor serem melhor
localizadas no
tempo e na frequencia e apresentarem maior numero de parametros,
torna as funcoes
Gabor especialmente apropriadas para a representacao de
caractersticas locais das
imagens (CASTANON, 2003).
Em duas dimensoes, a funcao Gabor g(x, y) e sua transformada de
Fourier G(u, v)
podem ser escritas como:
g(x, y) =
(1
2xy
)exp
[1
2
(x2
2x+y2
2y
)+ i2Wx
], (2.13)
48
-
G(u, v) = exp
{1
2
[(uW )2
2u+v2
2v
]}, (2.14)
onde u = 1/2x e v = 1/2y. As funcoes Gabor formam um conjunto
base
completo (nao-ortogonal), que e usado para expandir o sinal,
obtendo assim sua
descricao em frequencia local. Um banco (ou dicionario) de
filtros Gabor pode ser
construdo atraves de dilatacoes e rotacoes apropriadas da
wavelet mae g(x, y), a
partir da funcao geradora:
gmn(x, y) = amG(x, y), a > 1, m, n = integer , (2.15)
onde:
x = am(x cos + y sin ) , (2.16)
y = am(x sin + y cos ) , (2.17)
onde = n/K e K e o numero total de orientacoes e am e o fator
escala. A
nao-ortogonalidade das wavelets Gabor implica que ha informacao
reduntante nas
imagens filtradas. Para reduzir esta redundancia, Manjunath e Ma
(1996) definem
uma estrategia de geracao de bancos de filtros Gabor,
assegurando que os suportes
de magnitude de pico medio (half-peak) das respostas do banco de
filtros no espectro
de frequencia tangenciem uns aos outros, como mostra a Figura
2.16.
O processo de eliminacao de redundancia e produto da utilizacao
das seguintes
formulas no calculo dos parametros u e v (e, por consequencia, x
e y):
a = (Uh/Ul)1/(S1) , (2.18)
u =(a 1)Uh
(a 1)
2 ln 2, (2.19)
49
-
FIGURA 2.16 - Banco de filtros ortogonais, apos aplicar a
tecnica de eliminacao de redundancia.FONTE: Adaptado de Manjunath e
Ma (1996)
v = tan(
2k
)[Uh 2 ln 2
(2uUh
)][2 ln 2 (2 ln 2)
22uU2h
]1/2, (2.20)
onde Ul e Uh correspondem aos centros inferior e superior de
frequencias de interesse,
S corresponde ao numero de escalas na decomposicao em
multirresolucao, e m =
0, 1, 2, . . . , S 1.
Para construir um banco ou dicionario de filtros, inicialmente e
escolhido um inter-
valo de frequencias de interesse atraves da determinacao de dois
valores de referencia:
frequencia superior e inferior. O segundo passo e determinar o
numero de orientacoes
desejadas e em quantas escalas diferentes o intervalo de
frequencia sera decomposto.
No dicionario de filtros representado pela Figura 2.16, os
parametros usados sao: fre-
quencia superior Uh = 0.4; frequencia inferior Ul = 0.05; 6
orientacoes; e 4 escalas.
2.2.5 Representacao da Textura por Vetores de Atributos
Dada uma imagem I, e o banco de filtros Gabor gmn, a
transformada Gabor em
(x, y) e definida por:
50
-
Wmn(x, y) =
I(x, y)gmn (x x1, y y1)dx1dy1 , (2.21)
onde indica o complexo conjugado. Com a aplicacao de filtros
Gabor sobre ospadroes de textura, a geracao dos vetores de
atributos e realizada atraves do calculo
de medidas estatsticas da imagem filtrada. As medidas
estatsticas utilizadas sao a
media (mn) e o desvio padrao (mn) da magnitude dos coeficientes
da transformada,
definidas por:
mn =
|Wmn(xy)|dxdy , (2.22)
mn =
(|Wmn(xy)| mn)2 dxdy , (2.23)
Para cada filtro aplicado, os dados estatsticos de media e
desvio padrao sao calcu-
lados e concatenados para a formacao do vetor de atributos
daquela textura. Neste
trabalho, foi utilizado um banco de filtros Gabor de quatro
escalas e seis orientacoes.
Desta forma, os vetores de atributos resultantes tem a seguinte
forma:
f = [11111212 . . . 4646] , (2.24)
onde op e op denotam, respectivamente, os valores da media e do
desvio padrao no
estagio o e orientacao p. Um banco de filtros Gabor de quatro
escalas e seis orien-
tacoes possui vinte e quatro filtros para cada medida. Como a
informacao textural
e representada por duas medidas, entao o vetor de atributos
possui quarenta e oito
elementos: dois parametros para cada filtro (MARTINS, 2003).
2.3 Classificadores Baseados em Redes Neurais Artificiais
A classificacao no contexto de sensoriamento remoto consiste em
associar cada objeto
ou pixel de uma area em estudo a um ou mais elementos de um
conjunto de rotulos
definido pelo usuario, convertendo a informacao numerica contida
na imagem a uma
informacao tematica, como um determinado tipo de vegetacao (TSO;
MATHER, 2001).
Este processo pode ser visto como uma funcao de mapeamento, que
constroi uma
51
-
associacao entre os dados brutos e o conjunto de rotulos
definido pelo usuario, como
mostra a Figura 2.17. Uma imagem de sensoriamento remoto
totalmente classificada
e chamada de mapa tematico, pois possibilita a identificacao
geografica das classes
sobre a superfcie imageada. (CROSTA, 1992).
FIGURA 2.17 - O conceito do classificador como uma conexao entre
uma imagem (a esquerda) e umconjunto de rotulos de classe (a
direita).FONTE: Adaptado de Tso e Mather (2001)
Por mais de uma decada, o reconhecimento de padroes em imagens
de sensoriamento
remoto tem se baseado principalmente em tecnicas estatsticas
convencionais, como
os procedimentos de maxima probabilidade e distancia mnima.
Embora as abor-
dagens tradicionais possam apresentar bom desempenho, sua
habilidade geral para
resolver confusoes inter-classes e limitada. Nos ultimos anos,
estrategias alternativas
tem sido propostas, como o uso de redes neurais artificiais,
arvores de decisao e meto-
dos derivados da teoria dos conjuntos nebulosos (Fuzzy Set
Theory) (TSO; MATHER,
2001). A capacidade de reconhecer padroes, mesmo ao lidar com
informacoes rui-
dosas ou incompletas (HAYKIN, 2001), contribui para que as redes
neurais artificiais
possam atuar como ferramentas nos mais diversos tipos de
problemas (FAUSETT,
1994). No contexto de sensoriamento remoto, seu uso vem
crescendo nos ultimos
52
-
dez anos, principalmente para classificacao de imagens (TSO;
MATHER, 2001).
2.3.1 Fundamentos de Redes Neurais Artificiais
O desenvolvimento da teoria de Redes Neurais Artificiais comecou
ha aproximada-
mente 50 anos, motivado pelo desejo de tentar entender e ao
mesmo tempo imitar
o cerebro e algumas de suas habilidades (FAUSETT, 1994). Desde
entao, cientistas
tem se empenhado em criar novas tecnicas, alem de aperfeicoar
aquelas ja existentes,
com o objetivo de expandir as areas de aplicabilidade da
Neurocomputacao. Embora
a plausibilidade biologica dos modelos computacionais seja
considerada por alguns
pesquisadores menos importante do que sua capacidade de
desempenhar as tarefas
desejadas, uma breve introducao sobre as caractersticas basicas
dos sistemas neu-
rais biologicos pode ajudar no entendimento dos principais
fundamentos envolvidos
no projeto de uma rede neural artificial.
Em termos moleculares, o neuronio e a unidade fundamental do
sistema nervoso
central, por ser o componente responsavel por produzir e
conduzir as informacoes que
nele circulam. Os neuronios (ou celulas nervosas) possuem
configuracoes variadas de
acordo com sua funcao e regiao a que pertencem, porem obedecem a
uma estrutura
geral, que consiste de tres componentes basicos, como mostra a
Figura 2.18. O corpo
celular ou soma constitui o nucleo da celula e suas organelas.
Os dendritos consistem
em um grande numero de pequenos prolongamentos do corpo celular,
atraves dos
quais o neuronio recebe estmulos (informacoes) de outros
neuronios a ele associados.
O axonio corresponde ao prolongamento longo e fino que se
ramifica em sua porcao
terminal, atraves da qual o neuronio estabelece conexoes com
outros neuronios. O
axonio pode se originar do corpo celular ou de um dendrito
principal e e onde se
concentra a sada de informacao da celula.
53
-
FIGURA 2.18 - O neuronio e seus principais componentes
O corpo celular (soma) e responsavel por somar os sinais de
entrada. Quando a
entrada recebida e considerada suficiente, o neuronio dispara,
ou seja, transmite
um sinal atraves de seu axonio a outros neuronios. O contato
entre o axonio de um
neuronio e o dendrito de outro, ou seja, uma conexao entre dois
neuronios, denomina-
se sinapse (Figura 2.19). A capacidade de estabelecer tais
contatos e a principal
propriedade dos neuronios, pois e atraves das sinapses que os
neuronios trocam
informacoes, formando a base para a realizacao das funcoes do
sistema nervoso.
FIGURA 2.19 - A sinapse.
O neuronio consiste em um sistema eletroqumico muito pequeno,
porem extrema-
mente complexo, sendo capaz de prover os principais mecanismos
para processa-
mento de informacoes dentro do cerebro humano. Redes neurais
artificiais podem ser
54
-
descritas como sistemas computacionais para processamento de
informacao baseados
em um modelo simplificado do cerebro. Como uma analogia a
constituicao biolog-
ica do cerebro, a unidade fundamental das redes neurais
artificiais consiste em uma
estrutura denominada neuronio artificial ou unidade neuronal. O
neuronio artificial
tem, para fins computacionais, sua geometria reduzida a um
ponto, porem conserva
as caractersticas funcionais basicas do neuronio biologico. O
primeiro modelo de
neuronio artificial conhecido foi desenvolvido em 1943, no
trabalho pioneiro de Mc-
Culloch e Pitts (HAYKIN, 2001). Ele possui, como representado na
Figura 2.20, tres
elementos basicos: um conjunto de sinais de entrada, cada qual
associado a um peso;
um somador (
) para somar os sinais de entrada ponderados pelos pesos de
suas
respectivas sinapses; e uma funcao de ativacao, responsavel pela
ativacao ou nao
da sada do neuronio. Uma rede neural artificial e composta por
um conjunto de
unidades neuronais conectadas entre si, e os pesos associados as
conexoes represen-
tam a informacao usada pela rede para resolver o problema
(FAUSETT, 1994).
FIGURA 2.20 - O neuronio artificial de McCulloch e Pitts.
No cerebro, cada neuronio esta conectado a milhares de outros,
recebendo e proces-
sando, portanto, milhares de entradas diferentes. De acordo com
a maneira como
cada neuronio esta conectado com os outros dentro da rede, ele
se dedica a detec-
tar um conjunto especfico de coisas. Toda essa complexidade nao
e possvel de ser
reproduzida em um modelo de simulacao devido as limitacoes
impostas pela tecnolo-
gia atual, porem a tentativa de atingir plausibilidade
biologica, mesmo atraves de
simplificacoes, pode levar a melhores atributos computacionais.
Em uma rede neural
artificial, as unidades se distribuem na forma de camadas. O
arranjo das camadas e
os padroes de conexoes entre elas determinam a arquitetura da
rede, a qual, como
55
-
no caso dos sistemas biologicos, interfere diretamente no tipo
de tarefa que a rede e
capaz de desempenhar. A Figura 2.21 ilustra os tres tipos de
arquitetura possveis:
camada unica, composta por apenas uma camada de neuronios
aritificiais conectada
a camada que contem os sinais de entrada (Fig. 2.21(a));
multiplas camadas, que
possui entre a entrada e a sada uma ou mais camadas ocultas
(Fig. 2.21(b)); e ca-
mada competitiva, na qual a unidade a ser ativada para um dado
padrao de entrada
e determinada atraves de um processo de competicao (Fig.
2.21(c)).
(a) Camada unica. (b) Multiplas camadas.
(c) Camada competitiva.
FIGURA 2.21 - Exemplos de arquiteturas (ou topologias) de redes
neurais artificiais.
O processo de treinamento ao qual as unidades sao submetidas
tambem varia entre
os diferentes modelos de redes. O treinamento ou aprendizagem
consiste no metodo
usado para ajustar os pesos das conexoes ao longo da
apresentacao dos sinais de
entrada (dados de treinamento), de forma que a rede aprenda a
resolver o problema
em questao. Na aprendizagem supervisionada, o tipo mais comum, o
treinamento
e realizado apresentando-se a rede uma sequencia de vetores de
treinamento ou
padroes, cada qual associado a um vetor de sada desejado,
conhecido como vetor-
alvo. O vetor-alvo representa um professor ou supervisor, que
indica a rede se ela
esta ou nao produzindo a sada correta, determinando o ajuste dos
pesos atraves de
um determinado algoritmo de aprendizagem.
56
-
As redes neurais auto-organizaveis constituem modelos governados
por uma forma
nao-supervivisonada de treinamento, na qual uma sequencia de
vetores de entrada e
fornecida, mas nao ha um supervisor, ou seja, nao sao
especificados vetores-alvo. A
rede modifica os pesos de forma que vetores de entrada similares
sejam associados
a mesma unidade de sada, produzindo um vetor representativo para
cada grupo
formado (FAUSETT, 1994). Alem da arquitetura e do tipo e
aprendizagem, uma
terceira caracterstica que distingue os modelos de redes neurais
artificiais e sua
funcao de ativacao, aplicada sobre a soma dos sinais de entrada
ponderados para
produzir a sada do neuronio. As funcoes de ativacao mais usadas,
identidade, degrau
e sigmoide, estao representadas na Figura 2.22.
(a) Funcao identidade. (b) Funcao degrau.
(c) Funcao sigmoide.
FIGURA 2.22 - Funcoes de ativacao.FONTE: Adaptado de Misiti et
al. (2006).
Nas proximas secoes, sao descritas as propriedades das redes
utilizadas neste tra-
balho.
57
-
2.3.2 Mapa Auto-Organizavel de Kohonen (SOM)
Proposto por Kohonen (1988), o Mapa Auto-Organizavel de Kohonen
e um modelo
de rede neural artificial baseado em competicao, isto e, no qual
a rede deve escolher
uma unica unidade para responder a um dado padrao de entrada. A
Figura 2.21(c)
mostra a topologia da rede SOM, representada em uma grade
bidimensional de
unidades. A camada de entrada e conhecida como cortex sensorial,
por analogia com
a funcao desta area no sistema neural biologico (TSO; MATHER,
2001). A camada de
sada e chamada entao de cortex de mapeamento.
Cada uma das ligacoes entre as camadas de entrada e sada possui
um valor de
peso sinaptico wji onde i e j identificam o neuronio de entrada
e sada, respecti-
vamente. O passo inicial para a criacao de uma rede SOM requer a
definicao dos
parametros topologicos, ou seja, a escolha da quantidade de
unidades nas camadas
de entrada e sada. O numero de unidades de entrada deve ser
igual ao tamanho
do vetor de entrada. Nao ha uma especificacao formal para a
dimensao da grade
bidimesional nm (n,m > 1), embora algumas recomendacoes
possam ser encon-tradas na literatura (HAYKIN, 2001). O processo de
treinamento da rede comeca com
a inicializacao dos pesos sinapticos wji, atribuindo-lhes
valores aleatorios pequenos.
O proximo passo e retirar do espaco de entrada uma amostra x =
{x1, x2, ..., xk},onde k e a dimensao dos dados de entrada. A
distancia euclidiana entre o vetor de
entrada e cada unidade de sada e calculada de acordo com a
Equacao 2.25:
d2j =ki
(xni wnji)2 , (2.25)
onde xni e a entrada submetida ao neuronio i na iteracao n. A
unidade vencedora e
aquela que apresenta o melhor casamento com a entrada x, ou
seja, arg min{d2j}.Os pesos sao entao ajustados usando a formula de
atualizacao:
wn+1ji = wnji +
nj (xni wnji) , (2.26)
onde n corresponde a taxa de aprendizagem da rede, uma funcao
que decresce grad-
ualmente com o tempo (numero de iteracoes). j e a funcao de
vizinhanca centrada
em torno da unidade vencedora j, uma funcao unimodal da
distancia lateral entre
58
-
a unidade vencedora (j) e sua vizinhanca (j), que deve
satisfazer duas exigencias:
j e simetrica em relacao ao ponto maximo definido por d2j = 0;
em outraspalavras, ela alcanca seu valor maximo na unidade
vencedora (j), para a
qual a distancia d2j e nula;
a amplitude de j decresce monotonicamente com o aumento da
distancialateral d2j , decaindo a zero para d
2j; esta e uma condicao necessaria
para a convergencia.
Uma escolha tpica para j e a funcao gaussiana:
j = exp
(d2j
22
), (2.27)
onde o parametro equivale a largura efetiva da vizinhanca
topologica, como
mostra a Figura 2.23; ele mede o grau em que neuronios excitados
na vizinhanca do
vencedor participam do processo de aprendizagem.
FIGURA 2.23 - Funcao de vizinhanca gaussiana.FONTE: Adaptado de
Haykin (2001)
59
-
O processo a partir da etapa de amostragem e repetido ate que
nao sejam observadas
mudancas significativas no mapa de caractersticas, ou ate que se
atinja um numero
maximo predeterminado de iteracoes (HAYKIN, 2001).
2.3.3 Aprendizagem por Quantizacao Vetorial (LVQ)
A Aprendizagem por Quantizacao Vetorial (LVQ - Learning Vector
Quantization)
e um metodo de classificacao de padroes cujo objetivo e refinar
a definicao das
superfcies de decisao entre as classes, explorando informacoes
conhecidas sobre os
padroes de treinamento. Desta maneira, e possvel aplicar o mapa
auto-organizavel
de Kohonen para fazer um arranjo inicial dos pesos e, em uma
etapa posterior,
utilizar a LVQ para fazer um ajuste fino sobre o mapa de
caractersticas e melhorar
a capacidade de classificacao da rede, como mostra o diagrama da
Figura 2.24.
FIGURA 2.24 - Diagrama em blocos da classificacao SOM+LVQ.FONTE:
Adaptado de Haykin (2001)
A rede LVQ consiste em um modelo competitivo supervisionado, que
requer uma
colecao de exemplos de treinamento associados a classes ou
categorias conhecidas. O
conjunto de vetores de pesos relacionado as unidades de sada e
geralmente denom-
inado livro-codigo, e cada membro e chamado palavra-codigo ou
vetor de referencia
da classe representada pela unidade5. Cada padrao de entrada e
associado a classe
dada pela unidade cujo vetor de referencia e o mais proximo (em
medida de distan-
cia euclidiana) do vetor de entrada. O efeito desta associacao
equivale a dividir o
espaco de entrada atraves de um diagrama de Voronoi6, como
mostra a Figura 2.25.
5Os valores iniciais dos pesos correspondem aos valores finais
obtidos pelo algoritmo SOM.Quando a rede LVQ e usada de forma
independente, ou seja, sem um ajuste inicial dos pesos atravesdo
algoritmo SOM, o conjunto inicial de pesos e composto de valores
escolhidos aleatoriamente.
6Dados m pontos em um espaco n-dimensional, o diagrama de
Voronoi e a particao do espacon-dimensional em m regioes
poliedricas, uma regiao para cada ponto pm. Tal regiao e
chamadacelula de Voronoi, e contem todos os pontos que sao mais
proximos de p do que de qualquer outroponto no conjunto (HAYKIN,
2001).
60
-
FIGURA 2.25 - Diagrama de Voronoi envolvendo quatro
celulas.FONTE: Adaptado de Haykin (2001)
A tecnica usada pelo algoritmo LVQ usa a informacao conhecida
sobre as classes
para mover ligeiramente os vetores de Voronoi, a fim de melhorar
a qualidade das
regioes de decisao do classificador (HAYKIN, 2001). Dado um
vetor de entrada x e sua
sada-alvo (classe), o vetor de Voronoi (vetor de referencia) e
movido em direcao a
x se ambos os vetores pertencerem a mesma classe, ou afastado de
x caso contrario.
Isso implica numa pequena mudanca no algoritmo de treinamento em
relacao a
Equacao 2.26 da rede SOM. Supondo que o vetor de Voronoi wc seja
o mais proximo
do vetor de entrada xi, Cwc represente a classe associada ao
vetor de Voronoi wc,
e Cxi represente o rotulo de classe do vetor de entrada xi, a
atualizacao dos pesos
(vetores de Voronoi) ocorre como segue:
SeCwc =Cxi , entao
wn+1c = wnc +
n(xni wnc ) , (2.28)
onde 0 < n < 1.
SeCwc 6=Cxi , entao
wn+1c = wnc n(xni wnc ) . (2.29)
Os outros vetores de Voronoi nao sao modificados. E desejavel
que a constante de
aprendizagem n decresca monotonicamente com o numero de
iteracoes. Apos varios
61
-
passos atraves dos dados de entrada, os vetores de Voronoi
tipicamente convergem
e o treinamento esta completo (HAYKIN, 2001). Uma modificacao
deste algoritmo,
conhecida como LVQ2 (Aprendizagem por Quantizacao Vetorial Tipo
2), estipula
que as correcoes sobre os pesos somente devem ser efetuadas se o
vetor de entrada
x estiver dentro de uma janela definida ao redor do plano medio
entre dois vetores
de Voronoi vizinhos wp e wq pertencentes a classes diferentes. A
largura otima desta
janela deve ser determinada experimentalmente, e depende do
numero de amostras
de treinamento disponveis, embora algumas sugestoes praticas
sejam discutidas em
Kohonen (1990) e Demuth et al. (2006). Neste caso, as seguintes
atualizacoes sao
calculadas:
wn+1p = wnp +
n(xni wnp ) , (2.30)
wn+1q = wnq n(xni wnq ) , (2.31)
caso wp e xi pertencam a mesma classe (Cwp =Cxi), e wq e x,
mesmo apresentando
menor distancia euclidiana, pertencam a classes distintas (Cwq
=Cxi). Analisando
deficiencias contidas no algoritmo LVQ2, Kohonen (1990)
desenvolveu uma terceira
versao para a Aprendizagem por Quantizacao Vetorial (LVQ3), que
introduz uma
regra de atualizacao de pesos extra, aplicada nos casos em que
x, wp e wq pertencam
a mesma classe, ou seja,Cwp =Cxi =Cwq . Esta nova regra e
descrita na equacao
abaixo:
wn+1k = wnk + n(xni wnk ) , (2.32)
onde k{p, q}. O valor da constante e diretamente proporcional ao
tamanho dajanela. Estudos apontam o LVQ3 como o algoritmo que
produz os melhores re-
sultados (KOHONEN, 1990). O sucesso deste modelo em testes
aplicados por Ma e
Manjunath (1996) ao reconhecimento de padroes de texturas
determinou a escolha
do LVQ3 para o presente trabalho.
62
-
2.4 Processamento Paralelo
Desde o surgimento do primeiro computador digital eletronico7, a
computacao pas-
sou por um processo evolutivo intenso, a fim de proporcionar
maior desempenho
e ampliar o leque de aplicacoes que podem ser computacionalmente
resolvidas de
maneira eficiente. A partir da decada de 70, em busca de maior
eficiencia e facil-
idade no processo computacional, novas tecnologias passaram a
ser desenvolvidas,
como a computacao paralela e as redes de computadores (SANTANA
et al., 1997).
Pacheco (1997) define o computador paralelo como simplesmente um
computador
(ou colecao de computadores) com multiplos processadores que
podem trabalhar
juntos na resolucao de um problema unico. Sistemas paralelos e
distribudos tem
se tornado essenciais no contexto do processamento digital de
imagens, em especial
quando os dados sao obtidos por sensoriamento remoto. Esta
necessidade e reforcada
pelo crescente uso de sistemas SAR, cujos sensores apresentam
caractersticas com-
plexas, como polarizacao multipla e capacidades
interferometricas, alem de gerar
grandes quantidades de dados (TAYLOR et al., 1999). Converter
estes dados cada vez
mais amplamente disponveis em informacao efetiva para as
instituicoes responsaveis
por tomadas de decisao tem sido uma grande dificuldade na area
de processamento
de imagens, justificando a necessidade de serem desenvolvidos
sistemas especficos
para a aplicacao que apresentem eficiencia computacional.
Com o aumento da velocidade e confiabilidade das redes de
computadores observado
na ultima decada, torna-se cada vez mais comum a interligacao de
computadores pes-
soais e workstations de maneira eficiente para composicao de
sistemas distribudos.
Clusters denominam maquinas paralelas com arquitetura de memoria
distribuda
representados na forma de um conjunto de computadores
interconectados trabal-
hando juntos, dando ao usuario a impressao de um sistema unico,
apesar da dis-
tribuicao de seus componentes de dados e hardware (BUYYA, 1999).
Estes sistemas
tem sido utilizados para a execucao de programas paralelos, em
substituicao as ar-
quiteturas paralelas, em virtude de seu menor custo e maior
flexibilidade (SANTANA
et al., 1997).
As primeiras ideias relacionadas ao uso de clusters foram
desenvolvidas pela IBM na
decada de 60, conectando grandes mainframes com o objetivo de
proporcionar uma
forma de paralelismo comercial de baixo custo (BUYYA, 1999). O
modelo de clusters
7O primeiro computador eletronico foi projetado em meados de
1940, e recebeu o nome deENIAC (Electronic Numerical Integrator and
Computer).
63
-
denominado Beowulf, desenvolvido pela NASA em 1994, tornou-se um
projeto bem
sucedido e bastante usado atualmente. Esta arquitetura, adotada
para a extracao
de atributos de textura das imagens no presente trabalho, sera
descrita a seguir.
2.4.1 A Arquitetura Beowulf
O projeto Beowulf 8 surgiu em 1994, desenvolvido por Sterling et
al. (1995) com o ob-
jetivo de proporcionar a NASA um sistema que apresentasse
desempenho comparavel
ao das maquinas paralelas, porem a um custo cerca de dez vezes
menor. O primeiro
sistema Beowulf continha 16 processadores Intel 66 MHz 486
executando o sistema
operacional Linux, conectados via rede Ethernet. A necessidade
de um software para
estabelecer a rede de interconexao entre os processadores levou
ao desenvolvimento
de muitos dos drivers Ethernet para Linux ate hoje usados por
milhares de computa-
dores ao redor do mundo para conectarem-se a Internet (BUYYA,
1999). O projeto
obteve aprovacao imediata ao apresentar uma escolha alternativa
para proporcionar
computacao de alto desempenho (HPC - High Performance
Computing).
Com o sucesso do Beowulf original, muitos outros sistemas foram
construdos pelo
CEDIS/NASA (Center of Excellence in Space Data and Information
Sciences), uti-
lizando varias geracoes e famlias de processadores e conexoes de
rede (HSIEH, 2000).
Uma importante caracterstica que distingue os sistemas Beowulf
de outros clusters
e o fato de nao ser imposto ao usuario um modelo de arquitetura
fixo. Uma vez
que os parametros relacionados a custo e desempenho de
equipamentos de hardware
mudam constantemente, as geracoes de sistemas Beowulf evoluem
continuamente
desde sua composicao original, criada em 1994. Embora, em um
nvel mais geral, a
arquitetura tenha permanecido a mesma,