-
Estudo da configurao de diferentes arquiteturas de redes neurais
artificiais MLP para classificao de imagens pticas
Livia dos Santos Abdalla Carlos Frederico de S Voloto
Instituto Militar de Engenharia IME - Departamento de Engenharia
Cartogrfica Praa Gen. Tibrcio, n 80 Urca, Rio de Janeiro - RJ,
22290-270
{[email protected], [email protected]}
Abstract Artificial neural networks (ANN) can be used to produce
several products, including remote sensing classification images.
ANN may not beat the performance of traditional classification
methods, but it is unique in the sense that: 1) it is not dependent
on the prior knowledge of statistical model of data; and 2) it
makes it possible to add unusual information by the configuration
of parameters, input, hidden and output layers. Motivated by the
ability to add different levels of information, including spatial
and non-spatial data (e.g., Digital Terrain Models, time, date, a
given classification or a segmented image), and comparing to
classical methods of classification, this work test the use of ANN
for image classification. Despite this capability, this work aims
to compare the plain classification ability, by means of kappa
values and training sets as a reference example when there is no
ground truth available. Providing a fare alternative for image
classification, the advantages of the potential enhancements are to
be studied in future papers. This study explores simple
architectures of MLP to identify common themes of land cover and
uses, and is based on HRG/SPOT5 images. The results using kappa was
91% indicating that the RNA has achieved a good index of
training.
Palavras chaves: remote sensing, artificial neural network,
automatic classification, kappa index, sensoriamento remoto, redes
neurais artificiais, classificao automtica, ndice kappa.
1.Introduo Existem diversos mtodos para o tratamento de imagens
digitais de sensoriamento
remoto que permitem realizar tarefas de manipulao, anlise e
compreenso de cenas. O processamento de imagens utiliza pixels como
unidade de entrada e sada. A classificao de imagens utiliza pixels
como entrada, faz uma anlise dos pixels e gera, como sada, uma nova
imagem onde existem agrupamentos que compem classes e pode haver
informaes sobre as classes (ZHANG, 2009). Desse modo, tanto a
entrada como a sada so imagens e a finalidade principal desse
processo obter dos dados as informaes mais facilmente discernveis e
identificveis.
As tcnicas de processamento de imagens, segundo NOVO (2010),
podem ser categorizadas em trs grupos: tcnicas de pr-processamento,
tcnicas de realce e tcnicas de classificao. As tcnicas de
classificao consistem no estabelecimento de um processo de deciso,
no qual um grupo de pixels definido como pertencente a uma
determinada classe. Na classificao de imagens por processamento
digital, algoritmos computacionais so utilizados na identificao
automtica dos alvos e so baseados em classificadores pixel a pixel
ou por regies.
Anais XVI Simpsio Brasileiro de Sensoriamento Remoto - SBSR, Foz
do Iguau, PR, Brasil, 13 a 18 de abril de 2013, INPE
8200
-
A classificao pode ser executada com ou sem reviso. No modo
no-supervisionado, a classificao feita com base em mtodos
estatsticos de anlise de agrupamento e, durante o procedimento, no
h interveno direta do intrprete na definio das classes pertinentes
a cena. O modo supervisionado, por sua vez, baseado na coleta de
amostras denominadas reas de treinamento, referentes a classes
definidas pelo usurio. Os algoritmos de classificao, tanto
determinsticos como os probabilsticos, utilizam-se das amostras
fornecidas pelo usurio para rotular os pixels de toda a imagem como
pertencente a um determinado uso ou cobertura do solo.
Na classificao supervisionada, a utilizao de redes neurais
artificiais (RNA) pode ser uma alternativa mais vantajosa que
utilizar mtodos estatsticos em certos casos, como quando no h
informao prvia sobre a distribuio dos dados ou h possibilidade de
incorporar dados adicionais, no espectrais, classificao (CRUZ &
GALO, 2003). Como o uso de mtodos baseados no modelo de distribuio
da imagem j tm seu uso consagrado pela comunidade, o uso de RNA,
pela flexibilidade de permitir adicionar informaes e pela
disponibilizao de em tem sido cada vez mais
Nesse contexto, o objetivo do presente trabalho definir um
conjunto de parmetros que viabilize uma arquitetura de RNA que
adequadamente identifique diferentes feies de uso e cobertura do
solo de uma imagem do sensor HRG/SPOT5.
2. Redes Neurais Artificiais Segundo BRONDINO (1999), as RNAs
baseiam-se em modelos abstratos do funcionamento do crebro humano e
buscam reproduzir sistemas biologicamente realsticos. O sistema de
processamento de informaes de uma RNA se assemelha estrutura do
crebro humano, pois adquire e armazena conhecimentos atravs do
processo de aprendizado, que se d pelas conexes entre neurnios, o
que tambm so conhecidas como sinapses. Os neurnios interconectados
trabalham em paralelo para classificar e generalizar dados de
entrada em classes de sada (RIBEIRO & CENTENO, 2000).
Segundo BRONDINO (1999), esta organizao das camadas de uma RNA
(figura 1) que definem sua estrutura topolgica ou sua arquitetura
(maneira como os elementos de processamento so organizados). Assim
sendo, existem redes neurais de camada simples constitudas por um
grupo de neurnios (perceptrons) arranjados em apenas uma camada, e
as redes multicamadas, formadas por vrias camadas escondidas ou
pela combinao de vrias redes de camadas simples. Nessa estrutura, a
camada de entrada aquela na qual os padres so apresentados rede; as
camadas intermedirias (tambm chamadas de ocultas ou escondidas) so
responsveis por grande parte do processamento, podendo ser
consideradas como extratoras de caractersticas; e a camada de sada
aquela onde o resultado final apresentado.
Figura 1: Arquitetura de uma RNA com duas camadas escondidas
Anais XVI Simpsio Brasileiro de Sensoriamento Remoto - SBSR, Foz
do Iguau, PR, Brasil, 13 a 18 de abril de 2013, INPE
8201
-
Uma RNA formada por um conjunto de elementos processadores
simples, uma rede de interconexo e uma regra de aprendizado, sendo
o processamento feito de forma paralela por cada um dos ns da rede.
Assim, as RNAs conhecidas como perceptron multicamadas (MLP, do
ingls Multi-Layer Perceptron) so organizadas em camadas conectadas:
camada de entrada, uma ou mais camadas intermedirias e camada de
sada. Na camada de entrada no ocorre processamento e os dados j
preparados so apenas apresentados ao classificador, esta camada se
comunica a uma ou mais camadas ocultas onde ocorre o processamento
por meio de um sistema de conexes ponderadas. O processo de
aprendizagem se concentra nas camadas ocultas da rede. A camada de
sada apresenta o resultado do processamento.
feita uma atribuio de pesos aos dados de entrada, o que ir
determinar o nvel de ativao da unidade na rede. A magnitude da rede
determinada por um processo de treinamento repetitivo, o qual busca
a repetio com o intuito de convergir pra um esperado valor de sada
conhecido do conjunto de treinamento para cada amostra
definida.
O algoritmo de aprendizado mais utilizado para o seu treinamento
o algoritmo retro-propagao (backpropagation) (RUMELHART et al.,
1986 apud PICOLI, 2006). Seu treinamento supervisionado e baseia-se
numa regra de aprendizagem que compensa o erro durante o
treinamento (BOCANEGRA, 2002). Na correo, o erro retroalimentado
por meio da rede e o ajuste dos pesos feito usando um mtodo
recursivo, realinhando em cada iterao os resultados at que num
futuro os resultados se aproximem do esperado numa certa tolerncia
pr-definida.
O algoritmo backpropagation permite o ajuste de pesos em cada
uma das camadas da rede, sendo projetado para minimizar a soma do
erro quadrtico entre a sada calculada por uma estrutura
multicamadas e a desejada. Durante o treinamento, a inteno que este
erro diminua, mas para que isso ocorra, necessrio que os pesos
sejam iterativamente ajustados, como explicado. Os primeiros pesos
a serem ajustados so os da camada de sada, posteriormente os pesos
das camadas anteriores sero ajustados sequencialmente.
Um resultado significativo requer um timo conjunto de
treinamento e que o processo de classificao necessita de um
ajustamento de vrios parmetros, o que pode restringir sua
aplicabilidade (BLASCHKE et al., 2000).
3.Metodologia 3.1. Material
A imagem multiespectral utilizada para a realizao da classificao
automtica com RNA foi a do satlite SPOT 5 (figura 2), sensor HRG
(High-Resolution Geometric).
As imagens do satlite SPOT possuem aplicaes em diversas reas
cientficas e comerciais, no monitoramento de fenmenos e recursos
naturais, acompanhamento do uso agrcola das terras, apoio ao
monitoramento e definio de reas de preservao, na atualizao de mapas
e cartas, entre outros.
As imagens adquiridas no modo multiespectral oferecem resoluo
espacial de 10 metros (com exceo da banda do infravermelho mdio com
resoluo de 20 metros); e a banda pancromtica com 5 metros.
Anais XVI Simpsio Brasileiro de Sensoriamento Remoto - SBSR, Foz
do Iguau, PR, Brasil, 13 a 18 de abril de 2013, INPE
8202
-
Figura 2: Composio colorida da imagem SPOT 5
O processamento da imagem foi conduzido no aplicativo IDRISI,
cujas funcionalidades so direcionadas s aplicaes em SIG e
Processamento Digital de Imagens, e que utiliza como entrada as
bandas espectrais e canais oriundos de quaisquer origens. O
programa incorpora muitas funcionalidades analticas para imagens,
consulta a banco de dados e modelagem espacial (EASTMAN, 1998).
3.2.Arquitetura e Treinamento da Rede Neural As classes de sada
foram definidas com base em cinco classes classificadas visualmente
e foram compostas da seguinte forma: corpos d gua, culturas
diversas, floresta, campo e urbano.
A obteno das reas de treinamento foi realizada atravs da extrao
de reas em formato de polgonos da imagem para cada classe a ser
classificada, sendo no presente trabalho selecionadas entre 5 a 7
polgonos de tamanhos variados para cada classe. RICHARDS (1993)
indica um mnimo de (N+1) amostras para cada classe, sendo o N o
nmero de bandas espectrais que integram a imagem utilizada no
processo de classificao.
Aps a aquisio das reas de treinamento, foi calculada a resposta
espectral mdia do conjunto de treinamento, no qual o programa
associa cada pixel da imagem assinatura mais similar (mdulo
Makesig). Os conjuntos de treinamento tm que ser definidos num
plano de informao vetorial ou como imagem e tm que possuir um
identificador inteiro. Para que o referido mdulo possa funcionar,
necessita-se indicar tambm as bandas que podero ser usadas na
classificao. Neste trabalho foram utilizadas 4 bandas (onde ocorreu
uma prvia fuso IHS na banda do infravermelho mdio).
Aps a realizao da seleo e estudo das classes a serem
classificadas, que trata da distribuio de cada elemento da imagem a
uma das classes previamente selecionadas, foi definida uma
arquitetura para a RNA classificar as imagens. Esse procedimento
foi executado utilizando o mdulo de classificao por redes neurais
artificiais do tipo perceptron multicamadas (MLP), do software
IDRISI.
Diversos trabalhos descrevem os aspectos tericos ou a aplicao de
RNA na classificao de dados de sensoriamento remoto, e buscando uma
classificao
Anais XVI Simpsio Brasileiro de Sensoriamento Remoto - SBSR, Foz
do Iguau, PR, Brasil, 13 a 18 de abril de 2013, INPE
8203
-
supervisionada, foi adotado um modelo bsico de rede neural com
estrutura de mltiplas camadas, treinada com algoritmo
backpropagation.
A definio da arquitetura de uma MLP implica na determinao prvia
da dimensionalidade dos dados de entrada e das classes de
ocorrncia. O nmero de elementos da camada de sada foi definido com
base no nmero de classes a serem classificadas na imagem, sendo
cinco ns, com valores reconhecidos em virtude do conjunto de
treinamento estabelecido nas amostras. Para dimensionar o nmero de
camadas escondidas e o nmero de ns que constituem cada camada
intermediria, foram realizadas simulaes com diferentes arquiteturas
de redes neurais. Essas simulaes constaram, na verdade, do
treinamento e anlise do desempenho da rede treinada sobre a anlise
do ndice estatstico kappa, conforme descrito por LANDS e KOCH
(1977), para cada arquitetura testada. O ndice apresentado aps a
classificao pelo mdulo em que a rede neural est implementado,
resultando no kappa da classificao em relao ao conjunto de
treinamento.
4. Resultados e Discusses Como o presente trabalho surgiu da
necessidade de estudar as vantagens de utilizao
de um mtodo pouco explorado que, embora no seja novo, no tem uma
grande utilizao no meio dos usurios de sensoriamento remoto como
poderia, a despeito da disponibilizao crescente nos aplicativos
especializados na rea. O trabalho de VOLOTO e TEIXEIRA (2007)
exemplifica um uso diferenciado do modelo para detectar bordas e
classificar imagens, indicando o grande potencial que a utilizao de
MLP como ferramenta de processamento de imagens de sensoriamento
remoto.
Tabela 1: Alguns parmetros utilizados na realizao dos testes
Neurnios RMS n Pixels Camadas Escondidas 1 | 2 Camada
Taxa de Aprendizado Momentum Iteraes
Treinamento | Teste 1 320 2 10 | 3 0.01 0.5 10000 0.001880 |
0.001958 2 320 1 10 | - 0.01 0.5 10000 0.001565 | 0.001591 3 360 2
15 | 5 0.01 0.5 10000 0.001051 | 0.001125 4 360 2 15 | 5 0.02 0.53
10000 0.001049 | 0.001129 5 360 2 15 | 10 0.02 0.53 10000 0.001137
| 0.001197
( Nmero de pixels selecionados para o conjunto de treinamento e
teste; durante a busca para o valor mnimo sobre a superfcie de erro
evita problemas de oscilao e usado para acelerar o processo de
convergncia)
Este trabalho visa, assim, servir como referncia bsica com um
nvel de detalhamento e simplicidade que estimulem a utilizao desse
modelo. Algumas simplificaes devem ser destacadas: 1) no utilizao
de todos os parmetros e recursos possveis numa rede neural; 2) um
nmero exaustivo de variantes das configuraes possveis do MLP e
todos os seus parmetros; 2) foi utilizada apenas produto de sensor
ptico; 3) no foi realizado o teste com grande nmero de imagens
variadas e de diferentes regies geogrficas; 4) o estudo limitou-se
aos cinco temas apresentados; e 5) apenas utilizou-se como entrada
as informaes pixel-a-pixel das bandas multiespectrais, sem informao
de contexto; e 6) no foi realizada verificao de campo nem utilizada
uma verdade de campo.
Para definio da arquitetura ideal para classificao foram
realizados trinta testes, no qual foram realizadas as seguintes
alteraes na arquitetura da rede: nmero de camadas; nmero de
neurnios nas camadas; nmero do conjunto de pixels para o conjunto
de treinamento e teste; fator de momentum e taxa de aprendizado. A
tabela 1 apresenta a experimentao dos cinco melhores testes.
Anais XVI Simpsio Brasileiro de Sensoriamento Remoto - SBSR, Foz
do Iguau, PR, Brasil, 13 a 18 de abril de 2013, INPE
8204
-
Tabela 2: Matriz de Confuso entre as Classes
Massas d'gua Culturas Floresta Campo Urbano Total Erro de
Comisso Massas d'gua 722 0 1 7 235 965 25,18%
Culturas 0 1502 0 8 307 1817 17,34% Floresta 6 0 4221 6 183 4416
4,42% Campo 0 0 19 3468 167 3654 5,09% Urbano 2 50 0 1 9253 9306
0,57% Total 730 1552 4241 3490 10145 20989
Erro de Omisso 1,10% 3,22% 0,47% 0,63% 8,79%
Nesse sentido, duas importantes observaes devem ser pontuadas: o
aumento do nmero de camadas produziu melhores resultados, sendo o
nmero de neurnios da primeira camada superior ao da segunda camada.
Mas uma terceira camada no seria justificada pela simplicidade dos
fenmenos envolvidos, alm de exigir um nmero muito maior de amostras
de treinamento, teste e validao. Dentre as experimentaes
apresentadas na tabela, o 4 teste apresentou resultados mais
refinados que os demais, sendo possvel chegar a esta constatao a
partir da anlise da matriz de confuso dessa classificao (tabela 2),
que representa a distribuio de percentagens de pixels classificados
correta ou erroneamente (CONGALTON, 1991). A partir da matriz de
confuso, o MLP apresentou o ndice kappa para validar o que foi
constatado visualmente nas classificaes. Este ndice foi calculado
em relao s amostras de treinamento, e obteve o valor de 0,91 o que
segundo LANDIS e KOCH (1977) um valor considerado excelente,
portanto, satisfatrio para este estudo. Neste trabalho utilizou-se
o ndice kappa, para avaliar a acurcia temtica por ser mais sensvel
as variaes de erros de omisso e incluso (COHEN, 1960) e pelo seu
uso j consagrado pelos especialistas da rea. O seu clculo utiliza,
alm dos elementos da diagonal principal, todos os elementos da
matriz de erro (MOREIRA, 2001). A cena classificada, resultante da
aplicao da arquitetura treinada pela rede neural apresentada na
figura 3.
Figura 3: Resultado da classificao baseada na arquitetura de
redes neurais artificiais
Anais XVI Simpsio Brasileiro de Sensoriamento Remoto - SBSR, Foz
do Iguau, PR, Brasil, 13 a 18 de abril de 2013, INPE
8205
-
5. Consideraes Finais Neste trabalho, foi realizada a
classificao de imagens de sensoriamento remoto por uma RNA do tipo
MLP com o propsito de definir um conjunto de parmetros que melhor
identificassem as diferentes feies de uso e cobertura do solo para
uma aplicao simples, estabelecendo um parmetro inicial. A adio
futura de outros tipos de dados vai exigir um estudo especfico de
parmetros, conforme feito neste trabalho, mas exigindo uma busca
mais completa e focalizada dos parmetros. Para os dados utilizados,
o conjunto de parmetros que apresentou melhor resultado, aps
diversos testes, continha duas camadas escondidas, com quinze
neurnios na primeira e cinco na segunda camada, e taxa de
aprendizado de 0,02 e fator de momentum de 0,53. No dispondo do
mapa verdade da regio, o treinamento foi feito pelo algoritmo MLP,
onde os ndices kappa foram obtidos a partir da rede neural treinada
e das amostras de treinamento. Mesmo com o relevante valor do ndice
kappa, houve pequenos erros de classificao observados, os quais se
justificam por regies de mistura e fatores ambientais, como o
relevo acidentado que causa sombra e culturas intercalares que
interferem no padro espectral da imagem. Para refinar o processo e
corrigir esses erros pontuais, a suavizao por um filtro que utiliza
vizinhana do pixel no contexto da classe vizinha possibilitaria, em
tese, uma classificao com menor ndice de confuso. importante
salientar a existncia do carter aleatrio de inicializao do conjunto
de pesos do processo de MLP, o que no garante a repetibilidade do
resultado, a menos que os valores das sementes iniciais sejam
registrados. O valor de kappa pode no ser atingido mas pode ser
obtido valores ainda melhores em novas instncias, devido ao
procedimento de treinamento da rede. Assim, a apresentao do ndice
de desempenho da classificao um indicador de que aquela configurao
especfica satisfatria. Apesar dessa instabilidade intrnseca ao
mtodo, sua flexibilidade na possibilidade de integrao e adio de
novos dados, alm da possibilidade constatada neste trabalho de
obteno de resultados aceitveis, o torna um mtodo que precisa ser
muito mais explorado pela comunidade de sensoriamento.
Agradecimento Os autores agradecem a UFF pelas imagens
disponibilizadas pelo laboratrio de Geografia Fsica da UFF
(LAGEF/UFF).
Referncias Bibliogrficas
BOCANEGRA, C.W.R. Procedimentos para tornar mais Efetivo o Uso
das Redes Neurais Artificiais em Planejamento de Transportes. 2002,
146p. Dissertao (Mestrado em Engenharia Civil Transportes) Escola
de Engenharia de So Carlos, Universidade de So Paulo, So Carlos.
2003.
BLASCHKE, T.; LANG, L.; LORUP, E.; STROBL, J.; ZEIL P.
Object-Oriented Image Processing in an Integrated GIS/ Remote
Sensing Environment and Perspectives for Environmental
Applications. Vol. 2, 555-570, 2000.
BRONDINO, N.C.M. Estudo da Influncia da Acessibilidade no Valor
de Lotes Urbanos Atravs do Uso de Redes Neurais. 1999, 97p.
Dissertao (Doutorado em Engenharia Civil Transportes) Escola de
Engenharia de So Carlos, Universidade de So Paulo, So Carlos.
1999.
COHEN, J. A coefficient of agreement for nominal scales.
Educational and Psychological Measurement, v. 20, n. 1, p. 37-46,
1960.
Anais XVI Simpsio Brasileiro de Sensoriamento Remoto - SBSR, Foz
do Iguau, PR, Brasil, 13 a 18 de abril de 2013, INPE
8206
-
CRUZ, N. C; GALO, M. L. B. T. Aplicao de redes neurais
artificiais na classificao de imagens multitemporais e multisensor.
In: Colquio Brasileiro de Cincias Geodsicas, 3., 2003, Curitiba.
Anais. Curitiba: UFPR, 2003. CD-ROM.
EASTMAN, R. J. Traduo Portugus. Hasenack, H.; Weber, E. IDRISI
for Windows verso 2. Manual do Usurio. Verso Digital. Introduo;
Exerccios Tutoriais. Porto Alegre: Centro de Recursos Idrisi,
Brasil, 1998. 218p.
EMBRAPA. Monitoramento por Satlites. 2012. Disponvel em:
http://www.sat.cnpm.embrapa.br/conteudo/spot.htm. Acesso em:
15/09/2012.
LANDIS, J.R.; KOCH, G. G. The measurement of observer agreement
for categorical data. Biometrics. New York, v. 33, n.1, p.159-174,
1977.
MOREIRA, Maurcio Alves, Fundamentos de Sensoriamento Remoto. So
Jos dos campos-SP: INPE, 2001
NOVO, E. M. L. M. Sensoriamento remoto: Princpios e aplicaes.
Editora Edgard Blcher LTDA. So Paulo, SP. 2010.
PICOLI, M. C. A. Estimativa da produtividade agrcola da
cana-de-acar utilizando agregados de redes neurais artificiais:
estudo de caso usina Catanduva. 2006. 90p. (INPE-14669-TDI/1222).
Dissertao (Mestrado em Sensoriamento Remoto), Instituto Nacional de
Pesquisas Espaciais, So Jos dos Campos: INPE, 2006.
RIBEIRO, S. R. A.; CENTENO J. A. S. Clasificacin del uso del
suelo utilizando redes neurales y el algoritmo maxver. Innovacin,
Ao 14 n.1, p.55-60. Antofagasta Chile, 2002.
RICHARDS, J. A. Remote Sensing Digital Image Analyses: an
introduction. 2. ed. Berlin: Springer-Verlag, 1993. 340p.
VOLOTO, C.F.S.; GELELETE, C. Linear features detection in
CCD/CBERS-2 image using neural network. In: XIII Simpsio Brasileiro
de Sensoriamento Remoto, pp.1205-1210, So Jos dos Campos, Anais.
INPE, 2007.
Anais XVI Simpsio Brasileiro de Sensoriamento Remoto - SBSR, Foz
do Iguau, PR, Brasil, 13 a 18 de abril de 2013, INPE
8207