p1102

Estudo da configurao de diferentes arquiteturas de redes neurais artificiais MLP para classificao de imagens pticas

Livia dos Santos Abdalla Carlos Frederico de S Voloto

Instituto Militar de Engenharia IME - Departamento de Engenharia Cartogrfica Praa Gen. Tibrcio, n 80 Urca, Rio de Janeiro - RJ, 22290-270

{[email protected], [email protected]}

Abstract Artificial neural networks (ANN) can be used to produce several products, including remote sensing classification images. ANN may not beat the performance of traditional classification methods, but it is unique in the sense that: 1) it is not dependent on the prior knowledge of statistical model of data; and 2) it makes it possible to add unusual information by the configuration of parameters, input, hidden and output layers. Motivated by the ability to add different levels of information, including spatial and non-spatial data (e.g., Digital Terrain Models, time, date, a given classification or a segmented image), and comparing to classical methods of classification, this work test the use of ANN for image classification. Despite this capability, this work aims to compare the plain classification ability, by means of kappa values and training sets as a reference example when there is no ground truth available. Providing a fare alternative for image classification, the advantages of the potential enhancements are to be studied in future papers. This study explores simple architectures of MLP to identify common themes of land cover and uses, and is based on HRG/SPOT5 images. The results using kappa was 91% indicating that the RNA has achieved a good index of training.

Palavras chaves: remote sensing, artificial neural network, automatic classification, kappa index, sensoriamento remoto, redes neurais artificiais, classificao automtica, ndice kappa.

1.Introduo Existem diversos mtodos para o tratamento de imagens digitais de sensoriamento

remoto que permitem realizar tarefas de manipulao, anlise e compreenso de cenas. O processamento de imagens utiliza pixels como unidade de entrada e sada. A classificao de imagens utiliza pixels como entrada, faz uma anlise dos pixels e gera, como sada, uma nova imagem onde existem agrupamentos que compem classes e pode haver informaes sobre as classes (ZHANG, 2009). Desse modo, tanto a entrada como a sada so imagens e a finalidade principal desse processo obter dos dados as informaes mais facilmente discernveis e identificveis.

As tcnicas de processamento de imagens, segundo NOVO (2010), podem ser categorizadas em trs grupos: tcnicas de pr-processamento, tcnicas de realce e tcnicas de classificao. As tcnicas de classificao consistem no estabelecimento de um processo de deciso, no qual um grupo de pixels definido como pertencente a uma determinada classe. Na classificao de imagens por processamento digital, algoritmos computacionais so utilizados na identificao automtica dos alvos e so baseados em classificadores pixel a pixel ou por regies.

Anais XVI Simpsio Brasileiro de Sensoriamento Remoto - SBSR, Foz do Iguau, PR, Brasil, 13 a 18 de abril de 2013, INPE

8200

A classificao pode ser executada com ou sem reviso. No modo no-supervisionado, a classificao feita com base em mtodos estatsticos de anlise de agrupamento e, durante o procedimento, no h interveno direta do intrprete na definio das classes pertinentes a cena. O modo supervisionado, por sua vez, baseado na coleta de amostras denominadas reas de treinamento, referentes a classes definidas pelo usurio. Os algoritmos de classificao, tanto determinsticos como os probabilsticos, utilizam-se das amostras fornecidas pelo usurio para rotular os pixels de toda a imagem como pertencente a um determinado uso ou cobertura do solo.

Na classificao supervisionada, a utilizao de redes neurais artificiais (RNA) pode ser uma alternativa mais vantajosa que utilizar mtodos estatsticos em certos casos, como quando no h informao prvia sobre a distribuio dos dados ou h possibilidade de incorporar dados adicionais, no espectrais, classificao (CRUZ & GALO, 2003). Como o uso de mtodos baseados no modelo de distribuio da imagem j tm seu uso consagrado pela comunidade, o uso de RNA, pela flexibilidade de permitir adicionar informaes e pela disponibilizao de em tem sido cada vez mais

Nesse contexto, o objetivo do presente trabalho definir um conjunto de parmetros que viabilize uma arquitetura de RNA que adequadamente identifique diferentes feies de uso e cobertura do solo de uma imagem do sensor HRG/SPOT5.

2. Redes Neurais Artificiais Segundo BRONDINO (1999), as RNAs baseiam-se em modelos abstratos do funcionamento do crebro humano e buscam reproduzir sistemas biologicamente realsticos. O sistema de processamento de informaes de uma RNA se assemelha estrutura do crebro humano, pois adquire e armazena conhecimentos atravs do processo de aprendizado, que se d pelas conexes entre neurnios, o que tambm so conhecidas como sinapses. Os neurnios interconectados trabalham em paralelo para classificar e generalizar dados de entrada em classes de sada (RIBEIRO & CENTENO, 2000).

Segundo BRONDINO (1999), esta organizao das camadas de uma RNA (figura 1) que definem sua estrutura topolgica ou sua arquitetura (maneira como os elementos de processamento so organizados). Assim sendo, existem redes neurais de camada simples constitudas por um grupo de neurnios (perceptrons) arranjados em apenas uma camada, e as redes multicamadas, formadas por vrias camadas escondidas ou pela combinao de vrias redes de camadas simples. Nessa estrutura, a camada de entrada aquela na qual os padres so apresentados rede; as camadas intermedirias (tambm chamadas de ocultas ou escondidas) so responsveis por grande parte do processamento, podendo ser consideradas como extratoras de caractersticas; e a camada de sada aquela onde o resultado final apresentado.

Figura 1: Arquitetura de uma RNA com duas camadas escondidas


8201

Uma RNA formada por um conjunto de elementos processadores simples, uma rede de interconexo e uma regra de aprendizado, sendo o processamento feito de forma paralela por cada um dos ns da rede. Assim, as RNAs conhecidas como perceptron multicamadas (MLP, do ingls Multi-Layer Perceptron) so organizadas em camadas conectadas: camada de entrada, uma ou mais camadas intermedirias e camada de sada. Na camada de entrada no ocorre processamento e os dados j preparados so apenas apresentados ao classificador, esta camada se comunica a uma ou mais camadas ocultas onde ocorre o processamento por meio de um sistema de conexes ponderadas. O processo de aprendizagem se concentra nas camadas ocultas da rede. A camada de sada apresenta o resultado do processamento.

feita uma atribuio de pesos aos dados de entrada, o que ir determinar o nvel de ativao da unidade na rede. A magnitude da rede determinada por um processo de treinamento repetitivo, o qual busca a repetio com o intuito de convergir pra um esperado valor de sada conhecido do conjunto de treinamento para cada amostra definida.

O algoritmo de aprendizado mais utilizado para o seu treinamento o algoritmo retro-propagao (backpropagation) (RUMELHART et al., 1986 apud PICOLI, 2006). Seu treinamento supervisionado e baseia-se numa regra de aprendizagem que compensa o erro durante o treinamento (BOCANEGRA, 2002). Na correo, o erro retroalimentado por meio da rede e o ajuste dos pesos feito usando um mtodo recursivo, realinhando em cada iterao os resultados at que num futuro os resultados se aproximem do esperado numa certa tolerncia pr-definida.

O algoritmo backpropagation permite o ajuste de pesos em cada uma das camadas da rede, sendo projetado para minimizar a soma do erro quadrtico entre a sada calculada por uma estrutura multicamadas e a desejada. Durante o treinamento, a inteno que este erro diminua, mas para que isso ocorra, necessrio que os pesos sejam iterativamente ajustados, como explicado. Os primeiros pesos a serem ajustados so os da camada de sada, posteriormente os pesos das camadas anteriores sero ajustados sequencialmente.

Um resultado significativo requer um timo conjunto de treinamento e que o processo de classificao necessita de um ajustamento de vrios parmetros, o que pode restringir sua aplicabilidade (BLASCHKE et al., 2000).

3.Metodologia 3.1. Material

A imagem multiespectral utilizada para a realizao da classificao automtica com RNA foi a do satlite SPOT 5 (figura 2), sensor HRG (High-Resolution Geometric).

As imagens do satlite SPOT possuem aplicaes em diversas reas cientficas e comerciais, no monitoramento de fenmenos e recursos naturais, acompanhamento do uso agrcola das terras, apoio ao monitoramento e definio de reas de preservao, na atualizao de mapas e cartas, entre outros.

As imagens adquiridas no modo multiespectral oferecem resoluo espacial de 10 metros (com exceo da banda do infravermelho mdio com resoluo de 20 metros); e a banda pancromtica com 5 metros.


8202

Figura 2: Composio colorida da imagem SPOT 5

O processamento da imagem foi conduzido no aplicativo IDRISI, cujas funcionalidades so direcionadas s aplicaes em SIG e Processamento Digital de Imagens, e que utiliza como entrada as bandas espectrais e canais oriundos de quaisquer origens. O programa incorpora muitas funcionalidades analticas para imagens, consulta a banco de dados e modelagem espacial (EASTMAN, 1998).

3.2.Arquitetura e Treinamento da Rede Neural As classes de sada foram definidas com base em cinco classes classificadas visualmente e foram compostas da seguinte forma: corpos d gua, culturas diversas, floresta, campo e urbano.

A obteno das reas de treinamento foi realizada atravs da extrao de reas em formato de polgonos da imagem para cada classe a ser classificada, sendo no presente trabalho selecionadas entre 5 a 7 polgonos de tamanhos variados para cada classe. RICHARDS (1993) indica um mnimo de (N+1) amostras para cada classe, sendo o N o nmero de bandas espectrais que integram a imagem utilizada no processo de classificao.

Aps a aquisio das reas de treinamento, foi calculada a resposta espectral mdia do conjunto de treinamento, no qual o programa associa cada pixel da imagem assinatura mais similar (mdulo Makesig). Os conjuntos de treinamento tm que ser definidos num plano de informao vetorial ou como imagem e tm que possuir um identificador inteiro. Para que o referido mdulo possa funcionar, necessita-se indicar tambm as bandas que podero ser usadas na classificao. Neste trabalho foram utilizadas 4 bandas (onde ocorreu uma prvia fuso IHS na banda do infravermelho mdio).

Aps a realizao da seleo e estudo das classes a serem classificadas, que trata da distribuio de cada elemento da imagem a uma das classes previamente selecionadas, foi definida uma arquitetura para a RNA classificar as imagens. Esse procedimento foi executado utilizando o mdulo de classificao por redes neurais artificiais do tipo perceptron multicamadas (MLP), do software IDRISI.

Diversos trabalhos descrevem os aspectos tericos ou a aplicao de RNA na classificao de dados de sensoriamento remoto, e buscando uma classificao


8203

supervisionada, foi adotado um modelo bsico de rede neural com estrutura de mltiplas camadas, treinada com algoritmo backpropagation.

A definio da arquitetura de uma MLP implica na determinao prvia da dimensionalidade dos dados de entrada e das classes de ocorrncia. O nmero de elementos da camada de sada foi definido com base no nmero de classes a serem classificadas na imagem, sendo cinco ns, com valores reconhecidos em virtude do conjunto de treinamento estabelecido nas amostras. Para dimensionar o nmero de camadas escondidas e o nmero de ns que constituem cada camada intermediria, foram realizadas simulaes com diferentes arquiteturas de redes neurais. Essas simulaes constaram, na verdade, do treinamento e anlise do desempenho da rede treinada sobre a anlise do ndice estatstico kappa, conforme descrito por LANDS e KOCH (1977), para cada arquitetura testada. O ndice apresentado aps a classificao pelo mdulo em que a rede neural est implementado, resultando no kappa da classificao em relao ao conjunto de treinamento.

4. Resultados e Discusses Como o presente trabalho surgiu da necessidade de estudar as vantagens de utilizao

de um mtodo pouco explorado que, embora no seja novo, no tem uma grande utilizao no meio dos usurios de sensoriamento remoto como poderia, a despeito da disponibilizao crescente nos aplicativos especializados na rea. O trabalho de VOLOTO e TEIXEIRA (2007) exemplifica um uso diferenciado do modelo para detectar bordas e classificar imagens, indicando o grande potencial que a utilizao de MLP como ferramenta de processamento de imagens de sensoriamento remoto.

Tabela 1: Alguns parmetros utilizados na realizao dos testes

Neurnios RMS n Pixels Camadas Escondidas 1 | 2 Camada

Taxa de Aprendizado Momentum Iteraes

Treinamento | Teste 1 320 2 10 | 3 0.01 0.5 10000 0.001880 | 0.001958 2 320 1 10 | - 0.01 0.5 10000 0.001565 | 0.001591 3 360 2 15 | 5 0.01 0.5 10000 0.001051 | 0.001125 4 360 2 15 | 5 0.02 0.53 10000 0.001049 | 0.001129 5 360 2 15 | 10 0.02 0.53 10000 0.001137 | 0.001197

( Nmero de pixels selecionados para o conjunto de treinamento e teste; durante a busca para o valor mnimo sobre a superfcie de erro evita problemas de oscilao e usado para acelerar o processo de convergncia)

Este trabalho visa, assim, servir como referncia bsica com um nvel de detalhamento e simplicidade que estimulem a utilizao desse modelo. Algumas simplificaes devem ser destacadas: 1) no utilizao de todos os parmetros e recursos possveis numa rede neural; 2) um nmero exaustivo de variantes das configuraes possveis do MLP e todos os seus parmetros; 2) foi utilizada apenas produto de sensor ptico; 3) no foi realizado o teste com grande nmero de imagens variadas e de diferentes regies geogrficas; 4) o estudo limitou-se aos cinco temas apresentados; e 5) apenas utilizou-se como entrada as informaes pixel-a-pixel das bandas multiespectrais, sem informao de contexto; e 6) no foi realizada verificao de campo nem utilizada uma verdade de campo.

Para definio da arquitetura ideal para classificao foram realizados trinta testes, no qual foram realizadas as seguintes alteraes na arquitetura da rede: nmero de camadas; nmero de neurnios nas camadas; nmero do conjunto de pixels para o conjunto de treinamento e teste; fator de momentum e taxa de aprendizado. A tabela 1 apresenta a experimentao dos cinco melhores testes.


8204

Tabela 2: Matriz de Confuso entre as Classes

Massas d'gua Culturas Floresta Campo Urbano Total Erro de Comisso Massas d'gua 722 0 1 7 235 965 25,18%

Culturas 0 1502 0 8 307 1817 17,34% Floresta 6 0 4221 6 183 4416 4,42% Campo 0 0 19 3468 167 3654 5,09% Urbano 2 50 0 1 9253 9306 0,57% Total 730 1552 4241 3490 10145 20989

Erro de Omisso 1,10% 3,22% 0,47% 0,63% 8,79%

Nesse sentido, duas importantes observaes devem ser pontuadas: o aumento do nmero de camadas produziu melhores resultados, sendo o nmero de neurnios da primeira camada superior ao da segunda camada. Mas uma terceira camada no seria justificada pela simplicidade dos fenmenos envolvidos, alm de exigir um nmero muito maior de amostras de treinamento, teste e validao. Dentre as experimentaes apresentadas na tabela, o 4 teste apresentou resultados mais refinados que os demais, sendo possvel chegar a esta constatao a partir da anlise da matriz de confuso dessa classificao (tabela 2), que representa a distribuio de percentagens de pixels classificados correta ou erroneamente (CONGALTON, 1991). A partir da matriz de confuso, o MLP apresentou o ndice kappa para validar o que foi constatado visualmente nas classificaes. Este ndice foi calculado em relao s amostras de treinamento, e obteve o valor de 0,91 o que segundo LANDIS e KOCH (1977) um valor considerado excelente, portanto, satisfatrio para este estudo. Neste trabalho utilizou-se o ndice kappa, para avaliar a acurcia temtica por ser mais sensvel as variaes de erros de omisso e incluso (COHEN, 1960) e pelo seu uso j consagrado pelos especialistas da rea. O seu clculo utiliza, alm dos elementos da diagonal principal, todos os elementos da matriz de erro (MOREIRA, 2001). A cena classificada, resultante da aplicao da arquitetura treinada pela rede neural apresentada na figura 3.

Figura 3: Resultado da classificao baseada na arquitetura de redes neurais artificiais


8205

5. Consideraes Finais Neste trabalho, foi realizada a classificao de imagens de sensoriamento remoto por uma RNA do tipo MLP com o propsito de definir um conjunto de parmetros que melhor identificassem as diferentes feies de uso e cobertura do solo para uma aplicao simples, estabelecendo um parmetro inicial. A adio futura de outros tipos de dados vai exigir um estudo especfico de parmetros, conforme feito neste trabalho, mas exigindo uma busca mais completa e focalizada dos parmetros. Para os dados utilizados, o conjunto de parmetros que apresentou melhor resultado, aps diversos testes, continha duas camadas escondidas, com quinze neurnios na primeira e cinco na segunda camada, e taxa de aprendizado de 0,02 e fator de momentum de 0,53. No dispondo do mapa verdade da regio, o treinamento foi feito pelo algoritmo MLP, onde os ndices kappa foram obtidos a partir da rede neural treinada e das amostras de treinamento. Mesmo com o relevante valor do ndice kappa, houve pequenos erros de classificao observados, os quais se justificam por regies de mistura e fatores ambientais, como o relevo acidentado que causa sombra e culturas intercalares que interferem no padro espectral da imagem. Para refinar o processo e corrigir esses erros pontuais, a suavizao por um filtro que utiliza vizinhana do pixel no contexto da classe vizinha possibilitaria, em tese, uma classificao com menor ndice de confuso. importante salientar a existncia do carter aleatrio de inicializao do conjunto de pesos do processo de MLP, o que no garante a repetibilidade do resultado, a menos que os valores das sementes iniciais sejam registrados. O valor de kappa pode no ser atingido mas pode ser obtido valores ainda melhores em novas instncias, devido ao procedimento de treinamento da rede. Assim, a apresentao do ndice de desempenho da classificao um indicador de que aquela configurao especfica satisfatria. Apesar dessa instabilidade intrnseca ao mtodo, sua flexibilidade na possibilidade de integrao e adio de novos dados, alm da possibilidade constatada neste trabalho de obteno de resultados aceitveis, o torna um mtodo que precisa ser muito mais explorado pela comunidade de sensoriamento.

Agradecimento Os autores agradecem a UFF pelas imagens disponibilizadas pelo laboratrio de Geografia Fsica da UFF (LAGEF/UFF).

Referncias Bibliogrficas

BOCANEGRA, C.W.R. Procedimentos para tornar mais Efetivo o Uso das Redes Neurais Artificiais em Planejamento de Transportes. 2002, 146p. Dissertao (Mestrado em Engenharia Civil Transportes) Escola de Engenharia de So Carlos, Universidade de So Paulo, So Carlos. 2003.

BLASCHKE, T.; LANG, L.; LORUP, E.; STROBL, J.; ZEIL P. Object-Oriented Image Processing in an Integrated GIS/ Remote Sensing Environment and Perspectives for Environmental Applications. Vol. 2, 555-570, 2000.

BRONDINO, N.C.M. Estudo da Influncia da Acessibilidade no Valor de Lotes Urbanos Atravs do Uso de Redes Neurais. 1999, 97p. Dissertao (Doutorado em Engenharia Civil Transportes) Escola de Engenharia de So Carlos, Universidade de So Paulo, So Carlos. 1999.

COHEN, J. A coefficient of agreement for nominal scales. Educational and Psychological Measurement, v. 20, n. 1, p. 37-46, 1960.


8206

CRUZ, N. C; GALO, M. L. B. T. Aplicao de redes neurais artificiais na classificao de imagens multitemporais e multisensor. In: Colquio Brasileiro de Cincias Geodsicas, 3., 2003, Curitiba. Anais. Curitiba: UFPR, 2003. CD-ROM.

EASTMAN, R. J. Traduo Portugus. Hasenack, H.; Weber, E. IDRISI for Windows verso 2. Manual do Usurio. Verso Digital. Introduo; Exerccios Tutoriais. Porto Alegre: Centro de Recursos Idrisi, Brasil, 1998. 218p.

EMBRAPA. Monitoramento por Satlites. 2012. Disponvel em: http://www.sat.cnpm.embrapa.br/conteudo/spot.htm. Acesso em: 15/09/2012.

LANDIS, J.R.; KOCH, G. G. The measurement of observer agreement for categorical data. Biometrics. New York, v. 33, n.1, p.159-174, 1977.

MOREIRA, Maurcio Alves, Fundamentos de Sensoriamento Remoto. So Jos dos campos-SP: INPE, 2001

NOVO, E. M. L. M. Sensoriamento remoto: Princpios e aplicaes. Editora Edgard Blcher LTDA. So Paulo, SP. 2010.

PICOLI, M. C. A. Estimativa da produtividade agrcola da cana-de-acar utilizando agregados de redes neurais artificiais: estudo de caso usina Catanduva. 2006. 90p. (INPE-14669-TDI/1222). Dissertao (Mestrado em Sensoriamento Remoto), Instituto Nacional de Pesquisas Espaciais, So Jos dos Campos: INPE, 2006.

RIBEIRO, S. R. A.; CENTENO J. A. S. Clasificacin del uso del suelo utilizando redes neurales y el algoritmo maxver. Innovacin, Ao 14 n.1, p.55-60. Antofagasta Chile, 2002.

RICHARDS, J. A. Remote Sensing Digital Image Analyses: an introduction. 2. ed. Berlin: Springer-Verlag, 1993. 340p.

VOLOTO, C.F.S.; GELELETE, C. Linear features detection in CCD/CBERS-2 image using neural network. In: XIII Simpsio Brasileiro de Sensoriamento Remoto, pp.1205-1210, So Jos dos Campos, Anais. INPE, 2007.


8207

p1102

Documents