PREVISAO DO~ INDICE GEOMAGNETICO DST UTILIZANDO …mtc-m16c.sid.inpe.br/col/sid.inpe.br/mtc-m18@80/2009/04.13.13.16/... · vento solar com o campo geomagnético forma a estrutura

INPE-156706-TDI/1471

PREVISAO DO INDICE GEOMAGNETICO DST

UTILIZANDO REDES NEURAIS ARTIFICIAIS E

ARVORE DE DECISAO

Amita Muralikrishna

Dissertacao de Mestrado do Curso de Pos-Graduacao em Computacao Aplicada,

orientada pelos Drs. Jose Demisio Simoes da Silva e Alisson Dal Lago, aprovada

em 13 de fevereiro de 2009.

Registro do documento original:

<http://urlib.net/sid.inpe.br/mtc-m18@80/2009/04.13.13.16>

INPE

Sao Jose dos Campos

2009

http://urlib.net/sid.inpe.br/mtc-m18@80/2009/04.13.13.16

mailto:.net/sid.inpe.br/mtc-m18@80/2009/04.13.13.16

PUBLICADO POR:

Instituto Nacional de Pesquisas Espaciais - INPE

Gabinete do Diretor (GB)

Servico de Informacao e Documentacao (SID)

Caixa Postal 515 - CEP 12.245-970

Sao Jose dos Campos - SP - Brasil

Tel.:(012) 3945-6911/6923

Fax: (012) 3945-6919

E-mail: [email protected]

CONSELHO DE EDITORACAO:

Presidente:

Dr. Gerald Jean Francis Banon - Coordenacao Observacao da Terra (OBT)

Membros:

Dra Maria do Carmo de Andrade Nono - Conselho de Pos-Graduacao

Dr. Haroldo Fraga de Campos Velho - Centro de Tecnologias Especiais (CTE)

Dra Inez Staciarini Batista - Coordenacao Ciencias Espaciais e Atmosfericas (CEA)

Marciana Leite Ribeiro - Servico de Informacao e Documentacao (SID)

Dr. Ralf Gielow - Centro de Previsao de Tempo e Estudos Climaticos (CPT)

Dr. Wilson Yamaguti - Coordenacao Engenharia e Tecnologia Espacial (ETE)

BIBLIOTECA DIGITAL:

Dr. Gerald Jean Francis Banon - Coordenacao de Observacao da Terra (OBT)


Jefferson Andrade Ancelmo - Servico de Informacao e Documentacao (SID)

Simone A. Del-Ducca Barbedo - Servico de Informacao e Documentacao (SID)

REVISAO E NORMALIZACAO DOCUMENTARIA:


Marilucia Santos Melo Cid - Servico de Informacao e Documentacao (SID)

Yolanda Ribeiro da Silva Souza - Servico de Informacao e Documentacao (SID)

EDITORACAO ELETRONICA:

Viveca Sant´Ana Lemos - Servico de Informacao e Documentacao (SID)

[email protected]

INPE-156706-TDI/1471

PREVISAO DO INDICE GEOMAGNETICO DST

UTILIZANDO REDES NEURAIS ARTIFICIAIS E

ARVORE DE DECISAO

Amita Muralikrishna

Dissertacao de Mestrado do Curso de Pos-Graduacao em Computacao Aplicada,

orientada pelos Drs. Jose Demisio Simoes da Silva e Alisson Dal Lago, aprovada

em 13 de fevereiro de 2009.

Registro do documento original:

<http://urlib.net/sid.inpe.br/mtc-m18@80/2009/04.13.13.16>

INPE

Sao Jose dos Campos

2009


mailto:.net/sid.inpe.br/mtc-m18@80/2009/04.13.13.16

Dados Internacionais de Catalogacao na Publicacao (CIP)

Muralikrishna, Amita .K931p Previsao do Indice geomagnetico DST utilizando redes neurais

artificiais e arvore de decisao / Amita Muralikrishna . – Sao Josedos Campos : INPE, 2009.

132p. ; (INPE-156706-TDI/1471)

Dissertacao (Computacao Aplicada) – Instituto Nacional dePesquisas Espaciais, Sao Jose dos Campos, 2009.

Orientadores : Drs. Jose Demisio Simoes da Silva e Alisson DalLago..

1. Redes neurais artificiais. 2. Clima espacial. 3. DST. 4. Tem-pestade magnetica. 5. Arvore de decisao. 5. Perceptron multiplascamadas. 6. Backpropagation I.Tıtulo.

CDU 004.8:550.385.4

Copyright c© 2009 do MCT/INPE. Nenhuma parte desta publicacao pode ser reproduzida, arma-zenada em um sistema de recuperacao, ou transmitida sob qualquer forma ou por qualquer meio,eletronico, mecanico, fotografico, microfılmico, reprografico ou outros, sem a permissao escrita daEditora, com excecao de qualquer material fornecido especificamente no proposito de ser entradoe executado num sistema computacional, para o uso exclusivo do leitor da obra.

Copyright c© 2009 by MCT/INPE. No part of this publication may be reproduced, stored in aretrieval system, or transmitted in any form or by any means, eletronic, mechanical, photocopying,microfilming, recording or otherwise, without written permission from the Publisher, with theexception of any material supplied specifically for the purpose of being entered and executed on acomputer system, for exclusive use of the reader of the work.

“Nas grandes batalhas da vida, o primeiro passo para a vitória é o desejo de vencer.”

Mahatma Gandhi

Dedico este trabalho a meus pais, Murali e Vijaya, meu exemplo,

por quem tenho admiração, gratidão e respeito eternos.

AGRADECIMENTOS

Agradeço aos meus orientadores: ao professor Dr. José Demísio Simões da Silva pela

confiança depositada, pelos ensinamentos e pela oportunidade; ao Dr. Alisson Dal

Lago por ter me apresentado uma nova e fascinante área da ciência, pelos

ensinamentos, acompanhamento e incentivo constantes.

Aos professores da CAP pelos ensinamentos e conversas.

Aos meus amigos, que me contemplam com breves, mas eternos, momentos de alegria:

às minhas amigas-irmãs Salma, Kalyani e Angeli, pela eterna amizade e pelos

conselhos; à minha querida irmã de coração Aline, pela amizade, por me transmitir

tranqüilidade e pelo tempo dedicado a me ajudar neste trabalho; aos meus colegas de

curso e aos meus colegas de sala, pela amizade, por compartilharem seu tempo e suas

experiências, e pelas boas risadas.

Agradeço à minha família, meu bem mais precioso: a meus pais, pela educação e pelo

constante incentivo que me permitiram concluir mais esta etapa dos meus estudos; às

minhas irmãs, Anoopa e Aasita, por existirem, por estarem presentes sempre e pelo

apoio nos momentos que precisei; ao meu esposo Fábio, por me transmitir garra, pela

cumplicidade, por compartilhar comigo todas as nossas conquistas, desde o início. Aos

meus sogros, ao Daniel, ao Leonardo e à Ana Carolina, por terem torcido por mim.

Agradeço a todos que de alguma forma participaram desta fase e permitiram que este

trabalho fosse desenvolvido.

RESUMO

A Terra sofre constante influência da atividade solar através do vento solar, que traz consigo estruturas resultantes, principalmente, de eventos solares como explosões solares e ejeções coronais de massa. A interação quase estática do vento solar com o campo geomagnético forma a estrutura denominada magnetosfera, que funciona como um escudo, que protege o planeta do plasma provindo do Sol. No entanto, em função das características que as estruturas de origem solar adquirem ao longo do meio interplanetário, pode haver penetração de parte dessa matéria para dentro da magnetosfera. Como conseqüência, diversos tipos de distúrbios podem ser gerados no planeta, como, por exemplo, as auroras e as tempestades geomagnéticas, as quais podem ocasionar diversos danos aos sistemas tecnológicos, entre outros prejuízos. Este trabalho aborda a relação entre as características do meio interplanetário durante o avanço de estruturas interplanetárias em direção à Terra e os efeitos sentidos pelo campo geomagnético, como resposta a essas características. O foco principal é a previsão do comportamento do campo geomagnético, medido, neste trabalho, pelo índice geomagnético Dst, levando-se em conta, principalmente, as três coordenadas do campo magnético interplanetário. As ferramentas escolhidas para resolver o problema não-linear foram as técnicas: Rede Neural Artificial do tipo Perceptron de Múltiplas Camadas, treinada com algoritmo backpropagation, Mapa Auto-organizável de Kohonen e Árvore de Decisão com algoritmo J48. Foi possível comprovar algumas relações e questionar a existência de outras com a Árvore de Decisão e prever, com ótimo percentual de eficiência, o índice geomagnético Dst com a Rede MLP.

GEOMAGNETIC DST INDEX FORECAST USING ARTIFICIAL NEURAL NETWORKS AND DECISION TREE

ABSTRACT

The Earth suffers constant influence of the solar activity through the solar wind, which brings with it the resulting structures, mainly phenomena like solar flares and coronal mass ejection. The almost static interaction between the solar wind and the geomagnetic field forms a structure called magnetosphere, which acts as a shield that protects the planet from radiation and solar plasma. However, depending on the characteristics that these structures of solar origin acquire throughout the interplanetary medium, a part of the energy and matter may penetrate into the magnetosphere. As a result, different types of disturbances can be generated on the planet, for example, the aurora and the geomagnetic storms, which can cause damage to various technological systems, among other losses. The present work formulates the relationship between the characteristics of the interplanetary medium during the progress of the interplanetary structures towards the Earth and the effects observed on the geomagnetic field, in response to these characteristics. The main focus is on forecasting the behavior of the geomagnetic field, represented in this work by the Dst index, using for that, mainly, the three interplanetary magnetic field components. The tools chosen here to solve the non-linear problem were the Multi-layer Perceptrons Artificial Neural Network, trained with the backpropagation algorithm; the Kohonen Self-Organizing Map and the Decision Tree with the J48 algorithm. It was possible to establish some relationships and to question the existence of others with the Decision Tree, and predict the geomagnetic Dst index with great percentage efficiency with the Artificial Neural Network.

SUMÁRIO

Pág.

LISTA DE FIGURAS

LISTA DE TABELAS

LISTA DE SIGLAS E ABREVIATURAS

CAPÍTULO 1 INTRODUÇÃO ........................................................................ 25

1.1 Caracterização do problema .................................................................... 25

1.2 Motivação................................................................................................. 26

1.3 Objetivos .................................................................................................. 27

1.4 Métodos ................................................................................................... 27

1.5 Estrutura dos capítulos: ........................................................................... 28

CAPÍTULO 2 A RELAÇÃO SOL-TERRA...................................................... 31

2.1 O Sol ........................................................................................................ 32

2.1.1 A atividade solar.................................................................................... 33

2.2 Os campos magnéticos do Sol e interplanetário ...................................... 36

2.3 Vento Solar .............................................................................................. 37

2.3.1 Estruturas interplanetárias acopladas ao vento solar............................ 38

2.4 Magnetosfera ........................................................................................... 41

2.5 Conseqüências da relação Sol-Terra....................................................... 44

2.5.1 Tempestades Geomagnéticas .............................................................. 47

CAPÍTULO 3 TÉCNICAS DE INTELIGÊNCIA ARTIFICIAL ......................... 51

3.1 Técnicas escolhidas para o estudo de caso ............................................ 51

3.2 Árvores de decisão .................................................................................. 52

3.2.1 Algoritmo da Árvore de Decisão............................................................ 54

3.3 Redes Neurais Artificiais .......................................................................... 58

3.3.1 Perceptrons de Múltiplas Camadas (MLP)............................................ 60

3.3.2 Backpropagation ................................................................................... 64

3.3.3 Mapas Auto-Organizáveis de Kohonen................................................. 67

3.4 Aplicação em Clima Espacial ................................................................... 69

CAPÍTULO 4 DADOS E METODOLOGIA .................................................... 71

4.1 Dados....................................................................................................... 71

4.1.1 Dados interplanetários .......................................................................... 72

4.1.2 Índices geomagnéticos ......................................................................... 75

4.2 Metodologia ............................................................................................. 78

4.2.1 Pré-processamento: interpolação ......................................................... 78

4.3 Experimentos ........................................................................................... 80

4.3.1 Seleção de dados para treinamento e testes........................................ 81

4.3.2 Experimentos com Árvore de Decisão .................................................. 84

4.3.3 Experimentos com Rede Neural MLP ................................................... 85

4.3.4 Experimentos com Mapa de Kohonen .................................................. 89

CAPÍTULO 5 RESULTADOS ........................................................................ 91

5.1 Árvore de Decisão com algoritmo J48 ..................................................... 91

5.1.1 Resultado DT I: utilizando Bx, By e Bz ................................................... 92

5.1.2 Resultado DT II: Bx, By e Bz com variação nos dados........................... 94

5.1.3 Resultado DT III: utilizando Bz e Vp ....................................................... 97

5.1.4 Resultado DT IV: utilizando Bz .............................................................. 98

5.1.5 Resultado DT V: Bz e Dst .................................................................... 100

5.1.6 Outros experimentos........................................................................... 102

5.2 RNA MLP com algoritmo backpropagation ............................................ 103

5.2.1 Resultado MLP I: previsão com 1 hora de antecedência .................... 103

5.2.2 Resultado MLP II: previsão com 2 horas de antecedência ................. 112

5.2.3 Comparação de Resultados obtidos com a rede MLP ........................ 113

5.3 Mapa Auto-Organizável de Kohonen ..................................................... 114

CAPÍTULO 6 CONCLUSÕES.......................................................................119

6.1 Sugestões para trabalhos futuros .......................................................... 121

REFERÊNCIAS BIBLIOGRÁFICAS...............................................................123

LISTA DE FIGURAS

1.1. Magnetosfera, camada quase estática formada pela interação do vento

solar com o campo magnético da Terra. ................................................... 26

2.1. Diagrama dos os três principais tipos de fenômenos que afetam o

geoespaço, constituindo o Clima Espacial. ............................................... 32

2.2. Estrutura do interior solar e atmosfera. ..................................................... 33

2.3. O surgimento e evolução de um grupo de manchas solares, de acordo com

a rotação do Sol, observada por um dos instrumentos a bordo do satélite

SOHO........................................................................................................ 34

2.4. À esquerda, as órbitas da Terra, da Lua, do satélite ACE em torno do

ponto L1 (em harmonia com a órbita da Terra) e as distâncias entre elas e

em relação ao Sol (ilustração fora de escala). À direita, uma ilustração do

satélite SOHO. .......................................................................................... 35

2.5. Imagem capturada em 28 de Junho de 2000 por um dos instrumentos a

bordo do SOHO, o EIT, mostra duas proeminências (lado direito superior).

.................................................................................................................. 35

2.6. Representação do fluxo do vento solar a partir do Sol. No detalhe, o

encontro com um “obstáculo” interplanetário que interfere na direção do

fluxo........................................................................................................... 38

2.7. Evento registrado em imagens seqüenciais de 4 (quatro) instrumentos a

bordo do SOHO. ....................................................................................... 40

2.8. Ilustração do campo geomagnético aproximado por um dipolo. ............... 42

2.9. Representação artística da interação vento solar – magnetosfera. .......... 43

2.10. A magnetosfera e suas regiões............................................................... 43

2.11. Ilustração dos principais efeitos causados pela influência da atividade

solar na Terra............................................................................................ 46

2.12. Corrente de Anel representada pela estrutura toroidal em torno da Terra

(ilustração), formada durante um distúrbio geomagnético, e a ocorrência de

auroras nos pólos...................................................................................... 48

2.13. As fases da tempestade magnética que foi registrada em 6 de novembro

de 2001. .................................................................................................... 49

3.1 Árvore de Decisão gerada pelo algoritmo ID3 para os dados da TABELA

3.1. ............................................................................................................ 58

3.2. Neurônio biológico e seus componentes................................................... 59

3.3. RNA do tipo Perceptrons Múltiplas Camadas (à direita), e a estrutura

interna de seus neurônios (à esquerda).................................................... 60

3.4. Modelo de neurônio do tipo perceptron..................................................... 60

3.5. Função de ativação limiar. ........................................................................ 61

3.6. Funções de ativação: logística (a) e tangente hiperbólica (b). .................. 62

3.7. Exemplo de SOM unidimensional. ............................................................ 68

4.1. Dados dos parâmetros de plasma em duas resoluções............................ 73

4.2. Dados dos parâmetros do IMF em três resoluções................................... 73

4.3. As linhas tracejadas delimitam: em (a), os gaps ocorridos nos dados de

plasma, aproximadamente 1,5 dia até a fase principal da tempestade; em

(b), o trecho com o comportamento das componentes do IMF nas horas

que antecedem a fase principal da tempestade geomagnética. ............... 75

4.4. Índice Dst durante o mês de Julho de 2000. Uma super-tempestade é

observada entre os dias 14, 15 e 16, quando o índice é reduzido a valores

próximos de -300 nT. ................................................................................ 77

4.5. Índice Dst no mês de Outubro de 1999. Entre os dias 22 e 23,

aproximadamente, observa-se a ocorrência de uma tempestade

geomagnética, em que a fase principal chegou a valores menores que -

200 nT. ...................................................................................................... 77

4.6. Preenchimento de gaps. Neste exemplo, o mesmo gap (de

aproximadamente uma hora), no sinal da temperatura de prótons, é

preenchido em duas resoluções, uma horária e a outra de 64 segundos. 79

4.7. Preenchimento de gap para a resolução de 4 minutos. ............................ 79

4.8. Atenuação do sinal da componente Bx do IMF nas duas resoluções

(64segundos e 1 hora). ............................................................................. 80

4.9. Cálculo de média flutuante para atenuação do sinal da componente Bz. . 80

4.10. Índice Dst de alguns dos eventos de tempestades geomagnéticas

utilizados como dados de treinamento das ferramentas. .......................... 82

4.11. Exemplo de mês completo utilizado para testes. .................................... 82

4.12. Arquitetura utilizada para a RNA MLP..................................................... 87

5.1. Resultado I-a: mês de Setembro de 1999............................................... 104

5.2. Resultado I-b: mês de Outubro de 2000. ................................................ 105

5.3. Resultado I-c: mês de Outubro de 2000.................................................. 106

5.4. Resultado I-d: mês de Setembro de 2002............................................... 107

5.5. Resultado I-e: mês de Abril de 2000. ...................................................... 108

5.6. Resultado I-f: mês de Setembro de 2002................................................ 109

5.7. Resultado I-g: mês de Outubro de 2000. ................................................ 110

5.8. Resultado I-h: mês de Outubro de 2000. ................................................ 111

5.9. Resultado II: mês de Outubro de 2000. .................................................. 112

5.10. Exemplo da representação de um cluster. ............................................ 115

5.11. Clusters para entradas Bz...................................................................... 116

5.12. Parte dos clusters gerados para entradas By. ....................................... 117

LISTA DE TABELAS

2.1. Características do vento solar ................................................................... 37

3.1. Base de dados utilizada no exemplo “Saturday morning”. ........................ 57

4.1. Períodos de meses completos e dias de eventos isolados utilizados como

conjunto de dados nas fases de treinamento e teste nas técnicas. .......... 83

4.2. Combinações de parâmetros de entrada utilizados nos classificadores. .. 84

4.3. Identificação dos conjuntos de classes, com os devidos critérios e rótulos,

para os valores nominais do índice Dst utilizados no algoritmo J48. ........ 85

4.4. Faixas e passos variados para os testes para definição do número de

neurônios nas camadas ocultas e número de iterações na fase de

treinamento. .............................................................................................. 86

5.1. Exemplo de Matriz de Confusão e sua estrutura....................................... 92

5.2. Parte das regras geradas pelo treinamento I. ........................................... 93

5.3. Matriz de Confusão gerada com o conjunto de treinamento I. .................. 93

5.4. Matriz de Confusão gerada com o conjunto de teste I. ............................. 93

5.5. Parte do conjunto de regras gerados no treinamento IIa........................... 94

5.6. Matriz de Confusão gerada com o conjunto do treinamento IIa. ............... 95

5.7. Matriz de Confusão gerada com o conjunto do teste IIa. .......................... 95

5.8. Parte das regras geradas no treinamento IIb. ........................................... 96

5.9. Matriz de Confusão gerada no treinamento IIb. ........................................ 96

5.10. Matriz de Confusão gerada no teste IIb................................................... 96

5.11. Parte do conjunto de regras gerados no treinamento III.......................... 97

5.12. Matriz de Confusão gerada com o conjunto do treinamento III. .............. 98

5.13. Matrizes de Confusão geradas no 1º (a) e no 2º(b) testes III. ................. 98

5.14. Matriz de Confusão gerada pelo treinamento IV. .................................... 99

5.15. Parte do conjunto de regras do treinamento IV. ...................................... 99

5.16. Matrizes de Confusão geradas no 1º (a) e no 2º(b) testes IV................ 100

5.17. Conjunto completo de regras geradas no treinamento V. ..................... 101

5.18. Matriz de Confusão gerada no treinamento V. ...................................... 101

5.19. Matrizes de Confusão geradas no 1º (a) e no 2º (b) testes V................ 101

5.20. Subconjunto de regras ‘confusas’. ........................................................ 102

5.21. Resultado I-a: Medidas para análise da qualidade do resultado. .......... 104

5.22. Resultado I-b: Medidas para análise da qualidade do resultado. .......... 105

5.23. Resultado I-c: Medidas para análise da qualidade do resultado. .......... 106

5.24. Resultado I-d: Medidas para análise da qualidade do resultado. .......... 107

5.25. Resultado I-e: Medidas para análise da qualidade do resultado. .......... 108

5.26. Resultado I-f: Medidas para análise da qualidade do resultado. ........... 109

5.27. Resultado I-g: Medidas para análise da qualidade do resultado. .......... 111

5.28. Resultado I-h: Medidas para análise da qualidade do resultado. .......... 111

5.29. Resultado II: Medidas para análise da qualidade do resultado. ............ 113

5.30. Valores representativos do decréscimo de Bz nos instantes que

antecedem a ocorrência de tempestades intensas ou super-tempestades.

................................................................................................................ 116

5.31. Valores representativos do decréscimo de By nos instantes que

antecedem a ocorrência de tempestades moderadas e intensas (ou super-

tempestades). ......................................................................................... 117

LISTA DE SIGLAS E ABREVIATURAS

Dst Disturbance Storm Time – índice geomagnético

DT Decision Tree (Árvore de Decisão)

IMF Interplanetary Magnetic Field (Campo Magnético Interplanetário)

MLP Multilayer Perceptron (Perceptron de Múltiplas Camadas)

nT Nano Tesla: unidade de medida de intensidade de campo magnético. 1 Nano-Tesla = 109 Tesla:

RNA Rede Neural Artificial

SOM Self Organizing Map (Mapa Auto-Organizável)

25

CAPÍTULO 1 INTRODUÇÃO

1.1 Caracterização do problema

As técnicas de Inteligência Artificial (IA) têm sido aplicadas em estudos

multidisciplinares, abrangendo as mais diversas áreas de conhecimento, como

uma opção de abordagem para a solução de problemas que têm no seu

contexto a não-linearidade, a imprecisão, e outras características difíceis de

serem solucionadas com modelos computacionais convencionais. Neste

trabalho, algumas técnicas de IA serão aplicadas sobre um estudo de

fenômenos do Clima Espacial, envolvidos na relação Sol-Terra, investigando as

possíveis relações existentes entre as estruturas provenientes da atividade

solar e a ocorrência de distúrbios magnéticos na Terra, conhecidas como

tempestades geomagnéticas.

O Clima Espacial é a área que estuda os processos e efeitos envolvidos na

influência do Sol sobre os planetas do sistema solar. Como um coadjuvante

deste processo está o meio interplanetário, que se inclui no espaço dominado

pelo campo magnético solar, e por onde se propagam estruturas, denominadas

estruturas interplanetárias, formadas de plasma e matéria que se originam dos

eventos resultantes da atividade solar. No caminho que estas estruturas

percorrem, junto com um fluxo contínuo chamado vento solar, que parte do Sol

em direção ao meio interplanetário, elas encontram uma barreira formada pelo

campo magnético da Terra, que desvia grande parte dessa matéria, formando

uma estrutura quase estática chamada magnetosfera. Essa interação e a

formação da magnetosfera são ilustradas na FIGURA 1.1.

A magnetosfera, devido à sua interação com o vento solar, possui

características próprias que servem de palco a processos físicos que ocorrem,

por exemplo, quando é injetada matéria ionizada para o seu interior. O

processo principal que contribui com a entrada de matéria para dentro da

magnetosfera é a chamada reconexão magnética, que ocorre entre linhas de

26

campos magnéticos de diferentes topologias, como é o caso do campo

magnético interplanetário e o da Terra. A reconexão ocorre como uma fusão

entre linhas de campo que estão em direções opostas e implica na

transferência de matéria de um meio para o outro. Essa situação é a principal

desencadeadora de tempestades geomagnéticas, em outras palavras,

distúrbios no campo magnético da Terra, os quais podem provocar

conseqüências prejudiciais para a vida humana. Alguns dos prejuízos que

podem ser causados pela ocorrência de tempestades geomagnéticas de

grande intensidade são: interferências em sistemas de comunicação e de

energia elétrica, danos em sensores e em sistemas de navegação e controle

de satélites, entre outros. Estudos da previsão de tempestades geomagnéticas

buscam oferecer um alerta que permita a tomada de medidas e ações que têm

como intuito amenizar os efeitos que podem ser sentidos por esses eventos.

FIGURA 1.1. Magnetosfera, camada quase estática formada pela interação do vento solar com o campo magnético da Terra.

FONTE: Solar and Heliospheric Observatory Homepage (2008).

1.2 Motivação

Estudos anteriores, como Kugblenu et al. (1999) e Lundstedt (1997) abordaram

a previsão de tempestades geomagnéticas utilizando as Redes Neurais

Artificiais de diferentes arquiteturas, focando a previsão de períodos

perturbados.

27

A motivação para este trabalho foi desenvolver um sistema de previsão de

índice geomagnético Dst (do inglês, Disturbance Storm Time) para períodos

perturbados e períodos calmos, para um período completo de um mês.

1.3 Objetivos

O objetivo geral deste trabalho é utilizar técnicas de IA, para investigar as

possíveis relações existentes, não ignorando as relações já comprovadas,

entre as características de plasma e de campo magnético interplanetário -

medidas quando estruturas interplanetárias se aproximam da magnetosfera - e

o consequente comportamento do campo geomagnético, medido por índices

geomagnéticos.

Uma das intenções é a exploração desses dados para buscar informações

ainda não conhecidas na área.

O foco principal é a previsão do índice geomagnético Dst, principalmente

durante a ocorrência de tempestades geomagnéticas, sem descartar períodos

calmos.

1.4 Métodos

A primeira técnica empregada foi a Árvore de Decisão, uma das técnicas

utilizadas em aplicações de Data Mining, com o algoritmo J48, integrado ao

software WEKA (Weka, 2008). O intuito era de buscar regras pertinentes

relacionadas à ocorrência de tempestades geomagnéticas de alta intensidade,

observando dados de plasma e campo magnético interplanetário, instantes

antes da observação dos distúrbios.

A próxima técnica aplicada foi a Rede Neural Artificial do tipo Perceptron

Múltiplas Camadas, utilizada como ferramenta para realizar a previsão do

comportamento geomagnético, através do índice geomagnético Dst, tanto em

períodos calmos como nos perturbados - durante a ocorrência de tempestades

geomagnéticas.

28

A terceira técnica foi o Mapa Auto-organizável de Kohonen, com o qual se

buscou verificar as relações causa-efeito, sendo os dados de plasma e de

campo magnético interplanetário classificados como causas e o índice

geomagnético Dst, instantes adiante, como o efeito.

1.5 Estrutura dos capítulos:

O conteúdo abordado nos próximos capítulos segue a seguinte estrutura:

CAPÍTULO 2 – CLIMA ESPACIAL: Este capítulo introduz a área de Clima

Espacial, com enfoque na relação Sol-Terra, descrevendo brevemente a

atividade solar e os efeitos sentidos desde a formação da magnetosfera até a

perturbação do campo geomagnético. É apresentada a instrumentação

envolvida na coleta dos dados utilizados no trabalho.

CAPÍTULO 3 – TÉCNICAS DE INTELIGÊNCIA ARTIFICIAL: O capítulo faz

uma breve revisão sobre as técnicas de inteligência artificial escolhidas para

essa aplicação, descrevendo as suas particularidades e algoritmos, bem como

as principais equações e termos que os compõem.

CAPÍTULO 4 – DADOS E METODOLOGIA: Este capítulo descreve todas as

medições que compõem os dados utilizados no trabalho, citando as unidades

de medida, os formatos, as diferentes resoluções nas quais se encontram e os

dados selecionados para a aplicação. O capítulo também explica e exemplifica

a fase de pré-processamento realizada para alterar resoluções ou atenuar

sinais. São descritas as etapas de treinamento e teste de cada técnica,

juntamente com o conjunto de dados utilizados em ambas as fases e a relação

dos conjuntos de parâmetros de cada experimento realizado.

CAPÍTULO 5 – RESULTADOS: Neste capítulo serão exibidos os principais

resultados obtidos nos experimentos citados no CAPÍTULO 4. Será realizada a

comparação de alguns deles com os obtidos por outros trabalhos.

29

Simultaneamente, serão realizadas algumas análises estatísticas dos

resultados obtidos.

CAPÍTULO 6 – CONCLUSÕES: Por fim, este capítulo apresentará as principais

conclusões sobre a dissertação como um todo bem como fará algumas

sugestões para trabalhos futuros.

30

31

CAPÍTULO 2 A RELAÇÃO SOL-TERRA

Por volta de 1960, começaram a ser desenvolvidos equipamentos que

possibilitam uma observação mais detalhada da Terra, da atividade solar e da

influência do Sol nos planetas do meio interplanetário. A área que estuda os

processos físicos envolvidos, as causas e as conseqüências dessa interação,

foi denominada recentemente de Clima Espacial.

Clima Espacial foi definido como “... a área do conhecimento que engloba as

observações in situ e sensoriamento remoto do geoespaço, do meio

interplanetário e do Sol, possibilitando uma visão global de seus processos

físicos...”. (Dal Lago, 2004)

A variabilidade do Clima Espacial dá-se pela influência que o Sol exerce nos

planetas que fazem parte do Sistema Solar, principalmente nos mais próximos

a ele, como é o caso da Terra. Neste último caso, é comum utilizar a

terminologia “relação Sol-Terra”. Essa influência pode ser resumida em três

principais fenômenos que partem do Sol, os quais se caracterizam pelas

energias envolvidas, pelo seu tempo de propagação até a Terra, pela duração

de seus efeitos e pelos impactos gerados. A FIGURA 2.1 relaciona esses

fenômenos e descreve suas características.

Neste trabalho, o fenômeno abordado é o que causa tempestades

geomagnéticas. Os outros tipos podem interferir em eventuais situações que

serão citadas, como é o caso da falha na coleta de dados causada pela

aceleração de partículas de alta energia em direção aos instrumentos de

coleta, ilustrada no segundo fenômeno da FIGURA 2.1.

32

FIGURA 2.1. Diagrama dos os três principais tipos de fenômenos que afetam o geoespaço, constituindo o Clima Espacial.

FONTE: Adaptado de Dal Lago (2004).

2.1 O Sol

O Sol é uma estrela de, aproximadamente, 696 mil km de raio, 2 x 1030 kg de

massa e é constituído, principalmente, de hidrogênio (em torno de 90%) e hélio

(em torno de 10%). Em função de suas características e processos físicos, a

33

atmosfera solar é, por convenção, dividida em três grandes regiões, as quais

estão representadas na FIGURA 2.2 (Priest, 1995). São elas:

a) Fotosfera, com temperatura da ordem de 5800 K;

b) Cromosfera, com temperatura no intervalo de 4300 a 106 K;

c) Coroa, acima da Cromosfera e sem limite exterior, apresenta uma

temperatura da ordem de 106 K.

FIGURA 2.2. Estrutura do interior solar e atmosfera.

FONTE: Priest (1995).

2.1.1 A atividade solar

O Sol é um corpo gasoso que está em constante atividade, a qual envolve

processos físicos que se iniciam no núcleo e resultam em eventos que podem

ser observados nas camadas externas, como por exemplo a camada visível

(fotosfera). A atividade solar é caracterizada, principalmente, pelo surgimento e

a evolução de manchas solares (sun spots) (FIGURA 2.3), devido à ocorrência

34

de explosões solares, com liberação de energia, e ejeções coronais de massa,

que expelem o plasma solar em direção ao meio interplanetário (FIGURA 2.5).

FIGURA 2.3. O surgimento e evolução de um grupo de manchas solares, de acordo com a rotação do Sol, observada por um dos instrumentos a bordo do satélite SOHO.


Desde a década de 1970 existem estudos voltados à observação da atividade

solar através de imagens coletadas por satélites como o SOHO1 – “Solar and

Heliospheric Observatory”, lançado em Dezembro de 1995 (Hundhausen,

1997). O SOHO tem sua órbita em harmonia com a da Terra, em volta do Sol,

em torno de um ponto chamado primeiro Lagrangeano (L1). O ponto L1

encontra-se a, aproximadamente, 1,5 milhões km da Terra (quase quatro vezes

a distância da Lua), e a, aproximadamente, 148,5 milhões km do Sol, onde as

forças gravitacionais da Terra e do Sol se compensam a ponto de manter o

instrumento em um ponto semi-estável (Bruckneer et al., 1995). A FIGURA 2.4

ilustra a localização do ponto L1 e dos satélites que têm a sua órbita em torno

deste ponto. A FIGURA 2.5 mostra uma imagem do Sol capturada por um dos

instrumentos a bordo do SOHO.

O estudo da atividade solar observou uma periodicidade, com duração média

de 11 (onze) anos, denominada de ciclo solar de 11 anos. A sua duração é

estimada pela observação de vários fenômenos solares, entre eles o número

de manchas solares na fotosfera, que denotam mudanças no campo magnético

solar (Burlaga, 1995).

1 SOHO é um projeto de cooperação internacional entre ESA e NASA.

35

FIGURA 2.4. À esquerda, as órbitas da Terra, da Lua, do satélite ACE em torno do ponto L1 (em harmonia com a órbita da Terra) e as distâncias entre elas e em relação ao Sol (ilustração fora de escala). À direita, uma ilustração do satélite SOHO.

FONTES: Advanced Composition Explorer Homepage (2008) e Solar and Heliospheric Observatory Homepage (2008)

FIGURA 2.5. Imagem capturada em 28 de Junho de 2000 por um dos instrumentos a bordo do SOHO, o EIT, mostra duas proeminências (lado direito superior).


36

2.2 Os campos magnéticos do Sol e interplanetário

O campo magnético do Sol é complexo, não é confinado somente à sua

vizinhança, e é transportado pelo vento solar em direção ao meio

interplanetário, percorrendo toda a Heliosfera2, junto com a matéria e a energia

resultantes de eventos que ocorrem no Sol. Essa extensão do campo

magnético do Sol é chamada de campo magnético interplanetário ou IMF (do

inglês, Interplanetary Magnetic Field) (Parks, 1991).

O IMF é uma grandeza vetorial, normalmente descrita por três componentes

(Bx, By e Bz). Existem dois sistemas naturais de coordenadas, sendo um deles

com referência no plano da eclíptica3 (GSE) e o outro com referência à

orientação do eixo de dipolo magnético da Terra (GSM). Este último é o mais

conveniente para os objetivos deste trabalho. O sistema GSM possui o eixo x

na direção Sol-Terra, crescente em direção ao Sol; o plano x-z contém o eixo

de dipolo geomagnético; e a direção y completa o sistema de coordenadas de

acordo com a regra da mão direita (Mc Pherron, 1995).

Quando duas linhas de campo de polaridades opostas se aproximam, elas

podem "se fundir" ou "se reconectar", processo que foi chamado de “reconexão

magnética" (Dungey,1961), que pode resultar, dependendo do meio em que se

encontram, na transferência de energia e massa para dentro da magnetosfera.

Tal processo é o que melhor se aplica a algumas dinâmicas envolvidas na

Física Solar-Terrestre.

A interação entre o IMF e o campo magnético da Terra pode levar a uma série

de distúrbios no campo magnético e na atmosfera do nosso planeta,

evidenciando a importância do Sol como um dos principais forçantes dos

fenômenos de escala global da Terra.

2 Heliosfera – é a região dominada pelo campo magnético solar. 3 eclíptica – plano no qual a Terra realiza a sua órbita.

37

2.3 Vento Solar

O vento solar, na região próxima à eclíptica, é um fluxo supersônico, de

velocidade em torno de 400 km/s, de plasma ionizado que se move radialmente

a partir do Sol (Burlaga,1995). Dependendo das estruturas que carrega, pode

levar de 2 a 5 dias para percorrer a distância de 1UA4.

As características do vento solar podem ser analisadas antes deste chegar à

Terra devido à coleta de dados realizada por um outro satélite que, igual ao

SOHO, tem a sua órbita em torno do ponto L1. Trata-se do ACE (Advanced

Composition Explorer), que foi lançado em Agosto de 1997 (Stone et al., 1998).

A TABELA 2.1 apresenta as propriedades do vento solar observadas em uma

das medições do satélite ACE, próximo à órbita da Terra.

TABELA 2.1. Características do vento solar

Densidade de prótons 6.6 cm-3 Densidade de elétrons 7.1 cm-3

Densidade de He++ 0.25 cm-3 Velocidade 450 km/s

Temperatura de prótons 1.2 x 105 K Temperatura de elétrons 1.4 x 105 K

Campo magnético 7nT

FONTE: Adaptado de Hundhausen, 1995.

A primeira evidência indireta da existência do vento solar é datada de 1951,

quando Ludwig Biermann, através de observações da cauda de cometas,

percebeu que uma segunda cauda mais tênue se formava radialmente ao Sol.

O que se via era que a poeira cometária estava na direção anti-solar, ou seja,

tornava-se clara a existência de um fluxo permanente de gás ionizado

originado no Sol que causava esta variação (Goldstein, 1998). Mais tarde, um

4 UA (Unidade Astronômica): distância média entre a Terra e o Sol, que equivale a aproximadamente 1,5×108 km

38

modelo teórico para o Vento Solar foi proposto estimando quais seriam suas

características (Parker, 1958). A existência de um fluxo contínuo foi confirmada

em 1962 com as primeiras medidas in situ (Brandt,1970).

2.3.1 Estruturas interplanetárias acopladas ao vento solar

O vento solar pode carregar consigo estruturas resultantes de eventos que

ocorrem no Sol devido a diversos processos físicos internos. Alguns destes

eventos estão relacionados à rotação do Sol, a qual faz com que o fluxo

liberado e as linhas de campo magnético também acompanhem a rotação,

porém mais lentamente, formando um espiral, como mostra a FIGURA 2.6

(Burlaga, 1995). A FIGURA 2.6 ainda mostra o vento solar como o fluxo que

parte do Sol e que arrasta consigo uma parte do campo magnético do Sol, que

passa a constituir o campo magnético interplanetário.

FIGURA 2.6. Representação do fluxo do vento solar a partir do Sol. No detalhe, o encontro com um “obstáculo” interplanetário que interfere na direção do fluxo.

FONTE: Adaptado de Institute of Geophysics and Planetary Physics (2008).

39

As estruturas que mais aparecem associadas à ocorrência das tempestades

magnéticas na Terra são as ejeções coronais de massa (CMEs, do inglês

Coronal Mass Ejections), emissões de plasma, observadas na coroa do Sol

(Gosling et al., 1990,1991). E um dos eventos que acontecem com mais

freqüência são os flares ou labaredas solares, também conhecidas como

explosões solares, caracterizados pela liberação de energia em regiões ditas

ativas, que se tornam visíveis na fotosfera (Hannah et al., 2008).

A FIGURA 2.7 mostra um exemplo de evolução de um evento registrado por

diferentes instrumentos a bordo do satélite SOHO, o qual se origina em um

grupo de machas solares, que evoluem para um flare, em seguida para uma

CME observada 14 horas depois, e finalmente para uma enorme nuvem

magnética 3 horas depois.

As estruturas que se originam no Sol podem sofrer alterações nas suas

características ao percorrerem o meio interplanetário. Por exemplo, as CMEs

têm um conjunto de características quando são observadas por coronógrafos5

e outras quando estão lançadas no meio interplanetário, quando são chamadas

de ICMEs (do inglês, Interplanetary Coronal Mass Ejection), quando são

medidas junto com as características do vento solar. As enormes quantidades

de matéria liberada pelas CMEs em direção ao meio interplanetário possuem

características bastante distintas do vento solar normal quando observadas nas

proximidades da Terra (Neugebauer e Goldstein, 1997).

Dentre as manifestações interplanetárias das CMEs solares, as mais

importantes do ponto de vista geomagnético são as Nuvens Magnéticas

(Burlaga et al., 1981), uma classe de ICMEs, por possuírem fortes

componentes de campo magnético anti-paralelo ao campo geomagnético,

proporcionando maior eficiência na transferência de sua energia para dentro da

magnetosfera terrestre (Gonzalez et al., 1999).

5 Coronógrafos: instrumentos a bordo de satélites que obtêm imagens da atmosfera solar, através da simulação de eclipse no disco solar.

40

FIGURA 2.7. Evento registrado em imagens seqüenciais de 4 (quatro) instrumentos a bordo do SOHO.


É comum observar as CMEs se propagando desde o Sol até a Terra com

velocidade superior à do vento solar normal, produzindo uma onda de choque,

que pode produzir efeitos de compressão e intensificação do campo magnético

do vento solar, tornando-o eficiente para causar tempestades geomagnéticas

intensas (Tsurutani et al., 1988, Tsurutani et al., 1992). Da mesma forma,

outros efeitos de compressão de nuvens magnéticas, como os causados pela

sua interação com feixes rápidos originados de buracos coronais, podem

aumentar significativamente a eficiência em causar tempestades

geomagnéticas (Fenrich e Luhmann, 1998, Dal Lago et al., 2001, Dal Lago et

al., 2002).

41

Os eventos complexos, em que mais de uma estrutura interplanetária está

envolvida, são os mais comuns, principalmente para a ocorrência de super-

tempestades geomagnéticas, que são tempestades geomagnéticas de maior

intensidade. Estes eventos tornam-se importantes porque muitas vezes o

choque causado pela chegada das outras estruturas intensifica a situação de

perturbação pré-existente (Gonzalez et al., 2002).

2.4 Magnetosfera

A influência do vento solar sobre a Terra é constante e pode ser sentida ou não

no planeta. A ocorrência e a intensidade destes efeitos são ditadas pelas

características das estruturas formadas durante a atividade solar e a sua

propagação no meio interplanetário. De acordo com essas características,

estes processos podem ser imperceptíveis para a vida na Terra ou causar

fenômenos e mudanças que se tornam visíveis, ou até mesmo prejudiciais,

para as atividades no planeta.

Grande parte da matéria e energia das estruturas provenientes do Sol é

desviada pelo campo magnético da Terra, e a parte não desviada pode

penetrar no planeta de variadas formas.

O campo magnético da Terra (ou campo geomagnético) pode ser aproximado

por um dipolo magnético alinhado com o eixo de rotação (FIGURA 2.8) e é

formado por correntes que fluem no núcleo do planeta. (Jacobs, 1991)

É dito que o fluxo de plasma do vento solar é congelado ao IMF e o plasma

terrestre ao campo geomagnético, ou seja, o movimento dessas matérias fica

limitado ao dos campos magnéticos aos quais estão congelados, e vice-versa,

separando os plasmas das duas regiões distintas (Parks, 1991). Desta forma, a

influência do vento solar no campo magnético da Terra se restringe à interface

entre este e uma região ao redor do planeta, denominada magnetosfera.

42

FIGURA 2.8. Ilustração do campo geomagnético aproximado por um dipolo.

FONTE: Divisão de Geofísica Espacial (2008).

A magnetosfera terrestre é, portanto, uma cavidade formada pela interação do

campo magnético da Terra com o plasma que compõe o vento solar, onde os

processos físicos são dominados pelo campo geomagnético (Hughes, 1995). O

campo geomagnético atua como um escudo para a forte pressão exercida pelo

vento solar. Este, por possuir uma velocidade supersônica, ao aproximar-se da

Terra, encontra aquele como um obstáculo em seu percurso, produzindo uma

onda de choque (bow shock) em frente à magnetosfera (Russel, 1995).

A interação vento solar – magnetosfera (FIGURA 2.9) pode ser considerada

quase estática, pela presença constante do vento solar. A magnetosfera,

portanto, é assimétrica, comprimida em uma face e alongada na outra direção,

formando o que se chama de cauda magnética, caracterizada pelas linhas de

campo geomagnético esticadas, como se pode observar na FIGURA 2.10. Esta

região se estende até distâncias maiores do que 200 RE6 e serve como um

reservatório de energia do vento solar, que depois é dissipada na região

auroral e na magnetosfera interna (Parks, 1991). A FIGURA 2.10 ilustra a

magnetosfera e a composição de sua estrutura, resultado da sua interação com

o vento solar.

6 1RE equivale a um raio terrestre e mede aproximadamente 6.350 km (Lucas, 2005).

43

FIGURA 2.9. Representação artística da interação vento solar – magnetosfera.

FONTE: Adaptado de Instituto de Geofísica de La UNAM (2008).

FIGURA 2.10. A magnetosfera e suas regiões.

FONTE: Adaptado de RSI (2008).

A direção do IMF, juntamente com a velocidade do vento solar, é um dos

fatores controladores da entrada de energia na magnetosfera, que é

responsável pela ocorrência de tempestades e subtempestades magnéticas

(Gonzalez e Tsurutani, 1987, Gonzalez et al. 1994). Quando o IMF tem a

mesma direção do campo geomagnético, na fronteira entre os dois, pouco

plasma ou energia do vento solar entra na magnetosfera. No entanto, quando

TERRA SOL

VENTO SOLAR

44

os dois campos têm direções opostas, ocorre uma fusão magnética destes

campos e a energia e o plasma que passam através da fronteira. Trata-se do

fenômeno de reconexão magnética, processo citado anteriormente (Dungey,

1961; Gonzalez et al., 1994; Kamide et al., 1998).

No processo de reconexão magnética, a matéria congelada ao campo

magnético é liberada, resultando, no caso da relação entre o IMF e o campo

magnético da Terra, na transferência da energia trazida pelo vento solar para o

interior da magnetosfera. Parte do fluído entra na magnetosfera, e boa parte

dele é desviada para as laterais, sem entrar. Quando há a entrada de energia

na magnetosfera, os processos descritos, juntamente com outros processos

físicos, formam, por fim, na região equatorial da Terra, uma estrutura conhecida

como corrente de anel, a qual consiste de uma corrente equatorial composta de

íons e elétrons. Durante tempestades magnéticas, sua intensidade é

fortemente aumentada. (McPherron,1995)

A reconexão magnética pode acontecer tanto na parte frontal da magnetosfera

(lado diurno) como na cauda a, aproximadamente, 100 RE. Em ambos os

processos, há a transferência de matéria do vento solar para o interior da

magnetosfera. A dinâmica e as características deste fluxo desencadeiam dois

importantes processos na Terra: as tempestades magnéticas e as

subtempestades (associadas à ocorrência de auroras).

2.5 Conseqüências da relação Sol-Terra

O Sol é a principal fonte de energia para a Terra e as radiações que emite

podem influenciar vários processos ou sistemas no planeta. A principal

conseqüência da relação Sol-Terra é o distúrbio geomagnético, que pode ou

não causar prejuízos, dependendo da sua intensidade. Os sistemas de

transmissão de energia elétrica e de comunicação, por exemplo, mostraram-se

vulneráveis à influência solar. Foram também observados danos em sensores

e sistemas de controle, de navegação e comando de satélites (Simpson, 2003,

Tsurutani et al., 1997). Além destes prejuízos, astronautas ficam expostos

45

durante operações fora das espaçonaves (Joselyn, 1998). A FIGURA 2.11

reúne ilustrações dos principais efeitos da atividade solar sobre atividades

humanas no espaço e solo.

A intensidade de um distúrbio geomagnético pode ser especificada por uma

série de índices geomagnéticos. A característica e a intensidade desse

distúrbio e a latitude em que ocorre influenciam na escolha do índice

geomagnético mais apropriado (Tascione, 1994). Os índices mais utilizados

são:

a) Kp e Ap, em latitudes médias;

b) AU, AL e AE, na zona auroral;

c) Dst, Sym e Asy, no Equador.

O índice Dst é o mais utilizado na identificação e na previsão de tempestades

geomagnéticas.

46

FIGURA 2.11. Ilustração dos principais efeitos causados pela influência da atividade solar na Terra.


47

2.5.1 Tempestades Geomagnéticas

As variações sofridas pelo campo geomagnético como resposta à penetração e

dinâmica da matéria proveniente do plasma interplanetário dentro da

magnetosfera são resultados do desencadeamento de alguns processos

internos, como, por exemplo, a formação ou intensificação da chamada

corrente de anel (Gonzalez et al. 1994).

A tensão magnética gerada pelos campos que recém sofreram a reconexão

magnética na cauda da magnetosfera (processo descrito na Seção 2.4)

desencadeia uma série de processos físicos que envolvem partículas

carregadas, que resulta na formação da corrente de anel (estrutura toroidal

presente na FIGURA 2.12). Esta corrente faz diminuir a intensidade do campo

magnético terrestre e um aumento na sua intensidade é o primeiro indicador de

uma tempestade magnética (Tsurutani e Gonzalez, 1998). O comportamento

da corrente de anel é o que determina as características de uma tempestade

magnética, que é avaliada através do estudo da injeção, do transporte e da

perda das partículas carregadas que a constituem (Burton et al., 1975 e

Liemohn et al. 2001).

Uma tempestade magnética pode ser entendida, portanto, como um aumento

na densidade de energia das partículas que compõem a corrente de anel

equatorial. (Kamide et al., 1997)

A intensidade de uma tempestade é bem definida pelo índice Dst, o qual é

derivado de quatro estações de magnetômetros7 de baixa latitude, distribuídas

estrategicamente, nas cidades de Hermanus (África do Sul), Honolulu (Havaí,

EUA), Kakioka (Japão) e San Juan (Porto Rico).

7 Magnetômetros – são instrumentos usados para medir características como a intensidade, a direção e o sentido de campos magnéticos que estejam próximos a eles (Primdhal, 1979).

48

FIGURA 2.12. Corrente de Anel representada pela estrutura toroidal em torno da Terra (ilustração), formada durante um distúrbio geomagnético, e a ocorrência de auroras nos pólos.

FONTE: NASA Goddard Space Flight Center (2008).

A classificação das tempestades quanto à intensidade dos seus efeitos na

corrente de anel é feita através do índice Dst. Para eventos com -100 < Dst < -

50 nT, diz-se que as tempestades magnéticas são de intensidade moderada,

enquanto que aquelas em que o mínimo do Dst é inferior a -100 nT são

classificadas como tempestades magnéticas intensas (Gonzalez et al., 1994).

No grupo das intensas, considera-se ainda um grupo caracterizado por valores

extremamente negativos do Dst, classificadas como super-tempestades

magnéticas ou tempestades magnéticas muito intensas. Os valores de Dst

superiores a -30 nT geralmente são associados a distúrbios fracos ou a

ausência de distúrbio.

A FIGURA 2.13 mostra, em um exemplo de evento, as fases nas quais uma

tempestade magnética está dividida. Geralmente, há um início súbito, quando

há ocorrência de um choque, acumulando campo magnético e plasma na frente

da magnetosfera. Esta fase é chamada de fase inicial da tempestade (indicada

por I na FIGURA 2.13) e é seguida pela fase principal. A fase principal de uma

tempestade (indicada por II na FIGURA 2.13) é caracterizada pela maior

injeção de energia na corrente de anel, causada pela intensificação do

processo de reconexão na magnetosfera diurna. Logo em seguida, surge a

49

fase de recuperação (indicada por III na FIGURA 2.13), onde cessa o fluxo do

vento solar para dentro da magnetosfera (Tascione, 1994).

50 100 150 200 250 300-300

-250

-200

-150

-100

-50

0

50

Horas

nT

índice Dstíndice Dstíndice Dstíndice Dst

FIGURA 2.13. As fases da tempestade magnética que foi registrada em 6 de novembro de 2001.

Durante muitos anos estudou-se a forma como as características do meio-

interplanetário controlavam o desenvolvimento das tempestades magnéticas,

com o objetivo de buscar critérios e formas de se prever, com um período

maior de antecedência, a ocorrência das mesmas, a fim de que seus efeitos

pudessem ser amenizados.

Os eventos de tempestades magnéticas intensas geralmente aparecem

associados com estruturas interplanetárias complexas (Gonzalez et al., 2002).

Nos casos em que ocorrem inúmeros flares e em seguida múltiplas CMEs, os

quais, conseqüentemente, causam múltiplos choques, observa-se um grande

número de compressões de campo e de plasma, que resultam em tempestades

com mais de duas fases principais (Kamide et al., 1998, Vieira et al.,2001). Bell

I II III

50

et al. (1997) encontraram que a maioria das super-tempestades é marcada por

aumentos súbitos do nível de Dst.

A fim de se determinar se havia alguma dependência visível da ocorrência de

tempestades magnéticas em relação ao ciclo solar de 11 anos. Gonzalez et al.

(1994) fizeram um estudo concluindo que há uma distribuição de pico duplo,

com um aumento logo antes e um aumento logo após o pico do ciclo de

manchas solares.

Bell et al. (1997) também fizeram uma análise com super-tempestades durante

os anos de 1932 e 1995 e encontraram que a ocorrência desta classe de

tempestades dá-se, principalmente, na fase descendente do ciclo solar.

51

CAPÍTULO 3 TÉCNICAS DE INTELIGÊNCIA ARTIFICIAL

A área de Inteligência Artificial (IA) tem como um dos objetivos tentar simular

em modelos computacionais características presentes no comportamento

racional humano, na tentativa de gerar resultados próximos aos que um

humano geraria, com as vantagens de tempo, robustez e confiabilidade que um

sistema computacional pode oferecer. A IA se difere da computação

convencional por lidar com situações incertas, desconhecidas ou inexatas,

ambientes com os quais um humano lida freqüentemente. Um dos processos

simulados por algumas das técnicas de IA é o aprendizado por experiência, o

qual será o principal foco deste trabalho.

A IA é utilizada em diversas áreas, como: medicina (e.g., Andrade, 1999),

engenharia (e.g., Bianchi et al., 2007), negócios (e.g., O’Leary, 1997), entre

outras; executa vários tipos de tarefas, entre elas: reconhecimento de padrões,

processamento de sinais, processamento de imagens, controle e previsão,

realizadas por diversas técnicas, como Sistemas Especialistas, Lógica Difusa

(ou Fuzzy), Algoritmos Genéticos, Redes Neurais Artificiais, Árvore de Decisão,

entre outras.

Uma das áreas que optou pela utilização das técnicas de IA como ferramenta é

a de Clima Espacial, que a viu como uma opção de exploração de medições,

paralelamente aos estudos físicos dos diversos processos envolvidos na área.

Algumas aplicações de IA em Clima Espacial serão descritas na Seção 3.4

deste capítulo.

3.1 Técnicas escolhidas para o estudo de caso

O comportamento do campo magnético da Terra depende de uma série de

processos que envolvem, principalmente, as características do vento solar e do

campo magnético interplanetário e os processos internos que se desencadeiam

na magnetosfera, quando há a transferência de matéria e energia para o seu

52

interior. No entanto, não se tem certeza ainda de quais são os principais

elementos que ditam esse comportamento e sob quais condições.

Com o intuito de realizar a previsão do comportamento geomagnético e

investigar os parâmetros interplanetários que estariam mais ligados à

ocorrência de tempestades geomagnéticas, o presente trabalho observou duas

técnicas de IA como opções de aplicação:

a) Rede Neural Artificial do tipo Perceptron de Múltiplas Camadas,

treinada com o algoritmo backpropagation, para a previsão do índice

geomagnético Dst;

b) Árvore de Decisão, algoritmo J48, para buscar regras na ocorrência

das tempestades geomagnéticas, e

c) Mapa Auto-Organizável de Kohonen, para verificar a influência de

alguns parâmetros interplanetários na ocorrência de tempestades

geomagnéticas.

As duas primeiras técnicas utilizam o treinamento do tipo supervisionado,

durante o qual dados já observados, junto aos respectivos valores de resposta,

são apresentados. Já o Mapa de Kohonen utiliza treinamento do tipo não-

supervisionado, em que não são apresentadas à rede saídas desejadas.

3.2 Árvores de decisão

A Árvore de Decisão (DT – Decision Tree) é um algoritmo de classificação

supervisionada em que um dos resultados consiste em um conjunto de regras

encadeadas do tipo “SE � ENTÃO”, que formam uma estrutura hierárquica

semelhante à de uma árvore. Trabalha em cima de uma base de dados e

determina a classe, com base nos atributos de entrada. Os componentes desta

estrutura, basicamente, são:

53

a) Nós: regras que testam os valores (ou atributos);

b) Folhas: a classificação em si.

A tarefa da DT é, portanto, mapear um conjunto de dados já rotulados, ou seja,

descobrir o melhor conjunto de regras que leva àquela classificação, para em

seguida aplicar as regras descobertas em valores desconhecidos e assim

classificá-los.

Os dados utilizados na DT são rotulados, ou seja, cada uma das instâncias

(padrões) lidas pelo algoritmo já tem uma classe pré-definida. Estas instâncias

são compostas, além do rótulo, por um ou mais atributos, os quais podem ser

entendidos como parâmetros de entrada. Quanto maior o número de atributos,

maior a possibilidade de uma árvore com mais nós e folhas, por gerar um maior

número de combinações entre eles.

A execução da DT consiste em duas etapas:

1ª) Treinamento: Um conjunto de instâncias (compostos de um ou mais

atributos) rotuladas é apresentado ao algoritmo e este tem a tarefa de

elaborar as melhores regras que mapeiem os atributos de entrada aos

seus respectivos rótulos (atributos-classe);

2ª) Teste: O conjunto de regras formado no treinamento é aplicado em

instâncias não apresentadas na primeira etapa.

Durante as duas etapas é possível analisar a qualidade da classificação, que,

através do número de erros de classificação, definirá se a árvore produziu ou

não um bom conjunto de regras. Se sim, a árvore estará treinada para realizar

outras classificações.

A DT tem como objetivo tentar minimizar erros de classificação e o número de

nós e folhas (Santos, 2005). Possui a vantagem de exibir o conjunto de regras

gerado no treinamento, diferente de outros classificadores.

54

3.2.1 Algoritmo da Árvore de Decisão

Para explicar o algoritmo genérico de uma DT, será utilizado como referência, o

algoritmo J48 (Witten et al., 2005), encontrado implementado no programa

Weka (2008).

Uma DT pode ser desenvolvida para trabalhar com dados nominais ou

numéricos. Em ambos os casos, o seu algoritmo gera as regras baseando-se

na análise de cada atributo, através dos seus valores e da sua relação com os

demais parâmetros evolvidos. No caso de dados numéricos, os valores

utilizados são discretizados. O processo de análise utiliza-se de algumas

definições que estão relacionadas abaixo, seguidas das equações que as

descrevem (Quinlan, 1986; Witten et al., 2005; Santos, 2005).

Para facilitar a descrição, consideremos uma base de dados composta por n

instâncias. Cada instância é composta por um conjunto de atributos e por um

atributo-classe F, sendo que cada atributo A assume um valor v e o atributo-

classe F assume um valor j.

a) Probabilidade (p): A probabilidade da ocorrência de um valor para um

atributo é calculada como o número de ocorrências do valor de um

atributo dividido pelo número de instâncias da base de dados. A

probabilidade da ocorrência do valor v assumido por um atributo A

pode ser dada por:

( ) vn

p A vn

= = (3.1)

Onde vn é o número de ocorrências do valor v assumido pelo atributo A,

e n é o número de instâncias da base de dados.

b) Entropia (H): A entropia de um atributo é um valor de aleatoriedade,

que quanto maior, mais uniforme é a distribuição dos valores. Entropia

zero indica concentração absoluta de um único valor para os atributos

55

(Santos, 2005). A entropia de um atributo A , assim como a de um

atributo-classe F, pode ser dada pela equação:

( ) 2

1

logm

v v

v

H A p p=

= −∑ (3.2)

Onde m, como dito anteriormente, é o número dos diferentes valores que

são assumidos pelo atributo A e pv é a probabilidade de A assumir o valor

v.

c) Probabilidade Condicional (pC): Probabilidade de uma instância

possuir o atributo-classe F=j considerando que ele tem valor v para o

atributo A:

( ) ||

F j A v

C

F j

np F j A v

n

= =

=

= = = (3.3)

Onde |F j A vn = = é o número de ocorrências de j como valor do atributo-

classe F, quando o atributo A assume valor v; e F j

n = é o número de

ocorrências do valor j para o atributo-classe F na base de dados.

d) Entropia Condicional Específica (CE

H ): Entropia do atributo A para as

instâncias onde o atributo-classe F assume valor j:

( ) 2

1

| logv v

m

CE C C

v

H A F j p p=

= = −∑ , (3.4)

onde vC

p é a probabilidade de uma instância pertencer à classe j, sabendo-se

que o seu atributo A tem valor v; e m é a quantidade de valores distintos

assumidos pelo atributo A.

e) Entropia Condicional (C

H ): Entropia condicional de um atributo A em

relação ao atributo-classe F:

56

( ) ( ) ( )| |k

C i CE i

i

H A F p F j H A F j= = =∑ , (3.5)

onde ji é um valor possível que pode assumir o atributo-classe F e k é a

quantidade de valores diferentes assumidos por F.

As equações descritas acima levam ao cálculo de um valor de entropia

condicional para cada atributo existente na base de dados analisada. Estes

valores permitem o cálculo do ganho de informação.

f) Ganho de Informação (IG): Valor que indica dependência ou

correlação entre um atributo e a classe à qual a instância pertence,

sendo que, quanto maior o valor do IG, maior a relação de

dependência. O ganho de informação de um atributo A em relação à

classe F pode ser dado por:

( ) ( ) ( )| |CIG A F H F H A F= − . (3.6)

Se existe maior ganho de informação entre um atributo A e a classe F que

entre um atributo B e F, conclui-se que a classe F será atingida com menos

perda de informação se partir de A do que se partir de B (Santos, 2005).

O algoritmo genérico para a implementação de uma DT consiste, basicamente,

em três passos (Santos, 2005):

1. Testam-se todos os atributos. O que tiver maior ganho de informação

será escolhido para a criação de um nó da árvore;

2. Divide-se a árvore (criando nós e sub-árvores) partindo-se do atributo

selecionado.

3. Repetem-se recursivamente os passos anteriores até que não seja

mais possível decidir por atributos.

57

A FIGURA 3.1 mostra o conjunto de regras gerado pelo algoritmo ID3 (Quinlan,

1979, 1983) no exemplo “Saturday morning” (Quinlan, 1986), que usa as

instâncias relacionadas na TABELA 3.1. O problema trata a decisão de jogar

ou não golfe, dada a situação climática da manhã de sábado (“Saturday

morning”). Os atributos, neste exemplo, são: o tempo (ensolarado, nublado ou

chuvoso), a temperatura (quente, ameno ou frio), a umidade (muito ou

normal), e o vento (sim ou não); e o atributo-classe refere-se à decisão que

será tomada (jogar ou não jogar golfe).

Além da árvore, dada por um conjunto de regras, o algoritmo J48, que será

utilizado neste trabalho, gera, como resultado, uma Matriz de Confusão que

mostra o número de padrões classificados correta e incorretamente.

TABELA 3.1. Base de dados utilizada no exemplo “Saturday morning”.

ATRIBUTOS INSTÂNCIAS

TEMPO TEMPERATURA UMIDADE VENTO CLASSE

1 ensolarado quente muito não não jogar

2 ensolarado quente muito sim não jogar

3 nublado quente muito não jogar

4 chuvoso ameno muito não jogar

5 chuvoso frio normal não jogar

6 chuvoso frio normal sim não jogar

7 nublado frio normal sim jogar

8 ensolarado ameno muito não não jogar

9 ensolarado frio normal não jogar

10 chuvoso ameno normal não jogar

11 ensolarado ameno normal sim jogar

12 nublado ameno muito sim jogar

13 nublado quente normal não jogar

14 chuvoso ameno muito sim não jogar

FONTE: Adaptado de Quinlan (1986).

58

FIGURA 3.1 Árvore de Decisão gerada pelo algoritmo ID3 para os dados da TABELA 3.1.

FONTE: Adaptado de Quinlan (1986).

3.3 Redes Neurais Artificiais

O cérebro humano é um sistema de processamento paralelo altamente

complexo e não-linear, capaz de realizar tarefas como reconhecimento de

padrões, percepções e coordenação motora, muito mais agilmente que o mais

rápido dos computadores digitais existentes hoje. (Haykin, 2001)

A neurocomputação estuda a simulação computacional do cérebro humano,

fugindo das características da computação convencional, simulando a estrutura

composta por neurônios, suas interconexões e os estímulos que, através da

sinapse, passam de um neurônio para outro. O sistema resultante dessa

simulação é denominado Rede Neural Artificial (RNA).

Um neurônio biológico, como mostra a FIGURA 3.2, é basicamente composto

por três partes: dendritos, corpo celular (ou soma) e axônio. Em uma rede

neural biológica, impulsos elétricos são transferidos de uma célula para outra

através de um processo químico de conexão denominado sinapse, que ocorre

entre o axônio de um neurônio e dendritos de outros neurônios vizinhos.

tempo

umidade vento

jogar não-jogar jogar não-jogar

jogar

ensolarado nublado chuvoso

muito normal sim não

59

FIGURA 3.2. Neurônio biológico e seus componentes.

FONTE: Adaptado de Fausset (1994).

A estrutura das células do sistema neural biológico serviu como base para a

criação do considerado primeiro modelo de neurônio artificial, concebido por

Warren McCulloch e Walter Pitts (Fausset, 1994).

As RNAs são, portanto, sistemas computacionais que têm como unidades de

processamento neurônios artificiais, os quais são inter-conectados através de

pesos sinápticos. A sua modelagem pode ser realizada através de

componentes eletrônicos ou por simulações através de programas

computacionais, abordagem escolhida neste trabalho.

Uma RNA pode ter diferentes configurações em relação, por exemplo: ao

arranjo em camadas, a número de camadas, ao processamento interno dos

neurônios e ao tipo de conexões entre eles. Estes parâmetros, entre outros,

definem redes com diferentes arquiteturas. Entre as arquiteturas mais

utilizadas, destacam-se as de camada única (single-layer net), as recorrentes

(recurrent networks) e as que possuem múltiplas camadas (multilayer net) e

(Fausset, 1994 e Haykin, 2001), das quais faz parte o modelo Perceptrons de

Múltiplas Camadas (ou MLP do inglês, MultiLayer Perceptron).

axônio de outro neurônio

axônio de outro neurônio

axônio

dendritos

região sináptica

região sináptica

dendrito de outro

neurônio

dendrito de outro

neurônio

soma

60

3.3.1 Perceptrons de Múltiplas Camadas (MLP)

As MLP possuem duas ou mais camadas, sendo uma de saída e uma ou mais

intermediárias (ou ocultas). A FIGURA 3.3 ilustra uma MLP com duas

camadas: uma oculta com 4 (quatro) neurônios e a de saída com 2 (dois)

neurônios. A camada de entrada não é contabilizada por não realizar

processamento.

FIGURA 3.3. RNA do tipo Perceptrons Múltiplas Camadas (à direita), e a estrutura interna de seus neurônios (à esquerda).

A FIGURA 3.4 ilustra os elementos envolvidos na propagação de um sinal em

um neurônio k de uma MLP. Este processo consiste, resumidamente, na soma

ponderada das entradas xn pelos pesos wkn, com o acréscimo do bias bk1,

gerando vk, que é ativada pela função de ativação f, gerando a saída yk.

FIGURA 3.4. Modelo de neurônio do tipo perceptron.

E N T R A D A S

camada oculta

camada de saída

S A Í D A S

Σ | f

Σ | f

Σ | f

Σ | f

Σ | f

Σ | f

wk1

wk2

wk

xm

x2

xm

.

.

.

.

.

.

Σ

bk1

f (vk) vk

yk

wk1

wk2

wkm

x1

x2

xm

.

.

.

.

.

.

Σ

bk1

f (vk) vk

yk

bias

função de ativação

saída

entradas

soma ponderada

pesos

61

O bias, ou limiarizador, é um valor que tem a função de reforçar ou inibir as

entradas do neurônio, dependendo do seu sinal, positivo ou negativo,

respectivamente.

A função de ativação, ou função de transferência, é aplicada sobre a ativação

interna de um neurônio (explicado melhor a seguir), produzindo o sinal de saída

do neurônio em questão, podendo ser de vários tipos.

A função limiar (FIGURA 3.5) retorna uma saída binária, com a seguinte

condição:

( )1, se x 0

0, se x 0f x

≥=

<. (3.7)

-10 -8 -6 -4 -2 0 2 4 6 8 10-0.5

0

0.5

1

1.5

f(x)

FIGURA 3.5. Função de ativação limiar.

As funções sigmoidais são as mais utilizadas em RNAs (Haykin, 2001). Duas

delas, a função logística (FIGURA 3.6a) e a função tangente hiperbólica

(FIGURA 3.6b) são dadas, respectivamente, pelas equações abaixo:

( )1

1 exp( )f x

ax=

+ −, (3.8)

62

( )1 exp( )

1 exp( )

axf x

ax

− −=

+ −, (3.9)

onde a é o coeficiente de declividade. A função logística (Equação 3.8) limita a

sua saída no intervalo de 0 a 1 e a tangente hiperbólica (Equação 3.9) no

intervalo de -1 a 1.

-10 -8 -6 -4 -2 0 2 4 6 8 10-0.5

0

0.5

1

1.5

f(x)

-10 -8 -6 -4 -2 0 2 4 6 8 10-1.5

-1

-0.5

0

0.5

1

1.5

f(x)

(a) (b)

FIGURA 3.6. Funções de ativação: logística (a) e tangente hiperbólica (b).

O processamento de um perceptron k, visualizado na FIGURA 3.4,consiste nas

seguintes etapas:

1. Apresentação das entradas: as entradas xi podem ser os parâmetros

de entrada da rede (se o neurônio estiver na primeira camada oculta)

ou as saídas dos neurônios da camada anterior (se o neurônio estiver

em uma camada oculta mais interna ou na camada de saída).

2. Ativação interna: é realizada uma soma ponderada das m entradas

apresentadas ao neurônio k, de acordo com o conjunto de pesos wki

definido para aquele neurônio, da forma:

1

m

k ki i

i

v w x=

=∑ (3.10)

63

3. Função de ativação: a ativação interna vk, somada ao bias bk, passa

pela função f, que gera o valor de saída yk do neurônio k:

( )k k ky f v b= + (3.11)

4. Propagação da saída: a saída yk é propagada para os neurônios da

próxima camada (no caso deste neurônio pertencer a uma camada

oculta), ou a saída yk é também a saída da rede (no caso do neurônio

pertencer à camada de saída).

As RNAs são treinadas com o intuito de ajustar os pesos sinápticos dos

neurônios, de forma a definir o melhor conjunto de pesos, que minimiza o erro.

O treinamento pode ser realizado de forma supervisionada ou não-

supervisionada, sendo que no primeiro tipo, além do conjunto de parâmetros de

entrada, é apresentado também o respectivo conjunto de parâmetros

desejados na saída.

A configuração de uma RNA, no que diz respeito às quantidades de neurônios

nas camadas de entrada e saída, é definida de acordo com o número de

parâmetros que se deseja apresentar na entrada e o número de respostas que

se deseja obter na saída, respectivamente. O número de neurônios na(s)

camada(s) oculta(s) está associado à capacidade de generalização da rede.

Uma RNA envolve etapas antes da sua utilização como ferramenta:

a) Treinamento: um conjunto de dados de entrada, cujas saídas já são

conhecidas, deve ser escolhido como padrões de treinamento. Um

algoritmo de treinamento deve ser executado para gerar uma rede

que seja capaz de lidar com todas as diferentes situações

apresentadas a ela;

b) Testes: um outro conjunto de dados, também com saídas já

conhecidas, deve ser apresentado à rede. Nesta fase, a rede é

ativada, utilizando o conjunto de pesos ideais calculados durante o

64

treinamento. O seu desempenho é testado para a utilização na fase

de Validação;

c) Validação: A rede está pronta e testada para a utilização com dados

cujas saídas são desconhecidas. A rede classifica os padrões de

acordo com o “conhecimento” adquirido no treinamento e confirmado

na fase de testes.

Em 1986, foi desenvolvido o algoritmo denominado backpropagation (ou retro

propagação do erro), que logo se tornou popular e no qual se encontrou uma

forma computacionalmente eficiente de se realizar o treinamento das redes

MLP. (Haykin, 2001)

3.3.2 Backpropagation

O treinamento supervisionado, como citado anteriormente, é caracterizado pela

apresentação do conjunto de saídas desejadas à rede. No algoritmo

backpropagation, esses valores são comparados aos calculados pela rede, ou

seja, à(s) saída(s) yk do(s) neurônio(s) da camada de saída da seguinte forma:

( ) ( ) ( )k k ke n d n y n= − , (3.12)

onde ek é o erro calculado pela diferença entre dk - saída desejada - e yk - saída

calculada pela rede no neurônio k da camada de saída - e n é o número do

padrão de treinamento comparado naquele momento.

Em seqüência a essa comparação, calcula-se a Soma dos Erros Quadráticos

( ( )nε ) da rede dado por:

( ) ( )21

2k

k C

n e nε∈

= ∑ , (3.13)

sendo C o conjunto que possui todos os neurônios que fazem parte da camada

de saída e n o número do padrão de treinamento analisado naquele momento.

65

Através da soma dos erros quadráticos ( )nε calculado para cada padrão de

treinamento n, obtém-se o Erro Quadrático Médio (EQM) dado pela média dos

( )nε dos N padrões, por:

( )1

1 N

m

n

nN

ε ε=

= ∑ (3.14)

O algoritmo backpropagation se define em retropropagar e reduzir o EQM,

utilizando o cálculo do gradiente descendente como critério para o ajuste do

conjunto de pesos sinápticos.

O ajuste do peso j do neurônio k para um instante n+1 é dado por:

( ) ( ) ( )1kj kj kjw n w n w n+ = + ∆ , (3.15)

em que ( )kjw n∆ é o valor de correção, dado por:

( ) ( ) ( )kj k jw n n y nαδ∆ = , (3.16)

na qual α é a taxa de aprendizado; δk(n) é o gradiente local do neurônio k; e

yj(n) é uma das entradas provindas de um neurônio da camada anterior ou uma

das entradas da rede (no caso de k fazer parte da primeira camada oculta), ou

seja, uma das entradas do neurônio k, no instante n.

O gradiente local é dado por:

( ) ( ) ( )( )'k k k kn e n f v nδ = , (3.17)

onde 'kf é a derivada da função de ativação do neurônio k, v(n) é a atividade

interna do neurônio k e ek é o sinal de erro do neurônio k.

O cálculo da correção dos pesos sinápticos depende, portanto, do erro

calculado no neurônio k, quando este faz parte da camada de saída, onde é

apresentado o valor desejado. No entanto, quando o neurônio está na camada

66

oculta (neurônio j), não é possível calcular o erro utilizando os mesmos

cálculos utilizados para o neurônio de saída k. Neste caso, o erro do neurônio

oculto j é calculado em função dos erros dos neurônios de saída aos quais ele

está conectado. O cálculo do gradiente de um neurônio oculto j é dado,

portanto, por (Haykin, 2001):

( ) ( )( ) ( ) ( )'j j j k kj

k

n f v n n w nδ δ= ∑ . (3.18)

onde j é o neurônio oculto e k é um neurônio de saída ao qual j está conectado.

Haykin (2001) relaciona detalhadamente as equações presentes no algoritmo

backpropagation.

O algoritmo backpropagation pode ser resumido aos seguintes passos:

1. Inicialização do conjunto de pesos: os conjuntos de pesos sinápticos

e bias, que envolvem os sub-conjuntos relativos a cada neurônio da

rede, são inicializados com valores aleatórios entre -1 e 1;

2. Apresentação do conjunto de treinamento: os padrões de entrada são

apresentados, podendo cada padrão ser um valor único ou um vetor

de valores. Um padrão é apresentado por vez e este propaga para

frente (forward) e em seguida retro-propaga.

3. Propagação do sinal de entrada: o primeiro padrão é apresentado

aos neurônios da primeira camada, é ativado e apresentado à

camada seguinte, conforme as Equações 3.10 a 3.11, até que seja

recebido e processado pelos neurônios da camada de saída e seja

calculado o erro (Equação 3.12);

4. Retropropagação do erro: o erro calculado na camada de saída serve

de base para o cálculo dos gradientes locais dos neurônios de saída

(Equação 3.17) e dos ocultos (Equação 3.18);

67

5. Ajuste dos pesos: os gradientes locais possibilitam a correção dos

pesos dos neurônios de cada camada (Equações 3.15 e 3.16);

6. Iterações subseqüentes: os passos anteriores são realizados para

todos os padrões de entrada e são repetidos por mais iterações até

que o critério de parada - número máximo de iterações ou erro

mínimo tolerável - seja atingido.

7. Conjunto ideal de pesos: o conjunto ideal de pesos, gerados na

iteração que retornou o menor erro durante o treinamento, é

armazenado para utilização na fase de testes.

3.3.3 Mapas Auto-Organizáveis de Kohonen

Conhecidos também pela sigla SOM (do inglês, Self-Organizing Maps), os

Mapas Auto-Organizáveis de Kohonen são RNAs que adotam o treinamento

competitivo e do tipo não-supervisionado.

Diferentes das MLP, as redes SOM são compostas de um conjunto de

neurônios, em que cada unidade representa uma classe (ou cluster), através

do seu respectivo conjunto de pesos sinápticos. Um padrão de entrada é

classificado através do cálculo da aproximação de seus valores em relação ao

conjunto de pesos de cada neurônio da rede. O neurônio que possui o conjunto

de pesos mais próximo ao padrão de entrada, é denominado vencedor, e assim

é escolhido como a classe à qual o padrão analisado pertence.

Na rede SOM, além da camada de entrada, onde são apresentados os padrões

de entrada, existe mais uma única camada de neurônios, a de saída. Nela, os

neurônios assumem uma estrutura topológica, organizada em um vetor

unidimensional (conforme ilustra FIGURA 3.7) ou bidimensional (Fausset,

1994). A principal diferença entre ambas as dimensões é o tipo de vizinhança

entre seus neurônios. A vizinhança em um Mapa de Kohonen é definida pelos

68

neurônios próximos topologicamente, sendo o grau de vizinhança um dos

parâmetros de configuração que devem ser pré-definidos.

FIGURA 3.7. Exemplo de SOM unidimensional.

Assim como nas MLP, a cada uma das ligações entre as camadas de entrada e

saída é atribuído um valor de peso sináptico, como pode ser observado na

FIGURA 3.7. Tomando como exemplo a mesma figura, nota-se que cada

padrão de entrada é formado por um vetor de m parâmetros e que a camada de

saída possui n neurônios, ou clusters. Pode-se denotar o peso de cada ligação

como wji, em que i e j identificam, respectivamente, o número do parâmetro da

entrada e o neurônio de saída.

O passo inicial para a criação de uma rede SOM requer a definição dos

parâmetros topológicos, ou seja, a escolha da quantidade de unidades nas

camadas de entrada e saída, sendo o número de unidades de entrada igual ao

de parâmetros do vetor de entrada.

O processo de treinamento da rede começa com a inicialização dos pesos

sinápticos, atribuindo-lhes valores aleatórios. Em seguida, três etapas são

realizadas: competição, cooperação e adaptação sináptica (HAYKIN, 2001).

A competição consiste em determinar um neurônio vencedor K, que melhor

represente um dado padrão de entrada xi. O critério utilizado é o cálculo da

distância euclidiana entre o valor da entrada e os pesos de cada neurônio de

saída. O neurônio do qual a entrada for menos distante, é considerado o

camada de entrada

camada de saída

x1 x2 xm

. . .

x3 . . .

y1 y2 y3 yn

69

vencedor. A distância euclidiana dj entre a entrada xi e o vetor de pesos do

neurônio j é dada por:

( )2

1

m

j i ji

i

d x w=

= −∑ , (3.19)

em que i é o número do parâmetro de entrada.

A etapa de cooperação é realizada quando se é pré-definida uma vizinhança

topológica, ou seja, neurônios que estão a um raio R do neurônio vencedor e

cujos pesos serão atualizados juntamente aos do neurônio vencedor.

A adaptação sináptica, na última etapa, atualiza os pesos dos neurônios

selecionados, se considerada vizinhança R=0 , da forma:

( ) ( ) ( )( )1ik ik i ikw t w t x w tα+ = + − , (3.20)

diminuindo assim a distância dessas unidades com o padrão de entrada.

As três etapas são repetidas até serem apresentados todos os padrões do

vetor de entrada e durante um número máximo de interações ou outro critério

de parada.

3.4 Aplicação em Clima Espacial

Algumas técnicas de IA foram e continuam sendo utilizadas na área de Clima

Espacial, principalmente, para a tarefa de previsão. A previsão de distúrbios

geomagnéticos, juntamente com a utilização de Redes Neurais Artificiais, é a

principal abordagem nesse tipo de aplicação. Alguns dos trabalhos que se

concentram na previsão do índice Dst, utilizando RNAs, serão citados e

utilizados para comparação dos resultados obtidos neste trabalho.

Lundstedt (1997) relaciona algumas aplicações de técnicas de IA em previsão

de distúrbios geomagnéticos, entre elas:

70

a) Sistemas Especialistas para previsões de tempestades

geomagnéticas, através do índice Dst, com 1 a 3 dias de

antecedência utilizando como entrada a ocorrência de fenômenos

solares (Lundstedt, 1990);

b) MLPs com treinamento backpropagation (Lundstedt, 1992; Freeman et

al., 1993; Lundstedt and Wintoft, 1994; Gleisner et al., 1996), que

utilizaram como entrada dados do vento solar, das componentes do

campo magnético interplanetário e do Dst, em instantes de tempo

anteriores, para previsão de tempestades geomagnéticas através dos

índices Dst e AE.

c) Redes Neurais Recorrentes de Elman (Wu and Lundstedt 1996,

1997), que utilizaram os mesmos parâmetros de entrada e saída das

MLPs do Item b.

Os trabalhos acima citados apresentaram previsões do índice Dst de boa

qualidade - chegaram a um coeficiente de correlação de 0.92 e 85% de

eficiência na previsão (calculado pela variância relativa média). No entanto, os

resultados apresentaram mais qualidade para as fases inicial e principal de

tempestades geomagnéticas que para a fase de recuperação. Alguns anos

mais tarde, Kugblenu et al. (1999) previram a fase de recuperação com a

mesma precisão que as demais.

Os resultados obtidos em alguns desses trabalhos serão utilizados para a

comparação de alguns dos resultados obtidos no presente trabalho.

71

CAPÍTULO 4 DADOS E METODOLOGIA

Este capítulo descreve os formatos, resoluções e origem dos dados utilizados

no trabalho. Também relaciona e detalha os experimentos realizados com as

técnicas escolhidas.

Para os experimentos, foram utilizados basicamente dados de plasma, de

campo magnético interplanetário e de índice geomagnético Dst, em diferentes

resoluções. Os dados de plasma e IMF são disponibilizados on-line por cortesia

de N. Ness (Bartol Research Institute), D. J. McComas (SWRI); e o índice

geomagnético Dst por WDC-Kyoto.

4.1 Dados

O comportamento do IMF, as características do plasma que vem em direção à

Terra e a perturbação do campo geomagnético podem ser analisados através

de medições que são realizadas por satélites em órbita e por magnetômetros

em superfície.

O satélite ACE (Advanced Composition Explorer) coleta, constantemente,

características do plasma acoplado ao vento solar que flui em direção ao

planeta, assim como as medidas das componentes do campo magnético

interplanetário.

Os magnetômetros, situados em superfície, estão espalhados pelo mundo em

diversos pontos de coleta, que são mantidos por universidades e institutos de

pesquisa. Estes equipamentos medem o nível de distúrbio do campo

geomagnético, baseando-se na variação da componente H (horizontal).

A seguir serão relacionados os dados utilizados neste trabalho junto com os

respectivos formatos e características.

72

4.1.1 Dados interplanetários

Os dados de plasma e IMF utilizados neste trabalho foram coletados pelo ACE.

O satélite mede características do plasma contido na região do vento solar pela

qual ele atravessa, sendo essas a temperatura, a densidade e a velocidade. Os

instrumentos a bordo do ACE medem também a projeção do IMF nas três

componentes Bx, By e Bz, tomando como base o sistema de coordenadas GSM,

descrito no CAPÍTULO 2.

As características do plasma contidas no arquivo são:

a) Np: Densidade de prótons (cm-3);

b) Tp:Temperatura (K),

c) Vp:Velocidade de prótons (km/s).

As medições do IMF presentes no arquivo são:

a) Componente Bx (nT);

b) Componente By (nT),

c) Componente Bz (nT).

Um exemplo dos sinais interplanetários citados pode ser visualizado nos

gráficos da FIGURA 4.1.

As medições das seis características estão disponíveis em um mesmo arquivo

de texto, em dois tipos de resolução, sendo uma delas com um ponto a cada

hora e a outra com um ponto a cada 64 segundos. Uma comparação entre as

duas resoluções dos dados de plasma é realizada nos gráficos da FIGURA 4.1.

Uma outra resolução de um ponto a cada 4 minutos é disponibilizada somente

para as medições das componentes do IMF e esta é comparada às duas outras

na FIGURA 4.2.

73

0

10

20

30

40N

p (c

m- 3)

AGO / 2001 (1-5)

ponto / 64 seg

ponto / 1 h

0

1

2

3

x 105

T p (K

)

200

300

400

500

600

700

Vp (k

m/s

)

Dias

FIGURA 4.1. Dados dos parâmetros de plasma em duas resoluções.

-10

0

10

Bx

(nT

)

AGO / 2001 (1-5)

ponto / 64 seg

ponto / 4 minponto / 1 h

-10

0

10

By

(nT

)

1 2 3 4

-10

0

10

Bz

(nT

)

Dias

FIGURA 4.2. Dados dos parâmetros do IMF em três resoluções.

74

Além das medições, os arquivos contêm, para cada ponto, o registro do ano,

do dia Juliano, da hora, do minuto e dos segundos em que foi realizada a

coleta. Estes arquivos encontram-se disponíveis para download no instituto

responsável pelo satélite ACE, The ACE Science Center (ASC), no endereço

http://www.srl.caltech.edu/ACE/ASC/level2/index.html.

Como os intervalos utilizados nos experimentos foram, na maioria, de uma ou

duas horas, a resolução mais utilizada para os dados de plasma e IMF foi de

um ponto a cada hora. Outro fator que colaborou com essa decisão foi o fato

dos dados relativos ao índice Dst estarem na mesma resolução.

Os dados interplanetários, em alguns períodos, apresentam falhas (ou gaps)

devido ao volume de partículas de alta energia que atingem os instrumentos de

coleta, alguns minutos após a ocorrência de um evento no Sol (fenômeno

citado no CAPÍTULO 2). Os valores dos parâmetros interplanetários, nestes

períodos, extrapolam para valores irreais (-9999.9 nT), até que os sensores

voltem à coleta normal de dados. No trabalho, esta falha, quando apropriado, é

tratada com uma interpolação que é descrita no item 4.2.1 deste capítulo. Um

exemplo de gap pode ser observado na FIGURA 4.3 (a). Já os gráficos (b) da

FIGURA 4.3 mostram o distúrbio nos sinais das componentes do IMF, para o

mesmo evento, nos instantes que antecedem a ocorrência de uma tempestade

geomagnética de grande intensidade até a sua fase principal. Esse distúrbio

indica a aproximação de estruturas interplanetárias à magnetosfera.

Os parâmetros interplanetários utilizados no trabalho limitaram-se à velocidade

de prótons e, principalmente, às componentes do campo magnético

interplanetário, destacando entre elas a componente Bz. Gonzalez e Tsurutani

(1987) demonstraram quantitativamente que a intensidade de uma tempestade

geomagnética é diretamente proporcional ao produto dos parâmetros Vp e Bz.

http://www.srl.caltech.edu/ACE/ASC/level2/index.html

75

(a)

(b)

FIGURA 4.3. As linhas tracejadas delimitam: em (a), os gaps ocorridos nos dados de plasma, aproximadamente 1,5 dia até a fase principal da tempestade; em (b), o trecho com o comportamento das componentes do IMF nas horas que antecedem a fase principal da tempestade geomagnética.

4.1.2 Índices geomagnéticos

Uma variedade de índices especifica a intensidade de um distúrbio

geomagnético.

76

Como dito anteriormente, o índice Dst é o que melhor identifica a ocorrência de

uma tempestade geomagnética. O seu valor é definido pela composição das

medições realizadas, de hora em hora, da perturbação causada no

componente horizontal (H) do campo geomagnético, coletadas por quatro

estações de magnetômetros de baixa latitude. A variação do índice Dst conta

com a contribuição de quatro grandes sistemas de corrente, que estão

presentes na magnetosfera: sistema de corrente na magnetopausa, a chamada

corrente de Chapman-Ferraro, sistemas de corrente na cauda, as correntes de

anel parciais e simétricas (Maltsev, 2003). São variações desses sistemas que

identificam as fases em que uma tempestade é dividida, como mostrado na

FIGURA 2.13 do CAPÍTULO 2.

Um exemplo do sinal do índice Dst pode ser visualizado na FIGURA 4.4,

relativo ao mês de Julho de 2000. O período inicia com valores que indicam um

baixo nível de distúrbio, com ausência de tempestades ou tempestades fracas.

No entanto, entre os dias 14, 15 e 16, foi registrada uma super-tempestade que

levou o índice a valores pertos de -300 nT. A partir daí, o restante do mês

indica a fase de recuperação, em que o Dst ainda não chega a assumir valores

próximos de 0 nT. (Gonzalez et al., 1994)

A FIGURA 4.5 mostra um outro exemplo do índice Dst em um mês quase

inteiro perturbado, como foi o caso de Outubro de 1999. Durante o período,

entre os dias 22 e 23, observou-se uma super-tempestade, quando o índice foi

reduzido a valores pertos de -250nT. Nos outros dias foram observadas

tempestades de menor intensidade. Observa-se que a maioria dos intervalos

em que o índice assume valores próximos a 0nT indica a súbita elevação do

índice que caracteriza a fase inicial de uma tempestade geomagnética.

(Gonzalez et al., 1994)

O índice Dst mensal pode ser baixado no World Data Center for Geomagnetism

from Kyoto (WDC-Kyoto), no endereço http://swdcwww.kugi.kyoto-

u.ac.jp/dstdir/index.html.

http://swdcwww.kugi.kyoto-u.ac.jp/dstdir/index.html



77

FIGURA 4.4. Índice Dst durante o mês de Julho de 2000. Uma super-tempestade é observada entre os dias 14, 15 e 16, quando o índice é reduzido a valores próximos de -300 nT.

FIGURA 4.5. Índice Dst no mês de Outubro de 1999. Entre os dias 22 e 23, aproximadamente, observa-se a ocorrência de uma tempestade geomagnética, em que a fase principal chegou a valores menores que -200 nT.

78

4.2 Metodologia

A seguir serão descritos os processos seguidos no desenvolvimento dos

experimentos realizados.

4.2.1 Pré-processamento: interpolação

Os dados do meio interplanetário tiveram que sofrer interpolação em três

situações: na recuperação de períodos com gaps, na atenuação de sinais e na

alteração de resolução dos dados.

Como foi mencionado anteriormente, em alguns casos, nos eventos solares em

que há a ejeção de partículas em direção aos instrumentos de coleta, os

valores dos parâmetros sofrem uma extrapolação. Esses períodos, quando

pequenos – intervalos de até uma hora - foram interpolados utilizando uma

função de aproximação baseada nos vizinhos mais próximos. Os períodos que

apresentaram um longo período de gaps – intervalos que ultrapassavam uma

hora - não foram utilizados no trabalho. A FIGURA 4.6 mostra um exemplo de

interpolação que se aplica a esse caso, realizando também a comparação

entre duas resoluções distintas – de1 hora e de 64 segundos.

Outro exemplo de preenchimento de gap é mostrado na FIGURA 4.7, com

dados de resolução de 4 minutos.

A atenuação do sinal foi realizada em alguns experimentos com o intuito de

eliminar oscilações e picos não relevantes, que poderiam interferir na tarefa de

generalização dos classificadores utilizados. Para essa interpolação foram

realizados cálculos de médias flutuantes, como exemplificam a FIGURA 4.8 e a

FIGURA 4.9.

79

SINAL COM GAP:

res. 64seg

res. 1h

GAP PREENCHIDO:

res. 64seg

res. 1h

FIGURA 4.6. Preenchimento de gaps. Neste exemplo, o mesmo gap (de aproximadamente uma hora), no sinal da temperatura de prótons, é preenchido em duas resoluções, uma horária e a outra de 64 segundos.

GAPS NA RESOLUÇÃO DE 4 MIN.:

com gapgap preenchido

FIGURA 4.7. Preenchimento de gap para a resolução de 4 minutos.

80

RESOLUÇÃO DE 64 SEG.:

original

atenuado

RESOLUÇÃO DE 1 HORA:

original

atenuado

FIGURA 4.8. Atenuação do sinal da componente Bx do IMF nas duas resoluções (64segundos e 1 hora).

INTERPOLAÇÃO COM RESOLUÇÃO DE 4 MIN:

sinal original

sinal atenuado

FIGURA 4.9. Cálculo de média flutuante para atenuação do sinal da componente Bz.

4.3 Experimentos

Os experimentos consistiram em realizar as seguintes tarefas:

a) Determinar classes de eventos, incluindo, além do índice Dst, alguns

parâmetros interplanetários, utilizando Mapa de Kohonen;

81

b) Verificar parâmetros interplanetários que possam apresentar uma

importante relação à ocorrência de tempestades geomagnéticas,

utilizando Árvore de Decisão;

c) Prever o índice geomagnético Dst, durante períodos calmos e de

tempestades, utilizando Rede Neural Artificial do tipo Perceptron

Múltiplas Camadas.

4.3.1 Seleção de dados para treinamento e testes

Para todas as fases de treinamento das técnicas envolvidas, foram utilizados

alguns eventos específicos registrados entre os anos de 1998 e 2003. Os

eventos foram selecionados pelas tempestades geomagnéticas de diferentes

intensidades e classes que ocorreram no período. As medições variam de 2 a

15 dias, aproximadamente, sofrendo variação na resolução de acordo com o

experimento realizado. Optou-se também por evitar dados com períodos

grandes de gaps. Alguns dos eventos escolhidos para o treinamento serão

exibidos a seguir, nos gráficos das FIGURA 4.10.

Como se tem, por objetivo, realizar a tarefa de previsão em um sistema em

tempo real, optou-se por utilizar, como dados para teste, meses completos de

observação – como, por exemplo, o mês de Novembro de 2001 (FIGURA 4.11)

- que podem possuir tanto períodos perturbados como períodos calmos.

82

50 100 150 200

-300

-250

-200

-150

-100

-50

0

50

Horas

nT

(11/07/2000 a 20/07/2000)

50 100 150 200 250 300

-300

-250

-200

-150

-100

-50

0

50

Horas

nT

(01/05/1998 a 13/05/1998)

100 200 300 400

-300

-250

-200

-150

-100

-50

0

50

Horas

nT

(05/11/1998 a 21/11/1998)

50 100 150 200

-300

-250

-200

-150

-100

-50

0

50

Horas

nT

(21/09/1998 a 29/09/1998)

FIGURA 4.10. Índice Dst de alguns dos eventos de tempestades geomagnéticas utilizados como dados de treinamento das ferramentas.

FIGURA 4.11. Exemplo de mês completo utilizado para testes.

(nT)

83

Os conjuntos de dados selecionados para as fases de treinamento e testes da

rede MLP não foram fixos para todos os experimentos. Por exemplo, um

conjunto utilizado no treinamento de um dos experimentos foi utilizado como

conjunto de teste em outro experimento.

A TABELA 4.1 relaciona e identifica os conjuntos de dados utilizados para as

fases de teste e treinamento, separados por período. Cada conjunto é

detalhado com o total de dias e o número de instantes (ou padrões) horários

que o compõem. Os períodos escolhidos para formarem esses conjuntos foram

os que possuíam eventos de tempestades geomagnéticas com diferentes perfis

como, por exemplo, tempestades de diferentes intensidades ou duas ou mais

tempestades subseqüentes em um mesmo mês.

TABELA 4.1. Períodos de meses completos e dias de eventos isolados utilizados como conjunto de dados nas fases de treinamento e teste nas técnicas.

GRUPO Nº DE DIAS Nº DE INSTANTES PERÍODO

DATA1 13 312 01 a 13/05/1998

DATA2 9 216 21 a 29/09/1998

DATA3 17 408 05 a 21/11/1998

DATA4 30 720 01 a 30/09/1999

DATA5 10 240 21 a 30/10/1999

DATA6 6 144 05 a 10/04/2000

DATA7 3 72 15 a 17/07/2000

DATA8 9 216 09 a 17/08/2000

DATA9 30 720 01 a 30/04/2000

DATA10 31 744 01 a 31/07/2000

DATA11 31 744 01 a 31/10/2003

DATA12 30 720 01 a 30/11/2003

O critério de escolha dos parâmetros de entrada para os experimentos com a

rede MLP foi baseado nos elementos interplanetários cujos valores, segundo

estudos, influenciam no comportamento do campo geomagnético e colaboram

com a ocorrência de tempestades geomagnéticas (Gonzalez e Tsurutani,

84

1987). O índice Dst foi utilizado como parâmetro de entrada para tentar prever

a fase de recuperação da tempestade, que dura por horas ou dias, sendo que

os parâmetros interplanetários voltam aos valores que assumem em períodos

calmos em um intervalo menor de tempo. As combinações dos parâmetros de

entrada utilizados nas ferramentas em diferentes experimentos foram os

grupos identificados na TABELA 4.2.

TABELA 4.2. Combinações de parâmetros de entrada utilizados nos classificadores.

GRUPO ENTRADAS

PE1 Bx, By e Bz

PE2 Bz

PE3 Vp e Bz

PE4 Bz e Dst

PE5 By e Dst

PE6 Vp, Bz e Dst

As três componentes do IMF Bx , By e Bz foram utilizadas como atributos na DT

com o intuito de investigar suas possíveis relações com a ocorrência de

tempestades geomagnéticas. A componente By foi escolhida como um dos

parâmetros de entrada em um dos experimentos, devido ao resultado obtido

com a DT.

4.3.2 Experimentos com Árvore de Decisão

Nos experimentos realizados com a Árvore de Decisão, com algoritmo J48

(Weka, 2008), o atributo-classe utilizado na saída foi sempre o mesmo, ou seja,

o índice Dst discretizado em valores nominais e os demais atributos foram os

parâmetros interplanetários, com uma defasagem de 1 ou 2 horas sobre o

atributo-classe. As classificações aplicadas sobre o índice Dst seguiram os

critérios e rótulos exibidos na TABELA 4.3. Os rótulos baseiam-se nos termos

utilizados na área de clima espacial para as diferentes intensidades de


85

As variações realizadas entre os experimentos sobre cada grupo da TABELA

4.2 foram em relação:

a) Ao intervalo de horas entre o atributo-classe e os demais atributos;

b) Aos períodos de treinamento e testes, de acordo com os conjuntos

listados na TABELA 4.1,

c) Ao pré-processamento dos sinais: brutos ou atenuados.

TABELA 4.3. Identificação dos conjuntos de classes, com os devidos critérios e rótulos, para os valores nominais do índice Dst utilizados no algoritmo J48.

CLASSE RÓTULO CRITÉRIO I CRITÉRIO II CRITÉRIO III

AUSENTE a 30Dst ≥ −

FRACA f 50 30Dst− ≤ < − 70Dst ≥ − 50Dst ≥ −

MODERADA m 100 50Dst− ≤ < − 200 70Dst− ≤ < − 100 50Dst− ≤ < −

INTENSA i 250 100Dst− ≤ < − 100Dst < −

SUPER s 250Dst ≤ − 200Dst < −

Os experimentos realizados com Árvore de Decisão foram analisados através

dos conjuntos de regras gerados na fase de treinamento, que foram testados

na fase de teste, e através das Matrizes de Confusão.

4.3.3 Experimentos com Rede Neural MLP

A arquitetura da rede MLP foi definida da seguinte forma:

a) O número de vetores de entrada foi variado de acordo com os

experimentos e respectivo conjunto de parâmetros, conforme a

TABELA 4.2;

b) Na camada de saída, foi utilizado sempre um neurônio;

86

c) O número de neurônios da camada oculta foi definido após a

realização de testes avaliando a variação do erro quadrático, na fase

de treinamento, para diferentes números de neurônios ocultos.

d) Foi utilizada uma única camada oculta.

A TABELA 4.4 exibe as faixas de valores testados para o número de iterações

no treinamento e o número de neurônios na camada oculta, que foram

definidos com os primeiros experimentos.

TABELA 4.4. Faixas e passos variados para os testes para definição do número de neurônios nas camadas ocultas e número de iterações na fase de treinamento.

CONFIGURAÇÕES MÍNIMO MÁXIMO PASSO

nº máximo de iterações 1000 10000 1000

nº de neurônios na camada oculta 2 20 1

Os testes para a escolha do número de neurônios para a camada oculta

retornaram valores de erro quadrático mínimo baixos para 3, 4 ou 5 neurônios

ocultos. Foi optado, portanto, pela utilização de 4 neurônios ocultos em todos

os experimentos. A arquitetura de rede utilizada nos experimentos pode ser

vista na FIGURA 4.12.

O número de iterações utilizado na fase de treinamento, na maioria dos

experimentos, girou em torno de 5 e 10 mil.

As funções de ativação f utilizadas em ambas as camadas foi a tangente

hiperbólica e o valor inicial da taxa de aprendizagem α foi de 0.2. Essas

configurações se mantiveram fixas em todos os experimentos.

87

FIGURA 4.12. Arquitetura utilizada para a RNA MLP.

Variaram, de acordo com os experimentos:

a) O número de parâmetros de entrada, de acordo com a TABELA 4.2,

da Seção 4.3.1;

b) Os conjuntos de dados escolhidos para as fases de treinamento e

teste, de acordo com os conjuntos listados na TABELA 4.1, da Seção

4.3.1.

Os experimentos ainda se concentraram em previsões com 1 e 2 horas de

antecedência com variação no número de horas (delay) entre os parâmetros de

entrada e de saída, nas fases de treinamento e teste;

Para analisar os resultados de previsão obtidos pela rede, foram escolhidas

algumas medidas que pudessem comparar os valores calculados pela rede

com os observados, são elas:

a) O coeficiente de correlação linear ( ρ );

b) A variância relativa média (ARV, do inglês, Average Relative

Variance),

CAMADA OCULTA:

CAMADA DE SAÍDA:

CAMADA DE ENTRADA:

88

c) A raiz quadrada do erro quadrático médio (RMSE, do inglês, Root

Mean Squares Error).

Optou-se por essas medidas para possibilitar a comparação dos resultados

com os dos outros trabalhos, que utilizaram os mesmos parâmetros para a

análise dos resultados. Seguem abaixo as equações que descrevem cada uma

das medidas.

O coeficiente de correlação ρ entre os dados observados e os calculados pela

rede é dado por:

( ) ( ) ( ) ( )

( ) ( ) ( ) ( )2 2

1 1 1

2 2

1 1 1 1

N N N

n n n

N N N N

n n n n

N d n y n d n y n

N d n d n N y n y n

ρ = = =

= = = =

− =

− −

∑ ∑ ∑

∑ ∑ ∑ ∑

(4.1)

Ou, de forma simplificada, por:

( )( )

( ) ( ) ( ) ( )2 22 2

N dy d y

N d d N y y

ρ−

=

− −

∑ ∑ ∑

∑ ∑ ∑ ∑ (4.2)

A ARV é dada por:

( ) ( )( )

( )( )

2

1

2

1

N

n

N

n

d n y n

ARV

d n d

=

=

−

=

−

∑

∑ (4.3)

Dada a ARV, calcula-se o Percentual de Eficiência na Previsão EP por:

( )1 *100EP ARV= − (4.4)

89

Já a RMSE é dada por:

( ) ( )( )1 2

2

1

1 N

n

RMSE d n y nN =

= − ∑ (4.5)

Para as três equações, d(n) e y(n) são, respectivamente, o valor observado e o

calculado pela rede para o padrão n, N é o número total de padrões que estão

sendo testados, e d é o valor médio do vetor de valores observados.

O coeficiente de correlação linear ρ mede o grau de relacionamento linear

entre o valor desejado e o obtido.

A ARV será um valor entre 0 e 1, sendo que quanto mais próximo de 1, maior

será a variabilidade entre o sinal desejado e o obtido e, portanto, menor será a

qualidade da previsão. Dessa forma, partindo do ARV, calcula-se o percentual

de Eficiência na Previsão EP.

A RMSE será um valor dado em nT, unidade de medida na qual é representada

o índice geomagnético Dst, indicando a raiz quadrada do erro quadrático médio

a ser considerada na previsão de cada padrão.

4.3.4 Experimentos com Mapa de Kohonen

Os experimentos realizados com o Mapa de Kohonen tiveram o objetivo de

buscar relações que fossem de encontro aos resultados obtidos com a Árvore

de Decisão.

A arquitetura utilizada nos experimentos para a rede SOM foi formada de três

parâmetros como entradas da rede, e um número dinâmico de neurônios de

saída, arranjados de forma unidimensional, e gerados durante o treinamento.

Vizinhança R=0 foi adotada nos experimentos.

Os dados utilizados nestes experimentos estavam na resolução horária (um

ponto a cada hora) e foram atenuados e discretizados para valores inteiros.

90

Foram apresentados na entrada o parâmetro By, em um conjunto de

experimentos, e o parâmetro Bz, em um outro conjunto de experimentos,

ambos em instantes t-1, t-2 e t-3. E os valores representativos de cada cluster

gerado foram apresentados de forma a indicar a intensidade do índice Dst no

instante t.

Nos experimentos, foi realizada uma alteração em relação ao algoritmo original

da rede SOM, apresentado no CAPÍTULO 3, no qual é pré-definido o número

de clusters (classes). No caso deste trabalho, optou-se pela utilização do fator

de similaridade, em vez da distância Euclidiana, que indica o quanto um padrão

apresentado é similar a um cluster existente. A similaridade alta classifica

aquele padrão como parte do referente cluster; e similaridade abaixo de um

mínimo definido obriga a criação de um novo cluster que represente aquele

padrão.

O fator de similaridade dj entre a entrada xi e o vetor de pesos do neurônio j é

dado por:

( )1j i ji jid x w w= − − , (3.6)

em que i é o número da entrada. O fator de similaridade é calculado para cada

neurônio j existente, sendo que os valores do primeiro padrão apresentado à

rede são assumidos como os pesos do primeiro neurônio que é criado.

Maiores detalhes sobre os experimentos serão dados quando forem

apresentados os resultados.

91

CAPÍTULO 5 RESULTADOS

Neste capítulo serão apresentados e analisados os principais resultados dos

experimentos descritos no capítulo anterior. Os resultados serão separados por

técnica.

5.1 Árvore de Decisão com algoritmo J48

Nos experimentos realizados com a Árvore de Decisão, deu-se mais

importância às classificações das tempestades de maior intensidade -

tempestades intensas e super-tempestades - cujos efeitos podem ser mais

prejudiciais que as de intensidade menor.

Todos os sinais utilizados nos experimentos foram atenuados e com resolução

horária. Portanto, quando é dito ‘instante’, refere-se ao ponto horário; quando é

dito instante t-1, refere-se à hora anterior ao instante t, e assim em diante.

Os resultados podem ser analisados através do conjunto de regras gerado pela

DT (ou parte dele) e da Matriz de Confusão gerada com os conjuntos de

treinamento e teste.

A Matriz de Confusão é formada pela relação dos diferentes rótulos utilizados

nos dados - arranjados na última coluna à direita - e pelas classes (que são os

próprios rótulos) às quais a DT atribuiu cada padrão apresentado, de acordo

com as regras geradas no treinamento – que estão na primeira linha de cima

para baixo. A célula resultante do cruzamento de um rótulo r com uma classe r

contém o número de padrões rotulados por r e classificados corretamente

como r, pelo conjunto de regras gerado. Ou seja, podem ser considerados

classificações corretas, o número de padrões exibidos na diagonal principal da

matriz, sendo os demais valores, classificações errôneas.

A TABELA 5.1 mostra um exemplo de Matriz de Confusão, na qual é destacado

o resultado em que 105 padrões rotulados como moderada foram classificados

como moderada (ou seja, corretamente classificados); dos demais padrões

92

rotulados como moderada, 10 foram classificados erroneamente como

ausência e 8 como fraca. E ainda, foram classificados erroneamente como

moderada: 6 padrões rotulados como ausência, 13 como fraca e 3 como

intensa. Todos os números da matriz somam 718 padrões, e os da diagonal

principal somam 601 padrões, o que significa que o conjunto de regras gerado

para esse exemplo obteve, aproximadamente, 83% de acertos na classificação.

TABELA 5.1. Exemplo de Matriz de Confusão e sua estrutura.

CLASSES

a b c d e

286 16 6 1 0 |a = ausência

56 187 13 0 1 |b = fraca

10 8 105 0 0 |c = moderada

2 1 3 13 0 |d = intensa

0 0 0 0 10 |e = super

RÓ

TU

LO

S

5.1.1 Resultado DT I: utilizando Bx, By e Bz

O primeiro resultado obtido com o algoritmo J48 foi em um experimento que

utilizou como atributos de entrada as três componentes do IMF – Bx, By e Bz -

nos instantes de tempo t, t-1 e t-2, e a classe Dst no instante t gerada pelo

CRITÉRIO I (TABELA 4.3 do CAPÍTULO 4). Parte do conjunto de regras

gerado com o conjunto de treinamento (mês completo de Novembro de 2003)

está na TABELA 5.2 e a Matriz Confusão na TABELA 5.3, com 83% de acerto

na classificação para todos os padrões e 100% de acerto na classificação dos

padrões que indicaram as super-tempestades (Muralikrishna et al., 2005 e

2006).

Com o experimento foi possível observar, através de uma série de testes, que

as regras foram iniciadas sempre com o valor de Bz como base. Isso foi de

encontro à conclusão de Gonzalez e Tsurutani (1987) de que o valor dessa

93

componente é o parâmetro que mais colabora na previsão de tempestades

geomagnéticas.

TABELA 5.2. Parte das regras geradas pelo treinamento I.

bz-2 <= -6.04952

| bx-2 <= 1.844782: super (11.0/1.0)

| bx-2 > 1.844782

| | bx-2 <= 5.354289: moderada (7.0/1.0)

| | bx-2 > 5.354289: intensa (3.0)

bz-2 > -6.04952

| bx-1 <= -1.983987

| | bz-1 <= 3.348733

Na fase de teste (realizada com o mês de Outubro de 2003), observou-se a

classificação correta de 12 dos 23 padrões rotulados como super-tempestades

(sendo 9 desses 23 classificados como ‘moderada’). Pode-se observar a Matriz

de Confusão, gerada na fase de teste, na TABELA 5.4.

TABELA 5.3. Matriz de Confusão gerada com o conjunto de treinamento I.

a b c d e

286 16 6 1 0 |a = ausência

56 187 13 0 1 |b = fraca

10 8 105 0 0 |c = moderada

2 1 3 13 0 |d = intensa

0 0 0 0 10 |e = super

TABELA 5.4. Matriz de Confusão gerada com o conjunto de teste I.

a b c d e

200 72 46 13 1 |a = ausência

69 54 34 9 1 |b = fraca

80 60 34 6 9 |c = moderada

18 8 9 1 0 |d = intensa

3 2 1 0 12 |e = super

94

Observou-se que a classificação obtida pelo conjunto de teste não apresentou

a mesma qualidade do apresentado pelo conjunto de treinamento. A análise

das Matrizes de Confusão e do conjunto de regras chamou atenção a um

possível motivo na falha das regras que classificaram incorretamente as

tempestades intensas e super: as condições das componentes do IMF na fase

inicial de uma tempestade magnética podem estar sendo associadas a valores

altos de índice geomagnético, devido ao aumento súbito que este sofre no

início do processo. E isso, consequentemente classifica erroneamente o que

seria uma tempestade à ausência de perturbação.

5.1.2 Resultado DT II: Bx, By e Bz com variação nos dados

A alteração sugerida deste conjunto de experimentos em diante foi em relação

ao conjunto de dados escolhidos para o treinamento e testes. Foram utilizados

períodos de eventos isolados de tempestades como conjunto de treinamento -

DATA5, DATA6, DATA7 e DATA8 (vide TABELA 4.1 do CAPÍTULO 4) - e

meses completos de dados para o teste - DATA9 e DATA10.

Como atributos foram utilizados Bx, By e Bz em instantes t-1 e t-2, mantendo o

Dst em instante t como atributo-classe. Neste experimento, no entanto, utilizou-

se o CRITÉRIO III para a definição dos rótulos (valores nominais do atributo-

classe).

Mais uma vez a componente Bz mostrou-se influente no comportamento do

índice Dst, prevendo tempestades do tipo intensa quando assume valores

inferiores a -11.7 nT, como pode ser visto em parte das regras da TABELA 5.5.

TABELA 5.5. Parte do conjunto de regras gerados no treinamento IIa.

bz-2 <= 7.36

| bz-2 <= -5.03

| | bz-2 <= -11.7: i (5.0)

Observando a Matriz de Confusão gerada no treinamento (TABELA 5.6),

percebe-se a classificação correta de aproximadamente 97.5% dos padrões e

95

aproximadamente 93% de acerto na classificação das tempestades intensas.

Apesar do alto percentual, as demais regras que classificaram os 25 valores de

tempestade intensa (ou seja, os 30 instantes classificados corretamente

decrescidos dos 5 presentes na regra da TABELA 5.5) não são regras

pertinentes, já que associam valores altos de Bz às tempestades intensas.

TABELA 5.6. Matriz de Confusão gerada com o conjunto do treinamento IIa.

a b c

650 1 2 |a = f

14 43 0 |b = m

2 0 30 |c = i

A Matriz de Confusão gerada no teste (TABELA 5.7) comprova essa conclusão,

uma vez que 7 tempestades intensas foram classificadas como intensa

obedecendo à regra de ‘bz-2’ assumir valores inferiores a -11.7 nT. Salienta-se

que o algoritmo J48 não permite, quando realizado um teste, a verificação das

regras que geraram as classificações corretas e errôneas. Sendo assim, a

associação realizada das classificações corretas à regra da TABELA 5.5 só foi

possível devido a uma verificação independente ao algoritmo J48.

TABELA 5.7. Matriz de Confusão gerada com o conjunto do teste IIa.

a b c

617 14 2 |a = f

49 9 1 |b = m

19 0 7 |c = i

A influência da componente By foi observada em alguns dos experimentos,

como o que será descrito a seguir, em que foram utilizados mais uma vez as

três componentes do IMF. Neste caso Bx, By e Bz foram utilizados em instantes

t-1 e t-2, os rótulos foram gerados com o CRITÉRIO I, e ainda o conjunto de

treinamento (formado por DATA5, DATA6, DATA7 e DATA8) foi diferente ao

utilizado no primeiro experimento realizado com as três componentes.

96

Como pode ser visto na parte inicial das regras que é exibida na TABELA 5.8,

as regras do exemplo combinam critérios envolvendo ‘by-2’ e ‘bz-1’,

classificando 3 super-tempestades com as condições ‘bz-1’ <= -20.55nT e ‘by-

1’ <= -6.59nT.

TABELA 5.8. Parte das regras geradas no treinamento IIb.

by-1 <= 17.48

| bz-1 <= -12.66

| | bz-1 <= -20.55

| | | by-1 <= -6.59: s (3.0/1.0)

Pela Matriz de Confusão do treinamento (TABELA 5.9), observa-se que não

foram todas as super-tempestades que se aplicaram a essa regra, já que o

total era de 8. No entanto, a Matriz de Confusão de teste (TABELA 5.10)

mostra que 2 super-tempestades foram classificadas corretamente e verificou-

se, independentemente ao algoritmo J48, que as duas super-tempestades

obedecem às regras da TABELA 5.8.

TABELA 5.9. Matriz de Confusão gerada no treinamento IIb.

a b c d e

227 5 7 1 0 |a = a

29 104 21 3 0 |b = f

3 8 162 1 0 |c = m

4 1 4 73 1 |d = i

0 0 1 1 8 |e = s

TABELA 5.10. Matriz de Confusão gerada no teste IIb.

a b c d e

266 87 117 25 0 |a = a

48 44 45 1 0 |b = f

7 5 46 1 0 |c = m

3 11 18 0 0 |d = i

0 0 1 0 2 |e = s

97

5.1.3 Resultado DT III: utilizando Bz e Vp

Observou-se um resultado interessante em um dos experimentos, no qual

foram utilizados dois parâmetros como atributos de entrada: Bz e Vp, ambos no

instante t-1.

Analisando uma parte das regras criadas (TABELA 5.11) e olhando para a

Matriz de Confusão gerada pelo conjunto de treinamento (TABELA 5.12),

observa-se que, apesar do baixo percentual de acertos (aproximadamente

69,9%), os 5 instantes que indicam super-tempestades foram classificados com

100% de acerto. A regra que classifica 2 destes 5 instantes foi estabelecida em

casos em que a velocidade de prótons registra, uma hora antes daquele

instante, valores superiores a 930 km/s; no mesmo grupo é possível observar

26 instantes das tempestades do tipo intensa sendo previstas para valores

superiores a 572 km/s, sendo 22 destes para valores entre, aproximadamente,

683km/s e 930 km/s.

Dois testes para o conjunto de regras citado foram realizados com os conjuntos

DATA9 e DATA10, sendo que o primeiro classificou corretamente 5 dos 7

instantes de super-tempestades (2 foram classificados como intensas); e o

segundo teve 100% de acerto na classificação das super-tempestades, como

pode ser visto em (a) e (b), respectivamente, da TABELA 5.13.

TABELA 5.11. Parte do conjunto de regras gerados no treinamento III.

vp-2 > 500.23

| vp-2 <= 582.29

| | bz-2 <= -7.84

| | | vp-2 <= 562.23: i (5.0/1.0)

| | | vp-2 > 562.23

| | | | vp-2 <= 572.62: s (3.0)

| | | | vp-2 > 572.62: i (4.0)

| vp-2 > 582.29

| | vp-2 > 683.43

| | | vp-2 <= 930.59: i (22.0)

| | | vp-2 > 930.59: s (2.0)

98

TABELA 5.12. Matriz de Confusão gerada com o conjunto do treinamento III.

a b c d e

184 8 12 2 0 |a = a

69 68 11 0 0 |b = f

27 28 111 7 0 |c = m

3 8 10 61 0 |d = i

0 0 0 0 5 |e = s

TABELA 5.13. Matrizes de Confusão geradas no 1º (a) e no 2º(b) testes III.

a b c d e

400 19 60 16 0 |a = a

84 19 44 12 0 |b = f

23 9 22 3 0 |c = m

0 0 1 24 0 |d = i

0 0 0 2 5 |e = s

(a)

a b c D e

448 12 34 2 0 |a = a

86 29 23 0 0 |b = f

20 11 27 1 0 |c = m

2 5 5 11 0 |d = i

0 0 0 0 3 |e = s

(b)

5.1.4 Resultado DT IV: utilizando Bz

Uma outra tentativa de obter regras relevantes para a ocorrência de

tempestades intensas ou super-tempestades foi a de utilizar como atributos de

entrada somente valores da componente que está mais ligada à ocorrência de

tempestades geomagnética, Bz, em três diferentes instantes de tempo (t-1, t-2

e t-3), semelhante ao que foi realizado no experimento da Seção 5.1.1. Desta

99

vez, no entanto, os conjuntos de dados de treinamento e teste seguiram a

opção do último experimento.

A TABELA 5.14, que mostra a Matriz de Confusão gerada pelo treinamento,

mostra que, apesar do baixo percentual de acertos (58%), foram classificadas

corretamente 4 das 10 instâncias rotuladas como super-tempestades, e 5 do

total foram classificadas como intensas.

TABELA 5.14. Matriz de Confusão gerada pelo treinamento IV.

a b c d e

186 25 26 0 0 |a = a

55 62 38 2 0 |b = f

56 21 95 1 0 |c = m

19 11 11 41 1 |d = i

1 0 0 5 4 |e = s

Um fator importante observado neste experimento foi um subconjunto isolado

de regras que descreveram a ocorrência de super-tempestades e de

tempestades intensas, como pode ser visto na TABELA 5.15, pelas condições

‘bz-1’ menor ou igual a -38.95 nT e ‘bz-1’ com valores entre -14.31 e -38.95 nT.

A verificação das classificações corretas das tempestades do tipo super e

intensa, mostradas nas Matrizes de Confusão geradas pelo 1º e pelo 2º

conjuntos de teste (TABELA 5.16), confirmou a pertinência da regra ‘bz-1’ entre

-14.31 nT e -38.95 nT como causadora de tempestades geomagnéticas

intensas (3 no primeiro teste e 4 no segundo teste).

TABELA 5.15. Parte do conjunto de regras do treinamento IV.

bz-1 <= -7.84

| bz-1 <= -14.31

| | bz-1 <= -38.95: s (2.0)

| | bz-1 > -38.95: i (23.0/5.0)

100

TABELA 5.16. Matrizes de Confusão geradas no 1º (a) e no 2º(b) testes IV.

a b c d e

299 126 63 4 1 |a = a

73 59 23 4 0 |b = f

20 14 21 2 0 |c = m

4 4 6 11 0 |d = i

1 0 0 4 2 |e = s

(a)

a b c d e

328 135 26 5 0 |a = a

42 72 21 2 1 |b = f

16 34 6 3 0 |c = m

14 0 3 6 0 |d = i

0 0 0 3 0 |e = s

(b)

5.1.5 Resultado DT V: Bz e Dst

Um último resultado obtido com a DT, cuja qualidade nos resultados já estava

sendo esperada, foi utilizando o índice Dst também como parâmetro, ou seja,

como um dos atributos de entrada, que foram Bz e Dst em instante t-1.

As classes de Dst utilizadas para esse experimento foram as geradas pelo

CRITÉRIO II (TABELA 4.3 do CAPÍTULO 4). Este apresentou uma boa

classificação não somente das super-tempestades, como das outras duas

classes com uma porcentagem de acertos no treinamento de 97% (como pode

ser visto na Matriz de Confusão da TABELA 5.18) e nos dois testes de 99%,

como pode ser visto nas Matrizes de Confusão da TABELA 5.19. Neste

experimento, o treinamento gerou um conjunto com muito menos regras que

nos outros experimentos, como pode ser observado no conjunto completo que

foi colocado na TABELA 5.17.

101

TABELA 5.17. Conjunto completo de regras geradas no treinamento V.

dst-1 <= -77

| dst-1 <= -193

| | dst-1 <= -228: s (16.0)

| | dst-1 > -228

| | | bz-1 <= -19.85: s (5.0)

| | | bz-1 > -19.85: i (9.0/1.0)

| dst-1 > -193: i (100.0/1.0)

dst-1 > -77: f (538.0/17.0)

TABELA 5.18. Matriz de Confusão gerada no treinamento V.

a b c

521 0 0 |a = f

17 107 0 |b = i

0 2 21 |c = s

TABELA 5.19. Matrizes de Confusão geradas no 1º (a) e no 2º (b) testes V.

a b c

692 0 0 |a = f

7 35 0 |b = i

0 0 9 |c = s

(a)

a b c

676 1 0 |a = f

4 31 0 |b = i

0 1 6 |c = s

(b)

O experimento, como esperado, apresentou ótimo percentual de acertos,

gerando regras já previstas para o Dst e comprovando as regras observadas

para o Bz nos outros experimentos relacionados anteriormente.

102

5.1.6 Outros experimentos

Além dos experimentos com a utilização de parâmetros com valores discretos

como atributos de entrada, também foram realizados experimentos com dados

nominais tanto como atributos de entrada como no atributo-classe. No entanto,

esses resultados não serão apresentados por não terem apresentado boa

qualidade.

Nos experimentos com a DT, percebeu-se que nas regras geradas poderia

haver uma falha na classificação nos pontos de início das tempestades, já que

o Dst sofre um acréscimo súbito nesta fase. A outra ‘confusão’ nas regras pode

ter sido gerada devido à duração da fase de recuperação das tempestades,

que não está associada a perturbações nas componentes do campo magnético

interplanetário. Neste caso, uma tempestade poderia estar no início da fase de

recuperação – ou seja, ainda com o índice Dst assumindo valores muito baixos

- quando, uma hora antes, a componente Bz, por exemplo, já teria recuperado

para a sua faixa normal de valores.

A TABELA 5.20 mostra um exemplo de conjunto de regras geradas que

descreve essa situação, em que tempestades intensas, ao contrário do

esperado, são classificadas na condição de ‘bz-1’ assumir valores superiores a

17.85 nT.

TABELA 5.20. Subconjunto de regras ‘confusas’.

bz-2 > 5.42

| | bz-1 <= 17.85

| | | bz-1 <= 2.52: a (2.0/1.0)

| | | bz-1 > 2.52

| | | | bz-3 <= 5.17

| | | | | bz-2 <= 6.67

| | | | | | bz-2 <= 6.09: a (3.0/1.0)

| | | | | | bz-2 > 6.09: i (2.0)

| | | | | bz-2 > 6.67: a (2.0)

| | | | bz-3 > 5.17: m (32.0/17.0)

| | bz-1 > 17.85: i (9.0)

103

5.2 RNA MLP com algoritmo backpropagation

Previsões com alto grau de correlação foram obtidos desde os primeiros

experimentos realizados com a RNA MLP. (Muralikrishna et al., 2008a e 2008b)

Os principais resultados serão exibidos através de gráficos comparativos

gerados na fase de teste, ou seja, para períodos distintos aos utilizados

durante a fase de treinamento, com a sobreposição dos sinais de valores

desejados com os obtidos pela rede. Os resultados serão ainda avaliados

calculando-se o coeficiente de correlação linear ( ρ ), a variância relativa média

(ARV) e a raiz quadrada do erro quadrático médio (RMSE), descritos no

CAPÍTULO 4.

Cada um dos experimentos gerou diferentes resultados ao se alterar os

conjuntos de treinamento e teste e o número de iterações no treinamento.

Portanto, entre eles, o melhor resultado será descrito.

5.2.1 Resultado MLP I: previsão com 1 hora de antecedência

Os experimentos que geraram os melhores resultados foram os realizados para

previsão com uma hora de antecedência.

Uma das primeiras combinações testadas, de forma a investigar a relação de

By (observada nos experimentos com a DT) e comprovar a relação de Bz na

ocorrência de tempestades geomagnéticas, foram com Bz, By e Dst em

instantes t-1 e t-2, utilizando como dados para o conjunto de treinamento os

períodos DATA1, DATA2, DATA3 e DATA7 (vide TABELA 4.1 do CAPÍTULO

4), e como dados para teste, o mês completo de Setembro de 1999, ou DATA4.

O resultado pode ser observado no gráfico da FIGURA 5.1 e nas medidas da

TABELA 5.21.

104

100 200 300 400 500 600 700-300

-250

-200

-150

-100

-50

0

50

Tempo(horas)

Dst

(n

T)

(01/09/1999 a 30/09/1999)

desejado

obtido

FIGURA 5.1. Resultado I-a: mês de Setembro de 1999.

TABELA 5.21. Resultado I-a: Medidas para análise da qualidade do resultado.

Conjunto de Treinamento DATA1, DATA2, DATA3, DATA7

Parâmetros de Entrada Bz, By e Dst em t-1 e t-2

Coeficiente de Correlação ~ 0.97

% de Eficiência na Previsão ~ 88.5%

RMSE ~ 8 nT

O mesmo conjunto de parâmetros foi treinado desta vez com o mês de

Setembro de 1999 (previsto na FIGURA 5.1) e apresentou melhores

resultados. Um deles pode ser visto no gráfico da FIGURA 5.2, cuja avaliação

pode ser realizada pela TABELA 5.22.

105

100 200 300 400 500 600 700-300

-250

-200

-150

-100

-50

0

50

Tempo(horas)

Dst

(n

T)

(01/10/2000 a 31/10/2000)

desejado

obtido

FIGURA 5.2. Resultado I-b: mês de Outubro de 2000.

TABELA 5.22. Resultado I-b: Medidas para análise da qualidade do resultado.

Conjunto de Treinamento DATA4

Parâmetros de Entrada Bz, By e Dst em t-1 e t-2



RMSE ~ 7 nT

Os próximos dois gráficos (FIGURA 5.3 e FIGURA 5.4) representam os

resultados obtidos com a utilização da componente Bz e Dst em instantes t-1 e

t-2. Como esperado, eles mostram uma previsão de boa qualidade. O primeiro

resultado (FIGURA 5.3 e TABELA 5.23) pode ser comparado ao representado

pela FIGURA 5.2 e TABELA 5.22. Observa-se, no resultado obtido sem a

utilização do By, uma melhora significativa melhora na eficiência da previsão.

106

100 200 300 400 500 600 700-300

-250

-200

-150

-100

-50

0

50

Tempo(horas)

Dst

(n

T)

(01/10/2000 a 31/10/2000)

desejado

obtido

FIGURA 5.3. Resultado I-c: mês de Outubro de 2000.

TABELA 5.23. Resultado I-c: Medidas para análise da qualidade do resultado.

Conjunto de Treinamento DATA1, DATA2 e DATA3

Parâmetros de Entrada Bz e Dst em t-1 e t-2



RMSE ~ 6 nT

107

100 200 300 400 500 600 700-300

-250

-200

-150

-100

-50

0

50

Tempo(horas)

Dst

(n

T)

(01/09/2002 a 30/09/2002)

desejado

obtido

FIGURA 5.4. Resultado I-d: mês de Setembro de 2002.

TABELA 5.24. Resultado I-d: Medidas para análise da qualidade do resultado.


Parâmetros de Entrada Bz e Dst em t-1 e t-2


% de Eficiência na Previsão ~ 97%

RMSE ~ 5 nT

Para então investigar a influência da componente By independentemente à Bz,

optou-se por utilizá-lo como parâmetro de entrada, junto somente do Dst. O

resultado comprova a grande influência de By no comportamento do índice Dst

como pode ser visto claramente no gráfico da FIGURA 5.5 e na TABELA 5.25.

108

100 200 300 400 500 600 700-300

-250

-200

-150

-100

-50

0

50

Tempo(horas)

Dst

(n

T)

(01/04/2000 a 30/04/2000)

desejado

obtido

FIGURA 5.5. Resultado I-e: mês de Abril de 2000.

TABELA 5.25. Resultado I-e: Medidas para análise da qualidade do resultado.


Parâmetros de Entrada By e Dst em t-1 e t-2



RMSE ~ 8 nT

Os resultados realizados com o parâmetro Velocidade de Prótons (Vp) em

conjunto com a componente Bz do IMF e o índice Dst, como entradas da rede,

geraram resultados satisfatórios, porém inferiores aos obtidos somente com o

Bz e o Dst. Nota-se, no entanto, olhando para a TABELA 5.26, que o resultado

apresentou um ótimo grau de correlação entre os dois sinais, o que indica que

ambos apresentaram um grande grau de inter-relacionamento ao longo de

todos os padrões. O alto valor de erro, então, pode ser justificado pelo

109

deslocamento observado na sobreposição esperada entre eles, podendo esta

situação ser observada no gráfico da FIGURA 5.6.

100 200 300 400 500 600 700-300

-250

-200

-150

-100

-50

0

50

Tempo(horas)

Dst

(n

T)

(01/09/2002 a 30/09/2002)

desejado

obtido

FIGURA 5.6. Resultado I-f: mês de Setembro de 2002.

TABELA 5.26. Resultado I-f: Medidas para análise da qualidade do resultado.


Parâmetros de Entrada Vp, Bz e Dst em t-1,e t-2



RMSE ~ 15 nT

Para tentar verificar se a dimensão do histórico dos parâmetros de entrada

geraria melhoria na qualidade da previsão, optou-se por utilizar esses

parâmetros de um instante anterior (t-1) até, incrementando, 4 instantes

anteriores (t-4). Os experimentos, em que foi utilizado apenas um instante

110

anterior – Bz e Dst em instante t-1 – não geraram melhores resultados

comparados com os que utilizaram dois, exibidos nos experimentos acima.

Comparando-se os gráficos e tabelas dos resultados que utilizaram dois

instantes anteriores de Bz e Dst (FIGURA 5.3 e TABELA 5.23) e By e Dst

(FIGURA 5.5 e TABELA 5.25) com os que utilizaram três instantes anteriores

dos mesmos parâmetros (FIGURA 5.7 e TABELA 5.27, e FIGURA 5.8 e

TABELA 5.28, respectivamente), não se observa alterações relevantes.

Da mesma forma, foi testado o acréscimo de valores observados em instantes

anteriores como entrada para ambos os conjuntos de parâmetros, sem obter

alterações relevantes nos resultados, mostrando que os valores que

ultrapassam de 2 horas de antecedência, em princípio, não colaboram com o

aumento da qualidade da previsão.

100 200 300 400 500 600 700-300

-250

-200

-150

-100

-50

0

50

Tempo(horas)

Dst

(n

T)

(01/10/2000 a 31/10/2000)

desejado

obtido

FIGURA 5.7. Resultado I-g: mês de Outubro de 2000.

111

TABELA 5.27. Resultado I-g: Medidas para análise da qualidade do resultado.


Parâmetros de Entrada Bz e Dst em t-1, t-2 e t-3



RMSE ~ 6 nT

100 200 300 400 500 600 700-300

-250

-200

-150

-100

-50

0

50

Tempo(horas)

Dst

(n

T)

(01/10/2000 a 31/10/2000)

desejado

obtido

FIGURA 5.8. Resultado I-h: mês de Outubro de 2000.

TABELA 5.28. Resultado I-h: Medidas para análise da qualidade do resultado.


Parâmetros de Entrada By e Dst em t-1, t-2 e t-3


% de Eficiência na Previsão ~ 96%

RMSE ~ 6 nT

112

Foram realizados, para a previsão com 1 hora de antecedência, outros

experimentos que não apresentaram bons resultados.

5.2.2 Resultado MLP II: previsão com 2 horas de antecedência

Para a previsão com duas horas de antecedência, optou-se pelos parâmetros

de entrada que trouxeram os melhores resultados no primeiro conjunto de

experimentos, previsão com uma hora, ou seja, By, Bz e Dst.

Entre as combinações, o melhor resultado foi obtido utilizando como

parâmetros de entrada a componente Bz e o índice Dst em instantes t-2, t-3 e t-

4 e como parâmetros de saída o índice Dst no instante t. O gráfico da FIGURA

5.9 mostra a previsão do mês para essa configuração, que teve como medidas,

os valores da TABELA 5.29.

100 200 300 400 500 600 700-300

-250

-200

-150

-100

-50

0

50

Tempo(horas)

Dst

(n

T)

(01/10/2000 a 31/10/2000)

desejado

obtido

FIGURA 5.9. Resultado II: mês de Outubro de 2000.

113

TABELA 5.29. Resultado II: Medidas para análise da qualidade do resultado.


Parâmetros de Entrada Bz e Dst em t-2, t-3 e t-4



RMSE ~ 10 nT

Apesar da componente By ter apresentado bons resultados nos experimentos

de previsão com uma hora de antecedência, nestes os resultados foram bem

inferiores aos obtidos com os outros dois parâmetros.

Os experimentos de previsão com mais de 2 horas de antecedência

apresentaram uma baixa eficiência nos resultados, abaixo de 60%. Esse

comportamento nos resultados leva à conclusão que o processo que inicia no

distúrbio dos sinais interplanetários e termina na perturbação do campo

geomagnético leva em torno de 2 horas; em outras palavras, o índice

geomagnético leva em torno de 2 horas para responder ao avanço de

estruturas e à entrada de energia e matéria na magnetosfera.

5.2.3 Comparação de Resultados obtidos com a rede MLP

Wu e Lundstedt (1996) utilizaram uma Rede Neural Elman para a previsão do

índice Dst com 1 hora de antecedência e obtiveram a 85% de eficiência na

previsão (ARV de 0.15) e um coeficiente de correlação entre o Dst observado e

o previsto pela rede de 0.92.

Mais tarde, Wu e Lundstedt (1997) avançaram o seu estudo para a previsão do

Dst com 2 horas de antecedência. Obtiveram como resultado uma eficiência na

previsão de 82%, chegando a obter 0.90 de coeficiente de correlação entre os

dois sinais.

114

Kugblenu et al. (1999) utilizaram uma RNA MLP com treinamento

backpropagation para realizar a previsão do índice Dst com uma hora de

antecedência. Como entradas, foram apresentados os parâmetros

interplanetários B total e Bz do IMF e a Pressão Dinâmica – calculada em

função da Densidade e da Velocidade de prótons do vento solar – em instante

t-3, e Dst em instante t-1, t-2 e t-3, estando a saída desejada Dst no instante t.

O melhor resultado conseguido no trabalho foi a previsão de uma tempestade

(ocorrida em 19 de Dezembro de 1980), com ARV de 0.04, ou seja, com 96%

de eficiência e RMSE de 11 nT. Um outro evento gerou um coeficiente de

correlação de 0.96.

Verificou-se na previsão do índice Dst realizado no presente trabalho uma

qualidade superior aos obtidos por Wu e Lundstedt (1996 e 1997) e

semelhantes aos obtidos por Kugblenu et al. (1999).

5.3 Mapa Auto-Organizável de Kohonen

Os resultados obtidos com a rede SOM serão apresentados por clusters

representativos, através das observações do acréscimo (ou decréscimo) do

sinal e da cor com a qual o sinal foi plotado. Um exemplo de cluster está

ilustrado na FIGURA 5.10, em que está indicado o número do cluster no canto

superior direito, os três valores dos pesos representativos do cluster em

instantes t-1, t-2 e t-3, e duas linhas horizontais tracejadas que indicam, com

um limite inferior e outro superior, a faixa dentro da qual o parâmetro plotado

assume valores considerados normais.

Considerando que os pesos que compõem os clusters são valores

representativos dos parâmetros de entrada da rede, que estão em instantes t-1,

t-2 e t-3, eles são plotados com cores que representam a intensidade do índice

Dst medido no instante t. As cores seguem os critérios de classificação da

TABELA 4.3 (CAPÍTULO 4). Por exemplo, no caso do CRITÉRIO III, como no

conjunto de clusters da FIGURA 5.11, estão representados nas cores: ciano, os

clusters associados a índices que indicam tempestade fraca ou a ausência de

115

perturbação; em verde, os associados a tempestades moderadas, e em

vermelho, os associados a tempestades intensas ou super-tempestades.

-30

-20

-10

0

10

20

30

319

Bz

(nT

)

t-3t-3t-3t-3t-2t-2t-2t-2

t-1t-1t-1t-1

FIGURA 5.10. Exemplo da representação de um cluster.

Um dos resultados relevantes obtidos com a rede SOM foi utilizando a

componente Bz em três instantes t-3, t-2 e t-2 como entrada. O algoritmo gerou,

para um fator de similaridade de 0.75, os 319 clusters apresentados na

FIGURA 5.11.

Nota-se que os únicos clusters que representam o decréscimo da componente

Bz, ao longo das 3 horas, para valores abaixo do normal – os de número 215,

216, 281 e 282 - estão indicados pela ocorrência de tempestades do tipo

intensa ou super (cor vermelha) e assumiram os valores:

116

TABELA 5.30. Valores representativos do decréscimo de Bz nos instantes que antecedem a ocorrência de tempestades intensas ou super-tempestades.

CLUSTER Nº Bz-3 Bz-2 Bz-1

215 12 0 -15

216 0 -15 -28

281 21 8 -9

282 8 -9 -9

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36

37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54

55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72

73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90

91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108

109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126

127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144

145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162

163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180

181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198

199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216

217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234

235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252

253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270

271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288

289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306

FIGURA 5.11. Clusters para entradas Bz.

Um experimento semelhante ao primeiro, com o CRITÉRIO III de classificação

do Dst, utilizando três instantes de tempo da componente By foi realizado. Parte

dos 347 clusters gerados é exibida na FIGURA 5.12.

117

251 252 253 254 255 256 257 258 259 260 261 262 263 264 265

270 271 272 273 274 275 276 277 278 279 280 281 282 283 284

289 290 291 292 293 294 295 296 297 298 299 300 301 302 303

308 309 310 311 312 313 314 315 316 317 318 319 320 321 322

327 328 329 330 331 332 333 334 335 336 337 338 339 340 341

346 347

FIGURA 5.12. Parte dos clusters gerados para entradas By.

Nota-se, neste caso, que três clusters representam a queda visível do By para

valores abaixo do normal – os de número 255, 308 e 341. Entre eles um deles

indica a ocorrência de tempestade moderada (341), enquanto os outros dois

indicam a ocorrência de tempestade intensa ou super. Os valores são

representados na TABELA 5.31.

TABELA 5.31. Valores representativos do decréscimo de By nos instantes que antecedem a ocorrência de tempestades moderadas e intensas (ou super-tempestades).

CLUSTER Nº By-3 By-2 By-1

255 24 5 -17

308 24 1 -40

341 23 -1 -17

Os resultados obtidos com o Mapa de Kohonen, mesmo que não tenham

oferecido regras exatas sobre o comportamento das componentes By e Bz na

ocorrência de tempestades, vão de encontro às relações encontradas com a

Árvore de Decisão, comprovando a influência do Bz e sugerindo a influência

também de By.

118

119

CAPÍTULO 6 CONCLUSÕES

Após o desenvolvimento dos experimentos apresentados e a análise dos

resultados, concluiu-se que:

a) A utilização da RNA MLP possibilitou a realização da tarefa de

previsão do índice geomagnético Dst, foco principal deste trabalho,

com alto percentual de eficiência, superando resultados obtidos em

outros trabalhos que utilizaram a mesma abordagem.

b) As árvores de Decisão possibilitaram a comprovação de relações já

conhecidas entre parâmetros interplanetários e o comportamento do

campo geomagnético e sugeriram ainda a influência de um parâmetro

novo do campo magnético interplanetário, que estudos anteriores não

cogitaram.

A técnica Árvore de Decisão mostrou-se uma ferramenta interessante à

descoberta de regras específicas para ocorrência de tempestades

geomagnéticas dos tipos intensa e super, uma vez que uma pequena parte do

conjunto de regras gerado no treinamento pode ser interessante, mesmo que o

conjunto como um todo não apresente um grande percentual de acertos na

classificação.

Alguns dos resultados da DT confirmaram a influência já conhecida da

componente Bz e levantaram a possível influência de By na ocorrência de


Algumas regras confirmaram também a importância da velocidade de prótons,

que sob alguns critérios, indicaram a ocorrência de tempestades intensas e

super.

E ainda, quando utilizados como um dos atributos de entrada o índice Dst, em

instantes anteriores, bons resultados foram obtidos, como já era esperado, com

regras previsíveis, que mostram que o comportamento prévio do índice

120

influencia o seu comportamento futuro, principalmente na fase de recuperação

de uma tempestade geomagnética.

Apesar dos interessantes resultados obtidos com a DT, alguns pontos fracos

foram observados nesta abordagem, como por exemplo, o fato do algoritmo

J48 não ter conseguido lidar com a não-linearidade, como ocorre, por exemplo,

na fase de recuperação das tempestades, em que o comportamento do IMF

volta ao normal mas o Dst ainda possui valores abaixo do normal, o que o fez

gerar regras confusas. Outro ponto foi o de não permitir facilmente a

conferência, na fase de testes, das regras que geraram as classificações

corretas. Essa tarefa foi realizada, portanto, à parte.

As influências sugeridas nos experimentos realizados com a DT foram

reforçadas pela rede SOM, que verificou decréscimos tanto na componente By

como na componente Bz, instantes antes da ocorrência de tempestades dos

tipos moderada, intensa e super.

A RNA MLP realizou a tarefa de previsão do índice Dst com grande percentual

de eficiência. Como esperado, os conjuntos de dados formados pela

componente Bz, junto com o índice Dst foram os que geraram melhores

resultados de previsão. Os resultados ainda mostraram grande eficiência de

previsão na utilização da componente By, junto ao Dst, como entradas, o que

vai de encontro à influência de By verificada pela DT e pela rede SOM.

As medidas de eficiência na previsão, RMSE e coeficiente de correlação

permitiram a comparação dos resultados do presente com outros que

abordaram a RNA como técnica para previsão do Dst, sendo que a previsão

realizada neste trabalho foi igual ou superior à realizada pelos outros para a

defasagem de 1 hora, e superior para a defasagem de 2 horas.

Em relação ao tempo de resposta do campo geomagnético a distúrbios

interplanetários registrados pelo satélite ACE, concluiu-se que o processo entre

a perturbação no IMF e a ocorrência de tempestades magnéticas gira em torno

121

de 1 a 2 horas, já que a utilização de valores em instantes anteriores a duas

horas e a previsão com mais de duas horas de antecedência não trouxeram

resultados melhores que os previstos para essas duas defasagens.

6.1 Contribuições

Este trabalho apresentou, como principais contribuições:

a) uma RNA, que realiza a previsão do índice geomagnético Dst,;

b) a sugestão da influência de mais um parâmetro do campo magnético

interplanetário - componente By – no comportamento do campo

geomagnético.

6.2 Sugestões para trabalhos futuros

Para dar continuidade à investigação de elementos que possam contribuir com

a ocorrência de tempestades utilizando Árvore de Decisão, sugere-se analisar

separadamente as diferentes intensidades de tempestades, concentrando-se,

por exemplo, somente nas dos tipos intensa ou super. Sugere-se ainda que o

algoritmo proposto permita discriminar de alguma forma as regras que geraram

classificações corretas na fase de testes.

A outra sugestão é trabalhar com dados já observados, com a aplicação de um

procedimento que permita apresentar os dados em janelas de tempo maiores,

em vez de ponto a ponto. O intuito é o de estudar a variação do

comportamento dos parâmetros interplanetários nos instantes que antecedem

a ocorrência de uma tempestade geomagnética, com o conhecimento prévio da

intensidade que ela atingirá na sua fase principal.

Sugere-se ainda a investigação mais profunda da influência da componente By

no comportamento do campo geomagnético, em diferentes fases do ciclo solar.

122

123

REFERÊNCIAS BIBLIOGRÁFICAS

ADVANCED COMPOSITION EXPLORER HOMEPAGE. Mission overview.

Disponível em http://www.srl.caltech.edu/ACE/ace_mission.html. Acesso em

Julho de 2008.

ANDRADE P. J. N. Sistemas especialistas de apoio ao diagnóstico em

medicina. Relações com o teorema de Bayes e com a lógica do raciocínio

diagnóstico. Arq Bras Cardiol 1999;v. 73, n.6, p. 537-543, 1999.

BELL, J. T.; GUSSENHOVEN, M. S.; MULLEN, E. G. Super Storms. Journal of

Geophysical Research – Space Physics, v. 102, no. A7, p. 14 189-14198, July

1997.

BIANCHI, R. A. C.; RIBEIRO, C. H. C. ; COSTA, A. H. R. . Heuristic Selection

of Actions in Multiagent Reinforcement Learning. In: INTERNATIONAL JOINT

CONFERENCE ON ARTIFICIAL INTELLIGENCE - IJCAI, 20.. Proceedings of

IJCAI 2007, Hyderabad: [s.n], 2007.

BRANDT, J.C. Introduction to the solar Wind. San Francisco: Freeman and

Company, 1970.

BRUECKNER, G. E.; HOWARD, R. A.; KOOMEN, M. J.; KORENDYKE, C. M.;

MICHELS, D. J.;MOSES, J. D.; SOCKER, D. G.; DERE, K. P.; LAMY, P. L.;

LLEBARIA, A.; BOUT, M. V.; SIMNETT, G. M.; BEDFORD, D. K.; EYLES, C. J.

The large angle spectroscopic coronograph (LASCO). Solar Phys. V. 162, p.

357-402,1995.

BURLAGA, L. F., SITTLER, E., MARIANI, F. e SCHWENN, R. Magnetic loop

behind na interplanetary shock: Voyager, Hélios and IMP-8 observations. J.

Geophys. Res., v. 86, n. A8, p. 6673-6684, Aug. 1981.

BURLAGA, L. F. Interplanetary Magnetohydrodynamics. New York: Oxford

University Press, 1995.

http://www.srl.caltech.edu/ACE/ace_mission.html

124

BURTON, R. K., MCPHERRON, R. L., RUSSELL, C. T. An Empirical

Relationship Between Interplanetary Conditions and Dst, J. Geophysics Res.

v.80: 4204 – 4214p, 1975.

DAL LAGO, A. GONZALEZ, W. D., CLUA DE GONZALEZ, A. L.; VIEIRA, L. E.

Compression of magnetic clouds interplanetary space and increase in their

geoeffectiveness. J. Atm. Solar Terr. Phys., v. 63, n. 5, p. 451-455, 2001.

DAL LAGO, A. GONZALEZ, W. D., CLUA DE GONZALEZ, A. L.; VIEIRA, L. E.

Stream-interacting magnetic clouds causing very intense geomagnetic storms.

Adv. Space Res., v. 30, n. 10, p. 2225-2229, 2002.

DAL LAGO, A. Estudo de estruturas geoefetivas no meio interplanetário e

de suas causas solares.. 2003. 211 p. (INPE-10298-TDI/917). Tese

(Doutorado em Geofísica Espacial) - Instituto Nacional de Pesquisas Espaciais,

São José dos Campos. 2003. Disponível em:

http://urlib.net/sid.inpe.br/jeferson/2003/06.30.13.23. Acesso em: 13 mar. 2009.

DIVISÃO DE GEOFÍSICA ESPACIAL (DGE). Pesquisa & Desenvolvimento.

Disponível em http://www.dge.inpe.br/pt/Pesqui_dessenv.htm. Acesso em

Outubro de 2008.

DUNGEY, J. W. Interplanetary Magnetic Field and the Auroral Zones. Physical

Reviews Letters, v. 6, p.47, 1961.

FAUSETT, L. Fundamentals of neural networks. Upper Saddle River: Prentice

Hall, 1994.

FENRICH, F. R. e LUHMANN, J. G. Geomagnetic response to magnetic clouds

of different polarity. J. Geophys. Res. v. 25, n.15, p. 2999-3002, Aug. 1998.

FREEMAN, J.; NAGAI, A.; REIFF; P. DENIG, W.; GUSSENHOVEN-SHEA, S.;

HEINEMANN, M.; RICH, F. e HAIRSTON, M. The use of neural networks to

predict magnetospheric parameters for input to a magnetospheric forecast

http://urlib.net/sid.inpe.br/jeferson/2003/06.30.13.23

http://www.dge.inpe.br/pt/Pesqui_dessenv.htm

125

model, in Proceedings of Artificial Intelligence Applications in Solar-

Terrestrial Physics Workshop in Lund Sweden September, 22-24, 1993, Eds.

J. A. Joselyn, H. Lundstedt and J. Trollinger, 167-181, 1993.

GLEISNER, H.; LUNDSTEDT, H. e WINTOFT, P. Predicting geomagnetic

storms from solar wind data using time-delay neural networks, Ann. Geophys.,

in press, 1996.

GOLDSTEIN, B. E. The solar wind. In: SUESS, S. T.; TSURUTANI, B. T. (ed.)

From the Sun (ed. Suess e Tsurutani), 1998, 73-80p.

GONZALEZ, W. D.; e TSURUTANI, B. T. Criteria of interplanetary parameters

causing intense magnetic storms (Dst < -100 nT). Planet. Space Sci., v.35, n.9,

p.1101-1109, jul. 1987.

GONZALEZ, W.D.; JOSELYN,J.A.; KAMIDE,Y.; KROÉL,H.W.; ROSTOKER,G.;

TSURUTANI,B.T.; VASYLIUNAS,V.M. What is a Geomagnetic Storm? Journal

of Geophyisical Research-Space Physics, v. 99, n. A4, 5771-5792p,1994.

GONZALEZ, W. D., TSURUTANI, B. T., CLUA DE GONZALEZ, A. L.

Interplanetary origin of geomagnetic storms. Space Sci. Rev. v. 88, p. 529-562,

1999.

GONZALEZ, W. D.; TSURUTANI, B. T.; LEPPING, R. P.; SCHWENN, R.

Interplanetary Phenomena Associated with Very Intense Geomagnetic Storms.

Journal of Atmospheric and Solar-Terrestrial Physics, v. 64, p. 173-181,

2002.

GOSLING, J. T.; MCCOMAS, D. J.; PHILLIPS, J. L.; BAME, S. J. Geomagnetic

activity associated with Earth passage of interplanetary shock disturbances and

coronal mass ejections. Journal of Geophysical Research – Space Physics,

v. 96, p. 7831, 1991.

126

GOSLING, J. T., S. J. BAME, S. J., MCCOMAS, D. J. e PHILLIPS J. L. Coronal

mass Ejections and large geomagnetic storms, Geophys. Res. Lett., 17, 901-

904, 1990.

HANNAH, I. G.; KRUCKER, S.; HUDSON, H. S.; CHRISTE, S.; LIN, R. P. An

intriguing solar microflare observed with RHESSI, Hinode, and TRACE. Astron.

Astrophys., 481 (1), L45-L48, 2008.

HAYKIN, S. Redes neurais: princípios e prática. Porto Alegre: Bookman, 2001.

HUGHES, W. J. The magnetopause, magnetotail, and magnetic reconnection.

In: Kivelson, M. G. e Russell, C. T. (ed.) Introduction to Space Physics, United

Kingdom: Cambridge University Press, p. 227-287, 1995.

HUNDHAUSEN, A. J. An introduction. In: Crooker, N., Joselyn, J. A., e

Feynman, J. (ed.) Coronal Mass Ejections, Washington, DC: AGU, 1997. v. 99,

p.1-7.

HUNDHAUSEN, A. J. The solar wind. In: Kivelson, M. G. e Russell, C. T. (ed.)

Introduction to Space Physics, United Kingdom: Cambridge University Press, p.

91-128, 1995.

INSTITUTE OF GEOPHYSICS AND PLANETARY PHYSICS. Magnetospheric

Physics Group. Disponível em

http://www.igpp.ucla.edu/mpg/lectures/mkivelson/faculty97/12solarwind.jpg.

Acesso em Outubro de 2008.

JACOBS, J. A., Geomagnetism, London: Academic Press, 1991.

JOSELYN, J. A. The human inpect of solar flares and magnetic storms. In:

From the Sun, ed. S. Suess, e B. T. Tsurutani, Amer. Geophys. Washington, D.

C.: Union Press, 1998.

KAMIDE Y.; McPHERRON, R. L.; GONZALEZ, W. D.; HAMILTON, D. C.;

HUDSON, H. S.; JOSELYN, J. A.; KAHLER, S. W.; LYONS, L. R.;

http://www.igpp.ucla.edu/mpg/lectures/mkivelson/faculty97/12solarwind.jpg

127

LUNDSTEDT, H.; SZUSZCZEWICZ, E. Magnetic storms: current understanding

and outstanding questions. In: Tsurutani, B. T.; W. D., Walter; Kamide, Y.;

Arballo, J. K. (ed.). Magnetic Storms, Geophysical Monograph 98,

Washington DC: American Geophysical Union (AGU), 1997. p. 1-19.

KAMIDE, Y.; YOKOYAMA, N.; GONZALEZ, W. D.; TSURUTANI, B. T.;

DAGLIS, I. A.; BREKKE, A.; MASUDA, S. Two steps development of

geomagnetic storms. Journal of Geophysical Research-Space Physics, v.

103, n. A4, p 6917-6921, 1998.

KUGBLENU, S.; TAGUCHI, S. e OKUZAWA, T. “Prediction of the geomagnetic

storm associated Dst index using an Artificial Neural Network algorithm”, Earth

Planets Space, vol. 51, pp. 307-313, Japan, 1999.

LIEMOHN, M. W.; KOZYRA, J. U.; THOMSEN, M. F.; ROEDER, J. L.; LU, G.;

BOROVSKY, J. E.; CAYTON, T. E. Dominant role of the asymmetric ring

current in producing the stormtime Dst. Journal of Geophysical Research-

Space Physics, v. 106, p. 10883-10904, 2001.

LUCAS, A. Estudo da dinâmica da corrente de anel durante a fase principal de

super-tempestades magnéticas. 2005-05-31. 256 p. (INPE-14214-TDI/1115).

Dissertação (Mestrado em Geofísica Espacial) - Instituto Nacional de

Pesquisas Espaciais, São José dos Campos. 2005. Disponível em:

<http://urlib.net/sid.inpe.br/mtc-m17@80/2007/06.13.11.46>. Acesso em: 23

set. 2008.

LUNDSTEDT, H. An inductive expert system for solar predictions, in

Proceedings of Solar-Terrestrial Prediction Workshop, in Leura Australia

October 16-20, 1989, Eds. Thomson, R. J., Cole, D. G., Wilkinson, P. J., Shea,

M. A., Smart, D. and Heckman, G., p. 125-129, 1990.

LUNDSTEDT, H. Neural networks and predictions of solar-terrestrial effects,

Planet. Space Sci., 40, 457-464, 1992.


128

LUNDSTEDT, H., Wintoft, P. Prediction of geomagnetic storms from solar wind

data with the use of a neural network, Ann. Geophysicae, 12, 19-24, 1994.

LUNDSTEDT, H.; SZUSZCZEWICZ, E. Magnetic storms: Current

understanding and outstanding questions. In: Tsurutani, B. T.; W. D., Walter;

Kamide, Y.; Arballo, J. K. (ed.). Magnetic Storms, Geophysical Monograph

98, Washington DC: American Geophysical Union (AGU), 1997. p. 1-19.

LUNDSTEDT, H. AI Techniques in geomagnetic storm forecasting. In:

Tsurutani, B.T., Gonzales, W.D., Kamide, Y., Arballo, J.K. (ed.), Magnetic

Storms. American Geophysical Union, Washington, DC: Geophysical

Monograph 98, pp. 243–252, 1997.

MALTSEV, Y. P. The point of controversy in magnetic storm study (a review).

In: “Physics of Aurora Phenomena”, Proc. XVIII Annual Seminar, Aapatity, p.

33-40, 2003.

MC PHERRON, R. L. Magnetospheric dynamics. In: Kivelson, M. G. e Russell,

C. T. (ed.) Introduction to space physics, United Kingdom: Cambridge

University Press, p. 400-458, 1995.

MURALIKRISHNA, A.; SANTOS, R. D. C.; DAL LAGO, A.; SILVA, J. D. S.

Busca de regras para previsão de tempestades geomagnéticas utilizando

técnica de mineração de dados. In: WORKSHOP DOS CURSOS DE

COMPUTAÇÃO APLICADA DO INPE, 5. (WORCAP), 2005, São José dos

Campos. Anais... São José dos Campos: INPE, 2005. CD-ROM, On-line.

Disponível em: <http://urlib.net/dpi.inpe.br/hermes2@1905/2005/10.03.15.35>.

Acesso em: 25 set. 2008.

MURALIKRISHNA, A.; SANTOS, R. D. C.; DAL LAGO, A.; SILVA, J. D. S.

Busca de regras para previsão de tempestades geomagnéticas utilizando

técnica de mineração de dados. In: WORKSHOP DOS CURSOS DE

COMPUTAÇÃO APLICADA DO INPE, 5. (WORCAP), 2005, São José dos

http://urlib.net/dpi.inpe.br/hermes2@1905/2005/10.03.15.35

129

Campos. Anais... São José dos Campos: INPE, 2005. CD-ROM, On-line.

Disponível em: <http://urlib.net/dpi.inpe.br/hermes2@1905/2005/10.03.15.35>.

Acesso em: 25 set. 2008.

MURALIKRISHNA, A., SANTOS, R. D. C.; DAL LAGO, A.; SILVA, J. D. S..

Looking for Rules in Geomagnetic Storm Occurrence Using the Decision Tree

Technique. 2006 CEDAR WORKSHOP. USA - Santa Fé: CEDAR Poster

Session Booklet, p.12, 2006.

MURALIKRISHNA, A.; DAL LAGO, A.; SILVA, J. D. S.. Previsão do índice

geomagnético Dst utilizando Redes Neurais Artificiais. II SIMPÓSIO

BRASILEIRO DE GEOFÍSICA ESPACIAL E AERONOMIA. Campina

Grande/PB: Anais do II SBGEA, p. 196, 2008.

NASA GODDARD SPACE FLIGHT CENTER. Scientific Visualization Studio.

Disponível em:

http://svs.gsfc.nasa.gov/stories/magnetosphere_20020509/images/mag5copy.jp

g. Acesso em Outubro de 2008.

NEUGEBAUER, M. e GOLDSTEIN, R.. Particle and field signatures of coronal

mass ejections in the solar wind. In: Crooker, N., Joselyn J. A. e Feynman, J.

(ed.) Coronal mass ejections, Washington, DC: AGU, 1997. v. 99, p. 245-251.

O’LEARY, D.E.; KUOKKA, D. e PLANT, R. Artificial Intelligence and Virtual

Organizations, Comm. ACM, vol. 40, no. 1, pp. 52-59, Jan. 1997. Disponível

em: <http://portal.acm.org/citation.cfm?id=242857.242871>. Acesso em 07 de

Nov. de 2008.

PARKER, E.N., “Dynamics of the interplanetary gas and magnetic fields,”. 128,

664, Astrophys. J., 1958.

PARKS, G. K. Physics of space plasmas: an introduction, ix, 538 p. pp,

California, Redwood City: Addison-Wesley Publishing Company, 1991.

http://urlib.net/dpi.inpe.br/hermes2@1905/2005/10.03.15.35

http://svs.gsfc.nasa.gov/stories/magnetosphere_20020509/images/mag5copy.jp

http://portal.acm.org/citation.cfm?id=242857.242871

130

PRIEST, E. R. The Sun and its magnetohidrodynamics, In: Kivelson, M. G. e

Russell, C. T. (ed.) Introduction to space physics, United Kingdom: Cambridge


PRIMDHAL, F. The fluxgate magnetometer, J. Phys., E Sci. Instrum. 12 (1979),

pp. 241–253.

QUINLAN, J.R. Discovering rules by induction from large collections of

examples. In: D. Michie (ed.), Expert systems in the micro electronic age.

Edinburgh University Press, 1979.

QUINLAN, J.R. Learning efficient classification procedures and their application

to chess endgames. In R.S. Michalski, J.G. Carbonell & T.M. Mitchell, (ed.),

Machine learning: An artificial intelligence approach. Palo Alto: Tioga Publishing

Company, 1983.

QUINLAN, J. R. Induction of decision trees. Machine Learning I: 81–106, Mar

1986. Disponível em:

<http://www.cs.utah.edu/~hal/courses/2008S_ML/quinlan86decision.pdf>.

Acesso em 14 out. 2008.

RSI – Rice Space Institute. Disponível em

http://space.rice.edu/IMAGE/livefrom/5_magnetosphere.jpg. Acesso em

Outubro de 2008.

RUSSELL, C. T. A brief history of solar-terrestrial physics. In: Kivelson, M. G. e

Russell, C. T. (ed.) Introduction to space physics, United Kingdom: Cambridge


SANTOS, R. D. C.; Material da disciplina Princípios e Aplicações de Mineração

de Dados. São José dos Campos: INPE, 2005. On-line. Disponível em:

http://www.lac.inpe.br/~rafael.santos/Docs/CAP359/2005/dm07.pdf. Acesso em:

09 out. 2008.

http://www.cs.utah.edu/~hal/courses/2008S_ML/quinlan86decision.pdf

http://space.rice.edu/IMAGE/livefrom/5_magnetosphere.jpg

http://www.lac.inpe.br/~rafael.santos/Docs/CAP359/2005/dm07.pdf

131

SIMPSON, S. Massive Solar Storms Inflict Little Damage on Earth. Space

Weather, 1, 1012, Doi: 10.1029/2003SW000042, 2003

SOLAR AND HELIOSPHERIC OBSERVATORY HOMEPAGE. Gallery.

Disponível em http://sohowww.nascom.nasa.gov. Acesso em Julho de 2008.

STONE, E. C.; FRANDSEN, A. M.; MEWALDT, R. A.; CHRISTIAN, E. R.;

MARGOLIES, D.; ORMES, J. F.; SNOW, F., The Advanced Composition

Explorer, Space Science Reviews, 86, pp. 1--22, 1998.

TASCIONE, T. F. Introduction to the space environment. Malabar: F. L. Krieger

Publishing, 1994, p. 45-58, cap.5.

TSURUTANI, B. T., GONZALEZ, W. D., TANG, F.; AKASOFU, S. I. e SMITH,

E. J. Origin of interplanetary southward magnetic field responsible for major

magnetic storms near solar maximum (1978-1979). J. Geophys. Res., v.93,

n.A8, p.8519-8531, Aug. 1988.

TSURUTANI, B. T., GONZALEZ, W. D., TANG, F. e LEE, Y. T. Great magnetic

storms. Geophys. Res. Lett., v. 19, n. 1, p. 73-76. Jan. 1992.

TSURUTANI, B. T., GONZALEZ, W. D., KAMIDE, Y. Magnetic storms. Surveys

in Geophysics, 18: p. 363-383, 1997.

TSURUTANI, B. T.; GONZALEZ, W. D. Magnetic storms. In: Suessm S. T.:

Tsurutani, B. T. (ed.) From the sun: auroras, magnetic storms, solar flares,

cosmic rays. Washington: American Geophysics Union, 1998. P. 57-66.

INSTITUTO DE GEOFÍSICA UNAM. ISYP. Disponível em:

http://www.geofisica.unam.mx/isyp/3.html. Acesso em Outubro de 2008.

VIEIRA, L. E. A.; GONZALEZ, W. D.; CLUA DE GONZALEZ, A. L., DAL LAGO,

A. A study of magnetic storms development in two or three steps and its

association with the polarity of magnetic clouds. Journal of Atmospheric and

Solar-Terrestrial Physics, v. 63, p. 457-461, 2001.

http://sohowww.nascom.nasa.gov

http://www.geofisica.unam.mx/isyp/3.html

132

WEKA. WEKA 3: Data Mining Software in Java. Disponível em:

http://www.cs.waikato.ac.nz/ml/weka/index.html. Acesso em Outubro de 2008.

WITTEN, I, H.; FRANK, E. "Data mining: practical machine learning tools and

techniques", 2nd Edition, San Francisco: Morgan Kaufmann, 2005. 525 p.

Paper ISBN 0-12-088407-0.

WU, J.-G. e LUNDSTEDT, H. Prediction of geomagnetic storms from solar wind

data using Elman Recurrent Neural Networks. Geopys. Res. Letters, 23, p.

319-322, 1996.

WU, J.-G. e LUNDSTEDT, H. Geomagnetic storms predictions from solar wind

data with the use of Dynamic Neural Networks. J. Geophys. Res. 102, 14225,

1997.

http://www.cs.waikato.ac.nz/ml/weka/index.html

PUBLICAÇÕES TÉCNICO-CIENTÍFICAS EDITADAS PELO INPE

Teses e Dissertações (TDI)

Manuais Técnicos (MAN)

Teses e Dissertações apresentadas nos Cursos de Pós-Graduação do INPE.

São publicações de caráter técnico que incluem normas, procedimentos, instruções e orientações.

Notas Técnico-Científicas (NTC)

Relatórios de Pesquisa (RPQ)

Incluem resultados preliminares de pesquisa, descrição de equipamentos, descrição e ou documentação de programa de computador, descrição de sistemas e experimentos, apresenta- ção de testes, dados, atlas, e docu- mentação de projetos de engenharia.

Reportam resultados ou progressos de pesquisas tanto de natureza técnica quanto científica, cujo nível seja compatível com o de uma publicação em periódico nacional ou internacional.

Propostas e Relatórios de Projetos (PRP)

Publicações Didáticas (PUD)

São propostas de projetos técnico-científicos e relatórios de acompanha-mento de projetos, atividades e convê- nios.

Incluem apostilas, notas de aula e manuais didáticos.

Publicações Seriadas

Programas de Computador (PDC)

São os seriados técnico-científicos: boletins, periódicos, anuários e anais de eventos (simpósios e congressos). Constam destas publicações o Internacional Standard Serial Number (ISSN), que é um código único e definitivo para identificação de títulos de seriados.

São a seqüência de instruções ou códigos, expressos em uma linguagem de programação compilada ou inter- pretada, a ser executada por um computador para alcançar um determi- nado objetivo. São aceitos tanto programas fonte quanto executáveis.

Pré-publicações (PRE)

Todos os artigos publicados em periódicos, anais e como capítulos de livros.

PREVISAO DO~ INDICE GEOMAGNETICO DST UTILIZANDO …mtc-m16c.sid.inpe.br/col/sid.inpe.br/mtc-m18@80/2009/04.13.13.16/... · vento solar com o campo geomagnético forma a estrutura

Documents