INPE-156706-TDI/1471 PREVIS ˜ AO DO ´ INDICE GEOMAGN ´ ETICO DST UTILIZANDO REDES NEURAIS ARTIFICIAIS E ´ ARVORE DE DECIS ˜ AO Amita Muralikrishna Disserta¸c˜ ao de Mestrado do Curso de P´ os-Gradua¸ c˜aoemComputa¸c˜aoAplicada, orientada pelos Drs. Jos´ e Demisio Sim˜ oes da Silva e Alisson Dal Lago, aprovada em 13 de fevereiro de 2009. Registro do documento original: <http://urlib.net/sid.inpe.br/mtc-m18@80/2009/04.13.13.16> INPE S˜ ao Jos´ e dos Campos 2009
135
Embed
PREVISAO DO~ INDICE GEOMAGNETICO DST UTILIZANDO …mtc-m16c.sid.inpe.br/col/sid.inpe.br/mtc-m18@80/2009/04.13.13.16/... · vento solar com o campo geomagnético forma a estrutura
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
INPE-156706-TDI/1471
PREVISAO DO INDICE GEOMAGNETICO DST
UTILIZANDO REDES NEURAIS ARTIFICIAIS E
ARVORE DE DECISAO
Amita Muralikrishna
Dissertacao de Mestrado do Curso de Pos-Graduacao em Computacao Aplicada,
orientada pelos Drs. Jose Demisio Simoes da Silva e Alisson Dal Lago, aprovada
“Nas grandes batalhas da vida, o primeiro passo para a vitória é o desejo de vencer.”
Mahatma Gandhi
Dedico este trabalho a meus pais, Murali e Vijaya, meu exemplo,
por quem tenho admiração, gratidão e respeito eternos.
AGRADECIMENTOS
Agradeço aos meus orientadores: ao professor Dr. José Demísio Simões da Silva pela
confiança depositada, pelos ensinamentos e pela oportunidade; ao Dr. Alisson Dal
Lago por ter me apresentado uma nova e fascinante área da ciência, pelos
ensinamentos, acompanhamento e incentivo constantes.
Aos professores da CAP pelos ensinamentos e conversas.
Aos meus amigos, que me contemplam com breves, mas eternos, momentos de alegria:
às minhas amigas-irmãs Salma, Kalyani e Angeli, pela eterna amizade e pelos
conselhos; à minha querida irmã de coração Aline, pela amizade, por me transmitir
tranqüilidade e pelo tempo dedicado a me ajudar neste trabalho; aos meus colegas de
curso e aos meus colegas de sala, pela amizade, por compartilharem seu tempo e suas
experiências, e pelas boas risadas.
Agradeço à minha família, meu bem mais precioso: a meus pais, pela educação e pelo
constante incentivo que me permitiram concluir mais esta etapa dos meus estudos; às
minhas irmãs, Anoopa e Aasita, por existirem, por estarem presentes sempre e pelo
apoio nos momentos que precisei; ao meu esposo Fábio, por me transmitir garra, pela
cumplicidade, por compartilhar comigo todas as nossas conquistas, desde o início. Aos
meus sogros, ao Daniel, ao Leonardo e à Ana Carolina, por terem torcido por mim.
Agradeço a todos que de alguma forma participaram desta fase e permitiram que este
trabalho fosse desenvolvido.
RESUMO
A Terra sofre constante influência da atividade solar através do vento solar, que traz consigo estruturas resultantes, principalmente, de eventos solares como explosões solares e ejeções coronais de massa. A interação quase estática do vento solar com o campo geomagnético forma a estrutura denominada magnetosfera, que funciona como um escudo, que protege o planeta do plasma provindo do Sol. No entanto, em função das características que as estruturas de origem solar adquirem ao longo do meio interplanetário, pode haver penetração de parte dessa matéria para dentro da magnetosfera. Como conseqüência, diversos tipos de distúrbios podem ser gerados no planeta, como, por exemplo, as auroras e as tempestades geomagnéticas, as quais podem ocasionar diversos danos aos sistemas tecnológicos, entre outros prejuízos. Este trabalho aborda a relação entre as características do meio interplanetário durante o avanço de estruturas interplanetárias em direção à Terra e os efeitos sentidos pelo campo geomagnético, como resposta a essas características. O foco principal é a previsão do comportamento do campo geomagnético, medido, neste trabalho, pelo índice geomagnético Dst, levando-se em conta, principalmente, as três coordenadas do campo magnético interplanetário. As ferramentas escolhidas para resolver o problema não-linear foram as técnicas: Rede Neural Artificial do tipo Perceptron de Múltiplas Camadas, treinada com algoritmo backpropagation, Mapa Auto-organizável de Kohonen e Árvore de Decisão com algoritmo J48. Foi possível comprovar algumas relações e questionar a existência de outras com a Árvore de Decisão e prever, com ótimo percentual de eficiência, o índice geomagnético Dst com a Rede MLP.
GEOMAGNETIC DST INDEX FORECAST USING ARTIFICIAL NEURAL NETWORKS AND DECISION TREE
ABSTRACT
The Earth suffers constant influence of the solar activity through the solar wind, which brings with it the resulting structures, mainly phenomena like solar flares and coronal mass ejection. The almost static interaction between the solar wind and the geomagnetic field forms a structure called magnetosphere, which acts as a shield that protects the planet from radiation and solar plasma. However, depending on the characteristics that these structures of solar origin acquire throughout the interplanetary medium, a part of the energy and matter may penetrate into the magnetosphere. As a result, different types of disturbances can be generated on the planet, for example, the aurora and the geomagnetic storms, which can cause damage to various technological systems, among other losses. The present work formulates the relationship between the characteristics of the interplanetary medium during the progress of the interplanetary structures towards the Earth and the effects observed on the geomagnetic field, in response to these characteristics. The main focus is on forecasting the behavior of the geomagnetic field, represented in this work by the Dst index, using for that, mainly, the three interplanetary magnetic field components. The tools chosen here to solve the non-linear problem were the Multi-layer Perceptrons Artificial Neural Network, trained with the backpropagation algorithm; the Kohonen Self-Organizing Map and the Decision Tree with the J48 algorithm. It was possible to establish some relationships and to question the existence of others with the Decision Tree, and predict the geomagnetic Dst index with great percentage efficiency with the Artificial Neural Network.
IMF Interplanetary Magnetic Field (Campo Magnético Interplanetário)
MLP Multilayer Perceptron (Perceptron de Múltiplas Camadas)
nT Nano Tesla: unidade de medida de intensidade de campo magnético. 1 Nano-Tesla = 109 Tesla:
RNA Rede Neural Artificial
SOM Self Organizing Map (Mapa Auto-Organizável)
25
CAPÍTULO 1 INTRODUÇÃO
1.1 Caracterização do problema
As técnicas de Inteligência Artificial (IA) têm sido aplicadas em estudos
multidisciplinares, abrangendo as mais diversas áreas de conhecimento, como
uma opção de abordagem para a solução de problemas que têm no seu
contexto a não-linearidade, a imprecisão, e outras características difíceis de
serem solucionadas com modelos computacionais convencionais. Neste
trabalho, algumas técnicas de IA serão aplicadas sobre um estudo de
fenômenos do Clima Espacial, envolvidos na relação Sol-Terra, investigando as
possíveis relações existentes entre as estruturas provenientes da atividade
solar e a ocorrência de distúrbios magnéticos na Terra, conhecidas como
tempestades geomagnéticas.
O Clima Espacial é a área que estuda os processos e efeitos envolvidos na
influência do Sol sobre os planetas do sistema solar. Como um coadjuvante
deste processo está o meio interplanetário, que se inclui no espaço dominado
pelo campo magnético solar, e por onde se propagam estruturas, denominadas
estruturas interplanetárias, formadas de plasma e matéria que se originam dos
eventos resultantes da atividade solar. No caminho que estas estruturas
percorrem, junto com um fluxo contínuo chamado vento solar, que parte do Sol
em direção ao meio interplanetário, elas encontram uma barreira formada pelo
campo magnético da Terra, que desvia grande parte dessa matéria, formando
uma estrutura quase estática chamada magnetosfera. Essa interação e a
formação da magnetosfera são ilustradas na FIGURA 1.1.
A magnetosfera, devido à sua interação com o vento solar, possui
características próprias que servem de palco a processos físicos que ocorrem,
por exemplo, quando é injetada matéria ionizada para o seu interior. O
processo principal que contribui com a entrada de matéria para dentro da
magnetosfera é a chamada reconexão magnética, que ocorre entre linhas de
26
campos magnéticos de diferentes topologias, como é o caso do campo
magnético interplanetário e o da Terra. A reconexão ocorre como uma fusão
entre linhas de campo que estão em direções opostas e implica na
transferência de matéria de um meio para o outro. Essa situação é a principal
desencadeadora de tempestades geomagnéticas, em outras palavras,
distúrbios no campo magnético da Terra, os quais podem provocar
conseqüências prejudiciais para a vida humana. Alguns dos prejuízos que
podem ser causados pela ocorrência de tempestades geomagnéticas de
grande intensidade são: interferências em sistemas de comunicação e de
energia elétrica, danos em sensores e em sistemas de navegação e controle
de satélites, entre outros. Estudos da previsão de tempestades geomagnéticas
buscam oferecer um alerta que permita a tomada de medidas e ações que têm
como intuito amenizar os efeitos que podem ser sentidos por esses eventos.
FIGURA 1.1. Magnetosfera, camada quase estática formada pela interação do vento solar com o campo magnético da Terra.
FONTE: Solar and Heliospheric Observatory Homepage (2008).
1.2 Motivação
Estudos anteriores, como Kugblenu et al. (1999) e Lundstedt (1997) abordaram
a previsão de tempestades geomagnéticas utilizando as Redes Neurais
Artificiais de diferentes arquiteturas, focando a previsão de períodos
perturbados.
27
A motivação para este trabalho foi desenvolver um sistema de previsão de
índice geomagnético Dst (do inglês, Disturbance Storm Time) para períodos
perturbados e períodos calmos, para um período completo de um mês.
1.3 Objetivos
O objetivo geral deste trabalho é utilizar técnicas de IA, para investigar as
possíveis relações existentes, não ignorando as relações já comprovadas,
entre as características de plasma e de campo magnético interplanetário -
medidas quando estruturas interplanetárias se aproximam da magnetosfera - e
o consequente comportamento do campo geomagnético, medido por índices
geomagnéticos.
Uma das intenções é a exploração desses dados para buscar informações
ainda não conhecidas na área.
O foco principal é a previsão do índice geomagnético Dst, principalmente
durante a ocorrência de tempestades geomagnéticas, sem descartar períodos
calmos.
1.4 Métodos
A primeira técnica empregada foi a Árvore de Decisão, uma das técnicas
utilizadas em aplicações de Data Mining, com o algoritmo J48, integrado ao
software WEKA (Weka, 2008). O intuito era de buscar regras pertinentes
relacionadas à ocorrência de tempestades geomagnéticas de alta intensidade,
observando dados de plasma e campo magnético interplanetário, instantes
antes da observação dos distúrbios.
A próxima técnica aplicada foi a Rede Neural Artificial do tipo Perceptron
Múltiplas Camadas, utilizada como ferramenta para realizar a previsão do
comportamento geomagnético, através do índice geomagnético Dst, tanto em
períodos calmos como nos perturbados - durante a ocorrência de tempestades
geomagnéticas.
28
A terceira técnica foi o Mapa Auto-organizável de Kohonen, com o qual se
buscou verificar as relações causa-efeito, sendo os dados de plasma e de
campo magnético interplanetário classificados como causas e o índice
geomagnético Dst, instantes adiante, como o efeito.
1.5 Estrutura dos capítulos:
O conteúdo abordado nos próximos capítulos segue a seguinte estrutura:
CAPÍTULO 2 – CLIMA ESPACIAL: Este capítulo introduz a área de Clima
Espacial, com enfoque na relação Sol-Terra, descrevendo brevemente a
atividade solar e os efeitos sentidos desde a formação da magnetosfera até a
perturbação do campo geomagnético. É apresentada a instrumentação
envolvida na coleta dos dados utilizados no trabalho.
CAPÍTULO 3 – TÉCNICAS DE INTELIGÊNCIA ARTIFICIAL: O capítulo faz
uma breve revisão sobre as técnicas de inteligência artificial escolhidas para
essa aplicação, descrevendo as suas particularidades e algoritmos, bem como
as principais equações e termos que os compõem.
CAPÍTULO 4 – DADOS E METODOLOGIA: Este capítulo descreve todas as
medições que compõem os dados utilizados no trabalho, citando as unidades
de medida, os formatos, as diferentes resoluções nas quais se encontram e os
dados selecionados para a aplicação. O capítulo também explica e exemplifica
a fase de pré-processamento realizada para alterar resoluções ou atenuar
sinais. São descritas as etapas de treinamento e teste de cada técnica,
juntamente com o conjunto de dados utilizados em ambas as fases e a relação
dos conjuntos de parâmetros de cada experimento realizado.
CAPÍTULO 5 – RESULTADOS: Neste capítulo serão exibidos os principais
resultados obtidos nos experimentos citados no CAPÍTULO 4. Será realizada a
comparação de alguns deles com os obtidos por outros trabalhos.
29
Simultaneamente, serão realizadas algumas análises estatísticas dos
resultados obtidos.
CAPÍTULO 6 – CONCLUSÕES: Por fim, este capítulo apresentará as principais
conclusões sobre a dissertação como um todo bem como fará algumas
sugestões para trabalhos futuros.
30
31
CAPÍTULO 2 A RELAÇÃO SOL-TERRA
Por volta de 1960, começaram a ser desenvolvidos equipamentos que
possibilitam uma observação mais detalhada da Terra, da atividade solar e da
influência do Sol nos planetas do meio interplanetário. A área que estuda os
processos físicos envolvidos, as causas e as conseqüências dessa interação,
foi denominada recentemente de Clima Espacial.
Clima Espacial foi definido como “... a área do conhecimento que engloba as
observações in situ e sensoriamento remoto do geoespaço, do meio
interplanetário e do Sol, possibilitando uma visão global de seus processos
físicos...”. (Dal Lago, 2004)
A variabilidade do Clima Espacial dá-se pela influência que o Sol exerce nos
planetas que fazem parte do Sistema Solar, principalmente nos mais próximos
a ele, como é o caso da Terra. Neste último caso, é comum utilizar a
terminologia “relação Sol-Terra”. Essa influência pode ser resumida em três
principais fenômenos que partem do Sol, os quais se caracterizam pelas
energias envolvidas, pelo seu tempo de propagação até a Terra, pela duração
de seus efeitos e pelos impactos gerados. A FIGURA 2.1 relaciona esses
fenômenos e descreve suas características.
Neste trabalho, o fenômeno abordado é o que causa tempestades
geomagnéticas. Os outros tipos podem interferir em eventuais situações que
serão citadas, como é o caso da falha na coleta de dados causada pela
aceleração de partículas de alta energia em direção aos instrumentos de
coleta, ilustrada no segundo fenômeno da FIGURA 2.1.
32
FIGURA 2.1. Diagrama dos os três principais tipos de fenômenos que afetam o geoespaço, constituindo o Clima Espacial.
FONTE: Adaptado de Dal Lago (2004).
2.1 O Sol
O Sol é uma estrela de, aproximadamente, 696 mil km de raio, 2 x 1030 kg de
massa e é constituído, principalmente, de hidrogênio (em torno de 90%) e hélio
(em torno de 10%). Em função de suas características e processos físicos, a
33
atmosfera solar é, por convenção, dividida em três grandes regiões, as quais
estão representadas na FIGURA 2.2 (Priest, 1995). São elas:
a) Fotosfera, com temperatura da ordem de 5800 K;
b) Cromosfera, com temperatura no intervalo de 4300 a 106 K;
c) Coroa, acima da Cromosfera e sem limite exterior, apresenta uma
temperatura da ordem de 106 K.
FIGURA 2.2. Estrutura do interior solar e atmosfera.
FONTE: Priest (1995).
2.1.1 A atividade solar
O Sol é um corpo gasoso que está em constante atividade, a qual envolve
processos físicos que se iniciam no núcleo e resultam em eventos que podem
ser observados nas camadas externas, como por exemplo a camada visível
(fotosfera). A atividade solar é caracterizada, principalmente, pelo surgimento e
a evolução de manchas solares (sun spots) (FIGURA 2.3), devido à ocorrência
34
de explosões solares, com liberação de energia, e ejeções coronais de massa,
que expelem o plasma solar em direção ao meio interplanetário (FIGURA 2.5).
FIGURA 2.3. O surgimento e evolução de um grupo de manchas solares, de acordo com a rotação do Sol, observada por um dos instrumentos a bordo do satélite SOHO.
FONTE: Solar and Heliospheric Observatory Homepage (2008).
Desde a década de 1970 existem estudos voltados à observação da atividade
solar através de imagens coletadas por satélites como o SOHO1 – “Solar and
Heliospheric Observatory”, lançado em Dezembro de 1995 (Hundhausen,
1997). O SOHO tem sua órbita em harmonia com a da Terra, em volta do Sol,
em torno de um ponto chamado primeiro Lagrangeano (L1). O ponto L1
encontra-se a, aproximadamente, 1,5 milhões km da Terra (quase quatro vezes
a distância da Lua), e a, aproximadamente, 148,5 milhões km do Sol, onde as
forças gravitacionais da Terra e do Sol se compensam a ponto de manter o
instrumento em um ponto semi-estável (Bruckneer et al., 1995). A FIGURA 2.4
ilustra a localização do ponto L1 e dos satélites que têm a sua órbita em torno
deste ponto. A FIGURA 2.5 mostra uma imagem do Sol capturada por um dos
instrumentos a bordo do SOHO.
O estudo da atividade solar observou uma periodicidade, com duração média
de 11 (onze) anos, denominada de ciclo solar de 11 anos. A sua duração é
estimada pela observação de vários fenômenos solares, entre eles o número
de manchas solares na fotosfera, que denotam mudanças no campo magnético
solar (Burlaga, 1995).
1 SOHO é um projeto de cooperação internacional entre ESA e NASA.
35
FIGURA 2.4. À esquerda, as órbitas da Terra, da Lua, do satélite ACE em torno do ponto L1 (em harmonia com a órbita da Terra) e as distâncias entre elas e em relação ao Sol (ilustração fora de escala). À direita, uma ilustração do satélite SOHO.
FONTES: Advanced Composition Explorer Homepage (2008) e Solar and Heliospheric Observatory Homepage (2008)
FIGURA 2.5. Imagem capturada em 28 de Junho de 2000 por um dos instrumentos a bordo do SOHO, o EIT, mostra duas proeminências (lado direito superior).
FONTE: Solar and Heliospheric Observatory Homepage (2008).
36
2.2 Os campos magnéticos do Sol e interplanetário
O campo magnético do Sol é complexo, não é confinado somente à sua
vizinhança, e é transportado pelo vento solar em direção ao meio
interplanetário, percorrendo toda a Heliosfera2, junto com a matéria e a energia
resultantes de eventos que ocorrem no Sol. Essa extensão do campo
magnético do Sol é chamada de campo magnético interplanetário ou IMF (do
inglês, Interplanetary Magnetic Field) (Parks, 1991).
O IMF é uma grandeza vetorial, normalmente descrita por três componentes
(Bx, By e Bz). Existem dois sistemas naturais de coordenadas, sendo um deles
com referência no plano da eclíptica3 (GSE) e o outro com referência à
orientação do eixo de dipolo magnético da Terra (GSM). Este último é o mais
conveniente para os objetivos deste trabalho. O sistema GSM possui o eixo x
na direção Sol-Terra, crescente em direção ao Sol; o plano x-z contém o eixo
de dipolo geomagnético; e a direção y completa o sistema de coordenadas de
acordo com a regra da mão direita (Mc Pherron, 1995).
Quando duas linhas de campo de polaridades opostas se aproximam, elas
podem "se fundir" ou "se reconectar", processo que foi chamado de “reconexão
magnética" (Dungey,1961), que pode resultar, dependendo do meio em que se
encontram, na transferência de energia e massa para dentro da magnetosfera.
Tal processo é o que melhor se aplica a algumas dinâmicas envolvidas na
Física Solar-Terrestre.
A interação entre o IMF e o campo magnético da Terra pode levar a uma série
de distúrbios no campo magnético e na atmosfera do nosso planeta,
evidenciando a importância do Sol como um dos principais forçantes dos
fenômenos de escala global da Terra.
2 Heliosfera – é a região dominada pelo campo magnético solar. 3 eclíptica – plano no qual a Terra realiza a sua órbita.
37
2.3 Vento Solar
O vento solar, na região próxima à eclíptica, é um fluxo supersônico, de
velocidade em torno de 400 km/s, de plasma ionizado que se move radialmente
a partir do Sol (Burlaga,1995). Dependendo das estruturas que carrega, pode
levar de 2 a 5 dias para percorrer a distância de 1UA4.
As características do vento solar podem ser analisadas antes deste chegar à
Terra devido à coleta de dados realizada por um outro satélite que, igual ao
SOHO, tem a sua órbita em torno do ponto L1. Trata-se do ACE (Advanced
Composition Explorer), que foi lançado em Agosto de 1997 (Stone et al., 1998).
A TABELA 2.1 apresenta as propriedades do vento solar observadas em uma
das medições do satélite ACE, próximo à órbita da Terra.
TABELA 2.1. Características do vento solar
Densidade de prótons 6.6 cm-3 Densidade de elétrons 7.1 cm-3
Densidade de He++ 0.25 cm-3 Velocidade 450 km/s
Temperatura de prótons 1.2 x 105 K Temperatura de elétrons 1.4 x 105 K
Campo magnético 7nT
FONTE: Adaptado de Hundhausen, 1995.
A primeira evidência indireta da existência do vento solar é datada de 1951,
quando Ludwig Biermann, através de observações da cauda de cometas,
percebeu que uma segunda cauda mais tênue se formava radialmente ao Sol.
O que se via era que a poeira cometária estava na direção anti-solar, ou seja,
tornava-se clara a existência de um fluxo permanente de gás ionizado
originado no Sol que causava esta variação (Goldstein, 1998). Mais tarde, um
4 UA (Unidade Astronômica): distância média entre a Terra e o Sol, que equivale a aproximadamente 1,5×108 km
38
modelo teórico para o Vento Solar foi proposto estimando quais seriam suas
características (Parker, 1958). A existência de um fluxo contínuo foi confirmada
em 1962 com as primeiras medidas in situ (Brandt,1970).
2.3.1 Estruturas interplanetárias acopladas ao vento solar
O vento solar pode carregar consigo estruturas resultantes de eventos que
ocorrem no Sol devido a diversos processos físicos internos. Alguns destes
eventos estão relacionados à rotação do Sol, a qual faz com que o fluxo
liberado e as linhas de campo magnético também acompanhem a rotação,
porém mais lentamente, formando um espiral, como mostra a FIGURA 2.6
(Burlaga, 1995). A FIGURA 2.6 ainda mostra o vento solar como o fluxo que
parte do Sol e que arrasta consigo uma parte do campo magnético do Sol, que
passa a constituir o campo magnético interplanetário.
FIGURA 2.6. Representação do fluxo do vento solar a partir do Sol. No detalhe, o encontro com um “obstáculo” interplanetário que interfere na direção do fluxo.
FONTE: Adaptado de Institute of Geophysics and Planetary Physics (2008).
39
As estruturas que mais aparecem associadas à ocorrência das tempestades
magnéticas na Terra são as ejeções coronais de massa (CMEs, do inglês
Coronal Mass Ejections), emissões de plasma, observadas na coroa do Sol
(Gosling et al., 1990,1991). E um dos eventos que acontecem com mais
freqüência são os flares ou labaredas solares, também conhecidas como
explosões solares, caracterizados pela liberação de energia em regiões ditas
ativas, que se tornam visíveis na fotosfera (Hannah et al., 2008).
A FIGURA 2.7 mostra um exemplo de evolução de um evento registrado por
diferentes instrumentos a bordo do satélite SOHO, o qual se origina em um
grupo de machas solares, que evoluem para um flare, em seguida para uma
CME observada 14 horas depois, e finalmente para uma enorme nuvem
magnética 3 horas depois.
As estruturas que se originam no Sol podem sofrer alterações nas suas
características ao percorrerem o meio interplanetário. Por exemplo, as CMEs
têm um conjunto de características quando são observadas por coronógrafos5
e outras quando estão lançadas no meio interplanetário, quando são chamadas
de ICMEs (do inglês, Interplanetary Coronal Mass Ejection), quando são
medidas junto com as características do vento solar. As enormes quantidades
de matéria liberada pelas CMEs em direção ao meio interplanetário possuem
características bastante distintas do vento solar normal quando observadas nas
proximidades da Terra (Neugebauer e Goldstein, 1997).
Dentre as manifestações interplanetárias das CMEs solares, as mais
importantes do ponto de vista geomagnético são as Nuvens Magnéticas
(Burlaga et al., 1981), uma classe de ICMEs, por possuírem fortes
componentes de campo magnético anti-paralelo ao campo geomagnético,
proporcionando maior eficiência na transferência de sua energia para dentro da
magnetosfera terrestre (Gonzalez et al., 1999).
5 Coronógrafos: instrumentos a bordo de satélites que obtêm imagens da atmosfera solar, através da simulação de eclipse no disco solar.
40
FIGURA 2.7. Evento registrado em imagens seqüenciais de 4 (quatro) instrumentos a bordo do SOHO.
FONTE: Solar and Heliospheric Observatory Homepage (2008).
É comum observar as CMEs se propagando desde o Sol até a Terra com
velocidade superior à do vento solar normal, produzindo uma onda de choque,
que pode produzir efeitos de compressão e intensificação do campo magnético
do vento solar, tornando-o eficiente para causar tempestades geomagnéticas
intensas (Tsurutani et al., 1988, Tsurutani et al., 1992). Da mesma forma,
outros efeitos de compressão de nuvens magnéticas, como os causados pela
sua interação com feixes rápidos originados de buracos coronais, podem
aumentar significativamente a eficiência em causar tempestades
geomagnéticas (Fenrich e Luhmann, 1998, Dal Lago et al., 2001, Dal Lago et
al., 2002).
41
Os eventos complexos, em que mais de uma estrutura interplanetária está
envolvida, são os mais comuns, principalmente para a ocorrência de super-
tempestades geomagnéticas, que são tempestades geomagnéticas de maior
intensidade. Estes eventos tornam-se importantes porque muitas vezes o
choque causado pela chegada das outras estruturas intensifica a situação de
perturbação pré-existente (Gonzalez et al., 2002).
2.4 Magnetosfera
A influência do vento solar sobre a Terra é constante e pode ser sentida ou não
no planeta. A ocorrência e a intensidade destes efeitos são ditadas pelas
características das estruturas formadas durante a atividade solar e a sua
propagação no meio interplanetário. De acordo com essas características,
estes processos podem ser imperceptíveis para a vida na Terra ou causar
fenômenos e mudanças que se tornam visíveis, ou até mesmo prejudiciais,
para as atividades no planeta.
Grande parte da matéria e energia das estruturas provenientes do Sol é
desviada pelo campo magnético da Terra, e a parte não desviada pode
penetrar no planeta de variadas formas.
O campo magnético da Terra (ou campo geomagnético) pode ser aproximado
por um dipolo magnético alinhado com o eixo de rotação (FIGURA 2.8) e é
formado por correntes que fluem no núcleo do planeta. (Jacobs, 1991)
É dito que o fluxo de plasma do vento solar é congelado ao IMF e o plasma
terrestre ao campo geomagnético, ou seja, o movimento dessas matérias fica
limitado ao dos campos magnéticos aos quais estão congelados, e vice-versa,
separando os plasmas das duas regiões distintas (Parks, 1991). Desta forma, a
influência do vento solar no campo magnético da Terra se restringe à interface
entre este e uma região ao redor do planeta, denominada magnetosfera.
42
FIGURA 2.8. Ilustração do campo geomagnético aproximado por um dipolo.
FONTE: Divisão de Geofísica Espacial (2008).
A magnetosfera terrestre é, portanto, uma cavidade formada pela interação do
campo magnético da Terra com o plasma que compõe o vento solar, onde os
processos físicos são dominados pelo campo geomagnético (Hughes, 1995). O
campo geomagnético atua como um escudo para a forte pressão exercida pelo
vento solar. Este, por possuir uma velocidade supersônica, ao aproximar-se da
Terra, encontra aquele como um obstáculo em seu percurso, produzindo uma
onda de choque (bow shock) em frente à magnetosfera (Russel, 1995).
A interação vento solar – magnetosfera (FIGURA 2.9) pode ser considerada
quase estática, pela presença constante do vento solar. A magnetosfera,
portanto, é assimétrica, comprimida em uma face e alongada na outra direção,
formando o que se chama de cauda magnética, caracterizada pelas linhas de
campo geomagnético esticadas, como se pode observar na FIGURA 2.10. Esta
região se estende até distâncias maiores do que 200 RE6 e serve como um
reservatório de energia do vento solar, que depois é dissipada na região
auroral e na magnetosfera interna (Parks, 1991). A FIGURA 2.10 ilustra a
magnetosfera e a composição de sua estrutura, resultado da sua interação com
o vento solar.
6 1RE equivale a um raio terrestre e mede aproximadamente 6.350 km (Lucas, 2005).
43
FIGURA 2.9. Representação artística da interação vento solar – magnetosfera.
FONTE: Adaptado de Instituto de Geofísica de La UNAM (2008).
FIGURA 2.10. A magnetosfera e suas regiões.
FONTE: Adaptado de RSI (2008).
A direção do IMF, juntamente com a velocidade do vento solar, é um dos
fatores controladores da entrada de energia na magnetosfera, que é
responsável pela ocorrência de tempestades e subtempestades magnéticas
(Gonzalez e Tsurutani, 1987, Gonzalez et al. 1994). Quando o IMF tem a
mesma direção do campo geomagnético, na fronteira entre os dois, pouco
plasma ou energia do vento solar entra na magnetosfera. No entanto, quando
TERRA SOL
VENTO SOLAR
44
os dois campos têm direções opostas, ocorre uma fusão magnética destes
campos e a energia e o plasma que passam através da fronteira. Trata-se do
fenômeno de reconexão magnética, processo citado anteriormente (Dungey,
1961; Gonzalez et al., 1994; Kamide et al., 1998).
No processo de reconexão magnética, a matéria congelada ao campo
magnético é liberada, resultando, no caso da relação entre o IMF e o campo
magnético da Terra, na transferência da energia trazida pelo vento solar para o
interior da magnetosfera. Parte do fluído entra na magnetosfera, e boa parte
dele é desviada para as laterais, sem entrar. Quando há a entrada de energia
na magnetosfera, os processos descritos, juntamente com outros processos
físicos, formam, por fim, na região equatorial da Terra, uma estrutura conhecida
como corrente de anel, a qual consiste de uma corrente equatorial composta de
íons e elétrons. Durante tempestades magnéticas, sua intensidade é
fortemente aumentada. (McPherron,1995)
A reconexão magnética pode acontecer tanto na parte frontal da magnetosfera
(lado diurno) como na cauda a, aproximadamente, 100 RE. Em ambos os
processos, há a transferência de matéria do vento solar para o interior da
magnetosfera. A dinâmica e as características deste fluxo desencadeiam dois
importantes processos na Terra: as tempestades magnéticas e as
subtempestades (associadas à ocorrência de auroras).
2.5 Conseqüências da relação Sol-Terra
O Sol é a principal fonte de energia para a Terra e as radiações que emite
podem influenciar vários processos ou sistemas no planeta. A principal
conseqüência da relação Sol-Terra é o distúrbio geomagnético, que pode ou
não causar prejuízos, dependendo da sua intensidade. Os sistemas de
transmissão de energia elétrica e de comunicação, por exemplo, mostraram-se
vulneráveis à influência solar. Foram também observados danos em sensores
e sistemas de controle, de navegação e comando de satélites (Simpson, 2003,
Tsurutani et al., 1997). Além destes prejuízos, astronautas ficam expostos
45
durante operações fora das espaçonaves (Joselyn, 1998). A FIGURA 2.11
reúne ilustrações dos principais efeitos da atividade solar sobre atividades
humanas no espaço e solo.
A intensidade de um distúrbio geomagnético pode ser especificada por uma
série de índices geomagnéticos. A característica e a intensidade desse
distúrbio e a latitude em que ocorre influenciam na escolha do índice
geomagnético mais apropriado (Tascione, 1994). Os índices mais utilizados
são:
a) Kp e Ap, em latitudes médias;
b) AU, AL e AE, na zona auroral;
c) Dst, Sym e Asy, no Equador.
O índice Dst é o mais utilizado na identificação e na previsão de tempestades
geomagnéticas.
46
FIGURA 2.11. Ilustração dos principais efeitos causados pela influência da atividade solar na Terra.
FONTE: Solar and Heliospheric Observatory Homepage (2008).
47
2.5.1 Tempestades Geomagnéticas
As variações sofridas pelo campo geomagnético como resposta à penetração e
dinâmica da matéria proveniente do plasma interplanetário dentro da
magnetosfera são resultados do desencadeamento de alguns processos
internos, como, por exemplo, a formação ou intensificação da chamada
corrente de anel (Gonzalez et al. 1994).
A tensão magnética gerada pelos campos que recém sofreram a reconexão
magnética na cauda da magnetosfera (processo descrito na Seção 2.4)
desencadeia uma série de processos físicos que envolvem partículas
carregadas, que resulta na formação da corrente de anel (estrutura toroidal
presente na FIGURA 2.12). Esta corrente faz diminuir a intensidade do campo
magnético terrestre e um aumento na sua intensidade é o primeiro indicador de
uma tempestade magnética (Tsurutani e Gonzalez, 1998). O comportamento
da corrente de anel é o que determina as características de uma tempestade
magnética, que é avaliada através do estudo da injeção, do transporte e da
perda das partículas carregadas que a constituem (Burton et al., 1975 e
Liemohn et al. 2001).
Uma tempestade magnética pode ser entendida, portanto, como um aumento
na densidade de energia das partículas que compõem a corrente de anel
equatorial. (Kamide et al., 1997)
A intensidade de uma tempestade é bem definida pelo índice Dst, o qual é
derivado de quatro estações de magnetômetros7 de baixa latitude, distribuídas
estrategicamente, nas cidades de Hermanus (África do Sul), Honolulu (Havaí,
EUA), Kakioka (Japão) e San Juan (Porto Rico).
7 Magnetômetros – são instrumentos usados para medir características como a intensidade, a direção e o sentido de campos magnéticos que estejam próximos a eles (Primdhal, 1979).
48
FIGURA 2.12. Corrente de Anel representada pela estrutura toroidal em torno da Terra (ilustração), formada durante um distúrbio geomagnético, e a ocorrência de auroras nos pólos.
FONTE: NASA Goddard Space Flight Center (2008).
A classificação das tempestades quanto à intensidade dos seus efeitos na
corrente de anel é feita através do índice Dst. Para eventos com -100 < Dst < -
50 nT, diz-se que as tempestades magnéticas são de intensidade moderada,
enquanto que aquelas em que o mínimo do Dst é inferior a -100 nT são
classificadas como tempestades magnéticas intensas (Gonzalez et al., 1994).
No grupo das intensas, considera-se ainda um grupo caracterizado por valores
extremamente negativos do Dst, classificadas como super-tempestades
magnéticas ou tempestades magnéticas muito intensas. Os valores de Dst
superiores a -30 nT geralmente são associados a distúrbios fracos ou a
ausência de distúrbio.
A FIGURA 2.13 mostra, em um exemplo de evento, as fases nas quais uma
tempestade magnética está dividida. Geralmente, há um início súbito, quando
há ocorrência de um choque, acumulando campo magnético e plasma na frente
da magnetosfera. Esta fase é chamada de fase inicial da tempestade (indicada
por I na FIGURA 2.13) e é seguida pela fase principal. A fase principal de uma
tempestade (indicada por II na FIGURA 2.13) é caracterizada pela maior
injeção de energia na corrente de anel, causada pela intensificação do
processo de reconexão na magnetosfera diurna. Logo em seguida, surge a
49
fase de recuperação (indicada por III na FIGURA 2.13), onde cessa o fluxo do
vento solar para dentro da magnetosfera (Tascione, 1994).
50 100 150 200 250 300-300
-250
-200
-150
-100
-50
0
50
Horas
nT
índice Dstíndice Dstíndice Dstíndice Dst
FIGURA 2.13. As fases da tempestade magnética que foi registrada em 6 de novembro de 2001.
Durante muitos anos estudou-se a forma como as características do meio-
interplanetário controlavam o desenvolvimento das tempestades magnéticas,
com o objetivo de buscar critérios e formas de se prever, com um período
maior de antecedência, a ocorrência das mesmas, a fim de que seus efeitos
pudessem ser amenizados.
Os eventos de tempestades magnéticas intensas geralmente aparecem
associados com estruturas interplanetárias complexas (Gonzalez et al., 2002).
Nos casos em que ocorrem inúmeros flares e em seguida múltiplas CMEs, os
quais, conseqüentemente, causam múltiplos choques, observa-se um grande
número de compressões de campo e de plasma, que resultam em tempestades
com mais de duas fases principais (Kamide et al., 1998, Vieira et al.,2001). Bell
I II III
50
et al. (1997) encontraram que a maioria das super-tempestades é marcada por
aumentos súbitos do nível de Dst.
A fim de se determinar se havia alguma dependência visível da ocorrência de
tempestades magnéticas em relação ao ciclo solar de 11 anos. Gonzalez et al.
(1994) fizeram um estudo concluindo que há uma distribuição de pico duplo,
com um aumento logo antes e um aumento logo após o pico do ciclo de
manchas solares.
Bell et al. (1997) também fizeram uma análise com super-tempestades durante
os anos de 1932 e 1995 e encontraram que a ocorrência desta classe de
tempestades dá-se, principalmente, na fase descendente do ciclo solar.
51
CAPÍTULO 3 TÉCNICAS DE INTELIGÊNCIA ARTIFICIAL
A área de Inteligência Artificial (IA) tem como um dos objetivos tentar simular
em modelos computacionais características presentes no comportamento
racional humano, na tentativa de gerar resultados próximos aos que um
humano geraria, com as vantagens de tempo, robustez e confiabilidade que um
sistema computacional pode oferecer. A IA se difere da computação
convencional por lidar com situações incertas, desconhecidas ou inexatas,
ambientes com os quais um humano lida freqüentemente. Um dos processos
simulados por algumas das técnicas de IA é o aprendizado por experiência, o
qual será o principal foco deste trabalho.
A IA é utilizada em diversas áreas, como: medicina (e.g., Andrade, 1999),
engenharia (e.g., Bianchi et al., 2007), negócios (e.g., O’Leary, 1997), entre
outras; executa vários tipos de tarefas, entre elas: reconhecimento de padrões,
processamento de sinais, processamento de imagens, controle e previsão,
realizadas por diversas técnicas, como Sistemas Especialistas, Lógica Difusa
(ou Fuzzy), Algoritmos Genéticos, Redes Neurais Artificiais, Árvore de Decisão,
entre outras.
Uma das áreas que optou pela utilização das técnicas de IA como ferramenta é
a de Clima Espacial, que a viu como uma opção de exploração de medições,
paralelamente aos estudos físicos dos diversos processos envolvidos na área.
Algumas aplicações de IA em Clima Espacial serão descritas na Seção 3.4
deste capítulo.
3.1 Técnicas escolhidas para o estudo de caso
O comportamento do campo magnético da Terra depende de uma série de
processos que envolvem, principalmente, as características do vento solar e do
campo magnético interplanetário e os processos internos que se desencadeiam
na magnetosfera, quando há a transferência de matéria e energia para o seu
52
interior. No entanto, não se tem certeza ainda de quais são os principais
elementos que ditam esse comportamento e sob quais condições.
Com o intuito de realizar a previsão do comportamento geomagnético e
investigar os parâmetros interplanetários que estariam mais ligados à
ocorrência de tempestades geomagnéticas, o presente trabalho observou duas
técnicas de IA como opções de aplicação:
a) Rede Neural Artificial do tipo Perceptron de Múltiplas Camadas,
treinada com o algoritmo backpropagation, para a previsão do índice
geomagnético Dst;
b) Árvore de Decisão, algoritmo J48, para buscar regras na ocorrência
das tempestades geomagnéticas, e
c) Mapa Auto-Organizável de Kohonen, para verificar a influência de
alguns parâmetros interplanetários na ocorrência de tempestades
geomagnéticas.
As duas primeiras técnicas utilizam o treinamento do tipo supervisionado,
durante o qual dados já observados, junto aos respectivos valores de resposta,
são apresentados. Já o Mapa de Kohonen utiliza treinamento do tipo não-
supervisionado, em que não são apresentadas à rede saídas desejadas.
3.2 Árvores de decisão
A Árvore de Decisão (DT – Decision Tree) é um algoritmo de classificação
supervisionada em que um dos resultados consiste em um conjunto de regras
encadeadas do tipo “SE � ENTÃO”, que formam uma estrutura hierárquica
semelhante à de uma árvore. Trabalha em cima de uma base de dados e
determina a classe, com base nos atributos de entrada. Os componentes desta
estrutura, basicamente, são:
53
a) Nós: regras que testam os valores (ou atributos);
b) Folhas: a classificação em si.
A tarefa da DT é, portanto, mapear um conjunto de dados já rotulados, ou seja,
descobrir o melhor conjunto de regras que leva àquela classificação, para em
seguida aplicar as regras descobertas em valores desconhecidos e assim
classificá-los.
Os dados utilizados na DT são rotulados, ou seja, cada uma das instâncias
(padrões) lidas pelo algoritmo já tem uma classe pré-definida. Estas instâncias
são compostas, além do rótulo, por um ou mais atributos, os quais podem ser
entendidos como parâmetros de entrada. Quanto maior o número de atributos,
maior a possibilidade de uma árvore com mais nós e folhas, por gerar um maior
número de combinações entre eles.
A execução da DT consiste em duas etapas:
1ª) Treinamento: Um conjunto de instâncias (compostos de um ou mais
atributos) rotuladas é apresentado ao algoritmo e este tem a tarefa de
elaborar as melhores regras que mapeiem os atributos de entrada aos
seus respectivos rótulos (atributos-classe);
2ª) Teste: O conjunto de regras formado no treinamento é aplicado em
instâncias não apresentadas na primeira etapa.
Durante as duas etapas é possível analisar a qualidade da classificação, que,
através do número de erros de classificação, definirá se a árvore produziu ou
não um bom conjunto de regras. Se sim, a árvore estará treinada para realizar
outras classificações.
A DT tem como objetivo tentar minimizar erros de classificação e o número de
nós e folhas (Santos, 2005). Possui a vantagem de exibir o conjunto de regras
gerado no treinamento, diferente de outros classificadores.
54
3.2.1 Algoritmo da Árvore de Decisão
Para explicar o algoritmo genérico de uma DT, será utilizado como referência, o
algoritmo J48 (Witten et al., 2005), encontrado implementado no programa
Weka (2008).
Uma DT pode ser desenvolvida para trabalhar com dados nominais ou
numéricos. Em ambos os casos, o seu algoritmo gera as regras baseando-se
na análise de cada atributo, através dos seus valores e da sua relação com os
demais parâmetros evolvidos. No caso de dados numéricos, os valores
utilizados são discretizados. O processo de análise utiliza-se de algumas
definições que estão relacionadas abaixo, seguidas das equações que as
descrevem (Quinlan, 1986; Witten et al., 2005; Santos, 2005).
Para facilitar a descrição, consideremos uma base de dados composta por n
instâncias. Cada instância é composta por um conjunto de atributos e por um
atributo-classe F, sendo que cada atributo A assume um valor v e o atributo-
classe F assume um valor j.
a) Probabilidade (p): A probabilidade da ocorrência de um valor para um
atributo é calculada como o número de ocorrências do valor de um
atributo dividido pelo número de instâncias da base de dados. A
probabilidade da ocorrência do valor v assumido por um atributo A
pode ser dada por:
( ) vn
p A vn
= = (3.1)
Onde vn é o número de ocorrências do valor v assumido pelo atributo A,
e n é o número de instâncias da base de dados.
b) Entropia (H): A entropia de um atributo é um valor de aleatoriedade,
que quanto maior, mais uniforme é a distribuição dos valores. Entropia
zero indica concentração absoluta de um único valor para os atributos
55
(Santos, 2005). A entropia de um atributo A , assim como a de um
atributo-classe F, pode ser dada pela equação:
( ) 2
1
logm
v v
v
H A p p=
= −∑ (3.2)
Onde m, como dito anteriormente, é o número dos diferentes valores que
são assumidos pelo atributo A e pv é a probabilidade de A assumir o valor
v.
c) Probabilidade Condicional (pC): Probabilidade de uma instância
possuir o atributo-classe F=j considerando que ele tem valor v para o
atributo A:
( ) ||
F j A v
C
F j
np F j A v
n
= =
=
= = = (3.3)
Onde |F j A vn = = é o número de ocorrências de j como valor do atributo-
classe F, quando o atributo A assume valor v; e F j
n = é o número de
ocorrências do valor j para o atributo-classe F na base de dados.
d) Entropia Condicional Específica (CE
H ): Entropia do atributo A para as
instâncias onde o atributo-classe F assume valor j:
( ) 2
1
| logv v
m
CE C C
v
H A F j p p=
= = −∑ , (3.4)
onde vC
p é a probabilidade de uma instância pertencer à classe j, sabendo-se
que o seu atributo A tem valor v; e m é a quantidade de valores distintos
assumidos pelo atributo A.
e) Entropia Condicional (C
H ): Entropia condicional de um atributo A em
relação ao atributo-classe F:
56
( ) ( ) ( )| |k
C i CE i
i
H A F p F j H A F j= = =∑ , (3.5)
onde ji é um valor possível que pode assumir o atributo-classe F e k é a
quantidade de valores diferentes assumidos por F.
As equações descritas acima levam ao cálculo de um valor de entropia
condicional para cada atributo existente na base de dados analisada. Estes
valores permitem o cálculo do ganho de informação.
f) Ganho de Informação (IG): Valor que indica dependência ou
correlação entre um atributo e a classe à qual a instância pertence,
sendo que, quanto maior o valor do IG, maior a relação de
dependência. O ganho de informação de um atributo A em relação à
classe F pode ser dado por:
( ) ( ) ( )| |CIG A F H F H A F= − . (3.6)
Se existe maior ganho de informação entre um atributo A e a classe F que
entre um atributo B e F, conclui-se que a classe F será atingida com menos
perda de informação se partir de A do que se partir de B (Santos, 2005).
O algoritmo genérico para a implementação de uma DT consiste, basicamente,
em três passos (Santos, 2005):
1. Testam-se todos os atributos. O que tiver maior ganho de informação
será escolhido para a criação de um nó da árvore;
2. Divide-se a árvore (criando nós e sub-árvores) partindo-se do atributo
selecionado.
3. Repetem-se recursivamente os passos anteriores até que não seja
mais possível decidir por atributos.
57
A FIGURA 3.1 mostra o conjunto de regras gerado pelo algoritmo ID3 (Quinlan,
1979, 1983) no exemplo “Saturday morning” (Quinlan, 1986), que usa as
instâncias relacionadas na TABELA 3.1. O problema trata a decisão de jogar
ou não golfe, dada a situação climática da manhã de sábado (“Saturday
morning”). Os atributos, neste exemplo, são: o tempo (ensolarado, nublado ou
chuvoso), a temperatura (quente, ameno ou frio), a umidade (muito ou
normal), e o vento (sim ou não); e o atributo-classe refere-se à decisão que
será tomada (jogar ou não jogar golfe).
Além da árvore, dada por um conjunto de regras, o algoritmo J48, que será
utilizado neste trabalho, gera, como resultado, uma Matriz de Confusão que
mostra o número de padrões classificados correta e incorretamente.
TABELA 3.1. Base de dados utilizada no exemplo “Saturday morning”.
ATRIBUTOS INSTÂNCIAS
TEMPO TEMPERATURA UMIDADE VENTO CLASSE
1 ensolarado quente muito não não jogar
2 ensolarado quente muito sim não jogar
3 nublado quente muito não jogar
4 chuvoso ameno muito não jogar
5 chuvoso frio normal não jogar
6 chuvoso frio normal sim não jogar
7 nublado frio normal sim jogar
8 ensolarado ameno muito não não jogar
9 ensolarado frio normal não jogar
10 chuvoso ameno normal não jogar
11 ensolarado ameno normal sim jogar
12 nublado ameno muito sim jogar
13 nublado quente normal não jogar
14 chuvoso ameno muito sim não jogar
FONTE: Adaptado de Quinlan (1986).
58
FIGURA 3.1 Árvore de Decisão gerada pelo algoritmo ID3 para os dados da TABELA 3.1.
FONTE: Adaptado de Quinlan (1986).
3.3 Redes Neurais Artificiais
O cérebro humano é um sistema de processamento paralelo altamente
complexo e não-linear, capaz de realizar tarefas como reconhecimento de
padrões, percepções e coordenação motora, muito mais agilmente que o mais
rápido dos computadores digitais existentes hoje. (Haykin, 2001)
A neurocomputação estuda a simulação computacional do cérebro humano,
fugindo das características da computação convencional, simulando a estrutura
composta por neurônios, suas interconexões e os estímulos que, através da
sinapse, passam de um neurônio para outro. O sistema resultante dessa
simulação é denominado Rede Neural Artificial (RNA).
Um neurônio biológico, como mostra a FIGURA 3.2, é basicamente composto
por três partes: dendritos, corpo celular (ou soma) e axônio. Em uma rede
neural biológica, impulsos elétricos são transferidos de uma célula para outra
através de um processo químico de conexão denominado sinapse, que ocorre
entre o axônio de um neurônio e dendritos de outros neurônios vizinhos.
tempo
umidade vento
jogar não-jogar jogar não-jogar
jogar
ensolarado nublado chuvoso
muito normal sim não
59
FIGURA 3.2. Neurônio biológico e seus componentes.
FONTE: Adaptado de Fausset (1994).
A estrutura das células do sistema neural biológico serviu como base para a
criação do considerado primeiro modelo de neurônio artificial, concebido por
Warren McCulloch e Walter Pitts (Fausset, 1994).
As RNAs são, portanto, sistemas computacionais que têm como unidades de
processamento neurônios artificiais, os quais são inter-conectados através de
pesos sinápticos. A sua modelagem pode ser realizada através de
componentes eletrônicos ou por simulações através de programas
FIGURA 4.3. As linhas tracejadas delimitam: em (a), os gaps ocorridos nos dados de plasma, aproximadamente 1,5 dia até a fase principal da tempestade; em (b), o trecho com o comportamento das componentes do IMF nas horas que antecedem a fase principal da tempestade geomagnética.
4.1.2 Índices geomagnéticos
Uma variedade de índices especifica a intensidade de um distúrbio
geomagnético.
76
Como dito anteriormente, o índice Dst é o que melhor identifica a ocorrência de
uma tempestade geomagnética. O seu valor é definido pela composição das
medições realizadas, de hora em hora, da perturbação causada no
componente horizontal (H) do campo geomagnético, coletadas por quatro
estações de magnetômetros de baixa latitude. A variação do índice Dst conta
com a contribuição de quatro grandes sistemas de corrente, que estão
presentes na magnetosfera: sistema de corrente na magnetopausa, a chamada
corrente de Chapman-Ferraro, sistemas de corrente na cauda, as correntes de
anel parciais e simétricas (Maltsev, 2003). São variações desses sistemas que
identificam as fases em que uma tempestade é dividida, como mostrado na
FIGURA 2.13 do CAPÍTULO 2.
Um exemplo do sinal do índice Dst pode ser visualizado na FIGURA 4.4,
relativo ao mês de Julho de 2000. O período inicia com valores que indicam um
baixo nível de distúrbio, com ausência de tempestades ou tempestades fracas.
No entanto, entre os dias 14, 15 e 16, foi registrada uma super-tempestade que
levou o índice a valores pertos de -300 nT. A partir daí, o restante do mês
indica a fase de recuperação, em que o Dst ainda não chega a assumir valores
próximos de 0 nT. (Gonzalez et al., 1994)
A FIGURA 4.5 mostra um outro exemplo do índice Dst em um mês quase
inteiro perturbado, como foi o caso de Outubro de 1999. Durante o período,
entre os dias 22 e 23, observou-se uma super-tempestade, quando o índice foi
reduzido a valores pertos de -250nT. Nos outros dias foram observadas
tempestades de menor intensidade. Observa-se que a maioria dos intervalos
em que o índice assume valores próximos a 0nT indica a súbita elevação do
índice que caracteriza a fase inicial de uma tempestade geomagnética.
(Gonzalez et al., 1994)
O índice Dst mensal pode ser baixado no World Data Center for Geomagnetism
from Kyoto (WDC-Kyoto), no endereço http://swdcwww.kugi.kyoto-
FIGURA 4.4. Índice Dst durante o mês de Julho de 2000. Uma super-tempestade é observada entre os dias 14, 15 e 16, quando o índice é reduzido a valores próximos de -300 nT.
FIGURA 4.5. Índice Dst no mês de Outubro de 1999. Entre os dias 22 e 23, aproximadamente, observa-se a ocorrência de uma tempestade geomagnética, em que a fase principal chegou a valores menores que -200 nT.
78
4.2 Metodologia
A seguir serão descritos os processos seguidos no desenvolvimento dos
experimentos realizados.
4.2.1 Pré-processamento: interpolação
Os dados do meio interplanetário tiveram que sofrer interpolação em três
situações: na recuperação de períodos com gaps, na atenuação de sinais e na
alteração de resolução dos dados.
Como foi mencionado anteriormente, em alguns casos, nos eventos solares em
que há a ejeção de partículas em direção aos instrumentos de coleta, os
valores dos parâmetros sofrem uma extrapolação. Esses períodos, quando
pequenos – intervalos de até uma hora - foram interpolados utilizando uma
função de aproximação baseada nos vizinhos mais próximos. Os períodos que
apresentaram um longo período de gaps – intervalos que ultrapassavam uma
hora - não foram utilizados no trabalho. A FIGURA 4.6 mostra um exemplo de
interpolação que se aplica a esse caso, realizando também a comparação
entre duas resoluções distintas – de1 hora e de 64 segundos.
Outro exemplo de preenchimento de gap é mostrado na FIGURA 4.7, com
dados de resolução de 4 minutos.
A atenuação do sinal foi realizada em alguns experimentos com o intuito de
eliminar oscilações e picos não relevantes, que poderiam interferir na tarefa de
generalização dos classificadores utilizados. Para essa interpolação foram
realizados cálculos de médias flutuantes, como exemplificam a FIGURA 4.8 e a
FIGURA 4.9.
79
SINAL COM GAP:
res. 64seg
res. 1h
GAP PREENCHIDO:
res. 64seg
res. 1h
FIGURA 4.6. Preenchimento de gaps. Neste exemplo, o mesmo gap (de aproximadamente uma hora), no sinal da temperatura de prótons, é preenchido em duas resoluções, uma horária e a outra de 64 segundos.
GAPS NA RESOLUÇÃO DE 4 MIN.:
com gapgap preenchido
FIGURA 4.7. Preenchimento de gap para a resolução de 4 minutos.
80
RESOLUÇÃO DE 64 SEG.:
original
atenuado
RESOLUÇÃO DE 1 HORA:
original
atenuado
FIGURA 4.8. Atenuação do sinal da componente Bx do IMF nas duas resoluções (64segundos e 1 hora).
INTERPOLAÇÃO COM RESOLUÇÃO DE 4 MIN:
sinal original
sinal atenuado
FIGURA 4.9. Cálculo de média flutuante para atenuação do sinal da componente Bz.
4.3 Experimentos
Os experimentos consistiram em realizar as seguintes tarefas:
a) Determinar classes de eventos, incluindo, além do índice Dst, alguns
parâmetros interplanetários, utilizando Mapa de Kohonen;
81
b) Verificar parâmetros interplanetários que possam apresentar uma
importante relação à ocorrência de tempestades geomagnéticas,
utilizando Árvore de Decisão;
c) Prever o índice geomagnético Dst, durante períodos calmos e de
tempestades, utilizando Rede Neural Artificial do tipo Perceptron
Múltiplas Camadas.
4.3.1 Seleção de dados para treinamento e testes
Para todas as fases de treinamento das técnicas envolvidas, foram utilizados
alguns eventos específicos registrados entre os anos de 1998 e 2003. Os
eventos foram selecionados pelas tempestades geomagnéticas de diferentes
intensidades e classes que ocorreram no período. As medições variam de 2 a
15 dias, aproximadamente, sofrendo variação na resolução de acordo com o
experimento realizado. Optou-se também por evitar dados com períodos
grandes de gaps. Alguns dos eventos escolhidos para o treinamento serão
exibidos a seguir, nos gráficos das FIGURA 4.10.
Como se tem, por objetivo, realizar a tarefa de previsão em um sistema em
tempo real, optou-se por utilizar, como dados para teste, meses completos de
observação – como, por exemplo, o mês de Novembro de 2001 (FIGURA 4.11)
- que podem possuir tanto períodos perturbados como períodos calmos.
82
50 100 150 200
-300
-250
-200
-150
-100
-50
0
50
Horas
nT
(11/07/2000 a 20/07/2000)
50 100 150 200 250 300
-300
-250
-200
-150
-100
-50
0
50
Horas
nT
(01/05/1998 a 13/05/1998)
100 200 300 400
-300
-250
-200
-150
-100
-50
0
50
Horas
nT
(05/11/1998 a 21/11/1998)
50 100 150 200
-300
-250
-200
-150
-100
-50
0
50
Horas
nT
(21/09/1998 a 29/09/1998)
FIGURA 4.10. Índice Dst de alguns dos eventos de tempestades geomagnéticas utilizados como dados de treinamento das ferramentas.
FIGURA 4.11. Exemplo de mês completo utilizado para testes.
(nT)
83
Os conjuntos de dados selecionados para as fases de treinamento e testes da
rede MLP não foram fixos para todos os experimentos. Por exemplo, um
conjunto utilizado no treinamento de um dos experimentos foi utilizado como
conjunto de teste em outro experimento.
A TABELA 4.1 relaciona e identifica os conjuntos de dados utilizados para as
fases de teste e treinamento, separados por período. Cada conjunto é
detalhado com o total de dias e o número de instantes (ou padrões) horários
que o compõem. Os períodos escolhidos para formarem esses conjuntos foram
os que possuíam eventos de tempestades geomagnéticas com diferentes perfis
como, por exemplo, tempestades de diferentes intensidades ou duas ou mais
tempestades subseqüentes em um mesmo mês.
TABELA 4.1. Períodos de meses completos e dias de eventos isolados utilizados como conjunto de dados nas fases de treinamento e teste nas técnicas.
GRUPO Nº DE DIAS Nº DE INSTANTES PERÍODO
DATA1 13 312 01 a 13/05/1998
DATA2 9 216 21 a 29/09/1998
DATA3 17 408 05 a 21/11/1998
DATA4 30 720 01 a 30/09/1999
DATA5 10 240 21 a 30/10/1999
DATA6 6 144 05 a 10/04/2000
DATA7 3 72 15 a 17/07/2000
DATA8 9 216 09 a 17/08/2000
DATA9 30 720 01 a 30/04/2000
DATA10 31 744 01 a 31/07/2000
DATA11 31 744 01 a 31/10/2003
DATA12 30 720 01 a 30/11/2003
O critério de escolha dos parâmetros de entrada para os experimentos com a
rede MLP foi baseado nos elementos interplanetários cujos valores, segundo
estudos, influenciam no comportamento do campo geomagnético e colaboram
com a ocorrência de tempestades geomagnéticas (Gonzalez e Tsurutani,
84
1987). O índice Dst foi utilizado como parâmetro de entrada para tentar prever
a fase de recuperação da tempestade, que dura por horas ou dias, sendo que
os parâmetros interplanetários voltam aos valores que assumem em períodos
calmos em um intervalo menor de tempo. As combinações dos parâmetros de
entrada utilizados nas ferramentas em diferentes experimentos foram os
grupos identificados na TABELA 4.2.
TABELA 4.2. Combinações de parâmetros de entrada utilizados nos classificadores.
GRUPO ENTRADAS
PE1 Bx, By e Bz
PE2 Bz
PE3 Vp e Bz
PE4 Bz e Dst
PE5 By e Dst
PE6 Vp, Bz e Dst
As três componentes do IMF Bx , By e Bz foram utilizadas como atributos na DT
com o intuito de investigar suas possíveis relações com a ocorrência de
tempestades geomagnéticas. A componente By foi escolhida como um dos
parâmetros de entrada em um dos experimentos, devido ao resultado obtido
com a DT.
4.3.2 Experimentos com Árvore de Decisão
Nos experimentos realizados com a Árvore de Decisão, com algoritmo J48
(Weka, 2008), o atributo-classe utilizado na saída foi sempre o mesmo, ou seja,
o índice Dst discretizado em valores nominais e os demais atributos foram os
parâmetros interplanetários, com uma defasagem de 1 ou 2 horas sobre o
atributo-classe. As classificações aplicadas sobre o índice Dst seguiram os
critérios e rótulos exibidos na TABELA 4.3. Os rótulos baseiam-se nos termos
utilizados na área de clima espacial para as diferentes intensidades de
tempestades geomagnéticas.
85
As variações realizadas entre os experimentos sobre cada grupo da TABELA
4.2 foram em relação:
a) Ao intervalo de horas entre o atributo-classe e os demais atributos;
b) Aos períodos de treinamento e testes, de acordo com os conjuntos
listados na TABELA 4.1,
c) Ao pré-processamento dos sinais: brutos ou atenuados.
TABELA 4.3. Identificação dos conjuntos de classes, com os devidos critérios e rótulos, para os valores nominais do índice Dst utilizados no algoritmo J48.
Os experimentos realizados com Árvore de Decisão foram analisados através
dos conjuntos de regras gerados na fase de treinamento, que foram testados
na fase de teste, e através das Matrizes de Confusão.
4.3.3 Experimentos com Rede Neural MLP
A arquitetura da rede MLP foi definida da seguinte forma:
a) O número de vetores de entrada foi variado de acordo com os
experimentos e respectivo conjunto de parâmetros, conforme a
TABELA 4.2;
b) Na camada de saída, foi utilizado sempre um neurônio;
86
c) O número de neurônios da camada oculta foi definido após a
realização de testes avaliando a variação do erro quadrático, na fase
de treinamento, para diferentes números de neurônios ocultos.
d) Foi utilizada uma única camada oculta.
A TABELA 4.4 exibe as faixas de valores testados para o número de iterações
no treinamento e o número de neurônios na camada oculta, que foram
definidos com os primeiros experimentos.
TABELA 4.4. Faixas e passos variados para os testes para definição do número de neurônios nas camadas ocultas e número de iterações na fase de treinamento.
CONFIGURAÇÕES MÍNIMO MÁXIMO PASSO
nº máximo de iterações 1000 10000 1000
nº de neurônios na camada oculta 2 20 1
Os testes para a escolha do número de neurônios para a camada oculta
retornaram valores de erro quadrático mínimo baixos para 3, 4 ou 5 neurônios
ocultos. Foi optado, portanto, pela utilização de 4 neurônios ocultos em todos
os experimentos. A arquitetura de rede utilizada nos experimentos pode ser
vista na FIGURA 4.12.
O número de iterações utilizado na fase de treinamento, na maioria dos
experimentos, girou em torno de 5 e 10 mil.
As funções de ativação f utilizadas em ambas as camadas foi a tangente
hiperbólica e o valor inicial da taxa de aprendizagem α foi de 0.2. Essas
configurações se mantiveram fixas em todos os experimentos.
87
FIGURA 4.12. Arquitetura utilizada para a RNA MLP.
Variaram, de acordo com os experimentos:
a) O número de parâmetros de entrada, de acordo com a TABELA 4.2,
da Seção 4.3.1;
b) Os conjuntos de dados escolhidos para as fases de treinamento e
teste, de acordo com os conjuntos listados na TABELA 4.1, da Seção
4.3.1.
Os experimentos ainda se concentraram em previsões com 1 e 2 horas de
antecedência com variação no número de horas (delay) entre os parâmetros de
entrada e de saída, nas fases de treinamento e teste;
Para analisar os resultados de previsão obtidos pela rede, foram escolhidas
algumas medidas que pudessem comparar os valores calculados pela rede
com os observados, são elas:
a) O coeficiente de correlação linear ( ρ );
b) A variância relativa média (ARV, do inglês, Average Relative
Variance),
CAMADA OCULTA:
CAMADA DE SAÍDA:
CAMADA DE ENTRADA:
88
c) A raiz quadrada do erro quadrático médio (RMSE, do inglês, Root
Mean Squares Error).
Optou-se por essas medidas para possibilitar a comparação dos resultados
com os dos outros trabalhos, que utilizaram os mesmos parâmetros para a
análise dos resultados. Seguem abaixo as equações que descrevem cada uma
das medidas.
O coeficiente de correlação ρ entre os dados observados e os calculados pela
rede é dado por:
( ) ( ) ( ) ( )
( ) ( ) ( ) ( )2 2
1 1 1
2 2
1 1 1 1
N N N
n n n
N N N N
n n n n
N d n y n d n y n
N d n d n N y n y n
ρ = = =
= = = =
− =
− −
∑ ∑ ∑
∑ ∑ ∑ ∑
(4.1)
Ou, de forma simplificada, por:
( )( )
( ) ( ) ( ) ( )2 22 2
N dy d y
N d d N y y
ρ−
=
− −
∑ ∑ ∑
∑ ∑ ∑ ∑ (4.2)
A ARV é dada por:
( ) ( )( )
( )( )
2
1
2
1
N
n
N
n
d n y n
ARV
d n d
=
=
−
=
−
∑
∑ (4.3)
Dada a ARV, calcula-se o Percentual de Eficiência na Previsão EP por:
( )1 *100EP ARV= − (4.4)
89
Já a RMSE é dada por:
( ) ( )( )1 2
2
1
1 N
n
RMSE d n y nN =
= − ∑ (4.5)
Para as três equações, d(n) e y(n) são, respectivamente, o valor observado e o
calculado pela rede para o padrão n, N é o número total de padrões que estão
sendo testados, e d é o valor médio do vetor de valores observados.
O coeficiente de correlação linear ρ mede o grau de relacionamento linear
entre o valor desejado e o obtido.
A ARV será um valor entre 0 e 1, sendo que quanto mais próximo de 1, maior
será a variabilidade entre o sinal desejado e o obtido e, portanto, menor será a
qualidade da previsão. Dessa forma, partindo do ARV, calcula-se o percentual
de Eficiência na Previsão EP.
A RMSE será um valor dado em nT, unidade de medida na qual é representada
o índice geomagnético Dst, indicando a raiz quadrada do erro quadrático médio
a ser considerada na previsão de cada padrão.
4.3.4 Experimentos com Mapa de Kohonen
Os experimentos realizados com o Mapa de Kohonen tiveram o objetivo de
buscar relações que fossem de encontro aos resultados obtidos com a Árvore
de Decisão.
A arquitetura utilizada nos experimentos para a rede SOM foi formada de três
parâmetros como entradas da rede, e um número dinâmico de neurônios de
saída, arranjados de forma unidimensional, e gerados durante o treinamento.
Vizinhança R=0 foi adotada nos experimentos.
Os dados utilizados nestes experimentos estavam na resolução horária (um
ponto a cada hora) e foram atenuados e discretizados para valores inteiros.
90
Foram apresentados na entrada o parâmetro By, em um conjunto de
experimentos, e o parâmetro Bz, em um outro conjunto de experimentos,
ambos em instantes t-1, t-2 e t-3. E os valores representativos de cada cluster
gerado foram apresentados de forma a indicar a intensidade do índice Dst no
instante t.
Nos experimentos, foi realizada uma alteração em relação ao algoritmo original
da rede SOM, apresentado no CAPÍTULO 3, no qual é pré-definido o número
de clusters (classes). No caso deste trabalho, optou-se pela utilização do fator
de similaridade, em vez da distância Euclidiana, que indica o quanto um padrão
apresentado é similar a um cluster existente. A similaridade alta classifica
aquele padrão como parte do referente cluster; e similaridade abaixo de um
mínimo definido obriga a criação de um novo cluster que represente aquele
padrão.
O fator de similaridade dj entre a entrada xi e o vetor de pesos do neurônio j é
dado por:
( )1j i ji jid x w w= − − , (3.6)
em que i é o número da entrada. O fator de similaridade é calculado para cada
neurônio j existente, sendo que os valores do primeiro padrão apresentado à
rede são assumidos como os pesos do primeiro neurônio que é criado.
Maiores detalhes sobre os experimentos serão dados quando forem
apresentados os resultados.
91
CAPÍTULO 5 RESULTADOS
Neste capítulo serão apresentados e analisados os principais resultados dos
experimentos descritos no capítulo anterior. Os resultados serão separados por
técnica.
5.1 Árvore de Decisão com algoritmo J48
Nos experimentos realizados com a Árvore de Decisão, deu-se mais
importância às classificações das tempestades de maior intensidade -
tempestades intensas e super-tempestades - cujos efeitos podem ser mais
prejudiciais que as de intensidade menor.
Todos os sinais utilizados nos experimentos foram atenuados e com resolução
horária. Portanto, quando é dito ‘instante’, refere-se ao ponto horário; quando é
dito instante t-1, refere-se à hora anterior ao instante t, e assim em diante.
Os resultados podem ser analisados através do conjunto de regras gerado pela
DT (ou parte dele) e da Matriz de Confusão gerada com os conjuntos de
treinamento e teste.
A Matriz de Confusão é formada pela relação dos diferentes rótulos utilizados
nos dados - arranjados na última coluna à direita - e pelas classes (que são os
próprios rótulos) às quais a DT atribuiu cada padrão apresentado, de acordo
com as regras geradas no treinamento – que estão na primeira linha de cima
para baixo. A célula resultante do cruzamento de um rótulo r com uma classe r
contém o número de padrões rotulados por r e classificados corretamente
como r, pelo conjunto de regras gerado. Ou seja, podem ser considerados
classificações corretas, o número de padrões exibidos na diagonal principal da
matriz, sendo os demais valores, classificações errôneas.
A TABELA 5.1 mostra um exemplo de Matriz de Confusão, na qual é destacado
o resultado em que 105 padrões rotulados como moderada foram classificados
como moderada (ou seja, corretamente classificados); dos demais padrões
92
rotulados como moderada, 10 foram classificados erroneamente como
ausência e 8 como fraca. E ainda, foram classificados erroneamente como
moderada: 6 padrões rotulados como ausência, 13 como fraca e 3 como
intensa. Todos os números da matriz somam 718 padrões, e os da diagonal
principal somam 601 padrões, o que significa que o conjunto de regras gerado
para esse exemplo obteve, aproximadamente, 83% de acertos na classificação.
TABELA 5.1. Exemplo de Matriz de Confusão e sua estrutura.
CLASSES
a b c d e
286 16 6 1 0 |a = ausência
56 187 13 0 1 |b = fraca
10 8 105 0 0 |c = moderada
2 1 3 13 0 |d = intensa
0 0 0 0 10 |e = super
RÓ
TU
LO
S
5.1.1 Resultado DT I: utilizando Bx, By e Bz
O primeiro resultado obtido com o algoritmo J48 foi em um experimento que
utilizou como atributos de entrada as três componentes do IMF – Bx, By e Bz -
nos instantes de tempo t, t-1 e t-2, e a classe Dst no instante t gerada pelo
CRITÉRIO I (TABELA 4.3 do CAPÍTULO 4). Parte do conjunto de regras
gerado com o conjunto de treinamento (mês completo de Novembro de 2003)
está na TABELA 5.2 e a Matriz Confusão na TABELA 5.3, com 83% de acerto
na classificação para todos os padrões e 100% de acerto na classificação dos
padrões que indicaram as super-tempestades (Muralikrishna et al., 2005 e
2006).
Com o experimento foi possível observar, através de uma série de testes, que
as regras foram iniciadas sempre com o valor de Bz como base. Isso foi de
encontro à conclusão de Gonzalez e Tsurutani (1987) de que o valor dessa
93
componente é o parâmetro que mais colabora na previsão de tempestades
geomagnéticas.
TABELA 5.2. Parte das regras geradas pelo treinamento I.
bz-2 <= -6.04952
| bx-2 <= 1.844782: super (11.0/1.0)
| bx-2 > 1.844782
| | bx-2 <= 5.354289: moderada (7.0/1.0)
| | bx-2 > 5.354289: intensa (3.0)
bz-2 > -6.04952
| bx-1 <= -1.983987
| | bz-1 <= 3.348733
Na fase de teste (realizada com o mês de Outubro de 2003), observou-se a
classificação correta de 12 dos 23 padrões rotulados como super-tempestades
(sendo 9 desses 23 classificados como ‘moderada’). Pode-se observar a Matriz
de Confusão, gerada na fase de teste, na TABELA 5.4.
TABELA 5.3. Matriz de Confusão gerada com o conjunto de treinamento I.
a b c d e
286 16 6 1 0 |a = ausência
56 187 13 0 1 |b = fraca
10 8 105 0 0 |c = moderada
2 1 3 13 0 |d = intensa
0 0 0 0 10 |e = super
TABELA 5.4. Matriz de Confusão gerada com o conjunto de teste I.
a b c d e
200 72 46 13 1 |a = ausência
69 54 34 9 1 |b = fraca
80 60 34 6 9 |c = moderada
18 8 9 1 0 |d = intensa
3 2 1 0 12 |e = super
94
Observou-se que a classificação obtida pelo conjunto de teste não apresentou
a mesma qualidade do apresentado pelo conjunto de treinamento. A análise
das Matrizes de Confusão e do conjunto de regras chamou atenção a um
possível motivo na falha das regras que classificaram incorretamente as
tempestades intensas e super: as condições das componentes do IMF na fase
inicial de uma tempestade magnética podem estar sendo associadas a valores
altos de índice geomagnético, devido ao aumento súbito que este sofre no
início do processo. E isso, consequentemente classifica erroneamente o que
seria uma tempestade à ausência de perturbação.
5.1.2 Resultado DT II: Bx, By e Bz com variação nos dados
A alteração sugerida deste conjunto de experimentos em diante foi em relação
ao conjunto de dados escolhidos para o treinamento e testes. Foram utilizados
períodos de eventos isolados de tempestades como conjunto de treinamento -
DATA5, DATA6, DATA7 e DATA8 (vide TABELA 4.1 do CAPÍTULO 4) - e
meses completos de dados para o teste - DATA9 e DATA10.
Como atributos foram utilizados Bx, By e Bz em instantes t-1 e t-2, mantendo o
Dst em instante t como atributo-classe. Neste experimento, no entanto, utilizou-
se o CRITÉRIO III para a definição dos rótulos (valores nominais do atributo-
classe).
Mais uma vez a componente Bz mostrou-se influente no comportamento do
índice Dst, prevendo tempestades do tipo intensa quando assume valores
inferiores a -11.7 nT, como pode ser visto em parte das regras da TABELA 5.5.
TABELA 5.5. Parte do conjunto de regras gerados no treinamento IIa.
bz-2 <= 7.36
| bz-2 <= -5.03
| | bz-2 <= -11.7: i (5.0)
Observando a Matriz de Confusão gerada no treinamento (TABELA 5.6),
percebe-se a classificação correta de aproximadamente 97.5% dos padrões e
95
aproximadamente 93% de acerto na classificação das tempestades intensas.
Apesar do alto percentual, as demais regras que classificaram os 25 valores de
tempestade intensa (ou seja, os 30 instantes classificados corretamente
decrescidos dos 5 presentes na regra da TABELA 5.5) não são regras
pertinentes, já que associam valores altos de Bz às tempestades intensas.
TABELA 5.6. Matriz de Confusão gerada com o conjunto do treinamento IIa.
a b c
650 1 2 |a = f
14 43 0 |b = m
2 0 30 |c = i
A Matriz de Confusão gerada no teste (TABELA 5.7) comprova essa conclusão,
uma vez que 7 tempestades intensas foram classificadas como intensa
obedecendo à regra de ‘bz-2’ assumir valores inferiores a -11.7 nT. Salienta-se
que o algoritmo J48 não permite, quando realizado um teste, a verificação das
regras que geraram as classificações corretas e errôneas. Sendo assim, a
associação realizada das classificações corretas à regra da TABELA 5.5 só foi
possível devido a uma verificação independente ao algoritmo J48.
TABELA 5.7. Matriz de Confusão gerada com o conjunto do teste IIa.
a b c
617 14 2 |a = f
49 9 1 |b = m
19 0 7 |c = i
A influência da componente By foi observada em alguns dos experimentos,
como o que será descrito a seguir, em que foram utilizados mais uma vez as
três componentes do IMF. Neste caso Bx, By e Bz foram utilizados em instantes
t-1 e t-2, os rótulos foram gerados com o CRITÉRIO I, e ainda o conjunto de
treinamento (formado por DATA5, DATA6, DATA7 e DATA8) foi diferente ao
utilizado no primeiro experimento realizado com as três componentes.
96
Como pode ser visto na parte inicial das regras que é exibida na TABELA 5.8,
as regras do exemplo combinam critérios envolvendo ‘by-2’ e ‘bz-1’,
classificando 3 super-tempestades com as condições ‘bz-1’ <= -20.55nT e ‘by-
1’ <= -6.59nT.
TABELA 5.8. Parte das regras geradas no treinamento IIb.
by-1 <= 17.48
| bz-1 <= -12.66
| | bz-1 <= -20.55
| | | by-1 <= -6.59: s (3.0/1.0)
Pela Matriz de Confusão do treinamento (TABELA 5.9), observa-se que não
foram todas as super-tempestades que se aplicaram a essa regra, já que o
total era de 8. No entanto, a Matriz de Confusão de teste (TABELA 5.10)
mostra que 2 super-tempestades foram classificadas corretamente e verificou-
se, independentemente ao algoritmo J48, que as duas super-tempestades
obedecem às regras da TABELA 5.8.
TABELA 5.9. Matriz de Confusão gerada no treinamento IIb.
a b c d e
227 5 7 1 0 |a = a
29 104 21 3 0 |b = f
3 8 162 1 0 |c = m
4 1 4 73 1 |d = i
0 0 1 1 8 |e = s
TABELA 5.10. Matriz de Confusão gerada no teste IIb.
a b c d e
266 87 117 25 0 |a = a
48 44 45 1 0 |b = f
7 5 46 1 0 |c = m
3 11 18 0 0 |d = i
0 0 1 0 2 |e = s
97
5.1.3 Resultado DT III: utilizando Bz e Vp
Observou-se um resultado interessante em um dos experimentos, no qual
foram utilizados dois parâmetros como atributos de entrada: Bz e Vp, ambos no
instante t-1.
Analisando uma parte das regras criadas (TABELA 5.11) e olhando para a
Matriz de Confusão gerada pelo conjunto de treinamento (TABELA 5.12),
observa-se que, apesar do baixo percentual de acertos (aproximadamente
69,9%), os 5 instantes que indicam super-tempestades foram classificados com
100% de acerto. A regra que classifica 2 destes 5 instantes foi estabelecida em
casos em que a velocidade de prótons registra, uma hora antes daquele
instante, valores superiores a 930 km/s; no mesmo grupo é possível observar
26 instantes das tempestades do tipo intensa sendo previstas para valores
superiores a 572 km/s, sendo 22 destes para valores entre, aproximadamente,
683km/s e 930 km/s.
Dois testes para o conjunto de regras citado foram realizados com os conjuntos
DATA9 e DATA10, sendo que o primeiro classificou corretamente 5 dos 7
instantes de super-tempestades (2 foram classificados como intensas); e o
segundo teve 100% de acerto na classificação das super-tempestades, como
pode ser visto em (a) e (b), respectivamente, da TABELA 5.13.
TABELA 5.11. Parte do conjunto de regras gerados no treinamento III.
vp-2 > 500.23
| vp-2 <= 582.29
| | bz-2 <= -7.84
| | | vp-2 <= 562.23: i (5.0/1.0)
| | | vp-2 > 562.23
| | | | vp-2 <= 572.62: s (3.0)
| | | | vp-2 > 572.62: i (4.0)
| vp-2 > 582.29
| | vp-2 > 683.43
| | | vp-2 <= 930.59: i (22.0)
| | | vp-2 > 930.59: s (2.0)
98
TABELA 5.12. Matriz de Confusão gerada com o conjunto do treinamento III.
a b c d e
184 8 12 2 0 |a = a
69 68 11 0 0 |b = f
27 28 111 7 0 |c = m
3 8 10 61 0 |d = i
0 0 0 0 5 |e = s
TABELA 5.13. Matrizes de Confusão geradas no 1º (a) e no 2º(b) testes III.
a b c d e
400 19 60 16 0 |a = a
84 19 44 12 0 |b = f
23 9 22 3 0 |c = m
0 0 1 24 0 |d = i
0 0 0 2 5 |e = s
(a)
a b c D e
448 12 34 2 0 |a = a
86 29 23 0 0 |b = f
20 11 27 1 0 |c = m
2 5 5 11 0 |d = i
0 0 0 0 3 |e = s
(b)
5.1.4 Resultado DT IV: utilizando Bz
Uma outra tentativa de obter regras relevantes para a ocorrência de
tempestades intensas ou super-tempestades foi a de utilizar como atributos de
entrada somente valores da componente que está mais ligada à ocorrência de
tempestades geomagnética, Bz, em três diferentes instantes de tempo (t-1, t-2
e t-3), semelhante ao que foi realizado no experimento da Seção 5.1.1. Desta
99
vez, no entanto, os conjuntos de dados de treinamento e teste seguiram a
opção do último experimento.
A TABELA 5.14, que mostra a Matriz de Confusão gerada pelo treinamento,
mostra que, apesar do baixo percentual de acertos (58%), foram classificadas
corretamente 4 das 10 instâncias rotuladas como super-tempestades, e 5 do
total foram classificadas como intensas.
TABELA 5.14. Matriz de Confusão gerada pelo treinamento IV.
a b c d e
186 25 26 0 0 |a = a
55 62 38 2 0 |b = f
56 21 95 1 0 |c = m
19 11 11 41 1 |d = i
1 0 0 5 4 |e = s
Um fator importante observado neste experimento foi um subconjunto isolado
de regras que descreveram a ocorrência de super-tempestades e de
tempestades intensas, como pode ser visto na TABELA 5.15, pelas condições
‘bz-1’ menor ou igual a -38.95 nT e ‘bz-1’ com valores entre -14.31 e -38.95 nT.
A verificação das classificações corretas das tempestades do tipo super e
intensa, mostradas nas Matrizes de Confusão geradas pelo 1º e pelo 2º
conjuntos de teste (TABELA 5.16), confirmou a pertinência da regra ‘bz-1’ entre
-14.31 nT e -38.95 nT como causadora de tempestades geomagnéticas
intensas (3 no primeiro teste e 4 no segundo teste).
TABELA 5.15. Parte do conjunto de regras do treinamento IV.
bz-1 <= -7.84
| bz-1 <= -14.31
| | bz-1 <= -38.95: s (2.0)
| | bz-1 > -38.95: i (23.0/5.0)
100
TABELA 5.16. Matrizes de Confusão geradas no 1º (a) e no 2º(b) testes IV.
a b c d e
299 126 63 4 1 |a = a
73 59 23 4 0 |b = f
20 14 21 2 0 |c = m
4 4 6 11 0 |d = i
1 0 0 4 2 |e = s
(a)
a b c d e
328 135 26 5 0 |a = a
42 72 21 2 1 |b = f
16 34 6 3 0 |c = m
14 0 3 6 0 |d = i
0 0 0 3 0 |e = s
(b)
5.1.5 Resultado DT V: Bz e Dst
Um último resultado obtido com a DT, cuja qualidade nos resultados já estava
sendo esperada, foi utilizando o índice Dst também como parâmetro, ou seja,
como um dos atributos de entrada, que foram Bz e Dst em instante t-1.
As classes de Dst utilizadas para esse experimento foram as geradas pelo
CRITÉRIO II (TABELA 4.3 do CAPÍTULO 4). Este apresentou uma boa
classificação não somente das super-tempestades, como das outras duas
classes com uma porcentagem de acertos no treinamento de 97% (como pode
ser visto na Matriz de Confusão da TABELA 5.18) e nos dois testes de 99%,
como pode ser visto nas Matrizes de Confusão da TABELA 5.19. Neste
experimento, o treinamento gerou um conjunto com muito menos regras que
nos outros experimentos, como pode ser observado no conjunto completo que
foi colocado na TABELA 5.17.
101
TABELA 5.17. Conjunto completo de regras geradas no treinamento V.
dst-1 <= -77
| dst-1 <= -193
| | dst-1 <= -228: s (16.0)
| | dst-1 > -228
| | | bz-1 <= -19.85: s (5.0)
| | | bz-1 > -19.85: i (9.0/1.0)
| dst-1 > -193: i (100.0/1.0)
dst-1 > -77: f (538.0/17.0)
TABELA 5.18. Matriz de Confusão gerada no treinamento V.
a b c
521 0 0 |a = f
17 107 0 |b = i
0 2 21 |c = s
TABELA 5.19. Matrizes de Confusão geradas no 1º (a) e no 2º (b) testes V.
a b c
692 0 0 |a = f
7 35 0 |b = i
0 0 9 |c = s
(a)
a b c
676 1 0 |a = f
4 31 0 |b = i
0 1 6 |c = s
(b)
O experimento, como esperado, apresentou ótimo percentual de acertos,
gerando regras já previstas para o Dst e comprovando as regras observadas
para o Bz nos outros experimentos relacionados anteriormente.
102
5.1.6 Outros experimentos
Além dos experimentos com a utilização de parâmetros com valores discretos
como atributos de entrada, também foram realizados experimentos com dados
nominais tanto como atributos de entrada como no atributo-classe. No entanto,
esses resultados não serão apresentados por não terem apresentado boa
qualidade.
Nos experimentos com a DT, percebeu-se que nas regras geradas poderia
haver uma falha na classificação nos pontos de início das tempestades, já que
o Dst sofre um acréscimo súbito nesta fase. A outra ‘confusão’ nas regras pode
ter sido gerada devido à duração da fase de recuperação das tempestades,
que não está associada a perturbações nas componentes do campo magnético
interplanetário. Neste caso, uma tempestade poderia estar no início da fase de
recuperação – ou seja, ainda com o índice Dst assumindo valores muito baixos
- quando, uma hora antes, a componente Bz, por exemplo, já teria recuperado
para a sua faixa normal de valores.
A TABELA 5.20 mostra um exemplo de conjunto de regras geradas que
descreve essa situação, em que tempestades intensas, ao contrário do
esperado, são classificadas na condição de ‘bz-1’ assumir valores superiores a
17.85 nT.
TABELA 5.20. Subconjunto de regras ‘confusas’.
bz-2 > 5.42
| | bz-1 <= 17.85
| | | bz-1 <= 2.52: a (2.0/1.0)
| | | bz-1 > 2.52
| | | | bz-3 <= 5.17
| | | | | bz-2 <= 6.67
| | | | | | bz-2 <= 6.09: a (3.0/1.0)
| | | | | | bz-2 > 6.09: i (2.0)
| | | | | bz-2 > 6.67: a (2.0)
| | | | bz-3 > 5.17: m (32.0/17.0)
| | bz-1 > 17.85: i (9.0)
103
5.2 RNA MLP com algoritmo backpropagation
Previsões com alto grau de correlação foram obtidos desde os primeiros
experimentos realizados com a RNA MLP. (Muralikrishna et al., 2008a e 2008b)
Os principais resultados serão exibidos através de gráficos comparativos
gerados na fase de teste, ou seja, para períodos distintos aos utilizados
durante a fase de treinamento, com a sobreposição dos sinais de valores
desejados com os obtidos pela rede. Os resultados serão ainda avaliados
calculando-se o coeficiente de correlação linear ( ρ ), a variância relativa média
(ARV) e a raiz quadrada do erro quadrático médio (RMSE), descritos no
CAPÍTULO 4.
Cada um dos experimentos gerou diferentes resultados ao se alterar os
conjuntos de treinamento e teste e o número de iterações no treinamento.
Portanto, entre eles, o melhor resultado será descrito.
5.2.1 Resultado MLP I: previsão com 1 hora de antecedência
Os experimentos que geraram os melhores resultados foram os realizados para
previsão com uma hora de antecedência.
Uma das primeiras combinações testadas, de forma a investigar a relação de
By (observada nos experimentos com a DT) e comprovar a relação de Bz na
ocorrência de tempestades geomagnéticas, foram com Bz, By e Dst em
instantes t-1 e t-2, utilizando como dados para o conjunto de treinamento os
períodos DATA1, DATA2, DATA3 e DATA7 (vide TABELA 4.1 do CAPÍTULO
4), e como dados para teste, o mês completo de Setembro de 1999, ou DATA4.
O resultado pode ser observado no gráfico da FIGURA 5.1 e nas medidas da
TABELA 5.21.
104
100 200 300 400 500 600 700-300
-250
-200
-150
-100
-50
0
50
Tempo(horas)
Dst
(n
T)
(01/09/1999 a 30/09/1999)
desejado
obtido
FIGURA 5.1. Resultado I-a: mês de Setembro de 1999.
TABELA 5.21. Resultado I-a: Medidas para análise da qualidade do resultado.
Conjunto de Treinamento DATA1, DATA2, DATA3, DATA7
Parâmetros de Entrada Bz, By e Dst em t-1 e t-2
Coeficiente de Correlação ~ 0.97
% de Eficiência na Previsão ~ 88.5%
RMSE ~ 8 nT
O mesmo conjunto de parâmetros foi treinado desta vez com o mês de
Setembro de 1999 (previsto na FIGURA 5.1) e apresentou melhores
resultados. Um deles pode ser visto no gráfico da FIGURA 5.2, cuja avaliação
pode ser realizada pela TABELA 5.22.
105
100 200 300 400 500 600 700-300
-250
-200
-150
-100
-50
0
50
Tempo(horas)
Dst
(n
T)
(01/10/2000 a 31/10/2000)
desejado
obtido
FIGURA 5.2. Resultado I-b: mês de Outubro de 2000.
TABELA 5.22. Resultado I-b: Medidas para análise da qualidade do resultado.
Conjunto de Treinamento DATA4
Parâmetros de Entrada Bz, By e Dst em t-1 e t-2
Coeficiente de Correlação ~ 0.98
% de Eficiência na Previsão ~ 94.5%
RMSE ~ 7 nT
Os próximos dois gráficos (FIGURA 5.3 e FIGURA 5.4) representam os
resultados obtidos com a utilização da componente Bz e Dst em instantes t-1 e
t-2. Como esperado, eles mostram uma previsão de boa qualidade. O primeiro
resultado (FIGURA 5.3 e TABELA 5.23) pode ser comparado ao representado
pela FIGURA 5.2 e TABELA 5.22. Observa-se, no resultado obtido sem a
utilização do By, uma melhora significativa melhora na eficiência da previsão.
106
100 200 300 400 500 600 700-300
-250
-200
-150
-100
-50
0
50
Tempo(horas)
Dst
(n
T)
(01/10/2000 a 31/10/2000)
desejado
obtido
FIGURA 5.3. Resultado I-c: mês de Outubro de 2000.
TABELA 5.23. Resultado I-c: Medidas para análise da qualidade do resultado.
Conjunto de Treinamento DATA1, DATA2 e DATA3
Parâmetros de Entrada Bz e Dst em t-1 e t-2
Coeficiente de Correlação ~ 0.98
% de Eficiência na Previsão ~ 96.5%
RMSE ~ 6 nT
107
100 200 300 400 500 600 700-300
-250
-200
-150
-100
-50
0
50
Tempo(horas)
Dst
(n
T)
(01/09/2002 a 30/09/2002)
desejado
obtido
FIGURA 5.4. Resultado I-d: mês de Setembro de 2002.
TABELA 5.24. Resultado I-d: Medidas para análise da qualidade do resultado.
Conjunto de Treinamento DATA1, DATA2 e DATA3
Parâmetros de Entrada Bz e Dst em t-1 e t-2
Coeficiente de Correlação ~ 0.99
% de Eficiência na Previsão ~ 97%
RMSE ~ 5 nT
Para então investigar a influência da componente By independentemente à Bz,
optou-se por utilizá-lo como parâmetro de entrada, junto somente do Dst. O
resultado comprova a grande influência de By no comportamento do índice Dst
como pode ser visto claramente no gráfico da FIGURA 5.5 e na TABELA 5.25.
108
100 200 300 400 500 600 700-300
-250
-200
-150
-100
-50
0
50
Tempo(horas)
Dst
(n
T)
(01/04/2000 a 30/04/2000)
desejado
obtido
FIGURA 5.5. Resultado I-e: mês de Abril de 2000.
TABELA 5.25. Resultado I-e: Medidas para análise da qualidade do resultado.
Conjunto de Treinamento DATA1, DATA2 e DATA3
Parâmetros de Entrada By e Dst em t-1 e t-2
Coeficiente de Correlação ~ 0.98
% de Eficiência na Previsão ~ 94.5%
RMSE ~ 8 nT
Os resultados realizados com o parâmetro Velocidade de Prótons (Vp) em
conjunto com a componente Bz do IMF e o índice Dst, como entradas da rede,
geraram resultados satisfatórios, porém inferiores aos obtidos somente com o
Bz e o Dst. Nota-se, no entanto, olhando para a TABELA 5.26, que o resultado
apresentou um ótimo grau de correlação entre os dois sinais, o que indica que
ambos apresentaram um grande grau de inter-relacionamento ao longo de
todos os padrões. O alto valor de erro, então, pode ser justificado pelo
109
deslocamento observado na sobreposição esperada entre eles, podendo esta
situação ser observada no gráfico da FIGURA 5.6.
100 200 300 400 500 600 700-300
-250
-200
-150
-100
-50
0
50
Tempo(horas)
Dst
(n
T)
(01/09/2002 a 30/09/2002)
desejado
obtido
FIGURA 5.6. Resultado I-f: mês de Setembro de 2002.
TABELA 5.26. Resultado I-f: Medidas para análise da qualidade do resultado.
Conjunto de Treinamento DATA4
Parâmetros de Entrada Vp, Bz e Dst em t-1,e t-2
Coeficiente de Correlação ~ 0.99
% de Eficiência na Previsão ~ 77.5%
RMSE ~ 15 nT
Para tentar verificar se a dimensão do histórico dos parâmetros de entrada
geraria melhoria na qualidade da previsão, optou-se por utilizar esses
parâmetros de um instante anterior (t-1) até, incrementando, 4 instantes
anteriores (t-4). Os experimentos, em que foi utilizado apenas um instante
110
anterior – Bz e Dst em instante t-1 – não geraram melhores resultados
comparados com os que utilizaram dois, exibidos nos experimentos acima.
Comparando-se os gráficos e tabelas dos resultados que utilizaram dois
instantes anteriores de Bz e Dst (FIGURA 5.3 e TABELA 5.23) e By e Dst
(FIGURA 5.5 e TABELA 5.25) com os que utilizaram três instantes anteriores
dos mesmos parâmetros (FIGURA 5.7 e TABELA 5.27, e FIGURA 5.8 e
TABELA 5.28, respectivamente), não se observa alterações relevantes.
Da mesma forma, foi testado o acréscimo de valores observados em instantes
anteriores como entrada para ambos os conjuntos de parâmetros, sem obter
alterações relevantes nos resultados, mostrando que os valores que
ultrapassam de 2 horas de antecedência, em princípio, não colaboram com o
aumento da qualidade da previsão.
100 200 300 400 500 600 700-300
-250
-200
-150
-100
-50
0
50
Tempo(horas)
Dst
(n
T)
(01/10/2000 a 31/10/2000)
desejado
obtido
FIGURA 5.7. Resultado I-g: mês de Outubro de 2000.
111
TABELA 5.27. Resultado I-g: Medidas para análise da qualidade do resultado.
Conjunto de Treinamento DATA4
Parâmetros de Entrada Bz e Dst em t-1, t-2 e t-3
Coeficiente de Correlação ~ 0.99
% de Eficiência na Previsão ~ 96.5%
RMSE ~ 6 nT
100 200 300 400 500 600 700-300
-250
-200
-150
-100
-50
0
50
Tempo(horas)
Dst
(n
T)
(01/10/2000 a 31/10/2000)
desejado
obtido
FIGURA 5.8. Resultado I-h: mês de Outubro de 2000.
TABELA 5.28. Resultado I-h: Medidas para análise da qualidade do resultado.
Conjunto de Treinamento DATA4
Parâmetros de Entrada By e Dst em t-1, t-2 e t-3
Coeficiente de Correlação ~ 0.98
% de Eficiência na Previsão ~ 96%
RMSE ~ 6 nT
112
Foram realizados, para a previsão com 1 hora de antecedência, outros
experimentos que não apresentaram bons resultados.
5.2.2 Resultado MLP II: previsão com 2 horas de antecedência
Para a previsão com duas horas de antecedência, optou-se pelos parâmetros
de entrada que trouxeram os melhores resultados no primeiro conjunto de
experimentos, previsão com uma hora, ou seja, By, Bz e Dst.
Entre as combinações, o melhor resultado foi obtido utilizando como
parâmetros de entrada a componente Bz e o índice Dst em instantes t-2, t-3 e t-
4 e como parâmetros de saída o índice Dst no instante t. O gráfico da FIGURA
5.9 mostra a previsão do mês para essa configuração, que teve como medidas,
os valores da TABELA 5.29.
100 200 300 400 500 600 700-300
-250
-200
-150
-100
-50
0
50
Tempo(horas)
Dst
(n
T)
(01/10/2000 a 31/10/2000)
desejado
obtido
FIGURA 5.9. Resultado II: mês de Outubro de 2000.
113
TABELA 5.29. Resultado II: Medidas para análise da qualidade do resultado.
Conjunto de Treinamento DATA4
Parâmetros de Entrada Bz e Dst em t-2, t-3 e t-4
Coeficiente de Correlação ~ 0.95
% de Eficiência na Previsão ~ 89.5%
RMSE ~ 10 nT
Apesar da componente By ter apresentado bons resultados nos experimentos
de previsão com uma hora de antecedência, nestes os resultados foram bem
inferiores aos obtidos com os outros dois parâmetros.
Os experimentos de previsão com mais de 2 horas de antecedência
apresentaram uma baixa eficiência nos resultados, abaixo de 60%. Esse
comportamento nos resultados leva à conclusão que o processo que inicia no
distúrbio dos sinais interplanetários e termina na perturbação do campo
geomagnético leva em torno de 2 horas; em outras palavras, o índice
geomagnético leva em torno de 2 horas para responder ao avanço de
estruturas e à entrada de energia e matéria na magnetosfera.
5.2.3 Comparação de Resultados obtidos com a rede MLP
Wu e Lundstedt (1996) utilizaram uma Rede Neural Elman para a previsão do
índice Dst com 1 hora de antecedência e obtiveram a 85% de eficiência na
previsão (ARV de 0.15) e um coeficiente de correlação entre o Dst observado e
o previsto pela rede de 0.92.
Mais tarde, Wu e Lundstedt (1997) avançaram o seu estudo para a previsão do
Dst com 2 horas de antecedência. Obtiveram como resultado uma eficiência na
previsão de 82%, chegando a obter 0.90 de coeficiente de correlação entre os
dois sinais.
114
Kugblenu et al. (1999) utilizaram uma RNA MLP com treinamento
backpropagation para realizar a previsão do índice Dst com uma hora de
antecedência. Como entradas, foram apresentados os parâmetros
interplanetários B total e Bz do IMF e a Pressão Dinâmica – calculada em
função da Densidade e da Velocidade de prótons do vento solar – em instante
t-3, e Dst em instante t-1, t-2 e t-3, estando a saída desejada Dst no instante t.
O melhor resultado conseguido no trabalho foi a previsão de uma tempestade
(ocorrida em 19 de Dezembro de 1980), com ARV de 0.04, ou seja, com 96%
de eficiência e RMSE de 11 nT. Um outro evento gerou um coeficiente de
correlação de 0.96.
Verificou-se na previsão do índice Dst realizado no presente trabalho uma
qualidade superior aos obtidos por Wu e Lundstedt (1996 e 1997) e
semelhantes aos obtidos por Kugblenu et al. (1999).
5.3 Mapa Auto-Organizável de Kohonen
Os resultados obtidos com a rede SOM serão apresentados por clusters
representativos, através das observações do acréscimo (ou decréscimo) do
sinal e da cor com a qual o sinal foi plotado. Um exemplo de cluster está
ilustrado na FIGURA 5.10, em que está indicado o número do cluster no canto
superior direito, os três valores dos pesos representativos do cluster em
instantes t-1, t-2 e t-3, e duas linhas horizontais tracejadas que indicam, com
um limite inferior e outro superior, a faixa dentro da qual o parâmetro plotado
assume valores considerados normais.
Considerando que os pesos que compõem os clusters são valores
representativos dos parâmetros de entrada da rede, que estão em instantes t-1,
t-2 e t-3, eles são plotados com cores que representam a intensidade do índice
Dst medido no instante t. As cores seguem os critérios de classificação da
TABELA 4.3 (CAPÍTULO 4). Por exemplo, no caso do CRITÉRIO III, como no
conjunto de clusters da FIGURA 5.11, estão representados nas cores: ciano, os
clusters associados a índices que indicam tempestade fraca ou a ausência de
115
perturbação; em verde, os associados a tempestades moderadas, e em
vermelho, os associados a tempestades intensas ou super-tempestades.
-30
-20
-10
0
10
20
30
319
Bz
(nT
)
t-3t-3t-3t-3t-2t-2t-2t-2
t-1t-1t-1t-1
FIGURA 5.10. Exemplo da representação de um cluster.
Um dos resultados relevantes obtidos com a rede SOM foi utilizando a
componente Bz em três instantes t-3, t-2 e t-2 como entrada. O algoritmo gerou,
para um fator de similaridade de 0.75, os 319 clusters apresentados na
FIGURA 5.11.
Nota-se que os únicos clusters que representam o decréscimo da componente
Bz, ao longo das 3 horas, para valores abaixo do normal – os de número 215,
216, 281 e 282 - estão indicados pela ocorrência de tempestades do tipo
intensa ou super (cor vermelha) e assumiram os valores:
116
TABELA 5.30. Valores representativos do decréscimo de Bz nos instantes que antecedem a ocorrência de tempestades intensas ou super-tempestades.
FIGURA 5.12. Parte dos clusters gerados para entradas By.
Nota-se, neste caso, que três clusters representam a queda visível do By para
valores abaixo do normal – os de número 255, 308 e 341. Entre eles um deles
indica a ocorrência de tempestade moderada (341), enquanto os outros dois
indicam a ocorrência de tempestade intensa ou super. Os valores são
representados na TABELA 5.31.
TABELA 5.31. Valores representativos do decréscimo de By nos instantes que antecedem a ocorrência de tempestades moderadas e intensas (ou super-tempestades).
CLUSTER Nº By-3 By-2 By-1
255 24 5 -17
308 24 1 -40
341 23 -1 -17
Os resultados obtidos com o Mapa de Kohonen, mesmo que não tenham
oferecido regras exatas sobre o comportamento das componentes By e Bz na
ocorrência de tempestades, vão de encontro às relações encontradas com a
Árvore de Decisão, comprovando a influência do Bz e sugerindo a influência
também de By.
118
119
CAPÍTULO 6 CONCLUSÕES
Após o desenvolvimento dos experimentos apresentados e a análise dos
resultados, concluiu-se que:
a) A utilização da RNA MLP possibilitou a realização da tarefa de
previsão do índice geomagnético Dst, foco principal deste trabalho,
com alto percentual de eficiência, superando resultados obtidos em
outros trabalhos que utilizaram a mesma abordagem.
b) As árvores de Decisão possibilitaram a comprovação de relações já
conhecidas entre parâmetros interplanetários e o comportamento do
campo geomagnético e sugeriram ainda a influência de um parâmetro
novo do campo magnético interplanetário, que estudos anteriores não
cogitaram.
A técnica Árvore de Decisão mostrou-se uma ferramenta interessante à
descoberta de regras específicas para ocorrência de tempestades
geomagnéticas dos tipos intensa e super, uma vez que uma pequena parte do
conjunto de regras gerado no treinamento pode ser interessante, mesmo que o
conjunto como um todo não apresente um grande percentual de acertos na
classificação.
Alguns dos resultados da DT confirmaram a influência já conhecida da
componente Bz e levantaram a possível influência de By na ocorrência de
tempestades geomagnéticas.
Algumas regras confirmaram também a importância da velocidade de prótons,
que sob alguns critérios, indicaram a ocorrência de tempestades intensas e
super.
E ainda, quando utilizados como um dos atributos de entrada o índice Dst, em
instantes anteriores, bons resultados foram obtidos, como já era esperado, com
regras previsíveis, que mostram que o comportamento prévio do índice
120
influencia o seu comportamento futuro, principalmente na fase de recuperação
de uma tempestade geomagnética.
Apesar dos interessantes resultados obtidos com a DT, alguns pontos fracos
foram observados nesta abordagem, como por exemplo, o fato do algoritmo
J48 não ter conseguido lidar com a não-linearidade, como ocorre, por exemplo,
na fase de recuperação das tempestades, em que o comportamento do IMF
volta ao normal mas o Dst ainda possui valores abaixo do normal, o que o fez
gerar regras confusas. Outro ponto foi o de não permitir facilmente a
conferência, na fase de testes, das regras que geraram as classificações
corretas. Essa tarefa foi realizada, portanto, à parte.
As influências sugeridas nos experimentos realizados com a DT foram
reforçadas pela rede SOM, que verificou decréscimos tanto na componente By
como na componente Bz, instantes antes da ocorrência de tempestades dos
tipos moderada, intensa e super.
A RNA MLP realizou a tarefa de previsão do índice Dst com grande percentual
de eficiência. Como esperado, os conjuntos de dados formados pela
componente Bz, junto com o índice Dst foram os que geraram melhores
resultados de previsão. Os resultados ainda mostraram grande eficiência de
previsão na utilização da componente By, junto ao Dst, como entradas, o que
vai de encontro à influência de By verificada pela DT e pela rede SOM.
As medidas de eficiência na previsão, RMSE e coeficiente de correlação
permitiram a comparação dos resultados do presente com outros que
abordaram a RNA como técnica para previsão do Dst, sendo que a previsão
realizada neste trabalho foi igual ou superior à realizada pelos outros para a
defasagem de 1 hora, e superior para a defasagem de 2 horas.
Em relação ao tempo de resposta do campo geomagnético a distúrbios
interplanetários registrados pelo satélite ACE, concluiu-se que o processo entre
a perturbação no IMF e a ocorrência de tempestades magnéticas gira em torno
121
de 1 a 2 horas, já que a utilização de valores em instantes anteriores a duas
horas e a previsão com mais de duas horas de antecedência não trouxeram
resultados melhores que os previstos para essas duas defasagens.
6.1 Contribuições
Este trabalho apresentou, como principais contribuições:
a) uma RNA, que realiza a previsão do índice geomagnético Dst,;
b) a sugestão da influência de mais um parâmetro do campo magnético
interplanetário - componente By – no comportamento do campo
geomagnético.
6.2 Sugestões para trabalhos futuros
Para dar continuidade à investigação de elementos que possam contribuir com
a ocorrência de tempestades utilizando Árvore de Decisão, sugere-se analisar
separadamente as diferentes intensidades de tempestades, concentrando-se,
por exemplo, somente nas dos tipos intensa ou super. Sugere-se ainda que o
algoritmo proposto permita discriminar de alguma forma as regras que geraram
classificações corretas na fase de testes.
A outra sugestão é trabalhar com dados já observados, com a aplicação de um
procedimento que permita apresentar os dados em janelas de tempo maiores,
em vez de ponto a ponto. O intuito é o de estudar a variação do
comportamento dos parâmetros interplanetários nos instantes que antecedem
a ocorrência de uma tempestade geomagnética, com o conhecimento prévio da
intensidade que ela atingirá na sua fase principal.
Sugere-se ainda a investigação mais profunda da influência da componente By
no comportamento do campo geomagnético, em diferentes fases do ciclo solar.
122
123
REFERÊNCIAS BIBLIOGRÁFICAS
ADVANCED COMPOSITION EXPLORER HOMEPAGE. Mission overview.
Disponível em http://www.srl.caltech.edu/ACE/ace_mission.html. Acesso em
Julho de 2008.
ANDRADE P. J. N. Sistemas especialistas de apoio ao diagnóstico em
medicina. Relações com o teorema de Bayes e com a lógica do raciocínio
diagnóstico. Arq Bras Cardiol 1999;v. 73, n.6, p. 537-543, 1999.
BELL, J. T.; GUSSENHOVEN, M. S.; MULLEN, E. G. Super Storms. Journal of
Geophysical Research – Space Physics, v. 102, no. A7, p. 14 189-14198, July
1997.
BIANCHI, R. A. C.; RIBEIRO, C. H. C. ; COSTA, A. H. R. . Heuristic Selection
of Actions in Multiagent Reinforcement Learning. In: INTERNATIONAL JOINT
CONFERENCE ON ARTIFICIAL INTELLIGENCE - IJCAI, 20.. Proceedings of
IJCAI 2007, Hyderabad: [s.n], 2007.
BRANDT, J.C. Introduction to the solar Wind. San Francisco: Freeman and
Company, 1970.
BRUECKNER, G. E.; HOWARD, R. A.; KOOMEN, M. J.; KORENDYKE, C. M.;
MICHELS, D. J.;MOSES, J. D.; SOCKER, D. G.; DERE, K. P.; LAMY, P. L.;
LLEBARIA, A.; BOUT, M. V.; SIMNETT, G. M.; BEDFORD, D. K.; EYLES, C. J.
The large angle spectroscopic coronograph (LASCO). Solar Phys. V. 162, p.
357-402,1995.
BURLAGA, L. F., SITTLER, E., MARIANI, F. e SCHWENN, R. Magnetic loop
behind na interplanetary shock: Voyager, Hélios and IMP-8 observations. J.
Geophys. Res., v. 86, n. A8, p. 6673-6684, Aug. 1981.
BURLAGA, L. F. Interplanetary Magnetohydrodynamics. New York: Oxford
PUBLICAÇÕES TÉCNICO-CIENTÍFICAS EDITADAS PELO INPE
Teses e Dissertações (TDI)
Manuais Técnicos (MAN)
Teses e Dissertações apresentadas nos Cursos de Pós-Graduação do INPE.
São publicações de caráter técnico que incluem normas, procedimentos, instruções e orientações.
Notas Técnico-Científicas (NTC)
Relatórios de Pesquisa (RPQ)
Incluem resultados preliminares de pesquisa, descrição de equipamentos, descrição e ou documentação de programa de computador, descrição de sistemas e experimentos, apresenta- ção de testes, dados, atlas, e docu- mentação de projetos de engenharia.
Reportam resultados ou progressos de pesquisas tanto de natureza técnica quanto científica, cujo nível seja compatível com o de uma publicação em periódico nacional ou internacional.
Propostas e Relatórios de Projetos (PRP)
Publicações Didáticas (PUD)
São propostas de projetos técnico-científicos e relatórios de acompanha-mento de projetos, atividades e convê- nios.
Incluem apostilas, notas de aula e manuais didáticos.
Publicações Seriadas
Programas de Computador (PDC)
São os seriados técnico-científicos: boletins, periódicos, anuários e anais de eventos (simpósios e congressos). Constam destas publicações o Internacional Standard Serial Number (ISSN), que é um código único e definitivo para identificação de títulos de seriados.
São a seqüência de instruções ou códigos, expressos em uma linguagem de programação compilada ou inter- pretada, a ser executada por um computador para alcançar um determi- nado objetivo. São aceitos tanto programas fonte quanto executáveis.
Pré-publicações (PRE)
Todos os artigos publicados em periódicos, anais e como capítulos de livros.