P:\_DPP\HIDROLOGIA\GPD3\PROJETO UTM\Relatório\NT_051-09_Neuro3M - revisão 1.doc PREVISÃO DE VAZÕES DIÁRIAS AO RESERVATÓRIO DE TRÊS MARIAS USANDO A TÉCNICA DE REDES NEURAIS Operador Nacional do Sistema Elétrico Presidência Rua da Quitanda 196/22º andar, Centro
89
Embed
previsão de vazões diárias ao reservatório de três marias usando a ...
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
b) Análise de correlação e preenchimento de falhas 35
6.3 Tratamento da vazão natural 37 6.4 Análise Estatística 37
7. Resultados 48 7.1 Calibração da Rede Neural 48 7.2 Testes para o PMO e suas revisões 51
8. Conclusões e Recomendações 64
9. Operacionalização do Modelo Neuro3M no ONS 65
10. Referências Bibliográficas 66
ONS P:\_DPP\HIDROLOGIA\GPD3\PROJETO UTM\Relatório\NT_051-09_Neuro3M - revisão 1.doc
4 / 89
ANEXO I Resultados da comparação dos modelos – previsão de vazões para a primeira semana operativa 69
ANEXO II Chuva média da bacia para todos os meses do ano (em mm) 72
ANEXO III Análise de Consistência dos dados pluviométricos através do método do Vetor Regional 77
Lista de figuras e tabelas
Figura 01 – Localização da sub-bacia 40 no estado de Minas Gerias (CPRM,1996) 11
Figura 02 – Esquema representativo da composição da semana operativa nas revisões semanais 13
Figura 03 – Esquema de parada do treinamento no processo de validação cruzada 17
Figura 04 – Arquitetura combinatorial 18 Figura 05 - Distribuição espacial dos postos pluviométricos
na bacia do rio São Francisco (trecho à montante da UHE Três Marias) 23
Figura 06 – Variabilidade espacial da precipitação e erro associoado à interpolação – Mês de Janeiro 25
Figura 07 – Variabilidade espacial da precipitação e erro associoado à interpolação – Mês de Abril 25
Figura 08 – Variabilidade espacial da precipitação e erro associoado à interpolação – Mês de Agosto 26
Figura 09 – Variabilidade espacial da precipitação e erro associoado à interpolação – Mês de Dezembro 26
Figura 10 – Relação entre a chuva média observada e prevista para os anos de 1996 a 2007 28
Figura 11 – Relação entre a chuva média observada e prevista para as semanas operativas dos anos de 1998 a 2007 28
Figura 12 – Curva de permanência da chuva verificada e prevista a) agosto a novembro b)dezembro e janeiro 30
Figura 13 – Curva de permanência da chuva verificada e prevista a) fevereiro e março b) abril a julho 30
Figura 14 – Análise da existência de Viés – Período de Agosto a Novembro 31
Figura 15 – Análise da existência de Viés – Período de Dezembro e Janeiro 31
Figura 16 – Análise da existência de Viés – Período de Fevereiro e Março 32
ONS P:\_DPP\HIDROLOGIA\GPD3\PROJETO UTM\Relatório\NT_051-09_Neuro3M - revisão 1.doc
5 / 89
Figura 17 – Análise da existência de Viés – Período de Abril a Julho 32
Figura 18 – Relação entre a chuva média observada e prevista para as semanas operativas dos anos de 1998 a 2007 – após remoção do viés 33
Figura 19 – Sub-bacias da área de drenagem de Três Marias com a localização dos postos fluviométricos selecionados 34
Figura 20 – Polígono de Thiessen dos postos pluviométricos selecionados 38
Figura 21 – FAC dos postos de Porto Indaiá e Porto Mesquita 39
Figura 22 – FAC dos postos de Ponte Nova do Paraopeba e Ponte dos Vilelas Jusante 39
Figura 23 – FAC da vazão natural de Três Marias e do posto de Porto das Andorinhas 40
Figura 24 – FAC dos postos de Porto Pará e Iguatama 40 Figura 25 - Variabilidade das séries 43 Figura 26 – Matriz de correlação 44 Figura 27 – Dendograma 45 Figura 28 – ACP – análise dos componentes 1, 2 e 3 47 Figura 29 – ACP – análise dos componentes 2 e 3 47 Figura 30 – Períodos usados na divisão dos dados em
treinamento, validação e teste 48 Figura 31 – Dados de entrada das Redes NSRBN
selecionadas 50 Figura 32 – Parâmetros e desvios obtidos na calibração da
rede neural 51 Figura 33 – Comparação dos resultados da previsão 12
dias à frente – período úmido 52 Figura 34 – Comparação dos resultados da previsão 12
dias à frente – período seco 52 Figura 35 – Comparação dos resultados obtidos da
previsão semanal 54 Figura 36 – Ganhos/Perdas na qualidade dos resultados da
previsão de vazões da próxima semana operativa com a adoção da metodologia proposta 55
Figura 37 – Comparação dos resultados da previsão semanal – frequencia acumulada de acertos 58
Figura 38 – Comparação dos resultados da previsão semanal – frequencia acumulada de acertos 60
Figura 39 – Comparação dos resultados da previsão semanal – Ano 2000 61
Figura 40 – Comparação dos resultados da previsão semanal – Ano 2001 61
Figura 41 – Comparação dos resultados da previsão semanal – Ano 2002 62
Figura 42 – Comparação dos resultados da previsão semanal – Ano 2003 62
ONS P:\_DPP\HIDROLOGIA\GPD3\PROJETO UTM\Relatório\NT_051-09_Neuro3M - revisão 1.doc
6 / 89
Figura 43 – Comparação dos resultados da previsão semanal – Ano 2006 63
Figura 44 – Comparação dos resultados da previsão semanal – Ano 2007 63
Tabela 01 – Postos pluviométricos selecionados 21 Tabela 02 – Coeficiente de correlação entre os postos
pluviométricos selecionados na área a montante de Três Marias 22
Tabela 03–Constantes a e b das equações obtidas para remoção do viés da previsão de precipitação 33
Tabela 04 – Postos Fluviométricos da CEMIG em operação na área a montante do reservatório de Três Marias 36
Tabela 05 – Coeficiente de correlação entre os postos fluviométricos 36
Tabela 06 – Média e desvio padrão dos dados semanais usados 38
Tabela 07 – Lags obtidos para FAC máxima de 0,6 41 Tabela 08 – Lags obtidos para correlação cruzada máxima
de 0,6 entre a vazão natural de Três Marias e a variável indicada 42
Tabela 09 – Comparação dos resultados obtidos da previsão semanal 53
Tabela 10 – Comparação dos resultados da previsão semanal – período úmido e período seco 55
Tabela 11 – Comparação dos resultados da previsão semanal – frequencia acumulada de acertos – MAD 57
Tabela 12 – Comparação dos resultados da previsão semanal – frequencia acumulada de acertos – MAPE 59
Tabela 13 – Comparação dos resultados da previsão diária 64
ONS P:\_DPP\HIDROLOGIA\GPD3\PROJETO UTM\Relatório\NT_051-09_Neuro3M - revisão 1.doc
7 / 89
1. Introdução
As previsões de vazões subsidiam a tomada de decisão do âmbito do Setor
Elétrico porque permitem a avaliação das condições operacionais das usinas hidrelétricas
e termelétricas, através da utilização dos diferentes modelos de otimização e simulação
energética, proporcionando ganhos sinérgicos na operação do Sistema Interligado
Nacional – SIN. Estas previsões, quando realizadas com relativa precisão e
antecedência, podem permitir uma tomada de decisão no sentido de minimizar os efeitos
de uma cheia excepcional ou de uma situação de escassez de recursos hídricos.
As previsões de vazões podem interferir nas atividades de outros usuários
da água, tais como: irrigação, pesca, turismo, lazer e navegação, uma vez que as
defluências dos principais reservatórios são definidas com base nestas previsões.
Conforme o uso que se faça das previsões de vazões, trabalha-se com
diferentes horizontes e intervalos de discretização. No setor elétrico, trabalha-se com
três horizontes de previsões de vazões, a saber: previsões de médio, curto e
curtíssimo prazo.
A geração de cenários para o planejamento de médio prazo abrange um
horizonte de até cinco anos à frente, e é feita a partir do histórico de Energias
Naturais Afluentes - ENAS dos subsistemas, utilizando o GEVAZP (CEPEL, 2001),
que é um modelo estocástico multivariado de geração de séries sintéticas de ENAs,
que se baseia em modelos estocásticos periódicos auto-regressivos e utiliza
informações de até 6 (seis) meses anteriores. Esse modelo gera cenários em paralelo
com a mesma probabilidade de ocorrência, incluindo, dessa forma, a incerteza dessas
energias.
Para algumas avaliações de médio prazo utiliza-se também o sistema
PREVIVAZM (MACEIRA et al, 2003), desenvolvido pelo Centro de Pesquisas de
Energia Elétrica – CEPEL. O PREVIVAZM é um sistema para previsão de vazões em
base mensal, para um horizonte de até 12 (doze) meses à frente, formado pela
combinação de uma gama extensa de modelagens estocásticas, métodos de
estimação de parâmetros e tipos de transformação.
A previsão de vazões de curto prazo abrange um horizonte de dois meses à
frente, sendo o primeiro mês determinístico e o segundo estocástico. Sendo assim, a
previsão para o segundo mês é feita a partir de um histórico de vazões naturais
médias mensais, utilizando o modelo GEVAZP (CEPEL, 2001), que é um modelo
estocástico multivariado de geração de séries sintéticas de vazões incrementais
naturais afluentes aos aproveitamentos hidroelétricos. Esse modelo se baseia em
modelos estocásticos periódicos auto-regressivos e utiliza informações de até 11
ONS P:\_DPP\HIDROLOGIA\GPD3\PROJETO UTM\Relatório\NT_051-09_Neuro3M - revisão 1.doc
8 / 89
(onze) meses anteriores e gera cenários com a mesma probabilidade de ocorrência.
Os cenários são agregados, através de um processo de clusterização, incluindo,
dessa forma, a incerteza dessas vazões e tendo, como probabilidade de ocorrência, a
somatória das probabilidades dos cenários agregados. Esses resultados são
utilizados, por exemplo, para subsidiar as tomadas de decisão relativas ao
planejamento da operação para o horizonte anual, sinalizando o estado do
armazenamento dos reservatórios do SIN e o risco de déficit de energia para cada
subsistema.
Ainda no curto prazo, a previsão para o primeiro mês é discretizada
semanalmente, sendo obtida, em grande parte, pelo sistema estocástico univariado
PREVIVAZ (CEPEL 2004), a partir de um histórico de vazões naturais médias
semanais. Estas previsões têm por objetivo subsidiar o Programa Mensal de
Operação - PMO, realizado pelo Operador Nacional do Sistema Elétrico - ONS e suas
revisões semanais. O PREVIVAZ constitui-se num sistema de previsão de vazões em
base semanal, para um horizonte de até 6 (seis) semanas à frente, formado por 94
(noventa e quatro) modelos que combinam a estrutura de correlação, os tipos de
transformação e os métodos de estimação de parâmetros, utilizando informações de
até 4 (quatro) semanas anteriores.
Por último, quanto aos modelos de previsão de vazões para o curtíssimo
prazo, isto é, para até duas semanas à frente, em base diária, há no Brasil inúmeras
metodologias em uso. Algumas dessas metodologias já vêm sendo aplicadas pelas
empresas do setor elétrico e outras estão ainda em fase de teste para algumas bacias
hidrográficas.
Dentre as metodologias utilizadas atualmente no ONS, além das modelagens
estocásticas univariadas e multivariadas, pode-se citar alguns modelos de previsão de
vazões para a primeira semana operativa, a saber:
§ Modelo de previsão baseado na técnica de Data-Mining para a bacia do
rio Uruguai - MPCV;
§ Modelo baseado na inteligência artificial para a bacia do rio Iguaçu -
FUZZY Recorrente;
§ Combinação linear de modelagem física concentrada (SMAP) e de
modelagem estocástica linear (MEL) para o trecho da bacia do rio Paraná
entre as UHEs Rosana, Porto Primavera e Itaipu (SMAP-MEL); e
§ Modelo conceitual distribuído para a bacia do rio Paranaíba (MGB-IPH).
ONS P:\_DPP\HIDROLOGIA\GPD3\PROJETO UTM\Relatório\NT_051-09_Neuro3M - revisão 1.doc
9 / 89
Esses modelos utilizam além do histórico de vazões passadas, informações de
postos fluviométricos e precipitação observada e prevista em suas modelagens.
No contexto da modelagem estocástica univariada, um dos modelos
utilizados pelo ONS é o PREVIVAZH (CARVALHO, 2001), que é um modelo de
previsão de vazões em base diária, para um horizonte de até 14 (quatorze) dias à
frente, baseado na desagregação de previsão semanal, a partir da tendência inferida
das últimas vazões passadas e de séries sintéticas diárias de vazões naturais de
forma ponderada. Este modelo não utiliza em sua formulação nenhuma informação de
precipitação observada nem prevista.
No setor elétrico são utilizadas as vazões naturais afluentes aos
reservatórios, que correspondem àquelas que ocorreriam em uma seção do rio, caso
não houvesse a operação de reservatórios a montante, nem a vazão evaporada pelos
lagos artificiais, nem mesmo retiradas de água consumidas com abastecimento e
irrigação a montante. Em síntese, a vazão provida pela própria natureza.
Em novembro de 2003, foi estabelecida a formação de um Grupo de
Trabalho, específico no âmbito do ONS, com o objetivo de analisar e propor
aperfeiçoamentos dos modelos computacionais implantados no planejamento e
programação da operação, bem como estabelecer metodologias complementares
para apoio à decisão operativa. Esse grupo de trabalho, denominado de GT2 “Grupo
de Trabalho para o Aperfeiçoamento dos Modelos de Planejamento da Operação”,
propiciou a criação de Forças de Trabalho para tratar de temas específicos
associados ao planejamento e programação da operação. Dentre estas, foi criada a
Força Tarefa de Hidrologia (FT-Hidrologia), hoje transformada no Subgrupo Hidrologia
SG-HID, que dentre os seus objetos de estudo, vem analisando metodologias para
melhorar a previsão de vazões para os aproveitamentos do SIN, com a incorporação
da precipitação observada e prevista. Os estudos e resultados obtidos para a análise
de um modelo que tem como base a técnica de redes neurais para o aproveitamento
de Três Marias, localizado no rio São Francisco, formam o escopo desta nota técnica.
A previsão de vazões afluentes e a operação do aproveitamento de Três
Marias são relevantes no processo de operação dos demais reservatórios da bacia do
rio São Francisco, localizados a jusante deste reservatório, uma vez que as afluências
naturais a este aproveitamento representam cerca de 26% das afluências desse
mesmo rio São Francisco e que, tais processos, interferem nas definições de
estratégias energéticas para o Subsistema Nordeste.
ONS P:\_DPP\HIDROLOGIA\GPD3\PROJETO UTM\Relatório\NT_051-09_Neuro3M - revisão 1.doc
10 / 89
No capítulo 2 é apresentada a proposta e o objetivo deste trabalho. No capítulo
3 apresenta-se a descrição da área em estudo. No capítulo 4 apresenta-se o processo de
previsão de vazões no ONS e no capítulo 5 apresenta-se um resumo da técnica de redes
neurais utilizada no modelo Neuro3M.
No capítulo 6 apresenta-se uma descrição dos dados, das variáveis de entrada
e saída dos modelos utilizados. Os resultados obtidos em testes realizados são
apresentados no capítulo 7, seguidos das conclusões e recomendações e das
referências bibliográficas, apresentadas nos capítulos 8 e 9, respectivamente. Nos
anexos I e II são apresentados os resultados da comparação dos modelos de previsão e
a chuva média da bacia para todos os meses do ano.
2. Proposta e Objetivo
Esta nota técnica apresenta uma proposta metodológica, baseada na técnica
de redes neurais, para a previsão da vazão semanal, um passo à frente, ao
aproveitamento hidrelétrico de Três Marias, em substituição ao processo adotado
atualmente, bem como os resultados obtidos com esta utilização, e comparados com
aqueles obtidos com a metodologia atualmente utilizada pelo ONS.
O objetivo final deste trabalho é a implantação do modelo Neuro3M nos
processos de Programação Mensal da Operação - PMO e suas revisões, dando
sequência ao aperfeiçoamento no processo de previsão de vazões, a fim de proporcionar
melhores insumos para o PMO, e, consequentemente, para o despacho e operação das
usinas hidrelétricas e termelétricas do SIN, com reflexos na otimização e na segurança
do suprimento de energia elétrica.
Podem-se destacar os seguintes objetivos específicos:
§ Selecionar e analisar as informações dos postos hidrométricos
(fluviométricos e pluviométricos) da área a montante do reservatório de Três Marias;
§ Definir qual a melhor topologia de rede neural para a previsão de vazões
naturais afluentes ao reservatório de Três Marias.
§ Apresentar resultados da construção da rede neural e testes para
diferentes períodos do ano do reservatório de Três Marias;
§ Apresentá-la ao Subgrupo Hidrologia e, posteriormente, encaminhá-la à
ANEEL para solicitar autorização para uso no Programa Mensal da Operação e suas
revisões.
§
ONS P:\_DPP\HIDROLOGIA\GPD3\PROJETO UTM\Relatório\NT_051-09_Neuro3M - revisão 1.doc
11 / 89
3. Descrição da Área em Estudo
O reservatório de Três Marias localiza-se na região do Alto São Francisco,
entre os paralelos 18º e 21º de latitude sul e os meridianos 43º30’ e 46º40’ oeste de
longitude no estado de Minas Gerais (Figura 01), em uma zona climática tropical. A área
estende-se desde as cabeceiras, na Serra da Canastra, município de São Roque de
Minas, até a cidade de Pirapora (MG), abrangendo as sub-bacias dos rios das Velhas,
Pará e Indaiá, além das sub-bacias dos rios Abaeté e Jequitaí.
A Agência Nacional de Energia Elétrica - ANEEL divide a bacia do rio São
Francisco em nove sub-bacias. A região estudada corresponde à sub-bacia 40. Esta
sub-bacia representa a área de drenagem do reservatório de Três Marias e parte da
área de drenagem do Alto São Francisco (sub-bacias 40 e 41). Segundo a ANA/SPR
, o Alto São Francisco possui 167 municípios, sendo 93% da área urbanizada, com
uma densidade demográfica de 62,9 hab/km2 e uma disponibilidade hídrica de 6.003
m3/hab/ano.
Figura 01 – Localização da sub-bacia 40 no estado de Minas Gerias (CPRM,1996)
51º
16º
23º
40º
Belo Horizonte
Três Marias
A usina hidrelétrica de Três Marias, de propriedade da Companhia Energética
de Minas Gerais - CEMIG, tem uma potência instalada de 396 MW, está localizada em -
180 12’ 50” e -450 15’ 30” e teve o início de suas obras em maio de 1957, sendo concluída
em janeiro de 1961. Sua construção teve como principais objetivos: regularização do
curso das águas do rio São Francisco nas cheias periódicas, melhoria da navegabilidade,
ONS P:\_DPP\HIDROLOGIA\GPD3\PROJETO UTM\Relatório\NT_051-09_Neuro3M - revisão 1.doc
12 / 89
utilização do potencial hidrelétrico, e fomento da indústria e irrigação. O reservatório tem
uma área máxima de 1010 km2 e mínima de 316 km2, correspondendo a volumes de
19.528 e 4.250 hm3, respectivamente. O nível máximo operativo é 572,50 m, e o nível
mínimo operativo é 549,20 m. A área de drenagem é de 50.732 km2 e a vazão média de
longo termo (MLT) de 689 m3/s.
As unidades geomorfológicas existentes na bacia do Alto São Francisco são o
Planalto Dissecado do Centro-Sul e Leste de Minas, a Depressão São Franciscana, o
Planalto do São Francisco, o Quadrilátero Ferrífero e a Serra do Espinhaço.
O Alto São Francisco apresenta topografia ligeiramente acidentada, com serras
e terrenos ondulados e altitudes que variam de 1.600 a 600 m. O divisor leste é formado
pelas montanhas da Serra do Espinhaço, estreitas e alongadas na direção N-S, e com
altitudes de 1.300 a 1.000 m. Do lado oeste, destacam-se as Serras Gerais de Goiás,
cujas cotas oscilam entre 1.200 e 800 m.
O clima predominante na região é o Tropical Úmido e temperado de altitude
com insolação média anual de 2400 h e evaporação média anual de 1000 mm (ANA,
2004).
A característica climática mais importante na região em estudo é a existência
de duas estações bem marcadas: uma estação chuvosa, no verão, e outra seca, no
inverno.
Com relação à precipitação, os totais pluviométricos anuais variam, de forma
geral, entre 1700 mm nas cabeceiras da bacia a 1000 mm na confluência do rio São
Francisco com rio das Velhas (ANA, 2004). O trimestre mais chuvoso contribui com cerca
de 55 a 60% do total anual precipitado, correspondendo, para a quase totalidade da
bacia, aos meses de novembro, dezembro e janeiro. A exceção ocorre na extremidade
ocidental da bacia, onde os meses mais chuvosos são dezembro, janeiro e fevereiro. Já o
trimestre mais seco, correspondente aos meses de junho, julho e agosto, que contribui
com menos de 5% da precipitação anual.
Por se situar na região Sudeste, o Alto São Francisco é afetado pela
passagem de sistemas frontais, e a interação desses com a convecção tropical,
denominada de Zona de Convergência do Atlântico Sul - ZCAS. Um percentual
significativo da precipitação nesse trecho da bacia deve-se à atuação desses sistemas
(CLIMANÁLISE, 1986). Sistemas de escala subsinótica, tais como linhas de instabilidade,
também ocasionam precipitação. Estas são de curta duração, em oposição às
associadas às frentes e ZCAS, que duram alguns dias e abrangem áreas maiores.
ONS P:\_DPP\HIDROLOGIA\GPD3\PROJETO UTM\Relatório\NT_051-09_Neuro3M - revisão 1.doc
13 / 89
4. Processo de Previsão de Vazões
As previsões de vazões naturais no ONS são elaboradas de forma direta para
os locais denominados como postos base, ou, de forma indireta, a partir de
regressões lineares obtidas a partir das previsões realizadas para um posto base
próximo. Os aproveitamentos que têm suas vazões previstas a partir de um modelo
são denominados postos base e aqueles cujas previsões são obtidas a partir de
equações de regressão linear são denominados postos não base.
Os postos base e as equações de regressão para o cálculo da vazão prevista
dos postos não base são definidos a partir do estudo da série histórica de vazões de
cada aproveitamento e das relações estatísticas entre postos de uma determinada bacia.
O processo de previsão de vazões naturais semanais no ONS para o
Programa Mensal da Operação – PMO é realizado em geral às terças-feiras, como
definido nos procedimentos de rede deste Operador (no caso das revisões semanais
este processo é, de modo geral, realizado nas quartas-feiras, e, em casos específicos
este processo pode ser realizado em outro dia da semana). Neste dia os agentes de
geração de aproveitamentos definidos como base enviam previsões de vazões
naturais diárias para terça-feira, quarta-feira, quinta-feira e sexta-feira da semana em
curso, possibilitando ao ONS obter, a partir destas vazões diárias previstas e das
vazões naturais verificadas de sábado, domingo e segunda-feira, a vazão semanal
estimada da semana em curso (Q). Em paralelo, o ONS executa o modelo PrevivazH,
cujas previsões poderão substituir as previsões dos Agentes de Geração em caso de
falta ou inconsistência das mesmas. Na Figura 02 é possível observar um esquema
com o processo de previsões de vazões efetuado pelo ONS nas revisões do PMO.
Figura 02 – Esquema representativo da composição da semana operativa nas revisões semanais
Para a UHE Três Marias, atualmente o ONS utiliza o sistema PREVIVAZ
desenvolvido pelo CEPEL, para obter previsões de vazões semanais para um horizonte
de até seis semanas à frente.
ONS P:\_DPP\HIDROLOGIA\GPD3\PROJETO UTM\Relatório\NT_051-09_Neuro3M - revisão 1.doc
14 / 89
As metodologias estocásticas contidas neste sistema contemplam os modelos
autoregressivos e de médias móveis, com estrutura estacionária ou periódica, ou seja, os
modelos AR(p) e PAR(p), com “p” de até ordem 4, PARMA(p,1) e ARMA (p,1), com “p” de
até ordem 3. As transformações podem ser logarítmica, Box & Cox ou sem transformação
(GUILHON, 2003). Os métodos de estimação de parâmetros se baseiam no método da
máxima verossimilhança, quais sejam: método dos momentos, de regressão simples e de
regressão em relação à origem das previsões.
O PREVIVAZ divide o histórico em duas metades, estimando, para cada
semana, os parâmetros de todos os modelos para a primeira metade e verificando o erro
médio quadrático para a segunda metade, conforme a equação (1).
N
iobsX
N
i
iprevX 2)
1(å
=-
onde,
Xi prev – Vazão prevista no instante i.
Xi obs – Vazão observada no instante i.
N – número total de semanas da metade do histórico considerada.
Em seguida, o PREVIVAZ estima os parâmetros de todos os modelos para
cada semana da segunda metade de série e verifica o erro médio quadrático para a
primeira metade. Calcula-se então a média dos erros médios quadráticos das duas
metades para todos os modelos e ordena-se de modo a escolher, dentre as 94
combinações de modelagem, aquela que apresenta o menor valor médio de erro médio
quadrático.
Após a escolha do modelo, o PREVIVAZ estima novamente os parâmetros,
considerando todas as semanas do histórico completo e passa a utilizar os novos
parâmetros estimados para cada semana específica.
5. Introdução Teórica: Redes Neurais Artificiais
As redes neurais artificiais (RNAs) são uma técnica integrante dos Sistemas
Inteligentes, inspirados no comportamento humano ou da natureza. As RNAs vêm sendo
sugeridas para análise de séries temporais devido a sua capacidade de tratar com
relações de entrada-saída de dados não-lineares, destacando sua habilidade de
aprendizado e capacidade de generalização, associação e busca paralela. Estas
qualidades as tornam capazes de identificar e assimilar as características mais
(1)
ONS P:\_DPP\HIDROLOGIA\GPD3\PROJETO UTM\Relatório\NT_051-09_Neuro3M - revisão 1.doc
15 / 89
marcantes das séries, tais como sazonalidade, periodicidade, tendência, entre outras,
muitas vezes camufladas por ruídos. O uso da técnica de redes neurais tem se
intensificado cada vez mais, uma vez que, modelos baseados nessa técnica são de fácil
aplicação e têm proporcionado resultados satisfatórios.
As variantes de uma rede neural são muitas, e, combinando-as, pode-se
mudar a arquitetura conforme a necessidade da aplicação. Basicamente, os itens que
compõem uma rede neural são os seguintes:
- Conexões entre camadas;
- Número de camadas intermediárias;
-Quantidade de neurônios;
- Função de transferência; e
- Algoritmo de aprendizado/treinamento.
As camadas escondidas situam-se entre a camada de entrada e a camada de
saída da rede neural. Na metodologia clássica de aplicação da técnica de Multi-Layer
Perceptron – MLP com algoritmo backpropagation (VALENÇA, 2005b), não existe uma
regra única que defina o número de camadas escondidas nem o número de neurônios da
camada escondida. Contudo, a utilização de um grande número de camadas escondidas
não é recomendada, porque cada vez que o erro médio durante o treinamento é utilizado
na atualização dos pesos das sinapses da camada imediatamente anterior, ele se torna
menos útil ou preciso. Testes empíricos com a rede neural MLP backpropagation não
demonstraram vantagem significante no uso de duas camadas escondidas ao invés de
uma. Por isso, para a grande maioria dos problemas utiliza-se apenas uma camada
escondida. Essa parcimônia muitas vezes auxilia na implementação dos modelos de
previsão de vazões que devem representar a complexidade da natureza da forma mais
simples possível, sem detrimento da qualidade dos resultados.
Com relação ao número de neurônios nas camadas escondidas, este é
geralmente definido empiricamente, os melhores resultados são obtidos através de
um processo de tentativa e erro.
A topologia define a maneira com que os vários neurônios constituintes de uma
rede neural são interconectados.
As sinapses representam barreiras que, de um certo modo, modulam os sinais
que passam através delas. Esta modulação representa a força da sinapse. Em um
neurônio artificial, a força da sinapse é chamada de peso w. Como os neurônios
possuem um grande número de dendritos, eles podem receber sinais de vários neurônios
simultaneamente.
ONS P:\_DPP\HIDROLOGIA\GPD3\PROJETO UTM\Relatório\NT_051-09_Neuro3M - revisão 1.doc
16 / 89
A entrada líquida é dada pela equação 2.
å=
-=N
iiijj xwnet
1
f
Onde: wij é p peso;
xi é o valor da entrada;
F é o limiar.
Os neurônios de uma rede neural são geralmente dispostos em camadas
(layers), que recebem as mesmas denominações descritas para os tipos de neurônio:
§ Camada de Entrada: recebe os dados de entrada e não realiza nenhum
processamento sobre os dados, servindo apenas para distribuição dos
mesmos para os neurônios da camada subsequente;
§ Camadas Escondidas: suas entradas e saídas permanecem dentro do
sistema;
§ Camada de Saída: gera os dados de saída;
A Função de Ativação é a responsável pela não linearidade das redes neurais.
Existem diversas funções de ativação, entre elas:
Função Sigmóide (logística):
vev
-+=
1
1)(j
Função Tangente Sigmóide:
11
2)(
2-
+=
- vevj
Método da Validação Cruzada
A utilização de procedimentos de validação cruzada (VC) diminui os
problemas em relação ao super treinamento da rede, e, consequentemente,
amenizam os efeitos das redes super dimensionadas (CASTRO et al., 1999).
Para o método da validação cruzada devem-se dividir os dados em três
conjuntos:
– treinamento: usados para modificar os pesos;
– validação: usados para verificar o problema de super treinamento;
– teste: para testar o desempenho do modelo final.
(2)
ONS P:\_DPP\HIDROLOGIA\GPD3\PROJETO UTM\Relatório\NT_051-09_Neuro3M - revisão 1.doc
17 / 89
O treinamento usando validação cruzada deve ser interrompido quando o erro
com os dados de validação começar a crescer de forma consistente, conforme
apresentado na Figura 03, ou seja, os pesos são ajustados função dos dados de
treinamento, ficando os dados de validação apenas para determinação do momento
da parada do treinamento, evitando que a rede neural super ajuste os pesos e não
seja capaz de proporcionar bons resultados quando lhe forem apresentados um novo
conjunto de dados.
Figura 03 – Esquema de parada do treinamento no processo de validação cruzada
Fonte: adaptado de PUC - RIO, 2005
Além disso, para que a rede neural realize um bom aprendizado são
necessários alguns procedimentos, tais como: a normalização e a seleção ou
combinação de variáveis. Estes procedimentos conseguem diminuir o tamanho da
rede, acelerar o aprendizado e melhorar a generalização da rede neural.
A normalização pode ser feita, por exemplo, através do escalonamento linear
para o caso de dados com comportamento linear e, para o caso de dados com
comportamento não linear, pode-se usar transformação logarítmica.
validação
validação
ONS P:\_DPP\HIDROLOGIA\GPD3\PROJETO UTM\Relatório\NT_051-09_Neuro3M - revisão 1.doc
18 / 89
Redes NSRBN
A arquitetura de uma rede neural, de acordo com a possibilidade de mudanças
no seu tamanho durante o processo de treinamento, pode ser classificada em estática ou
dinâmica. Uma rede é dita de arquitetura estática quando o número de camadas e
unidades de processamento permanece constante desde a concepção da rede até a
finalização do seu treinamento. Por outro lado, uma rede de arquitetura dinâmica tem
como característica principal um processo de mudanças no tamanho durante o
treinamento. Um exemplo desse último tipo são as redes neurais compostas com blocos
de regressões sigmóides não-lineares (NSRBN – Non-linear Sigmoidal Regression
Blocks Networks), proposta por Valença (1999). Essas redes têm uma poderosa
capacidade de mapeamento no sentido de que qualquer função contínua definida em um
conjunto compacto em RN pode ser uniformemente aproximada (VALENÇA, 1999).
Dentre as características principais das Redes NSRBN, duas merecem
destaque: uma estrutura compacta, por possuir apenas uma camada escondida; e um
algoritmo construtivo, baseado em um método de aprendizado construtivo que é
responsável pela definição de sua complexidade ótima (VALENÇA, 2005b).
As redes NSRBN são redes com blocos de polinômios homogêneos, com
uma função de ativação na camada intermediária (por exemplo: tangente hiperbólica)
e, na camada de saída, uma ativação mais complexa, uma vez que realizam uma
regressão logística não linear. A Figura 04 mostra a arquitetura de uma rede NSRBN,
onde x1 a xN representam as variáveis de entrada da rede neural, f1(x) a fd(x)
representa a função de transferência das informações e f(x), a saída desejada.
Figura 04 – Arquitetura combinatorial
Polinômiode grau 1x1
x2
x3
xN
Polinômiode grau 2
Polinômiode grau p
Polinômiode grau d
.
.
.
.
..
f(x)
f1(x)
f2(x)
fp(x)
fd(x)
ONS P:\_DPP\HIDROLOGIA\GPD3\PROJETO UTM\Relatório\NT_051-09_Neuro3M - revisão 1.doc
19 / 89
Nessa classe de redes, um algoritmo construtivo é utilizado para incrementar a
estrutura da rede, partindo-se de uma pequena estrutura, até que se atinja uma estrutura
de tamanho ótimo, segundo critérios estatísticos de seleção adequados.
Uma rede NSRBN é uma rede combinatorial composta pela soma de p blocos
(p=1,...,d) com estrutura similar a uma MLP (Multi Layer Perceptron), na qual as unidades
escondidas desses blocos realizam uma regressão sigmóide linear das entradas (tal qual
uma MLP), e as unidades de saída realizam uma regressão do tipo sigmóide não-linear
das unidades escondidas (tal qual uma regressão logística não-linear). Essa nova
estrutura formada é um aproximador universal com forte capacidade de mapeamento
não-linear.
Esse bloco é uma rede feedforward, ou seja, ela está completamente
conectada com uma única camada escondida.
6. Descrição e Tratamento dos Dados
Em todos os processos de modelagem, a familiaridade com os dados
disponíveis é de máxima importância. Os modelos de redes neurais não são exceção, e o
pré-processamento das informações pode ter um efeito significativo no desempenho do
mesmo. Assim, a seguir são mostrados os resultados do tratamento e análises dos
dados, que servirão de entrada para a rede neural.
Neste trabalho foram usadas informações de estações pluviométricas,
fluviométricas e de vazão natural do reservatório de Três Marias. Todos os dados
pluviométricos e fluviométricos utilizados foram obtidos junto à CEMIG e à ANA.
6.1 Informações pluviométricas
A seguir são mostrados os postos pluviométricos utilizados, histórico de dados
disponíveis e processos utilizados no preenchimento de falhas e na análise geoestatística
efetuada.
a) Rede de postos pluviométricos pesquisada
Realizou-se uma análise das informações pluviométricas, objetivando proceder a
seleção de postos confiáveis de modo que fosse possível a execução de estudos e a
operacionalização do modelo. Nessa análise, selecionaram-se os postos pluviométricos
da CEMIG que atualmente estão em operação. Após a seleção desses postos, analisou-
se o histórico disponível, muitas vezes usando as informações da ANA para
ONS P:\_DPP\HIDROLOGIA\GPD3\PROJETO UTM\Relatório\NT_051-09_Neuro3M - revisão 1.doc
20 / 89
complementar as informações disponíveis na CEMIG. A Tabela 01 mostra a relação dos
postos selecionados, juntamente com o período do histórico disponível.
A Tabela 02 apresenta o coeficiente de correlação da precipitação diária dos
postos pluviométricos selecionados, destacando (em verde) os três postos mais bem
correlacionados com o posto em análise. Observa-se que todos os postos têm correlação
com os três postos mais bem correlacionados acima de 0,4, o que foi considerado
suficiente neste estudo.
ONS P:\_DPP\HIDROLOGIA\GPD3\PROJETO UTM\Relatório\NT_051-09_Neuro3M - revisão 1.doc
21 / 89
Tabela 01 – Postos pluviométricos selecionados
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 72045034 20°10' 45°43' Iguatama1945045 19°16' 45°18' Porto das Andorinhas1944078 19°57' 44°18' Ponte Nova do Paraopeba1944060 19°10' 44°41' Porto Mesquita2044056 20°24' 44°37' Ponte dos Vilelas1945017 19°17' 45°06' Porto Pará1845022 18°41' 45°35' Porto Indaiá2044063 20°38' 44°26' Fazenda Campo Grande2046015 20°20' 46°22' Vargem Bonita1945019 19°29' 45°36' Dores do Indaiá1944032 19°41' 44°53' SE Pitangui1845019 18°10' 45°18' UHE Três Marias2044059 20°14' 44°45' UHE Cajuru
Período de dados sem falha (dados da Cemig)Período de dados com falha (2 meses ou mais)Período de dados sem falha (dados da ANA)
Código PostoLatitude Longitude1970 1980 1990 2000
ONS P:\_DPP\HIDROLOGIA\GPD3\PROJETO UTM\Relatório\NT_051-09_Neuro3M - revisão 1.doc
22 / 89
Tabela 02 – Coeficiente de correlação entre os postos pluviométricos selecionados na área a montante de Três Marias
40865001 19°10' 44°41' Porto Mesquita 40130002 20°24' 44°37' Ponte dos Vilelas 40450001 19°17' 45°06' Porto Pará 40963000 18°41' 45°35' Porto Indaiá Período de dados sem falha (dados da Cemig) Período de dados com falha (2 meses ou mais) Período de dados sem falha (dados da ANA)
Tabela 05 – Coeficiente de correlação entre os postos fluviométricos