[email protected][email protected]1 M M ó ó dulo de Regressão e S dulo de Regressão e S é é ries ries Temporais Temporais Parte Parte 3 3 Mônica Barros, Mônica Barros, D.Sc. D.Sc. Julho de 2007 Julho de 2007 [email protected][email protected]2 Quem sou eu? Quem sou eu? Mônica Barros Doutora em Séries Temporais – PUC-Rio Mestre em Estatística – University of Texas at Austin, EUA Bacharel em Matemática – University of Washington, Seattle, EUA Professora da PUC-Rio (Depto. De Eng. Elétrica) E-mails: [email protected], [email protected]Home page: http://www.mbarros.com [email protected][email protected]3 Programa do Curso Programa do Curso Modelagem ARIMA de Box & Jenkins sazonal e não sazonal Função de autocorrelação e autocorrelação parcial Modelo Identificação de (p, q, d, P, Q, D) Estimação Estatísticas de ajuste e análise dos resíduos Exercícios [email protected][email protected]4 MODELO BOX & JENKINS UNIVARIADO (Não Sazonal e Sazonal)
18
Embed
Módulo de Regressão e Séries Temporais - mbarros.com · Estacionário Não Estacionário na Média Não Estacionário na Média E na Variância [email protected]@mbarros.com
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Mônica BarrosDoutora em Séries Temporais – PUC-RioMestre em Estatística – University of Texas at Austin, EUABacharel em Matemática – University ofWashington, Seattle, EUAProfessora da PUC-Rio (Depto. De Eng. Elétrica)E-mails: [email protected], [email protected] page: http://www.mbarros.com
Modelagem ARIMA de Box & Jenkinssazonal e não sazonal
Função de autocorrelação e autocorrelaçãoparcial Modelo Identificação de (p, q, d, P, Q, D) Estimação Estatísticas de ajuste e análise dos resíduos Exercícios
Um processo estocástico é chamado de ruruíído brancodo brancoe denotado por at se, além de estacionário de 2ªordem, ele não apresenta qualquer dependênciaserial, ou seja,
Ou seja, um ruído branco é uma seqüência de observações com média e variância constantes e autocorrelações nulas em todos os lags.
BOX & JENKINSBOX & JENKINSObjetivo de AnObjetivo de Anáálise de Slise de Séérie Temporalrie Temporal
Dada uma série temporal Zt que não é “branca”, isto é, que exibe uma estrutura de dependência serial, achar o melhor modelo matemático que descreva esta dependência serial e a transforme num ruído branco.
Se uma série já é ruído branco, então não existe modelo univariado para ela!
O operador B, conhecido como Operador de Atraso ou “Backward Shift Operator“ é bastante usado por na descrição dos modelos e é definido como:
FunFunçção de autocorrelaão de autocorrelaçção parcial de lag ão parcial de lag kk
É uma medida de dependência linear ou correlação linear entre Zt e Zt+keliminando a dependência dos termos intermediários Zt+1 , Zt+2 . . . Zt+k-1 i.e.:
ProblemaSe a ordem “p” do modelo cresce, teremos muitos parâmetros φi ; i = 1, . . . , p para estimar, o que requer séries de tamanhos elevados, nem sempre disponíveis .
Solução encontrada Reduzir a ordem “p” da parte AR através da inclusão no modelo de defasagens no ruído branco (além das defasagens da própria série temporal). Isso eqüivale a adicionar uma estrutura MA ao modelo (média móvel = “MovingAverage”)
Fundamento teórico dos modelos BJPassagem de um ruído branco por um filtro linear de memória infinita gera um processo estacionário de 2a ordem. (Teoria geral de sistemas lineares)
ψ( )B Z =t 1 2 3a a a at t t t− − − −− − −ψ ψ ψ1 2 3 K
APLICAÇÃO DO MÉTODONo gráfico a seguir está uma série não estacionária, para a qual são necessárias duas diferenças atéencontrar uma série estacionária.
APLICAÇÃO DO MÉTODOTestes de Testes de sobrefixasobrefixaççãoão – ajuste modelos “maiores” (mais elaborados) – substitua p por p + 1 e q por q + 1 e verifique se os parâmetros são significantes
Testes nos ResTestes nos ResííduosduosDevem ser ruído branco, com média nula e variância pequenaNÃO DEVE EXISTIR AUTOCORRELAÇÃO NOS RESÍDUOS!!!!
APLICAÇÃO DO MÉTODOTeste de Ljung e Box (ou Portmanteau)Estatística de teste é calculada a partir das ACFs estimadasdos resíduos. A estatística de Ljung e Box mede a magnitude da ACF dos resíduos para diversos lags, ou seja, estende a estatística de Durbin-Watson (só lag 1).
Q n n r in ka
i
k= +
-=Σ( ) ( )
( )2
2
1
Sob a hipótese de um ruído branco, Q é uma variável com densidade Qui-quadrado com M graus de liberdade.
BJ propõem uma estrutura similar ao modelo ARIMA(p,d,q) para as séries sazonais, considerando o intervalo de "S" (S; período sazonal, e.g. S = 12, S = 4, etc.) ao invés do intervalo unitário dos modelos simples.
Modelo MA(Q) Puramente SazonalMA(Q)sazonal ≡ MA(QS) simples com parâmetros não-nulos somente nos lags S, 2S,...,QS.
Exemplo: S = 12; MA(2) SazonalExemplo: S = 12; MA(2) Sazonal
Pelo visto anteriormente para o modelo simples, a PACF do Pelo visto anteriormente para o modelo simples, a PACF do MA(Q) sazonal MA(Q) sazonal éé composta de exponenciais e/ou sencomposta de exponenciais e/ou senóóides ides amortecidas nos lags S, 2S, 3S, amortecidas nos lags S, 2S, 3S, ........
DaDaíí:: AR(P)AR(P) Sazonal = AR(PS)Sazonal = AR(PS) Simples com parâmetroSimples com parâmetronãonão--nulos somente nos lag's S, 2S, ..., PSnulos somente nos lag's S, 2S, ..., PS
Por analogia (e dualidade) as funPor analogia (e dualidade) as funçções ACF e PACF do AR(P) Sazonalões ACF e PACF do AR(P) Sazonal são:são:
Exemplo: Modelo AirlineExemplo: Modelo AirlineÉÉ o modelo sazonal multiplicativo que representa so modelo sazonal multiplicativo que representa sééries sazonais que ries sazonais que exibem uma tendência e sobreposta a esta, uma componente sazonalexibem uma tendência e sobreposta a esta, uma componente sazonalmultiplicativa, tmultiplicativa, tíípica de dados de negpica de dados de negóócios e, particular, de vendas de cios e, particular, de vendas de passagens apassagens aééreas. O modelo reas. O modelo éé::
SARIMA (0, 1, 1) x (0, 1, 1)SARIMA (0, 1, 1) x (0, 1, 1)1212ÉÉ facil mostrar que o correlograma do modelo airline apresenta vafacil mostrar que o correlograma do modelo airline apresenta valores lores não nulos nos lag's 1, 11, 12 e 13, como abaixo:não nulos nos lag's 1, 11, 12 e 13, como abaixo:
Define-se variável de intervenção, como a série temporal, denotada por Xit , composta de valores "0“ e "1", onde "0" representa a ausência de um fenômeno. O modelo BJ com intervenção é dado por:
onde wi é o "efeito" da variável de intervenção Xit em Zt .
bi é o lag de defasamento do efeito da variável Xit em Zt .
Pelos gráficos anteriores...O problema é BEM MAIS complicado que no caso não sazonal....
ACF da série diferenciada – olhe o lags 1 e também lags múltiplos de 12, sugerindo MA(1) não sazonal e MA(1) sazonal.PACF da série diferenciada sugere AR(1) e AR(1) sazonal.Modelo tentativo: SARIMA(1,1,1)(1,0,1)
Estatísticas de erros dentro da amostraBICHoldout – separar alguns meses como se não pertencessem à série e verificar capacidade de previsãoACF dos resíduos – é importante que os resíduos de um modelo B/J não tenham estrutura.