예측방법 ARMA 개요 •George Box, Gwilym Jenkins 제안한 시계열 모형 •시계열 데이터는 (Trend + Cycle + Seasonality + Irregular) 성분이 있에 (1)설명변수 설정이 용이하지 못하거나 (2) 에 대한 예측을 위하여(시계열 데이터 분석의 주요 목적) 설명변수에 대한 예측치( )가 있어야 하는 문 제가 있고 (3)독립성 가정을 만족하지 못해 이 문제를 해결하는 어려움이 있어 회귀모형에 의한 분석보다는 관측 치의 이전 관측치를 활용하는 방법이 제안 • ARIMA(Auto-Regressive Integrated Moving-Average) 모형은 시계열 데이터 의 과거치(previous observation) 가 설명변수인 AR과 과거 관측치가 설명하지 못하는 부분에 해당되는 오차항 ( )들이 설명변수인 MA, 차분을 나타내는 integrate의 합성어이다. AR 모형은 아래 가설에 의해 제안되었다. • 과거의 패턴이 지속된다면 시계열 데이터 관측치 는 과거 관측치 에 의해 예측할 수 있을 것이다. •어느 정도의 멀리 있는 과거 관측치까지 이용할 것인가? 그리고 멀어질수록 영향력을 줄어들 것이다. 이런 상 황을 고려할 수 있는 가중치를 사용해야 하지 않을까? Backshift Notation , , …, 상관함수 Correlation Function 자기상관함수 Auto Correlation Function (ACF) • , 는 주기 j의 자기 공분산 (auto-covariance with lag j) •현재 관측값과 j기 이전 관측값들의 상관계수이다. • 주기 0인 상관계수는 현재 관측치 간 상관계수이므로 1이다. 부분자기상관함수 Partial Auto Correlation Function (PACF) • 두 변수 (X, Y)의 상관관계를 시간의 효과를 제거한 후 구한 순수 상관관계 • ⬄ Z->X 회귀분석 잔차와 Z->Y 잔차의 상관계수 } { t Y t X } { t Y ,...} , { 2 1 − − t t Y Y ,... , 2 1 − − t t e e t Y ,... , , 2 1 p t t t Y Y Y − − − 1 ) ( − = t t Y Y B 2 2 ) ( − = t t Y Y B p t t p Y Y B − = ) ( ) ( ) , ( ) 0 ( ) ( ) ( t j t t Y VAR Y Y Cov j j − = = γ γ ρ γ ( j ) ρ (0) = 1 2 2 . )) | ( ( )) | ( ( )) | ( ( )) | ( ( Z Y E Y E Z X E X E Z Y E Y E Z X E X E Z XY − − − − = ρ 한남대학교 권세혁교수 http://wolfpack.hnu.ac.kr / Page 1 11
11
Embed
FS arma 15Sep - Hannam Universitywolfpack.hannam.ac.kr/Stat_Notes/adv_stat/ETS/arma_R.pdf예측방법 ARMA 부분자기상관함수 •MA(1)가 invertibility 하면, MA(q) 모형:
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
예측방법 ARMA
개요
•George Box, Gwilym Jenkins 제안한 시계열 모형
•시계열 데이터는 (Trend + Cycle + Seasonality + Irregular) 성분이 있에 (1)설명변수 설정이 용이하지 못하거나
(2) 에 대한 예측을 위하여(시계열 데이터 분석의 주요 목적) 설명변수에 대한 예측치( )가 있어야 하는 문제가 있고 (3)독립성 가정을 만족하지 못해 이 문제를 해결하는 어려움이 있어 회귀모형에 의한 분석보다는 관측치의 이전 관측치를 활용하는 방법이 제안
•ARIMA(Auto-Regressive Integrated Moving-Average) 모형은 시계열 데이터 의 과거치(previous
observation) 가 설명변수인 AR과 과거 관측치가 설명하지 못하는 부분에 해당되는 오차항
( )들이 설명변수인 MA, 차분을 나타내는 integrate의 합성어이다.
AR 모형은 아래 가설에 의해 제안되었다.
•과거의 패턴이 지속된다면 시계열 데이터 관측치 는 과거 관측치 에 의해 예측할 수 있을 것이다.
•어느 정도의 멀리 있는 과거 관측치까지 이용할 것인가? 그리고 멀어질수록 영향력을 줄어들 것이다. 이런 상황을 고려할 수 있는 가중치를 사용해야 하지 않을까?
y1=c(10);y2=c(10);y3=c(10);y4=c(10) for (i in 2:100){ y1[i]=0.7*y1[i-1]+rnorm(1) #AR(1) y2[i]=y2[i-1]+rnorm(1) #Random Walk y3[i]=0.3*y3[i-1]+0.4*y4[i-1]+rnorm(1) #AR(2) y4[i]=y3[i-1] }
#(1) time plot plot(y1,type="l",ylim=c(-4,20)) lines(y2,col=“red”); lines(y3,col="blue")
#자기상관계수 출력 acf(y1,plot=F,type=c(“correlation”)); acf(y2,plot=F,type=c("correlation")) acf(y3,plot=F,type=c("correlation"))