Top Banner
Lê Tn Lut Các mô hình dbáo đơn gin 1 CHƯƠNG 13 DBÁO VI MÔ HÌNH ARIMA “Dbáo tài chính dường như là mt khoa hc góp phn làm cho chiêm tinh hc trnên đáng tin cy hơn.” Burton Malkiel, A Random Walk Down Wall Street (1985) 1 MC TIÊU Tìm hiu mt squá trình ngu nhiên đặc bit như nhiu trng, bước ngu nhiên Hiu khái nim tính dng ca quá trình ngu nhiên. Tđó có khnăng kim định được tính dng ca biến chui thi gian và biến đổi sliu để nó có tính dng Có khnăng nhn dng và xây dng mô hình dbáo trên sliu chui thi gian dng Nm phương pháp lun Box-Jenkins trong vic xây dng mô hình ARIMA cho sliu chui thi gian không dng Xây dng ARIMA vi Eviews BCC Quá trình ngu nhiên Mt squá trình ngu nhiên đặc bit Tính dng Mô hình dbáo trên biến chui thi gian dng không có tính mùa Mô hình dbáo trên biến chui thi gian có tính mùa Mô hình ARIMA Phương pháp lun Box-Jenkins Mô hình ARIMA cho biến chui thi gian có tính mùa (SARIMA) Tóm tt nhn dng mt smô hình ARIMA Xây dng mô hình ARIMA tđộng vi phn mm Autobox Hn chế ca các mô hình ARIMA 1 Theo Ernst R.Berndt (1991). The Practice of Econometrics: Clasical and Contemporay. Addison-Wesley Publishing Company
28

Chuong13 Mo Hnh ARIMA

Dec 05, 2014

Download

Documents

tranhungdao12a3

mo hinh arima
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Chuong13 Mo Hnh ARIMA

Lê Tấn Luật Các mô hình dự báo đơn giản

1

CHƯƠNG 13 DỰ BÁO VỚI MÔ HÌNH ARIMA

“Dự báo tài chính dường như là một khoa học góp phần làm cho chiêm tinh học trở nên đáng tin cậy hơn.”

Burton Malkiel, A Random Walk Down Wall Street (1985)1

MỤC TIÊU

� Tìm hiểu một số quá trình ngẫu nhiên đặc biệt như nhiễu trắng, bước ngẫu nhiên

� Hiểu khái niệm tính dừng của quá trình ngẫu nhiên. Từ đó có khả năng kiểm định được tính dừng của biến chuỗi thời gian và biến đổi số liệu để nó có tính dừng

� Có khả năng nhận dạng và xây dựng mô hình dự báo trên số liệu chuỗi thời gian dừng

� Nắm phương pháp luận Box-Jenkins trong việc xây dựng mô hình ARIMA cho số liệu chuỗi thời gian không dừng

� Xây dựng ARIMA với Eviews

BỐ CỤC

Quá trình ngẫu nhiên Một số quá trình ngẫu nhiên đặc biệt Tính dừng

Mô hình dự báo trên biến chuỗi thời gian dừng không có tính mùa

Mô hình dự báo trên biến chuỗi thời gian có tính mùa

Mô hình ARIMA

Phương pháp luận Box-Jenkins

Mô hình ARIMA cho biến chuỗi thời gian có tính mùa (SARIMA)

Tóm tắt nhận dạng một số mô hình ARIMA

Xây dựng mô hình ARIMA tự động với phần mềm Autobox Hạn chế của các mô hình ARIMA

1 Theo Ernst R.Berndt (1991). The Practice of Econometrics: Clasical and Contemporay. Addison-Wesley Publishing Company

Page 2: Chuong13 Mo Hnh ARIMA

Lê Tấn Luật Các mô hình dự báo đơn giản

2

13.1. Quá trình ngẫu nhiên

Quan điểm xây dựng mô hình dự báo mang tính thống kê của chương này là giá trị của biến số cần dự báo tuân theo một quá trình ngẫu nhiên theo một quy luật nào đó. Nhiệm vụ của nhà dự báo là xây dựng một mô hình mô tả bản chất quá trình ngẫu nhiên đã tạo ra giá trị của biến số đó. Khác với kỹ thuật hồi quy, tính ngẫu nhiên chứ không phải quan hệ nhân quả đóng vai trò quan trọng trong quá trình này.

13.2. Một số quá trình ngẫu nhiên đặc biệt

13.2.1. Nhiễu trắng (White noise)

Nhiễu trắng là một quá trình ngẫu nhiên có trung bình bằng 0, phương sai không đổi và tất cả các hệ số tự tương quan bằng 0. Nhớ lại các giả thiết của mô hình hồi quy tuyến tính cổ điển, nếu thoả mãn các giả thiết này thì phần dư của hồi quy tuân theo nhiễu trắng.

White noise

-10

-8

-6

-4

-2

0

2

4

6

8

10

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

Hình 13.1. Một “nhiễu trắng” theo phân phối thường có độ lệch chuẩn bằng 5.

Khi một biến số được xác định là một nhiễu trắng thì chúng ta không thể xây dựng mô hình dự báo mặc dù có thể xây dựng mô hình xác suất mô phỏng nó.

13.2.2. Bước ngẫu nhiên (Random Walk)

Tên gọi “bước ngẫu nhiên ” thể hiện tính không thể đoán trước được, quá trình này được ví như bước chân loạng choạng của người say rượu. Trong quá trình tuân theo bước ngẫu nhiên, sự thay đổi của biến số Y được rút ra một cách độc lập từ một phân phối có trung bình bằng 0. Vậy

ttt YY ε+= −1 (13.1) Với 0)( =tE ε và stE st ≠= ,0)( εε

Dự báo cho thời đoạn t là

Page 3: Chuong13 Mo Hnh ARIMA

Lê Tấn Luật Các mô hình dự báo đơn giản

3

111 )()()(ˆ−−− =+=+== ttttttt YEYYEYEY εε (13.2)

Dự báo cho thời đoạn t+1 là

1111 )()()(ˆ−+++ =+=+= tttttt YEYEYEY εε (13.3)

Vậy dự báo cho bao nhiêu thời đoạn tới cũng là 1−tY .

Tuy nhiên, sai số của dự báo tăng dần Sai số dự báo cho thời kỳ t+1

11111ˆ

+++++ =−+=−= ttttttt YYYYe εε (13.4) Phương sai của ước lượng

22

11 )()var( εσε == ++ tt Ee (13.5) Sai số dự báo cho thời kỳ t+2

2121222ˆ

+++++++ +=−++=−= ttttttttt YYYYe εεεε (13.6) Phương sai

( )( ) ( ) ( ) ( ) 221

22

21

2212 22)var( εσεεεεεε =++=+= +++++++ ttttttt EEEEe (13.7)

Vậy mặc dù giá trị dự báo không đổi nhưng sai số của dự báo tăng dần. Tương tự như nhiễu trắng, không thể xây dựng mô hình dự báo trên chuỗi tuân theo bước ngẫu nhiên.

Giả sử giá của một loại cổ phiếu Y ở phiên đầu tiên là 100 (ngàn VND/cổ phiếu) và tuân theo bước ngẫu nhiên với nhiễu trắng tuân theo phân phối thường với độ lệch chuẩn là 5. Với ba lần mô phỏng (ba kịch bản) giá 10 phiên giao dịch của “cổ phiếu say” này chúng ta nhận được kết quả như sau.

The Drunken Stock

50

60

70

80

90

100

110

120

130

0 1 2 3 4 5 6 7 8 9 10

Phiên

'00

0 V

ND

KB1

KB2

KB3

Hình 13.2. Quá trình bước ngẫu nhiên

13.2.3. Bước ngẫu nhiên với thành phần xu hướng

Page 4: Chuong13 Mo Hnh ARIMA

Lê Tấn Luật Các mô hình dự báo đơn giản

4

Biến số hoàn toàn tuân theo bước ngẫu nhiên ít gặp trong thực tế, tình huống chúng ta gặp thường xuyên hơn là biến số có tính xu hướng. ttt gYY ε++= −1 (13.8)

Với g là mức tăng trưởng kỳ vọng của một thời đoạn. Trở lại ví dụ về giá cổ phiếu, giả sử cổ phiếu Y tăng trung bình 2 ngàn VND một phiên. Chúng ta có thể mô phỏng quá trình tăng giá của Y qua 10 phiên như sau. Mặc dù chúng ta vãn có thể dự báo cho quá trình bước ngẫu nhiên có tính xu hướng nhưng phương sai của dự báo vẫn lớn như quá trình bước ngẫu nhiên thuần tuý.

50

60

70

80

90

100

110

120

130

140

0 1 2 3 4 5 6 7 8 9 10

Phiên

'00

0 V

ND

Hình 13.3. Quá trình bước ngẫu nhiên có tính xu hướng

13.3. Tính dừng

13.3.1. Số liệu dừng và không dừng

Các kỹ thuật dự báo trong chương này dựa trên giả thiết là quá trình ngẫu nhiên tạo ra biến số chuỗi thời gian cần dự báo là bất biến theo thời gian hay “dừng”. Khi biến số tuân theo quá trình “dừng” thì có thể biểu diễn chuỗi thời gian trong quá khứ và tương lai bằng một mô hình đại số đơn giản. Một biến chuỗi thời gian dừng phải có ba tính chất

(1) Trung bình không đổi theo thời gian: tYE Yt ∀= ,)( µ

(2) Phương sai không đổi theo thời gian: [ ] tYEY YYtt ∀==−= ,)()var( 222 σσµ

(3) Hệ số tự tương quan không đổi theo thời gian: [ ]

tYYE

r kYktYt

k ∀=−−

= − ,))((

σ

µµ

Page 5: Chuong13 Mo Hnh ARIMA

Lê Tấn Luật Các mô hình dự báo đơn giản

5

Một biến số chuỗi thời gian chỉ cần không có một trong ba tính chất trên thì được gọi là chuỗi thời gian không dừng.

13.3.2. Kiểm định tính dừng

(1) Nhận định bằng đồ thị

Nếu số liệu có tính xu hướng thì nó không dừng, vậy nếu một cách trực quan chúng ta thấy tính xu hướng dài hạn thì biến chuỗi thời gian không dừng. Ngoài ra trên đồ thị chúng ta cũng có thể dễ dàng nhận ra phương sai không đồng nhất. Riêng tính tự tương quan thì khó nhận biết hơn. Đồ thị ở hình 13.1 biểu diễn tỷ giá đô la Mỹ từ 1-2002 đến 9-2007. Chúng ta thấy trung bình tăng theo thời gian. Vậy tỷ giá đô la Mỹ không dừng.

14400

14600

14800

15000

15200

15400

15600

15800

16000

16200

16400

Ja

n-0

2

Mar-

02

Ma

y-0

2

Ju

l-02

Se

p-0

2

No

v-0

2

Ja

n-0

3

Mar-

03

Ma

y-0

3

Ju

l-03

Se

p-0

3

No

v-0

3

Ja

n-0

4

Mar-

04

Ma

y-0

4

Ju

l-04

Se

p-0

4

No

v-0

4

Ja

n-0

5

Mar-

05

Ma

y-0

5

Ju

l-05

Se

p-0

5

No

v-0

5

Ja

n-0

6

Mar-

06

Ma

y-0

6

Ju

l-06

Se

p-0

6

No

v-0

6

Ja

n-0

7

Mar-

07

Ma

y-0

7

Ju

l-07

Se

p-0

7

Hình 13.4. Tỷ giá VND/USD

Nguồn: Chỉ số giá USD của Tổng Cục Thống Kê

và tính toán hoàn nguyên giá gốc của tác giả

Hình 13.2 biểu diễn tỷ lệ tăng giá lương thực-thực phẩm hàng tháng từ 1-2002 đến 9-2007. Chuỗi này xem như dừng về trung bình nhưng có vẻ như nó vi phạm tính dừng về phương sai và cấu trúc tự tương quan. Ngoài ra chúng ta có thể thấy tính mùa rõ rệt. Giá lương thực-thực phẩm tăng cao vào tháng 2 (tết cổ truyền) sau đó sụt giảm trong tháng 3, quy trình này lặp đi lặp lại hàng năm.

Page 6: Chuong13 Mo Hnh ARIMA

Lê Tấn Luật Các mô hình dự báo đơn giản

6

-3.00%

-2.00%

-1.00%

0.00%

1.00%

2.00%

3.00%

4.00%

5.00%

6.00%

Feb

-02

Ap

r-02

Ju

n-0

2

Au

g-0

2

Oct-

02

Dec-0

2

Feb

-03

Ap

r-03

Ju

n-0

3

Au

g-0

3

Oct-

03

Dec-0

3

Feb

-04

Ap

r-04

Ju

n-0

4

Au

g-0

4

Oct-

04

Dec-0

4

Feb

-05

Ap

r-05

Ju

n-0

5

Au

g-0

5

Oct-

05

Dec-0

5

Feb

-06

Ap

r-06

Ju

n-0

6

Au

g-0

6

Oct-

06

Dec-0

6

Feb

-07

Ap

r-07

Ju

n-0

7

Au

g-0

7

Hình 13.5. Tỷ lệ tăng giá lương thực-thực phẩm

Nguồn: Tổng Cục Thống Kê

Trong thực hành, tính dừng về trung bình là điều kiện quan trọng nhất để xây dựng các mô hình dự báo ngắn hạn, và phương pháp đồ thị cho chúng ta kết luận nhanh về tính dừng của chuỗi.

(2) Phép kiểm định nghiệm đơn vị (Unit root test)

Kiểm định nghiệm đơn vị (Unit root test) theo Dickey-Fuller như sau2

Giả sử biến Y tuân theo quá trình tự hồi quy bậc 1

ttt YY ερµ ++= −1 (13.9)

với µ và ρ là các tham số và tε là nhiễu trắng.

Điều kiện cần để chuỗi dừng là 11 <<− ρ . Nếu 1>ρ thì chuỗi có xu hướng bùng nổ (giá trị tăng rất nhanh), hay chuỗi không dừng. Nếu 1=ρ thì chuỗi theo quá trình bước ngẫu nhiên có xu hướng, hay chuỗi cũng không dừng. Vậy giả thuyết không cho kiểm định tính dừng là 1=ρ và đối thuyết là 1<ρ .

Từ (13.9) rút ra hồi quy cho kiểm định là

ttt YY ερµ +−+=∆ −1)1(

ttt YY εγµ ++=∆ −1 (13.10)

Nếu Y tuân theo quá trình tự hồi quy bậc cao hơn thì sử dụng hồi quy kiểm định

2 Theo Brooks (2002), Introductory Econometrics for Finance, Cambridge University Press, trang 375.

Page 7: Chuong13 Mo Hnh ARIMA

Lê Tấn Luật Các mô hình dự báo đơn giản

7

∑=

−− +∆++=∆p

i

tititt YYY1

1 εβγµ (13.11)

H0: 0=γ , Chuỗi không dừng

H1: 0<γ , Chuỗi có tính dừng

Nếu 0<γ thì chuỗi có tính dừng. Vậy trị thống kê kiểm định là

)ˆ(

ˆ

α

α

seADF = (13.12)

ADF rất giống trị thống kê t trong hồi quy thông thường, nhưng giá trị tới hạn của trị thống kê này không thể tra theo bảng thống kê t-Student mà được xác định bằng thực nghiệm. Diskey-Fuller đã tính toán và McKinnon đã hiệu chỉnh giá trị tới hạn cho các trường hợp cụ thể. Eviews báo cáo giá trị tới hạn Mc Kinnon cho từng phép kiểm đinh cụ thể.

Nếu trị thống kê ADF nhỏ hơn giá trị tới hạn Mc Kinnon thì bác bỏ H0, hay chuỗi thời gian có tính dừng.

Thao tác kiểm định trên Eviews như sau:

<Cửa sổ biến số>/ View/ Unit Roots Test/ Augmented Diskey-Fuller/ Lags: p

Chúng ta thực hiện kiểm định trên 2 biến tỷ giá VND/USD và tỷ lệ tăng giá lương thực-thực phẩm trong ví dụ ở phần trên.

Page 8: Chuong13 Mo Hnh ARIMA

Lê Tấn Luật Các mô hình dự báo đơn giản

8

Hình 13.6. Kết quả kiểm định Augmented Diskey-Fuller cho biến VND/USD

Kết quả kiểm định cho ADF = -1.515> -2.9 = ADFα=5% cho kết luận là không bác bỏ được biến tỷ giá VND/USD không có tính dừng với mức ý nghĩa 95%.

Kết quả kiểm định cho ADF = -3.859< -2.9 = ADFα=5% cho kết luận là biến tăng giá lương thực-thực phẩm INFL_FOODS có tính dừng với mức ý nghĩa 5%.

Hình 13.7. Kết quả kiểm định Augmented Diskey-Fuller cho biến INFL_FOODS

13.3.3. Biến đổi số liệu không dừng thành dừng

Một biến chuỗi thời gian không dừng có thể được biến đổi thành dừng bằng cách lấy sai phân bậc 1

1)()1( −−== tttt YYYdI (13.13) Nếu sai phân bậc 1 chưa dừng thì tiếp tục lấy sai phân bậc cao hơn

)()()()2( 12

−−== tttt YdYdYdI (13.14) Thông thường chuỗi sai phân bậc 1 đã có tính dừng. Ví dụ chúng có chỉ số giá tiêu dùng CPI có xu hướng tăng nhưng sai phân của nó lại có tính dừng (hình 13.8).

Page 9: Chuong13 Mo Hnh ARIMA

Lê Tấn Luật Các mô hình dự báo đơn giản

9

100

110

120

130

140

150

2002 2003 2004 2005 2006 2007

CPI

-3

-2

-1

0

1

2

3

4

2002 2003 2004 2005 2006 2007

DCPI

Chỉ số giá tiêu dùng (12/2001=100) Mức tăng CPI ( DCPIt=d(CPIt)

Hình 13.8. Chỉ số giá tiêu dùng và sai phân của nó Trong thực tế thì sai phân của CPI (mức tăng tuyệt đối) không có ý nghĩa kinh tế bằng khái niệm lạm phát (mức tăng tương đối)

t

tt CPI

CPIdINFLATION

)(= (13.15)

-0.03

-0.02

-0.01

0.00

0.01

0.02

0.03

2002 2003 2004 2005 2006 2007

INFLATION

Hình 13.9. Lạm phát có tính dừng

13.3.4. Hàm tự tương quan và hàm tự tương quan riêng phần

(1) Hàm tự tương quan (AC-Autocorrelation)

Hàm tự tương quan với độ trễ k

[ ][ ] [ ]22 )()(

))((

µµ

µµρ

−−

−−=

ktt

kttk

YEYE

YYE (13.16)

Đối với chuỗi thời gian dừng, [ ] [ ] 222 )()( σµµ =−=− −ktt YEYE . Vậy

[ ]

2

))((

σ

µµρ

−−= −ktt

k

YYE (13.17)

Page 10: Chuong13 Mo Hnh ARIMA

Lê Tấn Luật Các mô hình dự báo đơn giản

10

Trong thực hành chúng ta chỉ tính được hàm tự tương quan mẫu (SAC-Sample Autocorrelation)

n

YY

kn

YYYY

rn

t

t

n

kt

ktt

k

=

+=

−−

=

1

2

1

)(

)(

))((

(13.18)

Trong trường hợp tất cả các hệ số tự tương quan đều bằng 0 với các k>0, chúng ta có trường hợp gọi là quá trình “nhiễu trắng”, hệ quả là các hạ thấp sức mạnh của các mô hình dự báo dựa trên tính chất của chuỗi thời gian.

Trị thống kê QLjung-Box được định nghĩa như sau.

= −+=

p

j

j

pLBjT

rnnQ

1

2

, )()2(

(13.19)

H0: ,021 ==== pρρρ K không tồn tại tự tương quan đến bậc p.

Dưới giả thuyết không, pLBQ , tuân theo phân phối Chi-bình phương với p bậc tự do.

Quy tắc quyết định

• Nếu 2%95,, ppLBQ χ> thì bác bỏ H0 hay có tồn tại tự tương quan đến bậc p với mức ý nghĩa

5%.

• Nếu 2%95,, ppLBQ χ≤ thì không thể bác bỏ H0 hay không tồn tại tự tương quan đến bậc p với

mức ý nghĩa 5%.

Eviews đã tính toán sẳn giá trị P của pLBQ , nên càng tiện lợi cho thao tác kiểm định. Chú ý

là nếu đã có thể bác bỏ H0 đến bậc p thì không cần xét tiếp đến bậc (p+1).

Inflation là số liệu lạm phát của Việt Nam từ 1-1995 đến 12-2005.

Page 11: Chuong13 Mo Hnh ARIMA

Lê Tấn Luật Các mô hình dự báo đơn giản

11

-0.02

-0.01

0.00

0.01

0.02

0.03

0.04

95 96 97 98 99 00 01 02 03 04 05

INFL

Hình 13.10. Lạm phát hàng tháng của Việt Nam giai đoạn 1-1995 đến 12-2005

Thao tác kiểm định tự tương quan trong Eviews như sau: Infl/ View/ Correlogram…/Level/ Lags to includ: 12/OK

Hình 13.11. Kiểm định tính tự tương quan của Infl (Y)

Ngay ở bậc trễ thứ 1 đã có Prob(Q-Stat) < 5%, vậy biến lạm phát có tự tương quan với độ trễ 1 khác 0 với mức ý nghĩa 5%.

(2) Hàm tương quan riêng phần (PAC-Partial Autocorrelation)

Hàm tự tương quan riêng phần ở độ trễ k đo lường tương quan giữa các giá trị Y cách nhau k thời đoạn sau khi loại bỏ tương quan giữa các bước trễ trung gian.

Eviews đo lường hệ số tương quan riêng phần bằng công thức sau

Page 12: Chuong13 Mo Hnh ARIMA

Lê Tấn Luật Các mô hình dự báo đơn giản

12

1,1

1,

1

1,

1

1,1

>

=

==

∑−

=−

=

−−

k

rr

rrr

r

krr

k

j

jjjk

k

j

jkjkk

kk

kkk

(13.20)

Với rk là hàm tự tương quan với độ trễ k.

AC và PAC là các trị thống kê quan trọng để chỉ định mô hình ARIMA, mô hình quan trọng nhất của chương này.

13.2. Mô hình dự báo trên biến chuỗi thời gian dừng không có tính mùa

13.2.1. Mô hình tự hồi quy (AR)

Mô hình tự hồi quy bậc p có dạng

AR(p): tptptt YYY εφφδ ++++= −− K11 (13.21)

Với iφ là các tham số chưa biết đo lường ảnh hưởng của Yt-i.

Điều kiện để quá trình AR(p) hội tụ là 0< iφ <1 với mọi i.

Có thể chứng minh được nếu chuỗi thời gian có tính dừng thì

)1( 1 pφφµδ −−−= K (13.22)

Đối với chuỗi tuân theo AR(p)

(1) AC giảm nhanh dần (ri giảm theo quy luật ổn định)

(2) PAC có đỉnh đến độ trễ thứ p, bằng 0 ở các độ trễ lớn hơn p.

Vậy nếu đồ thị AC và PAC cho

i. AC giảm nhanh dần, và

ii. PAC có đỉnh nhọn ở các độ trễ 1,2, …, p và giảm nhanh sau độ trễ p

thì chúng ta có thể kết luận tạm thời là chuỗi thời gian tuân theo mô hình tự hồi quy bậc p.

Page 13: Chuong13 Mo Hnh ARIMA

Lê Tấn Luật Các mô hình dự báo đơn giản

13

Hình 13.12. Đồ thị AC và PAC cho một quá trình xấp xỉ AR(2)

Thủ tục ước lượng mô hình tự hồi quy đến bậc p ở Eviews rất đơn giản như sau:

Quick/ Estimate Equation/ Equation Specification: Y C AR(1) AR(2)… AR(p)/OK

Trở lại ví dụ lạm phát, đồ thị AC và PAC (hình 12.3) gợi ý có thể quá trình ngẫu nhiên theo AR(1). Kết quả mô hình AR(1) như sau.

Hình 13.13. Kết quả mô hình AR(1) cho lạm phát

Thao tác ước lượng lạm phát theo AR(1) trên Eviews như sau:

<Kết xuất hồi quy>/ Procs/ Forecast/ Static/ OK

Page 14: Chuong13 Mo Hnh ARIMA

Lê Tấn Luật Các mô hình dự báo đơn giản

14

Hình 13.14. Giao diện dự báo

Kết quả dự báo lạm phát cho tháng 10-2007 là 0.0048 hay 0,48%.

13.2.2. Mô hình trung bình trượt (MA)

Mô hình trung bình trượt bậc q được ký hiệu là MA(q) có dạng

qtqtttY −− +⋅⋅⋅+++= εθεθεδ 11 (13.23)

với d là hằng số, et là nhiễu trắng.

Đối với chuỗi tuân theo MA(q)

1. AC khác không đến độ trễ thứ q, bằng 0 ở các độ trễ lớn hơn q.

2. PAC giảm nhanh dần (ri giảm theo quy luật ổn định).

Vậy nếu đồ thị AC và PAC cho

iii. AC có đỉnh nhọn ở các độ trễ 1,2, …, q và giảm nhanh sau độ trễ

iv. PAC giảm nhanh dần

thì chúng ta có thể kết luận tạm thời là chuỗi thời gian tuân theo quy trình trung bình trượt MA(q).

Thủ tục ước lượng mô hình trung bình trượt độ trễ q ở Eviews rất đơn giản như sau:

Quick/ Estimate Equation/ Equation Specification: Y C MA(1) MA(2) … MA(p)/OK

Đồ thị AC và PAC của lạm phát (hình 13.3) cũng gợi ý cho chúng ta là lạm phát có thể tuân theo trung bình trượt 1 thời đoạn MA(1).

Kết quả mô hình MA(1) như sau:

Page 15: Chuong13 Mo Hnh ARIMA

Lê Tấn Luật Các mô hình dự báo đơn giản

15

Hình 13.15. Kết quả ước lượng mô hình MA(1)

Kết quả ước lượng lạm phát theo mô hình MA(1) cho tháng 10-2007 là 0.52%.

13.2.3. Mô hình tự hồi quy kết hợp với trung bình trượt (ARMA)

Mô hình ARMA(p,q)

qtqttptptt YYY −−−− +⋅⋅⋅++++++= εθεθεφφδ 1111 K (13.24)

Quá trình ARMA(p,q) có

(1) AC có đỉnh đến độ trễ q, bằng 0 ở độ trễ lớn hơn q.

(2) PAC có đỉnh đến độ trễ p, bằng 0 ở độ trễ lớn hơn p.

Thủ tục ước lượng mô hình trung bình trượt độ trễ q ở Eviews rất đơn giản như sau:

Quick/ Estimate Equation/ Equation Specification: Y C AR(1)… AR(p) MA(1)…MA(q)/OK

Số liệu lạm phát có PAC và AC đều có đỉnh ở độ trễ 1 và giảm nhanh sau đó, vậy có thể xem lạm phát tuân theo quá trình ARMA(1,1)

Kết quả ước lượng mô hình ARMA(1,1)

Page 16: Chuong13 Mo Hnh ARIMA

Lê Tấn Luật Các mô hình dự báo đơn giản

16

Hình 13.16. Kết quả ước lượng ARMA(1,1)

Kết quả dự báo của mô hình ARMA cho lạm phát tháng 10-2007 là 0.49%.

13.3. Mô hình dự báo trên biến chuỗi thời gian có tính mùa

Vì cả ba mô hình AR(1), MA(1) và ARMA(1) đều là các mô hình hồi quy nên chúng ta có thể xem xét tính phù hợp của mô hình bằng hệ số xác định R2, cả ba mô hình đều có mức độ phù hợp thấp (R2<10%). Nếu nhìn lại đồ thị AC và PAC chúng ta thấy cả hệ số tự tương quan và tương quan riêng phần ở độ trễ 12 đều trở lại đỉnh và là giá trị dương. Vậy lạm phát của một tháng bất kỳ năm nay có xu hướng gần giống như cùng kỳ năm trước hay lạm phát có tính mùa vụ với chu kỳ là 12 tháng.

Page 17: Chuong13 Mo Hnh ARIMA

Lê Tấn Luật Các mô hình dự báo đơn giản

17

Hình 13.17. AC và PAC của lạm phát

Chúng ta có thể nhận thấy tính mùa vụ của lạm phát rõ hơn khi nhìn đồ thị 12.13. Đỉnh của lạm phát hàng năm đều rơi vào tháng 2 (tết âm lịch) và thấp nhất vào tháng 3. Ngoài ra diễn biến của lạm phát của các tháng khác hàng năm khá giống nhau.

-0.010

-0.005

0.000

0.005

0.010

0.015

0.020

0.025

05:01 05:07 06:01 06:07 07:01 07:07

Y

Hình 13.18. Tính mùa vụ của lạm phát

Các mô hình AR(1), MA(1) và ARMA(1,1) chỉ ước lượng lạm phát tháng này dựa vào lạm phát tháng trước nên kết quả dự báo không chính xác. Mô hình dự báo sẽ chính xác hơn nếu chúng ta hiệu chỉnh yếu tố mùa vụ. Một mô hình như vậy là SARMA (Seasonal Autoregressive and Moving Average).

Mô hình SARMA(1,1) với hiệu chỉnh mùa vụ chu kỳ 12 tháng trong Eviews được ước lượng như sau

Quick/ Estimate Equation/ Equation Specification: Y C AR(1) SAR(12) MA(1) SMA(12)/ OK.

Mô hình SARMA(1,1) được ước lượng như trên được trình bày lại như sau.

tt

tt

LLuLL

uY

ε)886.01)(305.01()013.11)(261.01(

003888.01212 −+=−−

+−= (13.25)

1312113121 264.0886.0305.0*264.0*013.1261.0 −−−−−− −−++−+≈ tttttttt YYYY εεεε

Mức độ phù hợp của mô hình tăng rất cao so với ba mô hình không xét đến tính mùa ở phần trước. Kết quả ước lượng lạm phát tháng 10-2007 với SARMA(1,1) là 0.31%.

Page 18: Chuong13 Mo Hnh ARIMA

Lê Tấn Luật Các mô hình dự báo đơn giản

18

Hình 13.19. Kết quả ước lượng mô hình SARMA(1,1) chu kỳ 12 tháng.

13.4. Mô hình ARIMA

13.4.1. Mô hình ARIMA

Trong các mục trước thảo luận về tính dừng của số liệu chuỗi thời gian, chúng ta đã thấy hầu hết chuỗi thời gian là không dừng và có thể biến chuỗi thời gian không dừng thành dừng bằng cách lấy sai phân của nó.

Ví dụ doanh thu Y của hệ thống cửa hàng WalMark từ quý 1 năm 1992 đến quý 4 năm 2000 có xu hướng tăng (hình 13.20.a). Vậy số liệu doanh thu WalMark không có tính dừng. Bằng cách lấy sai phân của Y chúng ta có được chuỗi thời gian có tính dừng (hình 12.20.b)3.

1

1

−−=

t

ttt

Y

YYdY

(13.26)

3 Thật ra số chuỗi dY chỉ dùng về trung bình, nó vẫn vi phạm tính dừng về phương sai, hơn nữa dY có tính thời vụ. Chúng ta sẽ xử lý tính mùa ở mục tiếp theo.

Page 19: Chuong13 Mo Hnh ARIMA

Lê Tấn Luật Các mô hình dự báo đơn giản

19

0

10000

20000

30000

40000

50000

60000

92 93 94 95 96 97 98 99 00

Y

-10000

-5000

0

5000

10000

15000

92 93 94 95 96 97 98 99 00

DY

a b

Hình 13.20. Doanh thu theo quý của Walmark4

Vì chuỗi dY dừng nên có thể áp dụng mô hình ARMA đã thảo luận ở mục 13.2 cho dY. Tuy nhiên, đồ thị AC và SAC của dY có hình dạng khá phức tạp.

Hình 13.21. AC và PAC của dY (tăng trưởng doanh thu của WalMark)

Từ 12.21 chúng ta chưa thể xác định chính xác mô hình ARMA phù hợp. Giả sử chúng ta thử nghiệm mô hình ARMA(1,1) cho dY.

1111)( −− +++= tttt YYd εθεφδ (13.27)

4 Nguồn: David M. Levine, Timothy K. Krehbiel, Mark L. Berenson (2006). Business Stattistics-A First Course, 3rd Edition. Prentice Hall.

Page 20: Chuong13 Mo Hnh ARIMA

Lê Tấn Luật Các mô hình dự báo đơn giản

20

Hình 13.22. Kết xuất mô hình ARIMA(1,1,1).

Kết quả dự báo cho 4 quý tiếp như sau

2001:1 44534

2001:2 45512

2001:3 46490

2001:4 47467

Mô hình 13.27 là ARMA(1,1) cho sai phân bậc 1 của Y. Người ta đặt tên cho loại mô hình này là ARIMA(1,1,1). (ARIMA-Autoregressive Integrated Moving Average).

Tổng quát, một mô hình được ký hiệu là ARIMA(p,d,q) có là mô hình ARMA(p,q) của I(d), với I(d) là sai phân bậc d của Y.

13.4.2. Phương pháp luận Box-Jenkins

Bước 1: Xác lập mô hình ARIMA(p,d,q)

- Dùng các đồ thị và các phép kiểm định để xác định bậc sai phân cần thiết để chuỗi thời gian có tính dừng. Giả sử dữ liệu dùng ở I(d).

- Dùng đồ thị SAC và SPAC của I(d) để xác định p và q.

- Triển khai dạng của mô hình.

Bước 2: Tính toán các tham số của mô hình.

Trong một số dạng ARIMA đơn giản chúng ta có thể dùng phương pháp bình phương tối thiểu. Một số dạng ARIMA phức tạp đòi hỏi phải sử dụng các ước lượng phi tuyến. Chúng ta không phải lo lắng về việc ước lượng tham số vì các phần mềm kinh tế lượng như Eviews sẽ tính giúp chúng ta. Quay lại bước 1 xây dựng mô hình với cặp (p,q) khác dường như cũng phù hợp. Giả sử chúng ta ước lượng được m mô hình ARIMA.

Bước 3: Kiểm tra chẩn đoán

Page 21: Chuong13 Mo Hnh ARIMA

Lê Tấn Luật Các mô hình dự báo đơn giản

21

So sánh các mô hình ARIMA đã ước lượng với các mô hình truyền thống (đường xu hướng, san bằng số mũ, trung bình trượt giản đơn…) và giữa các mô hình ARIMA với nhau để chọn mô hình tốt nhất.

Bước 4: Dự báo

Dùng mô hình tốt nhất để đưa ra dự báo ngắn hạn (1 hoặc 2 thời đoạn). Trong đa số trường hợp, mô hình ARIMA cho kết quả dự báo ngắn hạn đáng tin cậy nhất trong các phương pháp dự báo.

13.4.3. Mô hình ARIMA cho biến chuỗi thời gian có tính mùa (SARIMA)

Chúng ta có thể thấy số liệu tăng trưởng doanh thu của WalMark có tính mùa, cao nhất vào quý 3 và thấp nhất vào quý 4 hàng năm (hình 13.20). Vậy số liệu của tăng trưởng doanh thu có tính mùa với độ dài là 4.5

Mô hình ARIMA được biến đổi cho phù hợp với dữ liệu có tính mùa được gọi là SARIMA. Mô hình SARIMA cho doanh thu của WalMark được chỉ định trên Eviews như sau:

Quick/ Estimate Equation/ Equation Specification: d(Y) C AR(1) SAR(1) MA(1) SMA(1)

Kết quả ước lượng như sau

Hình 13.23. Kết quả ước lượng SARIMA

Kết quả ước lượng doanh thu cho năm 2001 như sau

2001:1 64146.61

2001:2 69330.33

5 Thông thường chu kỳ mùa là 12 cho só liệu tháng và 4 cho số liệu quý.

Page 22: Chuong13 Mo Hnh ARIMA

Lê Tấn Luật Các mô hình dự báo đơn giản

22

2001:3 71392.74

2001:4 83249.95

13.5. Tóm tắt nhận dạng một số mô hình ARIMA

Chú ý là mô hình ARIMA(p,d,q) chính là ARMA(p,q) cho sai phân bậc d. Vậy chúng ta chỉ cần nhận dạng các mô hình ARMA(p,q) là có thể nhận dạng được mô hình ARIMA tổng quát. ARIMA(p,q) còn được ký hiệu là ARIMA(p,0,q).

Nhận dạng bậc sai phân d đã được thảo luận ở các phần trước. Giả sử chuỗi thời gian đã có tính dừng (chuỗi gốc hoặc đã lấy sai phân) với ký hiệu là Y. Mô hình ARIMA(p,0,q) cho Y được nhận dạng qua đồ thị của hàm tự tương quan (AC) và hàm tự tương quan riêng phần (PAC) như ở bảng sau.

Bảng 13.1. Nhận dạng các mô hình ARIMA(p,0,q)

Mô hình AC PAC

ARIMA(0,0,0)6 Tất cả bằng 0 và Tất cả bằng 0

ARIMA(1,0,0) Tiến tới 0 và Bằng 0 sau độ trễ 1

ARIMA(2,0,0) Tiến tới 0 và Bằng 0 sau độ trễ 2

ARIMA(0,0,1) Bằng 0 sau độ trễ 1 và Tiến tới 0

ARIMA(0,0,2) Bằng 0 sau độ trễ 2 và Tiến tới 0

ARIMA(1,0,1) Bằng 0 sau độ trễ 1 và Bằng 0 sau độ trễ 1

ARIMA(p,0,q) Bằng 0 sau độ trễ p và Bằng 0 sau độ trễ q

13.6. Xây dựng mô hình ARIMA tự động với phần mềm Autobox

13.6.1. Giới thiệu phần mềm Autobox Phần mềm dự báo tự động Autobox do Automatic Forecasting System Inc phát triển. Phiên bản hiện nay là Autobox Version 6.0.0. Đây là phần mềm miễn phí (free-ware), có thể tải về vài cài đặt từ trang web http://www.autobox.com. Quá trình cài đặt đơn giản, không đòi hỏi bất cứ mật mã nào.

13.6.2. Nhập liệu vào Autobox Sau khi cài đặt xong, chạy chương trình Autobox sẽ xuất hiện màn hình Autobox rất đơn giản chỉ với thực đơn File và Help. Giả sử chúng ta cần dự báo giá vàng với số liệu quá khứ từ 1-2002 đến 9-2007 (69 quan sát). Mở file mới: File/New/ <Nhập thông số khoảng chứa số liệu giá vàng>

6 ARIMA(0,0,0) là quá trình nhiễu trắng (white noise), không thể xây dựng mô hình dự báo trên nó.

Page 23: Chuong13 Mo Hnh ARIMA

Lê Tấn Luật Các mô hình dự báo đơn giản

23

Hình 13.24. Nhập thông số cho biến Gold_Price

Chúng ta nhận được biến Gold_Price chưa có số liệu. Bây giờ Copy giá vàng từ Excel và dán vào vùng số liệu và lưu File số liệu. Chúng ta đã hoàn tất việc nhập liệu.7

Hình 12.25. Bảng số liệu Gold_Price trên Autobox

13.6.3. Chạy mô hình ARIMA trên Autobox Chạy mô hình bằng cách nhấp vào Process, hộp thoại chỉ định mô hình sẽ xuất hiện, chúng ta có các tuỳ chọn sau: Automatic: Tự động (1) With AFS Rules: theo quy tắc của Autobox

(2) With User Rules: theo quy tắc người sử dụng đặt

User Specified Model: Người sử dụng chỉ định mô hình

7 Còn một cách nhập liệu nữa là Import từ Excel. Độc giả tự tìm hiểu.

Page 24: Chuong13 Mo Hnh ARIMA

Lê Tấn Luật Các mô hình dự báo đơn giản

24

(3) Implicit Canned Model With AFS Rules: Mô hình không tường minh với quy tắc của Autobox

(4) Explicit Model With User Rules: Mô hình tường minh với quy tắc của người sử dụng

(5) Special: Đặc biệt (6) Identification Only: Chỉ xác định mô hình

(7) Monte Carlo Simulation With Explicit Model: Mô phỏng Monte Carlo với mô hình tường minh

Hình 13.26. Chỉ định mô hình trên Autobox

Kỹ thuật xây dựng mô hình dự báo thật sự rất phức tạp và nhiều kỹ thuật nằm ngoài khuôn khổ giáo trình này. Ở đây chúng ta chỉ xem xét hai trường hợp

- Automatic (Tự động): With AFS Rules (theo quy tắc của Autobox)

- User Specified Model (Người sử dụng chỉ định mô hình): Implicit Canned Model With AFS Rules (Mô hình không tường minh với quy tắc của Autobox).

Chỉ định mô hình: Giả sử chúng ta chọn mô hình cộng Holt-Winter Process/ Implicit Canned Model With AFS Rules/ Next/<Chọn loại mô hình: HOLT LINEAR TREND PLUS ADDITIVE SEASONAL FACTORS (ARIMA FORM)>/Next/ Finish/<Chờ>/ Excecution Completed/ OK.

Page 25: Chuong13 Mo Hnh ARIMA

Lê Tấn Luật Các mô hình dự báo đơn giản

25

Kết quả dự báo như sau.

Hình 13.27. Kết xuất dự báo theo mô hình cộng của Autobox

Ước lượng điểm cho giá vàng tháng 10-2007 là 1423.75 ngàn đồng/ chỉ. Khoảng tin cậy 95% cho giá vàng tháng 10-2007 là (1343; 1503) Ước lượng tự động Process/ Automatic/ With AFS Rules / Next/ Finish/<Chờ>/ Excecution Completed/ OK.

Page 26: Chuong13 Mo Hnh ARIMA

Lê Tấn Luật Các mô hình dự báo đơn giản

26

Hình 13.27. Kết xuất dự báo tự động trên Autobox.

Ước lượng điểm cho giá vàng tháng 10-2007 là 1465 ngàn đồng/ chỉ. Khoảng tin cậy 95% cho giá vàng tháng 10-207 là (14333; 1496). Trong đa số trường hợp, chọn mô hình tự động cho kết quả dự báo tốt nhất.

13.7. Hạn chế của các mô hình ARIMA

Tuy nhiều nghiên cứu cho thấy kết quả dự báo ngắn hạn của các mô hình ARIMA chính xác hơn các mô hình dự báo truyền thống nhưng nó cũng có nhiều hạn chế.

- Số quan sát cần cho dự báo phải lớn. Thông thường để xây dựng mô hình ARIMA cần trên 60 quan sát.

- Chỉ dùng để dự báo ngắn hạn. Do ARIMA dự báo giá trị thời kỳ sau chỉ dựa trên dãy số liệu các thời kỳ trước nên giá trị dự báo có dao động tắt dần. Dự báo cho các thời kỳ xa chỉ còn là hằng số ứng với giá trụ trung bình của chuỗi dừng. Thông thường chỉ dùng ARIMA dự báo cho một đến hai thời đoạn.

- Không thể đưa các ảnh hưởng nhân quả của các biến số kinh tế của thời kỳ cần dự báo vào mô hình. Ý tưởng của ARIMA là mô phỏng diễn biến của biến số cần dự báo theo diễn biến trong quá khứ với giả định là các điều kiện ảnh hưởng đến quá trình ngẫu nhiên của biến số cần dự báo không đổi. Vậy nếu thời kỳ hiện tại có bối cảnh khác hoàn toàn với quá khứ thì không thể dùng ARIMA.

Page 27: Chuong13 Mo Hnh ARIMA

Lê Tấn Luật Các mô hình dự báo đơn giản

27

Xây dựng mô hình ARIMA theo phương pháp luận Box-Jenkins có tính chất nghệ thuật hơn là khoa học, hơn nữa kỹ thuật và khối lượng tính toán khá lớn nên đòi hỏi phải có phần mềm kinh tế lượng chuyên dùng. Nếu chúng ta cần dự báo nhanh mà không quan tâm lắm đến cơ sở khoa học của mô hình dự báo thì phần mềm dự báo tự động Autobox là sự lựa chọn số một.

Tóm tắt

1. Nhiễu trắng là một quá trình ngẫu nhiên có trung bình bằng 0, phương sai không đổi và tất cả các hệ số tự tương quan bằng 0.

2. Bước ngẫu nhiên là một quá trình mà sự thay đổi biến số cần dự báo được rút ra một cách độc lập từ một phân phối có trung bình bằng 0.

3. Một biến chuỗi thời gian được xem như tuân theo một quá trình “dừng” khi

a. Trung bình không đổi theo thời gian: tYE Yt ∀= ,)( µ

b. Phương sai không đổi theo thời gian: [ ] tYEY YYtt ∀==−= ,)()var( 222 σσµ

c. Hệ số tự tương quan không đổi theo thời gian: [ ]

tYYE

r kYktYt

k ∀=−−

= − ,))((

σ

µµ

4. Đa số biến số kinh tế có tính xu hướng, vậy đa số biến chuỗi thời gian không dừng. Tuy nhiên, sai phân của chúng lại có tính dừng. Do đó có thể biến đổi biến chuỗi thời gian không dừng thành dừng bằng cách lấy sai phân.

5. Đối với chuỗi thời gian dừng, mô hình tự hồi quy bậc p có dạng

AR(p): tptptt YYY εφφδ ++++= −− K11

với iφ là các tham số chưa biết đo lường ảnh hưởng của Yt-i.

Và mô hình trung bình trượt bậc q được ký hiệu là

MA(q): qtqtttY −− +⋅⋅⋅+++= εθεθεδ 11

với d là hằng số, et là nhiễu trắng.

Mô hình tự hồi quy kết hợp với trung bình trượt là

(ARMA): qtqttptptt YYY −−−− +⋅⋅⋅++++++= εθεθεφφδ 1111 K

Quá trình ARMA(p,q) có

i. AC có đỉnh đến độ trễ q, bằng 0 ở độ trễ lớn hơn q.

ii. PAC có đỉnh đến độ trễ p, bằng 0 ở độ trễ lớn hơn p.

Page 28: Chuong13 Mo Hnh ARIMA

Lê Tấn Luật Các mô hình dự báo đơn giản

28

6. Mô hình ARMA(p,q) cho sai phân bậc d của biến cần dự báo được gọi là mô hình ARIMA.

7. Phương pháp luận Box-Jenkins cho mô hình ARIMA là

Bước 1: Xác lập mô hình ARIMA(p,d,q)

Bước 2: Tính toán các tham số của mô hình.

Bước 3: Kiểm tra chẩn đoán

Bước 4: Dự báo

8. Nếu không quan tâm đến cơ sở khoa học của dự báo thì chúng ta có thể sử dụng chức năng dự báo tự động của phần mềm Autobox.

Thảo luận và bài tập

1. Quá trình nhiễu trắng và bước ngẫu nhiên có thể xảy ra trong thực tế không? Giải thích. Nếu có thể hãy cho ví dụ minh hoạ.

2. Hãy nêu ưu và nhược điểm của dự báo theo mô hình ARIMA.

3. Xây dựng mô hình dự báo là khoa học hay nghệ thuật?

4. Sử dụng số liệu ở bài tập 3 chương 12.

a. Hãy chọn một mặt hàng và xây dựng mô hình ARIMA để dự báo lạm phát của mặt hàng đó cho 3 tháng cuối năm 2007.

b. Dự báo tự động trên Autobox và so sánh với kết quả dự báo ở câu a.

c. Dự báo trượt giá của mặt hàng được chọn trong ba tháng cuối năm 2007.