-
Profesor Zorica Mladenovic
Ekonomski fakultet, Beograd, 2020. 1
BOKS-DŽENKINSOVA
STRATEGIJA MODELIRANJA
Zorica Mladenović
BOKS-DŽENKINSOVA
STRATEGIJA MODELIRANJA
• Autori: Box i Jenkins, 1976
• Cilj: izbor odgovarajućeg ARIMA modela koji na
zadovoljavajući način opisuje kretanje konkretnog
skupa podataka vremenske serije.
• Polazna osnova: ARIMA model
• Izgradnja ARIMA modela (ARIMA modeliranje)
– ’Modeliranje bez teorije’
– ’Sofisticirana ekstrapolacija’
– Box: ‚‚Svi modeli su pogrešni, samo su neki korisni”
( )( ) ( ) tqqtdpp eL...LLXLL...LL −−−−+=−−−−− 2210221 111
1
2
-
Profesor Zorica Mladenovic
Ekonomski fakultet, Beograd, 2020. 2
BOKS-DŽENKINSOVA
STRATEGIJA MODELIRANJA
• Pristup se sastoji od tri faze:
– identifikacija modela
– ocena parametara modela i
– provera adekvatnosti modela.
• Iterativna procedura
I Faza identifikacije modela
• Potrebno je izabrati užu klasu ARIMA modela za koju
pretpostavljamo da predstavlja potencijalni generator skupa
podataka. Taj izbor zavisi od odgovora na sledeća pitanja:– Da li
je potrebno stabilizovati varijansu vremenske
serije?
– Koliki je stepen integrisanosti serije, odnosno koliko je puta
treba diferencirati da bi se ostvarila njena stacionarna
reprezentacija?
– Koliki je red autoregresione i komponente pokretnih sredina
modela? i
– Da li je potrebno u model uključiti slobodan član?
3
4
-
Profesor Zorica Mladenovic
Ekonomski fakultet, Beograd, 2020. 3
Pitanje Metodološki okvir
1. Da li je potrebno stabilizovati
varijansu vremenske serije?Grafički prikaz date serije
2. Koliki je stepen integrisanosti
serije?(d=?) 1. Test jediničnog korena
2. Obični i parcijalni korelogram
polazne serije
3. Koliki je red autoregresione i
komponente pokretnih sredina
modela? (p=?, q=?)
Obični i parcijalni korelogram
serije (koja je transformisana u
zavisnosti od broja jediničnih
korena)
4. Da li je potrebno u model
uključiti slobodan član za d=1?1. Grafički prikaz date
serije
2. SW test
ModelObična
autokorelaciona funkcija
Parcijalna
autokorelaciona funkcija
AR(p)
Vrednosti opadaju tokom vremena
po eksponencijalnoj/oscilatornoj ili
sinusoidnoj putanji
11≠ 0, 22≠ 0,..., pp=p,kk=0 za k>p.
Vrednosti su različite od nule samo
za docnje koje su manje ili jednake
redu procesa p.
MA(q)
r1≠ 0, r2≠ 0,..., rq≠ 0, rk=0 za k>q.
Vrednosti opadaju tokom vremena i
jednake su nuli za docnje veće od
reda procesa q.
Vrednosti opadaju tokom vremena
po eksponencijalnoj/oscilatornoj ili
sinusoidnoj putanji
ARMA(p,q)
Vrednosti opadaju tokom vremena.
Prvih q koeficijenata je određeno
parametrima AR i MA komponente,
dok se za docnje veće od q
koeficijenti ponašaju kao kod AR
modela.
Vrednosti opadaju tokom vremena.
Prvih p koeficijenata je određeno
parametrima AR i MA
komponente. Za docnje veće od p
koeficijenti slede putanju sličnu
kao kod MA modela.
5
6
-
Profesor Zorica Mladenovic
Ekonomski fakultet, Beograd, 2020. 4
II Faza ocene parametara modela
• Metod običnih najmanjih kvadrata se može
koristiti u oceni parametara AR modela.
• Za ocenu parametara MA i ARMA modela
koristi se metod nelinearnih najmanjih
kvadrata koji se zasniva na upotrebi
metoda numeričke optimizacije.
III Faza provere
adekvatnosti modela
• Da li je model saglasan sa podacima?
– Da li su reziduali normalno raspodeljeni i
neautokorelisani?
• Da li je izbor AR i MA komponente optimalan?
– Da li je model istovremeno ekonomičan i dovoljno
precizan?
7
8
-
Profesor Zorica Mladenovic
Ekonomski fakultet, Beograd, 2020. 5
III-1. Analiza reziduala
• Normalnost (histogram, JB test)
• Autokorelacija
– Da li postoji autokorelacije na određenoj, k-toj,
docnji? (H0: rk=0) i
– Da li postoji autokorelacija na svim docnjama
do K-te? (H0: r1= r2 =...= rK =0).
Da li postoji autokorelacije na
određenoj, k-toj, docnji? (H0: rk=0)
Validnost nulte hipoteze H0: rk=0 protiv
alternativne H1: rk≠0 se testira tako što se
proverava da li ocena autokorelacionog
koeficijenta na docnji k serije reziduala,
pripada intervalu (-2/√T, 2/√T).
9
10
-
Profesor Zorica Mladenovic
Ekonomski fakultet, Beograd, 2020. 6
Da li postoji autokorelacija na svim
docnjama do K-te?
(H0: r1= r2 =...= rK =0).• Validnost nulte hipoteze H0: r1= r2
=...= rK =0 se testira protiv
alternativne da je bar jedan od prvih K autokorelacionih
koeficijenata serije reziduala različit od nule na osnovu
Boks-Pirsove statistike:
• Na uzorcima manjeg obima raspodela BP(K) statistike se ne
aproksimira dovoljno precizno χ2 raspodelom u smislu da se
korišćenjem standardnih kritičnih vrednosti ove raspodele
potcenjuje postojanje autokorelacije.
• Ovaj problem se prevazilazi upotrebom korigovane verzije
Boks-Pirsove statistike, čiji su autori Boks i Ljung:
=
−−−
+==
K
i
qpKi :
iT
ˆ)T(T)K(BLj)K(Q
1
22
2 r
=
−−==
K
1i
2qpK
2ii :ˆT)K(BPK,...,2,1i,T
1,0N:ˆ rr
Šta raditi u slučaju da autokorelacija
postoji u rezidualima?
• To je znak da ARIMA model nije dobro
postavljen, odnosno da odabir objašnjavajućih
promenljivih nije adekvatan.
• Neophodno je redefinisati izbor AR i MA
komponenti u skladu sa evidentiranim tipom
(redom) autokorelacije i potom oceniti novi
model.
11
12
-
Profesor Zorica Mladenovic
Ekonomski fakultet, Beograd, 2020. 7
III-2. Optimalan izbor parametara modela
(Informacioni kriterijum)
Informacioni kriterijum predstavlja zbir dva elementa
1. Element koji je funkcija neobjašnjenog
varijabiliteta modela
2. Element kojim se sankcioniše gubitak u broju
stepeni slobode zbog povećanja broja
parametara za ocenjivanje
g je nenegativna kaznena funkcija
s2 je ocena varijanse slučajne greške modela
T
qpgsln)q,p(IC
++= 2
11
Informacioni kriterijum
• Sabirci u informacionoj funkciji različito
reaguju na povećanje p i q:
• Ocena varijanse sl. greške modela se smanjuje
• Kaznena komponenta se povećava
• Cilj: izbor kombinacije p i q koja minimizira
vrednost informacionog kriterijuma
T
qpgsln)q,p(IC
++= 2
13
14
-
Profesor Zorica Mladenovic
Ekonomski fakultet, Beograd, 2020. 8
Informacioni kriterijum (II)
Funkcija g Kaznena
komponenta
Naziv Oznaka
2 2(p+q)/T Akaikeov AIC
lnT (lnT)(p+q)/T Švarcov SC / SIC
2ln(lnT) 2(ln(lnT))*
(p+q)/T
Hana-Kvinov HQC / HQIC
Dodatni kriterijumi u fazi
provere adekvatnosti modela:
1. Namerno proširenje ARIMA modela
2. Analiza preciznosti u prognoziranju
15
16
-
Profesor Zorica Mladenovic
Ekonomski fakultet, Beograd, 2020. 9
Dodatni kriterijumi u fazi
provere adekvatnosti modela:
1. Dodajemo AR i MA komponente da bismo
proverili da li je model ’otporan’ na proširenje
Modifikacija se realizuje korak po korak
Dodatni kriterijumi u fazi provere adekvatnosti modela:
2. Preciznost u predvidjanju
: prognoze) greske (varijanse apokazatelj sledecih
osnovu na modela razlicitih prognoze preciznost oProveravam
3.
: trenucima u podatka ukupno
za serije vremenske kretanje moPrognozira 2.
podataka sa zakljucno model Ocenjujemo 1.
:vrednosti
T1,...,mm,1,2,..., :trenuci
:T) (ukupno uzorka iz Podaci
gmpodataka g
)g(X̂),...,(X̂:Ocene
X,...,X:vrednostipoznatenevarSt
T,...,,mmg
m
X,...,X,X,...,X
mm
gmm
Tmm
T
1
21
1
11
++
+
=+
++
+
17
18
-
Profesor Zorica Mladenovic
Ekonomski fakultet, Beograd, 2020. 10
Dodatni kriterijumi u fazi provere adekvatnosti modela:
preciznost u predvidjanju II
( )
slicna) relativno modela svojstva ostala
su da kompretpostav (pod ijuspecifikac jusuperiorni sugerisu
vrednosti Manje 4.
( prognoze greska naprocentual apsolutna Srednja 3.3.
( prognoze greska apsolutna Srednja 3.2.
) ( prognoze greske kvadratne srednje Koren 3.1.
: osnovu na prognoze preciznost oProveravam 3.
= += +
+
=
+
=
+
−=−
−
−
g
j jm
m
g
j jm
mjm
g
j
mjm
g
j
mjm
X
)j(X̂
gX
)j(X̂X
g
)errorpercentapsolutemean
)j(X̂Xg
)errorapsolutemean
)j(X̂Xg
rorsquared ermeanroot
11
1
2
1
1100100
1
1
Primer: Modeliranje godišnje stope rasta BDP
privrede Srbije (2002:1-2014:3)
51 kvartalni podatak
19
20
-
Profesor Zorica Mladenovic
Ekonomski fakultet, Beograd, 2020. 11
Identifikacija
Testiranje prisustva jediničnog korena u
godišnjoj stopi rasta BDP privrede Srbije
• ADF test
H0: Xt ~I(1), H1: Xt ~I(0)
ADF(3)=-4.76, tk=-3.51
-4.76
-
Profesor Zorica Mladenovic
Ekonomski fakultet, Beograd, 2020. 12
23
Identifikacija
Analiza korelacione strukture godišnje stope rasta
BDP (2002:1-2014:3), T=51 II
Docnja Ocena parcijalnog Značajna korelacija
(k) autokorel.koeficijenta
• 1 0.702 DA
• 2 0.108 NE
• 3 0.090 NE
• 4 -0.333 DA
• 5 0.285 DA
• 6 0.101 NE
• 7 0.094 NE
• 8 -0.051 NE
• Interval poverenja sa verovatnoćom 0.95: [-0.274;0.274]
Identifikacija
Predlog modela
• I ARIMA(5,0,0)
• II ARIMA(0,0,3)
23
24
-
Profesor Zorica Mladenovic
Ekonomski fakultet, Beograd, 2020. 13
Finalni model I:
Redukovani ARIMA(5,0,0)
Dependent Variable: X
Method: Least Squares
Sample (adjusted): 2003Q2 2014Q3
Included observations: 46 after adjustments
Convergence achieved after 3 iterations
Variable Coefficient Std. Error t-Statistic Prob.
C 0.018387 0.022495 0.817378 0.4186
AR(1) 0.847032 0.150558 5.625936 0.0000
AR(2) -0.047405 0.167969 -0.282223 0.7792
AR(3) 0.341610 0.153667 2.223055 0.0319
AR(4) -0.679710 0.164617 -4.129042 0.0002
AR(5) 0.365372 0.148513 2.460207 0.0183
R-squared 0.670041 Mean dependent var 0.027663
Adjusted R-squared 0.628797 S.D. dependent var 0.039148
S.E. of regression 0.023851 Akaike info criterion -4.512856
Sum squared resid 0.022755 Schwarz criterion -4.274337
Log likelihood 109.7957 Hannan-Quinn criter. -4.423505
F-statistic 16.24547 Durbin-Watson stat 2.105793
Prob(F-statistic) 0.000000
Inverted AR Roots .86 .56-.47i .56+.47i -.57+.69i
-.57-.69i
Dependent Variable: X
Method: Least Squares
Sample (adjusted): 2003Q2 2014Q3
Included observations: 46 after adjustments
Convergence achieved after 3 iterations
Variable Coefficient Std. Error t-Statistic Prob.
AR(1) 0.842077 0.115149 7.312919 0.0000
AR(3) 0.334425 0.141592 2.361901 0.0229
AR(4) -0.671169 0.159299 -4.213257 0.0001
AR(5) 0.374197 0.129251 2.895115 0.0060
R-squared 0.666190 Mean dependent var 0.027663
Adjusted R-squared 0.642346 S.D. dependent var 0.039148
S.E. of regression 0.023412 Akaike info criterion -4.588206
Sum squared resid 0.023021 Schwarz criterion -4.429194
Log likelihood 109.5287 Hannan-Quinn criter. -4.528639
Durbin-Watson stat 2.076152
Inverted AR Roots .90 .55-.46i .55+.46i -.58+.69i
-.58-.69i
Finalni model I:
Redukovani ARIMA(5,0,0)
Inverse Roots of AR/MA Polynomial(s)
Specification: X AR(1) AR(3) AR(4) AR(5)
Sample: 2001Q1 2014Q3
Included observations: 46
AR Root(s) Modulus Cycle
0.903349 0.903349
-0.577638 ± 0.685834i 0.896679 2.766985
0.547002 ± 0.464739i 0.717770 8.921584
No root lies outside the unit circle.
ARMA model is stationary.
25
26
-
Profesor Zorica Mladenovic
Ekonomski fakultet, Beograd, 2020. 14
Finalni model II:
ARIMA(0,0,3)
Dependent Variable: X
Method: Least Squares
Included observations: 51 after adjustments
Convergence achieved after 13 iterations
MA Backcast: OFF
Variable Coefficient Std. Error t-Statistic Prob.
C 0.033696 0.009772 3.448283 0.0012
MA(1) 0.816207 0.110067 7.415537 0.0000
MA(2) 0.650897 0.130614 4.983350 0.0000
MA(3) 0.671089 0.110972 6.047377 0.0000
R-squared 0.638205 Mean dependent var 0.031539
Adjusted R-squared 0.615111 S.D. dependent var 0.039339
S.E. of regression 0.024406 Akaike info criterion -4.512828
Sum squared resid 0.027995 Schwarz criterion -4.361312
Log likelihood 119.0771 Hannan-Quinn criter. -4.454929
F-statistic 27.63591 Durbin-Watson stat 1.935316
Prob(F-statistic) 0.000000
Inverted MA Roots .05-.86i .05+.86i -.91
Inverse Roots of AR/MA Polynomial(s)
Specification: X MA(1) MA(2) MA(3) C
Sample: 2001Q1 2014Q3
Included observations: 51
MA Root(s) Modulus Cycle
-0.910668 0.910668
0.047231 ± 0.857140i 0.858440 4.145267
No root lies outside the unit circle.
ARMA model is invertible.
Zapis modela
).(.JB),.(.)(Q,.s,.SC
).( ) . ().().(t-odn.
ê.ê.ê.ê.X
).(.JB),.(.)(Q,.s,.SC
).( ) .(). ().(t-odn.
êX.X.X.X.X
ttttt
tttttt
68076045005580244036134
056984427453
670650820030
91018051028380234042924
902214362317
370670330840
321
5431
===−=
++++=
===−=
−
++−+=
−−−
−−−−
3)ARIMA(0,0,
,0) ARIMA(5,0Redukovani
27
28
-
Profesor Zorica Mladenovic
Ekonomski fakultet, Beograd, 2020. 15
Analiza preciznosti u predvidjanju
- Ocenjeni su modeli zaključno sa 2014:1- Prognozirane su
vrednosti za 2014:2-2014:3
- Analizirana je varijansa greške prognoze
ModelKoren srednje
kvadratne greške
prognoze
Srednja apsolutna
greška prognoze
Srednja
apsolutna
procentualna
greška prognoze
Redukovani ARIMA(5,0,0) 0.0219 0.0172 106.18
ARIMA(0,0,3) 0.0235 0.0194 105.92
29