Laiko eilučių modeliai Laiko eilutės išskaidymas, glodinimas ir filtravimas 2013-09-11
Feb 24, 2016
Laiko eilučių modeliaiLaiko eilutės išskaidymas, glodinimas ir
filtravimas 2013-09-11
Turinys
1. Laiko eilutės samprata2. Laiko eilutės klasikinis išskaidymas 3. Laiko eilutės eksponentinis glodinimas4. Laiko eilutės filtrai5. Prognozių tikslumo matai
1.Laiko eilutės samprata
• Laiko eilutė (laiko seka) – periodiškų reiškinio stebėjimų visuma, kurių duomenys tai tam tikrais laiko momentais fiksuoti stebėjimų dydžiai, arba
per periodą stebimų dydžių suma. • Laiko eilutės gali būti suformuotos iš įvairaus dažnumo, tačiau vienodo periodiškumo duomenų:
valandinių, kasdienių, savaitinių, mėnesinių, metinių ir pan.
Laiko eilutės samprata
Laiko eilučių tipai:• Momentinės• Intervalinės
Laiko eilučių duomenų tipai:
• Absoliutūs (Yt)• Absoliutūs pokyčiai/prieaugiai (ΔYt= Yt- Yt-1)• Augimo tempas (T= Yt./ Yt-1)• Pokyčių tempas (Tpokyčių= ΔYt/Yt-1 ~ ln(Yt)
3.Laiko eilutės išskaidymas slenkančių vidurkiu metodu
Laiko eilutės (Yt ) komponentai:– trendas (T)– cikliniai svyravimai (C) – sezoniniai svyravimai (S), – atsitiktiniai svyravimai (A).
Yt= f(Tt; Ct; St; At)
Laiko eilutės išskaidymas
Du laiko eilutės išskaidymo būdai:– Sumos :– Sandaugos
Yt= Tt + Ct + St+ At
Yt= Tt ٠ Ct ٠ St ٠ At
Laiko eilutės išskaidymasIšskaidymo būdo pasirinkimas
Yt= Tt + Ct + St+ At
Yt= Tt ٠ Ct ٠ St ٠ At
02000400060008000
10000120001400016000
0
5000
10000
15000
20000
25000
1995.I
1995.III
1996.I
1996.III
1997.I
1997.III
1998.I
1998.III
1999.I
1999.III
Laiko eilutės išskaidymas Slenkančių vidurkių metodu
Slenkančių vidurkių rūšys– Paprastas– Svertinis – Centruotas
Slenkančių vidurkių rūšysPaprastas
• Suteikia vienodą svorį visiems slenkantį vidurkį sudarantiems n stebėjimams
MAt= 1/n yt-n+i =1/n (yt+yt-1 +…+yt-n+1)
Slenkančių vidurkių rūšysSvertinis
• Stebėjimų svoriai yra skirtingi. Svorių priskyrimo schemos gali būti įvairios. Pavyzdyje pateikiamas variantas, kai vėlesniam stebėjimui priskiriamas vis mažesnis svoris.
WMAt= (i*yt-n+i)/i = [nyt+(n-1)yt-1+…+1yt-n+1]/ [n+(n-1)+…+1]
Slenkančių vidurkių rūšysCentruotas
• CMAt= 1/n yi = 1/n [yt+(n-1)/2 + yt+(n-1)/2-1+…+ yt-(n-1)/2 ]
• Išlyginimas realizuojamas pakeičiant pirminės laiko eilutės reikšmes vidurkiu, suformuotu iš vienodo skaičiaus prieš stebėjimą ir po stebėjimo esančių stebėjimų. – Šio slenkančio vidurkio trūkumas - vėliausiems periodams
slenkantys vidurkiai nėra apskaičiuojami. – Slenkančio vidurkio dėmenų skaičius (n) turi būti nelyginis.
Laiko eilutės išskaidymasSezoniškumo indeksų nustatymas slenkančių
vidurkių metodu1. Slenkančių vidurkių metodu išlyginami
pirminiai stebėjimai (Yt). Išlygintoje eilutėje:
• (Tt ٠Ct) arba (Tt+Ct) lieka• (St ٠ At) arba (St + At) eliminuojama• Slenkantį vidurkį reikia papildomai centruoti, kai
slenkančio vidurkio dėmenų skaičius yra lyginis t.y. iš slenkančio vidurkio reikšmių apskaičiuoti dviejų dėmenų (n=2) slenkančius vidurkius,
DU_priv pradiniai duomenys ir išlyginta eilutė slenk. vidurkiais
600
800
1,000
1,200
1,400
1,600
1,800
00 01 02 03 04 05 06 07 08 09 10 11 12 13
DU_PRIVSL_CENT_VID_PRIV_DUSL_VID_DU_PRIV
Laiko eilutės išskaidymas Sezoniškumo indeksų nustatymas
2. Sezoniškumo komponentės išskyrimas• Iš faktinių Yt reikšmių eliminuojant trendo
ir ciklinių svyravimų bendrą komponentą, nustatomas bendras sezoniškumo ir atsitiktinumo komponentų dydis: – St+At = Yt - ( Tt + Ct.)– St٠At = Yt / Tt ٠ Ct
Laiko eilutės išskaidymas Sezoniškumo indeksų nustatymas
3. Sezoniškumo komponentę išskiriame apskaičiuodami
atitinkamų periodų (visų laiko eilutės atitinkamų
ketvirčių, pvz., I ketvirčio) (St+At) arba (St ٠ At)
reikšmių virdurkį.
• Apskaičiuotas vidurkis yra atitinkamo periodo
sezoniškumo indeksas - St
Darbo užmokesčio sezoniškumo indeksai
600
800
1,000
1,200
1,400
1,600
1,800
Q1 Q2 Q3 Q4
Means by Season
DU_PRIV by SeasonDate: 09/10/13 Time: 10:09Sample: 2000Q1 2013Q2Included observations: 54Difference from Moving AverageOriginal Series: DU_PRIVAdjusted Series: DU_PRIVSA
Scaling Factors:
1 -15.74700 2 -5.236579 3 10.21294 4 10.77063
Date: 09/10/13 Time: 10:11Sample: 2000Q1 2013Q2Included observations: 54Ratio to Moving AverageOriginal Series: DU_PRIVAdjusted Series: DU_PRIVSA
Scaling Factors:
1 0.985407 2 0.996610 3 1.009240 4 1.008939
Užimtumo sezoniškumo indeksai
400,000
450,000
500,000
550,000
600,000
650,000
700,000
Q1 Q2 Q3 Q4
Means by Season
UZ_PRIV by Season
Date: 09/10/13 Time: 11:45Sample: 2000Q1 2013Q2Included observations: 54Ratio to Moving AverageOriginal Series: UZ_PRIVAdjusted Series: UZ_PRIVSA
Scaling Factors:
1 0.992218 2 1.008364 3 1.013349 4 0.986318
Date: 09/10/13 Time: 11:46Sample: 2000Q1 2013Q2Included observations: 54Difference from Moving AverageOriginal Series: UZ_PRIVAdjusted Series: UZ_PRIVSA
Scaling Factors:
1 -3904.499 2 4613.033 3 7037.733 4 -7746.267
Laiko eilutės išskaidymasDuomenų desezonizavimas
3. Nustačius sezoniškumo komponentę, iš laiko eilučių pirminių duomenų eliminuojama jo įtaka:
• Tt+Ct+At = Yt – St
• Tt٠ Ct٠ At = Yt / St
Laiko eilutės išskaidymasTrendo nustatymas
4. Eliminavus sezoniškumą, galima nustatyti esminę laiko eilutės kitimo tendenciją-trendą
• Trendas dažniausiai nustatomas MKM
Laiko eilutės išskaidymasTrendo nustatymas
Dažniausiai naudojamos trendo funkcijos
PavadinimasPirminė išraiška Į tiesinę formą
transformuota išraiška
Tiesinė Yt=a+bt
Eksponentinė Yt=a*ebt lnYt=lna+b*t
Hiperbolinė Yt=a+b/t Yt=a+bT, kur T=1/t
Logaritminė Yt=a+b*lnt Yt=a+bT, kur T=lnt
Rodiklinė Yt=a*tb lnYt=lna+b*lnt
Cikliniai svyravimai
5. Cikliniai svyravimai nustatomi eliminavus trendo komponentę iš išlygintos eilutės
• Ct = (Tt+Ct )- Tt • Ct = Tt٠ Ct / Tt
Išskaidyta du_priv laiko eilutė
-400
0
400
800
1,200
1,600
2,000
00 01 02 03 04 05 06 07 08 09 10 11 12 13
CIKLAS_DU_PRIV SL_VID_CENT_DU_PRIVSL_VID_DU_PRIV TREND_DU_PRIVDU_PRIVSA
Laiko eilutės išskaidymo privalumai ir ribotumai:
• Privalumai:– Suprasti laiko eilutės sandarą ir kitimo aspektus– Naudinga preliminari priemonė prognozavimo
metodams parinkti • Ribotumai:
– Retai kada naudojama prognozavimui dėl ciklo ir atsitiktiniės komponenčių neprognozuojamumo
4. Laiko eilutės eksponentinis glodinimas (EG)
• Tai dar vienas būdas analizuoti ir prognozuoti laiko eilutes
• EG būdai:– Paprastas– Dvigubas– Trigubas
Eksponentinis glodinimasPaprastas
• S1= Y1
• S2= α Y2+(1- α) S1
• Bendru atveju • St= α Yt+(1- α) St-1,
• St= α[Yt+(1- α)Yt-1+(1- α)2Yt-2+…]+ (1- α)
t-1Y1
Eksponentinis glodinimasPaprastas
• Faktoriaus α ypatumai– 0 <α <1 – Labai stipri atsitiktinių svyravimų įtaka: – Yt - labai inertiškas procesas t.y.stipriai priklauso
nuo Yt-1 – .
α 0
α 1
Faktoriaus α nustatymo būdai:
– analitiko nuožiūra parenkamas α išlyginimo faktorius
– MKM nustatomas α toks, kuris minimizuoja paklaidų kvadratų sumą.
Eksponentinis glodinimasDvigubas (Holt’o tiesinis)
• Jeigu laiko eilutė turi trendą, taikomas dvigubas eksponentinio išlyginimo metodas.
Eksponentinis glodinimasDvigubas (Holt’o tiesinis)
• St= αYt+(1- α)(St-1+bt-1) Suglodinta stebėjimo reikšmė
• bt=β(St-St-1)+(1- β)bt-1 Suglodinta trendo reikšmė
• Ft+m=St+btm Prognozės reikšmė
• α ir β glodinimo koeficientai • St – suglodinta t stebėjimo reikšmė • bt –trendo suglodinta t reikšmė
• Ft+m prognozės reikšmės m- periodų į priekį
Eksponentinis glodinimasDvigubas (Holt’o tiesinis)
• b0 glodinimo koeficiento nustatymo būdai:– b0 prilyginti 0 (tinka, kai eilutė yra ilga)– MKM apskaičiuoti pirmų penkių laiko eilutės
narių trendo lygtį Yt =a+bt ir b0 =b
Eksponentinis glodinimasTrigubas (Holt’o Winterio) glodinimas
• Trigubas arba Holt‘o Winterio sezoninis glodinimas taikomas tuomet, kai laiko eilutei būdingas trendas ir sezoniniai svyravimai.
• Sezoniškumas gali būti adityvus arba multiplikatyvus
Eksponentinis glodinimasTrigubas (Holt’o Winterio) glodinimas
))(1( 11
ttLt
tt bS
cYS
11 )1()( tttt bSSb
Ltt
tt c
SYc )1(
Lmtttmt cmbSF )(
• α ir β ir γ glodinimo koeficientai
• St – suglodinta t stebėjimo reikšmė
• bt –trendo suglodinta t reikšmė
• ct –sezoniškumo įtakos faktorius
• Ft+m prognozės reikšmės m- periodų į priekį
• L-periodų skaičius metuose (pvz. ketvirtiniuose duom. L=4,
mėnesiniams L=12)
Eksponentinis glodinimastrigubas (Holt’o Winterio sezoninis)
• b0 ir c 1-L glodinimo koeficiento nustatymo būdai:– β0 prilyginti 0, o sezoniškumo indeksus c1-L =1
– MKM apskaičiuoti pirmų penkių laiko eilutės narių trendo lygtį Yt =a+bt ir β0 =b
Eksponentinis glodinimas DU
600
800
1,000
1,200
1,400
1,600
1,800
2,000
00 01 02 03 04 05 06 07 08 09 10 11 12 13 14
DU_PRISM_DVIGUB DU_PRIVDU_PRISM_PAPRAS DU_PRISM_TRGUB
Eksponentinis glodinimas DU
Date: 09/10/13 Time: 13:37Sample: 2000Q1 2013Q2Included observations: 54Method: Single ExponentialOriginal Series: DU_PRIVForecast Series: DU_PRISM_PAPRAS
Parameters: Alpha 0.9990Sum of Squared Residuals 121369.7Root Mean Squared Error 47.40873
End of Period Levels: Mean 1698.986
1698.9861698.9861698.9861698.9861698.9861698.986
Date: 09/10/13 Time: 13:43Sample: 2000Q1 2013Q2Included observations: 54Method: Holt-Winters No SeasonalOriginal Series: DU_PRIVForecast Series: DU_PRISM_DVIGUB
Parameters: Alpha 1.0000Beta 0.4100
Sum of Squared Residuals 70805.95Root Mean Squared Error 36.21079
End of Period Levels: Mean 1699.000Trend 17.75019
1734.500383...1752.250574...1770.000766...1787.750957...1805.501149...
Date: 09/10/13 Time: 13:49Sample: 2000Q1 2013Q2Included observations: 54Method: Holt-Winters Additive SeasonalOriginal Series: DU_PRIVForecast Series: DU_PRISM_TRGUB
Parameters: Alpha 1.0000Beta 0.5200Gamma 0.0000
Sum of Squared Residuals 52964.31Root Mean Squared Error 31.31805
End of Period Levels: Mean 1703.227Trend 17.56155Seasonals... 2012Q3 9.496394
2012Q4 9.9122602013Q1 -15.181492013Q2 -4.227163
1730.285110...1748.262528...1740.730331...1769.246211...1800.531321...1818.508740...
Paprastas EGDvigubas EG
Trigubas EG
Prognozė Prognozė
Prognozė
Eksponentinis glodinimas UŽ
400,000
440,000
480,000
520,000
560,000
600,000
640,000
680,000
720,000
00 01 02 03 04 05 06 07 08 09 10 11 12 13 14
UZ_PRIV UZ_PRISM_TRIGUBUZ_PRISM_PAPRAS UZ_PRISM_DVIGUB
Eksponentinis glodinimas UŽ
Date: 09/10/13 Time: 14:00Sample: 2000Q1 2013Q2Included observations: 54Method: Single ExponentialOriginal Series: UZ_PRIVForecast Series: UZ_PRISM_PAPRAS
Parameters: Alpha 0.9990Sum of Squared Residuals 2.45E+10Root Mean Squared Error 21278.62
End of Period Levels: Mean 625244.0
625244.0286...625244.0286...625244.0286...625244.0286...625244.0286...625244.0286...
Date: 09/10/13 Time: 14:03Sample: 2000Q1 2013Q2Included observations: 54Method: Holt-Winters No SeasonalOriginal Series: UZ_PRIVForecast Series: UZ_PRISM_DVIGUB
Parameters: Alpha 1.0000Beta 0.4400
Sum of Squared Residuals 1.33E+10Root Mean Squared Error 15669.90
End of Period Levels: Mean 625265.0Trend 10134.56
2013Q3 635399.62013Q4 645534.12014Q1 655668.72014Q2 665803.32014Q3 675937.82014Q4 686072.4
Date: 09/10/13 Time: 14:05Sample: 2000Q1 2013Q2Included observations: 54Method: Holt-Winters Additive SeasonalOriginal Series: UZ_PRIVForecast Series: UZ_PRISM_TRIGUB
Parameters: Alpha 1.0000Beta 0.7600Gamma 0.0000
Sum of Squared Residuals 6.05E+09Root Mean Squared Error 10588.40
End of Period Levels: Mean 620586.4Trend 9200.707Seasonals... 2012Q3 6994.545
2012Q4 -7777.2492013Q1 -3895.9432013Q2 4678.647
2013Q3 636781.62013Q4 631210.52014Q1 644292.52014Q2 662067.82014Q3 673584.42014Q4 668013.3
Paprastas EG
Tribubas EG
PrognozėPrognozė
Prognozė
Eksponentinis išlyginimasApibendrinimas
• Kada kokį metodą taikyti Sezoniškumas
Trendas
Nėra sezoniškumo Adityvus sezoniškumas
Multiplikatyvus sezoniškumas
Nėra trendo Paprastas EG HW aditive HWmultiplikative
Tiesinis trendas Dvigubas išlyginimas
HW aditive HWmultiplikative
Netiesinis trendas HW no seasons HW aditive HWmultiplikative
Eksponentinis išlyginimasApibendrinimas
• Kada kokį metodą taikyti Sezoniškumas
Trendas
Nėra sezoniškumo Adityvus sezoniškumas
Multiplikatyvus sezoniškumas
Nėra trendo
Tiesinis (Adityvus) trendas
Multiplikatyvus trendas
5 Laiko eilučių filtrai
• Filtrų tipai:– Hodrick- Prescott filtras– Dažnių filtras (magisratūroje)
Hodrick-Prescott filtras• Pagrindinė idėja:
– laiko eilutė išskaidoma į trendo ir ciklo komponentes
Laiko seka Trendas Ciklas
Hodrick-Prescot filtras
• Filtro nustatymo procedūra– Nustatomas ilgalaikis trendas τ– Randama ciklo kreivė ζ, atimant trendo
reikšmes τ iš laiko eilutės Y duomenų
Hodrick-Prescott filtras
• Trendo nustatymo metodas
Minimizuojami trendo nuokrypiai =
maksimizuojamas trendo atitikimas
duom. sekai Y
Minimizuojami trendo
šuoliai =
maksimizuojamas trendo
tolygumas
Hodrick-Prescott filtras
λ - filtro suglodinimo (išlyginimo parametras)
– kuo λ didesnis tuo labiau suglodinama trendo kreivė.
– kai λ• Hodrick-Prescot siūlomos λ reikšmės
100 - metiniai duomenys
λ= 1600 ketvirtiniai duomenys 14400 m4nesiniai duomenys
Hodrick-Prescott filtras Trendo nustatymo formulė τ = I –vienetinė TxT matavimų matrica K tai stačiakampė (T-2)xT matavimų matrica, kurios elementai [yra lygūs: 1 , i=j arba i=j+2 -2 , kai i=j+1 0 ,kitais atvejais
Hodrick-Prescott filtras 1 -2 1 0 0 0 …0 0 0 0 1 -2 1 0 0… 0 0 0 K= … …. … 0 0 0 0 0 1 -2 1
Hodrick-Prescott filtras Pvz. 1 -2 1 0 0 K= 0 1 -2 1 0 0 0 1 -2 1 1+λ -2λ λ 0 0 I+λK’K= -2λ λ 0 -λ 0 - λ 0 1+6λ 0 - λ 0 - λ 0 1+5λ 1 0 0 - λ 2λ 1+ λ
Hodrick-Prescott filtras Pvz. 1+λ -2λ λ 0 0 -1 -2λ 1+5λ -4λ λ 0 = - λ 0 1+6λ 0 - λ 0 -λ -4λ 1+5λ 1 0 0 - λ 2λ 1+ λ
Hodrick-Prescott filtras Pvz
• Įžvalgos– Hodrick Prescott filtras , nepriklauso nuo laiko
eilutės reikšmių, o priklauso nuo stebėjimų skaičiaus T ir λ
Du_priv Hodrick Prescott filtras
-200
-100
0
100
200
300
600
800
1,000
1,200
1,400
1,600
1,800
00 01 02 03 04 05 06 07 08 09 10 11 12 13 14
DU_PRIV Trend Cycle
Hodrick-Prescott Filter (lambda=1600)
Uz_priv Hodrick Prescott filtras
-120,000
-80,000
-40,000
0
40,000
80,000
300,000
400,000
500,000
600,000
700,000
00 01 02 03 04 05 06 07 08 09 10 11 12 13 14
UZ_PRIV Trend Cycle
Hodrick-Prescott Filter (lambda=1600)
5 Laiko eilučių prognozės tikslumas
• Prognozių tikslumas– Teisingo metodo parinkimas– Duomenų pakankamumas– Prognozės horizonto parinkimas– Prognozuojamo proceso pastovumas
5. Prognozių tikslumo matai
• RSS– prognozės paklaidų kvadratų suma: • MSE – vidutinė kvadratinė paklaida:
• RMSE – šaknis iš vidutinės kvadratinės paklaidos:
•
kTYY
MSE tp
t
2)(
t- stebėjimų, k – modelio parametrų skaičius.
kTYY
RMSE tp
t
2)(
5. Prognozių tikslumo matai
• MAE – vidutinė absoliutinė paklaida
• MAPEvidutinė absoliuti procentinė paklaida• :
kT
YYMAE t
pt
1001
t
tp
t
Y
YY
TMAPE
5. Prognozių tikslumo matai
• AIC – Akaike’s informacijos kriterijus:• BIC (SBC) – Schwarz kriterijus• Determinacijos koeficientas• Maksimalaus tikėtinumo kriterijus
5. Prognozių tikslumo matai
• Maksimalaus tikėtinumo kriterijus(Log likelihood)
l=
5. Prognozių tikslumo matai
• AIC – Akaike’s informacijos kriterijus: )• (SC) – Schwarz kriterijus SC