Exponenciális Exponenciális szűrések szűrések Statisztika II. Statisztika II. VEGTGAM22S VEGTGAM22S
Jan 11, 2016
Exponenciális Exponenciális szűrésekszűrések
Exponenciális Exponenciális szűrésekszűrésekStatisztika II.Statisztika II.VEGTGAM22SVEGTGAM22S
Simító eljárások (exponenciális szűrés)
A simító eljárások a determinisztikus modellezésnél már jobban figyelembe veszik az idősor véletlen jellegét, belső összefüggéseit is.
Ugyanakkor a „valódi” sztochasztikus modellezésnél egyszerűbb, áttekinthetőbb modelleket állítanak fel. A véletlen hatását simítással (kiátlagolással) igyekeznek kisebbíteni, ezáltal a determinisztikus jelleget emelik ki.
Egyfajta „közbenső” pontosságú és komplexitású modell-családot alkotnak.
Ez a modell-család onnan kapta a nevét, hogy az idősor t-edik elemét a múltbeli elemek exponenciálisan csökkenő súlyokkal vett lineáris kombinációjával becsüli.
Az exponenciális szűrési eljárás keretében több különböző paraméter kombináció beállítása mellett kiszámoljuk a
EXPONENCIÁLIS SZŰRÉS
négyzetes eltérést, és azt a paraméter kombinációt választjuk ki,amely mellett ez az eltérés a legkisebb.
A képletben jelöli a modell becslését a t-edik időpillanatban.
Ez a paraméter azt azt jelzi, hogy a t időpillanathoz tartozómegfigyelés milyen mélységig függ az előző időpontbeli megfigyelésektől, azaz az idősor „emlékezetével” kapcsolatos. Ha = 1, akkor a legutolsó elem korrelálatlan az előző megfigyelésekkel, azaz az idősor emlékezetnélküli. Az = 0 esetén viszont az összes megelőző megfigyelés azonos erősséggel korrelál Xt-vel.
Akkor szerepel ez a paraméter, ha trenddel számolunk a modellben. Ha közel van 1-hez, a trendfüggvényben az Xt-közeli értékek
nagyobb súllyal lesznek figyelembe véve, 0-közeli érték esetén pedig mindegyik érték közel azonos súllyal szerepel a trendfüggvény kiszámításában.
Simító eljárások (exponenciális szűrés)
Simító eljárások (exponenciális szűrés)
Szezonalitási paraméter. 1 esetén a szezonalitást
leíró függvény előállításában az Xt-közeli értékek
nagyobb súllyal lesznek figyelembe véve, 0 érték esetén pedig mindegyik érték közel azonos súllyal szerepel a szezonalitási függvénykiszámításában.
A paraméter helyett használatos, amikor a trendfüggvény idővel lecseng. Ha 1 a trend lecsengése gyors,
0 esetén pedig lassú.
Az exponenciális szűrés lépései
• Először felállítjuk a dekompozíciós modellt:
.ttttt CITX
• Ezután beállítjuk a modell-komponensek t=0 időponthoz tartozó becsléseit:
0000 CITX
Innen adódik a nulladik hibatag, amivel majd a következő lépésben fogunk korrigálni:
000 XXe
• A korrekciót valamennyi modell-komponensre elvégezzük:
001 ,,, efTT T 001 ,,, efII I
001 ,,, efCC C
1111 CITX
111 XXe
Az exponenciális szűrés lépései
• A második hibatag a következő lépésben játszik majd szerepet a
t=2 időpontbeli becslések korrigálásakor stb. A képletben szereplő
CIT fff ,, korrekciós súlyfüggvények ,,, paraméterei a
legkisebb négyzetek módszerével úgy lesznek meghatározva, hogy a
2
0
N
ttt XXQ
négyzetes eltérés a lehető legkisebb legyen!
Példa exponenciális szűrésre
Az egyszeres simítás a legegyszerűbb modellekben az alábbi rekurzív
összefüggésekkel adható meg. A leírásban .10
00 XX
(pl.
N
ttt XX
NX
0
20 )(
1 ) 000 XXe
00000001 1 XXXXXeXX
11111112 1 XXXXXeXX
02
01 11 XXX
Példa exponenciális szűrésreFolytatva az eljárást, mindegyik időpontra adunk becslést:
11 1 ttt XXX
NtXX
XXXtt
ttt
,...,2,1,11
11
001
32
21
A fenti utolsó összefüggést tömörebben is felírhatjuk:
.11 01
1 XXX tit
t
i
it
Ha most egy pillanatra feltesszük, hogy az idősornak negatív irányban
végtelen a hosszúsága, akkor a fenti összefüggés az alábbi alakot veszi fel:
11
11i
itiiti
it XwXX 11 i
iw
1
1i
iw
, ahol
Megmutatható, hogy:
Az idősor t-edik eleme tehát a múltbeli elemek exponenciálisan csökkenő súlyokkal vett lineáris kombinációjával van megbecsülve! (Innen származik a módszer neve is.)
A következőkben ismertetjük az SPSS-ben az exponenciális szűrés (Exponential Smoothing: Custom Model) paranccsal megvalósítható illesztéseket. A leírásban megadjuk az illesztett modellt és a simítási eljárás rekurzív összefüggéseit is.
Nincs trend, nincs szezonális hatás (Trend Component: None, Seasonal Component: None)
Modell: teb
tX
Becslés:
N
tt
XN
XX1
10
~
0~
11,
10~
1~
XXeeXX
1~
22,
21~
2~
XXeeXX
1~
,1
~~
tX
tX
te
te
tX
tX
Nincs trend, additív szezonális hatás van (Trend Component: None, Seasonal Component: Additive)
Modell: t
et
Ibt
X
0,
1,...,
2,
1II
pI
pI adott szezonális ismétlődések,
ip
pij pj
X
im
1 p hosszú szakasz átlagok, i=1,…, k,
p
Nk
Becslés:
Nincs trend, additív szezonális hatás van (Trend Component: None, Seasonal Component: Additive)
0~
11,
100~
,10
XXep
ISXk
k
ii
m
S
,1
~22
,111
~,
11
21,
101XXeISXe
pIIeSS
,2
~33
,222
~,
21
32,
212XXeISXe
pIIeSS
t
Xt
Xt
et
It
St
Xt
ept
It
It
et
St
S~
11,
~,1
1,
1
Nincs trend, multiplikatív szezonális hatás van(Trend Component: None, Seasonal Component: Multiplicative)
Modell: te
tIb
tX
0,
1,...,
2,
1II
pI
pI adott szezonális ismétlődések,
ip
pij pj
X
im
1 p hosszú szakasz átlagok, i=1,…, k,
p
Nk
Nincs trend, multiplikatív szezonális hatás van(Trend Component: None, Seasonal Component: Multiplicative)
0~
11,
100~
,10
XXep
ISXk
k
ii
m
S
1
~22
,211
~,
1
1111
,1
101
XXep
ISXS
e
pII
pI
eSS
t
Xt
Xt
ept
It
St
Xt
St
e
ptI
tI
ptI
te
tS
tS
~11
,1
~,1,
1
Becslés:
Lineáris trend, nincs szezonális hatás(Trend Component: Linear, Seasonal Component: None)
Modell: tetbb
tX
10
Becslések:
0~
11,
000~
,02
110
,1
00
XXeTSXTXSn
Xn
XT
1~
22,
111~
,101
,1001
XXeTSXeSTeTSS
Lineáris trend, additív szezonális hatás(Trend Component: Linear, Seasonal Component: Additive)
Modell: te
tItbb
tX
10
Becslések:
0~
11,
1000~
,0210
,)1(
00
XXep
ITSXTp
XSpk
mk
mT
1
~22
,2111
~,
11
11,
101,
1001XXe
pITSXe
pIIeTTeTSS
Stb.
Exponenciális trend, additív szezonális hatás(Trend Component: Exponential, Seasonal Component: Additive)
Modell: t
et
Itbbt
X 10
Becslés:
0
~11
,1000
~,
0ln
22
1lnexp
0,
11
ln2
lnexp
0XXe
pITSXT
pmS
k
mmT
1
~22
,2111
~,
11
11,
0
101
,1001
XXep
ITSXep
IIS
eTTeTSS
Stb.
Idővel gyengülő trend, nincs szezonális hatás(Trend Component: Damped, Seasonal Component: None)
Modell: tetbb
tX
10
Becslés:
0~
11,
000~
,02
110
,)1(
10
XXeTSXTXST
XT
XT
1~
22,
111~
,101
,1001
XXeTSXeTTeTSS
Stb.
Idővel gyengülő trend, additív szezonális hatás(Trend Component: Damped, Seasonal Component: Additive)
Modell: te
tItbb
tX
10
Becslés:
0~
11,
1000~
,0210
,)1(
10
XXep
ITSXTp
mSpk
Xk
XT
1~
22,
2111~
,1
2111
,1
101
,1
2001
XXep
ITSXep
II
eTTeTSS
Nyomtatók napi energia-felvételét tartalmazó idősor elemzése
A Trends chapter 4.sav állományban egy cég számítógépes nyomtatóinak napi energia-felvételei vannak rögzítve:
Nyomtatók napi energia-felvételét tartalmazó idősor elemzése
Az ábra megszemléléséből az alábbi következtetések vonhatók le: A soron nem érzékelhető trendhatás, az értékek véletlenszerűen szóródnak az átlagérték körül. Nem lehet kizárni a szezonális hatást, hiszen napi adatokról van szó. Elképzelhető, hogy 7, 30 vagy 365 hosszúságú ciklusok vannak a sorban, azaz számolni lehet heti, havi vagy esetleg éves ciklussal. Az idősornak van emlékezete olyan értelemben, hogy mindegyik érték közel van az őt közvetlenül megelőző értékekhez. Ezt a jelenséget a matematikában úgy lehet kifejezni, hogy pozitív autókorrelációt várunk.
Nyomtatók napi energia-felvételét tartalmazó idősor elemzése
Hajtsunk végre exponenciális szűrést (simítást) a
Analyze / Forecasting / Create Models
Paranccsal!
Először próbálkozzunk a Simple beállítással, amikor is sem trendet, sem szezonális hatást nem tételezünk fel.
Dependent variable: amount, Method: Exponential Smoothing, Criteria: Model Type Nonseasonal: Simple.
A Statistics és Plots füleknél a megadott összes lehetőség fakkját pipáljuk ki: , (OK).
Nyomtatók napi energia-felvételét tartalmazó idősor elemzése
Az paraméterre (ebben a modellben ez az egyetlen paraméter) a becslés 0,802-re adódott. Ez azt jelenti, hogy az Xt érték becsléséhez a hozzá közeli értékeket, tehát Xt-1 Xt-2-őt kell a legnagyobb súllyal figyelembe venni a becslő sor előállításakor.
A hibatagok ACF és PACF értékeire egy grafikont is kapunk, amiről leolvasható, hogy az értékek a tűréshatáron belül esnek.
Nyomtatók napi energia-felvételét tartalmazó idősor elemzése
Nyomtatók napi energia-felvételét tartalmazó idősor elemzése
Az eredeti és a becsült idősorok együttes ábrája a konfidencia sávval együtt:
Ellenőrizzük le a maradéksort is!
Nyomtatók napi energia-felvételét tartalmazó idősor elemzése
Látható, hogy sem trend, sem szezonális hatás nem érzékelhető, vagyis megszemlélés alapján fehérzajnak látszik. A normalitást ellenőrző P-P grafikon pontjai gyakorlatilag az átló mentén helyezkednek el,
Nyomtatók napi energia-felvételét tartalmazó idősor elemzése
Alkalmazzuk előrejelzésre a modellünket! Az =0,802 beállítás mellett, a 150-180 napokra kérjünk előrejelzést! Ehhez még egyszer le kell futtatni a modellt, de most a következő plusz beállításokat is tegyük meg: Save/Variables Predicted values, Options: First case after end of estimation period through a specified date, Date: observation 180.
Ennek hatására keletkezik egy új változó (neve: Predicted_amount_Model_1), ami a modell előrelelzett értékeit tartalmazza, de az esetszám nem 149 lesz, hanem 180.
Rajzoltassuk ki az eredeti (amount) és az előre jelzett (Predicted_amount_Model_1) idősorokat a Analyze/Forecasting/Sequence Charts… paranccsal:
Nyomtatók napi energia-felvételét tartalmazó idősor elemzése
Látható, hogy a jövőre vonatkozó előrejelzés egy konstans, hiszen a modellünkben sem trend, sem szezonális hatás nem szerepelt. Az alkalmazott modellben a becsült idősor lényegében az analizált idősor két nappal előre történő eltoltja lett. A maradéksor szórása elég jelentős (kb. kétharmada az eredeti sor szórásának), ami arra utal, hogy a becslés még nem magyarázza elég jól a jelenséget, azaz a predikció nem tűnik elég megbízhatónak.