ŽILINSKÁ UNIVERZITA V ŽILINE Fakulta riadenia a informatiky SEMESTRÁLNA PRÁCA EKONOMETRIA PIECKA Ján 2010/2011 5ZSH11
Oct 09, 2014
ŽILINSKÁ UNIVERZITA V ŽILINE
Fakulta riadenia a informatiky
SEMESTRÁLNA PRÁCA
EKONOMETRIA
PIECKA Ján 2010/2011 5ZSH11
2
Obsah 1. Formulácia a špecifikácia modelu................................................................................................... 3
2. Kvantifikácia modelu ....................................................................................................................... 5
3.1 Štatistická verifikácia modelu ........................................................................................................ 7
3.2 Ekonometrická verifikácia ............................................................................................................. 8
3.2.1 Testovanie prítomnosti autokorelácie reziduí........................................................................ 8
3.2.1 Testovanie prítomnosti heteroskedasticity .......................................................................... 10
3.2.3 Testovanie prítomnosti multikolinearity .............................................................................. 11
3.3 Ekonomická verifikácia modelu ................................................................................................... 13
4. Prognózovanie ............................................................................................................................... 14
3
1. Formulácia a špecifikácia modelu
Definícia problému:
Zistite vplyv jednotlivých zložiek HDP (GDP) podľa typu produktu na reálny hrubý
domáci produkt v konštantných cenách z roku 2005 pre USA.
„Real Gross Domestic Product by Major Type of Product, Chained Dollars (2005).“
Čo si máme predstaviť pod pojmom Real GDP resp. reálny HDP ?
„An inflation-adjusted measure that reflects the value of all goods and services produced in a
given year, expressed in base-year prices. Often referred to as "constant-price", "inflation-corrected"
GDP or "constant dollar GDP". Real GDP will measure the value of output in terms of prices from a
base year.“
Voľný preklad: Reálny HDP je o infláciu upravená hodnota všetkých tovarov a služieb vyrobených
v danom roku vyjadrená v cenách základného roku. Často je reálny HDP nazývaný ako HDP
v konštantných cenách. Reálny HDP sa bude merať hodnotou produkcie, pokiaľ ide o ceny
základného roka.
Investopedia.com o reálnom HDP hovorí:
„Unlike nominal GDP, real GDP can account for changes in the price level, and provide a more
accurate figure.“
Reálne ekonomické dáta:
Obdobie GDP Goods Services Structures
2007Q1 13 056,10 3 722,2 8 064,7 1 276,3
2007Q2 13 173,60 3 796,4 8 100,4 1 286,1
2007Q3 13 269,80 3 854,1 8 157,6 1 270,9
2007Q4 13 326,00 3 905,8 8 203,4 1 234,9
2008Q1 13 266,80 3 862,0 8 226,7 1 196,0
2008Q2 13 310,50 3 905,1 8 231,0 1 196,5
2008Q3 13 186,90 3 822,0 8 211,6 1 170,9
2008Q4 12 883,50 3 569,6 8 197,3 1 116,3
2009Q1 12 663,20 3 471,1 8 159,3 1 031,6
2009Q2 12 641,30 3 502,7 8 168,7 973,7
2009Q3 12 694,50 3 569,9 8 169,7 964,2
2009Q4 12 813,50 3 722,8 8 194,8 918,1
2010Q1 12 937,70 3 903,4 8 201,4 872,0
2010Q2 13 058,50 3 941,5 8 253,9 902,9
2010Q3 13 139,60 4 016,9 8 284,5 884,3
2010Q4 13 216,10 4 075,1 8 305,0 886,6
4
Dáta boli čerpané zo stránky The Bureau of Economic Analysis (BEA)
http://www.bea.gov/ teda amerického úradu pre ekonomické analýzy. Výhodou je, že
dáta su zozbierané od roku 1969 a sú prehľadne spracované v tabuľkách vo formáte pre
MS EXCEL. Sledovaným obdobím boli roky 2007 až 2010, pričom použité boli
štvrťročné dáta.
GDP (v modeli Yt) –hodnota reálneho HDP v sledovanom období v konštantých cenách.
Goods (v modeli ako Xt1 ) – tovar spotrebný a trvácny
Services ( v modeli Xt2 )- služby hodnota poskytnutých služieb v ekonomike + Includes
government consumption expenditures, which are for services (such as education and
national defense) produced by government. In current dollars, these services are valued at
their cost of production.
Structures ( v modeli Xt3 ) – stavby a budovy
T – časové obdobia ku ktorým sa vzťahujú údaje
5
2. Kvantifikácia modelu
- na základe súčasných ekonomických vedomostí predpokladám jednorovnicový
ekonometrický model v tvare:
Yt=b0 + b1*Xt1 + b2*Xt2 + b3*Xt3
- odhad parametrov pomocou jednoduchej metódy najmenších štvorcov:
- takže model môžeme zapísať v tvare:
Yt^ = 70,295 + 0,924* Xt1 + 1,017 * Xt2 + 1,056 * Xt3
- hodnoty odhadnutého GDP podľa modelu budú:
T Yt Yt^
2007Q1 13 056,10 13057,77
2007Q2 13 173,60 13172,96
2007Q3 13 269,80 13268,38
2007Q4 13 326,00 13324,70
2008Q1 13 266,80 13266,89
2008Q2 13 310,50 13311,59
2008Q3 13 186,90 13188,09
2008Q4 12 883,50 12882,80
2009Q1 12 663,20 12663,77
2009Q2 12 641,30 12641,39
2009Q3 12 694,50 12694,44
2009Q4 12 813,50 12812,51
2010Q1 12 937,70 12937,35
2010Q2 13 058,50 13058,56
2010Q3 13 139,60 13139,68
2010Q4 13 216,10 13216,71
6
Graf znázorňuje reálne Yt a odhadnuté(vypočítané) Yt^:
- zvislá os Y udáva veľkosť GDP v miliardách dolárov
- vodorovná os X znázorňuje časové obdobie ku ktorému sa vzťahuje GDP
(štvrťročne)
12 200,00
12 400,00
12 600,00
12 800,00
13 000,00
13 200,00
13 400,00
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Yt realne
Yt^ odhad
7
3.1 Štatistická verifikácia modelu
- pre tento účel nám poslúži voľne dostupný program R-CRAN pre štatistiké
výpočty a grafiku:
- z priloženého výstupu vyplývajú tieto závery:
- parametre modelu sú štatisticky významné (H0 zamietam) , pretože všetky
vypočítané hodnoty tj pre parametre bj sú väčšie ako tabuľková hodnota
Studentovho rozdelenia:
tj = bj^ /sbj tὰ/2(0,025;12)
t1 481,703826 2,56
t2 146,2486156 2,56
t3 489,7319842 2,56
- model ako celok je štatisticky významný (H0 zamietam) , pretože vypočítaná
hodnota F-štatistiky je väčšia ako tabuľková hodnota pre Fischerov test:
Fštatistika Ftab (0,05;3;12)
286352,8798 3,4903
- hodnota koeficienta determinácie R2 je rovná 1, z čoho vyplýva, že 100%
použitých dát je vysvetlených modelom. Pre istotu som všetky výpočty realizoval
aj v programe Excel, kde vyšla hodnota koeficienta 0,999986 čo môžeme považovať
za ekvivalent 1 .
8
3.2 Ekonometrická verifikácia
3.2.1 Testovanie prítomnosti autokorelácie reziduí
- na tento účel použijeme Durbin-Watson test implementovaný v R-ku:
- z výstupu vyplývajú nasledovné závery:
- hodnota korelačného koeficienta ρ=0,1871290
- hodnota koeficienta d-štatistiky d=1,357140
- hodnoty dL a dU pre 16 pozorovaní (n) a 3 vysvetľujúce premenné(k) na hladine
významnosti ὰ=0,05 sú : dL=0,857 a dU=1,728
dL < dvyp < dU
0,857 < 1,357140 < 1,728
...neviem rozhodnúť o prítomnosti autokorelácie
- použijeme ZMNŠ, nakoľko ani zvýšenie počtu pozorovaní na 32 neprinieslo
zlepšenie , teda transformujeme dáta a znovu aplikujeme JMNŠ:
Yt TYt TXt1 TXt2 TXt3
2007Q1 - - - -
2007Q2 10730,4245 3099,8683 6591,2604 1047,2672
2007Q3 10804,6368 3143,6833 6641,7799 1030,2333
2007Q4 10842,835 3184,586 6676,8761 997,0777
2008Q1 10773,1184 3131,1114 6691,6056 964,91434
2008Q2 10827,8964 3182,4076 6691,5455 972,69366
2008Q3 10696,1189 3091,2424 6671,3408 947,0001
2008Q4 10415,848 2854,3928 6660,6712 897,1906
2009Q1 10252,323 2803,1242 6625,3471 822,70785
2009Q2 10271,6475 2853,1564 6641,858 780,65768
2009Q3 10328,9456 2914,4431 6641,099 781,99245
2009Q4 10437,9904 3054,768 6666,0119 737,67018
2010Q1 10539,922 3206,756 6667,9149 700,19683
2010Q2 10637,4806 3211,0605 6719,1799 739,72347
2010Q3 10695,9754 3279,3309 6739,9556 715,34119
2010Q4 10757,2992 3323,4213 6754,7294 721,12179
Tabuľka 1 - Transformované dáta v tvare ε= -ρ*ut-1 + ut
9
- následne znovu vykonáme Durbin-Watson test:
- z výstupu po ZMNŠ vyplývajú nasledovné závery:
- hodnota korelačného koeficienta ρ=-0,09454
- hodnota koeficienta d-štatistiky d=2,184116
- hodnoty dL a dU pre 15 pozorovaní (n) a 3 vysvetľujúce premenné(k) na hladine
významnosti ὰ=0,05 sú : dL=0,814 a dU=1,75
dU < dvyp < 4-dU
1,75 < 2,184116 < 2,25
... autokorelácia bola odstránená použitím ZMNŠ
- odhad parametrov modelu s takto transformovanými dátami použitím JMNŠ
bude vyzerať následovne:
- hľadaný ekonometrický model po aplikovaní ZMNŠ a spätnej transformácií
predelením parametrov modelu hodnotou 1-ρ, teda hodnotou 0,812870957 bude
mať tvar:
┐Yt^=163,044 + 1,138 * Xt1 + 1,236 Xt2 +1,298 * Xt3
10
3.2.1 Testovanie prítomnosti heteroskedasticity
- na tento účel použijeme Goldfeld-Quandt test , ktorý vykonáme v Exceli
Preusporiadanie et2
podľa Xt1
Preusporiadanie et2
podľa Xt2
Preusporiadanie et
2 podľa Xt3
Xt1 et2 Xt2 et
2 Xt3 et2
3 471,1 0,32237 8 064,7 2,80342 872,0 0,11918 3 502,7 0,00809 8 100,4 0,41316 884,3 0,00677 3 569,6 0,48854 8 157,6 2,02363 886,6 0,37355 3 569,9 0,00350 8 159,3 0,32237 902,9 0,00348 3 722,2 2,80342 8 168,7 0,00809 918,1 0,97080 3 722,8 0,97080 8 169,7 0,00350 964,2 0,00350 3 796,4 0,41316 8 194,8 0,97080 973,7 0,00809
3 822,0 1,41224 M členov vyradím
8 197,3 0,48854 M členov vyradím
1 031,6 0,32237 3 854,1 2,02363 8 201,4 0,11918 1 116,3 0,48854 3 862,0 0,00730 8 203,4 1,67989 1 170,9 1,41224
3 903,4 0,11918 8 211,6 1,41224 1 196,0 0,00730
3 905,1 1,19189 8 226,7 0,00730 1 196,5 1,19189
3 905,8 1,67989 8 231,0 1,19189 1 234,9 1,67989
3 941,5 0,00348 8 253,9 0,00348 1 270,9 2,02363
4 016,9 0,00677 8 284,5 0,00677 1 276,3 2,80342
4 075,1 0,37355 8 305,0 0,37355 1 286,1 0,41316
tabuľková hodnota Ftab (0,05;3;3)= 9,277
- Z GQ testu nám vyplýva, že pre všetky preusporiadané hodnoty et2 podľa vysvetľujúcich
premenných platí F2,1 < Ftab (0,05;3;3) , a teda prijímam hypotézu H0, dáta sú
homoskedastické.
S1(vrchné) 5,00988 S1 6,54497 S1 1,48536
S2(dolné) 3,38205 S2 4,67511 S2 9,53153
F2,1 1,481315 F2,1 1,3999598 F2,1 6,41697
11
3.2.3 Testovanie prítomnosti multikolinearity
- multikolinearitu testujeme Farrar-Glauber testom , ktorý vykonáme v program R
a následne vyvodíme závery:
- vypočítaná hodnota: R2 = 13,43091
- tabuľková hodnota: tab(0,05;3)2 = 7,8
R2 > tab(0,05;3)2
- z uvedeného môžeme urobiť záver, že Farrar-Glauber test dokázal prítomnosť
multikolinearity (prijímam hypotézu H1), teda existencie lineárnej závislosti
medzi vysvetľujúcimi veličinami.
- multikolinearitu sa pokúsime odstrániť pomocou metódy hlavných komponentov
Odstraňovanie multikolinearity:
Z = NX * H -matica hlavných komponentov a vektor normovaných hodnôt Yt
comp 1 comp 2 comp 3 NYt
0,7762194 0,66197427 2,38940735 0,07063784
0,5171814 1,00368008 1,78887817 0,58140376
0,027503 1,16476453 0,9040747 0,999579773
-0,2746597 1,20550564 0,10102344 1,243878025
-0,5602392 0,85200875 -0,17004226 0,986538941
-0,4936773 1,02602742 -0,34465303 1,176500393
-0,4092559 0,57632912 0,04017408 0,639218115
-0,7703721 -0,6812564 0,76587734 -0,679644694
-0,3170116 -1,4659387 1,21764029 -1,637276457
-0,1622958 -1,6074689 0,82499435 -1,732474531
0,0433183 -1,3838171 0,58528666 -1,50121711
0,3089071 -0,9874564 -0,3064317 -0,983930774
0,8780303 -0,4813448 -1,06393174 -0,44404033
0,2467193 -0,1853602 -1,68479895 0,081070506
0,1421625 0,02971988 -2,32301991 0,433607664
0,0474703 0,2726328 -2,72447881 0,76614888
12
- znovuvykonaný test Farrar-Glauber nepreukázal prítomnosť multikolinearity,
nakoľko hodnota R2 = 0,0009689531 < tab(0,05;3)2
- z matice hlavných komponentov a vektoru normovaných hodnôt n_Yt sme
pomocou JMNŠ vypočítali parametre modelu, koeficient determinácie a F-
štatistiku:
- pri využití druhého stĺpca matice hlavných komponentov, teda Z2 na odhad
parametrov modelu cez JMNŠ sme dostali nasledujúci výstup, z ktorého je vidieť,
že vyše 92,3% dát je vysvetlených týmto stĺpcom (Z2) matice hlavných
komponentov. Ostatné dva stĺpce samostatne nedokázali vysvetliť ani 1% dát.
13
3.3 Ekonomická verifikácia modelu
Všetky odhadnuté parametre pri vysvetľujúcich premenných majú kladné
znamienka, čo podľa ekonomickej teórie je správne, nakoľko v prípade, že sa zvýši
hodnota vyprodukovaných tovarov alebo služieb, ktoré ovplyvňujú veľkosť reálneho
HDP tak sa zvýši aj jeho hodnota (brané v konštantných cenách) .
Podľa teórie veľkosť GDP = C + I + G + Nx , čiže spotreba domácností, investície,
spotreba štátu a čistý export. Všetky tieto faktory boli obsiahnuté vo vysvetľujúcich
premenných (Xt1,Xt2,Xt3) a preto si myslím, že model reprezentuje skutočnosť v prípade,
že by sme ignorovali výkyvy ekonomiky ako nedávna (resp. súčasná ? ) hospodárska
kríza. Aby bol použiteľný aj s týmito, tažko predvídateľnými výkyvmi (neberiem do
úvahy rakúsku ekonomickú školu) , museli by sme rozšíriť model o umelé premenné,
a zahrnúť pozorovania z minulých období . To by malo za následok vytvorenie viac
rovnicového simultánneho modelu, ktorý by sa s tým možno vysporiadal.
14
4. Prognózovanie
- aby sme mohli využiť model na určenie prognózy možného vývoja GDP v závislosti na
vstupujúcich premenných ktorými sú services (využité služby), goods (spotrebné
a trvalé statky) a structures , musíme overiť , či je tento model vhodný na takéto
prognózovanie. Robí sa to cez overovanie štruktúry modelu.
Dáta modelu rozdelíme na 2 časti:
kvantifikačné dáta – n1 (10pozorovaní)
verifikačné dáta – n2 (6 pozorovaní)
celkové obdobie – n (16 pozorovaní)
- pre všetky skupiny dát urobíme odhad parametrov cez JMNŠ a spočítame sumy
štvorcov reziduálne
T Yt Xt1 Xt2 Xt3 Yt^ et2 Ytk^ etk
2 Ytv^ etv2
2007Q1 13 056,10 3 722,2 8 064,7 1 276,3 13057,774 2,803424 13057,52 2,005051
2007Q2 13 173,60 3 796,4 8 100,4 1 286,1 13172,957 0,413155 13172,84 0,577984
2007Q3 13 269,80 3 854,1 8 157,6 1 270,9 13268,377 2,023632 13268,5 1,694296
2007Q4 13 326,00 3 905,8 8 203,4 1 234,9 13324,704 1,679892 13324,75 1,562564
2008Q1 13 266,80 3 862,0 8 226,7 1 196,0 13266,885 0,007297 13267,06 0,065182
2008Q2 13 310,50 3 905,1 8 231,0 1 196,5 13311,592 1,191891 13311,59 1,195084
2008Q3 13 186,90 3 822,0 8 211,6 1 170,9 13188,088 1,412241 13188,04 1,289097
2008Q4 12 883,50 3 569,6 8 197,3 1 116,3 12882,801 0,488544 12883,35 0,021877
2009Q1 12 663,20 3 471,1 8 159,3 1 031,6 12663,768 0,32237 12663,53 0,11058
2009Q2 12 641,30 3 502,7 8 168,7 973,7 12641,39 0,008093 12640,53 0,596889
2009Q3 12 694,50 3 569,9 8 169,7 964,2 12694,441 0,003498
12694,7 0,040479
2009Q4 12 813,50 3 722,8 8 194,8 918,1 12812,515 0,970801
12813,25 0,064054
2010Q1 12 937,70 3 903,4 8 201,4 872,0 12937,355 0,119178
12937,85 0,021834
2010Q2 13 058,50 3 941,5 8 253,9 902,9 13058,559 0,003477
13058,18 0,104586
2010Q3 13 139,60 4 016,9 8 284,5 884,3 13139,682 0,006768
13139,69 0,008466
2010Q4 13 216,10 4 075,1 8 305,0 886,6 13216,711 0,373549 13216,24 0,018365
∑ Scelkové = 11,82781 S1 = 9,118604 S2 = 0,257784
S* = S1 + S2
tabuľková hodnota Ftab (0,05;3;10)= 3,7083
vypočítaná hodnota FS=0,871487
FS < Ftab (0,05;3;10)
...prijímam hypotézu H0, model je vhodný na prognózovanie1
1 v prípade, že by som to vedel
15
Síce som prijal hypotézu H0 o vhodnosti modelu na prognózovanie, no osobne
s touto nie celkom súhlasím, nakoľko celkový počet pozorovaní bol 16, pričom boli
zahrnuté obdobia kedy začala celosvetová hospodárska recesia (Q3,2008) a od tejto
neuplynulo dostatok času, aby sa z nej ekonomika spamätala. Taktiež, som nepoužil
žiadne umelé premenné ktoré by kompenzovali túto skutočnosť. Preto si myslím, že
model nie je vhodný na prognózovanie, hoci F-test tvrdí opak .