Ekonometria_Semestralka PIECKA

ŽILINSKÁ UNIVERZITA V ŽILINE

Fakulta riadenia a informatiky

SEMESTRÁLNA PRÁCA

EKONOMETRIA

PIECKA Ján 2010/2011 5ZSH11

2

Obsah 1. Formulácia a špecifikácia modelu................................................................................................... 3

2. Kvantifikácia modelu ....................................................................................................................... 5

3.1 Štatistická verifikácia modelu ........................................................................................................ 7

3.2 Ekonometrická verifikácia ............................................................................................................. 8

3.2.1 Testovanie prítomnosti autokorelácie reziduí........................................................................ 8

3.2.1 Testovanie prítomnosti heteroskedasticity .......................................................................... 10

3.2.3 Testovanie prítomnosti multikolinearity .............................................................................. 11

3.3 Ekonomická verifikácia modelu ................................................................................................... 13

4. Prognózovanie ............................................................................................................................... 14

3

1. Formulácia a špecifikácia modelu

Definícia problému:

Zistite vplyv jednotlivých zložiek HDP (GDP) podľa typu produktu na reálny hrubý

domáci produkt v konštantných cenách z roku 2005 pre USA.

„Real Gross Domestic Product by Major Type of Product, Chained Dollars (2005).“

Čo si máme predstaviť pod pojmom Real GDP resp. reálny HDP ?

„An inflation-adjusted measure that reflects the value of all goods and services produced in a

given year, expressed in base-year prices. Often referred to as "constant-price", "inflation-corrected"

GDP or "constant dollar GDP". Real GDP will measure the value of output in terms of prices from a

base year.“

Voľný preklad: Reálny HDP je o infláciu upravená hodnota všetkých tovarov a služieb vyrobených

v danom roku vyjadrená v cenách základného roku. Často je reálny HDP nazývaný ako HDP

v konštantných cenách. Reálny HDP sa bude merať hodnotou produkcie, pokiaľ ide o ceny

základného roka.

Investopedia.com o reálnom HDP hovorí:

„Unlike nominal GDP, real GDP can account for changes in the price level, and provide a more

accurate figure.“

Reálne ekonomické dáta:

Obdobie GDP Goods Services Structures

2007Q1 13 056,10 3 722,2 8 064,7 1 276,3

2007Q2 13 173,60 3 796,4 8 100,4 1 286,1

2007Q3 13 269,80 3 854,1 8 157,6 1 270,9

2007Q4 13 326,00 3 905,8 8 203,4 1 234,9

2008Q1 13 266,80 3 862,0 8 226,7 1 196,0

2008Q2 13 310,50 3 905,1 8 231,0 1 196,5

2008Q3 13 186,90 3 822,0 8 211,6 1 170,9

2008Q4 12 883,50 3 569,6 8 197,3 1 116,3

2009Q1 12 663,20 3 471,1 8 159,3 1 031,6

2009Q2 12 641,30 3 502,7 8 168,7 973,7

2009Q3 12 694,50 3 569,9 8 169,7 964,2

2009Q4 12 813,50 3 722,8 8 194,8 918,1

2010Q1 12 937,70 3 903,4 8 201,4 872,0

2010Q2 13 058,50 3 941,5 8 253,9 902,9

2010Q3 13 139,60 4 016,9 8 284,5 884,3

2010Q4 13 216,10 4 075,1 8 305,0 886,6

4

Dáta boli čerpané zo stránky The Bureau of Economic Analysis (BEA)

http://www.bea.gov/ teda amerického úradu pre ekonomické analýzy. Výhodou je, že

dáta su zozbierané od roku 1969 a sú prehľadne spracované v tabuľkách vo formáte pre

MS EXCEL. Sledovaným obdobím boli roky 2007 až 2010, pričom použité boli

štvrťročné dáta.

GDP (v modeli Yt) –hodnota reálneho HDP v sledovanom období v konštantých cenách.

Goods (v modeli ako Xt1 ) – tovar spotrebný a trvácny

Services ( v modeli Xt2 )- služby hodnota poskytnutých služieb v ekonomike + Includes

government consumption expenditures, which are for services (such as education and

national defense) produced by government. In current dollars, these services are valued at

their cost of production.

Structures ( v modeli Xt3 ) – stavby a budovy

T – časové obdobia ku ktorým sa vzťahujú údaje

http://www.bea.gov/

5

2. Kvantifikácia modelu

- na základe súčasných ekonomických vedomostí predpokladám jednorovnicový

ekonometrický model v tvare:

Yt=b0 + b1*Xt1 + b2*Xt2 + b3*Xt3

- odhad parametrov pomocou jednoduchej metódy najmenších štvorcov:

- takže model môžeme zapísať v tvare:

Yt^ = 70,295 + 0,924* Xt1 + 1,017 * Xt2 + 1,056 * Xt3

- hodnoty odhadnutého GDP podľa modelu budú:

T Yt Yt^

2007Q1 13 056,10 13057,77

2007Q2 13 173,60 13172,96

2007Q3 13 269,80 13268,38

2007Q4 13 326,00 13324,70

2008Q1 13 266,80 13266,89

2008Q2 13 310,50 13311,59

2008Q3 13 186,90 13188,09

2008Q4 12 883,50 12882,80

2009Q1 12 663,20 12663,77

2009Q2 12 641,30 12641,39

2009Q3 12 694,50 12694,44

2009Q4 12 813,50 12812,51

2010Q1 12 937,70 12937,35

2010Q2 13 058,50 13058,56

2010Q3 13 139,60 13139,68

2010Q4 13 216,10 13216,71

6

Graf znázorňuje reálne Yt a odhadnuté(vypočítané) Yt^:

- zvislá os Y udáva veľkosť GDP v miliardách dolárov

- vodorovná os X znázorňuje časové obdobie ku ktorému sa vzťahuje GDP

(štvrťročne)

12 200,00

12 400,00

12 600,00

12 800,00

13 000,00

13 200,00

13 400,00

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Yt realne

Yt^ odhad

7

3.1 Štatistická verifikácia modelu

- pre tento účel nám poslúži voľne dostupný program R-CRAN pre štatistiké

výpočty a grafiku:

- z priloženého výstupu vyplývajú tieto závery:

- parametre modelu sú štatisticky významné (H0 zamietam) , pretože všetky

vypočítané hodnoty tj pre parametre bj sú väčšie ako tabuľková hodnota

Studentovho rozdelenia:

tj = bj^ /sbj tὰ/2(0,025;12)

t1 481,703826 2,56

t2 146,2486156 2,56

t3 489,7319842 2,56

- model ako celok je štatisticky významný (H0 zamietam) , pretože vypočítaná

hodnota F-štatistiky je väčšia ako tabuľková hodnota pre Fischerov test:

Fštatistika Ftab (0,05;3;12)

286352,8798 3,4903

- hodnota koeficienta determinácie R2 je rovná 1, z čoho vyplýva, že 100%

použitých dát je vysvetlených modelom. Pre istotu som všetky výpočty realizoval

aj v programe Excel, kde vyšla hodnota koeficienta 0,999986 čo môžeme považovať

za ekvivalent 1 .

8

3.2 Ekonometrická verifikácia

3.2.1 Testovanie prítomnosti autokorelácie reziduí

- na tento účel použijeme Durbin-Watson test implementovaný v R-ku:

- z výstupu vyplývajú nasledovné závery:

- hodnota korelačného koeficienta ρ=0,1871290

- hodnota koeficienta d-štatistiky d=1,357140

- hodnoty dL a dU pre 16 pozorovaní (n) a 3 vysvetľujúce premenné(k) na hladine

významnosti ὰ=0,05 sú : dL=0,857 a dU=1,728

dL < dvyp < dU

0,857 < 1,357140 < 1,728

...neviem rozhodnúť o prítomnosti autokorelácie

- použijeme ZMNŠ, nakoľko ani zvýšenie počtu pozorovaní na 32 neprinieslo

zlepšenie , teda transformujeme dáta a znovu aplikujeme JMNŠ:

Yt TYt TXt1 TXt2 TXt3

2007Q1 - - - -

2007Q2 10730,4245 3099,8683 6591,2604 1047,2672

2007Q3 10804,6368 3143,6833 6641,7799 1030,2333

2007Q4 10842,835 3184,586 6676,8761 997,0777

2008Q1 10773,1184 3131,1114 6691,6056 964,91434

2008Q2 10827,8964 3182,4076 6691,5455 972,69366

2008Q3 10696,1189 3091,2424 6671,3408 947,0001

2008Q4 10415,848 2854,3928 6660,6712 897,1906

2009Q1 10252,323 2803,1242 6625,3471 822,70785

2009Q2 10271,6475 2853,1564 6641,858 780,65768

2009Q3 10328,9456 2914,4431 6641,099 781,99245

2009Q4 10437,9904 3054,768 6666,0119 737,67018

2010Q1 10539,922 3206,756 6667,9149 700,19683

2010Q2 10637,4806 3211,0605 6719,1799 739,72347

2010Q3 10695,9754 3279,3309 6739,9556 715,34119

2010Q4 10757,2992 3323,4213 6754,7294 721,12179

Tabuľka 1 - Transformované dáta v tvare ε= -ρ*ut-1 + ut

9

- následne znovu vykonáme Durbin-Watson test:

- z výstupu po ZMNŠ vyplývajú nasledovné závery:

- hodnota korelačného koeficienta ρ=-0,09454

- hodnota koeficienta d-štatistiky d=2,184116

- hodnoty dL a dU pre 15 pozorovaní (n) a 3 vysvetľujúce premenné(k) na hladine

významnosti ὰ=0,05 sú : dL=0,814 a dU=1,75

dU < dvyp < 4-dU

1,75 < 2,184116 < 2,25

... autokorelácia bola odstránená použitím ZMNŠ

- odhad parametrov modelu s takto transformovanými dátami použitím JMNŠ

bude vyzerať následovne:

- hľadaný ekonometrický model po aplikovaní ZMNŠ a spätnej transformácií

predelením parametrov modelu hodnotou 1-ρ, teda hodnotou 0,812870957 bude

mať tvar:

┐Yt^=163,044 + 1,138 * Xt1 + 1,236 Xt2 +1,298 * Xt3

10

3.2.1 Testovanie prítomnosti heteroskedasticity

- na tento účel použijeme Goldfeld-Quandt test , ktorý vykonáme v Exceli

Preusporiadanie et2

podľa Xt1

Preusporiadanie et2

podľa Xt2

Preusporiadanie et

2 podľa Xt3

Xt1 et2 Xt2 et

2 Xt3 et2

3 471,1 0,32237 8 064,7 2,80342 872,0 0,11918 3 502,7 0,00809 8 100,4 0,41316 884,3 0,00677 3 569,6 0,48854 8 157,6 2,02363 886,6 0,37355 3 569,9 0,00350 8 159,3 0,32237 902,9 0,00348 3 722,2 2,80342 8 168,7 0,00809 918,1 0,97080 3 722,8 0,97080 8 169,7 0,00350 964,2 0,00350 3 796,4 0,41316 8 194,8 0,97080 973,7 0,00809

3 822,0 1,41224 M členov vyradím

8 197,3 0,48854 M členov vyradím

1 031,6 0,32237 3 854,1 2,02363 8 201,4 0,11918 1 116,3 0,48854 3 862,0 0,00730 8 203,4 1,67989 1 170,9 1,41224

3 903,4 0,11918 8 211,6 1,41224 1 196,0 0,00730

3 905,1 1,19189 8 226,7 0,00730 1 196,5 1,19189

3 905,8 1,67989 8 231,0 1,19189 1 234,9 1,67989

3 941,5 0,00348 8 253,9 0,00348 1 270,9 2,02363

4 016,9 0,00677 8 284,5 0,00677 1 276,3 2,80342

4 075,1 0,37355 8 305,0 0,37355 1 286,1 0,41316

tabuľková hodnota Ftab (0,05;3;3)= 9,277

- Z GQ testu nám vyplýva, že pre všetky preusporiadané hodnoty et2 podľa vysvetľujúcich

premenných platí F2,1 < Ftab (0,05;3;3) , a teda prijímam hypotézu H0, dáta sú

homoskedastické.

S1(vrchné) 5,00988 S1 6,54497 S1 1,48536

S2(dolné) 3,38205 S2 4,67511 S2 9,53153

F2,1 1,481315 F2,1 1,3999598 F2,1 6,41697

11

3.2.3 Testovanie prítomnosti multikolinearity

- multikolinearitu testujeme Farrar-Glauber testom , ktorý vykonáme v program R

a následne vyvodíme závery:

- vypočítaná hodnota: R2 = 13,43091

- tabuľková hodnota: tab(0,05;3)2 = 7,8

R2 > tab(0,05;3)2

- z uvedeného môžeme urobiť záver, že Farrar-Glauber test dokázal prítomnosť

multikolinearity (prijímam hypotézu H1), teda existencie lineárnej závislosti

medzi vysvetľujúcimi veličinami.

- multikolinearitu sa pokúsime odstrániť pomocou metódy hlavných komponentov

Odstraňovanie multikolinearity:

Z = NX * H -matica hlavných komponentov a vektor normovaných hodnôt Yt

comp 1 comp 2 comp 3 NYt

0,7762194 0,66197427 2,38940735 0,07063784

0,5171814 1,00368008 1,78887817 0,58140376

0,027503 1,16476453 0,9040747 0,999579773

-0,2746597 1,20550564 0,10102344 1,243878025

-0,5602392 0,85200875 -0,17004226 0,986538941

-0,4936773 1,02602742 -0,34465303 1,176500393

-0,4092559 0,57632912 0,04017408 0,639218115

-0,7703721 -0,6812564 0,76587734 -0,679644694

-0,3170116 -1,4659387 1,21764029 -1,637276457

-0,1622958 -1,6074689 0,82499435 -1,732474531

0,0433183 -1,3838171 0,58528666 -1,50121711

0,3089071 -0,9874564 -0,3064317 -0,983930774

0,8780303 -0,4813448 -1,06393174 -0,44404033

0,2467193 -0,1853602 -1,68479895 0,081070506

0,1421625 0,02971988 -2,32301991 0,433607664

0,0474703 0,2726328 -2,72447881 0,76614888

12

- znovuvykonaný test Farrar-Glauber nepreukázal prítomnosť multikolinearity,

nakoľko hodnota R2 = 0,0009689531 < tab(0,05;3)2

- z matice hlavných komponentov a vektoru normovaných hodnôt n_Yt sme

pomocou JMNŠ vypočítali parametre modelu, koeficient determinácie a F-

štatistiku:

- pri využití druhého stĺpca matice hlavných komponentov, teda Z2 na odhad

parametrov modelu cez JMNŠ sme dostali nasledujúci výstup, z ktorého je vidieť,

že vyše 92,3% dát je vysvetlených týmto stĺpcom (Z2) matice hlavných

komponentov. Ostatné dva stĺpce samostatne nedokázali vysvetliť ani 1% dát.

13

3.3 Ekonomická verifikácia modelu

Všetky odhadnuté parametre pri vysvetľujúcich premenných majú kladné

znamienka, čo podľa ekonomickej teórie je správne, nakoľko v prípade, že sa zvýši

hodnota vyprodukovaných tovarov alebo služieb, ktoré ovplyvňujú veľkosť reálneho

HDP tak sa zvýši aj jeho hodnota (brané v konštantných cenách) .

Podľa teórie veľkosť GDP = C + I + G + Nx , čiže spotreba domácností, investície,

spotreba štátu a čistý export. Všetky tieto faktory boli obsiahnuté vo vysvetľujúcich

premenných (Xt1,Xt2,Xt3) a preto si myslím, že model reprezentuje skutočnosť v prípade,

že by sme ignorovali výkyvy ekonomiky ako nedávna (resp. súčasná ? ) hospodárska

kríza. Aby bol použiteľný aj s týmito, tažko predvídateľnými výkyvmi (neberiem do

úvahy rakúsku ekonomickú školu) , museli by sme rozšíriť model o umelé premenné,

a zahrnúť pozorovania z minulých období . To by malo za následok vytvorenie viac

rovnicového simultánneho modelu, ktorý by sa s tým možno vysporiadal.

14

4. Prognózovanie

- aby sme mohli využiť model na určenie prognózy možného vývoja GDP v závislosti na

vstupujúcich premenných ktorými sú services (využité služby), goods (spotrebné

a trvalé statky) a structures , musíme overiť , či je tento model vhodný na takéto

prognózovanie. Robí sa to cez overovanie štruktúry modelu.

Dáta modelu rozdelíme na 2 časti:

kvantifikačné dáta – n1 (10pozorovaní)

verifikačné dáta – n2 (6 pozorovaní)

celkové obdobie – n (16 pozorovaní)

- pre všetky skupiny dát urobíme odhad parametrov cez JMNŠ a spočítame sumy

štvorcov reziduálne

T Yt Xt1 Xt2 Xt3 Yt^ et2 Ytk^ etk

2 Ytv^ etv2

2007Q1 13 056,10 3 722,2 8 064,7 1 276,3 13057,774 2,803424 13057,52 2,005051

2007Q2 13 173,60 3 796,4 8 100,4 1 286,1 13172,957 0,413155 13172,84 0,577984

2007Q3 13 269,80 3 854,1 8 157,6 1 270,9 13268,377 2,023632 13268,5 1,694296

2007Q4 13 326,00 3 905,8 8 203,4 1 234,9 13324,704 1,679892 13324,75 1,562564

2008Q1 13 266,80 3 862,0 8 226,7 1 196,0 13266,885 0,007297 13267,06 0,065182

2008Q2 13 310,50 3 905,1 8 231,0 1 196,5 13311,592 1,191891 13311,59 1,195084

2008Q3 13 186,90 3 822,0 8 211,6 1 170,9 13188,088 1,412241 13188,04 1,289097

2008Q4 12 883,50 3 569,6 8 197,3 1 116,3 12882,801 0,488544 12883,35 0,021877

2009Q1 12 663,20 3 471,1 8 159,3 1 031,6 12663,768 0,32237 12663,53 0,11058

2009Q2 12 641,30 3 502,7 8 168,7 973,7 12641,39 0,008093 12640,53 0,596889

2009Q3 12 694,50 3 569,9 8 169,7 964,2 12694,441 0,003498

12694,7 0,040479

2009Q4 12 813,50 3 722,8 8 194,8 918,1 12812,515 0,970801

12813,25 0,064054

2010Q1 12 937,70 3 903,4 8 201,4 872,0 12937,355 0,119178

12937,85 0,021834

2010Q2 13 058,50 3 941,5 8 253,9 902,9 13058,559 0,003477

13058,18 0,104586

2010Q3 13 139,60 4 016,9 8 284,5 884,3 13139,682 0,006768

13139,69 0,008466

2010Q4 13 216,10 4 075,1 8 305,0 886,6 13216,711 0,373549 13216,24 0,018365

∑ Scelkové = 11,82781 S1 = 9,118604 S2 = 0,257784

S* = S1 + S2

tabuľková hodnota Ftab (0,05;3;10)= 3,7083

vypočítaná hodnota FS=0,871487

FS < Ftab (0,05;3;10)

...prijímam hypotézu H0, model je vhodný na prognózovanie1

1 v prípade, že by som to vedel

15

Síce som prijal hypotézu H0 o vhodnosti modelu na prognózovanie, no osobne

s touto nie celkom súhlasím, nakoľko celkový počet pozorovaní bol 16, pričom boli

zahrnuté obdobia kedy začala celosvetová hospodárska recesia (Q3,2008) a od tejto

neuplynulo dostatok času, aby sa z nej ekonomika spamätala. Taktiež, som nepoužil

žiadne umelé premenné ktoré by kompenzovali túto skutočnosť. Preto si myslím, že

model nie je vhodný na prognózovanie, hoci F-test tvrdí opak .

Ekonometria_Semestralka PIECKA

Documents

s1 s2 f2

matice hlavnch komponentov

preto si myslm

h0 zamietam

kontantnch cench

lenov vyradm

3 vysvetujce premenn

real gdp