Modelul Multiplu

Sem. 1

Lucrare de laborator 2 Modelul econometric multiplu

Se cunosc următoarele date: Y=Y+N, unde N este numarul din registrul grupeiTabelul 1 „Datele generale”

Nr.crt. Y X1 X2 X31 23 2 45 101

2 25 1 43 112

3 21 3 43 134

4 27 6 47 125

5 25 7 42 109

6 30 8 41 136

7 32 8 32 112

8 30 5 33 127

9 32 5 41 108

10 27 8 38 143

11 30 4 32 141

12 32 9 31 152

13 36 12 35 154

14 32 7 29 160

Total 402 85 532 1814

Se cere:1) De creat şi de specificat modelul liniar general ce descrie legătura dintre variabile.2) De scris modelul în formă matriceală şi de specificat bine dimensiunile fiecărei matrice. De

soluţionat modelul.3) De soluţionat modelul folosind metoda centrării datelor.4) De calculat estimaţia varianţei erorilor şi abarerile standard pentru fiecare coeficient.5) De calculat şi , de explicat rezultatele obţinute.6) Coeficienţii şi simultan diferiţi de 1 şi -0,5?7) Sunt coeficienţii şi semnificativ diferiţi de 1 şi -0,5?8) Care este intervalul de încredere pentru variaţia eroril0r, dacă probabilitatea cu care se

garantează rezultatele este de 95%?9) Adăugarea variabilelor explicative şi ameliorează semnificativ calitatea estimaţiei în

raport cu singur?10) Coeficienţii sunt semnificativi diferiţi de zero, regresia este global semnificativă?11) Calculaţi previziunea şi intervalul de încredere pentru următoarele două perioade, dacă se

cunosc următoarele date:

1

(15)=3 (16)=6(15)=24 (16)=38(15)=165 (16)=170

Rezolvare:

1) Pe baza datelor prezentate în tabelul 1 vedem că avem o variabilă dependentă de mai multe variabile independente ceea ce ne demonstrează că modelul nostru econometric este unul liniar general de forma:

Y=fUnde: Y – valorile reale ale variabilei dependente;

- valorile reale ale variabelelor independente sau explicateve; - eroare de specificare.

Forma funcţie se poate vedea prin intermediul graficelor care arată dependenţa variabilei de explicat în raport cu variabilele explicative (vezi fig. 1,2,3 )

Fig.1 Legatura dintre X1 si Y

2

Am făcut aceste două grafice numerotate la fel în două programe diferite(excel si eviews) pentru a vedea asemănarea. Punctele sunt repartizate la fel indiferent de programul prin care facem graficele. În continuare voi prezenta doar graficele din eviews.

Fig.2 Legătura dintre X2 şi Y

Fig.3 Legătura dintre X3 şi Y

Fig.1 Legatura dintre X1 si Y

20222426283032343638

0 2 4 6 8 10 12

X1

Y

3

Analizînd graficele obţinute, şi în special norul de puncte, observăm că punctele sunt repartizate astfel încît ne sugerează o linie dreaptă. Particularităţile graficelor sunt că primul arată o linie cu panta pozitivă, al doilea grafic sugerează o linie cu pantă inversă primului grafic, iar cel de-al treilea grafic este greu de specificat. Datorită acestui fapt modelul care trebuie examinat este:

unde:Y - variabilă dependentă la observarea i;

- variabilă inde pendentă 2 explicativă la observarea i;- variabila explicarivă 2 la observarea i;

- variabila explicativă 3 la observarea i;- coeficienţii sau parametrii modelului;

- eroarea de specificare; În cazul în care scrim modelul incluzînd fiecare observare obţinem un sistem de ecuaţii liniare de

forma:

2) Modelul scris sub formă de matrice arată în felul următor:

Y=Xa+ , unde

;

;

;

iar dimensiunile matricelor sunt: (14;1) (14;4) (4;1) (14;1)

Pentru soluţionarea modelului e nevoie de estimat vectorul compus din parametrii . Estimarea parametrului prin metoda celor mai mici patrate presupune condiţia:

Dacă calculăm diferenţiala lui S în raport cu „a”, atunci obţinem relaţia care ne ajută să calculăm valoarea estimatorul :

4

asadar,

Avînd obţinute rezultatele de mai sus uşor putem să le introducem în formula noatră de aflare a valorilor vectorului .

Deci:

Voi folosi ca demonstraţie programul eviews:Pentru

5

Tabelul complet unde se află coeficienţii este următorul:

6

Tabelul de mai sus ne arată că

3) Pentru a face o comparaţie de rezultate şi în acelaşi timp o verificare dacă calculele au fost făcute corect, parametrii modelului pot fi estimaţi nu doar după metoda anterioară, dar şi prin metoda centrării datelor conform căreia:

şi Ұ= i=1,14 Pentru a continua calculele avem nevoie de valorile medii atît a variabilei

dependente cît şi a variabilelor independente. Astfel, calculăm mediile aritmetice după următoarele raporturi:

Datele egalităţilor de mai sus obţinute cu ajutorul mediilor calculate anterior sunt date în tabel (vezi tabelul 2):

Tabelul 2

Nr.Crt.

Y X1 X2 X3 Ұ

1 23 2 45 101 -5.71 -4.07 7 -28.6 16.57653 49 816.3265

2 25 1 43 112 -3.71 -5.07 5 -17.6 25.71939 25 308.7551

3 21 3 43 134 -7.71 -3.07 5 4.43 9.433673 25 19.61224

4 27 6 47 125 -1.71 -0.07 9 -4.57 0.005102 81 20.89796

7

5 25 7 42 109 -3.71 0.93 4 -20.6 0.862245 16 423.1837

6 30 8 41 136 1.286 1.93 3 6.43 3.719388 9 41.32653

7 32 8 32 112 3.286 1.93 -6 -17.6 3.719388 36 308.7551

8 30 5 33 127 1.286 -1.07 -5 -2.57 1.147959 25 6.612245

9 32 5 41 108 3.286 -1.07 3 -21.6 1.147959 9 465.3265

10 27 8 38 143 -1.71 1.93 0 13.4 3.719388 0 180.3265

11 30 4 32 141 1.286 -2.07 -6 11.4 4.290816 36 130.6122

12 32 9 31 152 3.286 2.93 -7 22.4 8.576531 49 503.0408

13 36 12 35 154 7.286 5.93 -3 24.4 35.14796 9 596.7551

14 32 7 29 160 3.286 0.93 -9 30.4 0.862245 81 925.898

Total 402 85 532 1814 0,00 0 0 0 114.9286 450 4747.429

Forma matriceală a modelului o putem scrie şi sub forma: Y=Xa+=> sau într-o formă mai redusă => că Ұde unde

Asadar, pentru a afla valoare vectorului avem nevoie de valoarea produsului dintre variabila X transpus şi X totul la puterea -1, şi de asemenea, de valoare produsului dintre X transpus şi Y. Deci avem următoarea matrice:

Datele din matricea anterioară sunt reflectate în următorul tabel(vezi tabelul 3)

Tabelul 3N

r.Ұ * * * Ұ* Ұ* Ұ*

1 -5.71 -4.07 7 -28.6 -28.5 116.3265 -200 23.26531 -40 163.26532 -3.71 -5.07 5 -17.6 -25.3571 89.11224 -87.8571 18.83673 -18.57 65.265313 -7.71 -3.07 5 4.43 -15.3571 -13.602 22.1429 23.69388 -38.57 -34.163274 -1.71 -0.07 9 -4.57 -0.64286 0.326531 -41.1429 0.122449 -15.43 7.8367355 -3.71 0.93 4 -20.6 3.714286 -19.102 -82.2857 -3.44898 -14.86 76.408166 1.286 1.93 3 6.43 5.785714 12.39796 19.2857 2.479592 3.8571 8.2653067 3.286 1.93 -6 -17.6 -11.5714 -33.8878 105.429 6.336735 -19.71 -57.734698 1.286 -1.07 -5 -2.57 5.357143 2.755102 12.8571 -1.37755 -6.429 -3.3061229 3.286 -1.07 3 -21.6 -3.21429 23.11224 -64.7143 -3.52041 9.8571 -70.877551

0-1.71 1.93 0 13.4 0 25.89796 0 -3.30612 0 -23.02041

8

11

1.286 -2.07 -6 11.4 12.42857 -23.6735 -68.5714 -2.66327 -7.714 14.69388

12

3.286 2.93 -7 22.4 -20.5 65.68367 -157 9.622449 -23 73.69388

13

7.286 5.93 -3 24.4 -17.7857 144.8265 -73.2857 43.19388 -21.86 177.9796

14

3.286 0.93 -9 30.4 -8.35714 28.2551 -273.857 3.05102 -29.57 99.97959

∑ 0,00 0 0 0 -104 418,4286 -889 116.2857 -222 498.2857

;

Deci:

de unde rezultă că: Avînd rezultatele acestori estimatori putem calcula estimaţia termenului liber din relaţia:

=> Avînd

aceste valori putem scrie forma modelului în întregime ca rezultat astfel:

=43,14868+0,801901 -0,381362 -0,037132

Analizînd datele observăm că orice metoda adecvată folosită la rezolvarea estimatorilor obţinem rezultate identice. În cazul de faţă atît prin metoda matriceală cît şi prin metoda centrării datelor estimatorii parametrilor de regresie coincid.

Estimatorii parametrilor de regresie au următoarea semnificaţie:

-creşterea variabilei cu o unitate are drept efect creşterea variabilei dependente cu 0,801901 (un.m)

-creşterea variabilei cu o unitate are ca efect diminuarea variabilei Y deoarece parametrul lui este o valoare negativă cu 0,3813362 (un. m)

- creşterea variabilei are efectul diminuarii variabilei endogene cu 0,03713 (unităţi de măsură).

4) Calculul privind estimaţia varianţei erorilor şi abaterile standart pentru fiecare coeficient .Conform definiţiei varianţa erorilor se calculează conform următoarei formule:

Datele în baza cărora am rezolvat varianţa erorilor sunt prezente în următorul tabel(vezi tabelul 4)

Tabelul 4

9

Nr. Y Ұ Ұ Ŷ e e

1 23 -5.71 32.65306 23.84079 -0.84 0.7069362 25 -3.71 13.79592 23.39316 1.61 2.5819293 21 -7.71 59.5102 24.18005 -3.18 10.112714 27 -1.71 2.938776 25.39449 1.61 2.5776495 25 -3.71 13.79592 28.69733 -3.7 13.670226 30 1.286 1.653061 28.87801 1.12 1.2588557 32 3.286 10.79592 33.20145 -1.2 1.4434898 30 1.286 1.653061 29.8574 0.14 0.0203349 32 3.286 10.79592 27.51202 4.49 20.1419710 27 -1.71 2.938776 29.76217 -2.76 7.62959911 30 1.286 1.653061 28.91701 1.08 1.17286912 32 3.286 10.79592 32.89942 -0.9 0.80895313 36 7.286 53.08163 33.70541 2.29 5.26516214 32 3.286 10.79592 31.76128 0.24 0.056986

∑ 402 0,00 226.8571 402 0,00 67.44767

Calcularea erorilor standard presupune soluţionarea următoarelor relaţii:

Matricea varcov( ) poate fi scrisă sub forma:

Dispersia coeficienţilor de regresie se află pe diagonala principală a matricei varcov( ), iar radicalul acestor dispersii sunt abaterile standard ale coeficienţilor .

5) Calcularea coeficientului de determinaţie şi coeficientul de determinaţie ajustat se face pe baza următoarelor relaţii:

Observăm că < deoarece coeficientul de corelaţie ajustat a fost corectat cu gradul de libertate. Nivelul coeficientului de determinaţie este de 0,702687 ceea ce semnifică că variabilele independente au o

10

contribuţie de 70,27% la modificările lui Y, iar restul procentajului care influienţează majorarea sau diminuarea variabilei Y este destinat altor factori aleatori care nu au fost luaţi în analiza modelului.

6) Coeficienţii a1 şi a2 sunt simultan diferiţi de 1 şi -0,5? Testarea ipotezei este:

Ipoteza nulă se acceptă în cazul cînd:

Relaţia este legea lui Fisher care semnifică testul F tabelar la pragul de semnificaţie şi q, n-k-1 grade de libertate.

Faptul că avem de testat doi parametri rezultă că q=2 iar şi .

Pentru a afla valoarea calculată a lui F mai avem nevoie de calcularea indicatorului . Calcularea lui se face astfel:

Avînd aceste date le putem înlocui direct în formulă pentru determinarea testului Fisher calculat. Aşadar,

Valoare

a tabelară a lui F este:

Comparînd valarile teoretice cu cele calculate a testul Fisher observăm că cel calculat este mai mic decît cel tabelar ceea ce semnifică acceptarea ipotezei nule. Conform ipotezei nule coeficienţii testaţi nu resping posibilitatea de a fi simultan diferiţi de 1 şi -0,5.

7) Coeficienţii a1 şi a2 sunt semnificativ diferiţi de 1 şi -0,5?

a)

Calculam valoarea calculat a testului T-Student

calculăm valoarea tabelară a testului Student în dependenţa de nivelul de semnificaţie şi n-1 grade de libertate

11

ceea ce semnifică respingerea ipotezei nule şi acceptarea alternativei, care denotă diferenţiere semnificativă a coeficientului a1 di zero. Acest lucru presupune că variabila X1are o influenţă puternică asupra variabilei Y.

b)

valoarea calculată a testului este:

Dacă rezultă că se acceptă alternativa, ceea ce înseamnă că coeficienţii a1 şi a2 sunt diferiţi de 1 şi respectiv, -0,5.

8) Intervalul de încredere pentru variaţia erorilor Intervalul de încredere a varianţei erorilor permite determinarea variaţiei amplitudinii erorilor.Intervalul de încredere se calculează conform formulei:

Aşadar 3,2933 20,7531

9) Adăugarea variabilelor explicative X2 şi X3 ameliorează semnificativ calitatea estimaţiei în raport cu X1 singur?

Deoarece adăugarea unor variabile explicative în model are drept efect creşterea SPE şi o reducere a SPR, vom vedea diferenţa între SPE (a modelului cu toate variabilele explicative incluse) şi ( a modelului cu o singură variabilă explicativă X1) va fi semnificativ pozitivă.

Solutionăm modelul cu o singură variabilă explicativă X1

Vom estima valorile parametrilor modelului în vaza metodei centrării datelor, calculele pentru aflarea parametrilor şi sunt redate în tabelul de mai jos:

Tabelul 5

Y X Ұ X-X¯ Ұ*( ) (X-X¯) Ŷ e e SPE23 2 -5.71 -4.07 23.26531 16.57653 24.59478 -1.59 2.543321 16.97033

25 1 -3.71 -5.07 18.83673 25.71939 23.58297 1.417 2.007972 26.33039

21 3 -7.71 -3.07 23.69388 9.433673 25.60659 -4.61 21.22065 9.657785

27 6 -1.71 -0.07 0.122449 0.005102 28.64201 -1.64 2.696209 0.005223

25 7 -3.71 0.93 -3.44898 0.862245 29.65382 -4.65 21.65806 0.882729

30 8 1.286 1.93 2.479592 3.719388 30.66563 -0.67 0.443064 3.807748

32 8 3.286 1.93 6.336735 3.719388 30.66563 1.334 1.780541 3.807748

30 5 1.286 -1.07 -1.37755 1.147959 27.63021 2.37 5.615928 1.175231

32 5 3.286 -1.07 -3.52041 1.147959 27.63021 4.37 19.09511 1.175231

12

27 8 -1.71 1.93 -3.30612 3.719388 30.66563 -3.67 13.43685 3.807748

30 4 1.286 -2.07 -2.66327 4.290816 26.6184 3.382 11.43524 4.392752

32 9 3.286 2.93 9.622449 8.576531 31.67744 0.323 0.104045 8.78028

36 12 7.286 5.93 43.19388 35.14796 34.71287 1.287 1.656716 35.98296

32 7 3.286 0.93 3.05102 0.862245 29.65382 2.346 5.50455 0.882729

402 85 0,0 0,0 116.2857 114.9286 402 0,0 109.1983 117.6589

Demonstraţie:

Ecuaţia modelul pe care îl analizăm este:Y=22,57116+1,011809X+eIar

Calculăm mai întîi , apoi . Avînd aceste date putem determina cu uşurinţă valoarea sumei patratelor totale care rezidă din următoarea relaţie:

Testăm ipotezele următoare cu ajutorul testului Fisher:

unde k – numărul de variabile explicative a modelului complet iar

- numărul de variabile explicative a modelului fără variabilele ajutătoare.

13

Comparînd rezultatele observăm că valoarea testului F calculat este mai mică decît valoarea tabelară a

lui (3,09504<4,103). Aşadar, se acceptă ipoteza nulă care denotă faptul că nu există diferenţă esenţială între cele două variabile exogene. Deci, adăugarea variabilelor X2 şi X3 nu ameliorează semnificativ calitatea estimaţiei modelului cu o singură variabilă independentă.

10) Regresia e global semnificativă?

Acest test pune problema existenţei unei variabile explicative care să influenţeze variabila Y semnificativ.

Adică

există cel puţin un coeficient diferit de zero.În cazul în care ipoteza nulă este acceptată semnifica că nu există nici o relaţie liniară esenţială între

variabila endogenă şi variabilele exogene, adică suma patratelor explicative nu este semnificativ diferit de zero. Regresia este considerată esenţială dacă variabila explicativă este diferită de zero. Pentru aceasta se foloseşte tabelul de analiză a varianţei şi testul Fisher.(vezi tabelul 6).

Tabelul 6

Nr Ŷ- (Ŷ- ) e e1 -4.87 23.75092 -5.71 32.65306 -0.8408 0.7069362 -5.32 28.31436 -3.71 13.79592 1.6068 2.5819293 -4.53 20.5593 -7.71 59.5102 -3.18 10.112714 -3.32 11.02102 -1.71 2.938776 1.6055 2.5776495 -0.02 0.000288 -3.71 13.79592 -3.6973 13.670226 0.164 0.026807 1.286 1.653061 1.122 1.2588557 4.487 20.13467 3.286 10.79592 -1.2015 1.4434898 1.143 1.306714 1.286 1.653061 0.1426 0.0203349 -1.2 1.445445 3.286 10.79592 4.488 20.1419710 1.048 1.098067 -1.71 2.938776 -2.7622 7.62959911 0.203 0.041097 1.286 1.653061 1.083 1.17286912 4.185 17.51533 3.286 10.79592 -0.8994 0.80895313 4.991 24.91128 7.286 53.08163 2.2946 5.26516214 3.047 9.284186 3.286 10.79592 0.2387 0.056986

∑ 0 159.4095 0 226.8571 0 67.44767

Ecuaţia fundamentală de analiză a variaţiei este:SPT=SPE+SPR226,8571=159,4095+67,44767Pentru a calcula valoarea testului Fisher mai e nevoie de calculat coeficientul de determinaţie

valoarea calculată a testului Fisher se realizează în baza relaţiei de mai jos

14

Faptul că 7,87818>F =3,98 demonstrază că idea de nulitate a coeficienţilor este respinsă, rezultă deci că se acceptă alternativa care ne spune că regresia este global semnificativă.

12) calcularea previziunii şi intervalul de încredere pentru următoarele două perioade.Se cunosc datele:

(15)=3 (16)=6(15)=24 (16)=38(15)=165 (16)=170

a) Previziunea pentru perioada 15 şi 1643,14868+0,801901 -0,381362 -0,037132

=30.2748şi

b) Intervalul de previziune pentru perioada 15 şi 16.

varianţa erorilor de previziune este:

Pentru perioada 16 va fi:

Aşadar intervalele de previziune pentru perioada 15 şi 16 vor fi următoarele:

15

Modelul Multiplu

Documents