This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Sem. 1
Lucrare de laborator 2 Modelul econometric multiplu
Se cunosc următoarele date: Y=Y+N, unde N este numarul din registrul grupeiTabelul 1 „Datele generale”
Nr.crt. Y X1 X2 X31 23 2 45 101
2 25 1 43 112
3 21 3 43 134
4 27 6 47 125
5 25 7 42 109
6 30 8 41 136
7 32 8 32 112
8 30 5 33 127
9 32 5 41 108
10 27 8 38 143
11 30 4 32 141
12 32 9 31 152
13 36 12 35 154
14 32 7 29 160
Total 402 85 532 1814
Se cere:1) De creat şi de specificat modelul liniar general ce descrie legătura dintre variabile.2) De scris modelul în formă matriceală şi de specificat bine dimensiunile fiecărei matrice. De
soluţionat modelul.3) De soluţionat modelul folosind metoda centrării datelor.4) De calculat estimaţia varianţei erorilor şi abarerile standard pentru fiecare coeficient.5) De calculat şi , de explicat rezultatele obţinute.6) Coeficienţii şi simultan diferiţi de 1 şi -0,5?7) Sunt coeficienţii şi semnificativ diferiţi de 1 şi -0,5?8) Care este intervalul de încredere pentru variaţia eroril0r, dacă probabilitatea cu care se
garantează rezultatele este de 95%?9) Adăugarea variabilelor explicative şi ameliorează semnificativ calitatea estimaţiei în
raport cu singur?10) Coeficienţii sunt semnificativi diferiţi de zero, regresia este global semnificativă?11) Calculaţi previziunea şi intervalul de încredere pentru următoarele două perioade, dacă se
cunosc următoarele date:
1
(15)=3 (16)=6(15)=24 (16)=38(15)=165 (16)=170
Rezolvare:
1) Pe baza datelor prezentate în tabelul 1 vedem că avem o variabilă dependentă de mai multe variabile independente ceea ce ne demonstrează că modelul nostru econometric este unul liniar general de forma:
Y=fUnde: Y – valorile reale ale variabilei dependente;
- valorile reale ale variabelelor independente sau explicateve; - eroare de specificare.
Forma funcţie se poate vedea prin intermediul graficelor care arată dependenţa variabilei de explicat în raport cu variabilele explicative (vezi fig. 1,2,3 )
Fig.1 Legatura dintre X1 si Y
2
Am făcut aceste două grafice numerotate la fel în două programe diferite(excel si eviews) pentru a vedea asemănarea. Punctele sunt repartizate la fel indiferent de programul prin care facem graficele. În continuare voi prezenta doar graficele din eviews.
Fig.2 Legătura dintre X2 şi Y
Fig.3 Legătura dintre X3 şi Y
Fig.1 Legatura dintre X1 si Y
20222426283032343638
0 2 4 6 8 10 12
X1
Y
3
Analizînd graficele obţinute, şi în special norul de puncte, observăm că punctele sunt repartizate astfel încît ne sugerează o linie dreaptă. Particularităţile graficelor sunt că primul arată o linie cu panta pozitivă, al doilea grafic sugerează o linie cu pantă inversă primului grafic, iar cel de-al treilea grafic este greu de specificat. Datorită acestui fapt modelul care trebuie examinat este:
unde:Y - variabilă dependentă la observarea i;
- variabilă inde pendentă 2 explicativă la observarea i;- variabila explicarivă 2 la observarea i;
- variabila explicativă 3 la observarea i;- coeficienţii sau parametrii modelului;
- eroarea de specificare; În cazul în care scrim modelul incluzînd fiecare observare obţinem un sistem de ecuaţii liniare de
forma:
2) Modelul scris sub formă de matrice arată în felul următor:
Y=Xa+ , unde
;
;
;
iar dimensiunile matricelor sunt: (14;1) (14;4) (4;1) (14;1)
Pentru soluţionarea modelului e nevoie de estimat vectorul compus din parametrii . Estimarea parametrului prin metoda celor mai mici patrate presupune condiţia:
Dacă calculăm diferenţiala lui S în raport cu „a”, atunci obţinem relaţia care ne ajută să calculăm valoarea estimatorul :
4
asadar,
Avînd obţinute rezultatele de mai sus uşor putem să le introducem în formula noatră de aflare a valorilor vectorului .
Deci:
Voi folosi ca demonstraţie programul eviews:Pentru
5
Tabelul complet unde se află coeficienţii este următorul:
6
Tabelul de mai sus ne arată că
3) Pentru a face o comparaţie de rezultate şi în acelaşi timp o verificare dacă calculele au fost făcute corect, parametrii modelului pot fi estimaţi nu doar după metoda anterioară, dar şi prin metoda centrării datelor conform căreia:
şi Ұ= i=1,14 Pentru a continua calculele avem nevoie de valorile medii atît a variabilei
dependente cît şi a variabilelor independente. Astfel, calculăm mediile aritmetice după următoarele raporturi:
Datele egalităţilor de mai sus obţinute cu ajutorul mediilor calculate anterior sunt date în tabel (vezi tabelul 2):
Forma matriceală a modelului o putem scrie şi sub forma: Y=Xa+=> sau într-o formă mai redusă => că Ұde unde
Asadar, pentru a afla valoare vectorului avem nevoie de valoarea produsului dintre variabila X transpus şi X totul la puterea -1, şi de asemenea, de valoare produsului dintre X transpus şi Y. Deci avem următoarea matrice:
Datele din matricea anterioară sunt reflectate în următorul tabel(vezi tabelul 3)
de unde rezultă că: Avînd rezultatele acestori estimatori putem calcula estimaţia termenului liber din relaţia:
=> Avînd
aceste valori putem scrie forma modelului în întregime ca rezultat astfel:
=43,14868+0,801901 -0,381362 -0,037132
Analizînd datele observăm că orice metoda adecvată folosită la rezolvarea estimatorilor obţinem rezultate identice. În cazul de faţă atît prin metoda matriceală cît şi prin metoda centrării datelor estimatorii parametrilor de regresie coincid.
Estimatorii parametrilor de regresie au următoarea semnificaţie:
-creşterea variabilei cu o unitate are drept efect creşterea variabilei dependente cu 0,801901 (un.m)
-creşterea variabilei cu o unitate are ca efect diminuarea variabilei Y deoarece parametrul lui este o valoare negativă cu 0,3813362 (un. m)
- creşterea variabilei are efectul diminuarii variabilei endogene cu 0,03713 (unităţi de măsură).
4) Calculul privind estimaţia varianţei erorilor şi abaterile standart pentru fiecare coeficient .Conform definiţiei varianţa erorilor se calculează conform următoarei formule:
Datele în baza cărora am rezolvat varianţa erorilor sunt prezente în următorul tabel(vezi tabelul 4)
Calcularea erorilor standard presupune soluţionarea următoarelor relaţii:
Matricea varcov( ) poate fi scrisă sub forma:
Dispersia coeficienţilor de regresie se află pe diagonala principală a matricei varcov( ), iar radicalul acestor dispersii sunt abaterile standard ale coeficienţilor .
5) Calcularea coeficientului de determinaţie şi coeficientul de determinaţie ajustat se face pe baza următoarelor relaţii:
Observăm că < deoarece coeficientul de corelaţie ajustat a fost corectat cu gradul de libertate. Nivelul coeficientului de determinaţie este de 0,702687 ceea ce semnifică că variabilele independente au o
10
contribuţie de 70,27% la modificările lui Y, iar restul procentajului care influienţează majorarea sau diminuarea variabilei Y este destinat altor factori aleatori care nu au fost luaţi în analiza modelului.
6) Coeficienţii a1 şi a2 sunt simultan diferiţi de 1 şi -0,5? Testarea ipotezei este:
Ipoteza nulă se acceptă în cazul cînd:
Relaţia este legea lui Fisher care semnifică testul F tabelar la pragul de semnificaţie şi q, n-k-1 grade de libertate.
Faptul că avem de testat doi parametri rezultă că q=2 iar şi .
Pentru a afla valoarea calculată a lui F mai avem nevoie de calcularea indicatorului . Calcularea lui se face astfel:
Avînd aceste date le putem înlocui direct în formulă pentru determinarea testului Fisher calculat. Aşadar,
Valoare
a tabelară a lui F este:
Comparînd valarile teoretice cu cele calculate a testul Fisher observăm că cel calculat este mai mic decît cel tabelar ceea ce semnifică acceptarea ipotezei nule. Conform ipotezei nule coeficienţii testaţi nu resping posibilitatea de a fi simultan diferiţi de 1 şi -0,5.
7) Coeficienţii a1 şi a2 sunt semnificativ diferiţi de 1 şi -0,5?
a)
Calculam valoarea calculat a testului T-Student
calculăm valoarea tabelară a testului Student în dependenţa de nivelul de semnificaţie şi n-1 grade de libertate
11
ceea ce semnifică respingerea ipotezei nule şi acceptarea alternativei, care denotă diferenţiere semnificativă a coeficientului a1 di zero. Acest lucru presupune că variabila X1are o influenţă puternică asupra variabilei Y.
b)
valoarea calculată a testului este:
Dacă rezultă că se acceptă alternativa, ceea ce înseamnă că coeficienţii a1 şi a2 sunt diferiţi de 1 şi respectiv, -0,5.
8) Intervalul de încredere pentru variaţia erorilor Intervalul de încredere a varianţei erorilor permite determinarea variaţiei amplitudinii erorilor.Intervalul de încredere se calculează conform formulei:
Aşadar 3,2933 20,7531
9) Adăugarea variabilelor explicative X2 şi X3 ameliorează semnificativ calitatea estimaţiei în raport cu X1 singur?
Deoarece adăugarea unor variabile explicative în model are drept efect creşterea SPE şi o reducere a SPR, vom vedea diferenţa între SPE (a modelului cu toate variabilele explicative incluse) şi ( a modelului cu o singură variabilă explicativă X1) va fi semnificativ pozitivă.
Solutionăm modelul cu o singură variabilă explicativă X1
Vom estima valorile parametrilor modelului în vaza metodei centrării datelor, calculele pentru aflarea parametrilor şi sunt redate în tabelul de mai jos:
Tabelul 5
Y X Ұ X-X¯ Ұ*( ) (X-X¯) Ŷ e e SPE23 2 -5.71 -4.07 23.26531 16.57653 24.59478 -1.59 2.543321 16.97033
Ecuaţia modelul pe care îl analizăm este:Y=22,57116+1,011809X+eIar
Calculăm mai întîi , apoi . Avînd aceste date putem determina cu uşurinţă valoarea sumei patratelor totale care rezidă din următoarea relaţie:
Testăm ipotezele următoare cu ajutorul testului Fisher:
unde k – numărul de variabile explicative a modelului complet iar
- numărul de variabile explicative a modelului fără variabilele ajutătoare.
13
Comparînd rezultatele observăm că valoarea testului F calculat este mai mică decît valoarea tabelară a
lui (3,09504<4,103). Aşadar, se acceptă ipoteza nulă care denotă faptul că nu există diferenţă esenţială între cele două variabile exogene. Deci, adăugarea variabilelor X2 şi X3 nu ameliorează semnificativ calitatea estimaţiei modelului cu o singură variabilă independentă.
10) Regresia e global semnificativă?
Acest test pune problema existenţei unei variabile explicative care să influenţeze variabila Y semnificativ.
Adică
există cel puţin un coeficient diferit de zero.În cazul în care ipoteza nulă este acceptată semnifica că nu există nici o relaţie liniară esenţială între
variabila endogenă şi variabilele exogene, adică suma patratelor explicative nu este semnificativ diferit de zero. Regresia este considerată esenţială dacă variabila explicativă este diferită de zero. Pentru aceasta se foloseşte tabelul de analiză a varianţei şi testul Fisher.(vezi tabelul 6).
Ecuaţia fundamentală de analiză a variaţiei este:SPT=SPE+SPR226,8571=159,4095+67,44767Pentru a calcula valoarea testului Fisher mai e nevoie de calculat coeficientul de determinaţie
valoarea calculată a testului Fisher se realizează în baza relaţiei de mai jos
14
Faptul că 7,87818>F =3,98 demonstrază că idea de nulitate a coeficienţilor este respinsă, rezultă deci că se acceptă alternativa care ne spune că regresia este global semnificativă.
12) calcularea previziunii şi intervalul de încredere pentru următoarele două perioade.Se cunosc datele:
(15)=3 (16)=6(15)=24 (16)=38(15)=165 (16)=170
a) Previziunea pentru perioada 15 şi 1643,14868+0,801901 -0,381362 -0,037132
=30.2748şi
b) Intervalul de previziune pentru perioada 15 şi 16.
varianţa erorilor de previziune este:
Pentru perioada 16 va fi:
Aşadar intervalele de previziune pentru perioada 15 şi 16 vor fi următoarele: