Compartimentul 3 Atenuarea multicoliniarităţii Spre deosebire de modelul unifactorial în cazul modelului multifactorial, ipoteza 1 1 presupune independenţa variabilelor explicative. Nerespectarea ei produce fenomenul de multicoliniaritate cazul, în care o variabilă endogenă este explicată de mai multe variabile explicative. Frecvenţa relativ ridicată a coliniarităţii dintre variabilele explicative se datorează gradului ridicat de interdependenţă din economie. Existenţa multicoliniarităţii este semnalată de 1) analogiile în evoluţia a variabilelor explicative; 2) apropierea de zero a determinantului X T X; 3) mărimea coeficientului de determinaţie multiplă (R 2 ) care aproape coincide cu mărimea lui în cazul în care una dintre variabilele cauzale este omisă; 4) contrazicere în verificarea testelor şi anume testul F aplicat valorilor teoretice este semnificabil, iar testul t, aplicat parametrilor de regresie semnalează ne semnificaţii în rândul parametrilor. Atenuarea multicoliniarităţii. 1) Dacă seriile de date sunt formate dintr-un număr redus de termeni (n<10), atunci se recomandă includerea de termeni suplimentari (n>15), astfel încât întâmplătoarele analogii să fie, pe cât posibil, eliminate. 2) În cazul corelării intense a 2 variabile exogene, se renunţe la una din ele, considerându-se că variabila omisă 45
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Compartimentul 3Atenuarea multicoliniarităţii
Spre deosebire de modelul unifactorial în cazul modelului multifactorial, ipoteza 11
presupune independenţa variabilelor explicative. Nerespectarea ei produce fenomenul de
multicoliniaritate cazul, în care o variabilă endogenă este explicată de mai multe variabile
explicative.
Frecvenţa relativ ridicată a coliniarităţii dintre variabilele explicative se datorează
gradului ridicat de interdependenţă din economie.
Existenţa multicoliniarităţii este semnalată de
1) analogiile în evoluţia a variabilelor explicative;
2) apropierea de zero a determinantului XTX;
3) mărimea coeficientului de determinaţie multiplă (R2) care aproape coincide cu
mărimea lui în cazul în care una dintre variabilele cauzale este omisă;
4) contrazicere în verificarea testelor şi anume testul F aplicat valorilor teoretice este
semnificabil, iar testul t, aplicat parametrilor de regresie semnalează ne semnificaţii în rândul
parametrilor.
Atenuarea multicoliniarităţii.
1) Dacă seriile de date sunt formate dintr-un număr redus de termeni (n<10), atunci se
recomandă includerea de termeni suplimentari (n>15), astfel încât întâmplătoarele analogii să
fie, pe cât posibil, eliminate.
2) În cazul corelării intense a 2 variabile exogene, se renunţe la una din ele,
considerându-se că variabila omisă este exprimată de către cea reţinută în model.
3) Dacă datele sunt prezentate sub formă de serii cronologice, se poate proceda la
calculul diferenţelor de ordinul 1 (yi -yi+1) sau la logaritmarea valorilor yi, x1i, x2i, ..., în
scopul atenuării coliniarităţii, prilejuite de prezenţe trendului în date.
Procedee de selecţie a variabilelor exogene în cazul unui model multifactorial.
Eliminarea fenomenului de coliniaritate implică calcularea coeficienţilor de corelaţie
liniară din trei variabilele exogene şi ry/x, coeficienţii de corelaţie liniară dintre variabila
explicată y şi variabilele sale explicative xi. Dacă va trebui ca una din cele două
variabile să fie eliminate din rândul variabilelor exogene.
45
Criteriul de excludere / includere a 2 variabile exogene care-s corelate liniar:
Dacă - se exclude Xj şi se reţine Xi; în caz contrar se exclude Xi şi se reţine Xj.
Astfel în prima etapă reţinând k variabile exogene liniar independente - fiind posibilă
estimarea celor (k+1) parametri se poate trece la etapa în care se continuă operaţia de selecţie a
variabilelor exogene xi.
În acest scop sunt mai multe procedee.
Primul procedeu
în model se introduc cele k variabile exogene, ordinea de includere fiind dată de
mărimea coeficienţilor de corelaţie a variabilei Y în raport de factorii săi:
În aşa fel se obţin k modele:
După cum ştim:Variaţie totala a variabilei Y = Variaţia explicată de modelul M(j) +Variaţie reziduală
Analiza acestor modele pe baza ANOVA prezentăm în tabelulTabelul 3.1
Măsura variaţieiSurse de variaţie Explicată de
modelNumărul de
grade de libertate
Reziduală Numărul de grade de libertate
x1
x1, …., xj
x1, …, xj, …, xk
xj+1, …, xk
Totală
1jk
k-jn-1
-
n-2n-(j+1)n-(k+1)
-
Din ultima relaţie uşor se obţine coeficientul de determinaţie:
care măsoară ponderea din variaţia totală a variabilei dependente z explicată de modelul M(j);
Coeficientul de determinaţie şi exprimă ponderea din variaţia
totală a variabilei y neexplicată de modelul M(j).
46
Pe baza acestor relaţii se pot formula criteriile de alegere a modelului optim M(r) din
grupul de modele M(j), şi anume sau sau
, gradul de semnificaţie a acestor mărimi fiind în prealabil verificat
cu ajutorul testului F.
Al doilea procedeu porneşte de la premiza că cei (k+1) factori de influenţă ai variabilei
explicate y sunt liniari independenţi. În aceste condiţii matricea (XT X)-1se calculează şi
cu ajutorul ei se estimează parametrii şi dispersiile acestora obţinându-se modelul
Apoi se testează semnificaţie estimatorilor cu ajutorul testului t cu pragul de
semnificaţie şi (n-(k+1)) grade de libertate.
Dacă atunci este semnificativ diferit de zero, în caz contrar
este nesemnificativ diferit de zero.
Presupunând că diferă de zero pentru j=0,1,...,r şi nu diferă semnificativ de
zero pentru j=r+1,...,k înseamnă că (xj)jr nu influenţează semnificativ variabila y şi pot fi
excluşi, astfel modelul va fi construit pe baza variabilelor exogene (xj), (Vjn). Al treilea
procedeu:
Teste de determinare a multicoliniarităţii.
l) Testul Klein
Acest test este fondat pe compararea coeficientului de determinaţie R2y calculat pentru
modelul cu k variabile exogene: şi coeficienţii de corelaţie simplă
între variabile explicative pentru ij.
Dacă există prezumtia multicoliniarităţii.
2) Testul Farrar et Glauber
Etapa 1. Calculăm determinantul matricei coeficienţilor de corelaţie între variabilele
explicative:
Dacă valoarea determinantului D tinde spre zero, riscul
47
multicolinarităţii e mare.
De exemplu, pentru in model de 2 variabile explicative, dacă ambele serii sunt perfect
corelate, atunci determinantul , iar în cazul când seriile sunt
ortogonale determinantul devine .
Etapa 2 .Efectuăm un test 2, verificând ipotezele următoare:
I0: D=1 (seriile sunt ortogonale).
I1: D<1 (seriile sunt dependente).
Valoarea empirică 2calculată
pentru un eşantion de n observaţii şi K numere de variabile
explicative (K=k+1 dacă termenul constant se include) este 2calc =-[n-1—1/6
(2k+5)LnD. Dacă tabelar cu 1/2 k(k-1) grade de libertate şi un prag de semnificaţie
, atunci ipoteza I0 este respinsă, are loc prezumţie multicoliniarităţii.
Dacă 2calc 2
tab se acceptă ipoteza de ortogonalitate.
Deasemenea pentru eliminarea multicoliniarităţii se aplică: METODA REGRESIEI
CONSECUTIVE.
Studiul de caz 3 (rezolvat)
În tabelul 3.2, ce urmează, sunt prezentate datele ce se referă la volumul producţiei
lansate şi a resurselor utilizate (capitalul fix şi munca) în industria unei ţări pe o perioadă de
10 ani (ritmurile de creştere a factorilor). În scopul simplificării analizei, datele au fost
logaritmate. Rezultatele obţinute formează conţinutul tabelului 3.2.
În acest tabel sunt folosite următoarele notaţii: X1=lgZ; X2=lgK; Y=(lgP-1), unde Z, K, P
reprezintă respectiv munca, capitalul fix şi volumul producţiei: