-
12. KORELACIJAPod pojmom korelacije podrazumijevamo
meuzavisnost, odnosno povezanost sluajnih varijabli. Mjera stupnja
podudarnosti (slaganja) sluajnih varijabli predstavlja mjeru
korelacije.
Korelacija moe biti pozitivna i negativna po smjeru. Pozitivna
korelacija je onda kada rast jedne varijable prati rast druge
varijable, odnosno pad jedne varijable prati pad druge. Negativna
korelacija znai da rast jedne varijable prati pad druge
varijable.
Ukoliko je korelacija potpuna, radi se o funkcionalnoj
povezanosti varijabli. Tada se vrijednost jedne sluajne varijable
moe se s potpunom sigurnou odrediti pomou vrijednosti druge
varijable. Ukoliko je korelacija djelomina, govorimo o stohastikoj
ili statistikoj vezi.
-
Primjer pozitivne korelacije:
Primjer negativne korelacije:
-
Primjer slabe korelacije:
-
12.1. KOEFICIJENT LINEARNE KORELACIJE Najvanija mjera linearne
korelacije meu sluajnim varijablama naziva se Pearsonov koeficijent
linearne korelacije. Primjenjuje se na omjerne i intervalne skale
mjerenja (numerike varijable).
Pretpostavka za njegovu primjenu je da su obje sluajne varijable
normalno distribuirane. Meutim, ako varijable X i Y nisu normalno
distribuirane svejedno se moe primijeniti Pearsonov koeficijent
linearne korelacije ako je broj parova dovoljno velik.
-
Ovako se izraunava:Izraz u brojniku podijeljen s n naziva se
kovarijancom, ili prvim mjeovitim momentom oko vrijednosti
aritmetikih sredina sluajnih varijabli X i Y.
-
Testiranje znaajnosti koeficijenta linearne
korelacije:Testiranje znaajnosti koeficijenta linearne korelacije
provodi se t-testom:
Ukoliko je koeficijent linearne korelacije osnovnoga skupa
jednak nuli, onda sampling distribucija koeficijenata linearne
korelacije tei normalnome obliku ako broj parova vrijednosti
sluajnih varijabli X i Y tei k beskonanosti. Ukoliko je broj parova
mali (n < 30) moe se koristiti Studentova distribucija.
-
Test veliina je ova:
Za velike uzorke standardna greka rauna se ovako:dok se za male
uzorke izraunava ovako:
-
Testiranje korelacije izmeu visine i teine:
-
Korelacija teaja HRK, izvoza i uvoza:
-
Zakljuak o statistikoj znaajnosti izvodi se kao i kod ostalih
testova. Ako je signifikantnost testa manja od 5% onda se prihvaa
alternativna hipoteza, odnosno koeficijent linearne korelacije je
statistiki znaajan. Kao i kod ostalih testova koji koriste ttest,
moe se takoer provesti i jednosmjerno testiranje ukoliko a priori
znamo predznak koeficijenta linearne korelacije a potrebno je samo
testirati njegovu statistiku znaajnost. Jednosmjerno testiranje ide
u korist alternativne hipoteze jer je za njeno prihvaanje potrebita
upola manja signifikantnost negoli kod dvosmjernoga testa.
Jednosmjerni testovi imaju veu snagu.
VANA NAPOMENA: Kod koeficijenta korelacije treba gledati i
njegovu praktinu znaajnost, a ne samo statistiku znaajnost.
-
Praktina znaajnost:Obino se ovako odreuje praktina
znaajnost:
r > 0.80 radi se o jakoj pozitivnoj korelaciji,
0.50 < r 0.80, radi se o srednje jakoj pozitivnoj
korelaciji,
0 < r 0.50, radi se o slaboj pozitivnoj korelaciji.
Na isti nain zakljuuje se ako je korelacija negativna. Neki
autori imaju neto drugaiji pristup navedenome problemu, ali to
ionako nije zasnovano na statistikoj matematici.
-
12.2. KOEFICIJENT PARCIJALNE KORELACIJEKoeficijent parcijalne
korelacije predstavlja mjeru korelacije izmeu dviju varijabli uz
istodobno iskljuenje utjecaja drugih varijabli. Npr. ukoliko rastu
cijene, potranja bi trebala opadati, meutim ako rastu i primanja
onda rast primanja kompenzira porast cijena.
Tako se moe dogoditi da dobijemo pozitivan koeficijent linearne
korelacije izmeu porasta cijena i porasta potranje. Ukoliko
uporabimo koeficijent parcijalne korelacije (iskljuimo utjecaj
primanja) koeficijent linearne korelacije imat e negativan
predznak, kako sugegira i ekonomska teorija.
-
Ukoliko radimo s tri varijable, tada se moe primijeniti sljedei
izraz:gdje oznaka Cij znai kofaktor (algebarski komplement) matrice
korelacijskih koeficijenata: .gdje je Mij odgovarajui minor
(subdeterminanta) matrice korelacijskih koeficijenata.
-
Matrica korelacijskih koeficijenata je sljedea:Radi se o
simetrinoj matrici.
-
12.3. KOEFICIJENT KORELACIJE RANGAOd svih koeficijenata koji
koriste rangove umjesto originalnih vrijednosti najvie u uporabi je
Spearmanov koeficijent korelacije ranga. Njegova vrijednost kree se
u istome rasponu kao i koeficijent linearne korelacije. Najee se
koristi za mjerenje korelacije izmeu redosljednih obiljeja ili
obiljeja ranga, ali se moe koristiti i kod numerikih varijabli
ukoliko nisu zadovoljene pretpostavke za primjenu Pearsonovoga
koeficijenta linearne korelacije. U tome sluaju ne koriste se
numerike vrijednosti varijabli X i Y nego njihovi rangovi. Rauna se
ovako:
-
Primjer: Korelacija izmeu bodova na dvama testovima za 10
studenata:Razlika rangova
Bodovi na testu ABodovi na testuB Rang varijable X Rang
varijable Y Razlika rangova
653480453478604610012080287088508090809811061.5831.57549105137258591010.55-4-0.52-3-10010.2525160.249100056.50
-
Formula za raunanje Spearmanovoga koeficijenta korelacije
ranga:Spearmanov koeficijent korelacije ranga spada u
neparametrijsku statistiku te samim time ima slabiju snagu negoli
Pearsonov koeficijent linearne korelacije.
Znaajnost Spearmanovoga koeficijenta korelacije ranga testira se
na isti nain kao i Pearsonovoga koeficijenta linearne
korelacije.