-
PENYELESAIAN KASUS MULTIKOLINEARITAS
PADA DATA PENJUALAN PERALATAN ELEKTRONIK DENGAN
METODE BEST SUBSET REGRESSION
MAKALAH
Disusun untuk memenuhi tugas mata kuliah Analisis Regresi
yang dibina oleh Ir. Hendro Permadi, M.Si
Oleh
Anita Hermaningtyas 408312408019
Rina Uktafiya 408312409119
Umi Qoiriah 408312409125
Dwi Rahmawati Utami 40831240913
UNIVERSITAS NEGERI MALANG
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
PROGRAM STUDI MATEMATIKA
Desember 2010
-
BAB 1
PENDAHULUAN
A. Latar Belakang
Regresi dalam statistika adalah salah satu metode untuk
menentukan
hubungan suatu variabel terhadap variabel yang lain. Variabel
yang pertama
disebut dengan variabel bebas atau variabel karena seringkali
digambarkan
dalam grafik sebagai absis. Variabel yang kedua adalah variabel
terikat atau
variabel , dalam grafik digambarkan sebagai ordinat. Kedua
variabel ini
biasanya merupakan variabel acak (random).
Apabila kita menggunakan model regresi
, dalam hal ini kita mempunyai asumsi bahwa , , , , sebagai
variable-variabel bebas tidak berkorelasi satu sama lain.
Seandainya variable-
variabel bebas tersebut berkorelasi satu sama lain, maka
dikatakan terjadi
kolinearitas berganda (multicollinearity). Ada kemungkinan
terjadi 2 variabel atau
lebih mempunyai hubungan yang sangat kuat sehingga pengaruh
masing-masing
variable tersebut terhadap sukar untuk dibedakan (Supranto,
2001).
Multikolinearitas adalah kondisi terdapatnya hubungan linier
atau korelasi
yang tinggi antara masing-masing variabel independen dalam model
regresi.
Multikolinearitas biasanya terjadi ketika sebagian besar
variabel yang digunakan
saling terkait dalam suatu model regresi. Oleh karena itu
masalah
multikolinearitas tidak terjadi pada regresi linier sederhana
yang hanya
melibatkan satu variabel independen.
Best subset adalah suatu metode pemilihan variable X yang
memuat
hubungan terbaik dengan variable Y. Menaksir persamaan regresi
semua
kemungkinan menggunakan semua kemungkinan kombinasi dari
variabel
independen. Pilih terbaik sesuai dengan mencari disesuaikan
tertinggi di R2 dan
standart error terendah.
-
B. Rumusan Masalah
1. Bagaimana mengidentifikasi multikolinearitas?
2. Bagaimana cara mengatasi multikolinearitas?
3. Bagaimana aplikasi dari metode best subset?
C. Tujuan
1. Untuk mengetahui mengidentifikasi multikolinearitas.
2. Untuk mengetahui cara mengatasi multikolinearitas.
3. Untuk mengetahui aplikasi dari metode best subset.
-
BAB II
PEMBAHASAN
Dalam suatu penelitian ilmiah biasanya yang diteliti adalah
hubungan
antara peubah, dimana perubah itu sebut saja hubungan antara
peubah, dimana
peubah itu sebut saja peubah bebas dan peubah tak bebas .
Hubungan tersebut
dapat pula berupa hubungan fungsional antar peubah yang satu
dengan peubah
yang lain. Tetapi masing-masing peubah merupakan bilangan
random, sehingga
bilamana peubah dipengaruhi atau ditentukan besarnya oleh peubah
maka
dapat dikatakan bahwa permasalahan tersebut dapat diselesaikan
dengan
menggunakan teknik analisis regresi (Nugroho, 1990b).
Dalam penelitian ini analisis yang dipergunakan adalah Analisis
Regresi
Berganda. Menurut Nugroho (1990b) ada beberapa alas an
dipergunakan Regresi
Berganda :
a. Membuat persamaan di dalam yang memberikan prediksi yang
terbaik
terhadap . Dengan adanya banyak peubah , mungkin juga termasuk
di
dalamnya pemilihan subset yang terbaik untuk memprediksi .
b. Dengan mengetahuinya peubah-peubah yang berpengaruh terhadap
,
mungkin perlu membuat rangking yang didasarkan pada besarnya
pengaruh terhadap .
Analisis Regresi Linier Berganda merupakan bentuk umum
sedangkan
Regresi Linier Sederhana merupakan bentuk khusus dari Regresi
Linier Berganda
yaitu apabila satu peubah bebas yang dilibatkannya
(Yitnosumartono, 1988)
Dalam regresi linier berganda terdapat satu peubah tak bebas
yang akan
dilihat hubungannya dengan dua atau lebih peubah bebasnya,
umpakan bahwa
pengamatan-pengamatan dapat dinyatakan dengan fungsi-fungsi
linier dari
beberapa , , , ..., yang diketahui dan faktor sisa. Model
populasinya
adalah sebagai berikut:
................................... 5.8
-
I = 1, 2, 3, ...,
Dimana = Nilai pengamatan yang ke-
, ..., = peubah bebas yang menentukan nilai pengamatan ke-
, ..., = koefisien-koefisien regresi sebagian (parsial)
untuk
peubah , ..., , secara berturut-turut.
= titik potong sumbu
= faktor sisaan yang ke-
= banyaknya pengamatan
Berdasarkan dari matriks korelasi kita dapat mengetahui
gambaran
kolinearitas ganda antara peubah bebas secara kasar dengan jalan
menggunakan
metode membanding koefisien korelasi dalam matriks korelasi
dengan nilai kritis
pada taraf nyata . Dari koefisien yang terpilih lalu dihitung
korelasi parsialnya
setelah itu langsung dilakukan pengujian hipotesis dimana :
Adapun statistik uji yang digunakan adalah :
dimana :
= banyaknya pengamatan
= banyaknya peubah bebas
Bila mana benar maka mengikuti distribusi dengan derajat
bebas
pada taraf nyata , jika ( ) maka ditolak yang berarti
kolinearitas ganda disebabkan karena dan terjadi secara
bersama-sama
dalam regresi.
Multikolinieritas (kolinearitas ganda) ditemukan oleh Ragner
Frisch yang
berarti adanya hubungan linier yang sempurna atau pasti diantara
beberapa atau
semua variabel yang menjelaskan ( , , ..., ) dari model
regresi.
Beberapa cara mengetahui apakah suatu model regresi itu
mempunyai
kolinearitas ganda atau tidak adalah sebagai berikut:
-
a. Suatu model yang variable-variabel penjelasnya bersifat
kolinearitas
memperlhatkan tanda-tanda sebagai berikut:
1. Koefisien determinasi ganda tinggi
2. Koefisien korelasi sederhananya tinggi
3. VIF (Variance Inflation Factor )
Jika nilai VIF lebih besar atau sama dengan 10, menandakan
adanya
multikolinieritas pada variabel bebas.
4. Tak satupun (sedikit sekali diantaranya) variable-variabel
bebas
memiliki uji- yang signifikan, walaupun keadaan 1, 2 dan 3
terpenuhi.
b. Jika hanya ada dua variable bebas yang ternyata korelasi
antara kedua
variable itu tinggi, maka dapat merupakan indikasi bahwa dalam
model
tersebut terjadi kolinearitas. Akan tetapi apabila model itu
mempunyai
lebih dari dua variable bebas, walaupun korelasi antara dua
variable
rendah, tidak dapat menjadi jaminan bahwa model tersebut tida
bersifat
multikollinearitas.
c. Apabila model yang akan diuji adalah: ( ) dengan
koefisien determinasi gandanya adalah tinggi yakni:
mendekati 1,
akan tetapi ,
, mempunyai nilai yang sangat rendah
dibandingkan nilai kofisien determinasi ganda antara dengan , ,
dan
berarti ada kolinearitas ganda.
d. Mengadakan uji antara variable-variabel bebasnya. Jika
hitung
dibandingkan dengan tabel dan ternyata signifikan maka dapat
dianggap
bahwa ada multikolinearitas (Awat, 1995).
Akibat Adanya Kolinearitas Ganda
Jika hubungan antar variable bebasnya sempurna, maka
koefisien
regresi parsial tak akan dapat diestimasi.
Kalau hubungan tersebut tidak sempurna, maka koefisien
regresi
parsial masih bisa diestimasi, tetapi kesalahan baku dari
penduga
koefisien regresi parsial sangat besar. Hal ini menyebabkan
pendugaan/peramalan nilai kurang teliti.
-
Cara Mengatasi Masalah Kolinearitas Ganda
Memeriksa secara teoritis untuk mengetahui apakah antara
variable
bebas memang ada hubungannya.
Mengadakan penggabungan antara data cross-section dan time
series,
yang akan disebut sebagai polling data.
Mengeluarkan salah satu variable bebasnya dari model
tersebut.
Mentransformasi variable yang ada dalam model.
Menambah data baru, yakni menambah jumlah observasi atau .
Dengan semakin besarnya , maka ada kemungkinan bahwa
standard
error akan semakin kecil pula.
Best Subset Regression
Regresi terbaik(best subsets regression) digunakan untuk
meregresikan
satu peubah respon pada semua kemungkinan kombinasi subset
peubah-peubah
prediktor dan kemudian memilih subset terbaik untuk setiap
ukuran (size)
informasi model terbaik ini dipilih berdasarkan nilai R-square
terbesar. Pada
setiap regresi subset terbaik ditampilkan statistik, yaitu :
R-sq, adj R-sq, S dan C-
p. Jika model di fit tanpa konstanta, R-sq dan adj R-sq tidak
ditampilkan.
-
APLIKASI
P.T. Cemerlang dalam beberapa bulan gencar mempromosikan
sejumlah peralatan
elektronik dengan membuka outlet-outlet di berbagai daerah.
Berikut adalah data
mengenai kenaikan penjualan, biaya promosi, jumlah outlet, laju
penduduk,
jumlah pesaing dan income masyarakat pada bulan Mei 2010.
Kenaikan
Penjualan
(%)
Income
Masyarakat
(%)
Banyaknya
Sales
Biaya
Promosi
Outlet Pesaing Laju
Penduduk
(%)
10
12
30
25
8
38
21
14
9
17
24
48
55
35
60
5,46
2,43
2,56
3,55
4,35
3,65
3,44
2,55
4,79
2,53
2,75
2,53
3,51
2,81
3,01
205
206
254
246
201
291
234
209
204
216
245
286
312
265
322
26
28
35
31
21
49
30
30
24
31
32
47
54
40
42
159
164
198
184
150
208
184
154
149
175
192
201
248
166
287
15,00
16,00
19,00
17,00
11,00
24,00
16,00
10,00
1,35
2,13
2,64
1,63
2,53
2,54
1,53
2,00
1,50
1,75
1,64
2,65
1,45
1,67
2,74
14,00
14,00
11,00
19,00
21,00
18,00
18,00
-
Keterangan :
= Kenaikan penjualan
= Income masyarakat
= Banyaknya sales
= Biaya Promosi
= Outlet
= Pesaing
= Laju penduduk
Dari hasil minitab yang didapat untuk mencari best subset dicari
C-P
dengan nilai terkecil, S terkecil, dan R-Sq (Adj) terbesar.
-
Sedangkan,
Dari data di atas dapat dilihat bahwa pada regresi dan
korelasinya ada
perubahan tanda sehingga menunjukkan bahwa data tersebut
multikolinearitas.
Lalu kita mulai menggunakan metode best subset yaitu dicari C-P
dengan
nilai terkecil, S terkecil, dan R-Sq (Adj) terbesar.
-
Dari keterangan di atas dapat dilihat R-sq yang besar dengan C-p
dan S
terkecil adalah persamaan dengan variable , , , , , .
Menganalisis dengan melihat nilai C-p bukan terkecil, Sterkecil,
dan R-Sq
(Adj)
-
Dapat dilihat bahwa pada persamaan regresi tersebut masih
terdapat
perubahan tanda sehingga masih terdapat kasus multikolinieritas
sehingga
persamaan regresi tersebut juga masih mengandung kasus
multikolinieritas.
Oleh karena itu, kita cari persamaan regresi yang lebih baik
dengan C-p
terkecil selanjutnya dan beda R-sq yang tidak jauh dari R-sq
yang terbesar sehigga
diperoleh persamaan regresi terbaik.
Selanjutnya dipilih variable , , dan karena memiliki C-p dan s
terkecil
dan R-Sq (Adj ) terbesar.
Berdasarkan hasil regresi di atas dapat dilihat bahwa masih
terjadi perubahan
tanda pada persaman regresinya..Sehingga masih terjadi kasus
multikolineariatas.Oleh karena itu perlu dipilih kemungkinan
variable yang lain
dengan 2 variabel yang merupakan variable terbaik.
Berikut ini analisis regresi dari dengan variabel bebas dan
dengan C-
p terkecil namun bukan terkecil dan R-Sq(Adj) bukan
terbesar.
Lalu diregresikan :
-
Dari analisis di atas, nampak bahwa pada persamaan regresi sudah
tidak terjadi
perubahan tanda lagi. Serta VIF dari kedua variabel tersebut
keduanya kurang dari
5. Sehingga dapat disimpulkan bahwa variabel yang paling
berpengaruh terhadap
yaitu dan sehingga model regresi yang terbaik yaitu
dengan R-sq = dan R-sq(adj) = yang
selisihnya tidak jauh dari R-sq yang terbesar.
-
BAB III
KESIMPULAN
Berdasarkan pembahasan data di atas dapat disimpulkan bahwa:
1. Dari data penelitian kenaikan penjualan peralatan elektronik
pada PT
Cemerlang, ternyata terjadi kasus multikolinieritas. Maka untuk
mengatasinya
digunakan metode best subset regression.
2. Dari hasil analis menggunakan metode best subset regression
diperoleh 2
variable yang paling mempengaruhi kenaikan penjualan peralatan
elektronik,
yaitu banyaknya sales dan benyaknya pesaing.
3. Dengan menggunakan metode best subset regression diperoleh
model regresi
terbaik yaitu dengan nilai C-P = 1,6 merupakan nilai paling
kecil, nilai
bukan terkecil, nilai R-Sq (Adj) = , dengan persamaan
regresi
4. Dari kesimpulan 1, 2, 3 dapat disimpulkan bahwa semakin
banyak sales dan
sedikit pesainga, semakin tinggi kenaikan penjualan peralatan
elektronik.
DAFTAR PUSTAKA
Permadi, Hendro. 1999. Teknik Analisis Regresi. UM Press:
Jakarta.
http://myunanto.staff.gunadarma.ac.id/Downloads/files/19417/BAB+15+REGRE
SI+TIP+TRIK+BERBAGAI+METODE+REGRESI+BERGANDA.pdf