ANALISIS REGRESIANALISIS REGRESI
Sri Wahyu Lelly Hana Setyanti, SE, MSi
Jurusan Manajemen
Universitas Jember
ANALISIS REGRESIPENGERTIAN• Jenis uji statistika yang dipakai untuk melihat daya prediksi variabel
independen (prediktor) terhadap variabel dependen (kriterium)
JENIS ANALISIS REGRESI• Regresi Linier. Memprediksi peranan prediktor dalam persamaan linier• Regresi Non Linier. Memprediksi peranan prediktor dalam persamaan
non-linier yang dibuat oleh peneliti sendiri
PRASYARAT ANALISIS REGRESI• Variabel dependen terdistribusi normal• Korelasi antar prediktor yang rendah (tidak ada multikolinieritas)• Hubungan antara prediktor dan kriterium adalah linier• Homokedastisitas• Jika data prediktor bersifat kualitatif (jender, agama, dsb) maka perlu
ditransformasi menjadi variabel dummy
Tujuan Regresi
1. Mengestimasi nilai rata-rata variabel tak bebas dan nilai rata-rata variabel bebas
2. Menguji hipotesis mengenai sifat alamiah ketergantungan (sesuai teori ekonomi)
3. Memprediksi atau meramalkan nilai rata-rata variabel tak bebas dan nilai rata-rata variabel bebas tertentu
Analisis Regresi
• Analisis regresi pada dasarnya merupakan kajian yang bertujuan untuk menemukan sampai seberapa besar pengaruh perubahan variabel independen terhadap variabel dependen.
• Analisis regresi linier sederhana berkiatan dengan kajian untuk mengetahui pengaruh satu variabel independen terhadap satu variabel independen
• Besarnya pengaruh variabel independen terhadap variabel dependen dapat dilihat melalui koefisien regresinya
Perbedaan dengan korelasi
Perbedaan dengan korelasi
Korelasi : mengukur kekuatan atau tingkat hubungan antara dua variabel (simple correlation) dan tiga variabel (multiple correlation)
Dalam analisis regresi, ada asimetris antara variabel tak bebas dan variabel bebas. variabel tak bebas bersifat acak atau stokastik dimana variabel bebas diasumsikan mempunyai nilai yang tetap dalam pengambilan sampel berulang
Dalam Korelasi, ada simetris variabel tak bebas dan variabel bebas.
Jika terdapat 2 variabel, misalkan X dan Y yang data-datanya diplot seperti gambar dibawah
Y
X
Y
X
Y
XY
X
Definisi Pengaruh
Maka plot data yang membentuk suatu pola tertentu menunjukkan bahwa variabel X dan Y membentuk suatu hubungan
X Y hubungan
X Y pengaruh
Regresi Linier Y Terhadap X
Jika pola yang membentuk hubungan X dan Y membentuk suatu garis lurus, maka disebut Pengaruh Linier
Dimana :variabel X variabel bebas (independent)
variabel Y variabel terikat (dependent)
Nilai-nilai Y ditentukan oleh nilai-nilai X
Variabel Y dipengaruhi oleh variabel X
Variabel X mempengaruhi variabel Y
Perbedaan dengan korelasi
Korelasi : mengukur kekuatan atau tingkat hubungan antara dua variabel (simple correlation) dan tiga variabel (multiple correlation)
Dalam analisis regresi, ada asimetris antara variabel tak bebas dan variabel bebas. variabel tak bebas bersifat acak atau stokastik dimana variabel bebas diasumsikan mempunyai nilai yang tetap dalam pengambilan sampel berulang
Dalam Korelasi, ada simetris variabel tak bebas dan variabel bebas.
Regresi Linier Y Terhadap X
• Plot antara X dan Y
Y
X
Garis lurus tersebut membentuk persamaan :
Y = a + bXa disebut intersepb disebut slope
Intersep
Bila X = 0 maka Y = a
Y
X
a.
Bila a = 0 maka garis akan melalui titik (0,0)
Y
X
Slope
Slope = kemiringan
Y = a + bX
Perubahan 1 satuan pada X mengakibatkan perubahan b satuan pada Y, sehingga Y mengukur kemiringan/slope garis tersebut.
1 satuan
b satuan
Y
X
Slope
Bila b positif
Bertambahnya nilai X mengakibatkan bertambahnya nilai Y
Bila b negatif
Bertambahnya nilai X mengakibatkan berkurangnya nilai Y
Regresi Linier Sederhana
Model regresi linier yang hanya melibatkan satu variabel bebas (X). Model regresinya sbb:
XY Dimana :
Y = variabel terikatX = variable bebas, = parameter regresi
Model Regresi Sederhana
• Variabel Y disebut dengan variabel dependen. Variabel ini disebut pula dengan beberapa nama yang serupa seperti variabel terikat, variabel regressand, dan variabel endogen. Perilaku atau variasi dari variabel Y akan dijelaskan oleh model/fungsi regresi sederhana.
• notasi X mewakili variabel independen. Nama yang ekuivalen untuk X adalah variabel bebas, variabel regressor, dan variabel eksogen. Secara keseluruhan, variabel X akan menjelaskan variasi dalam variabel Y
• Notasi a dan b keduanya disebut dengan parameter model. Secara lebih spesifik, a adalah konstanta dan b adalah koefisien regresi.
Metode Pendugaan Parameter Regresi
• Nilai dugaan a dan b diperoleh dari proses sbb :
1. Dilakukan turunan pertama terhadap a dan b
n
iii
i bXaYa
e
1
2
2)(
i
n
iii
i XbXaYb
e
1
2
2)(
2. Kedua persamaan hasil penurunan disamakan dengan nol
n
i
n
iii YXbna
1 1
n
ii
n
iii
n
ii YXXbXa
1 1
2
1
n
i
n
iii
n
i
n
ii
n
iiii
XXn
YXYXn
b
1 1
2
1 11 XbYa
• Manajemen musik ingin mengetahui hubungan fungsional antara nilai penjualan album (Y) dengan biaya promosi (X) yang diyakini bahwa biaya biaya promosi dapat mempengaruhi nilai penjualan. Buatlah persamaan regresi linear yang menunjukkan hubungan antara nilai penjualan album (Y) dengan biaya promosi (X) menggunakan data berikut dengan metode kuadrat terkecil
Persamaan Regresi Sederhana
Data nilai penjualan dan biaya promosi
Nilai penjualan (Y)
Biaya promosi (X)
6461847088927277
2016342327321822
Penyelesaiannya
Y X XY X2
6461847088927277
608
2016342327321822
192
1280976
285616102376294412961694
15032
400256
1156529729
1024324
4843 4902
Mencari nilai a dan b
40)24(5,176
248
192
768
608
an
XX
n
YY
XbYa
5,14965,12352
3520
)192()902.4(8
)608)(192()032.15(82
22
XXn
YXXYnb
XY 5,140ˆ
Output SPSS
Model Summary
.824a .679 .655 2857.39756Model1
R R SquareAdjustedR Square
Std. Error ofthe Estimate
Predictors: (Constant), HARIKERJa.
Kolom “Model”Kolom ini menunjukkan jumlah model dalam cetak hasil (print out). Angka “1” memberikan informasi bahwa hanya terdapat satu model dalam print out. Jika kita menggunakan metode lainnya, seperti metode forward atau backward, maka kita akan mendapatkan lebih dari satu model. Kolom “R”Kolom ini berisikan angka koefisien korelasi. Angka ini menunjukkan tingkat keeratan hubungan secara simultan antara variabel independen dan variabel dependen.
• Kolom “R Square”• Kolom ini berisikan angka koefisien determinasi. Angka ini menunjukkan
proporsi variasi variabel dependen yang bisa dijelaskan oleh variabel independen yang ada dalam model.
• Kolom “Adjusted R Square”• Kolom ini berisikan angka koefisien determinasi yang disesuaikan. Pada
prinsipnya angka ini bermakna seperti angka koefisien determinasi. Namun, angka koefisien ini telah disesuaikan dengan banyaknya data (n) dan banyaknya variabel dalam model (k).
• Kolom “ Standard Error of the Estimate”• Kolom ini berisikan angka kesalahan standar dari model yang
diestimasikan. Kita bisa menilai keakurasian model dengan menggunakan angka ini.
AnovaANOVAb
2.25E+08 1 224884849.5 27.543 .000a
1.06E+08 13 8164720.833
3.31E+08 14
Regression
Residual
Total
Model1
Sum ofSquares df Mean Square F Sig.
Predictors: (Constant), HARIKERJa.
Dependent Variable: OUTPUTb.
Kolom “Model”. Kolom ini menunjukkan jumlah model dalam cetak hasil (print out). Berdasarkan tabel Anova ini, kita mengetahui bahwa hanya ada satu model saja dalam prinout. Kolom “Sum of Square”Kolom ini berisikan tiga angka, yaitu Regression Sum of Square, Residual Sum of Square, dan Total Sum of Square. Regression Sum of Square menunjukkan variasi dari nilai estimasi variabel dependen dari nilai meannya yang dapat dijelaskan oleh variabel regressor. Residual Sum of Square menunjukkan nilai kuadrat dari variasi nilai estimasi variabel dependen terhadap nilai aktualnya. Sedangkan Total Sum of Square merupakan jumlah dari Regression Sum of Square dan Residual Sum of Square.
• Kolom “df”• Kolom ini mengindikasikan degree of freedom (derajat kebebasan).
Degree of freedom dari Regression Sum of Square adalah ditentukan oleh formula k – 1. Degree of freedom dari Residual Sum of Square adalah ditentukan oleh formula n – k. Dan degree of freedom dari Total Sum of Square adalah ditentukan oleh formula n – 1.
• Kolom “Mean Square• Kolom ini berisikan dua angka, yaitu Regression Mean of Square dan
Residual Mean of Square. Regression Mean of Square merupakan Regression Sum of Square dibagi degree of freedomnya. Residual Mean of Square merupakan Residual Sum of Square dibagi degree of freedomnya.
• Kolom “ F”• Kolom ini berisi nilai F hitung dari model yang kita miliki. Angka ini
merupakan Regression Mean of Square dibagi Residual Mean of Square. Pebandingan nilai F pada kolom ini dengan nilai F pada tabel akan memberikan indikasi apakah secara simultan variabel independen pada model berpengaruh secara signifikan terhadap variabel dependen.
• Kolom “Sig.”• Kolom ini adalah kolom siginifikansi (probabilitas) dari
terjadinya nilai F. Angka ini dapat digunakan untuk menguji apakah secara simultan variabel independen pada model berpengaruh secara signifikan terhadap variabel dependen dengan cara membandingkannya dengan tingkat signifikansi yang kita tetapkan (α).
Coefficientsa
-53064.7 14838.710 -3.576 .003
270.690 51.578 .824 5.248 .000
(Constant)
HARIKERJ
Model1
B Std. Error
UnstandardizedCoefficients
Beta
StandardizedCoefficients
t Sig.
Dependent Variable: OUTPUTa.
Kolom “Unstandardized Coefficients”Ada dua angka dalam kolom ini, yaitu Beta dan Standard Error. Beta menunjukkan parameter regresi. Dari tabel tersebut dapat diketahui bahwa konstanta dari model tersebut adalah – 53064,7 dan koefisien regresi HARIKERJ adalah 270,69. Angka standard error menunjukkan tingkat keakurasian dari konstanta dan koefisien regresi yang ada.
• Kolom “Standardized Coefficients”• Kolom ini berisikan angka koefisien yang sudah distandardkan.
Seringkali data yang kita masukkan dalam data editor file memiliki unit pengukuran yang berbeda sehingga pengaruh variabel-variabel yang ada tidak bisa diperbandingkan langsung. Untuk bisa melakukan perbandingan pengaruh ini kita bisa menggunakan angka ini.
• Kolom “t”• Kolom ini berisi nilai t hitung. Secara matematis, angka ini merupakan
pembagian antara Beta dan Standard Error. Berdasarkan angka t hitung ini kita bisa memberikan jawaban apakah secara parsial variabel independen berpengaruh signifikan terhadap variabel dependen.
• Kolom “Sig.”• Kolom ini berisi probabilitas terjadinya t hitung. Berdasarkan angka
probabilitas ini kita bisa memberikan jawaban apakah secara parsial variabel independen berpengaruh signifikan terhadap variabel dependen. Jika nilai probabilitas lebih besar dari tingkat signifikansi yang kita tetapkan (α), secara parsial variabel independen berpengaruh tidak signifikan terhadap variabel dependen, dan sebaliknya.
CONTOH ANALISIS
VARIABEL PENELITIANy = Kesetiaan Konsumenx1= Kualitas Produkx2= Sikap terhadap Iklan
HIPOTESIS• Mayor : Kualitas Produk dan Sikap terhadap Iklan
mendukung peningkatan Kesetiaan Konsumen• Minor (A) : Kualitas Produk mendukung peningkatan
Kesetiaan Konsumen• Minor (B) Sikap terhadap Iklan mendukung peningkatan
Kesetiaan Konsumen
Kesetiaan Konsumen (Y)
Kualitas Produk (X1)
Sikap terhadap Iklan (X2)
a
b
c
R = a+b+c | b1 = a+b | b2= c
Proses Regresi
Regresi adalah proses memasukkan Variabel Independen ke dalam model untuk memprediksi Variabel Dependen, proses tersebut dapat dilakukan secara simultan maupun satu persatu
ANOVAb
112.693 2 56.347 102.240 .000a
3.307 6 .551
116.000 8
Regression
Residual
Total
Model1
Sum ofSquares df Mean Square F Sig.
Predictors: (Constant), Sikap terhadap Iklan, Kualitas Produka.
Dependent Variable: Kesetiaan terhadap Produkb.
Model Summary
.986a .971 .962 .74238Model1
R R SquareAdjustedR Square
Std. Error ofthe Estimate
Predictors: (Constant), Sikap terhadap Iklan, KualitasProduk
a.
Coefficientsa
-4.084 1.727 -2.365 .056
.782 .116 .581 6.732 .001
.330 .055 .520 6.032 .001
(Constant)
Kualitas Produk
Sikap terhadap Iklan
Model1
B Std. Error
UnstandardizedCoefficients
Beta
StandardizedCoefficients
t Sig.
Dependent Variable: Kesetiaan terhadap Produka.
F=102,240 ; p<0,01
Hipotesis Mayor
Diterima
• b=0,782 ; p<0,01 Hipotesis Minor (A) Diterima• b=0,330 ; p<0,01 Hipotesis Minor (B) Diterima
PRINSIP REGRESI
SIAPA YANG YANG MASUK DULU DAPAT RUANG LEBIH BANYAK
Kesetiaan Konsumen (Y)
Kualitas Produk (X1)
Sikap terhadap Iklan (X2)
a
b
cR = a+b+c | b1 = a+b | b2= c
PRINSIP REGRESI
SIAPA YANG YANG MASUK DULU DAPAT RUANG LEBIH BANYAK
Keterampilan Sosial (Y)
Self Esteem (X1)
Self Confidence (X2)
a
b
cR = a+b+c | b1 = a+b | b2= c
Model Summary
.962a .926 .901 1.19851Model1
R R SquareAdjustedR Square
Std. Error ofthe Estimate
Predictors: (Constant), Self Confidence, Self Esteema.
Correlations
1 .958** .817**
.000 .007
9 9 9
.958** 1 .893**
.000 .001
9 9 9
.817** .893** 1
.007 .001
9 9 9
PearsonCorrelation
Sig. (2-tailed)
N
PearsonCorrelation
Sig. (2-tailed)
N
PearsonCorrelation
Sig. (2-tailed)
N
KeterampilanSosial
Self Esteem
SelfConfidence
KeterampilanSosial
SelfEsteem
SelfConfidence
Correlation is significant at the 0.01 level (2-tailed).**. ANOVAb
107.381 2 53.691 37.38 .000a
8.619 6 1.436
116.000 8
Regression
Residual
Total
Model1
Sum ofSquares df Mean Square F Sig.
Predictors: (Constant), Self Confidence, Self Esteema.
Dependent Variable: Keterampilan Sosialb.
Coefficientsa
-5.009 3.415 -1.467 .193
1.490 .327 1.126 4.559 .004
-.292 .384 -.188 -.761 .476
(Constant)
Self Esteem
Self Confidence
Model1
B Std. Error
UnstandardizedCoefficients
Beta
Std.Coefficients
t Sig.
Dependent Variable: Keterampilan Sosiala.
Korelasi antar prediktor terlalu
besar (multikolinieritas)
Menyebabkan analisis regresi
menjadi anomali
Contoh Analisis
Ingin dicari model regresi dari sales revenue (Y), dengan variabel bebas berupa ads expenditure (X1) dan pengeluaran untuk quality control (X2)
Tahun 1 2 3 4 5 6 7 8 9 10
X1 10 9 11 12 11 12 13 13 14 15
X2 3 4 3 3 4 5 6 7 7 8
Y 44 40 42 46 48 52 54 58 56 60
SIAPA YANG MASUK LEBIH DAHULU ?
• Peneliti yang menentukan sendiri– Berdasarkan pertimbangan teori, relevansi dengan sampel,
kepentingan penelitian
• Program yang menentukan– ENTER. Semua prediktor dimasukkan dalam satu waktu– REMOVE. Semua prediktor dimasukkan lalu semua prediktor
dikeluarkan secara simultan– STEPWISE. Prediktor yang memiliki daya prediksi yang besar
dimasukkan terlebih dahulu– FORWARD. Prediktor yang memiliki daya prediksi yang besar
dimasukkan terlebih dahulu– BACKWARD. Semua prediktor dimasukkan lalu prediktor yang
memiliki daya prediksi yang rendah dikeluarkan satu per satu berdasarkan yang
MENU SPSS
1. MASUK KE MENU | ANALYZE REGRESSION LINEAR2. OPTION | Masukkan variabel di dalam kotak
TUGAS
1. Ada 10 rumah tangga yang merupakan sampel random di teliti. Ditanyakan banyaknya konsumsi suatu komoditi tertentu (dalam satuan), harga komoditi (dalam satuan) dan pendapatan (dalam satuan).
Kita ketahui bahwa permintaan terhadap komoditi tersebut untuk keperluan konsumsi (Y) akan dipengaruhi oleh harga (X1) dan pendapatan (X2). Hasil penelitian adalah sebagai berikut :
X1 2 3 5 4 6 2 3 4 5 6
X2 3 4 6 5 7 6 4 5 4 3
Y 5 8 8 9 9 13 6 9 4 3
Cari persamaan regresi linier berganda Y = a + b1X1+b2X2