1 | Panduan Regresi Logistik TUTORIAL REGRESI LOGISTIK AGUS TRI BASUKI, SE., M.SI. Regresi logistik merupakan salah satu jenis regresi yang menghubungkan antara satu atau beberapa variabel independen (variabel bebas) dengan variabel dependen yang berupa kategori; biasanya 0 dan 1. Persamaan Regresi Logistik sebagai berikut: B0 merupakan konstanta, B1 merupakan koefisien masing- masing variabel. Nilai p atau peluang (Y=1) dapat dicari dengan persamaan Persamaan tersebut dapat digunakan untuk menghitung peluang responden yang memiliki nilai variabel yang sudah ditetapkan dalam persamaan, hasil akhir nilai p berkisar antara 0 – 1.
26
Embed
TUTORIAL REGRESI LOGISTIK - AGUS TRI BASUKI · 2020. 6. 28. · pada regresi linear (OLS) lebih dikenal dengan istilah R-Square. Nilai Nagelkerke R Square sebesar 0,493 dan Cox &
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
1 | Panduan Regresi Logistik
TUTORIAL REGRESI LOGISTIK AGUS TRI BASUKI, SE., M.SI.
Regresi logistik merupakan salah satu jenis regresi yang menghubungkan antara
satu atau beberapa variabel independen (variabel bebas) dengan variabel dependen yang
berupa kategori; biasanya 0 dan 1.
Persamaan Regresi Logistik sebagai berikut:
B0 merupakan konstanta, B1 merupakan koefisien masing- masing variabel. Nilai p atau
peluang (Y=1) dapat dicari dengan persamaan
Persamaan tersebut dapat digunakan untuk menghitung peluang responden yang memiliki
nilai variabel yang sudah ditetapkan dalam persamaan, hasil akhir nilai p berkisar antara 0
– 1.
2 | Panduan Regresi Logistik
Berikut ini hasil wawancara dengan 150 orang tentang faktor-faktor yang mempengaruhi
seseorang menjadi anggota koperasi (Y). Dimana X1 penghasilan responden dan X2
pendidikan responden.
Tabel 1 Data Penelitian
RESPONDEN Y X1 X2 RESPONDEN Y X1 X2
1 1 0 0 76 1 1 1
2 1 1 1 77 1 1 1
3 1 1 1 78 0 0 0
4 1 1 1 79 1 1 1
5 1 1 1 80 0 0 0
6 0 0 0 81 0 0 0
7 0 0 0 82 0 0 0
8 1 1 1 83 0 0 0
9 0 0 0 84 1 0 0
10 1 1 1 85 1 0 0
11 1 1 1 86 0 0 0
12 1 1 1 87 1 1 1
13 0 0 0 88 0 0 1
14 1 0 1 89 1 1 1
15 0 0 0 90 0 0 0
16 1 1 1 91 1 1 1
17 1 1 0 92 1 0 0
18 0 1 1 93 1 1 1
19 0 0 0 94 1 0 0
20 1 1 1 95 0 0 0
21 0 0 0 96 1 1 1
22 0 0 1 97 0 0 0
23 0 1 0 98 1 1 1
24 1 1 1 99 0 1 0
25 0 1 1 100 1 1 1
26 0 0 0 101 0 0 0
27 0 0 0 102 0 0 1
3 | Panduan Regresi Logistik
RESPONDEN Y X1 X2 RESPONDEN Y X1 X2
28 1 1 1 103 0 1 0
29 1 0 0 104 1 1 1
30 0 0 1 105 0 1 1
31 1 0 0 106 0 0 0
32 0 1 1 107 0 0 0
33 0 0 0 108 1 0 0
34 0 1 1 109 1 1 1
35 0 1 0 110 1 0 0
36 0 1 1 111 1 1 1
37 0 1 1 112 1 1 1
38 1 1 1 113 0 0 1
39 0 0 1 114 1 1 1
40 0 1 1 115 1 1 0
41 0 0 0 116 1 1 1
42 0 0 0 117 0 0 0
43 0 0 0 118 0 0 1
44 1 0 0 119 0 1 0
45 1 0 0 120 1 1 1
46 0 0 0 121 0 1 1
47 1 1 1 122 0 0 0
48 1 0 0 123 0 0 0
49 1 1 1 124 1 1 1
50 0 0 0 125 1 1 1
51 1 1 1 126 1 1 1
52 1 1 1 127 1 1 1
53 1 1 1 128 0 0 0
54 0 0 0 129 0 0 0
55 0 0 1 130 1 1 1
56 1 0 0 131 0 0 0
57 1 0 0 132 1 1 1
58 0 1 0 133 1 1 1
59 1 0 0 134 1 1 1
60 0 0 0 135 0 0 0
61 0 0 0 136 1 0 1
62 0 0 0 137 0 0 0
63 1 1 1 138 1 1 1
4 | Panduan Regresi Logistik
RESPONDEN Y X1 X2 RESPONDEN Y X1 X2
64 1 1 1 139 1 1 0
65 0 0 0 140 0 1 1
66 0 0 0 141 0 0 0
67 0 0 0 142 1 1 1
68 1 1 1 143 0 0 0
69 0 0 0 144 1 0 0
70 1 1 1 145 1 0 0
71 1 1 1 146 0 0 0
72 0 0 0 147 1 1 1
73 0 0 1 148 1 0 0
74 1 1 1 149 1 1 1
75 1 1 1 150 0 0 0 Sumber : Data Hipotesis
Keterangan :
VARIABEL
Y ANGGOTA KOPERASI X1 PENGHASILAN RESPONDEN X2 PENDIDIKAN RESPONDEN
0 Bukan Anggota
Y
1 Anggota Koperasi
0 Rendah
X1
1 Tinggi
0 Bukan Sarjana
X2
1 Sarjana
5 | Panduan Regresi Logistik
Tahapan Analisis Regresi Logistik
6 | Panduan Regresi Logistik
LANGKAH-LANGKAH PENYELESAIAN DENGAN SPSS
Langkah pertama masukan Tabel 1 dalam SPSS Data View
Variable View
7 | Panduan Regresi Logistik
Klik Label pada X1, Y Dan X2 dan tulis PENGHASILAN, ANGGOTA KOPERASI DAN
PENDIDIKAN
Klik Value pada X1 dan klik …. pada None Akan muncul tampilan
Ketik pada Value 0 dan Label Penghasilan Rendah lalu tekan Add
8 | Panduan Regresi Logistik
Ketik kembali Value 1 dan Label Penghasilan Tinggi Klik Add
9 | Panduan Regresi Logistik
Klik OK Lakukan hal yang sama untuk variabel Y dan X2 Klik Value pada Y ketik 0 untuk Bukan Anggota Koperasi dan ketik 1 untuk anggota Koperasi
Klik OK
10 | Panduan Regresi Logistik
Klik Value pada X1 ketik 0 untuk Bukan Pendidikan Sarjana dan ketik 1 untuk Pendidikan Sarjana
Klik Ok Setelan Value semua terisi akan muncul pada Variable View
11 | Panduan Regresi Logistik
Setelah Semua Terisi lakukan analisis dengan cara Pilih Analyze Regression
Binary Logistic
Masukan Anggota Koperasi (Y) ke dependent, kemudian masukan Penghasilan (X1) dan
Pendidikan (X2) ke Covariates
12 | Panduan Regresi Logistik
Kemudian klik Save, kemudian klik probabilities, Group membership, Unstandardized
dan Standardized. Serta Klik Include the covariance matrix
klik Continue, setelah itu klik Option …..
13 | Panduan Regresi Logistik
Klik Classification plots, Hosmer-Lemeshow goodness-of-fit, Casewise Listing of
residual, Correlations of estimates, iteration history, Cl for exp(B) dan Include
constan in model
Akan muncul output seperti dalam
14 | Panduan Regresi Logistik
15 | Panduan Regresi Logistik
INTERPRETASI HASIL REGRESI LOGISTIK DENGAN SPSS Case Processing Summary
Case Processing Summary
Unweighted Casesa N Percent
Selected Cases
Included in Analysis
150 100.0
Missing Cases 0 .0
Total 150 100.0
Unselected Cases 0 .0
Total 150 100.0
a. If weight is in effect, see classification table for the total number of cases.
Pada tabel Case Processing Summary adalah ringkasan jumlah sampel, yaitu sebanyak
150 sampel.
Dependent Variable Encoding
Original Value Internal Value
Bukan Anggota Koperasisi
0
Anggota Koperasi 1
Tabel diatas adalah kode variabel dependen. Yaitu kategori “Bukan anggota Koperasi”
dengan kode 0 dan “Anggota Koperasi” dengan kode 1. Oleh karena yang diberi kode 1
adalah “Anggota Koperasi”, maka “Anggota Koperasi” menjadi referensi atau efek dari
sebab. Sebab yang dimaksud adalah kejadian yang dihipotesiskan sebagai penyebab
munculnya efek atau masalah. Dalam hal ini, penghasilan tinggi (kode 1) dan pendidikan
sarjana (kode 1) menjadi sebab yang dapat meningkatkan menjadi anggota koperasi (kode
1).
16 | Panduan Regresi Logistik
Block 0: Beginning Block
Tabel Iteration History
Iteration Historya,b,c
Iteration -2 Log
likelihood
Coefficients
Constant
Step 0 1 207.837 -.053
2 207.837 -.053
a. Constant is included in the model.
b. Initial -2 Log Likelihood: 207.837
c. Estimation terminated at iteration number 2 because parameter estimates changed by less than .001.
Pada tabel Iteration History pada block 0 atau saat variabel independen tidak dimasukkan
dalam model: N=150 mendapatkan Nilai -2 Log Likelihood: 207,837. Degree of Freedom
(DF) = N – 1 = 150-1=149. Chi-Square (X2) Tabel Pada DF 149 dan Probabilitas 0.05
=178,485. Nilai -2 Log Likelihood (207,837) > X2 tabel (178,485) sehingga menolak H0,
maka menunjukkan bahwa model sebelum memasukkan variabel independen adalah
TIDAK FIT dengan data.
17 | Panduan Regresi Logistik
Classification Table
Classification Tablea,b
Observed
Predicted
Anggota Koperasi
Percentage Correct
Bukan Anggota
Koperasisi Anggota Koperasi
Step 0 Anggota Koperasi
Bukan Anggota Koperasisi
77 0 100.0
Anggota Koperasi 73 0 .0
Overall Percentage 51.3
a. Constant is included in the model.
b. The cut value is .500
Pada tabel Classifacation Table: Merupakan tabel kontingensi 2 x 2 yang seharusnya terjadi
atau disebut juga frekuensi harapan berdasarkan data empiris variabel dependen, di mana
jumlah sampel yang memiliki kategori variabel dependen referensi (kode 1) yaitu “Menjadi
Anggota Koperasi” sebanyak 73. Sedangkan yang “Tidak Menjadi Anggota Koperasi”
sebanyak 77 orang. Jumlah sampel sebanyak 150 orang. Sehingga nilai overall percentage
sebelum variabel independen dimasukkan ke dalam model sebesar: 73/150 = 1-52,0% =
48%.
18 | Panduan Regresi Logistik
Variabel Dalam Persamaan Tahap Beginning
Variables in the Equation
B S.E. Wald df Sig. Exp(B)
Step 0 Constant -.053 .163 .107 1 .744 .948
Pada tabel Variables in The Equation: Saat sebelum var independen di masukkan ke dalam
model, maka belum ada variabel independen di dalam model. Nilai Slope atau Koefisien
Beta (B) dari Konstanta adalah sebesar -0,053 dengan Odds Ratio atau Exp(B) sebesar
0,948. Nilai Signifikansi atau p value dari uji Wald sebesar 0,744.
Perlu diingat bahwa nilai B identik dengan koefisien beta pada Ordinary Least Square
(OLS) atau regresi linear. Sedangkan Uji Wald identik dengan t parsial pada OLS.
Sedangkan Exp(B) adalah nilai eksponen dari B, maka Exp(-0,053) = 0,948.
Variabel Tidak Dalam Persamaan Tahap Beginning
Variables not in the Equation
Score df Sig.
Step 0 Variables X1 40.729 1 .000
X2 80.724 1 .000
Overall Statistics 86.843 2 .000
Pada tabel Variables not in the Equation: Menunjukkan variabel yang belum dimasukkan ke
dalam model regresi, yaitu variabel X1 dan X2. Di mana X1 adalah variabel penghasilan
dan X2 adalah variabel pendidikan.
19 | Panduan Regresi Logistik
Tahap Entry Variabel
Hasil Omnibus Test
Omnibus Tests of Model Coefficients
Chi-square df Sig.
Step 1 Step 102.010 2 .000
Block 102.010 2 .000
Model 102.010 2 .000
Nilai X2 102.010 > X2 tabel pada DF 2 (jumlah variabel independen 2) yaitu 5,991
atau dengan signifikansi sebesar 0,000 (< 0,05) sehingga menolak H0, yang menunjukkan
bahwa penambahan variabel independen DAPAT memberikan pengaruh nyata terhadap
model, atau dengan kata lain model dinyatakan FIT.
Jika pendekatan OLS untuk menguji signifikansi simultan menggunakan uji F,
sedangkan pada regresi logistik menggunakan nilai Chi-Square dari selisih antara -2 Log
likelihood sebelum variabel independen masuk model dan -2 Log likelihood setelah variabel
independen masuk model. Pengujian ini disebut juga dengan pengujian Maximum
likelihood.
Sehingga jawaban terhadap hipotesis pengaruh simultan variabel independen
terhadap variabel dependen adalah menerima H1 dan menolak H0 atau yang berarti ada
pengaruh signifikan secara simultan penghasilan dan pendidikan terhadap seseorang
menjadi anggota koperasi oleh karena nilai p value Chi-Square sebesar 0,000 di mana <
Alpha 0,05 atau nilai Chi-Square Hitung 102.010 > Chi-Square tabel 5,991.
20 | Panduan Regresi Logistik
Pseudo R Square
Model Summary
Step -2 Log
likelihood Cox & Snell R Square
Nagelkerke R Square
1 105.827a .493 .658
a. Estimation terminated at iteration number 5 because parameter estimates changed by less than .001.
Di atas pada tabel Model Summary: Untuk melihat kemampuan variabel independen
dalam menjelaskan variabel dependen, digunakan nilai Cox & Snell R Square dan
Nagelkerke R Square. Nilai-nilai tersebut disebut juga dengan Pseudo R-Square atau jika
pada regresi linear (OLS) lebih dikenal dengan istilah R-Square.
Nilai Nagelkerke R Square sebesar 0,493 dan Cox & Snell R Square 0,658, yang
menunjukkan bahwa kemampuan variabel independen dalam menjelaskan
variabel dependen adalah sebesar 0,658 atau 65,8% dan terdapat 100% – 65,8% = 34,2%
faktor lain di luar model yang menjelaskan variabel dependen.
Hosmer and Lemeshow Test
Hosmer and Lemeshow Test adalah uji Goodness of fit test, yaitu uji untuk
menentukan apakah model yang dibentuk sudah tepat atau tidak. Dikatakan tepat apabila
tidak ada perbedaan signifikan antara model dengan nilai observasinya.
Hosmer and Lemeshow Test
Step Chi-square df Sig.
1 7.222 2 .027
21 | Panduan Regresi Logistik
Nilai Chi Square tabel untuk DF 1 (Jumlah variabel independen – 1) pada taraf
signifikansi 0,05 adalah sebesar 3,841. Karena nilai Chi Square Hosmer and Lemeshow
hitung 7,222 > Chi Square table 3,841 atau nilai signifikansi sebesar 0,000 (< 0,05)
sehingga menolak H0, yang menunjukkan bahwa model TIDAK dapat diterima dan
pengujian hipotesis TIDAK dapat dilakukan sebab ada perbedaan signifikan antara model
dengan nilai observasinya. usahakan nilai ini harus tidak signifikan Caranya
adalah dengan mengubah model persamaan regresi logistik dengan menambahkan
variabel interaksi antar variabel independen. Misal pada kasus di sini, dengan
menambahkan variabel interaksi antara X1 dan X2.
Variabel interaksi adalah variabel yang merupakan hasil interaksi antar
variabel independen. Variabel ini ada kalanya diperlukan untuk dimasukkan ke dalam model
regresi logistik dengan alasan karena secara substantif memang ada hubungan antar
variabel independen atau untuk mengatasi masalah Goodness of Fit Test di mana menolak
H0.
Setelah Diperbaiki
Hosmer and Lemeshow Test
Step Chi-square df Sig.
1 .000 2 1.000
Karena nilai Chi Square Hosmer and Lemeshow hitung 0,0000 < Chi Square table 3,841
atau nilai signifikansi sebesar 1,000 (> 0,05) sehingga menerima H0, yang menunjukkan
bahwa model DAPAT diterima dan pengujian hipotesis DAPAT dilakukan sebab tidak ada
perbedaan signifikan antara model dengan nilai observasinya.