-
Wisnu Harto Adi W & Mercoledi Nikman N @2013
Categorical Dependent Variable Model / Limited Dependent
Variable Mode Contoh dari model probit dan logit Binary dependent
variable Probit, dan logit model untuk functional forms -
properties Koefisien Model & Intepretasi Marginal effects (and
odds ratios) & Intepretasi Goodness of fit statistics (percent
correctly predicted and pseudo R-squared) Pilihan antara probit dan
logit Model ekonomi yang mengacu pada penggunaan model probit dan
logit
Pengantar
Dalam kehidupan sehari - hari, kita menumui beragam jawaban atas
pilhan. Begitu pula dengan data untuk penelitian yang Anda lakukan
menggunakan variabel dependen yang bersifat kontinyu, dan bisa saja
penelitian Anda menggunakan variabel dependen yang bersifat
diskrit, seperti kategorikal atau binomial. Ketika variabel
dependen yang Anda gunakan bersifat diskrit, Anda harus menggunakan
model khusus dalam penelitian Anda.
Namun perlu diingat bahwa diskrit banyak macamnya. Modul ini
akan menjelaskan model yang sering digunakan untuk penelitian yang
variabel dependennya bersifat binomial (hanya ada dua kemungkinan
jawaban), yaitu Logit dan Probit.
Contoh dari Model Probit & Logit
Contoh hasil model biner
Keputusan Ekonomis Konsumen: Apakah konsumen akan melakukan
pembelian atau tidak.
Buruh dalam Perekonomian: Apakah seorang individu berpartisipasi
dalam pasar tenaga kerja atau tidak.
Ekonomi Pertanian: Apakah seorang petani mengadopsi atau
menggunakan praktik organik dalam pemasaran / produksi kontrak,
dsb
Hasil dari putusan variabel dependennya
Keputusan / pilihan untuk memiliki atau tidak memiliki,
melakukan, menggunakan, atau mengadopsi.
Variabel terikat memiliki bentuk biner sebagai responnya Nilai
biner yag dimaksud adalah: 0 dan 1.
CDVM / LDVM merupakan istilah yang biasa digunakan untuk merujuk
pada Model Biner (Binary Model) maupun pengembangannya, seperti
Ordered Probit / Multinomial Logit, Mixed Probit, dan sebagainya.
Keputusan dalam bermain game RPG, maupun banyak hal lain seperti
keputusan untuk membeli barang A atau B, maupun game theory juga
bisa merujuk pada model biner
= 11 + = 1 +
Model Biner paling sederhana adalah Logit (data distribusi
Logistik), maupun Probit (Distribusi data normal) Penyederhanaan
model Logit adalah Pr(x) = 1/1+a, atau jika dijabarkan menjadi yang
bisa disederhanakan menjadi dy/dx (odds-ratio)
-
Wisnu Harto Adi W & Mercoledi Nikman N @2013
Logit Teori
Probit, dan logit model untuk functional forms - properties
Model Logit menggunakan persamaan eksponensial untuk mendapatkan
nilai probabilitas pada interval 0 dan 1, dan persamaannya adalah
sebagai berikut:
Pr() = 11 + = 11 + (+ +) atau dapat disederhanakan menjadi:
= 11 + = 1 + Zi sebagai bentuk penyederhanaan dari fungsi + xi+,
yaitu variabel independen yang memiliki kemampuan untuk
mempengaruhi nilai variabel dependen, sementara Pi merupakan
probabilitas
Saat Z berkisar antara - sampai , Pi akan menghasilkan nilai
antara 0 dan 1. Dengan kata lain, persamaan ini menghitung
probabilitas hasil Y antara interval 0 sampai 1. Namun implikasi
dari model ini adalah bentuknya bukan bentuk linear, dan Pi tidak
berhubungan linear dengan Z. Parameter yang dihasilkan perlu
melewati proses selanjutnya untuk benar-benar menunjukkan efek
marjinal.
Untuk membuatnya menjadi bentuk linear, kita harus membuat
logaritma natural dari persamaan Odds Ratio-nya. Odds Ratio
merupakan peluang sukses yang dibagi dengan peluang gagal.
Persamaannya adalah sebagai berikut:
Pr()1 Pr() = + 111 + = Setelah itu, bentuk persamaan diatas
dibuat menjadi logaritma natural, sebagai berikut:
ln Pr()1 Pr() = = + + Dengan kata lain, hasil odds ratio yang
dilogaritmanaturalkan akan menghasillkan parameter yang bersifat
linear dan dapat diinterpretasikan efek marjinalnya.
Agar lebih jelas, grafik di bawah ini menggambarkan bentuk kedua
persamaan yang telah dibentuk di atas.
Grafik 1: Perbedaan Hasil Ln Odds Ratio dan Probabilitas Model
Logit
-
Wisnu Harto Adi W & Mercoledi Nikman N @2013
Sumber: www.graphpad.com
Kelebihan model Logit adalah sebagai berikut:
Saat P berpindah dari 0 ke 1, persamaan logit akan berpindah
dari - ke . Oleh karena itu, meski probabilitasnya terbatasi antara
0 sampa 1, persamaan logit tersebut tidak terbatasi.
Hasil persamaan logit yang positif menunjukkan hubungan yang
searah (berbanding lurus) antara nilai variabel independen dengan
kemungkinan (odds) variabel dependen bernilai 1 (sukses). Artinya,
meningkatnya nilai variabel independen akan meningkatkan
kemungkinan variabel dependen bernilai 1, dan sebaliknya menurunnya
nilai variabel independen akan menurunkan kemungkinan variabel
dependen bernilai 1. Sedangkan hasil persamaan logit yang negatif
menunjukkan hubungan yang terbalik (berbanding terbalik) antara
nilai variabel independen dengan kemungkinan untuk variabel
dependen bernilai 1.
-
Wisnu Harto Adi W & Mercoledi Nikman N @2013
Probit Teori
Selain model Logit, yang juga sering digunakan untuk mengolah
data binomial adalah model Probit. Perbedaan yang paling mendasar
antara model Logit dan Probit adalah nature (keadaan) data yang
akan diolah. Model Probit mengasumsikan data yang diolah
terdistribusi normal, yaitu bell-shaped (berbentuk lonceng) dengan
standar error (galat) bernilai 1.
Model matematis Probit adalah sebagai berikut:
() = 12 2 2
Ii melambangkan variabel independen yang kiranya mempengaruhi
outcome fungsi Probit, maka persamaan di atas dapat juga ditulis
dengan:
() = 12 2 2+
Dan fungsi F(.) langsung menunjukkan fungsi probabilitas untuk
outcome variabel dependen. Implikasi dari model ini adalah
perlakuan lanjut untuk interpretasinya. Pada Logit, agar dapat
melihat probabilitanya kita harus mencari nilai rasio kemungkinan
yang kemudian dilogaritmanaturalkan. Namun pada Probit, hasil
koefisiennya dapat langsung dikonversi menjadi efek marjinal dengan
cara inversi fungsi persamaan di atas, dan langsung mendapat nilai
probabilita untuk outcome variabel dependen
() = 12 2 2+
Probit memiliki output probabilita yang sama dengan logit, namun
distribusi data dan metodenya berbeda (sama secara prinsipal)
Penyederhanaan model Probit adalah F_Pr(x) = 1/a*limX , atau jika
dijabarkan menjadi yang bisa disederhanakan menjadi dF/dx (Marginal
Effect)
-
Wisnu Harto Adi W & Mercoledi Nikman N @2013
Aplikasi Model Menggunakan Software STATA Modul ini akan
menggunakan data olahan1 dari SAKERTI/Indonesia Family Life Survey
putaran 4, yang diadakan tahun 2007-2008. Kita akan mencoba
mengolah data untuk melihat kemungkinan responden bekerja atau
tidak, dilihat dari variabel demografinya.
Mengenal Data Sebelum mengolah data, ada baiknya kita mengenal
data yang akan kita gunakan. Jika dataset yang anda gunakan telah
mempunyai label, maka command describe, atau bisa disingkat menjadi
de, dapat langsung digunakan.
Data dapat diimpor lewat:
use
http://dl.dropboxusercontent.com/u/45099676/ldvm_labkom_20042013.dta,
clear
ataupun penggunaan secara manual
. describe Contains data from
http://dl.dropboxusercontent.com/u/45099676/ldvm_labkom_20042013.dta
obs: 50,580 vars: 13 14 Jun 2012 02:22 size: 2,731,320 (94.8% of
memory free)
-------------------------------------------------------------------------------------
storage display value variable name type format label variable
label
-------------------------------------------------------------------------------------
pid07 byte %8.0g respondent's hh member id # hhid07 str8 %9s 2007
household id kerja float %9.0g status kerja responden saat
interview krt float %9.0g kepala rumah tangga age float %9.0g age
now miskin float %9.0g poor Poor or Not, 2007 pwt07xa float %9.0g
ifls4 person cross-section weight w/ attrition correction pensiun
float %9.0g Whether receiving PENSION lntotexp float %9.0g ln dari
pengeluaran perkapita laki float %9.0g berjenis kelamin laki-laki
socas float %9.0g mendapat bantuan sosial (either BLT,PKH,Raskin)
age2 float %9.0g hasil kuadrat dari umur sekarang kota byte %9.0g
RECODE of area (urban/rural) menikah float %9.0g sedang menikah
saat interview
-------------------------------------------------------------------------------------
Sorted by: hhid07 pid07 Dari tabel diatas kita dapat mengambil
beberapa informasi yang vital untuk pengolahan data selanjutnya.
Dalam dataset ini, terdapat 13 variabel dan 50.580 observasi. Satu
variabel, yaitu hhid07, bersifat string, yang berarti data tersebut
disimpan dalam bentuk non-numerik. Lainnya bersifat float dan byte,
yang berarti disimpan dalam bentuk numerik. Perbedaan kedua bentuk
berimplikasi pada jumlah digit data yang dapat disetor dalam
memori. Value label merupakan label yang dikenakan oleh nilai dalam
variabel yang menggunakan label tersebut. Dan variable label
merupakan label untuk suatu variabel, biasanya diisi dengan
informasi vital dari data oleh sang pengolah data.
Selanjutnya kita dapat melihat lebih jauh keadaan data dengan
menggunakan command summarize, atau bisa disingkat dengan su.
1 Data ini diolah dari buku K, 1 dan 3A. Segala informasi lebih
lanjut dari pengolahan data ini bisa langsung ditanyakan ke
penulis.
-
Wisnu Harto Adi W & Mercoledi Nikman N @2013
. summarize Variable | Obs Mean Std. Dev. Min Max
-------------+--------------------------------------------------------
pid07 | 50580 3.760854 2.823632 1 38 hhid07 | 0 kerja | 50580
.3951562 .488889 0 1 krt | 50580 .1540134 .3609652 0 1 age | 46732
28.71223 20.09182 0 120
-------------+--------------------------------------------------------
miskin | 46732 .1523367 .3593508 0 1 pwt07xa | 46731 1.031128
.494533 .2548358 2.764099 pensiun | 50580 .0160735 .1257597 0 1
lntotexp | 46720 14.18649 .8212604 6.725434 17.37144 laki | 46732
.4906488 .4999179 0 1
-------------+--------------------------------------------------------
socas | 50580 .4714512 .4991892 0 1 age2 | 46732 1228.065 1473.248
0 14400 kota | 46732 .5275828 .499244 0 1 menikah | 50580 .0324239
.1771248 0 1
Dari tabel diatas, kita dapat mengetahui tidak semua observasi
berjumlah sama. Variabel age, miskin, pwt07xa, laki, age2, dan kota
masing-masing berjumlah 46.732 observasi, dan variabel lntotexp
berjumlah 46.720. Hal ini akan berpengaruh pada regresi nantinya.
Perhatikan juga bahwa variabel hhid07 tidak mempunyai laporan
apapun. Hal ini bukan berarti variabel hhid07 tidak mempunyai
nilai, namun disebabkan bentuk datanya yang telah diidentifikasi
sebagai string. Selain itu, variabel kerja, krt, miskin, pensiun,
laki, socas, kota, dan menikah mempunyai nilai minimum 0 dan
maksimum 1. Hal ini menunjukkan kedelapan variabel tersebut
bersifat dummy. Variabel age, age2, pwt07xa dan lntotexp bernilai
kontinyu.
Spesifikasi Model Model yang digunakan untuk simulasi modul ini
adalah sebagai berikut:
( = 1) = + 1 + 2 + 3 + 4 + 52 + 6 + 7 +
Perhatikan spesifikasi modelnya yang menyatakan variabel
dependen sebagai P(Y =1); hal ini melambangkan model menghasilkan
nilai probabilitas variabel dependen bernilai 1 dilihat dari
keadaan variabel independen yang dinyatakan di spesifikasi
model.
Aplikasi Model 1: Logit Model Logit mempunyai syntax sebagai
berikut:
logit [var. dependen] [var. independen] [if] [in] [weight] [,
options]
fungsi if dan in adalah fungsi pembatas untuk data yang
digunakan, namun mempunyai perbedaan dalam aplikasi. Fungsi if
melakukan pembatasan dari nilai suatu variabel, sedangkan fungsi in
melakukan pembatasan berdasarkan urutan observasi. Sangat
dianjurkan untuk memakai fungsi if saja karena fungsi in sangat
bergantung pada urutan data. Sedangkan fungsi weight merupakan
pembobotan yang dimasukkan dalam data sampel, agar lebih
melambangkan populasi secara keseluruhan. Fungsi weight
-
Wisnu Harto Adi W & Mercoledi Nikman N @2013
yang dibolehkan adalah fweight (bobot frekuensi), iweight (bobot
kepentingan), atau aweight (bobot analitis).
Selanjutnya spesifikasi model diaplikasikan pada STATA, dan
hasilnya adalah sebagai berikut.
. logit kerja miskin laki lntotexp age age2 socas pensiun
Iteration 0: log likelihood = -31694.826 Iteration 1: log
likelihood = -21370.277 Iteration 2: log likelihood = -20592.498
Iteration 3: log likelihood = -20574.498 Iteration 4: log
likelihood = -20574.492 Iteration 5: log likelihood = -20574.492
Logistic regression Number of obs = 46720 LR chi2(7) = 22240.67
Prob > chi2 = 0.0000 Log likelihood = -20574.492 Pseudo R2 =
0.3509
------------------------------------------------------------------------------
kerja | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
miskin | -.4240104 .0401285 -10.57 0.000 -.5026608 -.3453599 laki |
1.038157 .0249915 41.54 0.000 .9891746 1.087139 lntotexp |
-.2916492 .0178292 -16.36 0.000 -.3265938 -.2567046 age | .3150323
.0033198 94.89 0.000 .3085256 .321539 age2 | -.0035296 .0000409
-86.24 0.000 -.0036099 -.0034494 socas | .1103204 .0259203 4.26
0.000 .0595176 .1611232 pensiun | -.4169765 .0862499 -4.83 0.000
-.5860233 -.2479297 _cons | -1.97111 .2606003 -7.56 0.000 -2.481877
-1.460342
------------------------------------------------------------------------------
Note: 1 failure and 0 successes completely determined.
Iterasi (pembagian) yang ada di bagian atas menunjukkan proses
maksimisasi logaritma dari fungsi likelihood. Pada iterasi 0, hasil
log kemungkinan (log likelihood) menggambarkan aplikasi model yang
hanya memasukkan nilai intersep (ditunjukkan dengan variabel
_cons). Sedangkan hasil log kemungkinan di baris terakhir
menunjukkan aplikasi model yang hasilnya ditampilkan dalam tabel
hasil.
Di sebelah kanan atas terdapat hasil tes 2 keseluruhan yang
hipotesis nol (H0)-nya menyatakan bahwa semua parameter dari model
bernilai 0. Hasil di atas menunjukkan H0ditolak, sehingga dapat
dibilang bahwa variabel independen yang dimasukkan dalam
spesifikasi mempunyai pengaruh terhadap outcome status kerja
responden.
-
Wisnu Harto Adi W & Mercoledi Nikman N @2013
Di bawahnya terdapat hasil tes pseudo R2, yang berperan sebagai
pengganti R2 di model linear. Perlu diperhatikan bahwa hasil pseudo
R2 kurang dapat menjelaskan interpretasi langsung dari varian,
suatu kelebihan yang dimiliki oleh tes R2 pada model linear.
Sebelum masuk ke interpretasi, ada baiknya kita mengetes apakah
spesifikasi model sudah benar apa belum. Untuk itu kita dapat
menggunakan 3 komando, yaitu estat gof; estat class; dan
fitstat.
. estat gof Logistic model for kerja, goodness-of-fit test
number of observations = 46720 number of covariate patterns = 46502
Pearson chi2(46494) = 46659.56 Prob > chi2 = 0.2931
Estat gof menunjukkan hasil goodness-of-fit Pearson 2 test untuk
model yang telah diregresi tepat sebelum komando ini digunakan.
Pengujian ini menggunakan metode pengecekan hasil data yang
terobservasi dibandingkan dengan hasil ekspektasi respon yang
didapat dari pola kovariat. Hipotesis nol dalam tes ini adalah
dipakainya model yang telah diregresi sebelumnya. Hasil tes di atas
menunjukkan tidak ditolaknya H0, yang berarti model ini valid untuk
diinterpretasi lebih lanjut.
. estat class Logistic model for kerja -------- True --------
Classified | D ~D | Total
-----------+--------------------------+----------- + | 15070 6240 |
21310 - | 4288 21122 | 25410
-----------+--------------------------+----------- Total | 19358
27362 | 46720 Classified + if predicted Pr(D) >= .5 True D
defined as kerja != 0
-------------------------------------------------- Sensitivity Pr(
+| D) 77.85% Specificity Pr( -|~D) 77.19% Positive predictive value
Pr( D| +) 70.72% Negative predictive value Pr(~D| -) 83.12%
-------------------------------------------------- False + rate for
true ~D Pr( +|~D) 22.81% False - rate for true D Pr( -| D) 22.15%
False + rate for classified + Pr(~D| +) 29.28% False - rate for
classified - Pr( D| -) 16.88%
-------------------------------------------------- Correctly
classified 77.47%
--------------------------------------------------
Sedangkan estat class menunjukkan tabel klasifikasi yang
menunjukkan apakah klasifikasi model sudah baik apa belum.
Sensitivity menunjukkan hasil prediksi bernilai sukses yang
terbukti dalam observasi bernilai sukses
Pseudo R^2 dipergunakan untuk menggantikan nilai R^2 dalam model
OLS. LDV lebih spesifik menggunakan nilai correctly classified
untuk menjelaskan R^2 dari model.
-
Wisnu Harto Adi W & Mercoledi Nikman N @2013
(Y bernilai 1), dan sensitivity menunjukkan hasil prediksi
bernilai gagal yang terbukti dalam observasi bernilai gagal (Y
bernilai 0). Dalam hal ini, sensitivity dan specificity bernilai
relatif sama, yaitu (berurutan) 77.85% dan 77.19%. Secara
keseluruhan, spesifikasi model ini dapat memprediksi dengan tepat
sebesar 77.47%.
. fitstat Measures of Fit for logistic of kerja Log-Lik
Intercept Only: -31694.826 Log-Lik Full Model: -20574.492 D(46712):
41148.984 LR(7): 22240.667 Prob > LR: 0.000 McFadden's R2: 0.351
McFadden's Adj R2: 0.351 Maximum Likelihood R2: 1.000 Cragg &
Uhler's R2: 1.000 McKelvey and Zavoina's R2: 0.603 Efron's R2:
0.393 Variance of y*: 8.279 Variance of error: 3.290 Count R2:
0.775 Adj Count R2: 0.456 AIC: 0.881 AIC*n: 41164.984 BIC:
-461095.059 BIC': -22165.404
Sedangkan komando fitstat memberikan hasil pengukuran aplikasi
model yang sering digunakan dalam model-model lainnya, seperti AIC
dan BIC (makin kecil nilainya maka lebih baik modelnya), juga
berbagai macam pengukuran R2.
Setelah melewati berbagai macam pengukuran aplikasi model, dapat
disimpulkan model Logit ini dapat diterima dan dapat diinterpretasi
lebih lanjut. Interpretasi model Logit dapat dilakukan dengan dua
cara, yaitu dengan menggunakan rasio kemungkinan (odds ratio) dan
dengan melihat efek marjinal.
Untuk melihat nilai rasio kemungkinan (odds ratio), dapat saja
menggunakan modifikasi syntax logit. Anda hanya perlu mengganti
komando logit menjadi logistic.
. logistic kerja miskin laki lntotexp age age2 socas pensiun
Logistic regression Number of obs = 46720 LR chi2(7) = 22240.67
Prob > chi2 = 0.0000 Log likelihood = -20574.492 Pseudo R2 =
0.3509
------------------------------------------------------------------------------
kerja | Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
miskin | .6544171 .0262608 -10.57 0.000 .6049189 .7079655 laki |
2.824008 .0705761 41.54 0.000 2.689014 2.965778 lntotexp | .7470305
.013319 -16.36 0.000 .7213767 .7735967 age | 1.370304 .0045491
94.89 0.000 1.361416 1.379249 age2 | .9964766 .0000408 -86.24 0.000
.9963967 .9965565 socas | 1.116636 .0289435 4.26 0.000 1.061324
1.17483 pensiun | .6590364 .0568418 -4.83 0.000 .5565361 .7804148
------------------------------------------------------------------------------
Note: 1 failure and 0 successes completely determined.
Perlu diingat bahwa nilai rasio kemungkinan bersifat linear,
jadi dapat langsung diinterpretasi. Rasio kemungkinan yang lebih
besar dari satu menunjukkan arah yang positif, sedangkan rasio
kemunkginan yang lebih kecil dari satu menunjukkan arah yang
negatif. Dalam model ini, terlihat bahwa yang paling berpengaruh
adalah variabel laki dan nilai rasio kemungkinannya lebih besar
dari 1; responden berjenis kelamin laki-laki akan lebih mungkin
untuk berstatus kerja dibandingkan responden berjenis kelamin
-
Wisnu Harto Adi W & Mercoledi Nikman N @2013
perempuan. Sedangkan variabel miskin mempunyai nilai rasio
kemungkinan yang lebih kecil dari 1; responden yang miskin akan
lebih mungkin untuk berstatus tidak bekerja dibandingkan responden
yang tidak miskin. Nilai rasio kemungkinan miskin sedikit lebih
rendah dari pensiun, yang berarti pengaruh miskin lebih besar
daripada pensiun. Sedangkan variabel age dan age2 tidak bisa
langsung diartikan karena berbentuk parabolik, dan perlu perlakuan
lebih lanjut.
Cara interpretasi yang kedua, yaitu melihat efek marjinal,
seringkali lebih sering digunakan. Sifat perubahan efeknya yang
terjadi seiring perubahan nilai variabel independen merupakan sifat
yang dimiliki model OLS yang mana lebih sering digunakan dalam
penelitian pada umumnya. Beberapa modifikasi model, seperti bentuk
parabolik yang dipakai dalam model di atas, malah membutuhkan efek
marjinal untuk perlakuan tambahan pada hasil awalnya sebelum dapat
diinterpretasi. Cara untuk mendapat efek marjinal dari model Logit
adalah sebagai berikut:
. mfx Marginal effects after logistic y = Pr(kerja) (predict) =
.28833844
------------------------------------------------------------------------------
variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X
---------+--------------------------------------------------------------------
miskin*| -.0812906 .00714 -11.39 0.000 -.09528 -.067301 .152119
laki*| .2116238 .00505 41.90 0.000 .201724 .221523 .490646 lntotexp
| -.0598462 .00365 -16.40 0.000 -.067001 -.052692 14.1865 age |
.0646444 .00053 120.92 0.000 .063597 .065692 28.7017 age2 |
-.0007243 .00001 -105.20 0.000 -.000738 -.000711 1226.97 socas*|
.0226241 .00531 4.26 0.000 .012213 .033035 .510338 pensiun*|
-.0778758 .01449 -5.37 0.000 -.106275 -.049476 .017402
------------------------------------------------------------------------------
(*) dy/dx is for discrete change of dummy variable from 0 to 1
Hasil di atas menunjukkan efek marjinal dari hasil regresi Logit
yang dilakukan sebelumnya. Dapat dilihat bahwa hasil interpretasi
dari rasio kemungkinan semakin ditegaskan dengan hasil efek
marjinal. Terdapat beberapa variabel yang belum diinterpretasi
sebelumnya dan akan diinterpretasi menggunakan hasil ini: variabel
socas bernilai positif sebesar .0226241, yang berarti responden
yang mendapat bantuan sosial akan lebih mungkin sebesar 2.26% untuk
berstatus bekerja dibandingkan responden yang tidak mendapat
bantuan sosial. Sedangkan variabel lntotexp bernilai negatif
sebesar -0.0598462, yang berarti tiap 1% kenaikan pada konsumsi
seorang responden membuat turunnya kemungkinan responden tersebut
untuk bekerja sebesar 0.0598%.
Dengan diketahuinya hasil efek marjinal, kita dapat melakukan
perlakuan tambahan untuk variabel age dan age2. Ambillah persamaan
parsial yang khusus melambangkan variabel dependen, kerja, dan
variabel independen, age, sebagai berikut:
( = 1) = .0646444 .0007243 2 Nilai .0646444 dan .0007243 diambil
dari hasil efek marjinal untuk (berurutan) variabel age dan age2.
Persamaan ini akan digunakan untuk memprediksi titik yang membentuk
grafik parabolik pengaruh umur terhadap probabilitas outcome status
bekerja. Caranya adalah sebagai berikut:
. gen efek_age= .0646444*age-(.0007243*age2) (3848 missing
values generated)
Perintah mfx. dipergunakan untuk melihat probabilita total dari
model LDV, juga mampu dipergunakan untuk nilai dx/dy nya.
-
Wisnu Harto Adi W & Mercoledi Nikman N @2013
. label variable efek_age "prediksi untuk pengaruh parsial
variabel age" . scatter efek_age age
Untuk memperjelas hasil estimasi model ini, maka kita dapat
melakukan prediksi menggunakan model ini dan menyimpan hasilnya
dalam variabel baru, yang untuk mempermudah pembacaan akan kita
namakan dengan logitkerja. Caranya adalah sebagai berikut:
. predict logitkerja (option pr assumed; Pr(kerja)) (3860
missing values generated) . gen
lnlogitkerja=ln(logitkerja/(1-logitkerja)) (3860 missing values
generated) . la var logitkerja "Pr(kerja) logit"
-3-2
-10
12
pred
iksi
unt
uk p
enga
ruh
pars
ial v
aria
bel a
ge
0 50 100 150age now
-
Wisnu Harto Adi W & Mercoledi Nikman N @2013
Dan untuk melihat hasil prediksinya, masukkan komando sebagai
berikut:
. scatter kerja logitkerja lnlogitkerja
Bentuknya yang seperti huruf S merupakan sifat dari fungsi logit
yang berbentuk CDF (Cumulative Distribution Function/Fungsi
Distribusi Kumulatif).
Aplikasi Model 2: Probit Setelah selesai berkutat dengan model
Logit, saatnya berganti metode ke model Probit. Syntax untuk model
Probit adalah sebagai berikut:
probit var.dependen [var.independen] [if] [in] [weight] [,
options]
tidak ada perbedaan besar antara syntax Logit dan Probit, hanya
komando awalnya saja yang berbeda.
Sebagai perbandingan, mari kita menggunakan data sebelumnya
dengan spesifikasi yang persis sama:
. probit kerja miskin laki lntotexp age age2 socas pensiun
Iteration 0: log likelihood = -31694.826 Iteration 1: log
likelihood = -21017.256 Iteration 2: log likelihood = -20526.255
Iteration 3: log likelihood = -20519.857 Iteration 4: log
likelihood = -20519.853 Iteration 5: log likelihood = -20519.853
Probit regression Number of obs = 46720 LR chi2(7) = 22349.95 Prob
> chi2 = 0.0000 Log likelihood = -20519.853 Pseudo R2 = 0.3526
------------------------------------------------------------------------------
kerja | Coef. Std. Err. z P>|z| [95% Conf. Interval]
0.2
.4.6
.81
-20 -15 -10 -5 0 5lnlogitkerja
status kerja responden saat interview Pr(kerja) logit
-
Wisnu Harto Adi W & Mercoledi Nikman N @2013
-------------+----------------------------------------------------------------
miskin | -.2493794 .0234154 -10.65 0.000 -.2952728 -.203486 laki |
.5981915 .0144496 41.40 0.000 .5698708 .6265123 lntotexp | -.168781
.0103833 -16.26 0.000 -.1891319 -.1484301 age | .1824727 .0017797
102.53 0.000 .1789846 .1859608 age2 | -.0020256 .0000217 -93.40
0.000 -.0020681 -.0019831 socas | .0654174 .0151829 4.31 0.000
.0356595 .0951754 pensiun | -.2659084 .0511079 -5.20 0.000
-.3660781 -.1657386 _cons | -1.162999 .1521409 -7.64 0.000 -1.46119
-.8648086
------------------------------------------------------------------------------
Note: 5 failures and 0 successes completely determined.
Seperti sebelumnya, perlu dilakukan uji kelayakan model terlebih
dahulu sebelum model dapat diinterpretasi. Khusus untuk Probit,
karena terdapat asumsi yang restriktif berupa normalitas model,
maka terdapat satu komando, skprobit, yang dapat digunakan untuk
menguji berlakunya asumsi ini. Komando ini menggunakan metode
Lagrange Multiplier Test untuk Normalitas residual hasil prediksi
variabel dependen menggunakan spesifikasi model yang sudah
diregresi sebelumnya. Caranya adalah sebagai berikut:
. skprobit kerja miskin laki lntotexp age age2 socas pensiun
Lagrange Multiplier Test for Normality after Probit Chi2(2) =
141.3823 Prob > chi2 = 0.0000 Ho: Normality Ha: No Normality
Seperti yang tertulis, hipotesis nolnya adalah normalitas
residual. Hasil di atas menunjukkan ditolaknya H0, yang berarti
data yang kita gunakan tidak normal dan seharusnya tidak
menggunakan probit.
Selain komando skprobit, terdapat juga komando lain yang dapat
digunakan untuk melakukan uji kelayakan model. Komando-komando
tersebut adalah komando yang sama seperti yang dilakukan pada uji
kelayakan Logit, yaitu estat gof; estat class; dan fitstat. Hasil
ketiga tes tersebut untuk model ini adalah sebagai berikut:
. estat gof Probit model for kerja, goodness-of-fit test number
of observations = 46720 number of covariate patterns = 46502
Pearson chi2(46494) = 282893.08 Prob > chi2 = 0.0000 . estat
class Probit model for kerja -------- True -------- Classified | D
~D | Total -----------+--------------------------+----------- + |
15110 6304 | 21414 - | 4248 21058 | 25306
-----------+--------------------------+----------- Total | 19358
27362 | 46720
-
Wisnu Harto Adi W & Mercoledi Nikman N @2013
Classified + if predicted Pr(D) >= .5 True D defined as kerja
!= 0 -------------------------------------------------- Sensitivity
Pr( +| D) 78.06% Specificity Pr( -|~D) 76.96% Positive predictive
value Pr( D| +) 70.56% Negative predictive value Pr(~D| -) 83.21%
-------------------------------------------------- False + rate for
true ~D Pr( +|~D) 23.04% False - rate for true D Pr( -| D) 21.94%
False + rate for classified + Pr(~D| +) 29.44% False - rate for
classified - Pr( D| -) 16.79%
-------------------------------------------------- Correctly
classified 77.41%
-------------------------------------------------- . fitstat
Measures of Fit for probit of kerja Log-Lik Intercept Only:
-31694.826 Log-Lik Full Model: -20519.853 D(46712): 41039.706
LR(7): 22349.946 Prob > LR: 0.000 McFadden's R2: 0.353
McFadden's Adj R2: 0.352 Maximum Likelihood R2: 1.000 Cragg &
Uhler's R2: 1.000 McKelvey and Zavoina's R2: 0.630 Efron's R2:
0.393 Variance of y*: 2.700 Variance of error: 1.000 Count R2:
0.774 Adj Count R2: 0.455 AIC: 0.879 AIC*n: 41055.706 BIC:
-461204.337 BIC': -22274.683
dari hasil estat gof terlihat bahwa pemakaian model ini ditolak.
Sebaiknya data diberikan perlakuan khusus terlebih dahulu, atau
spesifikasi modelnya diperbaiki terlebih dahulu, sampai dapat
dinyatakan diterima dan dapat diinterpretasikan.
Namun demi kepentingan penjelasan modul, diasumsikan terlebih
dahulu bahwa model ini diterima. Model Probit tidak mempunyai rasio
kemungkinan, sehingga interpretasinya langsung merujuk pada efek
marjinalnya. Cara cepat untuk mengeluarkan efek marjinal pada model
Probit adalah dengan mengganti komando probit pada regresi awal
menjadi dprobit. Contohnya adalah sebagai berikut:
. dprobit kerja miskin laki lntotexp age age2 socas pensiun
Iteration 0: log likelihood = -31694.826 Iteration 1: log
likelihood = -21842.615 Iteration 2: log likelihood = -20639.053
Iteration 3: log likelihood = -20521.702 Iteration 4: log
likelihood = -20519.853 Iteration 5: log likelihood = -20519.853
Probit regression, reporting marginal effects Number of obs = 46720
LR chi2(7) =22349.95 Prob > chi2 = 0.0000 Log likelihood =
-20519.853 Pseudo R2 = 0.3526
------------------------------------------------------------------------------
kerja | dF/dx Std. Err. z P>|z| x-bar [ 95% C.I. ]
---------+--------------------------------------------------------------------
miskin*| -.0825705 .0073226 -10.65 0.000 .152119 -.096922 -.068219
laki*| .2066827 .0049234 41.40 0.000 .490646 .197033 .216332
lntotexp | -.0587849 .0036105 -16.26 0.000 14.1865 -.065861
-.051708 age | .0635535 .0005123 102.53 0.000 28.7017 .062549
.064558 age2 | -.0007055 6.50e-06 -93.40 0.000 1226.97 -.000718
-.000693 socas*| .0227733 .0052817 4.31 0.000 .510338 .012421
.033125 pensiun*| -.0857661 .0150769 -5.20 0.000 .017402 -.115316
-.056216
-
Wisnu Harto Adi W & Mercoledi Nikman N @2013
---------+--------------------------------------------------------------------
obs. P | .4143408 pred. P | .3011442 (at x-bar)
------------------------------------------------------------------------------
(*) dF/dx is for discrete change of dummy variable from 0 to 1 z
and P>|z| correspond to the test of the underlying coefficient
being 0
Di kolom yanng biasanya merupakan tempat untuk koefisien, yang
sekarang ditunjukkan adalah efek marjinal dari masing-masing
variabel independen untuk menentukan probabilita outcome variabel
dependen. Cara membacanya pun sama seperti cara membaca hasil efek
marjinal dari Logit.
Untuk membandingkan hasil antara Logit dengan Probit, kembali
kita lakukan prediksi nilai menggunakan spesifikasi model yang
sudah ada.
. predict probitkerja (option pr assumed; Pr(kerja)) (3860
missing values generated) . la var probitkerja "Pr(kerja) probit" .
gen lnprobitkerja=ln(probitkerja/(1-probitkerja)) (3860 missing
values generated) . scatter kerja probitkerja lnprobitkerja
0.2
.4.6
.81
-60 -40 -20 0lnprobitkerja
status kerja responden saat interview Pr(kerja) probit
-
Wisnu Harto Adi W & Mercoledi Nikman N @2013
Ordinal Logit and Probit Regression Models Misalkan kita
memiliki variabel dependen ordinal seperti intensitas keagamaan (0
= tidak ada agama, 1 = agak kuat, 2 = tidak sangat kuat, dan 3 =
kuat). Logit ordinal dan model probit memiliki asumsi regresi
paralel atau asumsi odds-ratio, yang dalam prakteknya sering
dilanggar.
Ordinal Logit Model di Stata (ologit.)
Stata memiliki perintah dasar ologit.dan oprobit., yang
merupakan perintah untuk memperkirakan hasil logit ordinal serta
model regresi probit. Output yang dihasilkan mereka tampak seperti
hasil logit biasa: (mempergunakan data dari net install) . use
"http://dl.dropboxusercontent.com/u/45099676/gss_cdvm.dta", clear .
ologit belief educate income age male www
Iteration 0: log likelihood = -1499.6929 Iteration 1: log
likelihood = -1480.3168 Iteration 2: log likelihood = -1480.2738
Iteration 3: log likelihood = -1480.2738 Ordered logistic
regression Number of obs = 1174 LR chi2(5) = 38.84 Prob > chi2 =
0.0000 Log likelihood = -1480.2738 Pseudo R2 = 0.0129
------------------------------------------------------------------------------
belief | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educate | -.0020145 .0220039 -0.09 0.927 -.0451414 .0411124 income
| -.0059213 .0089976 -0.66 0.510 -.0235563 .0117137 age | .0186456
.0042123 4.43 0.000 .0103897 .0269015
male | -.4661952 .1085422 -4.30 0.000 -.6789339 -.2534564 www |
.1264832 .1357087 0.93 0.351 -.1395009 .3924673
-------------+----------------------------------------------------------------
/cut1 | -1.183894 .3674989 -1.904178 -.463609 /cut2 | -.4989643
.3648623 -1.214081 .2161526 /cut3 | 1.186547 .366256 .4686988
1.904396
------------------------------------------------------------------------------
Model ini cukup baik melakukan estimasi peluang, meskipun hanya
usia (age) dan jenis kelamin (sex) yang signifikan secara
statistik.
. fitstat
Measures of Fit for ologit of belief
Log-Lik Intercept Only: -1499.693 Log-Lik Full Model: -1480.274
D(1166): 2960.548 LR(5): 38.838 Prob > LR: 0.000 McFadden's R2:
0.013 McFadden's Adj R2: 0.008 ML (Cox-Snell) R2: 0.033
Cragg-Uhler(Nagelkerke) R2: 0.035 McKelvey & Zavoina's R2:
0.033 Variance of y*: 3.403 Variance of error: 3.290
-
Wisnu Harto Adi W & Mercoledi Nikman N @2013
Count R2: 0.407 Adj Count R2: 0.031 AIC: 2.535 AIC*n: 2976.548
BIC: -5280.941 BIC': -3.497 BIC used by Stata: 3017.093 AIC used by
Stata: 2976.548
. mfx, at(mean educate=16 male=0 www=1)
Marginal effects after ologit
y = Pr(belief==0) (predict) = .12983744
------------------------------------------------------------------------------
variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X
---------+--------------------------------------------------------------------
educate | .0002276 .00249 0.09 0.927 -.004655 .005111 16 income |
.000669 .00102 0.66 0.510 -.001322 .002659 24.6486 age | -.0021066
.00049 -4.27 0.000 -.003075 -.001139 41.3075 male*| .0622968 .01503
4.15 0.000 .032845 .091748 0 www*| -.014971 .0166 -0.90 0.367
-.047509 .017567 1
------------------------------------------------------------------------------
(*) dy/dx is for discrete change of dummy variable from 0 to 1
Marginal effect dan perubahan diskrit lebih mampu menjelaskan
apabila dibandingakan dengan perubahan dari faktor odd-ratio. Untuk
10 unit peningkatan usia yang meiliki rata-rata 41, probabilita
tidak beragama diperkirakan menurun sebesar 2,1 persen (.21 * 10),
yang bisa diartikan dari keseluruhan variabel lain bernilai konstan
pada titik acuan (cateris paribus asumsinya). Pria memiliki
kecenderungan sebesar 6,23 persen lebih mungkin dibandingkan
perempuan untuk tidak memiliki agama pada beberapa poinst referensi
yang sama.
Selanjutnya, perintah mfx2. bisa dipergunakan. Perintah ini
berguna untuk model respon ordinal dan multinomial (multinomial
logit, serta ordered probit). Perintah ini menghasilkan efek
marginal (perubahan diskrit) dan nilai standard error untuk semua
kasus dalam model, sedangkan mfx. hanya melaporkan efek marginal
untuk hasil pertama (0 dalam kasus ini) saja. Tapi baik mfx. maupun
mfx2. memiliki format output yang sama.
. mfx2, at(mean educate=16 male=0 www=1)
Frequencies for belief...
Religious | Intensity | Freq. Percent Cum.
----------------+----------------------------------- No religion
| 192 16.35 16.35
Somewhat strong | 134 11.41 27.77 Not very strong | 456 38.84
66.61
Strong | 392 33.39 100.00
----------------+-----------------------------------
Total | 1,174 100.00
Computing marginal effects after ologit for belief == 0...
Marginal effects after ologit y = Pr(belief==0) (predict,
o(0))
= .12983744
------------------------------------------------------------------------------
variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X
---------+--------------------------------------------------------------------
educate | .0002276 .00249 0.09 0.927 -.004655 .005111 16 income |
.000669 .00102 0.66 0.510 -.001322 .002659 24.6486 age | -.0021066
.00049 -4.27 0.000 -.003075 -.001139 41.3075
-
Wisnu Harto Adi W & Mercoledi Nikman N @2013
male*| .0622968 .01503 4.15 0.000 .032845 .091748 0 www*|
-.014971 .0166 -0.90 0.367 -.047509 .017567 1
------------------------------------------------------------------------------
(*) dy/dx is for discrete change of dummy variable from 0 to 1
Computing marginal effects after ologit for belief == 1...
Marginal effects after ologit y = Pr(belief==1) (predict,
o(1))
= .09854499
------------------------------------------------------------------------------
variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X
---------+--------------------------------------------------------------------
educate | .0001274 .00139 0.09 0.927 -.002602 .002857 16 income |
.0003745 .00057 0.66 0.511 -.000742 .001491 24.6486 age | -.0011792
.00028 -4.17 0.000 -.001733 -.000625 41.3075 male*| .0298649 .0073
4.09 0.000 .015564 .044166 0 www*| -.0080795 .00874 -0.92 0.355
-.025211 .009052 1
------------------------------------------------------------------------------
(*) dy/dx is for discrete change of dummy variable from 0 to 1
Computing marginal effects after ologit for belief == 2...
Marginal effects after ologit y = Pr(belief==2) (predict,
o(2))
= .3865383
------------------------------------------------------------------------------
variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X
---------+--------------------------------------------------------------------
educate | .000122 .00132 0.09 0.927 -.002472 .002716 16 income |
.0003586 .00055 0.65 0.517 -.000727 .001444 24.6486 age | -.0011294
.00036 -3.15 0.002 -.001833 -.000426 41.3075 male*| .0108521 .0057
1.90 0.057 -.000329 .022033 0 www*| -.006432 .00619 -1.04 0.299
-.018568 .005704 1
------------------------------------------------------------------------------
(*) dy/dx is for discrete change of dummy variable from 0 to 1
Computing marginal effects after ologit for belief == 3...
Marginal effects after ologit y = Pr(belief==3) (predict,
o(3))
= .38507927
------------------------------------------------------------------------------
variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X
---------+--------------------------------------------------------------------
educate | -.000477 .00521 -0.09 0.927 -.010682 .009728 16 income |
-.0014021 .00213 -0.66 0.511 -.00558 .002776 24.6486 age | .0044152
.001 4.41 0.000 .002455 .006375 41.3075 male*| -.1030138 .02374
-4.34 0.000 -.149547 -.056481 0 www*| .0294825 .03126 0.94 0.346
-.031777 .090743 1
------------------------------------------------------------------------------
(*) dy/dx is for discrete change of dummy variable from 0 to 1
Ordinal Probit Model in Stata (.oprobit)
Let us fit the ordinal probit model using the same
specification. Logit and probit models produce similar parameter
estimates and goodness-of-fit measures. For example, their
likelihood ratios are 38.84 versus 40.13 and pseudo R2 are .0129
versus .0134, respectively.
. oprobit belief educate income age male www
Iteration 0: log likelihood = -1499.6929 Iteration 1: log
likelihood = -1479.63 Iteration 2: log likelihood = -1479.6279
Iteration 3: log likelihood = -1479.6279
Ordered probit regression Number of obs = 1174 LR chi2(5) =
40.13 Prob > chi2 = 0.0000 Log likelihood = -1479.6279 Pseudo R2
= 0.0134
-
Wisnu Harto Adi W & Mercoledi Nikman N @2013
------------------------------------------------------------------------------
belief | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educate | -.0015194 .0130701 -0.12 0.907 -.0271362 .0240974 income
| -.0027382 .0053709 -0.51 0.610 -.0132649 .0077886 age | .0109693
.0024755 4.43 0.000 .0061175 .0158211
male | -.290305 .0646295 -4.49 0.000 -.4169764 -.1636335 www |
.0642404 .0809186 0.79 0.427 -.0943572 .2228379
-------------+----------------------------------------------------------------
/cut1 | -.7138045 .2182722 -1.14161 -.2859989 /cut2 | -.3178217
.2172398 -.7436038 .1079604 /cut3 | .7199238 .217734 .293173
1.146675
------------------------------------------------------------------------------
. fitstat
Measures of Fit for oprobit of belief
Log-Lik Intercept Only: -1499.693 Log-Lik Full Model: -1479.628
D(1166): 2959.256 LR(5): 40.130 Prob > LR: 0.000 McFadden's R2:
0.013 McFadden's Adj R2: 0.008 ML (Cox-Snell) R2: 0.034
Cragg-Uhler(Nagelkerke) R2: 0.036 McKelvey & Zavoina's R2:
0.040 Variance of y*: 1.041 Variance of error: 1.000 Count R2:
0.414 Adj Count R2: 0.042 AIC: 2.534 AIC*n: 2975.256 BIC: -5282.233
BIC': -4.789 BIC used by Stata: 3015.801 AIC used by Stata:
2975.256
Dari hitungan probabilita, yang diprediksi oleh efek marginal
(perubahan diskrit) pada titik-titik referensi yang sama. Maka,
didapatkan hasil 12,73 persen pengguna variabel WWW dengan jenis
kelamin perempuan rata - rata tidak memiliki agama. (dilihat dari
nilai mfx. y)
. mfx, at(mean educate=16 male=0 www=1)
Marginal effects after oprobit
y = Pr(belief==0) (predict) = .12727708
------------------------------------------------------------------------------
variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X
---------+--------------------------------------------------------------------
educate | .0003167 .00273 0.12 0.908 -.005037 .00567 16 income |
.0005708 .00112 0.51 0.610 -.001622 .002764 24.6486 age | -.0022867
.00053 -4.28 0.000 -.003335 -.001238 41.3075 male*| .070649 .01616
4.37 0.000 .038981 .102317 0 www*| -.0138841 .01793 -0.77 0.439
-.04903 .021262 1
------------------------------------------------------------------------------
(*) dy/dx is for discrete change of dummy variable from 0 to 1sd_x=
2.56971 6.19427 13.4071 .497765 .410755
Sedangkan dari hasil mfx2. , didapatkan rinciannya sebagai
berikut: . mfx2, at(mean educate=16 male=0 www=1)
Frequencies for belief...
Religious | Intensity | Freq. Percent Cum.
----------------+----------------------------------- No religion
| 192 16.35 16.35
Somewhat strong | 134 11.41 27.77 Not very strong | 456 38.84
66.61
Strong | 392 33.39 100.00
----------------+-----------------------------------
Total | 1,174 100.00
Computing marginal effects after oprobit for belief == 0...
Marginal effects after oprobit
-
Wisnu Harto Adi W & Mercoledi Nikman N @2013
y = Pr(belief==0) (predict, o(0)) = .12727708
------------------------------------------------------------------------------
variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X
---------+--------------------------------------------------------------------
educate | .0003167 .00273 0.12 0.908 -.005037 .00567 16 income |
.0005708 .00112 0.51 0.610 -.001622 .002764 24.6486 age | -.0022867
.00053 -4.28 0.000 -.003335 -.001238 41.3075 male*| .070649 .01616
4.37 0.000 .038981 .102317 0 www*| -.0138841 .01793 -0.77 0.439
-.04903 .021262 1
------------------------------------------------------------------------------
(*) dy/dx is for discrete change of dummy variable from 0 to 1
Computing marginal effects after oprobit for belief == 1...
Marginal effects after oprobit y = Pr(belief==1) (predict,
o(1))
= .10135041
------------------------------------------------------------------------------
variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X
---------+--------------------------------------------------------------------
educate | .0001431 .00123 0.12 0.907 -.002269 .002555 16 income |
.0002579 .00051 0.51 0.611 -.000734 .00125 24.6486 age | -.001033
.00025 -4.16 0.000 -.00152 -.000546 41.3075 male*| .0259728 .00613
4.24 0.000 .013958 .037987 0 www*| -.0060148 .00755 -0.80 0.426
-.020822 .008792 1
------------------------------------------------------------------------------
(*) dy/dx is for discrete change of dummy variable from 0 to 1
Computing marginal effects after oprobit for belief == 2...
Marginal effects after oprobit y = Pr(belief==2) (predict,
o(2))
= .38713527
------------------------------------------------------------------------------
variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X
---------+--------------------------------------------------------------------
educate | .0001206 .00103 0.12 0.907 -.001895 .002136 16 income |
.0002174 .00043 0.50 0.614 -.000627 .001062 24.6486 age | -.0008709
.00028 -3.15 0.002 -.001412 -.000329 41.3075 male*| .0082326 .00456
1.81 0.071 -.000701 .017166 0 www*| -.0043953 .00504 -0.87 0.383
-.01428 .005489 1
------------------------------------------------------------------------------
(*) dy/dx is for discrete change of dummy variable from 0 to 1
Computing marginal effects after oprobit for belief == 3...
Marginal effects after oprobit
y = Pr(belief==3) (predict, o(3)) = .38423723
------------------------------------------------------------------------------
variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X
---------+--------------------------------------------------------------------
educate | -.0005804 .00499 -0.12 0.907 -.01036 .0092 16 income |
-.001046 .00205 -0.51 0.610 -.005069 .002977 24.6486 age | .0041906
.00095 4.43 0.000 .002335 .006046 41.3075 male*| -.1048544 .02315
-4.53 0.000 -.150222 -.059487 0 www*| .0242943 .03037 0.80 0.424
-.035234 .083822 1
------------------------------------------------------------------------------
(*) dy/dx is for discrete change of dummy variable from 0 to 1
-
Wisnu Harto Adi W & Mercoledi Nikman N @2013
Multinomial Logit Regression Model
Dengan melakukan pemerikasaan model intensitas keagamaan dalam
model logit multinomial tanpa mengubah spesifikasi, maka kita coba
untuk mengingat kembali hasil tes Brant yang menolak hipotesis nol
akibat dari kemungkinan adanya asumsi proporsional sehingga model
logit ordinal tidak secara teoritis berlaku. Stata memiliki
mprobit.perintah agar sesuai dengan model probit multinomial, akan
tetapi model ini jarang dipergunakan daripada logit terutama karena
kesulitan secara praktikal dalam estimasinya.
Multinomial Logit di Stata (.mlogit)
Di Stata, mlogit. adalah perintah dasar untuk estimasi model
multinomial logit. Perintah ini secara menggunakan basis dasar satu
sebagai hasil dasar saat memperkirakan model.
. mlogit belief educate income age male www, base(3)
Iteration 0: log likelihood = -1499.6929 Iteration 1: log
likelihood = -1469.6341 Iteration 2: log likelihood = -1469.4492
Iteration 3: log likelihood = -1469.4492
Multinomial logistic regression Number of obs = 1174 LR chi2(15)
= 60.49 Prob > chi2 = 0.0000 Log likelihood = -1469.4492 Pseudo
R2 = 0.0202
------------------------------------------------------------------------------
belief | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
No_religion |
educate | .0041038 .0364791 0.11 0.910 -.067394 .0756016 income
| .0005614 .0149146 0.04 0.970 -.0286708 .0297935 age | -.0288972
.0070994 -4.07 0.000 -.0428118 -.0149827 male | .8967689 .1827037
4.91 0.000 .5386761 1.254862 www | -.0347578 .2318055 -0.15 0.881
-.4890883 .4195727
_cons | .0141817 .6060507 0.02 0.981 -1.173656 1.202019
-------------+----------------------------------------------------------------
Somewhat_s~g |
educate | .0060908 .041313 0.15 0.883 -.0748812 .0870628 income
| .0231701 .0184093 1.26 0.208 -.0129116 .0592517 age | -.0161198
.0077715 -2.07 0.038 -.0313517 -.0008878 male | .1738551 .2064474
0.84 0.400 -.2307744 .5784847 www | -.4482836 .2417881 -1.85 0.064
-.9221795 .0256124
_cons | -.7764871 .7036746 -1.10 0.270 -2.155664 .6026898
-------------+----------------------------------------------------------------
Not_very_s~g |
educate | -.0269446 .0284494 -0.95 0.344 -.0827043 .0288151
income | .0048478 .01171 0.41 0.679 -.0181035 .0277991
age | -.0237972 .0053893 -4.42 0.000 -.0343599 -.0132344
male | .4602734 .1429313 3.22 0.001 .1801332 .7404135 www |
-.0252644 .1785439 -0.14 0.887 -.3752041 .3246753
_cons | 1.237746 .4728153 2.62 0.009 .3110455 2.164447
-------------+----------------------------------------------------------------
Strong | (base outcome)
------------------------------------------------------------------------------
-
Wisnu Harto Adi W & Mercoledi Nikman N @2013
Sesuai dengan model yang menggunakan nilai terkecil dari
variabel hasil, maka kedua hasil menghasilkan nilai Goodness of fit
yang sama, tetapi nilai estimasi parameter mereka berbeda satu sama
lain. Keduanya akan memperkirakan modelnya dengan nilai yang sama,
tapi menggunakan pendekatan / cara yang berbeda. . mlogit belief
educate income age male www, base(0)
Iteration 0: log likelihood = -1499.6929 Iteration 1: log
likelihood = -1469.6341 Iteration 2: log likelihood = -1469.4492
Iteration 3: log likelihood = -1469.4492
Multinomial logistic regression Number of obs = 1174 LR chi2(15)
= 60.49 Prob > chi2 = 0.0000 Log likelihood = -1469.4492 Pseudo
R2 = 0.0202
------------------------------------------------------------------------------
belief | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
No_religion | (base outcome)
-------------+----------------------------------------------------------------
Somewhat_s~g |
educate | .001987 .0465735 0.04 0.966 -.0892955 .0932695 income
| .0226087 .0202724 1.12 0.265 -.0171245 .0623419 age | .0127774
.0090102 1.42 0.156 -.0048822 .030437 male | -.7229137 .2307764
-3.13 0.002 -1.175227 -.2706002 www | -.4135258 .2781579 -1.49
0.137 -.9587052 .1316536
_cons | -.7906688 .7863491 -1.01 0.315 -2.331885 .7505472
-------------+----------------------------------------------------------------
Not_very_s~g |
educate | -.0310484 .0352445 -0.88 0.378 -.1001264 .0380297
income | .0042864 .0142516 0.30 0.764 -.0236462 .0322191 age |
.0051 .0069699 0.73 0.464 -.0085608 .0187608 male | -.4364955
.17508 -2.49 0.013 -.7796459 -.0933451 www | .0094934 .2233075 0.04
0.966 -.4281812 .447168
_cons | 1.223565 .5817148 2.10 0.035 .0834247 2.363705
-------------+----------------------------------------------------------------
Strong |
educate | -.0041038 .0364791 -0.11 0.910 -.0756016 .067394
income | -.0005614 .0149146 -0.04 0.970 -.0297935 .0286708 age |
.0288972 .0070994 4.07 0.000 .0149827 .0428118 male | -.8967689
.1827037 -4.91 0.000 -1.254862 -.5386761 www | .0347578 .2318055
0.15 0.881 -.4195727 .4890883
_cons | -.0141817 .6060507 -0.02 0.981 -1.202019 1.173656
------------------------------------------------------------------------------
. fitstat
Measures of Fit for mlogit of belief
Log-Lik Intercept Only: -1499.693 Log-Lik Full Model: -1469.449
D(1150): 2938.898 LR(15): 60.487 Prob > LR: 0.000 McFadden's R2:
0.020 McFadden's Adj R2: 0.004 ML (Cox-Snell) R2: 0.050
Cragg-Uhler(Nagelkerke) R2: 0.054
Count R2: 0.428 Adj Count R2: 0.064 AIC: 2.544 AIC*n: 2986.898
BIC: -5189.499 BIC': 45.535 BIC used by Stata: 3066.126 AIC used by
Stata: 2974.898
-
Wisnu Harto Adi W & Mercoledi Nikman N @2013
Model multinomial logit mengembalikan rasio statistik
probabilita (2 = 60,49), tapi tidak untuk parameter individunya.
Model ini kurag baik dipergunakan untuk data yang normal (secara
distribusi data). Secara umum proses dari multinomial maupun
ordered logit / probit memiliki tahapan yang hampir sama dengan
logit - probit biasa. []
Secara metode, Multinomial Logit, maupun Ordered probit
menggunakan logika dasar Logit dan Probit biasa.
-
Wisnu Harto Adi W & Mercoledi Nikman N @2013
F.A.Q seputar Logit-Probit
Kapan harus tahu memakai Logit atau Probit? Seperti yang
ditunjukkan pada hasil di atas, Logit sebaiknya dipakai apabila
data yang digunakan bersifat tidak normal. Namun jika data yang
digunakan bersifat normal, maka akan lebih baik apabila memakai
Probit. Seringkali data bersifat normal jadi banyak orang yang
memakai Logit dan Probit tanpa pertimbangan lebih lanjut, namun
beberapa data banyak yang abnormal (seperti logistik) dan harus
memakai Logit untuk regresinya. Heckman, yang menggunakan model
biner untuk tahap pertama regresinya, juga secara khusus
mensyaratkan pemakaian Probit untuk pengolahan model binernya
karena model seleksi sensitif terhadap normalitas.
Adakah model lain untuk data yang bersifat binomial? Ada, namun
jarang sekali dipakai. Ada model LPM (Linear Probability Model)
yang merupakan ekstensi dari OLS, namun mempunyai kekurangan berupa
tidak dibatasinya kemungkinan prediksi antara 0 dan 1.
Penjelasan lebih lanjut tentang LPM terdapat di Suwardi
(2011).
Data saya bukan binomial, namun kategorikal. Pakainya Logit atau
Probit jugakah? Yang dipakai adalah ekstensi dari logit dan probit.
Ekstensinya ada banyak dan ini semua tergantung dengan keadaan dari
data dan tujuan penelitian. Terdapat model mlogit untuk variabel
dependen yang tingkatnya setara, oprobit untuk variabel dependen
yang mempunyai ranking, dan lain sebagainya. Penjelasan lebih
lanjut untuk ekstensi Logit dan Probit dapat dilihat di Hamilton
(2009), bab 10.
-
Wisnu Harto Adi W & Mercoledi Nikman N @2013
Daftar Pustaka Hamilton, Lewis. 2009. Statistics with Stata:
Updated for Version 10. Belmont: Brooks-Cole Cengage Learning.
Cameron, A.C. & P.K.Trivedi. 2009. Microeconomics using
Stata. College Station: STATA Press.
Suwardi, Akbar. 2011. Modul Final LPM, Logit, Probit (Edisi
2011). Handout Latihan Lab. Komputasi Dept. IE.
Nasiir, Mercoledi. 2012. Modul Pelatihan Logit Probit (Edisi
2012). Handout Latihan Lab. Komputasi Dept. IE
Park, Hun. 2009. Regression Models for Ordinal and Nominal
Dependent Variables Using SAS, Stata, LIMDEP, and SPSS*. Indiana
University: University Information Technology Services.
Katchova, Ani. 2013. Multinomial Probit and Logit Models. Stata
Handbook.
Logit TeoriProbit, dan logit model untuk functional forms -
propertiesProbit TeoriAplikasi Model Menggunakan Software
STATAMengenal DataSpesifikasi ModelAplikasi Model 1: LogitAplikasi
Model 2: Probit
F.A.Q seputar Logit-ProbitKapan harus tahu memakai Logit atau
Probit?Adakah model lain untuk data yang bersifat binomial?Data
saya bukan binomial, namun kategorikal. Pakainya Logit atau Probit
jugakah?
Daftar Pustaka