CDVM Training WisnuLedie(April2013)

Wisnu Harto Adi W & Mercoledi Nikman N @2013

Categorical Dependent Variable Model / Limited Dependent Variable Mode Contoh dari model probit dan logit Binary dependent variable Probit, dan logit model untuk functional forms - properties Koefisien Model & Intepretasi Marginal effects (and odds ratios) & Intepretasi Goodness of fit statistics (percent correctly predicted and pseudo R-squared) Pilihan antara probit dan logit Model ekonomi yang mengacu pada penggunaan model probit dan logit

Pengantar

Dalam kehidupan sehari - hari, kita menumui beragam jawaban atas pilhan. Begitu pula dengan data untuk penelitian yang Anda lakukan menggunakan variabel dependen yang bersifat kontinyu, dan bisa saja penelitian Anda menggunakan variabel dependen yang bersifat diskrit, seperti kategorikal atau binomial. Ketika variabel dependen yang Anda gunakan bersifat diskrit, Anda harus menggunakan model khusus dalam penelitian Anda.

Namun perlu diingat bahwa diskrit banyak macamnya. Modul ini akan menjelaskan model yang sering digunakan untuk penelitian yang variabel dependennya bersifat binomial (hanya ada dua kemungkinan jawaban), yaitu Logit dan Probit.

Contoh dari Model Probit & Logit

Contoh hasil model biner

Keputusan Ekonomis Konsumen: Apakah konsumen akan melakukan pembelian atau tidak.

Buruh dalam Perekonomian: Apakah seorang individu berpartisipasi dalam pasar tenaga kerja atau tidak.

Ekonomi Pertanian: Apakah seorang petani mengadopsi atau menggunakan praktik organik dalam pemasaran / produksi kontrak, dsb

Hasil dari putusan variabel dependennya

Keputusan / pilihan untuk memiliki atau tidak memiliki, melakukan, menggunakan, atau mengadopsi.

Variabel terikat memiliki bentuk biner sebagai responnya Nilai biner yag dimaksud adalah: 0 dan 1.

CDVM / LDVM merupakan istilah yang biasa digunakan untuk merujuk pada Model Biner (Binary Model) maupun pengembangannya, seperti Ordered Probit / Multinomial Logit, Mixed Probit, dan sebagainya. Keputusan dalam bermain game RPG, maupun banyak hal lain seperti keputusan untuk membeli barang A atau B, maupun game theory juga bisa merujuk pada model biner

= 11 + = 1 +

Model Biner paling sederhana adalah Logit (data distribusi Logistik), maupun Probit (Distribusi data normal) Penyederhanaan model Logit adalah Pr(x) = 1/1+a, atau jika dijabarkan menjadi yang bisa disederhanakan menjadi dy/dx (odds-ratio)


Logit Teori

Probit, dan logit model untuk functional forms - properties

Model Logit menggunakan persamaan eksponensial untuk mendapatkan nilai probabilitas pada interval 0 dan 1, dan persamaannya adalah sebagai berikut:

Pr() = 11 + = 11 + (+ +) atau dapat disederhanakan menjadi:

= 11 + = 1 + Zi sebagai bentuk penyederhanaan dari fungsi + xi+, yaitu variabel independen yang memiliki kemampuan untuk mempengaruhi nilai variabel dependen, sementara Pi merupakan probabilitas

Saat Z berkisar antara - sampai , Pi akan menghasilkan nilai antara 0 dan 1. Dengan kata lain, persamaan ini menghitung probabilitas hasil Y antara interval 0 sampai 1. Namun implikasi dari model ini adalah bentuknya bukan bentuk linear, dan Pi tidak berhubungan linear dengan Z. Parameter yang dihasilkan perlu melewati proses selanjutnya untuk benar-benar menunjukkan efek marjinal.

Untuk membuatnya menjadi bentuk linear, kita harus membuat logaritma natural dari persamaan Odds Ratio-nya. Odds Ratio merupakan peluang sukses yang dibagi dengan peluang gagal. Persamaannya adalah sebagai berikut:

Pr()1 Pr() = + 111 + = Setelah itu, bentuk persamaan diatas dibuat menjadi logaritma natural, sebagai berikut:

ln Pr()1 Pr() = = + + Dengan kata lain, hasil odds ratio yang dilogaritmanaturalkan akan menghasillkan parameter yang bersifat linear dan dapat diinterpretasikan efek marjinalnya.

Agar lebih jelas, grafik di bawah ini menggambarkan bentuk kedua persamaan yang telah dibentuk di atas.

Grafik 1: Perbedaan Hasil Ln Odds Ratio dan Probabilitas Model Logit


Sumber: www.graphpad.com

Kelebihan model Logit adalah sebagai berikut:

Saat P berpindah dari 0 ke 1, persamaan logit akan berpindah dari - ke . Oleh karena itu, meski probabilitasnya terbatasi antara 0 sampa 1, persamaan logit tersebut tidak terbatasi.

Hasil persamaan logit yang positif menunjukkan hubungan yang searah (berbanding lurus) antara nilai variabel independen dengan kemungkinan (odds) variabel dependen bernilai 1 (sukses). Artinya, meningkatnya nilai variabel independen akan meningkatkan kemungkinan variabel dependen bernilai 1, dan sebaliknya menurunnya nilai variabel independen akan menurunkan kemungkinan variabel dependen bernilai 1. Sedangkan hasil persamaan logit yang negatif menunjukkan hubungan yang terbalik (berbanding terbalik) antara nilai variabel independen dengan kemungkinan untuk variabel dependen bernilai 1.


Probit Teori

Selain model Logit, yang juga sering digunakan untuk mengolah data binomial adalah model Probit. Perbedaan yang paling mendasar antara model Logit dan Probit adalah nature (keadaan) data yang akan diolah. Model Probit mengasumsikan data yang diolah terdistribusi normal, yaitu bell-shaped (berbentuk lonceng) dengan standar error (galat) bernilai 1.

Model matematis Probit adalah sebagai berikut:

() = 12 2 2

Ii melambangkan variabel independen yang kiranya mempengaruhi outcome fungsi Probit, maka persamaan di atas dapat juga ditulis dengan:

() = 12 2 2+

Dan fungsi F(.) langsung menunjukkan fungsi probabilitas untuk outcome variabel dependen. Implikasi dari model ini adalah perlakuan lanjut untuk interpretasinya. Pada Logit, agar dapat melihat probabilitanya kita harus mencari nilai rasio kemungkinan yang kemudian dilogaritmanaturalkan. Namun pada Probit, hasil koefisiennya dapat langsung dikonversi menjadi efek marjinal dengan cara inversi fungsi persamaan di atas, dan langsung mendapat nilai probabilita untuk outcome variabel dependen

() = 12 2 2+

Probit memiliki output probabilita yang sama dengan logit, namun distribusi data dan metodenya berbeda (sama secara prinsipal) Penyederhanaan model Probit adalah F_Pr(x) = 1/a*limX , atau jika dijabarkan menjadi yang bisa disederhanakan menjadi dF/dx (Marginal Effect)


Aplikasi Model Menggunakan Software STATA Modul ini akan menggunakan data olahan1 dari SAKERTI/Indonesia Family Life Survey putaran 4, yang diadakan tahun 2007-2008. Kita akan mencoba mengolah data untuk melihat kemungkinan responden bekerja atau tidak, dilihat dari variabel demografinya.

Mengenal Data Sebelum mengolah data, ada baiknya kita mengenal data yang akan kita gunakan. Jika dataset yang anda gunakan telah mempunyai label, maka command describe, atau bisa disingkat menjadi de, dapat langsung digunakan.

Data dapat diimpor lewat:

use http://dl.dropboxusercontent.com/u/45099676/ldvm_labkom_20042013.dta, clear

ataupun penggunaan secara manual

. describe Contains data from http://dl.dropboxusercontent.com/u/45099676/ldvm_labkom_20042013.dta obs: 50,580 vars: 13 14 Jun 2012 02:22 size: 2,731,320 (94.8% of memory free) ------------------------------------------------------------------------------------- storage display value variable name type format label variable label ------------------------------------------------------------------------------------- pid07 byte %8.0g respondent's hh member id # hhid07 str8 %9s 2007 household id kerja float %9.0g status kerja responden saat interview krt float %9.0g kepala rumah tangga age float %9.0g age now miskin float %9.0g poor Poor or Not, 2007 pwt07xa float %9.0g ifls4 person cross-section weight w/ attrition correction pensiun float %9.0g Whether receiving PENSION lntotexp float %9.0g ln dari pengeluaran perkapita laki float %9.0g berjenis kelamin laki-laki socas float %9.0g mendapat bantuan sosial (either BLT,PKH,Raskin) age2 float %9.0g hasil kuadrat dari umur sekarang kota byte %9.0g RECODE of area (urban/rural) menikah float %9.0g sedang menikah saat interview ------------------------------------------------------------------------------------- Sorted by: hhid07 pid07 Dari tabel diatas kita dapat mengambil beberapa informasi yang vital untuk pengolahan data selanjutnya. Dalam dataset ini, terdapat 13 variabel dan 50.580 observasi. Satu variabel, yaitu hhid07, bersifat string, yang berarti data tersebut disimpan dalam bentuk non-numerik. Lainnya bersifat float dan byte, yang berarti disimpan dalam bentuk numerik. Perbedaan kedua bentuk berimplikasi pada jumlah digit data yang dapat disetor dalam memori. Value label merupakan label yang dikenakan oleh nilai dalam variabel yang menggunakan label tersebut. Dan variable label merupakan label untuk suatu variabel, biasanya diisi dengan informasi vital dari data oleh sang pengolah data.

Selanjutnya kita dapat melihat lebih jauh keadaan data dengan menggunakan command summarize, atau bisa disingkat dengan su.

1 Data ini diolah dari buku K, 1 dan 3A. Segala informasi lebih lanjut dari pengolahan data ini bisa langsung ditanyakan ke penulis.


. summarize Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- pid07 | 50580 3.760854 2.823632 1 38 hhid07 | 0 kerja | 50580 .3951562 .488889 0 1 krt | 50580 .1540134 .3609652 0 1 age | 46732 28.71223 20.09182 0 120 -------------+-------------------------------------------------------- miskin | 46732 .1523367 .3593508 0 1 pwt07xa | 46731 1.031128 .494533 .2548358 2.764099 pensiun | 50580 .0160735 .1257597 0 1 lntotexp | 46720 14.18649 .8212604 6.725434 17.37144 laki | 46732 .4906488 .4999179 0 1 -------------+-------------------------------------------------------- socas | 50580 .4714512 .4991892 0 1 age2 | 46732 1228.065 1473.248 0 14400 kota | 46732 .5275828 .499244 0 1 menikah | 50580 .0324239 .1771248 0 1

Dari tabel diatas, kita dapat mengetahui tidak semua observasi berjumlah sama. Variabel age, miskin, pwt07xa, laki, age2, dan kota masing-masing berjumlah 46.732 observasi, dan variabel lntotexp berjumlah 46.720. Hal ini akan berpengaruh pada regresi nantinya. Perhatikan juga bahwa variabel hhid07 tidak mempunyai laporan apapun. Hal ini bukan berarti variabel hhid07 tidak mempunyai nilai, namun disebabkan bentuk datanya yang telah diidentifikasi sebagai string. Selain itu, variabel kerja, krt, miskin, pensiun, laki, socas, kota, dan menikah mempunyai nilai minimum 0 dan maksimum 1. Hal ini menunjukkan kedelapan variabel tersebut bersifat dummy. Variabel age, age2, pwt07xa dan lntotexp bernilai kontinyu.

Spesifikasi Model Model yang digunakan untuk simulasi modul ini adalah sebagai berikut:

( = 1) = + 1 + 2 + 3 + 4 + 52 + 6 + 7 +

Perhatikan spesifikasi modelnya yang menyatakan variabel dependen sebagai P(Y =1); hal ini melambangkan model menghasilkan nilai probabilitas variabel dependen bernilai 1 dilihat dari keadaan variabel independen yang dinyatakan di spesifikasi model.

Aplikasi Model 1: Logit Model Logit mempunyai syntax sebagai berikut:

logit [var. dependen] [var. independen] [if] [in] [weight] [, options]

fungsi if dan in adalah fungsi pembatas untuk data yang digunakan, namun mempunyai perbedaan dalam aplikasi. Fungsi if melakukan pembatasan dari nilai suatu variabel, sedangkan fungsi in melakukan pembatasan berdasarkan urutan observasi. Sangat dianjurkan untuk memakai fungsi if saja karena fungsi in sangat bergantung pada urutan data. Sedangkan fungsi weight merupakan pembobotan yang dimasukkan dalam data sampel, agar lebih melambangkan populasi secara keseluruhan. Fungsi weight


yang dibolehkan adalah fweight (bobot frekuensi), iweight (bobot kepentingan), atau aweight (bobot analitis).

Selanjutnya spesifikasi model diaplikasikan pada STATA, dan hasilnya adalah sebagai berikut.

. logit kerja miskin laki lntotexp age age2 socas pensiun Iteration 0: log likelihood = -31694.826 Iteration 1: log likelihood = -21370.277 Iteration 2: log likelihood = -20592.498 Iteration 3: log likelihood = -20574.498 Iteration 4: log likelihood = -20574.492 Iteration 5: log likelihood = -20574.492 Logistic regression Number of obs = 46720 LR chi2(7) = 22240.67 Prob > chi2 = 0.0000 Log likelihood = -20574.492 Pseudo R2 = 0.3509 ------------------------------------------------------------------------------ kerja | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- miskin | -.4240104 .0401285 -10.57 0.000 -.5026608 -.3453599 laki | 1.038157 .0249915 41.54 0.000 .9891746 1.087139 lntotexp | -.2916492 .0178292 -16.36 0.000 -.3265938 -.2567046 age | .3150323 .0033198 94.89 0.000 .3085256 .321539 age2 | -.0035296 .0000409 -86.24 0.000 -.0036099 -.0034494 socas | .1103204 .0259203 4.26 0.000 .0595176 .1611232 pensiun | -.4169765 .0862499 -4.83 0.000 -.5860233 -.2479297 _cons | -1.97111 .2606003 -7.56 0.000 -2.481877 -1.460342 ------------------------------------------------------------------------------ Note: 1 failure and 0 successes completely determined.

Iterasi (pembagian) yang ada di bagian atas menunjukkan proses maksimisasi logaritma dari fungsi likelihood. Pada iterasi 0, hasil log kemungkinan (log likelihood) menggambarkan aplikasi model yang hanya memasukkan nilai intersep (ditunjukkan dengan variabel _cons). Sedangkan hasil log kemungkinan di baris terakhir menunjukkan aplikasi model yang hasilnya ditampilkan dalam tabel hasil.

Di sebelah kanan atas terdapat hasil tes 2 keseluruhan yang hipotesis nol (H0)-nya menyatakan bahwa semua parameter dari model bernilai 0. Hasil di atas menunjukkan H0ditolak, sehingga dapat dibilang bahwa variabel independen yang dimasukkan dalam spesifikasi mempunyai pengaruh terhadap outcome status kerja responden.


Di bawahnya terdapat hasil tes pseudo R2, yang berperan sebagai pengganti R2 di model linear. Perlu diperhatikan bahwa hasil pseudo R2 kurang dapat menjelaskan interpretasi langsung dari varian, suatu kelebihan yang dimiliki oleh tes R2 pada model linear.

Sebelum masuk ke interpretasi, ada baiknya kita mengetes apakah spesifikasi model sudah benar apa belum. Untuk itu kita dapat menggunakan 3 komando, yaitu estat gof; estat class; dan fitstat.

. estat gof Logistic model for kerja, goodness-of-fit test number of observations = 46720 number of covariate patterns = 46502 Pearson chi2(46494) = 46659.56 Prob > chi2 = 0.2931

Estat gof menunjukkan hasil goodness-of-fit Pearson 2 test untuk model yang telah diregresi tepat sebelum komando ini digunakan. Pengujian ini menggunakan metode pengecekan hasil data yang terobservasi dibandingkan dengan hasil ekspektasi respon yang didapat dari pola kovariat. Hipotesis nol dalam tes ini adalah dipakainya model yang telah diregresi sebelumnya. Hasil tes di atas menunjukkan tidak ditolaknya H0, yang berarti model ini valid untuk diinterpretasi lebih lanjut.

. estat class Logistic model for kerja -------- True -------- Classified | D ~D | Total -----------+--------------------------+----------- + | 15070 6240 | 21310 - | 4288 21122 | 25410 -----------+--------------------------+----------- Total | 19358 27362 | 46720 Classified + if predicted Pr(D) >= .5 True D defined as kerja != 0 -------------------------------------------------- Sensitivity Pr( +| D) 77.85% Specificity Pr( -|~D) 77.19% Positive predictive value Pr( D| +) 70.72% Negative predictive value Pr(~D| -) 83.12% -------------------------------------------------- False + rate for true ~D Pr( +|~D) 22.81% False - rate for true D Pr( -| D) 22.15% False + rate for classified + Pr(~D| +) 29.28% False - rate for classified - Pr( D| -) 16.88% -------------------------------------------------- Correctly classified 77.47% --------------------------------------------------

Sedangkan estat class menunjukkan tabel klasifikasi yang menunjukkan apakah klasifikasi model sudah baik apa belum. Sensitivity menunjukkan hasil prediksi bernilai sukses yang terbukti dalam observasi bernilai sukses

Pseudo R^2 dipergunakan untuk menggantikan nilai R^2 dalam model OLS. LDV lebih spesifik menggunakan nilai correctly classified untuk menjelaskan R^2 dari model.


(Y bernilai 1), dan sensitivity menunjukkan hasil prediksi bernilai gagal yang terbukti dalam observasi bernilai gagal (Y bernilai 0). Dalam hal ini, sensitivity dan specificity bernilai relatif sama, yaitu (berurutan) 77.85% dan 77.19%. Secara keseluruhan, spesifikasi model ini dapat memprediksi dengan tepat sebesar 77.47%.

. fitstat Measures of Fit for logistic of kerja Log-Lik Intercept Only: -31694.826 Log-Lik Full Model: -20574.492 D(46712): 41148.984 LR(7): 22240.667 Prob > LR: 0.000 McFadden's R2: 0.351 McFadden's Adj R2: 0.351 Maximum Likelihood R2: 1.000 Cragg & Uhler's R2: 1.000 McKelvey and Zavoina's R2: 0.603 Efron's R2: 0.393 Variance of y*: 8.279 Variance of error: 3.290 Count R2: 0.775 Adj Count R2: 0.456 AIC: 0.881 AIC*n: 41164.984 BIC: -461095.059 BIC': -22165.404

Sedangkan komando fitstat memberikan hasil pengukuran aplikasi model yang sering digunakan dalam model-model lainnya, seperti AIC dan BIC (makin kecil nilainya maka lebih baik modelnya), juga berbagai macam pengukuran R2.

Setelah melewati berbagai macam pengukuran aplikasi model, dapat disimpulkan model Logit ini dapat diterima dan dapat diinterpretasi lebih lanjut. Interpretasi model Logit dapat dilakukan dengan dua cara, yaitu dengan menggunakan rasio kemungkinan (odds ratio) dan dengan melihat efek marjinal.

Untuk melihat nilai rasio kemungkinan (odds ratio), dapat saja menggunakan modifikasi syntax logit. Anda hanya perlu mengganti komando logit menjadi logistic.

. logistic kerja miskin laki lntotexp age age2 socas pensiun Logistic regression Number of obs = 46720 LR chi2(7) = 22240.67 Prob > chi2 = 0.0000 Log likelihood = -20574.492 Pseudo R2 = 0.3509 ------------------------------------------------------------------------------ kerja | Odds Ratio Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- miskin | .6544171 .0262608 -10.57 0.000 .6049189 .7079655 laki | 2.824008 .0705761 41.54 0.000 2.689014 2.965778 lntotexp | .7470305 .013319 -16.36 0.000 .7213767 .7735967 age | 1.370304 .0045491 94.89 0.000 1.361416 1.379249 age2 | .9964766 .0000408 -86.24 0.000 .9963967 .9965565 socas | 1.116636 .0289435 4.26 0.000 1.061324 1.17483 pensiun | .6590364 .0568418 -4.83 0.000 .5565361 .7804148 ------------------------------------------------------------------------------ Note: 1 failure and 0 successes completely determined.

Perlu diingat bahwa nilai rasio kemungkinan bersifat linear, jadi dapat langsung diinterpretasi. Rasio kemungkinan yang lebih besar dari satu menunjukkan arah yang positif, sedangkan rasio kemunkginan yang lebih kecil dari satu menunjukkan arah yang negatif. Dalam model ini, terlihat bahwa yang paling berpengaruh adalah variabel laki dan nilai rasio kemungkinannya lebih besar dari 1; responden berjenis kelamin laki-laki akan lebih mungkin untuk berstatus kerja dibandingkan responden berjenis kelamin


perempuan. Sedangkan variabel miskin mempunyai nilai rasio kemungkinan yang lebih kecil dari 1; responden yang miskin akan lebih mungkin untuk berstatus tidak bekerja dibandingkan responden yang tidak miskin. Nilai rasio kemungkinan miskin sedikit lebih rendah dari pensiun, yang berarti pengaruh miskin lebih besar daripada pensiun. Sedangkan variabel age dan age2 tidak bisa langsung diartikan karena berbentuk parabolik, dan perlu perlakuan lebih lanjut.

Cara interpretasi yang kedua, yaitu melihat efek marjinal, seringkali lebih sering digunakan. Sifat perubahan efeknya yang terjadi seiring perubahan nilai variabel independen merupakan sifat yang dimiliki model OLS yang mana lebih sering digunakan dalam penelitian pada umumnya. Beberapa modifikasi model, seperti bentuk parabolik yang dipakai dalam model di atas, malah membutuhkan efek marjinal untuk perlakuan tambahan pada hasil awalnya sebelum dapat diinterpretasi. Cara untuk mendapat efek marjinal dari model Logit adalah sebagai berikut:

. mfx Marginal effects after logistic y = Pr(kerja) (predict) = .28833844 ------------------------------------------------------------------------------ variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X ---------+-------------------------------------------------------------------- miskin*| -.0812906 .00714 -11.39 0.000 -.09528 -.067301 .152119 laki*| .2116238 .00505 41.90 0.000 .201724 .221523 .490646 lntotexp | -.0598462 .00365 -16.40 0.000 -.067001 -.052692 14.1865 age | .0646444 .00053 120.92 0.000 .063597 .065692 28.7017 age2 | -.0007243 .00001 -105.20 0.000 -.000738 -.000711 1226.97 socas*| .0226241 .00531 4.26 0.000 .012213 .033035 .510338 pensiun*| -.0778758 .01449 -5.37 0.000 -.106275 -.049476 .017402 ------------------------------------------------------------------------------ (*) dy/dx is for discrete change of dummy variable from 0 to 1

Hasil di atas menunjukkan efek marjinal dari hasil regresi Logit yang dilakukan sebelumnya. Dapat dilihat bahwa hasil interpretasi dari rasio kemungkinan semakin ditegaskan dengan hasil efek marjinal. Terdapat beberapa variabel yang belum diinterpretasi sebelumnya dan akan diinterpretasi menggunakan hasil ini: variabel socas bernilai positif sebesar .0226241, yang berarti responden yang mendapat bantuan sosial akan lebih mungkin sebesar 2.26% untuk berstatus bekerja dibandingkan responden yang tidak mendapat bantuan sosial. Sedangkan variabel lntotexp bernilai negatif sebesar -0.0598462, yang berarti tiap 1% kenaikan pada konsumsi seorang responden membuat turunnya kemungkinan responden tersebut untuk bekerja sebesar 0.0598%.

Dengan diketahuinya hasil efek marjinal, kita dapat melakukan perlakuan tambahan untuk variabel age dan age2. Ambillah persamaan parsial yang khusus melambangkan variabel dependen, kerja, dan variabel independen, age, sebagai berikut:

( = 1) = .0646444 .0007243 2 Nilai .0646444 dan .0007243 diambil dari hasil efek marjinal untuk (berurutan) variabel age dan age2. Persamaan ini akan digunakan untuk memprediksi titik yang membentuk grafik parabolik pengaruh umur terhadap probabilitas outcome status bekerja. Caranya adalah sebagai berikut:

. gen efek_age= .0646444*age-(.0007243*age2) (3848 missing values generated)

Perintah mfx. dipergunakan untuk melihat probabilita total dari model LDV, juga mampu dipergunakan untuk nilai dx/dy nya.


. label variable efek_age "prediksi untuk pengaruh parsial variabel age" . scatter efek_age age

Untuk memperjelas hasil estimasi model ini, maka kita dapat melakukan prediksi menggunakan model ini dan menyimpan hasilnya dalam variabel baru, yang untuk mempermudah pembacaan akan kita namakan dengan logitkerja. Caranya adalah sebagai berikut:

. predict logitkerja (option pr assumed; Pr(kerja)) (3860 missing values generated) . gen lnlogitkerja=ln(logitkerja/(1-logitkerja)) (3860 missing values generated) . la var logitkerja "Pr(kerja) logit"

-3-2

-10

12

pred

iksi

unt

uk p

enga

ruh

pars

ial v

aria

bel a

ge

0 50 100 150age now


Dan untuk melihat hasil prediksinya, masukkan komando sebagai berikut:

. scatter kerja logitkerja lnlogitkerja

Bentuknya yang seperti huruf S merupakan sifat dari fungsi logit yang berbentuk CDF (Cumulative Distribution Function/Fungsi Distribusi Kumulatif).

Aplikasi Model 2: Probit Setelah selesai berkutat dengan model Logit, saatnya berganti metode ke model Probit. Syntax untuk model Probit adalah sebagai berikut:

probit var.dependen [var.independen] [if] [in] [weight] [, options]

tidak ada perbedaan besar antara syntax Logit dan Probit, hanya komando awalnya saja yang berbeda.

Sebagai perbandingan, mari kita menggunakan data sebelumnya dengan spesifikasi yang persis sama:

. probit kerja miskin laki lntotexp age age2 socas pensiun Iteration 0: log likelihood = -31694.826 Iteration 1: log likelihood = -21017.256 Iteration 2: log likelihood = -20526.255 Iteration 3: log likelihood = -20519.857 Iteration 4: log likelihood = -20519.853 Iteration 5: log likelihood = -20519.853 Probit regression Number of obs = 46720 LR chi2(7) = 22349.95 Prob > chi2 = 0.0000 Log likelihood = -20519.853 Pseudo R2 = 0.3526 ------------------------------------------------------------------------------ kerja | Coef. Std. Err. z P>|z| [95% Conf. Interval]

0.2

.4.6

.81

-20 -15 -10 -5 0 5lnlogitkerja

status kerja responden saat interview Pr(kerja) logit


-------------+---------------------------------------------------------------- miskin | -.2493794 .0234154 -10.65 0.000 -.2952728 -.203486 laki | .5981915 .0144496 41.40 0.000 .5698708 .6265123 lntotexp | -.168781 .0103833 -16.26 0.000 -.1891319 -.1484301 age | .1824727 .0017797 102.53 0.000 .1789846 .1859608 age2 | -.0020256 .0000217 -93.40 0.000 -.0020681 -.0019831 socas | .0654174 .0151829 4.31 0.000 .0356595 .0951754 pensiun | -.2659084 .0511079 -5.20 0.000 -.3660781 -.1657386 _cons | -1.162999 .1521409 -7.64 0.000 -1.46119 -.8648086 ------------------------------------------------------------------------------ Note: 5 failures and 0 successes completely determined.

Seperti sebelumnya, perlu dilakukan uji kelayakan model terlebih dahulu sebelum model dapat diinterpretasi. Khusus untuk Probit, karena terdapat asumsi yang restriktif berupa normalitas model, maka terdapat satu komando, skprobit, yang dapat digunakan untuk menguji berlakunya asumsi ini. Komando ini menggunakan metode Lagrange Multiplier Test untuk Normalitas residual hasil prediksi variabel dependen menggunakan spesifikasi model yang sudah diregresi sebelumnya. Caranya adalah sebagai berikut:

. skprobit kerja miskin laki lntotexp age age2 socas pensiun Lagrange Multiplier Test for Normality after Probit Chi2(2) = 141.3823 Prob > chi2 = 0.0000 Ho: Normality Ha: No Normality

Seperti yang tertulis, hipotesis nolnya adalah normalitas residual. Hasil di atas menunjukkan ditolaknya H0, yang berarti data yang kita gunakan tidak normal dan seharusnya tidak menggunakan probit.

Selain komando skprobit, terdapat juga komando lain yang dapat digunakan untuk melakukan uji kelayakan model. Komando-komando tersebut adalah komando yang sama seperti yang dilakukan pada uji kelayakan Logit, yaitu estat gof; estat class; dan fitstat. Hasil ketiga tes tersebut untuk model ini adalah sebagai berikut:

. estat gof Probit model for kerja, goodness-of-fit test number of observations = 46720 number of covariate patterns = 46502 Pearson chi2(46494) = 282893.08 Prob > chi2 = 0.0000 . estat class Probit model for kerja -------- True -------- Classified | D ~D | Total -----------+--------------------------+----------- + | 15110 6304 | 21414 - | 4248 21058 | 25306 -----------+--------------------------+----------- Total | 19358 27362 | 46720


Classified + if predicted Pr(D) >= .5 True D defined as kerja != 0 -------------------------------------------------- Sensitivity Pr( +| D) 78.06% Specificity Pr( -|~D) 76.96% Positive predictive value Pr( D| +) 70.56% Negative predictive value Pr(~D| -) 83.21% -------------------------------------------------- False + rate for true ~D Pr( +|~D) 23.04% False - rate for true D Pr( -| D) 21.94% False + rate for classified + Pr(~D| +) 29.44% False - rate for classified - Pr( D| -) 16.79% -------------------------------------------------- Correctly classified 77.41% -------------------------------------------------- . fitstat Measures of Fit for probit of kerja Log-Lik Intercept Only: -31694.826 Log-Lik Full Model: -20519.853 D(46712): 41039.706 LR(7): 22349.946 Prob > LR: 0.000 McFadden's R2: 0.353 McFadden's Adj R2: 0.352 Maximum Likelihood R2: 1.000 Cragg & Uhler's R2: 1.000 McKelvey and Zavoina's R2: 0.630 Efron's R2: 0.393 Variance of y*: 2.700 Variance of error: 1.000 Count R2: 0.774 Adj Count R2: 0.455 AIC: 0.879 AIC*n: 41055.706 BIC: -461204.337 BIC': -22274.683

dari hasil estat gof terlihat bahwa pemakaian model ini ditolak. Sebaiknya data diberikan perlakuan khusus terlebih dahulu, atau spesifikasi modelnya diperbaiki terlebih dahulu, sampai dapat dinyatakan diterima dan dapat diinterpretasikan.

Namun demi kepentingan penjelasan modul, diasumsikan terlebih dahulu bahwa model ini diterima. Model Probit tidak mempunyai rasio kemungkinan, sehingga interpretasinya langsung merujuk pada efek marjinalnya. Cara cepat untuk mengeluarkan efek marjinal pada model Probit adalah dengan mengganti komando probit pada regresi awal menjadi dprobit. Contohnya adalah sebagai berikut:

. dprobit kerja miskin laki lntotexp age age2 socas pensiun Iteration 0: log likelihood = -31694.826 Iteration 1: log likelihood = -21842.615 Iteration 2: log likelihood = -20639.053 Iteration 3: log likelihood = -20521.702 Iteration 4: log likelihood = -20519.853 Iteration 5: log likelihood = -20519.853 Probit regression, reporting marginal effects Number of obs = 46720 LR chi2(7) =22349.95 Prob > chi2 = 0.0000 Log likelihood = -20519.853 Pseudo R2 = 0.3526 ------------------------------------------------------------------------------ kerja | dF/dx Std. Err. z P>|z| x-bar [ 95% C.I. ] ---------+-------------------------------------------------------------------- miskin*| -.0825705 .0073226 -10.65 0.000 .152119 -.096922 -.068219 laki*| .2066827 .0049234 41.40 0.000 .490646 .197033 .216332 lntotexp | -.0587849 .0036105 -16.26 0.000 14.1865 -.065861 -.051708 age | .0635535 .0005123 102.53 0.000 28.7017 .062549 .064558 age2 | -.0007055 6.50e-06 -93.40 0.000 1226.97 -.000718 -.000693 socas*| .0227733 .0052817 4.31 0.000 .510338 .012421 .033125 pensiun*| -.0857661 .0150769 -5.20 0.000 .017402 -.115316 -.056216


---------+-------------------------------------------------------------------- obs. P | .4143408 pred. P | .3011442 (at x-bar) ------------------------------------------------------------------------------ (*) dF/dx is for discrete change of dummy variable from 0 to 1 z and P>|z| correspond to the test of the underlying coefficient being 0

Di kolom yanng biasanya merupakan tempat untuk koefisien, yang sekarang ditunjukkan adalah efek marjinal dari masing-masing variabel independen untuk menentukan probabilita outcome variabel dependen. Cara membacanya pun sama seperti cara membaca hasil efek marjinal dari Logit.

Untuk membandingkan hasil antara Logit dengan Probit, kembali kita lakukan prediksi nilai menggunakan spesifikasi model yang sudah ada.

. predict probitkerja (option pr assumed; Pr(kerja)) (3860 missing values generated) . la var probitkerja "Pr(kerja) probit" . gen lnprobitkerja=ln(probitkerja/(1-probitkerja)) (3860 missing values generated) . scatter kerja probitkerja lnprobitkerja

0.2

.4.6

.81

-60 -40 -20 0lnprobitkerja

status kerja responden saat interview Pr(kerja) probit


Ordinal Logit and Probit Regression Models Misalkan kita memiliki variabel dependen ordinal seperti intensitas keagamaan (0 = tidak ada agama, 1 = agak kuat, 2 = tidak sangat kuat, dan 3 = kuat). Logit ordinal dan model probit memiliki asumsi regresi paralel atau asumsi odds-ratio, yang dalam prakteknya sering dilanggar.

Ordinal Logit Model di Stata (ologit.)

Stata memiliki perintah dasar ologit.dan oprobit., yang merupakan perintah untuk memperkirakan hasil logit ordinal serta model regresi probit. Output yang dihasilkan mereka tampak seperti hasil logit biasa: (mempergunakan data dari net install) . use "http://dl.dropboxusercontent.com/u/45099676/gss_cdvm.dta", clear . ologit belief educate income age male www

Iteration 0: log likelihood = -1499.6929 Iteration 1: log likelihood = -1480.3168 Iteration 2: log likelihood = -1480.2738 Iteration 3: log likelihood = -1480.2738 Ordered logistic regression Number of obs = 1174 LR chi2(5) = 38.84 Prob > chi2 = 0.0000 Log likelihood = -1480.2738 Pseudo R2 = 0.0129

------------------------------------------------------------------------------ belief | Coef. Std. Err. z P>|z| [95% Conf. Interval]

-------------+---------------------------------------------------------------- educate | -.0020145 .0220039 -0.09 0.927 -.0451414 .0411124 income | -.0059213 .0089976 -0.66 0.510 -.0235563 .0117137 age | .0186456 .0042123 4.43 0.000 .0103897 .0269015

male | -.4661952 .1085422 -4.30 0.000 -.6789339 -.2534564 www | .1264832 .1357087 0.93 0.351 -.1395009 .3924673

-------------+---------------------------------------------------------------- /cut1 | -1.183894 .3674989 -1.904178 -.463609 /cut2 | -.4989643 .3648623 -1.214081 .2161526 /cut3 | 1.186547 .366256 .4686988 1.904396 ------------------------------------------------------------------------------

Model ini cukup baik melakukan estimasi peluang, meskipun hanya usia (age) dan jenis kelamin (sex) yang signifikan secara statistik.

. fitstat

Measures of Fit for ologit of belief

Log-Lik Intercept Only: -1499.693 Log-Lik Full Model: -1480.274 D(1166): 2960.548 LR(5): 38.838 Prob > LR: 0.000 McFadden's R2: 0.013 McFadden's Adj R2: 0.008 ML (Cox-Snell) R2: 0.033 Cragg-Uhler(Nagelkerke) R2: 0.035 McKelvey & Zavoina's R2: 0.033 Variance of y*: 3.403 Variance of error: 3.290


Count R2: 0.407 Adj Count R2: 0.031 AIC: 2.535 AIC*n: 2976.548 BIC: -5280.941 BIC': -3.497 BIC used by Stata: 3017.093 AIC used by Stata: 2976.548

. mfx, at(mean educate=16 male=0 www=1)

Marginal effects after ologit

y = Pr(belief==0) (predict) = .12983744

------------------------------------------------------------------------------ variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X ---------+-------------------------------------------------------------------- educate | .0002276 .00249 0.09 0.927 -.004655 .005111 16 income | .000669 .00102 0.66 0.510 -.001322 .002659 24.6486 age | -.0021066 .00049 -4.27 0.000 -.003075 -.001139 41.3075 male*| .0622968 .01503 4.15 0.000 .032845 .091748 0 www*| -.014971 .0166 -0.90 0.367 -.047509 .017567 1 ------------------------------------------------------------------------------ (*) dy/dx is for discrete change of dummy variable from 0 to 1

Marginal effect dan perubahan diskrit lebih mampu menjelaskan apabila dibandingakan dengan perubahan dari faktor odd-ratio. Untuk 10 unit peningkatan usia yang meiliki rata-rata 41, probabilita tidak beragama diperkirakan menurun sebesar 2,1 persen (.21 * 10), yang bisa diartikan dari keseluruhan variabel lain bernilai konstan pada titik acuan (cateris paribus asumsinya). Pria memiliki kecenderungan sebesar 6,23 persen lebih mungkin dibandingkan perempuan untuk tidak memiliki agama pada beberapa poinst referensi yang sama.

Selanjutnya, perintah mfx2. bisa dipergunakan. Perintah ini berguna untuk model respon ordinal dan multinomial (multinomial logit, serta ordered probit). Perintah ini menghasilkan efek marginal (perubahan diskrit) dan nilai standard error untuk semua kasus dalam model, sedangkan mfx. hanya melaporkan efek marginal untuk hasil pertama (0 dalam kasus ini) saja. Tapi baik mfx. maupun mfx2. memiliki format output yang sama.

. mfx2, at(mean educate=16 male=0 www=1)

Frequencies for belief...

Religious | Intensity | Freq. Percent Cum.

----------------+----------------------------------- No religion | 192 16.35 16.35

Somewhat strong | 134 11.41 27.77 Not very strong | 456 38.84 66.61

Strong | 392 33.39 100.00 ----------------+-----------------------------------

Total | 1,174 100.00

Computing marginal effects after ologit for belief == 0...

Marginal effects after ologit y = Pr(belief==0) (predict, o(0))

= .12983744 ------------------------------------------------------------------------------ variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X ---------+-------------------------------------------------------------------- educate | .0002276 .00249 0.09 0.927 -.004655 .005111 16 income | .000669 .00102 0.66 0.510 -.001322 .002659 24.6486 age | -.0021066 .00049 -4.27 0.000 -.003075 -.001139 41.3075


male*| .0622968 .01503 4.15 0.000 .032845 .091748 0 www*| -.014971 .0166 -0.90 0.367 -.047509 .017567 1 ------------------------------------------------------------------------------ (*) dy/dx is for discrete change of dummy variable from 0 to 1



= .09854499 ------------------------------------------------------------------------------ variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X ---------+-------------------------------------------------------------------- educate | .0001274 .00139 0.09 0.927 -.002602 .002857 16 income | .0003745 .00057 0.66 0.511 -.000742 .001491 24.6486 age | -.0011792 .00028 -4.17 0.000 -.001733 -.000625 41.3075 male*| .0298649 .0073 4.09 0.000 .015564 .044166 0 www*| -.0080795 .00874 -0.92 0.355 -.025211 .009052 1 ------------------------------------------------------------------------------ (*) dy/dx is for discrete change of dummy variable from 0 to 1



= .3865383 ------------------------------------------------------------------------------ variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X ---------+-------------------------------------------------------------------- educate | .000122 .00132 0.09 0.927 -.002472 .002716 16 income | .0003586 .00055 0.65 0.517 -.000727 .001444 24.6486 age | -.0011294 .00036 -3.15 0.002 -.001833 -.000426 41.3075 male*| .0108521 .0057 1.90 0.057 -.000329 .022033 0 www*| -.006432 .00619 -1.04 0.299 -.018568 .005704 1 ------------------------------------------------------------------------------ (*) dy/dx is for discrete change of dummy variable from 0 to 1



= .38507927 ------------------------------------------------------------------------------ variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X ---------+-------------------------------------------------------------------- educate | -.000477 .00521 -0.09 0.927 -.010682 .009728 16 income | -.0014021 .00213 -0.66 0.511 -.00558 .002776 24.6486 age | .0044152 .001 4.41 0.000 .002455 .006375 41.3075 male*| -.1030138 .02374 -4.34 0.000 -.149547 -.056481 0 www*| .0294825 .03126 0.94 0.346 -.031777 .090743 1 ------------------------------------------------------------------------------ (*) dy/dx is for discrete change of dummy variable from 0 to 1

Ordinal Probit Model in Stata (.oprobit)

Let us fit the ordinal probit model using the same specification. Logit and probit models produce similar parameter estimates and goodness-of-fit measures. For example, their likelihood ratios are 38.84 versus 40.13 and pseudo R2 are .0129 versus .0134, respectively.

. oprobit belief educate income age male www

Iteration 0: log likelihood = -1499.6929 Iteration 1: log likelihood = -1479.63 Iteration 2: log likelihood = -1479.6279 Iteration 3: log likelihood = -1479.6279

Ordered probit regression Number of obs = 1174 LR chi2(5) = 40.13 Prob > chi2 = 0.0000 Log likelihood = -1479.6279 Pseudo R2 = 0.0134



-------------+---------------------------------------------------------------- educate | -.0015194 .0130701 -0.12 0.907 -.0271362 .0240974 income | -.0027382 .0053709 -0.51 0.610 -.0132649 .0077886 age | .0109693 .0024755 4.43 0.000 .0061175 .0158211

male | -.290305 .0646295 -4.49 0.000 -.4169764 -.1636335 www | .0642404 .0809186 0.79 0.427 -.0943572 .2228379

-------------+---------------------------------------------------------------- /cut1 | -.7138045 .2182722 -1.14161 -.2859989 /cut2 | -.3178217 .2172398 -.7436038 .1079604 /cut3 | .7199238 .217734 .293173 1.146675 ------------------------------------------------------------------------------ . fitstat

Measures of Fit for oprobit of belief

Log-Lik Intercept Only: -1499.693 Log-Lik Full Model: -1479.628 D(1166): 2959.256 LR(5): 40.130 Prob > LR: 0.000 McFadden's R2: 0.013 McFadden's Adj R2: 0.008 ML (Cox-Snell) R2: 0.034 Cragg-Uhler(Nagelkerke) R2: 0.036 McKelvey & Zavoina's R2: 0.040 Variance of y*: 1.041 Variance of error: 1.000 Count R2: 0.414 Adj Count R2: 0.042 AIC: 2.534 AIC*n: 2975.256 BIC: -5282.233 BIC': -4.789 BIC used by Stata: 3015.801 AIC used by Stata: 2975.256

Dari hitungan probabilita, yang diprediksi oleh efek marginal (perubahan diskrit) pada titik-titik referensi yang sama. Maka, didapatkan hasil 12,73 persen pengguna variabel WWW dengan jenis kelamin perempuan rata - rata tidak memiliki agama. (dilihat dari nilai mfx. y)

. mfx, at(mean educate=16 male=0 www=1)

Marginal effects after oprobit

y = Pr(belief==0) (predict) = .12727708

------------------------------------------------------------------------------ variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X ---------+-------------------------------------------------------------------- educate | .0003167 .00273 0.12 0.908 -.005037 .00567 16 income | .0005708 .00112 0.51 0.610 -.001622 .002764 24.6486 age | -.0022867 .00053 -4.28 0.000 -.003335 -.001238 41.3075 male*| .070649 .01616 4.37 0.000 .038981 .102317 0 www*| -.0138841 .01793 -0.77 0.439 -.04903 .021262 1 ------------------------------------------------------------------------------ (*) dy/dx is for discrete change of dummy variable from 0 to 1sd_x= 2.56971 6.19427 13.4071 .497765 .410755

Sedangkan dari hasil mfx2. , didapatkan rinciannya sebagai berikut: . mfx2, at(mean educate=16 male=0 www=1)

Frequencies for belief...

Religious | Intensity | Freq. Percent Cum.

----------------+----------------------------------- No religion | 192 16.35 16.35

Somewhat strong | 134 11.41 27.77 Not very strong | 456 38.84 66.61

Strong | 392 33.39 100.00 ----------------+-----------------------------------

Total | 1,174 100.00

Computing marginal effects after oprobit for belief == 0...



y = Pr(belief==0) (predict, o(0)) = .12727708

------------------------------------------------------------------------------ variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X ---------+-------------------------------------------------------------------- educate | .0003167 .00273 0.12 0.908 -.005037 .00567 16 income | .0005708 .00112 0.51 0.610 -.001622 .002764 24.6486 age | -.0022867 .00053 -4.28 0.000 -.003335 -.001238 41.3075 male*| .070649 .01616 4.37 0.000 .038981 .102317 0 www*| -.0138841 .01793 -0.77 0.439 -.04903 .021262 1 ------------------------------------------------------------------------------ (*) dy/dx is for discrete change of dummy variable from 0 to 1


Marginal effects after oprobit y = Pr(belief==1) (predict, o(1))

= .10135041 ------------------------------------------------------------------------------ variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X ---------+-------------------------------------------------------------------- educate | .0001431 .00123 0.12 0.907 -.002269 .002555 16 income | .0002579 .00051 0.51 0.611 -.000734 .00125 24.6486 age | -.001033 .00025 -4.16 0.000 -.00152 -.000546 41.3075 male*| .0259728 .00613 4.24 0.000 .013958 .037987 0 www*| -.0060148 .00755 -0.80 0.426 -.020822 .008792 1 ------------------------------------------------------------------------------ (*) dy/dx is for discrete change of dummy variable from 0 to 1


Marginal effects after oprobit y = Pr(belief==2) (predict, o(2))

= .38713527 ------------------------------------------------------------------------------ variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X ---------+-------------------------------------------------------------------- educate | .0001206 .00103 0.12 0.907 -.001895 .002136 16 income | .0002174 .00043 0.50 0.614 -.000627 .001062 24.6486 age | -.0008709 .00028 -3.15 0.002 -.001412 -.000329 41.3075 male*| .0082326 .00456 1.81 0.071 -.000701 .017166 0 www*| -.0043953 .00504 -0.87 0.383 -.01428 .005489 1 ------------------------------------------------------------------------------ (*) dy/dx is for discrete change of dummy variable from 0 to 1



y = Pr(belief==3) (predict, o(3)) = .38423723

------------------------------------------------------------------------------ variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X ---------+-------------------------------------------------------------------- educate | -.0005804 .00499 -0.12 0.907 -.01036 .0092 16 income | -.001046 .00205 -0.51 0.610 -.005069 .002977 24.6486 age | .0041906 .00095 4.43 0.000 .002335 .006046 41.3075 male*| -.1048544 .02315 -4.53 0.000 -.150222 -.059487 0 www*| .0242943 .03037 0.80 0.424 -.035234 .083822 1 ------------------------------------------------------------------------------ (*) dy/dx is for discrete change of dummy variable from 0 to 1


Multinomial Logit Regression Model

Dengan melakukan pemerikasaan model intensitas keagamaan dalam model logit multinomial tanpa mengubah spesifikasi, maka kita coba untuk mengingat kembali hasil tes Brant yang menolak hipotesis nol akibat dari kemungkinan adanya asumsi proporsional sehingga model logit ordinal tidak secara teoritis berlaku. Stata memiliki mprobit.perintah agar sesuai dengan model probit multinomial, akan tetapi model ini jarang dipergunakan daripada logit terutama karena kesulitan secara praktikal dalam estimasinya.

Multinomial Logit di Stata (.mlogit)

Di Stata, mlogit. adalah perintah dasar untuk estimasi model multinomial logit. Perintah ini secara menggunakan basis dasar satu sebagai hasil dasar saat memperkirakan model.

. mlogit belief educate income age male www, base(3)


Multinomial logistic regression Number of obs = 1174 LR chi2(15) = 60.49 Prob > chi2 = 0.0000 Log likelihood = -1469.4492 Pseudo R2 = 0.0202


-------------+---------------------------------------------------------------- No_religion |

educate | .0041038 .0364791 0.11 0.910 -.067394 .0756016 income | .0005614 .0149146 0.04 0.970 -.0286708 .0297935 age | -.0288972 .0070994 -4.07 0.000 -.0428118 -.0149827 male | .8967689 .1827037 4.91 0.000 .5386761 1.254862 www | -.0347578 .2318055 -0.15 0.881 -.4890883 .4195727

_cons | .0141817 .6060507 0.02 0.981 -1.173656 1.202019 -------------+---------------------------------------------------------------- Somewhat_s~g |

educate | .0060908 .041313 0.15 0.883 -.0748812 .0870628 income | .0231701 .0184093 1.26 0.208 -.0129116 .0592517 age | -.0161198 .0077715 -2.07 0.038 -.0313517 -.0008878 male | .1738551 .2064474 0.84 0.400 -.2307744 .5784847 www | -.4482836 .2417881 -1.85 0.064 -.9221795 .0256124

_cons | -.7764871 .7036746 -1.10 0.270 -2.155664 .6026898 -------------+---------------------------------------------------------------- Not_very_s~g |

educate | -.0269446 .0284494 -0.95 0.344 -.0827043 .0288151 income | .0048478 .01171 0.41 0.679 -.0181035 .0277991

age | -.0237972 .0053893 -4.42 0.000 -.0343599 -.0132344

male | .4602734 .1429313 3.22 0.001 .1801332 .7404135 www | -.0252644 .1785439 -0.14 0.887 -.3752041 .3246753

_cons | 1.237746 .4728153 2.62 0.009 .3110455 2.164447 -------------+---------------------------------------------------------------- Strong | (base outcome) ------------------------------------------------------------------------------


Sesuai dengan model yang menggunakan nilai terkecil dari variabel hasil, maka kedua hasil menghasilkan nilai Goodness of fit yang sama, tetapi nilai estimasi parameter mereka berbeda satu sama lain. Keduanya akan memperkirakan modelnya dengan nilai yang sama, tapi menggunakan pendekatan / cara yang berbeda. . mlogit belief educate income age male www, base(0)


Multinomial logistic regression Number of obs = 1174 LR chi2(15) = 60.49 Prob > chi2 = 0.0000 Log likelihood = -1469.4492 Pseudo R2 = 0.0202


-------------+---------------------------------------------------------------- No_religion | (base outcome) -------------+---------------------------------------------------------------- Somewhat_s~g |

educate | .001987 .0465735 0.04 0.966 -.0892955 .0932695 income | .0226087 .0202724 1.12 0.265 -.0171245 .0623419 age | .0127774 .0090102 1.42 0.156 -.0048822 .030437 male | -.7229137 .2307764 -3.13 0.002 -1.175227 -.2706002 www | -.4135258 .2781579 -1.49 0.137 -.9587052 .1316536

_cons | -.7906688 .7863491 -1.01 0.315 -2.331885 .7505472 -------------+---------------------------------------------------------------- Not_very_s~g |

educate | -.0310484 .0352445 -0.88 0.378 -.1001264 .0380297 income | .0042864 .0142516 0.30 0.764 -.0236462 .0322191 age | .0051 .0069699 0.73 0.464 -.0085608 .0187608 male | -.4364955 .17508 -2.49 0.013 -.7796459 -.0933451 www | .0094934 .2233075 0.04 0.966 -.4281812 .447168

_cons | 1.223565 .5817148 2.10 0.035 .0834247 2.363705 -------------+---------------------------------------------------------------- Strong |

educate | -.0041038 .0364791 -0.11 0.910 -.0756016 .067394 income | -.0005614 .0149146 -0.04 0.970 -.0297935 .0286708 age | .0288972 .0070994 4.07 0.000 .0149827 .0428118 male | -.8967689 .1827037 -4.91 0.000 -1.254862 -.5386761 www | .0347578 .2318055 0.15 0.881 -.4195727 .4890883

_cons | -.0141817 .6060507 -0.02 0.981 -1.202019 1.173656 ------------------------------------------------------------------------------

. fitstat

Measures of Fit for mlogit of belief

Log-Lik Intercept Only: -1499.693 Log-Lik Full Model: -1469.449 D(1150): 2938.898 LR(15): 60.487 Prob > LR: 0.000 McFadden's R2: 0.020 McFadden's Adj R2: 0.004 ML (Cox-Snell) R2: 0.050 Cragg-Uhler(Nagelkerke) R2: 0.054

Count R2: 0.428 Adj Count R2: 0.064 AIC: 2.544 AIC*n: 2986.898 BIC: -5189.499 BIC': 45.535 BIC used by Stata: 3066.126 AIC used by Stata: 2974.898


Model multinomial logit mengembalikan rasio statistik probabilita (2 = 60,49), tapi tidak untuk parameter individunya. Model ini kurag baik dipergunakan untuk data yang normal (secara distribusi data). Secara umum proses dari multinomial maupun ordered logit / probit memiliki tahapan yang hampir sama dengan logit - probit biasa. []

Secara metode, Multinomial Logit, maupun Ordered probit menggunakan logika dasar Logit dan Probit biasa.


F.A.Q seputar Logit-Probit

Kapan harus tahu memakai Logit atau Probit? Seperti yang ditunjukkan pada hasil di atas, Logit sebaiknya dipakai apabila data yang digunakan bersifat tidak normal. Namun jika data yang digunakan bersifat normal, maka akan lebih baik apabila memakai Probit. Seringkali data bersifat normal jadi banyak orang yang memakai Logit dan Probit tanpa pertimbangan lebih lanjut, namun beberapa data banyak yang abnormal (seperti logistik) dan harus memakai Logit untuk regresinya. Heckman, yang menggunakan model biner untuk tahap pertama regresinya, juga secara khusus mensyaratkan pemakaian Probit untuk pengolahan model binernya karena model seleksi sensitif terhadap normalitas.

Adakah model lain untuk data yang bersifat binomial? Ada, namun jarang sekali dipakai. Ada model LPM (Linear Probability Model) yang merupakan ekstensi dari OLS, namun mempunyai kekurangan berupa tidak dibatasinya kemungkinan prediksi antara 0 dan 1.

Penjelasan lebih lanjut tentang LPM terdapat di Suwardi (2011).

Data saya bukan binomial, namun kategorikal. Pakainya Logit atau Probit jugakah? Yang dipakai adalah ekstensi dari logit dan probit. Ekstensinya ada banyak dan ini semua tergantung dengan keadaan dari data dan tujuan penelitian. Terdapat model mlogit untuk variabel dependen yang tingkatnya setara, oprobit untuk variabel dependen yang mempunyai ranking, dan lain sebagainya. Penjelasan lebih lanjut untuk ekstensi Logit dan Probit dapat dilihat di Hamilton (2009), bab 10.


Daftar Pustaka Hamilton, Lewis. 2009. Statistics with Stata: Updated for Version 10. Belmont: Brooks-Cole Cengage Learning.

Cameron, A.C. & P.K.Trivedi. 2009. Microeconomics using Stata. College Station: STATA Press.

Suwardi, Akbar. 2011. Modul Final LPM, Logit, Probit (Edisi 2011). Handout Latihan Lab. Komputasi Dept. IE.

Nasiir, Mercoledi. 2012. Modul Pelatihan Logit Probit (Edisi 2012). Handout Latihan Lab. Komputasi Dept. IE

Park, Hun. 2009. Regression Models for Ordinal and Nominal Dependent Variables Using SAS, Stata, LIMDEP, and SPSS*. Indiana University: University Information Technology Services.

Katchova, Ani. 2013. Multinomial Probit and Logit Models. Stata Handbook.

Logit TeoriProbit, dan logit model untuk functional forms - propertiesProbit TeoriAplikasi Model Menggunakan Software STATAMengenal DataSpesifikasi ModelAplikasi Model 1: LogitAplikasi Model 2: Probit

F.A.Q seputar Logit-ProbitKapan harus tahu memakai Logit atau Probit?Adakah model lain untuk data yang bersifat binomial?Data saya bukan binomial, namun kategorikal. Pakainya Logit atau Probit jugakah?

Daftar Pustaka

CDVM Training WisnuLedie(April2013)

Documents