A. Definisi Analisis Regresi Logistik Analisis Regresi dalam statistika adalah salah satu metode untuk menentukan hubungan sebab-akibat antara satu variable dengan variabel-variabel yang lain. Variabel “penyebab” disebut dengan bermacam-macam istilah, di antaranya seperti variable penjelas, variable eksplanatorik, variable independen, atau secara bebas, variabel X (karena seringkali digambarkan dalam grafik sebagai absis, atau sumbu X). Variabel “terkena akibat” dikenal sebagai variabel yang dipengaruhi, variabel dependen, variable terikat, atau variabel Y. Kedua variable ini dapat merupakan variable acak (random), namun variabel yang dipengaruhi harus selalu variable acak. Analisis regresi adalah salah satu analisis yang paling popular dan luas pemakaiannya. Hampir semua bidang ilmu yang memerlukan analisis sebab-akibat boleh dipastikan mengenal analisis ini. Analisis regresi logistik adalah suatu model matematik yang digunakan untuk mempelajari hubungan satu atau beberapa variabel independen dengan satu variabel dependen yang bersifat dikotomi (binary). Variabel binary adalah variabel yang hanya memiliki dua nilai, misalnya sakit/sehat, merokok/tidak merokok, BBLR/normal, dll. Adapun regresi logistik (kadang disebut model logistic atau model logit) merupakan salah satu bagian dari analisis regresi, yang digunakan untuk memprediksi probabilitas kejadian suatu peristiwa, dengan mencocokkan data pada fungsi logit kurva logistik. Metode ini merupakan model linear umum yang digunakan untuk regresi binomial. Seperti analisis
33
Embed
indahbios.files.wordpress.com · Web viewDefinisi Analisis Regresi Logistik. ... misalnya sakit/sehat, merokok/tidak merokok, BBLR/normal, dll. ... Kemudian risiko meningkat pada
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
A. Definisi Analisis Regresi Logistik
Analisis Regresi dalam statistika adalah salah satu metode untuk menentukan hubungan
sebab-akibat antara satu variable dengan variabel-variabel yang lain. Variabel “penyebab”
disebut dengan bermacam-macam istilah, di antaranya seperti variable penjelas, variable
eksplanatorik, variable independen, atau secara bebas, variabel X (karena seringkali
digambarkan dalam grafik sebagai absis, atau sumbu X). Variabel “terkena akibat” dikenal
sebagai variabel yang dipengaruhi, variabel dependen, variable terikat, atau variabel Y.
Kedua variable ini dapat merupakan variable acak (random), namun variabel yang
dipengaruhi harus selalu variable acak. Analisis regresi adalah salah satu analisis yang paling
popular dan luas pemakaiannya. Hampir semua bidang ilmu yang memerlukan analisis sebab-
akibat boleh dipastikan mengenal analisis ini.
Analisis regresi logistik adalah suatu model matematik yang digunakan untuk
mempelajari hubungan satu atau beberapa variabel independen dengan satu variabel
dependen yang bersifat dikotomi (binary). Variabel binary adalah variabel yang hanya
memiliki dua nilai, misalnya sakit/sehat, merokok/tidak merokok, BBLR/normal, dll.
Adapun regresi logistik (kadang disebut model logistic atau model logit) merupakan
salah satu bagian dari analisis regresi, yang digunakan untuk memprediksi probabilitas
kejadian suatu peristiwa, dengan mencocokkan data pada fungsi logit kurva logistik. Metode
ini merupakan model linear umum yang digunakan untuk regresi binomial. Seperti analisis
regresi pada umumnya, metode ini menggunakan beberapa variable bebas, baik numeric
maupun kategori. Misalnya, probabilitas bahwa orang yang menderita serangan jantung pada
waktu tertentu dapat diprediksi dari informasi usia, jenis kelamin, dan indeks massa tubuh.
Regresi logistik juga digunakan secara luas pada bidang kedokteran, ilmu sosial, dan bahkan
pada bidang pemasaran, seperti prediksi kecenderungan pelanggan untuk membeli suatu
produk atau berhenti berlangganan.
Regresi logistik tidak memerlukan asumsi normalitas, heteroskedastisitas, dan
autokorelasi, dikarenakan variabel terikat yang terdapat pada regresi logistik merupakan
variabel dikotomi (0 dan 1), sehingga residualnya tidak memerlukan ketiga pengujian
tersebut. Untuk asumsi multikolinearitas, karena hanya melibatkan variabel-variabel bebas,
maka masih perlu untuk dilakukan pengujian. Untuk pengujian multikolinearitas ini dapat
digunakan uji kebaikan sesuai (goodness of fit test), yang kemudian dilanjutkan dengan
pengujian hipotesis (uji χ2), guna melihat variabel-variabel bebas mana saja yang signifikan,
sehingga dapat tetap digunakan dalam penelitian. Selanjutnya, di antara variabel-variabel
bebas yang signifikan, dapat dibentuk suatu matriks korelasi, dan apabila tidak terdapat
variabel-variabel bebas yang saling memiliki korelasi yang tinggi, maka dapat disimpulkan
bahwa tidak terdapat gangguan multikolinearitas pada model penelitian (David W. Hosmer,
2011).
Contoh 1. Gambaran Sebaran kemampuan Melakukan Treadmill dihubungkan dengan
Kejadian Serangan Jantung
B. Fungsi Logistik
Fungsi logistik merupakan fungsi matematik dengan rumus:
Pada variasi nilai z dari -4 sampai dengan + 4 dapat digambarkan:
Pada saat nilai z=-4 maka f(z)=0 dan pada saat nilai z=+4 maka f(z)=1. Jadi nilai f(z)
akan berkisar antara 0 dan 1. Sifat ini yang membuat fungsi logistik populer, model logistik
dapat digunakan untuk menggambarkan probabilitas yang selalu memliki nilai antara 0 dan 1.
Pada epidemiologi, probabilitas ini dikenal sebagai risiko untuk terjadinya penyakit.
Jadi, dengan menggunakan fungsi logistik, kita pasti akan memperoleh perkiraan risiko
antara 0 dan 1. Kita tidak mungkin memperoleh perkiraan risiko lebih kecil dari 0 atau lebih
besar dari 1.
Alasan lain mengapa fungsi logistik ini populer untuk analisis data epidemiologi adalah
bentuk kurva logistik. Seperti terlihat pada gambar 6.1, nilai f(z) meningkat secara perlahan
pada saat z berubah dari -4 ke arah 0, kemudian f(z) meningkat secara cepatdan kemudian
peningkatannya kembali perlahan pada saat f(z) mendekati 1. Hasilnya adalah kurva yang
berbentuk S.
Kurva yang berbentuk S ini dianggap cocok untuk menggambarkan peningkatan risiko
terjadinya keluaran pada penelitian epidemiologi, jika z dianggap sebagai indeks yang
menggabungkan efek dari berbagai faktor risiko dan f(z) merupakan risiko pada nilai z
tertentu. Bentuk kurva S menunjukkan efek z pada risiko individu minimal pada nilai z kecil
sampai satu batas ambang tercapai. Kemudian risiko meningkat pada jangkauan z tertentu
dan tetap tinggi saat risiko mendekati 1 dan nilai z sudah cukup besar.
Menurut ahli epidemiologi, konsep batas ambang ini dapat digunakan pada berbagai
kadaan penyakit. Jadi bentuk kurva logistik dianggap dapat digunakan secara luas pada
analisis multivariabel pada penelitian epidemiologi.
C. Jenis dan Persamaan Regresi Logistik
Syarat penggunaan regresi logisti k
1. Variabel dependen : katagorik
2. Variabel independen : katagorik dan numerik (kategorik > numerik )
Jenis regresi logistik
1. Sederhana (simple) hanya satu variabel independen.
2. Ganda (multiple) lebih dari satu variabel independen.
Persamaan Regresi Logistik
Keterangan :
- P(Y) : Probabilitas seorang individu untuk mengalami Y=1
- OR (Odds Ratio) : Risiko kelompok X=1 untuk mengalami Y=1 dibandingkan dengan
kelompok X=0
D. Fungsi Regresi Logistik Ganda
1. Menetapkan model matematik yang paling baik untuk menggambarkan hubungan
variabel independen dan variabel dependen.
2. Menggambarkan hubungan kuantitatif antara variabel independen (xi) dengan
variabel dependen (y) setelah dikontrol oleh variabel lain.
3. Mengetahui variabel (xi) mana yang penting/dominan dalam memprediksi
variabel dependen (y).
4. Mengetahui adanya interaksi pada variabel independen (xi).
Logit (Y )=a+b1 x1+ .. ..+bk xk
P(Y )=1
1+Exp−(log itY )= 1
1+Exp−(a+b1x 1+ . . .. .+bk xk )
OR=Exp(b)=Exponensial(b)=e(b )
E. Aplikasi Regresi Logistik
1. Aplikasi pada desain studi Cohort
- Dapat menghitung Risiko Individu (probabilitas)
- Menghitung Risiko Relatif (RR)
- Contoh aplikasi penggunaan RR
2. Desain studi Case-control/Cross-Sectional
- Menghitung Odds Ratio (OR)
- Contoh aplikasi penggunaan OR
)....()( 1111
kk xbxbaY ExpP
RR=P1(Y )P0 (Y )
OR=Exp(b)
F. Metode Pemilihan Variabel Independen
Metode untuk melakukan pemilihan variabel independen dalam analisis multivariat
regresi linier ganda, yaitu:
a). ENTER, memasukkan semua variabel independen dengan serentak satu langkah,
tanpa melewati kriteria kemanaan statistik tertentu. Metode ini yang tepat/sering
digunakan, karena dalam pemodelan kita dapat melakukan pertimbangan aspek
substansi.
b). FORWARD, memasukkan satu persatu variabel dari hasil pengkorelasian variabel
dan memenuhi kriteria kemaknaan statistik untuk masuk ke dalam model, sampai
semua variabel yang memenuhi kriteria tersebut masuk ke dalam model. Variabel
yang masuk pertama kali adalah variabel yang mempunyai korelasi parsial terbesar
dengan variabel dependen dan yang memenuhi kriteria tertentu untuk dapat masuk
model. Korelasi parsial adalah adalah korelasi antara variabel independen dengan
dependen, kriteria variabel yang dapat masuk P-in (PIN) adalah 0,005 artinya variabel
yang dapat masuk model bila variabel tersebut mempunyai nilai P lebih kecil atau
sama dengan 0,05.
c). BACKWARD, memasukkan semua variabel ke dalam model, tetapi kemudian satu
persatu variabel independen dikeluarkan dari model berdasarkan kriteria kemaknaan
tertentu, variabel yang pertama kali dikeluarkan adalah variabel yang mempunyai
korelasi parsial terkecil dengan variabel dependen. Kriteria pengeluaran atau P-out
(POUT) adalah 0,10, artinya variabel yang mempunyai nilai P lebih besar atau sama
dengan 0,10 dikeluarkan dari model.
d). STEPWISE, model ini merupakan kombinasi antara metode backward dan Forward.
Seperti halnya forward, metode Stepwise dimulai dari tanpa variabel sama sekali di
dalam model. Lalu satu variabel hasil pengkorelasian variabel dimasukkan ke dalam
model. Lalu satu persatu variabel hasil pengkorelasian dimasukkan ke dalam model
dan dikeluartkan dari model dengan kriteria tertentu. Variabel yang pertama masuk
sama dengan metode forward yakni variabel yang mempunyai korelasi parsial
terbesar. Selanjutnya setelah masuk, variabel pertama ini diperiksa lagi apakah harus
dikeluarkan dari model menurut kriteria pengeluaran seperti metode backward.
e). REMOVE, mengeluarkan semua variabel independen dengan serentak satu langkah,
tanpa melewati kriteria kemaknaan statistik tertentu.
G. Jenis Pemodelan Multivariat Regresi Logistik
1. Regresi Logistik Model Prediksi
Model yang terdiri beberapa variabel independen yang dianggap terbaik untuk
memprediksi kejadian variable dependen.
Mengetahui Faktor-Faktor yang Berhubungan dengan Kejadian BBLR di Kabupaten
X tahun 2013
Langkah Pemodelan
a. Seleksi bivariat; menggunakan uji-statistik bivariat seperti biasa
1. Uji – t, untuk variabel age-low, lwt-low, ptl-low, ftv-low
Langkah-langkah dengan SPSS
- Analyze Compare Means Independent-Samples T Test
- Kotak dialog Independent-Samples T Test
Test variable(s): masukkan variabel independen jenis data kontinu