HALAMAN JUDUL
TESIS – SS14 2501
INTERVAL KONFIDENSI UNTUK PARAMETER MODEL REGRESI SEMIPARAMETRIK BIRESPON DENGAN PENDEKATAN SPLINE TRUNCATED (Aplikasi Pada Data Kemiskinan dan Pengeluaran Per Kapita Makanan Provinsi Jawa Timur)
ZAHROTUL AZIZAH NRP. 06211650010016
DOSEN PEMBIMBING Prof. Dr. Drs. I Nyoman Budiantara, M.Si Dr. Ismaini Zain, M.Si
PROGRAM MAGISTER DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA, KOMPUTASI DAN SAINS DATA INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA 2018
HALAMAN JUDUL
TESIS – SS14 2501
CONFIDENCE INTERVAL FOR PARAMETER OF BIRESPONSE SEMIPARAMETRIC REGRESSION MODEL BASED ON SPLINE TRUNCATED APPROACH (Applied on Percentage of Poverty and Food Expenditure per Capita Data in East Java Province)
ZAHROTUL AZIZAH NRP. 06211650010016
SUPERVISOR Prof. Dr. Drs. I Nyoman Budiantara, M.Si Dr. Ismaini Zain, M.Si
MAGISTER PROGRAM STATISTICS DEPARTMENT FACULTY OF MATHEMATICS, COMPUTATION, DAN DATA SCIENCE INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA 2018
v
INTERVAL KONFIDENSI UNTUK PARAMETER MODEL REGRESI
SEMIPARAMETRIK BIRESPON DENGAN PENDEKATAN SPLINE
TRUNCATED
(APLIKASI PADA DATA KEMISKINAN DAN PENGELUARAN PER
KAPITA MAKANAN PROVINSI JAWA TIMUR)
Nama Mahasiswa : Zahrotul Azizah
NRP : 06211650010016
Pembimbing 1 : Prof. Dr. I Nyoman Budiantara, M.Si
Pembimbing 2 : Dr. Ismaini Zain, M.Si
ABSTRAK
Interval konfidensi merupakan salah satu permasalahan penting di dalam
statistika inferensi pada regresi, namun pada interval konfidensi untuk regresi
semiparametrik belum banyak dilakukan. Beberapa penelitian sebelumnya yang
membahas mengenai interval konfidensi parameter model regresi menggunakan
pendekatan bayesian, sedangkan pada penelitian ini konstruksi interval konfidensi
dilakukan dengan metode pivotal quantity, karena dinilai lebih mudah karena tidak
melibatkan distribusi prior. Pendekatan dalam regresi semiparametrik yang
digunakan pada penelitian ini yaitu spline truncated. Pada kasus nyata, jika
ditemukan adanya dua variabel respon yang saling berkorelasi, maka dalam
memodelkan dengan menggunakan regresi dianalisis dengan model regresi
birespon. Selanjutnya, interval konfidensi untuk parameter model regresi birespon
semiparametrik dengan pendekatan spline truncated diaplikasikan pada data
kemiskinan dan pengeluaran per kapita makanan Jawa Timur. Berdasarkan hasil
penelitian dengan tingkat signifikansi sebesar 0,05 diperoleh bahwa persentase
kemiskinan dipengaruhi oleh rata-rata lama sekolah, gini ratio, angka partisipasi
sekolah, tingkat pengangguran terbuka, dan PDRB atas harga berlaku, sedangkan
pengeluaran per kapita makanan dipengaruhi oleh rata-rata lama sekolah dan PDRB
atas dasar harga berlaku. Model diperoleh dengan GCV minimum sebesar 4,189,
MSE sebesar 2,698 dan nilai 𝑅2 sebesar 91,05 %.
Kata kunci : Regresi Semiparametrik Birespon Spline Truncated, Interval
Konfidensi untuk Parameter Regresi, Persentase Kemiskinan, Pengeluaran per
Kapita Makanan.
vi
Halaman ini sengaja dikosongkan.
vii
CONFIDENCE INTERVAL FOR PARAMETER OF BIRESPONSE
SEMIPARAMETRIC REGRESSION MODEL BASED ON SPLINE
TRUNCATED APPROACH
(APPLIED ON PERCENTAGE OF POVERTY AND FOOD
EXPENDITURE PER CAPITA DATA IN EAST JAVA PROVINCE)
Name of Student : Zahrotul Azizah
NRP : 06211650010016
Supervisor : Prof. Dr. I Nyoman Budiantara, M.Si
Co-Supervisor : Dr. Ismaini Zain, M.Si
ABSTRACT
Confidence interval is one of the important problems in inference statistics
of regression, but the confidence interval for semiparametric regression has not
been widely performed. Some previous studies that discussed the confidence
interval of regression model parameters using bayesian approach, whereas in this
research confidence interval construction is done by pivotal quantity method, it is
considered easier because it doesn’t involve prior distribution. The approach in
semiparametric regression used in this study is spline truncated. In the real case, if
there is found the existence of two correlation response variables, then in modeling
used regression method is analyzed by biresponses regression model. Subsequently,
the confidence interval for parameters of semiparametric biresponses regression
model with the spline truncated approach was applied to poverty percentage data
and per capita food expenditure in East Java. Based on the result of the research
with significance level of 0,05, it is found that the percentage of poverty is
influenced by the average of school duration, gini ratio, school participation rate,
open unemployment rate, and GRDP (Gross Regional Domestic Product) over
current price, while per capita food expenditure is influenced by the average of
school duration and GRDP at current price. The model was obtained with minimum
GCV of 4.189, MSE of 2,698 and R2 of 91.05%.
Keywords: Spline Truncated Semiparametric Biresponses Regression, Confidence
Interval for Parameters of Regression, Percentage of Poverty, Per Capita Food
Expenditure.
viii
-Halaman ini sengaja dikosongkan-
ix
KATA PENGANTAR
Puji syukur penulis ucapkan kepada Allah SWT atas rahmat dan kasihNya,
penulis dapat menyelesaikan penulisan Tesis dengan judul “Interval Konfidensi
untuk Parameter Model Regresi Semiparametrik Birespon dengan
Pendekatan Spline Truncated (Aplikasi pada Data Persentase Kemiskinan
dan Pengeluaran Per Kapita Makanan)” ini dengan baik. Tesis ini disusun untuk
memenuhi salah satu syarat memperoleh gelar Magister Sains (M.Si) di Jurusan
Statistika, Fakultas Matematika, Komputasi, dan Sains Data, Institut Teknologi
Sepuluh Nopember Surabaya.
Terselesaikannya Tesis ini tidak lepas dari dukungan berbagai pihak yang
telah memberikan bantuan kepada penulis. Oleh karena itu, pada kesempatan ini
penulis ingin menyampaikan terima kasih kepada:
1. Orang tua penulis, Bapak Masyhudi dan Ibu Mufarokah dan adik penulis,
Ulyatur Rosyidah dan Alifatul Mujahadah yang selalu menyemangati, memberi
motivasi, kasih sayang serta dukungan kepada penulis,
2. Prof. Dr. Drs. I Nyoman Budiantara, M.Si. dan Dr. Ismaini Zain, M.Si, selaku
dosen pembimbing dalam penyusunan Tesis ini, yang telah banyak memberikan
ilmu, saran, dan penuh kesabaran serta bersedia meluangkan waktu untuk
membimbing penulis selama ini,
3. Dr. Vita Ratnasari, M.Si dan Dr. Sutikno, M.Si, selaku dosen penguji, yang
telah banyak memberikan masukan guna kesempurnaan Tesis ini,
4. Dr. Suhartono selaku Ketua Jurusan Statistika dan Dr.rer.pol. Heri Kuswanto,
M.Si., selaku Ketua Program Pascasarjana Jurusan Statistika, yang telah
memberikan waktu untuk mendukung terselesainya Tesis ini,
5. Dr. Setyawan, M.Si, selaku dosen wali penulis yang telah memberikan
dukungan moril dan arahan selama penulis menempuh studi,
6. Bapak dan Ibu dosen Jurusan Statistika, Fakultas Matematika, Komputasi, dan
Sains Data, Institut Teknologi Sepuluh Nopember, yang telah mendidik dan
membekali penulis dengan berbagai ilmu pengetahuan selama masa
perkuliahan, serta seluruh staf administrasi akademik, laboratorium, dan ruang
x
baca Statistika yang telah memberikan pelayanan dan fasilitas selama
perkuliahan,
7. Rekan-rekan pengerjaan Tesis nonparametrik, Imraatil Husni, Alvita R.D.,
Suprapto, Khaerul Umam, Rafael T., dan Fendi A. yang telah berjuang dan
belajar bersama selama pengerjaan Tesis,
8. Dr. Nur Chamidah, M.Si dan Eko Tjahjono, M.Si selaku dosen pembimbing
skripsi penulis dan dosen-dosen S-1 Statistika Unair yang telah memotivasi
penulis untuk melanjutkan studi master,
9. Silvyah rahmi, Jauhara Rana B., dan Bahagiati M. yang telah menjadi keluarga
kedua penulis selama menempuh studi master di Institut Teknologi Sepuluh
Nopember,
10. Bagus Aji S., Umi Tri Ruhana, Della Destylawati, Lussi Agustin, Bayyinah,
Fitriana Dz., dan Aulia Dwi R. yang senantiasa memberi semangat kepada
penulis selama perkuliahan dan pengerjaan Tesis,
11. Rekan seperjuangan Magister Statistika angkatan 2016, terima kasih atas
kerjasama, saran, dan kebersamaannya,
12. Semua pihak yang tidak dapat disebutkan satu persatu, yang telah membantu
dan menyumbangkan pikiran guna terselesaikan Tesis ini.
Penulis menyadari bahwa dalam tulisan Tesis ini masih banyak kekurangan,
sehingga kritik dan saran yang bersifat membangun dari berbagai pihak sangat
diharapkan demi penulisan yang lebih baik lagi di masa yang akan datang. Semoga
tulisan ini memberikan manfaat bagi semua dan bermanfaat untuk pengembangan
ilmu pengetahuan khususnya di bidang Statistika.
Surabaya, Januari 2018
Penulis
xi
DAFTAR ISI
HALAMAN JUDUL ...................................................................................... i
HALAMAN PENGESAHAN ........................................................................ iii
ABSTRAK ...................................................................................................... v
ABSTRACT .................................................................................................... vii
KATA PENGANTAR .................................................................................... ix
DAFTAR ISI ................................................................................................... xi
DAFTAR TABEL .......................................................................................... xiii
DAFTAR GAMBAR ...................................................................................... xv
BAB 1 PENDAHULUAN .............................................................................. 1
1.1 Latar Belakang ..................................................................................... 1
1.2 Rumusan Masalah ................................................................................ 4
1.3 Tujuan Penelitian ................................................................................. 4
1.4 Manfaat Penelitian ............................................................................... 5
1.5 Batasan Masalah................................................................................... 5
BAB 2 TINJAUAN PUSTAKA ..................................................................... 7
2.1 Analisis Regresi ................................................................................... 7
2.2 Spline Truncated .................................................................................. 8
2.2.1 Spline Truncated dalam Regresi Nonparametrik ....................... 8
2.2.2 Spline Truncated dalam Regresi Semiparametrik ..................... 9
2.3 Regresi Semiparametrik Birespon Spline Truncated ........................... 9
2.4 Pemilihan Titik Knot Optimal .............................................................. 12
2.5 Interval Konfidensi Parameter Regresi ................................................ 12
2.6 Weighted Least Square ........................................................................ 14
2.7 Aljabar Matriks .................................................................................... 15
2.8 Persentase Kemiskinan, Pengeluaran Per Kapita Makanan, dan Faktor
yang diduga Berpengaruh .................................................................... 16
BAB 3 METODOLOGI PENELITIAN ....................................................... 19
3.1 Sumber Data ......................................................................................... 19
3.2 Variabel Penelitian ............................................................................... 19
xii
3.3 Struktur Data Penelitian........................................................................ 20
3.4 Tahapan Penelitian ............................................................................... 21
BAB 4 HASIL DAN PEMBAHASAN
4.1 Kajian Interval Konfidensi untuk Parameter Model Regresi
Semiparametrik Birespon dengan Pendekatan Spline Truncated........ 25
4.1.1 Interval Konfidensi saat Variansi Eror Diketahui ....................... 33
4.1.2 Interval Konfidensi saat Variansi Eror Tidak Diketahui ............. 36
4.2 Aplikasi pada Data Persentase Kemiskinan dan Pengeluaran per Kapita
Makanan di Provinsi Jawa Timur ......................................................... 43
4.2.1 Deskriptif Persentase Kemiskinan, Pengeluaran Per Kapita Makanan dan
Faktor yang Diduga Mempengaruhinya ................................................... 43
4.2.2 Pengujian Korelasi Antar Variabel Respon ........................................... 50
4.2.3 Identifikasi Variabel Komponen Parametrik dan Nonparametrik .......... 50
4.2.4 Aplikasi Data Model Regresi Semiparametrik Birespon dengan
Pendekatan Spline Truncated ................................................................... 52
BAB 5 KESIMPULAN DAN SARAN
5.1 Kesimpulan .......................................................................................... 57
5.2 Saran .................................................................................................... 58
DAFTAR PUSTAKA ............................................................................... .... 59
Lampiran .......................................................................................................... 65
xiii
DAFTAR TABEL
Tabel 2.1 Penelitian Sebelumnya terkait Faktor-faktor yang Memengaruhi
Kemiskinan ........................................................................................ 17
Tabel 3.1 Variabel Penelitian ............................................................................... 19
Tabel 3.2 Struktur Data Penelitian ....................................................................... 20
Tabel 4.1 Statistika Deskriptif Variabel Penelitian .............................................. 43
Tabel 4.2 Tabel Identifikasi Linieritas dengan Scatter Plot ................................. 50
Tabel 4.3 Tabel Identifikasi Linieritas dengan Ramsey Test ................................ 51
Tabel4.4 Hasil Identifikasi Komponen Parametrik dan Nonparametrik Berdasarkan
Hasil Uji Ramsey .................................................................................. 52
Tabel 4.5 Nilai GCV untuk Spline Linear Satu Knot ........................................... 53
Tabel 4.6 Interval Konfidensi untuk Parameter ................................................... 54
xiv
-Halaman ini sengaja dikosongkan-
xv
DAFTAR GAMBAR
Gambar 4.1 Persentase Kemiskinan Berdasarkan Kabupaten/Kota di Jawa Timur
Tahun 2015 ...................................................................................... 45
Gambar 4.2 Pengeluaran per Kapita Makanan berdasarkan Kabupaten/kota di
Jawa Timur 2015 .............................................................................. 47
Gambar 4.3 Scatter Plot Variabel Persentase Kemiskinan dan Variabel yang
Diduga Berpengaruh ........................................................................ 48
Gambar 4.4 Scatter Plot Variabel Pendapatan per Kapita Makanan dan Variabel
yang Diduga Berpengaruh................................................................ 49
xvi
Halaman ini sengaja dikosongkan.
1
BAB 1
PENDAHULUAN
1.1 Latar Belakang
Interval konfidensi merupakan salah satu persoalan yang penting dalam hal
inferensi regresi (Nafi’ dan Budiantara, 2008). Interval konfidensi untuk parameter
model regresi digunakan pada penentuan variabel prediktor yang signifikan
berpengaruh terhadap variabel respon dengan melihat jika interval konfidensi
memuat nilai nol, maka variabel prediktor tidak berpengaruh secara signifikan
terhadap variabel respon. Interval konfidensi untuk parameter model regresi
parametrik telah dilakukan, namun konstruksi interval konfidensi untuk parameter
model regresi semiparametrik belum banyak dilakukan.
Konstruksi interval konfidensi regresi nonparametrik dilakukan oleh
beberapa peneliti seperti Wahba (1983) dan Wang (1998) untuk model regresi
spline smoothing menggunakan pendekatan bayesian yang melibatkan distribusi
prior improper sehingga secara matematis sulit dilakukan. Pendekatan yang dinilai
lebih mudah dibandingkan pendekatan bayesian dalam hal konstruksi interval
konfidensi yaitu pendekatan pivotal quantity dimana pada pendekatan ini tidak
melibatkan distribusi prior sehinga diperoleh model yang sederhana dan inferensi
statistika yang relatif mudah (Eubank, 1988). Peneliti yang menggunakan
pendekatan pivotal quantity untuk konstruksi interval konfidensi yaitu Loklomin
(2017) menggunakan metode untuk konstruksi interval konfidensi untuk parameter
model regresi semiparametrik, namun dalam hal ini hanya melibatkan satu respon
sehingga belum mengakomodasi interval konfidensi untuk regresi semiparametrik
birespon, padahal menurut Welsh dan Yee (2006), birespon merupakan masalah
yang menarik dibahas karena kedua variabel responnya saling berkorelasi.
Beberapa metode estimasi yang terdapat dalam regresi semiparametrik
antara lain spline, kernel, lokal linier, polinomial lokal, dan deret fourier (Hardle,
1990). Namun, dari beberapa metode estimasi tersebut, spline merupakan metode
yang paling diminati oleh peneliti dalam bidang regresi semiparametrik, hal
tersebut didasari karena spline memiliki interpretasi statistik dan visual yang sangat
baik (Eubank, 1999; Budiantara 2009). Spline merupakan potongan polinomial
2
tersegmen sehingga memiliki fleksibilitas lebih dari polinomial biasa, oleh karena
itu spline memiliki kelebihan lebih efektif dalam hal penyesuaian diri terhadap
karakteristik lokal suatu data (Fajriyyah dan Budiantara, 2015). Salah satu basis
fungsi yang digunakan pada spline yaitu spline truncated (Lyche and Morken,
2008).
Spline truncated merupakan model polinomial tersegmen yaitu memiliki
perubahan pola perilaku kurva yang berbeda pada interval yang berlainan yang
ditandai dengan adanya titik knot. Estimasi kurva regresi semiparametrik spline
truncated dapat dilakukan dengan memilih parameter smoothing, yaitu orde,
banyaknya titik knot, dan titik knot. Pemilihan parameter smoothing yang optimal
dilakukan penulis dengan menggunakan kriteria Generalized Cross Validation
(GCV) yaitu dengan memilih nilai GCV yang minimum. GCV digunakan karena
memiliki sifat optimal asimtotik yang tidak dimiliki metode lain (Wahba, 1990).
Penelitian mengenai Regresi semiparametrik dengan pendekatan spline
telah dilakukan antara lain Wibowo, Haryatmi, dan Budiantara (2013), Marina dan
Budiantara (2013), Sugiantari dan Budiantara (2013), Yani, Srinadi, dan Sumarjaya
(2017), dan Pratiwi, Budiantara, dan Wibowo (2017), namun pada beberapa
penelitian tersebut terbatas hanya membahas kasus dengan satu variabel respon
sehingga belum bisa mengakomodasi kasus dengan dua variabel respon.
Selanjutnya, beberapa penelitian yang membahas mengenai regresi birespon spline
dilakukan oleh Wulandari dan Budiantara (2014) dan Nurdiana, Herhyanto, dan
Dasari (2017) dengan pendekatan nonparametrik, sedangkan Wibowo dkk. (2012)
membahas model semiparametrik multirespon. Beberapa penelitian di atas, masih
dalam batas mengestimasi parameter dan belum melakukan inferensi lebih lanjut
terkait interval konfidensi. Pada penelitian ini, interval konfidensi parameter model
regresi birespon semiparametrik spline truncated diaplikasikan pada data persentase
kemiskinan dan pengeluaran per kapita makanan.
Kemiskinan merupakan permasalahan sosial kependudukan yang utamanya
perlu mendapat perhatian khusus karena salah satu sasaran dalam pembangunan
nasional adalah menurunkan tingkat kemiskinan (Rahmawati, Ispriyanti, dan
Warsito, 2017). Kemiskinan merupakan persoalan yang sangat kompleks dan
kronis, oleh karena itu dibutuhkan analisis yang tepat dan melibatkan semua
3
komponen permasalahan dalam penangannnya (Prawoto, 2009). Pada era
Sustainable Development Goals (SDG’s) ini, kemiskinan ditempatkan pada poin
pertama yang harus diraih yaitu terciptanya dunia tanpa kemiskinan sehingga
pengentasan kemiskinan merupakan prioritas bagi semua Negara, salah satunya
Indonesia.
Pada Tahun 2000, jumlah penduduk miskin di Indonesia mencapai 38,74
juta jiwa dan seiring bertambahnya tahun jumlah penduduk miskin di Indonesia
memiliki kecenderungan menurun hingga pada tahun 2015 jumlah penduduk
miskin sejumlah 28,51 juta jiwa (BPS 2015; Ishartono, 2016). Meskipun begitu,
jumlah tersebut merupakan angka yang masih besar mengingat bahwa target SDGs
adalah dunia tanpa kemiskinan atau dengan kata lain Indonesia masih sangat jauh
untuk mencapai tujuan tersebut. Kemiskinan di Indonesia yang cukup tinggi
didukung dengan fakta bahwa Indonesia merupakan Negara dengan urutan ke-5
dengan persentase populasi garis kemiskinan terbanyak di Asia Tenggara yaitu
sebesar 10,9% yang didasarkan pada data BPS tahun 2014 (Basic Statistic, 2017).
Di Indonesia, Jawa Timur merupakan provinsi dengan jumlah penduduk miskin
terbanyak yaitu sebanyak 4.638.530 (BPS, 2016). Walaupun Jawa Timur
berkontribusi pada Produk Domestik Bruto nasional yang cukup tinggi yaitu
tercatat oleh BPS (2016) sebesar 14,85% , namun tidak serta merta menjadikan
Jawa Timur sebagai provinsi yang rendah tingkat kemiskinannya.
Pengukuran kesejahteraan penduduk suatu daerah selain diukur dari
persentase kemiskinan dapat pula diukur melalui pengeluaran per kapita makanan
(Badan Ketahanan Pangan, 2015). Secara fakta, persentase penduduk miskin dan
pengeluaran per kapita makanan berkorelasi signifikan pada kajian data awal.
Kasus kemiskinan dan pengeluaran per kapita makanan beserta faktor-faktor yang
mempengaruhi telah dibahas oleh beberapa peneliti antara lain Wulandari dan
Budiantara (2014) dan Putri (2017). Wulandari dan Budiantara (2014) serta Putri
(2017) mendapatkan model untuk persentase kemiskinan dan pengeluaran per
kapita makanan dengan memuat variabel prediktor antara lain tingkat kesempatan
kerja, laju pertumbuhan ekonomi, tingkat pengangguran terbuka, dan tingkat
pastisipasi angkatan kerja, namun Putri (2017) menggunakan pendekatan Penalized
Spline, sedangkan Wulandari dan Budiantara (2014) menggunakan pendekatan
4
Spline. Penelitian lain yaitu Merdekawati dan Budiantara (2013) melakukan
pemodelan regresi spline truncated multivariabel memperoleh hasil bahwa
pertumbuhan ekonomi, tingkat pengangguran terbuka, dan tingkat pendidikan
berpengaruh terhadap kemiskinan. Berdasarkan kajian awal data diperoleh bahwa
pola data mengikuti pola semiparametrik sehingga syarat untuk aplikasi regresi
semiparametrik birespon telah terpenuhi.
1.2 Rumusan Masalah
Berdasarkan latar belakang yang telah diuraikan di atas, maka rumusan
masalah pada penelitian ini adalah sebagai berikut :
1. Bagaimana mendapatkan interval konfidensi untuk parameter model regresi
semiparametrik birespon dengan pendekatan spline truncated?
2. Bagaimana memodelkan persentase kemiskinan dan pengeluaran per kapita
makanan di Provinsi Jawa Timur dan variabel-variabel apa saja yang
berpengaruh menggunakan interval konfidensi untuk parameter model
regresi semiparametrik birespon dengan pendekatan spline truncated?
1.3 Tujuan Penelitian
Berdasarkan rumusan masalah yang telah diperoleh di atas, maka tujuan
penelitian adalah sebagai berikut :
1. Mengkaji interval konfidensi untuk parameter model regresi
semiparametrik birespon dengan pendekatan spline truncated.
2. Mengestimasi model data persentase kemiskinan dan pengeluaran per
kapita makanan di Provinsi Jawa Timur dan mengetahui variabel-variabel
yang berpengaruh menggunakan interval konfidensi untuk parameter model
regresi semiparametrik birespon dengan pendekatan spline truncated.
1.4 Manfaat Penelitian
Adapun manfaat yang diharapkan dalam penelitian ini adalah :
1. Menambah wawasan keilmuan mengenai interval konfidensi parameter
model regresi semiparametrik birespon dengan pendekatan spline
truncated.
5
2. Memberikan informasi kepada pemerintah untuk mengetahui variabel-
variabel yang mempengaruhi kemiskinan di Provinsi Jawa Timur.
3. Hasil penelitian diharapkan menjadi bahan masukan dan acuan untuk
penelitian-penelitian selanjutnya.
1.5 Batasan Masalah
Batasan yang digunakan pada penelitian ini adalah konstruksi interval
konfidensi untuk parameter model regresi semiparametrik birespon menggunakan
model spline linier. Pendekatan yang digunakan untuk mengkonstruksi interval
konfidensi pada Tesis ini adalah pendekatan pivotal quantity. Interval konfidensi
yang terbentuk digunakan untuk pengujian hipotesis dua arah. Data yang digunakan
dalam penelitian ini adalah data sekunder yang diambil dari publikasi BPS tahun
2015. Banyaknya titik knot pada spline linier yang digunakan adalah satu titik knot.
Pemilihan titik knot optimal dilakukan menggunakan metode GCV.
6
Halaman ini sengaja dikosongkan
7
BAB 2
TINJAUAN PUSTAKA
2.1 Analisis Regresi
Analisis regresi merupakan suatu metode statistik yang digunakan untuk
mengetahui hubungan fungsional antara variabel respon dan prediktor. Berikut
adalah model persamaan regresi :
1 2i 0 1 1i 2 2i l li iy =β +β x +β x +...β x +ε ;i , ,...,n (2.1)
dengan y merupakan variabel dependen sedangkan x merupakan variabel
independen. Persamaan (2.1) dapat dinyatakan dalam bentuk matriks sesuai
persamaan (2.2).
y = Xβ +ε (2.2)
dengan
11 1
12 2
1 1
1
1
1
l
l
n l n
x x
x xX
x x
, dan
1
2=
n
ε .
Analisis regresi memiliki dua pendekatan yaitu parametrik dan
nonparametrik (Eubank, 1998). Regresi parametrik merupakan pendekatan regresi
yang memiliki asumsi bentuk kurva regresi diketahui. Pada regresi parametrik,
selain diasumsikan kurva regresi diketahui, terdapat beberapa asumsi terkait model
pada persamaan (2.2) yaitu residual diasumsikan identik, independen, dan
berdistribusi normal 2~ IIDN( , )ε 0 I .
Selain regresi parametrik, regresi nonprametrik merupakan pendekatan
metode regresi dimana bentuk kurva regresinya tidak diketahui. Model regresi
nonparametrik dapat ditulis sebagai berikut :
1 2i i iy =f(t )+ε , i , ,...,n (2.3)
Regresi nonparametrik sangat memerhatikan fleksibilitas, dan hanya diasumsikan
bentuk fungsinya mulus (Eubank, 1988).
Beberapa kasus menyatakan variabel respon diketahui pola hubungannya
dengan salah satu variabel prediktor, tetapi dengan variabel prediktor yang lain
8
tidak diketahui bentuk pola hubungannya. Dalam keadaan seperti ini, maka
digunakan pendekatan regresi semiparametrik. Regresi semiparametrik adalah
gabungan antara regresi parametrik dan regresi nonparametrik. Model regresi
semiparametrik dapat ditulis sebagai berikut (Wu dan Zhang, 2006):
, 1,2, ,nTi i i iy f t i βx (2.4)
dengan 𝑦𝑖 adalah subjek ke-i , ix adalah vektor komponen parametrik pengamatan
ke-i, 𝑓(𝑡𝑖) adalah fungsi regresi dan 𝜀𝑖 adalah error random, 𝜀𝑖~𝑁(0, 𝜎2).
2.2 Uji Ramsey
Uji linearitas digunakan untuk mengindentifikasi apakah model yang
digunakan fungsi parametrik yang digunakan adalah fungsi linear atau tidak. Uji ini
dikembangkan oleh Ramsey pada tahun 1969 yang biasa disebut general test of
specification atau RESET (Pamungkas, 2013). Uji ini bertujuan untuk menghasilkan
F hitung, dengan prosedur kerja yaitu
Hipotesis:
0 :H antara variabel respon dan variabel prediktor terdapat hubungan linier
1 :H antara variabel respon dan variabel prediktor tidak terdapat hubungan linier
Prosedur mendapatkan statistik uji:
1. Mendapatkan fitted value dari variabel respon dengan cara melakukan analisis
regresi linear.
2. Variabel fitted yang telah dikuadratkan tersebut diregresikan bersama dengan
model semula sebagai variabel prediktor baru.
3. Menghitung
2 2
2
/
1 /
R new R old pF
R new n k
, daerah penolakan :
; , 1 > . hitung tabel k n kF F
dengan
p= Jumlah variabel prediktor yang baru masuk
n= Jumlah data
k= banyaknya parameter dalam model regresi baru
2R new= nilai dari persamaan regresi baru
2 R old nilai dari persamaan regresi lama
9
2.3 Spline Truncated
Spline truncated merupakan pendekatan regresi nonparametrik paling
populer. Salah satu kelebihan dari spline truncated yaitu model ini mengikuti pola
sesuai pergerakannya dengan adanya titik knot (Astuti, 2017). Secara umum, fungsi
spline berderajat p dengan titik-titik knot 1 2, ,.., rK K K dapat ditulis dalam bentuk
sebagaimana pada persamaan (2.5) berikut (Hardle, 1990).
01 1
g(t )p r
pj
i j i p k i k
j k
t t K
(2.5)
dan fungsi truncated diberikan oleh persamaan (2.6)
, t
0 , t
i k i k
i k
i k
t K Kt K
K
(2.6)
Regresi spline adalah regresi yang bentuk kurva regresinya didekati oleh fungsi
spline. Regresi spline dapat didekati dengan nonparametrik maupun
semiparametrik, hal ini didasarkan pada pola data yang didapatkan.
2.2.1 Spline Truncated dalam Regresi Nonparametrik
Secara umum, model regresi nonparametrik spline dapat dituliskan sebagai
berikut.
01 1
( ) , 1, 2, , n;p r
pj
j i p k i ki
j k
it i k=1,2,...K ,t t r
(2.7)
dimana p adalah derajat polinomial dan r adalah banyak titik knot pada fungsi
truncated, dengan 𝜀𝑖 adalah error random, 𝜀𝑖~𝑁(0, 𝜎2). Model regresi
nonparametrik spline pada persamaan (2.7) dapat disajikan dalam bentuk matriks
sebagai berikut:
η(t) = Zα +ε (2.8)
dengan 0 1 1( )T
p p p r α ,
1 1 1 1 1
2 2 2 1 2
1
1
1
1
P Pp
r
P Pp
r
P Pp
n n n n r
t t t K t K
t t t K t K
t t t K t K
Z ,
dan 1 2T
nε merupakan vektor residual.
10
2.2.2 Spline Truncated dalam Regresi Semiparametrik
Regresi semiparametrik diterapkan pada data yang sebagian variabel
prediktornya diketahui bentuk kurva regresinya dan sebagian yang lain tidak
diketahui, Eubank (1998) menyebut hal ini sebagai partial linier model untuk kurva
yang diketahui berbentuk linier. Mengacu pada persamaan (2.4) dan (2.5), jika
diberikan data berpasangan 1 2i i i( x ,t , y ), i , ,..,n dimana iy adalah variabel respon
sedangkan ix adalah variabel prediktor yang mengikuti pola parametrik dan it
adalah variabel prediktor yang mengikuti pola nonparametrik, model regresi
semiparametrik spline truncated dapat ditulis menjadi:
1 1
, 1, 2, , np r
pj
0 1 i 0 j i p k i k
j k
i iβ +β x α ty t K i
(2.9)
Persamaan (2.9) dapat disajikan dalam bentuk matriks berikut
y = X +β Zα +ε
Cω +ε (2.10)
dengan C X Z dan
βω =
α.
2.3 Regresi Semiparametrik Birespon Spline Truncated
Analisis regresi birespon merupakan suatu analisis yang digunakan untuk
mengetahui hubungan fungsional antara dua variabel respon dan variabel prediktor.
Secara umum, Wang, Guo, dan Brown (2000) menyatakan model regresi birespon
dapat ditulis dalam bentuk
, i 1,2, , ni i ix y f ε (2.11)
dengan 1 2,
T
i i iy yy , 1 2,T
i i ix f x f xf adalah vektor dari fungsi
regresi, serta 1 2,
T
i i iε adalah vektor dari error pengukuran dengan mean 0
dan variansi ∑ .𝑖 Indeks 𝑖 menyatakan banyak pengamatan pada 𝑦𝑖(1) dan 𝑦𝑖
(2)
dengan kedua variabel respon saling berkorelasi.
Model regresi semiparametrik birespon Spline Truncated digunakan pada
kasus yang memiliki dua variabel respon yang memenuhi sifat regresi
11
semiparametrik. Diberikan pasangan data 1 2
1 2 1 2
( ) ( )
i i li i i qi i i( x ,x ,...,x ,t ,t ,...,t , y , y ) ,
dengan 1 2i , ,..,n 1( )iy merupakan variabel respon pertama pada pengamatan ke-
i dan 2( )
iy menyatakan variabel respon ke dua pada pengamatan ke-i. Hubungan
antara 1 2i i li( x ,x ,...,x ) dan 1 2( ) ( )
i i( y , y ) diasumsikan mengikuti model regresi
parametrik, sedangkan 1 2i i qi(t ,t ,...,t ) dan 1 2( ) ( )
i i( y , y )diasumsikan mengikuti model
regresi nonparametrik. Mengacu persamaan (2.4) dan (2.11) maka jika persamaan
tersebut didekati dengan fungsi spline multivariabel, maka persamaan dapat ditulis.
1 1 1 1 1 1 1 1
1 2 1 2
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
i i i li i i qi iy g (x ) g (x ) ... g (x ) (t ) (t ) ... (t )
(2.12)
2 2 2 2 2 2 2 2
1 2 1 2
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
i i i li i i qi iy g (x ) g (x ) ... g (x ) (t ) (t ) ... (t )
(2.13)
Secara sederhana persamaan (2.12) dan (2.13) dapat ditulis ulang sebagai berikut.
1 1 1 1
1 1
ql( ) ( ) ( ) ( )
i ji mi i
j m
y g (x ) (t )
(2.14)
2 2 2 2
1 1
ql( ) ( ) ( ) ( )
i ji mi i
j m
y g (x ) (t )
(2.15)
dengan
1
(1) (1) (1) (1)
0
1 1
(1) ( )mi
rpp
j
j mi p k mi k
j k
t Kt t
2
(2) (2) (2) (2)
0
1 1
(2) ( ; 1,2 .) , ..mi
rpp
j
j mi p k mi k
j k
tt t K m q
1 1 1 1 1
0 1 2 l
( ) ( ) ( ) ( ) ( )
1i 2i 1i 1i 2i lig (x ,x ,...,x )=β +β x +β x +...+β x
2 2 2 2 2
0 1 2 l
( ) ( ) ( ) ( ) ( )
1i 2i 1i 1i 2i lig (x ,x ,...,x )=β +β x +β x +...+β x
Persamaan (2.14) dan (2.15) jika ditulis dalam bentuk matriks dapat ditulis
sebagai berikut :
y = Xβ + Zα +ε (2.16)
Persamaan (2.16) dapat ditulis kembali menjadi:
y = Cω +ε (2.17)
12
dengan C = X Z dan T
ω β α .
2.4 Pemilihan Titik Knot Optimal
Pemilihan titik knot merupakan hal yang sangat penting dalam regresi spline.
Titik knot merupakan suatu titik dimana data mengalami perubahan pada selang
interval tertentu. Menurut Wahba (1990) dan Wang (1998), metode pemilihan titik
knot optimal dilakukan dengan metode Generalized cross validation (GCV). Titik
knot optimal diperoleh melalui pemilihan nilai GCV terkecil (Budiantara, 2005).
Fungsi GCV dirumuskan sebagai berikut (Hardle,1990):
21
1
21
ˆ,
n
i iin y t
GCV C C C Cn t
kkr I
T -1 TA = ( )
A (2.18)
Dengan kA merupakan suatu matriks yang memuat knot k.
2.5 Interval Konfidensi Parameter Regresi
Interval konfidensi parameter regresi merupakan persoalan inferensi yang
penting dalam regresi spline. Langkah-langkah untuk mendapatkan estimasi
interval untuk suatu parameter dalam regresi dijelaskan oleh Montgomery, Peck,
dan Vining (2012) dengan menggunakan metode pivotal quantity sebagai berikut.
Model regresi linier berganda telah disajikan pada persamaan (2.2),
berdasarkan model, diketahui bahwa iy berdistribusi normal dengan mean
0 1
l
j jjx
dan varians 𝜎2. Langkah pertama yang harus dilakukan yaitu
mengetahui estimasi parameter, dalam hal ini pada metode regresi linier berganda
digunakan metode ordinary least square (OLS). Mengacu pada persamaan (2.2)
diperoleh estimator ̂ dengan metode OLS (Kutner, Nachtsheim, dan Neter, 2004):
ˆ T T -1β (X X) X y (2.19)
dengan memperhatikan bahwa β̂ kombinasi linier dari y , maka
2 1ˆ ~ ( , ( ) )N Tβ β X X , sehingga untuk masing-masing estimator berdistribusi
normal 2ˆ ~ ( , C )j j jjN , dimana jjC merupakan elemen diagonal ke-j dari
13
matriks 1
'
X X . Untuk membentuk suatu pivotal quantity untuk β , perlu
diperhatikan definisi tentang pivotal quantity berikut.
Jika Q=q(x1,x2,…,xn) adalah sebuah variabel random yang merupakan fungsi dari
X1,…,Xn dan , dan fungsi distribusinya tidak bergantung pada atau parameter
lain, maka Q disebut pivotal quantity .
Distribusi dari variabel random umumnya tidak memiliki pivotal quantity
yang pasti, artinya terdapat berbagai kemungkinan bentuk pivotal quantity, namun
teorema limit pusat sering kali digunakan untuk konstruksi interval konfidensi
untuk mayoritas distribusi dengan ukuran sampel besar.
Akibatnya, diperoleh pivotal quantity
20 1
j j
j
jj
ˆT , j , ,..,l
C
(2.20)
Variabel random ( )~
a
BT t
A
a
, jika dan hanya jika memenuhi tiga syarat yaitu
~ (0,1)B N , ( )A ~ a , dan A dan B independen.
Dengan pembuktian dengan berdasar syarat-syarat tersebut di atas, didapatkan
bahwa T berdistribusi t dengan derajat bebas n-l, dimana 𝜎2 diestimasi dengan
varians error. Untuk mendapatkan interval konfidensi terpendek diperlukan
optimasi Lagrange yaitu jika merupakan fungsi distribusi kumulatif dari pivotal
quantity Q=q(x1,x2,…,xp) dan didapatkan fungsi probabilitas untuk suatu interval
konfidensi
1 2( ( , , ..., ) ) 1
p(b) - (a) P a Q x x x b
Untuk mendapatkan interval konfidensi terpendek maka dicari
, ,1 2 p U LL(x ,x ,..., x )a b minimum dengan penyelesaian optimasi Lagrange :
, ,
{ ( )} {( ) }a b R a b R
a, b a bMin Min
14
Berdasarkan hasil pada persamaan (2.20) dan Teorema 4, didapat interval
konfidensi terpendek berukuran (1 ) 100% untuk koefisien regresi
, 0,1,..,j j l adalah sebagai berikut.
2 2
, ,2 2
ˆ ˆˆ ˆj jj j j jjn p n p
t C t C (2.21)
2.6 Weighted Least Square
Metode Ordinary Least Square (OLS) mengasumsikan bahwa terdapat
variansi konstan dalam error yang pada umumnya disebut keadaan
homoskedastisitas. Metode Weighted Least Square (WLS) dapat digunakan ketika
asumsi variansi konstan dalam error dilanggar atau dalam kata lain disebut
heteroskedastisitas (Greene, 2003). Berikut diberikan model :
y Xβ ε (2.22)
Dengan error diasumsikan berdistribusi normal multivariat dengan mean 0 dan
matriks variansi-kovariansi non konstan sebagai berikut :
2
1
2
2
2
0 0
0 0
0 0 0 n
=
Dalam metode OLS, berikut adalah fungsi yang diminimumkan untuk
mengestimasi parameter
2
T T T T T T
T T T T T
Q
T
T
ε
y y β X y y Xβ β X Xβ
y y β X y β X Xβ
ε
y - Xβ y - Xβ (2.23)
Persamaan (2.27) selanjutnya didiferensiasi terhadap β dengan proses sebagai
berikut:
1
2
0 2 2
ˆ
T T T T T
T T
T T
Q
y y β X y β X Xβ
β β
X y X Xβ
β X X X y
15
sehingga diperoleh estimator OLS sebagai berikut.
ˆ T -1 Tβ = (X X) X y (2.24)
Jika kita mendefinisikan invers dari matriks variansi kovariansi sebagai pembobot
untuk estimasi parameter yaitu 2
1i
i
, maka matriks V merupakan suatu matriks
diagonal yang berisi pembobot untuk estimasi parameter sebagai berikut.
1
2
n
0 0
0 0
0 0 0
V
Pada metode WLS fungsi yang diminimumkan untuk mengestimasi parameter
dirumuskan sebagai berikut
2
T T T T T T
T T T T T
Q
Ty - Xβ V y - Xβ
y Vy β X Vy y VXβ β X VXβ
y Vy β X Vy β X VXβ
(2.25)
Estimator WLS didapat dengan meminimumkan persamaan (2.25) dengan
memenuhi 0Q
β sebagai berikut.
1
2
0 2 2
ˆ
T T T T T
T T
T T
Q
y Vy β X Vy β X VXβ
β β
X Vy X VXβ
β X VX X Vy
sehingga diperoleh estimator WLS pada persamaan (2.26).
ˆ T -1 Tβ = (X VX) X Vy (2.26)
2.7 Aljabar Matriks
Beberapa teorema dasar terkait dengan aljabar matriks yang digunakan
untuk menyelesaikan estimasi parameter dan interval konfidensi berdasarkan
Rencher dan Scaalje (2007) adalah sebagai berikut.
Teorema 1.
16
Diberikan vektor a dan x , dimana 1 2, , ,..,T T T pa x x a a a a a memuat
konstanta, maka
T Ta x x aa
x x
Teorema 2.
Matriks A dikatakan idempoten jika AA = A
Teorema 3.
Jika A matriks berukuran nxp dan B matriks berukuran pxn, maka
( ) ( )tr trAB BA
Teorema 4.
Jika matriks A mempunyai rank r serta simetris dan idempoten, maka
( ) ( )rank A tr A r
Teorema 5.
Jika 2~ ( , )y N I dan A matriks simetris dengan rank r, maka
2/Ty y A
berdistribusi 2 2, / 2Tr A jika dan hanya jika A idempotent.
Teorema 6.
Jika 2~ ( , )y N I maka Ty yB dan
Ty yA adalah independen jika dan hanya jika
0BA atau 0AB .
2.8 Persentase Kemiskinan, Pengeluaran per Kapita Makanan dan Faktor
yang Diduga Berpengaruh
Kemiskinan menurut BPS (2014) didefinisikan sebagai ketidakmampuan
dari sisi ekonomi untuk memenuhi kebutuhan dasar seperti pangan, sandang,
pendidikan, kesehatan, dan perumahan. Sedangkan berdasarkan Undang-Undang
No. 24 Tahun 2004, kemiskinan adalah kondisi sosial ekonomi seseorang atau
sekelompok orang yang tidak terpenuhinya hak-hak dasarnya untuk
mempertahankan dan mengembangkan kehidupan yang bermartabat. Pengukuran
kesejahteraan penduduk di suatu daerah dapat diukur dengan persentase kemiskinan
dan pengeluaran per kapita makanan. Persentase kemiskinan merupakan persentase
17
penduduk yang berada di bawah garis kemiskinan, sedangkan pengeluaran per
kapita makanan yaitu biaya yang dikeluarkan untuk konsumsi semua anggota
rumah tangga selama sebulan untuk makanan dibagi dengan banyaknya anggota
rumah tangga tersebut (BPS, 2017).
Beberapa pertimbangan yang digunakan sebagai dasar pemilihan variabel
penelitian adalah beberapa penelitian yang dilakukan sebelumnya pada Tabel 2.1
berikut.
Tabel 2.1 Penelitian Sebelumnya terkait Faktor yang Memengaruhi Kemiskinan
Peneliti Judul Variabel Prediktor
Astiti dkk.
(2016)
Analisis regresi nonparametrik
spline multivariat untuk
pemodelan indikator kemiskinan
di Indonesia.
Angka melek huruf, rata-
rata lama sekolah, angka
partisipasi sekolah, PDRB
per kapita, tingkat
pengangguran terbuka.
Budiantara,
I.N.,
Wulandari
(2015)
Analisis Faktor-Faktor yang
Mempengaruhi Persentase
Penduduk Miskin dan
Pengeluaran Perkapita Makanan
di Jawa Timur Menggunakan
Regresi Nonparametrik Birespon
Spline.
Tingkat kesempatan kerja,
laju pertumbuhan ekonomi,
tingkat pengangguran
terbuka, dan tingkat
partisipasi angkatan kerja .
Merdekawati
dan
Budiantara
(2013)
Pemodelan Regresi Spline
Truncated Multivariabel pada
Faktor-Faktor yang
Mempengaruhi Kemiskinan di
Kabupaten/Kota Provinsi Jawa
Tengah.
Pertumbuhan ekonomi,
tingkat pengangguran
terbuka, dan tingkat
pendidikan
Rahmawati
dkk (2017)
Pemodelan kasus kemiskinan di
jawa tengah menggunakan
regresi nonparametrik metode B-
spline.
Angka melek huruf, tingkat
pengangguran terbuka,
angka partisipasi sekolah,
dan PDRB per kapita
Rumahorbo
(2014)
Analisis Faktor-faktor yang
Mempengaruhi Jumlah Penduduk
Miskin Provinsi Sumatera Utara
Pertumbuhan ekonomi,
pendapatan per kapita,
tingkat pengangguran
terbuka, dan inflasi
18
Tabel 2.1 (Lanjutan)
Peneliti Judul Variabel Prediktor
Cheema dan
Sial (2012)
Poverty, Income Inequality, and
Growth in Pakistan:
A Pooled Regression Analysis.
Gini rasio, Rata-rata
pengeluaran per kapita,
Indeks Pembangunan
Manusia
Iradian
(2005)
Inequality, poverty, and growth:
cross-country evidence.
Gini Rasio, PDRB per
kapita, Belanja pemerintah
Lee (2014) Globalization : Income Inequality
and poverty : Theory and
empirics.
PDB, gini rasio, Trade
(Ekspor + Impor),
Pendidikan
Berdasarkan penelitian sebelumnya yang telah disebutkan, beberapa faktor
yang diduga mempengaruhi persentase kemiskinan dan pengeluaran per kapita
makanan beserta penjelasannya adalah sebagai berikut berdasarkan definisi dari
BPS (2016):
1. Rata-rata lama sekolah menggambarkan jumlah tahun yang digunakan oleh
penduduk usia 15 tahun keatas dalam menjalani pendidikan formal.
2. Tingkat pengangguran terbuka adalah persentase jumlah pengangguran
terhadap jumlah angkatan kerja.
3. PDRB atas dasar harga berlaku yaitu nilai PDRB yang disusun atas dasar harga
berlaku pada periode penyusunan.
4. Angka partisipasi kasar SMA adalah proporsi anak sekolah pada jenjang SMA
terhadap penduduk pada kelompok usia 16-18 tahun dimana sejak tahun 2007
pendidikan non formal (Paket A, Paket B, dan Paket C) turut diperhitungkan.
5. Gini ratio merupakan suatu ukuran kemerataan yang dihitung dengan
membandingkan luas antara diagonal dan kurva lorenz (daerah A) dibagi
dengan luas segitiga di bawah diagonal. Rasio gini digunakan untuk mengukur
derajat ketidakmerataan pendapatan. Rasio Gini bernilai antara 0 dan 1. Nilai
1 menunjukkan complete inequality atau perfectly inequal, koefisien Gini
bernilai 0 menunjukkan adanya pemerataan pendapatan yang sempurna, atau
setiap orang memiliki pendapatan yang sama.
19
BAB 3
METODOLOGI PENELITIAN
3.1 Sumber Data
Penelitian ini menggunakan data sekunder tahun 2015 dari publikasi Badan
Pusat Statistik Provinsi Jawa Timur dengan unit observasi meliputi 38
kabupaten/kota di Provinsi Jawa Timur.
3.2 Variabel Penelitian
Variabel-variabel penelitian yang digunakan pada penelitian ini disajikan
pada Tabel 3.1.
Tabel 3.1 Variabel Penelitian
Variabel Keterangan Variabel Skala Data (1)y
PePersentase kemiskinan Rasio
(2)y Pengeluaran per kapita makanan Rasio
1x Angka partisipasi kasar SMA Rasio
2x Gini ratio Rasio
3x Tingkat Pengangguran Terbuka Rasio
4x Rata-rata lama sekolah Rasio
5x PDRB atas harga berlaku Rasio
Adapun penjelasan dari variabel-variabel dalam penelitian ini adalah
sebagai berikut.
a. Variabel Respon
Variabel respon yang digunakan pada penelitian ini adalah persentase
kemiskinan dan pengeluaran per kapita makanan. Persentase kemiskinan yaitu
persentase penduduk yang berada di bawah garis kemiskinan, sedangkan
pengeluaran per kapita makanan yaitu biaya yang dikeluarkan untuk konsumsi
semua anggota rumah tangga selama sebulan untuk makanan dibagi dengan
banyaknya anggota rumah tangga tersebut.
20
b. Variabel Prediktor
Varibel prediktor yang diduga mempengaruhi persentase kemiskinan dan
indeks kedalaman kemiskinan pada penelitian ini terdapat lima variabel
prediktor. Variabel prediktor tersebut adalah sebagai berikut.
1. Rata-rata lama sekolah menggambarkan jumlah tahun yang digunakan oleh
penduduk usia 15 tahun keatas dalam menjalani pendidikan formal.
2. Tingkat pengangguran terbuka adalah persentase jumlah pengangguran
terhadap jumlah angkatan kerja
3. PDRB atas dasar harga berlaku yaitu nilai PDRB yang disusun atas dasar
harga berlaku pada tahun perhitungan.
4. Angka partisipasi Kasar SMA adalah proporsi anak sekolah pada jenjang
SMA terhadap penduduk pada kelompok usia 16-18 tahun
5. Gini ratio merupakan suatu ukuran kemerataan pendapatan yang dihitung
dengan membandingkan luas antara diagonal dan kurva lorenz (daerah A)
dibagi dengan luas segitiga di bawah diagonal.
3.3 Struktur Data Penelitian
Unit observasi yang digunakan dalam penelitian ini adalah sebanyak 38
kabupaten/kota di Provinsi Jawa Timur dan banyaknya variabel prediktor terdiri
dari lima variabel yang terdiri dari dua komponen parametrik dan tiga komponen
nonparametrik. Sehingga, struktur data penelitian yang digunakan adalah sebagai
berikut.
Tabel 3.2 Struktur Data Penelitian
Kabupaten/ Kota (1)y (2)y 1x 2x 3x 4x 5x
1 (1)1y
(2)
1y 11x 21x 31x 41x 51x
2 (1)2y
(2)
2y 12x 22x 32x 42x 52x
38 (1)38y
(2)
38y 1(38)x 2(38)x 3(38)x 4(38)x 5(38)x
21
3.4 Langkah-Langkah Penelitian
Langkah-langkah untuk menjawab tujuan penelitian dalam penelitian ini
yaitu sebagai berikut :
3.4.1 Kajian Interval Konfidensi untuk Parameter Model Regresi
Semiparametrik Birespon dengan Pendekatan Spline Truncated
1. Diberikan data berpasangan (1) (2)
1 2 1 2( , ,.., , , ,.., , , )l qx x x t t t y y yang mengikuti
model regresi :
1 2( , ,.., ,l 1 2 qx x x t ,t ,..,t ) y f ε
dengan :
(d) (d) (d) (d)1 2, , 1, 2T
ny y y d
(1)
(2)
yy y
y
(1)
1 2
1 2 (2)
1 2
( , ,.., ,( , ,.., ,
( , ,.., ,
l 1 2 q
l 1 2 q
l 1 2 q
x x x t ,t ,..,t )x x x t ,t ,..,t )
x x x t ,t ,..,t )
ff
f,
(d)
1 1 2
(d)
2 1 2(d)
1 2
(d)
1 2
( , ,.., ,
( , ,.., ,( , ,.., , , 1, 2
( , ,.., ,
l 1 2 q
l 1 2 q
l 1 2 q
n l 1 2 q
f x x x t ,t ,..,t )
f x x x t ,t ,..,t )x x x t ,t ,..,t ) d
f x x x t ,t ,..,t )
f
1 (d) (d) (d)1 22
, , 1, 2T
d n d
εε ε
ε
2. Model regresi multivariabel diasumsikan bersifat aditif
1 2
1 1
( , ,.., , ) ( ) ( )ql
i i li 1i 2i qi j ji m mi i
j m
x x x t ,t ,..,t x t
f g η ε
dimana 1
( )l
j ji
j
x
g adalah komponen parametrik dan 1
( )q
m mi
m
t
η adalah
komponen nonparametrik.
3. Komponen parametrik 1
( )l
j ji
j
g x
dapat dihampiri dengan fungsi linier
1
1
l
j ji
j
x
.
22
4. Komponen nonparametrik 1
(t )q
m mi
m
dihampiri menggunakan spline linier
dengan r knot
20 2 2( )1 1
( ) , 1, 2, , n;p r
ph
h mi p k mi k
h k
m mit t Kt i k=1,2,...,r
5. Diberikan model regresi semiparametrik birespon multivariabel dengan
pendekatan spline truncated linier mengikuti persamaan berikut.
y = Cω +ε
dengan C = X Z dan 1 2T
T Tω ω ω
(1) (2) ( )1 1 1 1 10 11 1;T T T Td
l ω ω ω ω
(1) (2)2 2 2T T T
ω ω ω
1 1 1 1 1
( )
2 20 21 2 2( 1) 2( ) 21 2 2( 1) 2( )q q q q
Td
P P P r P P P r ω
X merupakan matriks yang memuat prediktor komponen parametrik dan Z
adalah matriks yang memuat komponen nonparametrik dengan ~ ( , )Nε 0 Σ
6. Mendapatkan estimasi untuk parameter ω menggunakan metode Weighted
Least Square dengan langkah-langkah sebagai berikut:
i. Membentuk fungsi L
( )L T
y - C ω W y - C ω
ii. Meminimumkan persamaan L dengan menyelesaikan persamaan
berikut.
( )0
L
ω
ω
iii. Mendapatkan estimasi dari ω yaitu ω̂ .
7. Mencari distribusi dari ω̂ .
8. Mencari Pivotal Quantity untuk parameter ω̂ .
Misalkan 1 2 ,( , ,.., )1 2 qv l t ,t ,..,tQ x x x
Pivotal Quantity untuk parameter
(1) (2)
1 1
2 2 2q q
m m
m m
v r r,v=1,2,..., l+ q
.
23
9. Menyelesaikan persamaan dalam probabilitas
(1) ( 2 )1 1
1 2 .( , ) 1 , 1, 2,..... 2 2, ,..,q q
m m
m m
v v 1 2 q vl r rP a Q t ,t ,..,t b v l + qx x x
10. Menghitung panjang interval konfidensi 1 yaitu :
,v va b
11. Membentuk fungsi Lagrange :
, , ( , ) ( ) ( ) (1 )v v v v v vG a b a b b a
dimana fungsi kumulatif distribusi dari pivotal quantity, dan konstanta
Lagrange.
12. Melakukan optimasi terhadap fungsi Lagrange dengan menghitung
derivatif parsial:
, ,0
v v
v
G a b
a
, ,0
dv dv
dv
G a b
b
, ,0
dv dvG a b
13. Dari langkah (13) diatas diperoleh interval konfidensi (1 ) 100% untuk
parameter v .
3.4.2 Aplikasi pada Data Persentase Kemiskinan dan Pengeluaran per Kapita
Makanan di Jawa Timur
Tujuan kedua dari tesis ini yaitu mengestimasi model data kemiskinan di
Provinsi Jawa Timur dan mengetahui variabel-variabel yang berpengaruh
menggunakan interval konfidensi parameter model regresi semiparametrik
birespon dengan pendekatan spline truncated. Untuk menjawab tujuan kedua,
dilakukan langkah-langkah sebagai berikut :
1. Menguji korelasi variabel persentase kemiskinan dan pengeluaran per
kapita makanan.
2. Membuat scatter plot antara variabel respon dengan variabel prediktor.
24
3. Menentukan variabel komponen parametrik berdasarkan pola data antara
variabel respon dan prediktor.
4. Menentukan variabel komponen nonparametrik berdasarkan pola data
antara variabel respon dan variabel prediktor.
5. Memodelkan data menggunakan regresi semiparametrik birespon spline
truncated linier, dimana spline yang digunakan adalah satu knot, dua knot,
tiga knot dan kombinasi knot.
6. Memilih titik knot optimal dengan metode GCV.
7. Menghitung MSE dan R2 sebagai bagian dari kriteria kebaikan model.
8. Menghitung interval konfidensi untuk parameter model regresi
semiparametrik birespon dengan pendekatan spline truncated linier.
9. Mengambil kesimpulan dengan menentukan variabel prediktor yang
berpengaruh secara signifikan terhadap variabel respon.
25
BAB 4
PEMBAHASAN
4.1 Kajian Interval Konfidensi untuk Parameter Model Regresi
Semiparametrik Birespon dengan Pendekatan Spline Truncated
Konstruksi interval konfidensi dapat dilakukan dengan beberapa
pendekatan, salah satu pendekatan adalah Pivotal Quantity. Pivotal Quantity
merupakan sebuah statistik yang fungsi distribusinya tidak memuat parameter.
Langkah yang harus dilakukan untuk mendapatkan interval konfidensi untuk
parameter model regresi yaitu mendapatkan estimasi dari parameter dan mencari
distribusi dari parameter. Pengestimasian parameter regresi birespon
semiparametrik dengan pendekatan spline truncated dalam penelitian ini dibahas
dengan menggunakan metode Weighted Least Square.
Diberikan data berpasangan (1) (2)
1 2 1 2( , ,.., , , ,.., , , )l qx x x t t t y y yang mengikuti
model regresi :
1 2( , ,.., ,l 1 2 qx x x t ,t ,..,t ) y f ε (4.1)
dengan :
(d) (d) (d) (d)1 2, , 1, 2T
ny y y d
(1)
(2)
yy y
y
(1)
1 2
1 2 (2)
1 2
( , ,.., ,( , ,.., ,
( , ,.., ,
l 1 2 q
l 1 2 q
l 1 2 q
x x x t ,t ,..,t )x x x t ,t ,..,t )
x x x t ,t ,..,t )
ff
f
(d)
1 1 2
(d)
2 1 2(d)
1 2
(d)
1 2
( , ,.., ,
( , ,.., ,( , ,.., , , 1, 2
( , ,.., ,
l 1 2 q
l 1 2 q
l 1 2 q
n l 1 2 q
f x x x t ,t ,..,t )
f x x x t ,t ,..,t )x x x t ,t ,..,t ) d
f x x x t ,t ,..,t )
f
(1)
( ) (d) (d) (d)
1 2(2), , 1, 2
Td
n d
εε ε
ε.
Model regresi pada persamaan 4.1 diasumsikan bersifat aditif dengan penjabaran
sebagai berikut.
26
1 2
0 0
( , ,.., , ) ( ) ( )ql
i i li 1i 2i qi j ji m mi
j m
x x x t ,t ,..,t x t
f g η (4.2)
dimana 1
( )l
j ji
j
x
g adalah komponen parametrik dengan banyaknya variabel
prediktor sejumlah l dan 1
( )q
m mi
m
t
η adalah komponen nonparametrik dengan
banyaknya variabel prediktor sejumlah q. Kurva komponen parametrik dengan l
variabel prediktor didekati dengan fungsi linier
10 11 1 12 1 1
0
( ) ...l
j ji i i l li
j
x x x x
g ω ω ω ω (4.3)
dengan
(1)
(2)( )
ji
ji
ji
g (x )x
g (x )
g
(1)
1
1 (2)
1
, 0,1, 2,...,j
j
j
j l
ω
dimana , 1,2,...,j j l merupakan parameter komponen parametrik linier. Persamaan
(4.3) dapat dinyatakan dalam bentuk matriks menjadi
1 2 1( , ,..., )lx x x g Xω (4.4)
dengan
(1)
1 2 (2)( , ,..., ) 1 2 ll
1 2 l
(x ,x ,...,x )x x x
(x ,x ,...,x )
gg
g
(d)
1 1 1
(d)
(d) 2 2 2
(d)
ln
, d 1,2
1 2 l
1 2 l
1 2 l
1n 2n
g (x ,x ,...,x )
g (x ,x ,...,x )(x ,x ,...,x )
g (x ,x ,...,x )
g
11 21 1
(1)12 22 2(1) (2)
(2)
1 2 2
1
10,
0
1
l
l
n n l
x x x
x x x
x x x
XX X X
X
27
Kurva komponen nonparametrik dengan q variabel prediktor didekati dengan
fungsi spline truncated linier. ( )mitη merupakan suatu vektor yang terdiri dari fungsi
spline truncated untuk variabel prediktor ke-m pada respon 1 dan respon 2
(d) (d) (d) (d) (d) (d) (d) (d) (d)
20 21 22 1 23 2 2( 1)(t ) t (t ) (t ) ... (t )m m m m mm mi mi mi m mi m r mi rmK K K
(d) (d) (d) (d)
20 21 2( 1)
1
= t (t )m m m
r
mi k mi km
k
K
(4.5)
dengan (d) (d)
(d)
(d)
(t ), t(t )
0 , t
mi km mi km
mi km
mi km
K KK
K
.
Sehingga ( )
1
( )q
d
m mi
m
t
dapat dituliskan kembali sebagai berikut.
( ) (d) (d) (d)
21 2( 1)
1 1 1 1
( ) t (t )d
m m
rq q qd
m mi mi k mi km
m m m k
t K
(4.6)
Persamaan (4.6) dapat dituliskan dalam notasi matriks pada persamaan (4.7).
( ) ( ) ( )( )
d d dη t Z ω (4.7)
Persamaan (4.7) merupakan fungsi regresi nonparametik yang didekati dengan
spline truncated linier untuk variabel respon ke-d, penulisan untuk fungsi regresi
birespon dapat dituliskan dalam persamaan (4.8).
2( )t η Zω (4.8)
dengan
(1) (2)( ) ( ) ( )T
η t η t η t ,
(d)
1 1 1
(d)
2 2 2(d)
(d)
, d 1,2
1 2 q
1 2 q
1n tn qn
(t ,t ,...,t )
(t ,t ,...,t )( )
(t ,t ,...,t )
η t
(1)
(2)
0,
0
Z
ZZ
28
1 1 111 11 11
(d) 2 2 112 12 12
1 1 1 1
(d) (d)(d) (d)111 1(d) (d)(d) (d)111 1
(d) (d) (d) (d)11 1 1
(t ) (t )(t ) (t )
(t ) (t )(t ) (t )
(t ) (t ) (t ) (t )
q q q
q q q
n n n qn qn q
tt q qrr
tt q qrr
t tr q qr
K KK K
K KK K
K K K K
Z
(1) (2)2 2T
ω ωω
1 1 2 21 2( )2 21 22 21 22 21 222( 1) 2( 1) 2( 1) q q qdT
r r r ω
Pada persamaan (4.3) dan (4.6), masing-masing telah diberikan fungsi regresi
untuk komponen parametrik dan fungsi regresi dengan pendekatan spline truncated
untuk komponen nonparametrik, kedua persamaan tersebut ditulis kembali dengan
berdasarkan persamaan (4.2) dan (4.1) pada persamaan (4.9) berikut.
1
2
(1) (1) (1) (1) (1) (1) (1) (1)
10 0 11 1 1 21 2( 1)
1 1 1
(2) (2) (2) (2) (2) (2) (2) (2)
10 0 11 1 1 21 2( 1)
1 1 1
... t (t )
... t (t )
m m
m m
rq q
i i i l li mi k mi km i
m m k
rq q
i i i l li mi k mi km i
m m k
y x x x K
y x x x K
(4.9)
untuk setiap pengamatan ke-i, i=1,2,...,n. (1)
iy merupakan variabel respon
pengamatan ke-i pada respon pertama, sedangkan (2)
iy merupakan variabel respon
pengamatan ke-i pada respon ke dua . Persamaan (4.9) dapat ditulis kembali dalam
notasi matriks menjadi:
1 2 y Xω Zω ε (4.10)
Karena adanya syarat terpenuhinya korelasi antara variabel respon satu dengan dua,
maka dibutuhkan matriks pembobot variansi kovariansi dalam mengestimasi
regresi semiparametrik birespon berdasarkan estimator spline truncated dengan
meminimumkan kriteria Weighted Least Square (WLS) yaitu dengan
meminimumkan fungsi berikut:
1 2 1 2L T
Xω Zω Xωy W y Zω= (4.11)
dengan memisalkan 1* y y Xω dengan mengasumsikan 1ω diketahui maka
persamaan (4.11) dapat ditulis kembali pada persamaan (4.12) berikut.
29
2 2* *L T
ω W yZy Zω= (4.12)
Persamaan (4.12) dapat diuraikan sebagai berikut.
2 2
*
*
2
L
T
T T
T
T T T T
2 2 2 2
T T T T
2 2 2
= y W y
y * Wy *-y * W y
Zω Zω
Zω - ω Z W ω Z WZω
ω Z W
* +
y * Wy * ω+ Z* WZωy
(4.13)
Nilai 2ω̂ dapat diperoleh dengan meminimumkan persamaan (4.13). Syarat
perlu agar persamaan (4.13) mencapai minimum adalah dengan memenuhi
2
0L
ω
, sehingga diperoleh :
2
2
2
1
2
*
*
2 0
0
ˆ
L
T
T
T
T
T
T
T
T
Wy * 2Zω
Wy *
Wy
Z Z Wy
- Z WZω
- Z Z WZω
Z WZω Z
ω WZ
(4.14)
Berdasarkan persamaan (4.10) dan (4.14) dengan memisalkan 1* y y Xω maka
didapatkan nilai dugaan dari *y yaitu ˆ *y dinyatakan pada persamaan (4.15).
2ˆ* *y A y (4.15)
dengan 2A merupakan matriks hat untuk komponen nonparametrik yaitu
1
2
TTA Z WZ ZWZ .
Mengacu pada persamaan (4.11), nilai dugaan untuk 1ω didapat dengan
pendiferensialan fungsi L dengan menggunakan metode WLS dengan penguraian
fungsi L sebagai berikut.
30
1 2 1 2
2 2 2
1 2 1 1 2
2
2 2 2 2
2 21 1 2 2
2
1
( ) ( )
T
T T T
T T T
T T
T
T
T
L
1
T
1
T
T
1
1
= y W y
y y W y y
(I - A )y - (I - A ) W (I - A )y - (I - A )
y (I - A ) W(I - A )y y (I - A
Xω Zω Xω Zω
Xω
) W(I - A )
(I - A ) W(I - A )y (I - A ) W(I - A )
Xω Xω Xω
Xω Xω
Xω
ω
y (I - A
X ω
W
X
(
X
)
ω
A A
12 2 2
21 2
2
T T
T T
T
T
1
I - A )y (I - A ) W(I - A )y
(I - A ) W(
ω X
I - Aω )X Xω
(4.16)
Selanjutnya, Syarat perlu agar persamaan (4.16) mencapai minimum adalah
dengan memenuhi 1
0L
ω
, sehingga diperoleh :
2 2 2 2
2 2 2 2
2 2 2 2
1
2 0
0
2
T T
T T
T T
T
T T
TTT
L
1
1
1
(I - A ) W(I - A )y (I - A ) W(I - A )
(I - A ) W(I - A )y (I - A ) W(I - A )
(
X X Xωω
X
I - A ) W(I - A ) (
X Xω
X Xω I - A ) W(I - AX )y
2 2 21
2ˆ T TT T
1 (I - A ) W(I - A ) (I - A ) W(I -X X X Aω )y (4.17)
Setelah mendapatkan nilai dugaan dari parameter 1ω dan 2ω , selanjutnya
didapatkan persamaan untuk menghitung ŷ dengan mensubtitusikan nilai 1ω̂ dan
2ω̂ sebagai berikut.
1
1
2 2 2 2
2
1 2
1
1
2 2 2
*
ˆ ˆ ˆ
T T
T
T T
T T T
T T
T T
T
T
Z Z W y
Z Z W
Xω Zy
(I - A ) W(I - A ) (I - A ) W(I - A )y Z WZ
(I - A ) W(I - A ) (I - A ) W(
ω
X X X X
X X X X I - A )y Z WZ
21
2 2 2
T T T T
X X Xy X (I - A ) W(I - A ) (I - A ) W(I - A )y (4.18)
Misalkan 21
1 2 2 2
T TT T
(I - A ) W(I - A )A X X (I - A ) WX (I - AX ) merupakan
matriks hat untuk komponen parametrik, sehingga persamaan (4.18) dapat ditulis
kembali pada persamaan (4.19).
31
=
ˆ
I
I
I
-1T T
-1T T
-1T T
T
1 1
1 1
1 1
1 1
T
T
2
Z Z W
Z Z W
Z Z W
A Ay y + Z WZ y - y
y + Z WZ - y
Z WZ -
A A
A
A
A
A - A
y
y
(4.19)
Jika I 1 12A A -A A , maka persamaan (4.19) dapat ditulis dalam bentuk lain
berikut.
ˆ y Ay (4.20)
dengan A merupakan matriks hat gabungan antara komponen parametrik dan
nonparametrik atau dapat disebut matriks hat semiparametrik.
Untuk memudahkan konstruksi interval konfidensi untuk parameter regresi
birespon semiparametrik, persamaan (4.10) dapat disederhanakan pada persamaan
(4.21) berikut.
y Cω ε (4.21)
dengan X ZC dan 1 2T
T T ω ωω .
Teorema 7.
Jika diberikan ( , )f x,t ω Cω merupakan fungsi dari x, t , dan ω dimana
( , )f x,t ω merupakan fungsi regresi semiparametrik birespon, maka
1
ˆ
TT
C Wyω C WC merupakan penduga dari ω .
Bukti.
Nilai ω̂ didapatkan dengan metode WLS yaitu sebagai berikut.
2
T T T T
T TT T
T
T
T
L
Tω ω
ω C ω
= y C W y C
y ω C ω
ω C
Wy Wy y WC WC
y Wy W ω Cy WCω
dengan menderivatifkan 0L
ω, didapat:
32
1
2
ˆ
2
0
T T
T T
T T
T T
L
C C ωω
C C ω
C ω C
ω
Wy WC
Wy WC
WC Wy
WCC C Wy
sehingga
1
ˆ
TT C Wyω C WC (4.22)
Lemma 1.
Jika 2 1
~ ( , )N
ε 0 W , sehingga 2 1
~ ( , )N
Cωy W , maka 2 1ˆ ~ ( , )( )N Tω ω C WC .
Bukti :
Model pada persamaan (4.21) dengan asumsi 2 1
~ ( , )N
ε 0 W maka
2 1~ ( , )N
Cωy W , oleh karena y berdistribusi normal, maka persamaan (4.22)
yang merupakan kombinasi linier dari y juga berdistribusi normal dengan nilai
harapan dan variansinya dicari berikut.
1
1
1
= ( )
ˆ
=
E
E
E
T
T
T
T
T
T
C Wy
C W y
C W
ω C WC
C WC
C WC Cω
ω
(4.23)
1
1 1
1 12 1
1 12
12
( )
ˆ
T
T
Var
Var
I
Var
T
T T
T T
T
T
T T
T T
T T
T
C Wy
C W y C W
C W W C W
C
ω C WC
C WC C WC
C WC C WC
C WC WC C WC
C WC
(4.24)
33
Dengan memperhatikan persamaan (4.23) dan (4.24), maka ˆ ~ ( , )Nω ω Σ , dengan
1
2
TΣ C WC . Selanjutnya, akan dirancang interval konfidensi (1 ) 100%x
untuk v , (1) (2)
1 1
1, 2,..., (2 2 2 )q q
m m
m m
v l q r r
untuk kasus variansi error (
2 1 W ) diketahui dan variansi error ( 2 1 W ) tidak diketahui.
4.1.1 Interval Konfidensi Saat Asumsi Variansi Error ( 2 1 W ) Diketahui
Pada subbab ini dibahas mengenai konstruksi interval konfidensi terpendek
(1 ) 100%x untuk v , (1) (2)
1 1
1, 2,..., (2 2 2 )q q
m m
m m
v l q r r
untuk kasus
variansi error ( 2 1 W ) diketahui.
Teorema 8.
Jika 1 2 1 2
ˆ( , , ..., , t , t , ..., t )
v v
v l l
vv
Z x x x
ω ω
merupakan suatu pivotal quantity dengan
asumsi variansi eror diketahui , maka interval konfidensi untuk v
ω diberikan oleh:
/2 /2ˆ ˆ( ) 1
v vv v v vvP Z Z
ω ω ω .
Bukti:
Diambil sebuah transformasi yang merupakan pivotal quantity dengan
asumsi variansi eror diketahui:
1 2 1 2
ˆ( , ,..., , t , t ,..., t ) v vv l l
vv
Z x x x
ω ω (4.25)
dengan vv merupakan elemen diagonal ke-v dari Σ . Variabel random Z ~ (0,1)v N
karena merupakan kombinasi linier dari ˆ vω dengan pembuktian nilai ekspektasi
dan variansinya sebagai berikut.
ˆ
1ˆ
0
E Z E
E E
v vv
vv
v v
vv
ω ω
ω ω
34
2
ˆ
1ˆ
1 0
1
Z v vvvv
v v
vv
vv
vv
Var Var
Var Var
ω ω
ω ω
Karena Σ diketahui maka Zv merupakan pivotal quantity untuk parameter regresi
ˆ .vω Interval konfidensi (1 ) dapat diperoleh dengan menyelesaikan persamaan
dalam probabilitas
1 2 1 2 l( ( , ,..., , t , t ,..., t ) ) 1v v l vP a Z x x x b
dengan va dan vb merupakan elemen bilangan riil, v va b . Apabila persamaan
(4.25) disubstitusi pada persamaan (4.26), maka bentuknya menjadi
ˆ( ) 1v vv v
vv
P a b
ω ω (4.26)
Persamaan (4.26) jika ditulis kembali akan didapatkan interval konfidensi untuk
parameter model regresi birespon semiparametrik berikut:
ˆ ˆ( ) 1v v vv v v v vvP b a ω ω ω (4.27)
Konsep yang digunakan pada penelitian ini yaitu interval konfidensi terpendek
sehingga nilai va dan vb harus ditentukan dan memenuhi kondisi dimana panjang
interval konfidensi ( ( , )v va b ) terpendek didapatkan. Interval konfidensi terpendek
didapat dengan menyelesaikan optimasi bersyarat berikut dengan metode lagrange
, ,{ ( )} {( ) }
v v v v vv
v v v va b R a b Ra ,b a bMin Min
(4.28)
dengan syarat
( ) 1v
v
b
v va
z dz atau ( ) ( ) (1 ) 0v vb a
merupakan fungsi probabilitas (0,1)N dan merupakan fungsi probabilitas
kumulatif (0,1)N . Langkah selanjutnya untuk mendapatkan nilai va dan vb maka
35
dilakukan derivatif parsial terhadap fungsi Langrange yang dibentuk pada
persamaan (4.29)
( , , ) ( ) ( ( ) ( ) (1 ))v v v v vv v vF a b b a b a (4.29)
dengan merupakan konstanta lagrange. Berikut adalah derivatif parsial fungsi
lagrange pada persamaan (4.29) terhadap masing-masing , ,v va b dan .
( , , )
'( ) 0v v vv vv
F a ba
a
(4.30)
( , , )
'( ) 0v v vv vv
F a bb
b
(4.31)
( , , )( ) ( ) (1 ) 0v v v v
v
F a bb a
b
(4.32)
Berdasarkan persamaan (4.30) dan (4.31) diperoleh
'( ) 0
'( ) 0
'( ) '( ) 0
'( ) '( ) 0
( ) ( )
vv v
vv v
v v
v v
v v
a
b
b a
b a
b a
(4.32)
Penyelesaian persamaan (4.32) adalah v vb a atau v vb a , tetapi penyelesaian
yang memenuhi kondisi distribusi normal standar yaitu v vb a sehingga jika
penyelesaian tersebut disubstitusikan pada persamaan (4.27) maka persamaan
tersebut dapat ditulis kembali menjadi
ˆ ˆ( ) 1v v vv v v v vvP b b ω ω ω (4.33)
dimana vb diperoleh dari ( )2v
v vb
z dz
atau dalam aplikasi sering ditulis dengan
2
Z yang nilainya dapat dilihat dalam tabel distribusi normal standar sehingga
persamaan (4.33) dapat ditulis kembali pada persamaan (4.34).
/2 /2ˆ ˆ( ) 1v vv v v vvP Z Z ω ω ω (4.34)
36
4.1.2 Interval Konfidensi Saat Asumsi Variansi Error ( 2 1 W ) Tidak
Diketahui
Pada subbab ini dibahas mengenai konstruksi interval konfidensi terpendek
(1 ) 100%x untuk v , (1) (2)
1 1
1, 2,..., (2 2 )q q
m m
m m
v l q r r
untuk kasus variansi
error ( 2 1 W ) tidak diketahui.
Teorema 9.
Jika 1 2 1 2
2
ˆ( , ,..., , t , t ,..., t ) v vv l l
vv
T x x xr
ω ω merupakan suatu pivotal quantity dengan
asumsi variansi eror ( 2 1 W ) tidak diketahui, maka interval konfidensi untuk vω
adalah:
1 1
, ,2 2
ˆ ˆ( ) 1
T T
vv vvv v vc cc c
r rP t t
T TT Ty C W y y CI - C I - C W yC WC C WC
ω ω ω
dengan (1) (2)
1 1
2 2 2 2q q
m m
m m
c n l q r r
.
Bukti:
Pivotal quantity dengan asumsi 2 1 W tidak diketahui didapatkan pada
persamaan (4.36).
1 2 1 22
ˆ( , ,..., , t , t ,..., t ) v vv l l
vv
T x x xr
ω ω (4.36)
di mana vvr merupakan elemen diagonal ke v dari matriks 1
TC WC . Variabel
random ( )~ aB
T tA
a
, jika dan hanya jika memenuhi tiga syarat yaitu ~ (0,1)B N
, ( )A ~ a , dan A dan B independen. Persamaan (4.36) agar menyerupai bentuk
BT
A
a
dapat diubah menjadi persamaan (4.37) berikut.
37
1 2 1 22
2
1ˆ
( , ,..., , t , t ,..., t )1
ˆ
vvv vv l l
vvvv
v v
vv
rT x x x x
rr
r
ω ω
ω ω (4.37)
Karena 2 tidak diketahui, maka nilai 2 didekati dengan MSE.
1 1
(1) (2)
1 1
(1) (2)
1 1
(1) (2)
1 1
2 2 2 2
ˆ ˆ
2 2 2 2
ˆ ˆ
2 2 2 2
q q
m m
m m
q q
m m
m m
q q
m m
m m
n l q r r
MSE
n l q r r
n l q r r
T TT
T
T
T
Ty - C C Wy C yy C W-
(y - y
C WC C WC
) (y - y)
(y - Cω) (y - Cω)
1
(
1
1
1) (2)
1 1
(1) (2)
1 1
1
2 2 2 2
2 2 2 2
q q
m m
m m
T
q q
m m
m
T
m
n l q r r
n l q r r
T T
T
T
T
T T
T T
C W y C W y
y C W
I - C I -
C W y
C
I - C I - C
C WC C WC
C WC C WC
(4.38)
Matriks T T T
y A Ay y Ay jika A merupakan matriks idempoten, matriks A pada
persamaan (4.38) yaitu 1
TT CA C WI - C WC . Berikut adalah pembuktian
matriks A merupakan matriks idempoten sesuai dengan Teorema 2 :
1 1
1 1 1
1 1
2
2
T T
T T T
T T
T T
T T T
T T
AA I C I C
I C C C
I C
C W C W
C W C W C W
C W C WCI
C WC C WC
C WC C WC C WC
C WC C WC
`
1
TT C WI C C WC (4.39)
38
Matriks A terbukti merupakan matriks idempoten sehingga persamaan (4.38) dapat
ditulis kembali pada persamaan (4.40).
(1) (2
1 1
1
)2 2 2 2
q q
m m
m m
T
n l q r r
MSE
TTyI Cy C- WC WC
(4.40)
Mengacu pada persamaan (4.37) dan (4.40), maka pivotal quantity untuk parameter
ˆvω adalah sebagai berikut:
(1) (2)
1
1
1
1 2 1 2
2 2 2 2
ˆ
( , ,..., , t , t ,..., t )T
q q
m m
m m
v v
vv
v l l
n l q r r
rT x x x
TTI - Cy C W yC WC
ω ω
2
1
2
(1) (2)
1 1
ˆ
2 2 2 2
T
v v
vv
q q
m m
m m
r
n l q r r
TTI - Cy C W yC WC
ω ω
(4.41)
Selanjutnya, akan dibuktikan bahwa 1 2 1 2 ( )( , ,..., , t , t ,..., t ) ~v l l aT x x x t dengan
derajat bebas (1) (2)
1 1
2 2 2 2q q
m m
m m
n l q r r
.
1. Misalkan 2
ˆv v
vv
Zr
ω ω, karena Z merupakan kombinasi linier dari ˆ vω , maka Z
berdistribusi normal dengan mean ( )E Z dan Var( )Z :
2
2
2
ˆ( )
1ˆ
1
0
v v
vv
v v
vv
v v
vv
E Z Er
Er
r
ω ω
ω ω
ω ω
39
2
2
2
2
ˆ( )
1ˆ
1
v v
vv
v v
vv
vv
vv
Var Z Varr
Varr
r
r
ω ω
ω ω
Sehingga terbukti bahwa Z ~ (0,1)N .
2. Jika 2 1~ ( , )N y Cω W , sesuai dengan Teorema 5, maka
2
2
12,2
~h
T
T
Cω ACω
y Ayjika dan hanya jika A idempoten dengan h adalah rank
dari A. Pembuktian bahwa A idempoten telah dibuktikan pada persamaan
(4.39). Selanjutnya, dicari rank dari A.
(1) ( 2)
1 1
2
2
1
1
1
1
2 2
( )
( )
2
2
q q
m m
m m
n
l q r r
rank rank
trace
trace trace
n trace
n trace I
T
T
T
T
T
T
T
T
A I - C C W
C W
C
I - C
I C W
C CW
C WC
C WC
C WC
C WC
(1) (2)
1 1
2 2 2 2q q
m m
m m
n l q r r
Setelah mendapatkan rank dari A, akan dihitung 2
1( )
2
T
Cω ACω
1
1
2 2
2
2
1 1( ) ( )
2 2
1
2
1
2
0
T T
T T T T
T T T T
T
T
T
T
Cω ACω Cω I - C Cω
ω C
C
Cω ω C C Cω
ω C C
W
C W
ω ω C CIω
C WC
C WC
40
Sehingga (1) ( 2)
2 2 2 2
1 1
~q q
n l q r rm mm m
Ty Ay .
3. Jika 2~ ( , )N y Cω W maka By dan
Ty Ay independen sesuai dengan Teorema 6
jika dan hanya jika 0BA , dengan 1
ˆ
TT C Wy Byω C WC sehingga
1
TTB C WC WC
1 1
1 1 1
1 1
0
T T
T T T
T T
T T
T T T
T T
C W C W
C W C W C W
B
C W C W
A I - C
C
C WC C WC
C WC C WC C WC
C WC C WC
Berdasarkan uraian tersebut pada poin 1, 2, dan 3 dapat ditarik kesimpulan bahwa
(1) ( 2)
1 1
(2n 2 2 2 )
~ q qm m
m m
vl q r r
T t
dan merupakan pivotal quantity untuk parameter model
regresi ω̂ saat 2σ W tidak diketahui. Interval konfidensi (1 ) dapat diperoleh
dengan menyelesaikan persamaan dalam probabilitas
1 2 1 2 l( ( , ,..., , t , t ,..., t ) ) 1v v l vP a T x x x b
dengan va dan vb merupakan elemen bilangan riil, v va b . Apabila persamaan
(4.41) disubstitusi pada persamaan (4.42) maka interval konfidensi dapat ditulis
sebagai berikut.
1
(1) (2)
1 1
ˆ( ) 1
2 2 2 2
T
v vv v
vvq q
m m
m m
P a b
r
n l q r r
TTI - Cy C W y
ω
WC
ω
C
(4.42)
Persamaan (4.42) jika ditulis kembali akan didapatkan interval konfidensi untuk
parameter model regresi birespon semiparametrik berikut:
41
1
1
(1) (2)
1 1
(1) (2)
1 1
ˆ(
2 2 2 2
ˆ ) 1
2 2 2 2
T
T
v v vv vq q
m m
m m
v v vvq q
m m
m m
P b r
n l q r r
a r
n l q r r
T
T
T
T
I -y C W y
y C W y
C
I - C
C WC
C WC
ω ω
ω
(4.43)
Konsep yang digunakan pada penelitian ini yaitu interval konfidensi terpendek
sehingga nilai va dan vb harus ditentukan dan memenuhi kondisi dimana panjang
interval konfidensi ( ( , )v va b ) terpendek didapatkan. Interval konfidensi terpendek
didapat dengan menyelesaikan optimasi bersyarat berikut dengan metode lagrange
1
(1) (2)
1 1
, ,{ ( )} ( )
2 2 2 2
v v v v
v v v
T
v
vvq q
m m
m m
a b R a b Ra ,b a b r
n l q r r
Min Min
TTI - CCy W yC WC
(4.44)
dengan syarat
(t ) 1v
v
b
v va
dt atau ( ) ( )