-
HALAMAN JUDUL
TESIS – SS14 2501
INTERVAL KONFIDENSI UNTUK PARAMETER MODEL REGRESI SEMIPARAMETRIK
BIRESPON DENGAN PENDEKATAN SPLINE TRUNCATED (Aplikasi Pada Data
Kemiskinan dan Pengeluaran Per Kapita Makanan Provinsi Jawa
Timur)
ZAHROTUL AZIZAH NRP. 06211650010016
DOSEN PEMBIMBING Prof. Dr. Drs. I Nyoman Budiantara, M.Si Dr.
Ismaini Zain, M.Si
PROGRAM MAGISTER DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA,
KOMPUTASI DAN SAINS DATA INSTITUT TEKNOLOGI SEPULUH NOPEMBER
SURABAYA 2018
-
HALAMAN JUDUL
TESIS – SS14 2501
CONFIDENCE INTERVAL FOR PARAMETER OF BIRESPONSE SEMIPARAMETRIC
REGRESSION MODEL BASED ON SPLINE TRUNCATED APPROACH (Applied on
Percentage of Poverty and Food Expenditure per Capita Data in East
Java Province)
ZAHROTUL AZIZAH NRP. 06211650010016
SUPERVISOR Prof. Dr. Drs. I Nyoman Budiantara, M.Si Dr. Ismaini
Zain, M.Si
MAGISTER PROGRAM STATISTICS DEPARTMENT FACULTY OF MATHEMATICS,
COMPUTATION, DAN DATA SCIENCE INSTITUT TEKNOLOGI SEPULUH NOPEMBER
SURABAYA 2018
-
v
INTERVAL KONFIDENSI UNTUK PARAMETER MODEL REGRESI
SEMIPARAMETRIK BIRESPON DENGAN PENDEKATAN SPLINE
TRUNCATED
(APLIKASI PADA DATA KEMISKINAN DAN PENGELUARAN PER
KAPITA MAKANAN PROVINSI JAWA TIMUR)
Nama Mahasiswa : Zahrotul Azizah
NRP : 06211650010016
Pembimbing 1 : Prof. Dr. I Nyoman Budiantara, M.Si
Pembimbing 2 : Dr. Ismaini Zain, M.Si
ABSTRAK
Interval konfidensi merupakan salah satu permasalahan penting di
dalam
statistika inferensi pada regresi, namun pada interval
konfidensi untuk regresi
semiparametrik belum banyak dilakukan. Beberapa penelitian
sebelumnya yang
membahas mengenai interval konfidensi parameter model regresi
menggunakan
pendekatan bayesian, sedangkan pada penelitian ini konstruksi
interval konfidensi
dilakukan dengan metode pivotal quantity, karena dinilai lebih
mudah karena tidak
melibatkan distribusi prior. Pendekatan dalam regresi
semiparametrik yang
digunakan pada penelitian ini yaitu spline truncated. Pada kasus
nyata, jika
ditemukan adanya dua variabel respon yang saling berkorelasi,
maka dalam
memodelkan dengan menggunakan regresi dianalisis dengan model
regresi
birespon. Selanjutnya, interval konfidensi untuk parameter model
regresi birespon
semiparametrik dengan pendekatan spline truncated diaplikasikan
pada data
kemiskinan dan pengeluaran per kapita makanan Jawa Timur.
Berdasarkan hasil
penelitian dengan tingkat signifikansi sebesar 0,05 diperoleh
bahwa persentase
kemiskinan dipengaruhi oleh rata-rata lama sekolah, gini ratio,
angka partisipasi
sekolah, tingkat pengangguran terbuka, dan PDRB atas harga
berlaku, sedangkan
pengeluaran per kapita makanan dipengaruhi oleh rata-rata lama
sekolah dan PDRB
atas dasar harga berlaku. Model diperoleh dengan GCV minimum
sebesar 4,189,
MSE sebesar 2,698 dan nilai 𝑅2 sebesar 91,05 %.
Kata kunci : Regresi Semiparametrik Birespon Spline Truncated,
Interval
Konfidensi untuk Parameter Regresi, Persentase Kemiskinan,
Pengeluaran per
Kapita Makanan.
-
vi
Halaman ini sengaja dikosongkan.
-
vii
CONFIDENCE INTERVAL FOR PARAMETER OF BIRESPONSE
SEMIPARAMETRIC REGRESSION MODEL BASED ON SPLINE
TRUNCATED APPROACH
(APPLIED ON PERCENTAGE OF POVERTY AND FOOD
EXPENDITURE PER CAPITA DATA IN EAST JAVA PROVINCE)
Name of Student : Zahrotul Azizah
NRP : 06211650010016
Supervisor : Prof. Dr. I Nyoman Budiantara, M.Si
Co-Supervisor : Dr. Ismaini Zain, M.Si
ABSTRACT
Confidence interval is one of the important problems in
inference statistics
of regression, but the confidence interval for semiparametric
regression has not
been widely performed. Some previous studies that discussed the
confidence
interval of regression model parameters using bayesian approach,
whereas in this
research confidence interval construction is done by pivotal
quantity method, it is
considered easier because it doesn’t involve prior distribution.
The approach in
semiparametric regression used in this study is spline
truncated. In the real case, if
there is found the existence of two correlation response
variables, then in modeling
used regression method is analyzed by biresponses regression
model. Subsequently,
the confidence interval for parameters of semiparametric
biresponses regression
model with the spline truncated approach was applied to poverty
percentage data
and per capita food expenditure in East Java. Based on the
result of the research
with significance level of 0,05, it is found that the percentage
of poverty is
influenced by the average of school duration, gini ratio, school
participation rate,
open unemployment rate, and GRDP (Gross Regional Domestic
Product) over
current price, while per capita food expenditure is influenced
by the average of
school duration and GRDP at current price. The model was
obtained with minimum
GCV of 4.189, MSE of 2,698 and R2 of 91.05%.
Keywords: Spline Truncated Semiparametric Biresponses
Regression, Confidence
Interval for Parameters of Regression, Percentage of Poverty,
Per Capita Food
Expenditure.
-
viii
-Halaman ini sengaja dikosongkan-
-
ix
KATA PENGANTAR
Puji syukur penulis ucapkan kepada Allah SWT atas rahmat dan
kasihNya,
penulis dapat menyelesaikan penulisan Tesis dengan judul
“Interval Konfidensi
untuk Parameter Model Regresi Semiparametrik Birespon dengan
Pendekatan Spline Truncated (Aplikasi pada Data Persentase
Kemiskinan
dan Pengeluaran Per Kapita Makanan)” ini dengan baik. Tesis ini
disusun untuk
memenuhi salah satu syarat memperoleh gelar Magister Sains
(M.Si) di Jurusan
Statistika, Fakultas Matematika, Komputasi, dan Sains Data,
Institut Teknologi
Sepuluh Nopember Surabaya.
Terselesaikannya Tesis ini tidak lepas dari dukungan berbagai
pihak yang
telah memberikan bantuan kepada penulis. Oleh karena itu, pada
kesempatan ini
penulis ingin menyampaikan terima kasih kepada:
1. Orang tua penulis, Bapak Masyhudi dan Ibu Mufarokah dan adik
penulis,
Ulyatur Rosyidah dan Alifatul Mujahadah yang selalu
menyemangati, memberi
motivasi, kasih sayang serta dukungan kepada penulis,
2. Prof. Dr. Drs. I Nyoman Budiantara, M.Si. dan Dr. Ismaini
Zain, M.Si, selaku
dosen pembimbing dalam penyusunan Tesis ini, yang telah banyak
memberikan
ilmu, saran, dan penuh kesabaran serta bersedia meluangkan waktu
untuk
membimbing penulis selama ini,
3. Dr. Vita Ratnasari, M.Si dan Dr. Sutikno, M.Si, selaku dosen
penguji, yang
telah banyak memberikan masukan guna kesempurnaan Tesis ini,
4. Dr. Suhartono selaku Ketua Jurusan Statistika dan Dr.rer.pol.
Heri Kuswanto,
M.Si., selaku Ketua Program Pascasarjana Jurusan Statistika,
yang telah
memberikan waktu untuk mendukung terselesainya Tesis ini,
5. Dr. Setyawan, M.Si, selaku dosen wali penulis yang telah
memberikan
dukungan moril dan arahan selama penulis menempuh studi,
6. Bapak dan Ibu dosen Jurusan Statistika, Fakultas Matematika,
Komputasi, dan
Sains Data, Institut Teknologi Sepuluh Nopember, yang telah
mendidik dan
membekali penulis dengan berbagai ilmu pengetahuan selama
masa
perkuliahan, serta seluruh staf administrasi akademik,
laboratorium, dan ruang
-
x
baca Statistika yang telah memberikan pelayanan dan fasilitas
selama
perkuliahan,
7. Rekan-rekan pengerjaan Tesis nonparametrik, Imraatil Husni,
Alvita R.D.,
Suprapto, Khaerul Umam, Rafael T., dan Fendi A. yang telah
berjuang dan
belajar bersama selama pengerjaan Tesis,
8. Dr. Nur Chamidah, M.Si dan Eko Tjahjono, M.Si selaku dosen
pembimbing
skripsi penulis dan dosen-dosen S-1 Statistika Unair yang telah
memotivasi
penulis untuk melanjutkan studi master,
9. Silvyah rahmi, Jauhara Rana B., dan Bahagiati M. yang telah
menjadi keluarga
kedua penulis selama menempuh studi master di Institut Teknologi
Sepuluh
Nopember,
10. Bagus Aji S., Umi Tri Ruhana, Della Destylawati, Lussi
Agustin, Bayyinah,
Fitriana Dz., dan Aulia Dwi R. yang senantiasa memberi semangat
kepada
penulis selama perkuliahan dan pengerjaan Tesis,
11. Rekan seperjuangan Magister Statistika angkatan 2016, terima
kasih atas
kerjasama, saran, dan kebersamaannya,
12. Semua pihak yang tidak dapat disebutkan satu persatu, yang
telah membantu
dan menyumbangkan pikiran guna terselesaikan Tesis ini.
Penulis menyadari bahwa dalam tulisan Tesis ini masih banyak
kekurangan,
sehingga kritik dan saran yang bersifat membangun dari berbagai
pihak sangat
diharapkan demi penulisan yang lebih baik lagi di masa yang akan
datang. Semoga
tulisan ini memberikan manfaat bagi semua dan bermanfaat untuk
pengembangan
ilmu pengetahuan khususnya di bidang Statistika.
Surabaya, Januari 2018
Penulis
-
xi
DAFTAR ISI
HALAMAN JUDUL
......................................................................................
i
HALAMAN PENGESAHAN
........................................................................
iii
ABSTRAK
......................................................................................................
v
ABSTRACT
....................................................................................................
vii
KATA PENGANTAR
....................................................................................
ix
DAFTAR ISI
...................................................................................................
xi
DAFTAR TABEL
..........................................................................................
xiii
DAFTAR GAMBAR
......................................................................................
xv
BAB 1 PENDAHULUAN
..............................................................................
1
1.1 Latar Belakang
.....................................................................................
1
1.2 Rumusan Masalah
................................................................................
4
1.3 Tujuan Penelitian
.................................................................................
4
1.4 Manfaat Penelitian
...............................................................................
5
1.5 Batasan
Masalah...................................................................................
5
BAB 2 TINJAUAN PUSTAKA
.....................................................................
7
2.1 Analisis Regresi
...................................................................................
7
2.2 Spline Truncated
..................................................................................
8
2.2.1 Spline Truncated dalam Regresi Nonparametrik
....................... 8
2.2.2 Spline Truncated dalam Regresi Semiparametrik
..................... 9
2.3 Regresi Semiparametrik Birespon Spline Truncated
........................... 9
2.4 Pemilihan Titik Knot Optimal
..............................................................
12
2.5 Interval Konfidensi Parameter Regresi
................................................ 12
2.6 Weighted Least Square
........................................................................
14
2.7 Aljabar Matriks
....................................................................................
15
2.8 Persentase Kemiskinan, Pengeluaran Per Kapita Makanan, dan
Faktor
yang diduga Berpengaruh
....................................................................
16
BAB 3 METODOLOGI PENELITIAN
....................................................... 19
3.1 Sumber Data
.........................................................................................
19
3.2 Variabel Penelitian
...............................................................................
19
-
xii
3.3 Struktur Data
Penelitian........................................................................
20
3.4 Tahapan Penelitian
...............................................................................
21
BAB 4 HASIL DAN PEMBAHASAN
4.1 Kajian Interval Konfidensi untuk Parameter Model Regresi
Semiparametrik Birespon dengan Pendekatan Spline
Truncated........ 25
4.1.1 Interval Konfidensi saat Variansi Eror Diketahui
....................... 33
4.1.2 Interval Konfidensi saat Variansi Eror Tidak Diketahui
............. 36
4.2 Aplikasi pada Data Persentase Kemiskinan dan Pengeluaran per
Kapita
Makanan di Provinsi Jawa Timur
......................................................... 43
4.2.1 Deskriptif Persentase Kemiskinan, Pengeluaran Per Kapita
Makanan dan
Faktor yang Diduga Mempengaruhinya
................................................... 43
4.2.2 Pengujian Korelasi Antar Variabel Respon
........................................... 50
4.2.3 Identifikasi Variabel Komponen Parametrik dan
Nonparametrik .......... 50
4.2.4 Aplikasi Data Model Regresi Semiparametrik Birespon
dengan
Pendekatan Spline Truncated
...................................................................
52
BAB 5 KESIMPULAN DAN SARAN
5.1 Kesimpulan
..........................................................................................
57
5.2 Saran
....................................................................................................
58
DAFTAR PUSTAKA
...............................................................................
.... 59
Lampiran
..........................................................................................................
65
-
xiii
DAFTAR TABEL
Tabel 2.1 Penelitian Sebelumnya terkait Faktor-faktor yang
Memengaruhi
Kemiskinan
........................................................................................
17
Tabel 3.1 Variabel Penelitian
...............................................................................
19
Tabel 3.2 Struktur Data Penelitian
.......................................................................
20
Tabel 4.1 Statistika Deskriptif Variabel Penelitian
.............................................. 43
Tabel 4.2 Tabel Identifikasi Linieritas dengan Scatter Plot
................................. 50
Tabel 4.3 Tabel Identifikasi Linieritas dengan Ramsey Test
................................ 51
Tabel4.4 Hasil Identifikasi Komponen Parametrik dan
Nonparametrik Berdasarkan
Hasil Uji Ramsey
..................................................................................
52
Tabel 4.5 Nilai GCV untuk Spline Linear Satu Knot
........................................... 53
Tabel 4.6 Interval Konfidensi untuk Parameter
................................................... 54
-
xiv
-Halaman ini sengaja dikosongkan-
-
xv
DAFTAR GAMBAR
Gambar 4.1 Persentase Kemiskinan Berdasarkan Kabupaten/Kota di
Jawa Timur
Tahun 2015
......................................................................................
45
Gambar 4.2 Pengeluaran per Kapita Makanan berdasarkan
Kabupaten/kota di
Jawa Timur 2015
..............................................................................
47
Gambar 4.3 Scatter Plot Variabel Persentase Kemiskinan dan
Variabel yang
Diduga Berpengaruh
........................................................................
48
Gambar 4.4 Scatter Plot Variabel Pendapatan per Kapita Makanan
dan Variabel
yang Diduga
Berpengaruh................................................................
49
-
xvi
Halaman ini sengaja dikosongkan.
-
1
BAB 1
PENDAHULUAN
1.1 Latar Belakang
Interval konfidensi merupakan salah satu persoalan yang penting
dalam hal
inferensi regresi (Nafi’ dan Budiantara, 2008). Interval
konfidensi untuk parameter
model regresi digunakan pada penentuan variabel prediktor yang
signifikan
berpengaruh terhadap variabel respon dengan melihat jika
interval konfidensi
memuat nilai nol, maka variabel prediktor tidak berpengaruh
secara signifikan
terhadap variabel respon. Interval konfidensi untuk parameter
model regresi
parametrik telah dilakukan, namun konstruksi interval konfidensi
untuk parameter
model regresi semiparametrik belum banyak dilakukan.
Konstruksi interval konfidensi regresi nonparametrik dilakukan
oleh
beberapa peneliti seperti Wahba (1983) dan Wang (1998) untuk
model regresi
spline smoothing menggunakan pendekatan bayesian yang melibatkan
distribusi
prior improper sehingga secara matematis sulit dilakukan.
Pendekatan yang dinilai
lebih mudah dibandingkan pendekatan bayesian dalam hal
konstruksi interval
konfidensi yaitu pendekatan pivotal quantity dimana pada
pendekatan ini tidak
melibatkan distribusi prior sehinga diperoleh model yang
sederhana dan inferensi
statistika yang relatif mudah (Eubank, 1988). Peneliti yang
menggunakan
pendekatan pivotal quantity untuk konstruksi interval konfidensi
yaitu Loklomin
(2017) menggunakan metode untuk konstruksi interval konfidensi
untuk parameter
model regresi semiparametrik, namun dalam hal ini hanya
melibatkan satu respon
sehingga belum mengakomodasi interval konfidensi untuk regresi
semiparametrik
birespon, padahal menurut Welsh dan Yee (2006), birespon
merupakan masalah
yang menarik dibahas karena kedua variabel responnya saling
berkorelasi.
Beberapa metode estimasi yang terdapat dalam regresi
semiparametrik
antara lain spline, kernel, lokal linier, polinomial lokal, dan
deret fourier (Hardle,
1990). Namun, dari beberapa metode estimasi tersebut, spline
merupakan metode
yang paling diminati oleh peneliti dalam bidang regresi
semiparametrik, hal
tersebut didasari karena spline memiliki interpretasi statistik
dan visual yang sangat
baik (Eubank, 1999; Budiantara 2009). Spline merupakan potongan
polinomial
-
2
tersegmen sehingga memiliki fleksibilitas lebih dari polinomial
biasa, oleh karena
itu spline memiliki kelebihan lebih efektif dalam hal
penyesuaian diri terhadap
karakteristik lokal suatu data (Fajriyyah dan Budiantara, 2015).
Salah satu basis
fungsi yang digunakan pada spline yaitu spline truncated (Lyche
and Morken,
2008).
Spline truncated merupakan model polinomial tersegmen yaitu
memiliki
perubahan pola perilaku kurva yang berbeda pada interval yang
berlainan yang
ditandai dengan adanya titik knot. Estimasi kurva regresi
semiparametrik spline
truncated dapat dilakukan dengan memilih parameter smoothing,
yaitu orde,
banyaknya titik knot, dan titik knot. Pemilihan parameter
smoothing yang optimal
dilakukan penulis dengan menggunakan kriteria Generalized Cross
Validation
(GCV) yaitu dengan memilih nilai GCV yang minimum. GCV digunakan
karena
memiliki sifat optimal asimtotik yang tidak dimiliki metode lain
(Wahba, 1990).
Penelitian mengenai Regresi semiparametrik dengan pendekatan
spline
telah dilakukan antara lain Wibowo, Haryatmi, dan Budiantara
(2013), Marina dan
Budiantara (2013), Sugiantari dan Budiantara (2013), Yani,
Srinadi, dan Sumarjaya
(2017), dan Pratiwi, Budiantara, dan Wibowo (2017), namun pada
beberapa
penelitian tersebut terbatas hanya membahas kasus dengan satu
variabel respon
sehingga belum bisa mengakomodasi kasus dengan dua variabel
respon.
Selanjutnya, beberapa penelitian yang membahas mengenai regresi
birespon spline
dilakukan oleh Wulandari dan Budiantara (2014) dan Nurdiana,
Herhyanto, dan
Dasari (2017) dengan pendekatan nonparametrik, sedangkan Wibowo
dkk. (2012)
membahas model semiparametrik multirespon. Beberapa penelitian
di atas, masih
dalam batas mengestimasi parameter dan belum melakukan inferensi
lebih lanjut
terkait interval konfidensi. Pada penelitian ini, interval
konfidensi parameter model
regresi birespon semiparametrik spline truncated diaplikasikan
pada data persentase
kemiskinan dan pengeluaran per kapita makanan.
Kemiskinan merupakan permasalahan sosial kependudukan yang
utamanya
perlu mendapat perhatian khusus karena salah satu sasaran dalam
pembangunan
nasional adalah menurunkan tingkat kemiskinan (Rahmawati,
Ispriyanti, dan
Warsito, 2017). Kemiskinan merupakan persoalan yang sangat
kompleks dan
kronis, oleh karena itu dibutuhkan analisis yang tepat dan
melibatkan semua
-
3
komponen permasalahan dalam penangannnya (Prawoto, 2009). Pada
era
Sustainable Development Goals (SDG’s) ini, kemiskinan
ditempatkan pada poin
pertama yang harus diraih yaitu terciptanya dunia tanpa
kemiskinan sehingga
pengentasan kemiskinan merupakan prioritas bagi semua Negara,
salah satunya
Indonesia.
Pada Tahun 2000, jumlah penduduk miskin di Indonesia mencapai
38,74
juta jiwa dan seiring bertambahnya tahun jumlah penduduk miskin
di Indonesia
memiliki kecenderungan menurun hingga pada tahun 2015 jumlah
penduduk
miskin sejumlah 28,51 juta jiwa (BPS 2015; Ishartono, 2016).
Meskipun begitu,
jumlah tersebut merupakan angka yang masih besar mengingat bahwa
target SDGs
adalah dunia tanpa kemiskinan atau dengan kata lain Indonesia
masih sangat jauh
untuk mencapai tujuan tersebut. Kemiskinan di Indonesia yang
cukup tinggi
didukung dengan fakta bahwa Indonesia merupakan Negara dengan
urutan ke-5
dengan persentase populasi garis kemiskinan terbanyak di Asia
Tenggara yaitu
sebesar 10,9% yang didasarkan pada data BPS tahun 2014 (Basic
Statistic, 2017).
Di Indonesia, Jawa Timur merupakan provinsi dengan jumlah
penduduk miskin
terbanyak yaitu sebanyak 4.638.530 (BPS, 2016). Walaupun Jawa
Timur
berkontribusi pada Produk Domestik Bruto nasional yang cukup
tinggi yaitu
tercatat oleh BPS (2016) sebesar 14,85% , namun tidak serta
merta menjadikan
Jawa Timur sebagai provinsi yang rendah tingkat
kemiskinannya.
Pengukuran kesejahteraan penduduk suatu daerah selain diukur
dari
persentase kemiskinan dapat pula diukur melalui pengeluaran per
kapita makanan
(Badan Ketahanan Pangan, 2015). Secara fakta, persentase
penduduk miskin dan
pengeluaran per kapita makanan berkorelasi signifikan pada
kajian data awal.
Kasus kemiskinan dan pengeluaran per kapita makanan beserta
faktor-faktor yang
mempengaruhi telah dibahas oleh beberapa peneliti antara lain
Wulandari dan
Budiantara (2014) dan Putri (2017). Wulandari dan Budiantara
(2014) serta Putri
(2017) mendapatkan model untuk persentase kemiskinan dan
pengeluaran per
kapita makanan dengan memuat variabel prediktor antara lain
tingkat kesempatan
kerja, laju pertumbuhan ekonomi, tingkat pengangguran terbuka,
dan tingkat
pastisipasi angkatan kerja, namun Putri (2017) menggunakan
pendekatan Penalized
Spline, sedangkan Wulandari dan Budiantara (2014) menggunakan
pendekatan
-
4
Spline. Penelitian lain yaitu Merdekawati dan Budiantara (2013)
melakukan
pemodelan regresi spline truncated multivariabel memperoleh
hasil bahwa
pertumbuhan ekonomi, tingkat pengangguran terbuka, dan tingkat
pendidikan
berpengaruh terhadap kemiskinan. Berdasarkan kajian awal data
diperoleh bahwa
pola data mengikuti pola semiparametrik sehingga syarat untuk
aplikasi regresi
semiparametrik birespon telah terpenuhi.
1.2 Rumusan Masalah
Berdasarkan latar belakang yang telah diuraikan di atas, maka
rumusan
masalah pada penelitian ini adalah sebagai berikut :
1. Bagaimana mendapatkan interval konfidensi untuk parameter
model regresi
semiparametrik birespon dengan pendekatan spline truncated?
2. Bagaimana memodelkan persentase kemiskinan dan pengeluaran
per kapita
makanan di Provinsi Jawa Timur dan variabel-variabel apa saja
yang
berpengaruh menggunakan interval konfidensi untuk parameter
model
regresi semiparametrik birespon dengan pendekatan spline
truncated?
1.3 Tujuan Penelitian
Berdasarkan rumusan masalah yang telah diperoleh di atas, maka
tujuan
penelitian adalah sebagai berikut :
1. Mengkaji interval konfidensi untuk parameter model
regresi
semiparametrik birespon dengan pendekatan spline truncated.
2. Mengestimasi model data persentase kemiskinan dan pengeluaran
per
kapita makanan di Provinsi Jawa Timur dan mengetahui
variabel-variabel
yang berpengaruh menggunakan interval konfidensi untuk parameter
model
regresi semiparametrik birespon dengan pendekatan spline
truncated.
1.4 Manfaat Penelitian
Adapun manfaat yang diharapkan dalam penelitian ini adalah :
1. Menambah wawasan keilmuan mengenai interval konfidensi
parameter
model regresi semiparametrik birespon dengan pendekatan
spline
truncated.
-
5
2. Memberikan informasi kepada pemerintah untuk mengetahui
variabel-
variabel yang mempengaruhi kemiskinan di Provinsi Jawa
Timur.
3. Hasil penelitian diharapkan menjadi bahan masukan dan acuan
untuk
penelitian-penelitian selanjutnya.
1.5 Batasan Masalah
Batasan yang digunakan pada penelitian ini adalah konstruksi
interval
konfidensi untuk parameter model regresi semiparametrik birespon
menggunakan
model spline linier. Pendekatan yang digunakan untuk
mengkonstruksi interval
konfidensi pada Tesis ini adalah pendekatan pivotal quantity.
Interval konfidensi
yang terbentuk digunakan untuk pengujian hipotesis dua arah.
Data yang digunakan
dalam penelitian ini adalah data sekunder yang diambil dari
publikasi BPS tahun
2015. Banyaknya titik knot pada spline linier yang digunakan
adalah satu titik knot.
Pemilihan titik knot optimal dilakukan menggunakan metode
GCV.
-
6
Halaman ini sengaja dikosongkan
-
7
BAB 2
TINJAUAN PUSTAKA
2.1 Analisis Regresi
Analisis regresi merupakan suatu metode statistik yang digunakan
untuk
mengetahui hubungan fungsional antara variabel respon dan
prediktor. Berikut
adalah model persamaan regresi :
1 2i 0 1 1i 2 2i l li iy =β +β x +β x +...β x +ε ;i , ,...,n
(2.1)
dengan y merupakan variabel dependen sedangkan x merupakan
variabel
independen. Persamaan (2.1) dapat dinyatakan dalam bentuk
matriks sesuai
persamaan (2.2).
y = Xβ +ε (2.2)
dengan
11 1
12 2
1 1
1
1
1
l
l
n l n
x x
x xX
x x
, dan
1
2=
n
ε .
Analisis regresi memiliki dua pendekatan yaitu parametrik
dan
nonparametrik (Eubank, 1998). Regresi parametrik merupakan
pendekatan regresi
yang memiliki asumsi bentuk kurva regresi diketahui. Pada
regresi parametrik,
selain diasumsikan kurva regresi diketahui, terdapat beberapa
asumsi terkait model
pada persamaan (2.2) yaitu residual diasumsikan identik,
independen, dan
berdistribusi normal 2~ IIDN( , )ε 0 I .
Selain regresi parametrik, regresi nonprametrik merupakan
pendekatan
metode regresi dimana bentuk kurva regresinya tidak diketahui.
Model regresi
nonparametrik dapat ditulis sebagai berikut :
1 2i i iy =f(t )+ε , i , ,...,n (2.3)
Regresi nonparametrik sangat memerhatikan fleksibilitas, dan
hanya diasumsikan
bentuk fungsinya mulus (Eubank, 1988).
Beberapa kasus menyatakan variabel respon diketahui pola
hubungannya
dengan salah satu variabel prediktor, tetapi dengan variabel
prediktor yang lain
-
8
tidak diketahui bentuk pola hubungannya. Dalam keadaan seperti
ini, maka
digunakan pendekatan regresi semiparametrik. Regresi
semiparametrik adalah
gabungan antara regresi parametrik dan regresi nonparametrik.
Model regresi
semiparametrik dapat ditulis sebagai berikut (Wu dan Zhang,
2006):
, 1,2, ,nTi i i iy f t i βx (2.4)
dengan 𝑦𝑖 adalah subjek ke-i , ix adalah vektor komponen
parametrik pengamatan
ke-i, 𝑓(𝑡𝑖) adalah fungsi regresi dan 𝜀𝑖 adalah error random,
𝜀𝑖~𝑁(0, 𝜎2).
2.2 Uji Ramsey
Uji linearitas digunakan untuk mengindentifikasi apakah model
yang
digunakan fungsi parametrik yang digunakan adalah fungsi linear
atau tidak. Uji ini
dikembangkan oleh Ramsey pada tahun 1969 yang biasa disebut
general test of
specification atau RESET (Pamungkas, 2013). Uji ini bertujuan
untuk menghasilkan
F hitung, dengan prosedur kerja yaitu
Hipotesis:
0 :H antara variabel respon dan variabel prediktor terdapat
hubungan linier
1 :H antara variabel respon dan variabel prediktor tidak
terdapat hubungan linier
Prosedur mendapatkan statistik uji:
1. Mendapatkan fitted value dari variabel respon dengan cara
melakukan analisis
regresi linear.
2. Variabel fitted yang telah dikuadratkan tersebut diregresikan
bersama dengan
model semula sebagai variabel prediktor baru.
3. Menghitung
2 2
2
/
1 /
R new R old pF
R new n k
, daerah penolakan :
; , 1 > . hitung tabel k n kF F
dengan
p= Jumlah variabel prediktor yang baru masuk
n= Jumlah data
k= banyaknya parameter dalam model regresi baru
2R new= nilai dari persamaan regresi baru
2 R old nilai dari persamaan regresi lama
-
9
2.3 Spline Truncated
Spline truncated merupakan pendekatan regresi nonparametrik
paling
populer. Salah satu kelebihan dari spline truncated yaitu model
ini mengikuti pola
sesuai pergerakannya dengan adanya titik knot (Astuti, 2017).
Secara umum, fungsi
spline berderajat p dengan titik-titik knot 1 2, ,.., rK K K
dapat ditulis dalam bentuk
sebagaimana pada persamaan (2.5) berikut (Hardle, 1990).
01 1
g(t )p r
pj
i j i p k i k
j k
t t K
(2.5)
dan fungsi truncated diberikan oleh persamaan (2.6)
, t
0 , t
i k i k
i k
i k
t K Kt K
K
(2.6)
Regresi spline adalah regresi yang bentuk kurva regresinya
didekati oleh fungsi
spline. Regresi spline dapat didekati dengan nonparametrik
maupun
semiparametrik, hal ini didasarkan pada pola data yang
didapatkan.
2.2.1 Spline Truncated dalam Regresi Nonparametrik
Secara umum, model regresi nonparametrik spline dapat dituliskan
sebagai
berikut.
01 1
( ) , 1, 2, , n;p r
pj
j i p k i ki
j k
it i k=1,2,...K ,t t r
(2.7)
dimana p adalah derajat polinomial dan r adalah banyak titik
knot pada fungsi
truncated, dengan 𝜀𝑖 adalah error random, 𝜀𝑖~𝑁(0, 𝜎2). Model
regresi
nonparametrik spline pada persamaan (2.7) dapat disajikan dalam
bentuk matriks
sebagai berikut:
η(t) = Zα +ε (2.8)
dengan 0 1 1( )T
p p p r α ,
1 1 1 1 1
2 2 2 1 2
1
1
1
1
P Pp
r
P Pp
r
P Pp
n n n n r
t t t K t K
t t t K t K
t t t K t K
Z ,
dan 1 2T
nε merupakan vektor residual.
-
10
2.2.2 Spline Truncated dalam Regresi Semiparametrik
Regresi semiparametrik diterapkan pada data yang sebagian
variabel
prediktornya diketahui bentuk kurva regresinya dan sebagian yang
lain tidak
diketahui, Eubank (1998) menyebut hal ini sebagai partial linier
model untuk kurva
yang diketahui berbentuk linier. Mengacu pada persamaan (2.4)
dan (2.5), jika
diberikan data berpasangan 1 2i i i( x ,t , y ), i , ,..,n
dimana iy adalah variabel respon
sedangkan ix adalah variabel prediktor yang mengikuti pola
parametrik dan it
adalah variabel prediktor yang mengikuti pola nonparametrik,
model regresi
semiparametrik spline truncated dapat ditulis menjadi:
1 1
, 1, 2, , np r
pj
0 1 i 0 j i p k i k
j k
i iβ +β x α ty t K i
(2.9)
Persamaan (2.9) dapat disajikan dalam bentuk matriks berikut
y = X +β Zα +ε
Cω +ε (2.10)
dengan C X Z dan
βω =
α.
2.3 Regresi Semiparametrik Birespon Spline Truncated
Analisis regresi birespon merupakan suatu analisis yang
digunakan untuk
mengetahui hubungan fungsional antara dua variabel respon dan
variabel prediktor.
Secara umum, Wang, Guo, dan Brown (2000) menyatakan model
regresi birespon
dapat ditulis dalam bentuk
, i 1,2, , ni i ix y f ε (2.11)
dengan 1 2,
T
i i iy yy , 1 2,T
i i ix f x f xf adalah vektor dari fungsi
regresi, serta 1 2,
T
i i iε adalah vektor dari error pengukuran dengan mean 0
dan variansi ∑ .𝑖 Indeks 𝑖 menyatakan banyak pengamatan pada
𝑦𝑖(1) dan 𝑦𝑖
(2)
dengan kedua variabel respon saling berkorelasi.
Model regresi semiparametrik birespon Spline Truncated digunakan
pada
kasus yang memiliki dua variabel respon yang memenuhi sifat
regresi
-
11
semiparametrik. Diberikan pasangan data 1 2
1 2 1 2
( ) ( )
i i li i i qi i i( x ,x ,...,x ,t ,t ,...,t , y , y ) ,
dengan 1 2i , ,..,n 1( )iy merupakan variabel respon pertama
pada pengamatan ke-
i dan 2( )
iy menyatakan variabel respon ke dua pada pengamatan ke-i.
Hubungan
antara 1 2i i li( x ,x ,...,x ) dan 1 2( ) ( )
i i( y , y ) diasumsikan mengikuti model regresi
parametrik, sedangkan 1 2i i qi(t ,t ,...,t ) dan 1 2( ) ( )
i i( y , y )diasumsikan mengikuti model
regresi nonparametrik. Mengacu persamaan (2.4) dan (2.11) maka
jika persamaan
tersebut didekati dengan fungsi spline multivariabel, maka
persamaan dapat ditulis.
1 1 1 1 1 1 1 1
1 2 1 2
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
i i i li i i qi iy g (x ) g (x ) ... g (x ) (t ) (t ) ... (t
)
(2.12)
2 2 2 2 2 2 2 2
1 2 1 2
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
i i i li i i qi iy g (x ) g (x ) ... g (x ) (t ) (t ) ... (t
)
(2.13)
Secara sederhana persamaan (2.12) dan (2.13) dapat ditulis ulang
sebagai berikut.
1 1 1 1
1 1
ql( ) ( ) ( ) ( )
i ji mi i
j m
y g (x ) (t )
(2.14)
2 2 2 2
1 1
ql( ) ( ) ( ) ( )
i ji mi i
j m
y g (x ) (t )
(2.15)
dengan
1
(1) (1) (1) (1)
0
1 1
(1) ( )mi
rpp
j
j mi p k mi k
j k
t Kt t
2
(2) (2) (2) (2)
0
1 1
(2) ( ; 1,2 .) , ..mi
rpp
j
j mi p k mi k
j k
tt t K m q
1 1 1 1 1
0 1 2 l
( ) ( ) ( ) ( ) ( )
1i 2i 1i 1i 2i lig (x ,x ,...,x )=β +β x +β x +...+β x
2 2 2 2 2
0 1 2 l
( ) ( ) ( ) ( ) ( )
1i 2i 1i 1i 2i lig (x ,x ,...,x )=β +β x +β x +...+β x
Persamaan (2.14) dan (2.15) jika ditulis dalam bentuk matriks
dapat ditulis
sebagai berikut :
y = Xβ + Zα +ε (2.16)
Persamaan (2.16) dapat ditulis kembali menjadi:
y = Cω +ε (2.17)
-
12
dengan C = X Z dan T
ω β α .
2.4 Pemilihan Titik Knot Optimal
Pemilihan titik knot merupakan hal yang sangat penting dalam
regresi spline.
Titik knot merupakan suatu titik dimana data mengalami perubahan
pada selang
interval tertentu. Menurut Wahba (1990) dan Wang (1998), metode
pemilihan titik
knot optimal dilakukan dengan metode Generalized cross
validation (GCV). Titik
knot optimal diperoleh melalui pemilihan nilai GCV terkecil
(Budiantara, 2005).
Fungsi GCV dirumuskan sebagai berikut (Hardle,1990):
21
1
21
ˆ,
n
i iin y t
GCV C C C Cn t
kkr I
T -1 TA = ( )
A (2.18)
Dengan kA merupakan suatu matriks yang memuat knot k.
2.5 Interval Konfidensi Parameter Regresi
Interval konfidensi parameter regresi merupakan persoalan
inferensi yang
penting dalam regresi spline. Langkah-langkah untuk mendapatkan
estimasi
interval untuk suatu parameter dalam regresi dijelaskan oleh
Montgomery, Peck,
dan Vining (2012) dengan menggunakan metode pivotal quantity
sebagai berikut.
Model regresi linier berganda telah disajikan pada persamaan
(2.2),
berdasarkan model, diketahui bahwa iy berdistribusi normal
dengan mean
0 1
l
j jjx
dan varians 𝜎2. Langkah pertama yang harus dilakukan yaitu
mengetahui estimasi parameter, dalam hal ini pada metode regresi
linier berganda
digunakan metode ordinary least square (OLS). Mengacu pada
persamaan (2.2)
diperoleh estimator ̂ dengan metode OLS (Kutner, Nachtsheim, dan
Neter, 2004):
ˆ T T -1β (X X) X y (2.19)
dengan memperhatikan bahwa β̂ kombinasi linier dari y , maka
2 1ˆ ~ ( , ( ) )N Tβ β X X , sehingga untuk masing-masing
estimator berdistribusi
normal 2ˆ ~ ( , C )j j jjN , dimana jjC merupakan elemen
diagonal ke-j dari
-
13
matriks 1
'
X X . Untuk membentuk suatu pivotal quantity untuk β , perlu
diperhatikan definisi tentang pivotal quantity berikut.
Jika Q=q(x1,x2,…,xn) adalah sebuah variabel random yang
merupakan fungsi dari
X1,…,Xn dan , dan fungsi distribusinya tidak bergantung pada
atau parameter
lain, maka Q disebut pivotal quantity .
Distribusi dari variabel random umumnya tidak memiliki pivotal
quantity
yang pasti, artinya terdapat berbagai kemungkinan bentuk pivotal
quantity, namun
teorema limit pusat sering kali digunakan untuk konstruksi
interval konfidensi
untuk mayoritas distribusi dengan ukuran sampel besar.
Akibatnya, diperoleh pivotal quantity
20 1
j j
j
jj
ˆT , j , ,..,l
C
(2.20)
Variabel random ( )~
a
BT t
A
a
, jika dan hanya jika memenuhi tiga syarat yaitu
~ (0,1)B N , ( )A ~ a , dan A dan B independen.
Dengan pembuktian dengan berdasar syarat-syarat tersebut di
atas, didapatkan
bahwa T berdistribusi t dengan derajat bebas n-l, dimana 𝜎2
diestimasi dengan
varians error. Untuk mendapatkan interval konfidensi terpendek
diperlukan
optimasi Lagrange yaitu jika merupakan fungsi distribusi
kumulatif dari pivotal
quantity Q=q(x1,x2,…,xp) dan didapatkan fungsi probabilitas
untuk suatu interval
konfidensi
1 2( ( , , ..., ) ) 1
p(b) - (a) P a Q x x x b
Untuk mendapatkan interval konfidensi terpendek maka dicari
, ,1 2 p U LL(x ,x ,..., x )a b minimum dengan penyelesaian
optimasi Lagrange :
, ,
{ ( )} {( ) }a b R a b R
a, b a bMin Min
-
14
Berdasarkan hasil pada persamaan (2.20) dan Teorema 4, didapat
interval
konfidensi terpendek berukuran (1 ) 100% untuk koefisien
regresi
, 0,1,..,j j l adalah sebagai berikut.
2 2
, ,2 2
ˆ ˆˆ ˆj jj j j jjn p n p
t C t C (2.21)
2.6 Weighted Least Square
Metode Ordinary Least Square (OLS) mengasumsikan bahwa
terdapat
variansi konstan dalam error yang pada umumnya disebut
keadaan
homoskedastisitas. Metode Weighted Least Square (WLS) dapat
digunakan ketika
asumsi variansi konstan dalam error dilanggar atau dalam kata
lain disebut
heteroskedastisitas (Greene, 2003). Berikut diberikan model
:
y Xβ ε (2.22)
Dengan error diasumsikan berdistribusi normal multivariat dengan
mean 0 dan
matriks variansi-kovariansi non konstan sebagai berikut :
2
1
2
2
2
0 0
0 0
0 0 0 n
=
Dalam metode OLS, berikut adalah fungsi yang diminimumkan
untuk
mengestimasi parameter
2
T T T T T T
T T T T T
Q
T
T
ε
y y β X y y Xβ β X Xβ
y y β X y β X Xβ
ε
y - Xβ y - Xβ (2.23)
Persamaan (2.27) selanjutnya didiferensiasi terhadap β dengan
proses sebagai
berikut:
1
2
0 2 2
ˆ
T T T T T
T T
T T
Q
y y β X y β X Xβ
β β
X y X Xβ
β X X X y
-
15
sehingga diperoleh estimator OLS sebagai berikut.
ˆ T -1 Tβ = (X X) X y (2.24)
Jika kita mendefinisikan invers dari matriks variansi kovariansi
sebagai pembobot
untuk estimasi parameter yaitu 2
1i
i
, maka matriks V merupakan suatu matriks
diagonal yang berisi pembobot untuk estimasi parameter sebagai
berikut.
1
2
n
0 0
0 0
0 0 0
V
Pada metode WLS fungsi yang diminimumkan untuk mengestimasi
parameter
dirumuskan sebagai berikut
2
T T T T T T
T T T T T
Q
Ty - Xβ V y - Xβ
y Vy β X Vy y VXβ β X VXβ
y Vy β X Vy β X VXβ
(2.25)
Estimator WLS didapat dengan meminimumkan persamaan (2.25)
dengan
memenuhi 0Q
β sebagai berikut.
1
2
0 2 2
ˆ
T T T T T
T T
T T
Q
y Vy β X Vy β X VXβ
β β
X Vy X VXβ
β X VX X Vy
sehingga diperoleh estimator WLS pada persamaan (2.26).
ˆ T -1 Tβ = (X VX) X Vy (2.26)
2.7 Aljabar Matriks
Beberapa teorema dasar terkait dengan aljabar matriks yang
digunakan
untuk menyelesaikan estimasi parameter dan interval konfidensi
berdasarkan
Rencher dan Scaalje (2007) adalah sebagai berikut.
Teorema 1.
-
16
Diberikan vektor a dan x , dimana 1 2, , ,..,T T T pa x x a a a
a a memuat
konstanta, maka
T Ta x x aa
x x
Teorema 2.
Matriks A dikatakan idempoten jika AA = A
Teorema 3.
Jika A matriks berukuran nxp dan B matriks berukuran pxn,
maka
( ) ( )tr trAB BA
Teorema 4.
Jika matriks A mempunyai rank r serta simetris dan idempoten,
maka
( ) ( )rank A tr A r
Teorema 5.
Jika 2~ ( , )y N I dan A matriks simetris dengan rank r,
maka
2/Ty y A
berdistribusi 2 2, / 2Tr A jika dan hanya jika A idempotent.
Teorema 6.
Jika 2~ ( , )y N I maka Ty yB dan
Ty yA adalah independen jika dan hanya jika
0BA atau 0AB .
2.8 Persentase Kemiskinan, Pengeluaran per Kapita Makanan dan
Faktor
yang Diduga Berpengaruh
Kemiskinan menurut BPS (2014) didefinisikan sebagai
ketidakmampuan
dari sisi ekonomi untuk memenuhi kebutuhan dasar seperti pangan,
sandang,
pendidikan, kesehatan, dan perumahan. Sedangkan berdasarkan
Undang-Undang
No. 24 Tahun 2004, kemiskinan adalah kondisi sosial ekonomi
seseorang atau
sekelompok orang yang tidak terpenuhinya hak-hak dasarnya
untuk
mempertahankan dan mengembangkan kehidupan yang bermartabat.
Pengukuran
kesejahteraan penduduk di suatu daerah dapat diukur dengan
persentase kemiskinan
dan pengeluaran per kapita makanan. Persentase kemiskinan
merupakan persentase
-
17
penduduk yang berada di bawah garis kemiskinan, sedangkan
pengeluaran per
kapita makanan yaitu biaya yang dikeluarkan untuk konsumsi semua
anggota
rumah tangga selama sebulan untuk makanan dibagi dengan
banyaknya anggota
rumah tangga tersebut (BPS, 2017).
Beberapa pertimbangan yang digunakan sebagai dasar pemilihan
variabel
penelitian adalah beberapa penelitian yang dilakukan sebelumnya
pada Tabel 2.1
berikut.
Tabel 2.1 Penelitian Sebelumnya terkait Faktor yang Memengaruhi
Kemiskinan
Peneliti Judul Variabel Prediktor
Astiti dkk.
(2016)
Analisis regresi nonparametrik
spline multivariat untuk
pemodelan indikator kemiskinan
di Indonesia.
Angka melek huruf, rata-
rata lama sekolah, angka
partisipasi sekolah, PDRB
per kapita, tingkat
pengangguran terbuka.
Budiantara,
I.N.,
Wulandari
(2015)
Analisis Faktor-Faktor yang
Mempengaruhi Persentase
Penduduk Miskin dan
Pengeluaran Perkapita Makanan
di Jawa Timur Menggunakan
Regresi Nonparametrik Birespon
Spline.
Tingkat kesempatan kerja,
laju pertumbuhan ekonomi,
tingkat pengangguran
terbuka, dan tingkat
partisipasi angkatan kerja .
Merdekawati
dan
Budiantara
(2013)
Pemodelan Regresi Spline
Truncated Multivariabel pada
Faktor-Faktor yang
Mempengaruhi Kemiskinan di
Kabupaten/Kota Provinsi Jawa
Tengah.
Pertumbuhan ekonomi,
tingkat pengangguran
terbuka, dan tingkat
pendidikan
Rahmawati
dkk (2017)
Pemodelan kasus kemiskinan di
jawa tengah menggunakan
regresi nonparametrik metode B-
spline.
Angka melek huruf, tingkat
pengangguran terbuka,
angka partisipasi sekolah,
dan PDRB per kapita
Rumahorbo
(2014)
Analisis Faktor-faktor yang
Mempengaruhi Jumlah Penduduk
Miskin Provinsi Sumatera Utara
Pertumbuhan ekonomi,
pendapatan per kapita,
tingkat pengangguran
terbuka, dan inflasi
-
18
Tabel 2.1 (Lanjutan)
Peneliti Judul Variabel Prediktor
Cheema dan
Sial (2012)
Poverty, Income Inequality, and
Growth in Pakistan:
A Pooled Regression Analysis.
Gini rasio, Rata-rata
pengeluaran per kapita,
Indeks Pembangunan
Manusia
Iradian
(2005)
Inequality, poverty, and growth:
cross-country evidence.
Gini Rasio, PDRB per
kapita, Belanja pemerintah
Lee (2014) Globalization : Income Inequality
and poverty : Theory and
empirics.
PDB, gini rasio, Trade
(Ekspor + Impor),
Pendidikan
Berdasarkan penelitian sebelumnya yang telah disebutkan,
beberapa faktor
yang diduga mempengaruhi persentase kemiskinan dan pengeluaran
per kapita
makanan beserta penjelasannya adalah sebagai berikut berdasarkan
definisi dari
BPS (2016):
1. Rata-rata lama sekolah menggambarkan jumlah tahun yang
digunakan oleh
penduduk usia 15 tahun keatas dalam menjalani pendidikan
formal.
2. Tingkat pengangguran terbuka adalah persentase jumlah
pengangguran
terhadap jumlah angkatan kerja.
3. PDRB atas dasar harga berlaku yaitu nilai PDRB yang disusun
atas dasar harga
berlaku pada periode penyusunan.
4. Angka partisipasi kasar SMA adalah proporsi anak sekolah pada
jenjang SMA
terhadap penduduk pada kelompok usia 16-18 tahun dimana sejak
tahun 2007
pendidikan non formal (Paket A, Paket B, dan Paket C) turut
diperhitungkan.
5. Gini ratio merupakan suatu ukuran kemerataan yang dihitung
dengan
membandingkan luas antara diagonal dan kurva lorenz (daerah A)
dibagi
dengan luas segitiga di bawah diagonal. Rasio gini digunakan
untuk mengukur
derajat ketidakmerataan pendapatan. Rasio Gini bernilai antara 0
dan 1. Nilai
1 menunjukkan complete inequality atau perfectly inequal,
koefisien Gini
bernilai 0 menunjukkan adanya pemerataan pendapatan yang
sempurna, atau
setiap orang memiliki pendapatan yang sama.
-
19
BAB 3
METODOLOGI PENELITIAN
3.1 Sumber Data
Penelitian ini menggunakan data sekunder tahun 2015 dari
publikasi Badan
Pusat Statistik Provinsi Jawa Timur dengan unit observasi
meliputi 38
kabupaten/kota di Provinsi Jawa Timur.
3.2 Variabel Penelitian
Variabel-variabel penelitian yang digunakan pada penelitian ini
disajikan
pada Tabel 3.1.
Tabel 3.1 Variabel Penelitian
Variabel Keterangan Variabel Skala Data (1)y
PePersentase kemiskinan Rasio
(2)y Pengeluaran per kapita makanan Rasio
1x Angka partisipasi kasar SMA Rasio
2x Gini ratio Rasio
3x Tingkat Pengangguran Terbuka Rasio
4x Rata-rata lama sekolah Rasio
5x PDRB atas harga berlaku Rasio
Adapun penjelasan dari variabel-variabel dalam penelitian ini
adalah
sebagai berikut.
a. Variabel Respon
Variabel respon yang digunakan pada penelitian ini adalah
persentase
kemiskinan dan pengeluaran per kapita makanan. Persentase
kemiskinan yaitu
persentase penduduk yang berada di bawah garis kemiskinan,
sedangkan
pengeluaran per kapita makanan yaitu biaya yang dikeluarkan
untuk konsumsi
semua anggota rumah tangga selama sebulan untuk makanan dibagi
dengan
banyaknya anggota rumah tangga tersebut.
-
20
b. Variabel Prediktor
Varibel prediktor yang diduga mempengaruhi persentase kemiskinan
dan
indeks kedalaman kemiskinan pada penelitian ini terdapat lima
variabel
prediktor. Variabel prediktor tersebut adalah sebagai
berikut.
1. Rata-rata lama sekolah menggambarkan jumlah tahun yang
digunakan oleh
penduduk usia 15 tahun keatas dalam menjalani pendidikan
formal.
2. Tingkat pengangguran terbuka adalah persentase jumlah
pengangguran
terhadap jumlah angkatan kerja
3. PDRB atas dasar harga berlaku yaitu nilai PDRB yang disusun
atas dasar
harga berlaku pada tahun perhitungan.
4. Angka partisipasi Kasar SMA adalah proporsi anak sekolah pada
jenjang
SMA terhadap penduduk pada kelompok usia 16-18 tahun
5. Gini ratio merupakan suatu ukuran kemerataan pendapatan yang
dihitung
dengan membandingkan luas antara diagonal dan kurva lorenz
(daerah A)
dibagi dengan luas segitiga di bawah diagonal.
3.3 Struktur Data Penelitian
Unit observasi yang digunakan dalam penelitian ini adalah
sebanyak 38
kabupaten/kota di Provinsi Jawa Timur dan banyaknya variabel
prediktor terdiri
dari lima variabel yang terdiri dari dua komponen parametrik dan
tiga komponen
nonparametrik. Sehingga, struktur data penelitian yang digunakan
adalah sebagai
berikut.
Tabel 3.2 Struktur Data Penelitian
Kabupaten/ Kota (1)y (2)y 1x 2x 3x 4x 5x
1 (1)1y
(2)
1y 11x 21x 31x 41x 51x
2 (1)2y
(2)
2y 12x 22x 32x 42x 52x
38 (1)38y
(2)
38y 1(38)x 2(38)x 3(38)x 4(38)x 5(38)x
-
21
3.4 Langkah-Langkah Penelitian
Langkah-langkah untuk menjawab tujuan penelitian dalam
penelitian ini
yaitu sebagai berikut :
3.4.1 Kajian Interval Konfidensi untuk Parameter Model
Regresi
Semiparametrik Birespon dengan Pendekatan Spline Truncated
1. Diberikan data berpasangan (1) (2)
1 2 1 2( , ,.., , , ,.., , , )l qx x x t t t y y yang
mengikuti
model regresi :
1 2( , ,.., ,l 1 2 qx x x t ,t ,..,t ) y f ε
dengan :
(d) (d) (d) (d)1 2, , 1, 2T
ny y y d
(1)
(2)
yy y
y
(1)
1 2
1 2 (2)
1 2
( , ,.., ,( , ,.., ,
( , ,.., ,
l 1 2 q
l 1 2 q
l 1 2 q
x x x t ,t ,..,t )x x x t ,t ,..,t )
x x x t ,t ,..,t )
ff
f,
(d)
1 1 2
(d)
2 1 2(d)
1 2
(d)
1 2
( , ,.., ,
( , ,.., ,( , ,.., , , 1, 2
( , ,.., ,
l 1 2 q
l 1 2 q
l 1 2 q
n l 1 2 q
f x x x t ,t ,..,t )
f x x x t ,t ,..,t )x x x t ,t ,..,t ) d
f x x x t ,t ,..,t )
f
1 (d) (d) (d)1 22
, , 1, 2T
d n d
εε ε
ε
2. Model regresi multivariabel diasumsikan bersifat aditif
1 2
1 1
( , ,.., , ) ( ) ( )ql
i i li 1i 2i qi j ji m mi i
j m
x x x t ,t ,..,t x t
f g η ε
dimana 1
( )l
j ji
j
x
g adalah komponen parametrik dan 1
( )q
m mi
m
t
η adalah
komponen nonparametrik.
3. Komponen parametrik 1
( )l
j ji
j
g x
dapat dihampiri dengan fungsi linier
1
1
l
j ji
j
x
.
-
22
4. Komponen nonparametrik 1
(t )q
m mi
m
dihampiri menggunakan spline linier
dengan r knot
20 2 2( )1 1
( ) , 1, 2, , n;p r
ph
h mi p k mi k
h k
m mit t Kt i k=1,2,...,r
5. Diberikan model regresi semiparametrik birespon multivariabel
dengan
pendekatan spline truncated linier mengikuti persamaan
berikut.
y = Cω +ε
dengan C = X Z dan 1 2T
T Tω ω ω
(1) (2) ( )1 1 1 1 10 11 1;T T T Td
l ω ω ω ω
(1) (2)2 2 2T T T
ω ω ω
1 1 1 1 1
( )
2 20 21 2 2( 1) 2( ) 21 2 2( 1) 2( )q q q q
Td
P P P r P P P r ω
X merupakan matriks yang memuat prediktor komponen parametrik
dan Z
adalah matriks yang memuat komponen nonparametrik dengan ~ ( ,
)Nε 0 Σ
6. Mendapatkan estimasi untuk parameter ω menggunakan metode
Weighted
Least Square dengan langkah-langkah sebagai berikut:
i. Membentuk fungsi L
( )L T
y - C ω W y - C ω
ii. Meminimumkan persamaan L dengan menyelesaikan persamaan
berikut.
( )0
L
ω
ω
iii. Mendapatkan estimasi dari ω yaitu ω̂ .
7. Mencari distribusi dari ω̂ .
8. Mencari Pivotal Quantity untuk parameter ω̂ .
Misalkan 1 2 ,( , ,.., )1 2 qv l t ,t ,..,tQ x x x
Pivotal Quantity untuk parameter
(1) (2)
1 1
2 2 2q q
m m
m m
v r r,v=1,2,..., l+ q
.
-
23
9. Menyelesaikan persamaan dalam probabilitas
(1) ( 2 )1 1
1 2 .( , ) 1 , 1, 2,..... 2 2, ,..,q q
m m
m m
v v 1 2 q vl r rP a Q t ,t ,..,t b v l + qx x x
10. Menghitung panjang interval konfidensi 1 yaitu :
,v va b
11. Membentuk fungsi Lagrange :
, , ( , ) ( ) ( ) (1 )v v v v v vG a b a b b a
dimana fungsi kumulatif distribusi dari pivotal quantity, dan
konstanta
Lagrange.
12. Melakukan optimasi terhadap fungsi Lagrange dengan
menghitung
derivatif parsial:
, ,0
v v
v
G a b
a
, ,0
dv dv
dv
G a b
b
, ,0
dv dvG a b
13. Dari langkah (13) diatas diperoleh interval konfidensi (1 )
100% untuk
parameter v .
3.4.2 Aplikasi pada Data Persentase Kemiskinan dan Pengeluaran
per Kapita
Makanan di Jawa Timur
Tujuan kedua dari tesis ini yaitu mengestimasi model data
kemiskinan di
Provinsi Jawa Timur dan mengetahui variabel-variabel yang
berpengaruh
menggunakan interval konfidensi parameter model regresi
semiparametrik
birespon dengan pendekatan spline truncated. Untuk menjawab
tujuan kedua,
dilakukan langkah-langkah sebagai berikut :
1. Menguji korelasi variabel persentase kemiskinan dan
pengeluaran per
kapita makanan.
2. Membuat scatter plot antara variabel respon dengan variabel
prediktor.
-
24
3. Menentukan variabel komponen parametrik berdasarkan pola data
antara
variabel respon dan prediktor.
4. Menentukan variabel komponen nonparametrik berdasarkan pola
data
antara variabel respon dan variabel prediktor.
5. Memodelkan data menggunakan regresi semiparametrik birespon
spline
truncated linier, dimana spline yang digunakan adalah satu knot,
dua knot,
tiga knot dan kombinasi knot.
6. Memilih titik knot optimal dengan metode GCV.
7. Menghitung MSE dan R2 sebagai bagian dari kriteria kebaikan
model.
8. Menghitung interval konfidensi untuk parameter model
regresi
semiparametrik birespon dengan pendekatan spline truncated
linier.
9. Mengambil kesimpulan dengan menentukan variabel prediktor
yang
berpengaruh secara signifikan terhadap variabel respon.
-
25
BAB 4
PEMBAHASAN
4.1 Kajian Interval Konfidensi untuk Parameter Model Regresi
Semiparametrik Birespon dengan Pendekatan Spline Truncated
Konstruksi interval konfidensi dapat dilakukan dengan
beberapa
pendekatan, salah satu pendekatan adalah Pivotal Quantity.
Pivotal Quantity
merupakan sebuah statistik yang fungsi distribusinya tidak
memuat parameter.
Langkah yang harus dilakukan untuk mendapatkan interval
konfidensi untuk
parameter model regresi yaitu mendapatkan estimasi dari
parameter dan mencari
distribusi dari parameter. Pengestimasian parameter regresi
birespon
semiparametrik dengan pendekatan spline truncated dalam
penelitian ini dibahas
dengan menggunakan metode Weighted Least Square.
Diberikan data berpasangan (1) (2)
1 2 1 2( , ,.., , , ,.., , , )l qx x x t t t y y yang
mengikuti
model regresi :
1 2( , ,.., ,l 1 2 qx x x t ,t ,..,t ) y f ε (4.1)
dengan :
(d) (d) (d) (d)1 2, , 1, 2T
ny y y d
(1)
(2)
yy y
y
(1)
1 2
1 2 (2)
1 2
( , ,.., ,( , ,.., ,
( , ,.., ,
l 1 2 q
l 1 2 q
l 1 2 q
x x x t ,t ,..,t )x x x t ,t ,..,t )
x x x t ,t ,..,t )
ff
f
(d)
1 1 2
(d)
2 1 2(d)
1 2
(d)
1 2
( , ,.., ,
( , ,.., ,( , ,.., , , 1, 2
( , ,.., ,
l 1 2 q
l 1 2 q
l 1 2 q
n l 1 2 q
f x x x t ,t ,..,t )
f x x x t ,t ,..,t )x x x t ,t ,..,t ) d
f x x x t ,t ,..,t )
f
(1)
( ) (d) (d) (d)
1 2(2), , 1, 2
Td
n d
εε ε
ε.
Model regresi pada persamaan 4.1 diasumsikan bersifat aditif
dengan penjabaran
sebagai berikut.
-
26
1 2
0 0
( , ,.., , ) ( ) ( )ql
i i li 1i 2i qi j ji m mi
j m
x x x t ,t ,..,t x t
f g η (4.2)
dimana 1
( )l
j ji
j
x
g adalah komponen parametrik dengan banyaknya variabel
prediktor sejumlah l dan 1
( )q
m mi
m
t
η adalah komponen nonparametrik dengan
banyaknya variabel prediktor sejumlah q. Kurva komponen
parametrik dengan l
variabel prediktor didekati dengan fungsi linier
10 11 1 12 1 1
0
( ) ...l
j ji i i l li
j
x x x x
g ω ω ω ω (4.3)
dengan
(1)
(2)( )
ji
ji
ji
g (x )x
g (x )
g
(1)
1
1 (2)
1
, 0,1, 2,...,j
j
j
j l
ω
dimana , 1,2,...,j j l merupakan parameter komponen parametrik
linier. Persamaan
(4.3) dapat dinyatakan dalam bentuk matriks menjadi
1 2 1( , ,..., )lx x x g Xω (4.4)
dengan
(1)
1 2 (2)( , ,..., ) 1 2 ll
1 2 l
(x ,x ,...,x )x x x
(x ,x ,...,x )
gg
g
(d)
1 1 1
(d)
(d) 2 2 2
(d)
ln
, d 1,2
1 2 l
1 2 l
1 2 l
1n 2n
g (x ,x ,...,x )
g (x ,x ,...,x )(x ,x ,...,x )
g (x ,x ,...,x )
g
11 21 1
(1)12 22 2(1) (2)
(2)
1 2 2
1
10,
0
1
l
l
n n l
x x x
x x x
x x x
XX X X
X
-
27
Kurva komponen nonparametrik dengan q variabel prediktor
didekati dengan
fungsi spline truncated linier. ( )mitη merupakan suatu vektor
yang terdiri dari fungsi
spline truncated untuk variabel prediktor ke-m pada respon 1 dan
respon 2
(d) (d) (d) (d) (d) (d) (d) (d) (d)
20 21 22 1 23 2 2( 1)(t ) t (t ) (t ) ... (t )m m m m mm mi mi
mi m mi m r mi rmK K K
(d) (d) (d) (d)
20 21 2( 1)
1
= t (t )m m m
r
mi k mi km
k
K
(4.5)
dengan (d) (d)
(d)
(d)
(t ), t(t )
0 , t
mi km mi km
mi km
mi km
K KK
K
.
Sehingga ( )
1
( )q
d
m mi
m
t
dapat dituliskan kembali sebagai berikut.
( ) (d) (d) (d)
21 2( 1)
1 1 1 1
( ) t (t )d
m m
rq q qd
m mi mi k mi km
m m m k
t K
(4.6)
Persamaan (4.6) dapat dituliskan dalam notasi matriks pada
persamaan (4.7).
( ) ( ) ( )( )
d d dη t Z ω (4.7)
Persamaan (4.7) merupakan fungsi regresi nonparametik yang
didekati dengan
spline truncated linier untuk variabel respon ke-d, penulisan
untuk fungsi regresi
birespon dapat dituliskan dalam persamaan (4.8).
2( )t η Zω (4.8)
dengan
(1) (2)( ) ( ) ( )T
η t η t η t ,
(d)
1 1 1
(d)
2 2 2(d)
(d)
, d 1,2
1 2 q
1 2 q
1n tn qn
(t ,t ,...,t )
(t ,t ,...,t )( )
(t ,t ,...,t )
η t
(1)
(2)
0,
0
Z
ZZ
-
28
1 1 111 11 11
(d) 2 2 112 12 12
1 1 1 1
(d) (d)(d) (d)111 1(d) (d)(d) (d)111 1
(d) (d) (d) (d)11 1 1
(t ) (t )(t ) (t )
(t ) (t )(t ) (t )
(t ) (t ) (t ) (t )
q q q
q q q
n n n qn qn q
tt q qrr
tt q qrr
t tr q qr
K KK K
K KK K
K K K K
Z
(1) (2)2 2T
ω ωω
1 1 2 21 2( )2 21 22 21 22 21 222( 1) 2( 1) 2( 1) q q qdT
r r r ω
Pada persamaan (4.3) dan (4.6), masing-masing telah diberikan
fungsi regresi
untuk komponen parametrik dan fungsi regresi dengan pendekatan
spline truncated
untuk komponen nonparametrik, kedua persamaan tersebut ditulis
kembali dengan
berdasarkan persamaan (4.2) dan (4.1) pada persamaan (4.9)
berikut.
1
2
(1) (1) (1) (1) (1) (1) (1) (1)
10 0 11 1 1 21 2( 1)
1 1 1
(2) (2) (2) (2) (2) (2) (2) (2)
10 0 11 1 1 21 2( 1)
1 1 1
... t (t )
... t (t )
m m
m m
rq q
i i i l li mi k mi km i
m m k
rq q
i i i l li mi k mi km i
m m k
y x x x K
y x x x K
(4.9)
untuk setiap pengamatan ke-i, i=1,2,...,n. (1)
iy merupakan variabel respon
pengamatan ke-i pada respon pertama, sedangkan (2)
iy merupakan variabel respon
pengamatan ke-i pada respon ke dua . Persamaan (4.9) dapat
ditulis kembali dalam
notasi matriks menjadi:
1 2 y Xω Zω ε (4.10)
Karena adanya syarat terpenuhinya korelasi antara variabel
respon satu dengan dua,
maka dibutuhkan matriks pembobot variansi kovariansi dalam
mengestimasi
regresi semiparametrik birespon berdasarkan estimator spline
truncated dengan
meminimumkan kriteria Weighted Least Square (WLS) yaitu
dengan
meminimumkan fungsi berikut:
1 2 1 2L T
Xω Zω Xωy W y Zω= (4.11)
dengan memisalkan 1* y y Xω dengan mengasumsikan 1ω diketahui
maka
persamaan (4.11) dapat ditulis kembali pada persamaan (4.12)
berikut.
-
29
2 2* *L T
ω W yZy Zω= (4.12)
Persamaan (4.12) dapat diuraikan sebagai berikut.
2 2
*
*
2
L
T
T T
T
T T T T
2 2 2 2
T T T T
2 2 2
= y W y
y * Wy *-y * W y
Zω Zω
Zω - ω Z W ω Z WZω
ω Z W
* +
y * Wy * ω+ Z* WZωy
(4.13)
Nilai 2ω̂ dapat diperoleh dengan meminimumkan persamaan (4.13).
Syarat
perlu agar persamaan (4.13) mencapai minimum adalah dengan
memenuhi
2
0L
ω
, sehingga diperoleh :
2
2
2
1
2
*
*
2 0
0
ˆ
L
T
T
T
T
T
T
T
T
Wy * 2Zω
Wy *
Wy
Z Z Wy
- Z WZω
- Z Z WZω
Z WZω Z
ω WZ
(4.14)
Berdasarkan persamaan (4.10) dan (4.14) dengan memisalkan 1* y y
Xω maka
didapatkan nilai dugaan dari *y yaitu ˆ *y dinyatakan pada
persamaan (4.15).
2ˆ* *y A y (4.15)
dengan 2A merupakan matriks hat untuk komponen nonparametrik
yaitu
1
2
TTA Z WZ ZWZ .
Mengacu pada persamaan (4.11), nilai dugaan untuk 1ω didapat
dengan
pendiferensialan fungsi L dengan menggunakan metode WLS dengan
penguraian
fungsi L sebagai berikut.
-
30
1 2 1 2
2 2 2
1 2 1 1 2
2
2 2 2 2
2 21 1 2 2
2
1
( ) ( )
T
T T T
T T T
T T
T
T
T
L
1
T
1
T
T
1
1
= y W y
y y W y y
(I - A )y - (I - A ) W (I - A )y - (I - A )
y (I - A ) W(I - A )y y (I - A
Xω Zω Xω Zω
Xω
) W(I - A )
(I - A ) W(I - A )y (I - A ) W(I - A )
Xω Xω Xω
Xω Xω
Xω
ω
y (I - A
X ω
W
X
(
X
)
ω
A A
12 2 2
21 2
2
T T
T T
T
T
1
I - A )y (I - A ) W(I - A )y
(I - A ) W(
ω X
I - Aω )X Xω
(4.16)
Selanjutnya, Syarat perlu agar persamaan (4.16) mencapai minimum
adalah
dengan memenuhi 1
0L
ω
, sehingga diperoleh :
2 2 2 2
2 2 2 2
2 2 2 2
1
2 0
0
2
T T
T T
T T
T
T T
TTT
L
1
1
1
(I - A ) W(I - A )y (I - A ) W(I - A )
(I - A ) W(I - A )y (I - A ) W(I - A )
(
X X Xωω
X
I - A ) W(I - A ) (
X Xω
X Xω I - A ) W(I - AX )y
2 2 21
2ˆ T TT T
1 (I - A ) W(I - A ) (I - A ) W(I -X X X Aω )y (4.17)
Setelah mendapatkan nilai dugaan dari parameter 1ω dan 2ω ,
selanjutnya
didapatkan persamaan untuk menghitung ŷ dengan mensubtitusikan
nilai 1ω̂ dan
2ω̂ sebagai berikut.
1
1
2 2 2 2
2
1 2
1
1
2 2 2
*
ˆ ˆ ˆ
T T
T
T T
T T T
T T
T T
T
T
Z Z W y
Z Z W
Xω Zy
(I - A ) W(I - A ) (I - A ) W(I - A )y Z WZ
(I - A ) W(I - A ) (I - A ) W(
ω
X X X X
X X X X I - A )y Z WZ
21
2 2 2
T T T T
X X Xy X (I - A ) W(I - A ) (I - A ) W(I - A )y (4.18)
Misalkan 21
1 2 2 2
T TT T
(I - A ) W(I - A )A X X (I - A ) WX (I - AX ) merupakan
matriks hat untuk komponen parametrik, sehingga persamaan (4.18)
dapat ditulis
kembali pada persamaan (4.19).
-
31
=
ˆ
I
I
I
-1T T
-1T T
-1T T
T
1 1
1 1
1 1
1 1
T
T
2
Z Z W
Z Z W
Z Z W
A Ay y + Z WZ y - y
y + Z WZ - y
Z WZ -
A A
A
A
A
A - A
y
y
(4.19)
Jika I 1 12A A -A A , maka persamaan (4.19) dapat ditulis dalam
bentuk lain
berikut.
ˆ y Ay (4.20)
dengan A merupakan matriks hat gabungan antara komponen
parametrik dan
nonparametrik atau dapat disebut matriks hat semiparametrik.
Untuk memudahkan konstruksi interval konfidensi untuk parameter
regresi
birespon semiparametrik, persamaan (4.10) dapat disederhanakan
pada persamaan
(4.21) berikut.
y Cω ε (4.21)
dengan X ZC dan 1 2T
T T ω ωω .
Teorema 7.
Jika diberikan ( , )f x,t ω Cω merupakan fungsi dari x, t , dan
ω dimana
( , )f x,t ω merupakan fungsi regresi semiparametrik birespon,
maka
1
ˆ
TT
C Wyω C WC merupakan penduga dari ω .
Bukti.
Nilai ω̂ didapatkan dengan metode WLS yaitu sebagai berikut.
2
T T T T
T TT T
T
T
T
L
Tω ω
ω C ω
= y C W y C
y ω C ω
ω C
Wy Wy y WC WC
y Wy W ω Cy WCω
dengan menderivatifkan 0L
ω, didapat:
-
32
1
2
ˆ
2
0
T T
T T
T T
T T
L
C C ωω
C C ω
C ω C
ω
Wy WC
Wy WC
WC Wy
WCC C Wy
sehingga
1
ˆ
TT C Wyω C WC (4.22)
Lemma 1.
Jika 2 1
~ ( , )N
ε 0 W , sehingga 2 1
~ ( , )N
Cωy W , maka 2 1ˆ ~ ( , )( )N Tω ω C WC .
Bukti :
Model pada persamaan (4.21) dengan asumsi 2 1
~ ( , )N
ε 0 W maka
2 1~ ( , )N
Cωy W , oleh karena y berdistribusi normal, maka persamaan
(4.22)
yang merupakan kombinasi linier dari y juga berdistribusi normal
dengan nilai
harapan dan variansinya dicari berikut.
1
1
1
= ( )
ˆ
=
E
E
E
T
T
T
T
T
T
C Wy
C W y
C W
ω C WC
C WC
C WC Cω
ω
(4.23)
1
1 1
1 12 1
1 12
12
( )
ˆ
T
T
Var
Var
I
Var
T
T T
T T
T
T
T T
T T
T T
T
C Wy
C W y C W
C W W C W
C
ω C WC
C WC C WC
C WC C WC
C WC WC C WC
C WC
(4.24)
-
33
Dengan memperhatikan persamaan (4.23) dan (4.24), maka ˆ ~ ( ,
)Nω ω Σ , dengan
1
2
TΣ C WC . Selanjutnya, akan dirancang interval konfidensi (1 )
100%x
untuk v , (1) (2)
1 1
1, 2,..., (2 2 2 )q q
m m
m m
v l q r r
untuk kasus variansi error (
2 1 W ) diketahui dan variansi error ( 2 1 W ) tidak
diketahui.
4.1.1 Interval Konfidensi Saat Asumsi Variansi Error ( 2 1 W )
Diketahui
Pada subbab ini dibahas mengenai konstruksi interval konfidensi
terpendek
(1 ) 100%x untuk v , (1) (2)
1 1
1, 2,..., (2 2 2 )q q
m m
m m
v l q r r
untuk kasus
variansi error ( 2 1 W ) diketahui.
Teorema 8.
Jika 1 2 1 2
ˆ( , , ..., , t , t , ..., t )
v v
v l l
vv
Z x x x
ω ω
merupakan suatu pivotal quantity dengan
asumsi variansi eror diketahui , maka interval konfidensi untuk
v
ω diberikan oleh:
/2 /2ˆ ˆ( ) 1
v vv v v vvP Z Z
ω ω ω .
Bukti:
Diambil sebuah transformasi yang merupakan pivotal quantity
dengan
asumsi variansi eror diketahui:
1 2 1 2
ˆ( , ,..., , t , t ,..., t ) v vv l l
vv
Z x x x
ω ω (4.25)
dengan vv merupakan elemen diagonal ke-v dari Σ . Variabel
random Z ~ (0,1)v N
karena merupakan kombinasi linier dari ˆ vω dengan pembuktian
nilai ekspektasi
dan variansinya sebagai berikut.
ˆ
1ˆ
0
E Z E
E E
v vv
vv
v v
vv
ω ω
ω ω
-
34
2
ˆ
1ˆ
1 0
1
Z v vvvv
v v
vv
vv
vv
Var Var
Var Var
ω ω
ω ω
Karena Σ diketahui maka Zv merupakan pivotal quantity untuk
parameter regresi
ˆ .vω Interval konfidensi (1 ) dapat diperoleh dengan
menyelesaikan persamaan
dalam probabilitas
1 2 1 2 l( ( , ,..., , t , t ,..., t ) ) 1v v l vP a Z x x x
b
dengan va dan vb merupakan elemen bilangan riil, v va b .
Apabila persamaan
(4.25) disubstitusi pada persamaan (4.26), maka bentuknya
menjadi
ˆ( ) 1v vv v
vv
P a b
ω ω (4.26)
Persamaan (4.26) jika ditulis kembali akan didapatkan interval
konfidensi untuk
parameter model regresi birespon semiparametrik berikut:
ˆ ˆ( ) 1v v vv v v v vvP b a ω ω ω (4.27)
Konsep yang digunakan pada penelitian ini yaitu interval
konfidensi terpendek
sehingga nilai va dan vb harus ditentukan dan memenuhi kondisi
dimana panjang
interval konfidensi ( ( , )v va b ) terpendek didapatkan.
Interval konfidensi terpendek
didapat dengan menyelesaikan optimasi bersyarat berikut dengan
metode lagrange
, ,{ ( )} {( ) }
v v v v vv
v v v va b R a b Ra ,b a bMin Min
(4.28)
dengan syarat
( ) 1v
v
b
v va
z dz atau ( ) ( ) (1 ) 0v vb a
merupakan fungsi probabilitas (0,1)N dan merupakan fungsi
probabilitas
kumulatif (0,1)N . Langkah selanjutnya untuk mendapatkan nilai
va dan vb maka
-
35
dilakukan derivatif parsial terhadap fungsi Langrange yang
dibentuk pada
persamaan (4.29)
( , , ) ( ) ( ( ) ( ) (1 ))v v v v vv v vF a b b a b a
(4.29)
dengan merupakan konstanta lagrange. Berikut adalah derivatif
parsial fungsi
lagrange pada persamaan (4.29) terhadap masing-masing , ,v va b
dan .
( , , )
'( ) 0v v vv vv
F a ba
a
(4.30)
( , , )
'( ) 0v v vv vv
F a bb
b
(4.31)
( , , )( ) ( ) (1 ) 0v v v v
v
F a bb a
b
(4.32)
Berdasarkan persamaan (4.30) dan (4.31) diperoleh
'( ) 0
'( ) 0
'( ) '( ) 0
'( ) '( ) 0
( ) ( )
vv v
vv v
v v
v v
v v
a
b
b a
b a
b a
(4.32)
Penyelesaian persamaan (4.32) adalah v vb a atau v vb a , tetapi
penyelesaian
yang memenuhi kondisi distribusi normal standar yaitu v vb a
sehingga jika
penyelesaian tersebut disubstitusikan pada persamaan (4.27) maka
persamaan
tersebut dapat ditulis kembali menjadi
ˆ ˆ( ) 1v v vv v v v vvP b b ω ω ω (4.33)
dimana vb diperoleh dari ( )2v
v vb
z dz
atau dalam aplikasi sering ditulis dengan
2
Z yang nilainya dapat dilihat dalam tabel distribusi normal
standar sehingga
persamaan (4.33) dapat ditulis kembali pada persamaan
(4.34).
/2 /2ˆ ˆ( ) 1v vv v v vvP Z Z ω ω ω (4.34)
-
36
4.1.2 Interval Konfidensi Saat Asumsi Variansi Error ( 2 1 W )
Tidak
Diketahui
Pada subbab ini dibahas mengenai konstruksi interval konfidensi
terpendek
(1 ) 100%x untuk v , (1) (2)
1 1
1, 2,..., (2 2 )q q
m m
m m
v l q r r
untuk kasus variansi
error ( 2 1 W ) tidak diketahui.
Teorema 9.
Jika 1 2 1 2
2
ˆ( , ,..., , t , t ,..., t ) v vv l l
vv
T x x xr
ω ω merupakan suatu pivotal quantity dengan
asumsi variansi eror ( 2 1 W ) tidak diketahui, maka interval
konfidensi untuk vω
adalah:
1 1
, ,2 2
ˆ ˆ( ) 1
T T
vv vvv v vc cc c
r rP t t
T TT Ty C W y y CI - C I - C W yC WC C WC
ω ω ω
dengan (1) (2)
1 1
2 2 2 2q q
m m
m m
c n l q r r
.
Bukti:
Pivotal quantity dengan asumsi 2 1 W tidak diketahui didapatkan
pada
persamaan (4.36).
1 2 1 22
ˆ( , ,..., , t , t ,..., t ) v vv l l
vv
T x x xr
ω ω (4.36)
di mana vvr merupakan elemen diagonal ke v dari matriks 1
TC WC . Variabel
random ( )~ aB
T tA
a
, jika dan hanya jika memenuhi tiga syarat yaitu ~ (0,1)B N
, ( )A ~ a , dan A dan B independen. Persamaan (4.36) agar
menyerupai bentuk
BT
A
a
dapat diubah menjadi persamaan (4.37) berikut.
-
37
1 2 1 22
2
1ˆ
( , ,..., , t , t ,..., t )1
ˆ
vvv vv l l
vvvv
v v
vv
rT x x x x
rr
r
ω ω
ω ω (4.37)
Karena 2 tidak diketahui, maka nilai 2 didekati dengan MSE.
1 1
(1) (2)
1 1
(1) (2)
1 1
(1) (2)
1 1
2 2 2 2
ˆ ˆ
2 2 2 2
ˆ ˆ
2 2 2 2
q q
m m
m m
q q
m m
m m
q q
m m
m m
n l q r r
MSE
n l q r r
n l q r r
T TT
T
T
T
Ty - C C Wy C yy C W-
(y - y
C WC C WC
) (y - y)
(y - Cω) (y - Cω)
1
(
1
1
1) (2)
1 1
(1) (2)
1 1
1
2 2 2 2
2 2 2 2
q q
m m
m m
T
q q
m m
m
T
m
n l q r r
n l q r r
T T
T
T
T
T T
T T
C W y C W y
y C W
I - C I -
C W y
C
I - C I - C
C WC C WC
C WC C WC
(4.38)
Matriks T T T
y A Ay y Ay jika A merupakan matriks idempoten, matriks A
pada
persamaan (4.38) yaitu 1
TT CA C WI - C WC . Berikut adalah pembuktian
matriks A merupakan matriks idempoten sesuai dengan Teorema 2
:
1 1
1 1 1
1 1
2
2
T T
T T T
T T
T T
T T T
T T
AA I C I C
I C C C
I C
C W C W
C W C W C W
C W C WCI
C WC C WC
C WC C WC C WC
C WC C WC
`
1
TT C WI C C WC (4.39)
-
38
Matriks A terbukti merupakan matriks idempoten sehingga
persamaan (4.38) dapat
ditulis kembali pada persamaan (4.40).
(1) (2
1 1
1
)2 2 2 2
q q
m m
m m
T
n l q r r
MSE
TTyI Cy C- WC WC
(4.40)
Mengacu pada persamaan (4.37) dan (4.40), maka pivotal quantity
untuk parameter
ˆvω adalah sebagai berikut:
(1) (2)
1
1
1
1 2 1 2
2 2 2 2
ˆ
( , ,..., , t , t ,..., t )T
q q
m m
m m
v v
vv
v l l
n l q r r
rT x x x
TTI - Cy C W yC WC
ω ω
2
1
2
(1) (2)
1 1
ˆ
2 2 2 2
T
v v
vv
q q
m m
m m
r
n l q r r
TTI - Cy C W yC WC
ω ω
(4.41)
Selanjutnya, akan dibuktikan bahwa 1 2 1 2 ( )( , ,..., , t , t
,..., t ) ~v l l aT x x x t dengan
derajat bebas (1) (2)
1 1
2 2 2 2q q
m m
m m
n l q r r
.
1. Misalkan 2
ˆv v
vv
Zr
ω ω, karena Z merupakan kombinasi linier dari ˆ vω , maka Z
berdistribusi normal dengan mean ( )E Z dan Var( )Z :
2
2
2
ˆ( )
1ˆ
1
0
v v
vv
v v
vv
v v
vv
E Z Er
Er
r
ω ω
ω ω
ω ω
-
39
2
2
2
2
ˆ( )
1ˆ
1
v v
vv
v v
vv
vv
vv
Var Z Varr
Varr
r
r
ω ω
ω ω
Sehingga terbukti bahwa Z ~ (0,1)N .
2. Jika 2 1~ ( , )N y Cω W , sesuai dengan Teorema 5, maka
2
2
12,2
~h
T
T
Cω ACω
y Ayjika dan hanya jika A idempoten dengan h adalah rank
dari A. Pembuktian bahwa A idempoten telah dibuktikan pada
persamaan
(4.39). Selanjutnya, dicari rank dari A.
(1) ( 2)
1 1
2
2
1
1
1
1
2 2
( )
( )
2
2
q q
m m
m m
n
l q r r
rank rank
trace
trace trace
n trace
n trace I
T
T
T
T
T
T
T
T
A I - C C W
C W
C
I - C
I C W
C CW
C WC
C WC
C WC
C WC
(1) (2)
1 1
2 2 2 2q q
m m
m m
n l q r r
Setelah mendapatkan rank dari A, akan dihitung 2
1( )
2
T
Cω ACω
1
1
2 2
2
2
1 1( ) ( )
2 2
1
2
1
2
0
T T
T T T T
T T T T
T
T
T
T
Cω ACω Cω I - C Cω
ω C
C
Cω ω C C Cω
ω C C
W
C W
ω ω C CIω
C WC
C WC
-
40
Sehingga (1) ( 2)
2 2 2 2
1 1
~q q
n l q r rm mm m
Ty Ay .
3. Jika 2~ ( , )N y Cω W maka By dan
Ty Ay independen sesuai dengan Teorema 6
jika dan hanya jika 0BA , dengan 1
ˆ
TT C Wy Byω C WC sehingga
1
TTB C WC WC
1 1
1 1 1
1 1
0
T T
T T T
T T
T T
T T T
T T
C W C W
C W C W C W
B
C W C W
A I - C
C
C WC C WC
C WC C WC C WC
C WC C WC
Berdasarkan uraian tersebut pada poin 1, 2, dan 3 dapat ditarik
kesimpulan bahwa
(1) ( 2)
1 1
(2n 2 2 2 )
~ q qm m
m m
vl q r r
T t
dan merupakan pivotal quantity untuk parameter model
regresi ω̂ saat 2σ W tidak diketahui. Interval konfidensi (1 )
dapat diperoleh
dengan menyelesaikan persamaan dalam probabilitas
1 2 1 2 l( ( , ,..., , t , t ,..., t ) ) 1v v l vP a T x x x
b
dengan va dan vb merupakan elemen bilangan riil, v va b .
Apabila persamaan
(4.41) disubstitusi pada persamaan (4.42) maka interval
konfidensi dapat ditulis
sebagai berikut.
1
(1) (2)
1 1
ˆ( ) 1
2 2 2 2
T
v vv v
vvq q
m m
m m
P a b
r
n l q r r
TTI - Cy C W y
ω
WC
ω
C
(4.42)
Persamaan (4.42) jika ditulis kembali akan didapatkan interval
konfidensi untuk
parameter model regresi birespon semiparametrik berikut:
-
41
1
1
(1) (2)
1 1
(1) (2)
1 1
ˆ(
2 2 2 2
ˆ ) 1
2 2 2 2
T
T
v v vv vq q
m m
m m
v v vvq q
m m
m m
P b r
n l q r r
a r
n l q r r
T
T
T
T
I -y C W y
y C W y
C
I - C
C WC
C WC
ω ω
ω
(4.43)
Konsep yang digunakan pada penelitian ini yaitu interval
konfidensi terpendek
sehingga nilai va dan vb harus ditentukan dan memenuhi kondisi
dimana panjang
interval konfidensi ( ( , )v va b ) terpendek didapatkan.
Interval konfidensi terpendek
didapat dengan menyelesaikan optimasi bersyarat berikut dengan
metode lagrange
1
(1) (2)
1 1
, ,{ ( )} ( )
2 2 2 2
v v v v
v v v
T
v
vvq q
m m
m m
a b R a b Ra ,b a b r
n l q r r
Min Min
TTI - CCy W yC WC
(4.44)
dengan syarat
(t ) 1v
v
b
v va
dt atau ( ) ( )