HALAMAN JUDULrepository.its.ac.id/50710/1/1316201016_Master_Thesis.pdfatas dasar harga berlaku. Model diperoleh dengan GCV minimum sebesar 4,189, MSE sebesar 2,698 dan nilai 𝑅2

HALAMAN JUDUL

TESIS – SS14 2501

INTERVAL KONFIDENSI UNTUK PARAMETER MODEL REGRESI SEMIPARAMETRIK BIRESPON DENGAN PENDEKATAN SPLINE TRUNCATED (Aplikasi Pada Data Kemiskinan dan Pengeluaran Per Kapita Makanan Provinsi Jawa Timur)

ZAHROTUL AZIZAH NRP. 06211650010016

DOSEN PEMBIMBING Prof. Dr. Drs. I Nyoman Budiantara, M.Si Dr. Ismaini Zain, M.Si

PROGRAM MAGISTER DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA, KOMPUTASI DAN SAINS DATA INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA 2018

HALAMAN JUDUL

TESIS – SS14 2501

CONFIDENCE INTERVAL FOR PARAMETER OF BIRESPONSE SEMIPARAMETRIC REGRESSION MODEL BASED ON SPLINE TRUNCATED APPROACH (Applied on Percentage of Poverty and Food Expenditure per Capita Data in East Java Province)

ZAHROTUL AZIZAH NRP. 06211650010016

SUPERVISOR Prof. Dr. Drs. I Nyoman Budiantara, M.Si Dr. Ismaini Zain, M.Si

MAGISTER PROGRAM STATISTICS DEPARTMENT FACULTY OF MATHEMATICS, COMPUTATION, DAN DATA SCIENCE INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA 2018

v

INTERVAL KONFIDENSI UNTUK PARAMETER MODEL REGRESI

SEMIPARAMETRIK BIRESPON DENGAN PENDEKATAN SPLINE

TRUNCATED

(APLIKASI PADA DATA KEMISKINAN DAN PENGELUARAN PER

KAPITA MAKANAN PROVINSI JAWA TIMUR)

Nama Mahasiswa : Zahrotul Azizah

NRP : 06211650010016

Pembimbing 1 : Prof. Dr. I Nyoman Budiantara, M.Si

Pembimbing 2 : Dr. Ismaini Zain, M.Si

ABSTRAK

Interval konfidensi merupakan salah satu permasalahan penting di dalam

statistika inferensi pada regresi, namun pada interval konfidensi untuk regresi

semiparametrik belum banyak dilakukan. Beberapa penelitian sebelumnya yang

membahas mengenai interval konfidensi parameter model regresi menggunakan

pendekatan bayesian, sedangkan pada penelitian ini konstruksi interval konfidensi

dilakukan dengan metode pivotal quantity, karena dinilai lebih mudah karena tidak

melibatkan distribusi prior. Pendekatan dalam regresi semiparametrik yang

digunakan pada penelitian ini yaitu spline truncated. Pada kasus nyata, jika

ditemukan adanya dua variabel respon yang saling berkorelasi, maka dalam

memodelkan dengan menggunakan regresi dianalisis dengan model regresi

birespon. Selanjutnya, interval konfidensi untuk parameter model regresi birespon

semiparametrik dengan pendekatan spline truncated diaplikasikan pada data

kemiskinan dan pengeluaran per kapita makanan Jawa Timur. Berdasarkan hasil

penelitian dengan tingkat signifikansi sebesar 0,05 diperoleh bahwa persentase

kemiskinan dipengaruhi oleh rata-rata lama sekolah, gini ratio, angka partisipasi

sekolah, tingkat pengangguran terbuka, dan PDRB atas harga berlaku, sedangkan

pengeluaran per kapita makanan dipengaruhi oleh rata-rata lama sekolah dan PDRB

atas dasar harga berlaku. Model diperoleh dengan GCV minimum sebesar 4,189,

MSE sebesar 2,698 dan nilai 𝑅2 sebesar 91,05 %.

Kata kunci : Regresi Semiparametrik Birespon Spline Truncated, Interval

Konfidensi untuk Parameter Regresi, Persentase Kemiskinan, Pengeluaran per

Kapita Makanan.

vi

Halaman ini sengaja dikosongkan.

vii

CONFIDENCE INTERVAL FOR PARAMETER OF BIRESPONSE

SEMIPARAMETRIC REGRESSION MODEL BASED ON SPLINE

TRUNCATED APPROACH

(APPLIED ON PERCENTAGE OF POVERTY AND FOOD

EXPENDITURE PER CAPITA DATA IN EAST JAVA PROVINCE)

Name of Student : Zahrotul Azizah

NRP : 06211650010016

Supervisor : Prof. Dr. I Nyoman Budiantara, M.Si

Co-Supervisor : Dr. Ismaini Zain, M.Si

ABSTRACT

Confidence interval is one of the important problems in inference statistics

of regression, but the confidence interval for semiparametric regression has not

been widely performed. Some previous studies that discussed the confidence

interval of regression model parameters using bayesian approach, whereas in this

research confidence interval construction is done by pivotal quantity method, it is

considered easier because it doesn’t involve prior distribution. The approach in

semiparametric regression used in this study is spline truncated. In the real case, if

there is found the existence of two correlation response variables, then in modeling

used regression method is analyzed by biresponses regression model. Subsequently,

the confidence interval for parameters of semiparametric biresponses regression

model with the spline truncated approach was applied to poverty percentage data

and per capita food expenditure in East Java. Based on the result of the research

with significance level of 0,05, it is found that the percentage of poverty is

influenced by the average of school duration, gini ratio, school participation rate,

open unemployment rate, and GRDP (Gross Regional Domestic Product) over

current price, while per capita food expenditure is influenced by the average of

school duration and GRDP at current price. The model was obtained with minimum

GCV of 4.189, MSE of 2,698 and R2 of 91.05%.

Keywords: Spline Truncated Semiparametric Biresponses Regression, Confidence

Interval for Parameters of Regression, Percentage of Poverty, Per Capita Food

Expenditure.

viii

-Halaman ini sengaja dikosongkan-

ix

KATA PENGANTAR

Puji syukur penulis ucapkan kepada Allah SWT atas rahmat dan kasihNya,

penulis dapat menyelesaikan penulisan Tesis dengan judul “Interval Konfidensi

untuk Parameter Model Regresi Semiparametrik Birespon dengan

Pendekatan Spline Truncated (Aplikasi pada Data Persentase Kemiskinan

dan Pengeluaran Per Kapita Makanan)” ini dengan baik. Tesis ini disusun untuk

memenuhi salah satu syarat memperoleh gelar Magister Sains (M.Si) di Jurusan

Statistika, Fakultas Matematika, Komputasi, dan Sains Data, Institut Teknologi

Sepuluh Nopember Surabaya.

Terselesaikannya Tesis ini tidak lepas dari dukungan berbagai pihak yang

telah memberikan bantuan kepada penulis. Oleh karena itu, pada kesempatan ini

penulis ingin menyampaikan terima kasih kepada:

1. Orang tua penulis, Bapak Masyhudi dan Ibu Mufarokah dan adik penulis,

Ulyatur Rosyidah dan Alifatul Mujahadah yang selalu menyemangati, memberi

motivasi, kasih sayang serta dukungan kepada penulis,

2. Prof. Dr. Drs. I Nyoman Budiantara, M.Si. dan Dr. Ismaini Zain, M.Si, selaku

dosen pembimbing dalam penyusunan Tesis ini, yang telah banyak memberikan

ilmu, saran, dan penuh kesabaran serta bersedia meluangkan waktu untuk

membimbing penulis selama ini,

3. Dr. Vita Ratnasari, M.Si dan Dr. Sutikno, M.Si, selaku dosen penguji, yang

telah banyak memberikan masukan guna kesempurnaan Tesis ini,

4. Dr. Suhartono selaku Ketua Jurusan Statistika dan Dr.rer.pol. Heri Kuswanto,

M.Si., selaku Ketua Program Pascasarjana Jurusan Statistika, yang telah

memberikan waktu untuk mendukung terselesainya Tesis ini,

5. Dr. Setyawan, M.Si, selaku dosen wali penulis yang telah memberikan

dukungan moril dan arahan selama penulis menempuh studi,

6. Bapak dan Ibu dosen Jurusan Statistika, Fakultas Matematika, Komputasi, dan

Sains Data, Institut Teknologi Sepuluh Nopember, yang telah mendidik dan

membekali penulis dengan berbagai ilmu pengetahuan selama masa

perkuliahan, serta seluruh staf administrasi akademik, laboratorium, dan ruang

x

baca Statistika yang telah memberikan pelayanan dan fasilitas selama

perkuliahan,

7. Rekan-rekan pengerjaan Tesis nonparametrik, Imraatil Husni, Alvita R.D.,

Suprapto, Khaerul Umam, Rafael T., dan Fendi A. yang telah berjuang dan

belajar bersama selama pengerjaan Tesis,

8. Dr. Nur Chamidah, M.Si dan Eko Tjahjono, M.Si selaku dosen pembimbing

skripsi penulis dan dosen-dosen S-1 Statistika Unair yang telah memotivasi

penulis untuk melanjutkan studi master,

9. Silvyah rahmi, Jauhara Rana B., dan Bahagiati M. yang telah menjadi keluarga

kedua penulis selama menempuh studi master di Institut Teknologi Sepuluh

Nopember,

10. Bagus Aji S., Umi Tri Ruhana, Della Destylawati, Lussi Agustin, Bayyinah,

Fitriana Dz., dan Aulia Dwi R. yang senantiasa memberi semangat kepada

penulis selama perkuliahan dan pengerjaan Tesis,

11. Rekan seperjuangan Magister Statistika angkatan 2016, terima kasih atas

kerjasama, saran, dan kebersamaannya,

12. Semua pihak yang tidak dapat disebutkan satu persatu, yang telah membantu

dan menyumbangkan pikiran guna terselesaikan Tesis ini.

Penulis menyadari bahwa dalam tulisan Tesis ini masih banyak kekurangan,

sehingga kritik dan saran yang bersifat membangun dari berbagai pihak sangat

diharapkan demi penulisan yang lebih baik lagi di masa yang akan datang. Semoga

tulisan ini memberikan manfaat bagi semua dan bermanfaat untuk pengembangan

ilmu pengetahuan khususnya di bidang Statistika.

Surabaya, Januari 2018

Penulis

xi

DAFTAR ISI

HALAMAN JUDUL ...................................................................................... i

HALAMAN PENGESAHAN ........................................................................ iii

ABSTRAK ...................................................................................................... v

ABSTRACT .................................................................................................... vii

KATA PENGANTAR .................................................................................... ix

DAFTAR ISI ................................................................................................... xi

DAFTAR TABEL .......................................................................................... xiii

DAFTAR GAMBAR ...................................................................................... xv

BAB 1 PENDAHULUAN .............................................................................. 1

1.1 Latar Belakang ..................................................................................... 1

1.2 Rumusan Masalah ................................................................................ 4

1.3 Tujuan Penelitian ................................................................................. 4

1.4 Manfaat Penelitian ............................................................................... 5

1.5 Batasan Masalah................................................................................... 5

BAB 2 TINJAUAN PUSTAKA ..................................................................... 7

2.1 Analisis Regresi ................................................................................... 7

2.2 Spline Truncated .................................................................................. 8

2.2.1 Spline Truncated dalam Regresi Nonparametrik ....................... 8

2.2.2 Spline Truncated dalam Regresi Semiparametrik ..................... 9

2.3 Regresi Semiparametrik Birespon Spline Truncated ........................... 9

2.4 Pemilihan Titik Knot Optimal .............................................................. 12

2.5 Interval Konfidensi Parameter Regresi ................................................ 12

2.6 Weighted Least Square ........................................................................ 14

2.7 Aljabar Matriks .................................................................................... 15

2.8 Persentase Kemiskinan, Pengeluaran Per Kapita Makanan, dan Faktor

yang diduga Berpengaruh .................................................................... 16

BAB 3 METODOLOGI PENELITIAN ....................................................... 19

3.1 Sumber Data ......................................................................................... 19

3.2 Variabel Penelitian ............................................................................... 19

xii

3.3 Struktur Data Penelitian........................................................................ 20

3.4 Tahapan Penelitian ............................................................................... 21

BAB 4 HASIL DAN PEMBAHASAN

4.1 Kajian Interval Konfidensi untuk Parameter Model Regresi

Semiparametrik Birespon dengan Pendekatan Spline Truncated........ 25

4.1.1 Interval Konfidensi saat Variansi Eror Diketahui ....................... 33

4.1.2 Interval Konfidensi saat Variansi Eror Tidak Diketahui ............. 36

4.2 Aplikasi pada Data Persentase Kemiskinan dan Pengeluaran per Kapita

Makanan di Provinsi Jawa Timur ......................................................... 43

4.2.1 Deskriptif Persentase Kemiskinan, Pengeluaran Per Kapita Makanan dan

Faktor yang Diduga Mempengaruhinya ................................................... 43

4.2.2 Pengujian Korelasi Antar Variabel Respon ........................................... 50

4.2.3 Identifikasi Variabel Komponen Parametrik dan Nonparametrik .......... 50

4.2.4 Aplikasi Data Model Regresi Semiparametrik Birespon dengan

Pendekatan Spline Truncated ................................................................... 52

BAB 5 KESIMPULAN DAN SARAN

5.1 Kesimpulan .......................................................................................... 57

5.2 Saran .................................................................................................... 58

DAFTAR PUSTAKA ............................................................................... .... 59

Lampiran .......................................................................................................... 65

xiii

DAFTAR TABEL

Tabel 2.1 Penelitian Sebelumnya terkait Faktor-faktor yang Memengaruhi

Kemiskinan ........................................................................................ 17

Tabel 3.1 Variabel Penelitian ............................................................................... 19

Tabel 3.2 Struktur Data Penelitian ....................................................................... 20

Tabel 4.1 Statistika Deskriptif Variabel Penelitian .............................................. 43

Tabel 4.2 Tabel Identifikasi Linieritas dengan Scatter Plot ................................. 50

Tabel 4.3 Tabel Identifikasi Linieritas dengan Ramsey Test ................................ 51

Tabel4.4 Hasil Identifikasi Komponen Parametrik dan Nonparametrik Berdasarkan

Hasil Uji Ramsey .................................................................................. 52

Tabel 4.5 Nilai GCV untuk Spline Linear Satu Knot ........................................... 53

Tabel 4.6 Interval Konfidensi untuk Parameter ................................................... 54

xiv

-Halaman ini sengaja dikosongkan-

xv

DAFTAR GAMBAR

Gambar 4.1 Persentase Kemiskinan Berdasarkan Kabupaten/Kota di Jawa Timur

Tahun 2015 ...................................................................................... 45

Gambar 4.2 Pengeluaran per Kapita Makanan berdasarkan Kabupaten/kota di

Jawa Timur 2015 .............................................................................. 47

Gambar 4.3 Scatter Plot Variabel Persentase Kemiskinan dan Variabel yang

Diduga Berpengaruh ........................................................................ 48

Gambar 4.4 Scatter Plot Variabel Pendapatan per Kapita Makanan dan Variabel

yang Diduga Berpengaruh................................................................ 49

xvi

Halaman ini sengaja dikosongkan.

1

BAB 1

PENDAHULUAN

1.1 Latar Belakang

Interval konfidensi merupakan salah satu persoalan yang penting dalam hal

inferensi regresi (Nafi’ dan Budiantara, 2008). Interval konfidensi untuk parameter

model regresi digunakan pada penentuan variabel prediktor yang signifikan

berpengaruh terhadap variabel respon dengan melihat jika interval konfidensi

memuat nilai nol, maka variabel prediktor tidak berpengaruh secara signifikan

terhadap variabel respon. Interval konfidensi untuk parameter model regresi

parametrik telah dilakukan, namun konstruksi interval konfidensi untuk parameter

model regresi semiparametrik belum banyak dilakukan.

Konstruksi interval konfidensi regresi nonparametrik dilakukan oleh

beberapa peneliti seperti Wahba (1983) dan Wang (1998) untuk model regresi

spline smoothing menggunakan pendekatan bayesian yang melibatkan distribusi

prior improper sehingga secara matematis sulit dilakukan. Pendekatan yang dinilai

lebih mudah dibandingkan pendekatan bayesian dalam hal konstruksi interval

konfidensi yaitu pendekatan pivotal quantity dimana pada pendekatan ini tidak

melibatkan distribusi prior sehinga diperoleh model yang sederhana dan inferensi

statistika yang relatif mudah (Eubank, 1988). Peneliti yang menggunakan

pendekatan pivotal quantity untuk konstruksi interval konfidensi yaitu Loklomin

(2017) menggunakan metode untuk konstruksi interval konfidensi untuk parameter

model regresi semiparametrik, namun dalam hal ini hanya melibatkan satu respon

sehingga belum mengakomodasi interval konfidensi untuk regresi semiparametrik

birespon, padahal menurut Welsh dan Yee (2006), birespon merupakan masalah

yang menarik dibahas karena kedua variabel responnya saling berkorelasi.

Beberapa metode estimasi yang terdapat dalam regresi semiparametrik

antara lain spline, kernel, lokal linier, polinomial lokal, dan deret fourier (Hardle,

1990). Namun, dari beberapa metode estimasi tersebut, spline merupakan metode

yang paling diminati oleh peneliti dalam bidang regresi semiparametrik, hal

tersebut didasari karena spline memiliki interpretasi statistik dan visual yang sangat

baik (Eubank, 1999; Budiantara 2009). Spline merupakan potongan polinomial

2

tersegmen sehingga memiliki fleksibilitas lebih dari polinomial biasa, oleh karena

itu spline memiliki kelebihan lebih efektif dalam hal penyesuaian diri terhadap

karakteristik lokal suatu data (Fajriyyah dan Budiantara, 2015). Salah satu basis

fungsi yang digunakan pada spline yaitu spline truncated (Lyche and Morken,

2008).

Spline truncated merupakan model polinomial tersegmen yaitu memiliki

perubahan pola perilaku kurva yang berbeda pada interval yang berlainan yang

ditandai dengan adanya titik knot. Estimasi kurva regresi semiparametrik spline

truncated dapat dilakukan dengan memilih parameter smoothing, yaitu orde,

banyaknya titik knot, dan titik knot. Pemilihan parameter smoothing yang optimal

dilakukan penulis dengan menggunakan kriteria Generalized Cross Validation

(GCV) yaitu dengan memilih nilai GCV yang minimum. GCV digunakan karena

memiliki sifat optimal asimtotik yang tidak dimiliki metode lain (Wahba, 1990).

Penelitian mengenai Regresi semiparametrik dengan pendekatan spline

telah dilakukan antara lain Wibowo, Haryatmi, dan Budiantara (2013), Marina dan

Budiantara (2013), Sugiantari dan Budiantara (2013), Yani, Srinadi, dan Sumarjaya

(2017), dan Pratiwi, Budiantara, dan Wibowo (2017), namun pada beberapa

penelitian tersebut terbatas hanya membahas kasus dengan satu variabel respon

sehingga belum bisa mengakomodasi kasus dengan dua variabel respon.

Selanjutnya, beberapa penelitian yang membahas mengenai regresi birespon spline

dilakukan oleh Wulandari dan Budiantara (2014) dan Nurdiana, Herhyanto, dan

Dasari (2017) dengan pendekatan nonparametrik, sedangkan Wibowo dkk. (2012)

membahas model semiparametrik multirespon. Beberapa penelitian di atas, masih

dalam batas mengestimasi parameter dan belum melakukan inferensi lebih lanjut

terkait interval konfidensi. Pada penelitian ini, interval konfidensi parameter model

regresi birespon semiparametrik spline truncated diaplikasikan pada data persentase

kemiskinan dan pengeluaran per kapita makanan.

Kemiskinan merupakan permasalahan sosial kependudukan yang utamanya

perlu mendapat perhatian khusus karena salah satu sasaran dalam pembangunan

nasional adalah menurunkan tingkat kemiskinan (Rahmawati, Ispriyanti, dan

Warsito, 2017). Kemiskinan merupakan persoalan yang sangat kompleks dan

kronis, oleh karena itu dibutuhkan analisis yang tepat dan melibatkan semua

3

komponen permasalahan dalam penangannnya (Prawoto, 2009). Pada era

Sustainable Development Goals (SDG’s) ini, kemiskinan ditempatkan pada poin

pertama yang harus diraih yaitu terciptanya dunia tanpa kemiskinan sehingga

pengentasan kemiskinan merupakan prioritas bagi semua Negara, salah satunya

Indonesia.

Pada Tahun 2000, jumlah penduduk miskin di Indonesia mencapai 38,74

juta jiwa dan seiring bertambahnya tahun jumlah penduduk miskin di Indonesia

memiliki kecenderungan menurun hingga pada tahun 2015 jumlah penduduk

miskin sejumlah 28,51 juta jiwa (BPS 2015; Ishartono, 2016). Meskipun begitu,

jumlah tersebut merupakan angka yang masih besar mengingat bahwa target SDGs

adalah dunia tanpa kemiskinan atau dengan kata lain Indonesia masih sangat jauh

untuk mencapai tujuan tersebut. Kemiskinan di Indonesia yang cukup tinggi

didukung dengan fakta bahwa Indonesia merupakan Negara dengan urutan ke-5

dengan persentase populasi garis kemiskinan terbanyak di Asia Tenggara yaitu

sebesar 10,9% yang didasarkan pada data BPS tahun 2014 (Basic Statistic, 2017).

Di Indonesia, Jawa Timur merupakan provinsi dengan jumlah penduduk miskin

terbanyak yaitu sebanyak 4.638.530 (BPS, 2016). Walaupun Jawa Timur

berkontribusi pada Produk Domestik Bruto nasional yang cukup tinggi yaitu

tercatat oleh BPS (2016) sebesar 14,85% , namun tidak serta merta menjadikan

Jawa Timur sebagai provinsi yang rendah tingkat kemiskinannya.

Pengukuran kesejahteraan penduduk suatu daerah selain diukur dari

persentase kemiskinan dapat pula diukur melalui pengeluaran per kapita makanan

(Badan Ketahanan Pangan, 2015). Secara fakta, persentase penduduk miskin dan

pengeluaran per kapita makanan berkorelasi signifikan pada kajian data awal.

Kasus kemiskinan dan pengeluaran per kapita makanan beserta faktor-faktor yang

mempengaruhi telah dibahas oleh beberapa peneliti antara lain Wulandari dan

Budiantara (2014) dan Putri (2017). Wulandari dan Budiantara (2014) serta Putri

(2017) mendapatkan model untuk persentase kemiskinan dan pengeluaran per

kapita makanan dengan memuat variabel prediktor antara lain tingkat kesempatan

kerja, laju pertumbuhan ekonomi, tingkat pengangguran terbuka, dan tingkat

pastisipasi angkatan kerja, namun Putri (2017) menggunakan pendekatan Penalized

Spline, sedangkan Wulandari dan Budiantara (2014) menggunakan pendekatan

4

Spline. Penelitian lain yaitu Merdekawati dan Budiantara (2013) melakukan

pemodelan regresi spline truncated multivariabel memperoleh hasil bahwa

pertumbuhan ekonomi, tingkat pengangguran terbuka, dan tingkat pendidikan

berpengaruh terhadap kemiskinan. Berdasarkan kajian awal data diperoleh bahwa

pola data mengikuti pola semiparametrik sehingga syarat untuk aplikasi regresi

semiparametrik birespon telah terpenuhi.

1.2 Rumusan Masalah

Berdasarkan latar belakang yang telah diuraikan di atas, maka rumusan

masalah pada penelitian ini adalah sebagai berikut :

1. Bagaimana mendapatkan interval konfidensi untuk parameter model regresi

semiparametrik birespon dengan pendekatan spline truncated?

2. Bagaimana memodelkan persentase kemiskinan dan pengeluaran per kapita

makanan di Provinsi Jawa Timur dan variabel-variabel apa saja yang

berpengaruh menggunakan interval konfidensi untuk parameter model

regresi semiparametrik birespon dengan pendekatan spline truncated?

1.3 Tujuan Penelitian

Berdasarkan rumusan masalah yang telah diperoleh di atas, maka tujuan

penelitian adalah sebagai berikut :

1. Mengkaji interval konfidensi untuk parameter model regresi

semiparametrik birespon dengan pendekatan spline truncated.

2. Mengestimasi model data persentase kemiskinan dan pengeluaran per

kapita makanan di Provinsi Jawa Timur dan mengetahui variabel-variabel

yang berpengaruh menggunakan interval konfidensi untuk parameter model

regresi semiparametrik birespon dengan pendekatan spline truncated.

1.4 Manfaat Penelitian

Adapun manfaat yang diharapkan dalam penelitian ini adalah :

1. Menambah wawasan keilmuan mengenai interval konfidensi parameter

model regresi semiparametrik birespon dengan pendekatan spline

truncated.

5

2. Memberikan informasi kepada pemerintah untuk mengetahui variabel-

variabel yang mempengaruhi kemiskinan di Provinsi Jawa Timur.

3. Hasil penelitian diharapkan menjadi bahan masukan dan acuan untuk

penelitian-penelitian selanjutnya.

1.5 Batasan Masalah

Batasan yang digunakan pada penelitian ini adalah konstruksi interval

konfidensi untuk parameter model regresi semiparametrik birespon menggunakan

model spline linier. Pendekatan yang digunakan untuk mengkonstruksi interval

konfidensi pada Tesis ini adalah pendekatan pivotal quantity. Interval konfidensi

yang terbentuk digunakan untuk pengujian hipotesis dua arah. Data yang digunakan

dalam penelitian ini adalah data sekunder yang diambil dari publikasi BPS tahun

2015. Banyaknya titik knot pada spline linier yang digunakan adalah satu titik knot.

Pemilihan titik knot optimal dilakukan menggunakan metode GCV.

6

Halaman ini sengaja dikosongkan

7

BAB 2

TINJAUAN PUSTAKA

2.1 Analisis Regresi

Analisis regresi merupakan suatu metode statistik yang digunakan untuk

mengetahui hubungan fungsional antara variabel respon dan prediktor. Berikut

adalah model persamaan regresi :

1 2i 0 1 1i 2 2i l li iy =β +β x +β x +...β x +ε ;i , ,...,n (2.1)

dengan y merupakan variabel dependen sedangkan x merupakan variabel

independen. Persamaan (2.1) dapat dinyatakan dalam bentuk matriks sesuai

persamaan (2.2).

y = Xβ +ε (2.2)

dengan

11 1

12 2

1 1

1

1

1

l

l

n l n

x x

x xX

x x

, dan

1

2=

n

ε .

Analisis regresi memiliki dua pendekatan yaitu parametrik dan

nonparametrik (Eubank, 1998). Regresi parametrik merupakan pendekatan regresi

yang memiliki asumsi bentuk kurva regresi diketahui. Pada regresi parametrik,

selain diasumsikan kurva regresi diketahui, terdapat beberapa asumsi terkait model

pada persamaan (2.2) yaitu residual diasumsikan identik, independen, dan

berdistribusi normal 2~ IIDN( , )ε 0 I .

Selain regresi parametrik, regresi nonprametrik merupakan pendekatan

metode regresi dimana bentuk kurva regresinya tidak diketahui. Model regresi

nonparametrik dapat ditulis sebagai berikut :

1 2i i iy =f(t )+ε , i , ,...,n (2.3)

Regresi nonparametrik sangat memerhatikan fleksibilitas, dan hanya diasumsikan

bentuk fungsinya mulus (Eubank, 1988).

Beberapa kasus menyatakan variabel respon diketahui pola hubungannya

dengan salah satu variabel prediktor, tetapi dengan variabel prediktor yang lain

8

tidak diketahui bentuk pola hubungannya. Dalam keadaan seperti ini, maka

digunakan pendekatan regresi semiparametrik. Regresi semiparametrik adalah

gabungan antara regresi parametrik dan regresi nonparametrik. Model regresi

semiparametrik dapat ditulis sebagai berikut (Wu dan Zhang, 2006):

, 1,2, ,nTi i i iy f t i βx (2.4)

dengan 𝑦𝑖 adalah subjek ke-i , ix adalah vektor komponen parametrik pengamatan

ke-i, 𝑓(𝑡𝑖) adalah fungsi regresi dan 𝜀𝑖 adalah error random, 𝜀𝑖~𝑁(0, 𝜎2).

2.2 Uji Ramsey

Uji linearitas digunakan untuk mengindentifikasi apakah model yang

digunakan fungsi parametrik yang digunakan adalah fungsi linear atau tidak. Uji ini

dikembangkan oleh Ramsey pada tahun 1969 yang biasa disebut general test of

specification atau RESET (Pamungkas, 2013). Uji ini bertujuan untuk menghasilkan

F hitung, dengan prosedur kerja yaitu

Hipotesis:

0 :H antara variabel respon dan variabel prediktor terdapat hubungan linier

1 :H antara variabel respon dan variabel prediktor tidak terdapat hubungan linier

Prosedur mendapatkan statistik uji:

1. Mendapatkan fitted value dari variabel respon dengan cara melakukan analisis

regresi linear.

2. Variabel fitted yang telah dikuadratkan tersebut diregresikan bersama dengan

model semula sebagai variabel prediktor baru.

3. Menghitung

2 2

2

/

1 /

R new R old pF

R new n k

, daerah penolakan :

; , 1 > . hitung tabel k n kF F

dengan

p= Jumlah variabel prediktor yang baru masuk

n= Jumlah data

k= banyaknya parameter dalam model regresi baru

2R new= nilai dari persamaan regresi baru

2 R old nilai dari persamaan regresi lama

9

2.3 Spline Truncated

Spline truncated merupakan pendekatan regresi nonparametrik paling

populer. Salah satu kelebihan dari spline truncated yaitu model ini mengikuti pola

sesuai pergerakannya dengan adanya titik knot (Astuti, 2017). Secara umum, fungsi

spline berderajat p dengan titik-titik knot 1 2, ,.., rK K K dapat ditulis dalam bentuk

sebagaimana pada persamaan (2.5) berikut (Hardle, 1990).

01 1

g(t )p r

pj

i j i p k i k

j k

t t K

(2.5)

dan fungsi truncated diberikan oleh persamaan (2.6)

, t

0 , t

i k i k

i k

i k

t K Kt K

K

(2.6)

Regresi spline adalah regresi yang bentuk kurva regresinya didekati oleh fungsi

spline. Regresi spline dapat didekati dengan nonparametrik maupun

semiparametrik, hal ini didasarkan pada pola data yang didapatkan.

2.2.1 Spline Truncated dalam Regresi Nonparametrik

Secara umum, model regresi nonparametrik spline dapat dituliskan sebagai

berikut.

01 1

( ) , 1, 2, , n;p r

pj

j i p k i ki

j k

it i k=1,2,...K ,t t r

(2.7)

dimana p adalah derajat polinomial dan r adalah banyak titik knot pada fungsi

truncated, dengan 𝜀𝑖 adalah error random, 𝜀𝑖~𝑁(0, 𝜎2). Model regresi

nonparametrik spline pada persamaan (2.7) dapat disajikan dalam bentuk matriks

sebagai berikut:

η(t) = Zα +ε (2.8)

dengan 0 1 1( )T

p p p r α ,

1 1 1 1 1

2 2 2 1 2

1

1

1

1

P Pp

r

P Pp

r

P Pp

n n n n r

t t t K t K

t t t K t K

t t t K t K

Z ,

dan 1 2T

nε merupakan vektor residual.

10

2.2.2 Spline Truncated dalam Regresi Semiparametrik

Regresi semiparametrik diterapkan pada data yang sebagian variabel

prediktornya diketahui bentuk kurva regresinya dan sebagian yang lain tidak

diketahui, Eubank (1998) menyebut hal ini sebagai partial linier model untuk kurva

yang diketahui berbentuk linier. Mengacu pada persamaan (2.4) dan (2.5), jika

diberikan data berpasangan 1 2i i i( x ,t , y ), i , ,..,n dimana iy adalah variabel respon

sedangkan ix adalah variabel prediktor yang mengikuti pola parametrik dan it

adalah variabel prediktor yang mengikuti pola nonparametrik, model regresi

semiparametrik spline truncated dapat ditulis menjadi:

1 1

, 1, 2, , np r

pj

0 1 i 0 j i p k i k

j k

i iβ +β x α ty t K i

(2.9)

Persamaan (2.9) dapat disajikan dalam bentuk matriks berikut

y = X +β Zα +ε

Cω +ε (2.10)

dengan C X Z dan

βω =

α.

2.3 Regresi Semiparametrik Birespon Spline Truncated

Analisis regresi birespon merupakan suatu analisis yang digunakan untuk

mengetahui hubungan fungsional antara dua variabel respon dan variabel prediktor.

Secara umum, Wang, Guo, dan Brown (2000) menyatakan model regresi birespon

dapat ditulis dalam bentuk

, i 1,2, , ni i ix y f ε (2.11)

dengan 1 2,

T

i i iy yy , 1 2,T

i i ix f x f xf adalah vektor dari fungsi

regresi, serta 1 2,

T

i i iε adalah vektor dari error pengukuran dengan mean 0

dan variansi ∑ .𝑖 Indeks 𝑖 menyatakan banyak pengamatan pada 𝑦𝑖(1) dan 𝑦𝑖

(2)

dengan kedua variabel respon saling berkorelasi.

Model regresi semiparametrik birespon Spline Truncated digunakan pada

kasus yang memiliki dua variabel respon yang memenuhi sifat regresi

11

semiparametrik. Diberikan pasangan data 1 2

1 2 1 2

( ) ( )

i i li i i qi i i( x ,x ,...,x ,t ,t ,...,t , y , y ) ,

dengan 1 2i , ,..,n 1( )iy merupakan variabel respon pertama pada pengamatan ke-

i dan 2( )

iy menyatakan variabel respon ke dua pada pengamatan ke-i. Hubungan

antara 1 2i i li( x ,x ,...,x ) dan 1 2( ) ( )

i i( y , y ) diasumsikan mengikuti model regresi

parametrik, sedangkan 1 2i i qi(t ,t ,...,t ) dan 1 2( ) ( )

i i( y , y )diasumsikan mengikuti model

regresi nonparametrik. Mengacu persamaan (2.4) dan (2.11) maka jika persamaan

tersebut didekati dengan fungsi spline multivariabel, maka persamaan dapat ditulis.

1 1 1 1 1 1 1 1

1 2 1 2

( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

i i i li i i qi iy g (x ) g (x ) ... g (x ) (t ) (t ) ... (t )

(2.12)

2 2 2 2 2 2 2 2

1 2 1 2

( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

i i i li i i qi iy g (x ) g (x ) ... g (x ) (t ) (t ) ... (t )

(2.13)

Secara sederhana persamaan (2.12) dan (2.13) dapat ditulis ulang sebagai berikut.

1 1 1 1

1 1

ql( ) ( ) ( ) ( )

i ji mi i

j m

y g (x ) (t )

(2.14)

2 2 2 2

1 1

ql( ) ( ) ( ) ( )

i ji mi i

j m

y g (x ) (t )

(2.15)

dengan

1

(1) (1) (1) (1)

0

1 1

(1) ( )mi

rpp

j

j mi p k mi k

j k

t Kt t

2

(2) (2) (2) (2)

0

1 1

(2) ( ; 1,2 .) , ..mi

rpp

j

j mi p k mi k

j k

tt t K m q

1 1 1 1 1

0 1 2 l

( ) ( ) ( ) ( ) ( )

1i 2i 1i 1i 2i lig (x ,x ,...,x )=β +β x +β x +...+β x

2 2 2 2 2

0 1 2 l

( ) ( ) ( ) ( ) ( )

1i 2i 1i 1i 2i lig (x ,x ,...,x )=β +β x +β x +...+β x

Persamaan (2.14) dan (2.15) jika ditulis dalam bentuk matriks dapat ditulis

sebagai berikut :

y = Xβ + Zα +ε (2.16)

Persamaan (2.16) dapat ditulis kembali menjadi:

y = Cω +ε (2.17)

12

dengan C = X Z dan T

ω β α .

2.4 Pemilihan Titik Knot Optimal

Pemilihan titik knot merupakan hal yang sangat penting dalam regresi spline.

Titik knot merupakan suatu titik dimana data mengalami perubahan pada selang

interval tertentu. Menurut Wahba (1990) dan Wang (1998), metode pemilihan titik

knot optimal dilakukan dengan metode Generalized cross validation (GCV). Titik

knot optimal diperoleh melalui pemilihan nilai GCV terkecil (Budiantara, 2005).

Fungsi GCV dirumuskan sebagai berikut (Hardle,1990):

21

1

21

ˆ,

n

i iin y t

GCV C C C Cn t

kkr I

T -1 TA = ( )

A (2.18)

Dengan kA merupakan suatu matriks yang memuat knot k.

2.5 Interval Konfidensi Parameter Regresi

Interval konfidensi parameter regresi merupakan persoalan inferensi yang

penting dalam regresi spline. Langkah-langkah untuk mendapatkan estimasi

interval untuk suatu parameter dalam regresi dijelaskan oleh Montgomery, Peck,

dan Vining (2012) dengan menggunakan metode pivotal quantity sebagai berikut.

Model regresi linier berganda telah disajikan pada persamaan (2.2),

berdasarkan model, diketahui bahwa iy berdistribusi normal dengan mean

0 1

l

j jjx

dan varians 𝜎2. Langkah pertama yang harus dilakukan yaitu

mengetahui estimasi parameter, dalam hal ini pada metode regresi linier berganda

digunakan metode ordinary least square (OLS). Mengacu pada persamaan (2.2)

diperoleh estimator ̂ dengan metode OLS (Kutner, Nachtsheim, dan Neter, 2004):

ˆ T T -1β (X X) X y (2.19)

dengan memperhatikan bahwa β̂ kombinasi linier dari y , maka

2 1ˆ ~ ( , ( ) )N Tβ β X X , sehingga untuk masing-masing estimator berdistribusi

normal 2ˆ ~ ( , C )j j jjN , dimana jjC merupakan elemen diagonal ke-j dari

13

matriks 1

'

X X . Untuk membentuk suatu pivotal quantity untuk β , perlu

diperhatikan definisi tentang pivotal quantity berikut.

Jika Q=q(x1,x2,…,xn) adalah sebuah variabel random yang merupakan fungsi dari

X1,…,Xn dan , dan fungsi distribusinya tidak bergantung pada atau parameter

lain, maka Q disebut pivotal quantity .

Distribusi dari variabel random umumnya tidak memiliki pivotal quantity

yang pasti, artinya terdapat berbagai kemungkinan bentuk pivotal quantity, namun

teorema limit pusat sering kali digunakan untuk konstruksi interval konfidensi

untuk mayoritas distribusi dengan ukuran sampel besar.

Akibatnya, diperoleh pivotal quantity

20 1

j j

j

jj

ˆT , j , ,..,l

C

(2.20)

Variabel random ( )~

a

BT t

A

a

, jika dan hanya jika memenuhi tiga syarat yaitu

~ (0,1)B N , ( )A ~ a , dan A dan B independen.

Dengan pembuktian dengan berdasar syarat-syarat tersebut di atas, didapatkan

bahwa T berdistribusi t dengan derajat bebas n-l, dimana 𝜎2 diestimasi dengan

varians error. Untuk mendapatkan interval konfidensi terpendek diperlukan

optimasi Lagrange yaitu jika merupakan fungsi distribusi kumulatif dari pivotal

quantity Q=q(x1,x2,…,xp) dan didapatkan fungsi probabilitas untuk suatu interval

konfidensi

1 2( ( , , ..., ) ) 1

p(b) - (a) P a Q x x x b

Untuk mendapatkan interval konfidensi terpendek maka dicari

, ,1 2 p U LL(x ,x ,..., x )a b minimum dengan penyelesaian optimasi Lagrange :

, ,

{ ( )} {( ) }a b R a b R

a, b a bMin Min

14

Berdasarkan hasil pada persamaan (2.20) dan Teorema 4, didapat interval

konfidensi terpendek berukuran (1 ) 100% untuk koefisien regresi

, 0,1,..,j j l adalah sebagai berikut.

2 2

, ,2 2

ˆ ˆˆ ˆj jj j j jjn p n p

t C t C (2.21)

2.6 Weighted Least Square

Metode Ordinary Least Square (OLS) mengasumsikan bahwa terdapat

variansi konstan dalam error yang pada umumnya disebut keadaan

homoskedastisitas. Metode Weighted Least Square (WLS) dapat digunakan ketika

asumsi variansi konstan dalam error dilanggar atau dalam kata lain disebut

heteroskedastisitas (Greene, 2003). Berikut diberikan model :

y Xβ ε (2.22)

Dengan error diasumsikan berdistribusi normal multivariat dengan mean 0 dan

matriks variansi-kovariansi non konstan sebagai berikut :

2

1

2

2

2

0 0

0 0

0 0 0 n

=

Dalam metode OLS, berikut adalah fungsi yang diminimumkan untuk

mengestimasi parameter

2

T T T T T T

T T T T T

Q

T

T

ε

y y β X y y Xβ β X Xβ

y y β X y β X Xβ

ε

y - Xβ y - Xβ (2.23)

Persamaan (2.27) selanjutnya didiferensiasi terhadap β dengan proses sebagai

berikut:

1

2

0 2 2

ˆ

T T T T T

T T

T T

Q

y y β X y β X Xβ

β β

X y X Xβ

β X X X y

15

sehingga diperoleh estimator OLS sebagai berikut.

ˆ T -1 Tβ = (X X) X y (2.24)

Jika kita mendefinisikan invers dari matriks variansi kovariansi sebagai pembobot

untuk estimasi parameter yaitu 2

1i

i

, maka matriks V merupakan suatu matriks

diagonal yang berisi pembobot untuk estimasi parameter sebagai berikut.

1

2

n

0 0

0 0

0 0 0

V

Pada metode WLS fungsi yang diminimumkan untuk mengestimasi parameter

dirumuskan sebagai berikut

2

T T T T T T

T T T T T

Q

Ty - Xβ V y - Xβ

y Vy β X Vy y VXβ β X VXβ

y Vy β X Vy β X VXβ

(2.25)

Estimator WLS didapat dengan meminimumkan persamaan (2.25) dengan

memenuhi 0Q

β sebagai berikut.

1

2

0 2 2

ˆ

T T T T T

T T

T T

Q

y Vy β X Vy β X VXβ

β β

X Vy X VXβ

β X VX X Vy

sehingga diperoleh estimator WLS pada persamaan (2.26).

ˆ T -1 Tβ = (X VX) X Vy (2.26)

2.7 Aljabar Matriks

Beberapa teorema dasar terkait dengan aljabar matriks yang digunakan

untuk menyelesaikan estimasi parameter dan interval konfidensi berdasarkan

Rencher dan Scaalje (2007) adalah sebagai berikut.

Teorema 1.

16

Diberikan vektor a dan x , dimana 1 2, , ,..,T T T pa x x a a a a a memuat

konstanta, maka

T Ta x x aa

x x

Teorema 2.

Matriks A dikatakan idempoten jika AA = A

Teorema 3.

Jika A matriks berukuran nxp dan B matriks berukuran pxn, maka

( ) ( )tr trAB BA

Teorema 4.

Jika matriks A mempunyai rank r serta simetris dan idempoten, maka

( ) ( )rank A tr A r

Teorema 5.

Jika 2~ ( , )y N I dan A matriks simetris dengan rank r, maka

2/Ty y A

berdistribusi 2 2, / 2Tr A jika dan hanya jika A idempotent.

Teorema 6.

Jika 2~ ( , )y N I maka Ty yB dan

Ty yA adalah independen jika dan hanya jika

0BA atau 0AB .

2.8 Persentase Kemiskinan, Pengeluaran per Kapita Makanan dan Faktor

yang Diduga Berpengaruh

Kemiskinan menurut BPS (2014) didefinisikan sebagai ketidakmampuan

dari sisi ekonomi untuk memenuhi kebutuhan dasar seperti pangan, sandang,

pendidikan, kesehatan, dan perumahan. Sedangkan berdasarkan Undang-Undang

No. 24 Tahun 2004, kemiskinan adalah kondisi sosial ekonomi seseorang atau

sekelompok orang yang tidak terpenuhinya hak-hak dasarnya untuk

mempertahankan dan mengembangkan kehidupan yang bermartabat. Pengukuran

kesejahteraan penduduk di suatu daerah dapat diukur dengan persentase kemiskinan

dan pengeluaran per kapita makanan. Persentase kemiskinan merupakan persentase

17

penduduk yang berada di bawah garis kemiskinan, sedangkan pengeluaran per

kapita makanan yaitu biaya yang dikeluarkan untuk konsumsi semua anggota

rumah tangga selama sebulan untuk makanan dibagi dengan banyaknya anggota

rumah tangga tersebut (BPS, 2017).

Beberapa pertimbangan yang digunakan sebagai dasar pemilihan variabel

penelitian adalah beberapa penelitian yang dilakukan sebelumnya pada Tabel 2.1

berikut.

Tabel 2.1 Penelitian Sebelumnya terkait Faktor yang Memengaruhi Kemiskinan

Peneliti Judul Variabel Prediktor

Astiti dkk.

(2016)

Analisis regresi nonparametrik

spline multivariat untuk

pemodelan indikator kemiskinan

di Indonesia.

Angka melek huruf, rata-

rata lama sekolah, angka

partisipasi sekolah, PDRB

per kapita, tingkat

pengangguran terbuka.

Budiantara,

I.N.,

Wulandari

(2015)

Analisis Faktor-Faktor yang

Mempengaruhi Persentase

Penduduk Miskin dan

Pengeluaran Perkapita Makanan

di Jawa Timur Menggunakan

Regresi Nonparametrik Birespon

Spline.

Tingkat kesempatan kerja,

laju pertumbuhan ekonomi,

tingkat pengangguran

terbuka, dan tingkat

partisipasi angkatan kerja .

Merdekawati

dan

Budiantara

(2013)

Pemodelan Regresi Spline

Truncated Multivariabel pada

Faktor-Faktor yang

Mempengaruhi Kemiskinan di

Kabupaten/Kota Provinsi Jawa

Tengah.

Pertumbuhan ekonomi,


terbuka, dan tingkat

pendidikan

Rahmawati

dkk (2017)

Pemodelan kasus kemiskinan di

jawa tengah menggunakan

regresi nonparametrik metode B-

spline.

Angka melek huruf, tingkat

pengangguran terbuka,

angka partisipasi sekolah,

dan PDRB per kapita

Rumahorbo

(2014)

Analisis Faktor-faktor yang

Mempengaruhi Jumlah Penduduk

Miskin Provinsi Sumatera Utara

Pertumbuhan ekonomi,

pendapatan per kapita,


terbuka, dan inflasi

18

Tabel 2.1 (Lanjutan)

Peneliti Judul Variabel Prediktor

Cheema dan

Sial (2012)

Poverty, Income Inequality, and

Growth in Pakistan:

A Pooled Regression Analysis.

Gini rasio, Rata-rata

pengeluaran per kapita,

Indeks Pembangunan

Manusia

Iradian

(2005)

Inequality, poverty, and growth:

cross-country evidence.

Gini Rasio, PDRB per

kapita, Belanja pemerintah

Lee (2014) Globalization : Income Inequality

and poverty : Theory and

empirics.

PDB, gini rasio, Trade

(Ekspor + Impor),

Pendidikan

Berdasarkan penelitian sebelumnya yang telah disebutkan, beberapa faktor

yang diduga mempengaruhi persentase kemiskinan dan pengeluaran per kapita

makanan beserta penjelasannya adalah sebagai berikut berdasarkan definisi dari

BPS (2016):

1. Rata-rata lama sekolah menggambarkan jumlah tahun yang digunakan oleh

penduduk usia 15 tahun keatas dalam menjalani pendidikan formal.

2. Tingkat pengangguran terbuka adalah persentase jumlah pengangguran

terhadap jumlah angkatan kerja.

3. PDRB atas dasar harga berlaku yaitu nilai PDRB yang disusun atas dasar harga

berlaku pada periode penyusunan.

4. Angka partisipasi kasar SMA adalah proporsi anak sekolah pada jenjang SMA

terhadap penduduk pada kelompok usia 16-18 tahun dimana sejak tahun 2007

pendidikan non formal (Paket A, Paket B, dan Paket C) turut diperhitungkan.

5. Gini ratio merupakan suatu ukuran kemerataan yang dihitung dengan

membandingkan luas antara diagonal dan kurva lorenz (daerah A) dibagi

dengan luas segitiga di bawah diagonal. Rasio gini digunakan untuk mengukur

derajat ketidakmerataan pendapatan. Rasio Gini bernilai antara 0 dan 1. Nilai

1 menunjukkan complete inequality atau perfectly inequal, koefisien Gini

bernilai 0 menunjukkan adanya pemerataan pendapatan yang sempurna, atau

setiap orang memiliki pendapatan yang sama.

19

BAB 3

METODOLOGI PENELITIAN

3.1 Sumber Data

Penelitian ini menggunakan data sekunder tahun 2015 dari publikasi Badan

Pusat Statistik Provinsi Jawa Timur dengan unit observasi meliputi 38

kabupaten/kota di Provinsi Jawa Timur.

3.2 Variabel Penelitian

Variabel-variabel penelitian yang digunakan pada penelitian ini disajikan

pada Tabel 3.1.

Tabel 3.1 Variabel Penelitian

Variabel Keterangan Variabel Skala Data (1)y

PePersentase kemiskinan Rasio

(2)y Pengeluaran per kapita makanan Rasio

1x Angka partisipasi kasar SMA Rasio

2x Gini ratio Rasio

3x Tingkat Pengangguran Terbuka Rasio

4x Rata-rata lama sekolah Rasio

5x PDRB atas harga berlaku Rasio

Adapun penjelasan dari variabel-variabel dalam penelitian ini adalah

sebagai berikut.

a. Variabel Respon

Variabel respon yang digunakan pada penelitian ini adalah persentase

kemiskinan dan pengeluaran per kapita makanan. Persentase kemiskinan yaitu

persentase penduduk yang berada di bawah garis kemiskinan, sedangkan

pengeluaran per kapita makanan yaitu biaya yang dikeluarkan untuk konsumsi

semua anggota rumah tangga selama sebulan untuk makanan dibagi dengan

banyaknya anggota rumah tangga tersebut.

20

b. Variabel Prediktor

Varibel prediktor yang diduga mempengaruhi persentase kemiskinan dan

indeks kedalaman kemiskinan pada penelitian ini terdapat lima variabel

prediktor. Variabel prediktor tersebut adalah sebagai berikut.

1. Rata-rata lama sekolah menggambarkan jumlah tahun yang digunakan oleh

penduduk usia 15 tahun keatas dalam menjalani pendidikan formal.

2. Tingkat pengangguran terbuka adalah persentase jumlah pengangguran

terhadap jumlah angkatan kerja

3. PDRB atas dasar harga berlaku yaitu nilai PDRB yang disusun atas dasar

harga berlaku pada tahun perhitungan.

4. Angka partisipasi Kasar SMA adalah proporsi anak sekolah pada jenjang

SMA terhadap penduduk pada kelompok usia 16-18 tahun

5. Gini ratio merupakan suatu ukuran kemerataan pendapatan yang dihitung

dengan membandingkan luas antara diagonal dan kurva lorenz (daerah A)

dibagi dengan luas segitiga di bawah diagonal.

3.3 Struktur Data Penelitian

Unit observasi yang digunakan dalam penelitian ini adalah sebanyak 38

kabupaten/kota di Provinsi Jawa Timur dan banyaknya variabel prediktor terdiri

dari lima variabel yang terdiri dari dua komponen parametrik dan tiga komponen

nonparametrik. Sehingga, struktur data penelitian yang digunakan adalah sebagai

berikut.

Tabel 3.2 Struktur Data Penelitian

Kabupaten/ Kota (1)y (2)y 1x 2x 3x 4x 5x

1 (1)1y

(2)

1y 11x 21x 31x 41x 51x

2 (1)2y

(2)

2y 12x 22x 32x 42x 52x

38 (1)38y

(2)

38y 1(38)x 2(38)x 3(38)x 4(38)x 5(38)x

21

3.4 Langkah-Langkah Penelitian

Langkah-langkah untuk menjawab tujuan penelitian dalam penelitian ini

yaitu sebagai berikut :

3.4.1 Kajian Interval Konfidensi untuk Parameter Model Regresi

Semiparametrik Birespon dengan Pendekatan Spline Truncated

1. Diberikan data berpasangan (1) (2)

1 2 1 2( , ,.., , , ,.., , , )l qx x x t t t y y yang mengikuti

model regresi :

1 2( , ,.., ,l 1 2 qx x x t ,t ,..,t ) y f ε

dengan :

(d) (d) (d) (d)1 2, , 1, 2T

ny y y d

(1)

(2)

yy y

y

(1)

1 2

1 2 (2)

1 2

( , ,.., ,( , ,.., ,

( , ,.., ,

l 1 2 q

l 1 2 q

l 1 2 q

x x x t ,t ,..,t )x x x t ,t ,..,t )

x x x t ,t ,..,t )

ff

f,

(d)

1 1 2

(d)

2 1 2(d)

1 2

(d)

1 2

( , ,.., ,

( , ,.., ,( , ,.., , , 1, 2

( , ,.., ,

l 1 2 q

l 1 2 q

l 1 2 q

n l 1 2 q

f x x x t ,t ,..,t )

f x x x t ,t ,..,t )x x x t ,t ,..,t ) d

f x x x t ,t ,..,t )

f

1 (d) (d) (d)1 22

, , 1, 2T

d n d

εε ε

ε

2. Model regresi multivariabel diasumsikan bersifat aditif

1 2

1 1

( , ,.., , ) ( ) ( )ql

i i li 1i 2i qi j ji m mi i

j m

x x x t ,t ,..,t x t

f g η ε

dimana 1

( )l

j ji

j

x

g adalah komponen parametrik dan 1

( )q

m mi

m

t

η adalah

komponen nonparametrik.

3. Komponen parametrik 1

( )l

j ji

j

g x

dapat dihampiri dengan fungsi linier

1

1

l

j ji

j

x

.

22

4. Komponen nonparametrik 1

(t )q

m mi

m

dihampiri menggunakan spline linier

dengan r knot

20 2 2( )1 1

( ) , 1, 2, , n;p r

ph

h mi p k mi k

h k

m mit t Kt i k=1,2,...,r

5. Diberikan model regresi semiparametrik birespon multivariabel dengan

pendekatan spline truncated linier mengikuti persamaan berikut.

y = Cω +ε

dengan C = X Z dan 1 2T

T Tω ω ω

(1) (2) ( )1 1 1 1 10 11 1;T T T Td

l ω ω ω ω

(1) (2)2 2 2T T T

ω ω ω

1 1 1 1 1

( )

2 20 21 2 2( 1) 2( ) 21 2 2( 1) 2( )q q q q

Td

P P P r P P P r ω

X merupakan matriks yang memuat prediktor komponen parametrik dan Z

adalah matriks yang memuat komponen nonparametrik dengan ~ ( , )Nε 0 Σ

6. Mendapatkan estimasi untuk parameter ω menggunakan metode Weighted

Least Square dengan langkah-langkah sebagai berikut:

i. Membentuk fungsi L

( )L T

y - C ω W y - C ω

ii. Meminimumkan persamaan L dengan menyelesaikan persamaan

berikut.

( )0

L

ω

ω

iii. Mendapatkan estimasi dari ω yaitu ω̂ .

7. Mencari distribusi dari ω̂ .

8. Mencari Pivotal Quantity untuk parameter ω̂ .

Misalkan 1 2 ,( , ,.., )1 2 qv l t ,t ,..,tQ x x x

Pivotal Quantity untuk parameter

(1) (2)

1 1

2 2 2q q

m m

m m

v r r,v=1,2,..., l+ q

.

23

9. Menyelesaikan persamaan dalam probabilitas

(1) ( 2 )1 1

1 2 .( , ) 1 , 1, 2,..... 2 2, ,..,q q

m m

m m

v v 1 2 q vl r rP a Q t ,t ,..,t b v l + qx x x

10. Menghitung panjang interval konfidensi 1 yaitu :

,v va b

11. Membentuk fungsi Lagrange :

, , ( , ) ( ) ( ) (1 )v v v v v vG a b a b b a

dimana fungsi kumulatif distribusi dari pivotal quantity, dan konstanta

Lagrange.

12. Melakukan optimasi terhadap fungsi Lagrange dengan menghitung

derivatif parsial:

, ,0

v v

v

G a b

a

, ,0

dv dv

dv

G a b

b

, ,0

dv dvG a b

13. Dari langkah (13) diatas diperoleh interval konfidensi (1 ) 100% untuk

parameter v .

3.4.2 Aplikasi pada Data Persentase Kemiskinan dan Pengeluaran per Kapita

Makanan di Jawa Timur

Tujuan kedua dari tesis ini yaitu mengestimasi model data kemiskinan di

Provinsi Jawa Timur dan mengetahui variabel-variabel yang berpengaruh

menggunakan interval konfidensi parameter model regresi semiparametrik

birespon dengan pendekatan spline truncated. Untuk menjawab tujuan kedua,

dilakukan langkah-langkah sebagai berikut :

1. Menguji korelasi variabel persentase kemiskinan dan pengeluaran per

kapita makanan.

2. Membuat scatter plot antara variabel respon dengan variabel prediktor.

24

3. Menentukan variabel komponen parametrik berdasarkan pola data antara

variabel respon dan prediktor.

4. Menentukan variabel komponen nonparametrik berdasarkan pola data

antara variabel respon dan variabel prediktor.

5. Memodelkan data menggunakan regresi semiparametrik birespon spline

truncated linier, dimana spline yang digunakan adalah satu knot, dua knot,

tiga knot dan kombinasi knot.

6. Memilih titik knot optimal dengan metode GCV.

7. Menghitung MSE dan R2 sebagai bagian dari kriteria kebaikan model.

8. Menghitung interval konfidensi untuk parameter model regresi

semiparametrik birespon dengan pendekatan spline truncated linier.

9. Mengambil kesimpulan dengan menentukan variabel prediktor yang

berpengaruh secara signifikan terhadap variabel respon.

25

BAB 4

PEMBAHASAN

4.1 Kajian Interval Konfidensi untuk Parameter Model Regresi

Semiparametrik Birespon dengan Pendekatan Spline Truncated

Konstruksi interval konfidensi dapat dilakukan dengan beberapa

pendekatan, salah satu pendekatan adalah Pivotal Quantity. Pivotal Quantity

merupakan sebuah statistik yang fungsi distribusinya tidak memuat parameter.

Langkah yang harus dilakukan untuk mendapatkan interval konfidensi untuk

parameter model regresi yaitu mendapatkan estimasi dari parameter dan mencari

distribusi dari parameter. Pengestimasian parameter regresi birespon

semiparametrik dengan pendekatan spline truncated dalam penelitian ini dibahas

dengan menggunakan metode Weighted Least Square.

Diberikan data berpasangan (1) (2)

1 2 1 2( , ,.., , , ,.., , , )l qx x x t t t y y yang mengikuti

model regresi :

1 2( , ,.., ,l 1 2 qx x x t ,t ,..,t ) y f ε (4.1)

dengan :

(d) (d) (d) (d)1 2, , 1, 2T

ny y y d

(1)

(2)

yy y

y

(1)

1 2

1 2 (2)

1 2

( , ,.., ,( , ,.., ,

( , ,.., ,

l 1 2 q

l 1 2 q

l 1 2 q

x x x t ,t ,..,t )x x x t ,t ,..,t )

x x x t ,t ,..,t )

ff

f

(d)

1 1 2

(d)

2 1 2(d)

1 2

(d)

1 2

( , ,.., ,

( , ,.., ,( , ,.., , , 1, 2

( , ,.., ,

l 1 2 q

l 1 2 q

l 1 2 q

n l 1 2 q

f x x x t ,t ,..,t )

f x x x t ,t ,..,t )x x x t ,t ,..,t ) d

f x x x t ,t ,..,t )

f

(1)

( ) (d) (d) (d)

1 2(2), , 1, 2

Td

n d

εε ε

ε.

Model regresi pada persamaan 4.1 diasumsikan bersifat aditif dengan penjabaran

sebagai berikut.

26

1 2

0 0

( , ,.., , ) ( ) ( )ql

i i li 1i 2i qi j ji m mi

j m

x x x t ,t ,..,t x t

f g η (4.2)

dimana 1

( )l

j ji

j

x

g adalah komponen parametrik dengan banyaknya variabel

prediktor sejumlah l dan 1

( )q

m mi

m

t

η adalah komponen nonparametrik dengan

banyaknya variabel prediktor sejumlah q. Kurva komponen parametrik dengan l

variabel prediktor didekati dengan fungsi linier

10 11 1 12 1 1

0

( ) ...l

j ji i i l li

j

x x x x

g ω ω ω ω (4.3)

dengan

(1)

(2)( )

ji

ji

ji

g (x )x

g (x )

g

(1)

1

1 (2)

1

, 0,1, 2,...,j

j

j

j l

ω

dimana , 1,2,...,j j l merupakan parameter komponen parametrik linier. Persamaan

(4.3) dapat dinyatakan dalam bentuk matriks menjadi

1 2 1( , ,..., )lx x x g Xω (4.4)

dengan

(1)

1 2 (2)( , ,..., ) 1 2 ll

1 2 l

(x ,x ,...,x )x x x

(x ,x ,...,x )

gg

g

(d)

1 1 1

(d)

(d) 2 2 2

(d)

ln

, d 1,2

1 2 l

1 2 l

1 2 l

1n 2n

g (x ,x ,...,x )

g (x ,x ,...,x )(x ,x ,...,x )

g (x ,x ,...,x )

g

11 21 1

(1)12 22 2(1) (2)

(2)

1 2 2

1

10,

0

1

l

l

n n l

x x x

x x x

x x x

XX X X

X

27

Kurva komponen nonparametrik dengan q variabel prediktor didekati dengan

fungsi spline truncated linier. ( )mitη merupakan suatu vektor yang terdiri dari fungsi

spline truncated untuk variabel prediktor ke-m pada respon 1 dan respon 2

(d) (d) (d) (d) (d) (d) (d) (d) (d)

20 21 22 1 23 2 2( 1)(t ) t (t ) (t ) ... (t )m m m m mm mi mi mi m mi m r mi rmK K K

(d) (d) (d) (d)

20 21 2( 1)

1

= t (t )m m m

r

mi k mi km

k

K

(4.5)

dengan (d) (d)

(d)

(d)

(t ), t(t )

0 , t

mi km mi km

mi km

mi km

K KK

K

.

Sehingga ( )

1

( )q

d

m mi

m

t

dapat dituliskan kembali sebagai berikut.

( ) (d) (d) (d)

21 2( 1)

1 1 1 1

( ) t (t )d

m m

rq q qd

m mi mi k mi km

m m m k

t K

(4.6)

Persamaan (4.6) dapat dituliskan dalam notasi matriks pada persamaan (4.7).

( ) ( ) ( )( )

d d dη t Z ω (4.7)

Persamaan (4.7) merupakan fungsi regresi nonparametik yang didekati dengan

spline truncated linier untuk variabel respon ke-d, penulisan untuk fungsi regresi

birespon dapat dituliskan dalam persamaan (4.8).

2( )t η Zω (4.8)

dengan

(1) (2)( ) ( ) ( )T

η t η t η t ,

(d)

1 1 1

(d)

2 2 2(d)

(d)

, d 1,2

1 2 q

1 2 q

1n tn qn

(t ,t ,...,t )

(t ,t ,...,t )( )

(t ,t ,...,t )

η t

(1)

(2)

0,

0

Z

ZZ

28

1 1 111 11 11

(d) 2 2 112 12 12

1 1 1 1

(d) (d)(d) (d)111 1(d) (d)(d) (d)111 1

(d) (d) (d) (d)11 1 1

(t ) (t )(t ) (t )

(t ) (t )(t ) (t )

(t ) (t ) (t ) (t )

q q q

q q q

n n n qn qn q

tt q qrr

tt q qrr

t tr q qr

K KK K

K KK K

K K K K

Z

(1) (2)2 2T

ω ωω

1 1 2 21 2( )2 21 22 21 22 21 222( 1) 2( 1) 2( 1) q q qdT

r r r ω

Pada persamaan (4.3) dan (4.6), masing-masing telah diberikan fungsi regresi

untuk komponen parametrik dan fungsi regresi dengan pendekatan spline truncated

untuk komponen nonparametrik, kedua persamaan tersebut ditulis kembali dengan

berdasarkan persamaan (4.2) dan (4.1) pada persamaan (4.9) berikut.

1

2

(1) (1) (1) (1) (1) (1) (1) (1)

10 0 11 1 1 21 2( 1)

1 1 1

(2) (2) (2) (2) (2) (2) (2) (2)

10 0 11 1 1 21 2( 1)

1 1 1

... t (t )

... t (t )

m m

m m

rq q

i i i l li mi k mi km i

m m k

rq q

i i i l li mi k mi km i

m m k

y x x x K

y x x x K

(4.9)

untuk setiap pengamatan ke-i, i=1,2,...,n. (1)

iy merupakan variabel respon

pengamatan ke-i pada respon pertama, sedangkan (2)

iy merupakan variabel respon

pengamatan ke-i pada respon ke dua . Persamaan (4.9) dapat ditulis kembali dalam

notasi matriks menjadi:

1 2 y Xω Zω ε (4.10)

Karena adanya syarat terpenuhinya korelasi antara variabel respon satu dengan dua,

maka dibutuhkan matriks pembobot variansi kovariansi dalam mengestimasi

regresi semiparametrik birespon berdasarkan estimator spline truncated dengan

meminimumkan kriteria Weighted Least Square (WLS) yaitu dengan

meminimumkan fungsi berikut:

1 2 1 2L T

Xω Zω Xωy W y Zω= (4.11)

dengan memisalkan 1* y y Xω dengan mengasumsikan 1ω diketahui maka

persamaan (4.11) dapat ditulis kembali pada persamaan (4.12) berikut.

29

2 2* *L T

ω W yZy Zω= (4.12)

Persamaan (4.12) dapat diuraikan sebagai berikut.

2 2

*

*

2

L

T

T T

T

T T T T

2 2 2 2

T T T T

2 2 2

= y W y

y * Wy *-y * W y

Zω Zω

Zω - ω Z W ω Z WZω

ω Z W

* +

y * Wy * ω+ Z* WZωy

(4.13)

Nilai 2ω̂ dapat diperoleh dengan meminimumkan persamaan (4.13). Syarat

perlu agar persamaan (4.13) mencapai minimum adalah dengan memenuhi

2

0L

ω

, sehingga diperoleh :

2

2

2

1

2

*

*

2 0

0

ˆ

L

T

T

T

T

T

T

T

T

Wy * 2Zω

Wy *

Wy

Z Z Wy

- Z WZω

- Z Z WZω

Z WZω Z

ω WZ

(4.14)

Berdasarkan persamaan (4.10) dan (4.14) dengan memisalkan 1* y y Xω maka

didapatkan nilai dugaan dari *y yaitu ˆ *y dinyatakan pada persamaan (4.15).

2ˆ* *y A y (4.15)

dengan 2A merupakan matriks hat untuk komponen nonparametrik yaitu

1

2

TTA Z WZ ZWZ .

Mengacu pada persamaan (4.11), nilai dugaan untuk 1ω didapat dengan

pendiferensialan fungsi L dengan menggunakan metode WLS dengan penguraian

fungsi L sebagai berikut.

30

1 2 1 2

2 2 2

1 2 1 1 2

2

2 2 2 2

2 21 1 2 2

2

1

( ) ( )

T

T T T

T T T

T T

T

T

T

L

1

T

1

T

T

1

1

= y W y

y y W y y

(I - A )y - (I - A ) W (I - A )y - (I - A )

y (I - A ) W(I - A )y y (I - A

Xω Zω Xω Zω

Xω

) W(I - A )

(I - A ) W(I - A )y (I - A ) W(I - A )

Xω Xω Xω

Xω Xω

Xω

ω

y (I - A

X ω

W

X

(

X

)

ω

A A

12 2 2

21 2

2

T T

T T

T

T

1

I - A )y (I - A ) W(I - A )y

(I - A ) W(

ω X

I - Aω )X Xω

(4.16)

Selanjutnya, Syarat perlu agar persamaan (4.16) mencapai minimum adalah

dengan memenuhi 1

0L

ω

, sehingga diperoleh :

2 2 2 2

2 2 2 2

2 2 2 2

1

2 0

0

2

T T

T T

T T

T

T T

TTT

L

1

1

1

(I - A ) W(I - A )y (I - A ) W(I - A )

(I - A ) W(I - A )y (I - A ) W(I - A )

(

X X Xωω

X

I - A ) W(I - A ) (

X Xω

X Xω I - A ) W(I - AX )y

2 2 21

2ˆ T TT T

1 (I - A ) W(I - A ) (I - A ) W(I -X X X Aω )y (4.17)

Setelah mendapatkan nilai dugaan dari parameter 1ω dan 2ω , selanjutnya

didapatkan persamaan untuk menghitung ŷ dengan mensubtitusikan nilai 1ω̂ dan

2ω̂ sebagai berikut.

1

1

2 2 2 2

2

1 2

1

1

2 2 2

*

ˆ ˆ ˆ

T T

T

T T

T T T

T T

T T

T

T

Z Z W y

Z Z W

Xω Zy

(I - A ) W(I - A ) (I - A ) W(I - A )y Z WZ

(I - A ) W(I - A ) (I - A ) W(

ω

X X X X

X X X X I - A )y Z WZ

21

2 2 2

T T T T

X X Xy X (I - A ) W(I - A ) (I - A ) W(I - A )y (4.18)

Misalkan 21

1 2 2 2

T TT T

(I - A ) W(I - A )A X X (I - A ) WX (I - AX ) merupakan

matriks hat untuk komponen parametrik, sehingga persamaan (4.18) dapat ditulis

kembali pada persamaan (4.19).

31

=

ˆ

I

I

I

-1T T

-1T T

-1T T

T

1 1

1 1

1 1

1 1

T

T

2

Z Z W

Z Z W

Z Z W

A Ay y + Z WZ y - y

y + Z WZ - y

Z WZ -

A A

A

A

A

A - A

y

y

(4.19)

Jika I 1 12A A -A A , maka persamaan (4.19) dapat ditulis dalam bentuk lain

berikut.

ˆ y Ay (4.20)

dengan A merupakan matriks hat gabungan antara komponen parametrik dan

nonparametrik atau dapat disebut matriks hat semiparametrik.

Untuk memudahkan konstruksi interval konfidensi untuk parameter regresi

birespon semiparametrik, persamaan (4.10) dapat disederhanakan pada persamaan

(4.21) berikut.

y Cω ε (4.21)

dengan X ZC dan 1 2T

T T ω ωω .

Teorema 7.

Jika diberikan ( , )f x,t ω Cω merupakan fungsi dari x, t , dan ω dimana

( , )f x,t ω merupakan fungsi regresi semiparametrik birespon, maka

1

ˆ

TT

C Wyω C WC merupakan penduga dari ω .

Bukti.

Nilai ω̂ didapatkan dengan metode WLS yaitu sebagai berikut.

2

T T T T

T TT T

T

T

T

L

Tω ω

ω C ω

= y C W y C

y ω C ω

ω C

Wy Wy y WC WC

y Wy W ω Cy WCω

dengan menderivatifkan 0L

ω, didapat:

32

1

2

ˆ

2

0

T T

T T

T T

T T

L

C C ωω

C C ω

C ω C

ω

Wy WC

Wy WC

WC Wy

WCC C Wy

sehingga

1

ˆ

TT C Wyω C WC (4.22)

Lemma 1.

Jika 2 1

~ ( , )N

ε 0 W , sehingga 2 1

~ ( , )N

Cωy W , maka 2 1ˆ ~ ( , )( )N Tω ω C WC .

Bukti :

Model pada persamaan (4.21) dengan asumsi 2 1

~ ( , )N

ε 0 W maka

2 1~ ( , )N

Cωy W , oleh karena y berdistribusi normal, maka persamaan (4.22)

yang merupakan kombinasi linier dari y juga berdistribusi normal dengan nilai

harapan dan variansinya dicari berikut.

1

1

1

= ( )

ˆ

=

E

E

E

T

T

T

T

T

T

C Wy

C W y

C W

ω C WC

C WC

C WC Cω

ω

(4.23)

1

1 1

1 12 1

1 12

12

( )

ˆ

T

T

Var

Var

I

Var

T

T T

T T

T

T

T T

T T

T T

T

C Wy

C W y C W

C W W C W

C

ω C WC

C WC C WC

C WC C WC

C WC WC C WC

C WC

(4.24)

33

Dengan memperhatikan persamaan (4.23) dan (4.24), maka ˆ ~ ( , )Nω ω Σ , dengan

1

2

TΣ C WC . Selanjutnya, akan dirancang interval konfidensi (1 ) 100%x

untuk v , (1) (2)

1 1

1, 2,..., (2 2 2 )q q

m m

m m

v l q r r

untuk kasus variansi error (

2 1 W ) diketahui dan variansi error ( 2 1 W ) tidak diketahui.

4.1.1 Interval Konfidensi Saat Asumsi Variansi Error ( 2 1 W ) Diketahui

Pada subbab ini dibahas mengenai konstruksi interval konfidensi terpendek

(1 ) 100%x untuk v , (1) (2)

1 1

1, 2,..., (2 2 2 )q q

m m

m m

v l q r r

untuk kasus

variansi error ( 2 1 W ) diketahui.

Teorema 8.

Jika 1 2 1 2

ˆ( , , ..., , t , t , ..., t )

v v

v l l

vv

Z x x x

ω ω

merupakan suatu pivotal quantity dengan

asumsi variansi eror diketahui , maka interval konfidensi untuk v

ω diberikan oleh:

/2 /2ˆ ˆ( ) 1

v vv v v vvP Z Z

ω ω ω .

Bukti:

Diambil sebuah transformasi yang merupakan pivotal quantity dengan

asumsi variansi eror diketahui:

1 2 1 2

ˆ( , ,..., , t , t ,..., t ) v vv l l

vv

Z x x x

ω ω (4.25)

dengan vv merupakan elemen diagonal ke-v dari Σ . Variabel random Z ~ (0,1)v N

karena merupakan kombinasi linier dari ˆ vω dengan pembuktian nilai ekspektasi

dan variansinya sebagai berikut.

ˆ

1ˆ

0

E Z E

E E

v vv

vv

v v

vv

ω ω

ω ω

34

2

ˆ

1ˆ

1 0

1

Z v vvvv

v v

vv

vv

vv

Var Var

Var Var

ω ω

ω ω

Karena Σ diketahui maka Zv merupakan pivotal quantity untuk parameter regresi

ˆ .vω Interval konfidensi (1 ) dapat diperoleh dengan menyelesaikan persamaan

dalam probabilitas

1 2 1 2 l( ( , ,..., , t , t ,..., t ) ) 1v v l vP a Z x x x b

dengan va dan vb merupakan elemen bilangan riil, v va b . Apabila persamaan

(4.25) disubstitusi pada persamaan (4.26), maka bentuknya menjadi

ˆ( ) 1v vv v

vv

P a b

ω ω (4.26)

Persamaan (4.26) jika ditulis kembali akan didapatkan interval konfidensi untuk

parameter model regresi birespon semiparametrik berikut:

ˆ ˆ( ) 1v v vv v v v vvP b a ω ω ω (4.27)

Konsep yang digunakan pada penelitian ini yaitu interval konfidensi terpendek

sehingga nilai va dan vb harus ditentukan dan memenuhi kondisi dimana panjang

interval konfidensi ( ( , )v va b ) terpendek didapatkan. Interval konfidensi terpendek

didapat dengan menyelesaikan optimasi bersyarat berikut dengan metode lagrange

, ,{ ( )} {( ) }

v v v v vv

v v v va b R a b Ra ,b a bMin Min

(4.28)

dengan syarat

( ) 1v

v

b

v va

z dz atau ( ) ( ) (1 ) 0v vb a

merupakan fungsi probabilitas (0,1)N dan merupakan fungsi probabilitas

kumulatif (0,1)N . Langkah selanjutnya untuk mendapatkan nilai va dan vb maka

35

dilakukan derivatif parsial terhadap fungsi Langrange yang dibentuk pada

persamaan (4.29)

( , , ) ( ) ( ( ) ( ) (1 ))v v v v vv v vF a b b a b a (4.29)

dengan merupakan konstanta lagrange. Berikut adalah derivatif parsial fungsi

lagrange pada persamaan (4.29) terhadap masing-masing , ,v va b dan .

( , , )

'( ) 0v v vv vv

F a ba

a

(4.30)

( , , )

'( ) 0v v vv vv

F a bb

b

(4.31)

( , , )( ) ( ) (1 ) 0v v v v

v

F a bb a

b

(4.32)

Berdasarkan persamaan (4.30) dan (4.31) diperoleh

'( ) 0

'( ) 0

'( ) '( ) 0

'( ) '( ) 0

( ) ( )

vv v

vv v

v v

v v

v v

a

b

b a

b a

b a

(4.32)

Penyelesaian persamaan (4.32) adalah v vb a atau v vb a , tetapi penyelesaian

yang memenuhi kondisi distribusi normal standar yaitu v vb a sehingga jika

penyelesaian tersebut disubstitusikan pada persamaan (4.27) maka persamaan

tersebut dapat ditulis kembali menjadi

ˆ ˆ( ) 1v v vv v v v vvP b b ω ω ω (4.33)

dimana vb diperoleh dari ( )2v

v vb

z dz

atau dalam aplikasi sering ditulis dengan

2

Z yang nilainya dapat dilihat dalam tabel distribusi normal standar sehingga

persamaan (4.33) dapat ditulis kembali pada persamaan (4.34).

/2 /2ˆ ˆ( ) 1v vv v v vvP Z Z ω ω ω (4.34)

36

4.1.2 Interval Konfidensi Saat Asumsi Variansi Error ( 2 1 W ) Tidak

Diketahui

Pada subbab ini dibahas mengenai konstruksi interval konfidensi terpendek

(1 ) 100%x untuk v , (1) (2)

1 1

1, 2,..., (2 2 )q q

m m

m m

v l q r r

untuk kasus variansi

error ( 2 1 W ) tidak diketahui.

Teorema 9.

Jika 1 2 1 2

2

ˆ( , ,..., , t , t ,..., t ) v vv l l

vv

T x x xr

ω ω merupakan suatu pivotal quantity dengan

asumsi variansi eror ( 2 1 W ) tidak diketahui, maka interval konfidensi untuk vω

adalah:

1 1

, ,2 2

ˆ ˆ( ) 1

T T

vv vvv v vc cc c

r rP t t

T TT Ty C W y y CI - C I - C W yC WC C WC

ω ω ω

dengan (1) (2)

1 1

2 2 2 2q q

m m

m m

c n l q r r

.

Bukti:

Pivotal quantity dengan asumsi 2 1 W tidak diketahui didapatkan pada

persamaan (4.36).

1 2 1 22

ˆ( , ,..., , t , t ,..., t ) v vv l l

vv

T x x xr

ω ω (4.36)

di mana vvr merupakan elemen diagonal ke v dari matriks 1

TC WC . Variabel

random ( )~ aB

T tA

a

, jika dan hanya jika memenuhi tiga syarat yaitu ~ (0,1)B N

, ( )A ~ a , dan A dan B independen. Persamaan (4.36) agar menyerupai bentuk

BT

A

a

dapat diubah menjadi persamaan (4.37) berikut.

37

1 2 1 22

2

1ˆ

( , ,..., , t , t ,..., t )1

ˆ

vvv vv l l

vvvv

v v

vv

rT x x x x

rr

r

ω ω

ω ω (4.37)

Karena 2 tidak diketahui, maka nilai 2 didekati dengan MSE.

1 1

(1) (2)

1 1

(1) (2)

1 1

(1) (2)

1 1

2 2 2 2

ˆ ˆ

2 2 2 2

ˆ ˆ

2 2 2 2

q q

m m

m m

q q

m m

m m

q q

m m

m m

n l q r r

MSE

n l q r r

n l q r r

T TT

T

T

T

Ty - C C Wy C yy C W-

(y - y

C WC C WC

) (y - y)

(y - Cω) (y - Cω)

1

(

1

1

1) (2)

1 1

(1) (2)

1 1

1

2 2 2 2

2 2 2 2

q q

m m

m m

T

q q

m m

m

T

m

n l q r r

n l q r r

T T

T

T

T

T T

T T

C W y C W y

y C W

I - C I -

C W y

C

I - C I - C

C WC C WC

C WC C WC

(4.38)

Matriks T T T

y A Ay y Ay jika A merupakan matriks idempoten, matriks A pada

persamaan (4.38) yaitu 1

TT CA C WI - C WC . Berikut adalah pembuktian

matriks A merupakan matriks idempoten sesuai dengan Teorema 2 :

1 1

1 1 1

1 1

2

2

T T

T T T

T T

T T

T T T

T T

AA I C I C

I C C C

I C

C W C W

C W C W C W

C W C WCI

C WC C WC

C WC C WC C WC

C WC C WC

`

1

TT C WI C C WC (4.39)

38

Matriks A terbukti merupakan matriks idempoten sehingga persamaan (4.38) dapat

ditulis kembali pada persamaan (4.40).

(1) (2

1 1

1

)2 2 2 2

q q

m m

m m

T

n l q r r

MSE

TTyI Cy C- WC WC

(4.40)

Mengacu pada persamaan (4.37) dan (4.40), maka pivotal quantity untuk parameter

ˆvω adalah sebagai berikut:

(1) (2)

1

1

1

1 2 1 2

2 2 2 2

ˆ

( , ,..., , t , t ,..., t )T

q q

m m

m m

v v

vv

v l l

n l q r r

rT x x x

TTI - Cy C W yC WC

ω ω

2

1

2

(1) (2)

1 1

ˆ

2 2 2 2

T

v v

vv

q q

m m

m m

r

n l q r r

TTI - Cy C W yC WC

ω ω

(4.41)

Selanjutnya, akan dibuktikan bahwa 1 2 1 2 ( )( , ,..., , t , t ,..., t ) ~v l l aT x x x t dengan

derajat bebas (1) (2)

1 1

2 2 2 2q q

m m

m m

n l q r r

.

1. Misalkan 2

ˆv v

vv

Zr

ω ω, karena Z merupakan kombinasi linier dari ˆ vω , maka Z

berdistribusi normal dengan mean ( )E Z dan Var( )Z :

2

2

2

ˆ( )

1ˆ

1

0

v v

vv

v v

vv

v v

vv

E Z Er

Er

r

ω ω

ω ω

ω ω

39

2

2

2

2

ˆ( )

1ˆ

1

v v

vv

v v

vv

vv

vv

Var Z Varr

Varr

r

r

ω ω

ω ω

Sehingga terbukti bahwa Z ~ (0,1)N .

2. Jika 2 1~ ( , )N y Cω W , sesuai dengan Teorema 5, maka

2

2

12,2

~h

T

T

Cω ACω

y Ayjika dan hanya jika A idempoten dengan h adalah rank

dari A. Pembuktian bahwa A idempoten telah dibuktikan pada persamaan

(4.39). Selanjutnya, dicari rank dari A.

(1) ( 2)

1 1

2

2

1

1

1

1

2 2

( )

( )

2

2

q q

m m

m m

n

l q r r

rank rank

trace

trace trace

n trace

n trace I

T

T

T

T

T

T

T

T

A I - C C W

C W

C

I - C

I C W

C CW

C WC

C WC

C WC

C WC

(1) (2)

1 1

2 2 2 2q q

m m

m m

n l q r r

Setelah mendapatkan rank dari A, akan dihitung 2

1( )

2

T

Cω ACω

1

1

2 2

2

2

1 1( ) ( )

2 2

1

2

1

2

0

T T

T T T T

T T T T

T

T

T

T

Cω ACω Cω I - C Cω

ω C

C

Cω ω C C Cω

ω C C

W

C W

ω ω C CIω

C WC

C WC

40

Sehingga (1) ( 2)

2 2 2 2

1 1

~q q

n l q r rm mm m

Ty Ay .

3. Jika 2~ ( , )N y Cω W maka By dan

Ty Ay independen sesuai dengan Teorema 6

jika dan hanya jika 0BA , dengan 1

ˆ

TT C Wy Byω C WC sehingga

1

TTB C WC WC

1 1

1 1 1

1 1

0

T T

T T T

T T

T T

T T T

T T

C W C W

C W C W C W

B

C W C W

A I - C

C

C WC C WC

C WC C WC C WC

C WC C WC

Berdasarkan uraian tersebut pada poin 1, 2, dan 3 dapat ditarik kesimpulan bahwa

(1) ( 2)

1 1

(2n 2 2 2 )

~ q qm m

m m

vl q r r

T t

dan merupakan pivotal quantity untuk parameter model

regresi ω̂ saat 2σ W tidak diketahui. Interval konfidensi (1 ) dapat diperoleh

dengan menyelesaikan persamaan dalam probabilitas

1 2 1 2 l( ( , ,..., , t , t ,..., t ) ) 1v v l vP a T x x x b

dengan va dan vb merupakan elemen bilangan riil, v va b . Apabila persamaan

(4.41) disubstitusi pada persamaan (4.42) maka interval konfidensi dapat ditulis

sebagai berikut.

1

(1) (2)

1 1

ˆ( ) 1

2 2 2 2

T

v vv v

vvq q

m m

m m

P a b

r

n l q r r

TTI - Cy C W y

ω

WC

ω

C

(4.42)

Persamaan (4.42) jika ditulis kembali akan didapatkan interval konfidensi untuk

parameter model regresi birespon semiparametrik berikut:

41

1

1

(1) (2)

1 1

(1) (2)

1 1

ˆ(

2 2 2 2

ˆ ) 1

2 2 2 2

T

T

v v vv vq q

m m

m m

v v vvq q

m m

m m

P b r

n l q r r

a r

n l q r r

T

T

T

T

I -y C W y

y C W y

C

I - C

C WC

C WC

ω ω

ω

(4.43)

Konsep yang digunakan pada penelitian ini yaitu interval konfidensi terpendek

sehingga nilai va dan vb harus ditentukan dan memenuhi kondisi dimana panjang

interval konfidensi ( ( , )v va b ) terpendek didapatkan. Interval konfidensi terpendek

didapat dengan menyelesaikan optimasi bersyarat berikut dengan metode lagrange

1

(1) (2)

1 1

, ,{ ( )} ( )

2 2 2 2

v v v v

v v v

T

v

vvq q

m m

m m

a b R a b Ra ,b a b r

n l q r r

Min Min

TTI - CCy W yC WC

(4.44)

dengan syarat

(t ) 1v

v

b

v va

dt atau ( ) ( )

HALAMAN JUDULrepository.its.ac.id/50710/1/1316201016_Master_Thesis.pdfatas dasar harga berlaku. Model diperoleh dengan GCV minimum sebesar 4,189, MSE sebesar 2,698 dan nilai 𝑅2

Documents

HALAMAN JUDULrepository.its.ac.id/50710/1/1316201016_Master_Thesis.pdfatas dasar harga berlaku. Model diperoleh dengan GCV minimum sebesar 4,189, MSE sebesar 2,698 dan nilai 𝑅2