PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIbuah replikasi bootstrap. Pada regresi linear berganda, metode bootstrap dibedakan menjadi dua, yaitu resampling pasangan terurut observasi

METODE BOOTSTRAP DAN APLIKASINYA

Skripsi

Diajukan untuk Memenuhi Salah Satu Syarat

Memperoleh Gelar Sarjana Program Studi Matematika

Oleh:

Amelia Enrika

NIM: 083114001

PROGRAM STUDI MATEMATIKA, JURUSAN MATEMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA

YOGYAKARTA

2011

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

i

METODE BOOTSTRAP DAN APLIKASINYA

Skripsi

Diajukan untuk Memenuhi Salah Satu Syarat

Memperoleh Gelar Sarjana Program Studi Matematika

Oleh:

Amelia Enrika

NIM: 083114001

PROGRAM STUDI MATEMATIKA, JURUSAN MATEMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA

YOGYAKARTA

2011


ii

BOOTSTRAP METHOD AND ITS APPLICATIONS

Thesis

Presented as Partial Fulfillment of the Requirements

to Obtain the Sarjana Sains Degree in Mathematics

By:

Amelia Enrika

Student Number: 083114001

MATHEMATICS STUDY PROGRAM, DEPARTMENT OF

MATHEMATICS

FACULTY OF SCIENCE AND TECHNOLOGY

SANATA DHARMA UNIVERSITY

YOGYAKARTA

2011




v

To reach a port, we must sail

Sail, not tie at anchor

Sail, not drift.

-Franklin Roosevelt-

Skripsi ini dipersembahkan untuk,

Allah Bapa, Putra dan Roh Kudus,

Kedua orang tua tercinta, Beng Lay dan Nanie,

Saudari terkasih, Seniyawati dan Novia Paulien,

Aga Hutama Tirta dan Tante Lina tersayang,

Serta orang-orang yang selalu berada di sisi saya.



vii

ABSTRAK

Tulisan ini membahas tentang metode bootstrap yang prinsipnya adalah memperlakukan sampel acak asli sebagai populasi, kemudian melakukan resampel sebanyak 𝑏𝑏 kali sebanyak mungkin, sehingga diharapkan distribusi dari sampel bootstrap tersebut mendekati normal. Dengan demikian, distribusi sampling bootstrap tersebut dapat digunakan untuk memberikan penjelasan tentang distribusi sampling, serta distribusi populasi.

Aplikasi metode bootstrap dalam statistika yang dibahas adalah pada pendugaan parameter populasi rata-rata, galat standar dan koefisien regresi linear berganda, serta pendugaan selang kepercayaan untuk rata-rata populasi dan koefisien regresi linear berganda. Pada pendugaan parameter rata-rata populasi dan galat standar digunakan metode bootstrap biasa, sedangkan untuk pendugaan selang kepercayaannya digunakan metode persentil bootstrap. Persentil bootstrap membentuk selang kepercayaan (1 − 𝛼𝛼)% dengan cara mengambil data persentil ke (𝛼𝛼 2⁄ )100 dan (1 − (𝛼𝛼 2⁄ ))100 sebagai batas bawah dan atas selang, dari 𝑏𝑏 buah replikasi bootstrap. Pada regresi linear berganda, metode bootstrap dibedakan menjadi dua, yaitu resampling pasangan terurut observasi dan resampling galat dari model regresi linear berganda. Selang kepercayaan koefisien regresi dipadukan antara kedua metode tersebut dengan metode persentil bootstrap.

Pendugaan parameter populasi dengan bootstrap dianggap cukup mendekati parameter penduga asli dan distribusinya mendekati normal seiring membesarnya nilai 𝑏𝑏 dan selang kepercayaan yang dibentuk dengan persentil bootstrap selalu menghasilkan selang yang lebih sempit dibandingkan dengan selang kepercayaan secara teoritis dengan tingkat signifikansi yang sama.

Kata kunci: metode bootstrap, resampling, rata-rata bootstrap, galat standar bootstrap, persentil bootstrap, regresi bootstrap, parameter populasi, koefisien regresi, resampling observasi, resampling galat


viii

ABSTRACT

This thesis discusses bootstrap method which treats original random sample as a population. The original random sample was resampled 𝑏𝑏 times as many as we can, so that the bootstrap sampling distribution approximates the normal distribution. Thus, the bootstrap distribution could be used to explain the sampling distribution and the population distribution.

Bootstrap method is applied in estimation of population mean, standard error, and multiple linear regression coefficients. In the estimation of mean and standard error of population, we use ordinary bootstrap method, while percentile bootstrap is used to estimate the confidence interval. Percentile bootstrap constructs a (1 − 𝛼𝛼)100% confidence interval by taking the (𝛼𝛼 2⁄ )100 and (1 − (𝛼𝛼 2⁄ ))100 percentile data of 𝑏𝑏 bootstrap replications as a lower limit and upper limit respectively. In multiple linear regression, there are two bootstrap methods, those are pair observation resampling and error/residual resampling. Confidence interval of regression coefficient is built by combining those two methods and percentile bootstrap.

The use of bootstrap method to estimate the population parameter is considered close to ordinary estimator and its distribution is approximate normal distribution as the increasing the value of 𝑏𝑏. At the same level of significance, the percentile bootstrap confidence interval always narrower than theoretical confidence interval.

Key word: bootstrap method, resampling, bootstrap mean, bootstrap standard error, percentile bootstrap, bootstrap regression, parameter of population, regression coefficient, paired observation resampling, error/residual resampling



x

KATA PENGANTAR

Puji dan syukur penulis haturkan kepada Tuhan Yesus Kristus atas berkat

dan rahmat-Nya sehingga penulis dapat menyelesaikan skripsi ini.

Penulis dapat menyusun skripsi ini bukan hanya atas kemampuan dan usaha

penulis semata, tetapi juga berkat bantuan dan dukungan berbagai pihak, oleh

karena itu penulis ingin mengucapkan terima kasih kepada:

1. Bapak Ir. Ig. Aris Dwiatmoko, M.Sc. selaku dosen pembimbing yang telah

dengan sabar memberikan pengarahan dan bimbingan selama proses

penyusunan skripsi ini.

2. Ibu Lusia Krismiyati Budiasih, S.Si., M.Si. selaku Ketua Program Studi

Matematika yang telah memberikan banyak nasehat dan bimbingan selama

penyusunan skripsi, serta Ibu Ch. Enny Murwaningtyas, S.Si., M.Si. yang

telah memberikan banyak bimbingan dalam hal akademik dan perkuliahan.

3. Seluruh bapak dan ibu dosen yang telah memberikan banyak ilmu

pengetahuan kepada penulis.

4. Perpustakaan Universitas Sanata Dharma dan staf sekretariat yang telah

memberikan fasilitas dan kemudahan pembelajaran, serta administrasi bagi

penulis selama masa perkuliahan.

5. Keluarga tersayang, yaitu kedua orang tua, beserta kedua saudari penulis:

Seniyawati dan Novia Paulien yang banyak direpotkan, tetapi terus

memberikan semangat, dukungan, dan doa kepada penulis.

6. Aga Hutama Tirta yang tidak kunjung bosan dan lelah mendukung,

menyemangati, menasehati dan mendengarkan keluh kesah penulis selama

proses penyusunan skripsi ini.

7. Teman-teman penulis: Shelli Moniaga dan Agustina Viktrisia Lily Hertati

yang selalu membantu, serta menyertai penulis dengan doa dan semangat.

Tak lupa terima kasih kepada Irene Saskia atas jempolnya yang setia

menemani saya selama 3 bulan terakhir.


xi

8. Teman-teman angkatan 2008 dan 2007 dari Program Studi Matematika yang

telah memberikan banyak pengalaman berharga, baik suka maupun duka,

dalam pembelajaran maupun kehidupan sehari-hari.

9. Semua pihak yang telah membantu penulis, tetapi tidak dapat disebutkan satu

persatu.

Hal yang juga disadari oleh penulis adalah masih banyaknya kekurangan

yang terdapat dalam tulisan ini, namun diharapkan agar hasil tulisan ini tetap

dapat memberikan manfaat bagi kemajuan ilmu pengetahuan, khususnya dalam

bidang matematika serta bagi pembaca tulisan ini. Kritik dan saran yang

membangun sangat penulis harapkan bagi kesempurnaan skripsi ini.

Yogyakarta, Desember 2011

Penulis


xii

DAFTAR ISI

Halaman

HALAMAN JUDUL ………………………………………………………… i

HALAMAN JUDUL DALAM BAHASA INGGRIS ……………………… ii

HALAMAN PERSETUJUAN PEMBIMBING …………………………….. iii

HALAMAN PENGESAHAN ………………………………………………... iv

HALAMAN PERSEMBAHAN ……………………………………………… v

HALAMAN PERNYATAAN KEASLIAN KARYA ……………………….. vi

HALAMAN ABSTRAK …………………………………………………….. vii

HALAMAN ABSTRACT ……………………………………………………. viii

LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA

ILMIAH UNTUK KEPENTINGAN AKADEMIS ………………………….. ix

KATA PENGANTAR ………………………………………………………... x

DAFTAR ISI …………………………………………………………………. xii

DAFTAR GAMBAR ………………………………………………………… xv

DAFTAR TABEL ……………………………………………………………. xvi

DAFTAR PROGRAM ……………………………………………………….. xix

BAB I PENDAHULUAN

A. Latar Belakang Masalah ………………………………………………. 1

B. Perumusan Masalah …………………………………………………... 7

C. Pembatasan Masalah …………………………………………………. 7

D. Tujuan Penulisan ……………………………………………………... 8

E. Manfaat Penulisan ……………………………………………………. 8


xiii

F. Metode Penulisan …………………………………………………….. 8

G. Sistematika Penulisan ………………………………………………… 9

BAB II LANDASAN TEORI

A. Teori Sampling

1. Sampling ………………………………………………………… 11

2. Bilangan Random ……………………………………………….. 14

3. Pembangkit Bilangan Random ………………………………….. 15

4. Distribusi Sampling ……………………………………………… 16

B. Estimasi

1. Estimasi Titik ……………………………………………………. 26

2. Estimasi Interval …………………………………………………. 26

C. Regresi Linear Berganda

1. Model Regresi Linear Berganda ………………………………… 28

2. Metode Kuadrat Terkecil ……………………………………….. 30

3. Sifat-Sifat Penduga Kuadrat Terkecil …………………………… 32

4. Selang Kepercayaan Untuk Parameter Regresi …………………. 34

BAB III METODE BOOTSTRAP

A. Prinsip Dasar Dan Algoritma Metode Bootstrap ……………………. 35

B. Aplikasi Pendekatan Galat Standar Dari Mean Dengan

Metode Bootstrap ……………………………………………………. 46

BAB IV APLIKASI METODE BOOTSTRAP

A. Metode Persentil Bootstrap

1. Dasar Pembentukan Selang Parameter Populasi Dengan


xiv

Metode Persentil Bootstrap ……………………………………… 54

2. Pembentukan Selang Kepercayaan Dengan Metode

Persentil Bootstrap ………………………………………………. 57

B. Regresi Linear Bootstrap

1. Metode Bootstrap Untuk Pendugaan Parameter Dalam

Regresi Linear Berganda ………………………………………… 64

a. Algoritma Metode Bootstrap Untuk

Meresampling Observasi …………………………………….. 65

b. Algoritma Metode Bootstrap Untuk

Meresampling Galat …………………………………………. 72

2. Pembentukan Selang Kepercayaan Bootstrap

Untuk Parameter Regresi ………………………………………… 79

BAB V PENUTUP

A. Kesimpulan …………………………………………………………… 87

B. Saran ………………………………………………………………….. 88

DAFTAR PUSTAKA ……………………………………………………….. 89

LAMPIRAN …………………………………………………………………. 91


xv

DAFTAR GAMBAR

Halaman

GAMBAR 1.1. ................................................................................................... 4

GAMBAR 2.1. ................................................................................................... 25

GAMBAR 2.2. ................................................................................................... 25

GAMBAR 3.1. ................................................................................................... 35

GAMBAR 3.2. ................................................................................................... 41

GAMBAR 3.3. ................................................................................................... 42

GAMBAR 3.4. ................................................................................................... 42

GAMBAR 3.5. ................................................................................................... 44

GAMBAR 3.6. ................................................................................................... 45

GAMBAR 3.7. ................................................................................................... 115

GAMBAR 3.8. ................................................................................................... 52

GAMBAR 4.1. ................................................................................................... 116

GAMBAR 4.2. ................................................................................................... 66

GAMBAR 4.3. ................................................................................................... 66

GAMBAR 4.4. ................................................................................................... 117

GAMBAR 4.5. ................................................................................................... 118

GAMBAR 4.6. ................................................................................................... 75

GAMBAR 4.7. ................................................................................................... 119

GAMBAR 4.8. ................................................................................................... 120


xvi

DAFTAR TABEL

Halaman

TABEL 3.1. …………………………………………………………………… 91

TABEL 3.2. …………………………………………………………………... 91

TABEL 3.3. …………………………………………………………………… 91

TABEL 3.4. …………………………………………………………………… 92

TABEL 3.5. …………………………………………………………………… 92

TABEL 3.6. …………………………………………………………………… 93

TABEL 4.1. …………………………………………………………………… 94

TABEL 4.2. …………………………………………………………………… 94

TABEL 4.3. …………………………………………………………………… 95

TABEL 4.4. …………………………………………………………………… 95

TABEL 4.5. …………………………………………………………………… 96

TABEL 4.6. …………………………………………………………………… 97

TABEL 4.7. …………………………………………………………………… 98

TABEL 4.8. …………………………………………………………………… 99

TABEL 4.9. …………………………………………………………………… 100

TABEL 4.10. …………………………………………………………………. 101

TABEL 4.11. ………………………………………………………………….. 102

TABEL 4.12. …………………………………………………………………. 102

TABEL 4.13. ………………………………………………………………….. 102


xvii

TABEL 4.14. …………………………………………………………………. 103

TABEL 4.15. …………………………………………………………………. 103

TABEL 4.16. …………………………………………………………………. 103

TABEL 4.17. …………………………………………………………………. 104

TABEL 4.18. …………………………………………………………………. 104

TABEL 4.19. …………………………………………………………………. 104

TABEL 4.20. …………………………………………………………………. 105

TABEL 4.21. …………………………………………………………………. 105

TABEL 4.22. …………………………………………………………………. 106

TABEL 4.23. …………………………………………………………………. 106

TABEL 4.24. …………………………………………………………………. 106

TABEL 4.25. …………………………………………………………………. 107

TABEL 4.26. …………………………………………………………………. 107

TABEL 4.27. …………………………………………………………………. 107

TABEL 4.28. …………………………………………………………………. 108

TABEL 4.29. …………………………………………………………………. 108

TABEL 4.30. …………………………………………………………………. 108

TABEL 4.31. …………………………………………………………………. 109

TABEL 4.32. …………………………………………………………………. 109

TABEL 4.33. …………………………………………………………………. 109

TABEL 4.34. …………………………………………………………………. 110


xviii

TABEL 4.35. …………………………………………………………………. 110

TABEL 4.36. …………………………………………………………………. 111

TABEL 4.37. …………………………………………………………………. 113


xix

DAFTAR PROGRAM

Halaman

PROGRAM 3.1. ……………………………………………………………… 121

PROGRAM 4.1. ……………………………………………………………… 123

PROGRAM 4.2. ……………………………………………………………… 124

PROGRAM 4.3. ……………………………………………………………… 127

PROGRAM 4.4. ……………………………………………………………… 130

PROGRAM 4.5. ……………………………………………………………… 132


BAB I

PENDAHULUAN

A. Latar Belakang Masalah

Sampling, yang berarti pengambilan sampel sering digunakan oleh para

statistikawan atau ilmuwan untuk mempermudah penelitian mereka, karena

ketidakmungkinan peneliti untuk mengobservasi objek-objek populasi secara

menyeluruh. Keterbatasan biaya, waktu, tenaga peneliti dan juga kesulitan pe-

ngumpulan data populasi adalah alasan-alasan dilakukannya sampling. Ba-

nyak metode sampling yang telah diciptakan oleh para peneliti, sebagai contoh

Metode Sampel Acak Sederhana, Metode Stratifikasi, Metode Cluster, dan se-

bagainya. Dari metode sampling ini, muncul pengembangannya, yaitu resam-

pling. Selama beberapa dekade terakhir, telah dilakukan pengembangan me-

tode resampling, Metode Jackknife, Metode Cross-validation dan Metode

Bootstrap merupakan teknik resampling yang sering digunakan para peneliti

dalam menganalisis data.

Dalam kondisi praktis dan statistikal, bentuk distribusi sampling jarang

diketahui secara pasti. Pendekatan parametrik tradisional lebih menekankan

pendugaan distribusi sampling dibandingkan pembuatan inferensi terhadap pa-

rameter populasi dari sebuah sampel. Cara yang digunakan adalah dengan

mengasumsikan bentuk distribusi sampling dari parameter penduga yang dike-

tahui sifat-sifat probabilitasnya (contohnya distribusi normal atau eksponen-

sial). Dalam pendekatan parametrik tradisional, parameter dari distribusi

sampling diduga secara analitik. Para peneliti dan statistikawan melakukan


2

perhitungan secara analitik menggunakan rumus yang rumit. Namun sering

kali ditemukan kendala berkaitan dengan distribusi sampling. Biasanya ken-

dala tersebut berupa kesulitan mendekati distribusi sampling secara analitik,

baik karena perhitungan yang terlalu sulit atau rumus yang rumit. Selain itu,

pendekatan secara analitik menggunakan asumsi-asumsi tertentu seperti ben-

tuk distribusi, apakah data tersebut normal atau tidak, ataupun bergantung pa-

da Teorema Limit Pusat. Pada kenyataannya secara praktis, terkadang para

peneliti tidak bisa bergantung pada asumsi-asumsi tersebut. Kesulitan untuk

mendekati distribusi sampling secara analitik tersebut menyebabkan data tidak

bisa diolah secara analitik. Akibatnya, parameter populasi pun sulit untuk di-

dekati secara analitik. Maka dari itu, banyak dilakukan riset untuk mengolah

data secara langsung dengan komputer untuk menanggulangi masalah-

masalah tersebut.

Perkembangan teknologi komputer yang sangat signifikan dalam bebe-

rapa dekade terakhir ini memberikan pengaruh yang besar dalam bidang statis-

tika. Analisis data menjadi lebih mudah dilakukan dengan adanya otomatisasi

penggambaran grafik dan perhitungan data. Studi statistikal yang melibatkan

himpunan data yang besar dan kompleks sekarang ini mampu dianalisa de-

ngan lebih mudah, sehingga juga berpengaruh pada efisiensi biaya penelitian.

Penelitian dapat dilakukan lebih cepat dan lebih sedikit biaya dibandingkan

dulu karena banyak muncul metode yang menerapkan komputasi yang sebe-

lumnya tidak terpikirkan untuk pendugaan parameter populasi, pembentukan

selang kepercayaan, dan uji signifikansi.


3

Pada tahun 1979, Bradley Efron mengembangkan metode Bootstrap un-

tuk pertama kalinya. Metode resampling yang berbasis komputer ini, bukan

metode resampling yang pertama kali muncul. Menurut Kvam dan Vidakovic

(2007), sebelum Metode Bootstrap, ada metode permutasi Fisher, Pitman, dan

metode Jackknife, tetapi metode Bootstrap adalah metode resampling yang

paling populer yang digunakan para peneliti pada saat ini. Metode ini sangat

popular di kalangan para peneliti karena metode ini langsung mengolah data,

menggunakan komputer sebagai pengolah datanya. Lagipula, para peneliti ti-

dak membutuhkan hitungan teoritis untuk mencapai parameter populasi tu-

juannya. Bootstrap baru-baru dikembangkan karena sangat bergantung pada

kecanggihan teknologi komputer untuk melakukan perhitungannya. Dengan

menyimulasikan langsung data-data yang ada, bootstrap menghindarkan kita

dari pembuatan model dan asumsi-asumsi yang tak dibutuhkan tentang para-

meter. Secara imajinatif, metode ini seolah-olah menarik diri sendiri dengan

tali sepatu sendiri (dengan mengambil sampel dari sampel itu sendiri) diban-

ding menggantungkan diri pada bantuan luar (dari asumsi-asumsi parametrik).

Dari sisi tersebut, metode bootstrap terlihat seperti sebuah prosedur nonpara-

metrik. Kenyataannya, bootstrap merupakan teknik resampling yang meli-

batkan bentuk parametrik dan nonparametrik, tetapi pada esensinya, merupa-

kan prosedur yang lebih bersifat empiris.

Efron menganalogikan istilah bootstrap dengan cerita rakyat Inggris, ya-

itu cerita Petualangan Baron von Munchausen. Dikisahkan sang Baron mele-

paskan diri dari rawa dengan menarik dirinya sendiri dengan menggunakan ta-


4

li sepatunya sendiri. Keadaan di mana sang Baron menggunakan tali sepa-

tunya sendiri untuk menyelamatkan dirinya, inilah yang dianalogikan Efron

dalam metode Bootstrap.

Peneliti menggunakan sampel dari sampel itu sendiri untuk mengetahui

parameter populasi. Efron ingin mendeskripsikan metode ini dengan istilah

bootstrap untuk membantu kita memahami karakteristik dari suatu estimator

tanpa bantuan dari model probabilitas tambahan atau asumsi-asumsi parame-

trik. Ketika memperkenalkan versi bootstrap, Efron termotivasi oleh dua ma-

salah yang paling penting dalam statistika terapan, yaitu penentuan penduga

untuk suatu parameter tujuan dan evaluasi dari keakuratan dari penduga terse-

but melalui galat standar dari penduga dan penentuan selang kepercayaan un-

tuk parameter tujuan tersebut. Sampel asli yang pertama kali diambil dipan-

dang sebagai suatu populasi karena sampel asli sebanyak 𝑛𝑛 buah itu dianggap

Gambar 1.1. Pada versi awal cerita, dikatakan bahwa Sang Baron menggunakan rambutnya sendiri untuk menyelamatkan dirinya sendiri. Tetapi lama-kelamaan ceritanya berubah menjadi Sang Baron menye-lamatkan dirinya dengan bootstrap.


5

mewakili karakteristik-karakteristik dari populasi (karena pengambilannya di-

lakukan secara acak). Karena perlakuan itu, metode bootstrap tidak memerlu-

kan asumsi kuat terhadap distribusi sampling dari statistik penduga untuk

mendekati distribusi samplingnya. Jadi begitu pula dengan resampel atau

sampel bootstrap yang diambil dengan pengembalian juga dianggap merepre-

sentasikan populasi sama halnya seperti bila kita mengambil banyak sampel

dari populasi. Banyak dilakukan simulasi dari data-data sampel yang telah

tersedia sangatlah menguntungkan peneliti atau statistikawan. Hal itu meng-

hindarkan kita dari pembuatan asumsi-asumsi yang tidak dibutuhkan tentang

parameter dan model. Bila dibandingkan dengan pendekatan parametrik tradi-

sional, metode bootstrap memuat lebih banyak repetisi dari komputasi data

sampel untuk mendekati bentuk distribusi sampling suatu statistik bila diban-

ding asumsi distribusional yang kuat ataupun formula analitik. Kelebihan

yang lain dari metode ini adalah dapat diterapkan seberapapun sulitnya ke-

mungkinan pencapaian nilai penduga parameter populasi. Para peneliti ba-

nyak menggunakan metode ini untuk diterapkan dalam berbagai bidang, con-

tohnya di bidang psikologi, geologi, ekonometrika, biologi, teknik, kimia dan

akunting. Bootstrap sering digunakan pada bidang-bidang tersebut karena se-

ring kali para peneliti hanya memiliki data sampel yang sangat sedikit.

Metode ini sering digunakan ketika distribusi sampling dari statistik ti-

dak dapat diasumsikan berdistribusi normal (seperti mengestimasi koefisien

regresi dengan Ordinary Least Square), atau ketika distribusi sampling tidak

memiliki solusi analitik atau tidak tahu bagaimana cara mendekatinya secara


6

analitik. Selain itu, bila ukuran populasinya cukup besar sehingga sulit untuk

menentukan kerangka sampel, lebih baik dilakukan resampling dengan me-

tode ini.

Dalam statistika, kita mengenal penduga parameter populasi berupa se-

lang kepercayaan. Selang kepercayaan suatu parameter θ dibentuk dengan

menentukan suatu selang nilai yang dengan peluang besar memuat parameter

yang diduga (parameter populasi) dan erornya harus minimum. Bentuk selang

kepercayaan ada tiga, yaitu:

�∞,𝜃𝜃�𝑈𝑈�, �𝜃𝜃�𝐿𝐿 ,∞�, �𝜃𝜃�𝐿𝐿 ,𝜃𝜃�𝑈𝑈�

dengan 𝜃𝜃�𝑈𝑈 adalah batas atas selang dan 𝜃𝜃�𝐿𝐿 adalah batas bawah selang. Dalam

tulisan ini, akan diulas bagaimana membentuk selang kepercayaan tersebut de-

ngan metode Bootstrap. Pembentukan selang kepercayaan yang akan diulas

adalah pembentukan selang kepercayaan dengan metode Persentil Bootstrap.

Metode Persentil Bootstrap menghasilkan selang kepercayaan yang lebih pen-

dek, variansi yang lebih kecil, dan tingkat kepercayaan yang lebih tinggi jika

dibandingkan dengan metode lain yang selama ini digunakan.

Metode Bootstrap juga dapat diterapkan pada regresi linear untuk mere-

sampling sampelnya dalam upaya mendekati koefisien-koefisien model regre-

si linear. Prinsip resampling bootstrap dalam regresi linear dibedakan berda-

sarkan asumsi tetap atau acaknya variabel independen dari sampel asli.


7

B. Perumusan Masalah

Permasalahan yang akan dibahas dalam tulisan ini akan dirumuskan se-

bagai berikut:

1. Apakah yang dimaksud dengan metode Bootstrap dan bagaimana landasan

teoritiknya?

2. Bagaimana penerapan metode Bootstrap pada pendugaan selang parameter

populasi dan parameter regresi linear berganda?

3. Bagaimana algoritma dan pemrograman MATLAB untuk pendugaan se-

lang parameter populasi dengan menggunakan metode Bootstrap?

4. Bagaimana algoritma dan pemrograman MATLAB untuk pendugaan pa-

rameter regresi dengan menggunakan metode Bootstrap?

C. Pembatasan Masalah

Penulis akan membatasi beberapa hal untuk uraian masalah yang akan

dibahas, yaitu:

1. Distribusi normal dan Student-t tidak dibahas dalam tulisan ini.

2. Pembentukan selang parameter populasi dengan prinsip Bootstrap dibatasi

hanya menggunakan metode Persentil Bootstrap.

3. Aplikasi metode bootstrap hanya dibatasi pada pendugaan parameter rata-

rata populasi, parameter koefisien regresi berganda, selang kepercayaan

rata-rata populasi, dan selang kepercayaan koefisien regresi berganda.


8

D. Tujuan Penulisan

Tulisan ini disusun dengan tujuan agar dapat lebih memahami salah satu

teknik resampling yang sering digunakan dalam statistika, yaitu Metode Boot-

strap. Terlebih lagi, akan dipelajari prinsip Bootstrap dalam metode Persentil

Bootstrap untuk membangun selang kepercayaan parameter populasi. Selain

itu, prinsip bootstrap dalam regresi linear berganda juga dipelajari dalam tuli-

san ini. Sebagai tambahan, kitapun akan mempelajari bagaimana penerapan

prinsip-prinsip tersebut dalam pemrograman MATLAB. Tulisan ini juga di-

susun sebagai pemenuhan tugas akhir dalam Program Studi Matematika Un-

iversitas Sanata Dharma.

E. Manfaat Penulisan

Dengan memperlajari topik ini kita dapat mempelajari kegunaan-

kegunaan metode Bootstrap dalam membangun selang penduga parameter po-

pulasi dengan memanfaatkan data-data yang ada. Kita juga dapat mempelajari

prinsip bootstrap dalam pengambilan sampel dalam regresi linear berganda.

Terlebih dari itu, kita juga dapat menerapkan metode tersebut dalam algoritma

dan pemrograman MATLAB sehingga proses komputasi lebih efektif dan efi-

sien.

F. Metode Penulisan

Penulis menggunakan metode studi kepustakaan, yaitu dengan mempela-

jari literatur yang berkaitan dengan topik metode Bootstrap dan teknik sam-


9

pling guna mencari perannya dalam membangun selang penduga parameter

populasi dan penduga parameter regresi linear berganda.

G. Sistematika Penulisan

BAB I. PENDAHULUAN

A. Latar Belakang Masalah

B. Perumusan Masalah

C. Pembatasan Masalah

D. Tujuan Penulisan

E. Manfaat Penulisan

F. Metode Penulisan

G. Sistematika Penulisan

BAB II. LANDASAN TEORI

A. Teori Sampling

B. Estimasi


BAB III. METODE BOOTSTRAP

A. Prinsip Dasar Dan Algoritma Metode Bootstrap

B. Aplikasi Pendekatan Galat standar Dari Mean Dengan Metode Boot-

strap


10

BAB IV. APLIKASI METODE BOOTSTRAP


B. Regresi Bootstrap

BAB V. PENUTUP

A. Kesimpulan

B. Saran

DAFTAR PUSTAKA

LAMPIRAN


BAB II

LANDASAN TEORI

A. Teori Sampling

1. Sampling

Dalam statistika, selalu ditemui istilah populasi atau semesta. Istilah

ini mengacu pada sekumpulan dari individu-individu atau atributnya, yang

dapat dispesifikasikan secara numerik. Contohnya, populasi dari berat ba-

dan, harga beras, dan sebagainya. Populasi yang memiliki elemen yang

terhingga jumlahnya disebut sebagai populasi terhingga. Contohnya ada-

lah populasi dari berat badan 48 siswa di suatu kelas. Istilah yang juga

sering dijumpai adalah sampel. Sampel merupakan bagian yang terpilih

dari suatu populasi dan proses pemilihan bagian terpilih tersebut disebut

sebagai sampling.

Sampling atau penarikan sampel, bertujuan untuk memperoleh in-

formasi (sebanyak mungkin) yang mendukung pengamatan variabel ter-

tentu guna mendapatkan keterangan tentang suatu populasi. Secara khu-

sus, sampling dilakukan untuk mengestimasi parameter tertentu dari suatu

populasi. Pemilihan sampel harus dilakukan secara acak (sampling acak)

agar semua elemen populasi memiliki peluang yang sama untuk terpilih.

Bilangan random (yang akan dibahas dalam subbab berikutnya) digunakan

dalam proses sampling acak.


12

Definisi 2.1.

Diberikan 𝑁𝑁 dan 𝑛𝑛 yang mewakili banyaknya elemen dari ukuran populasi

dan ukuran sampel secara berturut-turut. Bila samplingnya diperoleh den-

gan suatu cara sedemikian sehingga setiap dari �𝑁𝑁𝑛𝑛� buah sampel memiliki

probabilitas yang sama untuk terpilih, sampling tersebut dikatakan acak

dan hasilnya dikatakan sampel acak.

Dengan sampling sederhana, kita bermaksud melakukan sampling

acak secara bersamaan. Cara ini merupakan cara untuk memilih 𝑛𝑛 buah

sampel acak dari 𝑁𝑁 anggota populasi, sehingga 𝐶𝐶𝑛𝑛𝑁𝑁 sampel yang berbeda

memiliki peluang yang sama untuk dipilih. Dengan begitu, setiap sampel

memiliki probabilitas yang independen dan konstan. Tiap sampel diambil

satu-persatu setelah sebelumnya dinomori dari 1 sampai 𝑁𝑁. Kemudian, bi-

langan-bilangan random bernilai di antara 1 sampai 𝑁𝑁 dibangkitkan dan

digunakan untuk memilih secara acak.

Terdapat dua macam cara penarikan sampel berdasarkan pengemba-

lian sampel, yaitu sampling tanpa pengembalian dan sampling dengan pe-

ngembalian. Menurut buku Encyclopedia of Statistical Sciences (2006),

“Sampling is said to be with or without replacement according as to

whether or not the same member of the population may be selected more

than once.”, kemungkinan suatu anggota dari populasi dapat dipilih lebih

dari sekali itulah yang menentukan cara sampling ini.


13

Bila sebuah sampel yang diambil pada pengambilan pertama tidak

dikembalikan sebelum pengambilan sampel yang kedua, dan begitu sete-

rusnya, maka cara ini disebut dengan sampling tanpa pengembalian. Sam-

pling dengan metode ini tidak termasuk dalam sampling sederhana karena

probabilitas terpilihnya sampel tidak konstan. Pada sampling tanpa pen-

gembalian, pengambilan pertama pada sebuah himpunan sampel berukur-

an 𝑛𝑛 memiliki probabilitas sebesar 𝑛𝑛 𝑁𝑁⁄ . Pengambilan kedua memiliki

probabilitas sebesar (𝑛𝑛 − 1) (𝑁𝑁 − 1)⁄ karena anggota sampel dan populasi

masing-masing berkurang 1 anggota dengan tidak dilakukannya pengem-

balian sampel. Begitu pula untuk pengambilan ketiga dan seterusnya.

Maka dari itu, untuk sampling tanpa pengembalian, probabilitas semua 𝑛𝑛

buah sampel dapat dipilih dalam 𝑁𝑁 kali pengambilan adalah:

𝑛𝑛𝑁𝑁⋅

(𝑛𝑛 − 1)(𝑁𝑁 − 1)

⋅(𝑛𝑛 − 2)(𝑁𝑁 − 2)

⋅⋅⋅1

(𝑁𝑁 − 𝑛𝑛 + 1)=𝑛𝑛! (𝑁𝑁 − 𝑛𝑛)!

𝑁𝑁!=

1𝐶𝐶𝑛𝑛𝑁𝑁

Pada sampling dengan pengembalian, sampel yang sebelumnya telah

diambil, dikembalikan terlebih dulu sebelum mengambil sampel berikut-

nya. Jadi, sampel ke-i dapat muncul 0,1,2, … ,𝑛𝑛 kali dalam himpunan

sampelnya. Karena adanya pengembalian, seluruh unit sampel memiliki

peluang yang sama untuk dipilih, berapa kalipun sampel tersebut sudah

terpilih sebelumnya. Jadi, pada sampling dengan pengembalian, probabili-

tas masing-masing 𝑛𝑛 buah sampel untuk terpilih adalah 1 𝑁𝑁⁄ .

Alasan dilakukannya sampling yaitu, adalah suatu hal yang mustahil

bila seorang peneliti mengamati seluruh anggota dari populasi. Kalaupun

hal tersebut mungkin dilakukan, maka pasti akan membutuhkan biaya,


14

waktu dan sumber daya manusia yang tidak sedikit. Suatu populasi, mi-

salnya darah dalam tubuh manusia, tidak mungkin diobservasi seluruhnya

karena pengamatan seperti itu bersifat destruktif bagi populasi. Sering kali

pula populasi dianggap terlalu dinamis, dapat berubah-ubah sewaktu-

waktu, contohnya populasi penduduk suatu daerah. Sebenarnya peng-

amatan secara keseluruhan anggota populasi mungkin saja dilakukan dan

akan menghasilkan keterangan tentang populasi yang lebih tepat dan aku-

rat dibandingkan dengan mengamati sampel. Meskipun begitu, kita perlu

menjaga keseimbangan antara ketepatan hasil dengan banyaknya sumber

daya yang harus dikorbankan dengan mengamati populasi secara menyelu-

ruh. Karena itulah, para peneliti lebih memilih untuk mengamati sampel,

dengan syarat galat pengamatan diminimalisir daripada mengorbankan ba-

nyak sumber daya untuk penelitian populasi. Keterangan tentang populasi

dengan galat yang minimal dianggap cukup memuaskan bagi peneliti.

2. Bilangan Random

Sebelum teknologi komputer dan simulasi matematis berkembang

seperti sekarang ini, bilangan random biasanya didapat dari tabel bilangan

random yang disusun oleh L. H. C. Tippet. Tabel tersebut terdiri dari

10.400 buah bilangan empat digit. Bilangan random ini sangat diperlukan

untuk metode statistika yang bersifat probabilistik, seperti metode sam-

pling Monte Carlo. Dewasa ini, bilangan random sudah dapat dibang-


15

kitkan dengan menggunakan komputer, sehingga simulasi matematis dapat

dilakukan dengan mudah.

Sifat bilangan random yang acak diterapkan untuk membangkitkan

nilai dari variabel-variabel random untuk sembarang distribusi. Bilangan

random dibangkitkan dengan menggunakan algoritma numerik. Algoritma

numerik tersebut membuat barisan bilangan yang bersifat deterministik.

Bila dilihat tanpa mengetahui algoritmanya, bilangan-bilangan tersebut

terlihat acak. Sifat acak yang sebenarnya didapatkan dari algoritma inilah

yang menyebabkan sifat semu dari bilangan random tersebut. Maka dari

itu, bilangan random sering kali disebut sebagai bilangan pseudorandom.

3. Pembangkit Bilangan Random

Cara yang paling sederhana untuk membangkitkan bilangan random

yaitu dengan menggunakan Linear Congruential Generators.

Langkah pertama dimulai dengan nilai awal 𝑥𝑥0, lalu secara rekursif

menghitung nilai-nilai selanjutnya 𝑥𝑥𝑛𝑛 , 𝑛𝑛 ≥ 1, dengan rumus:

𝑥𝑥𝑛𝑛 = 𝑎𝑎𝑥𝑥𝑛𝑛−1 + 𝑐𝑐 modulo 𝑚𝑚

di mana 𝑎𝑎,𝑚𝑚 ∈ ℤ+ (ℤ+ adalah himpunan bilangan bulat positif) dan

𝑎𝑎𝑥𝑥𝑛𝑛−1 dapat dibagi oleh 𝑚𝑚 dan sisanya diambil sebagai nilai dari 𝑥𝑥𝑛𝑛 . Se-

tiap 𝑥𝑥𝑛𝑛 , nilainya bisa bernilai 0, 1, … ,𝑚𝑚− 1 dan nilai dari 𝑥𝑥𝑛𝑛 𝑚𝑚⁄ lah yang

disebut sebagai bilangan random. Bilangan ini diambil sebagai pendekat-

an dari sebuah variabel random seragam (0,1).


16

Sebagai contoh, bila diambil 𝑎𝑎 = 13, 𝑐𝑐 = 0, 𝑚𝑚 = 31, dan 𝑥𝑥0 = 1,

akan didapatkan deret sebagai berikut:

1, 13, 14, 27, 10, 6, 16, 22, …

Rumus rekursif untuk 𝑥𝑥𝑛𝑛 akan menghasilkan 30 bilangan bulat yang me-

rupakan permutasi dari 1 sampai 30. Hal ini akan berulang ketika ketiga

puluh bilangan sudah termuat dalam 30 bilangan pertama dalam deret. Pe-

riode perulangan ini biasanya terjadi pada saat 𝑚𝑚− 1.

Sesuai dengan aturan bilangan random, kita telah mendapatkan bari-

san untuk 𝑥𝑥𝑛𝑛 dan untuk membangkitkan bilangan random, kita tinggal

membagi masing-masing 𝑥𝑥𝑛𝑛 dengan 𝑚𝑚 = 31. Dengan begitu, kita akan

mendapatkan barisan:

0.03225, 0.41935, 0.45161, 0.87097, 0.32258, 0.19355, 0.51613, 0.70968, …

Barisan bilangan itu disebut dengan bilangan pseudorandom.

Pada program MATLAB, bilangan random dapat dibangkitkan de-

ngan mudah, dengan menggunakan fungsi tertentu. Matriks akan dibang-

kitkan dalam bentuk vektor kolom atau matriks. Fungsi pembangkit bi-

langan randomnya adalah

rand(n) dan rand(m,n)

di mana m adalah banyaknya baris dan n adalah banyaknya kolom.

4. Distribusi Sampling

Sebuah statistik pada dasarnya adalah penduga bagi parameter popu-

lasi. Statistik digunakan untuk menghitung nilai dugaan parameter popu-


17

lasi tersebut. Statistik berkaitan erat dengan distribusi dari sampel yang te-

lah diamati. Distribusi ini yang menentukan kesimpulan tentang distribusi

dari populasi.

Definisi 2.2.

Statistik adalah sebuah fungsi dari variabel random yang dapat diobservasi

dalam sebuah sampel dan diketahui sebagai konstanta. Statistik digunakan

untuk membuat inferensi (estimasi atau keputusan) tentang parameter po-

pulasi yang tidak diketahui.

Karena statistik adalah fungsi dari variabel random yang diobservasi

dalam sebuh sampel, jadi statistik itu sendiri adalah variabel random. Dis-

tribusi probabilitas dari suatu statistik tersebut disebut distribusi sampling.

Untuk membentuk distribusi sampling secara teoritis dari sebuah statistik,

akan bergantung pada distribusi dari random variabel yang dapat diobser-

vasi pada sampel.

Distribusi sampling yang berkaitan dengan distribusi normal sangat

diperlukan karena dibutuhkan untuk mendekati distribusi normal. Hal ini

disebabkan oleh banyaknya pengamatan konkrit yang memiliki distribusi

yang dapat dimodelkan dengan distribusi normal. Misalkan diberikan va-

riabel random 𝑋𝑋1,𝑋𝑋2, … ,𝑋𝑋𝑛𝑛 yang dapat diobservasi pada suatu sampel

acak, teorema berikut membentuk distribusi sampling dari statistik

𝑋𝑋� = (1 𝑛𝑛⁄ )(𝑋𝑋1 + 𝑋𝑋2 + ⋯+ 𝑋𝑋𝑛𝑛).


18

Teorema 2.1.

Diberikan variabel random 𝑋𝑋1,𝑋𝑋2, … ,𝑋𝑋𝑛𝑛 yang secara independen berdis-

tribusi normal dengan 𝐸𝐸(𝑋𝑋𝑖𝑖) = 𝜇𝜇𝑖𝑖 dan 𝑉𝑉𝑎𝑎𝑉𝑉(𝑋𝑋𝑖𝑖) = 𝜎𝜎𝑖𝑖2, 𝑖𝑖 = 1,2, … ,𝑛𝑛. Di-

definisikan 𝑈𝑈 sebagai

𝑈𝑈 = �𝑎𝑎𝑖𝑖𝑋𝑋𝑖𝑖

𝑛𝑛

𝑖𝑖=1

= 𝑎𝑎1𝑋𝑋1 + 𝑎𝑎2𝑋𝑋2 + ⋯+ 𝑎𝑎𝑛𝑛𝑋𝑋𝑛𝑛

di mana 𝑎𝑎1,𝑎𝑎2, … ,𝑎𝑎𝑛𝑛 konstan. Maka 𝑈𝑈 adalah variabel random yang ber-

distribusi normal dengan

𝐸𝐸(𝑈𝑈) = �𝑎𝑎𝑖𝑖𝜇𝜇𝑖𝑖

𝑛𝑛

𝑖𝑖=1

𝑉𝑉𝑎𝑎𝑉𝑉(𝑈𝑈) = �𝑎𝑎𝑖𝑖2𝜎𝜎𝑖𝑖2𝑛𝑛

𝑖𝑖=1

Bukti:

Karena 𝑋𝑋𝑖𝑖 berdistribusi normal dengan mean 𝜇𝜇𝑖𝑖 dan variansi 𝜎𝜎𝑖𝑖2, 𝑋𝑋𝑖𝑖

memiliki Fungsi Pembangkit Momen (FPM)

𝑚𝑚𝑋𝑋𝑖𝑖(𝑡𝑡) = exp�𝜇𝜇𝑖𝑖𝑡𝑡 +𝜎𝜎𝑖𝑖2𝑡𝑡2

2�

maka dari itu, 𝑎𝑎𝑖𝑖𝑋𝑋𝑖𝑖 memiliki FPM

𝑚𝑚𝑎𝑎𝑖𝑖𝑋𝑋𝑖𝑖(𝑡𝑡) = 𝐸𝐸(𝑒𝑒𝑡𝑡𝑎𝑎𝑖𝑖𝑋𝑋𝑖𝑖) = 𝑚𝑚𝑋𝑋𝑖𝑖(𝑎𝑎𝑖𝑖𝑡𝑡) = exp�𝜇𝜇𝑖𝑖𝑎𝑎𝑖𝑖𝑡𝑡 +𝑎𝑎𝑖𝑖2𝜎𝜎𝑖𝑖2𝑡𝑡2

2�

Karena 𝑋𝑋𝑖𝑖 independen, maka 𝑎𝑎𝑖𝑖𝑋𝑋𝑖𝑖 juga independen untuk 𝑖𝑖 = 1,2, … ,𝑛𝑛,

maka

𝑚𝑚𝑈𝑈(𝑡𝑡) = 𝑚𝑚𝑎𝑎1𝑋𝑋1 (𝑡𝑡)𝑚𝑚𝑎𝑎2𝑋𝑋2 (𝑡𝑡) …𝑚𝑚𝑎𝑎𝑛𝑛𝑋𝑋𝑛𝑛 (𝑡𝑡)


19

= exp�𝜇𝜇1𝑎𝑎1𝑡𝑡 +𝑎𝑎1

2𝜎𝜎12𝑡𝑡2

2�… exp�𝜇𝜇𝑛𝑛𝑎𝑎𝑛𝑛𝑡𝑡 +

𝑎𝑎𝑛𝑛2𝜎𝜎𝑛𝑛2𝑡𝑡2

2�

= exp�𝑡𝑡�𝜇𝜇𝑖𝑖𝑎𝑎𝑖𝑖

𝑛𝑛

𝑖𝑖=1

+𝑡𝑡2

2�𝑎𝑎𝑖𝑖2𝜎𝜎𝑖𝑖2𝑛𝑛

𝑖𝑖=1

�

adalah FPM dari distribusi normal dengan mean ∑ 𝜇𝜇𝑖𝑖𝑎𝑎𝑖𝑖𝑛𝑛𝑖𝑖=1 dan variansi

∑ 𝑎𝑎𝑖𝑖2𝜎𝜎𝑖𝑖2𝑛𝑛𝑖𝑖=1 . Karena FPM berkorespondensi satu-satu dengan distribusi

probabilitas, maka menurut teorema ketunggalan FPM, 𝑈𝑈 berdistribusi

normal dengan mean ∑ 𝜇𝜇𝑖𝑖𝑎𝑎𝑖𝑖𝑛𝑛𝑖𝑖=1 dan variansi ∑ 𝑎𝑎𝑖𝑖2𝜎𝜎𝑖𝑖2𝑛𝑛

𝑖𝑖=1 .

Teorema 2.2.

Diberikan sampel acak 𝑋𝑋1,𝑋𝑋2, … ,𝑋𝑋𝑛𝑛 berukuran 𝑛𝑛 dari distribusi normal

dengan mean 𝜇𝜇 dan variansi 𝜎𝜎2, maka

𝑋𝑋� =1𝑛𝑛�𝑋𝑋𝑖𝑖

𝑛𝑛

𝑖𝑖=1

berdistribusi normal dengan 𝜇𝜇 dan variansi 𝜎𝜎2 𝑛𝑛⁄ .

Bukti:

Karena 𝑋𝑋1,𝑋𝑋2, … ,𝑋𝑋𝑛𝑛 adalah sampel acak dari distribusi normal de-

ngan mean 𝜇𝜇 dan variansi 𝜎𝜎2, 𝑋𝑋𝑖𝑖 adalah variabel independen berdistribusi

normal, dengan 𝐸𝐸(𝑋𝑋𝑖𝑖) = 𝜇𝜇, 𝑉𝑉𝑎𝑎𝑉𝑉(𝑋𝑋𝑖𝑖) = 𝜎𝜎2, 𝑖𝑖 = 1,2, … ,𝑛𝑛. Maka,

𝑋𝑋� =1𝑛𝑛�𝑋𝑋𝑖𝑖

𝑛𝑛

𝑖𝑖=1

=1𝑛𝑛

(𝑋𝑋1) +1𝑛𝑛

(𝑋𝑋2) + ⋯+1𝑛𝑛

(𝑋𝑋𝑛𝑛)

dan 𝑋𝑋� adalah kombinasi linear dari 𝑋𝑋1,𝑋𝑋2, … ,𝑋𝑋𝑛𝑛 atau

𝑋𝑋� = 𝑎𝑎1𝑋𝑋1 + 𝑎𝑎2𝑋𝑋2 + ⋯+ 𝑎𝑎𝑛𝑛𝑋𝑋𝑛𝑛


20

dengan 𝑎𝑎1 = 1 𝑛𝑛⁄ , 𝑖𝑖 = 1,2, … ,𝑛𝑛.

Maka dari itu, Teorema 2.1 dapat digunakan untuk menyimpulkan bahwa

𝑋𝑋� berdistribusi normal dengan

𝐸𝐸(𝑋𝑋�) = 𝐸𝐸 �1𝑛𝑛


(𝑋𝑋2) + ⋯+1𝑛𝑛

(𝑋𝑋𝑛𝑛)�

=1𝑛𝑛

(𝜇𝜇) +1𝑛𝑛

(𝜇𝜇) + ⋯+1𝑛𝑛

(𝜇𝜇)

= 𝜇𝜇

𝑉𝑉𝑎𝑎𝑉𝑉(𝑌𝑌�) = 𝑉𝑉𝑎𝑎𝑉𝑉 �1𝑛𝑛


(𝑋𝑋2) + ⋯+1𝑛𝑛

(𝑋𝑋𝑛𝑛)�

=1𝑛𝑛2 (𝜎𝜎2) +

1𝑛𝑛2 (𝜎𝜎2) + ⋯+

1𝑛𝑛2 (𝜎𝜎2)

=1𝑛𝑛2 (𝑛𝑛𝜎𝜎2) =

𝜎𝜎2

𝑛𝑛

Jadi, distribusi sampling dari 𝑋𝑋� adalah normal dengan mean 𝜇𝜇 dan

variansi 𝜎𝜎2 𝑛𝑛⁄ . Artinya, harapan 𝑋𝑋� sama dengan harapan dari 𝑋𝑋, tetapi be-

sarnya variansi dari 𝑋𝑋� adalah 1 𝑛𝑛⁄ variansi dari 𝑋𝑋. Dengan nilai 𝑛𝑛 yang

semakin besar, semakin kecil nilai 𝑉𝑉𝑎𝑎𝑉𝑉(𝑋𝑋), jadi estimasi bagi 𝜇𝜇 semakin

baik.

Efron (1993) menjelaskan bahwa bila diberikan variabel random 𝑋𝑋

dengan fungsi probabilitas 𝑓𝑓(𝑋𝑋), nilai harapan 𝐸𝐸(𝑋𝑋), dan variansi

𝑉𝑉𝑎𝑎𝑉𝑉(𝑋𝑋), galat standar dari mean 𝑋𝑋�, yang dinotasikan sebagai 𝑆𝑆𝐸𝐸(𝑋𝑋�) ada-

lah akar dari variansi dari 𝑋𝑋�, yaitu

𝑆𝑆𝐸𝐸(𝑋𝑋�) = [𝑉𝑉𝑎𝑎𝑉𝑉(𝑋𝑋�)]1 2⁄ = 𝜎𝜎 √𝑛𝑛⁄ .


21

Teorema 2.3. (Teorema Limit Pusat)

Diberikan variabel random 𝑋𝑋1,𝑋𝑋2, … ,𝑋𝑋𝑛𝑛 yang secara independen dan seca-

ra identik berdistribusi dengan 𝐸𝐸(𝑋𝑋𝑖𝑖) = 𝜇𝜇 dan 𝑉𝑉𝑎𝑎𝑉𝑉(𝑋𝑋𝑖𝑖) = 𝜎𝜎2 < ∞,

𝑖𝑖 = 1,2, … ,𝑛𝑛. Didefinisikan

𝑈𝑈𝑛𝑛 = √𝑛𝑛 �𝑋𝑋� − 𝜇𝜇𝜎𝜎

� di mana 𝑋𝑋� =1𝑛𝑛�𝑋𝑋𝑖𝑖

𝑛𝑛

𝑖𝑖=1

maka fungsi distribusi dari 𝑈𝑈𝑛𝑛 akan mendekati fungsi distribusi normal stan-

dar dengan 𝑛𝑛 → ∞.

Bukti:

Sebuah variabel random didefinisikan sebagai berikut

𝑍𝑍𝑖𝑖 =𝑋𝑋𝑖𝑖 − 𝜇𝜇𝜎𝜎

Perhatikan bahwa 𝐸𝐸(𝑍𝑍𝑖𝑖) = 0 dan 𝑉𝑉𝑎𝑎𝑉𝑉(𝑍𝑍𝑖𝑖) = 1. Fungsi Pembangkit Mo-

men dari 𝑍𝑍𝑖𝑖 , yaitu 𝑚𝑚𝑍𝑍(𝑡𝑡) dapat ditulis sebagai

𝑚𝑚𝑍𝑍(𝑡𝑡) = 1 +𝑡𝑡2

2+𝑡𝑡3

3!𝐸𝐸�𝑍𝑍𝑖𝑖3� + ⋯

lalu,

𝑈𝑈𝑛𝑛 = √𝑛𝑛 �𝑋𝑋� − 𝜇𝜇𝜎𝜎

� =1√𝑛𝑛

�∑ 𝑋𝑋𝑖𝑖 − 𝑛𝑛𝜇𝜇𝑛𝑛𝑖𝑖=1

𝜎𝜎� =

1√𝑛𝑛

�𝑍𝑍𝑖𝑖

𝑛𝑛

𝑖𝑖=1

karena 𝑋𝑋𝑖𝑖 saling independen, hal ini mengakibatkan 𝑍𝑍𝑖𝑖 juga independen,

untuk 𝑖𝑖 = 1,2, … ,𝑛𝑛.


22

Mengingat bahwa fungsi pembangkit momen dari jumlahan variabel-

variabel random yang independen adalah perkalian dari fungsi pembangkit

momen individualnya masing-masing, maka

𝑚𝑚𝑛𝑛(𝑡𝑡) = �𝑚𝑚𝑍𝑍 �𝑡𝑡√𝑛𝑛

��𝑛𝑛

= �1 +𝑡𝑡2

2𝑛𝑛+

𝑡𝑡3

3!𝑛𝑛3 2⁄ 𝐸𝐸�𝑍𝑍𝑖𝑖3� + ⋯�𝑛𝑛

di mana 𝑘𝑘 = 𝐸𝐸(𝑍𝑍𝑖𝑖3).

Langkah selanjutnya adalah mengambil limit dari 𝑚𝑚𝑛𝑛(𝑡𝑡) untuk

𝑛𝑛 → ∞. Salah satu cara untuk menghitung nilai limit tersebut adalah den-

gan menggunakan ln𝑚𝑚𝑛𝑛(𝑡𝑡), di mana

ln𝑚𝑚𝑛𝑛(𝑡𝑡) = 𝑛𝑛 ln �1 + �𝑡𝑡2

2𝑛𝑛+

𝑡𝑡3𝑘𝑘6𝑛𝑛3 2⁄ + ⋯��

ekspansi deret standar untuk log (1 + 𝑥𝑥) adalah

ln(1 + 𝑥𝑥) = 𝑥𝑥 −𝑥𝑥2

2+𝑥𝑥3

3−𝑥𝑥4

4+ ⋯

dengan mengandaikan

𝑥𝑥 = �𝑡𝑡2

2𝑛𝑛+

𝑡𝑡3𝑘𝑘6𝑛𝑛3 2⁄ + ⋯�

kita akan mendapatkan

ln𝑚𝑚𝑛𝑛(𝑡𝑡) = 𝑛𝑛 ln(1 + 𝑥𝑥) = 𝑛𝑛 �𝑥𝑥 −𝑥𝑥2

2+ ⋯�

= 𝑛𝑛 ��𝑡𝑡2

2𝑛𝑛+

𝑡𝑡3𝑘𝑘6𝑛𝑛3 2⁄ + ⋯� −

12�𝑡𝑡2

2𝑛𝑛+

𝑡𝑡3𝑘𝑘6𝑛𝑛3 2⁄ + ⋯�

2

+ ⋯�

di mana suku-suku selanjutnya dalam ekspansi tersebut melibatkan 𝑥𝑥3, 𝑥𝑥4, dan

seterusnya. Dengan dikalikan dengan 𝑛𝑛, tampak bahwa suku pertama,

𝑡𝑡2 2⁄ tidak melibatkan 𝑛𝑛, sementara seluruh suku yang lainnya akan me-


23

miliki 𝑛𝑛 dengan pangkat positif pada penyebutnya. Maka dari itu, dapat

ditunjukkan bahwa

lim𝑛𝑛→∞

ln𝑚𝑚𝑛𝑛(𝑡𝑡) =𝑡𝑡2

2

atau

lim𝑛𝑛→∞

𝑚𝑚𝑛𝑛(𝑡𝑡) = 𝑒𝑒𝑡𝑡2

2

adalah fungsi pembangkit momen untuk variabel random normal standar.

Dengan begitu, kita dapat menyimpulkan bahwa 𝑈𝑈𝑛𝑛 memiliki fungsi dis-

tribusi yang mendekati variabel random normal standar.

Galat standar adalah cara yang paling umum dan sederhana untuk

mengindikasikan keakuratan secara statistikal. Kita mengharapkan 𝑋𝑋� akan

berada kurang dari satu galat standar dari 𝜇𝜇, ekspektasinya berkisar 68%

dan kurang dari dua galat standar, ekspektasinya sekitar 95%. Persentase

tersebut berasal dari Teorema Limit Pusat, dalam kondisi umum, distribusi

dari 𝑋𝑋� akan mendekati distribusi normal seiring dengan membesarnya nilai

𝑛𝑛. Pada kondisi inilah metode Bootstrap lebih menguntungkan kita. Teo-

rema Limit Pusat tersebut tidak perlu dijadikan pedoman utama untuk

mendapatkan pernyataan keakuratan statistik penduga mengenai populasi.

Galat standar dari mean dapat kita dekati langsung dengan bootstrap.

Terdapat contoh yang sederhana yang menunjukkan keterbatasan da-

ri Teorema Limit Pusat. Diberikan 𝑋𝑋1,𝑋𝑋2, … ,𝑋𝑋𝑛𝑛 adalah variabel random

yang saling independen dan nilai-nilainya memiliki dua kemungkinan, ya-

itu 0 (gagal) dan 1 (sukses). Sedangkan 𝑌𝑌 adalah variabel random yang


24

berdistribusi binomial dengan 𝑛𝑛 kali ulangan dan probabilitas sukses sebe-

sar 𝑝𝑝 dan 𝑌𝑌 adalah jumlahan dari 𝑋𝑋1,𝑋𝑋2, … ,𝑋𝑋𝑛𝑛 .

𝑌𝑌 = �𝑋𝑋𝑖𝑖

𝑛𝑛

𝑖𝑖=1

Variabel random 𝑋𝑋1,𝑋𝑋2, … ,𝑋𝑋𝑛𝑛 saling independen karena ulangannya

saling bebas. Maka dari itu, untuk 𝑛𝑛 yang besar, proporsi ulangan yang

sukses adalah

𝑌𝑌𝑛𝑛

=1𝑛𝑛�𝑋𝑋𝑖𝑖

𝑛𝑛

𝑖𝑖=1

= 𝑋𝑋�

Jadi 𝑋𝑋� akan memiliki distribusi sampling yang mendekati distribusi nor-

mal dengan mean 𝐸𝐸(𝑋𝑋𝑖𝑖) = 𝑝𝑝 dan 𝑉𝑉𝑎𝑎𝑉𝑉(𝑋𝑋𝑖𝑖) 𝑛𝑛⁄ = 𝑝𝑝(1 − 𝑝𝑝) 𝑛𝑛⁄ .

Pendekatan normal untuk distribusi binomial akan bekerja dengan

efektif untuk 𝑛𝑛 yang besar, tetapi ketika nilai 𝑝𝑝 mendekati 0 atau 1, atau

dapat juga dikatakan nilai 𝑝𝑝 yang berada di sekitar 0.5, pendekatan ini ti-

dak lagi efektif. Gambar 2.1 dan Gambar 2.2 berikut menggambarkan ke-

lemahan Teorema Limit Pusat dalam pendekatan normal untuk distribusi

binomial tersebut. Hal ini terjadi karena Teorema Limit Pusat memiliki

kesimetrisan dalam segi bentuk, dan untuk nilai 𝑝𝑝 yang berada di sekitar

0.5, distribusi binomial memiliki kesimetrisan, sehingga pendekatan nor-

mal bekerja efektif.


25

B. Estimasi

Penentuan penduga atau estimator untuk suatu parameter populasi (con-

tohnya: mean, proporsi, dll) merupakan salah satu masalah yang mendasar da-

lam statistika. Cara untuk mengestimasi penduga tersebut dibedakan menjadi

dua, yaitu estimasi titik dan estimasi interval.

Gambar 2.1. Untuk 𝑛𝑛 = 25 dan 𝑝𝑝 = 0.25, pendekatan normal untuk dis-tribusi binomial memberikan pendekatan yang baik.

Gambar 2.2. Untuk 𝑛𝑛 = 25 dan 𝑝𝑝 = 0.95, pendekatan normal untuk dis-tribusi binomial tidak memberikan pendekatan yang baik karena nilai 𝑝𝑝 yang mendekati 1.


26

Definisi 2.3.

Estimator adalah aturan yang menentukan bagaimana menghitung sebuah

penduga berdasarkan pengukuran (observasi) yang termuat dalam sebuah

sampel.

1. Estimasi Titik

Definisi 2.4.

Penentuan suatu nilai tunggal yang dapat sebaik-baiknya mendekati nilai

parameter populasi yang tidak diketahui disebut sebagai estimasi titik.

Bila 𝜃𝜃 adalah parameter populasi dan 𝜃𝜃� adalah penduga dari 𝜃𝜃, maka

kita berharap nilai-nilai dugaan akan berada di sekitar parameter yang di-

tuju. Ada banyak kemungkinan, bisa saja penduga akan berpusat di seki-

tar parameter tujuan ataupun tidak. Bila penduga berada di sekitar para-

meter tujuan, maka nilai harapan dari distribusi nilai dugaan akan sama

dengan parameter yang diduga (𝐸𝐸�𝜃𝜃�� = 𝜃𝜃). Sebagai contoh, 𝑋𝑋�, �̂�𝑝, dan

𝑋𝑋�1 − 𝑋𝑋�2 adalah penduga titik yang baik.

2. Estimasi Interval

Definisi 2.5.

Penentuan suatu selang nilai yang dengan peluang besar memuat parame-

ter populasi yang sebenarnya disebut sebagai estimasi interval.


27

Estimasi interval bertujuan untuk membangun suatu selang nilai dari

parameter tujuan yang berpeluang besar memuat nilai sebenarnya dari pa-

rameter tujuan. Selang kepercayaan dari parameter populasi juga diguna-

kan untuk mengindikasikan reliabilitas dari sebuah penduga. Informasi-

informasi yang terdapat pada sampel digunakan untuk membentuk dua

buah nilai yang membentuk batas atas dan batas bawah selang. Bila dike-

tahui 𝜃𝜃 dan 𝜃𝜃� (penduga dari 𝜃𝜃), maka berdasarkan batas atas dan bawah

selang, terdapat tiga bentuk selang kepercayaan yaitu, �𝜃𝜃�𝑙𝑙 ,𝜃𝜃�𝑢𝑢�, �𝜃𝜃�𝑙𝑙 ,∞�,

dan �∞,𝜃𝜃�𝑢𝑢�.

Definisi 2.6.

Diberikan 𝑥𝑥1, 𝑥𝑥2, … , 𝑥𝑥𝑛𝑛 memiliki fungsi distribusi probabilitas

𝑓𝑓(𝑥𝑥1, 𝑥𝑥2, … , 𝑥𝑥𝑛𝑛 ;𝜃𝜃);𝜃𝜃 ∈ 𝛀𝛀, di mana 𝛀𝛀 adalah sebuah selang. Diketahui 𝐿𝐿

dan 𝑈𝑈 adalah statistik, misalkan 𝐿𝐿 = 𝑙𝑙(𝑥𝑥1, 𝑥𝑥2, … , 𝑥𝑥𝑛𝑛) dan 𝑈𝑈 =

𝑢𝑢(𝑥𝑥1, 𝑥𝑥2, … , 𝑥𝑥𝑛𝑛). Bila dalam sebuah data percobaan 𝑥𝑥1, 𝑥𝑥2, … , 𝑥𝑥𝑛𝑛 , ke-

mudian telah dicari nilai 𝑙𝑙(𝑥𝑥1, 𝑥𝑥2, … , 𝑥𝑥𝑛𝑛) dan 𝑢𝑢(𝑥𝑥1, 𝑥𝑥2, … , 𝑥𝑥𝑛𝑛).

Selang �𝑙𝑙(𝑥𝑥1, 𝑥𝑥2, … , 𝑥𝑥𝑛𝑛),𝑢𝑢(𝑥𝑥1, 𝑥𝑥2, … , 𝑥𝑥𝑛𝑛)� dikatakan selang kepercayaan

(1 − 𝛼𝛼)100% untuk 𝜃𝜃 bila

𝑃𝑃[𝑙𝑙(𝑥𝑥1, … , 𝑥𝑥𝑛𝑛) < 𝜃𝜃 < 𝑢𝑢(𝑥𝑥1, … , 𝑥𝑥𝑛𝑛)] = 1 − 𝛼𝛼

di mana 0 < (1 − 𝛼𝛼) < 1. Nilai observasi 𝑙𝑙(𝑥𝑥1, … , 𝑥𝑥𝑛𝑛) dan 𝑢𝑢(𝑥𝑥1, … , 𝑥𝑥𝑛𝑛)

secara berturut-turut disebut sebagai batas bawah dan batas atas selang ke-

percayaan.


28

(1 − 𝛼𝛼) adalah simbol untuk probabilitas dari selang kepercayaan

atau juga disebut sebagai koefisien kepercayaan atau tingkat kepercayaan.

Tingkat kepercayaan ini menentukan seberapa sering atau seberapa besar

peluang sebuah selang memuat parameter populasi tujuan.

Bentuk selang pada Definisi 2.6 merupakan bentuk selang keper-

cayaan dua sisi sedangkan pada Definisi 2.7 berikut akan didefinisikan

bentuk selang kepercayaan satu sisi.

Definisi 2.7.

Selang Kepercayaan Satu Sisi

a. Bila

𝑃𝑃[𝑙𝑙(𝑥𝑥1, … , 𝑥𝑥𝑛𝑛) < 𝜃𝜃] = 1 − 𝛼𝛼

maka 𝑙𝑙(𝑥𝑥1, … , 𝑥𝑥𝑛𝑛) disebut sebagai batas bawah selang kepercayaan

(1 − 𝛼𝛼)100% satu sisi

b. Bila

𝑃𝑃[𝜃𝜃 < 𝑢𝑢(𝑥𝑥1, … , 𝑥𝑥𝑛𝑛)] = 1 − 𝛼𝛼

maka 𝑢𝑢(𝑥𝑥1, … , 𝑥𝑥𝑛𝑛) disebut sebagai batas atas selang kepercayaan

(1 − 𝛼𝛼)100% satu sisi


1. Model Regresi Linear Berganda

Dalam analisis regresi, model regresi linear memuat dua variabel

utama, yaitu 𝑦𝑦𝑖𝑖 = (𝑦𝑦1, 𝑦𝑦2, … ,𝑦𝑦𝑛𝑛) merupakan variabel dependen (sering ju-


29

ga disebut sebagai variabel respons), 𝑥𝑥𝑖𝑖𝑖𝑖 = (𝑥𝑥𝑖𝑖1, 𝑥𝑥𝑖𝑖2, … , 𝑥𝑥𝑖𝑖𝑘𝑘) adalah varia-

bel independen atau regressor, di mana 𝑖𝑖 = 1,2, … ,𝑛𝑛 dan 𝑖𝑖 = 1,2, … , 𝑘𝑘.

Pada dasarnya, persamaan regresi linear merupakan kombinasi linear dari

𝑥𝑥𝑖𝑖𝑖𝑖 dan 𝛽𝛽𝑖𝑖 .

𝑦𝑦𝑖𝑖 = �𝛽𝛽𝑖𝑖𝑥𝑥𝑖𝑖𝑖𝑖

𝑘𝑘

𝑖𝑖=1

di mana 𝛽𝛽𝑖𝑖 = (𝛽𝛽1,𝛽𝛽2, … ,𝛽𝛽𝑘𝑘) adalah koefisien regresi yang merupakan tu-

juan dari analisis regresi yang disimpulkan berdasarkan observasi 𝑥𝑥𝑖𝑖𝑖𝑖 . Ni-

lai-nilai 𝛽𝛽𝑖𝑖 didekati dengan menggunakan �̂�𝛽𝑖𝑖 sebagai penduga.

Struktur probabilitas dari model regresi linear biasanya dinyatakan

dalam bentuk matriks dan vektor adalah sebagai berikut.

𝐘𝐘 = 𝐗𝐗𝐗𝐗 + 𝛆𝛆

di mana 𝐘𝐘 = �

𝑦𝑦1𝑦𝑦2⋮𝑦𝑦𝑛𝑛

� , 𝐗𝐗 = �

𝑥𝑥0 𝑥𝑥11 𝑥𝑥12𝑥𝑥0 𝑥𝑥21 𝑥𝑥22

… 𝑥𝑥1𝑘𝑘… 𝑥𝑥2𝑘𝑘

⋮ ⋮ ⋮𝑥𝑥0 𝑥𝑥𝑛𝑛1 𝑥𝑥𝑛𝑛2

⋮ ⋮… 𝑥𝑥𝑛𝑛𝑘𝑘

�, 𝐗𝐗 = �

𝛽𝛽0𝛽𝛽1⋮𝛽𝛽𝑘𝑘

�, dan

𝛆𝛆 = �

𝜀𝜀1𝜀𝜀2⋮𝜀𝜀𝑛𝑛

�.

Pada persamaan di atas, 𝐘𝐘 adalah vektor variabel dependen, berdi-

mensi 𝑛𝑛 × 1 yang memuat 𝑦𝑦𝑖𝑖 , 𝐗𝐗 adalah matriks variabel independen yang

memuat 𝑥𝑥𝑖𝑖𝑖𝑖 dan berdimensi 𝑛𝑛 × (𝑘𝑘 + 1), untuk 𝑥𝑥0 = 1, 𝐗𝐗 adalah vektor

yang memuat koefisien-koefisien regresi yang belum diketahui, dan 𝛆𝛆 me-

nyatakan vektor galat yang berdistribusi normal dengan 𝐸𝐸(𝛆𝛆) = 0, serta

variansinya diharapkan konstan (𝑉𝑉𝑎𝑎𝑉𝑉(𝛆𝛆) = 𝜎𝜎2).


30

2. Metode Kuadrat Terkecil

Metode kuadrat terkecil adalah sebuah prosedur untuk mendekati pa-

rameter yang tidak diketahui dari sebuah model linear. Pengilustrasian

prosedur ini secara sederhana adalah dengan mencocokkannya dengan ga-

ris lurus yang paling dekat dengan himpunan titik-titik. Bila kita meng-

inginkan untuk menentukan model

𝑦𝑦 = 𝛽𝛽0 + 𝛽𝛽1𝑥𝑥1 + 𝛽𝛽2𝑥𝑥2 + ⋯+ 𝛽𝛽𝑘𝑘𝑥𝑥𝑘𝑘 + 𝜀𝜀

di mana model tersebut linear dalam parameter 𝛽𝛽𝑖𝑖 . Bila nilai-nilai penga-

matan dinyatakan sebagai 𝑥𝑥𝑖𝑖1, 𝑥𝑥𝑖𝑖2, … , 𝑥𝑥𝑖𝑖𝑘𝑘 ,𝑦𝑦𝑖𝑖 diambil secara acak dari suatu

populasi untuk 𝑖𝑖 = 1,2, … ,𝑛𝑛 dan 𝜀𝜀 adalah galatnya, yang memiliki nilai

harapan 𝐸𝐸(�𝜀𝜀|𝑥𝑥1, 𝑥𝑥2, … , 𝑥𝑥𝑘𝑘) = 0 yang mengakibatkan 𝐸𝐸(𝜀𝜀) = 0. Agar lebih

jelas, galat dari suatu model akhir regresi linear

𝑦𝑦�𝑖𝑖 = �̂�𝛽0 + �̂�𝛽1𝑥𝑥𝑖𝑖1 + �̂�𝛽2𝑥𝑥𝑖𝑖2 + ⋯+ �̂�𝛽𝑘𝑘𝑥𝑥𝑖𝑖𝑘𝑘

adalah

𝜀𝜀𝑖𝑖 = 𝑦𝑦𝑖𝑖 − 𝑦𝑦�𝑖𝑖

𝜀𝜀𝑖𝑖 = 𝑦𝑦𝑖𝑖 − �̂�𝛽0 − �̂�𝛽1𝑥𝑥𝑖𝑖1 − �̂�𝛽2𝑥𝑥𝑖𝑖2 −⋯− �̂�𝛽𝑘𝑘𝑥𝑥𝑖𝑖𝑘𝑘

Maka tujuan utama dari metode kuadrat terkecil adalah mencari per-

samaan yang meminimalkan jumlahan dari kuadrat selisih antara titik-titik

dan garisnya atau galatnya.

�𝜀𝜀𝑖𝑖2𝑛𝑛

𝑖𝑖=1

= ��𝑦𝑦𝑖𝑖 − �̂�𝛽0 − �̂�𝛽1𝑥𝑥𝑖𝑖1 − �̂�𝛽2𝑥𝑥𝑖𝑖2 −⋯− �̂�𝛽𝑘𝑘𝑥𝑥𝑖𝑖𝑘𝑘 �2

𝑛𝑛

𝑖𝑖=1

Persamaan di atas adalah jumlahan kuadrat dari galat atau sering kali

disebut sebagai jumlahan kuadrat dari residual. Bila nilai persamaan di


31

atas minimum, akan memenuhi untuk seluruh nilai 𝛽𝛽𝑖𝑖 untuk 𝑖𝑖 = 0,1, … ,𝑘𝑘.

Dengan mengambil turunan parsial dari persamaan kuadrat tersebut terha-

dap 𝛽𝛽𝑖𝑖 dan menyamakannya dengan nol, akan diperoleh

𝜕𝜕(∑ 𝜀𝜀𝑖𝑖2𝑛𝑛𝑖𝑖=1 )𝜕𝜕�̂�𝛽0

= ��𝑦𝑦𝑖𝑖 − �̂�𝛽0 − �̂�𝛽1𝑥𝑥𝑖𝑖1 − �̂�𝛽2𝑥𝑥𝑖𝑖2 −⋯− �̂�𝛽𝑘𝑘𝑥𝑥𝑖𝑖𝑘𝑘 �𝑛𝑛

𝑖𝑖=1

= �𝜀𝜀𝑖𝑖

𝑛𝑛

𝑖𝑖=1

= 0

𝜕𝜕(∑ 𝜀𝜀𝑖𝑖2𝑛𝑛𝑖𝑖=1 )𝜕𝜕�̂�𝛽1

= �𝑥𝑥𝑖𝑖1�𝑦𝑦𝑖𝑖 − �̂�𝛽0 − �̂�𝛽1𝑥𝑥𝑖𝑖1 − �̂�𝛽2𝑥𝑥𝑖𝑖2 −⋯− �̂�𝛽𝑘𝑘𝑥𝑥𝑖𝑖𝑘𝑘�𝑛𝑛

𝑖𝑖=1

= �𝑥𝑥𝑖𝑖1𝜀𝜀𝑖𝑖

𝑛𝑛

𝑖𝑖=1

= 0

𝜕𝜕(∑ 𝜀𝜀𝑖𝑖2𝑛𝑛𝑖𝑖=1 )𝜕𝜕�̂�𝛽2

= �𝑥𝑥𝑖𝑖2�𝑦𝑦𝑖𝑖 − �̂�𝛽0 − �̂�𝛽1𝑥𝑥𝑖𝑖1 − �̂�𝛽2𝑥𝑥𝑖𝑖2 −⋯− �̂�𝛽𝑘𝑘𝑥𝑥𝑖𝑖𝑘𝑘�𝑛𝑛

𝑖𝑖=1

= �𝑥𝑥𝑖𝑖2𝜀𝜀𝑖𝑖

𝑛𝑛

𝑖𝑖=1

= 0

…

𝜕𝜕(∑ 𝜀𝜀𝑖𝑖2𝑛𝑛𝑖𝑖=1 )𝜕𝜕�̂�𝛽𝑘𝑘

= �𝑥𝑥𝑖𝑖𝑘𝑘�𝑦𝑦𝑖𝑖 − �̂�𝛽0 − �̂�𝛽1𝑥𝑥𝑖𝑖1 − �̂�𝛽2𝑥𝑥𝑖𝑖2 −⋯− �̂�𝛽𝑘𝑘𝑥𝑥𝑖𝑖𝑘𝑘�𝑛𝑛

𝑖𝑖=1

= �𝑥𝑥𝑖𝑖𝑘𝑘𝜀𝜀𝑖𝑖

𝑛𝑛

𝑖𝑖=1

= 0

Keseluruh persamaan di atas akan diselesaikan dalam bentuk ma-

triks. Jumlahan pada ruas sebelah kanan, mengandung elemen-elemen da-

ri matriks 𝐗𝐗 dan 𝜀𝜀. Jadi ∑ 𝑥𝑥𝑖𝑖𝑖𝑖 𝜀𝜀𝑖𝑖𝑛𝑛𝑖𝑖=1 untuk 𝑖𝑖 = 0,1, … ,𝑘𝑘 di mana untuk

𝑘𝑘 = 0, 𝑥𝑥𝑖𝑖𝑘𝑘 = 1 dapat dinyatakan dalam matriks berikut.

𝐗𝐗′𝛆𝛆 = 𝟎𝟎

𝐗𝐗′�𝐘𝐘 − 𝐗𝐗𝐗𝐗�� = 𝟎𝟎

(𝐗𝐗′𝐗𝐗)𝐗𝐗� = 𝐗𝐗′𝐘𝐘

𝐗𝐗� = (𝐗𝐗′𝐗𝐗)−𝟏𝟏𝐗𝐗′𝐘𝐘


32

3. Sifat-Sifat Penduga Kuadrat Terkecil

Dalam metode kuadrat terkecil, terdapat sifat-sifat penduga yang

baik. Bila dipandang model umum regresi linear yang berbentuk

𝐘𝐘 = 𝐗𝐗𝐗𝐗 + 𝛆𝛆

dan dianggap bahwa 𝜀𝜀𝑖𝑖 saling bebas satu sama lain, serta 𝐸𝐸(𝜀𝜀𝑖𝑖) = 0,

𝑉𝑉𝑎𝑎𝑉𝑉(𝜀𝜀𝑖𝑖) = 𝜎𝜎2, untuk setiap 𝑖𝑖 = 1,2, … ,𝑛𝑛. Dalam lambang matriks, ini be-

rarti 𝑉𝑉𝑎𝑎𝑉𝑉(𝜀𝜀𝑖𝑖) = 𝜎𝜎2𝐼𝐼, bila 𝐼𝐼 menyatakan matriks satuan berukuran 𝑛𝑛 × 𝑛𝑛,

dengan demikian bila 𝐗𝐗 tidak memiliki distribusi sehingga diperlakukan

sebagai konstanta, maka

𝐸𝐸(𝐘𝐘) = 𝐗𝐗𝐗𝐗

dan

𝑉𝑉𝑎𝑎𝑉𝑉(𝑌𝑌) = 𝜎𝜎2𝐼𝐼

Jadi sifat-sifat dari penduga 𝐗𝐗� = (𝐗𝐗′𝐗𝐗)−1𝐗𝐗′𝐘𝐘 adalah

a. Tak Bias (𝐸𝐸��̂�𝛽𝑖𝑖 � = 𝛽𝛽𝑖𝑖 , 𝑖𝑖 = 0,1, … , 𝑘𝑘)

𝐸𝐸�𝐗𝐗�� = 𝐸𝐸((𝐗𝐗′𝐗𝐗)−1𝐗𝐗′𝐘𝐘)

= (𝐗𝐗′𝐗𝐗)−1𝐗𝐗′𝐄𝐄(𝐘𝐘)

= (𝐗𝐗′𝐗𝐗)−1𝐗𝐗′𝐗𝐗𝐗𝐗

= 𝐗𝐗

b. Variansi Minimum 𝑉𝑉𝑎𝑎𝑉𝑉��̂�𝛽𝑖𝑖 � = 𝜎𝜎2𝑐𝑐𝑖𝑖𝑖𝑖 , 𝑐𝑐𝑖𝑖𝑖𝑖 adalah elemen pada baris ke-𝑖𝑖

dan kolom ke-𝑖𝑖 dari matriks (𝐗𝐗′𝐗𝐗)−1

𝑉𝑉𝑎𝑎𝑉𝑉�𝐗𝐗�� = (𝐗𝐗′𝐗𝐗)−1𝐗𝐗′𝑉𝑉𝑎𝑎𝑉𝑉(𝐘𝐘)𝐗𝐗(𝐗𝐗′𝐗𝐗)−1

= (𝐗𝐗′𝐗𝐗)−1𝐗𝐗′𝜎𝜎2𝐼𝐼𝐗𝐗(𝐗𝐗′𝐗𝐗)−1


33

= 𝜎𝜎2(𝐗𝐗′𝐗𝐗)−1

Variansi dari 𝐗𝐗� merupakan variansi minimum dari semua penduga

tak bias. Hal ini dijamin oleh teorema Gauss-Markov berikut.

Teorema 2.4.

Penduga kuadrat terkecil 𝐗𝐗� = (𝐗𝐗′𝐗𝐗)−1𝐗𝐗′𝐘𝐘 memiliki variansi terkecil da-

lam himpunan semua penduga linear tak bias.

Bukti:

Misalkan 𝛂𝛂 adalah penduga linear lain dari 𝐗𝐗 yang juga tak bias, ka-

rena itu 𝛂𝛂 dapat di misalkan dengan bentuk berikut

𝛂𝛂 = [(𝐗𝐗′𝐗𝐗)−𝟏𝟏𝐗𝐗′ + 𝐔𝐔]𝐘𝐘

di mana 𝐔𝐔 adalah suatu matriks yang merupakan fungsi dari 𝐗𝐗, maka

𝐄𝐄(𝛂𝛂) = 𝐄𝐄[((𝐗𝐗′𝐗𝐗)−𝟏𝟏𝐗𝐗′ + 𝐔𝐔)𝐘𝐘]

= [(𝐗𝐗′𝐗𝐗)−𝟏𝟏𝐗𝐗′ + 𝐔𝐔]𝐄𝐄(𝐘𝐘)

= [(𝐗𝐗′𝐗𝐗)−𝟏𝟏𝐗𝐗′ + 𝐔𝐔](𝐗𝐗𝐗𝐗)

= (𝐗𝐗′𝐗𝐗)−𝟏𝟏𝐗𝐗′𝐗𝐗𝐗𝐗 + 𝐔𝐔𝐗𝐗𝐗𝐗

= (𝐼𝐼 + 𝐔𝐔𝐗𝐗)𝐗𝐗

agar 𝛂𝛂 menjadi penduga tak bias dari 𝐗𝐗, maka 𝐔𝐔𝐗𝐗 = 𝟎𝟎. Jadi,

𝑉𝑉𝑎𝑎𝑉𝑉(𝛂𝛂) = ((𝐗𝐗′𝐗𝐗)−𝟏𝟏𝐗𝐗′ + 𝐔𝐔)𝑉𝑉𝑎𝑎𝑉𝑉(𝐘𝐘)(𝐔𝐔′ + 𝐗𝐗(𝐗𝐗′𝐗𝐗)−𝟏𝟏)

= 𝜎𝜎2[(𝐗𝐗′𝐗𝐗)−𝟏𝟏𝐗𝐗′𝐔𝐔′ + 𝐔𝐔𝐔𝐔′ + (𝐗𝐗′𝐗𝐗)−𝟏𝟏 + 𝐔𝐔𝐗𝐗(𝐗𝐗′𝐗𝐗)−𝟏𝟏]

= 𝜎𝜎2[(𝐗𝐗′𝐗𝐗)−𝟏𝟏 + 𝐔𝐔𝐔𝐔′]


34

Karena 𝐔𝐔𝐗𝐗 = 𝐗𝐗′𝐔𝐔′ = 𝟎𝟎 dan matriks 𝐔𝐔𝐔𝐔′ adalah definit tak negatif,

semua unsur diagonalnya berbentuk kuadrat. Jadi terbukti bahwa variansi

dari setiap unsur dari vektor 𝛂𝛂 selalu lebih besar atau paling kecil sama

dengan variansi unsur 𝐗𝐗� yang bersesuaian. Seringkali 𝐗𝐗� disebut sebagai

Best Linear Unbiased Estimator (BLUE).

4. Selang Kepercayaan Untuk Parameter Regresi

Dalam model regresi linear berganda, dapat pula ditentukan selang

kepercayaan untuk parameter regresi. Untuk 𝑛𝑛 < 30, diberikan statistik

𝑡𝑡(𝑣𝑣,𝛼𝛼 2⁄ ) dengan derajat bebas 𝑣𝑣 = 𝑛𝑛 − 𝑝𝑝, di mana 𝑛𝑛 adalah ukuran sampel

dan 𝑝𝑝 = 𝑘𝑘 + 1 ditentukan dari banyaknya parameter. Maka selang keper-

cayaan (1 − 𝛼𝛼)100% untuk 𝛽𝛽𝑖𝑖 adalah

�̂�𝛽𝑖𝑖 − 𝑡𝑡(𝑣𝑣,𝛼𝛼 2⁄ )𝑠𝑠�𝑐𝑐𝑖𝑖𝑖𝑖 < 𝛽𝛽𝑖𝑖 < �̂�𝛽𝑖𝑖 + 𝑡𝑡(𝑣𝑣,𝛼𝛼 2⁄ )𝑠𝑠�𝑐𝑐𝑖𝑖𝑖𝑖

dengan 𝑖𝑖 = 0,1,2, … ,𝑘𝑘 di mana 𝑐𝑐𝑖𝑖𝑖𝑖 adalah elemen dari baris ke-𝑖𝑖 dan ko-

lom ke-𝑖𝑖 dari matriks (𝐗𝐗′𝐗𝐗)−1 dan 𝑠𝑠 adalah penduga tak bias dari 𝜎𝜎 dan

didefinisikan sebagai berikut.

𝑠𝑠2 =𝐘𝐘′𝐘𝐘 − 𝐗𝐗�′𝐗𝐗′𝐘𝐘

𝑛𝑛 − 𝑝𝑝

Variansi dari model regresi linear tersebut diduga dengan menggu-

nakan 𝑠𝑠2𝑐𝑐𝑖𝑖𝑖𝑖 dan galat standar dari model regresi ini diduga dengan 𝑠𝑠�𝑐𝑐𝑖𝑖𝑖𝑖 .

Bila 𝑛𝑛 ≥ 30, maka statistik 𝑡𝑡 dapat diganti dengan statistik 𝑧𝑧.


BAB III

METODE BOOTSTRAP

A. Prinsip Dasar dan Algoritma Metode Bootstrap

Kvam dan Vidakovic (2007) menyatakan bahwa dengan resampling, kita

berniat untuk mengambil sampel acak dari sampel. Misalkan sampel yang te-

lah diambil adalah 𝑥𝑥1, 𝑥𝑥2, … , 𝑥𝑥𝑛𝑛 dipandang sebagai sampel asli yang mewakili

suatu populasi terhingga dengan ukuran n. Sampel baru (biasanya berukuran

n pula) diambil secara “sampling dengan pengembalian”, maka beberapa dari

n sampel asli dapat muncul lebih dari satu kali. Kumpulan sampel baru ini

disebut sampel bootstrap. Metode tersebut dinamakan dengan Metode Boot-

strap. Agar lebih dapat memahami metode bootstrap, Gambar 3.1 menje-

laskan tahapannya dalam bentuk skema.

Dari sampel asli 𝑥𝑥1, 𝑥𝑥2, … , 𝑥𝑥𝑛𝑛 diambil b buah sampel bootstrap. Setiap

sampel bootstrap (x*1, x*2, …, x*b) memiliki n buah anggota yang diambil se-

𝑥𝑥∗1 𝑥𝑥∗2

𝑥𝑥∗𝑏𝑏

𝑠𝑠(𝑥𝑥∗1)

𝑠𝑠(𝑥𝑥∗2)

𝑠𝑠(𝑥𝑥∗𝑏𝑏)

…

…

𝑋𝑋 = {𝑥𝑥1, 𝑥𝑥2, … , 𝑥𝑥𝑛𝑛} Sampel Asli

Sampel Bootstrap

Replikasi bootstrap

Gambar 3.1. Prosedur pengambilan sampel dengan menggunakan metode Bootstrap


36

cara sampling dengan pengembalian n kali dari data sampel asli. Replikasi

bootstrap s(x*1), s(x*2), …, s(x*b) didapatkan dengan menghitung nilai statistik

tertentu, misalkan s(x) pada setiap sampel bootstrap. Akhirnya, standar devia-

si dari nilai-nilai s(x*1), s(x*2), …, s(x*b) adalah penduga dari galat standar dari

s(x). Galat standar inilah yang merupakan tujuan utama dari metode bootstrap,

yang kemudian dapat digunakan untuk membangun selang kepercayaan boot-

strap.

Secara umum, kita dapat mengurutkan langkah-langkah untuk metode

bootstrap secara umum. Misalkan pada suatu populasi, diambil 𝑛𝑛 buah sam-

pel acak yaitu 𝑋𝑋 = {𝑥𝑥1, 𝑥𝑥2, … , 𝑥𝑥𝑛𝑛}. Dari 𝑛𝑛 buah sampel acak tersebut, akan di-

ambil sebanyak 𝑏𝑏 unit sampel bootstrap, yaitu 𝑥𝑥∗1, 𝑥𝑥∗2, … , 𝑥𝑥∗𝑏𝑏 . Masing-

masing unit sampel tersebut adalah vektor yang terdiri dari 𝑛𝑛 buah sampel

yang diambil dengan pengembalian. Notasi bintang tersebut menandakan

bahwa vektor kumpulan data tersebut adalah hasil resampel dari sampel asli.

𝑋𝑋∗ bukanlah himpunan data sampel asli (𝑥𝑥).

Sampel bootstrap tersebut akan berupa vektor-vektor yang masing-

masing terdiri dari 𝑛𝑛 buah nilai. Nilai-nilai dari sampel asli dapat muncul be-

berapa kali karena adanya pengembalian sampel sebelum pengambilan kem-

bali sampel berikutnya. Dengan begitu setiap sampel bootstrap juga bisa me-

miliki beberapa data asli yang terwakili lebih dari sekali, atau bahkan tidak

terwakili sama sekali. Maka dari itu, sampel bootstrap ini bisa saja sama per-

sis dengan sampel asli ataupun sama sekali tidak sama dengan sampel aslinya.


37

Pengambilan unit-unit sampel bootstrap dengan pengembalian dilakukan

sampai 𝑏𝑏 kali sehingga terdapat 𝑏𝑏 unit sampel bootstrap. Besarnya nilai 𝑏𝑏

umumnya diambil dalam jumlah yang besar, karena semakin besar nilai 𝑏𝑏,

maka distribusi sampling yang didekati akan semakin mendekati distribusi

normal. Secara teoritis, besar nilai 𝑏𝑏 tidak pernah dibatasi, bisa sebesar

mungkin, asal kita memiliki kesabaran untuk membentuk sampel-sampel

bootstrap tersebut. Lagipula, jikalau nilai 𝑏𝑏 terlampau besar, hal itu tidak lagi

menjadi masalah karena semua proses penghitungan dilakukan dengan kom-

puter. Setelah didapatkan 𝑏𝑏 buah sampel bootstrap, hal yang dilakukan selan-

jutnya adalah menghitung statistik dari masing-masing sampel bootstrap untuk

menduga galat standar dari parameter penduga yang disimbolkan 𝜃𝜃�. Statistik

uji untuk masing-masing sampel bootstrap disimbolkan sebagai

𝑠𝑠(𝑥𝑥∗1), 𝑠𝑠(𝑥𝑥∗2), … , 𝑠𝑠(𝑥𝑥∗𝑏𝑏). Statistik uji tersebut bisa berupa mean, median,

atau proporsi. Seluruh standar deviasi dari statistik uji tersebut akan diguna-

kan untuk mengestimasi galat standar dari 𝑠𝑠(𝑥𝑥) atau 𝜃𝜃�. Pendugaan galat stan-

dar dari 𝜃𝜃� tersebut adalah tujuan utama dari metode bootstrap ini. Seluruh

proses pendekatan nilai ini akan langsung menggunakan kalkulasi dengan

komputer tanpa memerlukan kalkulasi teoritis.

Untuk setiap pengambilan kesimpulan langsung berdasarkan distribu-

sinya, terlihat jelas bahwa sampel bootstrap tidak sebaik sampel asli. Bila kita

mendekati sebuah parameter populasi, yaitu 𝜃𝜃 = 𝜃𝜃(𝐹𝐹), dari distribusi 𝐹𝐹, jelas

bahwa lebih baik memilih untuk menggunakan 𝜃𝜃�𝑛𝑛 = 𝜃𝜃�(𝐹𝐹𝑛𝑛). Yang dapat dije-

laskan dari sampel-sampel bootstrap adalah, bagaimana nilai 𝜃𝜃�𝑛𝑛 mungkin be-


38

rubah-ubah dari sampel ke sampel. Hal ini disebabkan karena elemen-elemen

dari masing-masing sampel bootstrap bisa sama atau sama sekali berbeda den-

gan sampel asli seperti yang telah dijelaskan sebelumnya. Daripada kita

hanya dapat menghitung 𝜃𝜃�𝑛𝑛 sekali saja karena hanya dimiliki satu buah sam-

pel sebanyak 𝑛𝑛, lebih baik kita meresampel (sebanyak tak hingga kali secara

teoritis) dan membentuk sampel bootstrap. Sebuah meta-estimator dibentuk

dari estimator untuk estimator awal bagi parameter populasi. Dengan begitu,

sebenarnya kita telah membangun sebuah meta-estimator dari sampel boot-

strap (misalkan 𝜃𝜃�∗ = 𝑠𝑠(𝑥𝑥∗)) dan meta-estimator tersebut menjelaskan tentang

𝜃𝜃�𝑛𝑛 , bukan 𝜃𝜃. Bila kita membangun sampel bootstrap berulang kali, kita dapat

membentuk gambaran secara tak langsung tentang distribusi 𝜃𝜃�𝑛𝑛 dan dari situ,

kita dapat membentuk suatu pernyataan tentang 𝜃𝜃.

Secara sederhana, metode bootstrap untuk pengambilan sampel dapat di-

tuliskan dalam algoritma berikut:

1. Bangun distribusi probabilitas empiris 𝑓𝑓(𝑥𝑥) dari sampel acak 𝑥𝑥1, 𝑥𝑥2, … , 𝑥𝑥𝑛𝑛

dengan menempatkan probabilitas 1 𝑛𝑛⁄ pada setiap titik di 𝑥𝑥1, 𝑥𝑥2, … , 𝑥𝑥𝑛𝑛 .

Ini adalah fungsi distribusi empiris dari 𝑥𝑥, yang merupakan pendekatan

(kemungkinan maksimum) maximum likelihood dari fungsi distribusi pro-

babilitas untuk populasi 𝑓𝑓(𝑥𝑥).

2. Dari distribusi probabilitas empiris tersebut, ambil sampel acak sederhana

sebanyak 𝑛𝑛 buah dengan pengembalian. Sampel inilah yang disebut sam-

pel bootstrap. Notasikan kumpulan sampel bootstrap ini dengan tanda bin-

tang (*) dan indeks nomor (contoh: 𝑥𝑥∗𝑏𝑏).


39

3. Hitung statistik yang dituju, yaitu 𝜃𝜃� (mean, proporsi, dst) untuk masing-

masing sampel bootstrap. Notasikan dengan 𝜃𝜃�∗𝑏𝑏 .

4. Ulangi langkah ke-2 dan ke-3 sebanyak 𝑏𝑏 kali, di mana 𝑏𝑏 adalah bilangan

yang besar nilainya. Biasanya 𝑏𝑏 tidak dibatasi, tetapi diambil antara 50

sampai 200 untuk mengestimasi galat standar dari 𝜃𝜃� dan minimal 𝑏𝑏 berni-

lai 1000 untuk mengestimasi interval kepercayaan di sekitar 𝜃𝜃�. (Mooney

& Duval, 1993)

5. Bangun distribusi probabilitas dari 𝑏𝑏 buah 𝜃𝜃�∗𝑏𝑏 dengan menempatkan pro-

babilitas 1 𝑏𝑏⁄ pada setiap titik 𝜃𝜃�∗1,𝜃𝜃�∗2, … ,𝜃𝜃�∗𝑏𝑏 . Distribusi ini adalah esti-

masti bootstrap dari distribusi sampling 𝜃𝜃�, 𝑓𝑓∗(𝜃𝜃�∗).

Basis pendekatan bootstrap secara statistikal adalah memperlakukan

sampel seolah-olah sampel tersebut adalah populasi dan menerapkan metode

sampling Monte Carlo (random sampling) untuk membangkitkan pendekatan

empiris dari statistik distribusi samplingnya. Prosedur dalam metode boot-

strap secara garis besar adalah sebagai berikut:

Langkah 1: Resampling

Pada awal pengambilan sampel acak dari suatu populasi, biasanya hanya

diambil satu unit sampel acak berukuran 𝑛𝑛 buah (untuk selanjutnya akan dis-

ebut sebagai sampel asli). Agar memiliki jumlah sampel yang lebih banyak,

maka dilakukan resampling dari satu buah sampel acak tersebut. Resampling

dilakukan dengan metode sampling dengan pengembalian dan berukuran sama

dengan sampel asli, yaitu 𝑛𝑛 buah sampel acak.


40

Setiap kali kita mengambil sebuah resampel acak dari sampel asli, sam-

pel tersebut dikembalikan terlebih dahulu sebelum dilakukannya pengambilan

resampel yang berikutnya, inilah yang dimaksud dengan resampling dengan

pengembalian. Dengan adanya pengembalian sampel, nilai-nilai observasi

pada sampel acak asli tersebut akan dapat diambil lebih dari sekali, ataupun

sama sekali tidak terambil. Bila yang dilakukan adalah sampling tanpa pen-

gembalian, yang akan kita dapatkan hanyalah satu buah sampel acak yang me-

rupakan permutasi dari sampel asli. Tak menutup kemungkinan pula, hasil re-

sampel akan sama dengan sampel asli. Kumpulan hasil resampel baru ini di-

sebut sampel bootstrap.

Contoh berikut diharapkan dapat memberikan gambaran besar tentang

langkah di atas.

Contoh 3.1. (Sumber: Introduction of the Practice Statistics oleh D. Moore,

hal. 16-3)

Di Amerika, banyak terdapat perusahaan yang menawarkan jasa layanan

telepon lokal. Bukanlah suatu ketertarikan publik untuk mendapati seluruh

perusahaan tersebut menggali jalan hanya untuk memendam kabel, jadi peru-

sahaan telepon lokal utama di setiap daerah harus (untuk bayaran tertentu)

berbagi jaringan dengan kompetitornya. Istilah legal untuk perusahaan tele-

pon lokal utama ini adalah Incumbent Local Exchange Carrier, ILEC. Para

kompetitor disebut sebagai Competing Local Exchange Carriers, atau CLECs.


41

Verizon adalah ILEC untuk suatu area besar di Amerika bagian timur,

seperti seharusnya, mereka harus menyediakan jasa perbaikan untuk pelang-

gan dari CLECs di area tersebut. Apakah Verizon memberikan layanan per-

baikan untuk pelanggan CLEC secepat (dalam rata-rata) seperti kepada pe-

langgannya sendiri? Bila tidak, itu keputusan pelanggan untuk meminta ganti

rugi. Komisi Perangkat Publik lokal memerlukan penggunaan dari tes uji sig-

nifikansi untuk membandingkan waktu perbaikan untuk kedua grup pelanggan.

Waktu perbaikan jauh dari normal. Gambar 3.2 dan 3.3 menggambarkan

distribusi dari sampel random dari 1664 kali perbaikan untuk pelanggan Veri-

zon sendiri. Distribusinya memiliki ekor kanan yang sangat panjang. Me-

diannya adalah 3.59 jam, tetapi meannya adalah 8.41 jam dan waktu perbaikan

terlama adalah 191.6 jam. Kita ragu untuk menggunakan prosedur 𝑡𝑡 untuk da-

ta seperti itu, terutama karena ukuran sampel bagi pelanggan CLEC lebih kecil

dari pelanggan Verizon sendiri.

Gambar 3.2. Distribusi dari 1664 kali perbaikan untuk pelanggan Verizon.

Waktu perbaikan (dalam jam)

Ban

yakn

ya p

erba

ikan


42

Resampling dan sampling dengan pengembalian pada Contoh 3.1 dije-

laskan dalam Gambar 3.4 berikut.

Gambar 3.3. Plot quantil normal untuk jumlah waktu perbaikan. Distribusinya sangat condong ke kanan.

Nilai normal

Wak

tu p

erba

ikan

(dal

am ja

m)

𝑥𝑥∗1 𝑥𝑥∗2 𝑥𝑥∗3

Gambar 3.4. Kotak teratas adalah sampel acak asli dengan 𝑛𝑛 = 6 dari data Verizon. Tiga kotak di bawahnya adalah tiga unit resampel dari sampel asli (𝑏𝑏 = 3). Beberapa nilai dari sam-pel asli muncul berulang kali dalam resampel.

�̅�𝑥∗1 = 4.13

{1,57; 0,22; 19,67; 0,00; 0,22; 3,12}

{0,00; 2,20; 2,20; 2,20; 19,67; 1.57}

�̅�𝑥∗2 = 4.64 �̅�𝑥∗3 = 1.74

{0,22; 3,12; 1,57; 3,12; 2,20; 0,22}

𝑋𝑋 = {3,12; 0,00; 1,57; 19,67; 0,22; 2,20} �̅�𝑥 = 4.46


43

Setelah dilakukan resampling, hal berikutnya yang dilakukan adalah

menghitung replikasi bootstrap (pada contoh ini akan dihitung rata-rata sam-

pel) untuk sampel asli dan setiap sampel bootstrap. Gambar 3.4 menunjukkan

bahwa bagaimana nilai replikasi bootstrap, dalam hal ini rata-rata sampel

bootstrap dapat berubah-ubah di setiap sampel bootstrap. Pada sampel boot-

strap ke-1, ke-2, dan ke-3, secara berturut-turut rata-ratanya adalah 4.13, 4.64,

dan 1.74. Nilai-nilai observasi dari sampel asli juga ada yang muncul bebera-

pa kali di sampel bootstrap.

Secara umum, rumus untuk menghitung rata-rata sampel bootstrap, yang

disimbolkan menjadi mean𝑏𝑏𝑏𝑏𝑏𝑏𝑡𝑡 adalah sebagai berikut.

mean𝑏𝑏𝑏𝑏𝑏𝑏𝑡𝑡 =1𝑏𝑏��̅�𝑥∗𝑖𝑖𝑏𝑏

𝑖𝑖=1

Setelah itu, galat standar dari mean sampel bootstrap juga dapat dipero-

leh dengan rumus berikut ini.

SE𝑏𝑏𝑏𝑏𝑏𝑏𝑡𝑡 = �1

𝑏𝑏 − 1�(�̅�𝑥∗𝑖𝑖 − mean𝑏𝑏𝑏𝑏𝑏𝑏𝑡𝑡 )2

𝑏𝑏

𝑖𝑖=1

Langkah 2: Distribusi Bootstrap

Dari statistik yang telah dihitung nilainya, dapat diperoleh distribusi

samplingnya. Distribusi bootstrap dari sebuah statistik menghimpun seluruh

nilai-nilai tersebut dari hasil resampel pada Langkah 1. Distribusi bootstrap

inilah yang nantinya akan memberikan gambaran tentang distribusi sampling

dari statistik tujuan


44

Contoh 3.2.

Pada Contoh 3.1, kita menginginkan untuk mengestimasi rata-rata popu-

lasi untuk waktu perbaikan (𝜇𝜇), jadi statistiknya adalah mean sampel (�̅�𝑥).

Untuk satu sampel random dari 1664 waktu perbaikan, �̅�𝑥 = 8.41 jam. Ketika

kita meresampel, kita mendapatkan nilai-nilai yang berbeda untuk �̅�𝑥, seperti

yang kita inginkan bila kita mengambil sampel baru dari populasi seluruh

waktu perbaikan.

Gambar 3.5 dan Gambar 3.6 berikut menjelaskan tentang distribusi boot-

strap dari rata-rata dari 1000 buah resampel dari data waktu perbaikan Verizon,

menggunakan histogram terlebih dahulu dan kurva densitas, kemudian plot

kuantil normal. Garis lurus pada histogram menandakan rata-rata sebesar 8.41

dari sampel asli, dan garis putus-putus menandakan rata-rata dari sampel boot-

strap. Menurut prinsip bootstrap, distribusi bootstrap merepresentasikan dis-

tribusi sampling. Akan dibandingkan distribusi bootstrap dengan apa yang ki-

ta ketahui tentang distribusi sampling.

Gambar 3.5. Distribusi Bootstrap untuk rata-rata 1000 resampel dari sampel waktu perbaikan Verizon.

Waktu perbaikan dari resampel (dalam jam)

Rata-rata sampel asli Rata-rata bootstrap


45

Dari segi bentuk pada Gambar 3.5 dan Gambar 3.6, dapat dikatakan

bahwa distribusi bootstrap mendekati normal. Garis tengah distribusi boot-

strap dekat dengan mean sampel asli. Dengan kata lain, distribusi bootstrap

hanya memiliki sedikit bias sebagai penduga mean sampel asli. Seperti yang

kita ketahui, distribusi sampling dari �̅�𝑥 terletak di tengah mean populasi 𝜇𝜇, se-

hingga �̅�𝑥 adalah penduga tak bias dari 𝜇𝜇. Jadi distribusi resamplingnya bersi-

fat seperti yang kita harapkan untuk sifat distribusi samplingnya. Penyebaran

distribusi bootstrap juga tergambarkan dalam Gambar 3.5. Standar deviasi

yang merupakan ukuran numerik dari variansi di antara rata-rata resampel bisa

didapatkan. Nilai numerik tersebut bisa diperoleh dari 1000 nilai �̅�𝑥 yang

membentuk distribusi bootstrap dan disebut sebagai galat standar bootstrap

Gambar 3.6. Plot quantil normal menegaskan bahwa distribusi bootstrap mendekati normal dari bentuknya.

Nilai normal

Wak

tu p

erba

ikan

dar

i res

ampe

l (d

alam

jam

)


46

dari rata-rata. Untuk contoh di atas, nilainya adalah 0.367. Secara teori, kita

mengetahui bahwa rumus untuk galat standar dari �̅�𝑥 adalah 𝜎𝜎 √𝑛𝑛⁄ di mana 𝜎𝜎

yang merupakan standar deviasi dari populasi, diduga dengan 𝑠𝑠 (standar de-

viasi dari sampel). Dari Contoh 3.1.1 dan 3.1.2, didapat 𝑠𝑠 = 14.69, maka

𝑠𝑠√𝑛𝑛

=14.69√1664

= 0.360

Nilai galat standar bootstrap sebesar 0.367 hampir mendekati nilai galat stan-

dar secara teoritis, 0.360.

B. Aplikasi Pendekatan Galat standar Dari Mean Dengan Metode Bootstrap

Pada sub-bab ini, akan dijelaskan tahapan pendekatan galat standar den-

gan menggunakan metode Bootstrap dengan menggunakan contoh. Pada Ta-

bel 3.1 diberikan 10 buah sampel acak yang diambil seorang peneliti menge-

nai tinggi bangunan yang memiliki 30 lantai atau lebih di suatu kota besar di

Amerika Serikat.

Tujuan kita adalah mendapatkan nilai pendekatan galat standar dari

mean dengan menggunakan metode bootstrap. Pendekatan akan dilakukan

dengan dua cara, yaitu perhitungan secara manual dan dengan perhitungan

program MATLAB. Prosedur pendekatan galat standar mean bootstrap secara

manual akan dijelaskan terlebih dahulu.

Dari sampel asli tersebut, akan diambil 10 buah resampel dengan meng-

gunakan bilangan random. Dibutuhkan sebanyak 100 buah bilangan random,

untuk meresampel sampel asli. Bilangan-bilangan random tersebut dibang-

kitkan dengan menggunakan program MATLAB (agar bilangan random yang


47

diperoleh sama, sehingga hasil perhitungannya dapat dibandingkan). Tabel

3.2 menyajikan 100 buah bilangan random tersebut. Nomor pada kolom me-

nunjukkan banyaknya resampel yang dilakukan untuk mendapatkan sampel

bootstrap, sedangkan nomor pada baris menunjukkan nomor sampel yang di-

ambil.

Langkah berikutnya adalah mengkonversikan bilangan-bilangan random

tersebut ke dalam indeks nomor sampel, sehingga bisa diperoleh nilai-nilai re-

sampelnya. Tabel 3.4 menguraikan hasil konversi tersebut. Angka-angka di

dalam Tabel 3.4 menunjukkan nomor sampel yang terpilih pada masing-

masing hasil sampel bootstrap. Adapun aturan konversi bilangan random ke

indeks nomor sampel yang dipilih ditampilkan pada Tabel 3.3.

Dari tabel hasil konversi indeks tersebut, kita akan mendapatkan Tabel

3.5 yang menguraikan nilai-nilai untuk masing-masing hasil sampel bootstrap.

Dari tabel tersebut akan langsung dihitung berapa mean untuk masing-masing

sampel bootstrap.

Pada Tabel 3.5, sepuluh buah nilai mean sampel bootstrap tersebut ada-

lah nilai statistik yang sebelumya kita lambangkan sebagai 𝜃𝜃�∗𝑏𝑏 atau dalam

contoh ini, statistik yang digunakan adalah �̅�𝑥, maka dapat disimbolkan menja-

di �̅�𝑥∗𝑏𝑏 .

Perhitungan nilai mean dan galat standar untuk sampel asli diperoleh se-

bagai berikut.

�̅�𝑥 =1𝑛𝑛�𝑥𝑥𝑖𝑖

𝑛𝑛

𝑖𝑖=1


48

=1

10(485 + 520 + 511 + 535 + 841 + 635 + 725 + 616 + 615 + 582)

= 606.5

dengan nilai standar deviasi sebesar 𝑠𝑠 = 109.079.

𝑆𝑆𝑆𝑆 =𝑠𝑠√𝑛𝑛

=109.079√10

= 34.494

Pendekatan mean untuk populasi dengan metode bootstrap, diperoleh

dengan menggunakan mean bootstrap (mean𝑏𝑏𝑏𝑏𝑏𝑏𝑡𝑡 ). Penduga mean𝑏𝑏𝑏𝑏𝑏𝑏𝑡𝑡 dida-

pat dengan menghitung rata-rata dari masing-masing mean dari setiap replika-

si bootstrap. Sedangkan pendekatan untuk galat standar diperoleh dengan

menghitung standar deviasi dari replikasi-replikasi bootstrap.

Estimasi mean sampling dan galat standar dari mean dapat diperoleh

dengan rumus berikut.

mean𝑏𝑏𝑏𝑏𝑏𝑏𝑡𝑡 =1𝑏𝑏��̅�𝑥∗𝑖𝑖𝑏𝑏

𝑖𝑖=1

SE𝑏𝑏𝑏𝑏𝑏𝑏𝑡𝑡 = �1

𝑏𝑏 − 1�(�̅�𝑥∗ − mean𝑏𝑏𝑏𝑏𝑏𝑏𝑡𝑡 )2

𝑏𝑏

𝑖𝑖=1

Jadi, rata-rata dan galat standar bootstrap untuk tinggi gedung yang memiliki

lebih dari 30 lantai adalah

mean𝑏𝑏𝑏𝑏𝑏𝑏𝑡𝑡 =1

10( 588.2 + 544.3 + 590.4 + 586 + 603.6 + 582.5 + 660.5

+ 617.5 + 605.9 + 632.9)

= 601.18

SE𝑏𝑏𝑏𝑏𝑏𝑏𝑡𝑡 = 31.48


49

Dalam MATLAB telah disediakan fungsi yang langsung dapat mere-

sampel dan mencari nilai parameter populasi dengan metode bootstrap, fung-

sinya yaitu

bootstat = bootstrp(nboot,bootfun,d1,...)

di mana nboot adalah besaran skalar yang menyatakan banyaknya resampel

yang ingin dibentuk, bootfun adalah fungsi untuk menghitung statistik tu-

juan, seperti mean (@mean) dan koefisien korelasi (@corr), dan d1,… me-

nyatakan data yang berupa skalar, vektor kolom atau matriks yang digunakan

sebagai input untuk bootfun. Pada tulisan ini, fungsi bootstat tidak

akan digunakan, melainkan membentuk sintaks program sederhana untuk

membentuk resampel bootstrap dan menghitung statistik tujuan.

Untuk membuat program yang dapat meresampel pada MATLAB, hal

yang pertama kali dilakukan adalah menyusun algoritma dan diagram alir.

Dalam program tersebut, data sampel asli berukuran 𝑛𝑛 dapat kita tuliskan se-

bagai masukan (input) sebagai vektor kolom. Banyaknya sampel bootstrap

(𝑏𝑏) yang ingin dibentuk juga dituliskan sebagai input, tetapi dalam bentuk be-

saran skalar. Untuk dapat melakukan resampling acak, kita perlu membang-

kitkan bilangan random dalam bentuk matriks (𝑛𝑛 × 𝑏𝑏) agar masing-masing

sampel bootstrap juga berukuran 𝑛𝑛 . Selanjutnya, proses penentuan indeks

sampel asli dari bilangan random harus ditentukan dalam rumus umum agar

berlaku untuk setiap 𝑛𝑛 buah sampel yang dimasukkan sebagai input. Karena

bilangan random yang dibangkitkan adalah bilangan random seragam yang

berada di selang (0,1), maka, untuk mempermudah proses penentuan indeks,


50

selang (0,1) dibagi menjadi 𝑛𝑛 buah sub-selang. Indeks sampel akan berjalan

dari 𝑖𝑖 = 1,2, … ,𝑛𝑛, sehingga titik-titik ujung dari sub-selang pasti merupakan

kelipatan dari 1 𝑛𝑛⁄ . Jadi, untuk suatu bilangan random U, kita akan memilih

sampel ke-1 bila 0 ≤ 𝑈𝑈 < 1 𝑛𝑛⁄ , sampel ke-2 bila 0 ≤ 𝑈𝑈 < 2 𝑛𝑛⁄ , begitu sete-

rusnya sampai kita memilih sampel ke- 𝑛𝑛 bila (𝑛𝑛 − 1) 𝑛𝑛⁄ ≤ 𝑈𝑈 < 1 atau

(𝑛𝑛 − 1) 𝑛𝑛⁄ ≤ 𝑈𝑈 < 𝑛𝑛 𝑛𝑛⁄ . Pada matriks bilangan random 𝑈𝑈, proses penentuan

indeks nomor sampel ini dimulai dari kolom ke-1, lalu diperiksa tiap baris ke-𝑖𝑖

bilangan randomnya, 𝑖𝑖 = 1, … ,𝑛𝑛, lalu berpindah ke kolom ke-2, lalu diperiksa

tiap baris ke- 𝑖𝑖 bilangan randomnya, 𝑖𝑖 = 1, … ,𝑛𝑛, dan begitu seterusnya sampai

kolom ke-j (𝑗𝑗 = 1, … , 𝑏𝑏). Ketika sudah terbentuk matriks baru yang merupa-

kan sampel bootstrap, rata-rata dari masing-masing kolom akan dihitung terle-

bih dulu sebelum dilakukannya perpindahan kolom ke kolom berikutnya, se-

hingga akan terbentuk vektor kolom untuk replikasi bootstrap ketika seluruh

kolom sudah diperiksa. Dari nilai-nilai replikasi bootstrap tersebut, akan dipe-

roleh pendekatan mean bootstrap dengan menghitung seluruh rata-ratanya,

serta pendekatan galat standar sampling dengan menghitung standar deviasi

dari nilai-nilai replikasi tersebut.

Algoritma pada MATLAB untuk membentuk metode bootstrap adalah

sebagai berikut.

1. Bangkitkan 𝑛𝑛 buah sampel asli (𝑠𝑠𝑠𝑠) dari suatu populasi dengan fungsi dis-

tribusi probabilitas tertentu (normal, eksponensial, binomial, dan random)

dengan nilai 𝑆𝑆(𝑥𝑥) dan 𝑉𝑉𝑠𝑠𝑉𝑉(𝑥𝑥) tertentu yang bersesuaian dengan fungsi

distribusinya.


51

2. Masukkan 𝑏𝑏, yaitu besaran skalar yang mewakili banyaknya sampel boot-

strap.

3. Bangkitkan bilangan random 𝑈𝑈 dalam bentuk matriks 𝑖𝑖 × 𝑗𝑗 di mana 𝑖𝑖 se-

banyak ukuran sampel dan 𝑗𝑗 sebanyak resampel bootstrap.

4. Untuk 𝑗𝑗 = 1, … , 𝑏𝑏, 𝑖𝑖 = 1, … ,𝑛𝑛 dan 𝑘𝑘 = 1, … ,𝑛𝑛

𝑈𝑈(𝑖𝑖, 𝑗𝑗) < 𝑘𝑘(1 𝑛𝑛⁄ ) & 𝑈𝑈(𝑖𝑖, 𝑗𝑗) ≥ (𝑘𝑘 − 1)(1 𝑛𝑛⁄ ) & 𝑈𝑈(𝑖𝑖, 𝑗𝑗) < 0,

𝑈𝑈(𝑖𝑖, 𝑗𝑗) = 𝑠𝑠𝑠𝑠(𝑘𝑘)

5. Hitung rata-rata dari masing-masing kolom, matriks 𝑈𝑈.

6. Kembali ke Langkah 4 sampai seluruh 𝑖𝑖 & 𝑗𝑗 dieksekusi.

7. Hitung rata-rata dari seluruh rata-rata pada Langkah 5.

8. Hitung standar deviasi dari seluruh rata-rata pada langkah 5. Selesai.

Runtutan sintaks program untuk pendekatan rata-rata dan galat standar

dengan menggunakan metode bootstrap ditulis dengan menggunakan fasilitas

m-file pada MATLAB, dilampirkan pada tulisan ini pada Program 3.1, se-

dangkan diagram alirnya dijelaskan pada Gambar 3.7 yang juga terlampir.

Bila dibandingkan, antara perhitungan MATLAB dengan perhitungan

manual menghasilkan hasil yang sama. Pengambilan bilangan random yang

sama pada penghitungan manual hanya dilakukan untuk menguji apakah pro-

gram tersebut berjalan dengan benar. Kalaupun dibangkitkan dengan meng-

gunakan MS Office Excel, tidak akan didapatkan kumpulan bilangan random

yang persis sama. Jadi nilai pendekatan, baik untuk mean dan galat standar,


52

yang didapat dengan program ini tidak akan ada yang sama persis karena bi-

langan random tersebut.

Dengan membuat grafik distribusi bootstrap, kita dapat melihat apakah

secara kasar, sampling berdistribusi normal atau tidak. Di sinilah Teorema

Limit Pusat tidak dibutuhkan oleh metode bootstrap. Pada umumnya, distri-

busi bootstrap memiliki kedekatan dengan bentuk distribusi normal, tetapi le-

bih berada di tengah nilai statistik sampel asli dibandingkan nilai parameter-

nya. Galat standar dapat dihitung dengan bootstrap, tanpa rumus tertentu dan

juga menguji normalitas data untuk statistik-statistik yang sulit diuji secara

teoritis. Gambar 3.8 menjelaskan distribusi bootstrap untuk hasil replikasi

bootstrap terhadap sampel asli dari tinggi bangunan yang memiliki 30 lantai

atau lebih di suatu kota di Amerika Serikat.

Gambar 3.8. Grafik distribusi dari repllikasi bootstrap dengan 500 resampel. Grafik memperlihatkan bahwa data cenderung berdistribusi normal.

Frek

uens

i

Rata-rata bootstrap


53

Dari segi bentuk yang ditampilkan dalam Gambar 3.8, distribusi boot-

strap memiliki bentuk yang hampir serupa dengan distribusi normal. Nilai

tengahnya berada di sekitar rata-rata sampel asli, yaitu 606.5. Mean dari boot-

strap tersebut tak bias, karena biasanya nilainya berdekatan dengan nilai mean

dari sampel asli. Selisih dari kedua nilai tersebut disebut sebagai pendekatan

bootstrap terhadap bias. Tabel 3.6 yang terlampir menyajikan perbandingan

antara mean asli dengan mean bootstrap untuk beberapa nilai 𝑏𝑏 yang berbeda.

Terlihat jelas bahwa, semakin besar nilai 𝑏𝑏0T, maka nilai mean dan galat

standar bootstrap akan semakin mendekati nilai mean sampel asli. Selisih dari

kedua nilai mean untuk 𝑏𝑏0T yang semakin besar, juga semakin mengecil. Nilai

mean dan galat standar bootstrap ini dianggap sudah cukup baik sebagai nilai

penduga dari mean dan galat standar sampling.


BAB IV

APLIKASI METODE BOOTSTRAP

Pada bab ini akan dibahas bagaimana aplikasi metode bootstrap untuk pen-

dugaan selang kepercayaan rata-rata populasi dan regresi linear.


1. Dasar Pembentukan Selang Parameter Populasi dengan Metode Per-

sentil Bootstrap

Selang kepercayaan dibentuk berdasarkan distribusi sampling dari

suatu statistik. Bila sebuah statistik penduga tidak bias, maka distribusi

samplingnya terletak pada nilai sebenarnya dari parameter populasi. Se-

lang kepercayaan 95% dapat diperoleh dengan mengambil 95% distribusi

sampling yang berada di tengah. Pada dasarnya ada beberapa cara pende-

katan untuk membangun selang parameter populasi dengan menggunakan

prinsip bootstrap. Metode persentil bootstrap adalah metode yang paling

mudah dan jelas untuk membangun selang parameter populasi berdasarkan

pendekatan bootstrap. Disebut sebagai persentil karena metode ini meng-

gunakan data persentil ke (𝛼𝛼 2⁄ )100 dan (1 − 𝛼𝛼 2⁄ )100 sebagai titik

ujung selang, untuk membentuk selang kepercayaan (1 − 𝛼𝛼)100%. Se-

lang yang terbentuk memuat (1 − 𝛼𝛼)100% data dari 𝜃𝜃�∗𝑏𝑏 replikasi boot-

strap. Misalkan 𝜃𝜃�∗𝑏𝑏 = 𝑠𝑠(𝑥𝑥∗𝑏𝑏) adalah replikasi bootstrap atau nilai suatu

statistik ke-b yang telah dihitung dari sampel bootstrap berukuran n yang


55

diambil dengan pengembalian. Sebagai contoh, untuk membangun selang

kepercayaan 90%, digunakan persentil ke-5 dan ke-95 dari 𝜃𝜃�∗𝑏𝑏 untuk me-

nandai batas 90% distribusi sampling yang ada di tengah. Dengan mengu-

rutkan sejumlah b replikasi bootstrap tersebut dari yang terkecil sampai

yang terbesar, akan dapat diperoleh selang yang memuat 90% data dari

𝜃𝜃�∗𝑏𝑏 yang dapat dijadikan selang kepercayaan 90% untuk 𝜃𝜃. Jadi secara

umum, selang kepercayaan dengan metode bootstrap adalah sebagai beri-

kut.

𝜃𝜃�∗𝑏𝑏 𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙 < 𝜃𝜃 < 𝜃𝜃�∗𝑏𝑏𝑢𝑢𝑢𝑢𝑢𝑢𝑙𝑙𝑙𝑙

di mana 𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙 = 𝑏𝑏𝛼𝛼 2⁄ dan 𝑢𝑢𝑢𝑢𝑢𝑢𝑙𝑙𝑙𝑙 = 𝑏𝑏(1 − 𝛼𝛼 2⁄ ). Bila 𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙 dan

𝑢𝑢𝑢𝑢𝑢𝑢𝑙𝑙𝑙𝑙 bukan berupa bilangan bulat, maka dapat dibulatkan ke bilangan

bulat terdekat atau menginterpolasikan antara nilai-nilai 𝜃𝜃�∗𝑏𝑏 yang bersebe-

lahan.

Selang parameter populasi dengan menggunakan pendekatan anali-

tik, mengasumsikan bahwa statistik uji tersebut berdistribusi normal serta

melibatkan Teorema Limit Pusat sebagai landasan. Metode persentil boot-

strap yang basisnya adalah metode nonparametrik, memiliki keunggulan

tersendiri karena tidak perlu bergantung pada Teorema Limit Pusat karena

metode ini tidak memerlukan asumsi distribusi samplingnya, untuk distri-

busi sampling seperti apapun, diketahui atau tidak, metode ini dapat dite-

rapkan. Asumsi bahwa data tersebut berdistribusi tertentu secara parame-

trik juga tidak diperlukan karena metode persentil bootstrap mengandalkan

persentil dari distribusi bootstrap yang telah dibentuk dari 𝜃𝜃�∗𝑏𝑏 . Selain itu,


56

rumus-rumus sulit juga tidak diperlukan dalam metode ini karena penggu-

naan distribusi bootstrap tersebut.

Bila dijelaskan dalam bentuk algoritma dan diagram alir, maka me-

tode persentil bootstrap dapat digambarkan sebagai berikut:

1. Bangkitkan 𝑛𝑛 buah sampel asli (𝑠𝑠𝑠𝑠) dari suatu populasi dengan fungsi

distribusi probabilitas tertentu (normal, eksponensial, binomial, dan

random) dengan nilai 𝐸𝐸(𝑥𝑥) dan 𝑉𝑉𝑠𝑠𝑙𝑙(𝑥𝑥) tertentu yang bersesuaian den-

gan fungsi distribusinya.

2. Masukkan 𝑏𝑏, yaitu besaran skalar yang mewakili banyaknya sampel

bootstrap.

3. Masukkan 𝛼𝛼, yaitu besaran skalar yang mewakili tingkat signifikansi

untuk selang kepercayaan.

4. Bangkitkan bilangan random 𝑈𝑈 dalam bentuk matriks 𝑖𝑖 × 𝑗𝑗 di mana 𝑖𝑖

sebanyak ukuran sampel dan 𝑗𝑗 sebanyak resampel bootstrap.

5. Untuk 𝑗𝑗 = 1, … , 𝑏𝑏, 𝑖𝑖 = 1, … ,𝑛𝑛 dan 𝑘𝑘 = 1, … ,𝑛𝑛

𝑈𝑈(𝑖𝑖, 𝑗𝑗) < 𝑘𝑘(1 𝑛𝑛⁄ ) & 𝑈𝑈(𝑖𝑖, 𝑗𝑗) ≥ (𝑘𝑘 − 1)(1 𝑛𝑛⁄ ) & 𝑈𝑈(𝑖𝑖, 𝑗𝑗) < 0,

𝑈𝑈(𝑖𝑖, 𝑗𝑗) = 𝑠𝑠𝑠𝑠(𝑘𝑘)

6. Hitung rata-rata dari masing-masing kolom, matriks 𝑈𝑈, namakan vek-

tor ini sebagai 𝑈𝑈∗.

7. Kembali ke Langkah 4 sampai seluruh 𝑖𝑖 & 𝑗𝑗 dieksekusi.

8. Hitung rata-rata dari rata-rata pada Langkah 5.

9. Hitung standar deviasi dari seluruh rata-rata pada langkah 5.


57

10. Urutkan vektor 𝑈𝑈∗ dari yang terkecil hingga yang terbesar (vektor ini

akan memiliki 𝑏𝑏 buah elemen.

11. Dengan tingkat signifikansi 𝛼𝛼 persentil dari 𝑈𝑈∗ dengan aturan:

𝑢𝑢𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙 = 𝑈𝑈(𝑏𝑏𝛼𝛼 2⁄ ) dan 𝑢𝑢𝑙𝑙𝑙𝑙𝑢𝑢𝑢𝑢𝑢𝑢𝑙𝑙𝑙𝑙 = 𝑈𝑈(𝑏𝑏(1 − 𝛼𝛼 2⁄ ))

Selesai.

Kode sintaks dalam program MATLAB akan dilampirkan pada Pro-

gram 4.1, sedangkan diagram alirnya adalah Gambar 4.1 juga terlampir

dalam tulisan ini. Pada program tersebut, fungsi distribusi populasi diba-

tasi untuk empat buah distribusi, yaitu distribusi normal, eksponensial, bi-

nomial, dan poisson.

2. Pembentukan Selang Kepercayaan dengan Metode Persentil Boot-

strap

Sebagai contoh, diberikan data banyaknya darah yang hilang dari tu-

buh babi. Sepuluh ekor babi dipilih secara acak dan diamati berapa ba-

nyak tubuhnya kehilangan darah dalam milliliter. Hasil observasi dije-

laskan pada Tabel 4.1 (sumber: Chernick, 2003). Selanjutnya, akan diam-

bil 20 sampel bootstrap dengan ukuran sampel 10 buah dengan cara pem-

bangkitan nilai random. Untuk itu, kita membutuhkan 200 buah bilangan

acak seragam. Pada Tabel 4.2 disajikan bilangan acak seragam yang ma-

sing-masing merepresentasikan sampel bootstrap. Aturan konversi bilan-

gan random ke indeks sampel asli yang terpilih untuk mendapatkan sampel

bootstrap dijelaskan dalam Tabel 4.3.


58

Dengan demikian, bilangan-bilangan random dalam Tabel 4.2 dapat

dikonversikan ke dalam yang disajikan pada Tabel 4.4. Berdasarkan nilai-

nilai indeks pada Tabel 4.4, Tabel 4.5 berisi nilai-nilai sampel bootstrap

yang bersesuaian dengan sampel asli pada Tabel 4.1.

Pada baris terakhir di Tabel 4.5, ditunjukkan rata-rata dari masing-

masing sampel bootstrap serta rata-rata dari keduapuluh sampel bootstrap.

Sebagai perbandingan, pada Tabel 4.1, dari 10 buah sampel random yang

asli, didapatkan mean sebesar 1.085,9 dan estimasi galat standar sebesar

226,772. Sedangkan pada Tabel 4.5 didapatkan mean sampel bootstrap

sebesar 1.159,8 dan estimasi galat standar bootstrap sebesar 217,15.

Selang penduga parameter populasi dengan metode persentil akan

dibangun dengan mengurutkan estimasi bootstrap mulai dari yang terkecil

sampai yang terbesar. Untuk selang kepercayaan 90%, persentil ke-5 dan

ke-95 digunakan menjadi titik-titik ujung interval. Karena terdapat 20 es-

timasi bootstrap, maka interval akan dibentuk dari estimasi terkecil kedua

sampai estimasi kedua terbesar (estimasi ke-2 dan ke-19). Tabel 4.6 me-

nyajikan estimasi bootstrap yang telah diurutkan dari nilai yang terkecil

sampai yang terbesar. Dengan menggunakan metode persentil bootstrap,

selang yang terbentuk adalah

�̅�𝑥∗𝑏𝑏 𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙 < 𝜇𝜇 < �̅�𝑥∗𝑏𝑏𝑢𝑢𝑢𝑢𝑢𝑢𝑙𝑙𝑙𝑙

�̅�𝑥∗2 < 𝜇𝜇 < �̅�𝑥∗19

867 < 𝜇𝜇 < 1.517,4


59

Estimasi bootstrap yang ke-2 adalah 867 dan ke-19 adalah 1.517,4,

jadi selang kepercayaan persentil bootstrap 90% yang kita dapatkan adalah

[867; 1.517,4]. Selang kepercayaan ini akan kita bandingkan dengan se-

lang penduga parameter parametrik. Selang kepercayaan secara analitik,

dengan menggunakan data sampel yang asli dengan ukuran sampel 10

buah, didapatkan sebagai berikut:

�̅�𝑥 − 𝑡𝑡𝛼𝛼 2⁄ ;𝑣𝑣𝑠𝑠√𝑛𝑛

≤ 𝜇𝜇 ≤ �̅�𝑥 + 𝑡𝑡𝛼𝛼 2⁄ ;𝑣𝑣𝑠𝑠√𝑛𝑛

1.085,9 − 𝑡𝑡0.05;9717.12√10

≤ 𝜇𝜇 ≤ 1.085,9 + 𝑡𝑡0.05;9717,12√10

1.085,9 − 1,8331717.12√10

≤ 𝜇𝜇 ≤ 1.085,9 − 1,8331717,12√10

670,2019 ≤ 𝜇𝜇 ≤ 1.501,598

Batas atas selang penduga parametrik dengan tingkat kepercayaan

90% adalah 1.501,598 dan batas bawahnya adalah 670,2019. Bila diban-

dingkan dengan selang kepercayaan 90% yang dihasilkan dengan metode

persentil bootstrap terdapat beberapa perbedaan pada nilai-nilai selang ke-

percayaan, tetapi metode persentil secara nyata memiliki lebar selang yang

lebih sempit dibandingkan dengan selang parametrik.

Bila distribusi bootstrap dari 𝜃𝜃�∗𝑏𝑏 mendekati normal, maka selang

persentil bootstrap akan mendekati interval standar normal pula. Menurut

Teorema Limit Pusat, dengan membesarnya nilai 𝑛𝑛 mendekati tak hingga,

maka distribusi sampling akan mendekati distribusi normal. Begitu pula

dengan distribusi bootstrap, semakin banyak jumlah sampel bootstrapnya,

distribusi bootstrapnya juga semakin mendekati normal. Namun, untuk


60

contoh di atas, 10 buah sampel bootstrap dianggap terlalu sedikit untuk

menyatakan bahwa distribusi bootstrapnya mendekati normal dan selang

persentil bootstrap juga mendekati interval standar normal.

Untuk menguji apakah selang persentil bootstrap memuat nilai pa-

rameter populasi yang sebenarnya, maka dilakukan perbandingan dengan

simulasi. Batas-batas selang kepercayaan yang diperbandingkan adalah

selang yang dibentuk dengan metode persentil bootstrap dengan selang

kepercayaan normal untuk ukuran populasi, ukuran sampel dan ukuran

sampel bootstrap yang berbeda-beda. Dengan program MATLAB, simu-

lasi yang dilakukan akan akan diambil 𝑛𝑛 = 10, serta 15 buah nilai 𝑏𝑏 yang

berbeda, yaitu 10, 20, 50, 60, 100, 200, 500, 700, 1.000, 1.500, 2.000,

3.000, 5.000, 7.000, dan 10.000. Hasil simulasi yang diperoleh dari pen-

geksekusian Program 4.1 yang terlampir, disajikan pada Tabel 4.7, Tabel

4.8, Tabel 4.9, dan Tabel 4.10. Pada tabel-tabel tersebut, diasumsikan dis-

tribusi populasi diketahui, yaitu populasi yang berdistribusi normal, eks-

ponensial, binomial, dan poisson. Selang kepercayaan yang akan dibentuk

berdasarkan tingkat signifikansi sebesar 5%. Untuk populasi yang berdis-

tribusi normal, akan diambil 𝜇𝜇 = 20 dan 𝜎𝜎 = 2 disajikan dalam Tabel 4.7.

Sedangkan untuk populasi berdistribusi eksponensial dan poisson secara

berturut-turut disajikan dalam Tabel 4.8 dan Tabel 4.10 dan nilai 𝜆𝜆 = 20

dan untuk populasi berdistribusi binomial, disajikan dalam Tabel 4.9 den-

gan nilai 𝑢𝑢 = 0,05 dan 𝑁𝑁 = 10.


61

Pada Tabel 4.7, diperlihatkan perbandingan selang kepercayaan

bootstrap dengan selang kepercayaan normal secara teoritis. Bila diang-

gap kita mengetahui distribusi populasinya, yaitu distribusi normal, seiring

dengan membesarnya nilai 𝑏𝑏, nilai pendekatan mean bootstrap semakin

mendekati mean sampel asli dengan bias yang kecil. Nilai mean bootstrap

berada di sekitar 20 (konvergen ke nilai parameter populasi, yaitu 𝜇𝜇 = 20)

dan sangat dekat dengan nilai mean sampel aslinya. Bias yang dihasilkan

mean bootstrap dengan sampel asli dapat dikatakan cukup kecil. Galat

standar yang dihasilkan dengan metode bootstrap selalu lebih kecil diban-

dingkan dengan galat standar secara teoritis, yaitu 𝑠𝑠 √𝑛𝑛⁄ . Variansi boot-

strap yang didapat sering kali berbeda cukup jauh dengan variansi sampel

asli dan variansi populasi yang telah ditentukan. Hal ini terjadi karena

sampel acak yang diambil selalu berbeda-beda dan terlalu beragam untuk

setiap pengambilannya.

Selain itu, pada tabel tersebut, terlihat sangat jelas bahwa selang per-

sentil bootstrap yang dihasilkan memiliki interval yang lebih sempit di-

bandingkan selang kepercayaan normal. Meskipun kedua selang tersebut

sama-sama memuat nilai sebenarnya dari populasi, yaitu 𝜇𝜇 = 20, tetapi

dengan tingkat signifikansi yang sama, metode persentil yang lebar inter-

valnya lebih sempit dinilai lebih baik daripada selang kepercayaan normal.

Semakin besar nilai 𝑏𝑏, distribusi bootstrap yang dihasilkan semakin men-

dekati distribusi normal bila dilihat grafik histogram fungsi distribusi

bootstrapnya pada program MATLAB.


62

Untuk populasi yang berdistribusi ekponensial, dipilih 𝜆𝜆 = 20, ke-

mudian dilakukan simulasi perbandingan mean dan selang kepercayaan-

nya. Terlihat perbedaan yang cukup signifikan untuk mean sampel asli da-

ri satu nilai 𝑏𝑏 ke nilai 𝑏𝑏 yang lain pada Tabel 4.8. Sampel acak yang diha-

silkan selalu memiliki jangkauan yang cukup jauh, sehingga berpengaruh

pada variansinya pula. Bila dilihat dari segi bentuk grafik, distribusi eks-

ponensial memiliki keesktreman bentuk yang berbeda jauh dengan grafik

distribusi normal. Berbeda dengan distribusi populasi lain yang hanya

memerlukan nilai 𝑏𝑏 yang terbilang kecil, untuk distribusi ini, diambil nilai

𝑏𝑏 yang cukup besar, yaitu 50.000 dan 100.000. Dalam pengeksekusian

program MATLAB, khusus untuk fungsi distribusi ini membutuhkan wak-

tu yang lebih lama sampai diperoleh hasilnya. Mean bootstrap dan pende-

katan galat standar yang dihasilkan pada Tabel 4.8 (pada lampiran) diang-

gap cukup mendekati nilai mean sampel asli dan galat standar secara teori-

tis untuk nilai 𝑏𝑏 tersebut. Variansi bootstrap yang dihasilkan juga cukup

beragam dan berbeda jauh dengan variansi populasi, di mana variansi po-

pulasi adalah 𝜆𝜆2 = 400. Bentuk distribusi populasi juga berpengaruh pada

sampel acak, sehingga juga berpengaruh pada penduga bootstrap. Kita

dapat mengambil kesimpulan bahwa pendekatan bootstrap ini baik atau ti-

dak, bila ada penduga lain yang dapat dibandingkan.

Selang kepercayaan yang dihasilkan juga tidak terlalu konsisten (ni-

lai batas bawah dan batas atasnya tidak selalu dekat) seperti contoh sebe-

lumnya, tetapi untuk setiap percobaan, selang persentil bootstrap selalu le-


63

bih sempit dibandingan selang kepercayaan normal, meskipun keduanya

sama-sama memuat parameter sampel.

Pada Tabel 4.9, pada pemilihan populasi yang berdistribusi binomial,

dengan 𝐸𝐸(𝑥𝑥) = 𝑛𝑛𝑢𝑢 = 5 dan 𝑉𝑉𝑠𝑠𝑙𝑙(𝑥𝑥) = 𝑛𝑛𝑢𝑢(1 − 𝑢𝑢) = 2.5 mean bootstrap

yang dihasilkan selalu mendekati nilai mean sampel asli dan nilai mean

populasi. Distribusi bootstrap yang ditampilkan pada grafik juga mende-

kati distribusi normal seiring dengan membesarnya nilai 𝑏𝑏. Pendekatan

galat standar bootstrap juga selalu mendekati galat standar secara teori, te-

tapi tidak untuk variansinya. Variansi yang dihasilkan cukup beragam dan

terkadang berbeda cukup jauh dari variansi sampel asli.

Selang kepercayaan persentil bootstrap juga mendekati selang keper-

cayaan normal, tetapi jangkauannya lebih sempit bila dibandingkan den-

gan selang kepercayaan normal. Baik selang persentil bootstrap maupun

selang normal tersebut juga selalu memuat parameter populasi. Selang

persentil bootstrap juga selalu memuat parameter sampel yang diduga.

Pendekatan mean bootstrap untuk populasi yang berdistribusi pois-

son dengan 𝐸𝐸(𝑥𝑥) = 𝑉𝑉𝑠𝑠𝑙𝑙(𝑥𝑥) = 𝜆𝜆 = 20 selalu mendekati parameter sam-

pelnya dan nilainya selalu mendekati parameter populasinya. Hal ini terli-

hat pada nilai-nilai yang disimulasikan dan ditulis pada Tabel 4.10. Va-

riansi yang dihasikan, baik variansi secara teoritis berdasarkan sampel asli

dan variansi bootstrap dapat dikatakan tidak terlalu konsisten. Kemungki-

nan hal ini disebabkan oleh keragaman sampel acak yang dihasilkan. Ga-

lat standar yang dihasilkan cukup mendekati galat standar secara teoritis,


64

selain itu bias untuk mean sampel asli dan sampel bootstrap terbilang cu-

kup kecil.

Meskipun terlihat cukup baik, selang persentil bootstrap memiliki

beberapa kekurangan. Selang persentil bootstrap tidak begitu efektif keti-

ka ukuran sampelnya cukup kecil, karena pentingnya ujung-ujung dari dis-

tribusi sampling dalam perhitungan selang kepercayaan ini. Masalah yang

kedua adalah, dalam penggunaan selang persentil bootstrap, kita harus

mengasumsikan bahwa distribusi sampling bootstrapnya merupakan pen-

duga tak bias dari distribusi sampling 𝑓𝑓�𝜃𝜃�� (Mooney & Duval, 1993). Se-

lain itu, menurut Efron (1993), selang persentil ini tidak memiliki petunjuk

apapun tentang distribusi normal yang menjadi dasar dan menggunakan

distribusi empiris sebagai gantinya, di sinilah konsekuensi dari inferensi

nonparametrik. Dalam hal ini, selang tersebut kurang memperhitungkan

pentingnya ujung-ujung ekor distribusi dari 𝜃𝜃�∗.

B. REGRESI LINEAR BOOTSTRAP

1. Metode Bootstrap Untuk Pendugaan Parameter Dalam Regresi Li-

near Berganda

Model regresi adalah metode statistikal yang sangat berguna dan me-

tode yang paling sering digunakan di antara metode-metode lainnya. Re-

gresi memudahkan kita untuk menganalisis situasi yang rumit dengan cara

yang relatif mudah, di mana kita mencoba untuk mengurutkan akibat-

akibat dari variabel-variabel penjelas dari sebuah variabel respons. Me-


65

tode bootstrap yang memiliki banyak keunggulan di dalam pengolahan da-

ta, juga dapat diterapkan pada pembentukan model regresi linear berganda

ini. Cara penarikan sampel bootstrap diterapkan untuk menentukan pen-

dekatan parameter regresi atau koefisien regresi.

Terdapat dua jenis penerapan metode bootstrap untuk meresampling

dalam analisis regresi, yaitu metode bootstrap untuk meresampling nilai

observasi dan metode bootstrap untuk meresampling eror. Pemilihan pe-

nerapan di antara kedua metode tersebut tergantung pada tetap atau acak-

nya variabel independen. Bila variabel independennya dianggap tetap,

maka metode yang dipilih adalah resampling dari erornya. Bila variabel

independennya acak, maka yang diresampling adalah nilai observasinya.

a. Algoritma Metode Bootstrap Untuk Meresampling Observasi

Pendekatan dengan metode ini dilakukan bila variabel indepen-

den dalam model regresi yang dibangun berdasarkan data, sama acak-

nya dengan variabel dependennya. Untuk memulainya, diberikan vek-

tor 𝐰𝐰𝑖𝑖 = �𝑦𝑦𝑖𝑖𝑥𝑥𝑖𝑖𝑗𝑗 � menyatakan nilai yang berasosiasi dengan observasi ke-

𝑖𝑖. Himpunan observasi dalam metode ini adalah vektor 𝐖𝐖 =

[𝐰𝐰1,𝐰𝐰2, … ,𝐰𝐰𝑛𝑛 ]. Untuk mempermudah, sampel asli yang akan diam-

bil dijelaskan pada gambar berikut.


66

𝑌𝑌 𝑋𝑋1 𝑋𝑋2 … 𝑋𝑋𝑘𝑘

𝑦𝑦1 𝑥𝑥11 𝑥𝑥12 … 𝑥𝑥1𝑘𝑘

𝑦𝑦2 𝑥𝑥21 𝑥𝑥22 … 𝑥𝑥2𝑘𝑘

⋮ ⋮ ⋮ ⋮ ⋮

𝑦𝑦𝑛𝑛 𝑥𝑥𝑛𝑛1 𝑥𝑥𝑛𝑛2 … 𝑥𝑥𝑛𝑛1

Secara sederhana, Gambar 4.3 menjelaskan prosedur metode

bootstrap dalam meresampling data observasi dalam regresi berganda.

Selanjutnya, algoritma atau prosedur metode bootstrap dalam

meresampling observasi secara umum adalah sebagai berikut.

1) Ambil sampel bootstrap 𝐰𝐰∗𝑏𝑏 (berupa vektor yang memuat 𝑛𝑛 buah

𝐰𝐰𝑖𝑖) dengan sampling dengan pengembalian dari observasi, kemu-

𝐰𝐰1 𝐰𝐰2

𝐰𝐰𝑛𝑛

Gambar 4.2. Pasangan terurut (𝑦𝑦𝑖𝑖 , 𝑥𝑥𝑖𝑖𝑗𝑗 ) dinotasikan da-

lam bentuk vektor 𝐰𝐰𝑖𝑖

OLS

Gambar 4.3. Skema regresi boostrap dengan meresampling observasi

𝛃𝛃�𝑏𝑏𝑙𝑙𝑙𝑙𝑡𝑡 = 𝛃𝛃�∗𝑏𝑏��

Replikasi bootstrap

Sampel Asli

𝐰𝐰∗1 𝐰𝐰∗2

𝐰𝐰∗𝑏𝑏

𝛃𝛃�∗1 𝛃𝛃�∗2 𝛃𝛃�∗𝑏𝑏 …

…

𝐖𝐖 = (𝐰𝐰1,𝐰𝐰2, … ,𝐰𝐰𝑛𝑛)

Sampel Bootstrap


67

dian bentuk distribusi empirisnya dengan menempatkan distribusi

probabilitas untuk setiap nilai 𝑙𝑙𝑖𝑖 . Notasikan elemen-elemen dari

setiap vektor dengan 𝐰𝐰𝑖𝑖∗𝑏𝑏 = �

𝑦𝑦𝑖𝑖∗𝑏𝑏

𝑥𝑥𝑖𝑖𝑗𝑗 ∗𝑏𝑏� di mana 𝑖𝑖 = 1,2, … ,𝑛𝑛 dan

𝑗𝑗 = 1,2, … , 𝑘𝑘. Elemen pada 𝐰𝐰𝑖𝑖∗𝑏𝑏 diambil dari elemen-elemen vek-

tor 𝐘𝐘∗𝑏𝑏 =

⎣⎢⎢⎡𝑦𝑦1

∗𝑏𝑏

𝑦𝑦2∗𝑏𝑏

⋮𝑦𝑦𝑛𝑛∗𝑏𝑏⎦

⎥⎥⎤ dan matriks

𝐗𝐗∗𝑏𝑏 =

⎣⎢⎢⎡𝑥𝑥0 𝑥𝑥11

∗𝑏𝑏 𝑥𝑥12∗𝑏𝑏

𝑥𝑥0 𝑥𝑥21∗𝑏𝑏 𝑥𝑥22

∗𝑏𝑏… 𝑥𝑥1𝑘𝑘

∗𝑏𝑏

… 𝑥𝑥2𝑘𝑘∗𝑏𝑏

⋮ ⋮ ⋮𝑥𝑥0 𝑥𝑥𝑛𝑛1

∗𝑏𝑏 𝑥𝑥𝑛𝑛2∗𝑏𝑏

⋮ ⋮… 𝑥𝑥𝑛𝑛𝑘𝑘 ∗𝑏𝑏⎦

⎥⎥⎤.

2) Hitung koefisien regresi bootstrap dengan OLS dari sampel boot-

strap.

𝛃𝛃�∗𝑏𝑏 = (𝐗𝐗∗𝑏𝑏′𝐗𝐗∗𝑏𝑏)−1𝐗𝐗∗𝑏𝑏′𝐘𝐘∗𝑏𝑏

3) Ulangi langkah 1 dan 2 hingga 𝑏𝑏 kali.

4) Bentuk distribusi bootstrap 𝐹𝐹(𝛃𝛃�∗𝑏𝑏) dari estimasi bootstrap

𝛃𝛃�∗1,𝛃𝛃�∗2, …𝛃𝛃�∗𝑏𝑏 dan gunakan 𝐹𝐹(𝛃𝛃�∗𝑏𝑏) untuk mengestimasi koefisien

regresi. Koefisien regresi diduga dengan

𝛃𝛃�𝑏𝑏𝑙𝑙𝑙𝑙𝑡𝑡 =1𝑏𝑏�𝛃𝛃�∗ℎ𝑏𝑏

ℎ=1

= 𝛃𝛃�∗𝑏𝑏��

5) Oleh karena itu, persamaan akhir regresi bootstrap adalah

𝐘𝐘� = 𝐗𝐗𝛃𝛃�𝑏𝑏𝑙𝑙𝑙𝑙𝑡𝑡

di mana 𝛃𝛃�𝑏𝑏𝑙𝑙𝑙𝑙𝑡𝑡 adalah penduga tak bias dari 𝛃𝛃�.


68

Bukti:

𝐸𝐸�𝛃𝛃�𝑏𝑏𝑙𝑙𝑙𝑙𝑡𝑡 � = 𝐸𝐸 �1𝑏𝑏�𝛃𝛃�∗ℎ𝑏𝑏

ℎ=1

�

=1𝑏𝑏𝐸𝐸 ��(𝐗𝐗∗𝑏𝑏′𝐗𝐗∗𝑏𝑏)−1(𝐗𝐗∗𝑏𝑏′𝐘𝐘∗𝑏𝑏)

𝑏𝑏

ℎ=1

�

=1𝑏𝑏𝐸𝐸 ��(𝐗𝐗∗𝑏𝑏′𝐗𝐗∗𝑏𝑏)−1 �𝐗𝐗∗𝑏𝑏 ′�𝐗𝐗∗𝑏𝑏𝛃𝛃� + 𝛆𝛆∗𝑏𝑏��

𝑏𝑏

ℎ=1

�

=1𝑏𝑏𝐸𝐸 ��(𝐗𝐗∗𝑏𝑏′𝐗𝐗∗𝑏𝑏)−1(𝐗𝐗∗𝑏𝑏′𝐗𝐗∗𝑏𝑏)𝛃𝛃� + �(𝐗𝐗∗𝑏𝑏′𝐗𝐗∗𝑏𝑏)−1(𝐗𝐗∗𝑏𝑏′𝛆𝛆∗𝑏𝑏)�

𝑏𝑏

ℎ=1

�

=1𝑏𝑏𝐸𝐸 ��𝛃𝛃� + �(𝐗𝐗∗𝑏𝑏′𝐗𝐗∗𝑏𝑏)−1(𝐗𝐗∗𝑏𝑏′𝛆𝛆∗𝑏𝑏)�

𝑏𝑏

ℎ=1

�

=1𝑏𝑏𝐸𝐸 ��𝛃𝛃� + �(𝐗𝐗∗𝑏𝑏′𝐗𝐗∗𝑏𝑏)−1 �𝐗𝐗∗𝑏𝑏 ′𝐄𝐄(𝛆𝛆∗𝑏𝑏)��

𝑏𝑏

ℎ=1

�

=1𝑏𝑏𝐸𝐸 �𝑏𝑏 �𝛃𝛃� + (𝐗𝐗∗𝑏𝑏′𝐗𝐗∗𝑏𝑏)−1 �𝐗𝐗∗𝑏𝑏 ′(0)�� =

1𝑏𝑏𝑏𝑏 𝐸𝐸�𝛃𝛃�� = 𝛃𝛃�

Pada Program 4.2, pasangan terurut �𝑥𝑥𝑖𝑖𝑗𝑗 ,𝑦𝑦𝑖𝑖�, diambil secara ran-

dom dan diperlakukan sebagai input. Program ini juga menggunakan

regresi linear berganda dengan konstanta.

Sedangkan pada Program 4.3, pasangan terurut �𝑥𝑥𝑖𝑖𝑗𝑗 ,𝑦𝑦𝑖𝑖�, diambil

secara random, di mana 𝑥𝑥𝑖𝑖𝑗𝑗 berdistribusi multivariat normal dengan

mean yaitu vektor 𝛍𝛍. Vektor ini berukuran 1 × 𝑘𝑘, memuat mean dari

masing-masing variabel independen, yaitu 𝜇𝜇𝑋𝑋1 , 𝜇𝜇𝑋𝑋2 , … , 𝜇𝜇𝑋𝑋𝑘𝑘 ) dan kova-

riansi 𝐜𝐜𝐜𝐜𝐜𝐜 di mana vektor berukuran 𝑘𝑘 × 𝑘𝑘 ini memuat variansi dari


69

variabel-variabel independen tersebut pada elemen diagonalnya. Se-

lain itu, 𝑦𝑦𝑖𝑖 harus memenuhi persamaan 𝐘𝐘 = 𝐗𝐗𝛃𝛃 + 𝛆𝛆. Nilai-nilai pada

vektor kolom galat dibangkitkan dengan menggunakan pembangkit bi-

langan random yang berdistribusi normal, di mana 𝐸𝐸(𝛆𝛆) = 0 dan

𝑉𝑉𝑠𝑠𝑙𝑙(𝛆𝛆) = σ2. Untuk menguji apakah metode bootstrap memberikan

pendekatan yang cukup signifikan untuk parameter populasi, diasum-

sikan kita telah mengetahui nilai 𝛃𝛃, karena itu nilai-nilai pada vektor

kolom tersebut diperlakukan sebagai input. Pada program ini, tidak

melibatkan regresi linear berganda dengan konstanta. Gambar 4.4

yang terlampir, menjelaskan diagram alir untuk program resampling

observasi untuk Program 4.2, sedangkan Gambar 4.5 merupakan dia-

gram alir dari Program 4.3. Kode sintaks untuk program-program

MATLAB tersebut, terdapat pada bagian lampiran.

Contoh 4.1. (Sumber: Efron (1993))

Pada tabel 4.11 berikut, disediakan data 27 alat medis yang seca-

ra kontinu menghantarkan hormon anti-inflamatori setelah digunakan

dalam suatu waktu tertentu. Alat medis diambil dari 3 pabrik yang

berbeda, A, B, dan C. Model ini mengabaikan jenis pabrik dan men-

ganggap variabel independennya hanyalah lamanya waktu penggunaan

alat medis (𝑋𝑋) dan variabel dependennya adalah besarnya konsentrasi

hormon anti-inflamatori (𝑌𝑌). Variabel independen (𝑌𝑌) diambil secara


70

acak, sehingga prosedur bootstrap yang akan dilakukan adalah pen-

gambilan sampel bootstrap dari himpunan pasangan terurut dari data.

Dengan bilangan random yang dibangkitkan pada Tabel 4.13,

akan diambil 5 sampel bootstrap yang berupa pasangan terurut (𝑥𝑥,𝑦𝑦)

dengan ukuran sampel 𝑛𝑛 = 9 untuk masing-masing jenis pabrik. Atu-

ran konversi indeks sampel yang dipilih terdapat pada Tabel 4.12, se-

dangkan hasil konversi indeks sampel yang terpilih untuk dijadikan

sampel bootstrap ditampilkan pada Tabel 4.14. dan Tabel 4.15 menya-

jikan hasil sampel bootstrap yang telah dibangkitkan, beserta nilai-nilai

koefisen regresi untuk masing-masing sampel bootstrap tersebut.

Dari hasil perhitungan sesuai dengan algoritma, didapatkan

�̂�𝛽0∗1

= 31,976, �̂�𝛽1∗1

= −0,062, �̂�𝛽0∗2

= 34,6517, �̂�𝛽1∗2

= −0,0762,

�̂�𝛽0∗3

= 34,5755, �̂�𝛽1∗3

= −0,0771, �̂�𝛽0∗4

= 34,2202, �̂�𝛽1∗4

=

−0,0755, dan �̂�𝛽0∗5

= 33,901, �̂�𝛽1∗5

= −0,072. Dengan begitu, dapat

diperoleh 𝛃𝛃�𝑏𝑏𝑙𝑙𝑙𝑙𝑡𝑡 dengan cara menghitung rata-rata dari seluruh 𝛃𝛃�∗𝐛𝐛.

𝛃𝛃�𝑏𝑏𝑙𝑙𝑙𝑙𝑡𝑡 = � 33,8649−0,07264�

Jadi persamaan regresi bootstrap yang terbentuk untuk data hormon

berdasarkan pabrik A adalah

𝑦𝑦�𝑖𝑖 = 33,8649 − 0,07264𝑥𝑥𝑖𝑖

Untuk alat medis buatan pabrik B, akan dibangkitkan bilangan

random, sama seperti pada data untuk pabrik A, bilangan random ter-

sebut disajikan pada Tabel 4.16. dengan menggunakan aturan konversi


71

indeks sampelpada Tabel 4.12, konversi indeks sampel yang terpilih

untuk dijadikan sampel bootstrap ditampilkan pada Tabel 4.17. dan

Tabel 4.18 menyajikan hasil sampel bootstrap yang telah dibangkitkan

untuk data pabrik B, beserta nilai-nilai koefisen regresi untuk masing-

masing sampel bootstrap tersebut. Pada Tabel 4.18, terdapat nilai rep-

likasi bootstrap sebagai berikut �̂�𝛽0∗1

= 34,1259, �̂�𝛽1∗1

= −0,0525,

�̂�𝛽0∗2

= 35,3939, �̂�𝛽1∗2

= −0,0566, �̂�𝛽0∗3

= 38,1158, �̂�𝛽1∗3

=

−0,0667, �̂�𝛽0∗4

= 34,9339, �̂�𝛽1∗4

= −0,0508, dan �̂�𝛽0∗5

= 34,1427,

�̂�𝛽1∗5

= −0,0547. Maka, dapat diperoleh 𝛃𝛃�𝑏𝑏𝑙𝑙𝑙𝑙𝑡𝑡 , yaitu

𝛃𝛃�𝑏𝑏𝑙𝑙𝑙𝑙𝑡𝑡 = �35,34244−0,05626�


berdasarkan pabrik B adalah

𝑦𝑦�𝑖𝑖 = 35,34244 − 0,05626𝑥𝑥𝑖𝑖

Sedangkan untuk alat medis buatan pabrik C, akan dibangkitkan

bilangan random, sama seperti pada data untuk pabrik A dan B, bilan-

gan random tersebut disajikan pada Tabel 4.19 dan dengan aturan kon-

versi indeks sampel ada Tabel 4.12, konversi indeks sampel yang terpi-

lih untuk dijadikan sampel bootstrap terdapat pada Tabel 4.20, serta

Tabel 4.21 menyajikan hasil sampel bootstrap yang telah dibangkitkan

untuk data pabrik C, beserta nilai-nilai koefisen regresi untuk masing-

masing sampel bootstrap tersebut. Pada Tabel 4.20, terdapat nilai rep-

likasi bootstrap. Nilai-nilai tersebut, yaitu �̂�𝛽0∗1

= 36,3948, �̂�𝛽1∗1

=


72

−0,0646, �̂�𝛽0∗2

= 42,8542, �̂�𝛽1∗2

= −0,01137, �̂�𝛽0∗3

= 37,2071,

�̂�𝛽1∗3

= −0,0742, �̂�𝛽0∗4

= 38,3745, �̂�𝛽1∗4

= −0,0832, dan �̂�𝛽0∗5

=

38,4051, �̂�𝛽1∗5

= −0,0849. Maka, dapat diperoleh 𝛃𝛃�𝑏𝑏𝑙𝑙𝑙𝑙𝑡𝑡 , yaitu

𝛃𝛃�𝑏𝑏𝑙𝑙𝑙𝑙𝑡𝑡 = �38,64714−0,08412�


berdasarkan pabrik C adalah

𝑦𝑦�𝑖𝑖 = 38,64714 − 0,08412𝑥𝑥𝑖𝑖

b. Algoritma Metode Bootstrap untuk Meresampling Galat

Bila regressornya tetap, maka resampling bootstrap perlu meng-

awetkan strukturnya. Algoritma untuk meresampling galat atau resi-

dual dari model regresi adalah sebagai berikut.

1) Bentuk persamaan regresi dengan menggunakan kuadrat terkecil

untuk sampel awal.

2) Hitung nilai 𝜀𝜀𝑖𝑖 = 𝑦𝑦𝑖𝑖 − 𝑦𝑦�𝑖𝑖 di mana 𝑖𝑖 = 1,2, … ,𝑛𝑛

3) Dari langkah 2, ambil sampel bootstrap 𝛆𝛆∗𝑏𝑏 , berupa vektor yang

memuat 𝑛𝑛 buah 𝜀𝜀𝑖𝑖 dan diambil dengan pengembalian. Untuk se-

tiap nilai 𝜀𝜀𝑖𝑖 diberikan distribusi probabilitasnya dengan peluang

1 𝑛𝑛⁄ .

4) Hitung nilai 𝐘𝐘∗𝑏𝑏 dengan menambahkan residual resampel pada

model regresi kuadrat terkecil pada langkah 1.

𝐘𝐘∗𝑏𝑏 = 𝐗𝐗𝛃𝛃� + 𝛆𝛆∗𝑏𝑏


73

5) Dari sampel bootstrap yang pertama, kita akan memperoleh

𝛃𝛃�∗𝑏𝑏 = (𝐗𝐗′𝐗𝐗)−𝟏𝟏𝐗𝐗′𝐘𝐘∗𝑏𝑏

atau

𝛃𝛃�∗𝑏𝑏 = 𝛃𝛃� + (𝐗𝐗′𝐗𝐗)−𝟏𝟏𝐗𝐗′𝛆𝛆∗𝑏𝑏

6) Ulangi langkah 3, 4, dan 5 sebanyak 𝑏𝑏 kali.

7) Bentuk distribusi bootstrap 𝐹𝐹(𝛃𝛃�∗𝑏𝑏) dari estimasi bootstrap

𝛃𝛃�∗1,𝛃𝛃�∗2, …𝛃𝛃�∗𝑏𝑏 dan gunakan 𝐹𝐹(𝛃𝛃�∗𝑏𝑏) untuk mengestimasi koefisien

regresi. Koefisien regresi diduga dengan

𝛃𝛃�𝑏𝑏𝑙𝑙𝑙𝑙𝑡𝑡 =1𝑏𝑏�𝛃𝛃�∗ℎ𝑏𝑏

ℎ=1

= 𝛃𝛃�∗𝑏𝑏��

8) Oleh karena itu, persamaan regresi bootstrap adalah


di mana 𝛃𝛃�𝑏𝑏𝑙𝑙𝑙𝑙𝑡𝑡 adalah penduga tak bias dari 𝛃𝛃�.

Bukti:

𝐸𝐸�𝛃𝛃�𝑏𝑏𝑙𝑙𝑙𝑙𝑡𝑡 � = 𝐸𝐸 �1𝑏𝑏�𝛃𝛃�∗ℎ𝑏𝑏

ℎ=1

�

=1𝑏𝑏𝐸𝐸 ��(𝐗𝐗′𝐗𝐗)−1(𝐗𝐗′𝐘𝐘∗𝑏𝑏)

𝑏𝑏

ℎ=1

� =1𝑏𝑏𝐸𝐸 ��(𝐗𝐗′𝐗𝐗)−1 �𝐗𝐗′�𝐗𝐗𝛃𝛃� + 𝛆𝛆∗𝑏𝑏��

𝑏𝑏

ℎ=1

�

=1𝑏𝑏𝐸𝐸 ��(𝐗𝐗′𝐗𝐗)−1(𝐗𝐗′𝐗𝐗)𝛃𝛃� + �(𝐗𝐗′𝐗𝐗)−1(𝐗𝐗′𝛆𝛆∗𝑏𝑏)�

𝑏𝑏

ℎ=1

�

=1𝑏𝑏𝐸𝐸 ��𝛃𝛃� + �(𝐗𝐗′𝐗𝐗)−1(𝐗𝐗′𝛆𝛆∗𝑏𝑏)�

𝑏𝑏

ℎ=1

�


74

=1𝑏𝑏𝐸𝐸 ��𝛃𝛃� + �(𝐗𝐗′𝐗𝐗)−1�𝐗𝐗′𝐄𝐄(𝛆𝛆∗𝑏𝑏)��

𝑏𝑏

ℎ=1

�

=1𝑏𝑏𝐸𝐸 �𝑏𝑏 �𝛃𝛃� + (𝐗𝐗′𝐗𝐗)−1�𝐗𝐗′(0)��

=1𝑏𝑏𝑏𝑏 𝐸𝐸�𝛃𝛃�� = 𝛃𝛃�

Secara sederhana, langkah-langkah dalam metode bootstrap pada

penerapannya dalam meresampling residual atau galat pada persamaan

regresi linear berganda dapat digambarkan dalam Gambar 4.6. Serta

aplikasi dalam runtunan kode sintaks MATLAB akan dilampirkan da-

lam tulisan ini pada Program 4.4 dan Program 4.5. Perbedaan dari ke-

dua program tersebut adalah perlakuan sampel asli pasangan terurut-

nya. Pada Program 4.4, variabel independen dan variabel dependen-

nya langsung diperlakukan sebagai input, sedangkan pada Program

4.5, variabel independennya dibangkitkan dari suatu populasi yang

berdistribusi multivariat normal dengan mean yaitu vektor 𝛍𝛍. Vektor

ini berukuran 1 × 𝑘𝑘, memuat mean dari masing-masing variabel inde-

penden, yaitu 𝜇𝜇𝑋𝑋1 ,𝜇𝜇𝑋𝑋2 , … , 𝜇𝜇𝑋𝑋𝑘𝑘 ) dan kovariansi 𝐜𝐜𝐜𝐜𝐜𝐜 di mana vektor be-

rukuran 𝑘𝑘 × 𝑘𝑘 ini memuat variansi dari variabel-variabel independen

tersebut pada elemen diagonalnya. Selain itu, 𝑦𝑦𝑖𝑖 harus memenuhi per-

samaan 𝐘𝐘 = 𝐗𝐗𝛃𝛃 + 𝛆𝛆. Nilai-nilai pada vektor kolom galat dibangkitkan

dengan menggunakan pembangkit bilangan random yang berdistribusi

normal, di mana 𝐸𝐸(𝛆𝛆) = 0 dan 𝑉𝑉𝑠𝑠𝑙𝑙(𝛆𝛆) = σ2. Untuk menguji apakah

metode bootstrap memberikan pendekatan yang cukup signifikan un-


75

tuk parameter populasi, diasumsikan kita telah mengetahui nilai 𝛃𝛃, ka-

rena itu nilai-nilai pada vektor kolom tersebut diperlakukan sebagai

input. Selain itu, Program 4.5 juga tidak melibatkan konstanta dalam

regresi linear gergandanya. Diagram alir untuk Program 4.4 terlampir

pada Gambar 4.7 dan untuk Program 4.5, diagram alirnya adalah

Gambar 4.8.

Contoh 4.2.

Dengan data yang sama seperti pada Tabel 4.11 dan mengasum-

sikan bahwa lamanya waktu penggunaan alat medis penghantar hor-

mon anti-inflamatori adalah tetap, akan digunakan metode regresi

Gambar 4.6. Skema regresi boostrap dengan meresampling galat

Sampel Asli 𝛆𝛆 = (𝜀𝜀1, 𝜀𝜀1, … , 𝜀𝜀𝑛𝑛)

OLS 𝐘𝐘� = 𝐗𝐗𝛃𝛃� + 𝛆𝛆

Sampel Bootstrap 𝛆𝛆∗2

… 𝛆𝛆∗1

𝛆𝛆∗𝑏𝑏

…

𝐘𝐘∗1 = 𝐗𝐗𝛃𝛃� + 𝛆𝛆∗1

𝐘𝐘∗2 = 𝐗𝐗𝛃𝛃� + 𝛆𝛆∗2

𝐘𝐘∗𝑏𝑏 = 𝐗𝐗𝛃𝛃� + 𝛆𝛆∗𝑏𝑏

𝛃𝛃�𝑏𝑏𝑙𝑙𝑙𝑙𝑡𝑡 = 𝛃𝛃�∗𝑏𝑏��

Replikasi bootstrap 𝛃𝛃�∗1 𝛃𝛃�∗2 𝛃𝛃�∗𝑏𝑏


76

bootstrap untuk meresampling residual. Langkah pertama adalah

menggunakan metode OLS untuk memperoleh model regresi dari

sampel awal. Pada Tabel 4.22, telah diperoleh nilai-nilai koefisien re-

gresi untuk persamaan awal. Persamaan regresi untuk ketiga jenis alat

berdasarkan buatan pabrik A, B, dan C secara berturut-turut adalah se-

bagai berikut.

𝐘𝐘𝐴𝐴 = 33,3601 − 0,0683𝑿𝑿𝑨𝑨

𝐘𝐘𝐵𝐵 = 35,2061 − 0,0563𝑿𝑿𝑩𝑩

𝐘𝐘𝐶𝐶 = 37,1973 − 0,0745𝐗𝐗𝐶𝐶

Selanjutnya, dengan menggunakan nilai 𝑋𝑋 untuk masing-masing

jenis alat, akan diperoleh nilai residual yang akan digunakan sebagai

sampel asli untuk resampel bootstrap. Nilai residual tersebut disajikan

pada Tabel 4.23, kemudian bangkitkan bilangan random untuk mere-

sampel nilai-nilai residual tersebut. Tabel 4.24, Tabel 4.28, dan Tabel

4.32 menyajikan bilangan random yang telah dibangkitkan dengan MS

Office Excel. Aturan konversi yang digunakan adalah aturan konversi

pada Tabel 4.12, sedangkan Tabel 4.25, Tabel 4.29, dan Tabel 4.33

memuat indeks sampel asli yang telah dikonversi dari bilangan ran-

domnya. Dalam Tabel 4.26, Tabel 4.30, dan Tabel 4.34 terdapat 5

buah sampel bootstrap residual berukuran 𝑛𝑛 = 9 untuk masing-masing

tabel, sehingga total terdapat 15 buah unit sampel bootstrap.

Nilai residual pada masing-masing sampel bootstrap tersebut di-

tambahkan dengan 𝐗𝐗𝛃𝛃�, sehingga didapatkan vektor 𝐘𝐘∗𝑏𝑏 . Seluruh hasil


77

perhitungan 𝐘𝐘∗𝑏𝑏 disajikan pada Tabel 4.27, Tabel 4.31, dan Tabel 4.35.

dari vektor 𝐗𝐗 dan 𝐘𝐘∗𝑏𝑏 dapat diperoleh parameter regresi 𝛃𝛃�∗𝑏𝑏 dengan

menggunakan OLS. Nilai-nilai dugaan parameter 𝛃𝛃�∗𝑏𝑏 tersebut juga

disajikan pada tabel yang sama dengan nilai-nilai 𝐘𝐘∗𝑏𝑏 . Untuk masing-

masing jenis alat medis A, B, dan C, dapat dihitung nilai dugaan para-

meter regresi bootstrapnya 𝛃𝛃�𝑏𝑏𝑙𝑙𝑙𝑙𝑡𝑡 , dengan menghitung rata-rata dari se-

luruh nilai 𝛃𝛃�∗𝑏𝑏 . Dengan begitu, dugaan parameter regresi bootstrap

untuk alat medis A, B, dan C secara berturut-turut adalah

𝛃𝛃�𝑏𝑏𝑙𝑙𝑙𝑙𝑡𝑡 𝐴𝐴 = �26,7922−0,0035�

𝛃𝛃�𝑏𝑏𝑙𝑙𝑙𝑙𝑡𝑡 𝐵𝐵 = �13,80760,00267�

𝛃𝛃�𝑏𝑏𝑙𝑙𝑙𝑙𝑡𝑡 𝐶𝐶 = �27,61130,0074 �

Dari ketiga nilai 𝛃𝛃�∗ tersebut, kita dapat membentuk model regresi

bootstrap dengan formula


sehingga model regresi bootstrap yang terbentuk adalah

𝐘𝐘�𝐀𝐀 = 𝐗𝐗𝐀𝐀𝛃𝛃�𝑏𝑏𝑙𝑙𝑙𝑙𝑡𝑡 𝐀𝐀 atau 𝑦𝑦�𝑖𝑖𝐴𝐴 = 26,7922 − 0,0035𝑥𝑥𝑖𝑖𝐴𝐴

𝐘𝐘�𝐁𝐁 = 𝐗𝐗𝐁𝐁𝛃𝛃�𝑏𝑏𝑙𝑙𝑙𝑙𝑡𝑡 𝐁𝐁 atau 𝑦𝑦�𝑖𝑖𝐵𝐵 = 13,8076 + 0,00267𝑥𝑥𝑖𝑖𝐵𝐵

𝐘𝐘�𝐂𝐂 = 𝐗𝐗𝐂𝐂𝛃𝛃�𝑏𝑏𝑙𝑙𝑙𝑙𝑡𝑡 𝐂𝐂 atau 𝑦𝑦�𝑖𝑖𝐶𝐶 = 27,6113 + 0,0074𝑥𝑥𝑖𝑖𝐶𝐶

Sebagai perbandingan, model regresi yang terbentuk dari sampel

asli tanpa sampel bootstrap dan diolah dengan OLS adalah sebagai be-

rikut


78

𝐘𝐘�𝐀𝐀 = 𝐗𝐗𝐀𝐀𝛃𝛃�𝐀𝐀 atau 𝑦𝑦�𝑖𝑖𝐴𝐴 = 33,3601 − 0,00683𝑥𝑥𝑖𝑖𝐴𝐴

𝐘𝐘�𝐁𝐁 = 𝐗𝐗𝐁𝐁𝛃𝛃�𝐁𝐁 atau 𝑦𝑦�𝑖𝑖𝐵𝐵 = 35,2061 − 0,00563𝑥𝑥𝑖𝑖𝐵𝐵

𝐘𝐘�𝐂𝐂 = 𝐗𝐗𝐂𝐂𝛃𝛃�𝐂𝐂 atau 𝑦𝑦�𝑖𝑖𝐶𝐶 = 37,1937 − 0,0745𝑥𝑥𝑖𝑖𝐶𝐶

Contoh di atas hanyalah sebagai gambaran bagaimana prosedur

regresi bootstrap, hasilnya dianggap kurang memadai untuk dikatakan

sebagai penduga 𝛃𝛃� karena nilai 𝑏𝑏 yang kecil. Kekurangan dari resam-

pling bootstrap untuk regresor yang tetap adalah keimplisitasan prose-

durnya mengasumsikan bahwa bentuk fungsional dari model regresi

yang cocok dengan data adalah benar dan erornya berdistribusi secara

identik. Bila andaikan nilai eror sebenarnya variansinya tidak konstan,

maka akan berimbas pada pencilan pada resamplingnya.

Bila terdapat pencilan dalam sampel dan himpunan data yang ke-

cil, metode bootstrap dalam pendekatannya untuk regresi, bisa dikata-

kan distribusi dari �̂�𝛽 tidak begitu baik digunakan untuk mendekati dis-

tribusi dari 𝛽𝛽. Selain itu, metode bootstrap sangat berdasarkan pada

asumsi keindependenan datanya, sehingga tidak dianjurkan untuk data

yang berstruktur dependen seperti model runtun waktu.

Kelebihannya dibandingkan dengan metode kuadrat terkecil ada-

lah performanya yang praktis sering kali lebih disukai tetapi hal ini ti-

dak menjamin kepastian akan hasilnya karena metode bootstrap selalu

menghasilkan hasil pendekatan berbeda-beda setiap kali simulasinya

dilakukan. Namun diyakini bahwa pendekatannya akan mendekati pa-

rameter tujuan dengan membesarnya nilai 𝑏𝑏. Metode bootstrap dalam


79

regresi juga membutuhkan ukuran sampel yang lebih kecil dibanding-

kan dengan metode kuadrat terkecil.

Dari kedua metode bootstrap dalam regresi linear, pemilihan me-

tode mana yang lebih baik, apakah meresampling observasi atau resi-

dualnya bergantung pada seberapa besar kita mempercayai model re-

gresi 𝐘𝐘 = 𝐗𝐗𝛃𝛃 + 𝛆𝛆. Menurut Chernick (2008), seperti yang ditulis ber-

dasarkan pernyataan Efron dan Tibshirani (1986), kedua pendekatan

parameter regresi ini ekivalen secara asimptotikal, tetapi dapat berbeda

ketika ukuran sampelnya kecil. Kemudian, berdasarkan Chernick

(2008), resampling observasi pasangan terurut pada regresi bootstrap

memiliki keuntungan tersendiri bila dibandingkan dengan resampling

galat pada regresi. Metode ini memberikan pendekatan variabilitas

yang lebih baik pada parameter-parameter regresi ketika modelnya ti-

dak baik. Penggunaan metode ini lebih disarankan ketimbang resam-

pling galat ketika (1) terdeteksi adanya heteroskedastisitas pada va-

riansi galat, (2) ada struktur korelasi pada galat, atau (3) dicurigai

adanya kemungkinan parameter penting yang hilang dalam model.

2. Pembentukan Selang Kepercayaan Bootstrap Untuk Parameter Re-

gresi

Berdasarkan teori dasar estimasi parameter populasi dengan meng-

gunakan selang kepercayaan, selang kepercayaan (1 − 𝛼𝛼)100% secara

umum berbentuk


80

𝑃𝑃[𝑙𝑙(𝑥𝑥1, … , 𝑥𝑥𝑛𝑛) < 𝜃𝜃 < 𝑢𝑢(𝑥𝑥1, … , 𝑥𝑥𝑛𝑛)] = 1 − 𝛼𝛼

di mana 𝑙𝑙(𝑥𝑥1, 𝑥𝑥2, … , 𝑥𝑥𝑛𝑛) dan 𝑢𝑢(𝑥𝑥1, 𝑥𝑥2, … , 𝑥𝑥𝑛𝑛) adalah suatu statistik ter-

tentu dari parameter populasi yang dituju.. Maka, selang kepercayaan

dengan pendekatan normal tersebut berbentuk

�̂�𝛽𝑖𝑖 − 𝑡𝑡(𝑣𝑣,𝛼𝛼 2⁄ )𝑠𝑠�𝑐𝑐𝑖𝑖𝑖𝑖 < 𝛽𝛽𝑖𝑖 < �̂�𝛽𝑖𝑖 + 𝑡𝑡(𝑣𝑣,𝛼𝛼 2⁄ )𝑠𝑠�𝑐𝑐𝑖𝑖𝑖𝑖

Statistik yang digunakan adalah 𝑡𝑡(𝑣𝑣,𝛼𝛼 2⁄ ) dengan derajat bebas

𝑣𝑣 = 𝑛𝑛 − 𝑢𝑢, di mana 𝑛𝑛 adalah ukuran sampel dan 𝑢𝑢 = 𝑘𝑘 + 1 ditentukan da-

ri banyaknya parameter. Distribusi Student-t digunakan untuk ukuran

sampel asli yang kurang dari 30, apabila 𝑛𝑛 ≥ 30, maka yang digunakan

adalah nilai 𝑧𝑧 (angka distribusi normal).

Selain dengan menggunakan pendekatan normal, terdapat juga se-

lang kepercayaan parameter regresi persentil bootstrap. Selang ini berben-

tuk

�̂�𝛽𝑗𝑗∗𝑏𝑏𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙

< 𝛽𝛽𝑗𝑗 < �̂�𝛽𝑗𝑗∗𝑏𝑏𝑢𝑢𝑢𝑢𝑢𝑢𝑙𝑙𝑙𝑙

di mana 𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙 = 𝑏𝑏𝛼𝛼 2⁄ dan 𝑢𝑢𝑢𝑢𝑢𝑢𝑙𝑙𝑙𝑙 = 𝑏𝑏(1 − 𝛼𝛼 2⁄ ). Selang ini dibentuk

dengan menggunakan metode persentil bootstrap seperti pada subbab A,

dengan 𝛽𝛽𝑗𝑗 sebagai parameter populasi dan �̂�𝛽𝑗𝑗∗𝑏𝑏

sebagai parameter pendu-

ga. Meskipun sebelumnya telah dikatakan bahwa penduga bootstrap tidak

bias, terkadang ketidakbiasannya hanyalah dalam jumlah yang kecil, untuk

itu, dapat ditentukan berapa besarnya bias dari penduga bootstrap tersebut.

𝑏𝑏𝑖𝑖𝑠𝑠𝑠𝑠𝑏𝑏𝑙𝑙𝑙𝑙𝑡𝑡 = �̂�𝛽𝑏𝑏𝑙𝑙𝑙𝑙𝑡𝑡 − �̂�𝛽


81

Untuk menentukan keakuratan dari parameter regresi bootstrap, di-

tentukanlah galat standar dari parameter regresi bootstrap. Secara umum

variansi untuk parameter regresi bootstrap menurut Efron (1993) adalah

𝑉𝑉𝑠𝑠𝑙𝑙��̂�𝛽𝑏𝑏𝑙𝑙𝑙𝑙𝑡𝑡 � = (𝐗𝐗′𝐗𝐗)−1𝐗𝐗′𝑉𝑉𝑠𝑠𝑙𝑙(𝐘𝐘∗)𝐗𝐗(𝐗𝐗′𝐗𝐗)−1

= 𝑠𝑠𝟐𝟐(𝐗𝐗′𝐗𝐗)−1

untuk 𝑉𝑉𝑠𝑠𝑙𝑙(𝐘𝐘∗) = 𝑠𝑠𝟐𝟐𝐈𝐈, dan 𝐈𝐈 adalah matriks identitas. Maka dari itu,

𝑆𝑆𝐸𝐸 ��̂�𝛽𝑏𝑏𝑙𝑙𝑙𝑙𝑡𝑡 𝑗𝑗 � = 𝑠𝑠�𝑐𝑐𝑖𝑖𝑖𝑖

dengan 𝑖𝑖 = 0,1,2, … ,𝑘𝑘 di mana 𝑐𝑐𝑖𝑖𝑖𝑖 adalah elemen dari baris ke-𝑖𝑖 dan ko-

lom ke-𝑖𝑖 dari matriks (𝐗𝐗′𝐗𝐗)−1, atau dengan kata lain, pendekatan galat

standar bootstrap 𝑆𝑆𝐸𝐸 ��̂�𝛽𝑏𝑏𝑙𝑙𝑙𝑙𝑡𝑡 𝑗𝑗 � serupa dengan pendekatan galat standar se-

cara teoritis biasa.

Untuk Contoh 4.1, dapat dibangun selang kepercayaan parameter re-

gresinya, baik dengan pendekatan normal, maupun dengan metode persen-

til bootstrap. Dengan menggunakan sintaks program MATLAB, yaitu

Program 4.2, secara cepat dapat diperoleh selang kepercayaan parameter

regresinya. Pada program dengan sampel asli sebagai input, diberikan

model regresi dengan menggunakan konstanta (kolom pertama berisi nilai

𝑥𝑥𝑖𝑖1 = 0, 𝑖𝑖 = 1,2, … ,𝑛𝑛). Sebagai contoh, bila diinginkan selang keper-

cayaan untuk 𝛽𝛽0 (dalam contoh ini terdapat 2 buah parameter, yaitu 𝛽𝛽0 dan

𝛽𝛽1) dengan membentuk 100 buah sampel bootstrap, variabel independen

diasumsikan acak, dan dengan tingkat signifikansi sebesar 5%, selang ke-

percayaan 95% untuk 𝛽𝛽0 dan 𝛽𝛽1 bagi alat medis keluaran pabrik A adalah


82

�̂�𝛽0∗𝑏𝑏𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙 < 𝛽𝛽0 < �̂�𝛽0

∗𝑏𝑏𝑢𝑢𝑢𝑢𝑢𝑢𝑙𝑙𝑙𝑙

30,46559 < 𝛽𝛽0 < 35,01045



−0,08490 < 𝛽𝛽1 < −0,05528

dengan menggunakan metode persentil bootstrap, di mana �̂�𝛽0,1∗𝑏𝑏𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙 =

�̂�𝛽0,1∗3

dan �̂�𝛽0,1∗𝑏𝑏𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙 = �̂�𝛽0,1

∗98. Sedangkan dengan menggunakan pende-

katan normal, dengan diperoleh selang kepercayaan 95% sebagai berikut

�̂�𝛽0 − 𝑡𝑡(7;0,025)𝑠𝑠�𝑐𝑐00 < 𝛽𝛽0 < �̂�𝛽0 + 𝑡𝑡(7;0,025)𝑠𝑠�𝑐𝑐00

33,36006 − 2,3646(1.583�0,606) < 𝛽𝛽0

< 33,36006 + 2,3646(1.583�0,606)

30,44614 < 𝛽𝛽0 < 36,27397

�̂�𝛽1 − 𝑡𝑡(7;0,025)𝑠𝑠�𝑐𝑐11 < 𝛽𝛽1 < �̂�𝛽1 + 𝑡𝑡(7;0,025)𝑠𝑠�𝑐𝑐11

−0,0683 − 2,3646 �1.583�2,183 × 10−5� < 𝛽𝛽1

< −0,0683 + 2,3646(1,583�2,183 × 10−5))

−0,08579 < 𝛽𝛽1 < −0,05081

Bila dibandingkan, antara selang kepercayaan yang dibentuk dengan

metode persentil dengan pendekatan normal, metode persentil menghasil-

kan selang kepercayaan yang lebih sempit dibandingkan dengan pendeka-

tan normal. Selain itu, dengan 100 buah sampel bootstrap, nilai pendeka-


83

tan �̂�𝛽𝑏𝑏𝑙𝑙𝑙𝑙𝑡𝑡 untuk �̂�𝛽0 dan �̂�𝛽1 secara berturut-turut adalah 33,44471 dan -

0,07013 sangat mendekati nilai �̂�𝛽0 dan �̂�𝛽1, yaitu 33,36006 dan -0,0683.

Apabila variabel independennya dianggap tetap (fixed) seperti pada

Contoh 4.2, dengan Program 4.4 pada lampiran, maka selang kepercayaan

95% untuk 𝛽𝛽0 dengan metode persentil bootstrap yaitu



31,38263 < 𝛽𝛽0 < 34,9939



−0,07986 < 𝛽𝛽1 < −0,05601

di mana �̂�𝛽0,1∗𝑏𝑏𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙 = �̂�𝛽0,1

∗3 dan �̂�𝛽0,1

∗𝑏𝑏𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙 = �̂�𝛽0,1

∗98. Apabila diban-

dingkan dengan selang kepercayaan normal yang sebelumnya, selang per-

sentil bootstrap dengan variabel independen yang dianggap tetap tetap

menghasilkan selang yang lebih sempit tetapi mendekati selang dengan

pendekatan normal tersebut.

Dari hasil simulasi tersebut, selang dengan lebar yang lebih sempit

dihasilkan oleh metode persentil bootstrap. Tetapi apabila dibandingkan

dari metode penarikan sampelnya, metode persentil untuk variabel inde-

penden yang dianggap tetap menghasilkan selang kepercayaan yang lebih

sempit lebarnya dibandingkan dengan meresampling pasangan terurut

sampelnya (variabel independen dianggap acak).


84

Untuk mendapatkan perbandingan yang lebih luas jangkauannya,

Tabel 4.36 dan Tabel 4.37 secara berturut-turut memperlihatkan perban-

dingan selang kepercayaan serta pendekatan 𝛃𝛃� dengan metode resampling

observasi dan resampling galat. Program yang digunakan adalah Program

4.3 dan 4.5 di mana kolom konstanta pada matriks variabel independen di-

hilangkan. Selain itu, pada program ini, variabel independennya dibang-

kitkan secara random dengan distribusi multivariat normal. Vektor

𝛍𝛍 = [65 90] diambil sebagai rata-rata, sedangkan 𝐜𝐜𝐜𝐜𝐜𝐜 = �20 22 19,3� dipi-

lih sebagai matriks kovariansi untuk membangkitkan sampel random mul-

tivariat untuk variabel independennya. Nilai-nilai pada kedua tabel terse-

but diperoleh dengan program yang tidak menggunakan kolom konstanta

pada matriks variabel independennya. Selain itu, pada program ini di-

asumsikan bahwa kita telah mengetahui nilai 𝛽𝛽𝑖𝑖 , agar kita dapat mengeta-

hui secara pasti bahwa selang persentil bootstrap memuat parameter popu-

lasinya, seperti pada tabel-tabel perbandingan di subbab pertama. Dalam

tabel-tabel tersebut dipilih 𝛽𝛽1 = 5 dan 𝛽𝛽2 = −2. Dengan begitu dari sam-

pel random, nilai-nilai variabel dependennya dibangkitkan dengan persa-

maan 𝑦𝑦𝑖𝑖 = 5𝑥𝑥1 − 2𝑥𝑥2 + 𝜀𝜀𝑖𝑖 , di mana 𝜀𝜀𝑖𝑖 dibangkitkan dengan menggunakan

bilangan random yang berdistribusi normal dengan 𝐸𝐸(𝛆𝛆) = 0 dan

𝑉𝑉𝑠𝑠𝑙𝑙(𝛆𝛆) = 𝜎𝜎2. Variansi dari galat tersebut diambil sebesar 1,92.

Bila dilihat perbandingan pada Tabel 4.36, yaitu resampling observa-

si data, nilai pendekatan �̂�𝛽𝑏𝑏𝑙𝑙𝑙𝑙𝑡𝑡 𝑖𝑖 cukup mendekati �̂�𝛽𝑖𝑖 dengan bias yang

mengecil seiring membesarnya 𝑏𝑏. Selang persentil bootstrap juga lebih


85

sempit daripada selang normal standard dan juga memuat nilai 𝛽𝛽𝑖𝑖 . Begitu

pula dengan nilai-nilai pada Tabel 4.37, pendekatan �̂�𝛽𝑏𝑏𝑙𝑙𝑙𝑙𝑡𝑡 𝑖𝑖 juga mendekati

�̂�𝛽𝑖𝑖 dengan bias kecil.

Dengan adanya kedua metode yang menghasilkan hasil yang terbi-

lang hampir sama, muncul pertanyaan metode mana yang lebih baik digu-

nakan atau kapan harus digunakan. Mooney dan Duval (1993) menyata-

kan bahwa dalam pemilihan resampling observasi atau galat, harus diper-

hitungkan komponen stokastik dari model. Secara teoritis resampling ga-

lat lebih dapat dinyatakan kebenarannya, maka dari itu banyak statistika-

wan teoritis menyarankan metode resampling galat ini. Tetapi ketika da-

lam eksperimen nyata, variabel independen dapat dinyatakan tetap (ini

adalah indikasi untuk menggunakan resampling galat), kebanyakan peneli-

ti sosial tidak berkutat dengan data eksperimental, melainkan penelitian

survey di mana nilai-nilai variabel independennya sama acaknya seperti

variabel dependennya. Alasan yang lain adalah resampling observasi di-

anggap kurang sensitif terhadap asumsi dibandingkan dengan resampling

galat (Efron & Tibshirani, 1993).

Givens dan Hoeting (2005) juga menekankan bahwa dalam pemili-

han metode resampling galat sangat bergantung pada seberapa besar mo-

del terpilih dapat cocok pada nilai observasi dan pada asumsi bahwa galat-

nya memiliki variansi konstan ataupun asumsi regresi lainnya. Tanpa ke-

percayaan terhadap hal-hal itu, lebih disarankan untuk meresampling ob-

servasinya. Meskipun begitu, resampling observasi dianggap kurang peka


86

terhadap pelanggaran-pelanggaran terhadap asumsi, di mana resampling

ini lebih berupa cerminan dari mekanisme pembangkit data asli.


BAB V

PENUTUP

A. Kesimpulan

Metode bootstrap adalah metode resampling yang sederhana dan sangat

mudah untuk diterapkan di berbagai bidang dalam dunia statistika. Prinsip dari

metode ini adalah pemberlakuan sampel asli sebagai populasi lalu meresampel

berulang kali hingga distribusi resampel dapat digunakan untuk

menggambarkan distribusi sampel asli, sehingga dapat memberikan penjelasan

lebih lanjut tentang distribusi populasi.

Selang kepercayaan parameter populasi dapat dibentuk dengan

sederhana dengan menggunakan metode persentil bootstrap. Data persentil ke-

(𝛼𝛼 2⁄ )100 dan ke-(1 − (𝛼𝛼 2⁄ ))100 digunakan sebagai batas bawah dan atas

selang kepercayaan (1 − 𝛼𝛼)100% untuk suatu parameter populasi. Metode ini

menghasilkan selang kepercayaan yang mendekati selang kepercayaan

normal, tetapi memiliki jarak yang lebih sempit dibandingkan selang

kepercayaan normal secara teoritis tersebut.

Pada pendugaan koefisien regresi dengan dua metode regresi bootstrap

yang berbeda, dihasilkan nilai-nilai penduga yang mendekati penduga dengan

metode OLS. Penduga koefisien regresi bootstrap tersebut juga memiliki bias

yang kecil terhadap penduga dengan metode OLS. Sedangkan untuk

pembentukan selang kepercayaan koefisien regresi bootstrap, kedua metode


88

tersebut sama-sama membentuk selang kepercayaan yang lebih sempit, bila

dibandingkan dengan selang kepercayaan normal.

B. Saran

Aplikasi metode bootstrap pada selang parameter populasi dalam skripsi

ini adalah selang parameter rata-rata populasi dan koefisien regresi linear

berganda dengan metode persentil bootstrap. Skripsi ini akan lebih baik bila

dikembangkan dengan pembahasan metode pembentukan selang parameter

populasi yang lain seperti metode Bias Corrected Bootstrap atau Studenized

Bootstrap.

Selain itu dapat juga dikembangkan dengan membahas aplikasi metode

bootstrap pada bidang lain di statistika seperti uji hipotesis bootstrap atau

Bayesian Bootstrap.


89

DAFTAR PUSTAKA

Bain, L. J. & Engelhardt, M. (1992). Introduction to Probability and Mathematical Statistics. Belmont, CA: Brooks/Cole.

Chernick, M. R. (2008). Bootstrap Methods, A practitioner's guide. Hoboken, NJ: John Wiley & Sons, Inc.

Chernick, M. R. & Friis, R. H. (2003). Introductory Biostatistics for the Health Sciences (Modern Applications Including Bootstrap). Hoboken, NJ: John Wiley & Sons, Inc.

Efron, B. & Tibshirani, R. (1993). An Introduction to the Bootstrap. New York: Chapman & Hall.

Efron, B. (1994). The Jackknife, the Bootstrap and Other Resampling Plans. Montoelier, Vermont: Capital City Press.

Givens, G. H. & Hoeting, J. A. (2005). Computational Statistics. Hoboken, NJ: John Wiley & Sons, Inc.

Johnson, R. A. (2005). Probability and Statistics for Engineers. Upper Saddle River, NJ: Pearson Prentice Hall.

Johnson, R. W. (2001). An Introduction to the Bootstrap. Journal of the Royal Statistical Society Series D (The Statistician) 23(2): 49-54.

Kapur, J. N. & Saxena, H. C. (2001). Mathematical Statistics. New Delhi: S. Chand & Company LTD.

Korn, R., Korn, E., & Kroisandt, G. (2010). Monte Carlo Methods and Models in Finance. Boca Raton: CRC Press.

Kvam, P. H. & Vidakovic, B. (2007). Nonparametric Statistics with Application to Science and Engineering. Hoboken, NJ: John Wiley & Sons, Inc.

Mendenhall, W., Scheaffer, R. L., & Wackerly, D. D. (1986). Mathematical Statistics With application (Third Edition). Boston: PWS Publisher.

Mooney, C Z & Duval, R D. (1993). Bootstrap: A Nonparametric Approach to Statistical Inference. Newbury Park, CA: Sage Publications.

Moore, D., McCabe, G. P., & Craig, B. A. (2009). Introduction to the Practice of Statistics. New York: W. H. Freeman and Company.


90

Kotz, S. (2006). Encyclopedia of Statistical Sciences (Second Edition). Hoboken, NJ: John Wiley & Sons, Inc.

Sembiring, R. K. (2003). Analisis Regresi. Bandung: Penerbit ITB.


91

LAMPIRAN

TABEL-TABEL PADA BAB III

Tabel 3.1. Sampel Acak Tinggi Bangunan di Suatu Kota di Amerika Serikat

485 511 841 725 615 520 535 635 616 582

Sumber: Pittsburgh Tribune Review, 27 January 1997

Tabel 3.2. Daftar Bilangan Random 1 2 3 4 5 6 7 8 9 10 1 0,5345 0,1946 0,9446 0,0655 0,3982 0,7809 0,7813 0,4606 0,8983 0,4576 2 0,9904 0,734 0,0878 0,3608 0,3561 0,5648 0,4534 0,7775 0,7668 0,7592 3 0,7173 0,1749 0,2795 0,2581 0,6466 0,0233 0,2971 0,8168 0,9469 0,9388 4 0,9801 0,1051 0,5962 0,4326 0,7331 0,0076 0,3584 0,6314 0,5357 0,8107 5 0,0537 0,3141 0,8284 0,3061 0,7317 0,989 0,4824 0,3649 0,9598 0,9304 6 0,6369 0,3488 0,7822 0,9666 0,9582 0,2016 0,4312 0,8875 0,9782 0,447 7 0,9604 0,399 0,5572 0,1299 0,046 0,8233 0,6988 0,2509 0,5221 0,8339 8 0,2699 0,2839 0,0363 0,2174 0,4244 0,361 0,6751 0,0661 0,8454 0,9878 9 0,9494 0,3139 0,6694 0,8934 0,009 0,4613 0,0069 0,7272 0,898 0,3696

10 0,9022 0,7183 0,849 0,6217 0,7038 0,11 0,079 0,7668 0,9312 0,1708

Tabel 3.3. Tabel Aturan Konversi Bilangan Random

No. Nilai bilangan random

dalam Tabel 3.2.2. Nomor sampel yang

dipilih 1 [0.0, 0.1) 1 2 [0.1, 0.2) 2 3 [0.2, 0.3) 3 4 [0.3, 0.4) 4 5 [0.4, 0.5) 5 6 [0.5, 0.6) 6 7 [0.6, 0.7) 7 8 [0.7, 0.8) 8 9 [0.8, 0.9) 9

10 [0.9, 1.0) 10


92

Tabel 3.4. Hasil Konversi Bilangan Random Ke Dalam Indeks Nomor Sampel 1 2 3 4 5 6 7 8 9 10

1 6 2 10 1 4 8 8 5 9 5 2 10 8 1 4 4 6 5 8 8 8 3 8 2 3 3 7 1 3 9 10 10 4 10 2 6 5 8 1 4 7 6 9 5 1 4 9 4 8 10 5 4 10 10 6 7 4 8 10 10 3 5 9 10 5 7 10 4 6 2 1 9 7 3 6 9 8 3 3 1 3 5 4 7 1 9 10 9 10 4 7 9 1 5 1 8 9 4

10 10 8 9 7 8 2 1 8 10 2

Tabel 3.5. Daftar 10 Sampel Bootstrap Berdasarkan Tabel 3.4 Beserta Meannya 1 2 3 4 5 6 7 8 9 10

1 635 520 582 485 535 616 616 841 615 841 2 582 616 485 535 535 635 841 616 616 616 3 616 520 511 511 725 485 511 615 582 582 4 582 520 635 841 616 485 535 725 635 615 5 485 535 615 535 616 582 841 535 582 582 6 725 535 616 582 582 511 841 615 582 841 7 582 535 635 520 485 615 725 511 635 615 8 511 511 485 511 841 535 725 485 615 582 9 582 535 725 615 485 841 485 616 615 535

10 582 616 615 725 616 520 485 616 582 520 Mean

Bootstrap Sampel 588,2 544,3 590,4 586 603,6 582,5 660,5 617,5 605,9 632,9


93

Tabel 3.6. Perbandingan Mean Asli dengan Mean Bootstrap

B Mean asli

Standar eror sampel asli

Mean boot

Standar eror

sampel bootstrap

Selisih mean

Selisih standar

eror

5 606,5 34,494 610,7 47,172 4,2 12,678 10 606,5 34,494 592,76 16,3397 13,74 18,1543 20 606,5 34,494 615,34 29,0079 8,84 5,4861 50 606,5 34,494 611,302 29,3235 4,802 5,1705

100 606,5 34,494 607,644 32,173 1,144 2,321 200 606,5 34,494 608,729 32,1191 2,2285 2,3749 500 606,5 34,494 605,594 32,5847 0,906 1,9093

1000 606,5 34,494 606,147 32,5664 0,3531 1,9276


94

TABEL-TABEL PADA BAB IV

TABEL 4.1. Data Banyaknya Darah yang Hilang dari Tubuh Babi (ml) Nomor Indeks Babi Perlakuan

1 543 2 666 3 455 4 823 5 1.716 6 797 7 2.828 8 1.251 9 702 10 1.078

rata-rata = 1.085,9

standar deviasi sampel = 717,12 Sumber: Tabel 8.2 pada Chernick (2003)

TABEL 4.2. Angka Acak Seragam Sampel Boostrap 1 0,00858 0,04352 0,17833 0,41105 0,46569 0,90109 0,14713 0,15905 0,84555 0,92326 2 0,69158 0,38683 0,41374 0,17028 0,09304 0,10834 0,61546 0,33503 0,84277 0,44800 3 0,00439 0,81846 0,45446 0,93971 0,84217 0,74968 0,62758 0,49813 0,13666 0,12981 4 0,29676 0,37909 0,95673 0,66757 0,72420 0,40567 0,81119 0,87494 0,85471 0,81520 5 0,69386 0,71708 0,88608 0,67251 0,22512 0,00169 0,58624 0,04059 0,05557 0,73345 6 0,68381 0,61725 0,49122 0,75836 0,15368 0,52551 0,54604 0,61136 0,51996 0,19921 7 0,19618 0,87653 0,18682 0,22917 0,56801 0,81679 0,93285 0,68284 0,11203 0,47990 8 0,16264 0,39564 0,37378 0,61382 0,51274 0,89407 0,11283 0,77207 0,90547 0,50981 9 0,40431 0,28106 0,28655 0,84536 0,71208 0,47599 0,36136 0,46412 0,99748 0,76167

10 0,69481 0,57748 0,93003 0,99900 0,25413 0,64661 0,17132 0,53464 0,52705 0,69602 11 0,80142 0,64567 0,38915 0,40716 0,76797 0,37083 0,53872 0,30022 0,43767 0,60257 12 0,25769 0,28265 0,26135 0,52688 0,11867 0,05398 0,43797 0,45228 0,28086 0,84568 13 0,61763 0,77188 0,54997 0,28352 0,57192 0,22751 0,82470 0,92971 0,29091 0,35441 14 0,54302 0,81734 0,15723 0,10921 0,20123 0,02787 0,97407 0,02481 0,69785 0,58025 15 0,80089 0,48271 0,45519 0,64328 0,48167 0,14794 0,07440 0,53407 0,32341 0,30360 16 0,60138 0,40435 0,75526 0,35949 0,84558 0,13211 0,29579 0,30048 0,47671 0,44720 17 0,56644 0,52133 0,55069 0,57102 0,67821 0,54934 0,66318 0,35153 0,36755 0,88011 18 0,97091 0,42397 0,08406 0,04213 0,52727 0,08328 0,24057 0,78695 0,91207 0,18451 19 0,71447 0,27337 0,62158 0,25679 0,63325 0,98669 0,16926 0,28929 0,06692 0,05049 20 0,18849 0,96248 0,46509 0,56863 0,27018 0,64818 0,40938 0,66102 0,65833 0,39169 Sumber: Tabel 8.3 pada Chernick (2003)


95


No, Nilai bilangan random

dalam Tabel 4.2. Nomor sampel yang dipilih 1 [0,0; 0,1) 1 2 [0,1; 0,2) 2 3 [0,2; 0,3) 3 4 [0,3; 0,4) 4 5 [0,4; 0,5) 5 6 [0,5; 0,6) 6 7 [0,6; 0,7) 7 8 [0,7; 0,8) 8 9 [0,8; 0,9) 9 10 [0,9; 1,0) 10

Tabel 4.4. Konversi Indeks Sampel Yang Dipilih 1 1 1 2 5 5 10 2 2 9 10 2 7 4 5 2 1 2 7 4 9 5 3 1 9 5 10 9 8 7 5 2 2 4 3 4 10 7 8 5 9 9 9 9 5 7 8 9 7 3 1 6 1 1 8 6 7 7 5 8 2 6 6 7 6 2 7 2 9 2 3 6 9 10 7 2 5 8 2 4 4 7 6 9 2 8 10 6 9 5 3 3 9 8 5 4 5 10 8

10 7 6 10 10 3 7 2 6 6 7 11 9 7 4 5 8 4 6 4 5 7 12 3 3 3 6 2 1 5 5 3 9 13 7 8 6 3 6 3 9 10 3 4 14 6 9 2 2 3 1 10 1 7 6 15 9 5 5 7 5 2 1 6 4 4 16 7 5 8 4 9 2 3 4 5 5 17 6 6 6 6 7 6 7 4 4 9 18 10 5 1 1 6 1 3 8 10 2 19 8 3 7 3 7 10 2 3 1 1 20 2 10 5 6 3 7 5 7 7 4

Sumber: Tabel 8.4 pada Chernick (2003)


96

Tabel 4.5. Data Sampel Bootstrap Besarnya Kehilangan Darah Berdasarkan Tabel 3

1 2 3 4 5 6 7 8 9 10

Rata-Rata

Sampel Bootstrap

1 543 543 666 1,716 1,716 1,078 666 666 702 1,078 937,4 2 2,828 823 1,716 666 543 666 2,828 823 702 1,716 1.331,1 3 543 702 1,716 1,078 702 1,251 2,828 1,716 666 666 1.186,8 4 455 823 1,078 2,828 1,251 1,716 702 702 702 702 1.095,9 5 2,828 1,251 702 2,828 455 543 797 543 543 1,251 1.174,1 6 2,828 2,828 1,716 1,251 666 797 797 2,828 797 666 1.517,4 7 666 702 666 455 797 702 1,078 2,828 666 1,716 1.027,6 8 666 823 823 2,828 797 702 666 1,251 1,078 797 1.043,1 9 1,716 455 455 702 1,251 1,716 823 1,716 1,078 1,251 1.116,3

10 2,828 797 1,078 1,078 455 2,828 666 797 797 2,828 1.415,2 11 702 2,828 823 1,716 1,251 823 797 823 1,716 2,828 1.430,7 12 455 455 455 797 666 543 1,716 1,716 455 702 796,0 13 2,828 1,251 797 455 797 455 702 1,078 455 823 964,1 14 797 702 666 666 455 543 1,078 543 2,828 797 907,5 15 702 1,716 1,716 2,828 1,716 666 543 797 823 823 1.233,0 16 2,828 1,716 1,251 823 702 666 455 823 1,716 1,716 1.269,6 17 797 797 797 797 2,828 797 2,828 823 823 702 1.198,9 18 1,078 1,716 543 543 797 543 455 1,251 1,078 666 867,0 19 1,251 455 2,828 455 2,828 1,078 666 455 543 543 1.110,2 20 666 1,078 1,716 797 455 2,828 1,716 2,828 2,828 823 1.573,5 Rata-rata dari keduapuluh sampel bootstrap 1.159,8 Sumber: Tabel 8.5 pada Chernick (2003)


97

Tabel 4.6. Estimasi Bootstrap dari Banyaknya Darah yang Hilang dari yang Terkecil

Urutan ke- Rata-rata Boostrap 1 796 2 867 3 907,5 4 937,4 5 964,1 6 1027,6 7 1043,1 8 1095,9 9 1110,2 10 1116,3 11 1174,1 12 1186,8 13 1198,9 14 1233 15 1269,6 16 1331,1 17 1415,2 18 1430,7 19 1517,4 20 1573,5


98

Tabel 4.7. Perbandingan Selang Kepercayaan Rata-Rata Populasi Berdistribusi Normal

SK Normal SK Percentil Mean Sampel

Asli

Mean Bootstrap

Variansi Asli

Variansi Bootstrap

SE Sampel

Asli

SE Bootstrap Bias

𝑛𝑛 𝑏𝑏 batas bawah

batas atas

batas bawah

batas atas

10 10 18,98756 22,24458 19,47538 21,40263 20,61607 20,59128 5,18245 3,20501 0,71989 0,56613 -0,0248

20 18,83157 20,6224 19,50171 20,23337 19,72698 19,81587 1,56676 0,4755 0,39582 0,21806 0,08889

50 18,88821 20,77765 19,1841 20,63278 19,83293 19,7475 1,74406 1,33145 0,41762 0,36489 -0,0854

60 19,6423 21,99763 19,75752 21,7084 20,81997 20,80486 2,71018 2,38448 0,52059 0,48831 -0,0151

100 19,25496 22,36573 19,56081 22,19748 20,81035 20,91294 4,72749 4,99761 0,68757 0,70694 0,10259

200 18,64061 21,35034 18,72471 21,02883 19,99547 19,98359 3,58712 3,08254 0,59893 0,55521 -0,0119

500 17,97873 21,75584 18,38355 21,49568 19,86728 19,86556 6,96967 6,29959 0,83485 0,79370 -0,0017

700 18,01784 20,95377 18,2659 20,73437 19,4858 19,4843 4,211 3,67791 0,64892 0,60646 -0,0015

1.000 18,28046 21,2827 28,60319 21,03145 19,78158 19,81184 4,40336 4,04445 0,66358 0,63596 0,03026

1.500 18,18501 20,98677 18,54654 20,8138 19,58589 19,58079 3,83492 3,26163 0,61927 0,57111 -0,0051

2.000 17,96361 21,6065 18,33984 21,30314 19,78506 19,78258 6,48318 5,74384 0,80518 0,75788 -0,0025

3.000 18,23089 22,13397 18,50325 21,71165 20,18243 20,17199 7,44233 6,84029 0,86269 0,82706 -0,0104

5.000 19,24148 22,12203 19,50032 21,8482 20,68176 20,68998 4,05365 3,59815 0,63668 0,59985 0,00822

7.000 18,69232 21,16047 18,94632 20,93078 19,9264 19,9331 2,97603 2,63938 0,54553 0,51375 0,0067

10.000 18,83916 21,7102 19,03178 21,38056 20,27468 20,2638 4,021693 3,61804 0,63417 0,60150 -0,0109


99

Tabel 4.8. Perbandingan Selang Kepercayaan Rata-Rata Populasi Berdistribusi Eksponensial


Asli

Mean Bootstrap

Variansi Asli

Variansi Bootstrap

SE Sampel

Asli

SE Bootstrap Bias


batas atas

batas bawah

batas atas

10 10 15,56777 56,53501 14,48083 50,05206 36,05139 32,32486 819,91329 896,57962 9,05491 9,46879 3,72653

20 9,70712 25,96265 6,8957 21,7917 17,83489 16,62887 129,09126 126,99353 3,59293 3,56362 1,20602

50 8,75454 31,07987 12,08316 31,02249 19,9172 19,97729 243,49499 256,51169 4,93452 5,06470 -0,0601

60 9,73689 52,59952 16,38048 50,84708 31,16821 31,8789 897,53639 859,48604 9,47384 9,27085 -0,7107

100 5,30218 42,43288 12,5198 40,69801 23,86753 24,17752 673,53571 600,7698 8,20692 7,75093 -0,31

200 10,05469 41,17845 15,12739 39,88704 25,61657 25,93019 473,23676 405,54455 6,87922 6,36824 -0,3136

500 8,8796 25,75298 13,74721 26,63075 17,33629 19,98695 139,75099 104,0611 3,73833 3,22585 -2,6507

700 9,22862 29,42665 11,69938 27,65731 19,32763 19,44738 199,30234 167,3555 4,46433 4,09091 -0,1198

1.000 8,21544 28,41439 11,08974 27,26411 18,31492 18,2652 199,32051 170,51747 4,46453 4,12938 0,04972

1.500 12,9504 31,24202 15,55862 29,66179 22,09621 22,22579 163,45522 134,86418 4,04296 3,67239 -0,1296

2.000 1,16064 37,58346 7,91006 35,82594 19,37205 19,46174 648,09925 573,82451 8,05046 7,57512 -0,0897

3.000 4,68547 28,94151 8,59478 28,20023 16,81349 16,88031 287,43139 260,07694 5,36126 5,09977 -0,0668

5.000 0,69244 50,4282 10,5277 49,11418 25,56032 25,43293 1208,4596 1113,693 10,99300 10,55317 0,12739

7.000 7,68651 34,98058 11,174 33,37386 21,33355 21,42432 363,94122 329,98193 6,03275 5,74441 -0,0908

10.000 1,88995 25,14349 6,07282 24,11707 13,51672 13,41603 264,1634 233,0531 5,13968 4,82756 0,10069

50.000 7,45291 26,26794 9,9849 25,16009 19,14764 19,10594 301,9276 262,0557 5,4947939 5,1191376 0,0417

100.000 4,56688 33,88441 6,64778 30,21143 19,22565 19,34908 419,8874 380,5071 6,4798719 6,1685258 -0,1234


100

Tabel 4.9. Perbandingan Selang Kepercayaan Rata-Rata Populasi Berdistribusi Binomial


Asli

Mean Bootstrap

Variansi Asli

Variansi Bootstrap

SE Sampel

Asli

SE Bootstrap Bias


batas atas

batas bawah

batas atas

10 10 3,42213 5,77787 4,2 5,2 4,6 4,68 2,71111 1,28444 0,52068 0,35839 -0,08

20 4,31275 5,88725 4,5 5,9 5,1 5,08 1,21111 1,39579 0,34801 0,37360 0,02

50 3,93361 6,06639 4,2 5,6 5 4,964 2,22222 1,61943 0,47140 0,40242 0,036

60 3,63095 5,76905 3,8 5,3 4,7 4,53833 2,23333 2,29184 0,47258 0,47873 0,16167

100 4,08526 6,71474 4,4 6,5 5,4 5,565 3,37778 3,34015 0,58119 0,57794 -0,165

200 3,23095 5,36905 3,5 5 4,3 4,2655 2,23333 1,97346 0,47258 0,44424 0,0345

500 4,47054 6,12946 4,6 6 5,3 5,313 1,34444 1,13999 0,36667 0,33764 -0,013

700 4,49514 6,30486 4,7 6,2 5,4 5,41386 1,6 1,51582 0,40000 0,38934 -0,0139

1.000 2,53227 5,26773 2,8 5,2 3,9 3,8913 3,65556 3,39814 0,60461 0,58294 0,0087

1.500 3,42213 5,77787 3,5 5,5 4,6 4,59947 2,71111 2,49459 0,52068 0,49946 0,00053

2.000 3,8178 6,5822 4 6,3 5,2 5,21295 3,73333 3,39257 0,61101 0,58246 -0,013

3.000 3,5294 5,8706 3,7 5,7 4,7 4,72273 2,67778 2,36382 0,51747 0,48619 -0,0227

5.000 2,26699 5,53301 2,7 5,3 3,9 3,89246 5,21111 4,56536 0,72188 0,67567 0,00754

7.000 4,08712 7,51288 4,4 7,2 5,8 5,79549 5,73333 5,16688 0,75719 0,71881 0,00451

10.000 2,94727 5,45273 3,2 5,3 4,2 4,2046 3,06667 2,75837 0,55378 0,52520 -0,0046


101

Tabel 4.10. Perbandingan Selang Kepercayaan Rata-Rata Populasi Berdistribusi Poisson


Asli

Mean Bootstrap

Variansi Asli

Variansi Bootstrap

SE Sampel

Asli

SE Bootstrap Bias


batas atas

batas bawah

batas atas

10 10 17,05997 24,14003 19,2 23,1 20,6 20,99 24,28889 15,43222 1,55849 1,24226 -0,39

20 17,60438 23,99562 17,3 22,5 20,8 20,845 19,95556 19,52079 1,41264 1,39717 -0,045

50 17,48672 24,31328 18,3 23,9 20,9 21,062 22,76667 21,94649 1,50886 1,48143 -0,162

60 18,21439 25,58561 19 24,1 21,9 21,73833 26,54444 21,81048 1,62925 1,47684 0,16167

100 16,57105 23,22895 18,1 22,7 19,9 20,251 21,65556 16,77878 1,47158 1,29533 -0,351

200 17,47759 23,12241 18,1 22,4 20,3 20,316 15,56667 13,40346 1,24766 1,15773 -0,016

500 19,87759 25,52241 20,4 24,9 22,7 22,7494 15,56667 13,67555 1,24766 1,16943 -0,0494

700 16,36396 25,63604 17,3 24,5 21 21,006 42 36,62425 2,04939 1,91375 -0,006

1.000 18,27811 23,52189 18,8 23,2 20,9 20,8806 13,43333 12,30594 1,15902 1,10932 0,0194

1.500 16,82487 24,57513 17,3 23,8 20,7 20,71 29,34444 27,03702 1,71302 1,64429 -0,01

2.000 16,0267 25,3733 16,7 24,4 20,7 20,7125 42,67778 38,24306 2,06586 1,95558 -0,0125

3.000 18,98018 24,41982 19,7 24 21,7 21,7269 14,45556 12,84028 1,20231 1,13315 -0,0269

5.000 18,1013 21,6987 18,5 21,3 19,9 19,90664 6,32222 5,6881 0,79512 0,75419 -0,0066

7.000 19,90352 27,89648 20,7 27,2 23,9 23,93161 31,21111 28,15401 1,76667 1,67792 -0,0316

10.000 17,04952 22,75048 17,7 22,3 19,9 19,88328 15,87778 13,92498 1,26007 1,18004 0,01672


102

Tabel 4.11. Data sisa konsentrasi anti-inflamatori pada 27 alat setelah digunakan dalam suatu waktu tertentu

Pabrik Waktu Besarnya Konsentrasi Pabrik Waktu Besarnya

Konsentrasi Pabrik Waktu Besarnya Konsentrasi

A 99 25,8 B 376 16,3 C 119 28,8 A 152 20,5 B 385 11,6 C 188 22 A 293 14,3 B 402 11,8 C 115 29,7 A 155 23,2 B 29 32,5 C 88 28,9 A 196 20,6 B 76 32 C 58 32,8 A 53 31,1 B 296 18 C 49 32,5 A 184 20,9 B 151 24,1 C 150 25,4 A 171 20,9 B 177 26,5 C 107 31,7 A 52 30,4 B 209 25,8 C 125 28,5 Sumber: Efron (1993)


No. Nilai bilangan random

Nomor sampel yang dipilih 1 [0.0, 0.1111) 1 2 [0.1, 0.2222) 2 3 [0.2222, 0.3333) 3 4 [0.3333, 0.4444) 4 5 [0.4444, 0.5556) 5 6 [0.5556, 0.6667) 6 7 [0.6667, 0.7778) 7 8 [0.7778, 0.8889) 8 9 [0.8889, 1) 9

Tabel 4.13. Daftar Bilangan Random Untuk Pengambilan Sampel Bootstrap Pabrik A 0,31935 0,05156 0,05732 0,60277 0,18976 0,68976 0,36702 0,65359 0,16988 0,47719 0,25875 0,82341 0,46757 0,43677 0,3861 0,14974 0,39133 0,7095 0,76153 0,66111 0,01119 0,68148 0,22144 0,1348 0,1862 0,91869 0,94531 0,65445 0,58754 0,96938 0,31187 0,62865 0,39526 0,1063 0,77753 0,67963 0,66109 0,79658 0,55003 0,52765 0,15849 0,34511 0,43549 0,51243 0,5482


103

Tabel 4.14. Konversi Indeks Sampel Asli Untuk Sampel Bootstrap A

4 1 1 6 2 7 4 6 2 5 3 8 5 4 4 2 4 7 7 6 1 7 2 2 2 9 9 6 6 9 3 6 4 1 7 7 6 8 5 5 2 4 4 5 5

Tabel 4.15. Hasil Sampel Bootstrap A 𝐰𝐰∗1 𝐰𝐰∗2 𝐰𝐰∗3 𝐰𝐰∗4 𝐰𝐰∗5 𝐱𝐱∗1 𝐲𝐲∗1 𝐱𝐱∗2 𝐲𝐲∗2 𝐱𝐱∗3 𝐲𝐲∗3 𝐱𝐱∗4 𝐲𝐲∗4 𝐱𝐱∗5 𝐲𝐲∗5 1 155 23,2 99 25,8 99 25,8 53 31,1 152 20,5 2 184 20,9 155 23,2 53 31,1 152 20,5 196 20,6 3 293 14,3 171 20,9 196 20,6 155 23,2 155 23,2 4 152 20,5 155 23,2 184 20,9 184 20,9 53 31,1 5 99 25,8 184 20,9 152 20,5 152 20,5 152 20,5 6 52 30,4 52 30,4 53 31,1 53 31,1 52 30,4 7 293 14,3 53 31,1 155 23,2 99 25,8 184 20,9 8 184 20,9 53 31,1 171 20,9 196 20,6 196 20,6 9 152 20,5 155 23,2 155 23,2 196 20,6 196 20,6 �̂�𝛽0 31,976 34,6517 34,5755 34,2202 33,901 �̂�𝛽1 -0,062 -0,0762 -0,0771 -0,0755 -0,072

Tabel 4.16. Daftar Bilangan Random Untuk Pengambilan Sampel Bootstrap Pabrik B 0,5984 0,68385 0,2321 0,83021 0,38384

0,17375 0,54873 0,8748 0,52726 0,65925 0,15461 0,91618 0,63967 0,08781 0,60032 0,94872 0,07404 0,86384 0,83617 0,14968 0,06042 0,77064 0,9402 0,98932 0,19818 0,0088 0,31364 0,55583 0,55635 0,76729

0,31471 0,46937 0,86903 0,67799 0,39693 0,04179 0,52928 0,52487 0,81292 0,01572 0,72804 0,27435 0,1715 0,01132 0,87972


104

Tabel 4.17. Konversi Indeks Sampel Asli Untuk Sampel Bootstrap B

6 7 3 8 4 2 5 8 5 6 2 9 6 1 6 9 1 8 8 2 1 7 9 9 2 1 3 6 6 7 3 5 8 7 4 1 5 5 8 1 7 3 2 1 8

Tabel 4.18. Hasil Sampel Bootstrap B 𝐰𝐰∗1 𝐰𝐰∗2 𝐰𝐰∗3 𝐰𝐰∗4 𝐰𝐰∗5

𝐱𝐱∗1 𝐲𝐲∗1 𝐱𝐱∗2 𝐲𝐲∗2 𝐱𝐱∗3 𝐲𝐲∗𝟑𝟑 𝐱𝐱∗𝟒𝟒 𝐲𝐲∗𝟒𝟒 𝐱𝐱∗𝟓𝟓 𝐲𝐲∗𝟓𝟓

1 296 18 151 24,1 402 11,8 177 26,5 29 32,5 2 385 11,6 76 32 177 26,5 76 32 296 18 3 385 11,6 209 25,8 296 18 376 16,3 296 18 4 209 25,8 376 16,3 177 26,5 177 26,5 385 11,6 5 376 16,3 151 24,1 209 25,8 209 25,8 385 11,6 6 376 16,3 402 11,8 296 18 296 18 151 24,1 7 402 11,8 76 32 177 26,5 151 24,1 29 32,5 8 376 16,3 76 32 76 32 177 26,5 376 16,3 9 151 24,1 402 11,8 385 11,6 376 16,3 177 26,5 �̂�𝛽0 34,1259 35,3939 38,1158 34,9339 34,1427 �̂�𝛽1 -0,0525 -0,0566 -0,0667 -0,0508 -0,0547

Tabel 4.19. Daftar Bilangan Random Untuk Pengambilan Sampel Bootstrap Pabrik C 0,46304 0,03916 0,32864 0,0845 0,22954 0,35884 0,31648 0,45556 0,71942 0,72214 0,80166 0,8684 0,40873 0,76976 0,53107 0,71706 0,0293 0,42674 0,23867 0,71233 0,10211 0,18687 0,03386 0,53729 0,22617 0,43816 0,88673 0,18139 0,77996 0,91983 0,88455 0,68119 0,82932 0,69313 0,11269 0,53646 0,11008 0,93013 0,68141 0,49838 0,04747 0,10341 0,07658 0,53787 0,12289


105

Tabel 4.20. Konversi Indeks Sampel Asli Untuk Sampel Bootstrap C

5 1 3 1 3 4 3 5 7 7 8 8 4 7 5 7 1 4 3 7 1 2 1 5 3 4 8 2 8 9 8 7 8 7 2 5 1 9 7 5 1 1 1 5 2

Tabel 4.21. Sampel Bootstrap C 𝐰𝐰∗1 𝐰𝐰∗2 𝐰𝐰∗3 𝐰𝐰∗4 𝐰𝐰∗5 𝐱𝐱∗1 𝐲𝐲∗1 𝐱𝐱∗2 𝐲𝐲∗2 𝐱𝐱∗3 𝐲𝐲∗𝟑𝟑 𝐱𝐱∗𝟒𝟒 𝐲𝐲∗𝟒𝟒 𝐱𝐱∗𝟓𝟓 𝐲𝐲∗𝟓𝟓

1 58 32,8 119 28,8 115 29,7 119 28,8 115 29,7 2 88 28,9 115 29,7 58 32,8 150 25,4 150 25,4 3 107 31,7 107 31,7 88 28,9 150 25,4 58 32,8 4 150 25,4 119 28,8 88 28,9 115 29,7 150 25,4 5 119 28,8 188 22 119 28,8 58 32,8 115 29,7 6 88 28,9 107 31,7 188 22 107 31,7 125 28,5 7 107 31,7 150 25,4 107 31,7 150 25,4 188 22 8 58 32,8 119 28,8 125 28,5 150 25,4 58 32,8 9 119 28,8 119 28,8 119 28,8 58 32,8 188 22 �̂�𝛽0 36,3948 42,8542 37,2071 38,3745 38,4051 �̂�𝛽1 -0,0646 -0,1137 -0,0742 -0,0832 -0,0849


106

Tabel 4.22. Data sisa konsentrasi anti-inflamatori pada 27 alat setelah digunakan dalam suatu waktu tertentu

Pabrik Waktu Besarnya Konsentrasi Pabrik Waktu Besarnya

Konsentrasi Pabrik Waktu Besarnya Konsentrasi

A 99 25,8 B 376 16,3 C 119 28,8 A 152 20,5 B 385 11,6 C 188 22 A 293 14,3 B 402 11,8 C 115 29,7 A 155 23,2 B 29 32,5 C 88 28,9 A 196 20,6 B 76 32 C 58 32,8 A 53 31,1 B 296 18 C 49 32,5 A 184 20,9 B 151 24,1 C 150 25,4 A 171 20,9 B 177 26,5 C 107 31,7 A 52 30,4 B 209 25,8 C 125 28,5 �̂�𝛽0 33,3601 �̂�𝛽0 35,2061 �̂�𝛽0 37,1937 �̂�𝛽1 -0,0683 �̂�𝛽1 -0,0563 �̂�𝛽1 -0,0745

Tabel 4.23. Data Residual A B C

𝐱𝐱 𝐲𝐲 𝐲𝐲� 𝛆𝛆 𝐱𝐱 𝐲𝐲 𝐲𝐲� 𝛆𝛆 𝐱𝐱 𝐲𝐲 𝐲𝐲� 𝛆𝛆 99 25,8 26,5984 -0,7984 376 16,3 14,0373 2,2627 119 28,8 28,3282 0,4718

152 20,5 22,9785 -2,4785 385 11,6 13,5306 -1,9306 188 22 23,1877 -1,1877 293 14,3 13,3482 0,9518 402 11,8 12,5735 -0,7735 115 29,7 28,6262 1,0738 155 23,2 22,7736 0,4264 29 32,5 33,5734 -1,0734 88 28,9 30,6377 -1,7377 196 20,6 19,9733 0,6267 76 32 30,9273 1,0727 58 32,8 32,8727 -0,0727 53 31,1 29,7402 1,3598 296 18 18,5413 -0,5413 49 32,5 33,5432 -1,0432

184 20,9 20,7929 0,1071 151 24,1 26,7048 -2,6048 150 25,4 26,0187 -0,6187 171 20,9 21,6808 -0,7808 177 26,5 25,241 1,259 107 31,7 29,2222 2,4778 52 30,4 29,8085 0,5915 209 25,8 23,4394 2,3606 125 28,5 27,8812 0,6188

Tabel 4.24. Bilangan Random Untuk data A 0,40106 0,70333 0,44062 0,67512 0,68191 0,88888 0,34275 0,48461 0,97195 0,11113 0,14384 0,13337 0,80577 0,46686 0,14381 0,91458 0,16034 0,55998 0,45008 0,28429 0,27807 0,68461 0,48834 0,64046 0,75464 0,39908 0,10288 0,99719 0,3026 0,44086 0,33456 0,29458 0,7259 0,68912 0,84364 0,40059 0,64646 0,98843 0,02543 0,48572 0,65503 0,19925 0,13004 0,67226 0,16455


107

Tabel 4.25. Konversi Bilangan Random Untuk data A

4 7 4 7 7 8 4 5 9 2 2 2 8 5 2 9 2 5 5 3 3 7 5 6 7 4 1 9 3 4 4 3 7 7 8 4 6 9 1 5 6 2 2 7 2

Tabel 4.26. Sampel Bootstrap Untuk data A 0,4264 0,1071 0,4264 0,1071 0,1071

-0,7808 0,4264 0,6267 0,5915 -2,4785 -2,4785 -2,4785 -0,7808 0,6267 -2,4785 0,5915 -2,4785 0,6267 0,6267 0,9518 0,9518 0,1071 0,6267 1,3598 0,1071 0,4264 -0,7984 0,5915 0,9518 0,4264 0,4264 0,9518 0,1071 0,1071 -0,7808 0,4264 1,3598 0,5915 -0,7984 0,6267 1,3598 -2,4785 -2,4785 0,1071 -2,4785

Tabel 4.27. Data 𝐘𝐘∗𝐛𝐛 Untuk Alat Pabrik A A

𝐱𝐱 𝐲𝐲∗𝟏𝟏 𝐲𝐲∗𝟐𝟐 𝐲𝐲∗𝟑𝟑 𝐲𝐲∗𝟒𝟒 𝐲𝐲∗𝟓𝟓 99 27,0248 26,7055 27,0248 26,7055 26,7055

152 25,8176 27,0248 27,2251 27,1899 24,1199 293 24,1199 24,1199 25,8176 27,2251 24,1199 155 27,1899 24,1199 27,2251 27,2251 27,5502 196 27,5502 26,7055 27,2251 27,9582 26,7055 53 27,0248 25,8 27,1899 27,5502 27,0248

184 27,0248 27,5502 26,7055 26,7055 25,8176 171 27,0248 27,9582 27,1899 25,8 27,2251 52 27,9582 24,1199 24,1199 26,7055 24,1199 �̂�𝛽0 28,3357 25,9534 26,3032 26,8986 26,4701 �̂�𝛽1 -0,0105 -0,0004 -0,0022 -0,0007 -0,0036


108

Tabel 4.28. Bilangan Random Untuk data B 0,64962 0,50028 0,49676 0,09937 0,96002 0,50456 0,1088 0,39118 0,04915 0,94231 0,70176 0,92523 0,63459 0,45539 0,09615 0,38553 0,13314 0,13394 0,64602 0,05154 0,06297 0,32638 0,28653 0,03359 0,31386 0,13732 0,07487 0,25483 0,35238 0,70652

0,447 0,95414 0,06426 0,22659 0,74747 0,08626 0,59546 0,00571 0,30365 0,32535 0,33022 0,60852 0,88701 0,8662 0,54287

Tabel 4.29. Konversi Bilangan Random Untuk data B

6 5 5 1 9 5 1 4 1 9 7 9 6 5 1 4 2 2 6 1 1 3 3 1 3 2 1 3 4 7 5 9 1 3 7 1 6 1 3 3 3 6 8 8 5

Tabel 4.30. Sampel Bootstrap Untuk data B -0,5413 1,0727 1,0727 2,2627 2,3606 1,0727 2,2627 -1,0734 2,2627 2,3606

-2,6048 2,3606 -0,5413 1,0727 2,2627 -1,0734 -1,9306 -1,9306 -0,5413 2,2627 2,2627 -0,7735 -0,7735 2,2627 -0,7735

-1,9306 2,2627 -0,7735 -1,0734 -2,6048 1,0727 2,3606 2,2627 -0,7735 -2,6048 2,2627 -0,5413 2,2627 -0,7735 -0,7735

-0,7735 -0,5413 1,259 1,259 1,0727


109

Tabel 4.31. Data 𝐘𝐘∗𝐛𝐛 Untuk Alat Pabrik B B

X 𝐲𝐲∗𝟏𝟏 𝐲𝐲∗𝟐𝟐 𝐲𝐲∗𝟑𝟑 𝐲𝐲∗𝟒𝟒 𝐲𝐲∗𝟓𝟓 376 13,496 15,11 15,11 16,3 16,3979 385 15,11 16,3 12,9639 16,3 16,3979 402 11,4325 16,3979 13,496 15,11 16,3 29 12,9639 12,1067 12,1067 13,496 16,3 76 16,3 13,2638 13,2638 16,3 13,2638

296 12,1067 16,3 13,2638 12,9639 11,4325 151 15,11 16,3979 16,3 13,2638 11,4325 177 16,3 13,496 16,3 13,2638 13,2638 209 13,2638 13,496 15,2963 15,2963 15,11 �̂�𝛽0 15,2445 12,6226 14,1997 13,7669 13,2045 �̂�𝛽1 -0,0053 0,0092 0,00014 0,004 0,0053

Tabel 4.32. Bilangan Random Untuk data C 0,04133 0,08309 0,47273 0,03581 0,92374 0,54571 0,51096 0,90588 0,00461 0,86464 0,70257 0,62594 0,92681 0,33341 0,50538 0,03658 0,29969 0,25404 0,07317 0,82293 0,60876 0,53299 0,16089 0,23856 0,39637 0,37982 0,16877 0,36126 0,96598 0,06233 0,76713 0,21339 0,63889 0,55119 0,8395 0,94759 0,7704 0,91441 0,42745 0,23971 0,26492 0,21495 0,88395 0,21323 0,83818

Tabel 4.33. Konversi Bilangan Random Untuk data C

1 1 5 1 9 5 5 9 1 8 7 6 9 4 5 1 3 3 1 8 6 5 2 3 4 4 2 4 9 1 7 2 6 5 8 9 7 9 4 3 3 2 8 2 8


110

Tabel 4.34. Sampel Bootstrap Untuk data C 0,4718 0,4718 -0,0727 0,4718 0,6188

-0,0727 -0,0727 0,6188 0,4718 2,4778 -0,6187 -1,0432 0,6188 -1,7377 -0,0727 0,4718 1,0738 1,0738 0,4718 2,4778

-1,0432 -0,0727 -1,1877 1,0738 -1,7377 -1,7377 -1,1877 -1,7377 0,6188 0,4718 -0,6187 -1,1877 -1,0432 -0,0727 2,4778 0,6188 -0,6187 0,6188 -1,7377 1,0738 1,0738 -1,1877 2,4778 -1,1877 2,4778

Tabel 4.35. Data 𝐘𝐘∗𝐛𝐛 Untuk Alat Pabrik C C

𝐱𝐱 𝐲𝐲∗𝟏𝟏 𝐲𝐲∗𝟐𝟐 𝐲𝐲∗𝟑𝟑 𝐲𝐲∗𝟒𝟒 𝐲𝐲∗𝟓𝟓 119 28,8 28,8 28,2555 28,8 28,947 188 28,2555 28,2555 28,947 28,8 30,806 115 27,7095 27,285 28,947 26,5905 28,2555 88 28,8 29,402 29,402 28,8 30,806 58 27,285 28,2555 27,1405 29,402 26,5905 49 26,5905 27,1405 26,5905 28,947 28,8

150 27,7095 27,1405 27,285 28,2555 30,806 107 28,947 27,7095 28,947 26,5905 29,402 125 29,402 27,1405 30,806 27,1405 30,806 �̂�𝛽0 27,1528 28,0049 27,0888 28,7832 27,0267 �̂�𝛽1 0,0091 -0,0009 0,0125 -0,0057 0,022


111

Tabel 4.36. Perbandingan Selang Kepercayaan Populasi Berdistribusi Multivariat Normal (Variabel Independen Dianggap Random)

𝑛𝑛 𝑏𝑏 𝑖𝑖

SK Pendekatan Normal SK Percentil

�̂�𝛽𝑖𝑖 �̂�𝛽𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏 𝑖𝑖 𝑆𝑆𝑆𝑆𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏 Bias batas

bawah batas atas

batas bawah

batas atas

10 10 1 4,5211 5,06077 4,72145 4,97239 4,79094 4,84201 0,11701 0,05107

2 -2,04885 -1,66545 -1,99237 -1,80209 -1,85715 -1,89656 0,08313 -0,03941

20 1 4,46122 5,16031 4,51586 5,13504 4,81077 4,80589 0,15158 -0,00488

2 -2,10709 -1,63738 -2,09046 -1,66785 -1,87224 -1,86805 0,10184 0,00419

50 1 4,67918 5,16591 4,75456 5,18428 4,92255 4,93627 0,10554 0,01372

2 -2,12184 -1,76204 -2,15422 -1,8132 -1,94194 -1,95284 0,07801 -0,0109

60 1 4,93652 5,46009 4,87196 5,30566 5,19831 5,15154 0,11352 -0,04677

2 -2,3024 -1,94806 -2,18579 -1,92053 -2,12523 -2,09515 0,07683 0,03008

100 1 4,70313 5,12522 4,764 5,04968 4,91417 4,90719 0,09152 -0,00698

2 -2,08009 -1,78234 -2,02576 -1,83073 -1,93121 -1,92714 0,06456 0,00407

200 1 4,85245 5,45942 4,86665 5,42643 5,15593 5,16486 0,13161 0,00893

2 -2,33605 -1,88978 -2,31601 -1,91983 -2,11291 -2,11973 0,09676 -0,00682

500 1 4,74587 5,19931 4,78146 5,17989 4,97259 4,97144 0,09832 -0,00115

2 -2,15082 -1,80284 -2,12956 -1,84034 -1,97683 -1,97641 0,07545 0,00042

700 1 4,87409 5,33962 4,85616 5,24894 5,10685 5,0942 0,10094 -0,01265

2 -2,25014 -1,91613 -2,18545 -1,90422 -2,08313 -2,07408 0,07242 0,00905

1.000 1 4,56323 5,2072 4,68666 5,21234 4,88521 4,9095 0,13963 0,02429

2 -2,14819 -1,69256 -2,14106 -1,77884 -1,92038 -1,93661 0,09879 -0,01623


112

1.500 1 4,32952 5,05672 4,48302 5,14414 4,69312 4,72568 0,15767 0,03256

2 -2,03564 -1,52879 -2,09643 -1,63624 -1,78221 -1,80454 0,1099 -0,02233

2.000 1 4,79081 5,16766 4,81271 5,12925 4,97923 4,97913 0,08171 -0,0001

2 -2,1157 -1,84864 -2,09228 -1,86875 -1,98217 -1,98241 0,0579 -0,00024

3.000 1 4,72481 5,08508 4,79161 5,12036 4,90494 4,9278 0,07812 0,02286

2 -2,05959 -1,78839 -2,0872 -1,83699 -1,92399 -1,94089 0,0588 -0,0169

5.000 1 4,75399 5,16084 4,75244 5,13759 4,95741 4,96104 0,08821 0,00363

2 -2,1173 -1,83253 -2,09737 -1,8236 -1,97492 -1,97648 0,06175 -0,00156

7.000 1 4,86549 5,139 4,89387 5,11181 5,00225 4,99904 0,05931 -0,00321

2 -2,10176 -1,89781 -2,08498 -1,92066 -1,99978 -1,99764 0,04422 0,00214

10.000 1 4,63846 5,18918 4,70281 5,23449 4,91382 4,92323 0,11941 0.00941

2 -2,14061 -1,7466 -2,15522 -1,78445 -1,94361 -1,94436 0,08543 -0.00075


113

Tabel 4.37. Perbandingan Selang Kepercayaan Koefisien Regresi Populasi Berdistribusi Multivariat Normal

(Variabel Independen Dianggap Tetap)

𝑛𝑛 𝑏𝑏 𝑖𝑖

SK Pendekatan Normal SK Percentil

�̂�𝛽𝑖𝑖 �̂�𝛽𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏 𝑖𝑖 𝑆𝑆𝑆𝑆𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏 Bias batas

bawah batas atas batas

bawah batas atas 10 10 1 4,5794 5,23661 4,7968 5,09438 4,908 4,94685 0,1425 0,03885

2 -2,18107 -1,70019 -2,07746 -1,86436 -1,94147 -1,97284 0,10391 -0,03137

20 1 4,61222 5,18778 4,69656 5,13802 4,9 4,85795 0,1248 -0,04205

2 -2,14377 -1,72739 -2,10387 -1,78551 -1,93558 -1,90338 0,09028 0,0322

50 1 4,6643 5,38567 4,76739 5,26037 5,02498 5,03902 0,15641 0,01404

2 -2,28387 -1,76778 -2,19517 -1,83659 -2,02582 -2,03574 0,1119 -0,00992

60 1 4,88859 5,2473 4,88506 5,19168 5,06795 5,05767 0,07778 -0,01028

2 -2,17869 -1,91104 -2,13363 -1,90912 -2,04486 -2,03754 0,05803 0,00732

100 1 4,75569 5,46285 4,83489 5,37106 5,10927 5,10666 0,15333 -0,00261

2 -2,32179 -1,82676 -2,25753 -1,88765 -2,07428 -2,07546 0,10733 -0,00118

200 1 4,62089 5,21808 4,69647 5,1193 4,91948 4,90957 0,12949 -0,00991

2 -2,15639 -1,72427 -2,08794 -1,781 -1,94033 -1,93358 0,09369 0,00675

500 1 4,74524 5,13954 4,79002 5,08415 4,94239 4,94116 0,08549 -0,00123

2 -2,09377 -1,80547 -2,05539 -1,83664 -1,94962 -1,94916 0,06251 0,00046

700 1 4,78739 5,56441 4,91674 5,44602 5,1759 5,18411 0,16848 0,00821

2 -2,43191 -1,84478 -2,33955 -1,94542 -2,13835 -2,14417 0,12731 -0,00582

1.000 1 4,58455 5,24271 4,66836 5,16396 4,91363 4,91429 0,14271 0,00066

2 -2,17809 -1,70065 -2,12149 -1,76324 -1,93937 -1,94002 0,10352 -0,00065


114

1.500 1 4,71014 5,30934 4,78342 5,23087 5,00974 5,00846 0,12992 -0,00128

2 -2,21969 -1,79443 -2,16537 -1,84749 -2,00706 -2,00746 0,09221 -0,0004

2.000 1 4,66854 5,44569 4,74356 5,36429 5,05712 5,05832 0,16851 0,0012

2 -2,31107 -1,76109 -2,25588 -1,81444 -2,03608 -2,0393 0,11925 -0,00322

3.000 1 4,53044 5,35447 4,61771 5,23558 4,94245 4,93983 0,17867 -0,00262

2 -2,25926 -1,66126 -2,17318 -1,7268 -1,96026 -1,96127 0,12966 -0,00101

5.000 1 4,54078 5,28344 4,63967 5,19477 4,91211 4,91307 0,16103 0,00096

2 -2,21082 -1,67473 -2,1462 -1,74806 -1,94277 -1,94298 0,11624 -0,00021

7.000 1 4,8081 5,32721 4,86812 5,26415 5,06765 5,06778 0,11256 0,00013

2 -2,23598 -1,8556 -2,1909 -1,89962 -2,04579 -2,04541 0,08248 0,00038

10.000 1 4,58146 5,35144 4,68113 5,25626 4,96645 4,968 0,16695 0,00155

2 -2,23772 -1,69569 -2,1737 -1,76626 -1,96671 -1,96753 0,11753 -0,00082


115

DIAGRAM ALIR PADA BAB III

Gambar 3.7. Diagram alir untuk Program 3.1

Bangkitkan (𝑛𝑛) sampel asli dari suatu populasi berdistribusi

tertentu dengan 𝐸𝐸(𝑥𝑥) dan 𝑉𝑉𝑉𝑉𝑉𝑉(𝑥𝑥)

Banyaknya sampel bootstrap (𝑏𝑏),

ukuran sampel (𝑛𝑛)

Untuk 𝑘𝑘 = 1:𝑛𝑛

Untuk 𝑗𝑗 = 1: 𝑏𝑏

Mulai

Bangkitkan bilangan random 𝑢𝑢

YA (𝑘𝑘 − 1) 𝑛𝑛⁄ < 𝑢𝑢(𝑖𝑖, 𝑗𝑗) ≤ 𝑘𝑘 𝑛𝑛⁄

TIDAK

TIDAK

𝑖𝑖 = 𝑛𝑛 YA 𝑚𝑚𝑚𝑚𝑉𝑉𝑛𝑛 = 𝑠𝑠𝑢𝑢𝑚𝑚(𝑢𝑢)/𝑛𝑛

YA 𝑗𝑗 = 𝑏𝑏

TIDAK Untuk 𝑖𝑖 = 1:𝑛𝑛

𝑢𝑢(𝑖𝑖, 𝑗𝑗) = 𝑠𝑠𝑉𝑉(𝑘𝑘)

Selesai 𝑚𝑚𝑚𝑚𝑉𝑉𝑛𝑛𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏 = 𝑚𝑚𝑚𝑚𝑉𝑉𝑛𝑛 𝑏𝑏⁄

𝑆𝑆𝐸𝐸𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏 = 𝑠𝑠𝑏𝑏𝑠𝑠(𝑚𝑚𝑚𝑚𝑉𝑉𝑛𝑛 𝑏𝑏⁄ )


116

DIAGRAM ALIR PADA BAB IV



Mulai

Bangkitkan bilangan random 𝑢𝑢

YA (𝑘𝑘 − 1) 𝑛𝑛⁄ < 𝑢𝑢(𝑖𝑖, 𝑗𝑗) ≤ 𝑘𝑘 𝑛𝑛⁄

TIDAK

TIDAK

𝑖𝑖 = 𝑛𝑛 YA

YA 𝑗𝑗 = 𝑏𝑏

TIDAK Untuk 𝑖𝑖 = 1:𝑛𝑛 Selesai

𝑚𝑚𝑚𝑚𝑉𝑉𝑛𝑛𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏 = 𝑚𝑚𝑚𝑚𝑉𝑉𝑛𝑛 𝑏𝑏⁄ 𝑆𝑆𝐸𝐸𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏 = 𝑠𝑠𝑏𝑏𝑠𝑠(𝑚𝑚𝑚𝑚𝑉𝑉𝑛𝑛 𝑏𝑏⁄ ) 𝑝𝑝𝑚𝑚𝑉𝑉𝑙𝑙𝑏𝑏𝑙𝑙𝑚𝑚𝑉𝑉 = 𝑚𝑚𝑚𝑚𝑉𝑉𝑛𝑛(𝑏𝑏𝑏𝑏 2⁄ )

𝑝𝑝𝑚𝑚𝑉𝑉𝑢𝑢𝑝𝑝𝑝𝑝𝑚𝑚𝑉𝑉 = 𝑚𝑚𝑚𝑚𝑉𝑉𝑛𝑛(𝑏𝑏(1 − 𝑏𝑏 2⁄ ))

𝑚𝑚𝑚𝑚𝑉𝑉𝑛𝑛 = 𝑠𝑠𝑢𝑢𝑚𝑚(𝑢𝑢)/𝑛𝑛

Bangkitkan (𝑛𝑛) sampel asli dari suatu populasi berdistribusi

tertentu dengan 𝐸𝐸(𝑥𝑥) dan 𝑉𝑉𝑉𝑉𝑉𝑉(𝑥𝑥)

𝑢𝑢(𝑖𝑖, 𝑗𝑗) = 𝑠𝑠𝑉𝑉(𝑘𝑘)

Gambar 4.1. Diagram alir untuk Program 4.1.


ukuran sampel (𝑛𝑛)


117

Gambar 4.4. Diagram alir dari Program 4.2.

Mulai


𝑛𝑛 < 30 TIDAK

YA

TIDAK 𝑗𝑗 = 𝑏𝑏

YA

𝑡𝑡𝑡𝑡 = |𝑡𝑡𝑡𝑡𝑛𝑛𝑡𝑡(𝛼𝛼 2⁄ ,𝑛𝑛 − 𝑝𝑝)|

𝑡𝑡𝑡𝑡 = |𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑡𝑡𝑛𝑛𝑡𝑡(𝛼𝛼 2⁄ , 0,1))|

Selesai

𝑃𝑃𝑃𝑃𝑛𝑛𝑃𝑃𝑃𝑃 = 𝑆𝑆𝑆𝑆(𝑐𝑐𝑃𝑃𝑡𝑡𝑐𝑐(𝑛𝑛𝑃𝑃(𝛼𝛼 2⁄ ))) 𝑃𝑃𝑃𝑃𝑛𝑛𝑃𝑃𝑃𝑃 = 𝑆𝑆𝑆𝑆(𝑛𝑛𝑛𝑛𝑟𝑟𝑛𝑛𝑟𝑟(𝑛𝑛𝑃𝑃(1 − (𝛼𝛼 2⁄ )))) 𝑁𝑁𝑛𝑛𝑛𝑛𝑛𝑛𝑃𝑃𝑃𝑃 = 𝛃𝛃� − 𝑡𝑡𝑡𝑡(𝑠𝑠(𝐗𝐗′𝐗𝐗)−𝟏𝟏(𝑝𝑝, 𝑝𝑝)) 𝑁𝑁𝑛𝑛𝑛𝑛𝑛𝑛𝑃𝑃𝑃𝑃 = 𝛃𝛃� + 𝑡𝑡𝑡𝑡(𝑠𝑠(𝐗𝐗′𝐗𝐗)−𝟏𝟏(𝑝𝑝, 𝑝𝑝))

Untuk 𝑐𝑐 = 1:𝑝𝑝

𝛃𝛃�∗𝑏𝑏 = 𝑡𝑡𝑛𝑛𝑡𝑡�𝐗𝐗∗𝑏𝑏′ 𝐗𝐗∗𝑏𝑏�(𝐗𝐗∗𝑏𝑏′ 𝐘𝐘∗𝑏𝑏)

Bangkitkan bilangan random 𝑟𝑟(𝑡𝑡)

Untuk 𝑡𝑡 = 1:𝑛𝑛


𝑟𝑟(𝑡𝑡) = 𝑤𝑤(𝑘𝑘)

TIDAK

𝑡𝑡 = 𝑛𝑛

YA

YA (𝑘𝑘 − 1) 𝑛𝑛⁄ < 𝑟𝑟(𝑡𝑡) ≤ 𝑘𝑘 𝑛𝑛⁄

TIDAK

𝑠𝑠 =(𝐘𝐘′𝐘𝐘) − (𝛃𝛃�′𝐗𝐗′𝐘𝐘)

(𝑛𝑛 − 𝑝𝑝)

𝛃𝛃�𝑏𝑏𝑛𝑛𝑛𝑛𝑡𝑡 = 𝑛𝑛𝑃𝑃𝑚𝑚𝑛𝑛�𝛃𝛃�∗𝑏𝑏�

𝑆𝑆𝑆𝑆𝑏𝑏𝑛𝑛𝑛𝑛𝑡𝑡 = 𝑠𝑠 �𝑠𝑠𝑠𝑠𝑛𝑛𝑡𝑡 �(𝐗𝐗′𝐗𝐗)−𝟏𝟏(𝑝𝑝, 𝑝𝑝)��

𝑆𝑆𝑆𝑆 = 𝑠𝑠𝑛𝑛𝑛𝑛𝑡𝑡(𝛃𝛃�∗𝑏𝑏)

Banyaknya sampel bootstrap (𝑏𝑏), ukuran sampel (𝑛𝑛), tingkat signifikansi (𝛼𝛼)

Pasangan terurut 𝐰𝐰 = (𝐱𝐱, 𝐲𝐲), 𝐱𝐱

(variabel independen dan dependen), banyaknya variabel

independen (𝑘𝑘) dan parameter (𝑝𝑝)


118


Mulai


𝑛𝑛 < 30 TIDAK

YA

TIDAK 𝑗𝑗 = 𝑏𝑏

YA



Selesai



𝛃𝛃�∗𝑏𝑏 = 𝑡𝑡𝑛𝑛𝑡𝑡�𝐗𝐗∗𝑏𝑏′ 𝐗𝐗∗𝑏𝑏�(𝐗𝐗∗𝑏𝑏′ 𝐘𝐘∗𝑏𝑏)

Bangkitkan bilangan random 𝑟𝑟(𝑡𝑡)



𝑟𝑟(𝑡𝑡) = 𝑤𝑤(𝑘𝑘)

TIDAK

𝑡𝑡 = 𝑛𝑛

YA

YA (𝑘𝑘 − 1) 𝑛𝑛⁄ < 𝑟𝑟(𝑡𝑡) ≤ 𝑘𝑘 𝑛𝑛⁄

TIDAK







ukuran sampel (𝑛𝑛), tingkat signifikansi (𝛼𝛼), dan banyaknya

variabel independen (𝑘𝑘)

𝑝𝑝 = 𝑘𝑘 + 1

Bangkitkan pasangan terurut 𝐰𝐰𝑡𝑡 dengan mean 𝐦𝐦𝐦𝐦 dan covariance 𝐜𝐜𝐜𝐜𝐜𝐜


119

Banyaknya sampel bootstrap (𝑏𝑏), ukuran sampel (𝑛𝑛), tingkat signifikansi (𝛼𝛼)

Pasangan terurut 𝐰𝐰 = (𝐱𝐱, 𝐲𝐲), 𝐱𝐱

(variabel independen dan dependen), banyaknya variabel

independen (𝑘𝑘) dan parameter (𝑝𝑝)

Mulai

𝛆𝛆 = 𝐘𝐘� − 𝐘𝐘 𝛃𝛃� = (𝐗𝐗′𝐗𝐗)−𝟏𝟏(𝐗𝐗′𝐘𝐘) Bangkitkan bilangan

random 𝑟𝑟(𝑡𝑡, 𝑗𝑗)








𝑟𝑟(𝑡𝑡, 𝑗𝑗) = 𝜀𝜀(𝑘𝑘)


(𝑘𝑘 − 1) 𝑛𝑛⁄ < 𝑟𝑟(𝑡𝑡, 𝑗𝑗) ≤ 𝑘𝑘 𝑛𝑛⁄

YA

TIDAK

𝑡𝑡 = 𝑛𝑛

TIDAK YA 𝐘𝐘�∗𝑏𝑏 = 𝐗𝐗𝛃𝛃� + 𝛆𝛆 𝛃𝛃�∗𝑏𝑏 = (𝐗𝐗′𝐗𝐗)−𝟏𝟏𝐗𝐗′𝐘𝐘∗𝑏𝑏

𝑗𝑗 = 𝑏𝑏

YA

TIDAK

Selesai



TIDAK

𝑛𝑛 < 30

YA





120



Mulai

𝛆𝛆 = 𝐘𝐘� − 𝐘𝐘 𝛃𝛃� = (𝐗𝐗′𝐗𝐗)−𝟏𝟏(𝐗𝐗′𝐘𝐘) Bangkitkan bilangan

random 𝑟𝑟(𝑡𝑡, 𝑗𝑗)








𝑟𝑟(𝑡𝑡, 𝑗𝑗) = 𝜀𝜀(𝑘𝑘)

(𝑘𝑘 − 1) 𝑛𝑛⁄ < 𝑟𝑟(𝑡𝑡, 𝑗𝑗) ≤ 𝑘𝑘 𝑛𝑛⁄

YA

TIDAK

𝑡𝑡 = 𝑛𝑛

TIDAK YA 𝐘𝐘�∗𝑏𝑏 = 𝐗𝐗𝛃𝛃� + 𝛆𝛆 𝛃𝛃�∗𝑏𝑏 = (𝐗𝐗′𝐗𝐗)−𝟏𝟏𝐗𝐗′𝐘𝐘∗𝑏𝑏

𝑗𝑗 = 𝑏𝑏

YA

TIDAK

Selesai



TIDAK

𝑛𝑛 < 30

YA




ukuran sampel (𝑛𝑛), tingkat signifikansi (𝛼𝛼), dan banyaknya

variabel independen (𝑘𝑘)

𝑝𝑝 = 𝑘𝑘 + 1

Bangkitkan pasangan terurut 𝐰𝐰𝑡𝑡 dengan mean 𝐦𝐦𝐦𝐦 dan covariance 𝐜𝐜𝐜𝐜𝐜𝐜


121

PROGRAM PADA BAB III

Program 3.1.

%PROGRAM 3.1 %program pendekatan rata-rata dan galat standar bootstrap %FS= jenis fungsi distribusi populasi %sa= sampel acak asli %n= besarnya ukuran sampel acak %re= banyaknya resampel bootstrap %u= matriks berisi bilangan random %bootstrapSAMPLE= matriks berisi hasil resampel dengan metode bootstrap % baris menyatakan ukuran sampel % kolom menyatakan banyaknya resampel (sampel bootstrap) %MEANboot= vektor kolom berisi mean untuk setiap hasil sampel bootstrap %xBARboot= pendekatan mean untuk sampling %RTasli= rata-rata sampel acak asli %SDasli= standar deviasi sampel acak asli %SEasli= standar eror sampel acak asli %RTpop= rata-rata populasi %SEpop= standar eror populasi %SEboot= pendekatan standar eror dari mean untuk sampling clear; clc; disp('Metode Bootstrap Pendekatan Standar Eror dan Selang kepercayaan Untuk Rata-Rata Populasi') disp(' ') disp('Jenis Fungsi Distribusi Simbol') disp(' Normal 1 ') disp(' Eksponensial 2 ') disp(' Binomial 3 ') disp(' Poisson 4 ') disp(' ') FS=input('masukkan jenis fungsi distribusi populasi: '); n=input('masukkan banyaknya sampel: '); re=input('masukkan banyaknya resampel :'); if FS==1 miu=input('masukkan nilai miu: '); sig=input('masukkan nilai sigma: '); sa=normrnd(miu,sig,1,n); rata=miu; varr=sig^2; elseif FS==2 L=input('masukkan nilai lamda: '); sa=exprnd(L,1,n); rata=L; varr=L^2; elseif FS==3 p=input('masukkan nilai p: '); C=input('masukkan banyaknya jumlah percobaan: '); sa=binornd(C,p,1,n); rata=p*C;


122

varr=rata*(1-p); else L=input('masukkan nilai lamda: '); sa=poissrnd(L,1,n); rata=L; varr=L; end tic sa; RTasli=mean(sa); SDasli=std(sa); VARasli=SDasli^2; SEasli=SDasli/(sqrt(n)); RTpop=rata; VARpop=varr; SEpop=(sqrt(varr/n)); u=rand(n,re); for j=1:re; for i=1:n; for k=1:n; while u(i,j)<(k*(1/n))&&u(i,j)>=((k-1)*(1/n))&&u(i,j)>=0; u(i,j)=sa(k); end rt=mean(u); end end end bootstrapSAMPLE=u; MEANboot=rt; xBARboot=mean(rt); SEboot=std(rt); VARboot=(SEboot^2)*n; disp('Sampel Asli: ') disp(sa') disp('Mean Populasi Mean Sampel Asli Mean Bootstrap') disp(fprintf('%10.5f%18.5f%22.5f\n',RTpop,RTasli,xBARboot)) disp(' ') disp('Var Populasi Var Sampel Asli Var Bootstrap') disp(fprintf('%10.5f%18.5f%22.5f\n',VARpop,VARasli,VARboot)) disp(' ') disp(' SE Populasi SE Sampel Asli SE Bootstrap') disp(fprintf('%10.5f%18.5f%22.5f\n',SEpop,SEasli,SEboot)) toc


123

PROGRAM PADA BAB IV

Program 4.1.

%PROGRAM 4.1 %program percentile bootstrap %FS= jenis fungsi distribusi populasi %sa= sampel acak asli %n= besarnya ukuran sampel acak %re= banyaknya resampel bootstrap %ts=tingkat signifikansi selang kepercayaan %u= matriks berisi bilangan random %bootstrapSAMPLE= matriks berisi hasil resampel dengan metode bootstrap % baris menyatakan ukuran sampel % kolom menyatakan banyaknya resampel (sampel bootstrap) %MEANboot= vektor kolom berisi mean untuk setiap hasil sampel bootstrap %xBARboot= pendekatan mean untuk sampling %RTasli= rata-rata sampel acak asli %SDasli= standar deviasi sampel acak asli %SEasli= standar eror sampel acak asli %RTpop= rata-rata populasi %SEpop= standar eror populasi %SEboot= pendekatan standar eror dari mean untuk sampling clear; clc; disp('Metode Bootstrap Pendekatan Standar Eror dan Selang kepercayaan Untuk Rata-Rata Populasi') disp(' ') disp('Jenis Fungsi Distribusi Simbol') disp(' Normal 1 ') disp(' Eksponensial 2 ') disp(' Binomial 3 ') disp(' Poisson 4 ') disp(' ') FS=input('masukkan jenis fungsi distribusi populasi: '); n=input('masukkan banyaknya sampel: '); re=input('masukkan banyaknya resampel :'); ts=input('masukkan tingkat signifikansi :'); if FS==1 miu=input('masukkan nilai miu: '); sig=input('masukkan nilai sigma: '); sa=normrnd(miu,sig,1,n); rata=miu; varr=sig^2; elseif FS==2 L=input('masukkan nilai lamda: '); sa=exprnd(L,1,n); rata=L; varr=L^2; elseif FS==3 p=input('masukkan nilai p: '); C=input('masukkan banyaknya jumlah percobaan: ');


124

sa=binornd(C,p,1,n); rata=p*C; varr=rata*(1-p); else L=input('masukkan nilai lamda: '); sa=poissrnd(L,1,n); rata=L; varr=L; end tic sa; RTasli=mean(sa); SDasli=std(sa); VARasli=SDasli^2; SEasli=SDasli/(sqrt(n)); RTpop=rata; VARpop=varr; SEpop=(sqrt(varr/n)); u=rand(n,re); for j=1:re; for i=1:n; for k=1:n; while u(i,j)<(k*(1/n))&&u(i,j)<(k*(1/n))&&u(i,j)>=((k-1)*(1/n))&&u(i,j)>=0; u(i,j)=sa(k); end rt=mean(u); end end end bootstrapSAMPLE=u; MEANboot=rt; xBARboot=mean(rt); SEboot=std(rt) VARboot=(SEboot^2)*n; SO=sort(rt); PERlower=SO(ceil(re*(ts/2))); PERupper=SO(round(re*(1-(ts/2)))); if n<30 tt=abs(tinv((ts/2),(n-1))); else tt=abs(norminv((ts/2),0,1)); end SKlower=(RTasli)-(tt*((SDasli)/(sqrt(n)))); SKupper=(RTasli)+(tt*((SDasli)/(sqrt(n)))); histfit(SO) disp('Sampel Asli: ') disp(sa') disp('Mean Populasi Mean Sampel Asli Mean Bootstrap') disp(fprintf('%10.5f%18.5f%22.5f\n',RTpop,RTasli,xBARboot)) disp(' ') disp('Var Populasi Var Sampel Asli Var Bootstrap') disp(fprintf('%10.5f%18.5f%22.5f\n',VARpop,VARasli,VARboot)) disp(' ') disp(' SE Populasi SE Sampel Asli SE Bootstrap')


125

disp(fprintf('%10.5f%18.5f%22.5f\n',SEpop,SEasli,SEboot)) disp(' ') disp('SK normal BB SK normal BA') disp(fprintf('%10.5f%19.5f\n',SKlower,SKupper)) disp(' ') disp('SK percentil BB SK percentil BA') disp(fprintf('%12.5f%20.5f\n',PERlower,PERupper)) toc

Program 4.2. %PROGRAM 4.2 %program bootstrap pendekatan parameter regresi dengan regressor RANDOM %t= banyaknya variabel independen %re= banyaknya sampel bootstrap %ip= banyaknya parameter regresi %ts= tingkat signifikansi selang kepercayaan parameter regresi %X= matriks VARIABEL INDEPENDEN ;kolom pertama terdiri dari elemen konstanta, x0=1 %Y= vektor VARIABEL DEPENDEN %u= matriks berisi bilangan random %Basli=Beta topi; vektor parameter penduga koefisien regresi asli. %s= standar deviasi dari eror %Bbntg= matriks berisi nilai Beta pendekatan dengan bootstrap %Bboot= vektor berisi hasil pendekatan parameter regresi bootstrap yang %didapat dari rata-rata kolom Bbntg %Bias= besarnya bias dari parameter bootstrap terhadap parameter penduga %SEboot= vektor berisi hasil pendekatan standar eror untuk parameter %regresi bootstrap %SKlower= batas bawah selang kepercayaan parameter regresi bootstrap pendekatan normal %SKupper= batas atas selang kepercayaan parameter regresi bootstrap pendekatan normal %PERlower= batas bawah selang kepercayaan parameter regresi bootstrap dengan %metode percentil %PERupper=batas atas selang kepercayaan parameter regresi bootstrap dengan %metode percentil clear; clc; t=input('masukkan banyaknya variabel independen: '); re=input('masukkan banyaknya sampel bootstrap: '); ip=t+1; ts=input('masukkan tingkat signifikansi: '); Y=input('masukkan matriks Variabel Dependen: '); n=length(Y); v=zeros(n,t); for e=1:t xx=input('masukkan matriks Variabel Independen: ');


126

v(:,e)=xx; end v; X=[ones(n,1),v]; In=inv(X'*X); Basli=In*(X'*Y); s=((Y'*Y)-(Basli'*X'*Y))/(n-ip) tic for j=1:re u=rand(n,1); w=repmat(u,1,(t+1)); oo=ones(n,1); sa=[oo,v]; for i=1:n; for k=1:n; while u(i)>=((k-1)*(1/n))&&u(i)<(k*(1/n))&&u(i)>=0; u(i)=Y(k); w(i,:)=sa(k,:); end end end Btopibntg=(inv(w'*w))*(w'*u); bb=length(Btopibntg); for l=1:bb Bbntg(l,j)=Btopibntg(l,:); end end Bbntg; Bbntgboot=Bbntg'; SO=sort(Bbntgboot); Bboot=mean(Bbntgboot); Bias=Bboot'-Basli; if n<30 tt=abs(tinv((ts/2),(n-length(Bboot)))); else tt=abs(norminv((ts/2),0,1)); end for d=1:ip SK=[SO(:,d)]; SEboot(d,:)=s*(sqrt(In(d,d))); Nbb=Basli(d)-(tt*s*(sqrt(In(d,d)))); Nba=Basli(d)+(tt*s*(sqrt(In(d,d)))); Pbb=SK(ceil(re*(ts/2))); Pba=SK(round(re*(1-(ts/2)))); SKlower(d,:)=Nbb; SKupper(d,:)=Nba; PERlower(d,:)=Pbb; PERupper(d,:)=Pba; end SKlower; SKupper; PERlower; PERupper; disp(' ')


127

disp(' Beta Topi Asli Beta Topi Bootstrap SE Bootstrap') for qq=1:ip fprintf('%12.5f%20.5f%22.5f%22.5f\n',Basli(qq),Bboot(qq),SEboot(qq),Bias(qq)) end disp(' ') disp('SK normal BB SK normal BA') for qq=1:ip fprintf('%10.5f%19.5f\n',SKlower(qq),SKupper(qq)) end disp(' ') disp('SK percentil BB SK percentil BA') for qq=1:ip fprintf('%12.5f%20.5f\n',PERlower(qq),PERupper(qq)) end toc Program 4.3. %PROGRAM 4.3 %program bootstrap pendekatan parameter regresi dengan regressor RANDOM %(tanpa konstanta) %t= banyaknya variabel independen %mu= vektor berisi t elemen yang berisi rata-rata untuk masing-masing %variabel independen %sig= matriks berukuran txt yang elemen diagonalnya berisi variansi dari %variabel independen yang indeksnya bersesuaian. harus semi definite %positif. %n= ukuran sampel %re= banyaknya sampel bootstrap %ip= banyaknya parameter regresi %er= standar deviasi untuk bilangan random normal %ts= tingkat signifikansi selang kepercayaan parameter regresi %beta= koefisien regresi populasi %vv= vektor berisi bilangan random normal dengan mean=0 dan var=er^2 yang digunakan sebagai eror untuk %Y. %X= matriks VARIABEL INDEPENDEN %Y= vektor VARIABEL DEPENDEN %u= matriks berisi bilangan random %Basli=Beta topi; vektor parameter penduga koefisien regresi asli. %s= standar deviasi dari eror %Bbntg= matriks berisi nilai Beta pendekatan dengan bootstrap %Bboot= vektor berisi hasil pendekatan parameter regresi bootstrap yang %didapat dari rata-rata kolom Bbntg %Bias= besarnya bias dari parameter bootstrap terhadap parameter penduga %asli


128

%SEboot= vektor berisi hasil pendekatan standar eror untuk parameter %regresi bootstrap %SKlower= batas bawah selang kepercayaan parameter regresi bootstrap pendekatan normal %SKupper= batas atas selang kepercayaan parameter regresi bootstrap pendekatan normal %PERlower= batas bawah selang kepercayaan parameter regresi bootstrap dengan %metode percentil %PERupper=batas atas selang kepercayaan parameter regresi bootstrap dengan %metode percentil clear; clc; t=input('masukkan banyaknya variabel independen: '); mu=input('masukkan vektor mu yang berisi rata-rata dari masing-masing variabel bebas: '); sig=input('masukkan matriks covariance: '); n=input('masukkan ukuran sampel: '); re=input('masukkan banyaknya sampel bootstrap: '); ip=t; lm=ip; er=input('masukkan standar deviasi galat: '); ts=input('masukkan tingkat signifikansi: '); for pp=1:ip beta(pp,:)=input('masukkan koefisien regresi: '); end tic x=mvnrnd(mu,sig,n); vv=normrnd(0,er,n,1); X=x; jj=X*beta; Y=(X*beta)+vv; In=inv(X'*X); Basli=In*(X'*Y); pro=(Y-(X*Basli)).*(Y-(X*Basli)); s=sqrt(((Y'*Y)-((Basli')*X'*Y))/(n-ip)); ss=sqrt((sum(pro))/(n-ip)); for j=1:re u=rand(n,1); saX=x; w=repmat(u,1,ip); for i=1:n for k=1:n while u(i)>=((k-1)*(1/n))&&u(i)<(k*(1/n))&&u(i)>=0; u(i)=Y(k); w(i,:)=saX(k,:); break end end end Btopibntg=(inv(w'*w))*(w'*u);


129

f=length(Btopibntg); for l=1:f Bbntg(l,j)=Btopibntg(l,:); end end Bbntg; Bbntgboot=Bbntg'; SO=sort(Bbntgboot); Bboot=mean(Bbntgboot); Bias=Bboot'-Basli; if n<30 tt=abs(tinv((ts/2),(n-ip))); else tt=abs(norminv((ts/2),0,1)); end for d=1:ip SK=[SO(:,d)]; SEboot(d,:)=s*(sqrt(In(d,d))) Nbb=Basli(d)-(tt*s*(sqrt(In(d,d)))) Nba=Basli(d)+(tt*s*(sqrt(In(d,d)))) Pbb=SK(ceil(re*(ts/2))); Pba=SK(round(re*(1-(ts/2)))); SKlower(d,:)=Nbb; SKupper(d,:)=Nba; PERlower(d,:)=Pbb; PERupper(d,:)=Pba; end SKlower; SKupper; PERlower; PERupper; SEboot; disp(' ') disp(' Beta Topi Asli Beta Topi Bootstrap SE Bootstrap') for qq=1:ip fprintf('%12.5f%20.5f%22.5f%22.5f\n',Basli(qq),Bboot(qq),SEboot(qq),Bias(qq)) end disp(' ') disp('SK normal BB SK normal BA jarak') for qq=1:ip fprintf('%10.5f%19.5f%19.5f\n',SKlower(qq),SKupper(qq),jarSK(qq)) end disp(' ') disp('SK percentil BB SK percentil BA jarak') for qq=1:ip fprintf('%12.5f%20.5f%20.5f\n',PERlower(qq),PERupper(qq),jarPER(qq)) end toc


130

Program 4.4. %PROGRAM 4.4 %program bootstrap pendekatan parameter regresi dengan regressor FIXED %X= matriks VARIABEL INDEPENDEN yang bersifat tetap/fixed %Y= vektor VARIABEL DEPENDEN %re= banyaknya resampel bootstrap %u= matriks berisi bilangan random %Btopi=Beta topi; vektor parameter penduga koefisien regresi awal. %E= vektor nilai RESIDUAL dari model regresi (digunakan sebagai sampel % asli) %Eboot= matriks berisi hasil resampel dengan metode bootstrap % baris menyatakan ukuran sampel % kolom menyatakan banyaknya resampel (sampel bootstrap) %Ybntg= matriks berisi hasil pendekatan nilai Y bintang bootstrap %Btopibntg= vektor berisi nilai Beta pendekatan dengan bootstrap %Bbntg= matriks berisi nilai rata-rata dari Btopibntg; merupakan hasil akhir %untuk parameter regresi bootstrap %Bboot= vektor berisi hasil pendekatan parameter regresi bootstrap yang %didapat dari rata-rata kolom Bbntg %s= standar deviasi dari eror %Bias= besarnya bias dari parameter bootstrap terhadap parameter penduga %SEboot= vektor berisi hasil pendekatan standar eror untuk parameter regresi bootstrap yang %didapat dari standar deviasi dari kolom Bbntg %SKlower= batas bawah selang kepercayaan parameter regresi bootstrap pendekatan normal %SKupper= batas atas selang kepercayaan parameter regresi bootstrap pendekatan normal %PERlower= batas bawah selang kepercayaan parameter regresi bootstrap dengan %metode percentil %PERupper=batas atas selang kepercayaan parameter regresi bootstrap dengan %metode percentil clear clc tic t=input('masukkan banyaknya variabel independen: '); re=input('masukkan banyaknya sampel bootstrap: '); ip=t+1; ts=input('masukkan tingkat signifikansi: '); x=input('masukkan matriks Variabel Independen: '); Y=input('masukkan matriks Variabel Dependen: '); n=length(x); tic oo=ones(n,1); X=[oo,x]; In=inv(X'*X); Btopi=In*(X'*Y);


131

Ytopi=X*(Btopi); E=Y-(Ytopi); tr=E'; n=length(tr); s=((Y'*Y)-(Btopi'*X'*Y))/(n-ip); u=rand(n,re); for j=1:re for i=1:n for k=1:n while u(i,j)<(k*(1/n))&&u(i,j)>=((k-1)*(1/n))&&u(i,j)>=0; u(i,j)=tr(k); break end end end end Eboot=u; XB=X*Btopi; for j=1:re; for i=1:n; A(i,j)=XB(i,1); end end A; Ybntg=A+Eboot; C=(inv(X'*X))*(X'); rows=length(C(:,1)); Bbntg=zeros(rows,re); for j=1:re; Btopibntg=C*Ybntg(:,j); for i=1:rows Bbntg(i,j)=Btopibntg(i,:); end end trp=Bbntg'; Bboot=mean(trp); Bias=Bboot'-Btopi; SO=sort(trp); if n<30 tt=abs(tinv((ts/2),(n-length(Bboot)))); else tt=abs(norminv((ts/2),0,1)); end for d=1:ip SK=[SO(:,d)]; Nbb=Btopi(d)-(tt*s*(sqrt(In(d,d)))); Nba=Btopi(d)+(tt*s*(sqrt(In(d,d)))); Pbb=SK(ceil(re*(ts/2))); Pba=SK(round(re*(1-(ts/2)))); SKlower(d,:)=Nbb; SKupper(d,:)=Nba; PERlower(d,:)=Pbb; PERupper(d,:)=Pba; SEboot(d,:)=s*(sqrt(In(d,d)));


132

end SKlower; SKupper; PERlower; PERupper; disp(' ') disp(' Beta Topi Asli Beta Topi Bootstrap SE Bootstrap') for qq=1:ip fprintf('%10.5f%20.5f%23.5f%15.5f\n',Btopi(qq),Bboot(qq),SEboot(qq),Bias(qq)) end disp(' ') disp('SK normal BB SK normal BA') for qq=1:ip fprintf('%10.5f%19.5f\n',SKlower(qq),SKupper(qq)) end disp(' ') disp('SK percentil BB SK percentil BA') for qq=1:ip fprintf('%12.5f%20.5f\n',PERlower(qq),PERupper(qq)) end toc Program 4.5. %PROGRAM 4.5 %program bootstrap pendekatan parameter regresi dengan regressor FIXED %t= banyaknya variabel independen %mu= vektor berisi t elemen yang berisi rata-rata untuk masing-masing %variabel independen %sig= matriks berukuran txt yang elemen diagonalnya berisi variansi dari %variabel independen yang indeksnya bersesuaian. harus semi definite %positif. %n= ukuran sampel %re= banyaknya sampel bootstrap %ip= banyaknya parameter regresi %er= standar deviasi untuk bilangan random normal %ts= tingkat signifikansi selang kepercayaan parameter regresi %beta= koefisien regresi populasi %vv= vektor berisi bilangan random normal dengan mean=0 dan var=er^2 yang digunakan sebagai eror untuk %Y. %X= matriks VARIABEL INDEPENDEN %Y= vektor VARIABEL DEPENDEN %u= matriks berisi bilangan random %Basli=Beta topi; vektor parameter penduga koefisien regresi asli. %s= standar deviasi dari eror%E= vektor nilai RESIDUAL dari model regresi (digunakan sebagai sampel


133

% asli) %Eboot= matriks berisi hasil resampel dengan metode bootstrap % baris menyatakan ukuran sampel % kolom menyatakan banyaknya resampel (sampel bootstrap) %Ybntg= matriks berisi hasil pendekatan nilai Y bintang bootstrap %Btopibntg= vektor berisi nilai Beta pendekatan dengan bootstrap %Bbntg= vektor berisi nilai rata-rata dari Btopibntg; merupakan hasil akhir %untuk parameter regresi bootstrap %Bboot= vektor berisi hasil pendekatan parameter regresi bootstrap yang %didapat dari rata-rata kolom Bbntg %Bias= besarnya bias dari parameter bootstrap terhadap parameter penduga %SEboot= vektor berisi hasil pendekatan standar eror untuk parameter regresi bootstrap yang %didapat dari standar deviasi dari kolom Bbntg %SKlower= batas bawah selang kepercayaan parameter regresi bootstrap pendekatan normal %SKupper= batas atas selang kepercayaan parameter regresi bootstrap pendekatan normal %PERlower= batas bawah selang kepercayaan parameter regresi bootstrap dengan %metode percentil %PERupper=batas atas selang kepercayaan parameter regresi bootstrap dengan %metode percentil clear clc t=input('masukkan banyaknya variabel independen: '); mu=input('masukkan vektor mu yang berisi rata-rata dari masing-masing variabel bebas: '); sig=input('masukkan matriks covariance yang elemen diagonalnya berisi variansi dari variabel bebas yang bersesuaian: '); n=input('masukkan banyaknya jumlah sampel: '); ip=t; re=input('masukkan banyaknya sampel bootstrap: '); lm=ip; er=input('masukkan standar deviasi dari galat: '); ts=input('masukkan tingkat signifikansi: '); tic for pp=1:ip beta(pp,:)=input('masukkan koefisien regresi: '); end x=mvnrnd(mu,sig,n); vv=normrnd(0,er,n,1); X=x; jj=X*beta; Y=(X*beta)+vv; In=inv(X'*X); Btopi=(In*(X'*Y));


134

Ytopi=X*(Btopi); E=Y-(Ytopi); tr=E'; s=sqrt(((Y'*Y)-((Btopi')*X'*Y))/(n-ip)); a=length(tr); u=rand(a,re); for j=1:re; for i=1:a; for k=1:a; while u(i,j)<(k*(1/a))&&u(i,j)>=((k-1)*(1/a))&&u(i,j)>=0; u(i,j)=tr(k); break end end end end Eboot=u; XB=X*Btopi; for j=1:re; for i=1:a; A(i,j)=XB(i,1); end end A; Ybntg=A+Eboot; C=In*X'; rows=length(C(:,1)); Bbntg=zeros(rows,re); for j=1:re; Btopibntg=C*Ybntg(:,j); for i=1:rows; Bbntg(i,j)=Btopibntg(i,:); end end trp=Bbntg'; Bboot=mean(trp); Bias=Bboot'-Btopi; SO=sort(trp); if a<30 tt=abs(tinv((ts/2),(a-(length(Bboot))))); else tt=abs(norminv((ts/2),0,1)); end for d=1:ip SK=[SO(:,d)]; SEboot(d,:)=s*(sqrt(In(d,d))) Nbb=Btopi(d)-(tt*(SEboot(d))); Nba=Btopi(d)+(tt*(SEboot(d))); Pbb=SK(ceil(re*(ts/2))); Pba=SK(round(re*(1-(ts/2)))); SKlower(d,:)=Nbb; SKupper(d,:)=Nba; PERlower(d,:)=Pbb; PERupper(d,:)=Pba; end


135

SKlower; SKupper; PERlower; PERupper; disp(' ') disp(' Beta Topi Asli Beta Topi Bootstrap SE Bootstrap Bias') for qq=1:ip fprintf('%10.5f%20.5f%23.5f%15.5f\n',Btopi(qq),Bboot(qq),SEboot(qq),Bias(qq)) end disp(' ') disp('SK normal BB SK normal BA') for qq=1:ip fprintf('%10.5f%19.5f\n',SKlower(qq),SKupper(qq)) end disp(' ') disp('SK percentil BB SK percentil BA') for qq=1:ip fprintf('%12.5f%20.5f\n',PERlower(qq),PERupper(qq)) end toc


PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIbuah replikasi bootstrap. Pada regresi linear berganda, metode bootstrap dibedakan menjadi dua, yaitu resampling pasangan terurut observasi

Documents