METODE BOOTSTRAP DAN APLIKASINYA Skripsi Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Program Studi Matematika Oleh: Amelia Enrika NIM: 083114001 PROGRAM STUDI MATEMATIKA, JURUSAN MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA YOGYAKARTA 2011 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
155
Embed
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIbuah replikasi bootstrap. Pada regresi linear berganda, metode bootstrap dibedakan menjadi dua, yaitu resampling pasangan terurut observasi
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
METODE BOOTSTRAP DAN APLIKASINYA
Skripsi
Diajukan untuk Memenuhi Salah Satu Syarat
Memperoleh Gelar Sarjana Program Studi Matematika
Oleh:
Amelia Enrika
NIM: 083114001
PROGRAM STUDI MATEMATIKA, JURUSAN MATEMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS SANATA DHARMA
YOGYAKARTA
2011
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
i
METODE BOOTSTRAP DAN APLIKASINYA
Skripsi
Diajukan untuk Memenuhi Salah Satu Syarat
Memperoleh Gelar Sarjana Program Studi Matematika
Oleh:
Amelia Enrika
NIM: 083114001
PROGRAM STUDI MATEMATIKA, JURUSAN MATEMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS SANATA DHARMA
YOGYAKARTA
2011
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ii
BOOTSTRAP METHOD AND ITS APPLICATIONS
Thesis
Presented as Partial Fulfillment of the Requirements
to Obtain the Sarjana Sains Degree in Mathematics
By:
Amelia Enrika
Student Number: 083114001
MATHEMATICS STUDY PROGRAM, DEPARTMENT OF
MATHEMATICS
FACULTY OF SCIENCE AND TECHNOLOGY
SANATA DHARMA UNIVERSITY
YOGYAKARTA
2011
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
v
To reach a port, we must sail
Sail, not tie at anchor
Sail, not drift.
-Franklin Roosevelt-
Skripsi ini dipersembahkan untuk,
Allah Bapa, Putra dan Roh Kudus,
Kedua orang tua tercinta, Beng Lay dan Nanie,
Saudari terkasih, Seniyawati dan Novia Paulien,
Aga Hutama Tirta dan Tante Lina tersayang,
Serta orang-orang yang selalu berada di sisi saya.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
vii
ABSTRAK
Tulisan ini membahas tentang metode bootstrap yang prinsipnya adalah memperlakukan sampel acak asli sebagai populasi, kemudian melakukan resampel sebanyak 𝑏𝑏 kali sebanyak mungkin, sehingga diharapkan distribusi dari sampel bootstrap tersebut mendekati normal. Dengan demikian, distribusi sampling bootstrap tersebut dapat digunakan untuk memberikan penjelasan tentang distribusi sampling, serta distribusi populasi.
Aplikasi metode bootstrap dalam statistika yang dibahas adalah pada pendugaan parameter populasi rata-rata, galat standar dan koefisien regresi linear berganda, serta pendugaan selang kepercayaan untuk rata-rata populasi dan koefisien regresi linear berganda. Pada pendugaan parameter rata-rata populasi dan galat standar digunakan metode bootstrap biasa, sedangkan untuk pendugaan selang kepercayaannya digunakan metode persentil bootstrap. Persentil bootstrap membentuk selang kepercayaan (1 − 𝛼𝛼)% dengan cara mengambil data persentil ke (𝛼𝛼 2⁄ )100 dan (1 − (𝛼𝛼 2⁄ ))100 sebagai batas bawah dan atas selang, dari 𝑏𝑏 buah replikasi bootstrap. Pada regresi linear berganda, metode bootstrap dibedakan menjadi dua, yaitu resampling pasangan terurut observasi dan resampling galat dari model regresi linear berganda. Selang kepercayaan koefisien regresi dipadukan antara kedua metode tersebut dengan metode persentil bootstrap.
Pendugaan parameter populasi dengan bootstrap dianggap cukup mendekati parameter penduga asli dan distribusinya mendekati normal seiring membesarnya nilai 𝑏𝑏 dan selang kepercayaan yang dibentuk dengan persentil bootstrap selalu menghasilkan selang yang lebih sempit dibandingkan dengan selang kepercayaan secara teoritis dengan tingkat signifikansi yang sama.
Kata kunci: metode bootstrap, resampling, rata-rata bootstrap, galat standar bootstrap, persentil bootstrap, regresi bootstrap, parameter populasi, koefisien regresi, resampling observasi, resampling galat
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
viii
ABSTRACT
This thesis discusses bootstrap method which treats original random sample as a population. The original random sample was resampled 𝑏𝑏 times as many as we can, so that the bootstrap sampling distribution approximates the normal distribution. Thus, the bootstrap distribution could be used to explain the sampling distribution and the population distribution.
Bootstrap method is applied in estimation of population mean, standard error, and multiple linear regression coefficients. In the estimation of mean and standard error of population, we use ordinary bootstrap method, while percentile bootstrap is used to estimate the confidence interval. Percentile bootstrap constructs a (1 − 𝛼𝛼)100% confidence interval by taking the (𝛼𝛼 2⁄ )100 and (1 − (𝛼𝛼 2⁄ ))100 percentile data of 𝑏𝑏 bootstrap replications as a lower limit and upper limit respectively. In multiple linear regression, there are two bootstrap methods, those are pair observation resampling and error/residual resampling. Confidence interval of regression coefficient is built by combining those two methods and percentile bootstrap.
The use of bootstrap method to estimate the population parameter is considered close to ordinary estimator and its distribution is approximate normal distribution as the increasing the value of 𝑏𝑏. At the same level of significance, the percentile bootstrap confidence interval always narrower than theoretical confidence interval.
4. Selang Kepercayaan Untuk Parameter Regresi …………………. 34
BAB III METODE BOOTSTRAP
A. Prinsip Dasar Dan Algoritma Metode Bootstrap ……………………. 35
B. Aplikasi Pendekatan Galat Standar Dari Mean Dengan
Metode Bootstrap ……………………………………………………. 46
BAB IV APLIKASI METODE BOOTSTRAP
A. Metode Persentil Bootstrap
1. Dasar Pembentukan Selang Parameter Populasi Dengan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xiv
Metode Persentil Bootstrap ……………………………………… 54
2. Pembentukan Selang Kepercayaan Dengan Metode
Persentil Bootstrap ………………………………………………. 57
B. Regresi Linear Bootstrap
1. Metode Bootstrap Untuk Pendugaan Parameter Dalam
Regresi Linear Berganda ………………………………………… 64
a. Algoritma Metode Bootstrap Untuk
Meresampling Observasi …………………………………….. 65
b. Algoritma Metode Bootstrap Untuk
Meresampling Galat …………………………………………. 72
2. Pembentukan Selang Kepercayaan Bootstrap
Untuk Parameter Regresi ………………………………………… 79
BAB V PENUTUP
A. Kesimpulan …………………………………………………………… 87
B. Saran ………………………………………………………………….. 88
DAFTAR PUSTAKA ……………………………………………………….. 89
LAMPIRAN …………………………………………………………………. 91
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xv
DAFTAR GAMBAR
Halaman
GAMBAR 1.1. ................................................................................................... 4
GAMBAR 2.1. ................................................................................................... 25
GAMBAR 2.2. ................................................................................................... 25
GAMBAR 3.1. ................................................................................................... 35
GAMBAR 3.2. ................................................................................................... 41
GAMBAR 3.3. ................................................................................................... 42
GAMBAR 3.4. ................................................................................................... 42
GAMBAR 3.5. ................................................................................................... 44
GAMBAR 3.6. ................................................................................................... 45
GAMBAR 3.7. ................................................................................................... 115
GAMBAR 3.8. ................................................................................................... 52
GAMBAR 4.1. ................................................................................................... 116
GAMBAR 4.2. ................................................................................................... 66
GAMBAR 4.3. ................................................................................................... 66
GAMBAR 4.4. ................................................................................................... 117
GAMBAR 4.5. ................................................................................................... 118
GAMBAR 4.6. ................................................................................................... 75
GAMBAR 4.7. ................................................................................................... 119
GAMBAR 4.8. ................................................................................................... 120
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xvi
DAFTAR TABEL
Halaman
TABEL 3.1. …………………………………………………………………… 91
TABEL 3.2. …………………………………………………………………... 91
TABEL 3.3. …………………………………………………………………… 91
TABEL 3.4. …………………………………………………………………… 92
TABEL 3.5. …………………………………………………………………… 92
TABEL 3.6. …………………………………………………………………… 93
TABEL 4.1. …………………………………………………………………… 94
TABEL 4.2. …………………………………………………………………… 94
TABEL 4.3. …………………………………………………………………… 95
TABEL 4.4. …………………………………………………………………… 95
TABEL 4.5. …………………………………………………………………… 96
TABEL 4.6. …………………………………………………………………… 97
TABEL 4.7. …………………………………………………………………… 98
TABEL 4.8. …………………………………………………………………… 99
TABEL 4.9. …………………………………………………………………… 100
TABEL 4.10. …………………………………………………………………. 101
TABEL 4.11. ………………………………………………………………….. 102
TABEL 4.12. …………………………………………………………………. 102
TABEL 4.13. ………………………………………………………………….. 102
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xvii
TABEL 4.14. …………………………………………………………………. 103
TABEL 4.15. …………………………………………………………………. 103
TABEL 4.16. …………………………………………………………………. 103
TABEL 4.17. …………………………………………………………………. 104
TABEL 4.18. …………………………………………………………………. 104
TABEL 4.19. …………………………………………………………………. 104
TABEL 4.20. …………………………………………………………………. 105
TABEL 4.21. …………………………………………………………………. 105
TABEL 4.22. …………………………………………………………………. 106
TABEL 4.23. …………………………………………………………………. 106
TABEL 4.24. …………………………………………………………………. 106
TABEL 4.25. …………………………………………………………………. 107
TABEL 4.26. …………………………………………………………………. 107
TABEL 4.27. …………………………………………………………………. 107
TABEL 4.28. …………………………………………………………………. 108
TABEL 4.29. …………………………………………………………………. 108
TABEL 4.30. …………………………………………………………………. 108
TABEL 4.31. …………………………………………………………………. 109
TABEL 4.32. …………………………………………………………………. 109
TABEL 4.33. …………………………………………………………………. 109
TABEL 4.34. …………………………………………………………………. 110
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xviii
TABEL 4.35. …………………………………………………………………. 110
TABEL 4.36. …………………………………………………………………. 111
TABEL 4.37. …………………………………………………………………. 113
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xix
DAFTAR PROGRAM
Halaman
PROGRAM 3.1. ……………………………………………………………… 121
PROGRAM 4.1. ……………………………………………………………… 123
PROGRAM 4.2. ……………………………………………………………… 124
PROGRAM 4.3. ……………………………………………………………… 127
PROGRAM 4.4. ……………………………………………………………… 130
PROGRAM 4.5. ……………………………………………………………… 132
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB I
PENDAHULUAN
A. Latar Belakang Masalah
Sampling, yang berarti pengambilan sampel sering digunakan oleh para
statistikawan atau ilmuwan untuk mempermudah penelitian mereka, karena
ketidakmungkinan peneliti untuk mengobservasi objek-objek populasi secara
menyeluruh. Keterbatasan biaya, waktu, tenaga peneliti dan juga kesulitan pe-
ngumpulan data populasi adalah alasan-alasan dilakukannya sampling. Ba-
nyak metode sampling yang telah diciptakan oleh para peneliti, sebagai contoh
Metode Sampel Acak Sederhana, Metode Stratifikasi, Metode Cluster, dan se-
bagainya. Dari metode sampling ini, muncul pengembangannya, yaitu resam-
pling. Selama beberapa dekade terakhir, telah dilakukan pengembangan me-
tode resampling, Metode Jackknife, Metode Cross-validation dan Metode
Bootstrap merupakan teknik resampling yang sering digunakan para peneliti
dalam menganalisis data.
Dalam kondisi praktis dan statistikal, bentuk distribusi sampling jarang
diketahui secara pasti. Pendekatan parametrik tradisional lebih menekankan
pendugaan distribusi sampling dibandingkan pembuatan inferensi terhadap pa-
rameter populasi dari sebuah sampel. Cara yang digunakan adalah dengan
mengasumsikan bentuk distribusi sampling dari parameter penduga yang dike-
tahui sifat-sifat probabilitasnya (contohnya distribusi normal atau eksponen-
sial). Dalam pendekatan parametrik tradisional, parameter dari distribusi
sampling diduga secara analitik. Para peneliti dan statistikawan melakukan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
2
perhitungan secara analitik menggunakan rumus yang rumit. Namun sering
kali ditemukan kendala berkaitan dengan distribusi sampling. Biasanya ken-
dala tersebut berupa kesulitan mendekati distribusi sampling secara analitik,
baik karena perhitungan yang terlalu sulit atau rumus yang rumit. Selain itu,
pendekatan secara analitik menggunakan asumsi-asumsi tertentu seperti ben-
tuk distribusi, apakah data tersebut normal atau tidak, ataupun bergantung pa-
da Teorema Limit Pusat. Pada kenyataannya secara praktis, terkadang para
peneliti tidak bisa bergantung pada asumsi-asumsi tersebut. Kesulitan untuk
mendekati distribusi sampling secara analitik tersebut menyebabkan data tidak
bisa diolah secara analitik. Akibatnya, parameter populasi pun sulit untuk di-
dekati secara analitik. Maka dari itu, banyak dilakukan riset untuk mengolah
data secara langsung dengan komputer untuk menanggulangi masalah-
masalah tersebut.
Perkembangan teknologi komputer yang sangat signifikan dalam bebe-
rapa dekade terakhir ini memberikan pengaruh yang besar dalam bidang statis-
tika. Analisis data menjadi lebih mudah dilakukan dengan adanya otomatisasi
penggambaran grafik dan perhitungan data. Studi statistikal yang melibatkan
himpunan data yang besar dan kompleks sekarang ini mampu dianalisa de-
ngan lebih mudah, sehingga juga berpengaruh pada efisiensi biaya penelitian.
Penelitian dapat dilakukan lebih cepat dan lebih sedikit biaya dibandingkan
dulu karena banyak muncul metode yang menerapkan komputasi yang sebe-
lumnya tidak terpikirkan untuk pendugaan parameter populasi, pembentukan
selang kepercayaan, dan uji signifikansi.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
3
Pada tahun 1979, Bradley Efron mengembangkan metode Bootstrap un-
tuk pertama kalinya. Metode resampling yang berbasis komputer ini, bukan
metode resampling yang pertama kali muncul. Menurut Kvam dan Vidakovic
(2007), sebelum Metode Bootstrap, ada metode permutasi Fisher, Pitman, dan
metode Jackknife, tetapi metode Bootstrap adalah metode resampling yang
paling populer yang digunakan para peneliti pada saat ini. Metode ini sangat
popular di kalangan para peneliti karena metode ini langsung mengolah data,
menggunakan komputer sebagai pengolah datanya. Lagipula, para peneliti ti-
dak membutuhkan hitungan teoritis untuk mencapai parameter populasi tu-
juannya. Bootstrap baru-baru dikembangkan karena sangat bergantung pada
kecanggihan teknologi komputer untuk melakukan perhitungannya. Dengan
menyimulasikan langsung data-data yang ada, bootstrap menghindarkan kita
dari pembuatan model dan asumsi-asumsi yang tak dibutuhkan tentang para-
meter. Secara imajinatif, metode ini seolah-olah menarik diri sendiri dengan
tali sepatu sendiri (dengan mengambil sampel dari sampel itu sendiri) diban-
ding menggantungkan diri pada bantuan luar (dari asumsi-asumsi parametrik).
Dari sisi tersebut, metode bootstrap terlihat seperti sebuah prosedur nonpara-
metrik. Kenyataannya, bootstrap merupakan teknik resampling yang meli-
batkan bentuk parametrik dan nonparametrik, tetapi pada esensinya, merupa-
kan prosedur yang lebih bersifat empiris.
Efron menganalogikan istilah bootstrap dengan cerita rakyat Inggris, ya-
itu cerita Petualangan Baron von Munchausen. Dikisahkan sang Baron mele-
paskan diri dari rawa dengan menarik dirinya sendiri dengan menggunakan ta-
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
4
li sepatunya sendiri. Keadaan di mana sang Baron menggunakan tali sepa-
tunya sendiri untuk menyelamatkan dirinya, inilah yang dianalogikan Efron
dalam metode Bootstrap.
Peneliti menggunakan sampel dari sampel itu sendiri untuk mengetahui
parameter populasi. Efron ingin mendeskripsikan metode ini dengan istilah
bootstrap untuk membantu kita memahami karakteristik dari suatu estimator
tanpa bantuan dari model probabilitas tambahan atau asumsi-asumsi parame-
trik. Ketika memperkenalkan versi bootstrap, Efron termotivasi oleh dua ma-
salah yang paling penting dalam statistika terapan, yaitu penentuan penduga
untuk suatu parameter tujuan dan evaluasi dari keakuratan dari penduga terse-
but melalui galat standar dari penduga dan penentuan selang kepercayaan un-
tuk parameter tujuan tersebut. Sampel asli yang pertama kali diambil dipan-
dang sebagai suatu populasi karena sampel asli sebanyak 𝑛𝑛 buah itu dianggap
Gambar 1.1. Pada versi awal cerita, dikatakan bahwa Sang Baron menggunakan rambutnya sendiri untuk menyelamatkan dirinya sendiri. Tetapi lama-kelamaan ceritanya berubah menjadi Sang Baron menye-lamatkan dirinya dengan bootstrap.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
5
mewakili karakteristik-karakteristik dari populasi (karena pengambilannya di-
lakukan secara acak). Karena perlakuan itu, metode bootstrap tidak memerlu-
kan asumsi kuat terhadap distribusi sampling dari statistik penduga untuk
mendekati distribusi samplingnya. Jadi begitu pula dengan resampel atau
sampel bootstrap yang diambil dengan pengembalian juga dianggap merepre-
sentasikan populasi sama halnya seperti bila kita mengambil banyak sampel
dari populasi. Banyak dilakukan simulasi dari data-data sampel yang telah
tersedia sangatlah menguntungkan peneliti atau statistikawan. Hal itu meng-
hindarkan kita dari pembuatan asumsi-asumsi yang tidak dibutuhkan tentang
parameter dan model. Bila dibandingkan dengan pendekatan parametrik tradi-
sional, metode bootstrap memuat lebih banyak repetisi dari komputasi data
sampel untuk mendekati bentuk distribusi sampling suatu statistik bila diban-
ding asumsi distribusional yang kuat ataupun formula analitik. Kelebihan
yang lain dari metode ini adalah dapat diterapkan seberapapun sulitnya ke-
mungkinan pencapaian nilai penduga parameter populasi. Para peneliti ba-
nyak menggunakan metode ini untuk diterapkan dalam berbagai bidang, con-
tohnya di bidang psikologi, geologi, ekonometrika, biologi, teknik, kimia dan
akunting. Bootstrap sering digunakan pada bidang-bidang tersebut karena se-
ring kali para peneliti hanya memiliki data sampel yang sangat sedikit.
Metode ini sering digunakan ketika distribusi sampling dari statistik ti-
dak dapat diasumsikan berdistribusi normal (seperti mengestimasi koefisien
regresi dengan Ordinary Least Square), atau ketika distribusi sampling tidak
memiliki solusi analitik atau tidak tahu bagaimana cara mendekatinya secara
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
6
analitik. Selain itu, bila ukuran populasinya cukup besar sehingga sulit untuk
menentukan kerangka sampel, lebih baik dilakukan resampling dengan me-
tode ini.
Dalam statistika, kita mengenal penduga parameter populasi berupa se-
lang kepercayaan. Selang kepercayaan suatu parameter θ dibentuk dengan
menentukan suatu selang nilai yang dengan peluang besar memuat parameter
yang diduga (parameter populasi) dan erornya harus minimum. Bentuk selang
kepercayaan ada tiga, yaitu:
�∞,𝜃𝜃�𝑈𝑈�, �𝜃𝜃�𝐿𝐿 ,∞�, �𝜃𝜃�𝐿𝐿 ,𝜃𝜃�𝑈𝑈�
dengan 𝜃𝜃�𝑈𝑈 adalah batas atas selang dan 𝜃𝜃�𝐿𝐿 adalah batas bawah selang. Dalam
tulisan ini, akan diulas bagaimana membentuk selang kepercayaan tersebut de-
ngan metode Bootstrap. Pembentukan selang kepercayaan yang akan diulas
adalah pembentukan selang kepercayaan dengan metode Persentil Bootstrap.
Metode Persentil Bootstrap menghasilkan selang kepercayaan yang lebih pen-
dek, variansi yang lebih kecil, dan tingkat kepercayaan yang lebih tinggi jika
dibandingkan dengan metode lain yang selama ini digunakan.
Metode Bootstrap juga dapat diterapkan pada regresi linear untuk mere-
sampling sampelnya dalam upaya mendekati koefisien-koefisien model regre-
si linear. Prinsip resampling bootstrap dalam regresi linear dibedakan berda-
sarkan asumsi tetap atau acaknya variabel independen dari sampel asli.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
7
B. Perumusan Masalah
Permasalahan yang akan dibahas dalam tulisan ini akan dirumuskan se-
bagai berikut:
1. Apakah yang dimaksud dengan metode Bootstrap dan bagaimana landasan
teoritiknya?
2. Bagaimana penerapan metode Bootstrap pada pendugaan selang parameter
populasi dan parameter regresi linear berganda?
3. Bagaimana algoritma dan pemrograman MATLAB untuk pendugaan se-
lang parameter populasi dengan menggunakan metode Bootstrap?
4. Bagaimana algoritma dan pemrograman MATLAB untuk pendugaan pa-
rameter regresi dengan menggunakan metode Bootstrap?
C. Pembatasan Masalah
Penulis akan membatasi beberapa hal untuk uraian masalah yang akan
dibahas, yaitu:
1. Distribusi normal dan Student-t tidak dibahas dalam tulisan ini.
2. Pembentukan selang parameter populasi dengan prinsip Bootstrap dibatasi
hanya menggunakan metode Persentil Bootstrap.
3. Aplikasi metode bootstrap hanya dibatasi pada pendugaan parameter rata-
rata populasi, parameter koefisien regresi berganda, selang kepercayaan
rata-rata populasi, dan selang kepercayaan koefisien regresi berganda.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
8
D. Tujuan Penulisan
Tulisan ini disusun dengan tujuan agar dapat lebih memahami salah satu
teknik resampling yang sering digunakan dalam statistika, yaitu Metode Boot-
strap. Terlebih lagi, akan dipelajari prinsip Bootstrap dalam metode Persentil
Bootstrap untuk membangun selang kepercayaan parameter populasi. Selain
itu, prinsip bootstrap dalam regresi linear berganda juga dipelajari dalam tuli-
san ini. Sebagai tambahan, kitapun akan mempelajari bagaimana penerapan
prinsip-prinsip tersebut dalam pemrograman MATLAB. Tulisan ini juga di-
susun sebagai pemenuhan tugas akhir dalam Program Studi Matematika Un-
iversitas Sanata Dharma.
E. Manfaat Penulisan
Dengan memperlajari topik ini kita dapat mempelajari kegunaan-
kegunaan metode Bootstrap dalam membangun selang penduga parameter po-
pulasi dengan memanfaatkan data-data yang ada. Kita juga dapat mempelajari
prinsip bootstrap dalam pengambilan sampel dalam regresi linear berganda.
Terlebih dari itu, kita juga dapat menerapkan metode tersebut dalam algoritma
dan pemrograman MATLAB sehingga proses komputasi lebih efektif dan efi-
sien.
F. Metode Penulisan
Penulis menggunakan metode studi kepustakaan, yaitu dengan mempela-
jari literatur yang berkaitan dengan topik metode Bootstrap dan teknik sam-
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
9
pling guna mencari perannya dalam membangun selang penduga parameter
populasi dan penduga parameter regresi linear berganda.
G. Sistematika Penulisan
BAB I. PENDAHULUAN
A. Latar Belakang Masalah
B. Perumusan Masalah
C. Pembatasan Masalah
D. Tujuan Penulisan
E. Manfaat Penulisan
F. Metode Penulisan
G. Sistematika Penulisan
BAB II. LANDASAN TEORI
A. Teori Sampling
B. Estimasi
C. Regresi Linear Berganda
BAB III. METODE BOOTSTRAP
A. Prinsip Dasar Dan Algoritma Metode Bootstrap
B. Aplikasi Pendekatan Galat standar Dari Mean Dengan Metode Boot-
strap
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
10
BAB IV. APLIKASI METODE BOOTSTRAP
A. Metode Persentil Bootstrap
B. Regresi Bootstrap
BAB V. PENUTUP
A. Kesimpulan
B. Saran
DAFTAR PUSTAKA
LAMPIRAN
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB II
LANDASAN TEORI
A. Teori Sampling
1. Sampling
Dalam statistika, selalu ditemui istilah populasi atau semesta. Istilah
ini mengacu pada sekumpulan dari individu-individu atau atributnya, yang
dapat dispesifikasikan secara numerik. Contohnya, populasi dari berat ba-
dan, harga beras, dan sebagainya. Populasi yang memiliki elemen yang
terhingga jumlahnya disebut sebagai populasi terhingga. Contohnya ada-
lah populasi dari berat badan 48 siswa di suatu kelas. Istilah yang juga
sering dijumpai adalah sampel. Sampel merupakan bagian yang terpilih
dari suatu populasi dan proses pemilihan bagian terpilih tersebut disebut
sebagai sampling.
Sampling atau penarikan sampel, bertujuan untuk memperoleh in-
formasi (sebanyak mungkin) yang mendukung pengamatan variabel ter-
tentu guna mendapatkan keterangan tentang suatu populasi. Secara khu-
sus, sampling dilakukan untuk mengestimasi parameter tertentu dari suatu
populasi. Pemilihan sampel harus dilakukan secara acak (sampling acak)
agar semua elemen populasi memiliki peluang yang sama untuk terpilih.
Bilangan random (yang akan dibahas dalam subbab berikutnya) digunakan
dalam proses sampling acak.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
12
Definisi 2.1.
Diberikan 𝑁𝑁 dan 𝑛𝑛 yang mewakili banyaknya elemen dari ukuran populasi
dan ukuran sampel secara berturut-turut. Bila samplingnya diperoleh den-
gan suatu cara sedemikian sehingga setiap dari �𝑁𝑁𝑛𝑛� buah sampel memiliki
probabilitas yang sama untuk terpilih, sampling tersebut dikatakan acak
dan hasilnya dikatakan sampel acak.
Dengan sampling sederhana, kita bermaksud melakukan sampling
acak secara bersamaan. Cara ini merupakan cara untuk memilih 𝑛𝑛 buah
sampel acak dari 𝑁𝑁 anggota populasi, sehingga 𝐶𝐶𝑛𝑛𝑁𝑁 sampel yang berbeda
memiliki peluang yang sama untuk dipilih. Dengan begitu, setiap sampel
memiliki probabilitas yang independen dan konstan. Tiap sampel diambil
satu-persatu setelah sebelumnya dinomori dari 1 sampai 𝑁𝑁. Kemudian, bi-
langan-bilangan random bernilai di antara 1 sampai 𝑁𝑁 dibangkitkan dan
digunakan untuk memilih secara acak.
Terdapat dua macam cara penarikan sampel berdasarkan pengemba-
lian sampel, yaitu sampling tanpa pengembalian dan sampling dengan pe-
ngembalian. Menurut buku Encyclopedia of Statistical Sciences (2006),
“Sampling is said to be with or without replacement according as to
whether or not the same member of the population may be selected more
than once.”, kemungkinan suatu anggota dari populasi dapat dipilih lebih
dari sekali itulah yang menentukan cara sampling ini.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
13
Bila sebuah sampel yang diambil pada pengambilan pertama tidak
dikembalikan sebelum pengambilan sampel yang kedua, dan begitu sete-
rusnya, maka cara ini disebut dengan sampling tanpa pengembalian. Sam-
pling dengan metode ini tidak termasuk dalam sampling sederhana karena
probabilitas terpilihnya sampel tidak konstan. Pada sampling tanpa pen-
gembalian, pengambilan pertama pada sebuah himpunan sampel berukur-
an 𝑛𝑛 memiliki probabilitas sebesar 𝑛𝑛 𝑁𝑁⁄ . Pengambilan kedua memiliki
probabilitas sebesar (𝑛𝑛 − 1) (𝑁𝑁 − 1)⁄ karena anggota sampel dan populasi
masing-masing berkurang 1 anggota dengan tidak dilakukannya pengem-
balian sampel. Begitu pula untuk pengambilan ketiga dan seterusnya.
Maka dari itu, untuk sampling tanpa pengembalian, probabilitas semua 𝑛𝑛
buah sampel dapat dipilih dalam 𝑁𝑁 kali pengambilan adalah:
𝑛𝑛𝑁𝑁⋅
(𝑛𝑛 − 1)(𝑁𝑁 − 1)
⋅(𝑛𝑛 − 2)(𝑁𝑁 − 2)
⋅⋅⋅1
(𝑁𝑁 − 𝑛𝑛 + 1)=𝑛𝑛! (𝑁𝑁 − 𝑛𝑛)!
𝑁𝑁!=
1𝐶𝐶𝑛𝑛𝑁𝑁
Pada sampling dengan pengembalian, sampel yang sebelumnya telah
diambil, dikembalikan terlebih dulu sebelum mengambil sampel berikut-
nya. Jadi, sampel ke-i dapat muncul 0,1,2, … ,𝑛𝑛 kali dalam himpunan
sampelnya. Karena adanya pengembalian, seluruh unit sampel memiliki
peluang yang sama untuk dipilih, berapa kalipun sampel tersebut sudah
terpilih sebelumnya. Jadi, pada sampling dengan pengembalian, probabili-
tas masing-masing 𝑛𝑛 buah sampel untuk terpilih adalah 1 𝑁𝑁⁄ .
Alasan dilakukannya sampling yaitu, adalah suatu hal yang mustahil
bila seorang peneliti mengamati seluruh anggota dari populasi. Kalaupun
hal tersebut mungkin dilakukan, maka pasti akan membutuhkan biaya,
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
14
waktu dan sumber daya manusia yang tidak sedikit. Suatu populasi, mi-
salnya darah dalam tubuh manusia, tidak mungkin diobservasi seluruhnya
karena pengamatan seperti itu bersifat destruktif bagi populasi. Sering kali
pula populasi dianggap terlalu dinamis, dapat berubah-ubah sewaktu-
waktu, contohnya populasi penduduk suatu daerah. Sebenarnya peng-
amatan secara keseluruhan anggota populasi mungkin saja dilakukan dan
akan menghasilkan keterangan tentang populasi yang lebih tepat dan aku-
rat dibandingkan dengan mengamati sampel. Meskipun begitu, kita perlu
menjaga keseimbangan antara ketepatan hasil dengan banyaknya sumber
daya yang harus dikorbankan dengan mengamati populasi secara menyelu-
ruh. Karena itulah, para peneliti lebih memilih untuk mengamati sampel,
dengan syarat galat pengamatan diminimalisir daripada mengorbankan ba-
nyak sumber daya untuk penelitian populasi. Keterangan tentang populasi
dengan galat yang minimal dianggap cukup memuaskan bagi peneliti.
2. Bilangan Random
Sebelum teknologi komputer dan simulasi matematis berkembang
seperti sekarang ini, bilangan random biasanya didapat dari tabel bilangan
random yang disusun oleh L. H. C. Tippet. Tabel tersebut terdiri dari
10.400 buah bilangan empat digit. Bilangan random ini sangat diperlukan
untuk metode statistika yang bersifat probabilistik, seperti metode sam-
pling Monte Carlo. Dewasa ini, bilangan random sudah dapat dibang-
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
15
kitkan dengan menggunakan komputer, sehingga simulasi matematis dapat
dilakukan dengan mudah.
Sifat bilangan random yang acak diterapkan untuk membangkitkan
nilai dari variabel-variabel random untuk sembarang distribusi. Bilangan
random dibangkitkan dengan menggunakan algoritma numerik. Algoritma
numerik tersebut membuat barisan bilangan yang bersifat deterministik.
Bila dilihat tanpa mengetahui algoritmanya, bilangan-bilangan tersebut
terlihat acak. Sifat acak yang sebenarnya didapatkan dari algoritma inilah
yang menyebabkan sifat semu dari bilangan random tersebut. Maka dari
itu, bilangan random sering kali disebut sebagai bilangan pseudorandom.
3. Pembangkit Bilangan Random
Cara yang paling sederhana untuk membangkitkan bilangan random
yaitu dengan menggunakan Linear Congruential Generators.
Langkah pertama dimulai dengan nilai awal 𝑥𝑥0, lalu secara rekursif
menghitung nilai-nilai selanjutnya 𝑥𝑥𝑛𝑛 , 𝑛𝑛 ≥ 1, dengan rumus:
𝑥𝑥𝑛𝑛 = 𝑎𝑎𝑥𝑥𝑛𝑛−1 + 𝑐𝑐 modulo 𝑚𝑚
di mana 𝑎𝑎,𝑚𝑚 ∈ ℤ+ (ℤ+ adalah himpunan bilangan bulat positif) dan
𝑎𝑎𝑥𝑥𝑛𝑛−1 dapat dibagi oleh 𝑚𝑚 dan sisanya diambil sebagai nilai dari 𝑥𝑥𝑛𝑛 . Se-
tiap 𝑥𝑥𝑛𝑛 , nilainya bisa bernilai 0, 1, … ,𝑚𝑚− 1 dan nilai dari 𝑥𝑥𝑛𝑛 𝑚𝑚⁄ lah yang
disebut sebagai bilangan random. Bilangan ini diambil sebagai pendekat-
an dari sebuah variabel random seragam (0,1).
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
16
Sebagai contoh, bila diambil 𝑎𝑎 = 13, 𝑐𝑐 = 0, 𝑚𝑚 = 31, dan 𝑥𝑥0 = 1,
akan didapatkan deret sebagai berikut:
1, 13, 14, 27, 10, 6, 16, 22, …
Rumus rekursif untuk 𝑥𝑥𝑛𝑛 akan menghasilkan 30 bilangan bulat yang me-
rupakan permutasi dari 1 sampai 30. Hal ini akan berulang ketika ketiga
puluh bilangan sudah termuat dalam 30 bilangan pertama dalam deret. Pe-
riode perulangan ini biasanya terjadi pada saat 𝑚𝑚− 1.
Sesuai dengan aturan bilangan random, kita telah mendapatkan bari-
san untuk 𝑥𝑥𝑛𝑛 dan untuk membangkitkan bilangan random, kita tinggal
membagi masing-masing 𝑥𝑥𝑛𝑛 dengan 𝑚𝑚 = 31. Dengan begitu, kita akan
dan 𝑋𝑋� adalah kombinasi linear dari 𝑋𝑋1,𝑋𝑋2, … ,𝑋𝑋𝑛𝑛 atau
𝑋𝑋� = 𝑎𝑎1𝑋𝑋1 + 𝑎𝑎2𝑋𝑋2 + ⋯+ 𝑎𝑎𝑛𝑛𝑋𝑋𝑛𝑛
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
20
dengan 𝑎𝑎1 = 1 𝑛𝑛⁄ , 𝑖𝑖 = 1,2, … ,𝑛𝑛.
Maka dari itu, Teorema 2.1 dapat digunakan untuk menyimpulkan bahwa
𝑋𝑋� berdistribusi normal dengan
𝐸𝐸(𝑋𝑋�) = 𝐸𝐸 �1𝑛𝑛
(𝑋𝑋1) +1𝑛𝑛
(𝑋𝑋2) + ⋯+1𝑛𝑛
(𝑋𝑋𝑛𝑛)�
=1𝑛𝑛
(𝜇𝜇) +1𝑛𝑛
(𝜇𝜇) + ⋯+1𝑛𝑛
(𝜇𝜇)
= 𝜇𝜇
𝑉𝑉𝑎𝑎𝑉𝑉(𝑌𝑌�) = 𝑉𝑉𝑎𝑎𝑉𝑉 �1𝑛𝑛
(𝑋𝑋1) +1𝑛𝑛
(𝑋𝑋2) + ⋯+1𝑛𝑛
(𝑋𝑋𝑛𝑛)�
=1𝑛𝑛2 (𝜎𝜎2) +
1𝑛𝑛2 (𝜎𝜎2) + ⋯+
1𝑛𝑛2 (𝜎𝜎2)
=1𝑛𝑛2 (𝑛𝑛𝜎𝜎2) =
𝜎𝜎2
𝑛𝑛
Jadi, distribusi sampling dari 𝑋𝑋� adalah normal dengan mean 𝜇𝜇 dan
variansi 𝜎𝜎2 𝑛𝑛⁄ . Artinya, harapan 𝑋𝑋� sama dengan harapan dari 𝑋𝑋, tetapi be-
sarnya variansi dari 𝑋𝑋� adalah 1 𝑛𝑛⁄ variansi dari 𝑋𝑋. Dengan nilai 𝑛𝑛 yang
semakin besar, semakin kecil nilai 𝑉𝑉𝑎𝑎𝑉𝑉(𝑋𝑋), jadi estimasi bagi 𝜇𝜇 semakin
baik.
Efron (1993) menjelaskan bahwa bila diberikan variabel random 𝑋𝑋
dengan fungsi probabilitas 𝑓𝑓(𝑋𝑋), nilai harapan 𝐸𝐸(𝑋𝑋), dan variansi
𝑉𝑉𝑎𝑎𝑉𝑉(𝑋𝑋), galat standar dari mean 𝑋𝑋�, yang dinotasikan sebagai 𝑆𝑆𝐸𝐸(𝑋𝑋�) ada-
lah akar dari variansi dari 𝑋𝑋�, yaitu
𝑆𝑆𝐸𝐸(𝑋𝑋�) = [𝑉𝑉𝑎𝑎𝑉𝑉(𝑋𝑋�)]1 2⁄ = 𝜎𝜎 √𝑛𝑛⁄ .
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
21
Teorema 2.3. (Teorema Limit Pusat)
Diberikan variabel random 𝑋𝑋1,𝑋𝑋2, … ,𝑋𝑋𝑛𝑛 yang secara independen dan seca-
ra identik berdistribusi dengan 𝐸𝐸(𝑋𝑋𝑖𝑖) = 𝜇𝜇 dan 𝑉𝑉𝑎𝑎𝑉𝑉(𝑋𝑋𝑖𝑖) = 𝜎𝜎2 < ∞,
𝑖𝑖 = 1,2, … ,𝑛𝑛. Didefinisikan
𝑈𝑈𝑛𝑛 = √𝑛𝑛 �𝑋𝑋� − 𝜇𝜇𝜎𝜎
� di mana 𝑋𝑋� =1𝑛𝑛�𝑋𝑋𝑖𝑖
𝑛𝑛
𝑖𝑖=1
maka fungsi distribusi dari 𝑈𝑈𝑛𝑛 akan mendekati fungsi distribusi normal stan-
dar dengan 𝑛𝑛 → ∞.
Bukti:
Sebuah variabel random didefinisikan sebagai berikut
𝑍𝑍𝑖𝑖 =𝑋𝑋𝑖𝑖 − 𝜇𝜇𝜎𝜎
Perhatikan bahwa 𝐸𝐸(𝑍𝑍𝑖𝑖) = 0 dan 𝑉𝑉𝑎𝑎𝑉𝑉(𝑍𝑍𝑖𝑖) = 1. Fungsi Pembangkit Mo-
men dari 𝑍𝑍𝑖𝑖 , yaitu 𝑚𝑚𝑍𝑍(𝑡𝑡) dapat ditulis sebagai
𝑚𝑚𝑍𝑍(𝑡𝑡) = 1 +𝑡𝑡2
2+𝑡𝑡3
3!𝐸𝐸�𝑍𝑍𝑖𝑖3� + ⋯
lalu,
𝑈𝑈𝑛𝑛 = √𝑛𝑛 �𝑋𝑋� − 𝜇𝜇𝜎𝜎
� =1√𝑛𝑛
�∑ 𝑋𝑋𝑖𝑖 − 𝑛𝑛𝜇𝜇𝑛𝑛𝑖𝑖=1
𝜎𝜎� =
1√𝑛𝑛
�𝑍𝑍𝑖𝑖
𝑛𝑛
𝑖𝑖=1
karena 𝑋𝑋𝑖𝑖 saling independen, hal ini mengakibatkan 𝑍𝑍𝑖𝑖 juga independen,
untuk 𝑖𝑖 = 1,2, … ,𝑛𝑛.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
22
Mengingat bahwa fungsi pembangkit momen dari jumlahan variabel-
variabel random yang independen adalah perkalian dari fungsi pembangkit
momen individualnya masing-masing, maka
𝑚𝑚𝑛𝑛(𝑡𝑡) = �𝑚𝑚𝑍𝑍 �𝑡𝑡√𝑛𝑛
��𝑛𝑛
= �1 +𝑡𝑡2
2𝑛𝑛+
𝑡𝑡3
3!𝑛𝑛3 2⁄ 𝐸𝐸�𝑍𝑍𝑖𝑖3� + ⋯�𝑛𝑛
di mana 𝑘𝑘 = 𝐸𝐸(𝑍𝑍𝑖𝑖3).
Langkah selanjutnya adalah mengambil limit dari 𝑚𝑚𝑛𝑛(𝑡𝑡) untuk
𝑛𝑛 → ∞. Salah satu cara untuk menghitung nilai limit tersebut adalah den-
gan menggunakan ln𝑚𝑚𝑛𝑛(𝑡𝑡), di mana
ln𝑚𝑚𝑛𝑛(𝑡𝑡) = 𝑛𝑛 ln �1 + �𝑡𝑡2
2𝑛𝑛+
𝑡𝑡3𝑘𝑘6𝑛𝑛3 2⁄ + ⋯��
ekspansi deret standar untuk log (1 + 𝑥𝑥) adalah
ln(1 + 𝑥𝑥) = 𝑥𝑥 −𝑥𝑥2
2+𝑥𝑥3
3−𝑥𝑥4
4+ ⋯
dengan mengandaikan
𝑥𝑥 = �𝑡𝑡2
2𝑛𝑛+
𝑡𝑡3𝑘𝑘6𝑛𝑛3 2⁄ + ⋯�
kita akan mendapatkan
ln𝑚𝑚𝑛𝑛(𝑡𝑡) = 𝑛𝑛 ln(1 + 𝑥𝑥) = 𝑛𝑛 �𝑥𝑥 −𝑥𝑥2
2+ ⋯�
= 𝑛𝑛 ��𝑡𝑡2
2𝑛𝑛+
𝑡𝑡3𝑘𝑘6𝑛𝑛3 2⁄ + ⋯� −
12�𝑡𝑡2
2𝑛𝑛+
𝑡𝑡3𝑘𝑘6𝑛𝑛3 2⁄ + ⋯�
2
+ ⋯�
di mana suku-suku selanjutnya dalam ekspansi tersebut melibatkan 𝑥𝑥3, 𝑥𝑥4, dan
seterusnya. Dengan dikalikan dengan 𝑛𝑛, tampak bahwa suku pertama,
𝑡𝑡2 2⁄ tidak melibatkan 𝑛𝑛, sementara seluruh suku yang lainnya akan me-
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
23
miliki 𝑛𝑛 dengan pangkat positif pada penyebutnya. Maka dari itu, dapat
ditunjukkan bahwa
lim𝑛𝑛→∞
ln𝑚𝑚𝑛𝑛(𝑡𝑡) =𝑡𝑡2
2
atau
lim𝑛𝑛→∞
𝑚𝑚𝑛𝑛(𝑡𝑡) = 𝑒𝑒𝑡𝑡2
2
adalah fungsi pembangkit momen untuk variabel random normal standar.
Dengan begitu, kita dapat menyimpulkan bahwa 𝑈𝑈𝑛𝑛 memiliki fungsi dis-
tribusi yang mendekati variabel random normal standar.
Galat standar adalah cara yang paling umum dan sederhana untuk
mengindikasikan keakuratan secara statistikal. Kita mengharapkan 𝑋𝑋� akan
berada kurang dari satu galat standar dari 𝜇𝜇, ekspektasinya berkisar 68%
dan kurang dari dua galat standar, ekspektasinya sekitar 95%. Persentase
tersebut berasal dari Teorema Limit Pusat, dalam kondisi umum, distribusi
dari 𝑋𝑋� akan mendekati distribusi normal seiring dengan membesarnya nilai
𝑛𝑛. Pada kondisi inilah metode Bootstrap lebih menguntungkan kita. Teo-
rema Limit Pusat tersebut tidak perlu dijadikan pedoman utama untuk
mendapatkan pernyataan keakuratan statistik penduga mengenai populasi.
Galat standar dari mean dapat kita dekati langsung dengan bootstrap.
Terdapat contoh yang sederhana yang menunjukkan keterbatasan da-
ri Teorema Limit Pusat. Diberikan 𝑋𝑋1,𝑋𝑋2, … ,𝑋𝑋𝑛𝑛 adalah variabel random
yang saling independen dan nilai-nilainya memiliki dua kemungkinan, ya-
itu 0 (gagal) dan 1 (sukses). Sedangkan 𝑌𝑌 adalah variabel random yang
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
24
berdistribusi binomial dengan 𝑛𝑛 kali ulangan dan probabilitas sukses sebe-
sar 𝑝𝑝 dan 𝑌𝑌 adalah jumlahan dari 𝑋𝑋1,𝑋𝑋2, … ,𝑋𝑋𝑛𝑛 .
𝑌𝑌 = �𝑋𝑋𝑖𝑖
𝑛𝑛
𝑖𝑖=1
Variabel random 𝑋𝑋1,𝑋𝑋2, … ,𝑋𝑋𝑛𝑛 saling independen karena ulangannya
saling bebas. Maka dari itu, untuk 𝑛𝑛 yang besar, proporsi ulangan yang
sukses adalah
𝑌𝑌𝑛𝑛
=1𝑛𝑛�𝑋𝑋𝑖𝑖
𝑛𝑛
𝑖𝑖=1
= 𝑋𝑋�
Jadi 𝑋𝑋� akan memiliki distribusi sampling yang mendekati distribusi nor-
mal dengan mean 𝐸𝐸(𝑋𝑋𝑖𝑖) = 𝑝𝑝 dan 𝑉𝑉𝑎𝑎𝑉𝑉(𝑋𝑋𝑖𝑖) 𝑛𝑛⁄ = 𝑝𝑝(1 − 𝑝𝑝) 𝑛𝑛⁄ .
Pendekatan normal untuk distribusi binomial akan bekerja dengan
efektif untuk 𝑛𝑛 yang besar, tetapi ketika nilai 𝑝𝑝 mendekati 0 atau 1, atau
dapat juga dikatakan nilai 𝑝𝑝 yang berada di sekitar 0.5, pendekatan ini ti-
dak lagi efektif. Gambar 2.1 dan Gambar 2.2 berikut menggambarkan ke-
lemahan Teorema Limit Pusat dalam pendekatan normal untuk distribusi
binomial tersebut. Hal ini terjadi karena Teorema Limit Pusat memiliki
kesimetrisan dalam segi bentuk, dan untuk nilai 𝑝𝑝 yang berada di sekitar
0.5, distribusi binomial memiliki kesimetrisan, sehingga pendekatan nor-
mal bekerja efektif.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
25
B. Estimasi
Penentuan penduga atau estimator untuk suatu parameter populasi (con-
tohnya: mean, proporsi, dll) merupakan salah satu masalah yang mendasar da-
lam statistika. Cara untuk mengestimasi penduga tersebut dibedakan menjadi
dua, yaitu estimasi titik dan estimasi interval.
Gambar 2.1. Untuk 𝑛𝑛 = 25 dan 𝑝𝑝 = 0.25, pendekatan normal untuk dis-tribusi binomial memberikan pendekatan yang baik.
Gambar 2.2. Untuk 𝑛𝑛 = 25 dan 𝑝𝑝 = 0.95, pendekatan normal untuk dis-tribusi binomial tidak memberikan pendekatan yang baik karena nilai 𝑝𝑝 yang mendekati 1.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
26
Definisi 2.3.
Estimator adalah aturan yang menentukan bagaimana menghitung sebuah
penduga berdasarkan pengukuran (observasi) yang termuat dalam sebuah
sampel.
1. Estimasi Titik
Definisi 2.4.
Penentuan suatu nilai tunggal yang dapat sebaik-baiknya mendekati nilai
parameter populasi yang tidak diketahui disebut sebagai estimasi titik.
Bila 𝜃𝜃 adalah parameter populasi dan 𝜃𝜃� adalah penduga dari 𝜃𝜃, maka
kita berharap nilai-nilai dugaan akan berada di sekitar parameter yang di-
tuju. Ada banyak kemungkinan, bisa saja penduga akan berpusat di seki-
tar parameter tujuan ataupun tidak. Bila penduga berada di sekitar para-
meter tujuan, maka nilai harapan dari distribusi nilai dugaan akan sama
dengan parameter yang diduga (𝐸𝐸�𝜃𝜃�� = 𝜃𝜃). Sebagai contoh, 𝑋𝑋�, �̂�𝑝, dan
𝑋𝑋�1 − 𝑋𝑋�2 adalah penduga titik yang baik.
2. Estimasi Interval
Definisi 2.5.
Penentuan suatu selang nilai yang dengan peluang besar memuat parame-
ter populasi yang sebenarnya disebut sebagai estimasi interval.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
27
Estimasi interval bertujuan untuk membangun suatu selang nilai dari
parameter tujuan yang berpeluang besar memuat nilai sebenarnya dari pa-
rameter tujuan. Selang kepercayaan dari parameter populasi juga diguna-
kan untuk mengindikasikan reliabilitas dari sebuah penduga. Informasi-
informasi yang terdapat pada sampel digunakan untuk membentuk dua
buah nilai yang membentuk batas atas dan batas bawah selang. Bila dike-
tahui 𝜃𝜃 dan 𝜃𝜃� (penduga dari 𝜃𝜃), maka berdasarkan batas atas dan bawah
selang, terdapat tiga bentuk selang kepercayaan yaitu, �𝜃𝜃�𝑙𝑙 ,𝜃𝜃�𝑢𝑢�, �𝜃𝜃�𝑙𝑙 ,∞�,
dan �∞,𝜃𝜃�𝑢𝑢�.
Definisi 2.6.
Diberikan 𝑥𝑥1, 𝑥𝑥2, … , 𝑥𝑥𝑛𝑛 memiliki fungsi distribusi probabilitas
𝑓𝑓(𝑥𝑥1, 𝑥𝑥2, … , 𝑥𝑥𝑛𝑛 ;𝜃𝜃);𝜃𝜃 ∈ 𝛀𝛀, di mana 𝛀𝛀 adalah sebuah selang. Diketahui 𝐿𝐿
dan 𝑈𝑈 adalah statistik, misalkan 𝐿𝐿 = 𝑙𝑙(𝑥𝑥1, 𝑥𝑥2, … , 𝑥𝑥𝑛𝑛) dan 𝑈𝑈 =
𝑢𝑢(𝑥𝑥1, 𝑥𝑥2, … , 𝑥𝑥𝑛𝑛). Bila dalam sebuah data percobaan 𝑥𝑥1, 𝑥𝑥2, … , 𝑥𝑥𝑛𝑛 , ke-
mudian telah dicari nilai 𝑙𝑙(𝑥𝑥1, 𝑥𝑥2, … , 𝑥𝑥𝑛𝑛) dan 𝑢𝑢(𝑥𝑥1, 𝑥𝑥2, … , 𝑥𝑥𝑛𝑛).
dengan 𝑖𝑖 = 0,1,2, … ,𝑘𝑘 di mana 𝑐𝑐𝑖𝑖𝑖𝑖 adalah elemen dari baris ke-𝑖𝑖 dan ko-
lom ke-𝑖𝑖 dari matriks (𝐗𝐗′𝐗𝐗)−1 dan 𝑠𝑠 adalah penduga tak bias dari 𝜎𝜎 dan
didefinisikan sebagai berikut.
𝑠𝑠2 =𝐘𝐘′𝐘𝐘 − 𝐗𝐗�′𝐗𝐗′𝐘𝐘
𝑛𝑛 − 𝑝𝑝
Variansi dari model regresi linear tersebut diduga dengan menggu-
nakan 𝑠𝑠2𝑐𝑐𝑖𝑖𝑖𝑖 dan galat standar dari model regresi ini diduga dengan 𝑠𝑠�𝑐𝑐𝑖𝑖𝑖𝑖 .
Bila 𝑛𝑛 ≥ 30, maka statistik 𝑡𝑡 dapat diganti dengan statistik 𝑧𝑧.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB III
METODE BOOTSTRAP
A. Prinsip Dasar dan Algoritma Metode Bootstrap
Kvam dan Vidakovic (2007) menyatakan bahwa dengan resampling, kita
berniat untuk mengambil sampel acak dari sampel. Misalkan sampel yang te-
lah diambil adalah 𝑥𝑥1, 𝑥𝑥2, … , 𝑥𝑥𝑛𝑛 dipandang sebagai sampel asli yang mewakili
suatu populasi terhingga dengan ukuran n. Sampel baru (biasanya berukuran
n pula) diambil secara “sampling dengan pengembalian”, maka beberapa dari
n sampel asli dapat muncul lebih dari satu kali. Kumpulan sampel baru ini
disebut sampel bootstrap. Metode tersebut dinamakan dengan Metode Boot-
strap. Agar lebih dapat memahami metode bootstrap, Gambar 3.1 menje-
laskan tahapannya dalam bentuk skema.
Dari sampel asli 𝑥𝑥1, 𝑥𝑥2, … , 𝑥𝑥𝑛𝑛 diambil b buah sampel bootstrap. Setiap
sampel bootstrap (x*1, x*2, …, x*b) memiliki n buah anggota yang diambil se-
𝑥𝑥∗1 𝑥𝑥∗2
𝑥𝑥∗𝑏𝑏
𝑠𝑠(𝑥𝑥∗1)
𝑠𝑠(𝑥𝑥∗2)
𝑠𝑠(𝑥𝑥∗𝑏𝑏)
…
…
𝑋𝑋 = {𝑥𝑥1, 𝑥𝑥2, … , 𝑥𝑥𝑛𝑛} Sampel Asli
Sampel Bootstrap
Replikasi bootstrap
Gambar 3.1. Prosedur pengambilan sampel dengan menggunakan metode Bootstrap
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
36
cara sampling dengan pengembalian n kali dari data sampel asli. Replikasi
bootstrap s(x*1), s(x*2), …, s(x*b) didapatkan dengan menghitung nilai statistik
tertentu, misalkan s(x) pada setiap sampel bootstrap. Akhirnya, standar devia-
si dari nilai-nilai s(x*1), s(x*2), …, s(x*b) adalah penduga dari galat standar dari
s(x). Galat standar inilah yang merupakan tujuan utama dari metode bootstrap,
yang kemudian dapat digunakan untuk membangun selang kepercayaan boot-
strap.
Secara umum, kita dapat mengurutkan langkah-langkah untuk metode
bootstrap secara umum. Misalkan pada suatu populasi, diambil 𝑛𝑛 buah sam-
pel acak yaitu 𝑋𝑋 = {𝑥𝑥1, 𝑥𝑥2, … , 𝑥𝑥𝑛𝑛}. Dari 𝑛𝑛 buah sampel acak tersebut, akan di-
ambil sebanyak 𝑏𝑏 unit sampel bootstrap, yaitu 𝑥𝑥∗1, 𝑥𝑥∗2, … , 𝑥𝑥∗𝑏𝑏 . Masing-
masing unit sampel tersebut adalah vektor yang terdiri dari 𝑛𝑛 buah sampel
yang diambil dengan pengembalian. Notasi bintang tersebut menandakan
bahwa vektor kumpulan data tersebut adalah hasil resampel dari sampel asli.
𝑋𝑋∗ bukanlah himpunan data sampel asli (𝑥𝑥).
Sampel bootstrap tersebut akan berupa vektor-vektor yang masing-
masing terdiri dari 𝑛𝑛 buah nilai. Nilai-nilai dari sampel asli dapat muncul be-
berapa kali karena adanya pengembalian sampel sebelum pengambilan kem-
bali sampel berikutnya. Dengan begitu setiap sampel bootstrap juga bisa me-
miliki beberapa data asli yang terwakili lebih dari sekali, atau bahkan tidak
terwakili sama sekali. Maka dari itu, sampel bootstrap ini bisa saja sama per-
sis dengan sampel asli ataupun sama sekali tidak sama dengan sampel aslinya.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
37
Pengambilan unit-unit sampel bootstrap dengan pengembalian dilakukan
sampai 𝑏𝑏 kali sehingga terdapat 𝑏𝑏 unit sampel bootstrap. Besarnya nilai 𝑏𝑏
umumnya diambil dalam jumlah yang besar, karena semakin besar nilai 𝑏𝑏,
maka distribusi sampling yang didekati akan semakin mendekati distribusi
normal. Secara teoritis, besar nilai 𝑏𝑏 tidak pernah dibatasi, bisa sebesar
mungkin, asal kita memiliki kesabaran untuk membentuk sampel-sampel
bootstrap tersebut. Lagipula, jikalau nilai 𝑏𝑏 terlampau besar, hal itu tidak lagi
menjadi masalah karena semua proses penghitungan dilakukan dengan kom-
puter. Setelah didapatkan 𝑏𝑏 buah sampel bootstrap, hal yang dilakukan selan-
jutnya adalah menghitung statistik dari masing-masing sampel bootstrap untuk
menduga galat standar dari parameter penduga yang disimbolkan 𝜃𝜃�. Statistik
uji untuk masing-masing sampel bootstrap disimbolkan sebagai
𝑠𝑠(𝑥𝑥∗1), 𝑠𝑠(𝑥𝑥∗2), … , 𝑠𝑠(𝑥𝑥∗𝑏𝑏). Statistik uji tersebut bisa berupa mean, median,
atau proporsi. Seluruh standar deviasi dari statistik uji tersebut akan diguna-
kan untuk mengestimasi galat standar dari 𝑠𝑠(𝑥𝑥) atau 𝜃𝜃�. Pendugaan galat stan-
dar dari 𝜃𝜃� tersebut adalah tujuan utama dari metode bootstrap ini. Seluruh
proses pendekatan nilai ini akan langsung menggunakan kalkulasi dengan
komputer tanpa memerlukan kalkulasi teoritis.
Untuk setiap pengambilan kesimpulan langsung berdasarkan distribu-
sinya, terlihat jelas bahwa sampel bootstrap tidak sebaik sampel asli. Bila kita
mendekati sebuah parameter populasi, yaitu 𝜃𝜃 = 𝜃𝜃(𝐹𝐹), dari distribusi 𝐹𝐹, jelas
bahwa lebih baik memilih untuk menggunakan 𝜃𝜃�𝑛𝑛 = 𝜃𝜃�(𝐹𝐹𝑛𝑛). Yang dapat dije-
laskan dari sampel-sampel bootstrap adalah, bagaimana nilai 𝜃𝜃�𝑛𝑛 mungkin be-
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
38
rubah-ubah dari sampel ke sampel. Hal ini disebabkan karena elemen-elemen
dari masing-masing sampel bootstrap bisa sama atau sama sekali berbeda den-
gan sampel asli seperti yang telah dijelaskan sebelumnya. Daripada kita
hanya dapat menghitung 𝜃𝜃�𝑛𝑛 sekali saja karena hanya dimiliki satu buah sam-
pel sebanyak 𝑛𝑛, lebih baik kita meresampel (sebanyak tak hingga kali secara
teoritis) dan membentuk sampel bootstrap. Sebuah meta-estimator dibentuk
dari estimator untuk estimator awal bagi parameter populasi. Dengan begitu,
sebenarnya kita telah membangun sebuah meta-estimator dari sampel boot-
strap (misalkan 𝜃𝜃�∗ = 𝑠𝑠(𝑥𝑥∗)) dan meta-estimator tersebut menjelaskan tentang
𝜃𝜃�𝑛𝑛 , bukan 𝜃𝜃. Bila kita membangun sampel bootstrap berulang kali, kita dapat
membentuk gambaran secara tak langsung tentang distribusi 𝜃𝜃�𝑛𝑛 dan dari situ,
kita dapat membentuk suatu pernyataan tentang 𝜃𝜃.
Secara sederhana, metode bootstrap untuk pengambilan sampel dapat di-
tuliskan dalam algoritma berikut:
1. Bangun distribusi probabilitas empiris 𝑓𝑓(𝑥𝑥) dari sampel acak 𝑥𝑥1, 𝑥𝑥2, … , 𝑥𝑥𝑛𝑛
dengan menempatkan probabilitas 1 𝑛𝑛⁄ pada setiap titik di 𝑥𝑥1, 𝑥𝑥2, … , 𝑥𝑥𝑛𝑛 .
Ini adalah fungsi distribusi empiris dari 𝑥𝑥, yang merupakan pendekatan
(kemungkinan maksimum) maximum likelihood dari fungsi distribusi pro-
babilitas untuk populasi 𝑓𝑓(𝑥𝑥).
2. Dari distribusi probabilitas empiris tersebut, ambil sampel acak sederhana
sebanyak 𝑛𝑛 buah dengan pengembalian. Sampel inilah yang disebut sam-
pel bootstrap. Notasikan kumpulan sampel bootstrap ini dengan tanda bin-
tang (*) dan indeks nomor (contoh: 𝑥𝑥∗𝑏𝑏).
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
39
3. Hitung statistik yang dituju, yaitu 𝜃𝜃� (mean, proporsi, dst) untuk masing-
masing sampel bootstrap. Notasikan dengan 𝜃𝜃�∗𝑏𝑏 .
4. Ulangi langkah ke-2 dan ke-3 sebanyak 𝑏𝑏 kali, di mana 𝑏𝑏 adalah bilangan
yang besar nilainya. Biasanya 𝑏𝑏 tidak dibatasi, tetapi diambil antara 50
sampai 200 untuk mengestimasi galat standar dari 𝜃𝜃� dan minimal 𝑏𝑏 berni-
lai 1000 untuk mengestimasi interval kepercayaan di sekitar 𝜃𝜃�. (Mooney
& Duval, 1993)
5. Bangun distribusi probabilitas dari 𝑏𝑏 buah 𝜃𝜃�∗𝑏𝑏 dengan menempatkan pro-
babilitas 1 𝑏𝑏⁄ pada setiap titik 𝜃𝜃�∗1,𝜃𝜃�∗2, … ,𝜃𝜃�∗𝑏𝑏 . Distribusi ini adalah esti-
masti bootstrap dari distribusi sampling 𝜃𝜃�, 𝑓𝑓∗(𝜃𝜃�∗).
Basis pendekatan bootstrap secara statistikal adalah memperlakukan
sampel seolah-olah sampel tersebut adalah populasi dan menerapkan metode
sampling Monte Carlo (random sampling) untuk membangkitkan pendekatan
empiris dari statistik distribusi samplingnya. Prosedur dalam metode boot-
strap secara garis besar adalah sebagai berikut:
Langkah 1: Resampling
Pada awal pengambilan sampel acak dari suatu populasi, biasanya hanya
diambil satu unit sampel acak berukuran 𝑛𝑛 buah (untuk selanjutnya akan dis-
ebut sebagai sampel asli). Agar memiliki jumlah sampel yang lebih banyak,
maka dilakukan resampling dari satu buah sampel acak tersebut. Resampling
dilakukan dengan metode sampling dengan pengembalian dan berukuran sama
dengan sampel asli, yaitu 𝑛𝑛 buah sampel acak.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
40
Setiap kali kita mengambil sebuah resampel acak dari sampel asli, sam-
pel tersebut dikembalikan terlebih dahulu sebelum dilakukannya pengambilan
resampel yang berikutnya, inilah yang dimaksud dengan resampling dengan
pengembalian. Dengan adanya pengembalian sampel, nilai-nilai observasi
pada sampel acak asli tersebut akan dapat diambil lebih dari sekali, ataupun
sama sekali tidak terambil. Bila yang dilakukan adalah sampling tanpa pen-
gembalian, yang akan kita dapatkan hanyalah satu buah sampel acak yang me-
rupakan permutasi dari sampel asli. Tak menutup kemungkinan pula, hasil re-
sampel akan sama dengan sampel asli. Kumpulan hasil resampel baru ini di-
sebut sampel bootstrap.
Contoh berikut diharapkan dapat memberikan gambaran besar tentang
langkah di atas.
Contoh 3.1. (Sumber: Introduction of the Practice Statistics oleh D. Moore,
hal. 16-3)
Di Amerika, banyak terdapat perusahaan yang menawarkan jasa layanan
telepon lokal. Bukanlah suatu ketertarikan publik untuk mendapati seluruh
perusahaan tersebut menggali jalan hanya untuk memendam kabel, jadi peru-
sahaan telepon lokal utama di setiap daerah harus (untuk bayaran tertentu)
berbagi jaringan dengan kompetitornya. Istilah legal untuk perusahaan tele-
pon lokal utama ini adalah Incumbent Local Exchange Carrier, ILEC. Para
kompetitor disebut sebagai Competing Local Exchange Carriers, atau CLECs.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
41
Verizon adalah ILEC untuk suatu area besar di Amerika bagian timur,
seperti seharusnya, mereka harus menyediakan jasa perbaikan untuk pelang-
gan dari CLECs di area tersebut. Apakah Verizon memberikan layanan per-
baikan untuk pelanggan CLEC secepat (dalam rata-rata) seperti kepada pe-
langgannya sendiri? Bila tidak, itu keputusan pelanggan untuk meminta ganti
rugi. Komisi Perangkat Publik lokal memerlukan penggunaan dari tes uji sig-
nifikansi untuk membandingkan waktu perbaikan untuk kedua grup pelanggan.
Waktu perbaikan jauh dari normal. Gambar 3.2 dan 3.3 menggambarkan
distribusi dari sampel random dari 1664 kali perbaikan untuk pelanggan Veri-
zon sendiri. Distribusinya memiliki ekor kanan yang sangat panjang. Me-
diannya adalah 3.59 jam, tetapi meannya adalah 8.41 jam dan waktu perbaikan
terlama adalah 191.6 jam. Kita ragu untuk menggunakan prosedur 𝑡𝑡 untuk da-
ta seperti itu, terutama karena ukuran sampel bagi pelanggan CLEC lebih kecil
dari pelanggan Verizon sendiri.
Gambar 3.2. Distribusi dari 1664 kali perbaikan untuk pelanggan Verizon.
Waktu perbaikan (dalam jam)
Ban
yakn
ya p
erba
ikan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
42
Resampling dan sampling dengan pengembalian pada Contoh 3.1 dije-
laskan dalam Gambar 3.4 berikut.
Gambar 3.3. Plot quantil normal untuk jumlah waktu perbaikan. Distribusinya sangat condong ke kanan.
Nilai normal
Wak
tu p
erba
ikan
(dal
am ja
m)
𝑥𝑥∗1 𝑥𝑥∗2 𝑥𝑥∗3
Gambar 3.4. Kotak teratas adalah sampel acak asli dengan 𝑛𝑛 = 6 dari data Verizon. Tiga kotak di bawahnya adalah tiga unit resampel dari sampel asli (𝑏𝑏 = 3). Beberapa nilai dari sam-pel asli muncul berulang kali dalam resampel.
Bila dibandingkan, antara selang kepercayaan yang dibentuk dengan
metode persentil dengan pendekatan normal, metode persentil menghasil-
kan selang kepercayaan yang lebih sempit dibandingkan dengan pendeka-
tan normal. Selain itu, dengan 100 buah sampel bootstrap, nilai pendeka-
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
83
tan �̂�𝛽𝑏𝑏𝑙𝑙𝑙𝑙𝑡𝑡 untuk �̂�𝛽0 dan �̂�𝛽1 secara berturut-turut adalah 33,44471 dan -
0,07013 sangat mendekati nilai �̂�𝛽0 dan �̂�𝛽1, yaitu 33,36006 dan -0,0683.
Apabila variabel independennya dianggap tetap (fixed) seperti pada
Contoh 4.2, dengan Program 4.4 pada lampiran, maka selang kepercayaan
95% untuk 𝛽𝛽0 dengan metode persentil bootstrap yaitu
�̂�𝛽0∗𝑏𝑏𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙 < 𝛽𝛽0 < �̂�𝛽0
∗𝑏𝑏𝑢𝑢𝑢𝑢𝑢𝑢𝑙𝑙𝑙𝑙
31,38263 < 𝛽𝛽0 < 34,9939
�̂�𝛽1∗𝑏𝑏𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙 < 𝛽𝛽1 < �̂�𝛽1
∗𝑏𝑏𝑢𝑢𝑢𝑢𝑢𝑢𝑙𝑙𝑙𝑙
−0,07986 < 𝛽𝛽1 < −0,05601
di mana �̂�𝛽0,1∗𝑏𝑏𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙 = �̂�𝛽0,1
∗3 dan �̂�𝛽0,1
∗𝑏𝑏𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙 = �̂�𝛽0,1
∗98. Apabila diban-
dingkan dengan selang kepercayaan normal yang sebelumnya, selang per-
sentil bootstrap dengan variabel independen yang dianggap tetap tetap
menghasilkan selang yang lebih sempit tetapi mendekati selang dengan
pendekatan normal tersebut.
Dari hasil simulasi tersebut, selang dengan lebar yang lebih sempit
dihasilkan oleh metode persentil bootstrap. Tetapi apabila dibandingkan
dari metode penarikan sampelnya, metode persentil untuk variabel inde-
penden yang dianggap tetap menghasilkan selang kepercayaan yang lebih
sempit lebarnya dibandingkan dengan meresampling pasangan terurut
sampelnya (variabel independen dianggap acak).
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
84
Untuk mendapatkan perbandingan yang lebih luas jangkauannya,
Tabel 4.36 dan Tabel 4.37 secara berturut-turut memperlihatkan perban-
dingan selang kepercayaan serta pendekatan 𝛃𝛃� dengan metode resampling
observasi dan resampling galat. Program yang digunakan adalah Program
4.3 dan 4.5 di mana kolom konstanta pada matriks variabel independen di-
hilangkan. Selain itu, pada program ini, variabel independennya dibang-
kitkan secara random dengan distribusi multivariat normal. Vektor
𝛍𝛍 = [65 90] diambil sebagai rata-rata, sedangkan 𝐜𝐜𝐜𝐜𝐜𝐜 = �20 22 19,3� dipi-
lih sebagai matriks kovariansi untuk membangkitkan sampel random mul-
tivariat untuk variabel independennya. Nilai-nilai pada kedua tabel terse-
but diperoleh dengan program yang tidak menggunakan kolom konstanta
pada matriks variabel independennya. Selain itu, pada program ini di-
asumsikan bahwa kita telah mengetahui nilai 𝛽𝛽𝑖𝑖 , agar kita dapat mengeta-
hui secara pasti bahwa selang persentil bootstrap memuat parameter popu-
lasinya, seperti pada tabel-tabel perbandingan di subbab pertama. Dalam
tabel-tabel tersebut dipilih 𝛽𝛽1 = 5 dan 𝛽𝛽2 = −2. Dengan begitu dari sam-
pel random, nilai-nilai variabel dependennya dibangkitkan dengan persa-
maan 𝑦𝑦𝑖𝑖 = 5𝑥𝑥1 − 2𝑥𝑥2 + 𝜀𝜀𝑖𝑖 , di mana 𝜀𝜀𝑖𝑖 dibangkitkan dengan menggunakan
bilangan random yang berdistribusi normal dengan 𝐸𝐸(𝛆𝛆) = 0 dan
𝑉𝑉𝑠𝑠𝑙𝑙(𝛆𝛆) = 𝜎𝜎2. Variansi dari galat tersebut diambil sebesar 1,92.
Bila dilihat perbandingan pada Tabel 4.36, yaitu resampling observa-
si data, nilai pendekatan �̂�𝛽𝑏𝑏𝑙𝑙𝑙𝑙𝑡𝑡 𝑖𝑖 cukup mendekati �̂�𝛽𝑖𝑖 dengan bias yang
mengecil seiring membesarnya 𝑏𝑏. Selang persentil bootstrap juga lebih
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
85
sempit daripada selang normal standard dan juga memuat nilai 𝛽𝛽𝑖𝑖 . Begitu
pula dengan nilai-nilai pada Tabel 4.37, pendekatan �̂�𝛽𝑏𝑏𝑙𝑙𝑙𝑙𝑡𝑡 𝑖𝑖 juga mendekati
�̂�𝛽𝑖𝑖 dengan bias kecil.
Dengan adanya kedua metode yang menghasilkan hasil yang terbi-
lang hampir sama, muncul pertanyaan metode mana yang lebih baik digu-
nakan atau kapan harus digunakan. Mooney dan Duval (1993) menyata-
kan bahwa dalam pemilihan resampling observasi atau galat, harus diper-
hitungkan komponen stokastik dari model. Secara teoritis resampling ga-
lat lebih dapat dinyatakan kebenarannya, maka dari itu banyak statistika-
wan teoritis menyarankan metode resampling galat ini. Tetapi ketika da-
lam eksperimen nyata, variabel independen dapat dinyatakan tetap (ini
adalah indikasi untuk menggunakan resampling galat), kebanyakan peneli-
ti sosial tidak berkutat dengan data eksperimental, melainkan penelitian
survey di mana nilai-nilai variabel independennya sama acaknya seperti
variabel dependennya. Alasan yang lain adalah resampling observasi di-
anggap kurang sensitif terhadap asumsi dibandingkan dengan resampling
galat (Efron & Tibshirani, 1993).
Givens dan Hoeting (2005) juga menekankan bahwa dalam pemili-
han metode resampling galat sangat bergantung pada seberapa besar mo-
del terpilih dapat cocok pada nilai observasi dan pada asumsi bahwa galat-
nya memiliki variansi konstan ataupun asumsi regresi lainnya. Tanpa ke-
percayaan terhadap hal-hal itu, lebih disarankan untuk meresampling ob-
servasinya. Meskipun begitu, resampling observasi dianggap kurang peka
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
86
terhadap pelanggaran-pelanggaran terhadap asumsi, di mana resampling
ini lebih berupa cerminan dari mekanisme pembangkit data asli.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB V
PENUTUP
A. Kesimpulan
Metode bootstrap adalah metode resampling yang sederhana dan sangat
mudah untuk diterapkan di berbagai bidang dalam dunia statistika. Prinsip dari
metode ini adalah pemberlakuan sampel asli sebagai populasi lalu meresampel
berulang kali hingga distribusi resampel dapat digunakan untuk
menggambarkan distribusi sampel asli, sehingga dapat memberikan penjelasan
lebih lanjut tentang distribusi populasi.
Selang kepercayaan parameter populasi dapat dibentuk dengan
sederhana dengan menggunakan metode persentil bootstrap. Data persentil ke-
(𝛼𝛼 2⁄ )100 dan ke-(1 − (𝛼𝛼 2⁄ ))100 digunakan sebagai batas bawah dan atas
selang kepercayaan (1 − 𝛼𝛼)100% untuk suatu parameter populasi. Metode ini
menghasilkan selang kepercayaan yang mendekati selang kepercayaan
normal, tetapi memiliki jarak yang lebih sempit dibandingkan selang
kepercayaan normal secara teoritis tersebut.
Pada pendugaan koefisien regresi dengan dua metode regresi bootstrap
yang berbeda, dihasilkan nilai-nilai penduga yang mendekati penduga dengan
metode OLS. Penduga koefisien regresi bootstrap tersebut juga memiliki bias
yang kecil terhadap penduga dengan metode OLS. Sedangkan untuk
pembentukan selang kepercayaan koefisien regresi bootstrap, kedua metode
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
88
tersebut sama-sama membentuk selang kepercayaan yang lebih sempit, bila
dibandingkan dengan selang kepercayaan normal.
B. Saran
Aplikasi metode bootstrap pada selang parameter populasi dalam skripsi
ini adalah selang parameter rata-rata populasi dan koefisien regresi linear
berganda dengan metode persentil bootstrap. Skripsi ini akan lebih baik bila
dikembangkan dengan pembahasan metode pembentukan selang parameter
populasi yang lain seperti metode Bias Corrected Bootstrap atau Studenized
Bootstrap.
Selain itu dapat juga dikembangkan dengan membahas aplikasi metode
bootstrap pada bidang lain di statistika seperti uji hipotesis bootstrap atau
Bayesian Bootstrap.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
89
DAFTAR PUSTAKA
Bain, L. J. & Engelhardt, M. (1992). Introduction to Probability and Mathematical Statistics. Belmont, CA: Brooks/Cole.
Chernick, M. R. (2008). Bootstrap Methods, A practitioner's guide. Hoboken, NJ: John Wiley & Sons, Inc.
Chernick, M. R. & Friis, R. H. (2003). Introductory Biostatistics for the Health Sciences (Modern Applications Including Bootstrap). Hoboken, NJ: John Wiley & Sons, Inc.
Efron, B. & Tibshirani, R. (1993). An Introduction to the Bootstrap. New York: Chapman & Hall.
Efron, B. (1994). The Jackknife, the Bootstrap and Other Resampling Plans. Montoelier, Vermont: Capital City Press.
Givens, G. H. & Hoeting, J. A. (2005). Computational Statistics. Hoboken, NJ: John Wiley & Sons, Inc.
Johnson, R. A. (2005). Probability and Statistics for Engineers. Upper Saddle River, NJ: Pearson Prentice Hall.
Johnson, R. W. (2001). An Introduction to the Bootstrap. Journal of the Royal Statistical Society Series D (The Statistician) 23(2): 49-54.
Kapur, J. N. & Saxena, H. C. (2001). Mathematical Statistics. New Delhi: S. Chand & Company LTD.
Korn, R., Korn, E., & Kroisandt, G. (2010). Monte Carlo Methods and Models in Finance. Boca Raton: CRC Press.
Kvam, P. H. & Vidakovic, B. (2007). Nonparametric Statistics with Application to Science and Engineering. Hoboken, NJ: John Wiley & Sons, Inc.
Mendenhall, W., Scheaffer, R. L., & Wackerly, D. D. (1986). Mathematical Statistics With application (Third Edition). Boston: PWS Publisher.
Mooney, C Z & Duval, R D. (1993). Bootstrap: A Nonparametric Approach to Statistical Inference. Newbury Park, CA: Sage Publications.
Moore, D., McCabe, G. P., & Craig, B. A. (2009). Introduction to the Practice of Statistics. New York: W. H. Freeman and Company.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
90
Kotz, S. (2006). Encyclopedia of Statistical Sciences (Second Edition). Hoboken, NJ: John Wiley & Sons, Inc.
Sembiring, R. K. (2003). Analisis Regresi. Bandung: Penerbit ITB.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
91
LAMPIRAN
TABEL-TABEL PADA BAB III
Tabel 3.1. Sampel Acak Tinggi Bangunan di Suatu Kota di Amerika Serikat
485 511 841 725 615 520 535 635 616 582
Sumber: Pittsburgh Tribune Review, 27 January 1997
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
102
Tabel 4.11. Data sisa konsentrasi anti-inflamatori pada 27 alat setelah digunakan dalam suatu waktu tertentu
Pabrik Waktu Besarnya Konsentrasi Pabrik Waktu Besarnya
Konsentrasi Pabrik Waktu Besarnya Konsentrasi
A 99 25,8 B 376 16,3 C 119 28,8 A 152 20,5 B 385 11,6 C 188 22 A 293 14,3 B 402 11,8 C 115 29,7 A 155 23,2 B 29 32,5 C 88 28,9 A 196 20,6 B 76 32 C 58 32,8 A 53 31,1 B 296 18 C 49 32,5 A 184 20,9 B 151 24,1 C 150 25,4 A 171 20,9 B 177 26,5 C 107 31,7 A 52 30,4 B 209 25,8 C 125 28,5 Sumber: Efron (1993)
Tabel 4.12. Tabel Aturan Konversi Bilangan Random
No. Nilai bilangan random
Nomor sampel yang dipilih 1 [0.0, 0.1111) 1 2 [0.1, 0.2222) 2 3 [0.2222, 0.3333) 3 4 [0.3333, 0.4444) 4 5 [0.4444, 0.5556) 5 6 [0.5556, 0.6667) 6 7 [0.6667, 0.7778) 7 8 [0.7778, 0.8889) 8 9 [0.8889, 1) 9
Tabel 4.13. Daftar Bilangan Random Untuk Pengambilan Sampel Bootstrap Pabrik A 0,31935 0,05156 0,05732 0,60277 0,18976 0,68976 0,36702 0,65359 0,16988 0,47719 0,25875 0,82341 0,46757 0,43677 0,3861 0,14974 0,39133 0,7095 0,76153 0,66111 0,01119 0,68148 0,22144 0,1348 0,1862 0,91869 0,94531 0,65445 0,58754 0,96938 0,31187 0,62865 0,39526 0,1063 0,77753 0,67963 0,66109 0,79658 0,55003 0,52765 0,15849 0,34511 0,43549 0,51243 0,5482
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
103
Tabel 4.14. Konversi Indeks Sampel Asli Untuk Sampel Bootstrap A
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
106
Tabel 4.22. Data sisa konsentrasi anti-inflamatori pada 27 alat setelah digunakan dalam suatu waktu tertentu
Pabrik Waktu Besarnya Konsentrasi Pabrik Waktu Besarnya
Konsentrasi Pabrik Waktu Besarnya Konsentrasi
A 99 25,8 B 376 16,3 C 119 28,8 A 152 20,5 B 385 11,6 C 188 22 A 293 14,3 B 402 11,8 C 115 29,7 A 155 23,2 B 29 32,5 C 88 28,9 A 196 20,6 B 76 32 C 58 32,8 A 53 31,1 B 296 18 C 49 32,5 A 184 20,9 B 151 24,1 C 150 25,4 A 171 20,9 B 177 26,5 C 107 31,7 A 52 30,4 B 209 25,8 C 125 28,5 �̂�𝛽0 33,3601 �̂�𝛽0 35,2061 �̂�𝛽0 37,1937 �̂�𝛽1 -0,0683 �̂�𝛽1 -0,0563 �̂�𝛽1 -0,0745
ukuran sampel (𝑛𝑛), tingkat signifikansi (𝛼𝛼), dan banyaknya
variabel independen (𝑘𝑘)
𝑝𝑝 = 𝑘𝑘 + 1
Bangkitkan pasangan terurut 𝐰𝐰𝑡𝑡 dengan mean 𝐦𝐦𝐦𝐦 dan covariance 𝐜𝐜𝐜𝐜𝐜𝐜
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
121
PROGRAM PADA BAB III
Program 3.1.
%PROGRAM 3.1 %program pendekatan rata-rata dan galat standar bootstrap %FS= jenis fungsi distribusi populasi %sa= sampel acak asli %n= besarnya ukuran sampel acak %re= banyaknya resampel bootstrap %u= matriks berisi bilangan random %bootstrapSAMPLE= matriks berisi hasil resampel dengan metode bootstrap % baris menyatakan ukuran sampel % kolom menyatakan banyaknya resampel (sampel bootstrap) %MEANboot= vektor kolom berisi mean untuk setiap hasil sampel bootstrap %xBARboot= pendekatan mean untuk sampling %RTasli= rata-rata sampel acak asli %SDasli= standar deviasi sampel acak asli %SEasli= standar eror sampel acak asli %RTpop= rata-rata populasi %SEpop= standar eror populasi %SEboot= pendekatan standar eror dari mean untuk sampling clear; clc; disp('Metode Bootstrap Pendekatan Standar Eror dan Selang kepercayaan Untuk Rata-Rata Populasi') disp(' ') disp('Jenis Fungsi Distribusi Simbol') disp(' Normal 1 ') disp(' Eksponensial 2 ') disp(' Binomial 3 ') disp(' Poisson 4 ') disp(' ') FS=input('masukkan jenis fungsi distribusi populasi: '); n=input('masukkan banyaknya sampel: '); re=input('masukkan banyaknya resampel :'); if FS==1 miu=input('masukkan nilai miu: '); sig=input('masukkan nilai sigma: '); sa=normrnd(miu,sig,1,n); rata=miu; varr=sig^2; elseif FS==2 L=input('masukkan nilai lamda: '); sa=exprnd(L,1,n); rata=L; varr=L^2; elseif FS==3 p=input('masukkan nilai p: '); C=input('masukkan banyaknya jumlah percobaan: '); sa=binornd(C,p,1,n); rata=p*C;
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
122
varr=rata*(1-p); else L=input('masukkan nilai lamda: '); sa=poissrnd(L,1,n); rata=L; varr=L; end tic sa; RTasli=mean(sa); SDasli=std(sa); VARasli=SDasli^2; SEasli=SDasli/(sqrt(n)); RTpop=rata; VARpop=varr; SEpop=(sqrt(varr/n)); u=rand(n,re); for j=1:re; for i=1:n; for k=1:n; while u(i,j)<(k*(1/n))&&u(i,j)>=((k-1)*(1/n))&&u(i,j)>=0; u(i,j)=sa(k); end rt=mean(u); end end end bootstrapSAMPLE=u; MEANboot=rt; xBARboot=mean(rt); SEboot=std(rt); VARboot=(SEboot^2)*n; disp('Sampel Asli: ') disp(sa') disp('Mean Populasi Mean Sampel Asli Mean Bootstrap') disp(fprintf('%10.5f%18.5f%22.5f\n',RTpop,RTasli,xBARboot)) disp(' ') disp('Var Populasi Var Sampel Asli Var Bootstrap') disp(fprintf('%10.5f%18.5f%22.5f\n',VARpop,VARasli,VARboot)) disp(' ') disp(' SE Populasi SE Sampel Asli SE Bootstrap') disp(fprintf('%10.5f%18.5f%22.5f\n',SEpop,SEasli,SEboot)) toc
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
123
PROGRAM PADA BAB IV
Program 4.1.
%PROGRAM 4.1 %program percentile bootstrap %FS= jenis fungsi distribusi populasi %sa= sampel acak asli %n= besarnya ukuran sampel acak %re= banyaknya resampel bootstrap %ts=tingkat signifikansi selang kepercayaan %u= matriks berisi bilangan random %bootstrapSAMPLE= matriks berisi hasil resampel dengan metode bootstrap % baris menyatakan ukuran sampel % kolom menyatakan banyaknya resampel (sampel bootstrap) %MEANboot= vektor kolom berisi mean untuk setiap hasil sampel bootstrap %xBARboot= pendekatan mean untuk sampling %RTasli= rata-rata sampel acak asli %SDasli= standar deviasi sampel acak asli %SEasli= standar eror sampel acak asli %RTpop= rata-rata populasi %SEpop= standar eror populasi %SEboot= pendekatan standar eror dari mean untuk sampling clear; clc; disp('Metode Bootstrap Pendekatan Standar Eror dan Selang kepercayaan Untuk Rata-Rata Populasi') disp(' ') disp('Jenis Fungsi Distribusi Simbol') disp(' Normal 1 ') disp(' Eksponensial 2 ') disp(' Binomial 3 ') disp(' Poisson 4 ') disp(' ') FS=input('masukkan jenis fungsi distribusi populasi: '); n=input('masukkan banyaknya sampel: '); re=input('masukkan banyaknya resampel :'); ts=input('masukkan tingkat signifikansi :'); if FS==1 miu=input('masukkan nilai miu: '); sig=input('masukkan nilai sigma: '); sa=normrnd(miu,sig,1,n); rata=miu; varr=sig^2; elseif FS==2 L=input('masukkan nilai lamda: '); sa=exprnd(L,1,n); rata=L; varr=L^2; elseif FS==3 p=input('masukkan nilai p: '); C=input('masukkan banyaknya jumlah percobaan: ');
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
124
sa=binornd(C,p,1,n); rata=p*C; varr=rata*(1-p); else L=input('masukkan nilai lamda: '); sa=poissrnd(L,1,n); rata=L; varr=L; end tic sa; RTasli=mean(sa); SDasli=std(sa); VARasli=SDasli^2; SEasli=SDasli/(sqrt(n)); RTpop=rata; VARpop=varr; SEpop=(sqrt(varr/n)); u=rand(n,re); for j=1:re; for i=1:n; for k=1:n; while u(i,j)<(k*(1/n))&&u(i,j)<(k*(1/n))&&u(i,j)>=((k-1)*(1/n))&&u(i,j)>=0; u(i,j)=sa(k); end rt=mean(u); end end end bootstrapSAMPLE=u; MEANboot=rt; xBARboot=mean(rt); SEboot=std(rt) VARboot=(SEboot^2)*n; SO=sort(rt); PERlower=SO(ceil(re*(ts/2))); PERupper=SO(round(re*(1-(ts/2)))); if n<30 tt=abs(tinv((ts/2),(n-1))); else tt=abs(norminv((ts/2),0,1)); end SKlower=(RTasli)-(tt*((SDasli)/(sqrt(n)))); SKupper=(RTasli)+(tt*((SDasli)/(sqrt(n)))); histfit(SO) disp('Sampel Asli: ') disp(sa') disp('Mean Populasi Mean Sampel Asli Mean Bootstrap') disp(fprintf('%10.5f%18.5f%22.5f\n',RTpop,RTasli,xBARboot)) disp(' ') disp('Var Populasi Var Sampel Asli Var Bootstrap') disp(fprintf('%10.5f%18.5f%22.5f\n',VARpop,VARasli,VARboot)) disp(' ') disp(' SE Populasi SE Sampel Asli SE Bootstrap')
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
125
disp(fprintf('%10.5f%18.5f%22.5f\n',SEpop,SEasli,SEboot)) disp(' ') disp('SK normal BB SK normal BA') disp(fprintf('%10.5f%19.5f\n',SKlower,SKupper)) disp(' ') disp('SK percentil BB SK percentil BA') disp(fprintf('%12.5f%20.5f\n',PERlower,PERupper)) toc
Program 4.2. %PROGRAM 4.2 %program bootstrap pendekatan parameter regresi dengan regressor RANDOM %t= banyaknya variabel independen %re= banyaknya sampel bootstrap %ip= banyaknya parameter regresi %ts= tingkat signifikansi selang kepercayaan parameter regresi %X= matriks VARIABEL INDEPENDEN ;kolom pertama terdiri dari elemen konstanta, x0=1 %Y= vektor VARIABEL DEPENDEN %u= matriks berisi bilangan random %Basli=Beta topi; vektor parameter penduga koefisien regresi asli. %s= standar deviasi dari eror %Bbntg= matriks berisi nilai Beta pendekatan dengan bootstrap %Bboot= vektor berisi hasil pendekatan parameter regresi bootstrap yang %didapat dari rata-rata kolom Bbntg %Bias= besarnya bias dari parameter bootstrap terhadap parameter penduga %SEboot= vektor berisi hasil pendekatan standar eror untuk parameter %regresi bootstrap %SKlower= batas bawah selang kepercayaan parameter regresi bootstrap pendekatan normal %SKupper= batas atas selang kepercayaan parameter regresi bootstrap pendekatan normal %PERlower= batas bawah selang kepercayaan parameter regresi bootstrap dengan %metode percentil %PERupper=batas atas selang kepercayaan parameter regresi bootstrap dengan %metode percentil clear; clc; t=input('masukkan banyaknya variabel independen: '); re=input('masukkan banyaknya sampel bootstrap: '); ip=t+1; ts=input('masukkan tingkat signifikansi: '); Y=input('masukkan matriks Variabel Dependen: '); n=length(Y); v=zeros(n,t); for e=1:t xx=input('masukkan matriks Variabel Independen: ');
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
126
v(:,e)=xx; end v; X=[ones(n,1),v]; In=inv(X'*X); Basli=In*(X'*Y); s=((Y'*Y)-(Basli'*X'*Y))/(n-ip) tic for j=1:re u=rand(n,1); w=repmat(u,1,(t+1)); oo=ones(n,1); sa=[oo,v]; for i=1:n; for k=1:n; while u(i)>=((k-1)*(1/n))&&u(i)<(k*(1/n))&&u(i)>=0; u(i)=Y(k); w(i,:)=sa(k,:); end end end Btopibntg=(inv(w'*w))*(w'*u); bb=length(Btopibntg); for l=1:bb Bbntg(l,j)=Btopibntg(l,:); end end Bbntg; Bbntgboot=Bbntg'; SO=sort(Bbntgboot); Bboot=mean(Bbntgboot); Bias=Bboot'-Basli; if n<30 tt=abs(tinv((ts/2),(n-length(Bboot)))); else tt=abs(norminv((ts/2),0,1)); end for d=1:ip SK=[SO(:,d)]; SEboot(d,:)=s*(sqrt(In(d,d))); Nbb=Basli(d)-(tt*s*(sqrt(In(d,d)))); Nba=Basli(d)+(tt*s*(sqrt(In(d,d)))); Pbb=SK(ceil(re*(ts/2))); Pba=SK(round(re*(1-(ts/2)))); SKlower(d,:)=Nbb; SKupper(d,:)=Nba; PERlower(d,:)=Pbb; PERupper(d,:)=Pba; end SKlower; SKupper; PERlower; PERupper; disp(' ')
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
127
disp(' Beta Topi Asli Beta Topi Bootstrap SE Bootstrap') for qq=1:ip fprintf('%12.5f%20.5f%22.5f%22.5f\n',Basli(qq),Bboot(qq),SEboot(qq),Bias(qq)) end disp(' ') disp('SK normal BB SK normal BA') for qq=1:ip fprintf('%10.5f%19.5f\n',SKlower(qq),SKupper(qq)) end disp(' ') disp('SK percentil BB SK percentil BA') for qq=1:ip fprintf('%12.5f%20.5f\n',PERlower(qq),PERupper(qq)) end toc Program 4.3. %PROGRAM 4.3 %program bootstrap pendekatan parameter regresi dengan regressor RANDOM %(tanpa konstanta) %t= banyaknya variabel independen %mu= vektor berisi t elemen yang berisi rata-rata untuk masing-masing %variabel independen %sig= matriks berukuran txt yang elemen diagonalnya berisi variansi dari %variabel independen yang indeksnya bersesuaian. harus semi definite %positif. %n= ukuran sampel %re= banyaknya sampel bootstrap %ip= banyaknya parameter regresi %er= standar deviasi untuk bilangan random normal %ts= tingkat signifikansi selang kepercayaan parameter regresi %beta= koefisien regresi populasi %vv= vektor berisi bilangan random normal dengan mean=0 dan var=er^2 yang digunakan sebagai eror untuk %Y. %X= matriks VARIABEL INDEPENDEN %Y= vektor VARIABEL DEPENDEN %u= matriks berisi bilangan random %Basli=Beta topi; vektor parameter penduga koefisien regresi asli. %s= standar deviasi dari eror %Bbntg= matriks berisi nilai Beta pendekatan dengan bootstrap %Bboot= vektor berisi hasil pendekatan parameter regresi bootstrap yang %didapat dari rata-rata kolom Bbntg %Bias= besarnya bias dari parameter bootstrap terhadap parameter penduga %asli
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
128
%SEboot= vektor berisi hasil pendekatan standar eror untuk parameter %regresi bootstrap %SKlower= batas bawah selang kepercayaan parameter regresi bootstrap pendekatan normal %SKupper= batas atas selang kepercayaan parameter regresi bootstrap pendekatan normal %PERlower= batas bawah selang kepercayaan parameter regresi bootstrap dengan %metode percentil %PERupper=batas atas selang kepercayaan parameter regresi bootstrap dengan %metode percentil clear; clc; t=input('masukkan banyaknya variabel independen: '); mu=input('masukkan vektor mu yang berisi rata-rata dari masing-masing variabel bebas: '); sig=input('masukkan matriks covariance: '); n=input('masukkan ukuran sampel: '); re=input('masukkan banyaknya sampel bootstrap: '); ip=t; lm=ip; er=input('masukkan standar deviasi galat: '); ts=input('masukkan tingkat signifikansi: '); for pp=1:ip beta(pp,:)=input('masukkan koefisien regresi: '); end tic x=mvnrnd(mu,sig,n); vv=normrnd(0,er,n,1); X=x; jj=X*beta; Y=(X*beta)+vv; In=inv(X'*X); Basli=In*(X'*Y); pro=(Y-(X*Basli)).*(Y-(X*Basli)); s=sqrt(((Y'*Y)-((Basli')*X'*Y))/(n-ip)); ss=sqrt((sum(pro))/(n-ip)); for j=1:re u=rand(n,1); saX=x; w=repmat(u,1,ip); for i=1:n for k=1:n while u(i)>=((k-1)*(1/n))&&u(i)<(k*(1/n))&&u(i)>=0; u(i)=Y(k); w(i,:)=saX(k,:); break end end end Btopibntg=(inv(w'*w))*(w'*u);
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
129
f=length(Btopibntg); for l=1:f Bbntg(l,j)=Btopibntg(l,:); end end Bbntg; Bbntgboot=Bbntg'; SO=sort(Bbntgboot); Bboot=mean(Bbntgboot); Bias=Bboot'-Basli; if n<30 tt=abs(tinv((ts/2),(n-ip))); else tt=abs(norminv((ts/2),0,1)); end for d=1:ip SK=[SO(:,d)]; SEboot(d,:)=s*(sqrt(In(d,d))) Nbb=Basli(d)-(tt*s*(sqrt(In(d,d)))) Nba=Basli(d)+(tt*s*(sqrt(In(d,d)))) Pbb=SK(ceil(re*(ts/2))); Pba=SK(round(re*(1-(ts/2)))); SKlower(d,:)=Nbb; SKupper(d,:)=Nba; PERlower(d,:)=Pbb; PERupper(d,:)=Pba; end SKlower; SKupper; PERlower; PERupper; SEboot; disp(' ') disp(' Beta Topi Asli Beta Topi Bootstrap SE Bootstrap') for qq=1:ip fprintf('%12.5f%20.5f%22.5f%22.5f\n',Basli(qq),Bboot(qq),SEboot(qq),Bias(qq)) end disp(' ') disp('SK normal BB SK normal BA jarak') for qq=1:ip fprintf('%10.5f%19.5f%19.5f\n',SKlower(qq),SKupper(qq),jarSK(qq)) end disp(' ') disp('SK percentil BB SK percentil BA jarak') for qq=1:ip fprintf('%12.5f%20.5f%20.5f\n',PERlower(qq),PERupper(qq),jarPER(qq)) end toc
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
130
Program 4.4. %PROGRAM 4.4 %program bootstrap pendekatan parameter regresi dengan regressor FIXED %X= matriks VARIABEL INDEPENDEN yang bersifat tetap/fixed %Y= vektor VARIABEL DEPENDEN %re= banyaknya resampel bootstrap %u= matriks berisi bilangan random %Btopi=Beta topi; vektor parameter penduga koefisien regresi awal. %E= vektor nilai RESIDUAL dari model regresi (digunakan sebagai sampel % asli) %Eboot= matriks berisi hasil resampel dengan metode bootstrap % baris menyatakan ukuran sampel % kolom menyatakan banyaknya resampel (sampel bootstrap) %Ybntg= matriks berisi hasil pendekatan nilai Y bintang bootstrap %Btopibntg= vektor berisi nilai Beta pendekatan dengan bootstrap %Bbntg= matriks berisi nilai rata-rata dari Btopibntg; merupakan hasil akhir %untuk parameter regresi bootstrap %Bboot= vektor berisi hasil pendekatan parameter regresi bootstrap yang %didapat dari rata-rata kolom Bbntg %s= standar deviasi dari eror %Bias= besarnya bias dari parameter bootstrap terhadap parameter penduga %SEboot= vektor berisi hasil pendekatan standar eror untuk parameter regresi bootstrap yang %didapat dari standar deviasi dari kolom Bbntg %SKlower= batas bawah selang kepercayaan parameter regresi bootstrap pendekatan normal %SKupper= batas atas selang kepercayaan parameter regresi bootstrap pendekatan normal %PERlower= batas bawah selang kepercayaan parameter regresi bootstrap dengan %metode percentil %PERupper=batas atas selang kepercayaan parameter regresi bootstrap dengan %metode percentil clear clc tic t=input('masukkan banyaknya variabel independen: '); re=input('masukkan banyaknya sampel bootstrap: '); ip=t+1; ts=input('masukkan tingkat signifikansi: '); x=input('masukkan matriks Variabel Independen: '); Y=input('masukkan matriks Variabel Dependen: '); n=length(x); tic oo=ones(n,1); X=[oo,x]; In=inv(X'*X); Btopi=In*(X'*Y);
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
131
Ytopi=X*(Btopi); E=Y-(Ytopi); tr=E'; n=length(tr); s=((Y'*Y)-(Btopi'*X'*Y))/(n-ip); u=rand(n,re); for j=1:re for i=1:n for k=1:n while u(i,j)<(k*(1/n))&&u(i,j)>=((k-1)*(1/n))&&u(i,j)>=0; u(i,j)=tr(k); break end end end end Eboot=u; XB=X*Btopi; for j=1:re; for i=1:n; A(i,j)=XB(i,1); end end A; Ybntg=A+Eboot; C=(inv(X'*X))*(X'); rows=length(C(:,1)); Bbntg=zeros(rows,re); for j=1:re; Btopibntg=C*Ybntg(:,j); for i=1:rows Bbntg(i,j)=Btopibntg(i,:); end end trp=Bbntg'; Bboot=mean(trp); Bias=Bboot'-Btopi; SO=sort(trp); if n<30 tt=abs(tinv((ts/2),(n-length(Bboot)))); else tt=abs(norminv((ts/2),0,1)); end for d=1:ip SK=[SO(:,d)]; Nbb=Btopi(d)-(tt*s*(sqrt(In(d,d)))); Nba=Btopi(d)+(tt*s*(sqrt(In(d,d)))); Pbb=SK(ceil(re*(ts/2))); Pba=SK(round(re*(1-(ts/2)))); SKlower(d,:)=Nbb; SKupper(d,:)=Nba; PERlower(d,:)=Pbb; PERupper(d,:)=Pba; SEboot(d,:)=s*(sqrt(In(d,d)));
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
132
end SKlower; SKupper; PERlower; PERupper; disp(' ') disp(' Beta Topi Asli Beta Topi Bootstrap SE Bootstrap') for qq=1:ip fprintf('%10.5f%20.5f%23.5f%15.5f\n',Btopi(qq),Bboot(qq),SEboot(qq),Bias(qq)) end disp(' ') disp('SK normal BB SK normal BA') for qq=1:ip fprintf('%10.5f%19.5f\n',SKlower(qq),SKupper(qq)) end disp(' ') disp('SK percentil BB SK percentil BA') for qq=1:ip fprintf('%12.5f%20.5f\n',PERlower(qq),PERupper(qq)) end toc Program 4.5. %PROGRAM 4.5 %program bootstrap pendekatan parameter regresi dengan regressor FIXED %t= banyaknya variabel independen %mu= vektor berisi t elemen yang berisi rata-rata untuk masing-masing %variabel independen %sig= matriks berukuran txt yang elemen diagonalnya berisi variansi dari %variabel independen yang indeksnya bersesuaian. harus semi definite %positif. %n= ukuran sampel %re= banyaknya sampel bootstrap %ip= banyaknya parameter regresi %er= standar deviasi untuk bilangan random normal %ts= tingkat signifikansi selang kepercayaan parameter regresi %beta= koefisien regresi populasi %vv= vektor berisi bilangan random normal dengan mean=0 dan var=er^2 yang digunakan sebagai eror untuk %Y. %X= matriks VARIABEL INDEPENDEN %Y= vektor VARIABEL DEPENDEN %u= matriks berisi bilangan random %Basli=Beta topi; vektor parameter penduga koefisien regresi asli. %s= standar deviasi dari eror%E= vektor nilai RESIDUAL dari model regresi (digunakan sebagai sampel
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
133
% asli) %Eboot= matriks berisi hasil resampel dengan metode bootstrap % baris menyatakan ukuran sampel % kolom menyatakan banyaknya resampel (sampel bootstrap) %Ybntg= matriks berisi hasil pendekatan nilai Y bintang bootstrap %Btopibntg= vektor berisi nilai Beta pendekatan dengan bootstrap %Bbntg= vektor berisi nilai rata-rata dari Btopibntg; merupakan hasil akhir %untuk parameter regresi bootstrap %Bboot= vektor berisi hasil pendekatan parameter regresi bootstrap yang %didapat dari rata-rata kolom Bbntg %Bias= besarnya bias dari parameter bootstrap terhadap parameter penduga %SEboot= vektor berisi hasil pendekatan standar eror untuk parameter regresi bootstrap yang %didapat dari standar deviasi dari kolom Bbntg %SKlower= batas bawah selang kepercayaan parameter regresi bootstrap pendekatan normal %SKupper= batas atas selang kepercayaan parameter regresi bootstrap pendekatan normal %PERlower= batas bawah selang kepercayaan parameter regresi bootstrap dengan %metode percentil %PERupper=batas atas selang kepercayaan parameter regresi bootstrap dengan %metode percentil clear clc t=input('masukkan banyaknya variabel independen: '); mu=input('masukkan vektor mu yang berisi rata-rata dari masing-masing variabel bebas: '); sig=input('masukkan matriks covariance yang elemen diagonalnya berisi variansi dari variabel bebas yang bersesuaian: '); n=input('masukkan banyaknya jumlah sampel: '); ip=t; re=input('masukkan banyaknya sampel bootstrap: '); lm=ip; er=input('masukkan standar deviasi dari galat: '); ts=input('masukkan tingkat signifikansi: '); tic for pp=1:ip beta(pp,:)=input('masukkan koefisien regresi: '); end x=mvnrnd(mu,sig,n); vv=normrnd(0,er,n,1); X=x; jj=X*beta; Y=(X*beta)+vv; In=inv(X'*X); Btopi=(In*(X'*Y));
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
134
Ytopi=X*(Btopi); E=Y-(Ytopi); tr=E'; s=sqrt(((Y'*Y)-((Btopi')*X'*Y))/(n-ip)); a=length(tr); u=rand(a,re); for j=1:re; for i=1:a; for k=1:a; while u(i,j)<(k*(1/a))&&u(i,j)>=((k-1)*(1/a))&&u(i,j)>=0; u(i,j)=tr(k); break end end end end Eboot=u; XB=X*Btopi; for j=1:re; for i=1:a; A(i,j)=XB(i,1); end end A; Ybntg=A+Eboot; C=In*X'; rows=length(C(:,1)); Bbntg=zeros(rows,re); for j=1:re; Btopibntg=C*Ybntg(:,j); for i=1:rows; Bbntg(i,j)=Btopibntg(i,:); end end trp=Bbntg'; Bboot=mean(trp); Bias=Bboot'-Btopi; SO=sort(trp); if a<30 tt=abs(tinv((ts/2),(a-(length(Bboot))))); else tt=abs(norminv((ts/2),0,1)); end for d=1:ip SK=[SO(:,d)]; SEboot(d,:)=s*(sqrt(In(d,d))) Nbb=Btopi(d)-(tt*(SEboot(d))); Nba=Btopi(d)+(tt*(SEboot(d))); Pbb=SK(ceil(re*(ts/2))); Pba=SK(round(re*(1-(ts/2)))); SKlower(d,:)=Nbb; SKupper(d,:)=Nba; PERlower(d,:)=Pbb; PERupper(d,:)=Pba; end
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
135
SKlower; SKupper; PERlower; PERupper; disp(' ') disp(' Beta Topi Asli Beta Topi Bootstrap SE Bootstrap Bias') for qq=1:ip fprintf('%10.5f%20.5f%23.5f%15.5f\n',Btopi(qq),Bboot(qq),SEboot(qq),Bias(qq)) end disp(' ') disp('SK normal BB SK normal BA') for qq=1:ip fprintf('%10.5f%19.5f\n',SKlower(qq),SKupper(qq)) end disp(' ') disp('SK percentil BB SK percentil BA') for qq=1:ip fprintf('%12.5f%20.5f\n',PERlower(qq),PERupper(qq)) end toc
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI