REGRESI ROBUST DENGAN ESTIMASI MM (Method of Moment) Skripsi untuk memenuhi sebagian persyaratan mencapai derajat Sarjana S-1 Program Studi Matematika diajukan oleh : EKO KURNIAWAN 06610032 Kepada PROGRAM STUDI MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI UIN SUNAN KALIJAGA YOGYAKARTA 2011
39
Embed
REGRESI ROBUST DENGAN ESTIMASI MM (Method of Moment ...
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
REGRESI ROBUST
DENGAN ESTIMASI MM (Method of Moment)
Skripsi
untuk memenuhi sebagian persyaratan
mencapai derajat Sarjana S-1
Program Studi Matematika
diajukan oleh :
EKO KURNIAWAN 06610032
Kepada
PROGRAM STUDI MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI
UIN SUNAN KALIJAGA YOGYAKARTA
2011
v
MOTTO
Jadilah pribadi yang professional religius
Kejarlah cita-citamu sebelum kau mengejar cintamu
Setiap ada kesulitan pasti akan ada jalan pemecahannya
Allah akan meninggikan beberapa derajad orang yang berilmu
“Sesungguhnya Allah tidak merubah keadaan suatu kaum,
sehingga mereka merubah keadaan yang ada pada diri mereka sendiri.”
(Q.S Ar-Ra’d : 11)
vi
HALAMAN PERSEMBAHAN
Karya ilmiah ini penulis persembahkan untuk
Bapak dan Ibu yang terkasih
Kakak dan adik tersayang
Keluarga besarku tercinta
Orang-orang terbaik dalam kehidupanku
Almamaterku Universitas Islam Negeri Sunan
Kalijaga
vii
KATA PENGANTAR
Puji syukur penulis panjatkan kehadirat Allah SWT yang telah
melimpahkan segala rahmat dan hidayah-Nya, sehingga penulisan skripsi ini
dapat terselesaikan dengan baik.
Penulis menyadari skripsi ini tidak akan selesai tanpa motivasi, bantuan,
bimbingan, dan arahan dari berbagai pihak baik moril maupun materiil. Oleh
karena itu, dengan kerendahan hati izinkan penulis mengucapkan rasa terima
kasih yang sedalam-dalamnya kepada :
1. Yth. Bapak Prof. Drs. H. Akh. Minhaji, M.A, Ph.D selaku Dekan Fakultas
Sains dan Teknologi UIN Sunan Kalijaga Yogyakarta.
2. Yth. Ibu Dra. Maizer Said Nahdi, M.Si. selaku mantan Dekan Fakultas Sains
dan Teknologi UIN Sunan Kalijaga Yogyakarta.
3. Yth. Ibu Dra. Hj. Khurul Wardati, M.Si selaku Pembantu Dekan I.
4. Yth. Ibu Hj. Sri Utami Zuliana, M.Sc selaku Ketua Program Studi
Matematika sekaligus Penasehat Akademik yang telah senantiasa
memotivasi serta mengarahkan sehingga skripsi ini dapat terselesaikan.
5. Yth. Bapak Mohammad Farhan Qudratullah, M.Si selaku pembimbing yang
telah meluangkan waktu untuk membantu, memotivasi, membimbing serta
mengarahkan sehingga skripsi ini dapat terselesaikan.
6. Segenap dosen dan karyawan Fakultas Sains dan Teknologi UIN Sunan
Kalijaga Yogyakarta.
viii
7. Kedua orang tua yang sangat penulis sayangi yang senantiasa memberikan
kasih sayang, semangat, serta do’a yang selalu mengiringi disetiap langkah
penulis.
8. Kakak dan adik tersayang mas adi dan mbak endang, mas pardi dan mbak
mur, mbak sam dan juga dewi serta keluarga besar penulis yang selalu
memberikan kasih sayang, motivasi dan do’a sehingga skripsi ini dapat
terselesaikan.
9. Seluruh sahabat-sahabatku yang selalu memberi motivasi dan berbagi ilmu
Umi, Suryo, Novi, Jeihan, Qori, Lina, Rani, Sahid serta semua sahabatku
matematika’06 yang tidak bisa penulis sebutkan satu persatu. Terima kasih,
kalian adalah sahabat terbaikku.
10. Semua pihak yang tidak bisa penulis sebutkan satu persatu yang telah
dengan ikhlas memberikan sumbangan moril maupun materiil kepada
penulis sehingga penulisan skripsi ini dapat terselesaikan.
Semoga jasa dan amal baik mereka mendapatkan balasan dari Allah SWT.
Penulis menyadari bahwa skripsi ini masih jauh dari sempurna. Untuk itu
penulis mengharapkan kritik dan saran yang bersifat membangun.
Akhir kata mudah-mudahan penulisan skripsi ini dapat bermanfaat bagi kita
semua, khususnya bagi para pembaca.
Yogyakarta, 18 Mei 2011 Penulis
Eko Kurniawan NIM.06610032
ix
DAFTAR ISI
COVER ............................................................................................................. i
HALAMAN JUDUL ........................................................................................ ii
HALAMAN PERSETUJUAN ....................................................................... iii
HALAMAN PERNYATAAN.......................................................................... iv
MOTTO ............................................................................................................. v
HALAMAN PERSEMBAHAN ...................................................................... vi
KATA PENGANTAR .................................................................................... vii
DAFTAR ISI .................................................................................................... ix
DAFTAR GAMBAR ....................................................................................... xi
DAFTAR TABEL .......................................................................................... xii
DAFTAR LAMPIRAN ................................................................................. xiii
ABSTRAKSI .................................................................................................. xiv
BAB I PENDAHULUAN .................................................................................. 1
1.1 Latar Belakang ........................................................................................ 1
1.2 Batasan Masalah ..................................................................................... 2
1.3 Rumusan Masalah ................................................................................... 3
1.4 Tujuan Penelitian .................................................................................... 3
Lampiran 7 : Output Robust MM Linear Regression ....................................... 88
Lampiran 8 : Output Nilai Summary Masing-Masing Variabel ....................... 89
xiv
REGRESI ROBUST DENGAN ESTIMASI MM
Oleh : Eko Kurniawan (06610032)
ABSTRAKSI
Estimasi parameter regresi linear bertujuan untuk menjelaskan satu atau lebih variabel independent iX terhadap variabel dependent iY . Metode estimasi yang sering digunakan adalah metode OLS (Ordinary Least square). Salah satu kelemahan metode ini adalah jika terdapat outlier pada data menyebabkan estimator yang dihasilkan kurang mampu mendeteksi outlier tersebut. Salah satu alternatif untuk memperbaiki kelemahan metode estimasi OLS adalah menggunakan estimasi yang bersifat robust yang mampu bertahan terhadap kehadiran outlier dalam jumlah tertentu pada data pengamatan. Regresi robust dapat digunakan untuk mendeteksi outlier dan memberikan hasil estimasi yang resistant atau robust terhadap outlier.
Penelitian ini membahas salah satu metode metode regrei robust yaitu metode estimasi MM (Method of Momment) yang bertujuan mengestimasi parameter regresi ketika data terkontaminasi outlier. Estimasi ini mempunyai efisiensi yang tinggi ketika error berdistribusi normal serta memiliki nilai breakdown yang tinggi pula. Penelitian ini bertujuan untuk mengkaji metode estimasi MM yang diterapkan pada pengaruh ujian tulis terhadap IPK mahasiswa Univeritas Islam Negeri Sunan Kalijaga Fakultas Sains dan Teknologi tahun 2009. data yang diambil meliputi tes verbal, tes numerik, tes spasial, tes dirosah islamiah, dan IPK. Hasil penelitian menunjukkan bahwa estimasi MM menghasilkan model yang lebih baik dari OLS. Hal ini ditunjukkan oleh nilai r-square yang lebih besar dan Standard error yang lebih kecil dari model hasil estimasi OLS. Kata Kunci : Ordinary Least Square, Outlier, Regresi Robust dengan Estimasi MM
1
BAB I
PENDAHULUAN
1.1 Latar Belakang
Istilah regresi pertama kali diperkenalkan oleh Sir Francis Galton pada
tahun 1877 dalam penelitian biogenetisnya. Analisis regresi merupakan analisis
yang mempelajari bagaimana membangun sebuah model fungsional dari data
untuk dapat menjelaskan atau meramalkan suatu fenomena alam atas dasar
fenomena yang lain. Analisis regresi berguna dalam menelaah hubungan sepasang
variabel atau lebih. Salah satu cara yang dapat digunakan untuk melihat hubungan
antara variabel independent dan variabel dependent adalah dengan menggunakan
metode Ordinary Least Square (OLS).
Penilaian ketetapan model regresi tidak cukup hanya didasarkan pada
besarnya koefisien determinasi atau koefisien regresi tetapi perlu pemeriksaan
sisaan (error) dengan lebih seksama yang menyangkut antara lain kemungkinan
adanya outlier. Identifikasi outlier dan melihat bagaimana peranannya terhadap
taksiran model merupakan tahapan diagnosis yang perlu ditempuh terutama bila
penaksiran modelnya dilakukan dengan metode OLS. Prosedur analisis yang
diharapkan adalah prosedur yang menghasilkan keluaran yang cukup baik
meskipun beberapa asumsinya tidak terpenuhi secara sempurna. Metode lain yang
dapat digunakan untuk mengatasi outlier adalah regresi robust.
Regresi robust diperkenalkan oleh Andrews (1972) dan merupakan
metode regresi yang digunakan ketika distribusi dari error tidak normal dan atau
2
adanya beberapa outlier yang berpengaruh pada model1. Metode ini merupakan
alat penting untuk menganalisa data yang dipengaruhi oleh outlier sehingga
dihasilkan model yang robust atau resistant terhadap outlier. Suatu estimasi yang
resistant adalah relatif tidak terpengaruh oleh perubahan besar pada bagian kecil
data atau perubahan kecil pada bagian besar data. Prosedur robust ditujukan untuk
mengakomodasi adanya keanehan data, sekaligus meniadakan identifikasi adanya
data outlier dan juga bersifat otomatis dalam menanggulangi data outlier2.
Beberapa metode estimasi dalam regresi robust diantaranya M Estimation, Least
Median Square (LMS), Least Trimmed Square (LTS), S Estimation, MM
Estimation.
Regresi robust merupakan metode yang baik untuk menanggulangi outlier,
karena menghasilkan estimator yang bersifat robust. Salah satu metode regresi
robust yang popular dan paling umum digunakan untuk menangani bad leverage
points adalah estimasi MM (Method of Moment). Estimasi MM mempunyai
efisiensi yang tinggi ketika error berdistribusi normal serta memiliki nilai
breakdown yang tinggi pula. Metode estimasi MM yang dikenalkan pertama kali
oleh Yohai (1987) memadukan estimasi nilai high breakdown (50%) dengan
efisiensi tinggi (mencapai 95%).
1.2 Batasan Masalah
Dalam penulisan tugas akhir ini pembatasan masalah sangat diperlukan
supaya tidak terjadi penyimpangan dari tujuan semula sehingga pemecahan
1 Azwar, R., Regresi Robust, (Surabaya: Jurnal penelitian, 2009) hal 1 2 Aunuddin, Analisis Data, (Bogor: ITB, 1989) hal 16
3
masalah akan lebih terfokus. Berdasarkan uraian latar belakang di atas, maka
pembatasan tugas akhir ini akan difokuskan pada regresi robust dengan metode
estimasi MM (Method of Moment) yang bertujuan untuk mengestimasi parameter
regresi ketika data terkontaminasi outlier. Estimasi ini mempunyai efisiensi serta
nilai breakdown yang tinggi.
1.3 Rumusan Masalah
Berdasarkan latar belakang di atas, maka dirumuskan permasalahan
sebagai berikut:
1 Apa yang dimaksud dengan regresi robust?
2 Bagaimana prosedur regresi robust dengan metode estimasi MM dalam
menyelesaikan masalah yang ada?
3 Bagaimana penerapan regresi robust dalam kasus pengaruh nilai masuk
ujian tulis terhadap IPK mahasiswa Sains dan Teknologi menggunakan S-
Plus 2000?
4 Bagaimana perbandingan estimasi OLS dengan estimasi MM pada data hasil
ujian tulis terhadap IPK mahasiswa Fakultas Sains dan Teknologi?
1.4 Tujuan Penelitian
Tujuan dari penelitian tugas akhir ini adalah :
1. Mempelajari dan memahami tentang regresi robust.
2. Mampu mengaplikasikan analisis regresi robust menggunakan metode
estimasi MM dalam memecahkan masalah yang ada.
4
3. Mampu mengaplikasikan regresi robust dalam kasus pengaruh nilai masuk
ujian tulis terhadap IPK mahasiswa Sains dan Teknologi menggunakan S-
Plus 2000.
1.5 Manfaat Penelitian
Penelitian ini diharapkan dapat memberikan sumbangan terhadap
perkembangan ilmu pengetahuan dalam rangka memperluas dan memperdalam
wawasan dalam bidang matematika, khususnya penelitian ini diharapkan dapat
bermanfaat dalam beberapa aspek diantaranya :
1. Memberikan pengetahuan tentang regresi robust
2. Memberikan pengetahuan tentang prosedur regresi robust dengan metode
estimasi MM.
3. Memberikan pengetahuan dalam mengaplikasikan regresi robust
menggunakan S-Plus 2000.
4. Memberikan motivasi untuk lebih mengembangkankan pengetahuan
tentang regresi robust.
1.6 Tinjauan Pustaka
Tinjauan pustaka dalam penulisan tugas akhir ini adalah
1. Makalah yang berjudul pencilan (outlier) yang ditulis oleh Soemartini
mahasiswa FMIPA Universitas Pajajaran Jatinangor yang membahas
keberadaan data pencilan akan mengganggu dalam proses analisis data dan
harus dihindari dalam banyak hal. Dalam kaitannya dengan analisis
regresi, pencilan dapat menyebabkan hal-hal berikut :
a. Residual yang besar dari model yang terbentuk atau E(e)≠0
5
b. Variansi pada data tersebut menjadi lebih besar
c. Taksiran interval memiliki rentang yang lebar
2 Skripsi yang berjudul “ Regresi robust dengan Estimasi M” yang ditulis
oleh mahasiswa Program Studi Statistik FMIPA UGM. Skripsi ini
membahas tentang definisi regresi robust dan prosedur estimasi M.
Estimasi ini merupakan salah satu kelas estimasi robust yang penting dan
paling luas digunakan. Estimasi ini meningkatkan efisiensi Gaussian dan
menjaga kerobustan dengan menangani vertical outlier. Estimasi ini
meminimumkan suatu fungsi ρ dari residual-risidual yang kemudian
diambil derivatifnya, yaitu ψ= ρ’. karena fungsi ψ tidak linear maka harus
diselesaikan dengan metode iterasi yaitu Iteratively Reweighted Least
Squares (IRLS)
3 Skripsi yang berjudul “ Regresi robust dengan Estimasi Least Trimmed
Square” yang ditulis oleh Yulvita Sangdiah, mahasiswi Program Studi
Statistik FMIPA UGM tahun 2007. Skripsi ini membahas tentang definisi
regresi robust dan prosedur estimasi Least Trimmed Square. Metode ini
menduga koefisien regresi dengan menggunakan OLS terhadap sebaran
data yang sudah terpangkas (trimmed) atau sebaran terwinsorkan
(winsorized distribution). Estimasi LTS merupakan estimasi kelas High
Breakdown Value. Nilai breakdown adalah proporsi minimal dari
banyaknya pencilan dibandingkan seluruh data pengamatan.
4 Skripsi yang berjudul “ Regresi robust dengan Estimasi Least Median
Square” yang ditulis oleh Zaid Muttaqin, mahasiswa Program Studi
6
Statistik FMIPA UGM tahun 2010. Skripsi ini membahas tentang definisi
regresi robust dan prosedur estimasi Least Median Square. Estimasi ini
mengganti jumlahan kudrat residual OLS dengan median kuadrat residual.
1.7 Sistematika Penulisan
Skripsi ini terdiri dari beberapa bab. Secara garis besar, sistematika
penulisan skripsi ini adalah sebagai berikut:
BAB I PENDAHULUAN
Bab ini berisi tentang latar belakang, rumusan masalah, batasan masalah,
tujuan penelitian, manfaat penelitian, metode penelitian, tinjauan pustaka
dan sistematika penulisan.
BAB II DASAR TEORI
Membahas tentang teori-teori yang akan dipakai sebagai dasar dalam
pemecahan masalah. Bab ini menjelaskan tentang variabel random diskrit
dan kontinu, regresi linear sederhana, regresi linear multiple, metode
estimasi ordinary least square, Maximum Likelihood dan weighted least
square serta menjelaskan tentang definisi Outlier, pengaruh outlier,
identifikasi outlier menggunakan metode grafis, standardized residual.
BAB III METODE PENELITIAN
Membahas tentang metode penelitian yang digunakan. Bab ini
menjelaskan tentang menemukan masalah, merumuskan masalah, studi
pustaka, analisis dan pemecahan masalah yang mencakup sumber data,
analisis data, dan pengambilan keputusan, serta penarikan kesimpulan.
BAB IV PEMBAHASAN
7
BAB IV PEMBAHASAN
Membahas tentang definisi regresi robust dan kegunaannya, prosedur
regresi robust dengan estimasi MM dan fungsi-fungsi ukuran robust.
BAB V STUDI KASUS
Pada bagian ini akan dibahas mengenai aplikasi analisis regresi robust
dengan estimasi MM menggunakan S-Plus 2000 dalam kasus pengaruh
nilai masuk ujian tulis terhadap IPK mahasiswa Fakulta Sains dan
Teknologi Universitas Islam Negeri Sunan Kalijaga.
BAB VI PENUTUP
Bab ini berisi tentang kesimpulan-kesimpulan yang diperoleh dari
beberapa pembahasan sebelumnya dan saran-saran yang berkaitan dengan
penelitian skripsi ini sebagai akibat dari kekurangan atau kelebihan dari
hasil analisis yang dilakukan.
DAFTAR PUSTAKA
Bagian ini memuat keterangan dari beberapa buku dan literatur lain yang
menjadi acuan dalam penyusunan skripsi ini.
72
BAB VI
PENUTUP
6.1 Kesimpulan
Berdasarkan hasil pembahasan dan studi kasus diperoleh kesimpulan
sebagai berikut :
1. Regresi robust adalah salah satu alternatif untuk mengestimasi parameter
dalam model regresi linear dengan tujuan mengurangi pengaruh dari
observasi-observasi yang memuat outlier. Estimator regresi robust mampu
mendeteksi dan dapat bertahan terhadap kehadiran outlier dalam jumlah
tertentu pada data pengamatan.
2. Prosedur regresi robust dengan estimasi MM :
Estimasi awal koefisien ( )1j
∧
β dan residual ( )1ie yang bersesuaian diambil
dari regresi robust dengan high breakdown points.
residual ( )1ie pada langkah pertama digunakan untuk menghitung skala
residual s
∧
σ dan dihitung pula pembobot awal ( )1iw .
residual ( )1ie dan skala residual s
∧
σ pada langkah sebelumnya digunakan
dalam iterasi awal sebagai penaksir WLS (Weighted Least square) untuk
menghitung koefisien regresi.
menghitung bobot baru ( )2iw menggunakan skala residual dari iterasi
awal WLS (Weighted Least square).
73
langkah 2,3, dan 4 diulang (dengan skala residual tetap konstan) sampai
( )∑=
n
i
mie
1 konvergen.
3. Model dengan menggunakan regresi robust dengan estimasi MM
1016.04559.2ˆ XY +=
Model diatas adalah model yang dihasilkan oleh estimasi MM setelah data
dieksekusi sehingga tinggal 1 variabel yang di analisis. Model tersebut
memiliki standard error sebesar 0.4136 dan r-square sebesar 0.321. Dari
r-square yang dihasilkan oleh estimasi MM, ini berarti bahwa hanya
sebesar 32.1% IPK dipengaruhi oleh ujian tulis, selebihnya 67.9%
dipengaruhi oleh faktor lain.
4. Regresi robust dengan metode estimasi MM menghasilkan standard error
yang lebih kecil dan r-square yang lebih besar daripada estimasi OLS. Oleh
karena itu metode estimasi MM relatif lebih baik dibandingkan dengan
metode estimasi OLS untuk data yang errornya tidak berdistribusi normal
atau data terkontaminasi outlier.
6.2 Saran
1. Estimasi MM merupakan metode estimasi regresi robust yang baik dalam
menangani outlier, namun perlu dipelajari juga metode estimasi selain
regresi robust estimasi MM dan mengaplikasikannya untuk mengatasi
beberapa permasalahan yang tidak dapat diselesaikan dengan regresi biasa.
74
2. Untuk pengambil keputusan, sekiranya bisa lebih memperhatikan faktor-
faktor yang mempengaruhi IPK mahasiswa supaya mahasiswa memperoleh
IPK yang lebih baik.
Model dengan menggunakan regresi robust dengan estimasi OLS
32 025.00208.0682.2ˆ XXY −+=
Model diatas adalah model yang dihasilkan oleh estimasi OLS setelah data
dieksekusi sehingga tinggal 2 variabel yang di analisis. Dari model diatas
menunjukkan bahwa tes numerik dan tes spasial berpengaruh terhadap IPK,
sedangkan tes verbal dan tes dirosah islamiyah tidak berpengaruh terhadap
IPK. Kita juga melihat bahwa tes spasial mempunyai pengaruh negatif.
Sehingga perlu evaluasi lebih lanjut tentang masalah tes spasial yang
mempunyai pengaruh negatif dan juga tes verbal maupun tes dirosah
islamiyah yang tidak berpengaruh terhadap IPK.
Demikian saran yang bisa peneliti berikan, semoga bisa menjadi masukan
untuk para peneliti selanjutnya di bidang statistik. Sehingga bisa mengembangkan
penelitian sebelumnya.
75
DAFTAR PUSTAKA
Huber, P.J., 1981. Robust Statistics. John Wiley and sons, New York.
Rousseeuw, R.J. and A.M. Leroy, 1987, Robust Regression and Detection. New
York.
Montgomery, D.C. and Peck, E.A., 1982, Introduction to Linear Regression analysis,
John Whilley and Sons Inc, New York.
Bain, L. J and Engelhardt, M., 1992, Introduction to Probability and Mathematical
Statistics, Second edition, Duxbury Press, California, USA.
Chen, Colin, 2002, robust Regression and Outlier Detection with the robustREG
Procedure. SUGI Paper 265-267, SAS Institute, Cary, NC.
Olive, D.J., 2006, Applied robust Statistics, Southern Illinois University, Department
*** Robust MM Linear Regression *** Final M-estimates. Residuals: Min 1Q Median 3Q Max -0.7955 -0.3095 0.009171 0.2635 0.6909 Coefficients: Value Std. Error t value Pr(>|t|) (Intercept) 2.5261 0.1473 17.1542 0.0000 Tes.Verbal 0.0137 0.0066 2.0852 0.0383 Tes.Numerik 0.0107 0.0062 1.7386 0.0837 Tes.Spasial -0.0215 0.0129 -1.6679 0.0969 Tes.Dirosah.Islamiah -0.0025 0.0050 -0.4899 0.6248 Residual scale estimate: 0.41 on 197 degrees of freedom Proportion of variation in response explained by model: 0.3343 Test for Bias Statistics P-value M-estimate 6.58 0.254 LS-estimate -21.62 1.000
The seed parameter is : 1313
Lampiran 8 : Output Nilai Summary Masing-Masing Variabel