LAPORAN PRAKTIKUM PENGANTAR METODE STATISTIKA MODUL VI Regresi Linier Berganda, Pemeriksaan dan Pengujian Asumsi Residual Identik, Independen dan Distribusi Normal serta Deteksi Multikolinieritas pada Data Peresentase Penduduk Miskin, dan Jumlah Sekolah terhadap Angka Putus Sekolah Usia SMA di Jawa Timur Tahun 2011 Oleh: Rendi Winarno 1314030091 Al Athur Risky D. 1314030099 Lutfi Intan Anggraeni 1314030103 Asisten Dosen: Aisyatul Al Lailiyah
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
LAPORAN PRAKTIKUMPENGANTAR METODE STATISTIKA
MODUL VI
Regresi Linier Berganda, Pemeriksaan dan Pengujian Asumsi
Residual Identik, Independen dan Distribusi Normal serta Deteksi
Multikolinieritas pada Data Peresentase Penduduk Miskin, dan
Jumlah Sekolah terhadap Angka Putus Sekolah Usia SMA di
Jawa Timur Tahun 2011
Oleh:
Rendi Winarno 1314030091
Al Athur Risky D. 1314030099
Lutfi Intan Anggraeni 1314030103
Asisten Dosen:
Aisyatul Al Lailiyah
Program Studi Diploma III
Jurusan Statistika
Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Teknologi Sepuluh Nopember
Surabaya
2015
ABSTRAK
Pendidikan merupakan salah satu faktor penting dalam upaya mengembangkan sumber daya manusia. Angka putus sekolah di Jawa Timur sampai saat ini masih tinggi, khususnya untuk jenjang usia SMA. Faktor-faktor yang mempengaruhi angka putus sekolah disebabkan oleh persentase penduduk miskin, terbatasnya jumlah sekolah yang ada, faktor sosial atau masyarakat, dan persentase tenaga pengajar.. Pada modul ini akan membahas mengenai pengujian dan pemeriksaan asumsi residual IIDN pada regresi linier berganda serta deteksi multikolinieritas. Data yang diambil merupakan data sekunder yang diambil dari tugas akhir yang berjudul “Pemodelan Angka Putus Sekolah Usia SMA di Jawa Timur Dengan Pendekatan Regresi Spline Multivariabel” sebanyak 38 data. Hasil yang didapatkan adalah pada regresi linier sederhana persentase tenaga pengajar berpengaruh signifikan terhadap angka putus sekolah di Jawa Timur sedangkan pada regresi linier berganda semua faktor penyebab putus sekolah berpengaruh signifikan terhadap angka putus sekolah di Jawa timur. Asumsi residual IIDN telah terpenuhi dengan regresi linier berganda. Serta tidak terdapat multikolinieritas pada variabel prediktor yang diuji
Kata Kunci: Analisis regresi linier berganda, analisis regresi linier sederhana, multikolinieritas, pengujian dan pemeriksaan asumsi residual IIDN
Normal) merupakan uji yang harus dilakukan apakah data yang digunakan
memenuhi ketiga asumsi tersebut dalam melakukan pengujian (Sudjana, 1996)
2.3.1 Pemeriksaan Aumsi Residual Identik
Pemeriksaan residual identik dilakukan untuk melihat apakah residual
memenuhi asumsi identik. Suatu data dikatakan identik apabila plot residualnya
menyebar secara acak dan tidak membentuk suatu pola tertentu. Nilai variansnya
rata-rata sama antara varians satu dengan yang lainnya.
2.3.2 Pemeriksaan Asumsi Residual Independen
Pemeriksaan residual independen dilakukan untuk melihat apakah residual
memenuhi asumsi independen. Suatu data dikatakan independen apabila plot
residualnya menyebar secara acak dan tidak membentuk suatu pola tertentu.
2.3.3 Pemeriksaan Asumsi Residual Berdistribusi Normal
Pemeriksaan residual distribusi normal dilakukan untuk melihat apakah
residual memenuhi asumsi berdistribusi normal, apabila plot residualya cenderung
mendekati garis lurus (garis linier) dengan melihat nilai Pvalue. Jadi suatu data
dapat dikatakan baik apabila data tersebut memenuhi semua asumsi IIDN
(Sudjana, 1996).
2.4 Deteksi Multikolinieritas
Mutikolinieritas adalah adanya hubungan antar variabel prediktor yang
menyebabkan terjadinya bias dalam model yang ditaksir. Deteksi adanya
7
multikolinieritas dalam model regresi dapat menggunakan tiga cara yaitu sebagai
berikut (Sudjana, 1996).
a. Nilai VIF (Variance Inflation Factor) dari masing-masing variabel
prediktor. Suatu variabel menunjukkan gejala multikolinieritas dapat dilihat
dari nilai VIF (Variance Inflation Factor) yang tinggi pada variabel-variabel
bebas suatu model regresi. Suatu model regresi mengalami multikolinieritas
jika terdapat nilai VIF yang lebih dari 10.
b. Korelasi yang tinggi antar variabel prediktor. Pengujian multikolinieritas
utus SEkedua adalah dengan menggunakan korelasi antar veribel prediktor
dan korelasi antar variabel prediktor dengan variabel respon.
c. Nilai koefisien determinasi yang tinggi namun ketika uji parsial variabel
prediktor tidak ada yang berpengaruh signifikan terhadap respon.
2.5 Analisis Regresi Linier Berganda
Analisis regresi linier berganda merupakan analisis regresiyang
mengestimasi variabel respon dan variabel prediktor yang terdiri dari dua variabel
atau lebih.
2.5.1 Estimasi Parameter Regresi Linier Berganda
Model matematis dari persamaan regresi linier berganda adalah:
Dimana:
Yi : Variabel tidak bebas untuk pengamatan ke-i, untuk i= 1,2,....,n
β0, β1,β2,...,βk : Parameter
X0, X1,..., Xk : Variabel bebas
: Error untuk pengamatan ke-i
Nilai β0, β1,β2,...,βk dapat dicari dengan pendekatan matriks metode kuadrat
terkecil (Ordinary Least Square Estimation Method) atau biasa juga disebut
OLSE atau OLS. Prinsip kerja metode ini adalah mencari nilai β0, β1,β2,...,βkyang
memberikan terkecil Penaksir OLS pada persamaan 2.3 merupakan penaksir
8
(2.8)
(2.7)
yang tidak bias, linier dan terbaik (Sembiring, 2003; Gujarati, 2003 dan
Widarjono, 2007). Estimasi parameter model regresi linier berganda:
Dimana:
2.5.2 Pengujian Serentak Regresi Linier Berganda
Pengujian Serentak digunakan untuk mengetahui pengaruh variabel
prediktor terhadap variabel respon (Draper, 1992).
Hipotesisnya adalah sebagai berikut.
(Variabel prediktor tidak berpengaruh signifikan
terhadap variabel respon)
Minimal terdapat satu , j=1,2,...,k (Minimal ada satu variabel
prediktor yang berpengaruh signifikan terhadap variabel respon)
Taraf Signifikan :
Daerah Penolakan :Tolak H0, jika Fhitung lebih besar dari F1-α(k, n-p).
Statistik uji yang digunakan adalah:
Tabel 2.1 Analisis Uji Serentak
Sumber Keragaman Derajat Bebas Jumlah Kuadrat(JK)
Kuadrat Tengah(KT)
Regresi K
Residual/ Error n-(k+1)
Total n-1
2.5.3 Pengujian Parsial Regresi Linier Berganda
9
(2.9)
(2.10)
Uji parsial digunakan untuk menguji variabel prediktor berpengaruh yang
signifikanatau tidak terhadap respon yang diamati.
Hipotesis:
(Variabel prediktor ke-j tidak berpengaruh signifikan terhadap
variabel respon)
(Variabel prediktor ke-j berpengaruh signifikan terhadap
variabel respon)
Taraf Signifikan :
Daerah penolakan : Tolak H0, jika |Thitung| lebih besar dari T1-α/2( n-p).
Statistik uji yang digunakan adalah:
dimana,
Kemudian nilai t dibandingkan dengan dari tabel–t dengan (n-(k+1))
derajat bebas.Uji-T ini bersifat dua arah dengan tingkat kepercayaan 100%
(Draper, 1992).
2.6 Putus Sekolah
Putus sekolah adalah proses berhentinya siswa secara terpaksa dari suatu
lembaga pendidikan tempat dia belajar atau terlantarnya anak dari sebuah
lembaga pendidikan formal, yang disebabkan oleh berbagai faktor. Faktor-faktor
yang mempengaruhi angka putus sekolah antara lain faktor ekonomi, demografi,
dan geografi. Faktor ekonomi dapat berasal dari persentase penduduk miskin,
tingkat kesejahteraan, pendapatan, dan pengeluaran rata-rata rumah tangga. Faktor
demografi dapat berasal dari jumlah anggota keluarga lebh dari empat, dll
(BPS,2011).
10
(2.11)
(2.12)
2.7 Kemiskinan
Kemiskinan dapat diartikan suatu kondisi serba kekurangan. Kemiskinan juga dapat dicirikan dengan ketidakmampuan untuk memenuhi berbagai kebutuhan pangan, perumahan, dan pakaian, tingkat pendapatan rendah, pendidikan dan keahlian rendah, keterkucilan sosial karena keterbatasan kemampuan untuk berpartisipasi dalam kegiatan sosial kemasyarakatan. Singkatnya, kemiskinan dapat didefinisikan sebagai suatu standar hidup yang rendah yaitu suatu tingkat kekurangan materi pada sejumlah atau segolongan orang dibandingkan dengan standar kehidupan yang umum berlaku dalam masyarakat yang bersangkutan (Suparlan, 1984).
2.8 SekolahSekolah merupakan wahana atau lembaga untuk belajar dan mengajar serta
tempat menerima dan memberi pelajaran. Sekolah merupakan tempat
berlangsungnya pendidikan sekaligus sebagai tempat masyarakat berharap tentang
kehidupan yang lebih baik pada masa yang akan datang. Sekolah sebagai pusat/
lembaga/ lingkungan pendidikan mempunyai tugas dan fungsi untuk
menyelenggarkan proses atau kegiatan belajar mengajar yang dilaksanakan secara
terencana, tertib dan teratur, sehingga untuk menghasilkan tenaga-tenaga yang
terampil dan terdidik yang senantiasa diperlukan bagi pelaksanaan pembangunan
dapat benar-benar terwujud (Azhari,2007).
11
BAB III
METODOLOGI PENELITIAN3.1 Sumber Data
Data yang digunakan dalam praktikum ini adalah data sekunder dengan
melakukan pengambilan data dari Tugas Akhir Mega Pradipta NRP 1309100038
yang berjudul “Pemodelan Angka Putus Sekolah Usia SMA di Jawa Timur
Dengan Pendekatan Regresi Spline Multivariabel pada hari Selasa, tanggal 27
Oktober 2015 pukul 11.00 WIB di Ruang Baca Statistika jurusan Statistika ITS.
3.2 Variabel Penelitian
Variabel penelitian yang digunakan dalam penelitian ini terdiri dari variabel
respon (Y) dan variabel prediktor (X) yang disajikan pada tabel berikut.
Tabel 3.1 Variabel PenelitianVariabel Keterangan
y Angka putus sekolah usia SMA di Jawa Timurx1 Persentase penduduk miskinx2 Persentase jumlah sekolah
3.3 Langkah Analisis Data
Langkah analisis yang dilakukan pada praktikum kali ini adalah sebagai
berikut.
1. Mengumpulkan data angka putus sekolah usia SMA di Jawa Timur
terhadap persentase penduduk miskin, persentase jumlah sekolah dan
persentase tenaga pengajar.
2. Menganalisis karakteristik data angka putus sekolah usia SMA di Jawa
Timur terhadap persentase penduduk miskin, dan persentase jumlah
sekolah.
4. Menguji asumsi residual IIDN data persentase penduduk miskin, jumlah
sekolah, dan tenaga pengajar terhadap angka putus sekolah usia SMA di
Jawa Timur.
12
5. Memeriksa asumsi residual IIDN data data persentase penduduk miskin,
jumlah sekolah, dan tenaga pengajar terhadap angka putus sekolah usia
SMA di Jawa Timur.
6. Mendeteksi kasus multikolinieritas data persentase penduduk miskin,
jumlah sekolah, dan tenaga pengajar terhadap angka putus sekolah usia
SMA di Jawa Timur.
7. Melakukan scatterplot, untuk mengetahui signifikan atau tidak antara
persentase penduduk miskin, jumlah sekolah, dan tenaga pengajar terhadap
angka putus sekolah usia SMA di Jawa Timur.
8. Mengestimasi persamaan model dan R-square data persentase penduduk
miskin, jumlah sekolah, dan tenaga pengajar terhadap angka putus sekolah
usia SMA di Jawa Timur dengan analisis regresi linier berganda.
9. Menguji signifikansi secara serentak data persentase penduduk miskin,
jumlah sekolah, dan tenaga pengajar terhadap angka putus sekolah usia
SMA di Jawa Timur.
10. Menguji signifikansi secara parsial data persentase penduduk miskin,
jumlah sekolah, dan tenaga pengajar terhadap angka putus sekolah usia
SMA di Jawa Timur.
11. Menarik kesimpulan dan saran.
13
3.1 Diagram Alir
Berikut adalah diagram alir pada praktikum kali ini.
14
Mulai
Pengumpulan Data
Pemeriksaan Asumsi Residual IIDN
Kesimpulan
Uji Parsial
Estimasi Parameter Model Regresi linier berganda
Uji Serentak
Pengujian asumsi residual IIDN
Karakteristik Data
Deteksi Multikolinieritas
Tolak H0Tolak H0
Tolak H0
Gagal tolak H0
Scatterplot
Gambar 3.1 Diagram Alir
BAB IV
ANALISIS DAN PEMBAHASAN
4.1 Karakteristik Data Penduduk Miskin dan Jumlah Sekolah terhadap
Angka Putus Sekolah Usia SMA di Jawa Timur Tahun 2011
Karakteristik mengenai data penduduk miskin dan jumlah sekolah
terhadap angka putus sekolah usia SMA di Jawa Timur tahun 2011 akan disajikan
pada tabel sebagai berikut.Tabel 4.1 Karakteristik Data Penduduk Miskin dan Jumlah Sekolah terhadap Angka
Putus Sekolah Usia SMA di Jawa Timur Tahun 2011Variabel Rata-rata Varians Median Minimum Maksimum
Angka putus sekolah usia SMA 0,982 0,461 0,745 0,2 3,03
Penduduk miksin 17,76 649,82 12,95 4,47 166,66Jumlah sekolah 0,2455 0,0069 0,23 0,15 0,5Tabel 4.1 menunjukkan bahwa angka putus sekolah usia SMA di Jawa
Timur dengan rata-rata sebesar 0,982 dengan rentang dari 0,2 hingga 3,03
didapatkan nilai tengah sebesar 0,745 dengan keragama data sebesar 0,461 dapat
dikatakan bahwa keragaman angka putus sekolah usia SMA cukup besar karena
terlalu banyak faktor-faktor yang mempengaruhi seperti jumlah penduduk miskin
dan terbatasnya sekolah yang ada. Selain itu Tabel 4.1 menunjukkan bahwa
faktor-faktor yang mempengaruhi angka putus sekolah usia SMA di Jawa Timur
paling banyak adalah faktor jumlah penduduk miskin dengan rata-rata sebesar
17,76 dengan rentang dari 4,47 hingga 166,66 didapatkan nilai tengah sebesar
12,95 dengan keragaman data sebesar 649,82 dapat dikatakan bahwa jumlah
penduduk miskin di Jawa Timur sangat mempengaruhi angka putus sekolah usia
SMA, sehingga pemerintah harus menekan angka kemiskinan yang ada di
Indonesia, sedangkan faktor yang sedikit mempengaruhi angka putus sekolah
adalah jumlah sekolah dengan rata-rata sebesar 0,2445 dengan rentang dari 0,15
sampai 0,5 dengan keragaman data sebesar 0,0069 dapat dikatakan bahwa jumlah
15
Selesai
sekolah sedikit mempengaruhi angka putus sekolah usia SMA di Jawa Timur
tahun 2011.
4.2 Pengujian dan Pemeriksaan Asumsi Residual IIDN serta Deteksi
Multikolinieritas
Pengujian dan pemeriksaan asumsi residual IIDN digunakan untuk
mengetahui residual data model regresi linier berganda memenuhi asumsi identik,
independen dan berdistribusi normal. Pengujian ini dilakukan secara visual
dengan melakukan pemeriksaan melalui scatterplot dan secara pengujian hipotesis
identik, independen dan berdistribusi normal. Deteksi multikolinieritas digunakan
untuk mendeteksi adanya hubungan antar variabel prediktor dalam model regresi
linier berganda.
4.2.1 Pengujian Asumsi Residual Identik
Pengujian asumsi residual identik menggunakan pengujian Glejser yang
bertujuan untuk mengetahui residual data model regresi berganda sudah
memenuhi asumsi identik atau tidak.
Hipotesis :
H0 : Residual data model regresi berganda telah memenuhi asumsi identik
H1 : Residual data model regresi berganda tidak memenuhi asumsi identik
Taraf signifikan = 0,05
Daerah penolakan: Tolak jika Fhitung > dan Pvalue <
Statistik UjiTabel 4.2 Uji Asumsi Residual Identik