HDI Indonesia Tahun 2002
Tugas Analisis Regresi
Outlier dan Permasalahannya Cucu Sumarni (1307201740)Is Anjar W
(1307201721)Human Development Index(HDI) Indonesia Tahun 2002
PROVINSIRATA-RATA LAMA WAKTU SEKOLAH*
(X)HDI(Y)
1NAD7.866
2SUMUT8.468.8
3SUMBAR867.5
4RIAU8.369.1
5JAMBI7.467.1
6SUMSEL7.166
7BENGKULU7.666.2
8LAMPUNG6.965.8
9BABEL6.665.4
10DKI10.475.6
11JABAR7.265.8
12JATENG6.566.3
13DIY8.170.8
14JATIM6.564.1
15BANTEN7.966.6
16BALI7.667.5
17NTB5.857.8
18NTT660.3
19KALBAR6.362.9
20KALTENG7.669.1
21KALSEL764.3
22KALTIM8.570
23SULUT8.671.3
24SULTENG7.364.4
25SULSEL6.865.3
26SULTRA7.364.1
27GORONTALO6.564.1
28MALUKU866.5
29MALUKU UTARA8.465.8
30PAPUA660.1
Sumber: BPSKet: * Usia 15 tahun ke atas* Khusus NAD, Maluku,
Maluku Utara dan Papua data rata-rata lama waktu sekolah keadaan
tahun 2003
The regression equation is
Dari model ini, kita lihat terdapat hubungan yang positif antara
Rata-rata lama sekolah (lamanya seseorang mengenyam pendidikan)
dengan Human Development Index/HDI artinya semakin lama penduduk
mengenyam pendidikan maka HDI suatu daerah/provinsi akan semakin
meningkat sebanyak 3.1821 persen. Jika suatu daerah dimana
rata-rata lama pendidikan penduduknya nol maka HDI terendahnya
sebesar 42.564.
Predictor Coef SE Coef T P
Constant 42.564 2.259 18.84 0.000
X 3.1821 0.3021 10.53 0.000
S = 1.59520 R-Sq = 79.8% R-Sq(adj) = 79.1%Dengan uji parameter,
kita dapatkan bahwa b0 = 42.564 dan b1(Rata-rata lama sekolah) =
3.1821 mempunyai pengaruh yang signifikan, dan model ini
menjelaskan sekitar 79.1 persen dari keadaan data yang
sebenarnya.
Analysis of Variance
Source DF SS MS F P
Regression 1 282.24 282.24 110.92 0.000
Residual Error 28 71.25 2.54
Lack of Fit 20 58.74 2.94 1.88 0.182
Pure Error 8 12.51 1.56
Total 29 353.49
Dari ANOVA dapat kita lihat Mean Square Error/MSE yang
dihasilkan adalah sebesar 2.54 sehingga F hitung didapatkan 110.92.
P-value Lack of Fit = 0.182 > 0.05 menunjukkan bahwa model
regresi yang diperoleh sudah sesuai (terima H0 : tidak ada lack of
fit/model sesuai)
Unusual Observations
Obs X Y Fit SE Fit Residual St Resid
10 10.4 75.600 75.657 0.948 -0.057 -0.04 X
17 5.8 57.800 61.020 0.568 -3.220 -2.16R
29 8.4 65.800 69.293 0.417 -3.493 -2.27R
Outlier:Dari hasil plot data, didapatkan data yang outlier,
antara lain: DKI Jakarta (data ke 10) NTB (data ke-17)
Maluku Utara (data ke 29)Penyebab Outlier
DKI Jakarta merupakan kota metropolitan dimana sarana pendidikan
dan kesehatan sangat memadai dibanding daerah lainnya dan
pendapatan per kapita juga paling tinggi diantara provinsi
lainnya.
NTB merupakan outlier, hal ini terjadi karena hampir setiap
kabupaten di NTB tergolong HDI terendah (lowest HDI), misalnya
Lombok Timur(56.1), Lombok Barat(55.0), Lombok Tengah(53.9), Sumba
Barat (53.4). Hal ini didukung rendahnya tingkat pendidikan dan
kesehatan di daerah tersebut. Sedangkan Maluku Utara termasuk
outlier karena HDI rendah tetapi tingkat pendidikan tinggi. Hal ini
disebabkan ada faktor lain yang berpengaruh terhadap penurunan HDI
di provinsi tersebut yang kontribusinya lebih tinggi dibanding
pendidikan, misalnya tingkat kematian di daerah tersebut yang
relatif tinggi dibanding daerah lain dan sarana kesehatan yang
minim.Pengaruh Outlier terhadap ModelJika data outlier dikeluarkan,
dalam hal ini yang dikeluarkan dari pengamatan adalah NTB dan
Maluku Utara. Sedangkan DKI Jakarta tidak dikeluarkan karena
meskipun termasuk outlier tetapi masih mempunyai pola/kecenderungan
yang sama dengan daerah lainnya. Hal ini terlihat dari plotnya yang
tepat berada pada garis regresi.Setelah out lier dikeluarkan,
modelnya berubah menjadi:
Scatter plot juga menunjukkan adanya perubahan kemiringan garis
regresi, artinya b0 dan b1 mengalami perubahan.
Predictor Coef SE Coef T P
Constant 43.385 2.043 21.24 0.000
X 3.1039 0.2726 11.39 0.000
S = 1.34345 R-Sq = 83.3% R-Sq(adj) = 82.7%
Dengan adanya perubahan b0 menjadi 43.385 dan b1 sebesar 3.1039,
maka R-Sq(adj) meningkat menjadi 82.7 persen.Analysis of
Variance
Source DF SS MS F P
Regression 1 233.96 233.96 129.63 0.000
Residual Error 26 46.93 1.80
Lack of Fit 19 38.91 2.05 1.79 0.220
Pure Error 7 8.01 1.14
Total 27 280.88
Setelah outlier dikeluarkan, ANOVA menunjukkan bahwa MSE yang
dihasilkan juga menjadi lebih kecil yaitu sebesar 1.80 sedangkan
nilai F hitung menjadi lebih besar yaitu 129.63 dan p-value lack of
fit juga lebih besar yaitu 0.220 artinya peluang H0 (tidak ada lack
of fit) diterima menjadi lebih besar.KesimpulanJika kita bandingkan
dengan model pertama (dengan outlier), walaupun sama-sama
signifikan dan modelnya sesuai, model kedua (outlier dikeluarkan)
menghasilkan Mean Square Error/MSE yang lebih kecil dan F hitung
yang lebih besar. Dengan demikian model kedua lebih bagus. Model
kedua dapat menjelaskan variasi data sebesar 82.7 persen relatif
lebih tinggi dibanding model pertama(79.1
persen).UraianNilaiR2(adj)
%MSEFLack of Fit
01
Model dengan outlier (Model I)42.564 3.1821 79.12.54110.92
p-value = 0.182 (tidak ada lack of fit)
Model tanpa outlier (Model II)43.385 3.1039 82.71.80129.63
p-value = 0.220 (tidak ada lack of fit)
Uji Asumsi Residual
NormalityIndependcyHomokedasticity
p-value>0.15 (Normal)Tdk ada autokorelasiPola residual
random
p-value>0.15 (Normal)Tdk ada autokorelasiPola residual
random
Dengan demikian out lier dapat menyebabkan tingkat akurasi model
berubah, sehingga jika ditujukan untuk peramalan maka kita harus
berhati-hati dengan data outlier. Lampiran
Uji Asumsi Residual Model I1. Tidak ada Autokorelasi
2. Normality
P-value > 0.15 terima H0 : i berdistribusi Normal
3. Homoskedastisitas
Pola residual acak/random dan berada di sekitar nol
mengindikasikan variasi residual identik(homoskedastisitas)
Uji Asumsi Residual Model II
1. Tidak ada Autokorelasi
2. Normality
P-value > 0.15 terima H0 : i berdistribusi Normal
3. Homoskedastisitas
Pola residual acak/random dan berada di sekitar nol
mengindikasikan variasi residual identik(homoskedastisitas)
Y = 43.4 + 3.10 X
Y = 42.6 + 3.18 X
EMBED MtbGraph.Document
EMBED MtbGraph.Document
EMBED MtbGraph.Document
PAGE 1
_1252947163
_1252948128
_1252948298
_1252948358
_1252948252
_1252947267
_1252947781
_1252945159
_1252947111
_1252917755