Oleh: Adhi Kurniawan SEKOLAH TINGGI ILMU STATISTIK PERTEMUAN 1-MPC 2 PRAKTIK
Variabel Pendukung (Auxiliarry Variable)
Digunakan dalam tahap penarikan sampel (Z)
Dasar Stratifikasi
Sebagai size pada PPS Sampling
Dasar pengurutan pada sampling sistematik
(implicit stratification)
Digunakan dalam tahap estimasi parameter (X)
Ratio Estimate
Difference Estimate
Regression Estimate
Untuk meningkatkan presisi (mengurangi varians sampling), desain sampling sering memanfaatkan auxiliarry variable yang mempunyai hubungan yang erat dengan variabel yang diteliti
GENERALIZED ESTIMATOR 𝒚 𝑮 = 𝒚 + 𝒄 𝑿 − 𝒙
dengan c merupakan sesuatu yang belum ditetapkan (konstan atau variabel)
𝑦 , 𝑥 merupakan nilai rata-rata karakteristik 𝑦 dan 𝑥 dari data sampel
𝑋 merupakan nilai rata-rata karakteristik 𝑥 dari data populasi
Keterangan:
1. Jika 𝑐 = 0 maka 𝑦 𝐺 = 𝑦 ----> (rata-rata sederhana)
2. Jika 𝑐 = 𝑘 (𝑘 adalah konstanta, tidak tergantung pada sampel), maka
𝑦 𝐷 = 𝑦 + 𝑘 𝑋 − 𝑥 ----> (difference estimator)
3. Jika 𝑐 = 𝛽 (𝛽 adalah konstanta, koefisien regresi populasi), maka
𝑦 𝑙𝑟 = 𝑦 + 𝛽 𝑋 − 𝑥 ----> (regression estimator)
4. Jika 𝑐 = 𝑏 (𝑏 adalah random variable, estimator untuk 𝛽), maka
𝑦 𝑙𝑟 = 𝑦 + 𝑏 𝑋 − 𝑥 ----> (regression estimator)
5. Jika 𝑐 = 𝑟 (𝑟 = 𝑦 𝑥 ), maka
𝑦 𝑅 = 𝑦 + 𝑟 𝑋 − 𝑥 = 𝑟𝑋 ----> (ratio estimator)
GENERALIZED ESTIMATOR PADA DESAIN SRS
No Nama Estimator Estimator rata-rata Unbiased Sampling Variance
1 Penduga SRS 𝑦 =
1
𝑛 𝑦𝑖
𝑛
𝑖=1
𝑣 𝑦 =1 − 𝑓
𝑛𝑠𝑦2
2 Penduga rasio (ratio estimator)
𝑦 𝑅 =𝑦
𝑥 𝑋 = 𝑅 𝑋 𝑣 𝑦 𝑅 =
(1 − 𝑓)
𝑛𝑠𝑦2 − 2𝑅 𝜌𝑠𝑦𝑠𝑥 + 𝑅 2𝑠𝑥
2
3 Penduga beda (difference estimator)
𝑦 𝐷 = 𝑦 + 𝑘(𝑋 − 𝑥 ) 𝑣 𝑦 𝑅 =
(1 − 𝑓)
𝑛𝑠𝑦2 − 2𝑘𝜌𝑠𝑦𝑠𝑥 + 𝑘2𝑠𝑥
2
4 Penduga regresi (regression estimator)
𝑦 𝑙𝑟 = 𝑦 + 𝑏(𝑋 − 𝑥 )
𝑣 𝑦 𝑙𝑟 =(1 − 𝑓)
𝑛𝑠𝑦2 − 2𝑏𝜌𝑠𝑦𝑠𝑥 + 𝑏2𝑠𝑥
2
=(1 − 𝑓)
𝑛𝑠𝑦2 1 − 𝜌2
Keterangan:
𝑏 =𝑠𝑦𝑥
𝑠𝑥2 =
1𝑛 − 1
𝑥𝑖 − 𝑥 𝑦𝑖 − 𝑦
1𝑛 − 1
𝑥𝑖 − 𝑥 2=
𝑥𝑖 − 𝑥 𝑦𝑖 − 𝑦
𝑥𝑖 − 𝑥 2
𝜌 =𝑠𝑦𝑥
𝑠𝑥𝑠𝑦=
𝑥𝑖 − 𝑥 𝑦𝑖 − 𝑦
𝑥𝑖 − 𝑥 2 𝑦𝑖 − 𝑦 2
𝑋 =1
𝑁 𝑋𝑖
𝑁
𝑖=1
→ rata − rata populasi
𝑥 =1
𝑛 𝑥𝑖
𝑛
𝑖=1
→ rata − rata sampel
GENERALIZED ESTIMATOR PADA DESAIN SRS
No Nama Estimator Estimator total Unbiased Sampling Variance
1 Penduga SRS 𝑌 = 𝑁𝑦 𝑣 𝑌 = 𝑁2𝑣 𝑦
2 Penduga rasio (ratio estimator)
𝑌 𝑅 = 𝑁𝑦 𝑅 𝑣 𝑌 = 𝑁2𝑣 𝑦 𝑅
3 Penduga beda (difference estimator)
𝑌 𝐷 = 𝑁𝑦 𝐷 𝑣 𝑌 = 𝑁2𝑣 𝑦 𝐷
4 Penduga regresi (regression estimator)
𝑌 𝑙𝑟 = 𝑁𝑦 𝑙𝑟 𝑣 𝑌 = 𝑁2𝑣 𝑦 𝑙𝑟
Keterangan: 𝑁: jumlah populasi
Relative Efficiency (RE) Merupakan perbandingan varians dari dua metode. Metode yang variansnya lebih kecil daripada metode lainnya dikatakan lebih efisien
𝑅𝐸 =𝑣 𝑦 1𝑣(𝑦 2)
𝑎𝑡𝑎𝑢 𝑅𝐸 =𝑣 𝑌 1
𝑣(𝑌 2)
REGRESSION ESTIMATOR PADA DESAIN SRS
Soal Latihan 1:
Sebuah pengamatan dilakukan terhadap 100 lahan yang ditanami pohon cabai merah di suatu desa. Dari hasil pengamatan dengan eye estimate diperoleh total produksi dari 100 lahan tersebut sebanyak 5750 kg. Sebuah random sampel sebanyak 10 lahan diambil secara SRS WOR dan setiap lahan terpilih dilakukan pemanenan cabai merah dan selanjutnya dilakukan pengukuran terhadap berat dari cabai yang dihasilkan. Data produksi cabai (kg) dari lahan terpilih yang diperoleh dari hasil pengamatan (eye estimate) dan hasil pengukuran sebagai berikut:
a. Perkirakan rata-rata produksi cabai per lahan dan total produksi cabai merah di desa tersebut dengan menggunakan difference estimator (𝑘 = 1) beserta standar error, RSE, dan 95% confidence interval-nya ! Interpretasikan hasil yang diperoleh
b. Perkirakan rata-rata produksi cabai per lahan dan total produksi cabai merah di desa tersebut dengan menggunakan regression estimator beserta standar error, RSE, dan 95% confidence interval-nya ! Interpretasikan hasil yang diperoleh
c. Hitunglah efisiensi penduga regresi terhadap penduga beda. Kesimpulan apa yang dapat diperoleh ?
No urut lahan 1 2 3 4 5 6 7 8 9 10
Produksi
(pengukuran) 51 42 46 39 71 61 58 57 58 67
Produksi
(pengamatan) 56 47 48 40 78 59 52 58 55 67
REGRESSION ESTIMATOR PADA DESAIN SRS Bentuk lain dari varians regression estimator:
𝑣 𝑦 =1 − 𝑓
𝑛𝑠𝑦2 1 − 𝜌2 =
1 − 𝑓
𝑛𝑠𝑦2 − 𝑠𝑦
2𝜌2
=1 − 𝑓
𝑛𝑠𝑦2 − 𝑠𝑦
2𝑠𝑦𝑥2
𝑠𝑦2𝑠𝑥
2 =1 − 𝑓
𝑛𝑠𝑦2 −
𝑠𝑦𝑥2
𝑠𝑥2
=1 − 𝑓
𝑛𝑠𝑦2 − 𝑏𝑠𝑦𝑥 =
1 − 𝑓
𝑛(𝑛 − 1) 𝒚𝒊 − 𝒚 𝟐 − 𝒃 𝒚𝒊 − 𝒚 𝒙𝒊 − 𝒙
𝒏
𝒊=𝟏
𝒏
𝒊=𝟏
=1 − 𝑓
𝑛(𝑛 − 1) 𝒚𝒊 − 𝒚 − 𝒃 𝒙𝒊 − 𝒙 𝟐
𝒏
𝒊=𝟏
=1 − 𝑓
𝑛(𝑛 − 1)∙ 𝑺𝑺𝑹𝒆𝒔
Keterangan: 𝑅𝑒𝑠𝑖𝑑𝑢𝑎𝑙 = 𝒆𝒊 = 𝒚𝒊 − 𝒚 − 𝒃 𝒙𝒊 − 𝒙
𝑆𝑢𝑚 𝑂𝑓 𝑆𝑞𝑢𝑎𝑟𝑒 𝑅𝑒𝑠𝑖𝑑𝑢𝑎𝑙 = 𝑆𝑆𝑅𝑒𝑠 = 𝒚𝒊 − 𝒚 − 𝒃 𝒙𝒊 − 𝒙 𝟐
𝒏
𝒊=𝟏
REGRESSION ESTIMATOR PADA DESAIN SRS
Syntax SPSS REGRESSION /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN /DEPENDENT Produksi_pengukuran /METHOD=ENTER Produksi_pengamatan.
Koefisien korelasi 𝝆
Soal Latihan 1 jika diselesaikan dengan SPSS
REGRESSION ESTIMATOR PADA DESAIN SRS
Koefisien regresi 𝒃 𝒚 − 𝒃𝒙
SSRes
Estimasi rata-rata 𝑦 𝑙𝑟 = 𝑦 + 𝑏 𝑋 − 𝑥
= 𝑦 + 𝑏𝑋 − 𝑏𝑥 = 𝑦 − 𝑏𝑥 + 𝑏𝑋 = 4,405 + 0,903 × 57,5 =56,3275
𝑣 𝑦 𝑙𝑟 =1 − 𝑓
𝑛(𝑛 − 1)× 𝑆𝑆𝑅𝑒𝑠
=1 − 0,1
10(10 − 1)× 134,347
= 1,34347
𝑠𝑒 𝑦 𝑙𝑟 = 1,15908
Estimasi total 𝑌 𝑙𝑟 = 𝑁𝑦 𝑙𝑟
= 100 × 56,3275 = 5632,75
𝑣 𝑌 𝑙𝑟 = 𝑁2𝑣 𝑦 𝑙𝑟
= 1002 × 1,34347 = 13.434,7
𝑠𝑒 𝑌 𝑙𝑟 = 115,908
REGRESSION ESTIMATOR PADA DESAIN SRS Soal Latihan 2:
Untuk meneliti kondisi pendidikan para penyandang cacat, dilakukan suatu survei disabilitas di pulau Jawa.
Dari 118 kabupaten/kota diambil sampel sebanyak 30 kabupaten/kota secara SRS WOR, kemudian dilakukan
pencacahan ke semua Sekolah Luar Biasa (SLB) yang ada di kabupaten/kota terpilih. Untuk setiap SLB yang
dikunjungi, dilakukan tes terhadap para penyandang cacat yang belajar di sekolah tersebut. Misalkan, 𝑥𝑖
merupakan jumlah guru yang mengajar di SLB untuk kabupaten/kota ke-i, 𝑦𝑖 merupakan jumlah penyandang
cacat yang nilai tesnya berada di atas standar nilai minimal yang ditetapkan. Diketahui jumlah guru SLB di
pulau Jawa sebanyak 826 orang. Ringkasan data yang diperoleh sebagai berikut:
𝑥𝑖 = 225
𝑛
𝑖=1
, 𝑦𝑖 = 1127
𝑛
𝑖=1
, 𝑥𝑖𝑦𝑖 = 14977
𝑛
𝑖=1
, 𝑥𝑖2 = 3005
𝑛
𝑖=1
, 𝑦𝑖2 = 75281
𝑛
𝑖=1
a. Perkirakan total penyandang cacat di pulau Jawa yang nilainya berada di atas standar minimal dengan
penduga rata-rata sederhana, lengkapi dengan standar error, RSE, dan 95% Confidence Interval-nya !
b. Dengan regression estimator, perkirakan total penyandang cacat di pulau Jawa yang nilainya berada di
atas standar minimal beserta standar error, RSE, dan 95% Confidence Interval-nya !
c. Hitunglah efisiensi regression estimator terhadap penduga SRS ! Apa yang dapat anda simpulkan ?
REGRESSION ESTIMATOR PADA DESAIN SRS Soal Latihan 3:
Dari data Sensus Ternak tahun lalu diperoleh informasi bahwa jumlah peternak sapi di suatu wilayah
sebanyak 82.688 rumah tangga peternak dan rata-rata jumlah sapi untuk tiap peternak sebanyak 9 ekor.
Sebuah sampel acak sederhana sebanyak 5.168 peternak diambil dari populasi tersebut untuk
memperkirakan produksi susu yang dihasilkan. Jumlah sapi yang diperoleh dari hasil observasi adalah
48.450 ekor dan rata-rata produksi susu untuk tiap peternak sebanyak 300 liter per hari. Informasi lain
yang diperoleh sebagai berikut:
𝑠𝑦 = 28,8
𝑠𝑥 = 1,25
𝜌 = 0,875
Dengan menggunakan regression estimator,
a. Perkirakan rata-rata produksi susu per hari yang dihasilkan oleh rumah tangga peternak beserta
standar error, rse, dan 95% Confidence Interval-nya !
b. Perkirakan total produksi susu per hari di wilayah tersebut beserta standar error, rse, dan 95%
Confidence Interval-nya !
c. Interpretasikan hasil yang diperoleh !
Keterangan: 𝑥 menyatakan jumlah sapi. 𝑦 menyatakan produksi susu.
REGRESSION ESTIMATOR PADA DESAIN SRS Soal Latihan 4:
Dalam rangka Praktik Kerja Lapangan, mahasiswa Tingkat 3 STIS melakukan penelitian kondisi kesehatan masyarakat di suatu wilayah. Dari hasil pemutakhiran (updating) rumah tangga yang dilakukan secara sensus (complete enumeration) di blok sensus terpilih diperoleh informasi bahwa jumlah penduduk yang mengalami keluhan kesehatan selama sebulan yang lalu sebanyak 248 orang. Dari populasi eligible rumah tangga sebanyak 120 rumah tangga yang diperoleh dari hasil pemutakhiran, diambil sampel sebanyak 10 rumah tangga secara SRS WOR untuk dilakukan pencacahan yang lebih rinci. Data yang diperoleh:
a. Dengan menggunakan penduga rata-rata sederhana, penduga rasio, penduga beda (k=1), dan penduga regresi, perkirakan jumlah penduduk yang mengalami keluhan kesehatan selama sebulan yang lalu beserta standar error, rse, dan 95% Confidence Interval-nya !. Interpretasikan hasil yang diperoleh.
b. Bandingkan efisiensi dari keempat metode pada point (a). Metode manakah yang mempunyai efisiensi yang terbaik ?
No urut ruta sampel 1 2 3 4 5 6 7 8 9 10
Jumlah ART mengalami keluhan (hasil
updating) 3 0 3 0 3 0 2 4 4 1
Jumlah ART mengalami keluhan (hasil
pencacahan) 4 1 4 1 3 1 2 4 4 1
GENERALIZED ESTIMATOR PADA DESAIN PPS
No Nama
Estimator Estimator total Unbiased Sampling Variance
1 Penduga PPS 𝑌 𝑝𝑝𝑠 =1
𝑛
𝑦𝑖
𝑝𝑖
𝑛
𝑖=1
𝑣 𝑌 𝑝𝑝𝑠 =1
𝑛(𝑛 − 1)
𝑦𝑖
𝑝𝑖− 𝑌 𝑝𝑝𝑠
2𝑛
𝑖=1
2 Penduga rasio (ratio estimator)
𝑌 𝑅(𝑝𝑝𝑠) =𝑌 𝑝𝑝𝑠
𝑋 𝑝𝑝𝑠
𝑋 = 𝑅 𝑋 𝑣 𝑌 𝑅(𝑝𝑝𝑠) = 𝑣 𝑌 𝑝𝑝𝑠 − 2𝑅 𝜌 𝑣 𝑌 𝑝𝑝𝑠 𝑣 𝑋 𝑝𝑝𝑠 + 𝑅 2𝑣 𝑋 𝑝𝑝𝑠
3 Penduga beda (difference estimator)
𝑌 𝐷(𝑝𝑝𝑠) = 𝑌 𝑝𝑝𝑠 + 𝑘(𝑋 − 𝑋 𝑝𝑝𝑠) 𝑣 𝑌 𝐷(𝑝𝑝𝑠) = 𝑣 𝑌 𝑝𝑝𝑠 − 2𝑘𝜌 𝑣 𝑌 𝑝𝑝𝑠 𝑣 𝑋 𝑝𝑝𝑠 + 𝑘2𝑣 𝑋 𝑝𝑝𝑠
4 Penduga regresi (regression estimator)
𝑌 𝑙𝑟(𝑝𝑝𝑠) = 𝑌 𝑝𝑝𝑠 + 𝑏(𝑋 − 𝑋 𝑝𝑝𝑠)
𝑣 𝑌 𝑙𝑟(𝑝𝑝𝑠) = 𝑣 𝑌 𝑝𝑝𝑠 − 2𝑏𝜌 𝑣 𝑌 𝑝𝑝𝑠 𝑣 𝑋 𝑝𝑝𝑠 + 𝑏2𝑣 𝑋 𝑝𝑝𝑠
= 𝑣 𝑌 𝑝𝑝𝑠 1 − 𝜌2
𝑏 =
𝑦𝑖𝑝𝑖
− 𝑌 𝑝𝑝𝑠𝑥𝑖𝑝𝑖
− 𝑋 𝑝𝑝𝑠
𝑥𝑖𝑝𝑖
− 𝑋 𝑝𝑝𝑠
2
𝜌 =
𝑦𝑖𝑝𝑖
− 𝑌 𝑝𝑝𝑠𝑥𝑖𝑝𝑖
− 𝑋 𝑝𝑝𝑠
𝑥𝑖𝑝𝑖
− 𝑋 𝑝𝑝𝑠
2
𝑦𝑖𝑝𝑖
− 𝑌 𝑝𝑝𝑠
2
𝑋 𝑝𝑝𝑠 =1
𝑛
𝑥𝑖
𝑝𝑖
𝑛
𝑖=1
𝑝𝑖 =𝑍𝑖
𝑍
𝑍 merupakan nilai dari variabel pendukung yang digunakan sebagai size (dasar peluang) dalam pengambilan sampel secara PPS, 𝑋 merupakan variabel pendukung yang digunakan pada tahap estimasi.
GENERALIZED ESTIMATOR PADA DESAIN PPS
No Nama Estimator Estimator rata-rata Unbiased Sampling Variance
1 Penduga PPS 𝑦 𝑝𝑝𝑠 =
𝑌 𝑝𝑝𝑠
𝑁 𝑣 𝑦 𝑝𝑝𝑠 =
𝑣(𝑌 𝑝𝑝𝑠)
𝑁2
2 Penduga rasio (ratio estimator) 𝑦 𝑅(𝑝𝑝𝑠) =
𝑌 𝑅(𝑝𝑝𝑠)
𝑁 𝑣 𝑦 𝑅(𝑝𝑝𝑠) =
𝑣(𝑌 𝑅(𝑝𝑝𝑠))
𝑁2
3 Penduga beda (difference estimator) 𝑦 𝐷(𝑝𝑝𝑠) =
𝑌 𝐷(𝑝𝑝𝑠)
𝑁 𝑣 𝑦 𝐷(𝑝𝑝𝑠) =
𝑣(𝑌 𝐷(𝑝𝑝𝑠))
𝑁2
4 Penduga regresi (regression estimator) 𝑦 𝑙𝑟(𝑝𝑝𝑠) =
𝑌 𝑙𝑟(𝑝𝑝𝑠)
𝑁 𝑣 𝑦 𝑙𝑟(𝑝𝑝𝑠) =
𝑣(𝑌 𝑙𝑟(𝑝𝑝𝑠))
𝑁2
Keterangan:
𝑣 𝑌 𝑝𝑝𝑠 =1
𝑛(𝑛 − 1)
𝑦𝑖
𝑝𝑖− 𝑌 𝑝𝑝𝑠
2𝑛
𝑖=1
𝑣 𝑋 𝑝𝑝𝑠 =1
𝑛(𝑛 − 1)
𝑥𝑖
𝑝𝑖− 𝑋 𝑝𝑝𝑠
2𝑛
𝑖=1
REGRESSION ESTIMATOR PADA DESAIN PPS Soal Latihan 5
Berdasarkan hasil pencacahan Potensi Desa (Podes) 2011, jumlah tindak kriminalitas di suatu kecamatan mencapai 775 kasus. Suatu survei dilakukan di kecamatan tersebut pada akhir tahun 2012 dengan mengambil sampel sebanyak 12 desa dari 30 desa secara PPS WR dengan size jumlah rumah tangga. Jumlah rumah tangga di kecamatan tersebut sebanyak 69.875 rumah tangga. Dari setiap desa terpilih diteliti jumlah kasus kriminalitas yang terjadi selama tahun 2012.
a. Perkirakan total tindak kriminalitas di kecamatan tsb tahun 2012 dengan estimasi PPS beserta standar error, RSE, dan 95% Confidence interval-nya!
b. Jika jumlah tindak kriminalitas tahun 2011 dijadikan sebagai auxiliarry variable, perkirakan total kasus kriminalitas yang terjadi di kecamatan tsb pada tahun 2012 dengan estimasi regresi beserta standar error, RSE, dan 95% Confidence interval-nya !
c. Hitung relative efficiency estimasi regresi terhadap estimasi PPS !
d. Interpretasikan hasil yang diperoleh
No Jumlah
ruta
Jumlah Kriminalitas
2011 (Podes)
2012 (survei)
1 1750 19 14
2 1500 16 9
3 2625 28 21
4 2000 28 14
5 3000 24 21
6 1000 6 9
7 3000 38 21
8 1250 12 10
9 3625 38 29
10 3250 48 26
11 3875 35 31
12 1000 8 7