-
2
Dasar Metode Simple Random Sampling
1.1 SIMPLE RANDOM SAMPLING
Metode yang paling sederhana dan paling umum dari metode
sampling adalah simple
random sampling (SRS) dimana sampel diambil unit per unit,
dengan peluang yang masing-
masing eleman mempunyai peluang sama untuk terpilih sebagai
sampel. Dengan demikian
SRS adalah metode memilih n unit sampling dari sebuah populasi
berrukuran N dengan
peluang yang sama bagi semua elemen atau prosedur sampling yang
mungkin dari n unit
yang bisa dibentuk dari N unit populasi mempunyai peluang yang
sama dalam pemilihan.
SRS juga kadang-kadang disebut sampling acak yang tak terbatas.
Jika n unit dipilih dan
dicatat kemudian dikembalikan ke populasi sebalum pengambilan
berikutnya dibuat dan
prosedur ini diulangi n kali, langkah ini dikenal sebagai SRS
dengan pemuluhan (with
replacement). Jika prosedur ini diulang sampi n unit yang
berbeda yang dipilih dan semua
pengulangan diabaikan, pemilihan ini disebut SRS tanpa
pengembalian (without replacement)
THEORMA 2.1.1 peluang unit yang telah ditentukan dari sebuah
populasi yang dipilih dari
beberapa pengambilan yang ditentukan adalah sama dengan peluang
pengambilan yang
pertama.
Bukti.
Peluang unit yang dispecifikan dipiulih sampai pengambilan ke r
secara jelas hasilnya
(a) peluang unit tidak dipilih dalam pengambilan tertentu (r-1)
dan (b) peluang terpilih
dalam pengambilan ke r dengan kondisi ini, init tak terpilih
dalam pengambilan sebelumnya
(r-1) peluang (a) ditentukan dengan
....
=
Peluang (b) ditentukan dengan karena itu peluang yang
dibutuhkan
adalah
yang independen diistilahkan r yang menunjukan nomer
pengambilan
THEOREMA 2.1.2 peluang unit yang ditentukan menjadi masukan
dalam sampel sama
dengan
Bukti
N menunjukan jumlah sampel sehingga unit yang dijadikan sampel
dalam n
pengambilan, peluang unit yang dijadikan sampel merupakan
peluang dari n peristiwa yang
saling bebas viz. hal ini tercangkup dalam sampel saat
pengambilan pertama, kedua hingga
ke n. seperti yang ditunjukkan theorem 2.1.1 peluang
masing-masing unit adalah
sedangkan peluang terpilihnya dalam sampel adalah
.
-
Kesimpulan 1. peluang sampel terpilih dari n unit adalah ( )
Kesimpulan 2. Jika populasi N unit m unit dihilangkan dan
ditambah m maka peluang
terpilih setiap unit adalah( )
1.2 PREOSEDUR PEMILIHAN SAMPEL ACAK
Karena teori sampling berdasarkan sumsi random sampling, teknik
random sampling
mempunyai dasar yang penting. Beberapa prosedur yang digunakan
dalam memilih sampel
acak adalah sebagai berikut
i. Metode Undian ii. Menggunakan Tabel Angka Random
2.2.1 Metode Undian
Dalam praktek, karcis atau undian dapat dianggap merupakan
bagian dari unit sebuah
populasi. Jadi, setiap unit sampel mempunyai tanda pengenal
sendiri dari 1 sampai dengan N.
Prosedur dalam memilih setiap unit sampel sangat sederhana.
Semua karcis atau undian
dimasukkan dalam suatu wadah seperti alat logam berbentuk bola,
dimana memungkinkan
untuk diacak secara cermat sebelum diadakan pengambilan.
Pengambilan setiap karcis dapat
diteruskan sampai ukuran sampel yang dibutuhkan didapatkan.
Prosedur menomori setiap karcis dan mengambil satu sampel
setelah diacak menjadi
tidak praktis jika ukuran populasi besar. Dalam praktek akan
menjadi lebih sulit untuk
mendapatkan pengacakan yang cermat. Kesalahan pengamatan manusia
akan mempengaruhi
keabsahan metode ini.
2.2.2 Menggunakan Tabel Angka Random
Sebuah tabel angka random terdiri atas susunan angka-angka dari
0 sampai 9, yang
disusun dalam bentuk linier atau pola persegi panjang (tabel),
dimana setiap posisi berisikan
satu dari nomor tersebut. Tabel angka random juga disusun dari
angka 0, 1, 2, . . . , 9 dimana
setiap angka bersifat independen terhadap angka lainnya.
Beberapa tabel angka random yang
umum digunakan yaitu :
i. Tabel angka random Tippett ii. Tabel Fisher dan Yates
iii. Tabel Kendall dan Smith iv. Satu juta angka acak
Untuk memastikan apakah seri angka random ini benar-benar
merupakan angka acak,
beberapa tes berikut ini dapat digunakan :
-
i. Tes frekuensi ii. Tes berseri
iii. Gap test iv. Poker test
Metode praktis untuk memilih sampel secara acak adalah dengan
memilih unit sampel
satu per satu dengan bantuan tabel angka random. Dengan
mengambil dua buah angka, kita
mendapatkan angka untuk unit sampel dari 00 sampai 99, dan
semuanya mempunyai
frekuensi yang sama. Dengan cara yang sama, tiga atau lebih
kombinasi angka bisa
didapatkan dengan mengkombinasikan tiga atau lebih baris atau
kolom tabel tersebut.
Cara sederhana dalam memilih sampel yang dibutuhkan adalah
dengan memilih
angka acak dari 1 sampai dengan N dan kemudian memilih unit yang
sesuai dengan angka
tersebut. Prosedur ini meliputi angka yang tidak terpakai karena
angka tersebut melebihi
besarnya N. Dalam penggunaan tabel angka random terdapat
beberapa modifikasi dalam
prosedur pengambilan angka random, yaitu :
i. Pendekatan sisa ii. Pendekatan hasil bagi
iii. Pemilihan angka secara bebas
Pendekatan Sisa
Suatu ukuran populasi ditentukan sebagai N yang mempunyai
sebanyak r digit angka
dan kemudian hasil perkalian dari N yang masih mempunyai jumlah
digit r dianggap sebagai
N. Sebuah angka acak k dipilih dari 1 sampai N dan kemudian unit
yang memiliki nomor urut yang sama dengan sisa dari hasil pembagian
angka random yang terpilih (k) dengan N
dipilih sebagai sampel. Apabila sisa pembagian sama dengan nol,
maka unit sampel terakhir
yang terpilih. Misalnya, N = 123, hasil perkalian dari N yang
masih memiliki 3 digit angka
adalah 984. Untuk memilih sebuah unit, sebuah angka acak dari
001 sampai 984 dipilih.
Misalnya angka random yang terpilih adalah 287. kemudian 287
dibagi dengan 123, sisanya
adalah 41. Jadi, unit dengan nomor urut 41 adalah yang terpilih
sebagai sampel.
Pendekatan hasil bagi
Sebuah ukuran populasi sebesar N memiliki r digit angka kemudian
hasil perkalian
sebanyak r digit dari N dianggap sebagai N dimana N/ N = q.
Sebuah angka acak k dipilih dari 0 sampai dengan N 1. Dengan
membagi k dengan q maka hasil bagi r didapatkan dan unit dengan
nomor urut r 1 adalah unit yang terpilih. Sebagai gambaran, N = 16
sedangkan N = 96 dengan q = 6. Sebua angka random yang terpilih
dari 0 sampai 95 adalah 65. Dengan membagi 65 dengan 6, hasil
baginya adalah 10 dan kemudian sampel yang terpilih
adalah 9.
-
Pemilihan angka secara bebas
Metode ini diusulkan oleh Mathai (1954). Sebuah angka acak
dipilh berdasarkan digit
pertama dan yang lainnya menurut sisa dari ukuran populasi. Jika
angka yang terpilih adalah
0 maka unit yang terpilih adalah unit yang terakhir. Tapi jika
angka acak yang didapatkan
lebih besar dari atau sama dengan N, maka angka tersebut tidak
dipakai dan prosedur ini
kembali diulang.
Contoh 2.1 Memilih contoh acak dari 11 rumah tangga dari daftar
112 rumah tangga di
sebuah desa.
(i) Dengan menggunakan 3 digit angka acak yang berada di kolom 1
sampai 3, 4
sampai 6 dan seterusnya dari tabel angka random dan angka yang
tak terpakai yang lebih
besar dari 112 (angka 000 juga termasuk), kita mempunyai urutan
angka yang diambil
sebagai sampel yaitu 033, 051, 052, 099, 102, 081, 092, 013,
017, 076, dan 079.
(ii) Pada prosedur diatas, angka yang lebih besar dari 112
ditolak. Oleh karenanya,
metode yang biasanya digunakan adalah pendekatan sisa yang dapa
menghindari tidak
terpakainya angka random yang lebih besar dari N. Hasil
perkalian terbesar dari 112 adalah
896. dengan menggunakan 3 digit angka random seperti diatas,
maka angka random yang
terpilih akan memuat sampel dengan nomor urut 086, 033, 049,
097, 051, 052, 066, 107, 015,
106 dan 020.
(iii) Jika pendekatan hasil bagi diterapkan, hasil perkalian
tertinggi dengan 3 digit
angka dari 112 adalah 896 sedangkan q = 8. Dengan menggunakan
angka random yang sama
dan membaginya dengan 8, kita mendapatkan contoh acak bernomor
urut 025, 004, 020, 026,
006, 006, 092, 041, 085, 027 dan 086 dengan metode pengembalian
dan nomor urut 025, 004,
020, 026, 006, 092, 041, 085, 027, 086, dan 042 dengan metode
tanpa pengembalian.
Contoh 2.2 Sepuluh kebun buah di sebuah tempat dekat dengan
sebuah desa berturut-turut
mempunyai 125, 793, 970, 830, 1502, 864, 503, 106, 970, 312
pohon buah. Tariklah sebuah
sampel acak dari 10 pohon buah dengan menggunakan tabel angka
random.
Kita anggap bahwa kebun buah pertama mempunyai nomor urut pohon
buah dari 1
sampai 125, di kebun buah kedua dari nomor 126 sampai 918, dan
seterusnya. Oleh
karenanya, angka kumulatif dari nomor urut tersebut dapat
ditulis sebagai berikut, 125, 918,
1888, 2718, 4220, 5084, 5587, 6663, 6975. dengan menggunakan 4
digit angka random
seperti contoh diatas dan dengan dugaan yang serupa, kita
mendapatkan sepuluh angka acak
1983, 0330, 1614, 2096, 0511, 0524, 3311, 6874, 2183 dan
6926.
Dengan angka random yang pertama 1983, kita memilih pohon yang
bernomor urut
95 di kebun buah keempat. Serupa dengan yang tadi, dengan angka
acak kedua 0330, kita
memilih pohon dengan nomor urut 205 di kebun buah kedua, dan
seterusnya.
-
2.3 ESTIMATION OF POPULATION PARAMETERS
Mari kita mengasumsikan setiap unit iu dalam sebuah populasi
memiliki suatu nilai
variabel iY untuk setiap karakter y. Untuk beberapa parameter,
mari didefinisikan sebagai
Total populasi, N
i
iyY
Rata-rata populasi, N
i
i NYY
Varian populasi, N
i
i NYY22 )(
Dalam sebuah n contoh acak unit-unit dalam sampel 1u , 2u , . .
., nu , secara berturut-
turut mempunyai 1y , 2y , . . ., ny . Estimator dari total
populasi dan rata-rata adalah
n
i
i yNyn
NY . , dan
n
i
i ynyY
Faktor nN yang ada di rumusan untuk total sampel biasanya
disebut perluasan atau
peningkatan atau faktor inflasi. Kebalikanya Nn disebut fraksi
sampling dan dinyatakan
dengan huruf f dalam buku ini.
Dalil 2.3.1 Dalam penarikan sampel aca sederhana, tanpa
pengembalian, rata-rata sampel y
adalah estimator yang unbiased dari parameter Y dan varian
samplingnya diberikan sebagai
NSfnSNnyV22 )1()1()( (2.3.1)
dimana
)1(22 NNS
Bukti Kita ketahui
-
2
2
22
1
1
PtPN
PPNtn (2.7.9)
(i) Jika faktor koreksi terbatas (kpt) diabaikan, maka :
220 1 PPtn (2.7.10)
(ii) Jika faktor koreksi tidak diabaikan, maka :
Nnn
n11 0
01
(2.7.11)
Contoh 2. 8
Dalam suatu populasi terdapat 4000 orang yang dipanggil untuk
memberikan hak
suaranya, 50% mengembalikannya ke kotak suara. Perkiraan jumlah
sampel untuk
mengestimasi proporsi orang yang mengembalikan kertas suara
sehingga mempunyai
batas kesalahan (MoE) 5% dari 95% derajat kepercayaan dimana
pengambilan sampel
dilakukan secara :
(iii) Pada kasus penarikan sample sederhana secara acak tanpa
pengembalian (WOR),
banyaknya kemungkinan sample adalah 10 yaitu 52 . Dapat kita
lihat bahwa setiap kemungkinan sample memiliki peluang yang sama
untuk terpilih yaitu masing-masing 1/10.
(a) Nilai harapan dari y , yang diberikan dari hasil rata-rata
pada kolom (6) dalam tabel 2.3.2,
dengan nilai 158,0 sebagai rata-rata pada populasi, hal itu
membuktikan bahwa y
merupakan estimator yang tidak bias bagi Y . Selanjutnya,
varians sampling yang didapatkan
dari rata-rata terhadap kuadrat error (kesalahan) yang
ditunjukkan pada kolom (7) dimana
hasilnya adalah 14,55 ,dengan asumsi bahwa .
)10/3(8/3)(22 Syv
(b) Sejak varians dari sampel ( 2s , diberikan oleh 2/)(2
21 yy ), dimana hal ini akan lebih
mempermudah penghitungan, rata-rata dari 10 sampel berarti
kuadrat yang ada seperti 2)(sE .
Perhatikan, 5,4810/485)(2 sE
Juga, kuadrat rata-rata populasi = 48,5
Jadi, kuadrat rata-rata sample menunjukkan estimator yang tidak
bias dari kuadrat rata-rata
populasi )(2S , buktinya :
22 )( SsE
-
(c) Estimator dari )( yV berasal dari :
20/)(3)( 221 yyyv
Nilainya ditunjukkan oleh kolom (8) pada tabel 2.3.2. Nilai
harapan (Expected Value) dari
)(yv yang di dapat dari hasil rata-rata nilai pada kolom (8)
yaitu 14,55. Menunjukkan bahwa
nilai itu adalah estimasi tidak bias
10
3)()]([
2SyVyvE
2.4. Estimasi Proporsi Populasi
Sering kali, unit-unit di dalam populasi dikelompokkan kedalam
dua grup (i) yang
mempunyai karakteristik khusus dan (ii) tidak memiliki
karakteristik tersebut. Contohnya,
hasil panen ladang yang diari dengan ladang yang tidak diari.
Apabila ladangnya diari, kita
dapat mengatakan bahwa dia memiliki karakteristik yaitu
irigasi/pengairan. Jika ladang
tersebut tidak diari, dapat dikatakan bahwa ia tidak memiliki
karakteristik khusus tersebut.
Jika kita ingin memperkirakan proporsi ladang yang diari, dengan
populasi ladang adalah
sebanyak N ladang dan diasumsikan bahwa iy memiliki nilai 1 jika
ladang tersebut diari, dan
lainnya dianggap nol (0). Dimana, total dari ladang yang diari
sebagai 1N adalah bagian dari
N.
N
i
ii Ny
Jadi,
N
i
i PN
Ny
NY
1
11 proporsi dari ladang yang di irigasi
dan
NPNy i
N
i
i 1
2
Jadi, masalah yang ada dalam memperkirakan proporsi populasi
adalah dengan
mendefinisikan varians seperti diatas. Apabila 1n unit sample
diambil dengan SRS dan
ukuran n yang memiliki karakteristik tertentu, maka proporsi
sampel diberikan dengan
./1 nnp Sehingga :
-
npynyn
i
i
n
i
i 1
2
1
1
Karena itu, estimasi tidak bias dari P adalah
pnnp )/( 1 (2.4.1)
TEOREMA 2.4.1 Pada penarikan sampel tanpa pengembalian (WOR),
varians dari p adalah :
)1(
)1(
)1(
)()(
Nn
NPQf
Nn
PQnNpV (2.4.2)
Dimana PQ 1 . Pembuktiannya adalah :
Bukti 1. Dalam pengambilan sampel tanpa pengembalian (WOR),
varians dari p adalah
nPQpV /)( (2.4.3)
Bukti 2. Varians dari pNN 1 , perkiraan total untuk beberapa
unit dengan beberapa
karakteristik tertentu adalah :
)1(/)()( 21 NnPQnNNNV (2.4.4)
TEOREMA 2.4.2 Pada pengambilan sampel tanpa pengembalian (WOR),
perkiraan tidak
bias dari )( pV adalah :
)1/()1()( npqfpv (2.4.5)
Pembuktiannya :
Bukti 1. Pada pengambilan sampel dengan pengembalian (WR),
estimasi tidak bias dari
)( pV adalah :
)1/()( npqpv (2.4.6)
Bukti 2. Estimasi tidak bias dari varians untuk NpN 1 adalah
:
)1/()1()1/()()( 21 npqNfnpqnNNNv (2.4.7)
Bukti 3. Koefisien variasi dari p adalah :
-
2/12/1
]/[]/[
nPQP
nPQCV (2.4.8)
CONTOH 2.4. Daftar pemilih dalam suatu lomba disuatu kota yang
mengukur kebenaran
usia tiap orang sebanyak 3000. Diambil sampel sebanyak 300 nama
secara SRS, dimana 51
orang diketahui menunjukkan umur yang salah. Perkirakan total
dari pemilih yang memiliki
kesalahan dalam menggambarkan usia dan perkirakan standart
error-nya.
Dimana ;
17.0,51,300,3000 1 pnnN
Estimasi total dari pemilih yang melakukan kesalahan dalam
menggambarkan usia mereka
dapat dijelaskan oleh :
510)17.0)(3000( 1 NpN
(i) Jika sampel diambil dengan pengembalian (WR), perkiraan
standart error-nya adalah
2/1 )]1/([1
npqNsN
2/1]50/)83.0)(17.0[(3000
3.159
(ii) Jika sampel diambil tanpa pengembalian (WOR), perkiraan
standart error-nya adalah :
2/1 )]1/()1[(1
npqfNsN
2/1]50/)83.0)(17.0)(10.01[(3000
1.151
2.5. Kombinasi dari estimasi yang tidak bias
Ada situasi dimana beberapa sampel dapat diperkirakan karena
sampel-sampel
tersebut diklasifikasikan menjadi 2 kombinasi. Jika ti (I =
1,2,,m) merupakan estimasi
tidak bias dari parameter , dimana satu dan lainnya dianggap
saling bebas, maka estimasi
gabungannya adalah :
m
i
i mtt1
/ (2.5.1)
-
juga adalah estimasi yang tidak bias dari . Varians dari t
adalah :
m
i
i mtvtV1
2/)()( (2.5.2)
dan estimasi varians-nya adalah :
m
i
i mmtttv1
2 )1(/)()( (2.5.3)
Kita akan mempergunakannya dalam kasus-kasus sebagai berikut
:
(i) SRS dalam variabel (ii) SRS dalam kebijaksanaan.
2.5.1 SRS dalam variable
Apabila myyy ,...,, 21 adalah rata-rata sampel, dimana setiap
variabel adalah saling
bebas, dengan banyak sampel masing-masing adalah n1, n2,, nm .
Perkiraan gabungan dari
semua sampel tersebut adalah :
(i) Estimasi m dengan rata-rata aritmatik
m
i
i myy1
/' (2.5.4)
(ii) Estimasi m dengan rata-rata tertimbang
m
i
ii nyny1
/'' (2.5.5)
dimana,
m
i
inn1
Jika sampel diambil dengan pengembalian
Varians sampling dari 'y dan ''y adalah :
m
i
i
m
i
i nim
myVyV1
2
2
1
2 //)()'(
(2.5.6)
Dan
-
n
nyVnyVm
i
ii
2
1
22 /)(.)''(
(2.5.7)
Estimator tidak bias dari )'(yV dan )''(yV berasal dari :
m
i
i mmyyyv )1(/)'()'(2 (2.5.8)
Dan
in
j
ij
m
i
nnyyyv )1(/)''()''( 2 (2.5.9)
Hal ini akan menunjukkan bahwa perkiraan seperti pada (2.5.5)
jauh lebih efisien jika
dibandingkan dengan hubungan pada (2.5.4) dan dapat diuji dengan
membandingkan variasi
keduanya dalam satu kasus.
Jika sampel diambil tanpa pengembalian
Varians sampling dari 'y dan ''y adalah sebagai berikut :
m
i
iii
m
i
i nmSfmyVyV222 /)1(/)()'( (2.5.10)
dan
m
i
inNnn
SyV 2
2 11)''( (2.5.11)
Estimasi tidak bias dari )'(yV dan )''(yV diperoleh dari :
m
i
iii nmsfyv22 /)1()'( (2.5.12)
dan
m
i
iii nsfnyv22 /)1()''( (2.5.13)
2.5.2. SRS dalam kebijaksanaan (attributes)
Hasil yang diperoleh pada bagian sebelumnya dapat diterapkan
kedalam SRS dengan
attributes ini. Jika p1, p2,,pm adalah proporsi sampel sebanyak
m dengan ukuran masing-
masing sampel n1, n2, , nm , dengan asumsi bahwa masing-masing
saling independent.
Estimasi gabungan dari semua sampel dapat diberikan sebagai
berikut :
-
(i) Estimasi m dengan rata-rata aritmatik
m
i
i mpp / (2.5.14)
(ii) Estimasi m dengan rata-rata tertimbang
m
i
ii npnp / (2.5.15)
Dimana;
m
i
inn
Jika sampel diambil dengan pengembalian
Varians sampling dari p dan p adalah sebagai berikut :
m
i
i
m
i
i nmPPmpVpV22 /)1(/)()( (2.5.16)
Dan
nPPnpVnpVm
i
ii /)1(/)(.)(22 (2.5.17)
Estimasi tidak bias dari )'( pV dan )''( pV diperoleh dari :
m
i
i mmpppv )1(/)()'(2 (2.5.18)
Dan
m
i
iiii nnppnpv )1(/)1()''(2 (2.5.19)
Estimator lainnya adalah :
npppv /)1()''( (2.5.20)
Jika sampel diambil dengan pengembalian
Varians sampling dari 'p dan ''p adalah :
-
m
i
ii mNnPPnNpV2)1(/)1()()'( (2.5.21)
Dan
m
i
ii NnPPnNpV )1(/)1()()''( (2.5.22)
Estimasi tidak bias dari )'( pV dan )''( pV diperoleh dari :
m
i
i mmpppv )1(/)'()'(2 (2.5.23)
Dan
m
i
iiiii nNnppnnNpv )1(/)1()()''(22 (2.5.24)
2.6. Batas Kepercayaan
Setelah memperkirakan (estimasi) nilai parameter yang tidak
diketahui, penting bagi
kita untuk mengetahui atau mengukur kepercayaan dan tingkat
ketelitian (kebenaran) dari
perhitungan estimasi yang kita dapat dan untuk membuat beberapa
batasan tertentu dengan
memberikan tingkat kepercayaan / kebenarannya. Jika kita
mengasumsikan bahwa estimator
y berdistribusi normal terhadap rata-rata populasi Y , batas
bawah dan batas atas untuk rata-
rata populasi Y adalah :
2/1
)1,( ]/)1[(. nfstyY nL (2.6.1)
Dan
2/1
)1,( ]/)1[(. nfstyY nU (2.6.2)
Dimana t(,n-1) adalah nilai dari tabel student-t dengan (n-1)
sebagai derajat bebas dan
merupakan tingkat kesalahan atau peluang melakukan kesalahan
dalam perhitungan. Sama
halnya dengan batas kepercayaan dari total populasi dapat
dituliskan sebagai berikut :
2/1)1,( ]/)1[(.. nfsNtyNY nL (2.6.3)
Dan
2/1)1,( ]/)1[(.. nfsNtyNY nU (2.6.4)
-
CONTOH 2.5. Tanda tangan untuk sebuah permohonan dikumpulkan
dalam 700 lembar.
Setiap lembar diberi tempat sebanyak 50 tanda tangan, tapi para
pemberi tanda tangan
meletakkan tanda tangan mereka dengan tidak teratur sehingga
banyaknya tanda tangan tiap
lembar tidak dapat dipastikan jumlahnya. Dalam pengumpulan,
terdapat 12 lembar yang
mengalami gangguan atau hilang. Kemudian diambil sampel secara
acak sebanyak 50 lembar
dan jumlah tanda tangan per lembar dukumpul dan hasilnya adalah
seperti tabel dibawah ini :
Banyaknya Tanda
tangan (yi)
Banyaknya Lembaran
(ni)
52
51
46
42
40
37
32
29
27
15
14
10
8
1
2
21
8
7
2
2
1
1
2
1
1
1
Perkirakan total tanda tangan untuk permohonan tersebut dan
perhitungkan batas
kepercayaannya sebesar 95%.
Yang kita ketahui,
50,68812700 innN
84820,1992 2 iiii ynyn
Sehingga, perkiraan total tanda tangan adalah
50/)1992)(688(. yNY
410.27
Dan
)1/()( 22 nyyns ii
-
]50/)1992(84820[49
1 2
55,10s
Karena itu, selang kepercayaan dengan tingkat kepercayaan 95%
adalah :
184.13)55,10)(688)(96,1(27410 LY
636.41)55,10)(688)(96,1(27410 UY
2.7. Perkiraan Ukuran Sampel
Dalam merencanakan survey sampel untuk memperkirakan parameter
populasi, salah
satu pertanyaan terpenting adalah bagaimana menentukan banyaknya
sampel yang akan
digunakan. Hal tersebut dilakukan dengan tingkat atau derajat
ketelitian (Presisi) yang
diperbolehkan dan dengan tingkat kepercayaan tertentu. Sebelum
kita membahas mengenai
perbedaan metode penarikan sampel yang digunakan, mari kita
lihat pendekatan solusi secara
umum pada masalah perkiraan ukuran atau banyaknya sampel yang
digunakan.
Apabila z merupakan jumlah kesalahan dari estimasi dan l(z)
merupakan kerugian
yang dibuat dalam pengestimasian tersebut. Untuk metode
penarikan sampel yang digunakan,
teori yang ada akan menyediakan bagi kita fungsi kepekatannya.
Jadi, nilai harapan dari
kehilangan/kerugian dari banyaknya sampel yang digunakan dapat
dihtung dari :
][ )()( zn lEL (2.7.1)
Dan apabila kita juga mempetimbangkan fungsi biaya untuk ukuran
sampel n, dinotasikan
sebagai berikut :
cnaC n )( (2.7.2)
Dimana a adalah biaya pendahuluan dan c merupakan biaya setiap
unit dalam metode
penarikan sampel tersebut.
Hubungan kombinasi (2.7.1) dengan (2.7.2), kita mendapatkan
total kerugian, yaitu :
)()()( nn CLn (2.7.3)
Dimana adalah jumlah tetap (konstan).
Apabila dalam penarikan sampel dimaksudkan untuk meminimumkan
kerugian,
banyaknya n dipilih melalui rumus (2.7.3) yang diperkecil.
Dengan menurunkan )(n dan mendapatkan n serta menyamakan 0/ n ,
nilai dari n
yang paling optimum dapat ditentukan.
-
CONTOH 2.6 Jika fungsi kerugian terhadap kesalahan/error dalam
estimasi proportional
dengan Yy dan jika biaya total dalam survey adalah cnaC ,
tunjukkan bahwa dengan
metode SRS, fpc diabaikan, ukuran n optimum adalah :
,2/ 3/2 ck dimana k adalah konstan.
Disini Yyl z )(
Atau Yykl z 1
)(
Dimana k1 juga konstan.
Jadi,mengikuti
nkYyEkL n /.211
)(
[dengan asumsi bahwa y terdistribusi )/,( nYN ]
Karena itu,
nkcnan /.2
)( 1
nkcna /.2
Kemudian diturunkan dan disamakan 0/ n , kita peroleh :
3/22/. ckn
Dengan tindakan yang sama dan analisis dapat dipakai untuk
beberapa metode penarikan
sampel dimana fungsi kerugian adalah kebalikan dari proportional
untuk n dan fungsi biaya
juga merupakan fungsi dari n. pembahasan secara umum ditunjukkan
oleh Yates(1960),
Raiffa dan Schlaifer(1961), Chaudhary(1977), dan Chaudhary dan
Singh(1979) yang
membahas garis tentang metode berangkai. Untuk pembahasan yang
diklasifikasikan atau
dikelompokkan, nilai yang baik dari metode ini dibahas oleh
Nordin(1944), Blythe(1945),
Deming(1950) dan Tippett(1950).
Sekarang mari kita menguraikan hasil dari SRS untuk
karakteristik yang dapat diukur
secara kuantitatif. Apabila marginal error (presisi) yang
diperbolehkan dalam
estimasi/perkiraan adalah , dan (1-) tingkat
kepercayaan/ketelitian. Rata-rata sampel y
diasumsikan terdistribusi normal dengan rata-rata populasi Y dan
varians :
-
n
S
N
nNyV
2
.)(
)(
Karena itu,
2/12
),( .
n
S
N
nNt (2.7.4)
Dimana t(, ) adalah nilai variasi bersama yang diberikan (1-),
dimana ;
222222 /1// NSttSn (2.7.5)
(i) Jika fpc diabaikan,didapat
2
22
0
St
n (2.7.6)
(ii) Jika fpc tidak diabaikan, kita bias mendapatkan nilai n
dengan meletakkan nilai dari n0 kedalam Eq. (2.7.5) dan kita
peroleh :
)/1/( 001 Nnnn (2.7.7)
CONTOH 2.7. Sebuah studi tentang metode sampling dalam sebuah
populasi mempunyai
500 unit sampling. Nilai total yang didapat 49Y dan 6,442 S .
Dalam SRS, berapa
banyak unit sampel yang dapat dipilih untuk memperkirakan Y
dengan maerginal error 10%
dan koefisien kepercayaan 95%, ketika penarikan sampel dilakukan
dengan (i) metode
pengembalian, (ii) dengan metode tanpa pengembalian?
(i) Sampling dengan pengembalian (WR). Dalam kasus ini, kita
dapat mengabaikan fpc/kpt dan diperoleh :
8136,7)9,4(
6,44)96,1(2
2
2
22
0
St
n
(ii) Sampling tanpa pengembalian (WOR). Dalam kasus ini, fpc
tidak diabaikan dan diperoleh :
8035,7/1 0
0
Nn
nn
Dengan cara yang sama, kita juga dapat membahas hasil ketika
unit sampel diklasifikasikan /
dikelompokkan berdasarkan karakteristik yang ada. Dengan dugaan
yang sama, proporsi
sampel p dapat diasumsikan berdistribusi normal dengan P dan
varians (N-n)P(1-P)/n(N-1).
Karena itu, nilai dari n sebelum diberikan, tingkat ketelitian
dapat di estimasi dengan
2/1
),( )]1(/)1()[( NnPPnNt (2.7.8)
dimana t(, ) memiliki pengertian yang sama seperti yang
diberikan dalam hubungan (2.7.4),
dimana diberikan :
-
(i) Pengambilan sampel dengan pengembalian Dalam kasus ini kita
dapat mengabaikan kpt, sehingga diperoleh :
3850025,05,05,096,11 2220 PPtn
(ii) Pengambilan sampel dengan tanpa pengembalian Dalam kasus
ini, kpt tidak dapat diabaikan dan kita peroleh :
352
11 0
01
Nn
nn
KUMPULAN PERMASALAHAN
2.1.Diketahui pada suatu daftar terdapat N pabrik dengan
penomoran secara terurut, m
pabrik sudah tidak beroperasi lagi dan n pabrik baru telah
ditambah ke daftar
pembuatan jumlah pabrik nmN Berikan prosedur sederhana untuk
pemilihan satu pabrik dengan alokasi sama dari
nmN pabrik, untuk menghindari penomoran ulang N pabrik pabrik
dan tunjukkan bahwa prosedur yang Anda berikan menggunakan alokasi
sama untuk
pabrik pabrik yang baru.
2.2.Dengan bantuan angka random, buatlah sampel acak, masing
masing berukuran 5
dengan mengikuti :
(i) Populasi Cauchy :
22
1
xxf dimana x
8,3 cm dan 1,2 cm
(ii) Populasi normal :
22 2exp2
1
xxf dimana x
8 dan 2
(iii) Populasi Bivariate Normal, dimana rata rata dari 2 peubah
x dan y aalah 68 cm dan 170 kg, standar deviasi dari x dan y adalah
3cm dan 7 kg dan koefisien
korelasi p adalah :
(i) + 1 (ii) dan (iii) 1
2.3.Prosedur yang dilakukan telah menggunakan pemilihan sampel
lahan untuk
eksperimen crop-cutting kuantitas padi :
-
Sebaliknya, nomor setiap desa terpilih ditunjukkan dala 3 angka
random yang
nilainya lebih kecil daripada angka survey tertinggi. Angka
angka random tersebut menggambarkan tiga lahan padi untuk
eksperimen crop-cutting. Jika
angka survey terpilih menunjukkan bahwa padi tidak tumbuh, maka
pilih angka
survey pertumbuhan padi selanjutnya di tempat lain.
Uji bahwa metode di bawah akan memberikan kemungkinan yang sama
termasuk
pada sampel untuk keseluruhan angka survey pertumbuhan padi,
diberikan sebagai
berikut :
(i) Nama desa Payagpur (ii) Total jumlah survey 299 (iii) Angka
random 28, 189, 269 (iv) Jumlah survey pertumbuhan padi 39 - 88 dan
189 - 299
Tunjukkan bahwa angka survey 39 memiliki kemungkinan 39/299
termasuk
dalam sampel, angka survey 189 kemungkinannya 101/299, sementara
angka
survey selanjutnya hanya mempunyai kemungkinan 1/299 untuk
masing masing angka.
2.4. Suatu populasi terdiri dari N unit, nilai peubah dari satu
unit diketahui menjadi yo.
Suatu sampel acak WOR dilemparkan sehingga menjadi (N-1) unit.
Tunjukkan bahwa
perkiraan
yNy 10 memiliki varians yang lebih kecil daripada Ny
didasarkan
pada sampel acak, WOR, jumlah n diambil dari populasi
tersebut.
2.5.
(i) Diketahui pengambilan sampel acak sederhana (SRS). Apakah
rata rata sampel konsisten dan unbiased estimator untuk rata rata
populasi ? Tunjukkan varians rata rata sampel dan juga perkiraan
varians unbiased. Apakah jumlah sampel dapat mewakili perkiraan
rata rata populasi dengan diberikan suatu standar error?
(ii) Jika 1n dari unit unit sampel adalah tipe A, tunjukkan
estimasi proporsi yang
unbiased dari unit unit tipe A dalam populasi and pengambilan
sampel varians serta perkirakan jika ukuran sampel cukup besar
dengan 95% tingkat keyakinan
dari proporsi unit yang tidak diketahui tipe A dalam
populasi.
2.6.Diketahui v menghilangkan perbedaan unit unit yang terjadi
dalam suatu sampel n unit unit terpilih dengan alokasi sama dengan
pengembalian dari suatu populasi N
unit unit. Perlihatkan bahwa estimator
v
i
iv vyy adalah unbiased untuk rata
rata populasi. Jelaskan suatu unbiased estimator varians dari
estimator tersebut.
2.7.Dari suatu sampel acak n unit unit, suatu bagian sampel
acak, m unit unit dilemparkan tanpa pengembalian dan bertambah ke
sampel asal. Perlihatkan bahwa
rata rata pada (n+m) unit unit adalah suatu unbiased estimator
dari populasi rata rata dan rasio varians tersebut memiliki rata
rata mula mula n unit dengan
perkiraan 2131 nmnm . Asumsikan bahwa populasi berukuran besar.
2.8.Diketahui nilai varians dari suatu pelemparan sampel acak
sederhana dengan tanpa
pengembalian dari suatu populasi terbatas.
N bola bola terletak dalm sebuah container besar, dilemparkan
secara rando dari suatu penambahan Mp merah dan Mq bola bola putih.
Kemudian sampel n bola bola dilemparkan secara acak dari container
sampel. Hal ini menujukkan bahwa selain
n bola bola tersebut, r adalah merah. Carilah v(r) dimana N bola
bola diletakkan ke container besar.
-
(i) dengan pengembalian (ii) dengan tanpa pengembalian
2.9.Varians rata rata sampel pada SRS adalah :
111 2
NyNyNnyVN
i
i
Penulisan unbiased estimator V(y) oleh v dengan catatan bahwa
:
N
i
i
n
i
i yyn
NE 22. 22 YvyE
Sehingga
n
i
i vyNyn
NE
NNnvE 22.
1
1.
11
2.10. Suatu produksi dalam kuintal untuk sejumlah padi yang
tumbuh pada 200 desa pada tehsil, halaman 44.
( Gambar dalam pasangan indicator angka desa )
(i) Pemilihan sampel acak sederhana dengan jumlah 20 dan 25 unit
dan perkirakan rata rata lahan per luas diketahui standar errornya
sebagai dasar terpilihnya unit.
(ii) Buatlah 95% interval kepercayaan dan interpretasikan.
(iii)Berapakah jumlah sampel yang diberikan dari estimasi rata rata
lahan dengan 55
standar error.
(1) 20 (2) 21 (3) 32 (4) 41 (5) 55
(6) 22 (7) 64 (8) 42 (9) 28 (10) 35
(11) 25 (12) 25 (13) 24 (14) 32 (15) 75
(16) 28 (17) 29 (18) 38 (19) 19 (20) 19
(21) 16 (22) 28 (23) 30 (24) 29 (25) 29
(26) 19 (27) 37 (28) 34 (29) 31 (30) 35
(31) 29 (32) 19 (33) 27 (34) 42 (35) 39
(36) 11 (37) 26 (38) 21 (39) 45 (40) 61
(41) 16 (42) 29 (43) 32 (44)32 (45) 63
(46) 30 (47) 21 (48) 35 (49) 28 (50) 18
(51) 24 (52) 32 (53) 23 (54) 8 (55) 35
(56) 27 (57) 35 (58) 25 (59) 29 (60) 29
(61) 25 (62) 31 (63) 38 (64) 31 (65) 43
(66) 21 (67) 36 (68) 30 (69) 37 (70) 47
(71) 15 (72) 27 (78) 36 (79) 28 (80) 43
-
(81) 28 (82) 25 (83) 31 (84) 6 (85) 4
(86) 22 (87) 24 (88) 39 (89) 71 (90) 44
(91) 24 (92) 34 (93) 18 (94) 28 (95) 10
(96) 70 (97) 20 (98) 32 (99) 42 (100) 47
2.11. Bahan bahan untuk membangun 5000 sumur telah diberitakan
selama tahun 1964 pada suatu wilayah sebagai bagian dari
Grow-more-Food Campaign di India. Daftar
penyelenggaraan yang diberitakan bersama dengan lokasi tujuan
masing masing sumur sebenarnya membangun dan menggunakannya untuk
tujuan irigasi. Sampel
dimaksudkan untuk terpilih dalam SRS. Diketahui julah sampel
untuk nilai p
berkisar antara 0,5 sampai 0,9, jika dapat dimungkinkan MoE
(batas kesalahan)
adalah 10% dan tingkat kepercayaan 95%.
2.12. Suatu data menunjukkan hubungan suatu jumlah laktat dari
produksi susu (dalam kg) 250 sapi di suatu daerah peternakan.
(i) Pilihlah sampel acak sederhana sebanyak 25. (ii) Perkirakan
rata rata dengan menggunakan standar error. (iii)Buatlah perkiraan
rata rata populasi dengan tingkat keyakinan 95%. 230 293 163 290
200 173 194 322 169 230
297 151 248 271 259 214 167 207 240 286
184 248 327 338 165 177 270 177 202 155
155 293 190 172 150 319 151 118 213 114
186 167 129 185 231 199 265 306 173 276
291 231 205 220 246 239 186 299 233 208
265 204 300 195 239 173 237 282 221 218
197 215 213 290 146 232 305 184 149 267
188 219 171 99 329 199 180 225 257 202
189 207 792 327 201 300 206 199 299 153
175 287 277 230 258 137 174 301 260 282
211 212 284 214 283 139 223 212 207 224
207 111 272 192 127 303 221 187 309 263
203 176 233 239 176 218 193 243 236 275
288 198 241 219 167 193 234 179 126 173
279 178 275 260 191 174 235 338 242 238
211 187 184 189 305 221 253 225 327 203
-
195 158 156 185 170 271 160 188 165 218
312 143 267 298 196 139 205 298 238 217
145 201 313 230 185 166 147 223 271 133
155 230 287 329 265 150 286 271 268 198
214 231 163 335 198 270 187 174 163 201
192 247 247 297 178 240 290 234 170 227
230 353 170 159 236 181 230 240 212 242
151 158 253 179 263 158 250 226 246 301
2.13. Distribusi frekuensi dari 232 kota di beberapa negara
dengan ukuran populasi dalam ribuan (000) adalah sebagai berikut
:
Ukuran kelas
populasi
Jumlah
kota
50 - 75 81
75 - 100 45
100 - 150 42
150 - 200 14
200 - 250 9
250 - 300 5
300 - 350 6
350 - 400 5
400 - 450 5
450 - 500 2
500 - 550 2
550 - 600 3
600 - 650 1
650 - 700 1
700 - 750 0
750 - 800 1
800 - 850 2
-
850 - 900 1
900 - 950 2
950 - 1800 0
1800 - 1850 1
1850 - 1950 0
1950 - 2000 1
2000 - 2050 0
2050 - 2100 1
2100 - 3600 0
3600 - 3650 1
3650 - 7850 0
7850 - 7900 1
Hitunglah standar error dari perkiraan rata rata populasi,
dimana :
(i) Suatu sampel dari 50 kota dipilih secara SRS WOR, dan (ii)
Dua kota terbesar pasti terdapat dalam survey dan hanya 48 kota
dipilih dari
230 kota dengan SRS WOR.
2.14. Dalam sebuah survey pertanian, 36 sampel diambil secara
SRS WOR dari 432 populasi yang terdapat di desa tersebut. Hubungan
data dengan ukuran wilayah
dicatat dalam data berikut :
No. urut
RT
Ukuran luas
lahan
1 21,04
2 12,59
3 20,30
4 16,16
5 23,82
6 1,79
7 26,91
8 7,41
9 7,68
-
10 66,55
11 141,80
12 28,12
13 8,29
14 7,27
15 1,47
16 1,12
17 10,67
18 5,94
19 3,15
20 4,84
21 9,07
22 3,69
23 14,61
24 1,10
25 22,13
26 1,68
27 49,58
28 1,68
29 4,80
30 12,72
31 6,31
32 14,18
33 22,19
34 5,50
35 25,29
36 20,99
-
Perkirakan dengan standar error proporsi wilayah 4321 ,,, PPPP
dalam 4 wilayah kelas
0 4,99; 5,00 9,99; 10,00 24,99 dan lebih dari 25.
DAFTAR PUSTAKA
Blyth, R. H., The economics of sample size applied to the
scaling of saw logs. Bio, Bull, 1, 67-70, (1945).
Chaudhary, F. S. Sequential approach to sample surveys, Ph. D.
thesis, Meerut University,
(1977).
Chaudary, F. S. and D. Singh, Sequential estimation of
population and sample sizes, (unpublished), (1979).
Deming, W. E., Some theory of sampling, John Wiley and Sons, New
York, (1950).
L.C. A. R., Sample surveys for the estimation of yield of food
crops, Bull, 72, New Delhi, (1951)
Mathai, A. On selecting random numbers for large scale sampling,
Sankhya, 13, 157 160. (1954).
Nordin, J. A., Determining sample size, J. Amer. Statist.Assoc.,
39, 497 506, (1944).
Raiffa, H. and R. Schlaifer, Applied Statistical Decision
Theory, Harvard Bussiness School,
Boston, (1961).
Tippett, L. H. C., Technological application of statistics, John
Willey & Sons, New York,
(19500.
Yates, F. Sampling methods for cencuses and survey, Charles
Griffin and Co., London,
(1960).