Top Banner
Analisa Data Statistik Chap 8: Sampling Distribution Agoes Soehianie, Ph.D
46

Analisa Data Statistik Chap 8: Sampling Distribution

Jan 12, 2016

Download

Documents

will

Analisa Data Statistik Chap 8: Sampling Distribution. Agoes Soehianie, Ph.D. Daftar Isi. Random Sampling, Populasi dan Sampel Mean dan Variansi Sampel Grafik Tampilan Data Distribusi Sampel Kesimpulan (Inferences) Tentang Mean Populasi. Random Sampling. - PowerPoint PPT Presentation
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Analisa Data Statistik Chap 8: Sampling Distribution

Analisa Data StatistikChap 8: Sampling Distribution

Agoes Soehianie, Ph.D

Page 2: Analisa Data Statistik Chap 8: Sampling Distribution

Daftar Isi

Random Sampling, Populasi dan Sampel

Mean dan Variansi Sampel Grafik Tampilan Data Distribusi Sampel Kesimpulan (Inferences)

Tentang Mean Populasi

Page 3: Analisa Data Statistik Chap 8: Sampling Distribution

Random Sampling

Suatu proses untuk mengambil sampel secara acak dari populasi. Secara teknis letak kerumitannya adalah pada proses untuk menjamin ke-random-an, terutama bilamana sampel berasal dari populasi yg berunsur manusia.

Ada beberapa teknik sampling yg dikenal:

1. Probabilistik sampling

Setiap anggota populasi memiliki kesempatan yg sama untuk terpilih.

Variasinya: Simple Random Sampling, Sistematik Random Sampling, Stratified Random Sampling, Multistage Area Random Sampling.

2. Non Probabilistik Sampling

Bilamana kesempatan anggota populasi terpilih tidak sama

Variasinya: Quota Sampling, Booster Sampling, Judgement Sampling, Convenience Sampling, Snow-Ball sampling etc

Proses analisa statistik hanya berlaku untuk probabilistik sampling

Page 4: Analisa Data Statistik Chap 8: Sampling Distribution

Populasi dan Sampel

Keseluruhan obyek atau kejadian yg menjadi sasaran observasi disebut populasi.

Contoh: penduduk Indonesia, mahasiswa ITB, sekrup diameter 5mm produksi pabrik X, pengguna HP di Bandung, Penderita AIDS di Indonesia, umur batuan, tekanan udara di Bandung, curah hujan di Jawa Barat, dll

Macam populasi :

Diskrit vs Kontinu

Finite vs Infinite

Setiap observasi di populasi adalah NILAI dari variabel random X yg memiliki distribusi probabilitas tertentu f(x).

Pada banyak kasus sulit/mahal/tidak mungkin untuk melakukan observasi untuk seluruh anggota populasi, sehingga diperlukan sampel.

Sampel : himpunan bagian dari populasi.

Page 5: Analisa Data Statistik Chap 8: Sampling Distribution

Statistik

Pada Statistik Inferential ingin diambil kesimpulan tentang parameter-parameter populasi (mean, variansi) dari studi terhadap parameter-parameter sampel.

Statitik adalah sebuah fungsi berdasarkan pada variabel random yg dihitung dari sampel.

Contoh : mean dan variansi serta STD

Mean sampel

Jika X1, ..,Xn adalah nilai variabel random dari sampel berukuran n maka mean dari sampel didefinisikan sbg:

dengan maka

n

kkXn

X1

1

n

kkx XS

1 n

SX X

Page 6: Analisa Data Statistik Chap 8: Sampling Distribution

Variansi sampel

Jika X1, ..,Xn adalah nilai variabel random dari sampel berukuran n maka mean dari sampel didefinisikan sbg:

Contoh.

Harga 1kg kopi di empat toko adalah 12,15,17 dan 20. Hitunglah rata-rata sampel dan variansinya.

Jawab

Statistik

2

1

2 )(1

1

n

kk XX

nS

  X (X-X) (X-X)^2

1 12 -4 16

2 15 -1 1

3 17 1 1

4 20 4 16

Sum 64 0 34

average 16  

11.33333

n

kkXn

X1

164

64133,1134

3

1

)(1

1 2

1

2

n

kk XX

nS

Page 7: Analisa Data Statistik Chap 8: Sampling Distribution

Variansi sampel (alternative)

Jika X1, ..,Xn adalah nilai variabel random dari sampel berukuran n maka variansi dari sampel didefinisikan sbg:

atau

Contoh

Hitung ulang variansi contoh sebelumnya dengan rumus ini.

Statistik

2

1 1

22

)1(

1 n

k

n

kkk XXn

nnS

  X X^2

1 12 144

2 15 225

3 17 289

4 20 400

Sum 64 1058

33,11641058*4)3(4

1

)1(

1

22

2

1 1

22

S

XXnnn

Sn

k

n

kkk

)1(

)( 22

nn

SnSS xxx

Page 8: Analisa Data Statistik Chap 8: Sampling Distribution

Standard Deviasi sampel

Standard Deviasi sampel S adalah akar positif dari variansi!

Soal

Berikut ini adalah IP mahasiswa angkatan 200X dari Prodi Fisika :

3.2 1.9 2.7 2.4 2.8

2.9 3.8 3.0 2.5 3.3

Hitunglah

a) Mean dan variansi sampel

b) Standard deviasi sampel

Statistik

Page 9: Analisa Data Statistik Chap 8: Sampling Distribution

Quartile adalah data yg membawa seluruh sampel menjadi 4 bagian sama besar. Dikenal 3 quartile:

a. Quartile bawah atau Quartile pertama Q1

Misal Q1 adalah Quartile bawah berarti 25% data ≤ Q1

b. Quartile tengah atau Quartile kedua Q2 = Median

Misal Q2 adalah Median berarti 55% data ≤ Q2

c. Quartile atas atau Quartile ketiga Q3

Misal Q3 adalah Quartile atas berarti 75% data ≤ Q4

Inter Quartile Range (IQR) = Q3-Q1

Cara menentukan Quartile Q1:

1. Urutkan data Xk dari nilai terendah hingga tertinggi

2. Hitung nomor urut data untuk Q1, yaitu k=n/4

Jika k bilangan bulat maka Q1 = (Xk+Xk+1)/2

Jika k tidak bulat, definisikan k’ adalah bilangan bulat terdekat di atas k, maka Q1 = Xk’

Ukuran Sebaran (Dispersi)- Quartile

Page 10: Analisa Data Statistik Chap 8: Sampling Distribution

Cara menentukan Quartile Q2:

1. Urutkan data Xk dari nilai terendah hingga tertinggi

2. Hitung nomor urut data untuk Q2, yaitu k=n/2

Jika k bilangan bulat maka Q2 = (Xk+Xk+1)/2

Jika k tidak bulat, definisikan k’ adalah bilangan bulat terdekat di atas k, maka Q2 = Xk’

Cara menentukan Quartile Q3:

1. Urutkan data Xk dari nilai terendah hingga tertinggi

2. Hitung nomor urut data untuk Q3, yaitu k=3n/4

Jika k bilangan bulat maka Q3 = (Xk+Xk+1)/2

Jika k tidak bulat, definisikan k’ adalah bilangan bulat terdekat di atas k, maka Q3 = Xk’

Ukuran Sebaran (Dispersi)- Quartile

Page 11: Analisa Data Statistik Chap 8: Sampling Distribution

Contoh. Misalkan data nilai Fisika 16 anak adalah sbb:

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

23 34 45 51 56 60 61 64 70 71 73 76 82 83 90 99

n=16

Q1: k=n/4 = 16/4 =4, maka Q1 = (X4+X5)/2 = (51+56)/2 = 53.5

Q2: k=n/2 = 16/2 =8, maka Q2 = (X8+X9)/2 = (64+70)/2 = 67

Q3: k=3n/4 = 3*16/4 =12, maka Q3 = (X12+X13)/2 = (76+82)/2 = 79

IQR = Q3-Q1 = 79-53.5 = 25.5

Quartile - Contoh

Page 12: Analisa Data Statistik Chap 8: Sampling Distribution

Outliers adalah data yg berbeda jauh dari data kebanyakan atau jauh dari mean atau median. Ada beberapa kebiasaan dalam menentukan outliers misalkan:

data di luar x ±3S di anggap outliers

data X > Q3 +1.5 IQR atau X < Q1 - 1.5 IQR

dianggap outliers

Titik ekstrem

X disebut titik extrem jika > Q3 + 3 IQR, atau

X disebut titik extrem jika < Q1 -d 3 IQR

Outliers

Page 13: Analisa Data Statistik Chap 8: Sampling Distribution

Jika C adalah persentile ke α (Pα) , artinya sebanyak α data ≤ C.

Jadi P0.5 = Median, P0.25=Q1 dan P0.75 =Q3.

Cara mencari Pα dari n buah data

1. Urutkan data

2. Hitung k = αn

Jika k bulat maka Pα = (Xk+Xk+1)/2

Jika k tak bulat, definisikan k’ bilangan bulat terdekat diatas k, maka Pα=Xk’

Persentile Pα

Page 14: Analisa Data Statistik Chap 8: Sampling Distribution

Box-Whisker Plot - Contoh

Example

No Nikotin No Nikotin No Nikotin No Nikotin

1 0.68 11 1.49 21 1.92 31 2.16

2 0.85 12 1.5 22 1.92 32 2.18

3 0.9 13 1.5 23 1.97 33 2.22

4 1.14 14 1.52 24 1.98 34 2.24

5 1.15 15 1.56 25 1.99 35 2.32

6 1.2 16 1.64 26 2 36 2.35

7 1.23 17 1.67 27 2.01 37 2.5

8 1.28 18 1.79 28 2.08 38 2.62

9 1.38 19 1.82 29 2.09 39 2.68

10 1.48 20 1.84 30 2.12 40 2.7

Berikut ini adalah kadar Nikotin dalam 40 sampel rokok yg dipelajari.

Quartilek = 40/4 = 10Q1 = (X10+X11)/2=1.485

k = 40/2 = 20Q2 = (X20+X21)/2=1.86

k = 3*40/4 = 30Q3 = (X30+X31)/2=2.14

IQR = Q3-Q1 =0.655

P0.025 =(X1+X2)/2=0.765

P0.975 = (X39+X40)/2=2.69

0.765 1.485 1.86 2.14 2.69

Page 15: Analisa Data Statistik Chap 8: Sampling Distribution

Box-Whisker Plot - Perbandingan

Page 16: Analisa Data Statistik Chap 8: Sampling Distribution

Quantile dari sampel dinyatakan oleh q(f) adalah batas nilai q yang menyatakan sebanyak fraksi f dari data bernilai kurang dari atau sama dengan q.

Jadi:

q(0.25)= Q1

q(0.5) = Q2=median

q(0.75) = Q3 dst

Quantile Plot memplot nilai data di sumbu tegak thd nilai quantile-nya

Quantile Plot

Page 17: Analisa Data Statistik Chap 8: Sampling Distribution

Data untuk Quantile plot.

Berikut ini data dari 30 sampel @5 data tentang ketebalan cat.

Quantile Plot - Example

Sampel   Sample  

1 29 36 39 34 34 16 35 30 35 29 37

2 29 29 28 32 31 17 40 31 38 35 31

3 34 34 39 38 37 18 35 36 30 33 32

4 35 37 33 38 41 19 35 34 35 30 36

5 30 29 31 38 29 20 35 35 31 38 36

6 34 31 37 39 36 21 32 36 36 32 36

7 30 35 33 40 36 22 36 37 32 34 34

8 28 28 31 34 30 23 29 34 33 37 35

9 32 36 38 38 35 24 36 36 35 37 37

10 35 30 37 35 31 25 36 30 35 33 31

11 35 30 35 38 35 26 35 30 29 38 35

12 38 34 35 35 31 27 35 36 30 34 36

13 34 35 33 30 34 28 35 30 36 29 35

14 40 35 34 33 35 29 38 36 35 31 31

15 34 35 38 35 30 30 30 34 40 28 30

Page 18: Analisa Data Statistik Chap 8: Sampling Distribution

Untuk membuat Quantile Plot.

1. Urutkan 1-150 data tsb

2. Buat frequency kumulatif dari data tsb

3. Plot Kumulatif freq vs data tsb

Tabel disamping menunjukkan sebagian

Bagian awal distribusi kumulatif.

Quantile Plot - Example

Freq Kum Data

0.006667 28

0.013333 28

0.02 28

0.026667 28

0.033333 29

0.04 29

0.046667 29

0.053333 29

0.06 29

0.066667 29

0.073333 29

0.08 29

0.086667 29

Page 19: Analisa Data Statistik Chap 8: Sampling Distribution

Quantile Plot

Quantile Plot

27

29

31

33

35

37

39

41

0 0.25 0.5 0.75 1

fraksi

Qu

anti

le

Q2Q1 Q3

Page 20: Analisa Data Statistik Chap 8: Sampling Distribution

Deteksi Penyimpangan dari Normal

Normal Quantile-Quantile PlotQuantile plot dipakai untuk

membandingkan distribusi sebuah sampel dengan distribusi teoretik.

Normal quantile-quantile plot adalah plot dari data terurut yi dengan standard normal quantile q(fi), yg didefinisikan:

q(fi) = 4.91[ f0.14 – (1-f)0.14]

Dengan fi adalah dimana i adalah nomor urut data:

4/1

8/3

n

ifi

  fi    

i (i-3/8)/(n+1/4) q Data

1 0.00416 -2.6281 28

2 0.010815 -2.2973 28

3 0.017471

-2.1

1174 28

4 0.024126

-1.9

7829 28

5 0.030782

-1.8

7247 29

6 0.037438

-1.7

8396 29

7 0.044093

-1.7

0739 29

8 0.050749

-1.6

3958 29

9 0.057404

-1.5

7849 29

10 0.06406

-1.5

2272 29

11 0.070715 -1.4713 29

12 0.077371

-1.4

2347 29

Page 21: Analisa Data Statistik Chap 8: Sampling Distribution

Normal Q-Q Plot

Normal Q-Q Plot

27

29

31

33

35

37

39

41

-3 -2 -1 0 1 2 3

Standard Normal Quantile

Qu

anti

le

Page 22: Analisa Data Statistik Chap 8: Sampling Distribution

Menarik Kesimpulan Ttg Populasi Dari Sampel

Ketika sebuah sampel random diambil dari populasi dengan rata-rata populasi μ, maka rata-rata yg diperoleh dari sampel akan berfluktuasi di sekitar rata-rata populasi.

Statistik inferensial berusaha untuk mengambil kesimpulan tentang parameter-parameter populasi berdasarkan informasi yg diperoleh dari sampel.

Distribusi Sampling

Yg dimaksud distribusi sampling adalah distribusi probabilitas dari sebuah statistik.

Jadi distribusi probabilitas dari rata-rata sampel dinamakan distribusi sampling dari rata-rata sampel

x

x

Page 23: Analisa Data Statistik Chap 8: Sampling Distribution

Distribusi Sampling dari Rata-Rata

Dari populasi terdistribusi normal dengan rata-rata μ dan variansi σ2 diambil sampel random berukuran n. Misal diperoleh rata-rata sampel tsb Bilamana diambil sampel berkali-kali masing-masing berukuran n, akan diperoleh distribusi rata-rata sampel:

Rata-rata sampel ini akan terdistribusi normal juga dengan rata-rata = μ:

yaitu rata-rata populasi dan variansi distribusi rata-rata sampelnya:

mxxxxx ,...,,,, 4321

x

nx

22

x

Page 24: Analisa Data Statistik Chap 8: Sampling Distribution

Contoh

Bolam lampu yg diproduksi sebuah pabrik terdistribusi normal dengan rata-rata umur 800 jam dan standard deviasi 40 jam. Carilah probabilitasnya bahwa sampel random 16 bolam akan memiliki rata-rata umur lampu kurang dari 775 jam.

Jawab.

Distribusi rata-rata sampel akan terdistribusi normal dengan rata-rata

dan standard deviasi

Untuk

Sehingga probabilitas P(x<775) = P(z<-2.5) = 0.0062 (tabel)

800x 1016

40

nx

5.210

800775775

X

XxZx

Page 25: Analisa Data Statistik Chap 8: Sampling Distribution

Teori Limit Pusat

Jika x adalah rata-rata dari sebuah sampel random berukuran n yg ditarik dari populasi dengan rata-rata μ dan variansi σ2, maka bentuk limit dari distribusi variabel

dengan n ∞ adalah distribusi normal standard n(z;0,1)

Ini berarti tanpa harus mengetahui bagaimanakah bentuk distribusi dari populasi, distribusi rata-rata sampelnya akan mendekati bentuk distribusi normal!

Jika populasinya mengikuti distribusi normal, tak peduli ukuran sampel distribusi rata-rata sampel akan mengikuti distribusi normal.

Tetapi jika distribusi populasinya tidak normal maka distribusi rata-rata sampel akan bagus mendekati normal jika n≥30 pada umumnya

n

xz

/

Page 26: Analisa Data Statistik Chap 8: Sampling Distribution

Ilustrasi: Teori Limit Pusat (Normalitas)

n kecil ke moderate

n besar (hampir normal)

n=1

Distribusi rata-rata sampel

rata-rata sampel

Page 27: Analisa Data Statistik Chap 8: Sampling Distribution

Aplikasi : Taksiran Rata-Rata Populasi

Jika xs adalah rata-rata dari sebuah sampel random berukuran n yg ditarik dari populasi dengan rata-rata μ dan variansi σ2, maka bentuk limit dari distribusi variabel

dengan n ∞ adalah distribusi normal standard n(z;0,1) Ini berarti tanpa harus mengetahui bagaimanakah bentuk distribusi dari

populasi, distribusi rata-rata sampelnya akan mendekati bentuk distribusi normal!

Jika populasinya mengikuti distribusi normal, tak peduli ukuran sampel distribusi rata-rata sampel akan mengikuti distribusi normal.

Tetapi jika distribusi populasinya tidak normal maka distribusi rata-rata sampel akan bagus mendekati normal jika n≥30 pada umumnya

n

xz s

/

Page 28: Analisa Data Statistik Chap 8: Sampling Distribution

Taksiran Rata-Rata Populasi

Contoh. Sebuah pabrik sparepart mobil, yg berupa silinder harus

memproduksi silindernya dengan diameter rata-rata 5.0mm. Dalam sebuah studi 100 silinder yg diproduksi dipilih secara random. Ternyata didapati rata-rata diameter sampelnya xs = 5.027mm. Diketahui bahwa standard deviasi populasi untuk diameter adalah 0.1mm. Apakah hasil dari sampel tsb mendukung statement bahwa rata-rata diameter di populasi 5.0mm?

Jawab. Pertanyaan ini akan dijawab dg jalan pemikiran demikian, jika benar

rata-rata populasi μ=5 berapakah probabilitasnya untuk mendapatkan rata-rata sampel yg berukuran 100 buah lebih dari atau sama dengan 5.027?

P(xs≥5.027) =? Zs = (Xs-μ)/(σ/√n) = (5.027-5)/(0.1/ √100) = 0.027/0.01=2.7 P(xs≥5.027) = P(Zs ≥ 2.7) =1- P(Z<2.7)= 0.0035 (dari tabel normal) Jadi probabilitasnya menemukan rata-rata sampel ≥ 5.027 hanya

0.35%. Berarti hasil studi thd sampel sangat tidak mendukung konjecture bahwa rata-rata populasi 5.0. Menurut Anda kemungkinan rata-rata populasi lebih kecil atau lebih besar dari 5.0?

Page 29: Analisa Data Statistik Chap 8: Sampling Distribution

Distribusi Sampling Selisih Dua Buah Rata-rata

Dalam membandingkan dua buah populasi maka yg dipelajari adalah selisih rata-rata dua buah populasi tsb μ1 – μ2.

Populasi 1 Populasi 2

μ1, σ1 μ2, σ2

Xs1 , S1, n1

Xs2 , S2, n2

Page 30: Analisa Data Statistik Chap 8: Sampling Distribution

Distribusi Sampling Selisih Dua Buah Rata-rata

Distribusi rata-rata sampel xs1 akan hampir normal dengan rata-rata μ1 dan variansi σ1x

2 =σ12/n1

Distribusi rata-rata sampel xs2 akan hampir normal dengan rata-rata μ2 dan variansi σ2x

2 =σ22/n2

Maka distribusi variabel selisih rata-rata sampel xs1-xs2 akan terdistribusi hampir normal juga dengan rata-rata:

μx1-x2 = μ1 – μ2

dan variansi:

σ2x1-x2 = σ1x

2 + σ2x2 = σ1

2/n1 + σ22/n2

Sehingga variabel standard Z:

Akan terdistribusi normal standard

2

22

1

21

2121 )()(

nn

xxZ ss

Page 31: Analisa Data Statistik Chap 8: Sampling Distribution

Contoh

Waktu pengeringan dua buah jenis cat disurvei. Cat jenis A diambil sampel acak 18 buah, demikian juga cat B juga diambil 18 sampel. Asumsi yg dipercaya adalah rata-rata populasi waktu pengeringan kedua jenis cat tsb adalah sama. Diketahui standard deviasi waktu pengeringannya sama yaitu 1 jam. Berapakah probabilitas mendapati bahwa waktu pengeringan sampel A akan lebih lama dari 1 jam dibandingkan sampel B dalam kasus ini?

Jawab:

Populasi: μA = μB σA = σB = 1

Sampel: nA = nB = 18

P(xsA-xsB > 1)?

Batasnya xsA-xsB =1, nilai Z yg terkait:

P(xsA-xsB > 1)= P(Z>3.0)=1-P(Z<3.0)=1-0.9987=0.0013

0.3

18

1

18

1

01)()(22

2

22

1

21

2121

nn

xxZ ss

Page 32: Analisa Data Statistik Chap 8: Sampling Distribution

Soal

Waktu hidup tabung televisi Merk A 6.5tahun, dengan standard deviasi 0.9 tahun. Sedangkan Merk B umur rata-ratanya 6.0 tahun dan standard deviasi 0.8 tahun. Berapakah probabilitasnya sampel random sebanyak 36 tabung merk A akan memiliki rata-rata umur tabung paling tidak 1 tahun lebih lama dibandingkan umur tabung yg dihitung dari sampel random merk B sebanyak 49 buah?

Page 33: Analisa Data Statistik Chap 8: Sampling Distribution

Distribusi Sampling Variansi S2

Bilamana ingin dipelajari variasi dari data maka fokus studi adalah pada distribusi variansi sampel S2 untuk mendapatkan kesimpulan tentang variansi populasi σ2.

Sampel random berukuran n diambil dari populasi normal dengan rata-rata μ dan variansi σ2. Diperolah bahwa variansi sampel S2. Maka statistik :

Akan memiliki distribusi chi-squared dengan derajat kebebasan ν=n-1.

n

k

k XXSn

12

2

2

22 )()1(

Page 34: Analisa Data Statistik Chap 8: Sampling Distribution

Distribusi Chi-Squared

Ditabelkan nilai variabel χ2 yang terkait dengan luas (α) ekor kanan dari distribusi chi-squared untuk berbagai derajat kebebasan.

2

22 )1(

Sn

χ2χα2

α

Page 35: Analisa Data Statistik Chap 8: Sampling Distribution

Tabel Distribusi Chi-Squared

Tabel nilai kritikal χ2α yang terkait dengan luas (α) ekor kanan dari

distribusi chi-squared untuk berbagai derajat kebebasan (v)

Page 36: Analisa Data Statistik Chap 8: Sampling Distribution

Contoh.

Pabrik aki menggaransi bahwa aki-nya tahan rata-rata 3 tahun dengan standard deviasi 1 tahun. Misalkan bahwa umur aki mengikuti distribusi normal. Diambil sampel acak 5 buah aki, dan ternyata umurnya 1.9, 2.4, 3.0, 3.5 dan 4.2 tahun. Periksalah apakah klaim pabrik bahwa standard deviasinya 1 tahun valid?

Jawab.

Pertama hitung variansi sampel:

2

1 1

22

)1(

1 n

k

n

kkk XXn

nnS

X X2

1.9 3.61

2.4 5.76

3 9

3.5 12.25

4.2 17.64

SUM 15 48.26

Sum^2 225  

S2= (nSxx- Sx^2)/(n*n-1)

S2= 0.815

Pabrik aki menggaransi bahwa aki-nya tahan rata-rata 3 tahun dengan standard deviasi 1 tahun. Misalkan bahwa umur aki mengikuti distribusi normal. Diambil sampel acak 5 buah aki, dan ternyata umurnya 1.9, 2.4, 3.0, 3.5 dan 4.2 tahun. Periksalah apakah klaim pabrik bahwa standard deviasinya 1 tahun valid?

Jawab.

Pertama hitung variansi sampel:

815.01526.48*5)15(5

1 22

S

26.31

815.0*)15()1(22

22

Sn

Page 37: Analisa Data Statistik Chap 8: Sampling Distribution

Contoh.

Dari tabel kita melihat bahwa jika derajat kebebasan v=4, maka 95% dari nilai-nilai χ2 akan berada diantara :

χ2χ0..9752

2.5%2.5%

χ0..0252

95%

Dari tabel χ20.025 (v=4) = 11.143

Dari tabel χ20.975 (v=4) = 0.484

Dengan σ2=1 dan v=4 ternyata terdapat probabilitas 95% bahwa S2 akan terletak antara 0.484 dan 11.143. Ternyata perhitungan menghasilkan sampel kita memiliki nilai χ2=3.26, Jadi sampel mendukung klaim bahwa variansi populasi =1.

Page 38: Analisa Data Statistik Chap 8: Sampling Distribution

Sampel Kecil: Student’s t Distribution

Pada banyak kasus sering dijumpai tidak tersedia informasi tentang varia,nsi populasi, sehingga dipergunakan variansi yg berasal dari sampel sebagai pengganti S. Bilamana sampel berukuran besar (n≥30) maka penggantian σ dengan S cukup baik dan kita bisa mempergunakan variabel normal Z spt biasa dalam perhitungan:

Jikalau sampel kecil (n<30) maka S2 akan berfluktuasi cukup besar dari sampel ke sampel sehingga perlu statistik yg lebih baik. Jika sampel kecil akan tetapi berasal dari distribusi normal, maka statistik T berikut ini:

nS

XZ

/

nS

XT

/

Page 39: Analisa Data Statistik Chap 8: Sampling Distribution

Sampel Kecil: Student’s t Distribution

Variabel T tsb akan mengikuti distribusi probabilitas yg disebut Distribusi Student T (Student adalah nama samaran dari penemu distribusi ini yg bernama Gosset), dengan derajat kebebasan v=n-1. Distribusi ini bentuknya serupa sekali dengan distribusi normal: rata-rata=0 dan bentuknya simetrik. Akan tetapi untuk sampel kecil maka ekor distribusinya lebih tinggi dibandingkan distribusi normal, jadi bentuknya ditentukan oleh derajat kebebasan.

t0

ν=∞

ν=2

Page 40: Analisa Data Statistik Chap 8: Sampling Distribution

Tabel Student’s t Distribution

Tabel distribusi student diberikan untuk nilai kritis t yg terkait dengan luas ekor kanan dari distribusi t, untuk berbagai nilai derajat kebebasan yg berbeda.

Page 41: Analisa Data Statistik Chap 8: Sampling Distribution

Contoh.

Seorang peneliti menyatakan rata-rata hasil panen setelah diberi pupuk adalah 500 gram per mm pupuk yg diberikan. Dia kemudian mengambil sampel 25 batch panen, dan memutuskan dia akan puas dengan klaimnya jikalau ternyata nilai t dari sampel terletak antara –t0.05 s/d t0.05. Peneliti tsb mengasumsikan bahwa bobot hasil panen mengikuti distribusi normal. Ternyata sampelnya memiliki rata-rata 518 gram dengan standard deviasi sampel 40. Apakah dia akan puas dengan klaimnya?

Jawab.

Ini adalah persoalan distribusi student t. Ukuran sampel n=25, sehingga derajat kebebasan ν=n-1=25-1=24. Dari tabel diketahui bahwa untuk v=24, maka t0.05 = 1.711, sedangkan hasil sampelnya memberikan

25.225/40

500518

/

nS

XT

Page 42: Analisa Data Statistik Chap 8: Sampling Distribution

Kegunaan Distribusi Student t

Distribusi student t biasanya digunakan dalam:

1. Kesimpulan ttg rata-rata populasi

2. Perbandingan antara dua buah rata-rata sampel

3. dll

Page 43: Analisa Data Statistik Chap 8: Sampling Distribution

Distribusi F

Salah satu perbandingan yg dilakukan dalam statistik adalah perbandingan variabilitas atau variansi dari dua buah sampel. Statistik yg dipergunakan dalam membandingkan variansi 2 buah sampel dinamakan distribusi F.

Jika S12 dan S2

2 adalah variansi dari 2 buah sampel random yg tak saling bergantung (independen) dengan ukuran n1 dan n2 yg diambil dari populasi normal dengan variansi σ1

2 dan σ22, maka statistik F:

Mengikuti distribusi F dengan derajat kebebasan v1=n1-1 dan v2=n2-1. Distribusi F bersifat asimetrik . bentuknya bergantung pada derajat kebebasannya

22

22

21

21

/

/

S

SF

Page 44: Analisa Data Statistik Chap 8: Sampling Distribution

Perbandingan Variansi: Distribution F

f0

ν=(10,30)

ν=(6,10)

fα0

α

Jika fα (v1,v2) menyatakan nilai kritis f dengan luas ekor kanan α untuk derajat kekebasan v1,v2, maka: (perhatikan urutan v1 dan v2)

),(

1),(

21121

ff

Page 45: Analisa Data Statistik Chap 8: Sampling Distribution

Tabel Distribusi F

Karena ada dua derajat kebebasan yg menentukan bentuk Distribusi F maka, tabel distribusi lebih terbatas, hanya ditabelkan nilai kritis F untuk beberapa nilai luas ekor kanan yg populer dipakai (misalnya α=5%)

Page 46: Analisa Data Statistik Chap 8: Sampling Distribution

Kegunaan Distribusi F

Nanti distribusi F akan dipakai untuk memeriksa kesamaan rata-rata dari beberapa grup sampel yg diambil secara independen. Ada dua faktor yg akan menentukan apakah perbedaan rata-rata sampel memang nyata atau tidak yaitu:

1. Variasi di dalam sampel (within)

2. Variasi antar sampel (between)

XX1 X2 X3