Top Banner
Pengukuran Dispersi 1 Menjelaskan Data
54
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Statistik 1 3 dispersi

Pengukuran Dispersi

1

Menjelaskan Data

Page 2: Statistik 1 3 dispersi

Buku Teks

2

Lind, Marchal and Wathen, 2005, Statistical Techniques in Business & Economics, 12th Ed., McGraw Hill, Irwin.

Page 3: Statistik 1 3 dispersi

Pengukuran Dispersi

3

Mengapa perlu mempelajari Dispersi?Pengukuran Range, Deviasi Rata-rata, Varians dan

Standar Deviasi, dan Koefisien VariasiPengukuran Kemencengan (Skewness)Pengukuran Kurtosis (Peakedness)Pengukuran Kuartil, Desil, dan Persentil

Page 4: Statistik 1 3 dispersi

Mengapa perlu mempelajari Dispersi?

4

Pengukuran nilai sentral (e.g. mean, modus, median) hanya menjelaskan pusat data, tidak menjelaskan sebaran data.

Dispersi dapat dipergunakan untuk membandingkan sebaran pada dua distribusi data atau lebih.

Page 5: Statistik 1 3 dispersi

Pengukuran Range (Rentang/ Jangkauan)

5

Range (Rentang/ Jangkauan) adalah perbedaan antara terbesar dan nilai terkecil.

Range = H - L

Hanya dua nilai yang digunakan dalam perhitungan.Sangat dipengaruhi oleh nilai ekstrem.Mudah untuk dihitung dan dimengerti.

Page 6: Statistik 1 3 dispersi

Deviasi Rata-rata (Mean Deviation)

Deviasi Rata-Rata (Mean Deviation) adalah rata-rata arimatik/hitung dari nilai absolut deviasi terhadap nilai rata-rata aritmatik/hitung.

Semua nilai yang digunakan dalam perhitungan.Tidak terlalu banyak dipengaruhi oleh nilai-nilai yang

besar atau kecil.Nilai absolut sulit untuk dimanipulasi.

nX-X Σ

=MD

Mean deviation juga disebut Mean Absolute Deviation (MAD).

Page 7: Statistik 1 3 dispersi

Contoh 1

7

Berat sampel peti-peti berisi buku untuk toko buku (dalam Kg) adalah:

103, 97, 101, 106, 103Tentukan rentang dan deviasi rata-rata-nya.

Range = 106 – 97 = 9

Page 8: Statistik 1 3 dispersi

Contoh 1

8

Langkah pertama adalah menentukan rata-rata berat kotak tsb:

Deviasi rata-rata-nya adalah:

102=5

510=

nΣX

=X

Σ X - X 12MD= = = 2.4n 5

x |x-xbar|103 197 5

101 1106 4103 1510 12

Page 9: Statistik 1 3 dispersi

Varians & Standar Deviasi

9

Varians adalah rata-rata aritmatik/hitung dari kuadrat deviasi rata-rata.

Standar Deviasi adalah akar kuadrat dari Varians.

Page 10: Statistik 1 3 dispersi

Varians Populasi

10

Varians populasi adalah rata-rata aritmetik/hitung dari kuadrat deviasi terhadap rata-rata populasi.

Semua nilai yang digunakan dalam perhitungan.Lebih cenderung dipengaruhi oleh nilai-nilai ekstrim

dibandingkan dengan deviasi rata-rata.

Page 11: Statistik 1 3 dispersi

Varians

11

Rumus untuk Varians Populasi adalah:

Rumus untuk Varians Sampel adalah:N

μ)-Σ(X=σ2

2

1-n)X-Σ(X

=s2

2

Catatan dalam rumus varians sampel jumlah deviasi dibagi oleh (n-1) bukan n. Walaupun secara logis seharusnya menggunakan n bukan (n-1), pembagian dengan (n-1) menghasilkan estimator yang tidak bias terhadap varians populasi, sedangkan pembagian menggunakan n menghasilkan estimator yang bias.

Page 12: Statistik 1 3 dispersi

Untuk memudahkan hitungan manual:

12

( ) ( )

( )

( )

2

2 2

2

2

2

2

2

1

1

XX X X

n

X Xs

n

XX

nsn

− = −

−=

−=

∑∑ ∑∑

∑∑

Page 13: Statistik 1 3 dispersi

Contoh 2

13

Usia masing-masing anggota keluarga Pak Arman adalah sbb:

2, 18, 34, 42 Berapa varians populasi-nya?

24=496

=n

ΣX=μ

22 Σ(X- μ) 944σ = = = 236

N 4

x x- µ (x- µ)2

2 -22 484

18 -6 36

34 -10 100

42 18 324

Σ=96 Σ=944

Page 14: Statistik 1 3 dispersi

Standar Deviasi Populasi

14

Standar Deviasi populasi (σ) adalah akar kuadrat dari varians populasi.

Untuk Contoh 2, Standar Deviasi populasi-nya adalah 15.36, diperoleh dari:

15.36=236=σ=σ 2

Page 15: Statistik 1 3 dispersi

Contoh 3 Untuk data Sampel

15

Upah per jam yang diperoleh dari sampel lima pekerja adalah:

$7, $5, $11, $8, $6.

Hitunglah varians dari data tsb.

7.40=537

=n

ΣX=X

x x- x bar (x- x bar)2

7 -0.4 0.16

5 -2.4 5.76

11 3.6 12.96

8 0.6 0.36

6 -1.4 1.96

Σ=37 Σ=21.2

( )2

2Σ X- X 21.2s = = = 5.30

n-1 5-1

Page 16: Statistik 1 3 dispersi

Standar Deviasi Sample

16

Standar deviasi sampel adalah akar kuadrat dari varians sampel.

In Contoh 3, standar deviasi sample adalah 2.30

2.30=5.29=s=s 2

Page 17: Statistik 1 3 dispersi

Variance

Ungrouped Data• Population

• Sample

Grouped Data• Population

Sample

( )

( )

2

2

2

2

2

X

N

XX

NN

µσ

σ

−=

−=

∑∑

( )

( )

1

12

2

2

2

2

−=

−−

=

∑ ∑

nn

XX

s

n

XXs

( )

( )

2

2

2

2

2

f X

N

fXfX

NN

µσ

σ

−=

−=

∑∑

( )

( )

1

12

2

2

2

2

−=

−−

=

∑ ∑

nn

fXfX

s

n

XXfs

Page 18: Statistik 1 3 dispersi

Standard Deviation

Ungrouped Data• Population

• Sample

Grouped Data• Population

Sample

( )

( ) ( )

2

2

2

X

N

XX

NN

µσ

σ

−=

−=

∑∑

( )

( ) ( )

2

2

2

if X

N

fXfX

NN

µσ

σ

−=

−=

∑∑

( )

( ) ( )

1

12

2

2

−=

−−

=

∑∑

nn

XX

s

n

XXs

( )

( ) ( )

1

12

2

2

−=

−−

=

∑∑

nn

fXfX

s

n

XXfs

Page 19: Statistik 1 3 dispersi

Sebuah sampel yang terdiri dari sepuluh bioskop di Surabaya dihitung jumlah film yang diputar minggu lalu. Hitunglah varian dan standar deviasinya.

Jumlah f i lm yang diputar

f requency f

1 up t o 3 1

3 up t o 5 2

5 up t o 7 3

7 up t o 9 1

9 up t o 11 3

Total 10

Page 20: Statistik 1 3 dispersi

Movies show ing

f class midpoint

x

( f .x) x-xbar f*(x-xbar)^2

1 up t o 3 1 2 2 -4.6 21.16 3 up t o 5 2 4 8 -2.6 13.52 5 up t o 7 3 6 18 -0.6 1.08 7 up t o 9 1 8 8 1.4 1.96

9 up to 11 3 10 30 3.4 34.68 Total 10 66 72.40

( ) 2

2 72.408.04

1 10 1

f X Xs

n

−= = =

− −∑

2 8.04 2.83s s= = =

Page 21: Statistik 1 3 dispersi

Interpretasi dan Penggunaan Standar Deviasi

21

Teorema Chebyshev : untuk setiap kelompok pengamatan (baik sampel maupun populasi), proporsi minimum nilai-nilai yang terletak dalam standar deviasi rata-rata k sekurang-kurangnya adalah:

dimana k2 adalah konstanta yang lebih besar dari 1.

2k1-1

Page 22: Statistik 1 3 dispersi

Contoh:Rata-rata hitung harga sepatu Nike adalah $51.54 dengan standar deviasi $7.51. Setidaknya berapa persen harga yang berada antara plus 3.5 standar deviasi dan minus 3.5 standar deviasi dari rata-rata?

Sekitar 92%

10.92

(3.5) 12.25= = =2 2

1 11- 1-k

Page 23: Statistik 1 3 dispersi

Teorema Chebyshev

K Coverage1 0%2 75.00%3 88.89%4 93.75%5 96.00%6 97.22%

Teorema Chebyshev: Untuk semua jenis pengamatan, proposi minimum nilai yang terletak dalam kisaran standar deviasi rata-rata k sekurang-kurangnya adalah 1- 1/k2

Ingat: semakin kecil standar deviasi, menunjukkan bahwa pengamatan berada didekat rata-rata, vice versa.

Page 24: Statistik 1 3 dispersi

Interpretasi dan Penggunaan Standar Deviasi

24

Aturan Empiris: Untuk setiap distribusi yang simetris & berbentuk lonceng (bell-shaped) :Sekitar 68% observasi akan berada pada plus dan minus 1 standar

deviasi rata-rata, Sekitar 95% observasi akan berada pada plus dan minus 2 standar

deviasi rata-rata, Dalam prakteknya, hampir semua observasi berada dalam plus

dan minus 3 standar deviasi rata-rata.

Aturan Empiris juga disebut sebagai Aturan normal.

Page 25: Statistik 1 3 dispersi

25µ−3σ µ−2σ µ−1σ µ µ+1σ µ+2σ µ+ 3σ

Kurva Berbentuk Lonceng menunukkan hubungan antara σ dan μ

Page 26: Statistik 1 3 dispersi

Mengapa perlu memperhatikan dispersi?

26

Dispersi dipergunakan sebagai salah satu ukuran risiko. Bandingkan dua aset dengan rata-rata expected return

yang sama:-2%, 0%,+2%-4%, 0%,+4%

Dispersi return aset kedua lebih besar dibandingkan yang pertama. Dengan demikian, aset kedua yang lebih berisiko.

Hal ini menunjukkan bahwa dispersi sangat penting untuk keputusan investasi, disamping informasi rata-rata expected return .

Page 27: Statistik 1 3 dispersi

Dispersi RelatifKoefisien Variasi adalah rasio dari standar deviasi terhadap rata-

rata aritmatik, dinyatakan dalam persentase:

CV: coefficient of variations: standar deviasix-bar: rata-rata

Berguna untuk membandingkan dua atau lebih distribusi yang:Datanya memiliki satuan /unit yang berbeda (misalnya: hari dan Rupiah)Datanya memiliki satuan / unit yang sama, tetapi rata-ratanya sangat jauh

berbeda (misal: gaji direktur dengan gaji buruh kasar)

(100%)Xs

=CV

Page 28: Statistik 1 3 dispersi

Contoh

28

Sebuah studi tentang bonus dan lama bekerja menghasilkan informasi statistik sebagai berikut:

Rata-rata bonus: $200, standar deviasi bonus: $40Rata-rata lama bekerja: 20 tahun, standar deviasi: 2 tahunBandingkan kedua distribusi tersebut (ingat masing-masing memiliki satuan yang

berbeda) Digunakan koefisien variasi:

Untuk Bonus:

Untuk lama bekerja

Dispersi untuk bonus lebih besar dibanding rata-ratanya.

40

200

sCV= (100%) = (100%) = 20%X

2

20

sCV= (100%) = (100%) = 10%X

Page 29: Statistik 1 3 dispersi

Skewness (Kemencengan/ asimetris) α3

Skewness (Kemencengan/ asimetris) adalah pengukuran dari kurangnya simetri pada distribusi.

Koefisien skewness (kemencengan) dapat berkisar dari -3,00 (asimetris negatif) sampai 3,00 (asimetris positif).

Nilai 0 menunjukkan distribusi yang simetris.Koefisien Kemencengan ini dihitung sebagai berikut:

Pearson:

Software:

Smedian)-x3(

=sk

−∑3

s

xx

2)-1)(n-(nn=sk

Page 30: Statistik 1 3 dispersi

SkewnessSk = 0 (symmetric)Sk = + (positively skewed)Sk = - (negatively skewed)Croxton & Cowden -3 ≤ Sk ≤ 3

Page 31: Statistik 1 3 dispersi

Cont..Bowley :

SkB = 0 symmetric (Q2-Q1 = Q3-Q2)SkB = + positively skewed

(Q2-Q1 < Q3-Q2)SkB = - negatively skewed

(Q2-Q1 > Q3-Q2)SkB = ± 0,1 (not significantly skewed) SkB > ± 0,3 (significantly skewed)

( ) ( )( ) ( )1223

1223

QQQQ

QQQQS

Bk −+−−−−=

Page 32: Statistik 1 3 dispersi

Cont..Relative skewness :

Ungrouped data :

Grouped data :

Karl Pearson : α3 ≥ ± 0,5Kenny & Keeping :

-2 ≤ α3 ≤ 2 (moderately skewed)α3 ≥ ± 2 (significantly skewed)

( )3

3

3

1

s

XXn∑ −=α

( )3

3

3

1

s

XXfn∑ −=α

Page 33: Statistik 1 3 dispersi

Skewness for Grouped DataPenjualan f Xi f (Xi - X ) ^3

20-30 4 25 -101,648.74

30-40 7 35 -51,109.69

40-50 8 45 -6,644.67

50-60 12 55 2.59

60-70 9 65 10,719.14

70-80 8 75 69,934.53

80-90 2 85 57,305.23

Total 50 -21,441.60

( )10,0

18,16

60,441.21501

33 −=−

Page 34: Statistik 1 3 dispersi
Page 35: Statistik 1 3 dispersi

Kurtosis (Peakedness)� Kurtosis

Ukuran ketinggian distribusi frekuensiPlatykurtic (relatif datar dan menyebar)Mesokurtic (normal)Leptokurtic (tinggi dan tipis)

Page 36: Statistik 1 3 dispersi

Kurtosis (1)

3 . 72 . 92 . 11 . 30 . 5- 0 . 3- 1 . 1- 1 . 9- 2 . 7- 3 . 5

7 0 0

6 0 0

5 0 0

4 0 0

3 0 0

2 0 0

1 0 0

0

X

Frequency

Platykurtic - flat distribution

Page 37: Statistik 1 3 dispersi

Kurtosis (2)

43210- 1- 2- 3- 4

5 0 0

4 0 0

3 0 0

2 0 0

1 0 0

0

X

Frequency

Mesokurtic – tidak terlalu datar & tidak terlalu tinggi (normal)

Page 38: Statistik 1 3 dispersi

Kurtosis (3)

Leptokurtic – distribusi yang tinggi

1 00- 1 0

2 0 0 0

1 0 0 0

0

Y

Frequency

Page 39: Statistik 1 3 dispersi

Kurtosis (Peakedness)

Formula :Ungrouped data :

Grouped data :

Note :α4 = 3 normal/mesokurtic

α4 = > 3 leptokurtic

α4 = < 3 platykurtic

( )4

4

4

1

s

XXn∑ −=α

( )4

4

4

1

s

XXfN∑ −=α

Page 40: Statistik 1 3 dispersi

Peakedness for Grouped DataPenjualan f Xi f . Xi f (Xi - X ) ^4

20-<30 4 25 100.00 2,988,472.84

30-<40 7 35 245.00 991,527.95

40-<50 8 45 360.00 62,459.92

50-<60 12 55 660.00 1.56

60-<70 9 65 585.00 113,622.93

70-<80 8 75 600.00 1,440,651.28

80-<90 2 85 170.00 1,753,540.10

Total 50 2,720.00 7,350,276.56

( )15,2

18,16

56,276.350.7501

44 ==α

Page 41: Statistik 1 3 dispersi

Kuarti l , Desil , dan Persentil

42

Fraktil adalah nilai-nilai data yang membagi seperangkat data yang telah terurut menjadi beberapa bagian yang sama.

Kuartil: membagi sekelompok observasi/ pengamatan yang telah diurutkan dari kecil ke besar menjadi 4 bagian yang sama.

(Q1: 25%, Q2: 50%, Q3: 75%)

Desil: membagi sekelompok observasi/ pengamatan yang telah diurutkan dari kecil ke besar menjadi 10 bagian yang sama.

Persentil: membagi sekelompok observasi/ pengamatan yang telah diurutkan dari kecil ke besar menjadi 100 bagian yang sama.

Page 42: Statistik 1 3 dispersi

Lokasi Persentil

43

Lokasi persentil dapat ditentukan dengan rumus sbb:

Lp : Lokasi persentil yang dicarin : jumlah pengamatanP: Persentil yang dicari

100P1)(n=Lp +

Page 43: Statistik 1 3 dispersi

Contoh 5

44

Quality Control pabrik selai kacang DK mencatat data berat 9 botol selai yang diproduksi dalam satu jam terakhir:

7,69 7,72 7,8 7,86 7,90 7,94 7,97 8,06 8,09

Tentukan Kuartil pertama.Tentukan Persentil ke-67.

Page 44: Statistik 1 3 dispersi

Contoh 5 continued

45

7,69 7,72 7,8 7,86 7,90 7,94 7,97 8,06 8,09

Kuartil pertama:

Kuartil pertama berada pada urutan ke-2.5 (antara data ke-2 dan ke-3):

7,72 + [(7,8-7,72)*0.5)= 7,72 + 0.04 = 7.76

Persentil ke-67:

Persentil ke-67 berada pada urutan ke-6.70 (antara ke-6 & ke-7):

7,94 + [(7.97-7,94)*0.7]= 7.94 + 0.02 = 7.96

2.5100251)(9=L25 =+

+ =6767L = (9 1) 6.70

100

Page 45: Statistik 1 3 dispersi

Untuk data yang dikelompokkan, urutan:

1. Susun Distribusi Frekuensi Kumulatif2. Tentukan Lokasi Persentil:

Lokasi Persentil Lp = n . P . 100

3. Gunakan formula sbb:

Persentil : P = L + ( n. P/100 - CF) . i fp

Pi = Persentil ke-i.L = Batas bawah kelas persentiln = Jumlah frekuensi.CF = Frekuensi kumulatif sebelum kelas Persentil f = Frekuensi kelas persentili = Interval kelas

Page 46: Statistik 1 3 dispersi

ContohTentukan Kuartil pertama (P25) dari data berikut:

Lokasi Persentil: 10*25/100= 2.5 kelas 3-5P25 = 3 + [(2.5 – 1)/2] * 2

= 4.5

Jumlah f i lm yg diputar

Frekuensi Frekuensi Kumulat if

1 up t o 3 1 1

3 up t o 5 2 3

5 up t o 7 3 6

7 up t o 9 1 7

9 up t o 11 3 10

Page 47: Statistik 1 3 dispersi

Jangkauan (Rentang) Interkuartil

48

Rentang interkuartil adalah jarak antara kuartil ketiga Q3 dan kuartil pertama Q1.

Rentang ini akan mencakup nilai tengah 50 persen dari pengamatan.

Rentang Interkuartil= Q3 - Q1

Page 48: Statistik 1 3 dispersi

Contoh 6

49

Untuk sekelompok observasi, Q3 adalah 24 dan Q1 adalah 10. Berapa rentang kuartilnya?

Rentang interkuartil: 24 - 10 = 14. Lima puluh persen dari observasi berada antara 10 dan 24.

Page 49: Statistik 1 3 dispersi

Others DispersionQuartile Deviation :

Coefficient of Quartile Variation :2

13 QQQ

−=δ

( )

dQ M

QQ

V 213 −

=13

13

QQ

QQVQ +

−=

Page 50: Statistik 1 3 dispersi

Data ekstrim (outliers)

51

Data ekstrim: nilai yang tidak konsisten dengan keseluruhan data. Yakni data yang lebih besar dari 1,5 jangkauan interkuartil (Q3-Q1) dan lebih kecil dari Q1 atau lebih besar dari Q3.

Outlier (Ekstrim) kecil: x < Q1 – 1.5 (Q3-Q1)

Outlier (Ekstrim) besar: x > Q3 + 1.5 (Q3-Q1)

Page 51: Statistik 1 3 dispersi

Contoh

Berikut ini data total pengeluaran mahasiswa selama 1 bulan (dalam ribuan):

Q1= 175, Q2= 350, Q3= 930, min: 0, Max: 1750

apakah ada outlier dalam data ini?

Outlier (Ekstrim) kecil:

x < 175 – 1.5 (930-175)

x < - 957.5Outlier (Ekstrim) besar:

x > 930 + 1.5 (930-175)

x > 2062.5

Oleh karena data min: 0 & max: 1750, maka tidak ada data outlier.

Page 52: Statistik 1 3 dispersi

Box Plots

53

Box plot adalah tampilan grafis, yang didasarkan pada kuartil, yang membantu untuk menggambarkan satu set data.

Ada 5 data yang diperlukan untuk menyusun sebuah box plot:

1. Nilai Minimum,2. Kuartil Pertama, 3. Median, 4. Kuartil Ketiga, 5. Nilai Maksimum.

Page 53: Statistik 1 3 dispersi

Contoh 7

54

Berdasarkan sampel dari 20 pengiriman, Buddy's Pizza memperoleh informasi berikut. Waktu pengiriman minimum adalah 13 menit dan maksimal 30 menit. Kuartil pertama adalah 15 menit, median 18 menit, dan kuartil ketiga 22 menit. Susun box plot untuk pengiriman tersebut.

Page 54: Statistik 1 3 dispersi

Contoh 7 continued

55

12 14 16 18 20 22 24 26 28 30 32

min max

median

Q1 Q3