-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
0
BAHAN AJAR
STATISTIKA INFERENSIAL
KODE MATA KULIAH MAT 201
ROMBEL 410140-03 410140-04 410140-05 410140-06 410140-07
Semester Gasal 2011/2012
Disusun Oleh Putriaji Hendikawati, S.Si., M.Pd., M.Sc.
Jurusan Matematika Fakultas Matematika dan Ilmu Pengetahuan
Alam
Universitas Negeri Semarang 2011
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
1
DAFTAR ISI
BAB I PENAKSIRAN PARAMETER
1. Pengertian Penaksiran
2. Menaksir Rata-rata 3. Menaksir Proporsi 4. Menaksir Simpangan
Baku 5. Menaksir Selisih Rata-Rata
6. Menaksir Selisih Proporsi
BAB II PENGUJIAN HIPOTESIS
1. Pendahuluan
2. Dua Macam Kekeliruan
3. Langkah Pengujian Hipotesis
4. Uji Hipotesis Rata-Rata
5. Uji Hipotesis Proporsi
6. Uji Hipotesis Varians
7. Uji Hipotesis Kesamaan Dua Rata-Rata
8. Uji Hipotesis Kesamaan Dua Proporsi
9. Uji Hipotesis Kesamaan Dua Varians
10. Uji Homogenitas Varians Populasi
BAB III ANALISIS VARIANS
BAB IV ANALISIS REGRESI
BAB V ANALISIS KORELASI
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
2
BAB I
PENAKSIRAN PARAMETER
1. Pengertian Penaksiran Statistika digunakan untuk menyimpulkan
populasi.
Kelakuan populasi dipelajari berdasarkan data yang diambil baik
secara
sampling maupun sensus. Namun, karena berbagai faktor untuk
menyimpulkan populasi diambil sebuah sampel yang representatif
kemudian
berdasarkan hasil analisis terhadap data sampel, kesimpulan
mengenai
populasi dibuat.
Kelakuan populasi yang akan diamati adalah mengenai parameter
populasi
dan sampel yang digunakan adalah sampel acak. Data sampel
dianalisis, nilai-
nilai yang perlu yaitu statistik dihitung dan berdasarkan
nilai-nilai statistik
dapat disimpulkan bagaimana parameter bertingkah laku.
Cara pengambilan kesimpulan tentang parameter sehubungan dengan
cara-
cara menaksir harga parameter. Harga parameter yang sebenarnya
tetapi tidak
diketahui nilainya tersebut akan ditaksir berdasarkan statistik
sampel yang
diambil dari populasi yang bersangkutan.
Parameter populasi yang akan ditaksir pada bab ini adalah
rata-rata,
simpangan baku dan proporsi.
Secara umum parameter populasi akan diberi simbol (baca: theta).
Jadi bisa merupakan rata-rata , simpangan baku , proporsi dan
sebagainya. Jika tidak diketahui harganya, ditaksir oleh harga
(baca: theta topi), maka dinamakan penaksir.
Sangat diharapkan = , yaitu penaksir dapat mengatakan harga
parameter yang sebenarnya. Namun, keinginan ini dapat dikatakan
terlalu ideal.
Kenyataan yang sering terjadi adalah:
a. menaksir oleh terlalu tinggi, atau
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
3
b. menaksir oleh terlalu rendah.
Kriteria untuk memperoleh penaksir yang baik yaitu: takbias,
memiliki varians
minimum dan konsisten.
a. penaksir dikatakan penaksir takbias jika rata-rata semua
harga yang mungkin akan sama dengan , ditulis ( ) =E . Penaksir
yang tidak takbias disebut penaksir bias.
b. penaksir bervarians minimum ialah penaksir dengan varians
terkecil
diantara semua penaksir untuk parameter yang sama. Jika 1 dan 2
dua penaksir untuk , jika varians 1 < varians 2 , maka 1
merupakan penaksir bervarians minimum.
c. Misalkan penaksir untuk yang dihitung berdasarkan sebuah
sampel acak berukuran n. Jika ukuran sampel n makin besar mendekati
ukuran
populasi menyebabkan mendekati , maka disebut penaksir
konsisten.
d. Penaksir yang takbias dan bervariansi minimum dinamakan
penaksir
terbaik.
Jika harga parameter ditaksir oleh tertentu, maka dinamakan
penaksir atau tepatnya titik taksiran (estimasi titik).
Misalkan akan ditaksir rata-rata tinggi mahasiswa jurusan
matematika Unnes.
Maka diambil sebuah sampel acak, kemudian data sampel
dikumpulkan lalu
dihitung rata-ratanya. Misalkan diperoleh x = 160 cm. Jika 160
cm ini
digunakan untuk menaksir rata-rata tinggi mahasiswa jurusan
matematika
Unnes, maka 160 adalah titik taksiran untuk rata-rata tinggi
mahasiswa
matematika Unnes.
Secara umum x adalah penaksir atau titik taksiran untuk .
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
4
Titik taksiran untuk suatu parameter , harganya akan berlainan
tergantung pada harga x yang diperoleh dari sampel yang diambil,
sehingga hasilnya
kurang meyakinkan atau kurang dapat dipercaya. Untuk itu
digunakan interval
taksiran atau selang taksiran, yaitu menaksir harga parameter di
antara batas
dua harga.
Dalam prakteknya harus dicari interval taksiran yang sempit
dengan derajat
kepercayaan yang memuaskan. Derajat kepercayaan menaksir,
disebut
koefisien kepercayaan, merupakan pernyataan dalam bentuk
peluang.
Jika koefisien kepercayaan dinyatakan dengan (baca: gamma), maka
10
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
5
2. Menaksir Rata-rata Misalkan dipunyai populasi berukuran N
dengan rata-rata dan simpangan baku . Dari populasi ini akan
ditaksir parameter rata-rata . Untuk itu ambil sebuah sampel acak
berukuran n, hitung satatistik yang diperlukan yaitu
x dan s . Titik taksiran untuk rata-rata adalah x . Dengan kata
lain, nilai ditaksir oleh harga x yang diperoleh dari sampel. Untuk
memperoleh taksiran yang tinggi derajat kepercayaannya,
digunakan
interval taksiran atau selang taksiran disertai nilai koefisien
kepercayaan yang
dikehendaki.
a. Simpangan baku diketahui dan populasi berdistribusi normal
Rumus (I.1) menjadi:
(I.2) =
+
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
6
Untuk interval kepercayaannya:
(I.5) nstx
nstx pp .. +
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
7
Penyelesaian
Diketahui x = 68,6
= 5,75 = 95% = 0,95
21 475,0= 475,0z = 1,96
a. Sampel n = 30 %51000
30 =Nn
n
zxn
zx .. 2121 +
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
8
3. Menaksir Proporsi Misalkan sebuah sampel acak berukuran n
diambil dari populasi binomial
berukuran N dimana terdapat proporsi untuk peristiwa A yang ada
dalam populasi tersebut. Jika terdapat x peristiwa A, sehingga
proporsi sampel untuk
peristiwa A = nx . Jadi titik taksiran untuk adalah nx .
Digunakan pendekatan oleh distribusi normal kepada binomial
untuk ukuran
sampel n cukup besar.
Rumus 100 % keyakinan untuk interval kepercayaan adalah
(I.8) npqzp
npqzp ..
21
21 +
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
9
( ) ( )( ) ( ) ( )( )100
4,06,0.96,16,0100
4,06,0.96,16,0 +
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
10
Contoh
Dari sebuah populasi yang berdistribusi normal, diambil sampel
yang representatif
dan diperoleh simpangan baku sebesar 6 dengan ukuran sampel 31.
Dengan
koefisien kepercayaan 99%, taksirlah interval dari simpangan
baku populasi.
Penyelesaian
Diketahui n = 31
s = 6
= 99 % = 0,99 ( ) ( ) ( ) ( ) ( ) 7,53
230,995,0
2131,99,012
12
,121 === ++ dk
( ) ( ) ( ) ( ) ( ) 8,132
30,005,02
131,99,0121
2,12
1 === dk Interval kepercayaan simpangan baku populasi adalah
( )( )
( )( )
212
1
22
212
1
2 11
+
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
11
Akan ditaksir selisih rata-rata )( 21 . Titik taksiran untuk
adalah )( 21 adalah )( 21 xx . Untuk menaksir selisih rata-rata
dibedakan hal-hal berikut:
a. Dalam hal 21 = Jika kedua populasi normal dan memiliki == 21
yang besarnya diketahui, maka 100 % interval kepercayaan untuk )(
21 adalah
(I.11) 212
12121212
12111)(11)(nn
zxxnn
zxx ++
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
12
Dengan memisalkan 11 =s dan 22 =s untuk sampel-sampel acak
berukuran cukup besar, dapat dilakukan pendekatan kepada distribusi
normal.
Rumus interval kepercayaan ditentukan oleh:
(I.14) 2
22
1
21
212121
2
22
1
21
2121 )()( n
snszxx
ns
nszxx ++
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
13
dengan pt diperoleh dari daftar distribusi Student dengan ( )+=
121p dan ( )1= ndk .
Contoh (Sudjana)
Ada dua cara pengukuran untuk mengukur kelembaban suatu zat.
Cara I
dilakukan 50 kali yang menghasilkan 1x = 60,2 dan 21s = 24,7.
Cara II dilakukan
60 kali dengan 2x = 70,4 dan 22s = 37,2. Tentukan interval
kepercayaan 95%
mengenai perbedaan rata-rata pengukuran dari kedua cara
tersebut.
Penyelesaian
Diketahui 1x = 60,2 ; 21s = 24,7
2x = 70,4 ; 22s = 37,2
Dimisalkan hasil kedua cara pengukuran berdistribusi normal.
( ) ( ) 975,095,0121121 =+=+= p ; 10826050 =+=dk Karena kedua
populasi normal dan memiliki == 21 tetapi besarnya tidak diketahui,
maka varians gabungan dari sampel adalah
( ) ( ) ( )( ) ( )( ) 53,3126050
2,371607,241502
11
21
222
2112 =+
+=++=
nnsnsns
Maka interval kepercayaan
21
212121
2111.)(11.)(nn
stxxnn
stxx pp ++
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
14
diambil sebuah sampel acak berukuran 1n dan 2n . Proporsi untuk
peristiwa
yang diperhatikan pada sampel tersebut adalah 1
11 n
xp = dan 2
22 n
xp = dengan
1x dan 2x menyatakan banyaknya peristiwa yang diperhatikan.
Akan ditentukan interval taksiran untuk ( )21 dengan menggunakan
pendekatan oleh distribusi normal asalkan 1n dan 2n cukup
besar.
Rumus untuk 100 % interval kepercayaan selisih ( )21 adalah
(I.16)
( ) ( )2
22
1
11
212121
2
22
1
11
2121 n
qpnqp
zppn
qpnqp
zpp ++
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
15
( ) ( )2
22
1
11
212121
2
22
1
11
2121 n
qpnqp
zppn
qpnqp
zpp ++
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
16
c. simpangan baku kedua populasi diasumsikan tidak sama.
4. Dari populasi tanaman padi jenis A dan jenis B, diambil
sampel tinggi
tanaman padi sbb:
Sampel I dari padi jenis A : 39,3 ; 45,5 ; 41,2 ; 53 ; 44,2 ;
42,5 ; 63,9.
Sampel II dari padi jenis B : 37 ; 42,4 ; 40,1 ; 52,2 ; 41,5 ;
40,8 ; 60,2.
Dengan observasi berpasangan tersebut dan interval kepercayaan
95 %,,
taksirlah selisih rata-ratanya.
5. Sebuah sampel berukuran 200 lampu yang dihasilkan oleh sebuah
mesin
produksi menunjukkan 15 buah lampu rusak. Sebuah sampel lain
berukuran
100 buah lampu yang dihasilkan oleh mesin kedua mengandung 12
buah
lampu yang rusak. Tentukan interval kepercayaan 99% untuk
selisih kedua
perbandingan.
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
17
BAB II
PENGUJIAN HIPOTESIS
1. Pendahuluan Sebelumnya telah dipelajari cara-cara menaksir
parameter untuk mengambil
kesimpulan tentang berapa besar harga parameter. Cara
pengambilan
kesimpulan yang kedua akan dipelajari adalah melalui pengujian
hipotesis.
Hipotesis adalah asumsi atau dugaan mengenai sesuatu hal yang
dibuat untuk
menjelaskan hal tersebut yang sering dituntut untuk
melakukan
pengecekannya.
Jika asumsi atau dugaan tersebut dikhususkan mengenai populasi,
umumnya
mengenai nilai-nilai parameter populasi, maka hipotesis disebut
hipotesis
statistik.
Contoh hipotesis
a. peluang lahirnya bayi berjenis kelamin laki-laki = 0,5.
b. 25 % masyarakat termasuk golongan A.
c. Rata-rata pendapatan keluarga di suatu daerah Rp 300.000,00
tiap bulan.
Setiap hipotesis bisa benar atau tidak benar, maka perlu
diadakan penelitian
sebelum hipotesis itu diterima atau ditolak. Langkah atau
prosedur untuk
menentukan apakah menerima atau menolak hipotesis dinamakan
pengujian
hipotesis.
2. Dua Macam Kekeliruan Meskipun dalam penelitian hipotesis
telah diterima atau ditolak, tidak berarti
bahwa telah dibuktikan kebenaran hipotesis. Yang diperlihatkan
adalah hanya
menerima atau menolak hipotesis saja.
Dalam melakukan pengujian hipotesis, ada dua macam kekeliruan
yang dapat
terjadi, yaitu:
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
18
a. Kekeliruan tipe I ialah menolak hipotesis yang seharusnya
diterima,
b. Kekeliruan tipe II ialah menerima hipotesis yang seharusnya
ditolak.
Tipe Kekeliruan Ketika Membuat Kesimpulan tentang Hipotesis
Keadaan Sebenarnya Kesimpulan Hipotesis Benar Hipotesis Salah
Terima Hipotesis BENAR SALAH
(Kekeliruan tipe II) Tolak Hipotesis SALAH
(Kekeliruan tipe II) BENAR
Kedua tipe kekeliruan dinyatakan dalam bentuk peluang. Peluang
membuat
kekeliruan tipe I biasa dinyatakan dengan (alpha) maka disebut
pula kekeliruan dan peluang membuat kekeliruan tipe II dinyatakan
dengan (beta) dikenal dengan kekeliruan . disebut taraf signifikan
(level of significan) atau taraf arti atau sering disebut taraf
nyata.
Jika diperkecil, maka menjadi besar dan demikian sebaliknya.
Harga yang biasa digunakan adalah 01,0= atau 05,0= . Misalnya,
dengan 05,0= atau sering disebut taraf nyata (taraf signifikansi)
5%, artinya kira-kira 5 dari tiap 100 kesimpulan bahwa akan
menolak
hipotesis yang harusnya diterima. Dengan kata lain kira-kira 95%
yakin
bahwa telah dibuat kesimpulan yang benar. Dalam hal demikian
dikatakan
bahwa hipotesis telah ditolak pada taraf nyata 0,05 yang berarti
mungkin salah
dengan peluang 0,05.
3. Langkah Pengujian Hipotesis Pengujian hipotesis akan membawa
pada kesimpulan untuk menerima atau
menolak hipotesis. Sehingga terdapat dua pilihan, dimana
digunakan
perumusan seperlunya agar lebih terperinci dan lebih mudah dalam
penentuan
di antara dua pilihan tersebut.
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
19
Hipotesis yang biasa dinyatakan dengan H, perlu dirumuskan
dengan singkat
dan jelas sesuai dengan persoalan yang dihadapi. Agar tampak
adanya dua
pilihan, maka hipotesis H ini didampingi pernyataan lain yang
isinya
berlawanan yang disebut dengan hipotesis tandingan (alternatif)
yang
dinyatakan dengan A.
Pasangan hipotesis H dan A, tepatnya H melawan A, akan
menentukan
kriteria pengujian yang terdiri dari daerah penerimaan dan
daerah penolakan
hipotesis. Daerah penolakan hipotesis sering disebut dengan
daerah kritis.
Bila menguji parameter ( dapat berupa rata-rata , proporsi ,
simpangan baku , dll), maka: a. Hipotesis mengandung pengertian
sama
Pengujian sederhana lawan sederhana
1) H : 0 = A : 1 = dengan 10 , dua nilai berbeda yang
diketahui.
Pengujian sederhana lawan komposit
2) H : 0 = A : 0
3) H : 0 = A : 0 >
4) H : 0 = A : 0 <
b. Hipotesis mengandung pengertian maksimum (pengujian komposit
lawan
komposit)
H : 0 A : 0 >
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
20
c. Hipotesis mengandung pengertian minimum pengujian komposit
lawan
komposit)
H : 0 A : 0 <
Berikut hanya akan dipelajari pengujian terhadap hipotesis
yang
perumusannya mengandung pengertian sama atau tidak memiliki
perbedaan,
disebut hipotesis nol 0H melawan hipotesis tandingannya 1H ,
yang
mengandung pengertian tidak sama, lebih besar atau lebih kecil.
1H harus
dipilih dan ditentukan peneliti sesuai dengan persoalan yang
dihadapi.
Pasangan 0H dan 1H yang telah dirumuskan dituliskan dalam bentuk
berikut.
=
01
00
: H : H
atau
>=
01
00
: H : H
atau
=
01
00
: H : H
2. Tentukan besarnya taraf signifikansi . 3. Kriteria
pengujian.
Tolak 0H jika 5,0zz , selainnya 0H diterima. Dengan 5,0z
diperoleh dari daftar distribusi normal baku dengan
peluang ( )5,0 . 4. Statistik hitung berdasarkan data penelitian
(sampel) yang diambil
menggunakan statistik z yang sama dengan rumus (II.1).
5. Menarik kesimpulan berdasarkan hasil 3 dan 4.
b. Dalam hal tidak diketahui
Pada kenyataannya simpangan baku sering tidak diketahui, maka
digunakan taksirannya yaitu simpangan baku s .
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
27
Langkah pengujian hipotesis:
1. Hipotesis pengujian
>=
01
00
: H : H
2. Tentukan besarnya taraf signifikansi . 3. Kriteria
pengujian.
Tolak 0H jika 1tt , selainnya 0H diterima. Dengan 1t diperoleh
dari daftar distribusi t (distribusi Student)
dengan peluang 1 dan 1= ndk . 4. Statistik hitung berdasarkan
data penelitian (sampel) yang diambil
menggunakan statistik t yang sama dengan rumus (II.2).
5. Menarik kesimpulan berdasarkan hasil 3 dan 4.
Contoh
Proses pembuatan barang rata-rata menghasilkan 15,7 unit per
jam. Hasil produksi
memiliki varians 2,3. metode baru diusulkan untuk mengganti
metode lama jika
rata-ratanya per jam menghasilkan paling sedikit 16 buah. Untuk
menentukan
apakah metode akan diganti atau tidak, metode baru dicoba 20
kali dan ternyata
rata-rata perjam menghasilkan 16,9 buah. Pengusaha bermaksud
mengambil risiko
5% untuk menggunakan metode baru apabila metode ini rata-rata
menghasilkan
labih dari 16 buah. Apakah keputusan yang akan diambil
pengusaha?
Penyelesaian
Diketahui x = 16,9 ; n = 20 ; = 3,2 , 0 =16 Langkah pengujian
hipotesis:
1. Hipotesis pengujian
=
01
00
: H : H
yaitu
>=
16 : H 16 : H
1
0
2. Taraf signifikansi = 5%. 3. Kriteria pengujian.
Tolak 0H jika 5,0zz 64,105,05,05,0 == zz
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
28
4. Statistik hitung berdasarkan data penelitian (sampel) yang
diambil
65,2
203,2169,160 ===
n
xz
5. Kesimpulan : karena 64,165,2 5,0 =>= zzhitung terletak
pada daerah kritis maka 0H ditolak. Jadi, 16> . Sehingga dapat
disimpulkan bahwa dengan risiko 5% metode baru dapat menggantikan
metode lama.
Uji Pihak Kiri
a. Dalam hal diketahui Langkah pengujian hipotesis:
1. Hipotesis pengujian
=81,0 : H
81,0 : H2
1
20
2. Taraf signifikansi = 5%. 3. Kriteria pengujian.
Tolak 0H jika 21
2 , selainnya terima 0H .
919,16205,0.2
1 = dengan 91101 === ndk 4. Statistik hitung berdasarkan data
penelitian (sampel) yang diambil.
( ) ( )( ) 0,1681,0
44,31110120
22 ===
sn
5. Kesimpulan : karena 919,1616 205,0.2
12 =
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
37
akan digunakan dasar distribusi sampling mengenai selisih
statistik, misalnya
selisih rata-rata dan selisih proporsi.
Misalkan dipunyai dua buah populasi, keduanya berdistribusi
normal dengan
rata-rata dan simpangan baku masing-masing 1 dan 1 untuk
populasi pertama, 2 dan 2 untuk populasi kedua. Secara independen
diambil sebuah sampel acak dengan ukuran 1n dan 2n dari
masing-masing populasi. Rata-rata
dan simpangan baku dari sampel-sampel itu berturut-turut 1x , 1s
dan 2x , 2s .
Akan diuji tentang rata-rata 1 dan 2 . a. Dalam hal == 21 dan
diketahui
Langkah pengujian hipotesis:
a. Hipotesis pengujian
=
211
210
: H : H
b. Tentukan besarnya taraf signifikansi . c. Kriteria
pengujian.
Terima 0H jika ( ) ( )
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
38
3. Kriteria pengujian.
Terima 0H jika 211211
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
39
3. Kriteria pengujian.
Terima 0H jika 211211
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
40
mt , diperoleh dari daftar distribusi Student dengan peluang dan
mdk = .
4. Statistik hitung berdasarkan data penelitian (sampel) yang
diambil.
(II.11)
2
22
1
21
21
ns
ns
xxt+=
5. Menarik kesimpulan berdasarkan hasil 3 dan 4.
Contoh (Sudjana)
Suatu barang dihasilkan dengan menggunakan dua proses. Ingin
diketahui apakah
kedua proses itu menghasilkan barang yang sama kualitasnya
ditinjau dari rata-
rata daya tekannya. Maka diadakan percobaan sebanyak 20 kali
masing-masing
dari hasil proses pertama maupun kedua. Diperoleh informasi 1x =
9,25 kg ; 2x =
10,4 kg ; 1s = 2,24 kg ; 2s = 3,12 kg. Bila populasinya dianggap
normal dengan
varians kedua populasi tidak sama, dengan taraf nyata 5%, ujilah
bagaimana
hasilnya!
Penyelesaian
Diketahui 1x = 9,25 kg ; 2x = 10,4 kg ; 1s = 2,24 kg ; 2s = 3,12
kg.
Pada kasus ini populasi dianggap normal dan variansnya tidak
diketahui namun
sama besar.
Langkah pengujian hipotesis dalam hal 21 dan keduanya tidak
diketahui 1. Hipotesis pengujian
=
berbeda yang tekan daya rata-rata kualitasdengan barangan
menghasilk proses kedua; : Hsama yang tekan daya rata-rata
kualitasdengan barangan menghasilk proses kedua; : H
211
210
2. Taraf signifikansi = 5%. 3. Kriteria pengujian.
Terima 0H jika 21
2211
21
2211
wwtwtwt
wwtwtw
++
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
41
2509,0200176,5
1
21
1 === nsw ; 4867,0
207344,9
2
22
2 === nsw
( ) ( ) ( ) ( ) 09,219;975,0120,05,0.2111,2111 1 ===== tttt
n
( ) ( ) ( ) ( ) 09,219;975,0120,05,0.2111,2112 2 ==== tttt n
Sehingga 21
2211
21
2211
wwtwtwt
wwtwtw
++
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
42
Dengan 211t diperoleh dari daftar distribusi t dengan
peluang
211 dan 1= ndk . 4. Statistik hitung berdasarkan data penelitian
(sampel) yang diambil.
(II.12)
nsBt
B=
5. Menarik kesimpulan berdasarkan hasil 3 dan 4.
11. Uji Hipotesis Kesamaan Dua Rata-Rata: Uji Satu Pihak Serupa
dengan uji dua pihak, pada uji satu pihak juga dimisalkan dipunyai
dua
buah populasi, keduanya berdistribusi normal dengan rata-rata
masing-masing
1 dan 2 dan simpangan baku 1 dan 2 . Uji Pihak Kanan
a. Dalam hal 21 = Langkah pengujian hipotesis:
1) Hipotesis pengujian
>=
211
210
: H : H
2) Tentukan besarnya taraf signifikansi . 3) Kriteria
pengujian.
Terima 0H jika < 1tt , dan tolak 0H untuk harga t yang lain.
Dengan 221 += nndk dan peluang ( )1 dari daftar distribusi t.
4) Statistik hitung berdasarkan data penelitian (sampel) yang
diambil
menggunakan statistik t yang sama dengan rumus (II.9) dan
(II.10).
5) Menarik kesimpulan berdasarkan hasil 3 dan 4.
b. Dalam hal 21
Pendekatan yang cukup memuaskan adalah dengan menggunakan
statistik
t .
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
43
Langkah pengujian hipotesis:
a) Hipotesis pengujian
>=
211
210
: H : H
b) Tentukan besarnya taraf signifikansi . c) Kriteria
pengujian.
Tolak 0H jika 21
2211
wwtwtwt +
+ , dan terima 0H jika terjadi sebaliknya.
Dengan 1
21
1 nsw = ;
2
22
2 nsw =
( ) ( )1,2111 1= ntt dan ( ) ( )1,2112 2= ntt Peluang untuk
penggunaan daftar distribusi t adalah ( )1 sedangkan derajat
kebebasannya masing-masing ( )11 n dan ( )12 n .
d) Statistik hitung berdasarkan data penelitian (sampel) yang
diambil
menggunakan statistik t yang sama dengan rumus (II.11). e)
Menarik kesimpulan berdasarkan hasil 3 dan 4.
c. Observasi berpasangan
Langkah pengujian hipotesis:
1. Hipotesis pengujian
>=
0 : H0 : H
1
0
B
B
2. Tentukan besarnya taraf signifikansi . 3. Kriteria
pengujian.
Tolak 0H jika 1tt , selainnya terima 0H . Dengan 1t diperoleh
dari daftar distribusi t dengan peluang 1 dan 1= ndk .
4. Statistik hitung berdasarkan data penelitian (sampel) yang
diambil
menggunakan statistik t yang sama dengan rumus (II.12).
5. Menarik kesimpulan berdasarkan hasil 3 dan 4.
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
44
Uji Pihak Kiri
a. Dalam hal 21 = dan keduanya tidak diketahui Langkah pengujian
hipotesis:
1. Hipotesis pengujian
=
: H : H
B1
B0
A
A
2. Taraf signifikansi = 5%. 3. Kriteria pengujian.
Tolak 0H jika 5,0zz dan Terima 0H jika < 5,0zz .
64,105,05,05,0 == zz
4. Statistik hitung berdasarkan data penelitian (sampel)
74,01001006880 =+
+=++=
BA
BA
nnxxp
26,074,011 === pq
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
49
( )( )94,1
1001
100126,074,0
10068
10080
11=
+=
+
=
BA
B
B
A
A
nnpq
nx
nx
z
5. Kesimpulan: karena 64,194,1 >=hitungz maka 0H ditolak.
Jadi, B >A . Artinya, pada taraf 5%, pemberian obat dapat
membantu penyembuhan penyakit.
Bagaimanakah bila penelitian ini diuji dengan taraf nyata 1%,
apakah masih
memberikan hasil yang sama dengan kesimpulan di atas!
14. Uji Hipotesis Kesamaan Dua Varians: Uji Dua Pihak Ketika
menaksir selisih rata-rata dan menguji kesamaan atau perbedaan
dua
rata-rata ditekankan asumsi bahwa kedua populasi memiliki
varians yang
sama agar menaksir dan menguji bisa dilakukan. Dalam hal varians
yang
berbeda, hingga saat ini hanya digunakan cara pendekatan. Oleh
karena itu,
maka perlu dilakukan pengujian mengenai kesamaan dua varians
atau lebih.
Populasi-populasi dengan varians yang sama besar dinamakan
populasi
dengan varians yang homogen. Bila populasi tersebut memiliki
varians yang
berbeda disebut populasi dengan varians yang heterogen.
Berikut akan dilakukan pengujian kesamaan varians untuk dua
populasi.
Misalkan dipunyai dua populasi normal dengan varians 21 dan 22 .
Langkah pengujian hipotesis:
1. Hipotesis pengujian
=
22
211
22
210
:: H
: H
2. Tentukan besarnya taraf signifikansi . 3. Kriteria
pengujian.
Terima 0H jika ( ) ( ) ( )1,1211,1,211 2121
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
50
4. Statistik hitung berdasarkan data penelitian (sampel) yang
diambil jika
sampel dari populasi pertama berukuran 1n dengan variansi 21s
dan sampel
dari populasi kedua berukuran 2n dengan variansi 22s .
(II.14) 22
21
ssF =
Statistik lain yang digunakan
(II.15) terkecilVariansterbesarVariansF =
Kriteria pengujian.
Tolak 0H jika ( )21 ,21 vvFF .
Dengan ( )21 ,21 vvF diperoleh dari daftar distribusi F dengan
peluang 21 dan derajat kebebasan v1 dan v2.
5. Menarik kesimpulan berdasarkan hasil 3 dan 4.
Contoh
Dari dua populasi siswa diukur hasil prestasi belajar siswa.
Dari populasi pertama
diukur 10 orang siswa ternyata 21s = 24,7. Dari populasi kedua
diukur 13 siswa
ternyata 22s = 37,2. Dengan = 10%, ujilah apakah kedua populasi
tersebut homogen.
Penyelesaian
Diketahui 21s = 24,7 n1 = 10
22s = 37,2 n2 = 13
Langkah pengujian hipotesis:
1. Hipotesis pengujian
=
22
211
22
210
:: H
: H
2. Taraf signifikansi = 10%. 3. Kriteria pengujian.
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
51
Terima 0H jika ( ) ( ) ( )1,1211,1,211 2121
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
52
15. Uji Hipotesis Kesamaan Dua Varians: Uji Satu Pihak
Uji Pihak Kanan
Langkah pengujian hipotesis:
1. Hipotesis pengujian
>=
22
211
22
210
:: H
: H
2. Tentukan besarnya taraf signifikansi . 3. Kriteria
pengujian.
Tolak 0H jika ( )1,1 21 nnFF , selainnya terima 0H . 4.
Statistik hitung berdasarkan data penelitian (sampel) yang
diambil
menggunakan statistik yang sama dengan rumus (II.14)
5. Menarik kesimpulan berdasarkan hasil 3 dan 4.
Uji Pihak Kiri
Langkah pengujian hipotesis:
1. Hipotesis pengujian
k populasi yang berdistribusi normal.
Dasar pemikiran penggunaan analisis varians adalah bahwa varians
total semua
subjek dalam suatu eksperimen dapat dianalisis dari dua sumber,
yaitu variansi
antar kelompok dan variansi di dalam kelompok.
Asumsi dasar dari analisis varians adalah sebagai berikut:
Populasi yang diamati memiliki distribusi normal.
Pengambilan sampel dilakukan secara acak dan setiap sampel
independen/tidak
terikat sampel yang lain.
Populasi-populasi dimana nilai sampel diperoleh memiliki varians
populasi yang
sama atau dapat ditulis 22221 , k === K dengan k jumlah
populasi.
Dikenal beberapa jenis varians sampel 2s , salah satunya
dihitung dengan rumus
( )1
22
=
nxx
s i dan varians populasi adalah 2 . Varians untuk sekumpulan
data ini melukiskan derajat perbedaan atau variansi
nilai data individu yang ada dalam kelompok atau kumpulan data
tersebut.
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
56
Variansi ini dihitung dari nilai rata-rata kumpulan data. Selain
itu dikenal pula
varians sampling berbagai statistik, untuk rata-rata diberi
lambang 2x , untuk proporsi dengan lambang 2
nx , dan sebagainya.
Langkah-langkah Analisis varians adalah sebagai berikut:
1. Rumuskan hipotesis nol ( 0H ) dan hipotesis tandingannya ( 1H
).
0H : mean k populasi ( )2>k yang berdistribusi normal adalah
sama. 1H : diantara k populasi ( )2>k terdapat mean populasi
yang berbeda.
(minimum ada satu tanda sama dengan tidak berlaku)
Atau secara matematis
kH ==== K3210 :
k
k
kH
=====
KKK
321
321
3211 :
2. Ambil sampel acak dari k buah ( )2>k populasi sbb: Sampel
I Sampel II Sampel III ... Sampel k
11x 12x 13x ... kx1
21x 22x 23x ... kx2
31x 32x 33x ... kx3 M M M ... M
1nx 2nx 3nx ... nkx
1x 2x 3x ... kx 3. Tentukan besarnya taraf signifikansi . 4.
Gunakan statistik F (Fisher)
kelompokdalamiansmeansantarians
VDKVAMFhitung var
var==
( )1
1
2
22
====
k
xxnnSVAM
k
jj
x , 1= kdk
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
57
( )( )11 1
2
== =
nk
xxVDK
n
i
k
jjij
Dengan x mean dari semua mean sampel
jx mean sampel ke-j, j = 1, 2, ..., k
ijx nilai data observasi ke-i dari sampel ke-j
5. Kriteria pengujian.
Terima 0H jika ( )( )1,1; nkkhitung FF . Tolak 0H jika ( )(
)1,1; > nkkhitung FF .
6. Mengambil kesimpulan berdasarkan hasil 4 dan 5.
7. Jika 0H diterima maka pengujian berakhir.
Jika 0H ditolak, analisis dilanjutkan dengan Uji Lanjut salah
satunya
dengan menggunakan Uji
21LSD (Least Significant Different).
( ) dnk StLSD .1,211211
=
ji
d ns
nsS
22
+= , VDKs =2
Kriteria pengujian Uji lanjut
211
LSD
Bandingkan antara ix dan jx : ji xx jika 211
>= LSDxxd jiij .
Contoh
Diterapkan model pembelajaran dengan 3 metode, kemudian
dilakukan tes dan
diperoleh skor hasil tes sbb:
Sampel ke-
Metode I Metode II Metode III
1 25 22 22 2 29 25 21 3 28 24 26 4 30 25 23
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
58
a. Dengan anava selidikilah apakah ada perbedaan diantara tiga
mean skor
hasil belajar dengan ketiga metode tersebut.
b. Bila terdapat perbedaan, dengan uji lanjut selidikilah model
pembelajaran
yang manakah yang terbaik. Gunakan = 5%. Penyelesaian
Diketahui 1x = 28 2x = 24 3x = 23
x = 25
Langkah-langkah Analisis varians:
Merumuskan hipotesis uji
3210 : ==H 1H : paling sedikit ada satu tanda sama dengan tidak
berlaku.
Sampel acak dari 3 buah populasi seperti tertera pada soal di
atas.
Taraf signifikansi = 5%.. Gunakan statistik F (Fisher)
( ) ( ) ( ) ( ){ } 2813
25232524252841
2221
2
=++=
==
k
xxnVAM
k
jj
( )( )
( ) ( )( ) ( )
( ) ( )( ) ( )
( ) ( )( ) ( )
( )78,3
91
14328232826
28212822
28252824
28252822
28302828
28292825
1
22
22
22
22
22
22
1 1
2
==
++++
++++
+++
=
== =
nk
xxVDK
n
i
k
jjij
41,778,3
28 ===VDKVAMFhitung
Kriteria pengujian.
Terima 0H jika ( )( )1,1; nkkhitung FF Tolak 0H jika ( )( )1,1;
> nkkhitung FF
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
59
( )( ) ( )( ) ( ) 26,49,2;05,0143,13;05,01,1; === FFF nkk
Kesimpulan : karena ( )( ) 26,441,7 1,1; =>= nkkhitung FF maka
0H ditolak.
Artinya, ada perbedaan diantara ketiga mean skor hasil belajar
dengan
ketiga metode tersebut.
Karena 0H ditolak, maka analisis dilanjutkan dengan Uji Lanjut
menggunakan
Uji
211
LSD
3748,1478,3
478,322 =+=+=
jid n
snsS , 78,32 ==VDKs
( ) ( ) ( ) ( )( ) ( )( ) ( ) 11,33748,1.26,2
3748,1.
3748,1..
9,975,0
143,05,02111,2
11211
=====
t
tStLSD dnk
Kriteria pengujian Uji lanjut
211
LSD
Bandingkan antara ix dan jx : ji xx jika 211
>= LSDxxd jiij .
11,3424282112112
=>===
LSDxxd . Berarti 1x > 2x .
11,3523282113113
=>===
LSDxxd . Berarti 1x > 3x .
11,3123242113223
=
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
60
Jawa Madura Bali 341 360 302 323 300 304 356 296 286 289 223 245
343 250 235 335 296 216 361 284 287 298 200 296 300 208 264 P
rodu
ksi s
usu
(lite
r)
309 231 259 Dengan taraf signifikansi = 5%, selidiki apakah ada
perbedaan perbandingan produksi susu sapi di 3 lokasi tersebut?
Jika ada perbedaan
manakah yang paling berbeda!
2. Dilakukan pengamatan terhadap hasil tes UAN siswa SMA. Para
siswa itu
dikelompokkan dalam 3 kategori (1) SMA Favorit, (2) SMA Negeri,
dan (3)
SMA Swasta. Diperoleh data pengamatan sebagai berikut:
No SMA Nilai No SMA Nilai No SMA Nilai 1 favorit 4,25 8 negeri
4,00 15 swasta 4,00 2 favorit 5,00 9 negeri 3,00 16 swasta 3,50 3
favorit 4,75 10 negeri 3,50 17 swasta 3,75 4 favorit 3,75 11 negeri
3,75 18 swasta 3,00 5 favorit 4,50 12 negeri 3,50 19 swasta 3,25 6
favorit 4,25 13 negeri 3,25 20 swasta 3,50 7 favorit 4,00 14 negeri
4,25 21 swasta 2,75
Selidiki apakah ketiga kelompok tersebut memiliki nilai
rata-rata UAN yang
sama dengan taraf signifikansi = 5%. 3. Dilakukan penelitian
mengenai berat badan mahasiswa berdasarkan sarapan
yang dimakan dari 4 kelompok sampel dan diperoleh data berat
badan (dalam
kg) sbb:
Sampel ke-
Mie instan
Nasi Roti Singkong
1 45 46 47 43 2 55 54 58 52 3 40 45 44 40 4 65 64 65 48 5 60 62
63 58 6 58 59 62 60 7 57 54 59 55
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
61
Dengan taraf signifikansi = 5%, selidiki sarapan manakah yang
membuat berat badan mahasiswa lebih tinggi dari yang lain!
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
62
BAB IV
ANALISIS REGRESI
1. Pendahuluan Metode analisis yang telah dibahas sebelumnya
adalah analisis terhadap data
mengenai sebuah karakteristik atau atribut (data kualitatif) dan
mengenai
sebuah variabel, diskrit maupun kontinu (data kuantitatif).
Namun, kenyataan
yang terjadi, banyak persoalan yang meliputi lebih dari sebuah
variabel.
Misalkan, hasil belajar siswa tergantung pada waktu belajar,
hasil produksi
padi tergantung pada cuaca serta penggunaan pupuk, dan lain
sebagainya.
Oleh karena itu perlu untuk mempelajari analisis data yang
terdiri atas banyak
variabel.
Jika dipunyai data yang terdiri atas dua atau lebih variabel,
maka dapat
dipelajari bagaimana variabel-variabel tersebut berhubungan.
Hubungan yang
diperoleh umumnya dinyatakan dalam bentuk persamaan matematik
yang
menyatakan hubungan fungsional antara variabel. Studi yang
mmempelajari
hubungan antar variabel ini dikenal dengan analisis regresi.
Tujuan dari bab ini adalah bagaimana menghitung suatu perkiraan
atau
persamaan regresi yang akan menjelaskan hubungan antara dua
variabel.
Yang akan dibahas adalah regresi garis sederhana, dimana akan
dibahas
mengenai hubungan antara dua variabel yang biasanya cukup tepat
dinyatakan
dalam suatu garis lurus. Selanjutnya tujuan dari penggunaan
persamaan
regresi adalah memperkirakan nilai dari suatu variabel pada
nilai tertentu dari
variabel lain dengan kata lain persamaan regresi digunakan untuk
peramalan.
2. Hubungan Fungsional Antara Variabel Dalam analisis regresi,
variabel akan dibedakan menjadi dua, yaitu variabel
bebas (variabel prediktor) dan variabel takbebas (variabel
respon). Variabel
yang mudah diperoleh atau tersedia dapat digolongkan ke dalam
variabel
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
63
bebas sedangkan variabel yang terjadi karena variabel bebas,
merupakan
variabel takbebas. Dalam analisis regresi, variabel bebas akan
dinyatakan
dengan kXXX ,,, 21 K ( )1k sedangkan variabel takbebas
dinyatakan dengan Y.
Telah diketahui bahwa statistika bertujuan untuk menyimpulkan
populasi
dengan menggunakan hasil analisis data sampel. Untuk analisis
regresi juga
akan ditentukan hubungan fungsional yang diharapkan berlaku
untuk populasi
berdasarkan data sampel yang diambil dari populasi yang
bersangkutan.
Hubungan fungsional ini akan dituliskan dalam bentuk persamaan
matematik
yang disebut dengan persamaan regresi yang akan bergantung
pada
parameter-parameter.
Secara umum model atau persamaan regresi untuk populasi dapat
ditulis
dalam bentuk
(IV.1) ( )mkxxxy XXXk ,,,,,, 2121,,,. 21 KKK = Dengan m ,,, 21 K
parameter-parameter yang ada dalam regresi.
Model regresi sederhana untuk populasi dengan sebuah variabel
bebas yang
biasa dikenal dengan regresi linier sederhana adalah
(IV.2) Xxy 21. += Dalam hal ini parameternya adalah 1 dan 2 .
Berdasarkan sebuah sampel, akan ditentukan atau ditaksir persamaan
regresi
populasi pada rumus (IV.1). Hal ini dapat dilakukan dengan jalan
menaksir
parameter-parameter m ,,, 21 K . Untuk kasus regresi linier
sederhana, perlu ditaksir parameter 1 dan 2 . Jika
1 dan 2 ditaksir oleh a dan b , maka persamaan regresi
berdasarkan sampel adalah
(IV.3) bXaY +=
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
64
Regresi dengan X merupakan variabel bebas dan Y variabel
takbebasnya
dinamakan regresi Y atas X.
Model regresi populasi pangkat dua atau parabola untuk sebuah
variabel bebas
dengan parameter 1 , 2 dan 3 adalah (IV.4) 2321. 2 XXxxy ++= Dan
berdasarkan sampel acak, parameter-parameter 1 , 2 dan 3 perlu
ditaksir dengan persamaan berikut
(IV.5) 2 cXbXaY ++= Dengan a , b dan c masing-masing diperoleh
dari perhitungan berdasarkan
data penelitian yang berturut-turut merupakan taksiran untuk 1 ,
2 dan 3 .
Berikut cara menentukan persamaan regresi, apabila dimiliki
data
pengamatan.
3. Metode Tangan Bebas Metode ini merupakan metode kira-kira
dengan menggunakan diagram pencar
(scatter diagram) dengan data yang diperoleh berdasarkan hasil
pengamatan.
Jika variabel yang diamati meliputi variabel bebas X dan
variabel takbebas Y,
maka data pengamatan yang diperoleh digambarkan pada sebuah
diagram
dengan X dinyatakan pada sumbu mendatar dan Y pada sumbu tegak
sehingga
terbentuk diagram pencar yang menunjukkan titik-titik
tertentu.
Ada dua manfaat dari penggunaan diagram pencar ini yaitu: (1)
Membantu
menunjukkan apakah terdapat hubungan yang bermanfaat antara dua
variabel,
(2) Membantu menetapkan tipe persamaan yang menunjukkan
hubungan
antara kedua variabel tersebut. Seperti yang tertulis dalam
manfaat yang
kedua, dari letak titik-titik pada diagram pencar, dapat
diperkirakan bentuk
regresinya. Jika letak titik-titik yang terbentuk di sekitar
garis lurus, maka
dapat diduga terjadi regresi linier. Namun, hubungan yang
terbentuk tidak
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
65
selalu harus berupa garis lurus. Jika letak titik-titik yang
terbentuk di sekitar
garis lengkung, maka dapat diduga terjadi regresi nonlinier.
Hubungan yang tergambar pada diagram pencar dapat berupa
hubungan
positif (atau langsung) antar dua variabel yaitu jika variabel
bebas meningkat
maka variabel takbebas juga meningkat. Namun, adapula
kemungkinan pada
variabel tertentu terdapat hubungan yang negatif (atau
berlawanan) yaitu jika
variabel bebas meningkat maka variabel takbebas akan menurun.
Atau bahkan
tidak ada hubungan sama sekali antara variabel (titik-titik yang
terbentuk pada
diagram pencar tidak menunjukkan pola tertentu).
4. Metode Kuadrat Terkecil Untuk Regresi Linier Metode ini
berdasarkan pada kenyataan bahwa jumlah pangkat dua (kuadrat)
dari jarak antara titik-titik dengan garis regresi yang sedang
dicari harus
sekecil mungkin.
Untuk pengamatan yang terdiri dari sebuah variabel bebas X dan
variabel
takbebas Y di mana model regresi linier untuk populasi seperti
rumus (IV.2)
telah dapat diduga, maka perlu ditaksir parameter-parameter
regresi sehingga
diperoleh persamaan seperti rumus (IV.3). Jadi untuk populasi,
model regresi
linier adalah
Xxy 21. += Harga parameter 1 dan 2 ditaksir oleh a dan b ,
sehingga persamaan regresi menggunakan data sampel adalah
bXaY +=
Koefisien-koefisien regresi a dan b untuk regresi linier dapat
dihitung
dengan rumus
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
66
(IV.6)
( )( ) ( )( )( )
( )( )( )22
22
2
=
=
ii
iiii
ii
iiiii
XXn
YXYXnb
XXn
YXXXYa
Jika terlebih dahulu dihitung koefisien b , maka koefisien a
dapat pula
ditentukan dengan rumus
(IV.7) XbYa = dengan X dan Y masing-masing adalah rata-rata
untuk variabel X dan Y.
Dalam regresi linier, koefisien b berarti perubahan rata-rata Y
untuk setiap
perubahan satu unit variabel X. Perubahan nilai Y bertambah
apabila nilai b
bertanda positif dan berkurang untuk tanda b negatif.
Contoh (Supranto)
Berikut data penjualan dari perusahaan makanan ringan
X : persentase kenaikan biaya iklan
Y : persentase kenaikan hasil penjualan
X 1 2 4 5 7 9 10 12
Y 2 4 5 7 8 10 12 14
Berapakah besarnya ramalan presentase kenaikan penjualan apabila
biaya
iklan dinaikkan menjadi 15 %.
Penyelesaian
X Y 2X XY
1 2 1 2
2 4 4 8
4 5 16 20
5 7 25 35
7 8 49 56
9 10 81 90
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
67
10 12 100 120
12 14 144 168
= 50iX 25,6=X
= 62iY 75,7=Y
= 4202iX = 499iiYX
Untuk menghitung ramalan presentase kenaikan penjualan, terlebih
dahulu
dicari persamaan regresi dari data tersebut.
( )( )( )
( ) ( )( )( ) ( ) 04,1860
892504208
62504998222
===
= ii
iiii
XXn
YXYXnb
( ) 25,125,604,175,7 === XbYa Sehingga diperoleh persamaan XbXaY
04,125,1 +=+= Nilai koefisien 04,1=b artinya setiap ada kenaikan 1%
biaya iklan, maka hasil penjualan akan naik sebesar 1,04 %.
Persamaan XbXaY 04,125,1 +=+= selanjutnya dapat digunakan untuk
meramalkan presentase kenaikan penjualan apabila terjadi
perubahan
(kenaikan atau pengurangan) biaya iklan.
Jika biaya iklan dinaikkan menjadi 15 %, maka ramalan presentase
kenaikan
penjualan adalah
XY 04,125,1 += dengan X = 15 % diperoleh ( ) 85,161504,125,1
=+=Y . Jadi besarnya ramalan presentase kenaikan penjualan apabila
biaya iklan
dinaikkan menjadi 15 % adalah 16,85.
5. Berbagai Varians Sehubungan dengan Regresi Linier Sederhana
Untuk analisis selanjutnya tentang regresi linier sederhana,
terdapat beberapa
asumsi yang harus diambil.
Asumsi pertama, mengenai kekeliruan prediksi atau galat prediksi
atau
perbedaan YYe = yang terjadi, mengingat hasil pengamatan
variabel takbebas Y belum tentu sama nilainya dengan harga yang
diharapkan yaitu Y
yang diperoleh dari regresi hasil pengamatan (sampel). Dalam
populasi, galat
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
68
prediksi dimisalkan berbentuk variabel acak yang mengikuti
distribusi normal
dengan rata-rata nol dan varians 2 . Asumsi kedua, untuk setiap
harga X yang diberikan, variabel takbebas Y
independen dan berdistribusi normal dengan rata-rata ( )X21 +
dan varians 2
.XY . Varians 2.XY dimisalkan sama untuk setiap X maka dapat
dinyatakn oleh varians kekeliruan taksiran ( )2 dan kekeliruan baku
taksiran xy. .
5.1. Kesalahan Baku Regresi dan Koefisien Regresi Sederhana
Kesalahan baku atau selisih taksir standar merupakan indeks
yang
digunakan untuk mengukur tingkat ketepatan regresi dan koefisien
regresi
atau mengukur variasi titik-titik observasi di sekitar garis
regresi. Dengan
kesalahan baku, batasan seberapa jauh melesetnya perkiraan
dalam
meramalkan data dapat diketahui (Hasan, 2010). Apabila semua
titik
observasi berada tepat pada garis regresi maka kesalahan baku
akan bernilai
sama dengan nol. Hal ini menunjukkan bahwa perkiraan yang
dilakukan
pada data pengamatan sesuai dengan data yang sebenarnya.
Berikut rumus yang digunakan untuk menghitung kesalahan baku
regresi
dan koefisien regresi.
a. Kesalahan baku untuk regresi
2
.2
=
nXYbYaY
Se
b. Kesalahan baku untuk koefisien regresi a (parameter a )
( )222
=
XXn
SXS ea
c. Kesalahan baku untuk koefisien regresi b (parameter b )
( )nX
X
SS eb 22
=
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
69
Coba Anda hitung kesalahan baku regresi, koefisien regresi a
dan
koefisien regresi b dengan data dari contoh soal sebelumnya!
5.2. Pendugaan Interval Koefisien Regresi
6. Regresi Non Linier Seringkali regresi linier tidak dapat
digunakan pada beberapa data karena
hipotesis kelinieran telah ditolak. Hal ini juga dapat dilihat
dari bentuk
diagram pencar yang tidak menunjukkan bentuk garis lurus,
sehingga model
regresi linier akan menyimpang dari letak titik-titik dalam
diagram pencar.
Hal ini perlu diperbaiki dengan menggunakan regresi
nonlinier.
Beberapa model regresi nonlinier yang mudah dan sering
digunakan, antara
lain:
6.1. Model Parabola kuadratik
Persamaan umum model ini ditaksir oleh
(IV.8) 2 cXbXaY ++= Dengan koefisien-koefisien cba ,, harus
ditentukan berdasarkan data
hasil pengamatan. Dengan menggunakan metode kuadrat terkecil,
maka
cba ,, dapat dihitung dengan sistem persamaan:
++= 2iii XcXbnaY ++= 32 iiiii XcXbXaYX ++= 4322 iiiii
XcXbXaYX
6.2. Model Parabola Kubik
Persamaan umum model ini ditaksir oleh
(IV.9) 32 dXcXbXaY +++=
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
70
Dengan koefisien-koefisien dcba ,,, dihitung dari data
pengamatan.
Sistem persamaan yang harus diselesaikan untuk menentukan dcba
,,,
adalah:
+++= 32 iiii XdXcXbnaY +++= 432 iiiiii XdXcXbXaYX +++= 54322
iiiiii XdXcXbXaYX +++= 65433 iiiiii XdXcXbXaYX
Semakin tinggi pangkat X dalam persamaan regresi, maka
semakin
banyak pula sistem persamaan yang harus diselesaikan.
6.3. Model Eksponen
Persamaan umum model ini ditaksir oleh
(IV.10) XbaY = Bentuk ini dapat dikembalikan kepada model linier
apabila diambil
logaritmanya. Dalam logaritma persamaannya akan menjadi
(IV.11) ( )XbaY logloglog += Apabila diambil YY log = , aa log=
, dan bb log= , maka diperoleh model XbaY += yang adalah model
linier seperti pada rumus (IV.3). dengan rumus (IV.6), maka a dan b
dapat dihitung, selanjutnya karena
aa log= dan bb log= , maka a dan b juga dapat dihitung. Dalam
logaritma, maka a dan b dapat dicari dari rumus
(IV.12) ( )
=
nX
bn
Ya ii log
loglog
( ) ( )( )( )
= 22
logloglog
ii
iiii
XXn
YXYXnb
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
71
Model eksponensial dalam rumus XbaY = sering pula disebut model
pertumbuhan karena sering digunakan dalam menganalisis data
hasil
pengamatan yang berhubungan dengan fenomena yang sifatnya
tumbuh.
Dalam hal ini, model persamaannya menjadi
(IV.13) bXeaY = dengan e adalah bilangan pokok logaritma
asli.
6.4. Model Geometrik
Persamaan umum model ini ditaksir oleh
(IV.14) bXaY = Bentuk ini dapat dikembalikan kepada model linier
dan apabila diambil
logaritmanya, maka
(IV.15) XbaY logloglog += Bentuk ini merupakan model linier
dalam Xlog dan Ylog . Koefisien a
dan b dapat dihitung dari:
(IV.16)
=
nX
bn
Ya ii
logloglog
( ) ( )( )( )
= 22 log)log(loglogloglog
ii
iiii
XXn
YXYXnb
6.5. Model Logistik
Model paling sederhana model logistik dapat ditaksir oleh
(IV.17) XabY 1 =
Untuk Y yang tidak sama dengan nol, maka bentuk di atas dapat
pula
ditulis sebagai XabY
=1 .
Jika diambil logaritmanya, diperoleh
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
72
(IV.18) ( )XbaY
loglog1log +=
Yang merupakan model linier dalam variabel-variabel X dan
Y1log .
Koefisien-koefisien a dan b dapat dicari dengan menggunakan
rumus
(IV.19) ( )
=
nX
bn
Ya ii log
loglog
( ) ( )( )( )
= 22
logloglog
ii
iiii
XXn
YXYXnb
Dengan Ylog diganti oleh
Y1log .
6.6. Model Hiperbola
Persamaan umum yang sederhana untuk model hiperbola dapat
dituliskan
dalam bentuk
(IV.20) bXa
Y +=1
Atau jika tidak ada Y berharga nol dapat ditulis menjadi
(IV.21) bXaY
+=1
Yang merupakan bentuk linier dalam variabel-variabel X dan Y1
.
Koefisien-koefisien a dan b dapat dihitung dengan rumus
(IV.22) ( )( ) ( )( )
( )
= 22
2
)( ii
iiiii
XXn
YXXXYa
( ) ( )( )( )
= 22 )( iiiiii
XXn
YXYXnb
Apabila variabel Y diganti oleh Y1 .
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
73
7. Regresi Linier Ganda Sebelumnya telah dibahas hubungan linear
dari dua variabel X dan Y dengan
menggunakan persamaan regresi linier bXaY += . Dalam kenyataan,
banyak data pengamatan yang terjadi dengan melibatkan
lebih dari dua variabel. Misalnya hasil panen padi (Y)
dipengaruhi oleh
penggunaan pupuk ( 1X ), luas sawah ( 2X ) dan curah hujan ( 3X
). Secara
umum, data hasil pengamatan Y dapat terjadi atau dipengaruhi
oleh variabel-
variabel bebas kXXX ,,, 21 K .
Akan ditentukan hubungan antara Y dan kXXX ,,, 21 K sehingga
diperoleh
regresi antara Y dan kXXX ,,, 21 K . Yang akan ditinjau hanyalah
garis regresi
sederhana yang dikenal dengan nama regresi linier berganda.
Model regresi
linier ganda atas kXXX ,,, 21 K akan ditaksir oleh
(IV.23) kk XbXbXbaY ++++= K2211 dengan kbbba ,,,, 21 K merupakan
koefisien-koefisien yang harus ditentukan
berdasarkan data pengamatan. Perhatikan bahwa regresi linier
bXaY += merupakan hal istimewa dari rumus (IV.23) untuk 021 =====
kbbba K .
Koefisien-koefisien kbbba ,,,, 21 K ditentukan dengan
menggunakan metode
kuadrat terkecil (Least Square Method) yang menghasilkan
persamaan normal
sebagai berikut
(IV.24) =++++ YXbXbXban kkK2211 =++++ YXXXbXXbXbXa kk 112122111
K =++++ YXXXbXbXXbXa kk 222221212 K
M
=++++ YXXbXXbXXbXa kkkkkk 22211 K Bila persamaan tersebut
diselesaikan, maka akan diperoleh nilai
kbbba ,,,, 21 K . Kemudian dapat dibentuk persamaan regresi
berganda.
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
74
Apabila persamaan regresi telah diperoleh, maka dapat diramalkan
nilai Y
dengan syarat bila nilai kXXX ,,, 21 K sebagai variabel bebas
sudah
diketahui.
Sama halnya dengan regresi linier, dalam regresi linier ganda
perubahan rata-
rata Y memperhatikan nilai dan tanda koefisien dari
masing-masing variabel
X. Pada rumus (IV.23) maka koefisien 1b menyatakan perubahan
rata-rata Y
untuk setiap perubahan satu unit variabel 1X apabila kXXX ,,, 32
K
semuanya dianggap tetap. Koefisien 2b menyatakan perubahan
rata-rata Y
untuk setiap perubahan satu unit variabel 2X apabila kXXX ,,, 31
K
semuanya dianggap tetap, demikian seterusnya. Jelas bahwa setiap
koefisien
hanya memberikan gambaran parsial apa yang terjadi pada Y untuk
perubahan
X yang berhubungan dengan koefisien yang bersesuaian. Oleh
karena itu
koefisien-koefisien kbbba ,,,, 21 K disebut pula koefisien
regresi parsial.
Contoh (Supranto)
Perhatikan file PDF
LATIHAN 1. Dengan menggunakan persamaan garis regresi bXaY += ,
hitunglah ramalan
nilai Y jika X = 16 dari kedua data berikut a.
X 2 4 3 8 9 10 15 13
Y 1 2 5 7 8 11 13 14
b. X 1 3 4 7 9 11 13
Y 12 11 9 8 6 5 4
2. Berikut data nilai hasil ujian mahasiswa matematika Unnes
X : nilai hasil ujian Kalkulus mahasiswa matematika Unnes
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
75
Y : nilai hasil ujian Statistika mahasiswa matematika Unnes
X 7 6 8 9 10 5 4 9 7 3
Y 6 8 9 7 9 6 5 8 8 4
a. Dengan menggunakan persamaan regresi, berapakah nilai ujian
Statistika
jika nilai ujian Kalkulus yang diperoleh sebesar 8,5.
b. Tuliskan persamaan regresi linier sederhana, berapakah
besarnya nilai
koefisien regresi? Jelaskan arti dari nilai-nilai tersebut!
c. Tentukan kesalahan baku regesi, koefisien regresi a dan
koefisien regresi
b .
d. Dalam soal ini bolehkan variabel Y memiliki nilai negatif?
Berikan alasan
Anda!
3. Dipunyai kumpulan data berikut
X ni XXXX ,,,,, 21 KK
Y ni YYYY ,,,,, 21 KK
Jika ( )( )
( )
= 2XX
YYXXb
i
ii dan XbYa =
dengan = iXnX 1 dan = iYnY 1 Tunjukkan bahwa:
a. ( )( )( )22
=ii
iiii
XXn
YXYXnb
b. ( )=
=n
ii XbaY
1
0
4. Sebuah perusahaan mencatat hasil penjualan dari tahun ketahun
sebagai
berikut. Tahun 1980 1981 1982 1983 1984 1985 1986
Hasil Penjualan
(jutaan Rp)
83 60 54 21 22 13 13
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
76
Terlihat adanya kemunduran dalam hasil penjualan tersebut.
Dengan menggunakan trend parabola 2 cXbXaY ++= , hitung berapa
ramalan hasil penjualan untuk tahun 1987 dan 1988? Gambarkan grafik
Y dan Y dalam satu gambar!
5. Perhatikan data berikut
X : harga barang perunit dalam ribuan rupiah
Y : hasil penjualan barang X dalam jutaan rupiah
X 20 35 60 100 150 300 500 800
Y 150 125 105 100 92 77 62 58
Dengan menggunakan trend eksponensial XbaY = , berapakah ramalan
hasil penjualan jika X = 900!
6. Perkembangan jumlah pabrik pada suatu daerah selama 6 tahun
adalah sebagai berikut.
Tahun 1981 1982 1983 1984 1985 1986
Banyaknya pabrik 4 8 12 18 18 20
Dengan menggunakan trend logistik XabY 1 = , hitung ramalan
banyaknya
pabrik yang dibangun pada tahun 1987?
7. PT ANGIN MOBAT MABIT menerapkan stategi promosi untuk
meningkatkan pendapatan penjualan mesin jahit. Akan dilihat
pengaruh iklan melalui televisi dan koran terhadap pendapatan.
Berikut data mingguan yang tercatat:
Iklan TV (juta rupiah)
Iklan Koran (juta rupiah)
Pendapatan (juta rupiah)
1 2 4 6 7 9
2 4 5 7 8
10
1 3 6 8 9
11
Dengan menggunakan persamaan regresi linier berganda, berapakah
ramalanpendapatan penjualan mesin jahit jika promosi dengan Iklan
TV sebesar 10 juta rupiah dan promosi dengan Iklan koran sebesar 12
juta rupiah!
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
77
BAB V
ANALISIS KORELASI
1. Pendahuluan Jika data hasil pengamatan terdiri dari banyak
variabel, maka hal yang perlu
diketahui berikutnya adalah seberapa kuat hubungan antara
variabel-variabel
tersebut terjadi. Dengan kata lain, perlu ditentukan derajat
hubungan antara
variabel-variabel. Studi yang membahas tentang derajat hubungan
antara
variabel dikenal dengan nama analisis korelasi. Sedangkan ukuran
yang
digunakan untuk mengetahui derajat hubungan, terutama untuk
data
kuantitatif, dinamakan koefisien korelasi.
Adanya hubungan (korelasi) antara variabel yang satu dengan
variabel lainnya
dapat dinyatakan dengan perubahan nilai variabel. Dalam bab ini
hanya akan
dibahas mengenai hubungan linier antara dua variabel X dan Y
.
Apabila dua variabel X dan Y mempunyai hubungan, maka nilai
variabel X
yang sudah diketahui dapat digunakan untuk
memperkirakan/menaksir atau
meramalkan Y. Ramalan pada dasarnya merupakan
perkiraan/taksiran
mengenai terjadinya suatu kejadian (nilai suatu variabel) untuk
waktu
mendatang, misalnya ramalan harga beras bulan depan, ramalan
jumlah
penduduk 10 tahun mendatang, dan lain sebagainya.
Serupa dengan analisis regresi, variabel Y yang nilainya akan
diramalkan
disebut variabel takbebas, sedangkan variabel X yang nilainya
digunakan
untuk meramalkan nilai Y disebut variabel bebas atau variabel
peramal
(predictor) atau sering disebut variabel yang menerangkan
(explanatory).
2. Koefisien Korelasi
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
78
Hubungan dua variabel dapat merupakan hubungan positif maupun
negatif.
Hubungan X dan Y dikatakan positif apabila kenaikan (penurunan)
X pada
umumnya diikuti oleh kenaikan (penurunan) Y. Sebaliknya
dikatakan negatif
jika kenaikan (penurunan) X pada umumnya diikuti oleh
penurunan
(kenaikan) Y.
Jika antara variabel X dan Y ada hubungan, bentuk diagram
pencarnya akan
mulus/teratur. Apabila terdapat hubungan positif, maka diagram
pencar akan
bergerak dari kiri bawah ke kanan atas, sedangkan apabila
terdapat hubungan
negatif, maka diagram pencar akan bergerak dari kiri atas ke
kanan bawah.
Bila bentuk diagram pencar tidak teratur, artinya
kenaikan/penurunan X pada
umumnya tidak diikuti oleh naik turunnya Y, dikatakan X dan Y
tidak
berkorelasi. Atau dengan kata lain, X dan Y dikatakan saling
bebas
(independent) jika naik dan turunnya varianel X tidak
mempengaruhi Y atau
antara X dan Y tidak ada hubungan atau hubungnnya sangat lemah
sehingga
dapat diabaikan.
Apabila hubungan X dan Y dapat dinyatakan dengan fungsi linier,
maka kuat
hubungan antara X dan Y diukur dengan suatu nilai yang disebut
Koefisien
Korelasi. Nilai koefisien korelasi.ini paling sedikit -1 dan
paling besar 1. Jika
r adalah koefisien korelasi,maka nilai r dapat dinyatakan
sebagai
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
79
11 r Jika
1=r , hubungan X dan Y sempurna dan positif (mendekati 1,
hubungan sangat kuat dan positif)
1=r , hubungan X dan Y sempurna dan negatif (mendekati -1,
hubungan sangat kuat dan negatif)
0=r , hubungan X dan Y lemah sekali atau tidak ada hubungan.
X dikatakan mempengaruhi Y, jika perubahan nilai X menyebabkan
adanya
perubahan nilai Y, artinya naik turunnya nilai X akan
mengakibatkan naik
turunnya nilai Y, sehingga nilai Y akan bervariasi. Namun, naik
turunnya nilai
Y tidak hanya disebabkan oleh variabel X, karena masih ada
faktor lain yang
menyebabkannya. Misalnya naik turunnya hasil panen padi (Y)
dipengaruhi
oleh penggunaan pupuk ( 1X ), namun juga dapat dipengaruhi
faktor-faktor
lain misalnya luas sawah, curah hujan dan lain-lain. Selanjutnya
dapat
dihitung besar kontribusi dari X terhadap naik turunnya nilai Y
dengan suatu
koefisien yang disebut koefisien penentuan/koefisien determinasi
(coefficient
of determination).
Jika koefisien determinasi ditulis KD, maka untuk menghitung KD
sebagai
berikut
2rKD = Besar koefisien determinasi menunjukkan besarnya
sumbangan variabel bebas
terhadap variabel takbebas. Total nilai koefisien determinasi
sebesar 100 %,
jika koefisien determinasi bernilai kurang dari 100 % maka
sisanya
dipengaruhi oleh faktor lain.
Cara menghitung r adalah sebagai berikut
Rumus 1
==
==n
ii
n
ii
n
iii
yx
yxr
1
2
1
2
1
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
80
XXx ii = =
=n
iiXn
X1
1
YYy ii = =
=n
iiYn
Y1
1
atau
Rumus 2
= == =
===
=
n
i
n
iii
n
i
n
iii
n
ii
n
ii
n
iii
YYnXXn
YXYXnr
1
2
1
2
1
2
1
2
111
Contoh (Supranto)
Berikut data penjualan dari perusahaan makanan ringan
X : persentase kenaikan biaya iklan
Y : persentase kenaikan hasil penjualan
X 1 2 4 5 7 9 10 12
Y 2 4 5 7 8 10 12 14
Hitunglah r!
Penyelesaian
Untuk menghitung r, dibuat tabel berikut
Dengan rumus 1 X Y
( )xXX
( )yYY
2x 2y xy
1 2 - 5,25 - 5,75 27,5625 33,0625 30,1875
2 4 - 4,25 - 3,75 18,0625 14,0625 15,9375
4 5 - 2,25 - 2,75 5,0625 7,5625 6,1875
5 7 - 1,25 - 0,75 1,5625 0,5625 0,9375
7 8 0,75 0,25 0,5625 0,0625 0,1875
9 10 2,75 2,25 7,5625 5,0625 6,1875
10 12 3,75 4,25 14,0625 18,0625 15,9375
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
81
12 14 5,75 6,25 33,0625 39,0625 35,9375
= 50iX 25,6=X
= 62iY 75,7=Y
= 0ix
= 0iy
= 5,1072ix
= 5,1172iy
= 5,111ii yx
99,0389,1125,111
5,1175,1075,111
1
2
1
2
1 ====
==
=n
ii
n
ii
n
iii
yx
yxr
Hubungan antara X dan Y sebesar 0,99 yang menunjukkan hubungan
yang
sangat kuat dan positif, artinya kenaikan biaya iklan pada
umumnya
menaikkan hasil penjualan.
Koefisien determinasi %989801,02 === rKD artinya sumbangan iklan
terhadap variasi Y (naik turunnya hasil penjualan) adalah 98 %, dan
2 %
sisanya disebabkan oleh faktor-faktor lainnya.
Dengan rumus 2
X Y 2X 2Y XY
1 2 1 4 2
2 4 4 16 8
4 5 16 25 20
5 7 25 49 35
7 8 49 64 56
9 10 81 100 90
10 12 100 144 120
12 14 144 196 168
= 50iX = 62iY = 4202iX = 5982iY = 499iiYX
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
82
= == =
===
=
8
1
28
1
28
1
28
1
2
8
1
8
1
8
1
88
8
i iii
i iii
ii
ii
iii
YYXX
YXYXr
( ) ( )( )( ) ( ) ( ) ( )22 625988504208
62504998
=r
99,0075,899
892940860
892 ===
3. Korelasi Rank (Peringkat) Misalkan ada dua orang Adi dan Bayu
yang sama-sama minuman ringan
dalam kemasan. Kedua orang tersebut diminta untuk memberikan
penilaian
terhadap 10 merk minuman ringan dalam kemasan. Minuman ringan
yang
paling digemari diberi nilai 1 dan seterusnya sampai minuman
ringan yang
tidak disenangi diberi nilai 10. Sehingga dalam hal ini Adi dan
Bayu
memberikan rank (peringkat) terhadap merk minuman ringan
tersebut.
Pemberian peringkat ini dapat juga dibalik, minuman ringan yang
paling
digemari diberi nilai 10 dan seterusnya sampai yang tidak
disenangi diberi
nilai 1. Diperoleh hasil pemberian rank sebagai berikut
No Merk Minuman Ringan Rank dari Adi Rank dari Bayu 1 Coca Cola
9 8 2 Fanta 5 3 3 Sprite 10 9 4 Frestea 1 2 5 Mizone 8 7 6 Pulpy
Orange 7 10 7 Teh Sosro 3 4 8 Pepsi Blue 4 6 9 Fruittea 2 1
10 Tebs 6 5
Untuk menghitung koefisien korelasi antara rank dari Adi dan
Bayu terhadap
10 merk minuman ringan dalam kemasan tersebut digunakan
Koefisien
Korelasi Rank (Rank Spearman).
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
83
( )161 22
=nn
dr irank
dimana
id = selisih dari pasangan rank ke-i
n = banyaknya pasangan rank (dalam hal ini n = 10)
Contoh
Carilah koefisien korelasi rank antara rank Adi dan Bayu dalam
menilai 10
merk minuman ringan.
Penyelesaian
Rank Adi 8 3 9 2 7 10 4 6 1 5
Rank Bayu 9 5 10 1 8 7 3 4 2 6
Selisih Rank (d) -1 -2 -1 1 -1 3 1 2 -1 -1 2d 1 4 1 1 1 9 1 4 1
1
Sehingga
( ) ( )( ) 85,08545,01455,01110010 114161161 22
===++++==
Knn
dr irank
Jadi, koefisien korelasi rank antara rank Adi dan Bayu dalam
menilai 10 merk
minuman ringan sebesar 0,85.
Contoh (Supranto, 1992: 159)
Ada 10 calon sales yang diuji mengenai teknik penjualan. Setelah
mereka
selesai diuji kemudian ditugaskan untuk melakukan penjualan.
Diperoleh data
hasil ujian (X) dan hasil penjualan tahun pertama (Y). Nilai X
dan Y dari 10
sales termasuk rank-nya adalah sebagai berikut.
Sales Nilai Ujian (X)
Rank Hasil Penjualan
(Y)
Rank Selisih Rank (d)
2d
A 48 3 312 2 1 1 B 32 6 164 8 -2 4 C 40 5 280 4 1 1 D 34 7 196 7
0 0
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
84
E 30 8 200 6 2 4 F 50 1,5 288 3 -1,5 2,25 G 26 9 146 10 -1 1 H
50 1,5 361 1 0,5 0,25 I 22 10 149 9 1 1 J 43 4 252 5 -1 1
Karena F dan H memiliki nilai yang sama maka rank mereka harus
sama yaitu
5,12
21 =+ . Mula-mula F diberi nilai 1 dan H diberi nilai 2 (atau
sebaliknya, kemudian dirata-rata). Apabila terdapat 3 objek yang
memiliki nilai yang
sama, maka diurutkan dan dicari rata-ratanya.
Sehingga
( ) ( )( ) 9061,00939,01110010 114161161 22
==++++==
Knn
dr irank
Jadi, koefisien korelasi rank antara rank nilai ujian dan hasil
penjualan sebesar
0,9061.
LATIHAN
1. Berikan contoh pasangan variabel yang memiliki hubungan
positif dan
negatif.
2. Tentukan apakah hubungan variabel X dan Y berikut positif
atau negatif.
Hitung nilai koefisien korelasi dan koefisien determinasi
kemudian
interpretasikan hasilnya.
a. X 2 4 3 8 9 10 15 13
Y 1 2 5 7 8 11 13 14
b. X 1 3 4 7 9 11 13
Y 12 11 9 8 6 5 4
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
85
3. Berikut data nilai hasil ujian mahasiswa matematika Unnes
X : nilai hasil ujian Kalkulus mahasiswa matematika Unnes
Y : nilai hasil ujian Statistika mahasiswa matematika Unnes
X 7 6 8 9 10 5 4 9 7 3
Y 6 8 9 7 9 6 5 8 8 4
Hitung nilai koefisien korelasi dan koefisien determinasi
kemudian
interpretasikan hasilnya.
4. Amat dan Budi diminta untuk memberikan rank berdasarkan suka
dan
tidaknya terhadap merk rokok tertentu. Rokok yang paling
disenangi diberi
nilai 10 dan yang paling tidak disenangi diberi nilai 1.
Diperoleh hasil rank
sebagai berikut.
No Merk Rokok Rank dari Amat Rank dari Budi 1 AAA 2 9 2 BBB 10 4
3 CCC 8 3 4 DDD 3 6 5 EEE 4 5 6 FFF 1 7 7 GGG 5 8 8 HHH 2 6
Hitung koefisien korelasi rank berdasarkan data tersebut!
5. Tabel berikut menunjukkan nilai 10 mahasiswa yang telah
berbentuk rank,
yang diperoleh dari hasil ujian kuliah Statistika dan Praktikum.
Carilah
korelasi ranknya.
Praktikum 8 3 9 2 7 10 4 6 1 5
Statistika 9 5 10 1 8 7 3 4 2 6
-
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
86
DAFTAR PUSTAKA
Hasan, I. 2001. Pokok-Pokok Materi Statistik 2 (Statistik
Inferensif). Edisi Kedua.
Bumi Aksara. Jakarta.
Sudjana. 1996. Metoda Statistika Edisi ke 6. Penerbit Tarsito.
Bandung.
Sugiyono. 2005. Statistik Untuk Penelitian. Penerbit Alfabeta.
Bandung.
Supranto, J. 1992. Statistik Teori dan Aplikasi. Jilid 1.
Erlangga. Jakarta.
Walpole, R & Myers, R. 1986. Ilmu Peluang dan Statistika
Untuk Insinyur dan
Ilmuan. Terjemahan. Penerbit ITB. Bandung.