BAB VIANALISIS KORELASI DAN REGRESI LINIER SEDERHANA
6.0. Tujuan Pembelajaran: Mahasiswa Mampu: 1. Menghitung dan
menginterpretasikan korelasi sederhana antara dua variabel2.
Mengetahui hubungan dua variabel yang tidak linier 3. Menentukan
korelasi dan mengujinya4. Menghitung dan menginterpretasikan
persamaan regresi linier sederhana 5. Mengetahui asumsi yang
digunakan dalam analisa regresi 6. Menentukan Model Regresi yang
Layak 7. Menghitung dan Menginterpretasikan Interval Keyakinan
untuk Koefisien Regresi 8. Mengetahui bahwa analisis regresi dapat
digunakan sebagai alat prediksi 9. Mengetahui bagaimana menerapkan
kasus nyata yang berhubungan dengan analisis regresi secara
benar
6.1. Scatter PlotSebelum menentukan bentuk hubungan dengan
analisis regreis linier atau sebelum mengukur keeratan hubungan
antara dua variabel, harus dilihat apakah variabel-variabel
tersebut mempunyai hubungan linier atau tidak dengan menggunakan
scatter plot seperti yang dibawah ini:
Grafik 1.Scatter Plot (Diagram Pencar)
Dalam scatter plot diatas ada empat kriteria,yaitu:Bila
titik-titik menggerombol mengikuti sebuah garis lurus dengan
kemiringan positif, maka kedua variabel dinyatakan memiliki
hubungan linier positifBila titik-titik menggerombol mengikuti
sebuah garis lurus dengan kemiringan negatif, maka kedua variabel
dinyatakan memiliki hubungan linier negatifBila titik-titik
menggerombol tidak mengikuti garis lurus, maka kedua variabel
dinyatakan tidak memiliki hubungan yang linierBila titik-titik
memencar atau membentuk suatu garis lurus mengikuti sebuah pola
yang acak atau tidak ada pola, maka kedua variabel dinyatakan tidak
memilki hubungan.6.2. Analisis KorelasiAnalisis korelasi digunakan
untuk mengukur kekuatan hubungan linier antara dua variabel.
Koefisien korelasi populasi (rho) adalah ukuran kekuatan hubungan
linier antara dua variabel dalam populasi sedangkan koefisien
korelasi sampel r adalah estimasi dari dan digunakan untuk mengukur
kekuatan hubungan linier dalam sampel observasi. Untuk selanjutnya
r disebut Koefisien Korelasi Pearson Product Momernt.
6.2.1. Korelasi Pearson (Product Moment) Korelasi pearson sering
juga disebut sebagai korelasi produk-momen atau korelasi saja.
Korelasi pearson termasuk ke dalam statistika parametrik. Besarnya
koefisien menggambarkan seberapa erat hubungan linear antara dua
variabel, bukan hubungan sebab akibat. Variabel yang terlibat
dua-duanya bertipe numerik (interval atau rasio), dan menyebar
normal jika ingin pengujian terhadapnya sah. Berikut ini pedoman
menentukan kuat tidaknya korelasi antara dua variabel menurut
Walpole :
Tabel 1.Interval Koefisien Tingkat Hubungan
0.00 0.1990.20 0.3990.40 0.5990.60 0.7990.80 1.000Sangat
rendahRendahCukupKuatSangat Kuat
Menurut Sarwono (2006) Batas-batas nilai koefisien korelasi
diinterpretasikan sebagai berikut:
Tabel 2.Interval HubunganTingkat Hubungan
0Tidak ada korelasi antara dua variabel
>0 0,25Korelasi sangat lemah
>0,25 0,5Korelasi cukup
>0,5 0,75Korelasi kuat
>0,75 0,99Korelasi sangat kuat
1Korelasi sempurna
Hasil dari analisis korelasi menunjukkan kekuatan atau kelemahan
dari suatu hubungan.Nilai koefisien korelasi ini akan berada pada
kisaran -1 sampai dengan +1. Koefisien korelasi minus menunjukkan
hubungan yang terbalik, dimana pengaruh yang terjadi adalah
pengaruh negatif. Dalam pengaruh yang negatif ini kenaikan suatu
variabel akan menyebabkan penurunan suatu variabel yang lain,
sedangkan penurunan suatu variabel akan menyebabkan kenaikan
variabel yang lain.Koefisien korelasi positif menunjukkan hubungan
yang searah dari dua variabel, dimana kenaikan suatu variabel akan
menyebabkan kenaikan variabel yang lain dan sebaliknya penurunan
suatu variabel akan menyebabkan penurunan variabel yang
lain.Koefisien korelasi sebesar nol menunjukkan tidak adanya
hubungan antara dua variabel, dengan kata lain kenaikan atau
penurunan suatu variabel tidak mempengaruhi variabel yang lain,
jadi berapapun perubahan harga pada suatu variabel tidak akan
mempengaruhi variabel yang lain karena nilainya yang tetap.Terdapat
bermacam-macam analisis korelasi yang dapat digunakan untuk
mengukur hubungan asosiatif dari suatu variabel. Korelasi yang akan
digunakan tergantung pada jenis data yang akan dianalisis. Korelasi
berdasarkan tingkatan data dapat dilihat pada tabel berikut
ini:
Tabel.3 Korelasi Berdasarkan Tingkatan DataTipe / Tingkat
DataTeknik Korelasi yang Digunakan
NominalKoefisien Kontingensi
OrdinalSpearman RankKendal Tau
Interval dan rasioPearson / Produk MomenKorelasi GandaKorelasi
Parsial.
Koefisien korelasi pearson diformulasikan sebagai berikut:
Atau: Atau: dimana: r = Koefisien Korelasi Sampel n = Ukuran
Sampel x = Nilai dari Variabel Independen y = Nilai Variabel
dependen
Dari persaamaan korelasi yang terakhir tersebut dapat dilihat
adanya hubungan antara b dan r. r digunakan untuk mengukur hubungan
linier antara x dan y, sedangkan b mengukur perubahan dalam y
akibat perubahan setiap unit x.Dalam kasus dimanai r1 = 0,3 dan r2
= 0,6 hanya berarti bahwa terdapat korelasi positif dimana r2 lebih
kuat daripada r1. Adalah salah jika menyimpulkan bahwa r2
mengindikasikan hubungan linier dua kali lebih baik dibandingkan
dengan r1.
6.2.2.Koefisien DeterminansiKoefisien determinansi adalah salah
satu alat analisis yang dapat digunakan untuk mengetahui lebih jauh
hubungan antar variabel. Koefisien determinansi disimbolkan dalam
R2 yang menyatakan proporsi variansi keseluruhan dalam nilai
variabel dependen yang dapat diterangkan oleh hubungan linier
dengan variabel independen atau menunjukkan proporsi total variasi
dalam nilai variabel dependen yang dapat dijelaskan oleh hubungan
linier dengan nilai variabel independen. Nilai koefisien
determinansi ini berkisar : juga dapat digunakan untuk
mempertimbangkan sebuah model regresi. Jika suatu model besar belum
tentu model tersebut adalah model yang baik, tetapi jika MSE model
kecil maka model teresbut adalah model regresi yang
terbaik.Koefisien determinasi biasanya dinyatakan dengan persen.
Sedangkan penafsirannya jika 0.994 sehingga R2 = 0.989 atau 98.9%
adalah pengaruh variabel bebas terhadap perubahan variabel terikat
adalah 98,9%, sedangkan sisanya sebesar 1,1% dipengaruhi oleh
variabel lain selain variabel bebas X. Koefisien determinasi banyak
digunakan dalam penjelasan tambahan untuk hasil perhitungan
koefisien regresi.
6.2.3. Korelasi GandaKorelasi ganda adalah korelasi yang
menunjukkan arah dan kuatnya hubungan antara dua atau lebih
variabel terikat secara bersama-sama dengan variabel yang lain
(variabel bebas). Contohnya: hubungan antara kesejahteraan pegawai,
hubungan dengan pemimpin, dan pengawasan dengan efektivitas
kerja.
Korelasi berganda merupakan korelasi dari beberapa variabel
bebas secara serentak dengan variabel terikat. Misalkan ada k
variabel bebas, dan satu variabel terikat Y dalam suatu persamaan
regresi linear maka besarnya korelasi bergandanya adalah :
dengan
6.2.4. Korelasi ParsialKorelasi parsial adalah korelasi yang
menunjukkan arah dan kuatnya hubungan atau pengaruh antara dua
variabel atau lebih (variabel bebas dan terikat) setelah satu
variabel yang diduga dapat mempengaruhi hubungan variabel tersebut
dikendalikan untuk dibuat tetap keberadaannya.Persamaan korelasi
antara x1 dengan y, bila variabel x1 dikendalikan atau korelasi
antara x1 dengan y bila x2 tetap yaitu :
Dimana : = korelasi antara x1 dengan x2 secara bersama-sama
dengan variabel y = korelasi product moment antara x1 dengan y =
korelasi product moment antara x2 dengan y = korelasi product
moment antara x1 dengan x2
6.3. Uji Hipotesis KorelasiPengujian hipotesis korelasi
bertujuan untuk mengetahui apakah terdapat hubungan antara dua
variabel tertentu. Perumusan hipotesis untuk korelasi adalah
sebagai berikut: H0: Tidak ada hubungan linier yang signifikan
antara dua variabel H1: Ada hubungan linier yang signifikan antara
dua variabel Atau H0: = 0 H1: 0 Statistik uji:Statistik uji
menggunakan uji-T, yakni dengan menggunakan rumus sebagai berikut:
atau Kriteria uji Tolak H0 jika thitung > ttabel atau thitung
< -ttabel Kesimpulan
Sementara untuk menguji hipotesis koefisien korelasi dengan
menggunakan koefisien korelasi taksiran (, dapat digunakan
hipotesis sebagai berikut: dimana Statistik uji:
(uji satu sisi) atau (uji dua sisi) Kriteria uji: Tolak H0 jika
zhitung > ztabel atau zhitung < -ztabel Kesimpulan
6.4.Analisis Regresi Dalam kehidupan sehari-hari, seringkali
dijumpai kasus yang berhubungan dengan dua variabel atau lebih.
Hubungan tersebut dapat berupa hubungan kausal atau hubungan
fungsional. Hubungan kausal misalnya : hubungan antara panas dengan
tingkat muai panjang, sedangkan hubungan fungsional contohnya:
hubungan antara kepemimpinan dengan tingkat kepuasan kerja pegawai.
Secara umum terdapat dua macam hubungan antara dua variabel atau
lebih, yaitu : Keeratan hubungan dapat diketahui dengan analisis
korelasi (bukan hubungan sebab-akibat)Bentuk hubungan dapat
diketahui dengan analisis regresi
6.4.1. Sejarah RegresiSejarah Regresi dimulai ketika Sir Francis
Galton (1822-1911) yang membandingkan tinggi badan anak laki-laki
dengan tinggi badan ayahnya. Galton menunjukkan bahwa tinggi anak
laki-laki dari ayah yang tinggi setelah beberapa generasi cenderung
mundur (regressed) mendekati nilai populasi. Dengan kata lain, anak
laki- laki dari ayah yang badannya sangat tinggi, cenderung lebih
pendek dari ayahnya. Sedangkan anak laki-laki dari ayah yang
badannya sangat pendek cenderung lebih tinggi dari ayahnya.
Sekarang istilah regresi diterapkan pada semua peramalan.
6.4.2. Definisi RegresiRegresi merupakan salah satu metoda dalam
analisis statistika yang digunakan untuk menganalisis dan
memodelkan secara matematis hubungan diantara dua variabel atau
lebih. Pada analisis regresi ini dikenal adanya variabel dependen
(variabel tak bebas/variabel tergantung/Unknown Variable/Response
Variable) dan variabel independen (variabel bebas/ Explanatory
Variable/Regressor Variable/Predictor Variabls/). Regresi dipakai
untuk mengukur besarnya pengaruh perubahan pada variabel dependen
yang diakibatkan perubahan pada variabel independen. Menurut
Gujarati (2006) analisis regresi merupakan suatu kajian terhadap
hubungan satu variabel yang disebut sebagai variabel yang
diterangkan (the explained variabel) dengan satu atau dua variabel
yang menerangkan (the explanatory). Variabel pertama disebut juga
sebagai variabel tergantung dan variabel kedua disebut juga sebagai
variabel bebas. Jika variabel bebas lebih dari satu, maka analisis
regresi disebut regresi linear berganda. Disebut berganda karena
pengaruh beberapa variabel bebas akan dikenakan kepada variabel
tergantung. Saat ini, analisis regresi banyak digunakan untuk
menelaah hubungan dua variabel atau lebih dan menentukan pola
hubungan yang modelnya belum diketahui, sehingga regresi secara
aplikatif lebih bersifat eksploratif.
6.4.3. AsumsiPenggunaan regresi linear sederhana didasarkan pada
asumsi diantaranya sbb: Error () independen secara statistik
Distribusi probabilitas dari Error berdistribusi Normal Distribusi
probabilitas dari Error(*) mempunyai variansi yang konstan Ada
hubungan linier antara kedua variabelCatatan (*): Residual adalah
selisih antara nilai duga (predicted value) dengan nilai pengamatan
sebenarnya apabila data yang digunakan adalah data sampel. Error
adalah selisih antara nilai duga (predicted value) dengan nilai
pengamatan yang sebenarnya apabila data yang digunakan adalah data
populasi. Persamaan keduanya : merupakan selisih antara nilai duga
(predicted value) dengan pengamatan sebenarnya. Perbedaan keduanya:
residual dari data sampel, error dari data populasi.
6.4.5. Analisis Regresi Linier SederhanaRegresi linier sederhana
ini bertujuan untuk mempelajari hubungan antara dua variabel yaitu
satu variabel bebas/variabel independen (X) dan variabel
terikat/variabel dependen (Y). Bentuk umum dari pesamaan regresi
linier sederhana dari populasi adalah: Persamaan garis regresi
sampel memberikan estimasi garis regresi populasi sebagai berikut:
Keterangan : = nilai estimasi dari variabel bebas. juga merupakan
variabel terikat (dependen variable)a = konstanta yang merupan
nilai estimasi jika nilai x=0 (intercept)b = koefisien
regresi/gradient garis regresi (slope)x = variabel bebas
(independent variable)
6.4.5.1. Metode Kuadarat Terkecil (Least-Squares Method)Metode
untuk menaksir dan sehingga jumlah kuadrat dari deviasi simpangan
antara observassi-observasin dan garis regresi menjadi minimum:
Dimana adalah nilai sisaan/galat/error yang merupakan
penyimpangan model regresi dari nilai yang sebenaranya.
Gambar VI.2 Grafik Regresi Linier dengan Nilai
Dengan cara mendeferensialkan persamaan di atas terhadap dan
kemudian terhadap , kemudian menyamakan hasil pendeferensilan itu
dengan nol, maka:
Dari persamaan di atas, maka diperoleh persamaan: atau atau
atau
Dari persamaan di atas disubstitusi, maka diperoleh persamaan
untuk menentukan nilai a: a =
atau: a = bDimana: = rata rata yi = rata rata xi
6.4.5.2. Partisi dari Varians TotalEstimasi parameter
menghasilkan variansi yang disebabkan karena kesalahan model dan
variansi yang disebabkan karena kesalahan eksperimen. Dekomposisi
varians dapat dijabarkan sebagai berikut:SST = SSR + SSE
Keterangan:SST = Sum of Square Total / Jumlah Kuadrat Total =SSR =
Sum of Square Regression / Jumlah Kuadrat Regresi = bSSE = Sum of
Square Eror / Jumlah Kuadrat Eror = b
Dimana :
6.4.5.3. Estimasi dari Sum of Square Error (SSE) merupakan
variansi yang menggambarkan penyimpangan dari nilainilai observasi
di sekitar garis regresi sampel. Nilai SSE () atau yang biasa
disebut MSE (Mean Squared Error) adalah estimasi dari dan
diestimasi dengan persamaan berikut: = S = = =
Standar Error Koefisien RegresiJika diambil sampel x dan y dari
populasi, maka masingmasing sampel tersebut memiliki gradien/slope
(b) sendiri. Gradien sampel tersebut akan bervariasi disekitar
nilai koefisien regresi tersebut. Maka perlu diketahui variasi
koefisien regresi tersebut dengan persamaan berikut:
6.4.5.3. Standar Error untuk bila nilai x diketahuiJika nilai x
dimasukkan berulangulang pada persamaan regresi, maka nilai
ratarata yang diperoleh tidak akan sama, yang artinya nilai
bervariasi. Sehingga nilai standar error dapat ditentukan dengan
persamaan berikut (bila x diketahui): =
6.4.6.Uji Parsial Parameter RegresiDigunakan untuk menguji
apakah parameter berarti pada model secara parsial.Tahapan uji yang
dilakukan: Hipotesis:H0 : = 0H1 : 0 Statistik Uji: Pengambilan
Keputusan: Tolak H0 jika thitung > t a/2(df= n-2) pada selang
kepercayaan Kesimpulan
6.4.7. Uji Intersep Model RegresiTahapan uji yang dilakukan:
Hipotesis:H0 : = 0H1 : 0 Statistik Uji: Pengambilan KeputusanTolak
H0 jika thitung > t a/2(db= n-2) pada selang kepercayaan
Kesimpulan
6.4.8. Selang KepercayaanSelang Kepercayaan untuk :
Selang Kepercayaan untuk :
6.4.9.PrediksiEstimasi selang keyakinan untuk Rata-rata y,
diberikan pada saat xp
Estimasi selang keyakinan untuk Nilai individual y diberikan
pada saat xp
6.5. Pemilihan Model RegresiPenentuan model regresi linier
sederhana ditekankan pada konsep linieritasnya dengan asumsi awal
bahwa hubungan tersebut linier diparamater regresinya. Pemilihan
variabel independen yang kurang tepat dapat menimbulkan bias dalam
estimasinya. Tahapan uji yang dilakukan: HipotesisH0 : = 0H1 : 0
Tentukan daerah kritis dengan Level of Significance () yang biasa
digunakan adalah 0,01 atau 0,05Tabel VI.1 Analysis of
VarianceSumberVariansiSSdfMSFhitung
RegresiSSR1MSR = SSR/1MSR/s2
ErrorSSEn 2S2 = SSE/n-2
TotalSSTn 1
Pengambilan KeputusanTolak H0 jika Fhitung > Ftabel(1 , n-2)
pada selang kepercayaan (level of significance) Kesimpulan
6.5.1 Pendekatan Analisis Varians (Anova)Untuk menguji kelayakan
dari suatu model regresi digunakan pendekatan analisis
varians.Analisis varians adaah suatu prosedur membagi variansi
total variabel dependen menjadi dua komponen, yaitu: variansi model
sistematik dan variansi error.
6.6. Analisis ResidualAnalisis residual dapat dilakukan
dengan:a. Pengujian Unequal variances: Varians pada setiap nilai x
harus identik, yaitudengan melakukan plot dengan , apabila terdapat
pola-pola tertentu berarti varians tidak identik sehingga perlu
distabilkan dengan transformasi.
b. Pengujian Non normal error,yaitu dengan: Stem and leaf
Histogram Dot diagram Plot normal (Normal Probability Plot)c. Jika
terdapat extreme skewness (kemiringan yang ekstrim) pada data, maka
tidak berdistribusi normal.d. Pengujian Correlated Error
(independent), yaitu dengan melihat plot dengan time order (i).
Jika ada pola tertentu, maka terjadilah dependent residual dimana
penyebabnya dapat karena kesalahan eksperimen atau kesalahan dalam
pembentukan model atau karena variabel prediktor yang diabaikan.e.
Pengecekan Ouliers residual yaitu dengan cara plot residual dalam
batas pengujian 3 ( dengan ).Apabila residual terletak di luar
batas 3 atau nilainya lebih besar dari 3, maka ada indikasi
outlier.
6.7. Pengujian Linieritas Regresi:untuk data dengan observasi
berulangPada beberapa percobaan untuk mendapatkan hasil yang akurat
seringkali dilakukan pengulangan observasi untuk setiap nilai x,
sehingga perlu dilakukan pengujian apakah model yang dihasilkan
sudah memenuhi atau tidak. Untuk menggambarkan kondisi tersebut
diatas dilakukan pengujian kecocokan model dengan pendekatan Lack
Of Fit.
6.7.1. Pengujian Lack Of Fit Sum of squared error terdiri atas
dua komponen, yaitu variasi random yang muncul antar nilai y untuk
setiap nilai x (pure experimental error) dan komponen yang dikenal
dengan istilah Lack Of Fit (LoF), untuk mengukur ketepatan
model.Prosedur Pengujian: HipotesisH0 : Tidak ada LoFH1 : Ada LoF
Model Linier tidak sesuai Tentukan daerah kritis dengan Level of
Significance () yang biasa digunakan adalah 0,01 atau 0,05 Hitung
Pure Error sum of square () dengan df = n k
Tabel VI.2 Analysis of VarianceSumberVariansiSSdfMSFhitung
RegresiSSR1MSR = SSR/1MSR/s2
Error:SSEn 2S2 = SSE(/n-2)
LofPure errorSSE - k - 2(SSE
n - kS2= /(n-k)
TotalSST n
Pengambilan KeputusanTolak H0 jika Fhitung > Ftabel(k-2 ,
n-k) pada selang kepercayaan (level of significance) Kesimpulan
Contoh 1nilai 9 mahasiswa dari suatu kelas pada ujian tengah
semester (x) dan pada ujian akhir semester (y) sebagai berikut
:n123456789
xi775071728194969967
yi826678344785999968
a. Tentukan persamaan garis regresi linear.b. Tentukan nilai
ujian akhir seorang murid yang mendapat nilai 85 pada ujian tengah
semester.Jawab : persamaan regresi linearn123456789
xi775071728194969967707
yi826678344785999968658
xiyi63143300553824483807799095049801455653258
xi259292500504151846561883692169801448957557
Sehingga b = = 0,777142dana = = 12,06232jadi, persamaan regresi
linear adalah = 12,06232 + 0,777142xx = 85 = 12,06232 +
(0,777142)(85) = 78,11936Contoh 2Lakukan uji regresi dengan
pendekatan ANOVA pada :x3,42,82,53,73,23,12,932,22,42,7
y2520182521223022102017
Jawab : x = 31,9y = 230 xiyi = 675,5 xi2 = 94,49 yi2 = 4866 =
2,9 = 20,9091b = 0,777142a = 12,06232Sxx = xi2 n()2 = 1,98Sxy =
xiyi n()= 8,4997Syy = yi2 n()2 = 56,9049SSR = b2 Sxx = 36,4894SSE =
Syy SSR = 20,4155 Hipotesis H0 : = 0H1 : 0 = 0.05 Tabel Anaysis of
VarianceKomponenRegresiSSdfMSFhitung
Regresi36,49136,4916,08276
Error20,4292,27
Total56,904910
Pengambilan KeputusanF tabel = F(0.05;1,9) = 5,12Karena Fhitung
> Ftabel maka Ho ditolak Kesimpulan:Model Regresi linier
sesuai
Contoh 3 Berikut adalah data jumlah biaya promosi (x) dan jumlah
penjualan (y) pada perusahaan ABC.TahunJumlah Biaya Promosi
x)Jumlah Penjualan (y)
20052230
20063638
20073135
20083237
20093134
20103238
Tentukanlah apakah terdapat hubungan antara biaya promosi dengan
penjualan menggunakan uji korelasi Spearman Rank dan tingkat
kesalahan 1%!Jawab:TahunJumlah Biaya Promosi (x)Jumlah Penjualan
(y)Range xRange y
200522301100
2006363865.50.50.25
200731352.53-0.50.25
200832374.540.50.25
200931342.520.50.25
201032384.55.5-11
2
Uji Hipotesis:H0: Tidak ada hubungan yang signifikan antara
variabel biaya promosi dengan variabel penjualanH1: Ada hubungan
yang signifikan antara variabel biaya promosi dengan variabel
penjualan.
Statistika uji:
Kriteria uji: Karena thitung > ttabel maka tolak
H0Kesimpulan: Karena tolak H0 maka terima H1 yakni ada hubungan
yang signifikan antara variabel biaya promosi dengan variabel
penjualan
LATIHAN SOAL:
1. Data berikut menyatakan IQ=X untuk kelompok anak berumur
tertentu dan hasil ujian prestasi pengetahuan umum
(Y).XiYiXiYiYiYi
1141101131371161329012110712012592294148735580407543645331130142137140125134106121111126951057168696639784959666746479689105125107971341069998117100453250575948554547594749
a. Gambar diagram pencarnya.b.Tentukn regresi linear Y atas X
lalu gambarkan.c.Jelaskan arti koefisien arah yang didapat.d.Berapa
rata-rata prestasi anak dapat diharapkan jika IQ nya 120?e.Tentukan
interval kepercayaan 95% untuk rata-rata prestasi anak dengan
IQ=120. Jelaskan artinya!f. Tentukan interval kepercayaan 95% untuk
seorang anak dengan IQ=120. Jelaskan artinya!g.Tentukan interval
kepercayaan 95% untuk perubahan rata-rata prestasi jika IQ berubah
dengan satu unit.h.Perlukah diambil model berbentuk lain?i.Asumsi
apakah yang harus diambil untuk menyelesaikan pertanyaan-pertanyaan
diatas?
2. Dari tabel berikut ini:X (oC)Y (gram)
0868
15121014
30252124
45313328
60443942
75485144
Carilah persamaan garis regresiGambarkan garis tersebut pada
diagram pencarTaksirlah banyaknya senyawa yang larut dalam 100 g
air pada 50oC.
3. Lakukan uji model regresi pada soal no.1.
4. Berikut adalah data banyaknya modal (dalam juta rupiah) dan
keuntungan yang diperoleh (dalam juta rupiah) yang dihasilkan dalam
waktu 10 bulan.
Modal (x)189204192214218178189167180194
Keuntungan (y)10151317191413111315
a. Hitunglah koefisien korelasi Pearson dan determinasi
berdasarkan data di atas dan ujiah!b. Tentukan apakah pernyataan
bahwa koefisien korelasi antara jumlah karyawan dan keuntungan
tidak lebih dari 0,7 adalah benar! Gunakan tingkat kesalahan
5%!
5. Hitunglah koefisien korelasi kondisi temperatur (x) dan
kepuasan pekerja (y) serta apakah ada hubungan yang signifikan
antara keduanya dengan menggunakan teknik korelasi pearson!
nKondisi temperatur (x)KepuasanKerja (y)
1820
21220
31017
4718
5819
6720
71218
81019
91216
10917
111016
121217
131218
141212
151217
6. Dibawah ini diberikan data yang secara acak diambil dari
populasi normal bervariabel dua (X dan Y).
XYXYXY
151310111612912481081069911013597749820.6981117201218161318115675137163841491401371701091768536145151615373952624509635132141
Regresi Linier BergandaAnalisis regresi linier berganda
digunakan untuk menganalisis hubungan antara variabel bebas (x) dan
variabel terikat (y). Namun pada regresi linier berganda ini,
variabel bebas (x) yang digunakan lebih dari dari satu. Bentuk
persamaan umum untuk model regresi linier berganda:= a +
Keterangan: = nilai dari variabel terikata = konstata nilai
estimasi jika nilai x=0 (intercept) = koefisien regresi gradient
garis regresi (slope) = variabel bebas
Metode Kuadarat Terkecil (Least-Squares Method)Untuk setiap
pengamatan akan memenuhi persamaan:= a + Dengan menggunakan metode
kuadrat terkecil, maka diperoleh persamaan:= - a -
Dengan syarat meminimasikan nilai a, , dan penurunannya, maka
diperoleh persamaan: = an + +
= a + + = a + +
Asumsi yang digunakan dalam analisis regresi linier berganda
antara lain:a. Setiap nilai error berdistribusi normal dengan
ratarata 0 dan dan varians 2b. Bersifat homoskedastisitasc.
Kovarian error = 0, tidak terjadi autokorelasid. Tidak terdapat
multikolinieritas, artinya tidak terdapat hubungan linier yang
sempurna diantara variabelvariabel bebas.
Latihan soal 1. Dari tabel berikut ini:X (oC)Y (gram)
0868
15121014
30252124
45313328
60443942
75485144
a. Carilah persamaan garis regresib. Gambarkan garis tersebut
pada diagram pencarc. Taksirlah banyaknya senyawa yang larut dalam
100 g air pada 50oC.
2. Lakukan uji model regresi pada soal no.1.
Penyederhanaan dua persamaan tersebut di atas menghasilkan
persamaan normal kuadrat terkecil sebagai berikut:
dan
Scatter PlotBAB 11-23
Hubungan Linier PositifHubungan Linier NegatifTidak Ada
Hub.linierTidak ada Hubungan 2010 Hermita Dyah Puspita