Mata kuliah KOMPUTASI ELEKTRO BAB 5 ANALISIS REGRESI Dalam analisis data sering dilakukan pembuatan suatu kurve yang dapat mewakili suatu rangkaian data yang diberikan dalam suatu sistem koordinat x-y. Data tersebut dapat berupa hasil percobaan di laboratorium atau pengamatan di lapangan. Karena adanya kesalahan-kesalahan atau ketidakpastian dalam pengujian, pengukuran atau variasi perubahan data dari waktu ke waktu, maka titik-titik data tersebar dalam koordinat x-y. Dalam analisis regresi akan dibuat kurve atau fungsi berdasarkan sebaran titik data. Kurve yang terbentuk diharapkan dapat mewakili titik-titik data tersebut. Seringkali, setelah kurve terbentuk, dilakukan pula ekstrapolasi untuk mendapatkan nilai y yang berkaitan dengan nilai x yang berada di luar rangkaian data yang ada. Metode yang akan digunakan untuk membuat kurve tersebut adalah metode kuadrat terkecil (least square method). Metode tersebut memungkinkan untuk membuat kurve yang paling mendekati titik-titik data. Gambar 5.1, adalah penyebaran titik-titik data hasil dari suatu percobaan pada sistem koordinat x-y. Penetapan bentuk kurve, apakah linier (garis lurus) atau lengkung (logaritmik atau berpangkat), tergantung dari kecenderungan (trend) dari penyebaran titik data, seperti pada Gambar 5.1a. dan 5.1b. Seringkali dijumpai adanya beberapa data yang mempunyai kesalahan sangat besar seperti titik A dan titik B pada Gambar 5.1. Pembuatan kurve dengan menggunakan titik A dan B pada gambar akan menghasilkan nilai yang juga mempunyai kesalahan, oleh karena itu data A dan B dapat dihilangkan. Jurusan Teknik Elektro ISTA Yogyakarta 54
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Mata kuliah KOMPUTASI ELEKTRO
BAB 5ANALISIS REGRESI
Dalam analisis data sering dilakukan pembuatan suatu kurveyang dapat mewakili suatu rangkaian data yang diberikan dalamsuatu sistem koordinat x-y. Data tersebut dapat berupa hasilpercobaan di laboratorium atau pengamatan di lapangan. Karenaadanya kesalahan-kesalahan atau ketidakpastian dalampengujian, pengukuran atau variasi perubahan data dari waktuke waktu, maka titik-titik data tersebar dalam koordinat x-y.Dalam analisis regresi akan dibuat kurve atau fungsiberdasarkan sebaran titik data. Kurve yang terbentukdiharapkan dapat mewakili titik-titik data tersebut.Seringkali, setelah kurve terbentuk, dilakukan pulaekstrapolasi untuk mendapatkan nilai y yang berkaitan dengannilai x yang berada di luar rangkaian data yang ada. Metode yang akan digunakan untuk membuat kurve tersebutadalah metode kuadrat terkecil (least square method). Metodetersebut memungkinkan untuk membuat kurve yang palingmendekati titik-titik data.Gambar 5.1, adalah penyebaran titik-titik data hasil darisuatu percobaan pada sistem koordinat x-y. Penetapan bentukkurve, apakah linier (garis lurus) atau lengkung (logaritmikatau berpangkat), tergantung dari kecenderungan (trend) daripenyebaran titik data, seperti pada Gambar 5.1a. dan 5.1b.Seringkali dijumpai adanya beberapa data yang mempunyai
kesalahan sangat besar seperti titik A dan titik B padaGambar 5.1. Pembuatan kurve dengan menggunakan titik A dan Bpada gambar akan menghasilkan nilai yang juga mempunyaikesalahan, oleh karena itu data A dan B dapat dihilangkan.
Jurusan Teknik Elektro ISTA Yogyakarta 54
Mata kuliah KOMPUTASI ELEKTRO
Gambar 5.1. Plot data pengukuran
5.1 Metode Kuadrat Terkecil (least square method)Gambar 5.2, menunjukkan sebaran dari titik-titik datahasil pengukuran pada bidang x-y. Akan dicari suatu kurve g(x) yang dapat mewakili titik percobaan tersebut. Caratermudah adalah membuat kurve secara visual yang merupakanfungsi terbaik g (x) yang digambarkan oleh titik-titikdata. Tetapi cara ini tidak bisa memberikan hasil yangmemuaskan, terutama apabila penyebaran titik data cukupbesar. Diinginkan suatu metode yang lebih pasti untukmendapatkan kurve tersebut, yaitu dengan membuat kurveyang meminimumkan perbedaan (selisih) antara titik-titikdata dan kurve. Teknik untuk mendapatkan kurve tersebutdikenal dengan regresi kuadrat terkecil.
Gambar 5.2. Kurve mewakili titik-titik data
Teknik tersebut dilakukan dengan prosedur berikut ini:
1) Titik-titik percobaan digambar pada suatu sistemkoordinat. Dari gambar sebaran titik data tersebut dapatdiketahui trend (pola) secara umum dari kumpulan titikdata, sehingga dapat ditentukan apakah kurve yangmewakili berupa garis lurus (linier) atau lengkung.
2) Dipilih suatu fungsi g (x) yang dianggap bisa mewakili f(x) yang mempunyai bentuk umum berikut ini:
Jurusan Teknik Elektro ISTA Yogyakarta 55
Mata kuliah KOMPUTASI ELEKTRO
g (x) = a0 + a1 x + a2 x2 + … + ar xr
(5.1)
Fungsi tersebut tergantung pada parameter a0, a1, …,
ar.
3) Ditentukan parameter a0, a1, …, ar sedemikian rupasehingga g (xi ; a0, a1, …, ar) melalui sedekat mungkintitik-titik data. Bentuk g (xi ; a0, a1, …, ar) mempunyaiarti fungsi g (xi) dengan parameter a0, a1, …, ar.
4) Apabila koordinat dari titik-titik percobaan adalah M(xi , yi), dengan nilai i = 1, 2, …, n maka selisihordinat antara titik-titik tersebut dengan fungsi g (xi ;a0, a1, …, ar) adalah:
Ei = Mi Gi = yi – g (xi ; a0, a1, …, ar)
= yi – (a0 + a1 xi + a2 xi 2 + a3 xi 3 + … + ar xi r)
5) Dipilih suatu fungsi g (x) yang mempunyai kesalahan Ei
terkecil. Dalam metode ini jumlah kuadrat dari kesalahanadalah terkecil.
(5.2)
6) Dicari parameter a0, a1, …, ar sedemikian sehingga D2
adalah minimum. Nilai D2 akan minimum apabila turunanpertamanya terhadap a0, a1, …, ar adalah nol, sehingga:
(5.3)
Jurusan Teknik Elektro ISTA Yogyakarta 56
Mata kuliah KOMPUTASI ELEKTRO
7) Penyelesaian dari persamaan (5.3) akan memberikan hasilparameter a0, a1, …, ar. Dengan demikian persamaan kurveterbaik yang mewakili titik-titik data telah diperoleh.
5.2 Metode Kuadrat Terkecil Untuk Kurve LinierBentuk paling sederhana dari regresi kuadrat terkeciladalah apabila kurve yang mewakili titik-titik datamerupakan garis lurus, sehingga persamaannya adalah:
g (x) = a + bx (5.4)
Dalam hal ini, a0 = a dan a1 = b.Jumlah kuadrat dari kesalahan dihitung dengan persamaan
(5.2):
(5.5)
Agar nilai D2 adalah minimum, maka persamaan (5.5)diturunkan terhadap parameter a dan b, kemudian disama-dengankan nol.Turunan pertama terhadap parameter a adalah:
(5.6)
Turunan pertama terhadap parameter b adalah:
(5.7)
Jurusan Teknik Elektro ISTA Yogyakarta 57
Mata kuliah KOMPUTASI ELEKTRO
Penjumlahan masing-masing suku persamaan (5.6) dan (5.7)adalah dari 1 hingga n.Persamaan (5.6) dan (5.7) dapat ditulis dalam bentuk:
(5.8)
(5.9)
dengan a = n aSelanjutnya persamaan (5.8) dapat ditulis menjadi:
n a = yi xi b
a = (5.10)
a =
atau
a = (5.11)
Interpolasi persamaan (5.10) ke dalam persamaan (5.9),
atau
(5.12)
Dengan menggunakan persamaan (5.11) dan persamaan (5.12)untuk menghitung koefisien a dan b, maka fungsi g (x) dapatdicari.Persamaan garis lain, selain persamaan (5.4) memberikanjumlah kuadrat kesalahan yang lebih besar, namun persamaan(5.4) adalah perkiraan terbaik dari data. Untuk mengetahuiderajat kesesuaian dari persamaan yang didapat, dihitungnilai koefisien korelasi yang berbentuk:
Jurusan Teknik Elektro ISTA Yogyakarta 58
Mata kuliah KOMPUTASI ELEKTRO
(5.13)
dengan r adalah koefisien korelasi, sedang D2 dan Dt2
diberikan oleh bentuk:
Nilai r bervariasi antara 0 dan 1, untuk perkiraan yangsempurna nilai r = 1, bila r = 0 perkiraan suatu fungsisangat jelek. Koefisien korelasi ini juga dapat digunakanuntuk memilih suatu persamaan dari beberapa alternatifyang ada, terutama di dalam regresi garis tidak lurus.Kurve lengkung dapat didekati dengan beberapa tipepersamaan, misalnya bentuk y = a xb; y = a eb; y = a0 + a1 x+ a2 x2, atau persamaan lain. Dari beberapa alternatiftersebut dipilih persamaan yang mempunyai nilai koefisienkorelasi terbesar (paling mendekati 1).
Contoh soal:
Tentukan persamaan garis yang mewakili data berikut.
x 4 6 8 10 14 16 20 22 24 28
y 30 18 22 28 14 22 16 8 20 8 PenyelesaianPenggambaran titik-titik data pada sistem koordinat x-ydiberikan dalam Gambar 5.3, yang dapat diwakili oleh garis
Jurusan Teknik Elektro ISTA Yogyakarta 59
Mata kuliah KOMPUTASI ELEKTRO
lurus. Penyelesaian dilakukan dengan menggunakan Tabel5.1.
Gambar 5.3. Sebaran titik-titik data pada sistem koordinat
Dari hitungan dalam Tabel 5.1, nilai rerata dari x dan y
adalah:
Persamaan garis yang mewakili titik-titik data adalah:y = a + bx
Tabel 5.1. Hitungan regresi linier
No xi yi xi yi xi2
12345678910
46810141620222428
301822281422168208
120108176280196352320176480224
163664100196256400484576784
152 186 2432
2912
dengan:
Jadi persamaan garis adalah:
Jurusan Teknik Elektro ISTA Yogyakarta 60
Mata kuliah KOMPUTASI ELEKTRO
5.3 Linierisasi Kurve Tidak LinierDalam praktek sering dijumpai bahwa sebaran titik-titikpada sistem koordinat mempunyai kecenderungan (trend) yangberupa kurve lengkung, sehingga persamaan (5.4) tidak bisalangsung digunakan. Gambar 5.4, menunjukkan sebaran datapada sistem koordinat x-y. Dalam Gambar 5.4a, titik datadiwakili oleh kurve linier, sedang Gambar 5.4b, diwakilioleh kurve lengkung. Terlihat bahwa pendekatan dengankurve lengkung memberikan hasil yang lebih baik daripadagaris lurus (kurve linier). Agar persamaan regresi linierdapat digunakan untuk mempresentasikan kurve lengkung,maka perlu dilakukan transformasi koordinat sedemikianrupa sehingga sebaran titik data bisa dipresentasikandalam kurve linier.Berikut ini diberikan dua fungsi transformasi data yangbisa digunakan, yaitu fungsi eksponensial dan fungsiberpangkat.
1) Persamaan berpangkat
Persamaan berpangkat diberikan oleh bentuk berikut ini.(5.14)
dengan a2 dan b2 adalah koefisien konstan.
Gambar 5.4. Titik data didekati dengan garis lurus dan
lengkung
Persamaan tersebut dapat dilinier-kan dengan menggunakanfungsi logaritmik sehingga didapat:
log y = b2 log x + log a2 (5.15)
yang merupakan hubungan log-log antara log y dan log x.Persamaan tersebut mempunyai bentuk garis lurus dengan
Jurusan Teknik Elektro ISTA Yogyakarta 61
Mata kuliah KOMPUTASI ELEKTRO
kemiringan b2 dan memotong sumbu log y pada log a2.Gambar 5.5, menunjukkan transformasi dari fungsi aslimenjadi fungsi logaritmik.
2) Fungsi exponensial
Contoh lain dari kurve tak linier adalah fungsieksponensial seperti diberikan oleh bentuk berikut:
(5.16)
dengan a1 dan b1 adalah konstanta.Persamaan tersebut dapat dilinier-kan dengan menggunakanlogaritma natural sehingga menjadi:
ln y = ln a1 + b1x ln e
Karena ln e = 1, maka:
ln y = ln a1 + b1x (5.17)
Persamaan (5.15) merupakan hubungan semi logaritmikantara ln y dan x. Persamaan tersebut mempunyai bentukgaris lurus dengan kemiringan b1 dan memotong sumbu ln y
pada ln a1. Gambar 5.6, menunjukkan transformasi darifungsi asli menjadi fungsi logaritmik.
Gambar 5.5. Transformasi fungsi logaritma
Gambar 5.6. Transformasi fungsi eksponensial
Contoh soal:
Jurusan Teknik Elektro ISTA Yogyakarta 62
Mata kuliah KOMPUTASI ELEKTRO
Tentukan persamaan kurve lengkung yang mewakili data
berikut ini.
x 1 2 3 4 5
y 0,5 1,7 3,4 5,7 8,4
Penyelesaian:Gambar 5.7, menunjukkan sebaran titik data pada sistemkoordinat x-y, untuk mencari kurve dengan menggunakandua bentuk transformasi, yaitu transformasi log dan ln.
Gambar 5.7. Sebaran data dan kurve lengkung
a). Transformasi log
Misalkan persamaan kurve yang dicari adalah:
y = a xb
Transformasi dengan menggunakan fungsi log, sehingga:
log y = log a xb log y = log a + b log x
Dilakukan transformasi berikut:
p = log y B = b
A = log a q = log x
Sehingga persamaan diatas dapat ditulis dalam bentuk:
= A + B
Hitungan dilakukan dengan menggunakan Tabel 5.2, darihitungan dalam Tabel 5.2, didapat beberapa parameterberikut ini.
Jurusan Teknik Elektro ISTA Yogyakarta 63
Mata kuliah KOMPUTASI ELEKTRO
Tabel 5.2. Hitungan regresi linier dengan
transformasi log
No xi yiqi =log xi
pi =log yi
qi pi qi2
12345
12345
0,51,73,45,78,4
00,30100,47710,60200,6990
-0,30100,23040,53150,75590,9243
00,06930,25360,45500,6461
00,09060,22760,36240,4886
15 19,7 2,0791 2,1411 1,42
401,1692
Koefisien A dan B dihitung dengan persamaan (5.11)
dan (5.12).
Setelah nilai B didapat kemudian dicari nilai A:
Dengan demikian persamaan transformasi adalah:
Mengingat:
A = log a 0,3001 = log a a = 0,5011
B = b b = 1,7517
Jurusan Teknik Elektro ISTA Yogyakarta 64
Mata kuliah KOMPUTASI ELEKTRO
maka persamaan yang dicari adalah:
y = 0,5011 x1,7517
b). Transformasi In
Misalkan persamaan kurve mempunyai bentuk:
y = a ebx
Transformasi dengan menggunakan fungsi ln, sehinggapersamaan diatas menjadi:
ln y = ln a ebx = ln a + ln ebx
ln y = ln a + bx
Dilakukan transformasi berikut:
p = ln y A = ln a
q = x B = b
Sehingga persamaan diatas dapat ditulis dalam bentuk:
p = A + B q
Hitungan dilakukan dengan menggunakan Tabel 5.3.Dari hitungan Tabel 5.3, didapat beberapa parameter
berikut ini:
Tabel 5.3 Hitungan regresi linier dengan
trasnformasi ln
No xi =qi
yiqi
2 =xi2
pi =ln yi
qi pi
12345
12345
0,51,73,4
1491625
-0,6931 0,53061,22381,74052,1282
-0,69311,06123,67146,96210,641
Jurusan Teknik Elektro ISTA Yogyakarta 65
Mata kuliah KOMPUTASI ELEKTRO
5,78,4
15 19,7 55 4,93 21,642
5Koefisien A dan B dihitung dengan persamaan (5.11)
dan (5.12).
Setelah nilai B didapat kemudian dicari nilai A,
yaitu:
Dengan demikian persamaan transformasi adalah:
P = 1,06975 + 0,68525 q
Mengingat:
A = ln a 1,06975 = ln a a = 0,3431
B = b b = 0,68525
Maka persamaan yang dicari adalah:
y = 0,3431 e0,68525x
5.4 Regresi PolinomialUntuk kurve lengkung persamaannya dapat diturunkan denganmelakukan transformasi data asli ke bentuk lain yangsesuai. Selain dengan menggunakan regresi polinomial.Penurunan persamaan dilakukan dengan menggunakan metodekuadrat terkecil.Persamaan polinomial order r mempunyai bentuk:
y = a0 + a1 x + a2 x2 + … + ar xr
Jumlah kuadrat dari kesalahan adalah:
Jurusan Teknik Elektro ISTA Yogyakarta 66
Mata kuliah KOMPUTASI ELEKTRO
Persamaan diatas diturunkan terhadap tiap koefisien daripolinomial dan kemudian disama-dengankan nol, sehinggadiperoleh:
(5.18)
Persamaan (5.18) dapat ditulis dalam bentuk:
=
(5.19)
Dengan semua penjumlahan adalah dari i = 1 sampai n. Dari r+ 1 persamaan tersebut akan dicari bilangan tak diketahuia0, a1, a2, …, ar dengan metode yang telah dibicarakan dalampembahasan sistem persamaan linier. Koefisien matriks daripersamaan tersebut biasanya sangat padat (sangat sedikitkoefisien nol) dan masing-masing koefisien sangat berbeda.Namun demikian biasanya nilai r adalah kecil sehinggasistem persamaan tersebut masih mudah diselesaikan.
Jurusan Teknik Elektro ISTA Yogyakarta 67
Mata kuliah KOMPUTASI ELEKTRO
Contoh soal: Cari persamaan kurve polinomial order dua
yang mewakili data berikut:
xi 0 1 2 3 4 5
yi 2,1 7,7 13,6 27,2 40,9 61,1
Penyelesaian:Persamaan polinomial dari order 2 mempunyai bentuk:
g (x) = a0 + a1 x + a2 x2 (c.1)
Ei = yi – g (x)
Ei2 = ( yi – a0 – a1 x – a2 x2 )2
D2 = Ei 2
Untuk polinomial order dua, diferensial dari D2 terhadaptiap koefisien dari polinomial dan kemudian disama-dengankan nol menghasilkan bentuk:
=
(c.2)
Hitungan dilakukan dengan menggunakan Tabel 5.4.
Tabel 5.4. Hitungan regresi polinomial order dua
No xi yi xi2 xi
3 xi4 xi yi xi
2 yi
123456
012345
2,17,713,627,240,961,1
01491625
0182764125
011681256625
07,727,281,6163,6
305,5
07,754,4244,8654,41527,
5
15 152,6 55 225 979 585,
62488,
8
Jurusan Teknik Elektro ISTA Yogyakarta 68
Mata kuliah KOMPUTASI ELEKTRO
Dengan melakukan hitungan dalam Tabel 5.4, maka sistem
persamaan (c.2) menjadi:
6 a0 + 15 a1 + 55 a2 = 152,6
15 a0 + 55 a1 + 225 a2 = 585,6
(c.3)
55 a0 + 225 a1 + 979 a2 = 2488,8
Dengan menggunakan sistem persamaan linier, makapenyelesaian dari persamaan diatas adalah a2 = 1,860714; a1
= 2,359286; dan a0 = 2,478571.Dengan demikian persamaan kurve adalah:
y = 2,478571 + 2,359286 x + 1,860714 x2
5.5 Regresi Linier Dengan Banyak VariabelMetode regresi linier dapat dikembangkan untuk kasusdimana y adalah fungsi linier dari dua atau lebihvariabel. Misalnya, y merupakan fungsi linier terhadap x1dan x2 dalam bentuk:
y = a0 + a1 x1 + a2 x2
Persamaan tersebut dapat digunakan untuk mempresentasikandata pengamatan dimana variabel yang dipelajari merupakanfungsi dari dua variabel.Nilai terbaik dari koefisien a0, a1, dan a2 diperoleh denganmencari kuadrat dari kesalahan yang dihitung denganpersamaan berikut:
Persamaan diatas diturunkan terhadap tiap koefisien daripolinomial, dan kemudian disama-dengankan nol, sehinggadiperoleh:
(5.20)
Jurusan Teknik Elektro ISTA Yogyakarta 69
Mata kuliah KOMPUTASI ELEKTRO
Persamaan (5.20) dapat ditulis dalam bentuk:
n a0 + x1,i a1 + x2,i a2 = yi
x1,i a0 + x1,i2 a1 + x1,i x2,i a2 = x1,i yi
x2,i a0 + x1,i x2,i a1 + x2,i 2 a2 = x2,i yi
atau dalam bentuk matriks menjadi:
=
(5.21)
Sistem persamaan (5.21) dapat diselesaikan denganmenggunakan metode pada sistem persamaan linier untukmendapatkan koefisien a0, a1, dan a2.Secara umum persamaan regresi linier dengan m variabel
mempunyai bentuk berikut:
y = a0 + a1 x1 + a2 x2 + … + am xm
di mana koefisien a0, a1, a2 sampai am dapat dihitung dari
sistem persamaan berikut:
Jurusan Teknik Elektro ISTA Yogyakarta 70
Mata kuliah KOMPUTASI ELEKTRO
=
(5.22)
Koefisien korelasi dapat dihitung dengan persamaan (5.13).
Contoh soal:
Buat persamaan kurve yang mewakili data berikut:
x1 0 2 2,5 1 4 7
x2 0 1 2 3 6 2
y 5 10 9 0 3 27
Penyelesaian:Penyelesaian dilakukan dengan menggunakan Tabel 5.5.
Tabel 5.5. Hitungan regresi linier dengan banyak variabel
y x1 x2 x12 x2
2 x1x2 x1 y x2 y51090327
022,5147
012362
04
6,2511649
0149364
02532414
02022,5012189
0101801854
54 16,5 14 76,2
5 54 48 243,5 100
Nilai-nilai yang diperoleh dalam Tabel 5.5, dimasukkandalam sistem persamaan (5.21), sehingga diperoleh:
Jurusan Teknik Elektro ISTA Yogyakarta 71
Mata kuliah KOMPUTASI ELEKTRO
=
(c.1)
Persamaan (c.1) dapat diselesaikan dengan metodepenyelesaian sistem persamaan linier, dan hasilnya adalaha0 = 5, a1 = 4, a2 = 3.
Persamaan kurve yang dihasilkan adalah: y = 5 + 4 x1 – 3 x2