Top Banner
APLIKASI K-MEANS...( Tinus Septioko, Hanna Arini Parhusip, Tundjung Mahatma) 353 APLIKASI K-MEANS UNTUK PENGELOMPOKAN RUMAH TANGGA DI SALATIGA BERDASARKAN DATA SUSENAS 2011 1 Tinus Septioko 1 , Hanna Arini Parhusip 2 , Tundjung Mahatma 3 1 Mahasiswa Program Studi Matematika FSM UKSW 2,3 Dosen Program Studi Matematika FSM UKSW e-mail : [email protected] 1 ,[email protected] 2 , [email protected] 3 Ucapan Terimakasih Penulis ucapkan terimakasih kepada pihak-pihak yang telah membantu dan membimbing dalam penyusunan makalah yang berjudul “ Aplikasi K-Means untuk Pengelompokan Rumah Tangga di Salatiga Berdasarkan Data Susenas 2011” sehingga dapat terselesaikan dengan lancar. Semoga Tuhan membalas kebaikan yang telah diberikan kepada penulis dengan berkat yang melimpah. 1 Penulis bersedia untuk berbagi data riset, data terlampir.
18

Aplikasi K-means Untuk Pengelompokan Rumah Tangga Di ... · 354 | Proceeding for Call Paper PEKAN ILMIAH DOSEN FEB – UKSW, 14 DESEMBER 2012 APLIKASI K-MEANS UNTUK PENGELOMPOKAN

Dec 26, 2019

Download

Documents

dariahiddleston
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Aplikasi K-means Untuk Pengelompokan Rumah Tangga Di ... · 354 | Proceeding for Call Paper PEKAN ILMIAH DOSEN FEB – UKSW, 14 DESEMBER 2012 APLIKASI K-MEANS UNTUK PENGELOMPOKAN

APLIKASI K-MEANS...( Tinus Septioko, Hanna Arini Parhusip, Tundjung Mahatma) 353

APLIKASI K-MEANS UNTUK PENGELOMPOKAN RUMAH TANGGA

DI SALATIGA BERDASARKAN DATA SUSENAS 20111

Tinus Septioko1, Hanna Arini Parhusip

2, Tundjung Mahatma

3

1Mahasiswa Program Studi Matematika FSM UKSW 2,3

Dosen Program Studi Matematika FSM UKSW

e-mail : [email protected],[email protected]

2,

[email protected]

Ucapan Terimakasih

Penulis ucapkan terimakasih kepada pihak-pihak yang telah membantu dan

membimbing dalam penyusunan makalah yang berjudul “ Aplikasi K-Means untuk

Pengelompokan Rumah Tangga di Salatiga Berdasarkan Data Susenas 2011” sehingga dapat

terselesaikan dengan lancar. Semoga Tuhan membalas kebaikan yang telah diberikan kepada

penulis dengan berkat yang melimpah.

1 Penulis bersedia untuk berbagi data riset, data terlampir.

Page 2: Aplikasi K-means Untuk Pengelompokan Rumah Tangga Di ... · 354 | Proceeding for Call Paper PEKAN ILMIAH DOSEN FEB – UKSW, 14 DESEMBER 2012 APLIKASI K-MEANS UNTUK PENGELOMPOKAN

354 | Proceeding for Call Paper PEKAN ILMIAH DOSEN FEB – UKSW, 14 DESEMBER 2012

APLIKASI K-MEANS UNTUK PENGELOMPOKAN RUMAH TANGGA

DI SALATIGA BERDASARKAN DATA SUSENAS 2011

Tinus Septioko1, Hanna Arini Parhusip

2, Tundjung Mahatma

3

1Mahasiswa Program Studi Matematika FSM UKSW 2,3

Dosen Program Studi Matematika FSM UKSW

e-mail : [email protected],[email protected]

2,

[email protected]

Abstrak

Survei sosial ekonomi nasional atau yang disebut Susenas adalah survei yang dilaksanakan

badan pusat statistik empat kali dalam setahun. Susenas merupakan salah satu sumber data yang

diperlukan khususnya untuk perencanaan di bidang sosial ekonomi masyarakat. Susenas

mengumpulkan data yang menyangkut bidang pendidikan, kesehatan, perumahan, dan sosial ekonomi

lainnya. Keadaan ekonomi masyarakat dapat diketahui melalui hasil Susenas, jika tingkat ekonomi

masyarakat rendah tentunya pemerintah tidak boleh tinggal diam. Dari data Susenas dapat diketahui

rumah tangga ekonomi bawah, menengah, maupun ekonomi atas. Hasil ini dapat digunakan untuk

patokan pemberian bantuan kepada rumah tangga ekonomi bawah.

Pengelompokan ekonomi masyarakat dapat dilakukan dengan metode clustering, dimana rumah

tangga yang memiliki karakteristik yang mirip akan dikelompokkan ke dalam kelompok yang sama.

Untuk mendapatkan hasil cluster yang lebih cepat dan efisien maka pada penelitian ini, dikembangkan

aplikasi untuk mengelompokkan rumah tangga dari data Susenas di Salatiga tahun 2011 triwulan satu

dan dua berdasarkan tingkat ekonomi, yaitu rumah tangga ekonomi atas, rumah tangga ekonomi

menengah, dan rumah tangga ekonomi bawah. Pengelompokan data dilakukan menggunakan metode

k-means, yaitu dengan mengelompokkan n-buah objek dengan p-dimensi ke dalam k-cluster

berdasarkan jarak minimal masing-masing data ke pusat cluster. Aplikasi yang dibangun diharapkan

dapat membantu untuk tujuan pengelompokan data bagi pihak-pihak yang membutuhkan.

Dari hasil penelitian terhadap 254 data sampel, diperoleh tiga kelompok rumah tangga

berdasarkan tingkat ekonomi, yaitu 25 rumah tangga ekonomi atas, 99 rumah tangga ekonomi

menengah, dan 130 rumah tangga ekonomi bawah. Rata-rata pendapatan rumah tangga yang masuk

dalam kategori rumah tangga ekonomi bawah berkisar antara 2 juta rupiah sampai 2.25 juta rupiah

per bulan, sedangkan untuk pendapatan dua kategori yang lain tentunya berada diatas 2.25 juta

rupiah per bulan.

Kata kunci : Susenas, cluster, K-means, ekonomi.

Abstract

National socioeconomic survey called Susenas is a survey conducted statistical central body

four times a year. Susenas is one source of the data needed for planning particularly in the area of

socio-economic population. Susenas collect data on education, health, housing, social and economic.

The state of the economy can be seen through the Susenas, if the economic needs of low government

certainly should not stay silent. From the Susenas data it can be seen bottom economy households,

middle, and upper economy. These results can be used to benchmark the provision of assistance to

households who economy below.

Page 3: Aplikasi K-means Untuk Pengelompokan Rumah Tangga Di ... · 354 | Proceeding for Call Paper PEKAN ILMIAH DOSEN FEB – UKSW, 14 DESEMBER 2012 APLIKASI K-MEANS UNTUK PENGELOMPOKAN

APLIKASI K-MEANS...( Tinus Septioko, Hanna Arini Parhusip, Tundjung Mahatma) 355

Community economic grouping to do with the method of clustering, where by households with

similar characteristics will be grouped into the same group. To get the cluster more quickly and

efficiently so in this study, the application was developed to classify the data Susenas households in

Salatiga in 2011 quarter one and two based on an economic level, ie the upper economy household,

middle class household, and the bottom economy household. Grouping of data is done using k-means

clustering method, by classifying n-pieces with a p-dimensional objects into k-clusters based on a

minimum distance of each data to a cluster center. Applications built is expected to help for the

purpose of grouping the data for private need.

From the results of a study of 254 samples of the data, obtained by the three groups of

households based on an economic level, ie 25 upper economy households, 99 middle class households,

and 130 down economy household. The average household income in the lower economic category of

households ranged up 2 million to 2.25 million per month, while for the other two categories of

income must be above 2.25 million per month.

Kata kunci : Susenas, cluster, K-means, economy.

1. Pendahuluan

Pemberian bantuan untuk masyarakat

miskin sudah banyak dilakukan, seperti

raskin, BLT, dan bantuan yang lainnya.

Melalui survei yang dilakukan BPS, yaitu

Susenas dapat diketahui perekonomian

masyarakat. Mencegah terjadinya salah

sasaran pemberian bantuan, maka dari data

perekonomian masyarakat, harus

dikelompokkan terlebih dahulu ke dalam

kelompok-kelompok ekonomi. Untuk

melakukan pengolahan data dapat

dilakukan dengan metode cluster. Metode

cluster adalah metode yang digunakan

untuk mengelompokkan data ke dalam satu

atau lebih kelompok yang mempunyai

karakteristik yang mirip. Penghitungan

manual akan sulit dilakukan mengingat

data yang diolah tidaklah sedikit.

Penghitungan manual yang lama dan rumit

dapat diatasi dengan adanya program

komputer. Peran komputer sebagai alat

bantu pengelompokan data sangat

menunjang dalam kecepatan dan ketepatan

hasil. Dalam berbagai bidang,

pengelompokan data banyak digunakan

dengan berbagai tujuan. Dalam bidang

ekonomi, clustering atau pengelompokan

data digunakan untuk membuat segmen

pasar, memahami perilaku pembeli,

mengenali peluang produk baru (Supranto

2004), digunakan untuk mengelompokkan

saham-saham perusahaan (Mahadwartha

2002), dalam bidang pendidikan digunakan

untuk memprediksi kualitas akademik

siswa (Oyelade et al. 2010), Program

komputer untuk pengelompokan data

banyak dijumpai, namun program-program

tersebut relatif memiliki memori yang

besar dan susah dalam penggunaannya.

Dalam penelitian ini masalah yang

timbul adalah bagaimana membangun

aplikasi k-means yang dapat digunakan

untuk mengelompokkan data Susenas

Salatiga tahun 2011 triwulan satu dan dua

untuk mengelompokkan rumah tangga

berdasarkan tingkat ekonomi. Hasil yang

didapatkan dapat digunakan untuk patokan

dalam pengambilan keputusan, misal

sebagai patokan untuk pemberian bantuan

kepada masyarakat seperti raskin, BLT,

ataupun bantuan yang lainnya. Tujuan dari

penelitian ini adalah membangun aplikasi

dengan metode k-means untuk

mengelompokkan rumah tangga di Salatiga

berdasarkan data Susenas ke dalam kriteria

rumah tangga ekonomi atas, rumah tangga

ekonomi menengah, dan rumah tangga

Page 4: Aplikasi K-means Untuk Pengelompokan Rumah Tangga Di ... · 354 | Proceeding for Call Paper PEKAN ILMIAH DOSEN FEB – UKSW, 14 DESEMBER 2012 APLIKASI K-MEANS UNTUK PENGELOMPOKAN

358 | Proceeding for Call Paper PEKAN ILMIAH DOSEN FEB – UKSW, 14 DESEMBER 2012

ekonomi bawah. Pada penelitian ini data

yang digunakan terbatas pada data Susenas

dan pebuatan program dilakukan dengan

program matlab R2009a.

Program ini berdasarkan pada

metode k-means clustering. K-means

merupakan salah satu metode clustering

non hirarki yang berusaha mempartisi data

ke dalam satu atau lebih cluster / kelompok

berdasarkan jarak minimal data ke

centroid. Metode ini mempartisi data,

dimana data yang memiliki karakteristik

yang mirip dikelompokkan ke dalam

cluster yang sama (Agusta 2007; Santoso

2007).

2. Analisis Cluster

Analisis cluster merupakan metode

pengolahan data yang bertujuan untuk

mengelompokkan data kedalam kelompok-

kelompok dimana data-data yang berada

dalam kelompok yang sama akan

mempunyai sifat yang mirip (Agusta 2007;

Santoso 2007).

2.1. K-means

K-means merupakan metode cluster

berbasis jarak yang membagi data ke

dalam k-cluster, dan algoritma ini hanya

bekerja pada data numerik. Pada awalnya

algoritma ini mengambil sebanyak k-

centroid secara random dari data, namun

dalam penelitian ini penentuan centroid

pertama kali diambil dari mean data

sebanyak k-centroid. Hitung jarak setiap

data terhadap masing-masing centroid,

dalam hal ini penghitungan jarak

digunakan rumus euclidean. Alokasikan

data ke cluster yang memiliki jarak

minimum ke centroid. Lakukan langkah

tersebut hingga cluster stabil / tidak

berubah.

2.2. Euclidean Distance

Untuk menghitung jarak antara data

dengan centroid digunakan euclidean

disatnce. Jarak dihitung menggunakan

persamaan satu (Santoso 2007; Supranto

2004) :

( ) ‖ ‖

√∑ ( )

(1)

dimana

: dimensi data

2.3. Menilai Kualitas Cluster

Metode yang digunakan untuk

menilai kualitas cluster dianggap ideal

adalah batasan variance, yaitu dengan

menghitung kepadatan cluster berupa

variance within cluster ( ) dan variance

between cluster ( ) Cluster yang ideal

memiliki minimum yang

mempresentasikan internal homogenity

dan maksimum yang

mempresentasikan external homogenity

(Saepulloh 2010).

(2)

Menghitung nilai variance tiap cluster

dapat dilakukan menggunakan persamaan

tiga :

∑ ( )

(3)

dimana

: variance pada cluster ke- ,

,

: banyaknya cluster

: banyaknya data pada cluster ke-

: data ke- pada cluster ke-

: rata-rata dari data pada cluster ke-

Selanjutnya untuk menghitung variance

within cluster (Vw) dapat dihitung dengan

persamaan empat :

∑ ( )

(4)

dimana

: variance dalam cluster

Page 5: Aplikasi K-means Untuk Pengelompokan Rumah Tangga Di ... · 354 | Proceeding for Call Paper PEKAN ILMIAH DOSEN FEB – UKSW, 14 DESEMBER 2012 APLIKASI K-MEANS UNTUK PENGELOMPOKAN

APLIKASI K-MEANS...( Tinus Septioko, Hanna Arini Parhusip, Tundjung Mahatma) 359

: banyaknya data

Variance between cluster (Vb) dihitung

menggunakan persamaan lima :

∑ ( )

(5)

dimana

: rata-rata .

3. Metode Penelitian

3.1. Data

Data yang digunakan adalah data

Susenas di Salatiga tahun 2011 triwulan

satu dan dua, dengan 254 pengamatan dan

empat variabel yang meliputi variabel

banyak anggota rumah tangga (orang),

pengeluaran makanan (Rp), pendapatan

rumah tangga (Rp), dan pengeluaran non

makanan (Rp).

3.2. Rancangan Program

Rancangan program untuk metode k-

means clustering menggunakan diagram

alir seperti pada gambar satu.

3.3. Uji Program

Dengan data dan metode yang sama

pengujian program dilakukan dengan cara

membandingkan hasil output program

dengan hasil output program SPSS.

Pengujian ini bertujuan untuk mengetahui

apakah hasil yang didapat dengan program

k-means sudah setara dengan program-

program yang lain.

4. Hasil dan Pembahasan

4.1. Implementasi Program

Uji coba dilakukan dengan

menggunakan data Susenas di Salatiga

tahun 2011 triwulan satu dan dua dengan

254 pengamatan dan empat variabel yang

meliputi variabel banyak ART (A),

konsumsi makanan (B), pendapatan (C),

dan konsumsi non-makanan (D). Dari ke-4

variabel ini memiliki satuan yang berbeda

sehingga tahap pertama yang dilakukan

adalah standarisasi data. Data yang sudah

distandarisasi kemudian digunakan untuk

proses pengelompokan. Setelah didapatkan

hasil cluster, sebagai pengecekan, dengan

metode yang sama hasil ini dibandingkan

dengan hasil penghitungan dengan

program SPSS. Pengelompokan data

dengan program k-means adalah sebagai

berikut :

a. Menjalankan program k-means dengan

Matlab, maka akan terlihat tampilan

awal program, yang terlihat pada

gambar dua.

>> cover_program % merupakan

perintah untuk memanggil program

k-means

b. Tampilan program utama terlihat pada

gambar tiga, digunakan untuk

menginputkan parameter-parameter

program dan prosedur program yang

meliputi :

1. Banyak cluster yang dibentuk 3.

2. Buka data yang akan diproses,

dalam hal ini data Susenas Salatiga

tahun 2011.

3. Lakukan proses standarisasi data.

4. Proses pengelompokan k-means.

5. Hasil pengelompokan data ke

dalam tiga kelompok dengan 254

pengamatan dapat dilihat dalam

tabel hasil cluster.

Pada tabel satu disajikan sebagian

data asli yang akan dikelompokkan. Data

ini kemudian distandarisasi utuk membuat

data tidak bersatuan. Tabel dua adalah

hasil standarisasi data sebelum diolah

dengan program k-means. Selanjutnya

digunakan algoritma k-means untuk

mengelompokkan data yang sudah

distandarisasi. Data akan dikelompokkan

menjadi tiga kelompok. Langkah

Page 6: Aplikasi K-means Untuk Pengelompokan Rumah Tangga Di ... · 354 | Proceeding for Call Paper PEKAN ILMIAH DOSEN FEB – UKSW, 14 DESEMBER 2012 APLIKASI K-MEANS UNTUK PENGELOMPOKAN

360 | Proceeding for Call Paper PEKAN ILMIAH DOSEN FEB – UKSW, 14 DESEMBER 2012

pengelompokan data dengan k-means

adalah sebagai berikut :

1. Menentukan pusat cluster pertama atau

centroid awal.

Centroid pertama didekati dengan

mean dari data sebanyak k-cluster.

Karena akan dibentuk tiga cluster maka

centroid yang dibentuk juga sebanyak

tiga. Berikut merupakan centroid yang

dibentuk :

( )

( )

( )

2. Hitung jarak setiap data terhadap setiap

pusat cluster.

Dengan persamaan satu dihitung jarak

setiap data ke setiap centroid. Hasil

penghitungan jarak ditampilkan dalam

tabel tiga.

3. Data akan menjadi anggota dari cluster

yang memiliki nilai jarak terkecil dari

pusat clusternya, hal ini ditampilkan

dalam tabel empat.

Hitung setia centroid yang baru dari

mean data yang menjadi anggota cluster,

hitung jarak setiap data ke centroid yang

baru. Alokasikan setiap data ke cluster

yang memiliki jarak minimal. Ulangi

langkah satu sampai tiga hingga cluster

stabil / tidak ada perubahan. Hasil akhir

dari program k-means ditampilkan dalam

tabel lima dan centroid akhir ditampilkan

dalam tabel enam, dengan nilai sebesar

0.011655 persen, hal ini menunjukkan

tingkat homogenitas hasil cluster. Hasil

yang diperoleh dengan program k-means

adalah sebagai berikut :

a. Rumah tangga ekonomi atas sebanyak

25 rumah tangga, terdapat dalam

cluster satu. Terlihat dari nilai variabel

C / pendapatan 2.420 merupakan nilai

paling besar dintara cluster yang lain.

b. Rumah tangga ekonomi menengah

sebanyak 99 rumah tangga, terdapat

dalam cluster dua, dengan nilai

variabel pendapatan 0.030.

c. Rumah tangga ekonomi bawah

sebanyak 130 rumah tangga, terdapat

dalam cluster tiga dengan nilai

variabel pendapatan terkecil yaitu -

0.488.

4.2. Output SPSS

Dengan data dan metode yang sama,

dengan alat bantu SPSS dilakukan proses

clustering. Centroid pertama, hasil cluster,

dan centroid akhir secara berturut-turut

ditampilkan dalam tabel tujuh, delapan,

dan sembilan. Dalam tabel sepuluh

menunjukkan banyak data yang menjadi

anggota cluster yang terbentuk. Hasil

cluster akhir yang diperoleh dengan

program SPSS adalah :

a. Rumah tangga ekonomi atas sebanyak

21 rumah tangga, terdapat dalam

cluster tiga, yang berdasar pada nilai

Zscore(v3) 2.70304 yang merupakan

nilai tertinggi dibanding dengan nilai

pada cluster yang lain.

b. Rumah tangga ekonomi menengah

sebanyak 127 rumah tangga, terdapat

dalam cluster satu, dengan nilai

Zscore(v3) sebesar 0.00837.

c. Rumah tangga ekonomi bawah

sebanyak 106 rumah tangga, terdapat

dalam cluster dua, dengan nilai

Zscore(v3) sebesar -0.54553.

4.3. Perbandingan Hasil

Hasil program yang dihasilkan

program k-means dan SPSS ditampilkan

dalam diagram batang yang tersaji dalam

gambar empat. Rumah tangga dengan

Page 7: Aplikasi K-means Untuk Pengelompokan Rumah Tangga Di ... · 354 | Proceeding for Call Paper PEKAN ILMIAH DOSEN FEB – UKSW, 14 DESEMBER 2012 APLIKASI K-MEANS UNTUK PENGELOMPOKAN

APLIKASI K-MEANS...( Tinus Septioko, Hanna Arini Parhusip, Tundjung Mahatma) 361

tingkat ekonomi atas ditunjukkan dalam

cluster satu. Dari hasil program k-means,

sebanyak 25 rumah tangga menjadi

anggota cluster satu, dan hasil SPSS

sebanyak 21 rumah tangga menjadi

anggota cluster satu. Rumah tangga yang

menjadi anggota cluster satu ditampilkan

dalam tabel 11. Dari tabel 11 terlihat

bahwa rumah tangga 165, 190, 210, 230

yang menjadi anggota cluster satu dari

hasil program k-means tidak menjadi

anggota cluster satu dari hasil SPSS.

Empat data ini menjadi anggota cluster

lain dalam hasil program k-means. Dengan

cara yang sama cluster dua dan tiga dapat

diketahui.

5. Kesimpulan

Berdasarkan hasil penelitian,

diperoleh kesimpulan sebagai berikut :

1) Program yang telah dibangun dapat

digunakan untuk mengelompokkan

rumah tangga berdasarkan tingkat

perekonomian (ekonomi atas,

menengah, dan bawah). Program

hanya dapat digunakan untuk data

numerik.

2) Dari program k-means didapat 25

rumah tangga ekonomi atas, 99 rumah

tangga ekonomi menengah, dan 130

rumah tangga ekonomi bawah.

3) Dari SPSS didapat 21 rumah tangga

ekonomi atas, 127 rumah tangga

ekonomi menengah, dan 106 rumah

tangga ekonomi bawah.

4) Perbedaan hasil program k-means dan

SPSS terjadi karena perbedaan

inisialisasi centroid pertama. Metode

k-means sangat sensitif terhadap

inisialisasi centroid awal, sehingga

hasil cluster yang dihasilkan berbeda.

5) Berdasarkan data, sebagian besar

penduduk Salatiga berekonomi

menengah ke bawah.

6)

6. Daftar Pustaka

Agusta, Yudi. 2007. K-means-

Penerapan, Permasalahan dan

Metode Terkait. Jurnal Sistem

dan Informatika Vol.3 : 47 - 60.

Bandan Pusat Statistik. 2010. Survei

Sosial Ekonomi Nasional

[SUSENAS Juli 2010] (Pedoman

Pencacahan KOR). Jakarta :

Badan Pusat Statistik.

Mahadwartha, P.A. 2002. Analisis

Cluster Saham-Saham

Berdasarkan Nisbah Profitabilitas

Di Masa Kritis. Jurnal Ekonomi

dan Bisnis Dian Ekonomi VIII/2.

O.J.Oyelade, O.O.Oladipupo, dan

I.C.Obagbuwa. 2010. Aplication

of K-means Clustering Algorithm

for Prediction of Students’

Academic Performance.

International Journal of

Computer Science and

Information Security, Vol. 7, No.

1.

Saepulloh, D. 2010. Analisis Data

Mining K-means cluster analysis

Untuk Menentukan Data Berjenis

Biner (Studi Kasus

Pengelompokan Rumah Tangga

Sasaran (RTS) Bantuan

Langsung Tunai (BLT))(Tesis).

Bandung : Fakultas Matematika

dan Ilmu Pengetahuan Alam

Universitas Padjadjaran.

Santoso, B. 2007. DATA MINING :

Teknik Pemanfaatan Data untuk

Keperluan Bisnis, Edisi Pertama.

Yogyakarta : Graha Ilmu.

Supranto, J. 2004. Analisis Multivariat

Arti dan Interpretasi. Jakarta :

Rineka Cipta.

Page 8: Aplikasi K-means Untuk Pengelompokan Rumah Tangga Di ... · 354 | Proceeding for Call Paper PEKAN ILMIAH DOSEN FEB – UKSW, 14 DESEMBER 2012 APLIKASI K-MEANS UNTUK PENGELOMPOKAN

362 | Proceeding for Call Paper PEKAN ILMIAH DOSEN FEB – UKSW, 14 DESEMBER 2012

LAMPIRAN GAMBAR

1. Gambar 1. Diagram alir program k-means.

2. Gambar 2. Tampilan awal program k-means.

3. Gambar 3. Tampilan program k-means.

4. Gambar 4. Hasil cluster program k-means dan SPSS.

LAMPIRAN TABEL

1. Tabel 1. Data asli.

2. Tabel 2. Data standarisasi.

3. Tabel 3. Jarak data ke centroid.

4. Tabel 4. Hasil cluster.

5. Tabel 5. Final cluster.

6. Tabel 6. Final centroid.

7. Tabel 7. Centroid pertama.

8. Tabel 8. Cluster awal.

9. Tabel 9. Final cluster centroid.

10. Anggota cluster.

11. Anggota cluster 1.

Tentukan

banyak cluster k

Tentukan

Centroid

Hitung jarak

objek dengan

Centroid

Alokasikan

objek (minimum

jarak)

konvergen

Buka file data

Standarisasi data

Start

End

Ya

Tidak

Gambar 1. Diagram alir program k-

means.

Gambar 2. Tampilan awal program k-

means.

Page 9: Aplikasi K-means Untuk Pengelompokan Rumah Tangga Di ... · 354 | Proceeding for Call Paper PEKAN ILMIAH DOSEN FEB – UKSW, 14 DESEMBER 2012 APLIKASI K-MEANS UNTUK PENGELOMPOKAN

APLIKASI K-MEANS...( Tinus Septioko, Hanna Arini Parhusip, Tundjung Mahatma) 363

Gambar 3. Tampilan program k-means.

Gambar 4. Hasil cluster k-means dan

SPSS.

Tabel 1. Data asli.

No. A B C D

1 5 1759864 2705000 824383

2 5 1783285 3364333 1418616

3 3 1346142 6040000 4297650

4 4 1118571 3353000 1936733

5 3 774857 1426333 773483

250 3 572785 4266667 3440916

251 1 867857 4674000 3587168

252 2 525642 3566667 2613668

253 1 460714 1571933 1342584

254 1 1075714 1766667 689000

Tabel 2. Data standarisasi.

No A B C D

1 0.717 0.499 -0.356 -0.548

2 0.717 0.527 -0.197 -0.373

3 -0.321 0.0189 0.448 0.473

4 0.198 -0.246 -0.200 -0.221

5 -0.321 -0.645 -0.664 -0.563

250 0.198 -0.704 -0.502 -0.424

251 -0.321 -0.880 0.020 0.221

252 -1.358 -0.537 0.119 0.264

253 -0.840 -0.935 -0.148 -0.022

254

-

1.3583 -1.011 -0.629 -0.396

Tabel 3. Jarak data ke centroid.

No

1 1.078 0.920 1.380

2 0.919 0.788 1.336

3 0.663 0.842 0.879

4 0.631 0.450 0.552

5 1.403 1.257 0.791

250 1.138 1.132 0.739

251 1.652 1.712 1.155

252 1.496 1.475 0.856

253 2.110 2.054 1.389

254 1.863 1.809 1.203

Tabel 4. Hasil cluster.

No

1 *

2 *

3 *

4 *

5 *

25

0

*

25

1

*

25

2

*

25

3

*

25

99 130

21

127 106

0

50

100

150

1 2 3

Ban

yak

rum

ah t

angg

a

Cluster

Hasil Cluster

Program k-means

SPSS

Page 10: Aplikasi K-means Untuk Pengelompokan Rumah Tangga Di ... · 354 | Proceeding for Call Paper PEKAN ILMIAH DOSEN FEB – UKSW, 14 DESEMBER 2012 APLIKASI K-MEANS UNTUK PENGELOMPOKAN

364 | Proceeding for Call Paper PEKAN ILMIAH DOSEN FEB – UKSW, 14 DESEMBER 2012

25

4

*

Tabel 5. Final cluster.

No

1 *

2 *

3 *

4 *

5 *

25

0

*

25

1

*

25

2

*

25

3

*

25

4

*

Tabel 6. Final centroid.

Center A B C D

0.883 2.012 2.420 2.282 25

0.680 0.294 0.030

-

0.060

99

-

0.688 -0.611

-

0.488

-

0.393

130

Tabel 7. Centroid pertama.

Cluster

1 2 3

Zscore(v

1) 3.31097

-

1.35830 1.23574

Zscore(v

2)

-

0.87100 1.90744 0.17092

Zscore(v

3) 0.90330

-

0.65212 5.50626

Zscore(v

4) 0.71345

-

0.53290 5.75191

Tabel 8. Cluster awal.

No

1 *

2 *

3 *

4 *

5 *

25

0

*

25

1

*

25

2

*

25

3

*

25

4

*

Tabel 9. Final cluster centroid.

Cluster

1 2 3

Zscore(v

1) 0.48408

-

0.70244 0.61811

Zscore(v

2)

-

0.76434 0.99986

-

0.42446

Zscore(v

3) 0.00837

-

0.54553 2.70304

Zscore(v

4)

-

0.08154

-

0.43978 2.71299

Tabel 10. Anggota

cluster.

Page 11: Aplikasi K-means Untuk Pengelompokan Rumah Tangga Di ... · 354 | Proceeding for Call Paper PEKAN ILMIAH DOSEN FEB – UKSW, 14 DESEMBER 2012 APLIKASI K-MEANS UNTUK PENGELOMPOKAN

APLIKASI K-MEANS...( Tinus Septioko, Hanna Arini Parhusip, Tundjung Mahatma) 365

Cluster 1 127

2 106

3 21

Valid 254

Missing 0

Tabel 11. Anggota cluster 1.

Cluster 1

program

k-means

SPSS program

k-means

SPSS

16 16 126 126

25 25 160 160

27 27 161 161

34 34 165

36 36 190

47 47 192 192

52 52 210

62 62 218 218

75 64 219 219

95 95 230

107 107 237 237

109 109 246 246

121 121

LAMPIRAN DATA SUSENAS SALATIGA 2011

No

.

A

(or

ang

)

B

(Rp)

C

(Rp)

D

(Rp)

1 2 3 4 5

1 5

1,759,86

4

2,705,00

0 824,383

2 5

1,783,28

5

3,364,33

3

1,418,61

6

3 3

1,346,14

2

6,040,00

0

4,297,65

0

4 4

1,118,57

1

3,353,00

0

1,936,73

3

5 3 774,857

1,426,33

3 773,483

6 4

1,740,75

0

7,664,40

0

5,270,86

6

7 7

2,602,71

4

6,285,66

7

3,323,50

0

8 3

1,959,21

4

5,950,00

0

3,734,66

7

9 3

2,281,07

1

5,750,00

0

3,154,33

3

10 2 745,285

1,323,33

3 472,666

11 2 705,000 1,650,33 937,133

3

12 2 708,642

1,051,40

0 359,666

13 4

1,278,85

7

7,826,61

7

6,677,78

3

14 2 741,000

1,466,66

7 719,666

15 6

1,963,92

8

3,500,00

0

1,048,66

6

16 4

1,456,50

0

24,633,3

33

22,132,2

83

17 5

1,550,22

8

3,450,00

0

1,820,00

0

18 1 602,142

6,366,66

7

5,580,66

6

19 7

1,954,28

5

4,661,66

7

2,147,49

9

20 4

1,670,14

2

4,976,66

7

3,411,16

6

21 6

2,052,00

0

7,068,00

0

4,795,40

0

22 7

1,573,07

1

5,098,66

7

3,340,06

6

23 5 934,714

1,225,00

0 485,166

24 3 1,131,85 3,316,66 2,182,40

Page 12: Aplikasi K-means Untuk Pengelompokan Rumah Tangga Di ... · 354 | Proceeding for Call Paper PEKAN ILMIAH DOSEN FEB – UKSW, 14 DESEMBER 2012 APLIKASI K-MEANS UNTUK PENGELOMPOKAN

366 | Proceeding for Call Paper PEKAN ILMIAH DOSEN FEB – UKSW, 14 DESEMBER 2012

7 7 0

25 4

4,218,00

0

12,559,3

33

7,585,43

3

26 3

1,279,07

1

2,439,16

7

1,024,26

6

27 6

2,525,14

2

13,850,4

17

11,987,8

99

28 3 814,285

1,780,00

0 841,667

29 5

1,621,92

8

4,156,33

3

2,352,56

6

30 1 938,571

3,057,66

7

1,987,10

0

31 5

1,042,92

8

2,950,83

3

1,934,77

4

32 5

1,038,96

4

1,613,66

7 578,950

33 5

1,937,14

2

3,356,66

7

1,292,16

6

34 4

3,159,00

0

24,841,6

67

20,379,2

99

35 4

1,431,53

5

5,533,33

3

3,889,91

7

36 7

4,617,64

2

11,833,3

33

5,955,65

0

37 5

1,869,85

7

2,622,33

3 671,567

38 3

1,274,14

2

2,520,00

0

1,439,66

6

39 4 956,442

2,399,66

7

1,280,83

3

40 3

1,031,48

5

2,164,24

3 967,866

41 2

1,056,42

8

2,310,00

0

1,068,73

3

42 3 597,857

1,910,00

0

1,286,28

6

43 6

1,101,70

7

1,786,10

0 739,233

44 4 899,142

2,103,33

3

1,136,49

9

45 4 996,000

2,560,71

4

1,836,50

1

46 2 640,071

1,600,00

0 928,666

47 4

2,450,14

2

16,557,1

67

13,695,5

83

48 1 921,000

2,916,06

7

1,975,93

3

49 5 957,857

2,040,00

0 989,667

50 5

1,414,28

5

2,941,66

7

1,338,66

6

51 5

1,943,57

1

3,008,33

3 963,171

52 6

2,689,28

5

11,791,6

67

8,712,66

6

53 1 944,357

1,883,33

3 856,118

54 8

2,232,85

7

5,183,25

0

2,770,61

6

55 3

1,490,14

2

5,577,33

3

3,595,40

0

56 3 972,857

2,161,33

3 965,350

57 4

1,145,46

4

2,287,00

0

1,050,43

3

58 1 495,428

3,048,00

0

2,487,61

6

59 2 512,250

1,060,66

7 393,616

60 5

1,452,85

7

2,395,00

0 849,833

61 4 922,607

2,199,83

3

1,255,14

7

62 6

3,604,71

4

12,284,5

67

8,215,69

9

63 3

1,000,07

1

4,386,73

3

3,304,83

3

64 1

1,323,21

4

10,166,6

66

8,676,74

9

65 3 886,500

1,233,33

3 362,167

66 5

2,157,42

8

3,329,33

3

1,283,08

3

67 3 1,033,28 2,388,33 1,329,67

Page 13: Aplikasi K-means Untuk Pengelompokan Rumah Tangga Di ... · 354 | Proceeding for Call Paper PEKAN ILMIAH DOSEN FEB – UKSW, 14 DESEMBER 2012 APLIKASI K-MEANS UNTUK PENGELOMPOKAN

APLIKASI K-MEANS...( Tinus Septioko, Hanna Arini Parhusip, Tundjung Mahatma) 367

5 3 0

68 4

1,035,42

8

3,636,66

7

2,571,66

6

69 2

1,433,57

1

8,333,33

3

6,659,76

6

70 5

1,317,10

7

5,161,06

7

3,728,93

3

71 4

1,226,05

7

9,276,76

0

7,665,79

3

72 4 562,285

5,866,66

7

4,945,08

3

73 1 735,000

2,982,00

0

1,992,38

3

74 4

1,341,90

8

5,406,66

6

4,069,69

8

75 9

3,446,57

1

8,833,33

3

3,430,66

6

76 2 873,385

1,246,60

0 342,766

77 1 156,642 331,667 167,916

78 3

1,737,85

7

3,450,00

0

1,629,16

6

79 5

1,319,35

7

2,023,33

3 737,916

80 7

2,058,10

7

5,387,33

3

3,223,66

6

81 3

1,402,26

4

5,411,66

7

3,970,08

3

82 2 848,614

1,509,80

0 660,193

83 4

1,267,71

4

1,976,66

7 740,416

84 2 645,107

2,169,33

3

1,284,26

6

85 5

2,625,42

8

4,226,66

7

1,474,16

7

86 3

1,263,53

5

3,283,33

3

1,716,66

6

87 4

1,161,64

2

1,939,00

0 659,933

88 4

3,301,71

4

6,684,66

7

2,494,48

3

89 6 1,786,28 3,399,00 1,419,03

5 0 3

90 7

1,514,78

5

3,253,33

3

1,198,16

7

91 4

1,080,64

2

1,823,33

3 661,833

92 5

1,614,42

8

2,982,50

0

1,107,49

9

93 3

1,134,21

4

2,859,35

0

1,542,08

3

94 4

1,426,17

8

2,674,50

0

1,098,10

0

95 6

4,536,42

8

27,020,0

00

22,262,8

33

96 3 556,071

1,183,33

3 601,049

97 4

3,017,14

2

5,800,00

0

2,581,23

3

98 4 789,642

2,420,66

7

1,485,83

3

99 6

1,275,00

0

4,056,66

7

2,570,86

7

10

0 3

1,165,28

5

2,105,50

0 894,400

10

1 5

1,422,00

0

5,803,51

7

4,317,05

0

10

2 7

2,380,71

4

4,266,66

7

1,765,25

4

10

3 8

2,290,28

5

3,800,00

0

1,426,49

0

10

4 2 560,057 983,333 388,200

10

5 5

1,131,00

0

1,745,00

0 690,667

10

6 3

1,771,50

0

4,171,66

7

2,396,01

8

10

7 10

5,164,17

8

19,250,0

00

13,279,3

00

10

8 2 749,571

1,095,56

7 337,133

10

9 5

2,071,28

5

15,095,6

67

12,595,0

50

11

0 2 801,000

4,694,66

7

3,572,03

3

Page 14: Aplikasi K-means Untuk Pengelompokan Rumah Tangga Di ... · 354 | Proceeding for Call Paper PEKAN ILMIAH DOSEN FEB – UKSW, 14 DESEMBER 2012 APLIKASI K-MEANS UNTUK PENGELOMPOKAN

368 | Proceeding for Call Paper PEKAN ILMIAH DOSEN FEB – UKSW, 14 DESEMBER 2012

11

1 6

1,287,42

8

5,436,66

7

3,769,63

3

11

2 1 828,000

5,307,66

7

4,126,23

3

11

3 5

2,015,57

1

4,200,00

0

1,836,08

3

11

4 7

1,561,71

4

2,404,16

7 710,600

11

5 7

2,049,64

2

4,090,00

0

1,636,48

2

11

6 3 841,928

1,206,33

3 431,749

11

7 1 915,000

3,916,66

7

2,820,46

6

11

8 3

1,330,92

8

2,276,66

7 761,417

11

9 5

1,876,28

5

3,726,66

7

1,764,00

0

12

0 6

1,462,28

5

6,225,00

0

3,429,11

7

12

1 4

3,232,28

5

15,405,0

00

11,411,8

66

12

2 3

1,148,03

5

1,801,66

7 545,400

12

3 4 791,785

2,200,96

7

1,324,24

6

12

4 4 946,285

2,680,86

7

1,675,39

9

12

5 3

1,133,14

2

3,866,66

7

2,634,23

3

12

6 8

1,901,46

4

9,955,00

0

7,915,26

6

12

7 6

1,353,21

4

2,020,16

7 683,999

12

8 1 242,678 354,667 114,000

12

9 5

2,075,35

7

4,540,00

0

2,133,99

9

13

0 4

1,305,85

7

2,113,33

3

1,216,50

0

13

1 1 320,571

2,573,33

3

2,109,83

3

13 3 1,327,07 2,191,66 1,022,86

2 1 7 6

13

3 4

1,403,78

5

3,600,00

0

2,248,83

3

13

4 1 989,142

1,530,00

0 875,917

13

5 3

1,041,42

8

1,998,33

3 608,000

13

6 2 834,857

1,626,66

7 443,000

13

7 6

1,288,50

0

2,523,33

3

1,021,66

7

13

8 7

1,358,57

1

2,100,00

0

1,001,40

0

13

9 1 442,285 985,000 444,600

14

0 6

1,613,35

7

3,486,66

7

1,565,63

3

14

1 4

1,426,60

7

3,950,00

0

2,487,91

6

14

2 3

1,900,28

5

4,503,08

3

2,477,66

6

14

3 4

1,057,92

8

2,034,33

3 952,866

14

4 4

2,412,53

5

5,467,50

0

2,797,58

3

14

5 3

1,073,57

1

8,166,66

7

6,920,74

9

14

6 3 694,714

1,821,66

7 991,967

14

7 3

1,602,53

5

3,384,63

3

1,629,33

3

14

8 3 904,285

2,230,00

0

1,131,20

0

14

9 1 632,142

1,500,00

0 943,400

15

0 4

1,554,77

1

6,960,66

7

5,014,65

8

15

1 1 544,285

1,948,33

3

1,366,11

7

15

2 1 438,107

2,090,00

0

1,421,16

6

15

3 1 621,428

2,250,00

0

1,630,83

3

Page 15: Aplikasi K-means Untuk Pengelompokan Rumah Tangga Di ... · 354 | Proceeding for Call Paper PEKAN ILMIAH DOSEN FEB – UKSW, 14 DESEMBER 2012 APLIKASI K-MEANS UNTUK PENGELOMPOKAN

APLIKASI K-MEANS...( Tinus Septioko, Hanna Arini Parhusip, Tundjung Mahatma) 369

15

4 1 688,285

1,686,66

7 945,966

15

5 1 450,000 854,000 403,666

15

6 1 968,571

1,797,83

3 799,167

15

7 1 209,464 608,333 268,000

15

8 4 822,642

2,233,33

3

1,304,08

3

15

9 8

2,316,42

8

4,043,33

3

1,598,58

3

16

0 4

1,537,28

5

11,399,0

00

8,212,21

6

16

1 4

1,711,50

0

16,659,0

00

13,620,2

33

16

2 3 671,357 975,000 226,166

16

3 6

1,097,35

7

1,390,83

3 370,583

16

4 2 864,107

2,991,50

0

1,951,26

6

16

5 11

4,678,82

1

7,481,80

0

2,483,16

6

16

6 2

1,709,35

7

3,181,33

3

1,424,26

6

16

7 10

1,231,07

1

7,968,00

0

5,117,16

7

16

8 7

1,721,89

2

4,676,66

7

2,922,33

3

16

9 4

1,141,28

5

7,266,66

7

6,098,50

0

17

0 2 322,500 651,667 271,000

17

1 3 902,464

4,933,33

3

2,985,66

7

17

2 2 408,428

1,166,66

7 716,917

17

3 5 453,000 714,000 359,250

17

4 3

1,371,42

8

5,083,33

3

3,591,33

3

17 1 233,571 345,000 49,666

5

17

6 2 851,357

2,253,33

3

1,368,90

0

17

7 3 508,714 740,000 203,483

17

8 2 600,428

1,500,00

0 674,666

17

9 3 920,571

1,783,33

3 787,336

18

0 4

1,273,50

0

4,650,00

0

3,375,03

3

18

1 5

1,406,78

5

3,050,00

0

1,432,83

3

18

2 4

1,730,35

7

4,766,66

7

2,615,91

6

18

3 4 495,428

1,146,66

7 578,366

18

4 1 720,000

1,150,00

0 366,666

18

5 3 786,428

1,900,00

0

1,115,00

0

18

6 4 785,785

1,833,33

4 990,733

18

7 4

1,418,14

2

6,353,33

3

3,460,41

7

18

8 3

1,373,35

7

7,613,33

3

5,900,46

6

18

9 5

1,089,25

7

2,491,66

7

1,294,83

3

19

0 3

2,351,78

5

9,453,33

3

6,725,26

6

19

1 2 502,928

1,450,00

0 971,970

19

2 3

1,941,21

4

9,523,33

3

8,529,85

8

19

3 5

2,192,67

8

7,716,00

0

3,702,23

3

19

4 4

2,118,85

7

6,500,00

0

2,985,16

7

19

5 1 585,535

3,440,33

3

2,252,95

9

19

6 3

1,368,64

2

2,277,53

3 781,267

Page 16: Aplikasi K-means Untuk Pengelompokan Rumah Tangga Di ... · 354 | Proceeding for Call Paper PEKAN ILMIAH DOSEN FEB – UKSW, 14 DESEMBER 2012 APLIKASI K-MEANS UNTUK PENGELOMPOKAN

370 | Proceeding for Call Paper PEKAN ILMIAH DOSEN FEB – UKSW, 14 DESEMBER 2012

19

7 4 661,200

1,750,46

7

1,028,63

3

19

8 2 681,857

1,103,33

3 290,933

19

9 2

1,432,50

0

2,698,10

0

1,199,43

3

20

0 3 493,714

1,330,33

3 824,666

20

1 1 513,857 948,800 409,033

20

2 1 699,642

1,797,33

3

1,056,90

0

20

3 1 456,428

1,288,00

0 771,833

20

4 1 422,142 921,333 490,667

20

5 1 537,000 962,133 370,400

20

6 2 738,857

3,840,00

0

2,946,56

6

20

7 5 703,928

1,458,33

3 933,366

20

8 3 812,142

2,525,00

0

1,671,33

3

20

9 4 985,607

2,190,00

0

1,020,16

6

21

0 3

3,830,57

1

9,066,66

7

5,023,16

6

21

1 2

1,163,57

1

3,016,66

7

1,843,75

2

21

2 3

1,395,47

1

5,316,63

3

3,851,63

3

21

3 5 936,750

1,570,00

0 656,766

21

4 2 369,000

1,006,66

7 601,016

21

5 2 733,071

3,100,00

0

2,222,62

0

21

6 2 514,928

1,253,33

3 639,166

21

7 4

1,592,35

7

5,678,33

3

3,562,33

3

21 2 1,759,71 11,566,6 8,887,23

8 4 67 3

21

9 3

4,060,71

4

17,603,6

67

10,333,9

83

22

0 5

1,932,53

5

3,221,00

0

1,108,26

7

22

1 3

1,495,17

8

2,786,00

0

1,105,65

0

22

2 1 267,428 340,000 56,500

22

3 3

1,153,28

5

3,116,66

7

1,903,58

3

22

4 3 577,714

1,116,66

7 444,333

22

5 4

1,829,14

2

8,725,00

0

6,383,16

7

22

6 5

1,615,39

2

4,504,76

7

2,397,83

7

22

7 5 668,571

1,205,96

7 562,171

22

8 4

1,061,78

5

3,700,00

0

2,608,75

4

22

9 4 909,428

1,743,00

0 744,999

23

0 7

5,211,00

0

7,250,00

0

2,062,17

0

23

1 3 756,428

1,960,00

0

1,072,50

3

23

2 4 804,428

2,366,66

7

1,389,11

7

23

3 5 900,857

2,083,33

3

1,046,41

7

23

4 3 990,857

1,625,00

0 628,833

23

5 6

1,656,21

4

3,231,66

7

1,434,00

1

23

6 1 713,571

1,284,66

7 698,500

23

7 6

2,664,64

2

19,300,0

00

15,559,2

50

23

8 1 872,142

2,119,16

7

1,184,91

6

23

9 1 411,428 981,133 584,866

Page 17: Aplikasi K-means Untuk Pengelompokan Rumah Tangga Di ... · 354 | Proceeding for Call Paper PEKAN ILMIAH DOSEN FEB – UKSW, 14 DESEMBER 2012 APLIKASI K-MEANS UNTUK PENGELOMPOKAN

APLIKASI K-MEANS...( Tinus Septioko, Hanna Arini Parhusip, Tundjung Mahatma) 371

24

0 1 637,714

6,500,00

0

5,312,26

7

24

1 1 377,142

1,150,00

0 851,366

24

2 1 642,857

3,056,66

7

2,318,63

3

24

3 1 811,714

1,677,33

3 861,333

24

4 1

1,422,85

7

4,670,33

3

3,172,73

3

24

5 4

1,191,42

8

4,936,00

0

3,152,33

6

24

6 4

1,681,71

4

12,466,6

67

10,403,6

83

24 4 1,168,71 2,341,66 1,093,17

7 4 7 3

24

8 5

1,305,21

4

3,900,00

0

2,078,15

3

24

9 4 724,285

2,100,00

0

1,246,42

0

25

0 3 572,785

4,266,66

7

3,440,91

6

25

1 1 867,857

4,674,00

0

3,587,16

8

25

2 2 525,642

3,566,66

7

2,613,66

8

25

3 1 460,714

1,571,93

3

1,342,58

4

25

4 1

1,075,71

4

1,766,66

7 689,000

Page 18: Aplikasi K-means Untuk Pengelompokan Rumah Tangga Di ... · 354 | Proceeding for Call Paper PEKAN ILMIAH DOSEN FEB – UKSW, 14 DESEMBER 2012 APLIKASI K-MEANS UNTUK PENGELOMPOKAN

372 | Proceeding for Call Paper PEKAN ILMIAH DOSEN FEB – UKSW, 14 DESEMBER 2012