Cluster Non Hirarki

BAB I

PENDAHULUAN

1.1 Latar Belakang

Sektor industri menempati posisi sentral dalam ekonomi masyarakat modern dan

merupakan motor penggerak yang memberikan dasar bagi peningkatan kemakmuran,

terutama di negara-negara maju. Bagi negara berkembang, industri sangat esensial untuk

memperluas landasan pembangunan dan memenuhi kebutuhan masyarakat yang terus

meningkat. Banyak kebutuhan umat manusia hanya dapat dipenuhi oleh barang dan jasa yang

disediakan dari sektor industri.

Pembangunan di Indonesia khususnya pada sektor industri telah mengalami

perkembangan yang cukup pesat. Perkembangan industri ini ternyata membawa dampak bagi

kehidupan manusia, baik dampak positif maupun dampak negatif. Dampak positif dari

kegiatan industri adalah dapat mengurangi tingkat pengangguran, menambah devisa negara

melalui ekspor produk industri, serta dapat menarik para investor untuk menanamkan modal

pada sektor ini. Selain dampak positif, kegiatan industri juga menimbulkan dampak negatif.

Salah satu dampak negatif yang ditimbulkan adalah pencemaran udara. Pencemaran udara

dirasakan semakin hari kian meningkat terutama daerah yang kepadatan lalu lintasnya cukup

tinggi serta di lokasi industri yang kurang memperhatikan dampak lingkungan. Udara yang

tercemar dapat merusak lingkungan sekitarnya dan berpotensi terganggunya kesehatan

masyarakat sekitar.

Dengan meningkatnya beban pencemaran udara sebagai efek negatif dari kegiatan

industri, maka diperlukan pengelompokkan industri berdasarkan beban polutan yang

dihasilkan untuk mengetahui tingkat pencemaran udara dari tiap jenis industri. Hal tersebut

dimaksudkan agar pemerintah dan pelaku industri dapat merelokasikan zona industri,

melakukan pemantauan kualitas udara pada tiap kelompok industri.

Dalam analisis statistik, kriteria polutan tersebut dinyatakan sebagai variat. Semakin

banyak unsur yang menjadi kriteria polutan akan semakin rumit analisis statistik yang harus

dilakukan. Dari sekian banyak metode statistika, analisis multivariat merupakan analisis yang

cocok untuk meringkas data dengan peubah yang banyak. Beberapa analisis dalam analisis

multivariat yang dapat digunakan untuk memahami dan mempermudah interpretasi data

multivariat diantaranya adalah Analisis Cluster (Tim Penelitian dan Pengembangan,

2005:120).

Analisis ini bertujuan untuk mengelompokkan objek-objek berdasarkan karakteristik

diantara objek-objek tersebut. Dari analisis cluster kita dapat mengetahui kelompok-

kelompok yang terbentuk dengan ciri khas dari tiap kelompok. Banyak objek yang dapat

dikelompokkkan dengan analisis cluster, diantaranya adalah produk (barang dan jasa), benda,

manusia (responden, konsumen) (Supranto, 2004: 141).

Analisis cluster dibagi dalam 2 metode, yaitu :

1. Metode Hierarchical

2. Metode Non - Hierarchical

Dalam masalah ini akan dibahas mengenai analisis cluster dengan metode hierarchical

dan metode non-hierarchical. Pada metode hierarchical ini memulai mengelompokkan

dengan dua atau lebih obyek yang mempunyai kesamaan paling dekat. Kemudian proses

diteruskan ke obyek lain yang mempunyai kedekatan kedua. Demikian seterusnya sehingga

cluster akan membentuk semacam “pohon” hierarki (tingkatan) yang jelas antar obyek, dari

yang paling mirip sampai yang paling tidak mirip. Dendogram biasanya digunakan untuk

membantu memperjelas proses hierarki tersebut.

1.2 Rumusan Masalah

Dalam uraian diatas maka dapat dibentuk rumusan masalah yaitu bagaimana

melakukan pengelompokkan data dengan menggunakan metode clustering?

1.3 Tujuan

Dari rumusan masalah di atas maka tujuan dan maksud dari presentasi ini adalah

sebagai berikut memberikan penjelasan bagaimana menggelompokkan data dengan

menggunakan metode clustering.

BAB II

KAJIAN TEORI

Analisis cluster merupakan teknik multivariat yang mempunyai tujuan utama untuk

mengelompokkan objek-objek berdasarkan karakteristik yang dimilikinya. Analisis cluster

mengklasifikasi objek sehingga setiap objek yang paling dekat kesamaannya dengan objek

lain berada dalam cluster yang sama.

Analisis cluster termasuk dalam analisis statistik multivariat metode interdependen.

Sebagai alat analisis interdependen maka tujuan analisis cluster tidak untuk menghubungkan

ataupun membedakan dengan sampel/variabel lain. Analisis cluster merupakan salah satu alat

analisis yang berguna sebagai peringkas data. Dalam meringkas data ini dapat dilakukan

dengan jalan mengelompokkan objek-objek berdasarkan kesamaan karakteristik tertentu di

antara objek-objek yang hendak diteliti.

Analisis cluster merupakan alat untuk mengelompokkan sejumlah n obyek

berdasarkan p variat yang secara relatif mempunyai kesamaan karakteristik diantara obyek –

obyek tersebut, sehingga keragaman di dalam suatu kelompok tersebut lebih kecil

dibandingkan keragaman antar kelompok. Obyek dapat berupa barang, jasa, tumbuhan,

binatang dan orang (responden, konsumen, atau yang lainnya).

Jika terdapat n obyek dan p variat, maka observasi xij

dengan i = 1, 2,…, n dan j = 1, 2, …, p,

dapat digambarkan sebagai berikut:

Var 1 Var 2 … Var j … Var p

x11

x12

… x1j

… x1p

Obyek 2 x21

x22

… x2j

… x2p

: : : : : : :

Obyek i xi1

xi2

: xij : x

ip

: : : : : : :

Obyek n xn1

xn2

: xnj

: xnp

Adapun ciri-ciri cluster adalah:

1. Homogenitas (kesamaan) yang tinggi antar anggota dalam satu cluster (within-cluster).

2. Heterogenitas (perbedaan) yang tinggi antar cluster yang satu dengan cluster yang

lainnya (between-cluster).

Analisis cluster mempunyai beberapa istilah penting, antara lain:

1. Skedul aglomerasi (agalomeration schedule), ialah jadwal yang memberikan informasi

tentang objek atau kasus yang akan dikelompokkan pada setiap tahap pada suatu

proses analisis cluster yang hierarkis.

2. Rata-rata cluster (cluster centroid), ialah nilai rata-rata variabel dari semua objek atau

observasi dalam cluster tertentu.

3. Pusat cluster (cluster centers), ialah titik awal dimulainya pengelompokkan di dalam

cluster nonhierarki.

4. Keanggotaan cluster (cluster membership), ialah keanggotaan yang menunjukkan

cluster untuk setiap objek yang menjadi anggotanya.

5. Dendogram, disebut juga grafik pohon, output MINITAB yang memvisualisasikan

hasil analisis cluster yang dilakukan peneliti. Garis vertikal atau tegak menunjukkan

cluster yang digabung bersama. Posisi garis pada pada skala menunjukkan jarak untuk

mana cluster digabung. Dendogram harus dibaca dari kiri ke kanan.

6. Distances between cluster centers, ialah jarak yang menunjukkan bagaimana

terpisahnya pasangan individu cluster

Proses Analisis Cluster

Untuk melakukan analisis cluster ada beberapa proses yang harus dilakukan . Proses

analisis cluster tersebut meliputi :

1. Menentukan ukuran ketakmiripan antar dua objek.

Sesuai prinsip daftar cluster yaitu mengelompokkan objek yang mempunyai kemiripan,

maka proses pertama adalah mengukur seberapa jauh ada kesamaan antar objek. Dengan

memiliki sebuah ukuran kuantitatif untuk mengatakan bahwa dua obyek tertentu lebih mirip

dibandingkan dengan obyek lain, akan menghilangkan kebingungan dan mempermudah

proses formal dalam pengclusteran. Salah satu yang jelas bisa menjadi ukuran ketakmiripan

adalah fungsi jarak antara objek a dan b, yang biasa dinotasikan dengan d(a,b).

Sifat – sifat ukuran ketakmiripan adalah :

1) d(a.b) ≥ 0

2) d(a,a) = 0

3) d(a,b) = d(b,a)

4) (a,b) meningkat seiring semakin tidak mirip kedua objek a dan b.

5) d(a,c) ≤ d(a,b) + d(b,c) (Sartono, 2003:216).

Jarak yang paling umum digunakan adalah jarak euclidean. Ukuran jarak atau

ketidaksamaan antar obyek ke-i dengan obyek ke-h, disimbolkan dengan dih

. Nilai dih

diperoleh melalui perhitungan jarak kuadrat Euclidean sebagai berikut ∑ (

)

dimana:

dih

= jarak kuadrat Euclidean antar obyek ke-i dengan obyek ke-h.

p = jumlah variabel cluster.

xij

= nilai atau data dari obyek ke-i pada variabel ke-j.

xhj

= nilai atau data dari obyek ke-h pada variabel ke-j

2. Membuat Cluster

Proses cluster atau pengelompokan data bisa dilakukan dengan dua metode yaitu;

a. Metode Hirarki

Metode ini memulai pengelompokan dengan dua atau lebih objek yang mempunyai

kesamaan paling dekat. Kemudiaan operasi diteruskan ke objek lain yang mempunyai

kedekatan kedua. Demikian seterusnya sehingga cluster akan membentuk semacam „pohon‟

dimana ada hirarki (tingkatan) yang jelas antar objek, dari yang paling mirip sampai paling

tidak mirip. Metode yang digunakan untuk proses Clustering secara hirarki adalah Single

Linkage (Pauatan Tunggal). Metode ini akan mengelompokan dua objek yang mempunyai

jarak terdekat dahulu. Jadi pada setiap tahapan, banyaknya cluster berkurang satu. Secara

formal, dua buah cluster Br dan B

s, jarak antara B

r dan B

s misalkan h(B

r,B

s) didefinisikan

sebagai : h(Br,B

s) = min{d(x

i,x

j); x

i anggota B

r, x

j anggota B

s}

Hasil berupa single linkage clustering dapat disajikan dalam bentuk suatu dendogram atau

diagram pohon. Cabang-cabang pohon menunjukkan cluster/kelompok. Cabang-cabang

tersebut bertemu bersama-sama (menggabung) pada simpul yang posisinya sepanjang suatu

sumbu jarak (kemiripan) menunjukkan tingkat dimana penggabungan terjadi.

b. Metode Non-hirarki

Metode ini dimulai dengan proses penentuan jumlah cluster terlebih dahulu. Metode

Non-hirarki bertujuan mengelompokkan n obyek kedalam k kelompok metode ini

yang digunakan adalah k-means. Metode k-means digunakan sebagai alternatif metode cluster

untuk data dengan ukuran yang besar karena memiliki kecepatan yang lebih tinggi

dibandingkan metode hirarki.

Mac Queen menyarankan bahwa penggunaan k-means untuk menjelaskan algoritma dalam

penentuan suatu objek ke dalam cluster tertentu berdasarkan rataan terdekat. Proses

Pengelusteran dengan metode k-means adalah :

1) Menetukan besarnya k, yaitu banyaknya cluter dan menentukan centroid di tiap cluster.

2) Menghitung jarak tiap objek dengan setiap centroid.

3) Menghitung kembali rataan (centroid) untuk cluster yang baru terbentuk.

4) Mengulangi langkah 2 sampai tidak ada lagi pemindahan objek antar cluster

5) Setelah cluster terbentuk, baik dengan metode hirarki maupun non hirarki, langkah

selanjutnya melakukan interpretasi terhadap cluster yang terbentuk,yang pada intinya

memberi nama spesifik untuk menggambar isi cluster tersebut.

6) Melakukan validasi cluster.

Untuk menguji validasi cluster digunakan uji parsial F.

Hipotesis:

H0: variabel i bukan variabel pembeda dalam pengclusteran.

H1: variabel i merupakan variabel pembeda dalam pengclusteran

Taraf signifikansi α

Statistik uji

F=

Kriteria Uji :

Tolak H0 jika F > F

α, k-1,n-k

BAB III

PEMBAHASAN

3.1 Metode Hierarki

Berdasarkan data BPS (Badan Pusat Statistik) Semarang yaitu data tentang beban

pencemaran udara menurut industry di Jawa Tengah tahun 2005. Data yang diunakan dalam

permasalahan ini ada 5 variabel, dimana variable-variabel tersebut adalah jenis polutan yang

meliputi debu, Sulfur dioksida (SO2), Hidrocarbon (HC), dan Carbonmonoksida (CO).

Sedangkan obyek-obyek yang digunakan adalah 14 jenis Industri di Jawa Tengah yaitu

Industri makanan, minuman, tekstil, kayu, olahan kayu, kertas, kimia dasar, non logam,

semen, kapur dan gips, logam dasar, hasil-hasil olahan logam, rumah sakit, dan industry

perhotelan.

Dalam contoh ini akan digunakan proses clustering secra hirarki menggunakan

metode pautan tunggal atau single lingkage metode ini didasarkan pada jarak minimum.

Tabel. 1

Data Beban Pencemaran Udara pada Sektor Industri

Di Jawa Tengah Tahun 2005 (dalam ton)

Industri debu SO2 NO2 HC CO

makanan 16941.8 157563 73638.52 3168.8 393.13

Minuman 14608.3 135861 62496.05 2732.1 338.94

Tekstil 92737.1 862476 403086.58 17343.7 2151.66

Kayu 37078.6 344839 161163.97 8876.5 860.28

Olahan kayu 63789.9 575982 269190.49 11582.5 1436.93

Kertas 4916.8 483239 2137.91 919.5 131.40

Kimia dasar 6031.1 56090 27387.22 1127.9 139.93

non ogam 5226.6 48609 22717.69 977.5 121.27

Semen 509.7 4741 2215.52 95.3 11.83

Kapur dan Gips 9945.9 19350 10694.06 1860.1 230.75

Logam dasar 3830.5 35624 21977.07 1002.9 88.87

Hasil Olahan Logam 7291.3 67810 31691.85 1363.6 168.34

Rumah sakit 63.4 59 284.02 11.9 1.47

Perhotelan 98.2 91 426,64 18.4 2.28

Dalam melakukan analisis cluster terdapat dua metode yaitu metode kelompok hiraki

dan metode kelompok non hirarki. Dalam hal ini metode yang digunakan adalah metode

hiraki karena paling banyak digunakan oleh para peneliti dan memiliki keunggulan tersendiri,

yaitu pengelompokan yang terbentuk dapat terjadi secara alamiah. Kita menyelesaikan

permasalahan ini menggunakan minitab, berikut langkah-langkahnya:

1. Stat – Multivariat – Cluster Observation

2. Variable of distance matrik(masukan seluruh variable yang diteliti

3. Lingkage method (dalam pembahsan ini meggunakn single)

4. Number of cluster (pilih 1)

5. Centang standardize variable

6. Centang

7. Show dendogram

8. Klik ok

Berdasarkan hasil pengolahan menggunakan Minitab didapatkan Hasil sebagai berikut:

Cluster Analysis of Observations: debu, CO, SO2, HC

Standardized Variables, Euclidean Distance, Single Linkage

Amalgamation Steps

Number

of obs.

Number of Similarity Distance Clusters New in new

Step clusters level level joined cluster cluster

1 13 99.9671 0.00219 13 14 13 2

2 12 99.5318 0.03118 9 13 9 3

3 11 99.1321 0.05778 7 8 7 2

4 10 98.6922 0.08707 7 11 7 3

5 9 98.6503 0.08987 7 12 7 4

6 8 97.4813 0.16770 1 2 1 2

7 7 96.2898 0.24703 7 10 7 5

8 6 95.9428 0.27014 7 9 7 8

9 5 92.1049 0.52567 1 7 1 10

10 4 78.5689 1.42693 1 6 1 11

11 3 75.0155 1.66353 1 4 1 12

12 2 74.9141 1.67028 1 5 1 13

13 1 67.2651 2.17957 1 3 1 14

Final Partition

Number of clusters: 1

Within Average Maximum

cluster distance distance

Number of sum of from from

observations squares centroid centroid

Cluster1 14 52 1.48746 5.25638

Keterangan

Pada Step (tahap) 1, terbentuk satu cluster antara industri Rumah Sakit dan Industri

Perhotelan dengan koofisien jarak 0.00219 yang menunjukkan besarnya jarak antara industri

Rumah sakit (13) dan Industri Perhotelan (14). Proses Aglomerasi dimulai dengan jarak antar

obyek yang paling dekat.

Pada step (tahap) 2,dapat dilihat terbentuknya cluster antara industri Semen (9) dan

Industri Rumah sakit (13), dengan nilai koofisien jarak sebesar 0.03118 yang menunjukkan

besarnya jarak terdekat antara industry semen dan kedua industry sebelumnya (industry

Rumah sakit dan Perhotelan). Dengan terbentuknya cluster tersebut, maka sekarang cluster

terdiri dari 3 obyek, yaitu industry rumah sakit, perhotelan dan juga industry semen.

Pada Step (tahap)3, dapat dilihat terbentuknya cluster antara industry Kimia dasar

dan industri non logam, dengan niai koefisien jarak 0.05778 yang menunjukkan jarak

terdekat antara industry Kimia dasar dan industry non logam. Terbentuk cluster baru dengan

anggota industry kimia dasar dan industry non logam.

Pada step 4, dapat dilihat terbentuk cluster antara industry kimia dasar dan industry

hasil olahan logam, dengan koefisien jarak 0.08707 yang menunjukkan jarak terdekat antara

industry hasil olahan logam dengan dua industry sebelumnya (industry kimia dasar dan

industry non logam). Dengan terbentuknya cluster tersebut, maka cluster sekarang terdiri dari

3 obyek yaitu industry kimia dasar, industry non logam dan industry hasil olahan logam.

3546141391012118721

67.27

78.18

89.09

100.00

Observations

Similarity

DendrogramSingle Linkage, Euclidean Distance

Pada step 7, didapatkan bahwa cluster antara industry kimia dasar, kapur dan gips,

logam dasar, dan industry hasil olahan logam dengan dan industry semen, rumah sakit dan

industry perhotelan dengan nilai koofisien jarak 0.24703 . Dengan terbentuknya cluster

tersebut, maka sekarang cluster terdiri dari 7 obyek, yaitu industry rumah sakit, perhotelan ,

industry semen , industry kimia dasar, kapur dan gips, logam dasar, dan industry hasil olahan

logam.

Dengan cara yang sama proses pengclusteran dilakukan terus menerus sampai step

terakhir yaitu step 13 hingga pada akhirnya hanya membentuk sebuah cluster saja. Lebih

jelasnya proses penggabungan satu demi satu dapat dilihat dalam bentuk dendogram diatas.

Interpretasi Hasil:

1. Hasil analisis cluster dari 14 jenis industry berdasarkan jenis polutan (debu, SO2, NO2,

HC, CO) dapat dikelompokan menjadi 3 kelompok atau cluster, yaitu

a. cluster pertama adalah kelompok indutri pencemaran kecil

b. Cluster kedua adalah kelompok industry pencemaran sedang

c. Cluster ketiga adalah kelompok industry pencemaran tinggi

2. Ciri-ciri tiap Cluster atau kelompok yaitu :

a. Cluster pertama : kelima jenis polutannya memiliki rata-rata kecil diantara cluster

yang lain anggotanya yaitu industry logam dasar, industry kapur dan gips, industry

semen, industry non logam, industry kimia dasar, industry minuman, industry

makanan, industry hasil olahan logam, industry rumah sakit, dan industry prhotelan.

b. Cluster kedua : kelima jenis polutannya memiliki rata-rata lebih dari cluster pertama

dan kurang dari cluster ketiga, anggotanya yaitu indutri kayu, industry olahan kayu,

dan industry kertas.

c. Cluster jetiga : kelima jenis polutannya memiliki rata-rata tebesar diantara cluster

yang lain, anggotanya yaitu industry tekstil.

3.2 Metode Non Hierarki

Sebagaimana telah dijelaskan sebelumnya bahwa metode K-Means Cluster ini jumlah

cluster ditentukan sendiri. Metode non-hirarki memproses semua objek (kasus) secara

sekaligus. Metode yang digunakan adalah k-means dimana k adalah banyaknya cluster .

Proses pengclusteran dengan metode k-means adalah :

a. Besarnya k (banyaknya cluster) = 3. Centroid ada 3 karena jumlah cluster ada tiga.

Nilai centroid diperoleh secara acak.

(centroid cluster ) adalah nilai kelima variabel dari obyek industri kertas

(centroid cluster ) adalah nilai kelima variabel dari obyek industri rumah sakit

(centroid cluster ) adalah nilai kelima variabel dari obyek industri tekstil

Nilai centroid dari tiap cluster adalah :

c1 = (4916,75; 483238,54; 21370,91; 919,53; 131,4)

c2 = (63,37; 58,93; 284,02, 11,85; 1,47)

c3 = (92737,12; 862476,34; 403086,58; 17343,74; 2151,66)

b. Jarak setiap objek dengan tiap centroid

Jarak setiap objek dari centroid ( pusat cluster) pertama dengan menggunakan kuadrat

jarak Euclidean adalah ;

Tabel 2.1 Jarak setiap objek dari pusat cluster pertama

Industri c1

Makanan (16941,83-4916,75)2

+ (157562,87-483238,54)2

+ (73638,52-21370,91)2

+ (3168,79-919,53)2

+ (393,13-

131,40)2

= 1,089x1011

Minuman (14608,25-4916,75)2

+ (135861,10-483238,54)2

+ (62496,05-21370,91)2

+ (2732,06-919,53)2

+ (338,94-

131,40)2

= 1,225x1011

Tekstil (92737,12-4916,75)2

+ (862476,34-483238,54)2

+ (403086,58-21370,91)2

+ (17343,74 -919,53)2

+

(2151,66-131,40)2

=2,975x1011

Kayu (37078,59-4916,75)2

+ (344839,36-483238,54)2

+ (161163,97-21370,91)2

+ (18876,55 -919,53)2

+

(860,28-131,40)2

= 4,005x1010

Olahan kayu (63789,95-4916,75)2

+ (575981,54-483238,54)2

+ (269190,49-21370,91)2

+ (11582,55-919,53)2

+

(1436,93-131,40)2

=7,360x1010

Kertas (4916,75-4916,75)2

+ (483238,54 -483238,54)2

+ (21370,91-21370,91)2

+ (919,53-919,53)2

+ (131,40-

131,40)2

= 0

Kimia dasar (6031,05-4916,75)2

+ (56090,16-483238,54)2

+ (27387,22-21370,91)2

+ (1127,93-919,53)2

+ ( 139,93-

131,40)2

= 1,825x1011

Non logam (5226,60-4916,75)2

+ (48608,60 -483238,54)2

+ (22717,69-21370,91)2

+ (977,48-919,53)2

+ (121,27-

131,40)2

= 1,889x1011

Semen (509,72-4916,75)2

+ (4740,50-483238,54)2

+ (2215,52-21370,91)2

+ (95,33-919,53)2

+ (11,83-131,40)2

=

2,293x1011

Kapur dan gips ( 9945,85-4916,75)2

+ (19350,26-483238,54)2

+ (10694,06-21370,91)2

+ (1860,05-919,53)2

+ (230,75-

131,40)2

= 2,153x1011

Logam Dasar

Jarak setiap objek dari centroid (pusat cluster) kedua dengan menggunakan kuadrat

jarak euclidean adalah;

Tabel 2.2 Jarak setiap objek dari pusat cluster kedua

Industri c2

Makanan (16941,83-63,37)2

+ (157562,87-58,93)2

+ (73638,52-284,02)2

+ (3168,79-11,85)2

+ (393,13-1,47)2

=3,048 x1010

Minuman (14608,25-63,37)2

+ (135861,10-58,93)2

+ (62496,05-284,02)2

+ (2732,06-11,85)2

+ (338,94-1,47)2

=

2,253 x1010

Tekstil (92737,12-63,37)2

+ ( 862476,34-58,93)2

+ (403086,58-284,02)2

+ (17343,74 -11,85)2

+ (2151,66-1,47)2

=9,149 x1011

Kayu (37078,59-63,37)2

+ (344839,36-58,93)2

+ (161163,97-284,02)2

+ (18876,55 -11,85)2

+ (860,28-1,47)2

=

1,465 x1011

Olahan kayu (63789,95-63,37)2

+ (575981,54-58,93)2

+ (269190,49-284,02)2

+ (11582,55-11,85)2

+ (1436,93-1,47)2

= 4,082 x1011

Kertas (4916,75-63,37)2

+ (483238,54 -58,93)2

+ (21370,91-284,02)2

+ (919,53-11,85)2

+ (131,40-1,47)2

=

2,339 x1011

Kimia dasar (6031,05-63,37)2

+ (56090,16-58,93)2

+ (27387,22-284,02)2

+ (1127,93-11,85)2

+ ( 139,93-1,47)2

=

3,911 x109

Non logam (5226,60-63,37)2

+ (48608,60-58,93)2

+ (22717,69-284,02)2

+ (977,48-11,85)2

+ (121,27-1,47)2

= 2,888

x109

Semen (509,72-63,37)2

+(4740,50-58,93)2

+ (2215,52-284,02)2

+ (95,33-11,85)2

+ (11,83-1,47)2

= 2,585x107

Kapur dan gips (9945,85-63,37)2

+ (19350,26-58,93)2

+ (10694,06-284,02)2

+ (1860,05-11,85)2

+ (230,75-1,47)2

=

5,817x108

Logam Dasar (3830,46-63,37)2

+ (35624,19-58,93)2

+ (21977,07-284,02)2

+ (1002,93-11,85)2

+ (88,87-1,47)2

= 1,751

x109

Hasil Olahan

Logam

(7291,27-63,37)2 + (67810,42-58,93)2 + (31691,85-284,02)2 + (1363,61-11,85)2 + (168,34-1,47)2

=5,631 x109

Rumah Sakit (63,37-63,37)2 + (58,93-58,93)2 + (284,02-284,02)2 + (11,85-11,85)2 + (1,47-1,47)2 = 0

Perhotelan (98,15-63,37)2 + ( 91,29-58,93)2 + ( 426,64-284,02)2 + ( 18,36-11,85)2 + (2,28-1,47)2 =2,264x104

Hasil Olahan

Logam

Rumah Sakit

Perhotelan

Jarak setiap objek dari centroid (pusat cluster) ketiga dengan menggunakan kuadrat jarak

euclidean adalah ;

Tabel 2.3 Jarak setiap objek dari pusat cluster ketiga

Industri c3

Makanan (16941,83-92737,12)2

+(157562,87-862476,34)2

+(73638,52-403086,58)2

+ (3168,79-17343,74)2

+

(393,13-2151,66)2

= 6,114 x1011

Minuman (14608,25-92737,12)2

+(135861,10-862476,34)2

+ (62496,05-403086,58)2

+ (2732,06-17343,74)2

+

(338,94-2151,66)2

= 6,503 x1011

Tekstil (92737,12-92737,12)2

+ (862476,34-862476,34)2

+ (403086,58-403086,58)2

+ (17343,74 -17343,74)2

+ (2151,66-2151,66)2

= 0

Kayu (37078,59-92737,12)2

+ (344839,36-862476,34)2

+ (161163,97-403086,58)2

+ (18876,55-17343,74)2

+

(860,28-2151,66)2

= 3,296 x1011

Olahan kayu (63789,95-92737,12)2

+ (575981,54-862476,34)2

+ (269190,49-403086,58)2

+ (11582,55-17343,74)2

+

(1436,93-2151,66)2

= 1,009 x1011

Kertas (4916,75-92737,12)2

+ (483238,54-862476,34)2

+ (21370,91-403086,58)2

+ (919,53-17343,74)2

+

(131,40-2151,66)2

= 2,975 x1011

Kimia dasar (6031,05-92737,12)2

+ (56090,16-862476,34)2

+ (27387,22-403086,58)2

+ (1127,93-17343,74)2

+ (

139,93-2151,66)2

= 7,992 x1011

Non logam (5226,60-92737,12)2

+ (48608,60-862476,34)2

+ (22717,69-403086,58)2

+ (977,48-17343,74)2

+

(121,27-2151,66)2

= 8,150 x1011

Semen (509,72-92737,12)2

+ (4740,50-862476,34)2

+ (2215,52-403086,58)2

+ (95,33-17343,74)2

+ (11,83-

2151,66)2

= 9,052 x1011

Kapur dan gips (9945,85-92737,12)2

+ (19350,26-862476,34)2

+ (10694,06-403086,58)2

+ (1860,05-17343,74)2

+

(230,75-2151,66)2

= 8,719 x1011

Logam Dasar (3830,46-92737,12)2

+ (35624,19-862476,34)2

+ (21977,07-403086,58)2

+ (1002,93-17343,74)2

+

(88,87-2151,66)2

= 8,371 x1011

Hasil Olahan

Logam (7291,27-92737,12)

2

+ (67810,42-862476,34)2

+ (31691,85-403086,58)2

+ (1363,61-17343,74)2

+

(168,34-2151,66)2

= 7,770 x1011

Rumah Sakit (63,37-92737,12)2 + (58,93-862476,34)2 + (284,02-403086,58)2 + (11,85-17343,74)2 + (1,47-

2151,66)2 = 9,149 x1011

Perhotelan (98,15-92737,12)2 +(91,29-862476,34)2 + (426,64-403086,58)2 + ( 18,36-17343,74)2 + (2,28-

2151,66)2 =9,147 x1011

Secara keseluruhan jarak tiap objek (industi) ke pusat cluster (centroid) adalah sebagai berikut;

Tabel 2.4 Jarak tiap objek ke centroid secara keseluruhan

Industri c1 c

2 c

3

Makanan 1,089x1011

3,048x1010

6,114 x1011

Minuman 1,225 x1011

2,253 x1010

6,503 x1011

Tekstil 2,975 x1011

9,149 x1011

0

Kayu 4,005 x1010

1,465 x1011

3,296 x1011

Olahan kayu 7,360 x1010

4,082 x1011

1,009 x1011

Kertas 0 2,339x1011

2,975 x1011

Kimia dasar 1,825 x1011

3,911 x109

7,992 x1011

Non logam 1,889 x1011

2,888 x109

8,150 x1011

Semen 2,293 x1011

2,585x107

9,052 x1011

Kapur&gips 2,153 x1011

5,817x108

8,719 x1011

Logam dasar 2,004 x1011

1,751x109

8,371 x1011

Hasil olahan

logam 1,727 x10

11

5,631x109

7,770 x1011

Rumah sakit 2,339 x1011

0 9,149 x1011

Perhotelan 2,339 x1011

2,264x104

9,147 x1011

Dari tabel 2.4 diperoleh sebagai berikut;

Jarak terdekat industri makanan adalah dengan c2, sehingga industri makanan masuk ke

cluster 2.

Jarak terdekat industri minuman adalah dengan c2, sehingga industri minuman masuk ke

cluster 2.

Jarak terdekat industri tekstil adalah dengan c3, sehingga industri tekstil masuk ke cluster

3.

Jarak terdekat industri kayu adalah dengan c1, sehingga industri kayu masuk ke cluster 1.

Jarak terdekat industri olahan kayu adalah dengan c1, sehingga industri olahan kayu

masuk ke cluster 1.

Jarak terdekat industri kertas adalah dengan c1, sehingga industri kertas masuk ke cluster

1.

Jarak terdekat industri kimia dasar adalah dengan c2, sehingga industri kimia dasar masuk

ke cluster 2.

Jarak terdekat industri non logam adalah dengan c2, sehingga industri non logam masuk

ke cluster 2.

Jarak terdekat industri semen adalah dengan c2, sehingga industri semen masuk ke cluster

2.

Jarak terdekat industri kapur dan gips adalah dengan c2, sehingga industri kapur dan gips

masuk ke cluster 2.

Jarak terdekat industri logam dasar adalah dengan c2, sehingga industri logam dasar

masuk ke cluster 2.

Jarak terdekat industri hasil olahan logam adalah dengan c2, sehingga industri hasil

olahan logam masuk ke cluster 2.

Jarak terdekat industri rumah sakit adalah dengan c2, sehingga industri rumah sakit masuk

ke cluster 2.

Jarak terdekat industri perhotelan adalah dengan c2, sehingga industri perhotelan masuk

ke cluster 2.

Dari proses ini diperoleh anggota tiap cluster sebagai berikut :

Cluster 1 dengan anggota : industri kayu, industri olahan kayu, industri kertas.

Cluster 2 dengan anggota : industri logam dasar, industri kapur dan gips, industri

semen, industri non logam, industri kimia dasar, industri minuman, industri makanan,

industri hasil olahan logam, industri rumah sakit, industri perhotelan.

Cluster 3 dengan anggota : industri tekstil.

c. Selanjutnya menghitung kembali centroid yang baru yang merupakan rataan kelima

variabel pada tiap cluster.

c1* (centroid cluster 1) adalah nilai kelima variabel dari 3 objek yang masuk ke dalam

cluster 1 pada langkah b.

c2* (centroid cluster 2) adalah nilai rata-rata kelima variabel dari 10 objek yang

masuk ke cluster 2 pada langkah b.

c3* (centroid cluster 3) adalah nilai rata-rata kelima variabel dari objek industri tekstil.

Nilai centroid dari tiap cluster adalah :

c1* = (35261,76; 468019,81; 150575,12; 10459,54; 809,54)

c2* = (6454,66; 52579,83; 25352,86; 1235,84; 149,68)

c3* = (92737,12; 862476,34; 403086,58; 17343,74; 2151,66)

d. Jarak setiap objek dengan tiap centroid

Jarak setiap objek dengan centroid (pusat cluster) pertama adalah sebagai berikut :

Tabel 2.5

Industri c1*

Makanan (16941,83-35261,76)2

+(157562,87-468019,81)2

+ (73638,52-150575,12)2

+ (3168,79-10459,54)2

+

(393,13-809,54)2

= 1,027x1011

Minuman (14608,25-35261,76)2

+(135861,10-468019,81)2

+ (62496,05-150575,12)2

+ (2732,06-10459,54)2

+

(338,94-809,54)2

= 1,186 x1011

Tekstil (92737,12-35261,76)2

+(862476,34-468019,81)2

+(403086,58-150575,12)2

+ (17343,74 -10459,54)2

+ (2151,66-809,54)2

= 2,227 x1011

Kayu (37078,59-35261,76)2

+(344839,36-468019,81)2

+(161163,97 -150575,12)2

+ (18876,55 -10459,54)2

+ (860,28-809,54)2

= 1,536x1010

Olahan kayu (63789,95-35261,76)2

+(575981,54-468019,81)2

+(269190,49-150575,12)2

+ (11582,55-10459,54)2

+

(1436,93-809,54)2

= 2,654 x1010

Kertas (4916,75-35261,76)2

+(483238,54-468019,81)2

+ (21370,91-150575,12)2

+ (919,53-10459,54)2

+

(131,40-809,54)2

= 1,794 x1010

Kimia dasar (6031,05-35261,76)2

+ (56090,16-468019,81)2

+ (27387,22-150575,12)2

+ (1127,93-10459,54)2

+

(139,93-809,54)2

= 1,858 x1011

Non logam (5226,60-35261,76)2

+ (48608,60-468019,81)2

+ (22717,69-150575,12)2

+ (977,48-10459,54)2

+

(121,27-809,54)2

= 1,932 x1011

Semen (509,72-35261,76)2

+ (4740,50-468019,81)2

+ (2215,52-150575,12)2

+ (95,33-10459,54)2

+ (11,83-

809,54)2

= 2,380 x1011

Kapur dan gips ( 9945,85-35261,76)2

+ (19350,26-468019,81)2

+ (10694,06-150575,12)2

+ (1860,05-10459,54)2

+

(230,75-809,54)2

= 2,216 x1011

Logam Dasar (3830,46-35261,76)2 + (35624,19-468019,81)2 + (21977,07-150575,12)2 + (1002,93-10459,54)2 +

(88,87-809,54)2 = 2,046 x1011

Hasil Olahan Logam (7291,27-35261,76)2 + (67810,42-468019,81)2 + (31691,85-150575,12)2 + (1363,61-10459,54)2 +

(168,34-809,54)2 = 1,752 x1011

Rumah Sakit (63,37-35261,76)2 + (58,93-468019,81)2 + (284,02-150575,12)2 + (11,85-10459,54)2 + (1,47-

809,54)2 = 2,429 x1011

Perhotelan (98,15-35261,76)2 + (91,29-468019,81)2 + (426,64-150575,12)2 + (18,36-10459,54)2 + (2,28-

809,54)2 = 2,428 x1011

Jarak setiap objek dengan centroid (pusat cluster) kedua adalah sebagai berikut :

Tabel 2.6

Industri c2*

Makanan (16941,83-6454,66)2

+ (157562,87-52579,83)2

+ (73638,52-25352,86)2

+ (3168,79-1235,84)2

+

(393,13-149,68)2

= 1,347 x1010

Minuman (14608,25-6454,66)2

+ (135861,10-52579,83)2

+ (62496,05-25352,86)2

+ (2732,06-1235,84)2

+

(338,94-149,68)2

= 8,384 x109

Tekstil (92737,12-6454,66)2

+ ( 862476,34-52579,83)2

+ (403086,58-25352,86)2

+ (17343,74 -1235,84)2

+

(2151,66-149,68)2

= 8,063 x1011

Kayu (37078,59-6454,66)2

+ (344839,36-52579,83)2

+ (161163,97-25352,86)2

+ (18876,55 -1235,84)2

+

(860,28-149,68)2

= 1,051 x1011

Olahan kayu (63789,95-6454,66)2

+ (575981,54-52579,83)2

+ (269190,49-25352,86)2

+ (11582,55-1235,84)2

+

(1436,93-149,68)2

= 3,368 x1011

Kertas (4916,75-6454,66)2

+ (483238,54 -52579,83)2

+ (21370,91-25352,86)2

+ (919,53-1235,84)2

+

(131,40-149,68)2

= 1,855 x1011

Kimia dasar (6031,05-6454,66)2

+ (56090,16-52579,83)2

+ (27387,22-25352,86)2

+ (1127,93-1235,84)2

+ (

139,93-149,68)2

= 1,665 x107

Non logam (5226,60-6454,66)2

+ (48608,60-52579,83)2

+ (22717,69-25352,86)2

+ (977,48-1235,84)2

+

(121,27-149,68)2

= 2,429 x107

Semen (509,72-6454,66)2

+ (4740,50-52579,83)2

+ (2215,52-25352,86)2

+ (95,33-1235,84)2

+ (11,83-

149,68)2

= 2,861 x109

Kapur dan gips (9945,85-6454,66)2

+ (19350,26-52579,83)2

+ (10694,06-25352,86)2

+ (1860,05-1235,84)2

+

(230,75-149,68)2

= 1,332 x109

Logam Dasar (3830,46-6454,66)2

+ (35624,19-52579,83)2

+ (21977,07-25352,86)2

+ (1002,93-1235,84)2

+

(88,87-149,68)2

= 3,058 x108

Hasil Olahan Logam (7291,27-6454,66)2 + (67810,42-52579,83)2 + (31691,85-25352,86)2 + (1363,61-1235,84)2 +

(168,34-149,68)2 = 2,729 x108

Rumah Sakit (63,37-6454,66)2 + (58,93-52579,83)2 + (284,02-25352,86)2 + (11,85-1235,84)2 + (1,47-149,68)2

= 3,429 x109

Perhotelan (98,15-6454,66)2 + (91,29-52579,83)2 + (426,64-25352,86)2 + (18,36-1235,84)2 + (2,28-149,68)2

= 3,418 x109

Jarak setiap objek dengan centroid (pusat cluster) ketiga adalah sebagai berikut :

Industri c3*

Makanan (16941,83-92737,12)2

+(157562,87-862476,34)2

+(73638,52-403086,58)2

+ (3168,79-17343,74)2

+

(393,13-2151,66)2

= 6,114 x1011

Minuman (14608,25-92737,12)2

+(135861,10-862476,34)2

+(62496,05-403086,58)2

+ (2732,06-17343,74)2

+

(338,94-2151,66)2

= 6,503 x1011

Tekstil (92737,12-92737,12)2

+(862476,34-862476,34)2

+ (403086,58-403086,58)2

+ (17343,74 -

17343,74)2

+ (2151,66-2151,66)2

= 0

Kayu (37078,59-92737,12)2

+(344839,36-862476,34)2

+ (161163,97-403086,58)2

+ (18876,55 -

17343,74)2

+ (860,28-2151,66)2

= 3,296 x1011

Olahan kayu (63789,95-92737,12)2

+(575981,54-862476,34)2

+ (269190,49-403086,58)2

+ (11582,55-17343,74)2

+ (1436,93-2151,66)2

= 1,009 x1011

Kertas (4916,75-92737,12)2

+ (483238,54 -862476,34)2

+ (21370,91-403086,58)2

+ (919,53-17343,74)2

+

(131,40-2151,66)2

= 2,975 x1011

Kimia dasar (6031,05-92737,12)2

+ (56090,16-862476,34)2

+ (27387,22-403086,58)2

+ (1127,93-17343,74)2

+ (

139,93-2151,66)2

= 7,992 x1011

Non logam (5226,60-92737,12)2

+ (48608,60 -862476,34)2

+ (22717,69-403086,58)2

+ (977,48-17343,74)2

+

(121,27-2151,66)2

= 8,150 x1011

Secara keseluruhan jarak tiap objek (industri) ke pusat cluster (centroid) adalah sebagai

berikut:

Industri c1* c

2* c

3*

Makanan 1,027 x10

11 1,347 x10

10

6,114 x1011

Minuman 1,186 x10

11 8,384 x10

9

6,503 x1011

Tekstil 2,227 x10

11 8,063 x10

11

0

Kayu 1,536 x1010

1,051 x1011

3,296 x1011

Olahan kayu 2,654 x1010

3,368 x1011

1,009 x1011

Kertas 1,794 x1010

1,855 x1011

2,975 x1011

Kimia dasar 1,858 x10

11 1,665 x10

7

7,992 x1011

Non logam 1,932 x10

11 2,429 x10

7

8,150 x1011

Semen 2,380 x10

11 2,861 x10

9

9,052 x1011

Kapur&gips 2,216 x10

11 1,332 x10

9

8,719 x1011

Logam dasar 2,046 x10

11 3,058 x10

8

8,371 x1011

Hasil olahan

logam 1,752 x10

11 2,729 x10

8

7,770 x1011

Rumah sakit 2,429 x10

11 3,429 x10

9

9,149 x1011

Perhotelan 2,428 x1011

3,418 x109

9,147 x1011

Keterangan :

Jarak terdekat industri makanan adalah dengan c2, sehingga industri makanan

masuk ke cluster 2.

Semen (509,72-92737,12)2

+ (4740,50-862476,34)2

+ (2215,52-403086,58)2

+ (95,33-17343,74)2

+ (11,83-

2151,66)2

= 9,052 x1011

Kapur dan gips ( 9945,85-92737,12)2

+ (19350,26-862476,34)2

+ (10694,06-403086,58)2

+ (1860,05-17343,74)2

+

(230,75-2151,66)2

= 8,719 x1011

Logam Dasar (3830,46-92737,12)2

+ (35624,19-862476,34)2

+ (21977,07-403086,58)2

+ (1002,93-17343,74)2

+

(88,87-2151,66)2

= 8,371 x1011

Hasil Olahan Logam (7291,27-92737,12)2

+ (67810,42-862476,34)2

+ (31691,85-403086,58)2

+ (1363,61-17343,74)2

+

(168,34-2151,66)2

= 7,770 x1011

Rumah Sakit (63,37-92737,12)2

+ (58,93-862476,34)2

+ (284,02-403086,58)2

+ (11,85-17343,74)2

+ (1,47-

2151,66)2

= 9,149 x1011

Perhotelan (98,15-92737,12)2

+ (91,29-862476,34)2

+ (426,64-403086,58)2

+ (18,36-17343,74)2

+ (2,28-

149,68)2

= 9,147 x1011

Jarak terdekat industri minuman adalah dengan c2, sehingga industri minuman

masuk ke cluster 2.

Jarak terdekat industri tekstil adalah dengan c3 , sehingga industri tekstil masuk ke

cluster 3.

Jarak terdekat industri kayu adalah dengan c1, sehingga industri kayu masuk ke

cluster 1.

Jarak terdekat industri olahan kayu adalah dengan c1, sehingga industri olahan

kayu masuk ke cluster 1.

Jarak terdekat industri kertas adalah dengan c1, sehingga industri kertas masuk ke

cluster 1.

Jarak terdekat industri kimia dasar adalah dengan c2, sehingga industri kimia dasar

masuk ke cluster 2.

Jarak terdekat industri non logam adalah dengan c2, sehingga industri non logam

masuk ke cluster 2.

Jarak terdekat industri semen adalah dengan c2, sehingga industri semen masuk ke

cluster 2.

Jarak terdekat industri kapur dan gips adalah dengan c2, sehingga industri kapur

dan gips masuk ke cluster 2.

Jarak terdekat industri logam dasar adalah dengan c2, sehingga industri logam

dasar masuk ke cluster 2.

Jarak terdekat industri hasil olahan logam adalah dengan c2, sehingga industri

hasil olahan logam masuk ke cluster 2.

Jarak terdekat industri rumah sakit adalah dengan c2, sehingga industri rumah

sakit masuk ke cluster 2.

Jarak terdekat industri perhotelan adalah dengan c2, sehingga industri perhotelan

masuk ke cluster 2

Dari proses ini diperoleh anggota tiap cluster sebagai berikut :

Cluster 1 dengan anggota : industri kayu , industri olahan kayu, industri kertas.

Cluster 2 dengan anggota : industri logam dasar, industri kapur dan gips, industri

semen, industri non logam, industri kimia dasar, industri minuman, industri makanan,

industri hasil olahan logam, industri rumah sakit, industri perhotelan.

Cluster 3 dengan anggota : industri tekstil.

Karena tidak ada perubahan hasil pengclusteran, maka proses berhenti. Dari tiga cluster

yang terbentuk, kita dapat melihat rata-rata banyaknya polutan (dalam satuan ton) pada setiap

cluster, yaitu :

• Untuk polutan debu terbanyak berada di cluster ketiga dengan rata-rata sebesar

92.737,12 ton. Jadi industri tekstil menghasilkan polutan debu terbesar.

Sedangkan polutan debu terkecil adalah dari cluster kedua dengan rata-rata

sebesar 6.454,66 ton.

• Untuk polutan SO2 terbanyak berada di cluster ketiga dengan rata-rata sebesar

862.476,34 ton. Sedangkan polutan SO2 terkecil adalah dari cluster kedua

dengan rata-rata sebesar 52.579,83 ton.

• Untuk polutan NO2 terbanyak berada di cluster ketiga dengan rata-rata sebesar

403.086,58 ton. Sedangkan polutan NO2 terkecil adalah dari cluster kedua dengan

rata-rata sebesar 25.352,86 ton.

• Untuk polutan HC terbanyak berada di cluster ketiga dengan rata-rata sebesar

17.343,74 ton. Sedangkan polutan HC terkecil adalah dari cluster kedua dengan

rata-rata sebesar 1.235,84 ton

• Untuk polutan CO terbanyak berada di cluster ketiga dengan rata-rata sebesar

2.151,66 ton. Sedangkan polutan CO terkecil adalah dari cluster kedua dengan

rata-rata sebesar 149,68 ton.

3. Setelah cluster terbentuk, tahap selanjutnya yaitu memberi nama spesifik untuk

menggambarkan isi cluster tersebut. Dari ketiga cluster yang terbentuk kita dapat

mengklasifikasikan sebagai berikut :

Cluster pertama : Kelima jenis polutan memiliki rata-rata lebih dari cluster kedua dan

kurang dari cluster ketiga, sehingga dapat kita golongkan menjadi kelompok industri

dengan tingkat pencemaran sedang, anggotanya adalah industri kayu , industri olahan

kayu dan industri kertas.

Cluster kedua : Kelima jenis polutan memiliki rata-rata terkecil diantara cluster yang

lain, sehingga dapat kita golongkan menjadi kelompok industri dengan tingkat

pencemaran rendah, anggotanya adalah industri logam dasar, industri kapur dan gips,

industri semen, industri non logam, industri kimia dasar, industri minuman, industri

makanan, industri hasil olahan logam, industri rumah sakit dan industri perhotelan.

Cluster ketiga : Kelima jenis polutan memiliki rata-rata terbesar diantara cluster yang

lain, sehingga dapat kita golongkan menjadi kelompok industri dengan tingkat

pencemaran tinggi, anggotanya adalah industri tekstil.

BAB IV

KESIMPULAN

4.1 Kesimpulan

Setelah mengelompokkan n buah obyek pengamatan kedalam m kelompok

berdasarkan p variat dapat diketahui bahwa tujuan utama dari pengclusteran obyek adalah

untuk mendapatkan kelompok obyek yang memiliki nilai relatif sama. Sehingga kelak dalam

interpretasi, obyek-obyek yang berada pada satu cluster memiliki peluang yang cukup tinggi

akan muncul bersamaan pada satu individu.

Manfaat analsis Cluster

1. Untuk menerapkan dasar-dasar pengelompokan dengan lebih konsisten.

2. Untuk mengembangkan suatu metode generalisasi secara innduktif, yaitu

pengambilan kesimpulan secara umum dengan berdasarkan fakta-fakta khusus.

3. Menemukan tipologi yang cocok dengan karakter obyek yang diteliti.

4. Mendiskripsikan sifat-sifat / karakteristik dari masing-masing kelompok.

Metode pengelompokan pada dasarnya ada dua, yaitu pengelompokan

hirarki (Hierarchical Clustering Method) dan pengelompokan non hirarki

Non Hierarchical Clustering Method).

Metode pengelompokan hirarki digunakan apabila belum ada informasi jumlah

kelompok. Sedangkan metode pengelompokan non hirarki bertujuan mengelompokan n

obyek ke dalam k kelompok ( k < n ). Salah satu prosedur pengelompokan pada non hirarki

adalah dengan

menggunakan metode K-Means. Metode ini merupakan metode pengelompokan yang

bertujuan mengelompokan obyek sedemikian hingga jarak tiap-tiap obyek ke pusat kelompok

di dalam satu kelompok adalah minimum.

4.2 Saran

Terdapat beberapa algoritma cluster yang dapat digunakan untuk mengelompokkan

objek-objek, baik itu dengan pengelompokan hirarki ataupun pengelompokan non hirarki.

Namun yang perlu diperhatikan adalah stabilitas dari solusi yang diperoleh, oleh karena itu

perlu di cek kembali setiap algoritma cluster tersebut baik sebelum atau sesudah

pengelompokkan.

Cluster Non Hirarki

Documents