Maret 2015 ETS ANALISIS MULTIVARIAT
BAB I
PENDAHULUAN
1.1 Latar Belakang
Metode analisis multivariat adalah suatu metode statistik
yang digunakan untuk menganalisis data yang terdiri atas
banyak variabel dan diduga antar variabel saling
berhubungan. Metode analisis multivariat dapat
diklasifikasikan menjadi dua yaitu metode dependen dan
metode interdependen.
Metode analisis dependen adalah suatu metode dimana suatu
variabel atau suatu kumpulan variabel yang diketahui sebagai
variabel dependen diprediksi atau dijelaskan oleh variabel
lain yang disebut variabel independen. Sedangkan metode
analisis interdependen adalah suatu metode dimana tidak ada
satu atau sekelompok variabel pun yang didefinisikan sebagai
variabel dependen maupun interdependen.
Metode analisis dependen dibagi menjadi beberapa metode
analisis yakni analisis regresi berganda, analisis
diskriminan, analisis multivariate varian (MANOVA), analisis
conjoint, dan analisis korelasi kanonikal. Sedangkan pada
metode interdependen dibagi menjadi analisis faktor,
analisis cluster dan multidimensional scaling.
Pada makalah ini tidak akan membahas metode-metode analisis
multivariat secara keseluruhan akan tetapi hanya membahas
beberapa metode analisis multivariat saja diantaranya
adalah analisis faktor, analisis cluster dan analisis
multivariate varian (MANOVA).
Salah satu dari beberapa metode analisis multivariat yang
akan dilakukan dalam makalah ini adalah analisis faktor.
Analisis faktor adalah salah satu analisis yang banyak
digunakan pada statistik multivariat. Analisis faktor
merupakan salah satu teknik untuk menyederhanakan kumpulan
variabel yang banyak dan saling berkorelasi menjadi suatu
kumpulan variabel baru yang ringkas dan tidak saling
berkorelasi yang disebut faktor. Didalam analisis varian,
analisis regresi dan analisis diskriminan, satu variabel
merupakan variabel independen. Didalam analisis faktor,
variabel-variabel tidak dikelompokan menjadi variabel
independen dan dependen. Metode estimasi dalam analisis
faktor terdiri dari metode non-iteratif dan metode iteratif.
Akan tetapi metode estimasi yang akan dipakai dalam
penyelesaian masalah dalam makalah ini adalah metode
analisis yang paling populer yaitu analisis komponen utama
(principal component analysis) yang termasuk dalam metode non-
iteratif.
Metode interdependen lain yang dilakukan selain dengan
menggunakan analisis faktor adalah analisis cluster.
Analisis cluster merupakan salah satu teknik multivariat
yang mempunyai tujuan utama untuk mengelompokan objek-objek
berdasarkan karakteristik yang dimilikinya. Sehingga dalam
analisis ini tidak ada pembedaan variabel dependent dan
variabel independen. Tujuan analisis cluster adalah untuk
mengklasifikasi objek ke dalam kelompok-kelompok yang
relatif homogen yang didasarkan pada suatu kumpulan variabel
yang dipertimbangkan akan diteliti. Tahapan pengklusteran
disajikan dalam dendogram yang memungkinkan penelusuran
pengklusteran obyek-obyek yang diamati dengan lebih mudah
dan informatif. Untuk menggunakan teknik ini persyaratan
yang harus dipenuhi, diantaranya ialah:
Data yang digunakan untuk analisis ini ialah data
kuantitatif berskala interval atau rasio.
Metode yang ada ialah hubungan antara kelompok
(between-groups linkage), hubungan dalam kelompok (within-
groups linkage), kelompok terdekat (nearest neighbor),
kelompok berikutnya (furthest neighbor), kluster centroid
(centroid clustering), kluster median (median clustering), dan
metode Ward's.
Selain metode interdependent, terdapat salah satu metode
dependet yakni analisis varian multivariat (MANOVA) yang
sering digunakan untuk menghitung pengujian signifikansi
perbedaan rata-rata secara bersamaan antara kelompok untuk dua
atau lebih variable dependent. Teknik ini bermanfaat untuk
menganalisis variabel-variabel dependent lebih dari dua yang
berskala interval atau rasio. Untuk menggunakan MANOVA
beberapa persyaratan yang harus dipenuhi ialah:
Variabel tergantung harus dua atau lebih dengan
skala interval
Variabel bebas satu dengan menggunakan skala
nominal.
Untuk semua variabel tergantung, data diambil dengan
cara random sample dari vektor-vektor populasi
normal multivariate dalam suatu populasi, dan untuk
matrik-matrik variance-covariance untuk semua sel
sama
1.2 Permasalahan
1) Bagaimana menguraikan hubungan antar banyak variabel
dengan menggunakan faktor pada analisis faktor dengan
metode analisis komponen utama (principal component
analysis)?
2) Bagaimana cara mengelompokan data berdasarkan
karakteristik yang dimilikinya dengan menggunakan
analisis cluster?
3) Bagaimana menghitung pengujian signifikansi perbedaan
rata-rata secara bersama antar kelompok untuk dua atau
lebih variabel dependen dengan menggunakan analysis
varian multivariat (MANOVA)?
1.3 Tujuan
1) Menguraikan hubungan antar banyak variabel dengan
menggunakan faktor pada analisis faktor dengan metode
analisis komponen utama (principal component analysis).
2) Mengelompokan data berdasarkan karakteristik yang
dimilikinya dengan menggunakan analisis cluster.
3) Menghitung pengujian signifikansi perbedaan rata-rata
secara bersama antar kelompok untuk dua atau lebih
variabel dependen dengan menggunakan analysis varian
multivariat (MANOVA).
BAB II
TINJAUAN PUSTAKA
A. Kaiser Meyer Oikin (KMO)
Uji Kaiser-Meyer-Olkin bertujuan untuk mengetahui apakah semua
data yang telah terambil telah cukup untuk difaktorkan (uji
kecukupan data). Hipotesis dari Kaiser-Meyer-Olkin adalah sebagai
berikut.
Hipotesis :
H0 : Jumlah data cukup untuk difaktorkan
H1 : Jumlah data tidak cukup untuk difaktorkan
Statistik uji :
KMO=∑i=1
p
∑j=1
prij2
∑i=1
p
∑j=1
prij2 +∑
i=1
p
∑j=1
paij2
(1)
dengan
i = 1, 2, 3, ..., p dan j = 1, 2, ..., p i≠jrij = Koefisien korelasi antara variabel i dan j
aij = Koefisien korelasi parsial antara variabel i dan j
Apabila nilai KMO lebih besar dari 0,5 maka gagal tolak H0
sehingga dapat disimpulkan jumlah data telah cukup difaktorkan
[1].
B. Uji Bartlett’s (Kebebasan Antar Variabel)
Uji Bartlett’s bertujuan untuk mengetahui apakah terdapat
hubungan antar variabel dalam kasus multivariat. Jika variabel
X1, X2,…,Xp independent (bersifat saling bebas), maka matriks
korelasi antar variabel sama dengan matriks identitas.
Hipotesis dari uji Bartlett’s sebagai berikut.
H0 : ρ = I
H1 : ρ ≠ I
Statistik Uji :
rk=1
p−1∑i=1prik k = 1,2,...p
(4)
r=2
p(p−1)∑∑
i<krik
(2)
γ̂=(p−1 )2 [1−(1−r )2 ]p−(p−2 ) (1−r )2
(3)
dengan
rk = rata-rata elemen diagonal pada kolom atau baris ke k dari
matrik R (matrik korelasi)
r = rata-rata keseluruhan dari elemen diagonalDaerah penolakan :
tolak H0, jika
T=(n−1 )(1−r )2 [∑∑
i<k(rik−r)2−γ̂∑
k=1
p
(rk−r )2]>χ(p+1) (p−2 )/2,α2 (4)
Maka variabel-variabel saling berkorelasi, hal ini berarti
terdapat hubungan antar variabel. Jika H0 ditolak maka analisis
multivariat layak untuk digunakan terutama metode analisis
komponen utama dan analisis faktor [2].
C. Principle Component Analysis
Analisis komponen utama adalah analisis statistika yang
bertujuan untuk mereduksi dimensi data dengan cara
membangkitkan variabel baru (komponen utama) yang merupakan
kombinasi linear dari variabel asal sedemikan hingga varians
komponen utama menjadi maksimum dan antar komponen utama
bersifat saling bebas [2].
Model analisis komponen utama dapat ditulis sebagai
berikut.
[Y1
Y2
Y3
⋮Ym
]=[a11 a12 a13 … a1pa21 a22 a23 … a2pa31 a32 a33 … a3p⋮ ⋮ ⋮ ⋮ ⋮am1 am2 am3 … amp
][X1
X2
X3
⋮Xm
] ,m≤p (5)
Dengan
Y1 = komponen utama pertama, komponen yang mempunyai varians
terbesar
Y2 = komponen utama kedua, komponen yang mempunyai varians
terbesar kedua
Ym = komponen utama ke-m, komponen yang mempunyai varians
terbesar ke-m
X1 = variabel asal pertama
X2 = variabel asal kedua
Xp = variabel asal ke-p
m = banyaknya komponen utama
p = banyaknya variabel asal
Dengan analisis komponen utama diharapkan lebih mudah
melakukan interpretasi tanpa kehilangan banyak informasi
tentang data, bahkan informasi yang didapat menjadi lebih
padat dan bermakna.
Jika terdapat vektor random X = [X1,X2,X3,….Xp ]yang berisisejumlah pengamatan terhadap p variabel mempunyai rata-rata
dan matrik kovarians dengan eigenvalue. λ1≥λ2≥….≥λp≥∅.Maka
dapat ditulis suatu variabel baru yang merupakan kombinasi
linier dari variabel asal sebagai berikut.
Y1=l1X=l11X1+l21X2+…lp1XpY2=l2X=l12X1+l22X2+…lp2Xp
⋮
Yp=lpX=l1pX1+l2pX2+…lppXp (6) atau dapat ditulis dengan
notasi Yi=liX dimana l adalah matrik transformasi yang akan
mengubah variabel asal X menjadi Y yang disebut principal
component, dimana :
Var (Yi)=li∑ lii=1,2,….p
(8)
Cov (Yi,Yk)=li∑ lki,k=1,2,….p (7)
Komponen utama adalah kombinasi linier Y1,Y2,Y3,…,Yp yang tidak
berkorelasi dan mempunyai varians sebesar mungkin.
D. Scree Plot
Scree plot adalah tampilan grafis dari varians dari masing-
masing komponen dalam data set yang digunakan untuk menentukan
berapa banyak komponen yang harus dipertahankan untuk
menjelaskan persentase yang tinggi dari variasi dalam data.
Pada pendekatan ini akar karakteristik dari masing-masing
komponen utama diplot berdasarkan urutan besarnya akar
karakteristik. Dasar pemikiran dari scree plot adalah hasil
komponen utama sudah diurutkan berdasarkan besarnya akar
karakteristik, maka komponen utama pertama akan muncul
pertama, diikuti komponen utama lainnya yang mempunyai
proporsi keragaman yang lebih kecil. Plot menunjukkan varians
untuk komponen pertama dan komponen berikutnya dimana nilai
eigenvalue turun. Ketika penurunan berhenti dan kurva membuat
siku ke arah penurunan yang kurang tajam (ekstrim) maka nilai
tersebutlah yang bisa dijadikan acuan untuk menentukan banyak
faktor atau untuk mengambil jumlah komponen utama berdasarkan
jumlah akar karakteristik sebelum terjadinya garis lurus[2].
E. Analisis Faktor
Tujuan dari analisis faktor adalah untuk menggambarkan
hubungan-hubungan kovarian antara beberapa variabel yang
mendasari tetapi tidak teramati. Vektor random teramati X
dengan ∑p komponen, memiliki rata-rata μdan matrik kovarian.Model analisis faktor adalah sebagai berikut[2].
X1−μ1=l11F1+l12F2+…l1mFm+ε1
Xp−μp=lp1F1+lp2F2+…lpmFm+εp (10)
Atau dapat ditulis dalam notasi matrik sebagai berikut.
Xpxl=μ(pxl )+L(pxm)F(mxl )+ε(pxl ) (11)
Dengan μi=¿rata-rata variabel i
εi=¿faktor spesifik ke – i
Fj=¿common faktor ke- j
lij=¿loading dari variabel ke – i pada faktor ke-j
Bagian dari varian variabel ke – i dari m common faktor
disebut komunalitas ke – i yang merupakan jumlah kuadrat dari
loading variabel ke – i pada m common faktor dengan rumus
sebagai berikut [1].
hi2=li1
2 +li22 +…+lℑ
2 (12)
Tujuan analisis faktor adalah menggunakan matriks korelasi
hitungan untuk
1.) Mengidentifikasi jumlah terkecil dari faktor umum (yaitu
model faktor yang paling parsimoni) yang mempunyai
penjelasan terbaik atau menghubungkan korelasi diantara
variabel indikator.
2.) Mengidentifikasi, melalui faktor rotasi, solusi faktor
yang paling masuk akal.
3.) Estimasi bentuk dan struktur loading, komunality dan
varian unik dari indikator.
4.) Intrepretasi dari faktor umum.
5.) Jika perlu, dilakukan estimasi faktor skor
F. Matriks Komponen yang Dirotasi
Bila dalam analisis terdapat suatu faktor yang memiliki satu
variabel atau pembagian variabel-variabel pada masing-masing
faktor masih banyak yang rancu karena loading faktor pada
faktor 1, faktor 2 dan seterusnya karena selisih nilai loading
faktor tidak berbeda jauh, maka digunakan matrik komponen yang
dirotasi. Transformasi ortogonal dari faktor pembebanan, serta
transformasi ortogonal tersirat dari faktor-faktor disebut
faktor rotasi.
Jika L̂ adalah matriks pxm estimasi beban faktor diperoleh
dengan metode apapun (komponen utama, maksimum likelihood)
maka[1].
L̂¿=L̂ T,dimana TT’ = T’T= I (13)
* berukuran pxm dari matriks yang dirotasi. Maka dari itu,
estimasi kovarian atau matriks korelasi tetap tidak berubah,
karena
L̂L̂'+ Ψ̂=L̂TT'L̂+Ψ̂=L̂¿ L̂¿ '+Ψ̂ (14)
dan matrik rotasi yang baru ditentukan dari hubungan berikut.
L̂¿=L̂ TDimana :
L̂¿: matrik berukuran px2
L̂: matrik berukuran px2
T : matrik berukur
BAB III
METODOLOGI
3.1 Data dan Variabel
Sumber data
Data yang digunakan dalam makalah ini adalah data car
sales yang merupakan data sampel SPSS. Data ini adalah
adalah data penjualan jenis-jenis mobil yang diproduksi
oleh beberapa pabrikan mobil bersama dengan beberapa
variabel yang mendukung.
Variabel
Dengan jumlah data (n) sebanyak 98 pabrikan mobil yang
menghasilkan berbagai jenis mobil, terdapat beberapa
variabel:
= sales (in thousand)
= log-transformed sales (insales)
= 4-year resale value
= price in thousand
= engine size
= horse power
= wheel base
= width
= length
= curb weight
= fuel capacity
= fuel efficiency
3.2 Langkah analisis
Sebelum data diolah akan dilakukan pre-processing terlebih
dahulu. Tujuan dilakukannya pre-processing adalah Tahap
pre-processing dilakukan dengan menggunakan software SPSS.
Hal-hal yang dilakukan dalam tahap pre processing adalah
sebagai berikut:
1) Analisis missing value
Missing value adalah informasi yang tidak tersedia untuk
sebuah objek atau kasus. Missing value terjadi karena
informasi tentang sebuah objek tidak diberikan, sulit
dicari , atau memang informasi tersebut tidak ada. Pada
dasarnya missing value tidak ada masalah bagi keseluruhan
data, misal hanya 1% dari keseluruhan data. Namun jika
persentase data yang hilang cukup besar maka perlu
dilakukan penanganan lebih lanjut.Penanganan yang
dilakukan yaitu dengan mengisi data yang missing
tersebut. Biasanya diisi dengan mean/rata rata data dari
variabel tersebut.
2) Deteksi outlier
Bisa dilihat melalui box plot. Jika ada data yang outlier
maka ada beberapa cara menangani data outlier. Salah
satunya adalah dengan menghilangkan data outlier
tersebut.
Setelah data sudah melalui tahap pre processing, maka data
tersebut sudah siap untuk selanjutnya diolah dengan
menggunakan metode-metode analisis yang diperlukan.
Langkah-langkah dalam melakukan analisis faktor:
1) Uji asumsi
Identifikasi kecukupan data dengan menggunakan
Measure of Sampling Adequacy (MSA) dan Kaiser-Meyer-Olkin
(KMO).
Data dikatakan memenuhi kecukupan data jika nilai
MSA atau KMO > 0,5
Cek MSA untuk masing-masing variabel:
o Lihat nilai anti image correlation
o Keluarkan variabel dengan nilai terkecil <0,5
o Ulangi proses pengujian sampai semua nilai
MSA >0,5
Identifikasi korelasi antar variabel.
o Hipotesis:
Ho: matriks korelasi adalah matriks
identitas
H1: matriks korelasi bukan matriks identitas
o Jika nilai signifikansi<α maka tolak H0 atauada korelasi antar variabel.
o Nilai signifikansi dapat dilihat dari Bartlett’s
test.
2) Proses ekstraksi.
Dalam melakukan proses ekstraksi metode yang paling
populer digunakan adalah PCA (principal component
analysis).
Langkah-langkah dalam proses ekstraksi adalah:
Penentuan jumlah faktor
Ada tiga cara menentukan banyaknya faktor dalam
PCA, yaitu:
o Scree Plot
o Jumlah nilai eigen yang lebih besar 1
o Total variansi yang bisa dijelaskan adalah
>70%
Pengelompokan variabel ke dalam faktor
Pemberian nama faktor
3) Interpretasi output
Langkah-langkah dalam melakukan analisis cluster:
BAB IV
HASIL DAN PEMBAHASAN
Pada bagian ini akan dijabarkan penerapan analisis faktor,
analisis cluster dan analisis varian multivariat (MANOVA) pada
data car sales.
4.1 aplikasi analisis faktor pada data car sales
1) Pre-processing data
Data asli car sales terdapat cukup banyak missing value.
Dari tabel dibawah ini dapat diketahui berapa banyak
missing value yang terdapat di masing-masing variabel.
Untuk menangani masalah missing value yang terjadi pada
data cukup diatasi dengan menggunakan mean/rata-rata
data tiap variabel. Caranya adalah dengan mengisi mean
dari data tiap variabel pada cell data yang missing.
Proses ini dapat dilakukan dengan menggunakan bantuan
software SPSS.
Setelah mendapatkan data yang sudah lengkap, langkah
selanjutnya adalah deteksi outlier. Setelah data
dideteksi outlier dengan menggunakan box plot pada SPSS
maka data-data outlier tiap variabel disajikan pada
gambar 1.1 berikut:
Data outlier adalah data yang secara nyata berbeda
dengan data-data yang lain. Seperti yang telah
diketahui, outlier bisa mengacaukan hasil analisis dari
suatu data. Oleh karena itu perlu diterapkan suatu
penanganan yang tepat untuk mengatasi data outlier. Hal
tersebut dapat dilakukan dengan cara menghilangkan data
outlier atau tetap mempertahankannya tetapi pada saat
melakukan analisis hendaknya data outlier tersebut
dipisah dengan data yang lain. Untuk kasus ini kami
memilih untuk menghilangkan data outlier saja. Oleh
karena itu sebelum menghilangkannya, semua data
distandarkan terlebih dahulu dengan alasan agar lebih
mudah mengurangi data outlier. Setelah itu baru
menghilangkan data-data yang outlier.
Setelah melalui tahap preprocessing yaitu analisis
missing value dan deteksi outlier beserta dengan
penanganan masalah outlier berupa standarisasi dan
menghilangkan data outlier maka diperoleh data yang siap
diolah sebagai berikut:
Data diatas sudah bebas dari data outlier, hal ini dapat
dilihat dari box plot berikut:
2) Uji asumsi
Identifikasi kecukupan data
Karna
nilai KMO dan MSA adalah 0,842 > 0,5 maka dapat
disimpulkan bahwa secara keseluruhan data dikatakan
memenuhi kecukupan data.
Sedangkan untuk melihat kecukupan data masing-masing
variabel dapat dilihat dari nilai MSA masing-masing
varibel berikut:
KMO and Bartlett's TestKaiser-Meyer-Olkin Measure of Sampling Adequacy.
,842
Bartlett's Test of Sphericity
Approx. Chi-Square 1253,574df 66Sig. ,000
a. Measure of sampling adequacy
Karna semua nilai MSA >0,5 maka tidak ada variabel yang
perlu dikeluarkan sehingga tidak perlu mengulangi proses
pengujian. Dilihat dari nilai MSA tiap variabel yang > 0,5
menunjukan bahwa asumsi kecukupan data sudah dipenuhi oleh
masing-masing variabel.
Identifikasi korelasi antar variabel
o Hipotesis
Ho= matriks korelasi adalah matriks identitas
H1= matriks korelasi bukan matriks identitas
o Statistik uji
Dengan ∝= 0,5 maka jika dilihat dari Bartlett’s Test,
karena nilai signifikansi adalah 0,000 < 0,5 maka tolak Ho.
Jadi kesimpulannya matriks korelasi bukan matriks identitas
sehingga ada korelasi antar variabel.
3) Proses ekstraksi
Metode yang digunakan adalah principal component analysis.
Dengan menggunakan SPSS diperoleh tabel berikut:
KMO and Bartlett's TestKaiser-Meyer-Olkin Measure of Sampling Adequacy.
,842
Bartlett's Test of Sphericity
Approx. Chi-Square 1253,574df 66Sig. ,000
Dari tabel dapat dilihat bahwa setelah melakukan proses
ekstraksi dengan metode principal component analysis, nilai
eigen yang mempunyai nilai lebih besar 1 ada sebanyak 3 faktor
pertama, oleh karena itu banyaknya komponen yang diperoleh
adalah sebanyak 3 faktor yang dapat menjelaskan total variasi
sebanyak 83,501%. Scree plot hubungan antara nilai eigen dan
banyaknya faktor yang terbentuk adalah sebagai berikut:
Total Variance Explained
Component
Initial Eigenvalues Extraction Sums of Squared Loadings
Rotation Sums of Squared Loadings
Total % ofVariance
Cumulative %
Total % ofVariance
Cumulative %
Total % ofVariance
Cumulative %
1 6,611 55,088 55,088 6,611 55,088 55,088 4,278 35,653 35,653
2 2,338 19,484 74,572 2,338 19,484 74,572 3,686 30,716 66,369
3 1,071 8,929 83,501 1,071 8,929 83,501 2,056 17,132 83,501
4 ,638 5,315 88,816
5 ,397 3,308 92,124
6 ,294 2,452 94,576
7 ,187 1,560 96,137
8 ,126 1,051 97,188
9 ,115 ,962 98,150
10 ,097 ,807 98,956
11 ,073 ,611 99,568
12 ,052 ,432 100,000
Extraction Method: Principal Component Analysis.
Pengelompokan variabel kedalam faktorRotated component
matrix menunjukan
nilai korelasi
antara setiap variabel terhadap faktor yang terbentuk. Nilai
korelasi ini disebut juga faktor loading. Tanpa melihat tanda
(+/-) pada nilai faktor loading, ke-12 variabel dapat
direduksi menkadi 3 faktor. Pengelompokan tiap variabel untuk
Rotated Component Matrixa
Component1 2 3
Zscore: Sales in thousands
-,085 ,092 ,965
Zscore: Log-transformed sales
-,063 ,100 ,965
Zscore: SMEAN(resale)
,832 ,029 -,186
Zscore: SMEAN(price) ,822 ,242 -,300Zscore: SMEAN(engine_s)
,603 ,650 ,115
Zscore: SMEAN(horsepow)
,694 ,577 -,095
Zscore: SMEAN(wheelbas)
,319 ,835 ,160
Zscore: SMEAN(width) ,195 ,875 ,049Zscore: SMEAN(length)
,213 ,909 ,057
Zscore: SMEAN(curb_wgt)
,776 ,551 ,039
Zscore: SMEAN(fuel_cap)
,778 ,439 ,064
Zscore: SMEAN(mpg) -,813 -,258 -,096Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization.a. Rotation converged in 5 iterations.
masuk kedalam suatu faktor dilihat dari nilai loading faktor
yang terbesar.
Pemberian nama faktor
Faktor 1 Faktor 2
(
Faktor 3
: resale
: price
: horse
power
: curb
weight
: fuel
capacity
: engine
size
: wheel
base
: width
: length
: sales in
thousands
: in sales
: mpg
4) Interpretasi output
4.2 aplikasi analisis cluster pada data car sales
Ada dua metode yang sering digunakan untuk menetapkan
banyaknya cluster, yaitu metode hierarki dan metode non
hierarki. Pada makalah ini kami menggunakan metode hierarki
dengan alasan bahwa banyaknya cluster yang diinginkan tidak
diketahui dan jumlah objek yang dikelompokan kurang dari 100.
Single linkage