BAB I PENDAHULUAN Prinsip Dasar Analisis gerombol adalah analisis statistik peubah ganda yang digunakan apabila ada n buah individu atau objek yang mempunyai p peubah dan n objek tersebut ingin dikelompokkan ke dalam k kelompok berdasarkan sifat-sifat yang diamati sehingga individu atau objek yang terletak dalam satu gerombol memiliki kemiripan sifat yang lebih besar dibandingkan dengan individu yang terletak dalam gerombol lain . Oleh karena itu, homogenitas yang tinggi antar anggota dalam gerombol dan heterogenitas (perbedaan) yang tinggi antar gerombol yang satu dengan yang lainnya merupakan dua hal yang harus dimiliki sebuah gerombol . Penggerombolan ini memberikan manfaat, antara lain untuk eksplorasi data, reduksi data, dan pelapisan data. Eksplorasi data dilakukan untuk memperoleh gambaran tentang informasi yang ada dalam himpunan data tersebut sampai pada pembangkitan hipotesis untuk struktur populasinya. Reduksi data akan dapat mewakili seluruh anggota gerombol dengan suatu ringkasan gerombol tertentu, sedangkan pelapisan data akan berguna dalam penarikan sampel atau penggolongan tipe objek
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
BAB I
PENDAHULUAN
Prinsip Dasar
Analisis gerombol adalah analisis statistik peubah ganda yang digunakan
apabila ada n buah individu atau objek yang mempunyai p peubah dan n objek
tersebut ingin dikelompokkan ke dalam k kelompok berdasarkan sifat-sifat yang
diamati sehingga individu atau objek yang terletak dalam satu gerombol memiliki
kemiripan sifat yang lebih besar dibandingkan dengan individu yang terletak
dalam gerombol lain . Oleh karena itu, homogenitas yang tinggi antar anggota
dalam gerombol dan heterogenitas (perbedaan) yang tinggi antar gerombol yang
satu dengan yang lainnya merupakan dua hal yang harus dimiliki sebuah
gerombol .
Penggerombolan ini memberikan manfaat, antara lain untuk eksplorasi
data, reduksi data, dan pelapisan data. Eksplorasi data dilakukan untuk
memperoleh gambaran tentang informasi yang ada dalam himpunan data tersebut
sampai pada pembangkitan hipotesis untuk struktur populasinya. Reduksi data
akan dapat mewakili seluruh anggota gerombol dengan suatu ringkasan gerombol
tertentu, sedangkan pelapisan data akan berguna dalam penarikan sampel atau
penggolongan tipe objek
Analisis gerombol telah dipergunakan dalam pemasaran, seperti
pembentukan segmen berdasarkan data demografi, psychographic profiles,
mengenali test market cities, menentukan pasar yang mirip di berbagai negara dan
mencari kelompok yang mirip dari pembaca majalah untuk membantu di dalam
pemilihan media/majalah .
Statistik yang berkaitan dengan analisis gerombol
Sebelum membahas statistik yang berkaitan dengan analisis gerombol, perlu
disebutkan bahwa kebayakan metode penggerombolan merupakan prosedur yang
relatif sederhana yang tidak didukung dengan suatu penelaran statistik yang
ekstensif. Sebagian besar metode penggerombolan heuristics berdasarkan pada
algoritma (algorithm). Jadi, analisis gerombol sangat kontras apabila
dibandingkan dengan analisis varian, regresi berganda, analisis diskriminan dan
analisis faktor yang didasarkan pada penalaran statistika yang sangat ekstensif.
Walaupun banyak metode penggerombolan yang mempunyai sifat/ciri statistik
yang penting, kesederhanaan metode ini perlu dipahami (dikenali). Statistik dan
konsep yang diuraikan dibawah ini berkaitan dengan analisis gerombol.
1. Skedul aglomerasi (aglomeration schedule), ialah skedul yang
memberikan informasi tentang objek atau kasus yang akan digabung
(dikelompokkan, dimasukkan dalam gerombol) pada setiap tahap, pada
suatu proses penggerombolan yang hierarki.
2. Rata-rata gerombol (cluster centroid) ialah nilai rata-rata variabel
dari semua objek atau kasus dalam suatu gerombol tertentu.
3. Pusat gerombol (cluster centers) ialah titik awal dimulainya
pengelompokan di dalam penggerombolan non hierarki (non-hierarchil
clustering). Gerombol dibangun/dibentuk disekitar titik-titik ini atau benih
(seeds).
4. Keanggotaan gerombol (cluster membership) ialah keanggotaan
yang menunjukkan gerombol, untuk mana setiap objek atau kasus menjadi
anggotanya (misalnya objek tertentu menjadi anggota gerombol 1 atau
gerombol 2, dan lain sebgainya).
5. Dendogram, juga disebut grafik pohon (tree graph), suatu alat
grafis untuk menyajikan (display) hasil penggerombolan. Garis vertikal atau
tegak mewakili gerombol yang digabung bersama. Posisi garis pada skala
menunjukkan jarak (distance) untuk mana gerombol digabung. Dendogram
harus dibaca dari kiri ke kanan.
6. Jarak antara pusat gerombol (distances between cluster centres)
ialah jarak yang menunjukkan bagaimana terpisahnya pasangan individu
gerombol. Gerombol yang terpisahkan jauh (widely separated) sangat
berbeda, dan memang itu yang diinginkan.
7. Diagram icicle ialah panyajian berupa grafis dari hasil
penggerombolan disebut demikian karena bentuknya menyerupai suatu
deretan es yang tergantung pada mulut gua (the cares of a house). Kolom
menunjukkan objek/kasus yang akan dikelompokkan dan baris menunjukkan