TUGAS AKHIR – SS141501 PENGELOMPOKAN AKSESI JERUK PERSILANGAN BERDASARKAN KARAKTER KUANTITATIF DAN KUALITATIF MENGGUNAKAN FUZZY C-MEANS DAN K-MODES CANDRA WIDHI SAPUTRA NRP 1314 105 029 Dosen Pembimbing Dr. Sutikno, S.Si, M.Si Dr. Chaireni Martasari, S.P, M.Si PROGRAM STUDI S1 JURUSAN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA 2016
103
Embed
PENGELOMPOKAN AKSESI JERUK PERSILANGAN …repository.its.ac.id/75121/1/1314105029-Undergraduate_Thesis.pdf · berdasarkan karakter kuantitatif dan kualitatif menggunakan fuzzy c-means
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
TUGAS AKHIR – SS141501
PENGELOMPOKAN AKSESI JERUK PERSILANGANBERDASARKAN KARAKTER KUANTITATIFDAN KUALITATIF MENGGUNAKAN FUZZY C-MEANSDAN K-MODES
1.1 Latar Belakang ............................................................ 11.2 Rumusan Masalah........................................................ 51.3 Tujuan ......................................................................... 51.4 Manfaat ....................................................................... 61.5 Batasan Masalah ......................................................... 6
BAB III METODOLOGI PENELITIAN3.1 Sumber Data ............................................................... 213.2 Variabel Penelitian ...................................................... 213.3 Langkah Analisis ........................................................ 22
BAB IV ANALISIS DAN PEMBAHASAN4.1 Karakter Data Persilangan ........................................... 274.2 Pengelompokan Data Persilangan Aksesi P5 ............. 34
xiv
4.2.1 Pengelompokan dengan Fuzzy C-Means ............. 344.2.2 Pengelompokan dengan K-Modes ....................... 374.2.3 Kombinasi Cluster dengan Ensemble Cluster ..... 404.2.4 Perbedaan Karakteristik antar Cluster ................. 43
4.3 Perbandingan Antar Metode........................................ 45BAB V KESIMPULAN DAN SARAN
DAFTAR PUSTAKA ............................................................. 49LAMPIRAN ............................................................................ 51BIODATA PENULIS .............................................................. 87
xvii
DAFTAR TABEL
HalamanTabel 2.1 Uji One-Way ANOVA............................................ 19Tabel 3.1 Variabel Kuantitatif ................................................ 21Tabel 3.2 Variabel Kualitatif .................................................. 22Tabel 4.1 Deskripsi Data Kuantitatif P5................................. 27Tabel 4.2 Deskripsi Data Kualitatif P5................................... 28Tabel 4.3 Keterangan Wajah Mewakili variabel .................... 31Tabel 4.4 Keterangan Wajah Mewakili variabel .................... 33Tabel 4.5 Keanggotaan Setiap Cluster Data Kuantitatif......... 36Tabel 4.6 Keanggotaan Setiap Cluster Data Kualitatif........... 39Tabel 4.7 Keanggotaan Setiap Cluster Data Gabungan ......... 41Tabel 4.8 P-Value Uji Normal untuk Ketiga Metode............. 44Tabel 4.9 P-Value Homogenitas Untuk Ketiga Metode ......... 44Tabel 4.10 P-Value ANOVA Pada Data kuantitatif ................. 45Tabel 4.11 Nilai icdrate dan akurasi ketiga Metode................. 42
xviii
(Halaman ini sengaja dikosongkan)
xv
DAFTAR GAMBAR
HalamanGambar 2.1 Skema Penelitian Ensemble Cluster................... 17Gambar 3.1 Diagram Alir. ..................................................... 25Gambar 4.1 Chernoff Face Data Kuantitatif Aksesi P5......... 30Gambar 4.2 Chernoff Face Data Kualitatif Aksesi P5........... 32Gambar 4.3 Nilai Pseudo F-Statistcs dari 3 Cluster .............. 35Gambar 4.4 Nilai Proporsi dari 3 Cluster yang Terbentuk .... 38
xvi
(Halaman ini sengaja dikosongkan)
xix
DAFTAR LAMPIRAN
HalamanLampiran 1 Data Kuantitatif Jeruk Persilangan dengan Aksesi
P5. .................................................................... 51Lampiran 2 Data Kualitatif Jeruk Persilangan dengan Aksesi
P5. .................................................................... 53Lampiran 3 Boxplot Setiap Variabel. .................................. 55Lampiran 4 Syntax Pseudo F-Statistics Program MATLAB
. ........................................................................ 58Lampiran 5 Syntax Fuzzy C-Means Program MATLAB.... 59Lampiran 6 Fungsi Keanggotaan Fuzzy C-Means. ............. 61Lampiran 7 Fungsi Obyektif Fuzzy C-Means. .................... 64Lampiran 8 Perhitungan Nilai Akurasi. .............................. 65Lampiran 9 Syntax K-Modes Program R............................ 67Lampiran 10 Contoh Perhitungan K-Modes dengan R. ........ 70Lampiran 11 Karakteristik Cluster........................................ 71Lampiran 12 Hasil Uji One-Way ANOVA Data Kuantitatif
.. ....................................................................... 72Lampiran 13 Hasil Uji Asumsi dan One-Way ANOVA Data
Kuantitatif Pada K-Modes ............................... 77Lampiran 14 Hasil Uji Asumsi dan One-Way ANOVA Data
Kuantitatif Pada Ensemble Cluster.................. 82
xx
(Halaman ini sengaja dikosongkan)
1
BAB 1
PENDAHULUAN
1.1 Latar Belakang
Varietas tanaman yang memiliki beberapa keragaman
menjadi simbol pada suatu negara bahwa memiliki kekayaan
dibidang holtikultura. Indonesia termasuk negara yang memiliki
banyak keragaman varietas tanaman. Tanaman Jeruk merupakan
hal yang cukup menonjol untuk keragaman tanaman, hal itu
dibuktikan dengan adanya pemuliaan tanaman yang dilakukan
oleh institusi yang dinaungi oleh Departemen Pertanian,
contohnya adalah Balai Penelitian Jeruk dan Buah Subtropika
(Balitjestro). Balitjestro memiliki tugas untuk memperkaya
jumlah varietas tanaman jeruk. Terdapat cara yang digunakan
untuk memperkaya suatu varietas tanaman, salah satunya adalah
dengan cara persilangan. Persilangan tanaman dilakukan untuk
menciptakan suatu varietas baru yang memiliki kualitas baik dari
kedua induk yang disilangkan. Jeruk Siam telah menjadi target
utama dari pihak Balitjestro untuk diperkaya varietasnya. Hal itu
dilakukan karena jeruk jenis Siam memiliki cita rasa yang manis.
Jeruk jenis Siam memiliki suatu kelemahan yaitu memiliki warna
kulit yang kurang menarik, menarik tidaknya kulit tersebut
diindikasikan dengan warna kuning atau orange. Balitjestro
menyilangkan jeruk jenis Siam dengan jeruk jenis yang lain
tujuannya adalah mendapatkan varietas jeruk yang memiliki cita
rasa manis, warna kulit buah kuning atau orange, dan mudah
dikupas. Jeruk Siam Pontianak dan jeruk Soe merupakan salah
satu contoh program persilangan tanaman jeruk dari Balitjestro.
Jeruk Siam Pontianak memiliki ciri rasa yang manis, akan tetapi
penampilan kulit dari jeruk tersebut tidaklah menarik, Jeruk Soe
memiliki cita rasa asam akan tetapi memiliki penampilan kulit
yang menarik. Proses persilangan antara jeruk Siam Pontianak
dan jeruk Soe diharapkan menghasilkan suatu varietas jeruk yang
memiliki penampilan kulit yang menarik dan memiliki cita rasa
manis (Martasari, 2014).
Balitjestro telah memulai program pemuliaan jeruk sejak
tahun 2006 dengan cara persilangan antara 2 jenis jeruk.
2
Persilangan dalam 1 prose dapat menghasilkan kira – kira 150
varietas tanaman baru. Banyaknya hasil varietas baru dari hasil
persilangan di dapat dari biji buah hasil persilangan antara jeruk
jenis Siam Pontianak dan jeruk jenis Soe. Untuk dapat
membedakan varietas baru tersebut, maka varietas yang baru
muncul tersebut nantinya akan diberi nama. Pemberian nama
tersebut dalam bidang pertanian disebut dengan aksesi. Sebuah
nama (aksesi) mempunyai peran yang cukup penting karena suatu
varietas dari masing – masing aksesi akan di amati terus
perkembangannya, sehingga aksesi akan menjadi penanda agar
varietas tersebut tidak tertukar (Martasari, 2014). Persilangan
antara jeruk jenis Siam Pontianak dan jeruk jenis Soe akan
diberikan kode aksesi P5. Setelah semua hasil persilangan
memiliki nama masing – masing, selanjutnya akan diamati
perkembangannya. Tentunya, dari 150 varietas baru yang
dihasilkan dari 1 persilangan memiliki peluang kecil untuk hidup
semuanya. Varietas baru sebanyak 150 hanya menghasilkan 30
aksesi yang dapat hidup dan ditanam di lahan terbuka, dari 30
aksesi belum tentu semuanya merupakan varietas baru yang
diharapkan. Seleksi tanaman sangat diperlukan untuk mengetahui
karakter yang merupakan varietas yang diharapkan. Proses seleksi
dapat dilakukan dengan cara melihat karakter tanaman jeruk.
Karakterisasi tanaman jeruk merupakan cara yang paling
sederhana, karena hanya melihat melalui visualisasi tanaman
jeruk tersebut. Karakterisasi tanaman jeruk akan menghasilkan
data yang diambil dari pengukuran jeruk di setiap aksesinya.
Terdapat 2 jenis data yang dihasilkan dari karakterisasi tanaman
jeruk, yaitu data kuantitatif dan data kualitatif. Variabel
pengukuran pada data kuantitatif terdiri atas: diameter jeruk, lebar
jeruk, jumlah juring, jumlah biji normal, jumlah biji abnormal,
volume jus, brix, dan berat buah. Variabel pengukuran pada data
kualitatif terdiri atas: bentuk buah, bentuk pangkal, bentuk ujung,
warna kulit, permukaan kulit, keeratan epicarp-mesocarp, tekstur
pulp, dan rasa. Keragaman karakteristik setiap aksesi akan
menyulitkan dalam menentukan aksesi mana yang merupakan
varietas unggul. Data yang didapatkan dari persilangan selama ini
cara analisis nya adalah sendiri-sendiri, sehingga seringkali
5
mendapatkan kesimpulan yang tidak valid. Analisis statistika
digunakan untuk membantu mengatasi masalah tersebut, salah
satu contohnya adalah analisis cluster. Analisis cluster digunakan
untuk mengelompokkan atau membedakan aksesi jeruk
persilangan.
Analisis cluster merupakan suatu teknik multivariat yang
mempunyai tujuan utama untuk mengelompokkan objek-objek
berdasarkan kesamaan karakte yang dimilikinya. Dengan analisis
ini, objek dikelompokkan sedemikian rupa sehingga setiap objek
yang paling dekat kesamaannya dengan objek lain berada dalam
suatu kelompok yang sama. Metode pengelompokan C-Means
merupakan salah satu metode data clustering nonhirarki yang
berusaha mempartisi data kedalam satu atau lebih kelompok.
Kekurangan metode C-Means adalah penentuan jumlah kelompok
yang paling tepat kemungkinan terjadinya kegagalan untuk
konvergen, sehingga proses iterasi berlangsung secara terus
menerus (Johnson & Wichern, 2007). Analisis cluster digunakan
untuk mempercepat proses seleksi tanaman jeruk melalui
karakteristik kuantitatif dan kualitatif. Masalah yang muncul
adalah, data aksesi hasil persilangan memiliki keragaman yang
cukup rendah, sehingga dibutuhkan suatu konsep pemilihan yang
lembut, selain itu bagaimana mendapatkan kelompok dari data
yang bertipe kualitatif dan kuantitatif.
Metode Fuzzy C-Means Cluster merupakan solusi yang
baik untuk meminimalkan kegagalan konvergen metode C-Means
pada data yang bertipe kuantitatif dengan keragaman rendah. Data
kualitatif akan dianalisis menggunakan metode K-Modes karena
menggunakan ukuran modus. Metode Fuzzy C-Means merupakan
pengembangan metode C-Means dengan menambahkan konsep
Fuzzy. Metode K-Modes juga merupakan pengembangan metode
C-Means, bedanya hanya mengganti nilai pusat cluster-nya dari
means menjadi modus. Menganalisis cluster pada data kuantitatif
dan data kualitatif adalah dengan cara terpisah yang selama ini
dilakukan oleh Balitjestro, sehingga dibutuhkan metode yang
mampu menganalisis secara bersamaan kedua tipe data. Metode
Ensemble Cluster merupakan solusi untuk mengatasi masalah
tersebut. Pengelompokan Ensemble merupakan gabungan
4
beberapa algoritma untuk mendapatkan hasil pengelompokan
yang lebih baik (Yoon, 2006).
Penelitian tentang Fuzzy C-Means sudah pernah dilakukan
diantaranya: Hannah, 2011; Sukim, 2011; Dewi (2012) Fuzzy C-
Means lebih kokoh untuk mempertahankan banyaknya cluster
terhadap adanya data pencilan jika dibandingkan dengan metode
C-Means. Penelitian tentang ensemble cluster yang pernah diteliti
oleh Yuana (2012) hasil penelitian tersebut menunjukkan bahwa
pengelompokkan dilakukan sekaligus dengan menggabungkan
(Ensemble) dua algoritma pengelompokan yang berbeda. Jurnal
penelitian internasional yang dilakukan oleh Saguna (2012)
penelitian tersebut menghasilkan Algoritma K-Modes mampu
efisien mengelompokkan data kategori.
Penelitian ini dilakukan untuk mengetahui pengelompokan
aksesi jeruk persilangan dengan menggunakan metode Fuzzy C-
Means, K-Modes, dan Ensemble Cluster.
1.2 Rumusan masalah
Pada proses persilangan untuk mendapatkan varietas jeruk
unggul digunakan analisis cluster yang melibatkan data
kuantitatif dan kualitatif. Oleh karena digunakan metode fuzzy c-
means, k-modes, dan ensemble cluster. Berdasarkan latar
belakang tersebut maka permasalahan yang diangkat dalam
penelitian ini sebagai berikut.
1. Bagaimana karakteristik hasil persilangan jeruk Siam
Pontianak dan jeruk Soe?
2. Bagaimana mendapatkan kelompok persilangan jeruk Siam
Pontianak dan jeruk Soe dengan metode fuzzy c-means, k-
modes, dan ensemble cluster?
3. Bagaimana performa metode fuzzy c-means, k-modes, dan
ensemble cluster untuk melakukan pengelompokan pada
hasil persilangan jeruk Siam Pontianak dan jeruk Soe?
1.3 Tujuan
Berdasarkan rumusan masalah maka didapatkan tujuan
sebagai berikut.
5
1. Mendeskripsikan hasil persilangan persilangan jeruk Siam
Pontianak dan jeruk Soe
2. Mendapatkan kelompok aksesi dengan metode fuzzy c-
means, k-modes, dan ensemble cluster.
3. Membandingkan kinerja metode pengelompokan fuzzy c-
means, k-modes, dan ensemble cluster.
1.4 Manfaat
Manfaat dari penelitian ini adalah memanfaatkan dan
mempertimbangkan metode fuzzy c-means cluster, k-modes, dan
ensemble cluster dalam membantu proses seleksi aksesi jeruk.
1.5 Batasan Masalah
Penelitian ini dibatasi pada pengelompokan aksesi tanaman
jeruk persilangan antara jeruk jenis Siam Pontianak dengan jeruk
jenis Soe di Balitjestro pada pengamatan bulan juni – agustus
2015. Metode yang digunakan pada penelitian ini adalah
menggunakan fuzzy c-means dan k-modes yang juga akan
digunakan ensemble cluster untuk membentuk final cluster.
6
(Halaman ini sengaja dikosongkan)
7
BAB IILANDASAN TEORI
2.1 Persilangan Jeruk Siam Pontianak dan SoeIlmu pemuliaan tanaman sebelumnya dikenal dengan nama
ilmu seleksi karena dalam pelaksanaannya dilakukan pemilihanterhadap tanaman yang diinginkan, baik secara individu maupunkelompok. Ilmu pemuliaan digunakan untuk menemukan varietas– varietas baru dari proses pemuliaan. Varietas unggul merupakanfaktor utama yang menentukan tingginya produksi yang diperolehbila persyaratan lain dipenuhi. Suatu varietas unggul tidakselamanya akan menunjukkan keunggulannya, tetapi makin lamaproduksi akan makin menurun tergantung pada komposisigenetiknya. Untuk mendapatkan suatu varietas unggul diperlukanwaktu yang cukup lama. Pada dasarnya, suatu varietas unggulharus memenuhi beberapa persyaratan sebagai berikut: (1)mempunyai kemampuan berproduksi yang tinggi; (2) mempunyaikualitas hasil panen yang baik; dan (3) mempunyai kepastianhasil panen. Jadi, varietas unggul memiliki jaminan dalam halkuantitas dal kualitas hasil yang diberikan. Persyaratan tersebutakan berkembang secara khusus, tergantung pada komoditastanaman, produk yang dimanfaatkan dari tanaman, dan negaraatau wilayah tempat tanaman itu dimuliakan sesuai dengan situasidan kondisi serta kepentingannya.
Persilangan tanaman merupakan usaha yang dilakukanuntuk mendapatkan varietas baru dengan cara mengawinkanbunga yang terdapat di kedua induknya. Dengan cara persilanganbunga yang telah siap kawin, maka akan diharapkan mendapatkanvarietas baru yang lebih baik. Persilangan dilakukan agar terdapatbanyak variasi tanaman dan akan berguna untuk banyak orangkarena memiliki banyak variasi tanaman. Dengan adanyapersilangan, hasil yang diharapkan adalah perwakilan sifat baikyang terdapat pada kedua induk sehingga menghasilkan varietasyang unggul (Mangoendidjojo W, 2012). Balitjestro di bidangpemuliaan memiliki program untuk memperbanyak variasitanaman jeruknya. Salah satu cara adalah dengan menyilangkanbunga dari kedua induk yang telah siap kawin. Tentu saja
8
persilangan ini tidak akan ada waktu maksimalnya, karena setelahmendapatkan varietas yang baik akan dicari lagi beberapa varianstanaman dengan kategori yang baik juga. Sehingga persilanganakan dilakukan secara terus menerus karena banyak variansvarietas yang harus didapatkan (Martasari, 2014). Salah satutarget utama adalah jeruk siam, karena jeruk siam memiliki rasayang manis akan tetapi penampilan kurang menarik. Sehinggapihak Balitjestro telah melakukan persilangan antara jeruk jenisSiam Pontianak dan jeruk jenis Soe. Soe sendiri memilikikeunggulan penampilan yang menarik di kulitnya yaitu berwarnaorange.
2.2 Statistika DeskriptifStatistika deskriptif adalah metode-metode yang berkaitan
dengan pengumpulan dan penyajian suatu gugus data sehinggamemberikan informasi yang berguna. Statistika deskriptifmemberikan informasi hanya mengenai data yang tersedia dansama sekali tidak menarik inferensia atau generalisasi gugus datainduknya yang lebih besar (Walpole,1995). Statistika deskriptifsecara univariate dan multivariate akan digunakan untukmendeskripsikan data aksesi hasil persilangan.a. Statistika deskriptif univariate1. Mean
Mean atau rata-rata adalah perhitungan dengan caramembagi jumlah nilai data dengan banyaknya data. Rumus rata-rata sebagai berikut:
n
iix
nx
1
1(2.1)
Dimana:
x = rata-rataxi = jumlah pengamatan ke-in = banyaknya pengamatan
2. VariansVarians (Ragam) adalah nilai rata-rata dari kuadrat
simpangan baku.
9
1
)(s 1
2
2
n
xxin
i (2.2)
Keterangan :s2 = ukuran penyebaran (varian)
x = rata-rataxi = jumlah pengamatan ke-in = banyaknya pengamatan
3. Minimun dan MaksimumNilai minimum adalah nilai terendah dari sekelompok data
yang diamati dan nilai maksimum adalah nilai tertinggi darisekelompok data yang diamati. (Walpolle, 1995).
b. Statistika deskriptif multivariate dengan Chernoff FaceAnalisis ini pertama kali diperkenalkan oleh Herman
Chernoff (Dillon, 1984) yaitu teknik visualisasi berupa metodegrafik untuk merepresentasikan data dengan banyak variabeldalam bentuk wajah kartun (Chernoff faces) yang ditentukanlebih dari 20 parameter yaitu terdiri dari panjang hidung,kelengkungan mulut, panjang alis, besar sudut alis dan lain-lain.
Chernoff faces menjadi alat peraga yang sangat efektifkarena menghubungkan data dengan raut wajah yang manaterkadang dapat menunjukkan keadaan seseorang atau kelompokbahkan suatu wilayah. Dimensi data yang berbeda dipetakanuntuk raut wajah yang berbeda, sebagai contoh lebar muka, lebartelinga, tinggi telinga, lebar dari mulut, panjang hidung dan lain-lain.
Chernoff face dapat mengekspresikan kondisi/ keadaanyang sebenarnya pada suatu lingkungan berdasarkanpenggambaran /pemetaan raut muka. Dalam bentuknya yang asli,Chernoff membuat sampai 18 dimensi untuk seluruh vektorrespon yang didefinisikan. Setiap dimensi diasosiasikan dengansatu dari 18 penampakan muka. Bruckner (1978) telah membuatsebuah program untuk membuat ‘faces’. Enam penampakanwajah yang dibuat adalah: (1) kepala, (2) mulut, (3) hidung, (4)mata, (5) alis mata, dan (6) telinga. (Dillon, 1984)
10
2.3 Himpunan FuzzyHimpunan Fuzzy adalah sebuah himpunan dimana
keanggotaan tiap elemennya tidak mempunyai batas yang jelas.Himpunan yang demikian sangat kontras dengan himpunan klasik(Agus Naba, 2009). Himpunan Fuzzy pertama kali diperkenalkanpada tahun 1965 oleh Lotfi A. Zadeh yang digunakan untukmempresentasikan kekaburan dalam kehidupan sehari – hari.Penalaran fuzzy yang dikembangakan dalam konsep matematismenjadi menarik karena interpretasi fuzzy dalam struktur datasangat mudah dipahami dan mampu beradaptasi dengan kondisiketidakpastian yang menyertai permasalahan di lapangan (Bezdek& Pal (1995) dalam Yuana, 2012).
Pada suatu himpunan tegas (hard), nilai keanggotaan dariitem x dalam suatu himpunan A, yang sering ditulis dengan
)(xA , memiliki dua kemungkinan yaitu (1), yang berarti bahwaakan menjadi anggota suatu himpunan, atau (0) yang berarti tidakmenjadi anggota suatu himpunan (Kusumadewi, 2004). Haltersebut dirasakan masih kurang adil, karena jika ada perubahansedikit pada suatu nilai maka akan mempengaruhi keanggotaaandalam himpunan. Oleh karena itu, konsep fuzzy sangat dibutuhkanuntuk mengantisipasi hal tersebut.
Konsep ini merupakan pengembangan dari teori himpunanyang klasik. Jika X adalah universe of discourse dan elemen –elemennya dinotasikan dengan x, maka sebuah fuzzy set A dalamX didefinisikan dengan:
XxxAxA )(,
)(xA adalah fungsi keanggotaan dari x dalam A. Fungsikeanggotaan memetakan tiap elemen dari x menjadi derajatkeanggotaan antara 0 dan 1. Secara umum, beberapa kesimpulantentang himpunan dan fungsi keanggotaan fuzzy diberikan dibawah ini (Agus Naba, 2009) :1. Himpunan fuzzy menekankan konsep variabel samar (vague
of fuzzy variable).2. Himpunan fuzzy mengijinkan keanggotaan parsial dari
suatu himpunan.
11
3. Derajat keanggotaan fuzzy dalam himpunan fuzzy berkisarantara 0 sampai 1.
4. Tiap fungsi keanggotaan berasosiasi dengan sebuahhimpunan fuzzy tertentu dan memetakan suatu nilai inputke nilai derajat keanggotaan yang sesuai.Dalam teori himpunan fuzzy terdapat istilah fungsi
keanggotaan (membership function), yaitu suatu kurva yangmenunjukkan pemetaan titik – titik input data ke dalam niaikeanggotaannya yang memiliki inteval nila dari 0 sampai 1.
2.4 Analisis ClusterMenurut Johnson & Wichern (2007), Cluster merupakan
salah satu metode dalam hubungan multivariat. Metodepengelompokan banyak memberikan manfaat, diantaranya untukmenaksir dimensi, mengidentifikasikan outlier dan menunjukkanhipotesis menarik tentang suatu hubungan. Analisis clusterdidasarkan pada kemiripan atau kedekatan. Dalam analisis clusterterdapat 2 metode yang dapat dipakai untuk melakukanpengelompokan data yaitu metode hirarki dan metode non hirarki.Misal terdapat sebanyak n obyek pengamatan dengan p variabel,maka sebelum dilakukan pengelompokkan terhadap pengamatanditentukan ukuran kedekatan antar obyek yang digunakan adalahjarak Euclidean.
2.5 Fuzzy C-Means ClusterFuzzy Cluster merupakan penerapan dari konsep fuzzy
terhadap cluster. Konsep fuzzy diharapkan mampu untukmeminimalkan kejadian konvergen yang biasa dialami olehmetode cluster biasa. Metode FCM merupakan pengembangandari metode tak berhirarki c-means cluster, karena pada awalnyamenentukan jumlah kelompok yang akan dibentuk. Setelah itumelakukan iterasi sampai anggota setiap kelompok terbentuk.Sehingga setiap objek ke-k (k = 1,..., c)
Pada pendekatan himpunan fuzzy, metode pengelompokanberdasarkan kenyataan bahwa objek – objek tertentu secara tegastidak dapat dikelompokkan pada kelompok tertentu. Dengan
12
pendekatan FCM, setiap objek ke-k dianggap menjadi anggota.Berikut ini adalah algoritma FCM:1. Input data yang akan di cluster X, berupa matriks berukuran
n x m ( n = banyaknya data, m = banyaknya variabel setiapdata). Xij = data sampel ke-i (i=1,2,...,n), variabel ke-j(j=1,2,...,m).
2. Menentukan jumlah cluster (c) , weighting exponent (w=2),maksimum iterasi, error terkecil ( = 10-6), fungsi objektifawal (P0=0), dan iterasi awal (t=1).
3. Membangkitkan bilangan random uik, i =1,2,...,n; k= 1,2,...,csebagai elemen matriks partisi awal partisi U
4. Menghitung centriod dari masing-masing kelompok sesuaipersamaan berikut.
n
i
wik
n
i ijw
ik
kju
xuv
1
1
)(
)((2.3)
dimana :n : Banyaknya pengamatani : Indeks objek ke-ik : Indeks cluster ke-kuik : Keanggotaan objek ke-i dan cluster ke-kvkj : Centroid/rata rata cluster ke-k untuk variabel ke-jw : Weighting exponent
: Nilai objek ke-i yang ada didalam cluster tersebutuntuk variabel ke-j
5. Menghitung derajat keanggotaan setiap pengamatan padasetiap cluster. Dimana untuk nilai derajat keanggotaanmempunyai jangkauan nilai 0 ≤ uik ≤ 1
1
1
1
2
c
j
m
ji
kiik d
du (2.4)
untuk nilai dki menggunakan persamaan (2.4)uik : Keanggotaan objek ke-i dan cluster ke-k
: Jarak Euclidean cluster ke- objek ke-: Jarak Euclidean variabel ke-j objek ke-
13
m : Weighting exponentc : Banyaknya cluster6. Menentukan kriteria penghentian iterasi, yaitu perubahan
matriks partisi pada iterasi sekarang dan iterasi sebelumnya.Apabila − ( ) < maka proses berhenti.
n
i
c
k
mik
m
j kjijl uvxU
1 1 1
2 (2.5)
dimana :uik : Keanggotaan objek ke-i dan cluster ke-kvkj : Centroid rata rata cluster ke-k untuk variabel ke-j
: Nilai objek ke-i yang ada didalam cluster tersebut untukvariabel ke-j
m : Weighting exponentc : Banyaknya clustern : Banyaknya pengamatani : Indeks objek ke-ik : Indeks cluster ke-kNamun apabila perubahan nilai membership function masih diatasnilai threshold ( ), maka kembali ke langkah 4, dimana l : iterasike-t ; U : derajat keanggotaan (Bezdek, Ehrlich, & Full, 1984).
Metode FCM memiliki kelemahan yaitu hanya dapatdigunakan pada data yang bertipe kontinu. Dalam kondisi nyatadilapangan, tidak semua data bertipe kontinu. Pada kasuspengelompokan aksesi jeruk persilangan, variabel yang menjadiukuran untuk mengetahui karakteristik dari sebuah aksesi berupadua tipe data yaitu kualitatif dan kontinu. Dewi (2012) dalampenelititannya melakukan transformasi data dari skala ordinalmenjadi skala interval dengan membawanya ke distribusi N(0,1).Kemudian Yuana (2014) melakukan transformasi data sepertiyang dilakukan oleh Dewi untuk mengelompokkan kemiskinan diJombang. Metode transformasi tersebut dikenal dengan Methodsof Succesive Interval. Dengan menggunakan metode ini, makapengelompokkan data menggunakan Fuzzy C-Means dapatdilakukan.
14
2.6 Algoritma K-ModesK-Modes merupakan analisis cluster yang khusus untuk
mengelompokkan data yang bertipe kategori. Jika dilihat sekilas,metode K-Modes hampir sama dengan metode K-Means. Keduametode sama – sama menggunakan ukuran rata – rata untukmenentukan pusat clusternya. Bedanya jika K-Meansmenggunakan rata – rata, K-Modes menggunakan nilai Modusuntuk menjadi pusat cluster nya. Adapun langkah untukmemperoleh cluster pada algoritma K-Modes adalah sebagaiberikut (Huang & Ng, 1999).1) Tentukan jumlah cluster2) Alokasikan pengamatan ke dalam cluster secara random3) Hitung modes pengamatan yang ada di masing-masing
cluster4) Alokasikan masing-masing data ke cluster terdekat5) Kembali ke Step 3, apabila masih ada pengamatan yang
berpindah cluster atau apabila perubahan nilai modes atauapabila perubahan nilai pada objective function yangdigunakan, di atas nilai threshold yang ditentukanPada algoritma K-Modes nantinya akan dihitung akurasi
dan cluster optimum untuk penentuan hasil cluster terbaik. Untukmenentukan hal tersebut, akan digunakan tingkat akurasi hasildari pengelompokkan K-Modes, berikut adalah persamaan yangdapat digunakan.
c
cca
nr
1
1(2.6)
Dimana n adalah banyaknya pengamatan, ca adalah
banyaknya kategori yang mendominasi pada kelompok c.Akurasi akan disajikan dalam bentuk presentase, denganmengalikan hasil r dengan 100%. Error atau kesalahanpengelompokkan juga dapat dihitung dari tingkat akurasi,yaitu re 1 (Huang & Ng, 1999).
2.7 Pseudo F-StatisticsPenentuan jumlah cluster optimum akan menggunakan
pseudo-statistic (Orpin & Kostylev, 2006). Nilai pseudo f-
15
statistics tertinggi menunjukkan bahwa jumlah kelompok telahoptimal, dimana keseragaman dalam kelompok sangat homogensedangkan antar kelompok sangat heterogen. Rumus yangdigunakan dalam menghitung nilai pseudo f-statistics adalahsebagai berikut.
Pseudo F-Statictics =
in
R
i
R
2
2
1
1(2.7)
dengan
SST
SSWSSTR
)(2 (2.8)
N
n
I
i
J
j
jjni xxSST
1 1 1
2)( (2.9)
N
n
I
i
J
j
ji
jni xxSSW
1 1 1
2)( (2.10)
dimana
: total jumlah dari kuadrat jarak terhadap rata-ratakeseluruhan: total jumlah dari kuadrat jarak objek terhadap rata-ratakelompoknya: banyak objek: banyak cluster: banyak variabel
: sampel ke- kelompok ke- variabel ke−̅ : rata-rata seluruh sampel pada variabel ke-̅ : rata-rata sampel pada kelompok ke- variabel ke-
2.8 Ensemble ClusterPengelompokan Ensemble merupakan metode untuk
menggabungkan beberapa algoritma yang berbeda untuk
16
medapatkan partisi umum dari hasil pengelompokan individu(He, (2005a) dalam Angsoka, 2012). Tujuan dari pengelompokanensemble adalah untuk menggabungkan hasil pengelompokandari beberapa algoritma pengelompokan untuk mendapatkan hasilpengelompokan yang lebih baik (Yoon, (2006) dalam Angsoka,2012)
Langkah – langkah dalam metode pengelompokanensembel adalah sebagai berikut1. Kumpulan data yang terdiri atas variabel kualitatif dan
kontinu, dibagi menjadi dua subdata, yaitu murni kualitatifdan murni kontinu.
2. Lakukan pengelompokan objek dengan variabel berskalakuantitatif dengan pendekatan fuzzy C-Means
3. Lakukan pengelompokan objek dengan variabel berskalakualitatif dengan pendekatan K-Modes
4. Menggabungkan hasil pengelompokan dari (2) dan (3)yang disebut proses ensembel.
5. Lakukan pengelompokan (4) menggunakan algoritma yangtelah ditentukan untuk mendapatkan kelompok akhir.Ensemble Cluster merupakan alternatif lain untuk
mengatasi kasus pengelompokkan yang memiliki 2 tipe data(kontinu dan kualitatif). Dewi (2012) dalam penelitiannyamelakukan pengelompokan desa perdesaan di Provinsi Riaumenggunakan metode Cluster Ensemble. Selain itu, akandibandingkan kinerja dari 3 hasil cluster (Cluster Ensemble, FullCategoric, Full Continu). Perbandingan ke 3 cluster tersebutmenghasilkan bahwa Cluster Ensemble memiliki kinerja yanglebih baik karena memiliki nilai rasio terkecil.
Ensemble Cluster memiliki skema yang cukup menarikdengan hasil final cluster merupakan pengelompokan dari datakualitatif yang di dapat dari hasil cluster dari kedua algoritma.Berikut gambaran dari skema Ensemble Cluster.
17
Gambar 2.1 Skema Penelitian Ensemble Cluster
2.9 Internal Cluster Dispersion (Icdrate)Beberapa macam metode untuk membandingkan hasil
pengelompokan dapat dilakukan berbagai cara dan rumusan. Salahsatunya dengan menghitung performansi klaster denganmenghitung nilai SSE dari hasil pengolahan data dan menghitungpersebaran (internal cluster dispersion rate) dalam masing-masing cluster yang telah terbentuk. Semakin kecil nilai icdratemaka semakin baik hasil pengelompokkannya (Firdausi, 2012).
Mingoti & Lima (2006) membandingkan metode clusteryang terbaik dengan mengevaluasi performansi algoritma denganmenggunakan prosentase rata-rata dari klasifikasi yang benar(recovery rate) dan nilai persebaran data-data dalam cluster(internal cluster dispersion rate) dari hasil akhir pengelompokkanyang didefinisikan dengan persamaan (2.13)berikut.
Icdrate = 1- = 1- = 1- R2 (2.11)
dimana :SST : Total jumlah dari kuadrat jarak terhadap rata-rata
keseluruhan.SSW : Total jumlah dari kuadrat jarak sampel terhadap rata-
2.10 Uji One Way ANOVASebelum melakukan uji one – way ANOVA akan dilakukan
uji kenormalan data dengan menggunakan kolmogorov smirnovdan uji homogenitas varians dari setiap cluster. Berikut adalahpemaparannya.2.10.1 Uji Kolmogorov Smirnov
Adapun pengujian yang dilakukan dengan KolmogorovSmirnov adalah sebagai berikut:Hipotesis:Ho : Residual distribusi normal.H1 : Residual tidak distribusi normalStatistik Uji :
D = Sup xFxFn 0 (2.13)
Daerah Kritis :Tolak H0 jika D > D
Dimana :
D = nilai kritis untuk uji Kolmogorov Smirnov satu sampel,
diperoleh dari tabel Kolmogorov Smirnov satusampel.
2.10.2 Uji HomogenitasPemeriksaan dengan suatu treatment (perlakuan) dengan
menggunakan uji levene (levene Test’s) untuk melihatkehomogenan data tersebut.a. Perlakuan
Hipotesis
Ho : 222
21 .... k ; (tidak ada perbedaan)
H1 : Minimal ada satu pasang yang tidak samaDaerah Kritis
Tolak Ho jika P-Value < Gagal tolak Ho jika P-value >
Statistik Uji
Sp2 = kN
S)1n(k
1i
2ii
(2.14)
19
Menentukan respon mana yang dipengaruhi oleh perlakuanyang dalam hal ini adalah hasil Cluster dapat diperoleh melaluipengujian One-way ANOVA (Analysis of Variance). Berikutadalah hipotesis yang digunakan dalam pengujian One-wayANOVAH0 : = = .... = (dimana n = banyak cluster yang terbentuk)H1 : minimal ada satu yang tidak samaStatistik uji :
Fhitung =∑ ( )( )∑ ∑∑
(2.15)
Tolak H0 jika Fhitung lebih besar dari Ftabel, atau nilai p-valuekurang dari α=0,05
Berikut merupakan tabel uji one-way ANOVA (Johnson &Wichern, 2007) :
Tabel 2.1 Tabel uji one-way ANOVASumberVariasi
Matrik Jumlah Kuadrat DerajatBebas (db)
Perlakuan treat = ∑ ( − ) T-1Residual
(Eror)eror = ∑ ∑ − −
Total treat+ eror = ∑ ∑ − − 1
20
(Halaman ini sengaja dikosongkan)
21
BAB IIIMETODOLOGI PENELITIAN
3.1 Sumber DataData yang digunakan dalam penelitian ini adalah data
sekunder yang diperoleh dari pengamatan di Balai PenelitianJeruk dan Buah Subtropika. Pengamatan ini dilakukan pada buahjeruk hasil persilangan dari kedua induk dan akan dibedakanantara data kuantitatif dan data kualitatif, data yang digunakansebanyak 34 aksesi P5 (persilangan antara jeruk Siam Pontianakdengan jeruk Soe).
3.2 Variabel PenelitianPenelitian ini menggunakan data karakter tanaman jeruk
hasil persilangan. Variabel yang digunakan adalah data karakterjeruk yang dilakukan pengamatan pada buahnya, berikutmerupakan variabel penelitian yang digunakan
Tabel 3.1 Variabel KuantitatifVariabel Keterangan
X1 Diameter Buah (cm)X2 Tebal Kulit (mm)X3 Jumlah Juring (Buah)X4 Jumlah Biji Normal(Buah)X5 Jumlah Biji Abnormal (Buah)X6 Volume Jus (ml / 50g)X7 BrixX8 Berat Buah (g)
22
Tabel 3.2 Variabel KualitatifVariabel Skala Keterangan Variabel Skala Keterangan
3.3 Langkah AnalisisLangkah analisis yang dilakukan dalam penelitian ini
sebagai berikut.1. Mendiskripsikan karakter tanaman jeruk dengan
menggunakan ukuran means, varians, nilai minimum danmaksimum. Selain itu dengan cara visualisasi menggunakanchernoff face dan boxplot.
2. Melakukan pemisahan data kualitatif dan kuantitatif3. Melakukan pengelompokan karakter kuantitatif dengan
metode fuzzy c-means, berikut merupakan langkah-langkahnya.a. Input data yang akan di cluster X, berupa matriks
berukuran n x m ( n = banyaknya data, m = banyaknyavariabel setiap data). Xij = data sampel ke-i (i=1,2,...,n),variabel ke-j (j=1,2,...,m).
b. Menentukan jumlah cluster (c) , weighting exponent
23
(w=2), maksimum iterasi, error terkecil ( = 10-6), fungsiobjektif awal (P0=0), dan iterasi awal (t=1).
c. Membangkitkan bilangan random uik, i =1,2,...,n; k=1,2,...,c sebagai elemen matriks partisi awal partisi U
d. Menghitung centriod dari masing-masing kelompoke. Menghitung derajat keanggotaan setiap data pada setiap
cluster. Dimana untuk nilai derajat keanggotaanmempunyai jangkauan nilai 0 ≤ uik ≤ 1
f. Menentukan kriteria penghentian iterasi, yaitu perubahanmatriks partisi pada iterasi sekarang dan iterasisebelumnya. Apabila < maka prosesberhenti.
g. Namun apabila perubahan nilai membership functionmasih diatas nilai threshold ( , maka kembali ke langkah4, dimana l : iterasi ke-t ; U : derajat keanggotaan
4. Melakukan pengelompokan karakter kualitatif denganmetode k-modes, berikut merupakan langkah-langkahnyaa. Tentukan jumlah clusterb. Alokasikan data ke dalam cluster secara randomc. Hitung modes dari data yang ada di masing-masing
clusterd. Alokasikan masing-masing data ke cluster terdekate. Kembali ke Step 3, apabila masih ada data yang
berpindah cluster atau apabila perubahan nilai modes atauapabila perubahan nilai pada objective function yangdigunakan, di atas nilai threshold yang ditentukan
5. Menentukan jumlah cluster optimum dengan metode FuzzyC-Means melalui nilai Pseudo-f statistics terbesar.Sedangkan untuk K-Modes digunakan proporsi terbesar.
6. Mengelompokkan aksesi hasil persilangan tanaman jerukberdasarkan karakteristik kuantitatif dan kualitatif sesuaidengan jumlah cluster optimum.
7. Melakukan ensemble cluster dari kedua algoritma yangdigunakan, hasil cluster dari kedua algoritma akan menjadidata kualitatif. Data kualitatif yang baru nantinya akanberukuran matriks nx2 (Rahayu, 2013), dengan kolom ke 1adalah cluster membership dari hasil cluster kuantitatif, dan
24
kolom ke 2 adalah cluster membership dari hasil clusterkualitatif. Berikut merupakan langkah-langkah ensemblecluster.a. Kumpulan data yang terdiri atas variabel kualitatif dan
kuantitatif, dibagi menjadi dua subdata, yaitu murnikualitatif dan murni kuantitatif.
b. Lakukan pengelompokan objek dengan variabel berskalakuantitatif dengan pendekatan fuzzy C-Means
c. Lakukan pengelompokan objek dengan variabel berskalakualitatif dengan pendekatan K-Modes
d. Menggabungkan hasil pengelompokan dari (2) dan (3)yang disebut proses ensembel.
e. Lakukan pengelompokan (4) menggunakan algoritmayang telah ditentukan untuk mendapatkan kelompokakhir.
8. Membandingkan ketiga metode yaitu fuzzy c-means, k-modes, dan ensmeble cluster dengan cara menggunakan nilaiicdrate untuk data kuantitatif dan nilai akurasi untuk datakualitatif.
Berdasarkan langkah analisis yang telah dijelaskan makadiagram alir yang terbentuk adalah seperti pada Gambar 3.1.
25
Gambar 3.1 Diagram Alir Metode Analisis
Data
Pemisahan data Kuantitatif dan Kualitatif
Data Kuantitatif Data Kualitatif
Statistika Deskriptifmenggunakan mean, stadev,
minimum, maximum, boxplot,chernoff face
Statistika Deskriptifmenggunakan ukuranmodus, chernoff face
Fuzzy C-MeansK-Modes
Pseudo F-StatisticsUkuran Proporsi
Pembentukan Clustermenggunakan cluster
optimum
Pembentukan Clustermenggunakan cluster
optimum
Output 1
Output 2
Final Cluster
K-Modes
Membandingkan hasil ketiga metode dengan menggunakanicdrate untuk kuantitatif dan akurasi untuk kualitatif
end% If some entries of "options" are nan's, replace them with defaults.nan_index = find(isnan(options)==1);options(nan_index) = default_options(nan_index);if options(1) <= 1,
error('The exponent should be greater than 1!');end
end
expo = options(1); % Exponent for Umax_iter = options(2); % Max. iterationmin_impro = options(3); % Min. improvementdisplay = options(4); % Display info or not
obj_fcn = zeros(max_iter, 1); % Array for objective function
60
U = initfcm(cluster_n, data_n); % Initial fuzzy partition% Main loopfor i = 1:max_iter,
[U, center, obj_fcn(i)] = stepfcm(data, U, cluster_n, expo);if display,
fprintf('Iteration count = %d, obj. fcn = %f\n', i, obj_fcn(i));end% check termination conditionif i > 1,
if abs(obj_fcn(i) - obj_fcn(i-1)) < min_impro, break; end,end
end
iter_n = i; % Actual number of iterationsobj_fcn(iter_n+1:max_iter) = [];
Derajat Keanggotaan Awal
function U = initfcm(cluster_n, data_n)U = rand(cluster_n, data_n);col_sum = sum(U);U = U./col_sum(ones(cluster_n, 1), :);
Iterasi Fuzzy C-Means
function [U_new, center, obj_fcn] = stepfcm(data, U, cluster_n, expo)mf = U.^expo; % MF matrix after exponential modificationcenter = mf*data./((ones(size(data, 2), 1)*sum(mf'))'); % new centerdist = distfcm(center, data); % fill the distance matrixobj_fcn = sum(sum((dist.^2).*mf)); % objective functiontmp = dist.^(-2/(expo-1)); % calculate new U, suppose expo != 1U_new = tmp./(ones(cluster_n, 1)*sum(tmp));
61
Lampiran 6Fungsi Keanggotaan Fuzzy C-Means Clustering 2 Kelompok
1 Obloid Truncate Truncate Kuning Kehijauan Halus Sedang Lembut Sedang2 Obloid Truncate Truncate Kuning Kehijauan Halus Sedang Lembut Enak3 Obloid Convex Truncate Kuning Kehijauan Berpori Sedang Sedang Buruk4 Obloid Truncate Truncate Kuning Kehijauan Halus Sedang Lembut Sedang
72
Lampiran 12Hasil Uji Asumsi dan uji One-Way ANOVA Data Kuantitatif
0,50,0-0,5-1,0
99
95
90
80706050403020
10
5
1
Diameter
Perc
ent
Mean 1,044916E-16StDev 0,3067N 34KS 0,150P-Value 0,050
Probability Plot of DiameterNormal
Test of Homogeneity of VariancesDiameter
Levene Statistic df1 df2 Sig..398 2 31 .675
ANOVADiameter
Sum of Squares df Mean Square F Sig.Between Groups 5.755 2 2.878 28.755 .000
Within Groups 3.102 31 .100
Total 8.857 33
3210-1-2
99
95
90
80706050403020
10
5
1
Tebal Kulit
Perc
ent
Mean -6,53072E-17StDev 0,8443N 34KS 0,163P-Value 0,030
Probability Plot of Tebal KulitNormal
73
Test of Homogeneity of VariancesTebal Kulit
Levene Statistic df1 df2 Sig.1.746 2 31 .191
ANOVATebal Kulit
Sum of Squares df Mean Square F Sig.Between Groups 1.993 2 .996 1.312 .284Within Groups 23.537 31 .759Total 25.530 33
1,51,00,50,0-0,5-1,0
99
95
90
80706050403020
10
5
1
Jumlah Juring
Perc
ent
Mean 6,791953E-16StDev 0,5657N 34KS 0,063P-Value >0,150
Probability Plot of Jumlah JuringNormal
Test of Homogeneity of VariancesJumlah Juring
Levene Statistic df1 df2 Sig..578 2 31 .567
ANOVAJumlah Juring
Sum of Squares df Mean Square F Sig.Between Groups .744 2 .372 1.021 .372Within Groups 11.286 31 .364Total 12.029 33
74
1050-5-10
99
95
90
80706050403020
10
5
1
Biji NormalPe
rcen
t
Mean -7,31441E-16StDev 4,581N 34KS 0,090P-Value >0,150
Probability Plot of Biji NormalNormal
Test of Homogeneity of VariancesBiji Normal
Levene Statistic df1 df2 Sig.1.156 2 31 .328
ANOVABiji Normal
Sum of Squares df Mean Square F Sig.Between Groups 86.332 2 43.166 1.916 .164Within Groups 698.286 31 22.525Total 784.618 33
10,07,55,02,50,0-2,5-5,0
99
95
90
80706050403020
10
5
1
Biji Abnormal
Perc
ent
Mean 7,314411E-16StDev 2,149N 34KS 0,169P-Value 0,021
Probability Plot of Biji AbnormalNormal
Test of Homogeneity of VariancesBiji Abnormal
Levene Statistic df1 df2 Sig..368 2 31 .695
ANOVABiji Abnormal
Sum of Squares df Mean Square F Sig.Between Groups 1.318 2 .659 .135 .874Within Groups 150.800 31 4.865Total 152.118 33
75
50-5-10
99
95
90
80706050403020
10
5
1
Volume Jus
Perc
ent
Mean 6,269495E-16StDev 3,080N 34KS 0,197P-Value <0,010
Probability Plot of Volume JusNormal
Test of Homogeneity of VariancesVolume Jus
Levene Statistic df1 df2 Sig.3.868 2 31 .032
ANOVAVolume Jus
Sum of Squares df Mean Square F Sig.Between Groups 1.717 2 .859 .085 .919Within Groups 312.952 31 10.095Total 314.670 33
543210-1-2-3-4
99
95
90
80706050403020
10
5
1
Brix
Perc
ent
Mean 1,044916E-16StDev 1,676N 34KS 0,165P-Value 0,027
Probability Plot of BrixNormal
Test of Homogeneity of VariancesBrix
Levene Statistic df1 df2 Sig.1.890 2 31 .168
ANOVABrix
Sum of Squares df Mean Square F Sig.Between Groups 9.061 2 4.531 1.516 .235Within Groups 92.661 31 2.989Total 101.723 33
76
403020100-10-20-30
99
95
90
80706050403020
10
5
1
Berat BuahPe
rcen
t
Mean 8,777293E-15StDev 9,771N 34KS 0,107P-Value >0,150
Probability Plot of Berat BuahNormal
Test of Homogeneity of VariancesBerat BuahLevene Statistic df1 df2 Sig.
1.388 2 31 .265
ANOVABerat Buah
Sum of Squares df Mean Square F Sig.Between Groups 11.795.179 2 5.897.589 58.153 .000Within Groups 3.143.890 31 101.416Total 14.939.069 33
77
Lampiran 13Hasil Uji Asumsi dan uji One-Way ANOVA Data KuantitatifPada K-Modes
1,51,00,50,0-0,5-1,0
99
95
90
80706050403020
10
5
1
Diameter
Perc
ent
Mean -2,61229E-16StDev 0,4988N 34KS 0,130P-Value 0,149
Probability Plot of DiameterNormal
Test of Homogeneity of VariancesDiameterLevene Statistic df1 df2 Sig.
1.314 3 30 .288
ANOVADiameter
Sum of Squares df Mean Square F Sig.Between Groups 1.361 3 .454 1.815 .166Within Groups 7.497 30 .250Total 8.857 33
43210-1-2
99
95
90
80706050403020
10
5
1
Tebal Kulit
Perc
ent
Mean 1,306145E-17StDev 0,8687N 34KS 0,178P-Value <0,010
Probability Plot of Tebal KulitNormal
Test of Homogeneity of VariancesTebal Kulit
Levene Statistic df1 df2 Sig..758 3 30 .527
78
ANOVATebal Kulit
Sum of Squares df Mean Square F Sig.Between Groups 1.211 3 .404 .498 .687Within Groups 24.320 30 .811Total 25.530 33
1,51,00,50,0-0,5-1,0
99
95
90
80706050403020
10
5
1
Jumlah Juring
Perc
ent
Mean 7,314411E-16StDev 0,5495N 34KS 0,122P-Value >0,150
Probability Plot of Jumlah JuringNormal
Test of Homogeneity of VariancesJumlah Juring
Levene Statistic df1 df2 Sig..452 3 30 .718
ANOVAJumlah Juring
Sum of Squares df Mean Square F Sig.Between Groups .508 3 .169 .451 .719Within Groups 11.257 30 .375Total 11.765 33
1050-5-10
99
95
90
80706050403020
10
5
1
Biji Normal
Perc
ent
Mean 3,657205E-16StDev 4,466N 34KS 0,123P-Value >0,150
Probability Plot of Biji NormalNormal
Test of Homogeneity of VariancesBiji Normal
Levene Statistic df1 df2 Sig.1.140 3 30 .349
79
ANOVABiji Normal
Sum of Squares df Mean Square F Sig.Between Groups 56.922 3 18.974 .782 .513Within Groups 727.695 30 24.257Total 784.618 33
10,07,55,02,50,0-2,5-5,0
99
95
90
80706050403020
10
5
1
Biji Abnormal
Perc
ent
Mean 6,530724E-17StDev 2,042N 34KS 0,203P-Value <0,010
Probability Plot of Biji AbnormalNormal
Test of Homogeneity of VariancesBiji Abnormal
Levene Statistic df1 df2 Sig.1.548 3 30 .222
ANOVABiji Abnormal
Sum of Squares df Mean Square F Sig.Between Groups 24.067 3 8.022 1.879 .154Within Groups 128.051 30 4.268Total 152.118 33
50-5-10
99
95
90
80706050403020
10
5
1
Volume Jus
Perc
ent
Mean -8,35933E-16StDev 2,919N 34KS 0,137P-Value 0,100
Probability Plot of Volume JusNormal
Test of Homogeneity of VariancesVolume Jus
Levene Statistic df1 df2 Sig..984 3 30 .414
80
ANOVAVolume Jus
Sum of Squares df Mean Square F Sig.Between Groups 40.680 3 13.560 1.485 .239Within Groups 273.990 30 9.133Total 314.670 33
543210-1-2-3-4
99
95
90
80706050403020
10
5
1
Brix
Perc
ent
Mean 1,044916E-16StDev 1,479N 34KS 0,095P-Value >0,150
Probability Plot of BrixNormal
Test of Homogeneity of VariancesBrix
Levene Statistic df1 df2 Sig.1.001 3 30 .406
ANOVABrix
Sum of Squares df Mean Square F Sig.Between Groups 12.077 3 4.026 1.347 .278Within Groups 89.646 30 2.988Total 101.723 33
7550250-25-50
99
95
90
80706050403020
10
5
1
Berat Buah
Perc
ent
Mean 0StDev 20,56N 34KS 0,127P-Value >0,150
Probability Plot of Berat BuahNormal
Test of Homogeneity of VariancesBerat Buah
Levene Statistic df1 df2 Sig.1.639 3 30 .201
81
ANOVABerat Buah
Sum of Squares df Mean Square F Sig.Between Groups 2.223.149 3 741.050 1.748 .178Within Groups 12.715.920 30 423.864Total 14.939.069 33
82
Lampiran 14Hasil Uji Asumsi dan Uji One-Way ANOVA Data Kuantitatifpada Ensemble Cluster
1,51,00,50,0-0,5-1,0
99
95
90
80706050403020
10
5
1
Diameter
Perc
ent
Mean 5,224579E-16StDev 0,4063N 34KS 0,163P-Value 0,031
Probability Plot of DiameterNormal
Test of Homogeneity of VariancesDiameter
Levene Statistic df1 df2 Sig..613 3 30 .612
ANOVADiameter
Sum of Squares df Mean Square F Sig.Between Groups 3.485 3 1.162 6.488 .002Within Groups 5.372 30 .179Total 8.857 33
3210-1-2
99
95
90
80706050403020
10
5
1
Tebal Kulit
Perc
ent
Mean -1,56737E-16StDev 0,8422N 34KS 0,169P-Value 0,021
Probability Plot of Tebal KulitNormal
Test of Homogeneity of VariancesTebal Kulit
Levene Statistic df1 df2 Sig.2.467 3 30 .081
83
ANOVATebal Kulit
Sum of Squares df Mean Square F Sig.Between Groups 3.797 3 1.266 1.747 .179Within Groups 21.733 30 .724Total 25.530 33
1,51,00,50,0-0,5-1,0
99
95
90
80706050403020
10
5
1
Jumlah Juring
Perc
ent
Mean 3,657205E-16StDev 0,5662N 34KS 0,070P-Value >0,150
Probability Plot of Jumlah JuringNormal
Test of Homogeneity of VariancesJumlah juring
Levene Statistic df1 df2 Sig..027 3 30 .994
ANOVAJumlah juring
Sum of Squares df Mean Square F Sig.Between Groups .770 3 .257 .700 .559Within Groups 10.995 30 .366Total 11.765 33
1050-5-10
99
95
90
80706050403020
10
5
1
Biji Normal
Perc
ent
Mean -1,04492E-15StDev 4,644N 34KS 0,113P-Value >0,150
Probability Plot of Biji NormalNormal
Test of Homogeneity of VariancesBiji Normal
Levene Statistic df1 df2 Sig.2.105 3 30 .121
84
ANOVABiji Normal
Sum of Squares df Mean Square F Sig.Between Groups 183.418 3 61.139 3.051 .044Within Groups 601.199 30 20.040Total 784.618 33
10,07,55,02,50,0-2,5-5,0
99
95
90
80706050403020
10
5
1
Biji Abnormal
Perc
ent
Mean 9,926700E-16StDev 2,109N 34KS 0,178P-Value <0,010
Probability Plot of Biji AbnormalNormal
Test of Homogeneity of VariancesBiji Abnormal
Levene Statistic df1 df2 Sig..686 3 30 .568
ANOVABiji Abnormal
Sum of Squares df Mean Square F Sig.Between Groups 12.618 3 4.206 .905 .450Within Groups 139.499 30 4.650Total 152.118 33
50-5-10
99
95
90
80706050403020
10
5
1
Volume Jus
Perc
ent
Mean 6,269495E-16StDev 3,080N 34KS 0,212P-Value <0,010
Probability Plot of Volume JusNormal
Test of Homogeneity of VariancesVolume Jus
Levene Statistic df1 df2 Sig.3.420 3 30 .030
85
ANOVAVolume Jus
Sum of Squares df Mean Square F Sig.Between Groups 15.952 3 5.317 .534 .663Within Groups 298.718 30 9.957Total 314.670 33
543210-1-2-3-4
99
95
90
80706050403020
10
5
1
Brix
Perc
ent
Mean 4,702121E-16StDev 1,667N 34KS 0,191P-Value <0,010
Probability Plot of BrixNormal
Test of Homogeneity of VariancesBrix
Levene Statistic df1 df2 Sig.2.479 3 30 .080
ANOVABrix
Sum of Squares df Mean Square F Sig.Between Groups 28.125 3 9.375 3.821 .020Within Groups 73.598 30 2.453Total 101.723 33
7550250-25-50
99
95
90
80706050403020
10
5
1
Berat Buah
Perc
ent
Mean 4,597629E-15StDev 15,41N 34KS 0,188P-Value <0,010
Probability Plot of Berat BuahNormal
Test of Homogeneity of VariancesBerat Buah
Levene Statistic df1 df2 Sig.1.815 3 30 .166
86
ANOVABerat Buah
Sum of Squares df Mean Square F Sig.Between Groups 6.983.356 3 2.327.785 8.778 .000Within Groups 7.955.713 30 265.190Total 14.939.069 33
47
BAB VKESIMPULAN DAN SARAN
5.1 KesimpulanBerdasarkan hasil analisis karakter dan pembahasan
terhadap karakter persilangan jeruk aksesi P5 maka dapatdiperoleh kesimpulan sebagai berikut.1. Jeruk persilangan aksesi P5 rata-rata memiliki karakter
yang hampir sama karena memiliki varians yang kecil.Pada bentuk fisik jeruk aksesi P5, ukurannya cukup besar,dan berwarna menarik.
2. Pada fuzzy c-means cluster didapatkan cluster optimumsebanyak 3 kelompok dengan nilai pseudo f-statisticssebesar 41,65, Sedangkan untuk karakter kualitatif yangdianalisis dengan metode K-Modes yang dibentuk4kelompok menghasilkan nilai keakurasian sebesar 100%.Metode Ensemble Cluster mampu untuk mengelompokkankarakter campuran yang bertipe kuantitatif dan kualitatif.Hal tersebut dibuktikan dengan keakuratan pengelompokandengan jumlah kelompok sebanyak 4 sebesar 97%. Selainitu, Ensemble Cluster mampu menerangkan ataumenggabungkan kedua tipe karakter menjadi 1 karakteryaitu bertipe kualitatif.
3. Metode fuzzy c-means memiliki nilai icdrate yang terkecilyaitu 0,27, sedangkan untuk akurasi pada karakter kualitatifsemuanya sama yaitu 97%. Hal ini berarti dengan metodefuzzy c-means cluster yang digunakan pada karakterkuantitatif cukup untuk mengelompokkan kedua tipekarakter.
5.2 SaranUntuk penelitian selanjutnya dengan menambah metode
pembanding untuk karakter kuantitatif dan kualitatif sehinggadapat mengetahui sejauh mana metode utama dapat bekerjadengan baik. Selain itu, lebih teliti lagi untuk menyeleksi variabelpenelitian yang digunakan agar tidak ada salah 1 variabel yangmendominasi variabel lain.
48
(Halaman ini sengaja dikosongkan)
49
DAFTAR PUSTAKA
Balitjestro, 2015. Profil Balitjestro. [Online] Available at:http://balitjestro.litbang.pertanian.go.id/profil/balitjestro/ [Accessed 15 Desember 2015].
Bezdek, J.C., Ehrlich, R., Full, W. 1984. FCM: Fuzzy C-MeansClustering Algorithm. USA: Computers & GeosciencesVol. 10, No. 2-3, pp. 191-203
Chernoff, H. (1973). The Use of Faces to Represent Points in k-Dimensional Space Graphically. Journal of AmericanStatistical Association 68 , 361-368
Dewi, A., 2012. Metode Cluster Ensemble Untuk PengelompokanDesa Perdesaan di Provinsi Riau. Thesis, JurusanStatistika FMIPA-ITS, Surabaya
Hanna. (2011). Pengelompokan Kabupaten/Kota di ProvinsiJawa Timur Berdasarkan Indikator PendidikanSMA/SMK/MA dengan Metode C-Means dan Fuzzy C-Means. Tugas Akhir, Jurusan Statistika FMIPA-ITS,Surabaya
Huang, Z., Ng, Michael. 1999. A Fuzzy K-Modes Algorithm ForClustering Categorical Data. IEEE Transactions OnFuzzy System Vol. 7, No 4.
Johnson, R. A. and Wichern, D. W. 2007. .Applied MultivariatAnalysis, Sixth Edition. Prentice Hall Inc. New Jersey.
Kusumadewi, Sri dan Hari Purnomo. (2004). Aplikasi LogikaFuzzy untuk Pendukung Keputusan. Yogyakarta : GrahaIlmu.
Martasari, C., 2014. Kajian Genetik dan Percepatan PembungaanTanaman Hasil Fusi Protoplasma Jeruk Siam Madu(Citrus nobilis Lour.) dan Satsuma Mandarin (Citrusunshiu). Malang: Universitas Brawijaya
Mangoendidjojo, W. 2003. Dasar – Dasar Pemuliaan TanamanEdisi ke-6. Yogyakarta: Penerbit Kanisius (AnggotaIKAPI)
Mingoti, S., & Lima, J. (2006). Comparing SOM Neural Networkwith Fuzzy C-Means, C-Means and Traditional
50
Hierarchical Clustering Algorithms. European Journalof Operational Research, 174, 1742-1759.
Naba, Agus. (2009). Belajar Cepat Fuzzy Logic MenggunakanMATLAB. Yogyakarta : CV ANDI OFFSET.
Orpin, A., & Kostylev, V. (2006). Towards a Statistically ValidMethod of Textural Sea Floor Characterization ofBenthic Habitats. Marine Geology, 209-222.
Rahayu, D.P. (2013). Analisis Karakteristik Kelompok Denganmenggunakan Pendekatan Cluster Ensemble, JurnalMatematika, Sains, dan Teknologi, Vol.14, No 1, 1-10
Suguna, J. 2012. Ensemble Fuzzy Clustering for Mixed Numericand Categorical Data, International Journal ofComputer Application, Vol. 42, No. 3
Sukim. 2011. Metode C-Means Cluster dan Fuzzy C-MeansCluster Serta Aplikasinya pada Kasus PengelompokkanDesa/Kelurahan Berdasarkan Status Ketertinggalan.Thesis, Jurusan Statistika FMIPA-ITS, Surabaya
Sukmawati, Y. (2012). Hybrid Model Fuzzy C-Means (FCM) danMultivariate Adaptive Regression Spline (MARS) padaKasus Rumah Tangga Miskin Kabupaten Jombang.Thesis, Jurusan Statistika FMIPA-ITS, Surabaya
Walpole, Ronald E. 1995. Pengantar Metode Statistik. Edisi ke-3.Diterjemahkan oleh: Ir. Bambang Sumantri. Jakarta : PTGramedia Pustaka Utama.
Yoon, H. S., 2006. Heterogeneous Clustering Ensemble MethodFor Combining Different Cluster Results. BioDM 2006,pp. 82-91
79
BIODATA PENULIS
Penulis dilahirkan diMagetan pada tanggal 6 Juni 1993 sebagai anak kedua dari duabersaudara. Penulis bertempat tinggal di Prumahan Bumi SukoIndah Blok B1-04 Sidoarjo. Penulis telah menempuh pendidikanformal dimulai dari TK Tunas Jaya Kelun, Madiun, SD Negeri 1Mejoyo Mojokerto, lalu pindah ke SD Negeri 1 Suko Sidoarjopada kelas 2, SMP Negeri 1 Wonoayu, dan SMA Negeri 1 SookoMojokerto. Setelah lulus dari SMA, penulis melanjutkan studinyadi Diploma III Jurusan Statistka FMIPA ITS Surabaya melaluijalur penerimaan reguler pada tahun 2011 dengan NRP. 13 11 030017. Setelah lulus dari Diploma 3, penulis melanjutkan studi nyake jenjang Sarjan Statistika melalui program Lintas Jalur ITSpada tahun 2014 diterima dengan NRP 1314105029. Selamaperkuliahan penulis sangat aktif mengikuti kegiatan kepanitiaandi KM ITS. Penulis pernah bergabung dalam organisasikemahasiswaan, yakni sebagai staff departemen Kewirausahaan(KWU) HIMASTA-ITS pada periode 2012/2013. Pelatihan yangpernah diikuti penulis diantaranya LKMM PRA TD FMIPA ITSdan LKMM TD HIMASTA-ITS. Penulis juga pernah mengikutikegiatan mahasiswa di IBC (ITS Badminton Community). Untukkritik dan saran dapat dikirim melalui email [email protected]. Penulis dapat dihubungi melaluinomer 081703326776.