PENGELOMPOKAN AKSESI JERUK PERSILANGAN BERDASARKAN KARAKTERISTIK KUALITATIF DAN KUANTITATIF MENGGUNAKAN FUZZY C-MEANS DAN K-MODES CANDRA WIDHI SAPUTRA - 1314105029 Jurusan Statistika Fakultas Ilmu Pengetahuan dan Matematika Institut Teknologi Sepuluh Nopember Surabaya 2016 Dosen Pembimbing: Dr. Sutikno, S.Si, M.Si Co Pembimbing: Dr. Chaireni Martasari, S.P, M.Si 1
57
Embed
PENGELOMPOKAN AKSESI JERUK PERSILANGAN …repository.its.ac.id/75121/3/1314105029-Presentation.pdf · 2020. 2. 21. · tanaman jeruk persilangan antara jeruk jenis Siam Pontianak
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
PENGELOMPOKAN AKSESI JERUK PERSILANGAN BERDASARKAN
KARAKTERISTIK KUALITATIF DAN KUANTITATIF MENGGUNAKAN
FUZZY C-MEANS DAN K-MODES
CANDRA WIDHI SAPUTRA - 1314105029
Jurusan Statistika
Fakultas Ilmu Pengetahuan dan Matematika
Institut Teknologi Sepuluh Nopember
Surabaya
2016
Dosen Pembimbing: Dr. Sutikno, S.Si, M.Si
Co Pembimbing: Dr. Chaireni Martasari, S.P, M.Si
1
Kesimpulan Dan Saran
Analisis Dan Pembahasan
Metodologi Penelitian
Tinjauan Pustaka
Pendahuluan
2
3
228 Varietas Jeruk
28 Varietas Strawberry 35 Varietas Lengkeng
49 Varietas Anggur 73 Varietas Apel
4
Pemuliaan Tanaman Persilangan Keragaman Tanaman
Jeruk
5
A
B
C
X
Jeruk
Siam
Menghasilkan jeruk yang memiliki rasa manis, kulit
berwarna orange, dan mudah dikupas
TUJUAN
6
Satu kali persilangan menghasilkan kurang lebih
150 varietas. Dimana Varietas – varietas tersebut akan
diberikan nama dengan sebutan aksesi. Persilangan
jeruk Siam Pontianak dan jeruk Soe diberikan label
aksesi P5.
7
X
Menghasilkan jeruk yang berasa manis dan kulitnya
menarik
TUJUAN
Siam Pontianak Keunggulan
- Memiliki rasa yang manis
Kelemahan
- Memiliki kulit yang berwarna hijau
dan tidak menarik
Keprok Soe Keunggulan
- Memiliki kulit yang berwarna
orange dan menarik
Kelemahan
- Memiliki rasa yang asam
8
Berdasarkan karakteristik Morfologi
Data Kualitatif Data Kuantitatif
Masalah 1. Keragaman data hasil persilangan
aksesi cukup kecil 2. Terkadang terdapat outlier 3. Menghasilkan 2 kesimpulan karena
pengamatan sendiri – sendiri
Fuzzy C-Means
K-Modes
Ensemble Cluster
1. Bentuk Buah
2. Bentuk Pangkal
3. Bentuk Ujung
4. Warna Kulit
5. Permukaan Kulit
6. Keeratan Epicarp
7. Tekstur Pulp
8. Rasa
1. Diameter Buah
2. Tebal Kulit
3. Jumlah Juring
4. Jumlah Biji Normal
5. Jumlah Biji Abnormal
6. Volume Jus
7. Brix
8. Berat Buah
9
Sukim (2011)
• Metode Fuzzy C-Means lebih kokoh untuk mempertahankan banyaknya cluster terhadap adanya data pencilan jika dibandingkan dengan metode C-Means.
Dewi (2012)
• Pengelompokkan dapat dilakukan sekaligus dengan menggabungkan (Ensemble) dua algoritma pengelompokkan yang berbeda.
Saguna (2012)
• Algoritma K-Modes mampu efisien untuk data kualitatif. Begitupun algoritma Fuzzy C-Means untuk data kuantitatif.
10
11
1
• Bagaimana proses seleksi aksesi jeruk dapat terbentuk dari metode fuzzy c-means cluster dan metode k-modes?
2
• Bagaimana penggabungan data dari hasil cluster yang didapat dari metode fuzzy c-means cluster dan metode k-modes menggunakan ensemble cluster?
12
1
• Menganalisa kinerja metode fuzzy c-means cluster dan metode k-modes untuk melakukan proses seleksi
2
• Menguji proses penggabungan cluster dengan data bertipe kualitatif dan kuantitatif menggunakan ensemble cluster
Manfaat dari penelitian ini adalah memanfaatkan dan mempertimbangkan metode fuzzy c-means cluster,
k-modes, dan ensemble cluster dalam membantu proses seleksi aksesi jeruk.
13
Penelitian ini dibatasi pada pengelompokan aksesi tanaman jeruk persilangan antara jeruk jenis Siam Pontianak dengan jeruk jenis Soe di Balitjestro. Metode yang digunakan pada penelitian ini adalah menggunakan fuzzy c-means dan k-modes yang juga akan digunakan ensemble cluster untuk membentuk final cluster
14
15
X
Menghasilkan satu tanaman yang
mewakili sifat baik dari kedua tetua.
Selain itu mendapatkan banyak
keragaman varietas tanaman
A B
16
a. Buah Hasil
Persilangan
b. Kultur in vitro
c. Minigrafting plantet
Pada batang bawah
d. Pelihara di Nursery
e. Seleksi fase vegetatif
f. Seleksi fase generatif
g. Ditanam pada
tabulampot
h. Contoh aksesi dengan
warna kuning
17
Dalam penelitian ini Statistika Deskriptif digunakan untuk mengetahui karakteristik daun dan jeruk menggunakan
ukuran Means, Varians, Modus, nilai minimum dan maximum, serta akan ditambahkan Chernoff face
18
Teknik visualisasi berupa bentuk wajah Untuk menggambarkan keadaan data untuk setiap variabel
Chernoff Face
Himpunan Klasik Himpunan Fuzzy
0 1 Selang interval [0,1]
19
Tegas Lembut
0
1
0
0,7
0,1 0,2
• Analisis Cluster mempunyai tujuan untuk mengelompokkan objek-objek berdasarkan kemiripan karakteristik
Jarak Antar Cluster
Maksimal
Jarak Antar Anggota Cluster
Minimal
20
21
n
i
w
ik
n
i ij
w
ik
kj
u
xuv
1
1
)(
)(
1
1
1
2
c
j
m
ji
kiik
d
du
n
i
c
k
m
ik
m
j kjij
l uvxU1 1 1
2
Input Data yang akan di Cluster, berupa matriks berukuran n x m
Menentukan Jumlah Cluster (c), weighted exponent (w=2), maksimum iterasi (100), error terkecil (𝜀 = 10-6), fungsi objektif awal (P0=0), dan iterasi awal (t=1)
Membangkitkan bilangan random sebagai elemen matriks partisi awal U, berukuran n x c
Menghitung centroid dari masing – masing kelompok menggunakan persamaan
Menghitung derajat keanggotaan setiap data pada setiap cluster dengan jangkauan nilai 0-1
Menentukan kriteria penghentian iterasi, apabila
𝑈𝑙 − 𝑈(𝑙−1) < 𝜀 maka
proses berhenti
Kembali ke Step 3, apabila masih ada data yang berpindah cluster
Alokasikan masing-masing data ke cluster terdekat
Hitung modes dari data yang ada di masing-masing cluster
Alokasikan data ke dalam cluster secara random
Tentukan jumlah cluster
22
Pseudo F-statistics =
𝑅2
𝑖−1
1−𝑅2
𝐼−𝑖
𝑅2 =𝑆𝑆𝑇 − 𝑆𝑆𝑊
𝑆𝑆𝑇
𝑆𝑆𝑇 = 𝑥𝑛𝑖𝑗− 𝑥 𝑗
2𝐽
𝑗=1
𝐼
𝑖=1
𝑁
𝑛=1
𝑆𝑆𝑊 = 𝑥𝑛𝑖𝑗− 𝑥 𝑖𝑗 2
𝐽
𝑗=1
𝐼
1=1
𝑁
𝑛=1
23
Nilai pseudo f-statistics tertinggi menunjukkan bahwa jumlah kelompok telah optimal, dimana keseragaman dalam
kelompok sangat homogen sedangkan antar kelompok sangat heterogen.
Pada algoritma K-Modes nantinya akan dihitung akurasi dan cluster optimum untuk penentuan hasil cluster terbaik. Untuk menentukan hal tersebut, akan digunakan tingkat akurasi hasil dari pengelompokkan K-Modes
24
c
c
can
r1
1
ca
Dimana n adalah banyaknya kategori yang mendominasi pada kelompok ac. Akurasi akan disajikan dalam bentuk presentase, dengan mengalikan hasil r dengan 100%. Error atau kesalahan pengelompokkan juga dapat dihitung dari tingkat akurasi, yaitu e=1-r
Internal Cluster Dispertion Rate (Icd rate) merupakan metode yang digunakan untuk membandingkan metode klaster yang terbaik dengan mengevaluasi
performansi algoritma dengan menggunakan prosentase rata-rata dari klasifikasi yang benar (recovery rate).
𝐼𝑐𝑑𝑟𝑎𝑡𝑒 = 1 −𝑆𝑆𝐵
𝑆𝑆𝑇= 1 −
𝑆𝑆𝑇_𝑆𝑆𝑊
𝑆𝑆𝑇
= 1 − 𝑅2
𝑅2 =𝑆𝑆𝑇 − 𝑆𝑆𝑊
𝑆𝑆𝑇
𝑆𝑆𝐵 = 𝑆𝑆𝑇 − 𝑆𝑆𝑊
𝑆𝑆𝑇:total jumlah dari kuadrat jarak terhadap rata-rata keseluruhan
𝑆𝑆𝑊:total jumlah dari kuadrat jarak objek terhadap rata-rata kelompoknya.
𝑅2 :Recovery Rate
25
• Metode untuk menggabungkan beberapa algoritma yang berbeda untuk medapatkan partisi umum dari hasil pengelompokan individu.
• Tujuannya adalah untuk menggabungkan hasil pengelompokan dari beberapa algoritma pengelompokan untuk mendapatkan hasil pengelompokan yang lebih baik.
Data
Awal
Data
Kontinu
Data
Kategori
Algoritma K-
Modes
Algoritma Fuzzy
C-Means
Algoritma K-
Modes
26
27
Data Karakteristik Kuantitatif dan Kualitatif
Data sekunder Hasil Pengamatan
Data Persilangan antara Jeruk Siam Pontianak dan Soe
Objek Penelitian: 34 Aksesi hasil
persilangan antara jeruk Siam Pontianak dan Soe
(P5) 28
Variabel Keterangan
X1 Diameter Buah (mm)
X2 Tebal Kulit (mm)
X3 Jumlah Juring (Buah)
X4 Jumlah Biji Normal (Buah)
X5 Jumlah Biji Abnormal
X6 Volume Jus
X7 Brix
X8 Berat Buah
29
Data Kuantitatif
30
Variabel Skala Keterangan Variabel Skala Keterangan 1 Spheroid 1 Hijau Muda 2 Ellipsoid 2 Hijau Tua
Bentuk 3 Pyriform Warna 3 Kuning
Kehijauan Buah (X1) 4 Oblique Kulit (X4) 4 Kuning
5 Obloid 5 Orange
Kekuningan 1 Necked 6 Orange 2 Convex 1 Halus
Bentuk 3 Truncate 2 Berpori Pangkal
(X2) 4 Concave Permukaan 3 Berambut
5 Concave Collared
Kulit (X5) 4 Kasar
1 Mammiform 5 Bergelombang Bentuk 2 Acute
Keeratan Epicarp (X6)
1 Lemah Ujung (X3) 3 Rounded 2 Sedang
4 Truncate 3 Kuat 5 Depressed 1 Sangat Buruk 1 Lembut 2 Buruk
Tekstur Pulp (X7)
2 Sedang Rasa (X8)
3 Sedang
3 Kasar 4 Enak 5 Sangat Enak
31
32
33
Deskripsi Data Memisahkan Data Menentukan derajat
keanggotaan
Menentukan jumlah Cluster optimum,
Kuantitatif : Pseudo F-Statistics,
Kualitatif: Proporsi
Mengelompokkan aksesi berdasarkan
Cluster optimum
Melakukan ensemble cluster dari kedua
algoritma
Melakukan Final Cluster dengan K-
Modes
Pengujian One-Way ANOVA dan One-
Way MANOVA
Membandingkan Hasil Ketiga Metode
34
35
Data
Pemisahan data Kuantitatif dan Kualitatif
Data Kuantitatif
Statistika Deskriptif menggunakan mean, stadev, minimum, maximum,
boxplot, chernoff face
Fuzzy C-Means
Pseudo F-Statistics
Pembentukan Cluster menggunakan cluster
optimum
Output 1
Data Kualitatif
Statistika Deskriptif menggunakan ukuran modus,
chernoff face
K-Modes
Ukuran Proporsi
Pembentukan Cluster menggunakan cluster optimum
Output 2 Final Cluster
K-Modes
Menentukan perbedaan karakteristik cluster dengan pengujian one-way MANOVA dan one-way ANOVA
Nilai Pseudo F-Statistics Tertinggi, akan dibentuk
3 kelompok untuk metode Fuzzy C-Means
Nilai akurasi ketiga kelompok sama 97%.
43
n
i
w
ik
n
i ij
w
ik
kj
u
xuv
1
1
)(
)(
1
1
1
2
c
j
m
ji
kiik
d
du
n
i
c
k
m
ik
m
j kjij
l uvxU1 1 1
2
Input Data yang akan di Cluster, berupa matriks berukuran n x m
Menentukan Jumlah Cluster (c), weighted exponent (w=2), maksimum iterasi (100), error terkecil (𝜀 = 10-6), fungsi objektif awal (P0=0), dan iterasi awal (t=1)
Membangkitkan bilangan random sebagai elemen matriks partisi awal U, berukuran n x c
Menghitung centroid dari masing – masing kelompok menggunakan persamaan
Menghitung derajat keanggotaan setiap data pada setiap cluster dengan jangkauan nilai 0-1
Memiliki nilai p-value < 0,05, sehingga menjadi karakter pembeda pada setiap cluster
51
0.27
0.93
0.56
0.97
0.97
0.97
FUZZY C-MEANS K-MODES ENSEMBLE
Nilai Akurasi ketiga Metode sama 97%
Nilai icdrate Fuzzy C-Means terkecil yaitu 0,27
Pengelompokan data persilangan
dengan 2 jenis data cukup
menggunakan metode Fuzzy C-
Means
52
53
1
• Metode Fuzzy C-Means dan K-Modes mampu untuk mengelompokkan data persilangan aksesi P5 dengan baik, itu terbukti dari nilai icdrate sebesar 0,27 dan akurasi sebesar 97%
2
• Metode Ensemble Cluster dapat mengelompokkan data gabungan dengan cukup baik sehingga mampu mengatasi masalah adanya variabel kuantitatif dan kualitatif.
3
• dengan metode fuzzy c-means cluster yang digunakan pada data kuantitatif cukup untuk mengelompokkan kedua tipe data karena Metode fuzzy c-means memiliki nilai icdrate yang terkecil yaitu 0,27
54
Untuk penelitian selanjutnya dengan menambah
metode pembanding untuk data kuantitatif dan
kualitatif sehingga dapat mengetahui sejauh mana
metode utama dapat bekerja dengan baik. Selain
itu, lebih teliti lagi untuk menyeleksi variabel
penelitian yang digunakan agar tidak ada salah 1
variabel yang mendominasi variabel lain.
Balitjestro, 2015. Profil Balitjestro. [Online] Available at:
http://balitjestro.litbang.pertanian.go.id/profil/balitjestro/ [Accessed 15 Desember 2015].
Bezdek, J.C., Ehrlich, R., Full, W. 1984. FCM: Fuzzy C-Means Clustering Algorithm. USA:
Computers & Geosciences Vol. 10, No. 2-3, pp. 191-203
Dewi, A., 2012. Metode Cluster Ensemble Untuk Pengelompokan Desa Perdesaan di Provinsi