Identifikasi Parameter yang Berpengaruh pada Kinerja Algoritma Clustering dengan Metode Evidence Accumulation JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNOLOGI INFORMASI INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA 2014 Dosen Pembimbing : Dr. Eng. Chastine Fatichah, S.Kom,. M.Kom. Victor Hariadi, S.Si., M.,Kom Penyusun Tugas Akhir : Ratih Kirana Diantari 5110100051 07/07/2014 1 Tugas Akhir – KI091391
22
Embed
Identifikasi Parameter yang Berpengaruh pada Kinerja ... · Identifikasi Parameter yang Berpengaruh pada Kinerja Algoritma Clustering dengan Metode Evidence Accumulation JURUSAN TEKNIK
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Identifikasi Parameter yang Berpengaruh pada Kinerja Algoritma Clustering dengan Metode Evidence
Accumulation
JURUSAN TEKNIK INFORMATIKAFAKULTAS TEKNOLOGI INFORMASI
Metode clustering memiliki beberapa pendekatan, salahsatunya adalah consensus clustering
Consensus Clustering : clustering yang melibatkan kombinasidari beberapa metode tanpa mempertimbangkan atribut datainput
Teknik Consensus Clustering menggunakan EvidenceAccumulation (EA)
RUMUSAN MASALAH
07/07/20144
1. Memahami konsep Consensus Clustering2. Merancang metode Consensus dan Evidence Accumulation3. Mengimplemantasi metode Consensus dan Evidence
Accumulation yang melibatkan beberapa parameter4. Melakukan ujicoba menggunakan metode Evidence
Accumulation pada Consensus Clustering yang melibatkanbeberapa parameter dengan beberapa dataset
Tugas Akhir – KI091391
BATASAN MASALAH1. Dataset yang digunakan terdiri dari 8, yaitu:
07/07/20145 Tugas Akhir – KI091391
No Dataset
Jumlah Data
JumlahAtribut
Jumlah Cluster
1 Halfring 400 2 2
2 Spiral 200 2 2
3 Iris 150 4 3
4 Wine 178 13 3
5 Glass 214 10 6
6 Vowel 990 10 11
7 Ecoli 336 8 8
8 Seeds 210 7 3
2. Implementasi dilakukan pada Matlab 2008a
HalfringSpiralIrisWineGlassVowelEcoliSeeds
TUJUAN1. Mengembangkan aplikasi clustering berbasis Consensus
Clustering dan Evidence Accumulation2. Mengidentifikasi kinerja Consensus Clustering dengan
metode Evidence Accumulation yang dipengaruhi beberapaparameter, yaitu k (jumlah cluster) dan t (threshold)
07/07/20146 Tugas Akhir – KI091391
07/07/2014
AGENDA
PERANCANGAN PERANGKAT
LUNAK
PENDAHULUAN
KESIMPULAN & SARAN
UJI COBA
7 Tugas Akhir – KI091391
PERANCANGAN PERANGKAT LUNAK
07/07/2014Tugas Akhir – KI0913918
PERANCANGAN PERANGKAT LUNAK
07/07/2014Tugas Akhir – KI0913919
METODE EVIDENCE ACCUMULATION
SPLIT Tahap ini melalukan proses perulanganclustering dengan metode K-means untukmendapatkan cluster yang bervariasi
COMBINE • Dari hasil cluster yang bervariasimenghasilkan pasangan data, yang disimpandi matrik co_occurence• Frekuensi pasangan data yang seringmuncul akan disimpan di matrikco_association
MERGE Matrik co_association merupakan matrikkesamaan data. Nilai dari matrik ini akandibandingkan dengan threshold.
12444,02444,0002444,01002444,01
8000,01119111,0
001117556,0008000,09111,07556,01
07/07/2014
AGENDA
UJI COBA
PERANCANGAN PERANGKAT
LUNAK
PENDAHULUAN
KEISMPULAN & SARAN
10 Tugas Akhir – KI091391
UJI COBA PARAMETER
07/07/2014Tugas Akhir – KI09139111
Data t k Cluster yang dihasilkan
Halfring 0,2 15 2
Spiral 0,7 20 2
Iris 0,7 3 4
Wine 0,2 3 3
Glass 0,4 10 6
Vowel 0,6 31 15
Ecoli 0,7 10 9
Seeds 0,6 3 3
Halfring
Optimal
Spiral
Optimal
Iris
OptimalOptimal
WineGlass
Optimal
Vowel
Optimal
Ecoli
Optimal
Seeds
Optimal
07/07/2014
AGENDA
KESIMPULAN & SARAN
UJI COBA
PERANCANGAN PERANGKAT
LUNAK
PENDAHULUAN
12 Tugas Akhir – KI091391
KESIMPULAN & SARAN Kesimpulan1. Metode Evidence Accumulation dan Consensus Clustering dapat
menyelesaikan permasalahan clustering, tergantung pada parameteryang diujikan
2. Nilai optimal setiap dataset,yaitu Halfring terletak pada t = 0,1 & k =10; t = 0,1 – 0,3 & k = 15; t = 0,1 – 0,2 & k = 20, Spiral terletakpada t = 0,7 & k = 20; t = 0,6 & k = 25; t = 0,5 – 0,6 & k = 30, Iristerletak pada t = 0,7 – 0,8 & k = 3, Wine terletak pada t = 0,2 – 0,8& k = 3, Glass terletak pada t = 0,4 & k = 10, Vowel terletak pada t =0,6 & k = 31, Ecoli terletak pada t = 0,7 & k = 10 dan Seeds terletakpada t = 0,6 & k = 3.
SaranPada metode Evidence Accumulation proses penyimpanan nilaico_association dapat direduksi