Page 1
160. IT Journal, Vol. 6 No. 2 Oktober 2018 2252-746X
IMPLEMENTASI ALGORITMA K-MEANS DAN FP-
GROWTH UNTUK REKOMENDASI BIMBINGAN
BELAJAR BERDASARKAN SEGMENTASI AKADEMIK
SISWA
IMPLEMENTATION OF K-MEANS AND FP-GROWTH ALGORITHM FOR LEARNING
MENTOR RECOMMENDATIONS BASED ON STUDENT ACADEMIC
SEGMENTATION
Evi Dewi Sri Mulyani1, Susanto
2, Yoga Handoko Agustin
3, Nensi Mardhiani Surgawi
4
1STMIK TASIKMALAYA, JL. R.E.Martadinata, (0265) 310830
2Jurusan Teknik Informatika STMIK Tasikmalaya, Kota Tasikmalaya
e-mail: [email protected] ,
[email protected] ,
[email protected]
Abstract The enrichment matter is prayer learners preparations for the review facing the national
exam. In High School 4 Tasikmalaya state no special grouping for a review of un enrichment. No
special their grouping, resulting in less targeted hearts set eyes schedule lesson what are truly needed
by the students. for the required it solution to address these difficulties. by grouping method using the
k-means algorithm and fp-growth hearts implemented the initial application. Period 2 according to
the number clusters ada un lessons eye, while the data is 190 term data value of students had and
maximum term is 3 itemsets. Singer applications besides showing the grouping of students national
exam study eye on, can also featuring the eye pattern national exam needed lesson from each group.
Keywords— National Exams, K-Means, and FP-Growth.
Abstrak
Pengayaan materi merupakan salah satu persiapan peserta didik untuk menghadapi Ujian
Nasional (UN). Di SMA NEGERI 4 TASIKMALAYA tidak ada pengelompokan khusus untuk
pengayaan UN. Tidak adanya pengelompokan khusus, mengakibatkan kurang tepat sasaran dalam
mengatur jadwal mata pelajaran apa saja yang benar-benar dibutuhkan oleh siswa tersebut. Untuk
itu diperlukan solusi yang dapat mengatasi kesulitan tersebut. Metode clustering untuk
pengelompokan siswa dengan menggunakan Algoritma K-Means dan untuk pola mata pelajaran tiap
kelompok siswa menggunakan Algoritma FP-Growth. Jumlah cluster ada k=2 dan maksimal itemset
adalah 3 itemset, jumlah dataset yang digunakan adalah 190 dataset. Aplikasi ini selain menampilkan
pengelompokkan siswa pada mata pelajaran UN, juga dapat menampilkan pola mata pelajaran UN
yang dibutuhkan dari tiap kelompoknya.
Kata kunci— Ujian Nasional, K-Means, dan FP-Growth.
1. PENDAHULUAN
Ujian Nasional atau sering disebut UN merupakan bentuk evaluasi terhadap hasil belajar
siswa yang dilakukan pada akhir jenjang pendidikan dasar dan menengah. Berbagai upaya dilakukan
oleh hampir setiap sekolah untuk menghadapi ujian nasional baik secara materi, mental maupun
spiritual. Persiapan materi dilakuakan oleh sekolah dengan cara mempersiapkan perencanaan yang
matang bagi siswa dalam pengayaan materi bahan ajar sesuai, salasatu faktor yang harus diperhatikan
dalam pengayaan adalah siswa[1]. Setiap siswa memiliki kebutuhan yang berbeda. Hal ini sangat
perlu diperhatikan oleh guru dalam memilih dan menentukan mata pelajaran pengayaan yang benar-
benar dibutuhan. Kesesuaian mata pelajaran pengayaan dengan kebutuhan siswa akan memacu siswa
untuk lebih berhasil dalam belajarnya. Jika kegiatan yang dipilih tidak sesuai dengan kebutuhan siswa
Page 2
Evi, Implementasi Algoritma K-Means dan...161
mengakibatkan kurang memahami dalam mempelajari mata pelajaran tertentu. Pengambilan
keputusan berusaha untuk memanfaatkan gudang data yang sudah dimiliki untuk menggali informasi
yang berguna membantu mengambil kesimpulan[2].
Salah satu sekolah yang melakukan kegiatan pengayaan adalah SMA Negri 4 Tasikmalaya
yang bertempat di Jl. Letkol RE. Djaelani – Cilembang. Kegiatan pengayaan ini wajib dilakukan oleh
seluruh siswa berdasarkan kelas. Tidak adanya pengelompokan khusus, mengakibatkan kurang tepat
sasaran dalam mengatur jadwal mata pelajaran apa saja yang benar-benar dibutuhkan oleh siswa
tersebut. Kebutuhan untuk memberikan tambahan materi belajar atau yang biasa disebut pengayaan
materi sangat diperlukan, didalam penelitian ini diambil sample siswa kelas XII-MIPA, pihak sekolah
harus melakukan penggalian data (data mining). Salah satu informasi yang harus digali berdasarkan
database nilai adalah penguasaan siswa terhadap materi yang akan diujikan dalam ujian nasional
(UN). UN akan mengujikan materi Matematika, Bahasa Indonesia, Bahasa Inggris, Fisika, Kimia dan
Biologi. Penelitian ini bertujuan untuk mengelompokan siswa berdasarkan nilai rata-rata dari
Semester 1 - 5 dengan 2 kelompok siswa menggunakan Algoritma K-Means.
Setelah dikelompokan langkah selanjutnya menentukan pola dari mata pelajaran apa saja
yang perlu di berikan jam lebih dari mata pelajaran yang lainnya, sehingga kelompok siswa tersebut
mengetahui mata pelajaran apa saja yang dibutuhkan sehingga lebih tepat sasaran. Pola tersebut
diambil dari nilai mata pelajaran yang memeiliki nilai <= 80 dari masing-masing siswa
perkelompoknya, nilai support dan confidence yang paling tinggi itu akan dijadikan mata pelajaran
yang diberikan jam lebih dari mata pelajaran yang lainnya dengan menggunakan Algoritma FP-
Grwoth.
Pada penelitian ini juga menggunaka metedology CRISP–DM dan bantuan Tool Rapid Miner
5. Hasil dari analisis ini diharapkan dapat dimanfaatkan oleh sekolah, untuk mengatur jadwal mata
pelajaran pengayaan sesuai dengan kebutuhan kelompok siswa tersebut. Sebagai bahan pertimbangan
dalam penelitian ini akan dicantumkan beberapa penelitian terdahulu yang telah dilakukan oleh
peneliti lain.
Penelitian penelitian sebelumnya pada Tahun 2015, Penelitian ini menghasilkan metode
clustering dengan menggunakan Algoritma K-Means yang implementasikan dalam aplikasi. Jumlah
cluster ada empat sesuai jumlah mata pelajaran UN, sedangkan jumlah sampel data adalah 12 siswa
yang memiliki nilai terendah. Aplikasi ini selain menampilkan pengelompokkan kemampuan siswa
pada mata pelajaran Ujian Nasional, juga dapat digunakan untuk memantau perkembangan
kemampuan setelah mengikuti pengayaan materi.[1]
Penelitian selanjutnya pada Tahun 2014, Penelitian ini mengunakan metode K-Means, jarak antara
cluster yang pertama dan kedua terlalu jauh sedangkan jarak antara cluster yang kedua dan ketiga
relatif terlalu dekat. Dari nilai cluster yang didapatkan, bisa disimpulkan bahwa nilai UN tidak
menjamin seseorang akan mempunyai nilai IPK yang relatif tinggi.[3]
Penelitian yang terakhir dilakukan Tahun 2015, Data yang digunakan sebagai sumber merupakan data
yang diambil di STMIK TRIGUNA DHARMA 1 tahun terakhir, yaitu Pendidikan Terakhir, Alamat
Rumah, Jurusan, Pilihan Prodi. Hasil penelitian ini adalah berupa suatu perangkat lunak dengan
mengimplementasikan Algoritma FP-Growth yang menggunakan konsep pembangunan FP-Tree
dalam mencari Frequent Itemset.[4]
Page 3
162. IT Journal, Vol. 6 No. 2 Oktober 2018 2252-746X
2. METODELOGI PENELITIAN
2.1. Metode Pengembangan Sistem
Metode perancangan yang digunakan dalam karya ilmiah ini menggunakan model air terjun
(waterfall). ―Model Waterfall yaitu proses pengurutan desain, yang digunakan dalam proses
pengembangan perangkat lunak, dimana prosesnya mengalir kebawah (seperti air terjun) melalui
tahap requirements analysis, system design, implementations, testing, dan maintenance. Metode ini
lebih terfokus kepada masing-masing fase agar hasilnya tetap maksimal, karena tidak ada pengerjaan
yang bersifat paralel.[5]
Adapun tahapan-tahapan dari model ini ialah :
1. Analisis Kebutuhan system (Requirements Analysis), yaitu proses pengumpulan kebutuhan yang
dilakukan secara intensif untuk menspesifikasikan kebutuhan perangkat lunak agar dapat dipahami
perangkat lunak seperti apa yang dibutuhkan oleh user.
2. Desain (Design), yaitu proses multi langkah yang fokus pada desain pembuatan program perangkat
lunak termasuk struktur data, arsitektur perangkat lunak, refresentasi antarmuka, dan prosedur
pengodean.
3. Implementasi (Coding), yaitu desain harus di translasikan kedalam program perangkat lunak. Hasil
dari tahap ini adalah program komputer sesuai dengan desain yang telah dibuat pada tahap desain.
4. Pengujian (Verifcation), yaitu kegiatan yang berfokus pada perangkat lunak secara segi logic dan
fungsional dan memastikan bahwa semua bagian sudah diuji.
5. Pemeliharaan (Maintenance), pada tahap ini tidak menutup kemungkinan sebuah perangkat lunak
mengalami perubahan ketika sudah dikirimkan ke user, perubahan bisa terjadi karena adanya
kesalahan yang muncul dan tidak terdetek di lingkungan baru.
Gambar 1. Siklus Waterfall [5]
2.2. Metode Pengumpulan Data
Metode pengumpulan data merupakan langkah yang paling strategis dalam penelitian, karena
tujuan utama dari metode ini yaitu mendapatkan data yang memenuhi standar data yang ditetapkan.
Adapun teknik pengumpulan data yang digunakan dalam penelitian ini yaitu :
1. Observasi
―Observasi merupakan suatu kegiatan mendapatkan informasi yang diperlukan untuk menyajikan
gambaran suatu peristiwa atau kejadian untuk menjawab pertanyaan penelitian, untuk membantu
mengerti perilaku manusia dan untuk evaluasi yaitu melakukan pengukuran terhadap aspek tertentu
melakukan umpan balik terhadap pengukuran tersebut.‖[7]
Dengan metode observasi ini penyusun langsung terjun ke lapangan yaitu ke SMA Negeri 4
Tasikmalaya. Untuk mengamati dan mempelajai kelemahan dan kekurangan sistem yang ada untuk
dijadikan landasan dalam membuat Rekomendasi Pengayaan Mata Pelajaran UN Berdasarkan
Segmentasi Siswa untuk membantu dalam menentukan mata pelajaran apa saja yang dibutuhkan tiap
kelompok siswa.
2. Wawancara
―Wawancara adalah percakapan dengan maksud tertentu. Atau merupakan proses memperoleh
penjelasan untuk mengumpulkan informasi dengan menggunakan cara tanya jawab baik secara
langsung maupun tidak langsung antara pewawancara dengan orang yang di wawancarai.‖ Kegiatan
Page 4
Evi, Implementasi Algoritma K-Means dan...163
wawancara ini dilakukan untuk mendapatkan kebenaran data dari pihak yang dituju sesuai dengan
yang diajukan oleh peneliti. Peneliti melakukan wawancara dengan salah satu narasumber dari SMA
Negeri 4 Tasikmalaya yaitu kepada wakasek kurikulum dimana wakasek kurikulum tersebut yang
lebih mengetahui secara pasti sistem penjawalan un di sekolah tersebut.
3. Studi Literatur
Yaitu pengumpulan data dengan mempelajari literatur-literatur yang terkait, referensi dari buku,
modul artikel ataupun dari internet yang berkaitan dengan penelitian ini.
2.3. Metode Perancangan
Dalam penelitian ini metode perancangan yang digunakan adalah merode perancangan system
melalui tahap-tahap sebagai berikut :
1. Flowmap
2. Diagram Konteks
3. Data Flow Diagram
4. Entitas Relationship Diagram (ERD)
5. Relasi Antar Tabel
2.4. Algoritma K-Means
K-means merupakan metode pengklasteran secara partitioningyang memisahkan data ke
dalam kelompok yang berbeda. Dengan partitioning secara iteratif, K-Means mampu meminimalkan
rata-rata jarak setiap data ke klasternya.[8]
Langkah-langkah pada Algoritma K-Means adalah :
1. Tentukan k sebagai jumlah cluster yang ingin dibentuk. Tetapkan pusat cluster.
2. Hitung jarak setiap data ke pusat cluster menggunakan persamaan Euclidean.
dik √∑ ( )
3. Kelompokkan data ke dalam cluster yang dengan jarak yang paling pendek menggunakan
persamaan.
∑
√∑( )
4. Hitung pusat cluster yang baru menggunakan persamaan
∑
Dimana :
Xij kluster ke – k
P = banyaknya anggota clusterke k
5. Ulangi langkah 2 sampai dengan 4 hingga sudah tidak ada lagi data yang berpindah ke kluster
yang lain.
2.5. Algoritma FP-Growth
Algoritma ini menggunakan pendekatan yang berbeda dari paradigma yang selama ini
sering digunakan yaitu algoritma apriori. Frequent Pattern Growth (FP-Growth) adalah salah satu
alternatif algoritma yang dapat digunakan untuk menentukan himpunan data yang paling sering
muncul (frequent itemset) dalam sebuah kumpulan data. Dalam Algoritma Frequent Pattern Growth
(FP-Growth) menyimpan informasi mengenai frequent itemset dalam bentuk struktur prefix-tree
atau sering di sebut FP-Tree. Tidak melakukan candidate generation dalam proses pencarian
frequent itemset, sehingga dapat mengurangi scan database secara berulang dalam proses mining dan
dapat berlangsung lebih cepat.[9]
Page 5
164. IT Journal, Vol. 6 No. 2 Oktober 2018 2252-746X
3. HASIL DAN PEMBAHASAN
3.1. Analisis Kebutuhan Sistem
3.1.1. Analisis Masalah
Tahap analisa bertujuan untuk memahami masalah rekomendasi pengayaan mata pelajaran
UN berdasarkan segmentasi siswa yang ada dan menjadi dasar perancangan serta sebagai acuan dalam
untuk menciptakan sistem yang baru agar bisa mempermudah dan memperbaiki kelemahan dari
sistem yang lama, sehingga sistem yang baru bisa lebih baik dari sistem yang lama. Setelah
melakukan penelitian, penyusun mendapatkan masalah yang dihadapi di SMA Negeri 4 Tasikmalaya,
maka penyusun dapat menganalisis masalah, yaitu :
1. Belum adanya pengelompokan siswa berdasarkan nilai rata-rata rapot dari semester 1-5 untuk
bahan pertimbangan pemilihan mata pelajaran pada pengayaan.
2. Belum adanya analisis kebutuhan mata pelajaran siswa untuk pengayaan un.
3.1.2. Analisis Kebutuhan
Tahap ini bertujuan untuk menganalisis kebutuhan dari system yang akan dibuat. Adapun
kebutuhan-kebutuhan tersebut yaitu :
1. Sistem yang menggunakan aplikasi web membantu pengelola dalam proses menentukan
pengelompokan siswa, pemilihan mata pelajaran pengayaan un berdasarkan pengelompokan
siswa dan proses pembuatan laporan.
2. Sistem dapat menampilkan menu-menu pilihan yang dibutuhkan pengelola dalam
melakukan kegiatannya.
3.2. Analisis CRISP-DM (Cross Industry Standart Process for Data Mining)
Berikut ini penjelasan apa saja yang dilakukan tiap fase dalam model ini :
Gambar 2. Crisp-DM[9]
1. Fase Pemahaman Bisnis (Business Understanding Phase)
Pemahaman bisnis mengacu pada proses penentuan rekomendasi pengayaan mata
pelajaran UN berdasarkan segmentasi siswa di SMA Negeri 4 Tasikmalaya. Dimana tidak
adanya pengelompokan khusus, mengakibatkan kurang tepat sasaran dalam mengatur jadwal
mata pelajaran pengayaan apa saja yang benar-benar dibutuhkan oleh siswa tersebut. Oleh
karena itu diperlukan segmentasi siswa dan penentuan ploa mata pelajaran pengayaan
berdasarkan data histori nilai siswa semester 1-5 untuk kelas XII-MIPA untuk membantu
pihak wakil kepala sekolah bagian kurikulum dalam menentukan jadwal mata pelajaran
pengayaan apa saja yang benar-benar dibutuhkan oleh kelompok siswa tersebut. Algoritma
yang digunakan yaitu Algoritma K-Means dan FP-Grwoth yang bertujuan untuk segmentasi
dan analisis pola data nilai siswa dengan akurat.
2. Fase Pemahaman Data (Data Understanding Phase)
Dalam fase ini dilakukan pengumpulan data, mengenali lebih lanjut data yang akan
digunakan dan mengevaluasi kualitas data. Pemahaman data mengacu pada data nilai siswa
kelas XII-MIPA tahun 2017 sebanyak 963 record dari semester 1-5.
3. Fase Pengolahan Data (Data Preparation Phase)
Page 6
Evi, Implementasi Algoritma K-Means dan...165
Pada tahap ini struktur basis data akan dipersiapkan sehingga mempermudah proses mining.
Proses preparation ini mencakup tiga hal utama yaitu:
a. Data Selection: Memilih data yang akan digunakan dalam proses data mining. Dalam
penelitian ini terdapat 963 data, dan didalam proses ini dilakukan juga pemilihan atribut-
atribut yang disesuaikan dengan proses data mining yaitu nik siswa, nilai bahasa
indonesia, nilai matematika, nilai bahasa inggris, nilai fisika, nilai bologi dan nilai kimia.
b. Data Preprocessing: Pada tahap ini pembuatan data set berdasarkan data yang telah ada
dari SMA Negeri 4 Tasikmalaya dengan menentukan field-field apa saja yang akan
digunakan. Kemudian data tersebut masuk dalam tahapan processing, yaitu:
a. Data cleaning, dalam data siswa tersebut terdapat jumlah data siswa yang terus
berkurang tiap semesternya, dikarenakan siswa tersebut pindah sekolah. Maka dari itu
dilakukannya pembersihan data siswa agar tidak termasuk lagi kedalam data set nilai
siswa tersebut.
b. Data Integration, Dalam hal ini ada 5 arsip yang diambil yaitu dari data nilai mata
pelajaran UN di Semester 1-5
c. Data reduction, jumlah atribut dalam data set terlalu besar maka untuk mengurangi
jumlah atribut yang tidak digunakan akan dihapus. Sehingga atribut yang akan
digunakan sebanyak 7 atribut. Dimana 6 atribut sebagai atribut nilai, 1 atribut sebagai
id.
c. Data Transformation: Dalam proses ini, data ditransformasikan ke dalam bentuk yang
sesuai untuk proses data mining yaitu segementasi dan analisis pola terhadap data nilai
siswa, kemudian dari 963 data nilai tersebut diambil nilai rata-rata, kemudia jumlah data
set menjadi 190.
4. Fase Pemodelan Data (Modeling Phase)
Pada tahap pertama algoritma yang digunakan yaitu algoritma K-Means. Dalam
algoritma K-Means dilakukan pengelompokan dengan k=2. Setelah itu dilakukan berulang
hingga semua atribut perkelompoknya di rapidminer. Hasil perhitungan manual harus sesuai
dengan hasil yang ada pada rapidminer. Kemudian tahap algoritma yang digunakan yaitu
algoritma FP-Grwoth. Dengan hasil segemntasi sekarang dilakukan analisis pola dari tiap
kelompoknya dengan item set maksimal 3, yang akan dihasilkan mata pelajaran pengayaan
yang benar-benar dibutuhkan oleh setiap kelompok siswa sehingga bisa mengatur jadwal
pengayaan sesuai hasil dari pola tersebut.
5. Fase Evaluasi (Evaluation Phase)
Pada fase evaluasi ini algoritma yang digunakan akan diterapkan pada pemberian
jadwal mata pelajaran UN sesuai dengan kelompok siswa XII-MIPA di SMA Negeri 4
Tasikmalaya. Pengamatan hasil pola mata pelajaran pengayaan UN dari tiap segmentasi siswa
ini akan dilakukan dengan proses evaluasi. Validasi pola yang dihasilkan yaitu dengan cara
bertanya ke guru yang bersangkutan tentang kelompok yang membutuhkan mata pelajaran
UN dan mencocokannya dengan data nilai siswa tersebut untuk mengukur kebenaran pola
yang dihasilkan. Jika benar maka lanjut kepada tahap Deployment Phase dan jika salah maka
kembali ke tahap Business Understanding Phase.
6. Fase Penyebaran (Deployment Phase)
Fase Penyebaran adalah fase dimana menggunakan model yang dihasilkan seperti
laporan atau penerapan proses data mining secara parallel pada departemen lain. Pola yang
dihasilkan pada proses data mining dipresentasikan dalam bentuk dekripsi yang mudah
dipahami.
3.3. Desain
3.2.1. Gambaran Flowmap Umum Sistem Yang Diajukan.
Desain sistem dapat didefinisikan sebagai penggambaran dan pembuatan sketsa atau
pengaturan dari beberapa elemen yang terpisah ke dalam satu kesatuan yang utuh dan berfungsi.[5].
Selanjutnya, sesuai dengan gambaran dari analisis system yang sedang berjalan, dapat
dibuatkan flowmap sebagai acuan pembangunan program. Hasil dari analisis sistem tersebut akan
dimplementasikan pada flowmap yang diajukan berikut ini :
Page 7
166. IT Journal, Vol. 6 No. 2 Oktober 2018 2252-746X
Gambar 3. Flowmap Sistem yang diajukan
3.2.2. Gambaran Diagram Konteks
Diagram konteks sistem dibuat untuk menentukan lingkup awal. Diagram Aliran Data
kejadian-kejadian konteks ini hanya menunjukan antarmuka utama sistem dengan lingkungannya.
Gambar 4. Diagram Context yang diajukan
Page 8
Evi, Implementasi Algoritma K-Means dan...167
3.2.3. Gambaran Data Flow Diagram(DFD)
Gambar 5. DFD Level 0
Gambar 6. DFD Level 1
Page 9
168. IT Journal, Vol. 6 No. 2 Oktober 2018 2252-746X
Gambar 7. DFD Level 2
Gambar 8. DFD Level 3
Gambar 9. DFD Level 4
Page 10
Evi, Implementasi Algoritma K-Means dan...169
3.2.4. Gambaran Entity Relationship Diagram (ERD)
Entity Relationship Diagram (ERD) merupakan diagram yang dipergunakan untuk
menggambarkan hubungan antara entity dalam suatu system, adapun gambarannya akan ditunjukan
pada gambar berikut :
Gambar 10. Entity Relathionship Diagram (ERD)
3.2.5. Relasi Antar Tabel
Relasi antar tabel digunakan untuk menggambarkan hubungan antar entitas dalam system
tabel, dalam program penggajian ini ada empat tabel yang digunakan yaitu :
Gambar 11. Relasi Antar Table
3.4. Analisis Algoritma K-Means
Percobaan dilakukan dengan menggunakan parameter-parameter berikut :
Jumlah Cluster : 2
Jumlah Data : 190
Jumlah Atribut : 6 (Bahasa Indonesia, MTK, Bahasa Inggris, Fisika, Kimia, Biologi)
Page 11
170. IT Journal, Vol. 6 No. 2 Oktober 2018 2252-746X
Tabel 1 Data Nilai Rata-Rata Siswa Mipa
NO-INDK BINDO MTK INGGRIS BIOLOGI FISIKA KIMIA
141510001 84,7 85,9 80,8 83,6 82,14 79,4
141510002 84,3 86,8 81,6 82,5 81,9 81,1
….. ……. …… …….. …… ….. …..
141510196 84 83 81 83,6 81,96 77,8
3.3.1. Perhitungan Algoritma K-Means
1. Penentuan pusat awal cluster.
Untuk penentuan awal diasumsikan dengan menggunakan nilai terendah pada masing-masing
mata pelajaran terdapat di Tabel 2.
Tabel 2. Pusat Awal Cluster
C1 141510128 89,3 96,2 83,9 84,8 85,77 87
C2 141510150 77 76,7 75,7 79,4 76,2 75,3
2. Perhitungan jarak pusat cluster.
Untuk mengukur jarak antara data dengan pusat cluster digunakan Euclidian distance,
kemudian akan didapatkan matriks jarak sebagai berikut :
Sebagai contoh, perhitungan jarak dari data ke-1 terhadap pusat cluster adalah :
C1=√( ) ( ) ( )
( ) ( ) ( )
C2=√( ) ( ) ( )
( ) ( ) ( )
Dan seterusnya dilanjutkan untuk data ke 2, … N. Kemudian akan didapatkan matriks jarak
sebagai berikut :
D1 = Tabel 3.
Tabel 3. Data Hasil Perhitungan D1
NO-INDK C1 C2
141510001 14,465 15,481
141510002 13,18 16,305
……… …….. ………
141510196 17,66 13,159
3. Pengelompokkan data
G1 = Tabel 4.
Tabel 4. Pengelompokan Data G1
NO-INDK C1 C2
141510001 1 0
141510002 1 0
…….. …….. …….
141510196 0 1
Lakukan langkah yang sama sampai akhir iterasi, sehingga mendapakan hasil pengelompokan C1 dan
C2 :
- C1 data 1,2,3,4,5,6,7,8,9,10,…, dan 179 Jumlahnya 140
- C2 data 30,35,38,39,41,42,…., dan 190 Jumlahnya 86
3.5. Analisis FP-Growth
Page 12
Evi, Implementasi Algoritma K-Means dan...171
Dengan melakukan proses Analisis FP-Growth dihasilkan masing-masing mata pelajaran
pengayaan UN yang dibutuhkan tiap kelompok, yaitu :
- Kelompok 1 :
Assosiattion Rule yang memenuhi syarat nilai minimum support ≥ 0,13 dan nilai confidence ≥ 0,20
adalah: Inggris → Kimia (jika kelompok 1 memprioritaskan mata pelajaran Bahasa Inggris, maka
Kimia juga harus ikut di prioritaskan.)
- Kelompok 2 :
Assosiattion Rule yang memenuhi syarat nilai minimum support ≥ 0,26 dan nilai confidence ≥ 0,20
adalah: Kimia → Inggris dan Biologi (jika kelompok 2 memprioritaskan mata pelajaran Kimia, maka
Bahasa Inggris dan Biologi juga harus ikut di prioritaskan.)
3.6. Implementasi
Pada bagian ini menjelaskan mengenai pembuatan aplikasi berdasarkan rancangan sistem
yang telah di buat. Antar muka (interface) program terdiri dari masukan (input), yaitu format untuk
menentukan pilihan pada saat pengguna melakukan masukan terhadap sistem untuk diproses
pengolahan data dan manipulasinya. Berikut ini adalah beberapa tampilan dari Program Rekomendasi
Pengayaan Mata Pelajaran UN Berdasarkan Segmentasi Siswa di SMA Negeri 4 Tasikmalaya yang
telah dibangun.
Gambar 12. Tampilan Data Siswa
Gambar 13. Tampilan Data Nilai Siswa
Page 13
172. IT Journal, Vol. 6 No. 2 Oktober 2018 2252-746X
Gambar 14. Data Hasil Segmentasi Siswa
Gambar 15. Data Hasil Asosiasi Persegmentasi Siswa
Gambar 16. Tampilan Laporan Segmentasi Siswa
Page 14
Evi, Implementasi Algoritma K-Means dan...173
4. KESIMPULAN
Berdasarkan tahap penelitian yang telah dilakukan, maka dapat disimpulkan yaitu sebagai
berikut :
1. Dihasilkan 2 Kelompok siswa berdasarkan nilai rata-rata rapot dari semester 1-5 untuk bahan
pertimbangan pemilihan mata pelajaran pada pengayaan.
2. Seletah menganalisis kebutuhan mata pelajaran siswa dalam pengayaan un. Dihasilkan bahwa
Kelompok 1 pola yang dihasilkan adalah Inggris -> Kimia dan Kelompok 2 pola yang dihasilkan
adalah Kimia -> Inggris dan Biologi.
5. SARAN
Melihat dari kesimpulan yang diuraikan diatas, maka ada beberapa hal yang harus ditinjau,
diantaranya :
1. Untuk jumlah k bisa ditambah agar pengelompokan bisa lebih akurat sesuai.
2. Untuk penelitian selanjutnya bisa memilihan algoritma klustering dan saosiasi yang lebih baik
agar cluster dan pola yang dihasilkan lebih akurat lagi.
3. Untuk progam bisa dikembangan menjadi dinamis sehingga jumlah k bisa otomatis ditambah lagi
sesuai kebutuhan.
DATAR PUSTAKA
[1] F. E. M. Agustin, A. Fitria, and A. H. S, ―( Studi Kasus : Smp Negeri 101 Jakarta ) Program
Studi Teknik Informatika , Fakultas Sains dan Teknologi Universitas Islam Negeri Syarif
Hidayatullah,‖ Implementasi Algoritm. K-Means Untuk Menentukan Kelompok
Pengayaan Mater. Mata Pelajaran Ujian Nas. (Studi Kasus Smp Negeri 101 Jakarta), vol.
8, pp. 73–78, 2013.
[2] Susanto, Susanto; Mulyani, Evi Dewi Sri; Nurhasanah, Irma Ratnasari. Penerapan Data Mining
Classification Untuk Prediksi Perilaku Pola Pembelian Terhadap Waktu Transaksi
Menggunakan Metode Naïve Bayes. Proceedings Konferensi Nasional Sistem dan
Informatika (KNS&I), 2015
[3] Hartatik, ―Pengelompokan mahasiswa berdasarkan nilai ujian nasional dan ipk menggunakan
metode k-means,‖ Semin. Nas. Inform. 2014, pp. 35–40, 2014.
[4] D. Samuel, ―Penerapan Stuktur FP-Tree dan Algoritma FP-Growth dalam Optimasi Penentuan
Frequent Itemset,‖ Inst. Teknol. Bandung, vol. 1, 2008.
[5] A. Kristanto, ―Rekayasa Perangkat Lunak (Konsep Dasar),‖ Gava Media, Yogyakarta, 2004.
[6] R. S. Pressman, ―Rekayasa Perangkat Lunak: Pendekatan Praktisi.‖ Andi, 2012.
[7] V. W. Sujarweni, ―Metodologi Penelitian.‖ Pustaka Baru Press, Yogyakarta, 2014.
[8] J. MacQueen and others, ―Some methods for classification and analysis of multivariate
observations,‖ in Proceedings of the fifth Berkeley symposium on mathematical statistics
and probability, 1967, vol. 1, no. 14, pp. 281–297.
[9] R. N. Arifin, ―Implementasi Algoritma Frequent Pattern Growth ( Fp-Growth ) Menentkan
Asosiasi Antar Produk ( Study Kasus Nadiamart ),‖ Progr. Tek. Inform. Univ. Dian
Nuswantoro.
[10] C. Shearer, ―The CRISP-DM model: the new blueprint for data mining,‖ J. data Warehous.,
vol. 5, no. 4, pp. 13–22, 2000.