IMPLEMENTASI ALGORITMA K-MEANS DAN FP- GROWTH …

160. IT Journal, Vol. 6 No. 2 Oktober 2018 2252-746X

IMPLEMENTASI ALGORITMA K-MEANS DAN FP-

GROWTH UNTUK REKOMENDASI BIMBINGAN

BELAJAR BERDASARKAN SEGMENTASI AKADEMIK

SISWA

IMPLEMENTATION OF K-MEANS AND FP-GROWTH ALGORITHM FOR LEARNING

MENTOR RECOMMENDATIONS BASED ON STUDENT ACADEMIC

SEGMENTATION

Evi Dewi Sri Mulyani1, Susanto

2, Yoga Handoko Agustin

3, Nensi Mardhiani Surgawi

4

1STMIK TASIKMALAYA, JL. R.E.Martadinata, (0265) 310830

2Jurusan Teknik Informatika STMIK Tasikmalaya, Kota Tasikmalaya

e-mail: [email protected] ,

[email protected] ,

[email protected]

Abstract The enrichment matter is prayer learners preparations for the review facing the national

exam. In High School 4 Tasikmalaya state no special grouping for a review of un enrichment. No

special their grouping, resulting in less targeted hearts set eyes schedule lesson what are truly needed

by the students. for the required it solution to address these difficulties. by grouping method using the

k-means algorithm and fp-growth hearts implemented the initial application. Period 2 according to

the number clusters ada un lessons eye, while the data is 190 term data value of students had and

maximum term is 3 itemsets. Singer applications besides showing the grouping of students national

exam study eye on, can also featuring the eye pattern national exam needed lesson from each group.

Keywords— National Exams, K-Means, and FP-Growth.

Abstrak

Pengayaan materi merupakan salah satu persiapan peserta didik untuk menghadapi Ujian

Nasional (UN). Di SMA NEGERI 4 TASIKMALAYA tidak ada pengelompokan khusus untuk

pengayaan UN. Tidak adanya pengelompokan khusus, mengakibatkan kurang tepat sasaran dalam

mengatur jadwal mata pelajaran apa saja yang benar-benar dibutuhkan oleh siswa tersebut. Untuk

itu diperlukan solusi yang dapat mengatasi kesulitan tersebut. Metode clustering untuk

pengelompokan siswa dengan menggunakan Algoritma K-Means dan untuk pola mata pelajaran tiap

kelompok siswa menggunakan Algoritma FP-Growth. Jumlah cluster ada k=2 dan maksimal itemset

adalah 3 itemset, jumlah dataset yang digunakan adalah 190 dataset. Aplikasi ini selain menampilkan

pengelompokkan siswa pada mata pelajaran UN, juga dapat menampilkan pola mata pelajaran UN

yang dibutuhkan dari tiap kelompoknya.

Kata kunci— Ujian Nasional, K-Means, dan FP-Growth.

1. PENDAHULUAN

Ujian Nasional atau sering disebut UN merupakan bentuk evaluasi terhadap hasil belajar

siswa yang dilakukan pada akhir jenjang pendidikan dasar dan menengah. Berbagai upaya dilakukan

oleh hampir setiap sekolah untuk menghadapi ujian nasional baik secara materi, mental maupun

spiritual. Persiapan materi dilakuakan oleh sekolah dengan cara mempersiapkan perencanaan yang

matang bagi siswa dalam pengayaan materi bahan ajar sesuai, salasatu faktor yang harus diperhatikan

dalam pengayaan adalah siswa[1]. Setiap siswa memiliki kebutuhan yang berbeda. Hal ini sangat

perlu diperhatikan oleh guru dalam memilih dan menentukan mata pelajaran pengayaan yang benar-

benar dibutuhan. Kesesuaian mata pelajaran pengayaan dengan kebutuhan siswa akan memacu siswa

untuk lebih berhasil dalam belajarnya. Jika kegiatan yang dipilih tidak sesuai dengan kebutuhan siswa

mailto:[email protected]



Evi, Implementasi Algoritma K-Means dan...161

mengakibatkan kurang memahami dalam mempelajari mata pelajaran tertentu. Pengambilan

keputusan berusaha untuk memanfaatkan gudang data yang sudah dimiliki untuk menggali informasi

yang berguna membantu mengambil kesimpulan[2].

Salah satu sekolah yang melakukan kegiatan pengayaan adalah SMA Negri 4 Tasikmalaya

yang bertempat di Jl. Letkol RE. Djaelani – Cilembang. Kegiatan pengayaan ini wajib dilakukan oleh

seluruh siswa berdasarkan kelas. Tidak adanya pengelompokan khusus, mengakibatkan kurang tepat

sasaran dalam mengatur jadwal mata pelajaran apa saja yang benar-benar dibutuhkan oleh siswa

tersebut. Kebutuhan untuk memberikan tambahan materi belajar atau yang biasa disebut pengayaan

materi sangat diperlukan, didalam penelitian ini diambil sample siswa kelas XII-MIPA, pihak sekolah

harus melakukan penggalian data (data mining). Salah satu informasi yang harus digali berdasarkan

database nilai adalah penguasaan siswa terhadap materi yang akan diujikan dalam ujian nasional

(UN). UN akan mengujikan materi Matematika, Bahasa Indonesia, Bahasa Inggris, Fisika, Kimia dan

Biologi. Penelitian ini bertujuan untuk mengelompokan siswa berdasarkan nilai rata-rata dari

Semester 1 - 5 dengan 2 kelompok siswa menggunakan Algoritma K-Means.

Setelah dikelompokan langkah selanjutnya menentukan pola dari mata pelajaran apa saja

yang perlu di berikan jam lebih dari mata pelajaran yang lainnya, sehingga kelompok siswa tersebut

mengetahui mata pelajaran apa saja yang dibutuhkan sehingga lebih tepat sasaran. Pola tersebut

diambil dari nilai mata pelajaran yang memeiliki nilai <= 80 dari masing-masing siswa

perkelompoknya, nilai support dan confidence yang paling tinggi itu akan dijadikan mata pelajaran

yang diberikan jam lebih dari mata pelajaran yang lainnya dengan menggunakan Algoritma FP-

Grwoth.

Pada penelitian ini juga menggunaka metedology CRISP–DM dan bantuan Tool Rapid Miner

5. Hasil dari analisis ini diharapkan dapat dimanfaatkan oleh sekolah, untuk mengatur jadwal mata

pelajaran pengayaan sesuai dengan kebutuhan kelompok siswa tersebut. Sebagai bahan pertimbangan

dalam penelitian ini akan dicantumkan beberapa penelitian terdahulu yang telah dilakukan oleh

peneliti lain.

Penelitian penelitian sebelumnya pada Tahun 2015, Penelitian ini menghasilkan metode

clustering dengan menggunakan Algoritma K-Means yang implementasikan dalam aplikasi. Jumlah

cluster ada empat sesuai jumlah mata pelajaran UN, sedangkan jumlah sampel data adalah 12 siswa

yang memiliki nilai terendah. Aplikasi ini selain menampilkan pengelompokkan kemampuan siswa

pada mata pelajaran Ujian Nasional, juga dapat digunakan untuk memantau perkembangan

kemampuan setelah mengikuti pengayaan materi.[1]

Penelitian selanjutnya pada Tahun 2014, Penelitian ini mengunakan metode K-Means, jarak antara

cluster yang pertama dan kedua terlalu jauh sedangkan jarak antara cluster yang kedua dan ketiga

relatif terlalu dekat. Dari nilai cluster yang didapatkan, bisa disimpulkan bahwa nilai UN tidak

menjamin seseorang akan mempunyai nilai IPK yang relatif tinggi.[3]

Penelitian yang terakhir dilakukan Tahun 2015, Data yang digunakan sebagai sumber merupakan data

yang diambil di STMIK TRIGUNA DHARMA 1 tahun terakhir, yaitu Pendidikan Terakhir, Alamat

Rumah, Jurusan, Pilihan Prodi. Hasil penelitian ini adalah berupa suatu perangkat lunak dengan

mengimplementasikan Algoritma FP-Growth yang menggunakan konsep pembangunan FP-Tree

dalam mencari Frequent Itemset.[4]


2. METODELOGI PENELITIAN

2.1. Metode Pengembangan Sistem

Metode perancangan yang digunakan dalam karya ilmiah ini menggunakan model air terjun

(waterfall). ―Model Waterfall yaitu proses pengurutan desain, yang digunakan dalam proses

pengembangan perangkat lunak, dimana prosesnya mengalir kebawah (seperti air terjun) melalui

tahap requirements analysis, system design, implementations, testing, dan maintenance. Metode ini

lebih terfokus kepada masing-masing fase agar hasilnya tetap maksimal, karena tidak ada pengerjaan

yang bersifat paralel.[5]

Adapun tahapan-tahapan dari model ini ialah :

1. Analisis Kebutuhan system (Requirements Analysis), yaitu proses pengumpulan kebutuhan yang

dilakukan secara intensif untuk menspesifikasikan kebutuhan perangkat lunak agar dapat dipahami

perangkat lunak seperti apa yang dibutuhkan oleh user.

2. Desain (Design), yaitu proses multi langkah yang fokus pada desain pembuatan program perangkat

lunak termasuk struktur data, arsitektur perangkat lunak, refresentasi antarmuka, dan prosedur

pengodean.

3. Implementasi (Coding), yaitu desain harus di translasikan kedalam program perangkat lunak. Hasil

dari tahap ini adalah program komputer sesuai dengan desain yang telah dibuat pada tahap desain.

4. Pengujian (Verifcation), yaitu kegiatan yang berfokus pada perangkat lunak secara segi logic dan

fungsional dan memastikan bahwa semua bagian sudah diuji.

5. Pemeliharaan (Maintenance), pada tahap ini tidak menutup kemungkinan sebuah perangkat lunak

mengalami perubahan ketika sudah dikirimkan ke user, perubahan bisa terjadi karena adanya

kesalahan yang muncul dan tidak terdetek di lingkungan baru.

Gambar 1. Siklus Waterfall [5]

2.2. Metode Pengumpulan Data

Metode pengumpulan data merupakan langkah yang paling strategis dalam penelitian, karena

tujuan utama dari metode ini yaitu mendapatkan data yang memenuhi standar data yang ditetapkan.

Adapun teknik pengumpulan data yang digunakan dalam penelitian ini yaitu :

1. Observasi

―Observasi merupakan suatu kegiatan mendapatkan informasi yang diperlukan untuk menyajikan

gambaran suatu peristiwa atau kejadian untuk menjawab pertanyaan penelitian, untuk membantu

mengerti perilaku manusia dan untuk evaluasi yaitu melakukan pengukuran terhadap aspek tertentu

melakukan umpan balik terhadap pengukuran tersebut.‖[7]

Dengan metode observasi ini penyusun langsung terjun ke lapangan yaitu ke SMA Negeri 4

Tasikmalaya. Untuk mengamati dan mempelajai kelemahan dan kekurangan sistem yang ada untuk

dijadikan landasan dalam membuat Rekomendasi Pengayaan Mata Pelajaran UN Berdasarkan

Segmentasi Siswa untuk membantu dalam menentukan mata pelajaran apa saja yang dibutuhkan tiap

kelompok siswa.

2. Wawancara

―Wawancara adalah percakapan dengan maksud tertentu. Atau merupakan proses memperoleh

penjelasan untuk mengumpulkan informasi dengan menggunakan cara tanya jawab baik secara

langsung maupun tidak langsung antara pewawancara dengan orang yang di wawancarai.‖ Kegiatan


wawancara ini dilakukan untuk mendapatkan kebenaran data dari pihak yang dituju sesuai dengan

yang diajukan oleh peneliti. Peneliti melakukan wawancara dengan salah satu narasumber dari SMA

Negeri 4 Tasikmalaya yaitu kepada wakasek kurikulum dimana wakasek kurikulum tersebut yang

lebih mengetahui secara pasti sistem penjawalan un di sekolah tersebut.

3. Studi Literatur

Yaitu pengumpulan data dengan mempelajari literatur-literatur yang terkait, referensi dari buku,

modul artikel ataupun dari internet yang berkaitan dengan penelitian ini.

2.3. Metode Perancangan

Dalam penelitian ini metode perancangan yang digunakan adalah merode perancangan system

melalui tahap-tahap sebagai berikut :

1. Flowmap

2. Diagram Konteks

3. Data Flow Diagram

4. Entitas Relationship Diagram (ERD)

5. Relasi Antar Tabel

2.4. Algoritma K-Means

K-means merupakan metode pengklasteran secara partitioningyang memisahkan data ke

dalam kelompok yang berbeda. Dengan partitioning secara iteratif, K-Means mampu meminimalkan

rata-rata jarak setiap data ke klasternya.[8]

Langkah-langkah pada Algoritma K-Means adalah :

1. Tentukan k sebagai jumlah cluster yang ingin dibentuk. Tetapkan pusat cluster.

2. Hitung jarak setiap data ke pusat cluster menggunakan persamaan Euclidean.

dik √∑ ( )

3. Kelompokkan data ke dalam cluster yang dengan jarak yang paling pendek menggunakan

persamaan.

∑

√∑( )

4. Hitung pusat cluster yang baru menggunakan persamaan

∑

Dimana :

Xij kluster ke – k

P = banyaknya anggota clusterke k

5. Ulangi langkah 2 sampai dengan 4 hingga sudah tidak ada lagi data yang berpindah ke kluster

yang lain.

2.5. Algoritma FP-Growth

Algoritma ini menggunakan pendekatan yang berbeda dari paradigma yang selama ini

sering digunakan yaitu algoritma apriori. Frequent Pattern Growth (FP-Growth) adalah salah satu

alternatif algoritma yang dapat digunakan untuk menentukan himpunan data yang paling sering

muncul (frequent itemset) dalam sebuah kumpulan data. Dalam Algoritma Frequent Pattern Growth

(FP-Growth) menyimpan informasi mengenai frequent itemset dalam bentuk struktur prefix-tree

atau sering di sebut FP-Tree. Tidak melakukan candidate generation dalam proses pencarian

frequent itemset, sehingga dapat mengurangi scan database secara berulang dalam proses mining dan

dapat berlangsung lebih cepat.[9]


3. HASIL DAN PEMBAHASAN

3.1. Analisis Kebutuhan Sistem

3.1.1. Analisis Masalah

Tahap analisa bertujuan untuk memahami masalah rekomendasi pengayaan mata pelajaran

UN berdasarkan segmentasi siswa yang ada dan menjadi dasar perancangan serta sebagai acuan dalam

untuk menciptakan sistem yang baru agar bisa mempermudah dan memperbaiki kelemahan dari

sistem yang lama, sehingga sistem yang baru bisa lebih baik dari sistem yang lama. Setelah

melakukan penelitian, penyusun mendapatkan masalah yang dihadapi di SMA Negeri 4 Tasikmalaya,

maka penyusun dapat menganalisis masalah, yaitu :

1. Belum adanya pengelompokan siswa berdasarkan nilai rata-rata rapot dari semester 1-5 untuk

bahan pertimbangan pemilihan mata pelajaran pada pengayaan.

2. Belum adanya analisis kebutuhan mata pelajaran siswa untuk pengayaan un.

3.1.2. Analisis Kebutuhan

Tahap ini bertujuan untuk menganalisis kebutuhan dari system yang akan dibuat. Adapun

kebutuhan-kebutuhan tersebut yaitu :

1. Sistem yang menggunakan aplikasi web membantu pengelola dalam proses menentukan

pengelompokan siswa, pemilihan mata pelajaran pengayaan un berdasarkan pengelompokan

siswa dan proses pembuatan laporan.

2. Sistem dapat menampilkan menu-menu pilihan yang dibutuhkan pengelola dalam

melakukan kegiatannya.

3.2. Analisis CRISP-DM (Cross Industry Standart Process for Data Mining)

Berikut ini penjelasan apa saja yang dilakukan tiap fase dalam model ini :

Gambar 2. Crisp-DM[9]

1. Fase Pemahaman Bisnis (Business Understanding Phase)

Pemahaman bisnis mengacu pada proses penentuan rekomendasi pengayaan mata

pelajaran UN berdasarkan segmentasi siswa di SMA Negeri 4 Tasikmalaya. Dimana tidak

adanya pengelompokan khusus, mengakibatkan kurang tepat sasaran dalam mengatur jadwal

mata pelajaran pengayaan apa saja yang benar-benar dibutuhkan oleh siswa tersebut. Oleh

karena itu diperlukan segmentasi siswa dan penentuan ploa mata pelajaran pengayaan

berdasarkan data histori nilai siswa semester 1-5 untuk kelas XII-MIPA untuk membantu

pihak wakil kepala sekolah bagian kurikulum dalam menentukan jadwal mata pelajaran

pengayaan apa saja yang benar-benar dibutuhkan oleh kelompok siswa tersebut. Algoritma

yang digunakan yaitu Algoritma K-Means dan FP-Grwoth yang bertujuan untuk segmentasi

dan analisis pola data nilai siswa dengan akurat.

2. Fase Pemahaman Data (Data Understanding Phase)

Dalam fase ini dilakukan pengumpulan data, mengenali lebih lanjut data yang akan

digunakan dan mengevaluasi kualitas data. Pemahaman data mengacu pada data nilai siswa

kelas XII-MIPA tahun 2017 sebanyak 963 record dari semester 1-5.

3. Fase Pengolahan Data (Data Preparation Phase)


Pada tahap ini struktur basis data akan dipersiapkan sehingga mempermudah proses mining.

Proses preparation ini mencakup tiga hal utama yaitu:

a. Data Selection: Memilih data yang akan digunakan dalam proses data mining. Dalam

penelitian ini terdapat 963 data, dan didalam proses ini dilakukan juga pemilihan atribut-

atribut yang disesuaikan dengan proses data mining yaitu nik siswa, nilai bahasa

indonesia, nilai matematika, nilai bahasa inggris, nilai fisika, nilai bologi dan nilai kimia.

b. Data Preprocessing: Pada tahap ini pembuatan data set berdasarkan data yang telah ada

dari SMA Negeri 4 Tasikmalaya dengan menentukan field-field apa saja yang akan

digunakan. Kemudian data tersebut masuk dalam tahapan processing, yaitu:

a. Data cleaning, dalam data siswa tersebut terdapat jumlah data siswa yang terus

berkurang tiap semesternya, dikarenakan siswa tersebut pindah sekolah. Maka dari itu

dilakukannya pembersihan data siswa agar tidak termasuk lagi kedalam data set nilai

siswa tersebut.

b. Data Integration, Dalam hal ini ada 5 arsip yang diambil yaitu dari data nilai mata

pelajaran UN di Semester 1-5

c. Data reduction, jumlah atribut dalam data set terlalu besar maka untuk mengurangi

jumlah atribut yang tidak digunakan akan dihapus. Sehingga atribut yang akan

digunakan sebanyak 7 atribut. Dimana 6 atribut sebagai atribut nilai, 1 atribut sebagai

id.

c. Data Transformation: Dalam proses ini, data ditransformasikan ke dalam bentuk yang

sesuai untuk proses data mining yaitu segementasi dan analisis pola terhadap data nilai

siswa, kemudian dari 963 data nilai tersebut diambil nilai rata-rata, kemudia jumlah data

set menjadi 190.

4. Fase Pemodelan Data (Modeling Phase)

Pada tahap pertama algoritma yang digunakan yaitu algoritma K-Means. Dalam

algoritma K-Means dilakukan pengelompokan dengan k=2. Setelah itu dilakukan berulang

hingga semua atribut perkelompoknya di rapidminer. Hasil perhitungan manual harus sesuai

dengan hasil yang ada pada rapidminer. Kemudian tahap algoritma yang digunakan yaitu

algoritma FP-Grwoth. Dengan hasil segemntasi sekarang dilakukan analisis pola dari tiap

kelompoknya dengan item set maksimal 3, yang akan dihasilkan mata pelajaran pengayaan

yang benar-benar dibutuhkan oleh setiap kelompok siswa sehingga bisa mengatur jadwal

pengayaan sesuai hasil dari pola tersebut.

5. Fase Evaluasi (Evaluation Phase)

Pada fase evaluasi ini algoritma yang digunakan akan diterapkan pada pemberian

jadwal mata pelajaran UN sesuai dengan kelompok siswa XII-MIPA di SMA Negeri 4

Tasikmalaya. Pengamatan hasil pola mata pelajaran pengayaan UN dari tiap segmentasi siswa

ini akan dilakukan dengan proses evaluasi. Validasi pola yang dihasilkan yaitu dengan cara

bertanya ke guru yang bersangkutan tentang kelompok yang membutuhkan mata pelajaran

UN dan mencocokannya dengan data nilai siswa tersebut untuk mengukur kebenaran pola

yang dihasilkan. Jika benar maka lanjut kepada tahap Deployment Phase dan jika salah maka

kembali ke tahap Business Understanding Phase.

6. Fase Penyebaran (Deployment Phase)

Fase Penyebaran adalah fase dimana menggunakan model yang dihasilkan seperti

laporan atau penerapan proses data mining secara parallel pada departemen lain. Pola yang

dihasilkan pada proses data mining dipresentasikan dalam bentuk dekripsi yang mudah

dipahami.

3.3. Desain

3.2.1. Gambaran Flowmap Umum Sistem Yang Diajukan.

Desain sistem dapat didefinisikan sebagai penggambaran dan pembuatan sketsa atau

pengaturan dari beberapa elemen yang terpisah ke dalam satu kesatuan yang utuh dan berfungsi.[5].

Selanjutnya, sesuai dengan gambaran dari analisis system yang sedang berjalan, dapat

dibuatkan flowmap sebagai acuan pembangunan program. Hasil dari analisis sistem tersebut akan

dimplementasikan pada flowmap yang diajukan berikut ini :


Gambar 3. Flowmap Sistem yang diajukan

3.2.2. Gambaran Diagram Konteks

Diagram konteks sistem dibuat untuk menentukan lingkup awal. Diagram Aliran Data

kejadian-kejadian konteks ini hanya menunjukan antarmuka utama sistem dengan lingkungannya.

Gambar 4. Diagram Context yang diajukan


3.2.3. Gambaran Data Flow Diagram(DFD)

Gambar 5. DFD Level 0







3.2.4. Gambaran Entity Relationship Diagram (ERD)

Entity Relationship Diagram (ERD) merupakan diagram yang dipergunakan untuk

menggambarkan hubungan antara entity dalam suatu system, adapun gambarannya akan ditunjukan

pada gambar berikut :

Gambar 10. Entity Relathionship Diagram (ERD)

3.2.5. Relasi Antar Tabel

Relasi antar tabel digunakan untuk menggambarkan hubungan antar entitas dalam system

tabel, dalam program penggajian ini ada empat tabel yang digunakan yaitu :

Gambar 11. Relasi Antar Table

3.4. Analisis Algoritma K-Means

Percobaan dilakukan dengan menggunakan parameter-parameter berikut :

Jumlah Cluster : 2

Jumlah Data : 190

Jumlah Atribut : 6 (Bahasa Indonesia, MTK, Bahasa Inggris, Fisika, Kimia, Biologi)


Tabel 1 Data Nilai Rata-Rata Siswa Mipa

NO-INDK BINDO MTK INGGRIS BIOLOGI FISIKA KIMIA

141510001 84,7 85,9 80,8 83,6 82,14 79,4

141510002 84,3 86,8 81,6 82,5 81,9 81,1

….. ……. …… …….. …… ….. …..

141510196 84 83 81 83,6 81,96 77,8

3.3.1. Perhitungan Algoritma K-Means

1. Penentuan pusat awal cluster.

Untuk penentuan awal diasumsikan dengan menggunakan nilai terendah pada masing-masing

mata pelajaran terdapat di Tabel 2.

Tabel 2. Pusat Awal Cluster

C1 141510128 89,3 96,2 83,9 84,8 85,77 87

C2 141510150 77 76,7 75,7 79,4 76,2 75,3

2. Perhitungan jarak pusat cluster.

Untuk mengukur jarak antara data dengan pusat cluster digunakan Euclidian distance,

kemudian akan didapatkan matriks jarak sebagai berikut :

Sebagai contoh, perhitungan jarak dari data ke-1 terhadap pusat cluster adalah :

C1=√( ) ( ) ( )

( ) ( ) ( )

C2=√( ) ( ) ( )

( ) ( ) ( )

Dan seterusnya dilanjutkan untuk data ke 2, … N. Kemudian akan didapatkan matriks jarak

sebagai berikut :

D1 = Tabel 3.

Tabel 3. Data Hasil Perhitungan D1

NO-INDK C1 C2

141510001 14,465 15,481

141510002 13,18 16,305

……… …….. ………

141510196 17,66 13,159

3. Pengelompokkan data

G1 = Tabel 4.

Tabel 4. Pengelompokan Data G1

NO-INDK C1 C2

141510001 1 0

141510002 1 0

…….. …….. …….

141510196 0 1

Lakukan langkah yang sama sampai akhir iterasi, sehingga mendapakan hasil pengelompokan C1 dan

C2 :

- C1 data 1,2,3,4,5,6,7,8,9,10,…, dan 179 Jumlahnya 140

- C2 data 30,35,38,39,41,42,…., dan 190 Jumlahnya 86

3.5. Analisis FP-Growth


Dengan melakukan proses Analisis FP-Growth dihasilkan masing-masing mata pelajaran

pengayaan UN yang dibutuhkan tiap kelompok, yaitu :

- Kelompok 1 :

Assosiattion Rule yang memenuhi syarat nilai minimum support ≥ 0,13 dan nilai confidence ≥ 0,20

adalah: Inggris → Kimia (jika kelompok 1 memprioritaskan mata pelajaran Bahasa Inggris, maka

Kimia juga harus ikut di prioritaskan.)

- Kelompok 2 :

Assosiattion Rule yang memenuhi syarat nilai minimum support ≥ 0,26 dan nilai confidence ≥ 0,20

adalah: Kimia → Inggris dan Biologi (jika kelompok 2 memprioritaskan mata pelajaran Kimia, maka

Bahasa Inggris dan Biologi juga harus ikut di prioritaskan.)

3.6. Implementasi

Pada bagian ini menjelaskan mengenai pembuatan aplikasi berdasarkan rancangan sistem

yang telah di buat. Antar muka (interface) program terdiri dari masukan (input), yaitu format untuk

menentukan pilihan pada saat pengguna melakukan masukan terhadap sistem untuk diproses

pengolahan data dan manipulasinya. Berikut ini adalah beberapa tampilan dari Program Rekomendasi

Pengayaan Mata Pelajaran UN Berdasarkan Segmentasi Siswa di SMA Negeri 4 Tasikmalaya yang

telah dibangun.

Gambar 12. Tampilan Data Siswa

Gambar 13. Tampilan Data Nilai Siswa


Gambar 14. Data Hasil Segmentasi Siswa

Gambar 15. Data Hasil Asosiasi Persegmentasi Siswa

Gambar 16. Tampilan Laporan Segmentasi Siswa


4. KESIMPULAN

Berdasarkan tahap penelitian yang telah dilakukan, maka dapat disimpulkan yaitu sebagai

berikut :

1. Dihasilkan 2 Kelompok siswa berdasarkan nilai rata-rata rapot dari semester 1-5 untuk bahan

pertimbangan pemilihan mata pelajaran pada pengayaan.

2. Seletah menganalisis kebutuhan mata pelajaran siswa dalam pengayaan un. Dihasilkan bahwa

Kelompok 1 pola yang dihasilkan adalah Inggris -> Kimia dan Kelompok 2 pola yang dihasilkan

adalah Kimia -> Inggris dan Biologi.

5. SARAN

Melihat dari kesimpulan yang diuraikan diatas, maka ada beberapa hal yang harus ditinjau,

diantaranya :

1. Untuk jumlah k bisa ditambah agar pengelompokan bisa lebih akurat sesuai.

2. Untuk penelitian selanjutnya bisa memilihan algoritma klustering dan saosiasi yang lebih baik

agar cluster dan pola yang dihasilkan lebih akurat lagi.

3. Untuk progam bisa dikembangan menjadi dinamis sehingga jumlah k bisa otomatis ditambah lagi

sesuai kebutuhan.

DATAR PUSTAKA

[1] F. E. M. Agustin, A. Fitria, and A. H. S, ―( Studi Kasus : Smp Negeri 101 Jakarta ) Program

Studi Teknik Informatika , Fakultas Sains dan Teknologi Universitas Islam Negeri Syarif

Hidayatullah,‖ Implementasi Algoritm. K-Means Untuk Menentukan Kelompok

Pengayaan Mater. Mata Pelajaran Ujian Nas. (Studi Kasus Smp Negeri 101 Jakarta), vol.

8, pp. 73–78, 2013.

[2] Susanto, Susanto; Mulyani, Evi Dewi Sri; Nurhasanah, Irma Ratnasari. Penerapan Data Mining

Classification Untuk Prediksi Perilaku Pola Pembelian Terhadap Waktu Transaksi

Menggunakan Metode Naïve Bayes. Proceedings Konferensi Nasional Sistem dan

Informatika (KNS&I), 2015

[3] Hartatik, ―Pengelompokan mahasiswa berdasarkan nilai ujian nasional dan ipk menggunakan

metode k-means,‖ Semin. Nas. Inform. 2014, pp. 35–40, 2014.

[4] D. Samuel, ―Penerapan Stuktur FP-Tree dan Algoritma FP-Growth dalam Optimasi Penentuan

Frequent Itemset,‖ Inst. Teknol. Bandung, vol. 1, 2008.

[5] A. Kristanto, ―Rekayasa Perangkat Lunak (Konsep Dasar),‖ Gava Media, Yogyakarta, 2004.

[6] R. S. Pressman, ―Rekayasa Perangkat Lunak: Pendekatan Praktisi.‖ Andi, 2012.

[7] V. W. Sujarweni, ―Metodologi Penelitian.‖ Pustaka Baru Press, Yogyakarta, 2014.

[8] J. MacQueen and others, ―Some methods for classification and analysis of multivariate

observations,‖ in Proceedings of the fifth Berkeley symposium on mathematical statistics

and probability, 1967, vol. 1, no. 14, pp. 281–297.

[9] R. N. Arifin, ―Implementasi Algoritma Frequent Pattern Growth ( Fp-Growth ) Menentkan

Asosiasi Antar Produk ( Study Kasus Nadiamart ),‖ Progr. Tek. Inform. Univ. Dian

Nuswantoro.

[10] C. Shearer, ―The CRISP-DM model: the new blueprint for data mining,‖ J. data Warehous.,

vol. 5, no. 4, pp. 13–22, 2000.

IMPLEMENTASI ALGORITMA K-MEANS DAN FP- GROWTH …

Documents