UNIVERSITAS INDONESIA PEMANFAATAN TEKNIK DATA MINING CLASSIFICATION UNTUK POLA PENGISIAN JABATAN STRUKTURAL: STUDI KASUS PEMERINTAH KOTA BOGOR KARYA AKHIR TOSAN WIAR RAMDHANI 1206194985 FAKULTAS ILMU KOMPUTER PROGRAM STUDI MAGISTER TEKNOLOGI INFORMASI JAKARTA JULI 2014
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
UNIVERSITAS INDONESIA
PEMANFAATAN TEKNIK DATA MINING CLASSIFICATION UNTUK POLA PENGISIAN JABATAN STRUKTURAL:
STUDI KASUS PEMERINTAH KOTA BOGOR
KARYA AKHIR
TOSAN WIAR RAMDHANI 1206194985
FAKULTAS ILMU KOMPUTER PROGRAM STUDI MAGISTER TEKNOLOGI INFORMASI
JAKARTA JULI 2014
UNIVERSITAS INDONESIA
PEMANFAATAN TEKNIK DATA MINING CLASSIFICATION UNTUK POLA PENGISIAN JABATAN STRUKTURAL:
STUDI KASUS PEMERINTAH KOTA BOGOR
KARYA AKHIR
Diajukan sebagai salah satu syarat untuk memperoleh gelar Magister Teknologi Informasi
TOSAN WIAR RAMDHANI 1206194985
FAKULTAS ILMU KOMPUTER PROGRAM STUDI MAGISTER TEKNOLOGI INFORMASI
JAKARTA JULI 2014
ii Universitas Indonesia
HALAMAN PERNYATAAN ORISINALITAS
Karya Akhir ini adalah hasil karya sendiri,
dan semua sumber baik yang dikutip maupun dirujuk
telah saya nyatakan dengan benar
Nama : Tosan Wiar Ramdhani
NPM : 1206194985
Tanda tangan :
Tanggal : 3 Juli 2014
iii Universitas Indonesia
HALAMAN PENGESAHAN
Karya Akhir ini diajukan oleh:
Nama : Tosan Wiar Ramdhani
NPM : 1206194984
Program Studi : Magister Teknologi Informasi
Judul : Pemanfaatan Teknik Data mining classification untuk Pola Pengisian Jabatan Struktural: Studi Kasus Pemerintah Kota Bogor
Telah berhasil dipertahankan di hadapan Dewan Penguji dan diterima sebagai bagian pernyataan yang diperlukan untuk memperoleh gelar Magister Teknologi Informasi pada Program Studi Magister Teknologi Informasi, Fakultas Ilmu Komputer, Universitas Indonesia.
DEWAN PENGUJI
Pembimbing I : Betty Purwandari, Ph.D (……………………….)
Penguji: Dr. Achmad Nizar Hidayanto, S.Kom, M.Kom (……………………….)
Penguji: Dr. Indra Budi, S.Kom, M.Kom (……………………….)
Ditetapkan di : Jakarta
Tanggal :
iv Universitas Indonesia
KATA PENGANTAR
Puji syukur penulis panjatkan kepada Tuhan Yang Maha Esa, karena atas berkat
dan rahmat-Nya, penulis dapat menyelesaikan Karya Akhir ini. Penulisan Karya
Akhir dilakukan dalam rangka memenuhi salah satu syarat untuk mencapai gelar
Magister Teknologi Informasi pada Program Studi Magister Teknologi Informasi,
Fakultas Ilmu Komputer – Universitas Indonesia. Penulis menyadari bahwa, tanpa
bantuan dan bimbingan dari berbagai pihak, dari masa perkuliahan sampai pada
penyusunan karya akhir ini, sangatlah sulit bagi penulis untuk menyelesaikannya.
Oleh karena itu, penulis mengucapkan terimakasih kepada:
1. Ibu Betty Purwandari, Ph.D , selaku dosen pembimbing I dan Ibu Yova
Ruldeviyani, M.Kom selaku doesen pembimbing II, yang telah
menyediakan waktu, tenaga, dan pikiran untuk mengarahkan dalam
penyusunan Karya Akhir ini.
2. Dosen Penguji yang telah menguji dan memberikan saran dan perbaikan
pada Karya Akhir ini.
3. Kementrian Komunikasi dan Informasi, yang telah memberikan bantuan
beasiswa.
4. Istri tercinta, Dian Kusumaningrum, yang telah memberikan pengertian,
perhatian, dukungan, dan semangat yang telah diberikan pada penulis.
5. Kedua orang tua tercinta, yang telah memberikan dukungan, doa, dan
perhatian yang telah diberikan kepada penulis.
6. Staf di Magister Teknologi Informasi, yang telah membantu kelancaran
perkuliahan dan Karya Akhir.
7. Teman – teman di MTI 2012SA, yang telah membantu dalam melewati
masa-masa perkuliahan.
Akhir kata, semoga Allah SWT membalas semua kebaikan dan bantuan yang
telah diberikan dengan pahala yang berlipat ganda. Semoga Karya Akhir ini
memberikan manfaat bagi pengembangan ilmu pada umumnya dan bagi penulis
pada khususnya.
Jakarta, 3 Juli 2014
Penulis
v Universitas Indonesia
HALAMAN PERNYATAAN PERSETUJUAN PUBLIKASI
KARYA AKHIR UNTUK KEPENTINGAN AKADEMIS
Sebagai sivitas akademik Universitas Indonesia, saya yang bertanda tangan di bawah ini:
Nama : Tosan Wiar Ramdhani
NPM : 1206194985
Program Studi : Magister Teknologi Informasi
Fakultas : Ilmu Komputer
Jenis Karya : Karya Akhir
Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada
Universitas Indonesia Hak Bebas Royalti Non-eksklusif (Non-exclusive
Royalty-Free Right) atas karya ilmiah saya yang berjudul:
Pemanfaatan Teknik Data mining classification untuk Pola Pengisian Jabatan
Struktural: Studi Kasus Pemerintah Kota Bogor
Dengan Hak Bebas Royalti Non-eksklusif ini Universitas Indonesia berhak
menyimpan, mengalihmedia/formatkan, mengelola dalam bentuk pangkalan data
(database), merawat, dan mempublikasikan karya akhir saya tanpa meminta izin
dari saya selama tetap mencantumkan saya sebagai penulis/pencipta dan sebagai
pemilik Hak Cipta.
Demikian pernyataan ini saya buat dengan sebenarnya.
Dibuat di : Jakarta
Pada Tanggal : 3 Juli 2014
Yang menyatakan
(Tosan Wiar Ramdhani)
vi Universitas Indonesia
ABSTRAK
Nama : Tosan Wiar Ramdhani Program Studi : Magister Teknologi Informasi Judul : Pemanfaatan Teknik Data Mining Classification untuk Pola
Pengisian Jabatan Struktural: Studi Kasus Pemerintah Kota Bogor
Pemerintah Kota Bogor merupakan salah satu bagian dari Pemerintah Provinsi Jawa Barat yang memiliki jumlah pegawai lebih dari 9000 orang. Pengelolaan kepegawaian dilakukan oleh Badan Kepegawaian Pendidikan dan Pelatihan Kota Bogor (BKPP). BKPP membentuk tim Badan Pertimbangan Jabatan dan Kepangkatan (Baperjakat) dalam tugas pengangkatan, pemindahan dan pemberhentian PNS dalam dan dari jabatan struktural Eselon IIA ke bawah. Baperjakat mengalami masalah dalam menyusun calon pejabat struktural yang selama ini dilakukan secara manual, meskipun sudah memiliki aplikasi Sistem Informasi Manajemen Kepegawaian (SIMPEG) sebagai aplikasi pengelolaan kepegawaian. Penelitian ini melakukan identifikasi pola pengisian jabatan struktural di lingkungan Pemerintah Kota Bogor dengan menggunakan data jabatan struktural tahun 2009 hingga 2013 yang bersumber dari basis data SIMPEG. Berbagai algoritma data mining dari teknik classification diujicobakan untuk mengidentifikasi pola pengisian jabatan struktural. Dari hasil classification, algoritma Classification Rule with Unbiased Interaction Selection and Estimation (CRUISE) menjadi algoritma terbaik dalam akurasi class eselon dengan tingkat akurasi rata-rata sebesar 95,7% untuk setiap tingkat eselon. Pola yang dihasilkan dapat menjadi rules yang akan diimplementasikan sebagai modul baru dalam aplikasi SIMPEG yang berfungsi memberikan usulan dalam pengisian jabatan struktural yang ditempatkan secara otomatis. Urutan atribut yang secara dominan muncul pada setiap tingkat eselon adalah atribut jenjang jabatan, pangkat golongan, pendidikan dan pelatihan, tingkat pendidikan, masa kerja, pengalaman dalam unit kerja, serta umur. Kata Kunci : Data Mining, Classification, Mutasi Jabatan Struktural
vii Universitas Indonesia
ABSTRACT
Name : Tosan Wiar Ramdhani Study Program : Magister of Information Technlogy Title : The Use of Data Mining Classification Technique for Filling
Structural Positions: A Case Study in Bogor Local Government
Bogor District Government is a part of West Java Province Government, which employs more than 9,000 employees. The human resources are managed by human resources and training division that is called Badan Kepegawaian Pendidikan dan Pelatihan (BKPP). BKPP form a team called Badan Pertimbangan Jabatan dan Kepangkatan (Baperjakat), who are responsible for promoting, rotating and dismissing local government employees from structural positions below the Echelon IIA positions. Baperjakat have problems on constructing the draft of structural government positions. These processes were done manually, even though BKPP have a human resources information systems called SIMPEG. The main purpose of this research is to identify patterns of filling structural positions at Bogor Local Government using the structural position data from 2009 to 2013. The data were taken from the SIMPEG database. Various data mining classification algorithms were tested to identify filling structural position patterns. The classification process yields Classification Rule with Unbiased Interaction Selection and Estimation (CRUISE) as the best algorithm in echelon class. Its average accuracy is 95.7% for each echelon level. The discovered patterns can be applied as base rules that will be implemented as new modules of SIMPEG. These new modules can provide suggestions for automatically filling structural positions. The order of attributes, which dominantly show at each echelon, are hierarchy type, class rank, training education, level of education, working period, experience within division and age.
Keywords : Data Mining, Classification, Promotions of Government Employee in
Structural Positions
viii Universitas Indonesia
DAFTAR ISI
HALAMAN JUDUL ............................................................................................ i HALAMAN PERNYATAAN ORISINALITAS .................................................. ii HALAMAN PENGESAHAN ............................................................................. iii KATA PENGANTAR ........................................................................................ iv HALAMAN PERNYATAAN PERSETUJUAN PUBLIKASI KARYA AKHIR UNTUK KEPENTINGAN AKADEMIS ............................................................. v ABSTRAK ......................................................................................................... vi ABSTRACT ...................................................................................................... vii DAFTAR ISI .................................................................................................... viii DAFTAR TABEL ............................................................................................... x DAFTAR GAMBAR ......................................................................................... xii 1. PENDAHULUAN .......................................................................................... 1
1.1 Latar Belakang ................................................................................ 1 1.2 Perumusan Masalah ......................................................................... 2 1.3 Tujuan Penelitian............................................................................. 4 1.4 Manfaat Penelitian ........................................................................... 5 1.5 Ruang Lingkup Penelitian ............................................................... 5
2. TINJAUAN PUSTAKA ................................................................................. 6 2.1 Data Mining .................................................................................... 6 2.2 Teknik Dasar dalam Data Mining .................................................... 8
2.2.1 Teknik Classification....................................................................... 8 2.2.2 Teknik Association Rule ................................................................ 10 2.2.3 Teknik Cluster Analysis ................................................................. 12
2.3 Pengangkatan Pegawai Negeri Sipil dalam Jabatan Struktural ....... 13 2.4 Penelitian Terdahulu ...................................................................... 14
2.4.1 Data Mining Classifcation Technique for Talent Management using SVM (S.Yashoda, P.S.Prakash, 2012) ........................................... 14
2.4.2 The Decision Tree Classifcation and Its Application Research in Personnel Management (Peng Ye, 2011) ...................................... 17
2.4.3 Data mining classification Techniques for Human Talent Forecasting (Hamidah Jantan, Abdul Razak Hamdan,Zulaiha Ali Othman, 2011) .............................................................................. 19
2.4.4 Pembandingan Tingkat Akurasi Dua Model Data mining yang Dihasilkan oleh Decision tree Dan Naïve Bayes Studi Kasus: Suatu Perusahaan Manufaktur dan Penjualan Sepeda (Afif Farisi, 2007) . 21
3.1 Tahapan Penelitian ........................................................................ 31 3.2 Metode Pengumpulan Data ............................................................ 33 3.3 Metode Analisis Data .................................................................... 34
4. ANALISIS DAN PEMBAHASAN ............................................................... 37 4.1 Data Pre-processing ...................................................................... 37
4.1.1 Ekstraksi Data ............................................................................... 37 4.1.2 Transformasi Data ......................................................................... 47
ix Universitas Indonesia
4.2 Data Mining dengan Classification ................................................ 48 4.2.1 Classification pada Data Eselon V ................................................. 49 4.2.2 Classification pada Data Eselon IVB ............................................. 54 4.2.3 Classification pada Data Eselon IVA ............................................. 59 4.2.4 Classification pada Data Eselon IIIB ............................................. 65 4.2.5 Classification pada data Eselon IIIA .............................................. 70 4.2.6 Classification pada Data Eselon IIB .............................................. 75 4.2.7 Classification pada Data Eselon IIA .............................................. 80
4.3 Analisis Hasil Prediksi................................................................... 82 4.4 Diskusi: Pola Umum Pengisian Jabatan Struktural Setiap Eselon ... 83 4.5 Analisis Dampak ........................................................................... 84
Tabel 2.1 Jenjang Pangkat Golongan untuk Setiap Tingkat Eselon................................. 13 Tabel 2.2 Atribut dengan Tipe Data Continous yang Digunakan (S.Yashoda, P.S.Prakash,
2012) ........................................................................................................... 15 Tabel 2.3 Atribut dan Variabel yang Digunakan ............................................................ 20 Tabel 2.4 Akurasi dari Model dengan Seluruh Atribut (Hamidah Jantan, Abdul Razak
Hamdan,Zulaiha Ali Othman, 2011) ............................................................ 20 Tabel 2.5 Atribut yang Digunakan pada Data Pelanggan dan Penjualan ......................... 21 Tabel 2.6 Perbandingan Teknik Dasar Data Mining ....................................................... 24 Tabel 2.7 Perbandingan Peneletian Sebelumnya ............................................................ 25 Tabel 3.1 Data yang Tersedia ............................................................................. 33 Tabel 3.2 Tabel Perbandingan Data Mining Tools .............................................. 35 Tabel 4.1 Atribut yang Digunakan ..................................................................... 40 Tabel 4.2 Jumlah Record Data yang Digunakan ................................................. 41 Tabel 4.3 Sebaran Data Atribut Pangkat Golongan pada Train Set ..................... 41 Tabel 4.4 Sebaran Data Atribut Pangkat Golongan pada Test Set ...................... 42 Tabel 4.5 Sebaran Data Atribut Masa Kerja pada Train Set ................................ 42 Tabel 4.6 Sebaran Data Atribut Masa Kerja pada Test Set .................................. 42 Tabel 4.7 Sebaran Data Atribut Tingkat Pendidikan pada Train Set ................... 43 Tabel 4.8 Sebaran Data Atribut Tingkat Pendidikan pada Test Set ...................... 43 Tabel 4.9 Sebaran Data Atribut Pendidikan dan Pelatihan pada Train Set ........... 43 Tabel 4.10 Sebaran Data Atribut Pendidikan dan Pelatihan pada Test Set ........... 44 Tabel 4.11 Sebaran Data Atribut Pengalaman Unit Kerja pada Train Set ............ 44 Tabel 4.12 Sebaran Data Atribut Pengalaman Unit Kerja pada Test Set .............. 44 Tabel 4.13 Sebaran Data Atribut Umur pada Train Set ....................................... 45 Tabel 4.14 Sebaran Data Atribut Umur pada Test Set ......................................... 45 Tabel 4.15 Sebaran Data Atribut Jenjang Jabatan pada Train Set........................ 45 Tabel 4.16 Sebaran Data Atribut Jenjang Jabatan pada Test Set .......................... 46 Tabel 4.17 Sebaran Data Atribut Eselonering pada Train Set ............................. 46 Tabel 4.18 Sebaran Data Atribut Eselonering pada Test Set................................ 46 Tabel 4.19 Penyeragaman Atribut Pendidikan dan Pelatihan .............................. 47 Tabel 4.20 Hasil Classification untuk Eselon V ................................................. 49 Tabel 4.21 Confusion Matrix untuk Algoritma AD Tree ..................................... 49 Tabel 4.22 Contoh Test Set data Eselon V .......................................................... 52 Tabel 4.23 Contoh Hasil Perhitungan Nilai untuk Setiap Atribut ........................ 52 Tabel 4.24 Confusion Matrix untuk Algoritma CRUISE untuk Eselon V ............ 52 Tabel 4.25 Hasil Classification untuk Eselon IVB .............................................. 54 Tabel 4.26 Confusion Matrix Algoritma Jrip untuk Eselon IVB ......................... 54 Tabel 4.27 Confusion Matrix untuk Algoritma CRUISE untuk Eselon IVB ........ 56 Tabel 4.28 Hasil Classification untuk Eselon IVA ............................................. 59 Tabel 4.29 Confusion Matrix Algoritma Decorate untuk Data Eselon IVA ........ 60 Tabel 4.30 Confusion Matrix untuk Algoritma CRUISE untuk Eselon IVA ........ 62 Tabel 4.31 Hasil Classification untuk Eselon IIIB .............................................. 65 Tabel 4.32 Confusion Matrix untuk Algoritma CRUISE untuk Eselon IIIB ........ 65 Tabel 4.33 Confusion Matrix Algoritma Bayes NET untuk Data Eselon IIIB ...... 67 Tabel 4.34 Hasil Classification untuk Eselon IIIA .............................................. 70
xi Universitas Indonesia
Tabel 4.35 Confusion Matrix untuk Algoritma REP Tree untuk Eselon IIIA ...... 70 Tabel 4.36 Confusion Matrix untuk Algoritma CRUISE untuk Eselon IIIA ........ 73 Tabel 4.37 Hasil Classification untuk Eselon IIB ............................................... 75 Tabel 4.38 Confusion Matrix Algoritma Bayes NET untuk Eselon IIB ............... 76 Tabel 4.39 Confusion Matrix untuk Algoritma CRUISE untuk Eselon IIB .......... 78 Tabel 4.40 Hasil Classification untuk Eselon IIA ............................................... 80 Tabel 4.41 Confusion Matrix Algoritma Bayes NET untuk Eselon IIA ............... 80
xii Universitas Indonesia
DAFTAR GAMBAR
Gambar 1.1 Diagram Tulang Ikan Permasalahan Mutasi Jabatan Struktural ......... 3 Gambar 2.1 Representasi Model Classification dengan Beberapa Metode ............ 9 Gambar 2.2 Metode Data Mining untuk Pengelolaan Sumber Daya Manusia ..... 16 Gambar 2.3 Metode Penelitian untuk Data Mining Staf Pengajar ....................... 17 Gambar 2.4 Perbandingan Akurasi Decision tree dengan Naïve Bayes ............... 22 Gambar 2.5 Theoretical Framework Penelitian .................................................. 29 Gambar 3.1 Kerangka Kerja Penelitian .............................................................. 31 Gambar 3.2 Hasil Survey Kdnuggets.com Tahun 2007 ...................................... 34 Gambar 4.1 Struktur Tabel yang Digunakan....................................................... 39 Gambar 4.2 Pola Pengisian Jabatan Struktural Eselon V .................................... 50 Gambar 4.3 Pola Pengisian Jabatan Struktural Eselon IIIB ................................. 67 Gambar 4.4 Output Algoritma Bayes NET untuk Data Eselon IIB ...................... 76 Gambar 4.5 Output Agoritma Bayes NET untuk Data Eselon IIA ....................... 81 Gambar 4.6 Grafik Persentase Akurasi Prediksi Class Eselon ............................ 83
1 Universitas Indonesia
BAB 1
PENDAHULUAN
1.1 Latar Belakang
Pemerintah Kota Bogor merupakan salah satu bagian dari Pemerintah Provinsi
Jawa Barat yang memiliki jumlah pegawai lebih dari 9000 orang. Pemerintah
Kota Bogor terdiri dari 11 dinas, 6 badan, 6 kecamatan, 6 kantor dan 62
kelurahan. Sesuai dengan tugas pokok dan fungsi masing-masing unit kerja,
pengelolaan kepegawaian dilakukan oleh Badan Kepegawaian Pendidikan dan
Pelatihan Kota Bogor (BKPP). Secara Struktur BKPP terdiri dari 1 sekretariat
dan 3 bidang yang di antaranya yaitu: Bidang Formasi, Pengadaan dan
Kesejahteraan Pegawai, Bidang Pendidikan dan Pelatihan, serta Bidang Mutasi
dan Pengembangan karir.
Bidang Mutasi dan Pengembangan karir terdiri dari dua sub bidang yaitu Sub
Bidang Mutasi Pegawai dan Sub Bidang Pengembangan Karir. Secara Khusus
Sub Bidang Pengembangan Karir memiliki tugas pokok dan fungsi mengelola
pengembangan karir pegawai, termasuk di dalamnya tugas belajar, izin belajar,
ujian dinas serta mutasi jabatan struktural.
Dalam hal mutasi jabatan struktural, Sub Bidang Pengembangan Karir dibantu
oleh Badan pertimbangan Jabatan dan Kepangkatan (Baperjakat). Dalam Pasal 14,
15 dan 16 Peraturan Pemerintah Nomor 100 Tahun 2000 tentang Pengangkatan
PNS dalam Jabatan Struktural secara rinci dijelaskan tugas pokok hingga susunan
anggotanya Baperjakat. Agar pengangkatan, pemindahan dan pemberhentian PNS
dalam dan dari jabatan srtuktural eselon II ke bawah terjamin kualitas dan
objektifitasnya, dibentuklah Badan Pertimbangan Jabatan dan Kepangkatan
(Baperjakat). Baperjakat Instansi Daerah Kabupaten/Kota, yang dibentuk dan
ditetapkan oleh Pejabat Pembina Kepegawaian Daerah Kabupaten/Kota
(Bupati/Walikota).
Ketua Baperjakat Instansi Daerah Kabupaten/Kota adalah Sekretaris Daerah
Kabupaten/Kota dengan anggota para pejabat Eselon II dan Sekretaris
2
Universitas Indonesia
dijabat oleh pejabat Eselon III yang membidangi kepegawaian. Jumlah anggota
Baperjakat untuk menjamin objektifitas dan kepastian dalam pengambilan
keputusan ditetapkan dalam jumlah ganjil. Masa keanggotaan Baperjakat paling
lama 3 tahun. Dalam hal Ketua Baperjakat Insansi Pusat dan Daerah kosong,
maka Pejabat Pembina Kepegawaian menunjuk salah seorang anggota yang senior
untuk menjadi ketua.
Baperjakat Instansi Daerah Kabupaten atau Kota bertugas memberikan
pertimbangan kepada Pejabat Pembina Kepegawaian dalam:
1. Pengangkatan, pemindahan dan pemberhentian dalam dan dari jabatan
struktural Eselon II ke bawah.
2. Pemberian kenaikan pangkat bagi yang menduduki jabatan struktural,
menunjukkan prestasi kerja yang luar biasa baiknya, atau menemukan
penemuan baru yang bermanfaat bagi negara.
3. Perpanjangan batas usia pensiun bagi PNS yang menduduki jabatan struktural
eselon I dan eselon II.
4. Pengangkatan Sekretaris Kabupaten/Kota.
Dalam mendukung pengelolaan kepegawaian di lingkungan Pemerintah Kota
Bogor, BKPP mengelola Sistem Informasi Manajemen Kepegawaian (SIMPEG)
yang menyimpan data kepegawaian Pemerintah Kota Bogor. SIMPEG mulai
dikembangkan pada tahun 2009. SIMPEG merupakan aplikasi berbasis Web yang
dikembangkan menggunakan bahasa pemrograman PHP dan datanya disimpan
dengan menggunakan basis data MySQL. SIMPEG secara internal digunakan oleh
BKPP untuk mengelola data kepegawaian, sedangkan secara eksternal dapat
digunakan oleh seluruh Pegawai Negeri Sipil Pemerintah Kota Bogor untuk
mengelola data masing-masing pegawai.
1.2 Perumusan Masalah
Berdasarkan hasil wawancara dengan Sekretaris Baperjakat yang juga menjabat
sebagai Kepala Bidang Mutasi dan Pengembangan Karir, diketahui terdapat
permasalahan dalam penyusunan usulan draft mutasi jabatan struktural yaitu: tim
Baperjakat mengalamai kesulitan dalam menyusun calon pejabat struktural yang
selama ini dilakukan secara manual.
3
Universitas Indonesia
Sistem yang ada (SIMPEG) belum dapat memberikan usulan secara otomatis
apabila terjadi kekosongan jabatan struktural akibat pejabat pensiun maupun rotasi
jabatan. Dalam hal ini tim Baperjakat melakukan penelusuran data melalui
SIMPEG secara manual terhadap calon-calon yang diusulkan mengisi jabatan
struktural.
Di sisi lain Peraturan Pemerintah tidak secara spesifik mengatur bagaimana teknis
pengisian jabatan struktural yang baik dan benar. Adapun beberapa peraturan
yang mengatur pengisian jabatan struktural sifatnya umum contohnya pangkat
minimum yang harus dipenuhi untuk mengisi suatu jabatan struktural. Hal-hal
yang lebih spesifik seperti tingkat pendidikan, pengalaman bekerja pada suatu unit
kerja, maupun pendidikan dan pelatihan yang pernah ditempuh seorang pegawai
belum diatur dalam Peraturan Pemerintah yang ada. Secara umum permasalahan
yang ada dapat digambarkan dalam diagram tulang ikan pada Gambar 1.1:
Gambar 1.1 Diagram Tulang Ikan Permasalahan Mutasi Jabatan Struktural
Dari Gambar 1.1 terlihat beberapa faktor utama yang menyebabkan kesulitan
dalam penyusunan draft mutasi jabatan struktural.
1. Berdasarkan hasil wawancara dengan sekretaris Baperjakat sebagai nara
sumber (Lampiran 1, Jawaban 2), terdapat kalimat “Selain dari pada itu, akan
sangat membantu tim Baperjakat jika SIMPEG mampu mengusulkan nama-
nama calon pejabat struktural jika terjadi mutasi jabatan struktural.” Kalimat
tersebut menujukkan adanya permasalahan dalam sistem, yaitu SIMPEG tidak
dapat memberikan usulan calon pejabat struktural. Hal tersebut dikarenakan
4
Universitas Indonesia
saat ini SIMPEG tidak dilengkapi dengan kemampuan pendukung keputusan.
Untuk memiliki kemampuan tersebut, maka pola pengisian jabatan struktural
harus diketahui terlebih dahulu.
2. Pada pernyataan lainnya dalam wawancara dengan nara sumber (Lampiran 1,
Jawaban 1), terungkap, “Tim Baperjakat merasa kesulitan dalam menelusuri
data calon pejabat struktural yang diusulkan.” Selain itu nara sumber
menyatakan, “…, dan kita tetap harus menelusuri data tersebut secara manual
satu per satu dengan menggunakan aplikasi SIMPEG.” Kedua pernyataan
tersebut menunjukkan bahwa salah satu akar permasalahan mengenai data
adalah penelusuran data calon pejabat struktural masih dilakukan secara
manual satu per satu.
3. Pada pernyataan lainnya dalam wawancara dengan nara sumber (Lampiran 1,
Jawaban 3), terdapat kalimat, “Peraturan Pemerintah No 13 tahun 2002 tidak
secara spesifik mengatur mana komponen kepegawaian yang menjadi prioritas
dalam mengisi suatu jabatan struktural.” Kalimat tersebut menunjukkan bahwa
dari sisi regulasi tim Baperjakat merasa kesulitan dalam mencari panduan yang
spesifik yang dapat dijadikan acuan untuk menentukan pengisian jabatan
struktural.
Berdasarkan akar permasalahan sistem yang ada maka dapat ditarik suatu
pertanyaan riset untuk penelitian ini yaitu:
“Apakah pola yang sesuai untuk melakukan pengisian jabatan struktural di
setiap tingkat eselon pada Pemerintah Kota Bogor?"
1.3 Tujuan Penelitian
Tujuan dari penelitian ini adalah untuk mempelajari pola pengisian jabatan
struktural yang ada (2009-2013) dari basis data SIMPEG dengan menggunakan
teknik data mining classification. Dengan demikian dapat ditemukan suatu acuan
yang dapat digunakan SIMPEG untuk memberikan usulan calon pejabat
struktural. Teknik data mining classification adalah salah satu teknik data mining
yang dapat digunakan untuk membangun model prediksi berdasarkan classifier
yang akan diprediksi. Hal tersebut berbeda dengan dua teknik data mining
lainnya, yaitu association rule yang digunakan untuk melihat keterkaitan atribut,
5
Universitas Indonesia
dan clustering yang digunakan untuk mengelompokkan data berdasarkan
kemiripan atau kedekatan data (Han dan Kamber, 2006).
1.4 Manfaat Penelitian
Hasil dari penelitian ini adalah pola pengisian jabatan struktural yang diharapkan
akan memudahkan tim Baperjakat dalam menyusun draft mutasi jabatan
struktural. Dengan diketahuinya pola pengisian jabatan struktural maka SIMPEG
dapat memberikan usulan nama calon pejabat struktural, sehingga tim Baperjakat
tidak perlu melakukan penelusuran data sefcara manual satu per satu. Hal ini juga
tentunya dapat melengkapi dan memperjelas PP No 13 Tahun 2002 terkait
pengisian jabatan struktural di lingkungan pemerintah.
Penelitian ini juga dapat dijadikan salah satu sumber rujukan bagi penelitian
lainnya khususnya dalam hal penyusunan draft mutasi jabatan struktural di
lingkungan pemerintah.
1.5 Ruang Lingkup Penelitian
Ruang lingkup penelitian ini adalah melakukan penambangan data (data mining)
dari data kepegawaian di lingkungan Pemerintah Kota Bogor dari basis data
SIMPEG dari tahun 2009 hingga 2014.
Metode yang digunakan dalam penelitian ini untuk melakukan penambangan data
adalah teknik data mining classification untuk menemukan pola pengisian jabatan
struktural pada Pemerintah Kota Bogor.
Penelitian ini tidak akan membahas komponen lain di luar sistem seperti
keterbatasan data mutasi jabatan yang ada. Data yang tersedia pada SIMPEG
adalah data kepegawaian dari tahun 2009 sampai dengan 2014. Penelitian ini juga
tidak akan membahas solusi bagi permasalahan terkait regulasi mengingat hal
tersebut merupakan kewenangan pemerintah pusat. Data jabatan struktural yang
digunakan adalah tingkat Eselon IIA ke bawah, karena eselon I hanya terdapat di
tingkat pemerintah provinsi.
6 Universitas Indonesia
BAB 2
TINJAUAN PUSTAKA
Dalam tinjauan pustaka ini akan dibahas teori dasar, metodologi yang akan
digunakan, serta penelitian terdahulu yang terkait dengan penelitian ini. Untuk
mempelajari pola pengisian jabatan struktural di lingkungan Pemerintah Kota
Bogor dengan sumber basis data SIMPEG, dapat digunakan teknik data mining.
2.1 Data Mining
Data mining adalah suatu proses yang menggunakan teknik statistik, matematika,
kecerdasan buatan dan machine-learning untuk mengekstraksi dan
mengindentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari
berbagai basis data besar (Turban, 2005). Dalam buku yang berjudul Decision
Support System And Intelligent Systems, Turban, Aronson, dan Liang menjelaskan
beberapa karakteristik utama dan sasaran data mining di antaranya sebagai
berikut:
Data sering dikubur pada sebuah basis data yang sangat besar, yang kadang-
kadang berisi data dari beberapa tahun. Dalam banyak kasus, data dihapus
dan dikonsolidasi di dalam sebuah data warehouse.
Lingkungan data mining biasanya adalah arsitektur client/server atau
arsitektur berbasis Web.
Piranti baru yang canggih, meliputi visualisasi yang canggih membantu
memindahkan informasi atau mengubur informasi dalam berkas-berkas
perusahaan atau arsip catatan publik.
Pemilik data biasanya adalah end user yang diberdayakan oleh data drill dan
alat query lainnya untuk mengajukan pertanyaan khusus dan mendapatkan
jawaban secara tepat dengan sedikit atau tanpa keterampilan pemrograman.
Pemaksaan sering melibatkan penemuan hasil yang tidak diharapkan dan
mengharuskan end user untuk berpikir kreatif.
Piranti data mining sudah digabung dengan spreadsheet dan piranti
pengembangan perangkat lunak lainnya, sehingga data yang sudah diolah
dengan data mining dapat dianalisis dan diproses dengan cepat dan mudah.
7
Universitas Indonesia
Karena ada sejumlah besar data dan usaha pencarian dalam skala besar, maka
pemrosesan paralel untuk data mining kadang-kadang perlu digunakan.
Menurut Han dan Kamber dalam bukunya pada tahun 2006, yang berjudul Data
Mining Concepts and Techniques, data mining didefinisikan sebagai ekstraksi dari
pengetahuan yang menarik (aturan, pola, kebiasaan, batasan) yang bersumber dari
basis data dalam skala besar. Berdasarkan dua definisi di atas dapat disimpulkan
bahwa data mining adalah suatu cara yang dapat digunakan untuk mengekstraksi
pengetahuan dengan beberapa teknik seperti statistik, matematika, kecerdasan
buatan dan machine-learning yang bersumber dari basis data yang berskala besar.
Pada umumnya data mining sering disinonimkan dengan istilah Knowledge
Discovery from Data (KDD). Meskipun demikian secara khusus data mining
hanyalah suatu langkah penting dalam urutan proses knowledge discovery. Proses
knowledge discovery terdiri atas beberapa iterasi terurut seperti yang dapat
dijelaskan sebagai berikut (Han dan Kamber, 2006):
1. Data Cleaning: bertujuan menghapus noise dan data yang tidak konsisten.
2. Data Integration: merupakan tahap dengan beberapa sumber data yang
dikombinasikan.
3. Data Selection: tahap pemilihan data yang relevan dari basis data yang akan
digunakan untuk proses analisis.
4. Data Transformation: Data ditransformasi dan dikonsolidasi dalam bentuk
yang sesuai untuk kebutuhan data mining, misalnya dengan cara menyusun
summary atau agregat.
5. Data mining: proses penting dengan penerapan metode intelijen untuk dapat
mengekstrak pola data.
6. Pattern Evaluation: untuk mengidentifikasi pola yang merepresentasikan
basis pengetahuan yang ditemukan.
7. Knowledge Presentation: adalah suatu tahap yang menggunakan teknik-
teknik visualisasi dan representasi pengetahuan, digunakan untuk
menghasilkan pengetahuan yang dibutuhkan oleh pengguna.
8
Universitas Indonesia
2.2 Teknik Dasar dalam Data Mining
Berdasarkan kegunaannya data mining memiliki beberapa teknik dasar seperti
association yang dapat digunakan untuk analisis market-basket, classification
and prediction yang dapat digunakan untuk quality control, serta cluster analysis
yang dapat digunakan untuk mendesain segmentasi pasar (Han dan Kamber,
2006).
2.2.1 Teknik Classification
Classification adalah proses menemukan model atau fungsi yang menjelaskan
konsep atau kelas data. Proses ini bertujuan agar dapat memanfaatkan model yang
didapat untuk memprediksi kelas dari sebuah objek yang belum diketahui
sebelumnya (Han dan Kamber, 2006).
Serupa dengan asssociation rule, Classification memiliki dua tahapan utama
yang terdiri dari:
1. Mengestimasi akurasi prediktif dari model yang dibuat.
2. Jika nilai akurasi yang didapatkan dapat diterima, model dapat digunakan
untuk memprediksi kelas dari objek yang belum diketahui sebelumnya.
Terdapat beberapa metode yang dapat digunakan untuk membangun model
classification seperti fungsi IF-THEN sederhana, decision tree atau neural
network (dapat dilihat ilustrasinya pada Gambar 2.1).
9
Universitas Indonesia
Gambar 2.1 Representasi Model Classification dengan Beberapa Metode
Sumber: Han dan Kamber (2006)
Berdasarkan Gambar 2.1, dapat dilihat bahwa model classification berdasarkan
umur dan penghasilan dapat dibentuk dengan menggunakan beberapa metode
seperti fungsi IF-THEN (a), decision tree (b), dan neural network (c) untuk
memprediksi apakah suatu objek termasuk ke dalam kelas A, B atau C.
Fungsi IF-THEN dapat digunakan untuk menyusun rule-based classifier. Bentuk
umum dari fungsi IF-THEN cukup sederhana yaitu IF condition Then conclusion.
Contoh sederhana penggunaan fungsi IF-THEN sebagai berikut: Rule R1: IF age
= youth AND student = yes THEN buys_computer = yes. Bagian IF dari R1
disebut sebagai rule antecedent atau precondition, sedangkan bagian THEN-nya
disebut rule consequent. Kondisi pada rule antecendent dapat berisi satu atau
lebih attribute test (dalam hal ini sebagai contoh: age = youth AND student = yes)
yang secara logika matematika terhubung dengan fungsi logika AND. Rule
consequent dapat berisi prediksi kelas. Dalam hal ini kita memprediksi apakah
pelanggan akan membeli sebuah komputer. Jika suatu kondisi dalam rule
antecendent bernilai TRUE dalam suatu baris data transaksi, maka data transaksi
tersebut memenuhi rule antecendent dan rule-nya berlaku untuk data tersebut
(Han dan Kamber, 2006). Beberapa algoritma yang menggunakan teknik dasar ini
di antaranya algoritma Jrip, One R, dan Classification Based on Association
(Weka, 2012).
10
Universitas Indonesia
Decision tree adalah diagram pohon yang bentuknya mirip dengan diagram flow
chart. Pohon tersebut memiliki tiga bagian utama yaitu internal node berupa uji
dari sebuah atribut, branch yang merepresentasikan hasil uji (setiap baris dari
branch bernilai sama untuk atribut yang telah diuji), dan leaf node
merepresentasikan label dari kelas atau distribusi dari label kelas. Untuk
mengetahui kelas dari sampel yang tidak diketahui, nilai atribut dari sampel
diujikan terhadap decision tree yang disusun. Decision tree dapat dengan mudah
dikonversi menjadi classification rules. Beberapa algoritma yang menggunakan
teknik ini di antaranya algoritma J48, AD tree, dan simple cart (Weka, 2012).
Neural network menggunakan algoritma pembelajaran back propagation yang
terdiri dari sekelompok input atau output yang saling berhubungan, dengan setiap
hubungan memiliki bobot yang saling terkait. Pada fase pembelajaran, neural
network belajar dengan cara menyesuaikan bobot sehingga memiliki kemampuan
memprediksi kelas dari input baris data dengan benar. Proses pembelajaran neural
network juga sering disebut connectionist learning dikarenakan adanya beberapa
hubungan diantara beberapa unit data rules. Beberapa algoritma yang
menggunakan teknik ini di antaranya yaitu algoritma RBF network, voted
perceptron, dan multilayer perceptron (Weka, 2012).
2.2.2 Teknik Association Rule
Association rule merupakan usaha untuk menemukan pola berulang (frequent
pattern), keterkaitan (association), korelasi atau struktur sebab-akibat dari
beberapa kumpulan data atau objek pada transaksi dalam basis data, basis data
relasional, dan sumber repositori informasi lainnya. Tujuan utama association
rule adalah menemukan suatu keteraturan dalam data, misalnya produk yang
sering dibeli secara bersamaan dalam sebuah transaksi belanja, produk lain yang
akan dibeli jika kita membeli sebuah komputer, tipe DNA yang sensitif terhadap
suatu obat baru, dan otomasi klasifikasi dokumen Web (Han dan Kamber, 2006).
11
Universitas Indonesia
Data transaksi belanja seringkali digunakan sebagai contoh untuk menerangkan
Dari dua poin di atas dapat dijelaskan bahwa nilai support dari association rule
sebesar 0,5%. Hal tersebut menunjukkan bahwa 0,5% dari seluruh transaksi
pembalut dan minuman ringan dibeli secara bersamaan. Nilai confident sebesar
60% menunjukkan bahwa 60% dari seluruh pelanggan yang membeli pembalut,
juga membeli minuman ringan. Rule yang memenuhi nilai minimum support dan
confidence threshold disebut sebagai strong rule. Secara umum nilai confidence
dan support dapat ditentukan dengan persamaan berikut:
A dan B adalah sebuah itemset dari transaksi T, sedangkan itemset merupakan
sekumpulan item I yang terdiri dari {I1,I2, …,Im}, dengan A I, B I, dan
A∩B=φ. Notasi P (A B) adalah nilai kemungkinan dari munculnya transaksi A
dan B secara bersamaan.
Beberapa istilah yang sering digunakan dalam association rule di antaranya yaitu
itemset, yang merupakan sekelompok item dalam sebuah transaksi dalam basis
data. Itemset yang berisi sejumlah k item disebut k-itemset. Misalnya {minuman
ringan, pembalut}, disebut sebagai 2-itemset. Jika sebuah itemset memenuhi nilai
minimum support yang ditentukan, maka itemset tersebut merupakan frequent
itemset. Sekumpulan frequent k-itemsets biasanya dinotasikan sebagai Lk.
12
Universitas Indonesia
Secara umum association rule memiliki dua tahapan proses yaitu:
1. Cari semua frequent itemsets: secara definisi setiap itemset setidaknya akan
muncul sebanyak yang didefinisikan oleh jumlah minimum support atau biasa
disingkat min_sup.
2. Merumuskan association rule dari frequent itemsets: secara definisi aturan ini
harus memenuhi minimum support dan minimum confidence.
Tahap kedua tentunya lebih mudah dibanding tahap pertama, seluruh performa
dari Association Rule Mining sangat ditentukan oleh tahap pertama yaitu mencari
semua frequent itemsets.
2.2.3 Teknik Cluster Analysis
Proses pengelompokkan sekumpulan objek dalam beberapa kelas yang memiliki
kemiripan disebut clustering. Sebuah cluster adalah kumpulan beberapa objek
data yang memiliki kesamaan satu sama lain dalam cluster yang sama dan
berbeda dengan objek lain dalam cluster yang lain (Han dan Kamber, 2006).
Dengan otomasi clustering kita dapat mengidentifikasi kepadatan dan sebaran dari
sebuah area yang terdiri atas beberapa objek, sehingga kita dapat menemukan pola
sebaran dan korelasi yang menarik diantara atribut data. Cluster analysis sudah
banyak digunakan dalam beragam aplikasi seperti riset pasar, pengenalan pola,
analisis data, dan pemrosesan citra digital.
Clustering sering juga disebut sebagai segmentasi data dalam berbagai aplikasi
karena clustering dapat membagi sejumlah besar data ke dalam beberapa
kelompok berdasarkan kesamaannya.
Jenis data yang umumnya digunakan pada clustering di antaranya yaitu variabel
skala interval, variabel biner, variabel nominal, ordinal, dan rasio, serta gabungan
dari beberapa tipe variabel. Beberapa metode clustering yang sering digunakan di
antaranya yaitu:
Algoritma partisi: menyusun beragam partisi lalu mengevaluasi hasilnya
dengan menggunakan beberapa kriteria.
13
Universitas Indonesia
Algoritma hirarki: menciptakan dekomposisi hirarki dari sekelompok data
atau objek dengan menggunakan beberapa kriteria.
Density-based: pendekatan clustering berdasarkan konektifitas dan fungsi
density.
Grid-based: pendekatan clustering berdasarkan beberapa tingkat struktur
granularity.
Model-based: pendekatan clustering berdasarkan hasil hipotesis sebuah
model dari setiap cluster yang terbentuk dengan tujuan untuk mencari model
terbaik yang sesuai.
2.3 Pengangkatan Pegawai Negeri Sipil dalam Jabatan Struktural
Peraturan Pemerintah yang mengatur pengisian jabatan struktural secara umum
tertuang dalam Peraturan Pemerintah Republik Indonesia Nomor 100 Tahun 2000
tentang pengangkatan Pegawai Negeri Sipil dalam jabatan struktural yang
kemudian diperbarui dengan Peraturan Pemerintah Republik Indonesia Nomor 13
Tahun 2002.
Beberapa poin penting yang diperbarui dalam peraturan tersebut adalah jenjang
pangkat golongan terendah dan tertinggi untuk masing-masing tingkat eselon
seperti yang dapat dilihat pada Tabel 2.1:
Tabel 2.1 Jenjang Pangkat Golongan untuk Setiap Tingkat Eselon
No Eselon Jenjang Pangkat, Golongan / Ruang Terendah Tertinggi
Pangkat Gol / Ruang
Pangkat Gol / Ruan
g 1 I a Pembina Utama IV/e Pembina Utama IV/e 2 I b Pembina Utama
Madya IV/d Pembina Utama IV/e
3 II a Pembina Utama Muda IV/c Pembina Utama Madya
IV/d
4 II b Pembina Tingkat I IV/b Pembina Utama Muda IV/c 5 III a Pembina IV/a Pembina Tingkat I IV/b 6 III b Penata Tingkat I III/d Pembina IV/a 7 IV a Penata III/c Penata Tingkat I III/d 8 IV b Penata Tingkat I III/b Penata III/c 9 V Penata Muda III/a Penata Tingkat I III/b
Sumber : Peraturan Pemerintah Republik Indonesia Nomor 13 Tahun 2002.
14
Universitas Indonesia
Berdasarkan Tabel 2.1 diketahui bahwa Baperjakat dapat menggunakan tabel
tersebut sebagai acuan dasar untuk menentukan kriteria yang diperlukan dalam
mengisi jabatan struktural. Dalam hal ini pangkat dan golongan merupakan suatu
atribut yang nantinya akan digunakan dalam proses data mining untuk mengetahui
pola pengisian jabatan struktural pada Pemerintah Kota Bogor.
Beberapa atribut lain yang dapat digunakan untuk menemukan pola pengisisian
jabatan struktural sebetulnya tercantum pada Pasal 6 dalam Peraturan Pemerintah
Republik Indonesia Nomor 100 Tahun 2000 yang secara eksplisit menyebutkan
bahwa faktor senioritas dalam kepangkatan, usia, pendidikan dan pelatihan
jabatan serta pengalaman yang dimiliki merupakan beberapa hal yang bisa
menjadi bahan pertimbangan Pembina Kepegawaian Daerah dalam mengisi suatu
jabatan struktural.
Namun tidak ada pembobotan atau skala prioritas terhadap faktor-faktor tersebut
untuk menilai kelayakan seorang pegawai mengisi jabatan struktural. Oleh karena
itu pemanfaatan data mining pada penelitian ini ditujukan untuk mengetahui skala
prioritas mana yang lebih didahulukan diantara beberapa faktor tersebut dengan
menggunakan basis data SIMPEG sebagai sumber datanya.
2.4 Penelitian Terdahulu
Beberapa penelitian terdahulu yang pernah dilakukan terkait dengan penggunaan
data mining dapat dijelaskan sebagi berikut:
2.4.1 Data Mining Classifcation Technique for Talent Management using
SVM (S.Yashoda, P.S.Prakash, 2012)
Salah satu tantangan pada pengelolaan sumber daya manusia adalah mengelola
bakat yang ada pada sumber daya manusia dalam organisasi. Masalah dalam
mengelola potensi bakat pada sumber daya manusia di dalam organisasi dapat
diselesaikan dengan menggunakan teknik data mining classification dari beberapa
teknik classification yang sering digunakan seperti: decision tree, neural network,
support vector machine, dan algoritma nearest neigbour.
Penelitian ini menggunakan pendekatan gabungan antara Class Attributee
Contingency Coefficient (CACC) dengan support vector machine. Data yang
digunakan dalam penelitian ini adalah UCI adult data set yang merupakan data
15
Universitas Indonesia
sensus pendapatan tahun 1994 yang dapat diunduh pada alamat situs
http://archive.ics.uci.edu/ml/machine-learning-databases/adult/. Dari 14 atribut
yang tersedia (umur, bidang pekerjaan, nilai final weight, lamanya pendidikan
formal yang pernah ditempuh, status nikah, pekerjaan, hubungan keluarga, suku,
jenis kelamin, keuntungan modal, kerugian modal, jumlah jam kerja mingguan
dan kewarganegaraan), hanya 6 atribut yang digunakan dengan tipe data continous
seperti yang ditunjukkan pada Tabel 2.2:
Tabel 2.2 Atribut dengan Tipe Data Continous yang Digunakan
Multi Layer Perceptron 87,16 99,84 84,55 Radial Basis Function Network 91,45 99,98 87,09 K-Star 92,06 97,83 87,79
Sumber: Hamidah Jantan, Abdul Razak Hamdan,Zulaiha Ali Othman (2011)
Berdasarkan Tabel 2.4 dapat dilihat algoritma C.45 memiliki nilai akurasi yang
lebih baik dibandingkan dengan algoritma lainnya. Dengan begitu teknik ini dapat
digunakan untuk memprediksi data bakat sumber daya manusia selanjutnya
dengan konstruksi classification rules yang terbentuk.
21
Universitas Indonesia
2.4.4 Pembandingan Tingkat Akurasi Dua Model Data mining yang
Dihasilkan oleh Decision tree Dan Naïve Bayes Studi Kasus: Suatu
Perusahaan Manufaktur dan Penjualan Sepeda (Afif Farisi, 2007)
Penelitian ini bertujuan melakukan simulasi pembuatan data mining model
dengan mengambil dataset dari basis data dan data warehouse suatu perusahaan
manufaktur dan penjualan sepeda. Implementasi data mining dengan
membandingkan dua algoritma classification yang berbeda yaitu decision tree dan
naïve bayes. Dataset yang digunakan dalam penelitian ini bersumber dari data
pelanggan dan transaksi penjualan sepeda dengan pemilihan atribut yang dapat
dilihat pada Tabel 2.5.
Tabel 2.5 Atribut yang Digunakan pada Data Pelanggan dan Penjualan
Atribut Tipe Data Keterangan Ckey Angka Primary key Mstatus Karakter Status perkawinan Gender Karakter Jenis kelamin Kidnum Karakter Jumlah anak Education Karakter Pendidikan terakhir Occupation Karakter Pekerjaan Hstatus Karakter Kepemilikan rumah CarNum Karakter Jumlah kendaraan bermotor IPYear Karakter Rentang gaji Region Karakter Domisili Age Angka Umur Bflag Karakter Membeli atau tidak membeli sepeda
Sumber: Afif Farisi (2007)
Tabel 2.7 menjelaskan atribut-atribut yang dimiliki pelanggan toko sepeda yang
akan digunakan untuk mengetahui pola pelanggan yang berpotensi membeli atau
tidak membeli sepeda. Dari seluruh dataset yang ada 90% dataset digunakan
sebagai train set, dan 10% digunakan sebagai test set.
Data mining tool yang digunakan dalam penelitian ini adalah SQL Server
Analysis Service yang merupakan fitur dari Microsoft SQL Server 2005.
Dengan menggunakan algoritma decision tree didapatkan 116 pola yang terbentuk
dengan temuan beberapa fakta sebagai berikut:
99,99% pelanggan yang memiliki satu kendaraan bermotor, dengan rentang
gaji 0 sampai dengan Rp 50.000.000 per tahun, dan umur 29 hingga 32 tahun,
22
Universitas Indonesia
pada regional solo, tidak akan membeli sepeda. Namun kemungkinan
munculnya seorang pelanggan dengan karakteristik tersebut hanya 0,25%.
99,99% pelanggan yang memiliki dua kendaraan bermotor, dengan rentang
gaji Rp 100.000.000 sampai dengan Rp 150.000.000 per tahun, dan umur 39
hingga 41 tahun, dengan jumlah anak dua, akan membeli sepeda. Namun
kemungkinan munculnya seorang pelanggan dengan karakteristik tersebut
hanya 0,11%.
Dengan menggunakan algoritma naïve bayes, didapatkan 35 grup yang saling
lepas, dengan fakta-fakta sebagai berikut:
Kemungkinan terbesar grup yang akan membeli sepeda adalah pelangan yang
tidak memiliki kendaraan bermotor, dengan persentase pembelian sebesar
63,59%. Kemungkinan munculnya seorang pelanggan dengan karakteristik
tersebut adalah 22,94%.
Kemungkinan terkecil grup yang akan membeli sepeda adalah pelangan umur
di atas 59 tahun, dengan persentase pembelian sebesar 0,06%. Kemungkinan
munculnya seorang pelanggan dengan karakteristik tersebut adalah 0,31%.
Perbandingan tingkat akurasi dari dua algoritma yang digunakan dapat dilihat
pada Gambar 2.4:
Gambar 2.4 Perbandingan Akurasi Decision tree dengan Naïve Bayes
Sumber: Afif Farisi (2007)
Seperti yang terlihat pada Gambar 2.4, model decision tree menghasilkan tingkat
akurasi 68,85% sedangkan model naïve bayes hanya menghasilkan tingkat akurasi
60,7%.
23
Universitas Indonesia
Berdasarkan tinjauan pustaka, penelitian sebelumnya, dan metodologi yang
dijelaskan sebelumnya maka dapat disusun suatu perbandingan dalam bentuk
tabel seperti yang terlihat pada Tabel 2.6 untuk perbandingan teori dan Tabel 2.7
untuk perbandingan penelitian terdahulu.
24
Universitas Indonesia
Perbandingan Teori Compare Contrast Criticize Synthesize Summarize Rujukan
Seperti yang dapat dilihat pada Tabel 4.17 dan 4.18, rendahnya jumlah train set
pada tingkat Eselon V dan Eselon IIA dikhawatirkan akan menyebabkan
rendahnya akurasi prediksi pada test set di tingkat eselon yang sama. Jumlah data
secara menyeluruh untuk tiap tingkat eselon dapat dilihat pada Lampiran 2.
47
Universitas Indonesia
4.1.2 Transformasi Data
Setelah atribut dan ekstraksi data dilakukan maka tahapan selanjutnya adalah
melakukan transformasi data dengan melakukan validasi data untuk setiap atribut
seperti menghapus record yang memiliki nilai NULL pada atribut pangkat dan
golongan. Sedangkan pada atribut pendidikan dan pelatihan akan berisi ‘belum
mengikuti’ apabila data yang bersangkutan tidak pernah mengikuti diklat
kepemimpinan.
Dari total 3.265 SK mutasi jabatan tentunya harus melalui validasi terlebih dahulu
seperti validasi atribut eselonering yang menjadi classifier. Jika pada kolom id_j
pada tabel SK bernilai 0, maka record tersebut tidak dapat digunakan dan harus
dihapus, mengingat kolom id_j adalah foreign key ke tabel jabatan yang
mengidentifikasikan jabatan dan tingkat eselonering dari suatu SK mutasi jabatan.
Dari hasil validasi ini 3.004 SK yang dapat diidentifikasi tingkat eseloneringnya.
Dari total 16.346 SK kenaikan pangkat juga melalui validasi terlebih dahulu. SK
kenaikan pangkat yang digunakan adalah SK untuk pegawai struktural dengan
pangkat dan golongan minimum untuk mengisi jabatan struktural yaitu golongan
III/b ke atas yang belum pernah menjadi pejabat struktural. Untuk tingkat Eselon
V menggunakan SK pegawai dengan golongan III/a ke atas khusus pada unit kerja
dinas pendidikan, mengingat jabatan Eselon V hanya ada pada unit kerja tersebut.
Dari hasil validasi ini diperoleh 438 SK pegawai yang memenuhi pangkat
minimum untuk mengisi jabatan struktural tetapi belum mendapatkan untuk
menjadi pejabat struktural.
Atribut pendidikan dan pelatihan juga mengalami proses transformasi data dengan
beberapa nilai memiliki makna yang sama seperti yang dapat dijelaskan pada
Tabel 4.19.
Tabel 4.19 Penyeragaman Atribut Pendidikan dan Pelatihan
Nilai Atribut Bentuk Penyeragaman Adum, Adumla, SPADA,SPALA, Diklat
Kepemimpinan Tk. IV Pim IV
SPAMA, Pim III, Diklat Kepemimpinan Tk. III Pim III SPAMEN, Pim II, Diklat Kepemimpinan Tk. II Pim II
48
Universitas Indonesia
Seperti yang dapat dilihat pada tabel 4.19, yang paling banyak memiliki
keragaman adalah jenis diklat Pim IV, dengan Adum, Adumla, SPADA, SPALA
dan Diklat Kepemimpian Tk. IV merupakan hal yang sama yaitu pendidikan dan
pelatihan untuk pejabat eselon IV yang dalam hal ini diseragamkan dengan label
Pim IV.
Fungsi agregasi digunakan untuk mengisi atribut masa kerja dan atribut
pengalaman dalam unit kerja. Atribut masa kerja dihitung dengan cara
mengurangi kolom tmt pada SK mutasi jabatan atau SK kenaikan pangkat dengan
kolom tmt pada SK CPNS. Sedangkan pada atribut pengalaman dalam unit kerja
dihitung dengan cara mengurangi kolom tmt pada SK mutasi jabatan atau SK
kenaikan pangkat dengan kolom tmt pada sk alih kerja.
Khusus atribut pengalaman dalam unit kerja, nilainya bisa saja berbeda untuk test
set di setiap tingkat eselon. Misalnya seorang pegawai pernah menjabat sebagai
eselon IVA selama 1,5 tahun, maka nilai tersebut hanya akan digunakan pada saat
melakukan classification untuk tingkat eselon IVA. Sedangkan nilai pengalaman
unit kerja untuk dari pegawai tersebut untuk tingkat eselon di atasnya bernilai 0
tahun.
Setelah semua data dari setiap atribut didapatkan dari basis data SIMPEG maka
agar dapat diolah dengan menggunakan data mining tool WEKA, data tersebut
dikonversi dalam format *.csv yang dikonversi lagi menjadi format file *.arff baik
untuk train set maupun test set dari setiap tingkatan eselon.
4.2 Data Mining dengan Classification
Pengolahan data pada penelitian ini dibagi menjadi 7 bagian sesuai dengan jumlah
tingkat eselon yang ada, dengan Eselon V sebagai jabatan dengan tingkat terendah
yaitu Kepala Tata Usaha SMP dan SMA, dan Eselon IIA sebagai jabatan tertinggi
yaitu Sekretaris Daerah Kota Bogor.
Data mining tool yang digunakan adalah WEKA, R, dan CRUISE. Teknik data
mining yang digunakan adalah classification dengan menggunakan 7 atribut yaitu
umur, pangkat golongan, masa kerja, pengalaman dalam unit kerja, tingkat
pendidikan, pendidikan dan pelatihan jabatan, serta tingkat eselon sebagai atribut
classifier. Dalam penelitian ini seluruh algoritma classification (60 Algoritma)
49
Universitas Indonesia
yang tersedia pada WEKA digunakan untuk menemukan hasil akurasi prediksi
yang terbaik.
4.2.1 Classification pada Data Eselon V
Pada data tingkat Eselon V terdiri atas 941 train set (73 Mutasi Jabatan dan 868
Kenaikan Pangkat) dan 1.001 test set dengan hasil classification seperti pada
Tabel 4.20.
Tabel 4.20 Hasil Classification untuk Eselon V
Algoritma Pola prediksi
Data mining
tool
Akurasi Train
set
Akurasi Test set
Akurasi Eselon
V
Akurasi Non
eselon
AD Tree ada Weka 99,89% 94,8% 100% 94,71%
CRUISE ada CRUISE 99,15% 94,21% 100% 94,1%
Seperti yang dapat dilihat pada tabel 4.20, salah satu algoritma dengan akurasi
eselon terbaik yang menghasilkan pola prediksi adalah algoritma AD tree dengan
confusion matrix seperti yang dapat dilihat padaTabel 4.21.
Tabel 4.21 Confusion Matrix untuk Algoritma AD Tree
Eselon V Non Eselon 18 0 52 931
Tabel 4.21 menjelaskan bahwa algoritma AD tree menghasilkan nilai akurasi
sebesar 94,8% pada prediksi test set Eselon V dengan tanpa kesalahan prediksi
pada data Eselon V, dan 52 kesalahan dalam memprediksi data non eselon.
Secara umum algoritma ini melakukan klasifikasi dengan cara menyusun decision
tree dengan beberapa cabang alternatif keputusan. Dalam hal ini setiap cabang
memiliki nilai yang berbeda sesuai dengan nilai yang ada pada setiap test set.
Nilai pada setiap atribut tersebut akan dijumlahkan sesuai dengan data test set
yang diuji. Jika total nilai bernilai negatif maka akan diklasifikasikan sebagai
eselon V, sebaliknya jika total nilai bernilai positif maka akan diklasifikasikan
sebagai non eselon. Pola prediksi yang terbentuk untuk data Eselon V dapat
dilihat pada Gambar 4.2.
50
Universitas Indonesia
Gambar 4.2 Pola Pengisian Jabatan Struktural Eselon V
51
Universitas Indonesia
Seperti yang dapat dilihat pada Gambar 4.2, pola pengisian jabatan struktural yang
terbentuk dibagi menjadi 9 rule dengan urutan sebagai berikut:
1. Nilai awal dari suatu test set adalah 1,232. Apabila suatu data memiliki jenjang
jabatan fungsional maka akan diberi nilai 3,507, sebaliknya jika memiliki
jenjang jabatan struktural akan diberi nilai -2,035.
2. Jika pegawai dengan jenjang struktural tersebut berumur di bawah 49,292
tahun maka akan diberi nilai 0,009, sebaliknya apabila berumur lebih dari sama
dengan 49,292 akan diberi nilai -0,946.
3. Jika pegawai struktural tersebut memiliki masa kerja di bawah 23,75 tahun
maka akan diberi nilai 0,112, sebaliknya jika masa kerjanya lebih dari sama
dengan 23,75 maka akan diberi nilai -0,832.
4. Untuk pegawai dengan masa kerja di bawah 17,708 tahun akan diberi nilai
1,341, sebaliknya pegawai dengan masa kerja lebih dari sama dengan 17,708
akan diberi nilai -1,133.
5. Pegawai dengan masa kerja di atas 17,708 tersebut, apabila memiliki pangkat
golongan III/b maka akan diberi nilai 0,549, sebaliknya jika memiliki pangkat
selain III/b maka akan diberi nilai -0,726.
6. Pegawai dengan masa kerja di atas 17,708 tersebut, apabila memiliki umur di
bawah 49,125 tahun maka akan diberi nilai -0,555, sebaliknya apabila memiliki
umur lebih dari sama dengan 49,125 maka akan diberi nilai 0,443.
7. Untuk pegawai dengan masa kerja di bawah 12,292 tahun akan diberi nilai
1,067, sebaliknya apabila masa kerjanya lebih dari sama dengan 12,292 tahun
akan diberi nilai -0,205.
8. Pegawai dengan masa kerja di atas 12,292 tahun tersebut, apabila memiliki
umur di bawah 39,667 tahun maka akan diberi nilai -0,896, sebaliknya jika
memiliki umur lebih dari sama dengan 39,667 tahun maka akan diberi nilai
0,27.
9. Pegawai dengan umur lebih dari sama dengan 39,667 tahun tersebut, apabila
berumur di bawah 49,292 maka akan diberi nilai 0,407, sebaliknya apabila
berumur lebih dari sama dengan 49,292 maka akan diberi nilai -0,418.
52
Universitas Indonesia
Sebagai contoh apabila sebuah data memilki nilai atribut seperti yang ditampilkan
pada tabel 4.22, maka kita tinggal menghitung nilai atribut sesuai dengan 9 nilai
atribut dari pola pengisian yang disebutkan sebelumnya.
Tabel 4.22 Contoh Test Set data Eselon V
Masa Kerja
Tingkat Pendidikan
Pangkat Golongan
Pengalaman Unit Kerja
Pendidikan Pelatihan
Umur Jenjang Jabatan
15,916 SMA III/a 0 Belum Mengikuti
39,667 Struktural
Berdasarkan contoh test set yang ada, maka dengan menggunakan pola pengisian
yang terbentuk dari algoritma AD tree nilai total untuk setiap atribut dapat
dihitung seperti yang ditampilkan pada Tabel 4.23.
Tabel 4.23 Contoh Hasil Perhitungan Nilai untuk Setiap Atribut
Nilai Rule
1,232 Nilai Awal -2,035 Jenjang Jabatan = Struktural 0,099 Umur < 49,292
0,112 Masa Kerja < 23,75
1,341 Masa Kerja < 17,708
-0,205 Masa Kerja >= 12,292
0,27 Umur >=39,667
0,407 Umur < 49,292
1,222 Total Nilai
Seperti yang terlihat pada Tabel 4.23 total nilai dari contoh test set tersebut
bernilai positif (1,222) sehingga diprediksi sebagai non eselon.
Algoritma lain yang juga menghasilkan akurasi class Eselon V cukup tinggi
adalah CRUISE yang diimplementasikan dengan menggunakan data mining tool
berbasis teks dengan nama yang sama yaitu CRUISE. Hasil confusion matrix
dapat dilihat pada Tabel 4.24.
Tabel 4.24 Confusion Matrix untuk Algoritma CRUISE untuk Eselon V
Eselon V Non Eselon 18 0 58 925
Tabel 4.24 menjelaskan bahwa algoritma CRUISE menghasilkan nilai akurasi
sebesar 94,21% pada prediksi test set Eselon V dengan tanpa kesalahan prediksi
53
Universitas Indonesia
pada data Eselon V, dan 58 kesalahan dalam memprediksi data non eselon.
Berikut ini adalah decision tree yang terbentuk:
Node 1: masakerja <= 12.2917 Node 2: Terminal Node, predicted class = non eselon Class label : V non eselon Class size : 0 793 Node 1: masakerja > 12.2917 Node 3 : jenjab = Struktural Node 6: Terminal Node, predicted class = V Class label : V non eselon Class size : 73 8 Node 3 : jenjab = Fungsional Node 7: Terminal Node, predicted class = non eselon Class label : V non eselon Class size : 0 67
Dari bentuk decision tree di atas dapat diidentifikasi pola pengisian jabatan
struktural Eselon V adalah bahwa semua pejabat struktural Eselon V memiliki
masa kerja lebih dari 12,2917 tahun dengan jenjang jabatan struktural.
Pola pengisian jabatan struktural yang terbentuk dari algoritma AD Tree dan
CRUISE memiliki beberapa persamaan sebagai berikut:
1. Atribut masa kerja dengan nilai di bawah 12,2917 dikategorikan sebagai non
eselon pada algoritma CRUISE. Pada algoritma AD Tree nilai yang sama diberi
nilai positif (1,067), yang berarti memiliki kecenderungan untuk
diklasifikasikan sebagai non eselon.
2. Atribut masa kerja dengan nilai di atas 12,2917 dikategorikan sebagai eselon V
pada algoritma CRUISE apabila didukung dengan atribut jenjang jabatan
dengan nilai struktural. Pada algoritma AD Tree nilai yang sama diberi nilai
negatif (-2,05 untuk atribut masa kerja dan -2,035 untuk atribut jenjang jabatan
struktural), yang berarti memiliki kecendurungan untuk diklasifikasikan
sebagai eselon V.
Perbedaan dari dua algoritma tersebut adalah pada algoritma AD tree atribut
pangkat golongan dan atribut umur ikut menentukan hasil classification.
Sedangkan pada algoritma CRUISE, dua atribut tersebut tidak menentukan hasil
54
Universitas Indonesia
classification. Namun dari perbedaan tersebut tidak ditemukan pola pengisian
jabatan struktural yang saling bertentangan.
Hasil classification seluruh algoritma yang tersedia secara lengkap untuk Eselon
V dapat dilihat pada Lampiran 2.
4.2.2 Classification pada Data Eselon IVB
Pada data tingkat Eselon IVB terdiri atas 2.989 train set (1.096 Mutasi Jabatan
dan 1.893 Kenaikan Pangkat) dan 2.363 test set dengan hasil Classification dapat
dilihat pada Tabel 4.25.
Tabel 4.25 Hasil Classification untuk Eselon IVB
Algoritma Pola prediksi
Data mining
tool
Akurasi Train
set
Akurasi Test set
Akurasi Eselon IVB
Akurasi Non
eselon
Jrip Ada Weka 91,36 83,15% 88,98% 82,10%
CRUISE Ada CRUISE 92,17% 80,36% 87,33% 79,10%
Seperti yang dapat dilihat pada tabel 4.25, Salah satu algoritma dengan akurasi
eselon terbaik yang menghasilkan pola prediksi yang lebih baik yaitu algoritma
Jrip dengan confusion matrix yang dapat dilihat padaTabel 4.26.
Tabel 4.26 Confusion Matrix Algoritma Jrip untuk Eselon IVB
Non Eselon Eselon IVB
40 323
1642 358
Tabel 4.26 menjelaskan bahwa algoritma Jrip menghasilkan nilai akurasi sebesar
83,15% pada prediksi test set Eselon IVB dengan 40 kesalahan prediksi pada data
Eselon IVB, dan 358 kesalahan dalam memprediksi data non eselon.
Secara umum algoritma ini melakukan klasifikasi dengan cara menyusun rules
dengan fungsi “jika maka” berdasarkan data train set yang ada. Berikut pola
prediksi yang terbentuk untuk data Eselon IVB:
55
Universitas Indonesia
(jenjab = Struktural) and (masakerja >= 16.8333) => eselonering=IVB
(jenjab = Struktural) and (masakerja <= 6.25) and (umur >= 36.0833) and (pangkat_golongan = III/b) and (umur >= 38.75) => eselonering=IVB
(jenjab = Struktural) and (pangkat_golongan = III/b) and (tingkat_pendidikan = S1) and (masakerja >= 4.25) and (masakerja <= 8.08333) => eselonering=IVB
(jenjab = Struktural) and (pengalaman_unitkerja >= 0.416667) => eselonering=IVB
(jenjab = Struktural) and (umur <= 40.0833) and (umur >= 37.1667) and (masakerja <= 3.75) => eselonering=IVB
(jenjab = Struktural) and (masakerja >= 15.75) and (masakerja <= 22.5833) => eselonering=IVB
(jenjab = Struktural) and (masakerja <= 7.75) and (umur >= 31.25) and (masakerja <= 3.91667) and (masakerja >= 2) => eselonering=IVB
(jenjab = Struktural) and (umur <= 40.25) and (tingkat_pendidikan = S2) and (umur >= 31.75) => eselonering=IVB
(jenjab = Struktural) and (diklat = Pim IV) => eselonering=IVB
(jenjab = Struktural) and (umur <= 39.9167) and (tingkat_pendidikan = D3) and (masakerja >= 8.16667) => eselonering=IVB
(jenjab = Struktural) and (tingkat_pendidikan = S1) and (masakerja >= 12.75) and (masakerja >= 15) => eselonering=IVB
Dari algoritma Jrip dihasilkan 11 pola pengisian jabatan struktural dengan
menggunakan fungsi “jika maka” dengan rincian sebagai berikut:
1. Pegawai dengan jenjang jabatan struktural yang memililiki masa kerja lebih
dari sama dengan 16,833 tahun, diklasifikasikan sebagai pejabat Eselon IVB.
2. Pegawai dengan jenjang jabatan struktural yang memiliki masa kerja kurang
dari 6,25 tahun, berumur lebih dari sama dengan 38,75 tahun dan memiliki
pangkat golongan III/b, diklasifikasikan sebagai pejabat Eselon IVB.
3. Pegawai dengan jenjang jabatan struktural yang memiliki pangkat golongan
III/b dengan tingkat pendidikan S1 dan masa kerja antara 4,25 tahun hingga
8,0833 tahun, diklasifikasikan sebagai pejabat Eselon IVB.
4. Pegawai dengan jenjang jabatan struktural yang memiliki pengalaman unit
kerja lebih dari sama dengan 0,4167 tahun, diklasifikasikan sebagai pejabat
Eselon IVB.
56
Universitas Indonesia
5. Pegawai dengan jenjang jabatan struktural yang berumur antara 37,1667
tahun hingga 40,083 tahun dengan masa kerja kurang dari sama dengan 3,75
tahun, diklasifikasikan sebagai pejabat Eselon IVB.
6. Pegawai dengan jenjang jabatan struktural yang memiliki masa kerja antara
15,75 tahun hingga 15,833 tahun, diklasifikasikan sebagai pejabat Eselon
IVB.
7. Pegawai dengan jenjang jabatan struktural yang memiliki masa kerja antara 2
tahun hingga 3,916 tahun serta berumur lebih dari sama dengan 31,25 tahun,
diklasifikasikan sebagai pejabat Eselon IVB.
8. Pegawai dengan jenjang jabatan struktural yang berumur antara 31,75 tahun
hingga 40,25 tahun dengan tingkat pendidikan S2, diklasifikasikan sebagai
pejabat Eselon IVB.
9. Pegawai dengan jenjang jabatan struktural yang telah mengikuti pendidikan
pelatihan Pim IV, diklasifikasikan sebagai pejabat Eselon IVB.
10. Pegawai dengan jenjang jabatan struktural yang berumur kurang dari sama
dengan 39,916 dengan tingkat pendidikan D3 serta memiliki masa kerja lebih
dari sama dengan 8,166 tahun, diklasifikasikan sebagai pejabat Eselon IVB.
11. Pegawai dengan jenjang jabatan struktural yang memiliki tingkat pendidikan
S1 dengan masa kerja lebih dari sama 15 tahun, diklasifikasikan sebagai
pejabat Eselon IVB.
Algoritma lain yang juga menghasilkan akurasi class Eselon IVB cukup tinggi
adalah CRUISE yang diimplementasikan dengan menggunakan data mining tool
berbasis teks dengan nama yang sama yaitu CRUISE. Hasil confusion matrix yang
terbentuk dapat dilihat pada Tabel 4.27.
Tabel 4.27 Confusion Matrix untuk Algoritma CRUISE untuk Eselon IVB
Eselon IVB Non Eselon 317 46 418 1.582
Tabel 4.27 menjelaskan bahwa algoritma CRUISE menghasilkan nilai akurasi
sebesar 80,36% pada prediksi test set Eselon IVB dengan 46 kesalahan prediksi
pada data Eselon IVB, dan 418 kesalahan dalam memprediksi data non eselon.
Dikarenakan ukuran decision tree yang terbentuk dari algoritma ini cukup besar
57
Universitas Indonesia
(53 cabang), maka secara rinci decision tree yang terbentuk dapat dilihat pada
Lampiran 3. Dari decision tree yang terbentuk pada data Eselon IVB dapat
disimpulkan 15 pola pengisian jabatan struktural seperti:
1. Untuk pegawai dengan masa kerja di bawah 15,7083 tahun, yang
diprioritaskan untuk mengisi jabatan struktural Eselon IVB adalah pegawai
dengan jenjang jabatan struktural dan telah mengikuti diklat Pim IV.
2. Pegawai dengan masa kerja di bawah 15,7083 dan jenjang jabatan struktural
yang memiliki masa kerja di atas 1,8333 dapat mengisi jabatan struktural
Eselon IVB apabila berumur di atas 26,2083 tahun.
3. Untuk pegawai dengan masa kerja di bawah 15,7083 dan jenjang jabatan
struktural yang memiliki masa kerja di atas 3,5833 tahun, yang diprioritaskan
untuk mengisi jabatan struktural adalah adalah pegawai dengan pangkat
golongan di atas III/a dan memiliki pengalaman dalam unit kerja di atas
2,54167 tahun.
4. Pegawai dengan masa kerja di bawah 15,7083 dan jenjang jabatan struktural
yang memiliki yang memiliki masa kerja di atas 4,20833 tahun dapat mengisi
jabatan struktural Eselon IVB apabila memiliki pangkat dan golongan di atas
III/a.
5. Pegawai dengan masa kerja di atas 15,7083 tahun yang diprioritaskan mengisi
jabatan struktural Eselon IVB adalah pegawai dengan jenjang jabatan
struktural dengan pangkat golongan di atas III/a, memiliki pengalaman unit
kerja di bawah 4,125 tahun dan telah mengikuti diklat Pim IV.
6. Untuk pegawai dengan masa kerja di atas 15,7083 yang memiliki jenjang
jabatan struktural serta memiliki pangkat golongan III/a yang diprioritaskan
mengisi jabatan struktural Eselon IVB adalah pegawai dengan umur di bawah
50,9167 tahun.
7. Untuk pegawai dengan masa kerja di bawah 15,7083 dan jenjang jabatan
struktural yang memiliki masa kerja di atas 3,5833 tahun dan di bawah 4,208
tahun, yang diprioritaskan untuk mengisi jabatan struktural adalah pegawai
dengan pangkat golongan III/a.
8. Untuk pegawai dengan masa kerja di bawah 15,7083 dan jenjang jabatan
struktural yang memiliki masa kerja di atas 7,791 tahun, yang diprioritaskan
58
Universitas Indonesia
untuk mengisi jabatan struktural adalah pegawai dengan pengalaman unit
kerja lebih dari 0,125 tahun.
9. Untuk pegawai dengan masa kerja di bawah 15,7083 dan jenjang jabatan
struktural yang memiliki masa kerja di atas 7,791 tahun serta memiliki tingkat
pendidikan D3 atau S2, dapat mengisi jabatan struktural Eselon IVB apabila
berumur tidak lebih dari 42,375 tahun.
10. Untuk pegawai dengan masa kerja di bawah 15,7083 dan jenjang jabatan
struktural yang memiliki masa kerja di atas 7,791 tahun serta memiliki tingkat
pendidikan selain D3 atau selain S2, dapat mengisi jabatan struktural Eselon
IVB apabila memiliki pangkat golongan III/d atau IV/a.
11. Untuk pegawai dengan masa kerja di atas 15,7083 yang memiliki jenjang
jabatan struktural serta memiliki pangkat golongan di atas III/a yang
diprioritaskan mengisi jabatan struktural Eselon IVB adalah pegawai dengan
pengalaman unit kerja di atas 4,125 tahun.
12. Untuk pegawai dengan masa kerja di atas 15,7083 yang memiliki jenjang
jabatan struktural serta memiliki pangkat golongan di atas III/a yang
diprioritaskan mengisi jabatan struktural Eselon IVB adalah pegawai dengan
pengalaman unit kerja di bawah 4,125 tahun yang belum pernah mengikuti
pendidikan pelatihan kepemimpian dan memiliki pengalaman unit kerja di
atas 2,208 tahun.
13. Untuk pegawai dengan masa kerja di atas 15,7083 yang memiliki jenjang
jabatan struktural serta memiliki pangkat golongan di atas III/a yang
diprioritaskan mengisi jabatan struktural Eselon IVB adalah pegawai dengan
pengalaman unit kerja di bawah 4,125 tahun yang belum pernah mengikuti
pendidikan pelatihan kepemimpian dan memiliki pengalaman unit kerja tidak
lebih dari 1,833 tahun.
14. Untuk pegawai dengan masa kerja di bawah 15,7083 dan jenjang jabatan
struktural yang memiliki masa kerja di atas 7,791 tahun serta memiliki tingkat
pendidikan selain D3 atau selain S2, dapat mengisi jabatan struktural Eselon
IVB apabila memiliki pendidikan S1, dengan pangkat golongan III/b serta
berumur tidak lebih dari 31,125 tahun.
59
Universitas Indonesia
15. Untuk pegawai dengan masa kerja di bawah 15,7083 dan jenjang jabatan
struktural yang memiliki masa kerja di atas 7,791 tahun serta memiliki tingkat
pendidikan selain D3 atau selain S2, dapat mengisi jabatan struktural Eselon
IVB apabila memiliki pendidikan S1, dengan pangkat golongan III/b,
berumur lebih dari 31,125 tahun serta memiliki masa kerja lebih dari 12,791
tahun.
Pola pengisian jabatan struktural yang terbentuk dari algoritma Jrip dan CRUISE
memiliki beberapa persamaan sebagai berikut:
1. Atribut masa kerja dan jenjang jabatan mendominasi rule yang terbentuk dari
pola pengisian jabatan struktural untuk Eselon IVB.
2. Pada beberapa rule, atribut pendidikan dan pelatihan, pangkat golongan,
tingkat pendidikan, dan umur turut menentukan hasil classification untuk
class Eselon IVB.
Perbedaan dari dua algoritma tersebut adalah pada algoritma Jrip atribut jenjang
jabatan menjadi percabangan pertama dari rule yang terbentuk lalu diikuti oleh
atribut masa kerja. Sedangkan pada algoritma CRUISE percabangan pertama
ditentukan oleh atribut masa kerja, yang kemudian diikuti oleh atribut jenjang
jabatan. Namun dari perbedaan tersebut tidak ditemukan pola pengisian jabatan
struktural yang saling bertentangan.
Hasil classification seluruh algoritma yang tersedia secara lengkap untuk Eselon
IVB dapat dilihat pada Lampiran 2.
4.2.3 Classification pada Data Eselon IVA
Pada data tingkat Eselon IVA terdiri atas 4.062 train set (1.272 Mutasi Jabatan
dan 2.790 Kenaikan Pangkat) dan 2.368 test set dengan hasil classification seperti
pada Tabel 4.28.
Tabel 4.28 Hasil Classification untuk Eselon IVA
Algoritma Pola prediksi
Data mining
tool
Akurasi Train set
Akurasi Test set
Akurasi Eselon IVA
Akurasi Non
eselon
Decorate Ada Weka 91,94% 88,04% 91,79% 87,42%
CRUISE Ada CRUISE 92,17% 85,47% 94,47% 84,08%
60
Universitas Indonesia
Seperti yang dapat dilihat pada tabel 4.28, salah satu algoritma dengan akurasi
eselon terbaik yang menghasilkan pola prediksi adalah algoritma Decorate dengan
confusion matrix eperti yang dapat dilihat padaTabel 4.29.
Tabel 4.29 Confusion Matrix Algoritma Decorate untuk Data Eselon IVA
Eselon IVA Non Eselon
313 28
255 1.772
Tabel 4.29 menjelaskan bahwa algoritma simple cart menghasilkan nilai akurasi
sebesar 88,04% pada prediksi test set Eselon V dengan 28 kesalahan prediksi pada
data Eselon IVA, dan 255 kesalahan dalam memprediksi data non eselon.
Dikarenakan ukuran decision tree yang terbentuk dari algoritma ini cukup besar
(76 cabang), maka secara rinci decision tree yang terbentuk dapat dilihat pada
Lampiran 4.
Dari decision tree yang terbentuk pada data Eselon IVA dapat disimpulkan 19
pola pengisian jabatan struktural seperti:
1. Pegawai dengan jenjang jabatan struktural yang memiliki golongan III/d atau
III/a dapat dijadikan Eselon IVA.
2. Pegawai dengan jenjang jabatan struktural yang memiliki golongan IV/b
dapat dijadikan Eselon IVA jika memiliki tingkat pendidikan S2 atau S1.
3. Pegawai dengan jenjang jabatan struktural yang memiliki golongan IV/a
dapat dijadikan Eselon IVA jika memiliki tingkat pendidikan D3,S1, atau S2.
4. Pegawai dengan jenjang jabatan struktural yang memiliki golongan IV/a
dengan tingkat pendidikan SMA dapat dijadikan Eselon IVA jika berumur di
atas 50,916 tahun.
5. Pegawai dengan jenjang jabatan struktural yang memiliki golongan III/c
dapat dijadikan Eselon IVA jika memiliki pengalaman unit kerja di atas 3,583
tahun.
6. Pegawai dengan jenjang jabatan struktural yang memiliki golongan III/c
dengan pengalaman unit kerja tidak lebih dari 3,583 tahun dapat dijadikan
Eselon IVA jika memiliki tingkat pendidikan D1 atau D3 atau S1 atau S2.
7. Pegawai dengan jenjang jabatan struktural yang memiliki golongan IV/b
dengan tingkat pendidikan S2 dapat dijadikan Eselon IVA jika memiliki masa
61
Universitas Indonesia
kerja tidak lebih dari 17,083 tahun dan telah mengikuti pendidikan dan
pelatihan Pim IV.
8. Pegawai dengan jenjang jabatan struktural yang memiliki golongan III/c
,pengalaman unit kerja tidak lebih dari 1,25 tahun dan tingkat pendidikan
SMA dapat dijadikan Eselon IVA jika memiliki masa kerja tidak lebih dari
27,083 tahun.
9. Pegawai dengan jenjang jabatan struktural yang memiliki golongan III/c
,pengalaman unit kerja tidak lebih dari 1,25 tahun dan tingkat pendidikan
SMA dapat dijadikan Eselon IVA jika memiliki masa kerja lebih dari 28,833
tahun, telah mengikuti pendidikan dan pelatihan Pim IV, dan berumur di atas
52 tahun.
10. Pegawai dengan jenjang jabatan struktural yang memiliki golongan III/c,
pengalaman unit kerja tidak lebih dari 1,25 tahun dan tingkat pendidikan
SMA dapat dijadikan Eselon IVA jika memiliki masa kerja di atas 30,916
tahun meskipun berlum pernah mengikuti pendidikan dan pelatihan Pim IV.
11. Pegawai dengan jenjang jabatan struktural yang memiliki golongan IV/b
dengan tingkat pendidikan S2 tetapi belum mengikuti pendidikan dan
pelatihan Pim IV dapat dijadikan Eselon IVA jika memiliki masa kerja tidak
lebih dari 5,833 tahun dan berumur di bawah 36,583 tahun.
12. Pegawai dengan jenjang jabatan struktural yang memiliki golongan IV/b
dengan tingkat pendidikan S2 tetapi belum mengikuti pendidikan dan
pelatihan Pim IV dapat dijadikan Eselon IVA jika memiliki masa kerja antara
5,833 tahun hingga 7,416 tahun.
13. Pegawai dengan jenjang jabatan struktural yang memiliki golongan IV/b
dengan tingkat pendidikan S2 tetapi belum mengikuti pendidikan dan
pelatihan Pim IV dapat dijadikan Eselon IVA jika memiliki masa kerja lebih
dari 14,916 tahun.
14. Pegawai dengan jenjang jabatan struktural yang memiliki golongan IV/b
dengan tingkat pendidikan S2 tetapi belum mengikuti pendidikan dan
pelatihan Pim IV dapat dijadikan Eselon IVA jika memiliki masa kerja antara
7,416 tahun hingga 14,916 tahun dan berumur di bawah 34,083 tahun.
62
Universitas Indonesia
15. Pegawai dengan jenjang jabatan struktural yang memiliki golongan IV/b
dengan tingkat pendidikan SMA dapat dijadikan Eselon IVA jika memiliki
pengalaman unit kerja antara 0,5 tahun hingga 1,5 tahun dan berumur di atas
49,833 tahun.
16. Pegawai dengan jenjang jabatan struktural yang memiliki golongan IV/b
dengan tingkat pendidikan S1, dan memiliki pengalaman unit kerja di bawah
0,083 tahun dijadikan Eselon IVA jika telah mengikuti pendidikan dan
pelatihan Pim IV dan berumur tidak lebih dari 28,667 tahun.
17. Pegawai dengan jenjang jabatan struktural yang memiliki golongan IV/b
dengan tingkat pendidikan S1, dan memiliki pengalaman unit kerja di bawah
0,083 tahun dijadikan Eselon IVA jika telah mengikuti pendidikan dan
pelatihan Pim IV, berumur lebih dari 28,667 tahun serta memiliki masa kerja
di atas 17,083 tahun.
18. Pegawai dengan jenjang jabatan struktural yang memiliki golongan IV/b
dengan tingkat pendidikan S1, dan memiliki pengalaman unit kerja di bawah
0,083 tahun dijadikan Eselon IVA jika telah mengikuti pendidikan dan
pelatihan Pim IV, berumur lebih dari 43,583 tahun serta memiliki masa kerja
tidak lebih dari 17,083 tahun.
19. Pegawai dengan jenjang jabatan struktural yang memiliki golongan IV/b
dengan tingkat pendidikan S1, memiliki pengalaman unit kerja di bawah
0,083 tahun, meskipun belum mengikuti pendidikan dan pelatihan Pim IV,
dijadikan Eselon IVA jika memiliki masa kerja antara 7,583 tahun hingga
7,916 tahun.
Algoritma lain yang juga menghasilkan akurasi class Eselon IVA cukup tinggi
adalah CRUISE yang diimplementasikan dengan menggunakan data mining tool
berbasis teks dengan nama yang sama yaitu CRUISE. Hasil confusion matrix yang
terbentuk dapat dilihat pada Tabel 4.30.
Tabel 4.30 Confusion Matrix untuk Algoritma CRUISE untuk Eselon IVA
Eselon IVA Non Eselon 322 19 325 1.702
63
Universitas Indonesia
Tabel 4.30 menjelaskan bahwa algoritma CRUISE menghasilkan nilai akurasi
sebesar 85,47% pada prediksi test set Eselon IVA dengan 19 kesalahan prediksi
pada data Eselon IVA, dan 418 kesalahan dalam memprediksi data non eselon.
Decision tree yang terbentuk tidak sebesar decision tree pada data Eselon IVB.
Pada data Eselon IVA decision tree yang terbentuk hanya memiliki 19 cabang
dengan 4 rule utama yang menentukkan class Eselon IVA seperti yang dapat
dilihat pada decision tree berikut:
Node 1 : pangkatgolongan = III/a III/c IV/a IV/b Node 2 : jenjab = Struktural Node 4: Terminal Node, predicted class = IVA Class label : IVA non eselon Class size : 857 244 Node 1 : pangkatgolongan = III/b III/d Node 3 : diklatpim = Pim II Pim III Pim IV Node 6 : pangkatgolongan = III/a III/c III/d IV/a IV/b Node 12: Terminal Node, predicted class = IVA Class label : IVA non eselon Class size : 162 21 Node 6 : pangkatgolongan = III/b Node 13: umur <= 44.6250 Node 26: Terminal Node, predicted class = IVA Class label : IVA non eselon Class size : 27 22 Node 3 : diklatpim = belum mengikuti Node 7: pengalamanunitkerja <= 0.833335E-01 Node 14 : jenjab = Struktural Node 28 : pangkatgolongan = III/d Node 56: Terminal Node, predicted class = IVA Class label : IVA non eselon Class size : 92 34 Node 7: pengalamanunitkerja > 0.833335E-01 Node 15: pengalamanunitkerja <= 3.04167 Node 30: Terminal Node, predicted class = IVA Class label : IVA non eselon Class size : 50 44
64
Universitas Indonesia
Dari decision tree tersebut, 4 pola pengisian jabatan struktural Eselon IVA yang
dapat diidentifikasi adalah:
1. Pegawai dengan pangkat golongan III/a, III/c, IV/a, dan IV/b yang
diutamakan untuk mengisi jabatan struktural Eselon IVA apabila memiliki
jenjang jabatan struktural.
2. Pegawai dengan pangkat golongan III/b atau III/d yang diutamakan untuk
mengisi jabatan struktural Eselon IVA adalah yang pernah mengikuti diklat
Pim.
3. Sedangkan pegawai dengan pangkat golongan III/b atau III/d yang belum
pernah mengikuti diklat Pim pada golongan tersebut dapat mengisi jabatan
struktural Eselon IVA apabila memiliki pengalaman unit kerja tidak lebih dari
0.8333 tahun, memiliki jenjang jabatan struktural, dan memiliki pangkat
golongan III/d.
4. Sedangkan pegawai dengan pangkat golongan III/b atau III/d yang belum
pernah mengikuti diklat Pim pada golongan tersebut dapat mengisi jabatan
struktural Eselon IVA apabila memiliki pengalaman unit kerja antara 0.8333
tahun hingga 3,041 tahun.
Pola pengisian jabatan struktural yang terbentuk dari algoritma Decorate dan
CRUISE memiliki beberapa persamaan sebagai berikut:
1. Atribut pangkat golongan dan jenjang jabatan mendominasi rule yang
terbentuk dari pola pengisian jabatan struktural untuk Eselon IVA.
2. Pada beberapa rule, atribut pendidikan dan pelatihan,pangkat golongan,
tingkat pendidikan, dan umur turut menentukan hasil classification untuk
class Eselon IVA.
Perbedaan dari dua algoritma tersebut adalah pada algoritma Decorate atribut
jenjang jabatan menjadi percabangan pertama dari rule yang terbentuk lalu diikuti
oleh atribut pangkat golongan. Sedangkan pada algoritma CRUISE percabangan
pertama ditentukan oleh atribut pangkat gologan, yang kemudian diikuti oleh
atribut jenjang jabatan. Dari perbedaan tersebut tidak ditemukan pola pengisian
jabatan struktural yang saling bertentangan.
Hasil classification seluruh algoritma yang tersedia secara lengkap untuk Eselon
IVA dapat dilihat pada Lampiran 2.
65
Universitas Indonesia
4.2.4 Classification pada Data Eselon IIIB
Pada data tingkat Eselon IIIB terdiri atas 5.364 train set (254 Mutasi Jabatan dan
5.110 Kenaikan Pangkat) dan 4.223 test set dengan hasil classification dapat
dilihat pada Tabel 4.31.
Tabel 4.31 Hasil Classification untuk Eselon IIIB
Algoritma Pola prediksi
Data mining
tool
Akurasi Train set
Akurasi Test set
Akurasi Eselon
IIIB
Akurasi Non
eselon
Bayes NET Ada Weka 93,90% 96,04% 76,19% 96,35%
CRUISE Ada CRUISE 90,19% 92,92% 98,41% 92,84%
Seperti yang dapat dilihat pada tabel 4.31 algoritma CRUISE menunjukkan
persentase akurasi test set yang tinggi (92,92%), algoritma ini menghasilkan
akurasi prediksi tertinggi dari algoritma lainnya yaitu sebesar 98,41% pada class
Eselon IIIB dan menghasilkan akurasi prediksi class non eselon sebesar 92,84%,
dengan confusion matrix dapat dilihat pada Tabel 4.32.
Tabel 4.32 Confusion Matrix untuk Algoritma CRUISE untuk Eselon IIIB
Eselon IIIB Non Eselon 62 1
298 3.862
Tabel 4.32 menjelaskan bahwa algoritma CRUISE menghasilkan nilai akurasi
sebesar 92,92% pada prediksi test set Eselon IIIB dengan tanpa kesalahan prediksi
pada data Eselon IIIB, dan 283 kesalahan prediksi data non eselon yang
seharusnya tidak menjadi Eselon IIIB.
Secara umum algoritma CRUISE adalah algoritma classification yang dapat
secara simultan mengurangi ukuran decision tree, dan dapat meningkatkan akurasi
prediksi dengan menyesuaikan diskriminan bivariat linier. Berikut ini adalah
model prediksi decision tree yang terbentuk:
66
Universitas Indonesia
jenjab = Fungsional: non eselon (3665)
jenjab = Struktural:
:...pangkat_golongan = III/c: non eselon (884/3) pangkat_golongan in {III/d,IV/a,IV/b,IV/c}: :...pengalaman_unitkerja > 4.83333: IIIB (48/2) pengalaman_unitkerja <= 4.83333: :...diklat = Pim III: IIIB (82/28) diklat in {belum mengikuti,Pim II,Pim IV}: :...tingkat_pendidikan in {D1,D2,D3,S1,S3,SD,SMA, : SMP}: non eselon (449/72) tingkat_pendidikan = S2: :...umur > 53.8333: IIIB (15/3) umur <= 53.8333: :...pangkat_golongan in {IV/a,IV/c}: non eselon (138/32) pangkat_golongan = IV/b: IIIB (2/1) pangkat_golongan = III/d: :...masakerja <= 24.0833: non eselon (65/22) masakerja > 24.0833: IIIB (16/4)
Dari bentuk decision tree tersebut dapat diidentifikasi 5 pola pengisian jabatan
struktural Eselon IIIB sebagai berikut:
1. Pegawai dengan jenjang jabatan struktural yang memiliki pangkat golongan
di atas III/c dapat dijadikan pejabat Eselon IIIB jika memiliki pengalaman
unit kerja di atas 4,833 tahun.
2. Pegawai dengan jenjang jabatan struktural yang memiliki pangkat golongan
di atas III/c dan memiliki pengalaman unit kerja tidak lebih dari 4,833 tahun,
dapat dijadikan pejabat Eselon IIIB jika telah mengikuti pendidikan dan
pelatihan Pim III.
3. Pegawai dengan jenjang jabatan struktural yang memiliki pangkat golongan
di atas III/c dan memiliki pengalaman unit kerja tidak lebih dari 4,833 tahun
tetapi belum mengikuti pendidikan dan pelatihan Pim III, dapat dijadikan
pejabat Eselon IIIB jika memiliki tingkat pendidikan S2 dan berumur di atas
53,833 tahun.
4. Pegawai dengan jenjang jabatan struktural yang memiliki pangkat golongan
IV/b dan memiliki pengalaman unit kerja tidak lebih dari 4,833 tahun tetapi
belum mengikuti pendidikan dan pelatihan Pim III, dapat dijadikan pejabat
Eselon IIIB jika memiliki tingkat pendidikan S2 dan berumur tidak lebih dari
53,833 tahun .
67
Universitas Indonesia
5. Pegawai dengan jenjang jabatan struktural yang memiliki pangkat golongan
III/d dan memiliki pengalaman unit kerja tidak lebih dari 4,833 tahun tetapi
belum mengikuti pendidikan dan pelatihan Pim III, dapat dijadikan pejabat
Eselon IIIB jika berpendidikan S2, berumur tidak lebih dari 53,833 tahun,
dengan masa kerja lebih dari 24,083 tahun .
Algoritma lainnya yang juga menghasilkan pola prediksi dengan akurasi test set
yang cukup tinggi adalah algoritma Bayes NET dengan nilai akurasi sebesar
96,04% dan confusion matrix dapat dilihat pada Tabel 4.33.
Tabel 4.33 Confusion Matrix Algoritma Bayes NET untuk Data Eselon IIIB
Eselon IIIB Non Eselon 48 15
152 4.008
Tabel 4.33 menjelaskan bahwa algoritma Bayes NET menghasilkan nilai akurasi
sebesar 96,04% pada prediksi test set Eselon IIIB dengan 15 kesalahan prediksi
pada data Eselon IIIB, dan 152 kesalahan dalam memprediksi data non eselon.
Berikut ini adalah pola pengisian jabatan struktural yang terbentuk dari algoritma
Bayes NET untuk data Eselon IIIB yang dapat dilihat pada Gambar 4.3.
Gambar 4.3 Pola Pengisian Jabatan Struktural Eselon IIIB
68
Universitas Indonesia
Seperti yang dapat dilihat pada gambar 4.3 algoritma Bayes NET tidak
menganggap suatu atribut lebih penting dari pada atribut lainnya, melainkan
memunculkan nilai peluang munculnya suatu nilai pada atribut. Dari output
algoritma Bayes NET pola pengisian jabatan struktural Eselon IIIB yang dapat
diidentifikasi di antaranya yaitu:
1. Untuk atribut pendidikan dari train set Eselon IIIB, tingkat pendidikan S2
memiliki persentase peluang sebesar 52,8% disusul dengan tingkat
pendidikan S1 dengan persentase peluang sebesar 42,7% untuk menjadi
pejabat Eselon IIIB. Meskipun demikian dari hasil train set non eselon
tingkat pendidikan S1 memiliki persentase peluang sebesar 54,3% untuk
tidak menjadi pejabat Eselon IIIB.
2. Untuk atribut masa kerja dari train set Eselon IIB, pegawai dengan masa
kerja di atas 12,458 tahun memiliki persentase peluang sebesar 93,3% untuk
menjadi pejabat Eselon IIIB. Meskipun demikian dari hasil train set non
eselon, pegawai dengan masa kerja di atas 12,458 tahun memiliki persentase
peluang sebesar 79,99% untuk tidak menjadi pejabat Eselon IIIB.
3. Untuk atribut pendidikan dan pelatihan dari train set Eselon IIIB, pegawai
yang pernah mengikuti diklat Pim IV memiliki persentase peluang sebesar
32,6% untuk menjadi pejabat Eselon IIIB, disusul dengan Pim III dengan
presentase peluang sebesar 27,1%. Hal ini didukung pula oleh train set non
eselon yang menunjukkan pegawai yang belum mengikuti diklat
kepemimpinan sama sekali memiliki persentase peluang sebesar 87,2% untuk
tidak menjadi pejabat Eselon IIIB.
4. Untuk atribut pangkat golongan dari train set Eselon IIIB, pegawai dengan
pangkat golongan III/d memiliki persentase peluang sebesar 61% untuk
menjadi pejabat Eselon IIIB disusul dengan pegawai dengan golongan IV/a
dengan persentase peluang sebesar 30,6%.
5. Untuk atribut pengalaman unit kerja dari train set Eselon IIB, pegawai
dengan pengalaman unit kerja 0 hingga 0,208 tahun memiliki peluang sebesar
61,8% untuk menjadi pejabat Eselon IIIB. Meskipun demikian dari hasil train
set non eselon, pegawai dengan pengalaman unit kerja 0 hingga 0,208 tahun
memiliki peluang sebesar 91,78% untuk tidak menjadi pejabat Eselon IIIB.
69
Universitas Indonesia
6. Untuk atribut jenjang jabatan, dari train set Eselon IIIB, pegawai dengan
jenjang jabatan struktural memiliki persentase peluang sebesar 99,8% untuk
menjadi pejabat Eselon IIIB. Hal ini juga didukung oleh train set non eselon
yang menunjukkan pegawai dengan jenjang jabatan fungsional memiliki
persentase peluang sebesar 71,7% untuk tidak menjadi pejabat Eselon IIB.
7. Untuk atribut umur, pegawai dengan umur maksimal 55,625 tahun memiliki
persentase peluang sebesar 99,8% untuk menjadi pejabat Eselon IIIB.
Meskipun demikian dari hasil train setnon eselon, pegawai dengan maksimal
55,625 tahun memiliki persentase peluang sebesar 86,3% untuk tidak menjadi
pejabat Eselon IIIB.
Pola pengisian jabatan struktural yang terbentuk dari algoritma Bayes NET dan
CRUISE memiliki beberapa persamaan sebagai berikut:
1. Atribut jenjang jabatan struktural memiliki peran penting dalam menentukan
hasil classification. Pada Algoritma CRUISE cabang pertama decision tree
ditentukan oleh atribut jenjang jabatan struktural untuk class Eselon IIIB,
begitu juga pada algoritma Bayes NET jenjang jabatan struktural memiliki
nilai peluang 99,8% untuk menjadi Eselon IIIB.
2. Atribut tingkat pendidikan dengan nilai S2 dan atribut umur dengan nilai di
atas 53,833 tahun menjadi penentu class Eselon IIIB pada dua algoritma ini.
Pada algoritma CRUISE, pegawai dengan tingkat pendidikan S2 dan berumur
di tas 53,833 tahun diklasifikasikan sebagai Eselon IIIB, begitu juga pada
pada algoritma Bayes NET atribut tingkat pendidikan S2 memiliki nilai
peluang sebesar 52,8% dan atribut umur dengan nilai tidak lebih dari 55,625
tahun memiliki peluang sebesar 99,8% untuk diklasifikasikan sebagai Eselon
IIIB.
Perbedaan dari dua algoritma tersebut adalah pada algoritma Bayes NET
penentuan rentang nilai untuk atribut dengan tipe data numerik cukup berbeda
dengan algoritma CRUISE. Sebagai contoh untuk atribut umur pada algoritma
CRUISE dibatasi oleh nilai 53,833 tahun sedangkan pada algoritma Bayes NET
dibatasi oleh nilai 55,625 tahun. Pada atribut masa kerja juga terdapat perbedaan
serupa, pada algoritma CRUISE dibatasi oleh nilai 24,083 tahun pada algoritma
Bayes NET dibatasi oleh nilai 5,166 tahun dan 12,458 tahun. Contoh lainnya
70
Universitas Indonesia
terdapat pada atribut pengalaman unit kerja, pada algoritma CRUISE dibatasi oleh
nilai 4,833 tahun, sedangkan pada algoritma Bayes NET dibatasi oleh nilai 0,208
tahun. Dari perbedaan tersebut hanya atribut pengalaman unit kerja yang terlihat
bertentangan. Hasil classification seluruh algoritma yang tersedia secara lengkap
untuk Eselon IIIB dapat dilihat pada Lampiran 2.
4.2.5 Classification pada data Eselon IIIA
Pada data tingkat Eselon IIIA terdiri atas 4.410 train set (194 Mutasi Jabatan dan
4.216 Kenaikan Pangkat) dan 3.694 test set dengan hasil classification seperti
pada Tabel 4.34.
Tabel 4.34 Hasil Classification untuk Eselon IIIA
Algoritma Pola prediksi
Data mining
tool
Akurasi Train set
Akurasi Test set
Akurasi Eselon IIIA
Akurasi Non
eselon
REP Tree Ada Weka 97,86% 98,64% 81,25% 98,88%
CRUISE Ada CRUISE 90,98% 95,83% 93,75% 95,86%
Algoritma yang menghasilkan pola prediksi class Eselon IIIA cukup tinggi adalah
algoritma REP tree dengan persentase akurasi test set sebesar 98,64% dan
confusion matrix dapat dilihat pada Tabel 4.35.
Tabel 4.35 Confusion Matrix untuk Algoritma REP Tree untuk Eselon IIIA
Eselon IIIA Non Eselon 40 8 41 3605
Tabel 4.34 menjelaskan bahwa algoritma REP tree menghasilkan nilai akurasi
sebesar 98,64% pada prediksi test set Eselon IIIA dengan 8 kesalahan prediksi
pada data Eselon IIIA yang seharusnya menjadi Eselon IIIA, dan 41 kesalahan
prediksi data non eselon yang seharusnya tidak menjadi Eselon IIIA.
Secara umum algoritma REP tree mencoba menyusun decision tree dengan
menggunakan nilai yang ada pada setiap atribut lalu dikurangi dengan nilai error
dengan menggunakan backlifting. Dengan algoritma ini, atribut yang memiliki
nilai numerik hanya diurutkan sekali. Nilai yang kosong pada suatu atribut
dipisahkan menjadi cabang-cabang tersendiri. Berikut adalah decision tree yang
Dari output decision tree yang terbentuk untuk data Eselon IIIA, dapat
diidentifikasi bahwa atribut yang paling berpengaruh untuk data Eselon IIIA
adalah pendidikan dan pelatihan dengan 14 pola pengisian jabatan struktural
sebagai berikut:
1. Untuk pegawai yang pernah mengikuti pendidikan dan pelatihan Pim II
dipastikan dapat mengisi jabatan Eselon IIIA.
2. Pegawai yang pernah mengikuti pendidikan dan pelatihan Pim III, dengan
pangkat golongan IV/a, dan pengalaman unit kerja di bawah 1,13 tahun, serta
memiliki tingkat pendidikan S1 dapat dijadikan Eselon IIIA jika memiliki
masa kerja di bawah 2,25 tahun.
3. Pegawai yang pernah mengikuti pendidikan dan pelatihan Pim III, dengan
pangkat golongan IV/a, dan pengalaman unit kerja di bawah 1,13 tahun, serta
memiliki tingkat pendidikan S1 dapat dijadikan Eselon IIIA jika memiliki
masa kerja di atas 20,83 tahun.
4. Pegawai yang pernah mengikuti pendidikan dan pelatihan Pim III, dengan
pangkat golongan IV/a, dan pengalaman unit kerja di bawah 1,13 tahun, dapat
dijadikan Eselon IIIA jika memiliki tingkat pendidikan S2.
5. Pegawai yang pernah mengikuti pendidikan dan pelatihan Pim III, dengan
pangkat golongan IV/a, dan pengalaman unit kerja di bawah 1,13 tahun, dapat
dijadikan Eselon IIIA jika memiliki tingkat pendidikan D3.
6. Pegawai yang pernah mengikuti pendidikan dan pelatihan Pim III, dengan
pangkat golongan IV/a dapat dijadikan Eselon IIIA jika memiliki pengalaman
unit kerja di atas 2,33 tahun.
7. Pegawai yang pernah mengikuti pendidikan dan pelatihan Pim III, dengan
pangkat golongan III/d dapat dijadikan Eselon IIIA jika memiliki masa kerja
antara 12,83 tahun hingga 14,46 tahun.
8. Untuk pegawai yang pernah mengikuti pendidikan dan pelatihan Pim III
dipastikan dapat mengisi jabatan Eselon IIIA jika memiliki pangkat golongan
IV/b.
9. Untuk pegawai yang pernah mengikuti pendidikan dan pelatihan Pim III
dipastikan dapat mengisi jabatan Eselon IIIA jika memiliki pangkat golongan
IV/c.
73
Universitas Indonesia
10. Pegawai yang pernah mengikuti pendidikan dan pelatihan Pim IV, dengan
pangkat golongan IV/a dan masa pengalaman unit kerja di bawah 4,13 tahun,
dapat mengisi jabatan Eselon IIIA jika memiliki masa kerja lebih dari 16,04
tahun dan berumur antara 42,04 tahun hingga 51,67 tahun.
11. Pegawai yang pernah mengikuti pendidikan dan pelatihan Pim IV, dengan
pangkat golongan IV/a dan masa pengalaman unit kerja di bawah 4,13 serta
memiliki masa kerja di atas 16,04 tahun, dapat mengisi jabatan Eselon IIIA
jika berumur di atas 51,67 tahun dan berpendidikan S1.
12. Pegawai yang pernah mengikuti pendidikan dan pelatihan Pim IV, dengan
pangkat golongan IV/a, dapat mengisi jabatan Eselon IIIA jika memiliki
pengalaman unit kerja lebih daru 4,13 tahun.
13. Untuk pegawai yang pernah mengikuti pendidikan dan pelatihan Pim IV
dipastikan dapat mengisi jabatan Eselon IIIA jika memiliki pangkat golongan
IV/b.
14. Untuk pegawai yang belum pernah mengikuti pendidikan dan pelatihan juga
dapat mengisi jabatan Eselon IIIA jika memiliki jenjang jabatan struktural,
dengan masa kerja lebih dari 22,17 tahun dan memiliki pangkat golongan
IV//b.
Algoritma lain yang menghasilkan akurasi class Eselon IIIA cukup tinggi adalah
CRUISE yang diimplementasikan dengan menggunakan data mining tool berbasis
teks dengan nama yang sama yaitu CRUISE. Hasil confusion matrix yang
terbentuk dapat dilihat pada Tabel 4.36.
Tabel 4.36 Confusion Matrix untuk Algoritma CRUISE untuk Eselon IIIA
Eselon IIIA Non Eselon 45 3 151 3.495
Tabel 4.36 menjelaskan bahwa algoritma CRUISE menghasilkan nilai akurasi
sebesar 95,83% pada prediksi test set Eselon IIIA dengan 3 kesalahan prediksi
pada data Eselon IIIA, dan 151 kesalahan dalam memprediksi data non eselon.
Berikut ini adalah decision tree yang terbentuk:
74
Universitas Indonesia
Node 1 : diklatpim = Pim II Pim III Pim IV Node 2 : pangkatgolongan = IV/a IV/b IV/c Node 4: Terminal Node, predicted class = IIIA Class label : IIIA non eselon Class size : 144 156 Node 2 : pangkatgolongan = III/d Node 5 : diklatpim = Pim III Node 10: Terminal Node, predicted class = IIIA Class label : IIIA non eselon Class size : 6 50 Node 1 : diklatpim = belum mengikuti Node 3 : jenjab = Struktural Node 6 : pangkatgolongan = IV/a IV/b Node 12: Terminal Node, predicted class = IIIA Class label : IIIA non eselon Class size : 37 174 Node 6 : pangkatgolongan = III/d IV/c Node 13 : tingkatpendidikan = D1 D3 Node 26: Terminal Node, predicted class = IIIA Class label : IIIA non eselon Class size : 2 13 Dari decision tree yang terbentuk untuk data Eselon IIIA, dapat diidentifikasi 4
pola pengisian jabatan struktural sebagi berikut:
1. Pegawai yang diprioritaskan untuk mengisi jabatan struktural Eselon IIIA
adalah pegawai yang pernah mengikuti diklat Pim dengan golongan IV/a ke
atas.
2. Pegawai dengan golongan III/d yang diutamakan adalah yang pernah
mengikuti diklat Pim III.
3. Untuk pegawai yang belum pernah mengikuti diklat Pim yang diutamakan
adalah yang memiliki jenjang jabatan struktural dengan pangkat golongan
IV/a atau IV/b.
4. Pegawai dengan pangkat golongan III/d atau IV/c dapat mengisi jabatan
eselon IIIA jika memiliki tingkat pendidikan D1 atau D3.
75
Universitas Indonesia
Pola pengisian jabatan struktural yang terbentuk dari algoritma REP Tree dan
CRUISE memiliki beberapa persamaan sebagai berikut:
1. Atribut pendidikan dan pelatihan menjadi cabang pertama decision tree dari
dua algoritma tersebut.
2. Atribut pangkat golongan menjadi cabang ke-2 pada beberapa cabang dari
decision tree pada dua algoritma tersebut.
Perbedaan yang terlihat dari dua algoritma tersebut adalah pada algoritma
CRUISE, atribut dengan tipe data numerik (masa kerja, pengalaman dalam unit
kerja, dan umur) sama sekali tidak mempengaruhi hasil classification sedangkan
pada algoritma REP Tree atribut numerik seperti masa kerja dan pengalaman unit
kerja turut menentukan hasil classification. Dari perbedaan tersebut tidak
ditemukan pola pengisian jabatan struktural yang saling bertentangan.
Hasil classification seluruh algoritma yang tersedia secara lengkap untuk Eselon
IIIA dapat dilihat pada Lampiran 2.
4.2.6 Classification pada Data Eselon IIB
Pada data tingkat Eselon IIB terdiri atas 3.488 train set (112 Mutasi Jabatan dan
3.376 Kenaikan Pangkat) dan 3.046 test set dengan hasil classification dapat
dilihat pada Tabel 4.37.
Tabel 4.37 Hasil Classification untuk Eselon IIB
Algoritma Pola prediksi
Data mining
tool
Akurasi Train
set
Akurasi Test set
Akurasi Eselon
IIB
Akurasi Non
eselon
Bayes NET Ada Weka 96,3% 98,52% 100% 98,51%
CRUISE Ada CRUISE 83,94% 88,71% 100% 88,6%
Seperti yang dapat dilihat pada tabel 4.37, algoritma yang memiliki akurasi
tertinggi baik untuk class Eselon IIB dan non eselon adalah Bayes NET,
meskipun total akurasi test set-nya hanya mencapai 98,52%, tetapi mampu
menghasilkan akurasi prediksi 100% pada class Eselon IIB dan menghasilkan
akurasi prediksi class non eselon sebesar 98,51%, dengan confusion matrix dapat
dilihat pada Tabel 4.38.
76
Universitas Indonesia
Tabel 4.38 Confusion Matrix Algoritma Bayes NET untuk Eselon IIB
Eselon IIB Non Eselon 29 0 45 2972
Tabel 4.38 di atas menjelaskan bahwa algoritma Bayes NET menghasilkan nilai
akurasi sebesar 98,52% pada prediksi test set Eselon IIB dengan tanpa kesalahan
prediksi pada data Eselon IIB, dan 45 kesalahan prediksi data non eselon yang
seharusnya tidak menjadi Eselon IIB.
Secara umum algoritma Bayes NET mengidentifikasi pola data dengan
menggunakan algoritma pencarian dan pengukuran kualitas. Algoritma ini
menghasilkan nilai kemungkinan dari setiap nilai pada atribut yang ada. Pola
pengisian jabatan struktural yang terbentuk dari algoritma Bayes NET dapat
dilihat pada Gambar 4.4.
Gambar 4.4 Output Algoritma Bayes NET untuk Data Eselon IIB
Seperti yang dapat dilihat pada Gambar 4.4, algoritma Bayes NET tidak
menganggap suatu atribut lebih penting dari pada atribut lainnya. Dari output
algoritma Bayes NET pola pengisian jabatan struktural Eselon IIB yang dapat
diidentifikasi di antaranya yaitu:
1. Untuk atribut pendidikan dari train set Eselon IIB, tingkat pendidikan S2
memiliki persentase peluang sebesar 58,8% disusul dengan tingkat
pendidikan S1 dengan persentase peluang sebesar 28,8% untuk menjadi
pejabat Eselon IIB. Meskipun demikian dari hasil train set non eselon tingkat
77
Universitas Indonesia
pendidikan S1 memiliki persentase peluang sebesar 49,4% untuk tidak
menjadi pejabat Eselon IIIB.
2. Untuk atribut masa kerja dari train set Eselon IIB, pegawai dengan masa
kerja di atas 23,625 tahun memiliki persentase peluang sebesar 56,6% untuk
menjadi pejabat Eselon IIB. Meskipun demikian dari hasil train setnon
eselon, pegawai dengan masa kerja di atas 23,625 tahun memiliki persentase
peluang sebesar 38,1% untuk tidak menjadi pejabat Eselon IIB.
3. Untuk atribut pendidikan dan pelatihan dari train set Eselon IIB, pegawai
yang pernah mengikuti diklat Pim III memiliki persentase peluang sebesar
39,9% untuk menjadi pejabat Eselon IIB, disusul dengan Pim II dengan
presentase peluang sebesar 31,1%. Hal ini didukung pula oleh train set non
eselon yang menunjukkan pegawai yang belum mengikuti diklat
kepemimpinan sama sekali memiliki persentase peluang sebesar 91,1% untuk
tidak menjadi pejabat Eselon IIB.
4. Untuk atribut pangkat golongan dari train set Eselon IIB, pegawai dengan
pangkat golongan IV/b memiliki persentase peluang sebesar 59,3% untuk
menjadi pejabat Eselon IIB. Sedangkan dari hasil train set non eselon,
pegawai dengan pangkat golongan IV/a memiliki persentase peluang sebesar
90,9% untuk tidak menjadi pejabat Eselon IIB.
5. Untuk atribut pengalaman unit kerja dari train set Eselon IIB, pegawai
dengan pengalaman unit kerja 0 hingga 0,08 tahun memiliki peluang sebesar
81% untuk menjadi pejabat Eselon IIB. Meskipun demikian dari hasil train
set non eselon, pegawai dengan pengalaman unit kerja 0 hingga 0,08 tahun
memiliki peluang sebesar 96,8% untuk tidak menjadi pejabat Eselon IIB.
6. Untuk atribut jenjang jabatan, dari train set Eselon IIB, pegawai dengan
jenjang jabatan struktural memiliki persentase peluang sebesar 99,6% untuk
menjadi pejabat Eselon IIB. Hal ini juga didukung oleh train set non eselon
yang menunjukkan pegawai dengan jenjang jabatan fungsional memiliki
persentase peluang sebesar 84,9% untuk tidak menjadi pejabat Eselon IIB.
7. Untuk atribut umur, pegawai dengan umur maksimal 56,7 tahun memiliki
persentase peluang sebesar 99,6% untuk menjadi pejabat Eselon
IIB.Meskipun demikian dari hasil train set non eselon, pegawai dengan
78
Universitas Indonesia
maksimal 56,7 tahun memiliki persentase peluang sebesar 83,5% untuk tidak
menjadi pejabat Eselon IIB.
Algoritma lain yang juga menghasilkan akurasi class Eselon IIB cukup tinggi
adalah CRUISE yang diimplementasikan dengan menggunakan data mining tool
berbasis teks dengan nama yang sama yaitu CRUISE. Hasil confusion matrix yang
terbentuk dapat dilihat pada Tabel 4.39.
Tabel 4.39 Confusion Matrix untuk Algoritma CRUISE untuk Eselon IIB
Eselon IIB Non Eselon 29 0 344 2.673
Tabel 4.39, menjelaskan bahwa algoritma CRUISE menghasilkan nilai akurasi
sebesar 88,71% pada prediksi test set Eselon IIB dengan tanpa kesalahan prediksi
pada data Eselon IIB, dan 344 kesalahan dalam memprediksi data non eselon.
Berikut ini adalah decision tree yang terbentuk:
Node 1 : diklatpim = Pim II Pim III Pim IV Node 2: Terminal Node, predicted class = IIB Class label : IIB non eselon Class size : 87 300
Node 1 : diklatpim = belum mengikuti
Node 3 : pangkatgolongan = III/a III/b III/c III/d IV/b IV/c Node 6: Terminal Node, predicted class = IIB Class label : IIB non eselon Class size : 22 248
Node 3 : pangkatgolongan = IV/a
Node 7 : jenjab = Struktural Node 14 : tingkatpendidikan = D3 Node 28: Terminal Node, predicted class = IIB Class label : IIB non eselon Class size : 1 6
Node 29: masakerja > 27.9167
Node 59 : tingkatpendidikan = S1 Node 118: Terminal Node, predicted class = IIB Class label : IIB non eselon Class size : 2 6
79
Universitas Indonesia
Dari decision tree yang terbentuk untuk data Eselon IIB di atas, 4 pola pengisian
jabatan struktural yang dapat diidentifikasi:
1. Pegawai yang diprioritaskan mengisi jabatan Eselon IIB adalah yang pernah
mengikuti diklat Pim.
2. Untuk pegawai yang belum pernah mengikuti diklat Pim yang diutamakan
untuk mengisi jabatan struktural Eselon IIB adalah pegawai yang memiliki
pangkat golongan IV/a dengan jenjang jabatan struktural, dengan tingkat
pendidikan D3.
3. Untuk pegawai yang belum pernah mengikuti diklat Pim yang diutamakan
untuk mengisi jabatan struktural Eselon IIB adalah pegawai yang memiliki
pangkat golongan IV/a dengan jenjang jabatan struktural, masa kerja di atas
27.9167 tahun dan tingkat pendidikan S1.
4. Untuk pegawai di atas golongan IV/a dapat diklasifikasikan sebagai Eselon
IIB.
Pola pengisian jabatan struktural yang terbentuk dari algoritma Bayes NET dan
CRUISE memiliki beberapa persamaan sebagai berikut:
1. Atribut pendidikan dan pelatihan memiliki peranan penting dalam menentukan
hasil classification pada dua algoritma ini. Pada algoritma CRUISE atribut
pendidikan pelatihan menjadi cabang pertama dalam melakukan classification,
begitu juga pada algoritma Bayes NET atribut pendidikan dan pelatihan dengan
nilai yang pernah mengikuti pendidikan dan pelatihan memiliki nilai peluang
sebesar 77,6% untuk menjadi Eselon IIB.
2. Atribut pangkat golongan juga memiliki peranan penting dalam menentukan
hasil classification pada dua algoritma ini khususnya untuk nilai golongan di
atas IV/a. Pada algoritma CRUISE atribut pangkat golongan dengan nilai di
atas IV/a dipastikan dapat mengisi jabatan Eselon IIB, begitu juga pada
algoritma Bayes NET nilai atribut pangkat golongan khususnya golongan di
atas IV/a memiliki peluang sebesar 73,6% untuk menjadi Eselon IIB.
Perbedaan yang terlihat dari dua algoritma tersebut adalah pada algoritma
CRUISE, dari 3 atribut numerik hanya atribut masa kerja yang mempengaruhi
hasil classification sedangkan pada algoritma Bayes NET atribut numerik seperti
masa kerja dan pengalaman unit kerja turut menentukan hasil classification. Dari
80
Universitas Indonesia
perbedaan tersebut tidak ditemukan pola pengisian jabatan struktural yang saling
bertentangan.
4.2.7 Classification pada Data Eselon IIA
Pada data tingkat Eselon IIA terdiri atas 395 train set (3 Mutasi Jabatan dan 392
Kenaikan Pangkat) dan 271 test set dengan hasil classification dapat dilihat pada
Tabel 4.40.
Tabel 4.40 Hasil Classification untuk Eselon IIA
Algoritma Pola prediksi
Data mining
tool
Akurasi Train set
Akurasi Test set
Akurasi Eselon
IIA
Akurasi Non
eselon Bayes NET Ada Weka 99,74% 100% 100% 100%
CRUISE Ada CRUISE 0,76% 100% 100% 100%
Seperti yang dapat dilihat pada tabel 4.40, untuk data Eselon IIA hampir seluruh
algoritma yang digunakan menghasilkan prediksi yang 100% akurat. Hanya 7 dari
62 algoritma yang digunakan menghasilkan akurasi di bawah 100%. Matrix
confusion yang dihasilkan dapat dilihat pada Tabel 4.41.
Tabel 4.41 Confusion Matrix Algoritma Bayes NET untuk Eselon IIA
Eselon IIA Non Eselon 0 0 0 271
Tabel 4.41 di atas menjelaskan bahwa 55 dari 62 algoritma secara akurat
memprediksi data Eselon IIA dan non eselon, Nilai 0 pada kolom Eselon IIA dan
baris pertama menunjukkan tidak ada posisi eselon yang terisi. Hal ini sesuai
dengan kondisi terakhir pada tanggal 10 Januari 2014, dengan jabatan Eselon IIA
masih kosong karena Sekretaris Daerah Kota Bogor yang terdahulu mengajukan
cuti di luar tanggungan negara karena mencalonkan diri sebagai wakil walikota
pada Pemilu Kepala Daerah di akhir tahun 2013.
Algoritma Bayes NET memiliki akurasi cukup tinggi di beberapa tingkat eselon,
maka pada data Eselon IIA akan menggunakan contoh output model prediksi dari
algoritma Bayes NET seperti pada Gambar 4.5.
81
Universitas Indonesia
Gambar 4.5 Output Agoritma Bayes NET untuk Data Eselon IIA
Seperti yang dapat dilihat pada gambar 4.5, algoritma Bayes NET tidak
menganggap suatu atribut lebih penting dari pada atribut lainnya, melainkan
memunculkan nilai peluang munculnya suatu nilai pada atribut. Dari output
algoritma Bayes NET pola pengisian jabatan struktural Eselon IIA yang dapat
diidentifikasi di antaranya yaitu:
1. Untuk atribut pendidikan dari train set Eselon IIA, tingkat pendidikan S2
memiliki persentase peluang sebesar 50% untuk menjadi pejabat Eselon IIA.
Meskipun demikian dari hasil train set non eselon tingkat pendidikan S2
memiliki persentase peluang sebesar 40,5% untuk tidak menjadi pejabat
Eselon IIIA.
2. yang pernah mengikuti diklat Pim II memiliki persentase peluang sebesar
70% untuk menjadi pejabat Eselon IIA. Hal ini didukung pula oleh train set
non eselon yang menunjukkan pegawai yang belum mengikuti diklat
kepemimpinan sama sekali memiliki persentase peluang sebesar 66,9% untuk
tidak menjadi pejabat Eselon IIA.
3. Untuk atribut pangkat golongan dari train set Eselon IIA, pegawai dengan
pangkat golongan III/c, IV/c, dan IV/d memiliki persentase peluang yang
sama sebesar 30% untuk menjadi pejabat Eselon IIA. Sedangkan dari hasil
82
Universitas Indonesia
train set non eselon, pegawai dengan pangkat golongan IV/b memiliki
persentase peluang sebesar 90% untuk tidak menjadi pejabat Eselon IIA.
4. Untuk atribut jenjang jabatan, dari train set Eselon IIA, pegawai dengan
jenjang jabatan struktural memiliki persentase peluang sebesar 87,5% untuk
menjadi pejabat Eselon IIA. Hal ini juga didukung oleh train set non eselon
yang menunjukkan pegawai dengan jenjang jabatan fungsional memiliki
persentase peluang sebesar 58,4% untuk tidak menjadi pejabat Eselon IIA.
5. Untuk atribut umur, masa kerja, dan pengalaman dalam unit kerja pada data
Eselon IIA, algoritma Bayes NET tidak melakukan klasifikasi berdasarkan
nilai rentang tertentu dalam arti berapapun umur, masa kerja maupun
pengalaman unit kerja pegawai, semuanya memiliki peluang yang sama untuk
dapat menjadi pejabat Eselon IIA.
Algoritma lain yang juga memiliki persentase akurasi terbaik di beberapa tingkat
eselon adalah algoritma CRUISE dengan nilai persentase dan confusion matrix
yang sama dengan algoritma Bayes NET dan C5.0. Decision tree yang terbentuk
dari algoritma CRUISE untuk data Eselon IIA adalah sebagai berikut:
Node 1: Terminal Node, predicted class = IIA Class label : IIA non eselon Class size : 3 392 Dari decision tree yang cukup sederhana di atas dapat dilihat bahwa algoritma
CRUISE tidak dapat menentukan atribut mana yang menjadi penentu class Eselon
IIA mengingat ukuran class yang cukup kecil yaitu 3 record.
Tidak ditemukan kesamaan pada dua algoritma ini mengingat decision tree dari
algoritma CRUISE tidak dapat menentukan class Eselon IIA karena ukuran train
set yang terlalu kecil.
4.3 Analisis Hasil Prediksi
Dari 21.649 train set (3.004 mutasi jabatan dan 18.645 kenaikan pangkat) dan
16.966 test set yang digunakan teknik data mining classification untuk pengisian
jabatan struktural menghasilkan akurasi prediksi class eselon dan algoritma
terbaik yang beragam untuk tiap tingkat eselon, seperti yang dapat dilihat pada
Gambar 4.6:
83
Universitas Indonesia
Gambar 4.6 Grafik Persentase Akurasi Prediksi Class Eselon
Secara umum algoritma CRUISE memiliki rata-rata akurasi prediksi class eselon
yang paling baik di setiap tingkat eselon dengan akurasi sebesar 95,7%. Meskipun
algoritma ini hanya menjadi akurasi paling baik pada 4 tingkat eselon yaitu Eselon
V,IIIB, IIB dan IIA tetapi secara umum nilai akurasinya sangat konsisten dengan
nilai akurasi tertinggi 100% dan nilai akurasi terendah adalah 83,3% pada tingkat
Eselon IVB.
Algoritma lain yang juga menghasilkan pola prediksi dengan akurasi class eselon
yang cukup baik adalah algoritma Bayes NET. Algoritma ini memiliki rata-rata
akurasi sebesar 89,57% di setiap tingkat eselon dengan nilai akurasi tertinggi
100% dan nilai akurasi terendah adalah 76,19% pada tingkat Eselon IIIB.
4.4 Diskusi: Pola Umum Pengisian Jabatan Struktural Setiap Eselon
Meskipun pada pembahasan sebelumnya dapat dilihat bahwa setiap tingkat eselon
memiliki pola pengisian jabatan struktural yang berbeda-beda, tetapi beberapa
atribut yang sama selalu muncul di beberapa tingkat eselon di antaranya adalah:
84
Universitas Indonesia
Pada semua tingkat eselon kecuali Eselon IIA, atribut jenjang jabatan selalu
muncul dengan jenjang jabatan struktural yang selalu mendominasi pengisian
jabatan struktural dibandingkan dengan jenjang jabatan fungsional.
Pada tingkat Eselon IIIA ,IIB, dan IIA atribut pendidikan dan pelatihan
muncul sebagai atribut penentu classifier. Pada tiga tingkat eselon tersebut
atribut pendidikan dan pelatihan selalu menjadi prioritas pertama.
Pada tingkat Eselon IVB,IVA,IIB, dan IIIA atribut pangkat golongan pegawai
muncul sebagai atribut penentu classifier. Pada tingkat Eselon IVB atribut
pangkat golongan berada pada prioritas ke-3. Pada tingkat Eselon IVA atribut
pangkat golongan berada pada prioritas ke-2 setelah atribut jenjang jabatan.
Atribut pengalaman unit kerja juga menjadi atribut penentu classifier.Pada
tingkat Eselon V, IIIB dan IIIA atribut pengalaman unit kerja berada pada
prioritas ke-3.Pada tiga tingkat Eselon V dan IVB atribut masa kerja selalu
menjadi prioritas ke-2.
Atribut masa kerja menjadi atribut penentu classifier pada beberapa tingkat
eselon.
Dari beberapa poin di atas sesuai dengan jumlah kemunculan atribut penentu
classifier di setiap tingkat eselon maka dapat disimpulkan bahwa urutan
prioritas atribut yang terbentuk dari setiap tingkat eselon adalah jenjang
jabatan, pangkat golongan, pendidikan dan pelatihan, tingkat pendidikan,
masa kerja, pengalaman dalam unit kerja serta umur.
4.5 Analisis Dampak
Hasil dari penelitian ini tentunya harus dapat bermanfaat bagi organisasi dan
keilmuan. Dampak bagi organisasi dalam hal ini adalah tim Baperjakat
Pemerintah Kota Bogor. Dampak keilmuan khususnya terkait dengan
pemanfaatan teknik data mining classification di bidang pengelolaan sumber daya
manusia.
4.5.1 Analisis Dampak Organisasi
Pola pengisian jabatan struktural yang didapatkan tentunya dapat menjadi acuan
untuk membentuk rules dalam modul SIMPEG. Sebagai contoh apabila terdapat
85
Universitas Indonesia
kekosongan jabatan pada tingkat Eselon V, maka rule yang didapat dari algoritma
CRUISE untuk Eselon V yaitu:
Node 1: masakerja > 12.2917 Node 3 : jenjab = Struktural Node 6: Terminal Node, predicted class = V Class label : V non eselon Class size : 73 8 Rule tersebut akan diimplementasikan ke dalam bahasa SQL untuk mendapatkan calon kandidiat untuk mengisi kekosongan tersebut, dengan menuliskan script PHP berikut:
<?php
include(“koneksi.php”);
$q=mysql_query(“select nama, datediff(year, tmt, curdate()) as ‘masa kerja’ from pegawai inner join sk on sk.id_pegawai = pegawai.id_pegawai where id_kategori_sk=6 and pangkat_gol=III/a or pangkat_gol=III/b and jenjab = ‘struktural’ and datediff(year, tmt, curdate()) > 12.2917 order by ‘masa kerja’ desc”)
while($q=mysql_fetch_array($q)
print_r($q);
?>
Penjelasan script PHP di atas adalah sebagai berikut:
Fungsi include(“koneksi.php”), digunakan untuk konfigurasi koneksi basis
data.
Statement $q=mysql_query(“ “), digunakan untuk menulis script SQL yang
akan dieksekusi.
Script SQL select nama, datediff(year, tmt, curdate()) as ‘masa kerja’ from
pegawai, berfungsi mengambil kolom nama dan menghitung selisih antara
tanggal hari ini dengan kolom tmt pada SK CPNS (id_kategori=6) dengan
menyimpan sebagai kolom ‘masa kerja’.
Bagian inner join sk on sk.id_pegawai = pegawai.id_pegawai where
id_kategori_sk=6, digunakan untuk menghubungkan table pegawai dengan
table sk dan hanya mengambil SK CPNS saja (id_kategori=6).
Bagian and pangkat_gol=III/a or pangkat_gol=III/b, berfungsi mengambil
data pegawai yang memiliki golongan III/a atau III/b saja, yang merupakan
syarat golongan untuk eselon V.
86
Universitas Indonesia
Bagian and jenjab = ‘struktural’, berfungsi mengambil data pegawai dengan
jenjang jabatan structural saja.
Bagian and datediff(year, tmt, curdate()) > 12.2917 berfungsi mengambil
masa kerja pegawai di atas 12.2917 tahun.
Bagian order by ‘masa kerja’ desc berfungsi mengurutkan data yang diambil
berdasarkan masa kerja yang terbesar hingga masa kerja terbesar.
Pola yang dihasilkan secara rinci dapat dilihat pada Sub Bab 4.2. Rules yang
diimplementasikan pada modul baru SIMPEG tentunya akan menambah
kemampuan SIMPEG dalam menyusun draft pengisian jabatan struktural secara
otomatis. Dengan adanya kemampuan tersebut, Baperjakat tidak perlu lagi
menyusun menyusun draft pengisian jabatan struktural secara manual karena
sudah dapat disusun dengan menggunakan SIMPEG.
4.5.2 Analisis Dampak Keilmuan
Hasil penelitian ini menunjukkan bahwa teknik data mining classification dapat
digunakan untuk membantu pengelolaan manajemen sumber daya manusia
khususnya dalam lingkungan pemerintahan. Secara umum teknik ini juga dapat
dimanfaatkan dalam perusahaan atau organisasi lain dengan penentuan atribut
sesuai kebijakan perusahaan atau organisasi tersebut. Dengan demikian penelitian
ini dapat dijadikan acuan bagi penelitan-penelitan serupa untuk menggunakan
teknik yang sama dalam pengelolaan sumber daya manusia secara umum dan
menempatkan sumber daya yang tepat di posisi yang tepat secara khusus.
87 Universitas Indonesia
BAB 5
KESIMPULAN DAN SARAN
Dari hasil analisis dan pembahasan mengenai pemanfaatan teknik data mining
classification untuk pola pengisian jabatan struktural pada Pemerintah Kota Bogor
dapat ditarik beberapa kesimpulan dan saran sebagai berikut:
5.1 Kesimpulan
Beberapa kesimpulan yang dapat ditarik dari hasil pada penelitian ini di antaranya
yaitu:
Meskipun pada setiap tingkat eselon menghasilkan pola pengisian jabatan
struktural yang berbeda, beberapa atribut selalu muncul secara dominan di
setiap pola prediksi dan tingkat eselon. Urutan atribut yang terbentuk
sebagai berikut: jenjang jabatan, pangkat golongan, pendidikan dan
pelatihan, tingkat pendidikan, masa kerja, pengalaman dalam unit kerja serta
umur. Secara rinci hasil pola pengisian yang terbentuk dapat dilihat pada
Sub Bab 4.2.
Pola pengisian jabatan struktural yang terbentuk akan menjadi rule yang
diimplementasikan menjadi modul baru dalam SIMPEG. Modul tersebut
tentunya akan menambah kemampuan pendukung keputusan berupa draft
pengisian jabatan struktural. Hal ini dapat menjawab permasalahan seperti
yang dijelaskan pada Gambar 1.1.
Setiap data set tingkat eselon menghasilkan algoritma terbaik yang berbeda
dan tingkat akurasi class eselon yang berbeda pula, sebagaimana dibahas
pada Sub Bab 4.3. Algoritma CRUISE secara umum menghasilkan rata-rata
akurasi yang paling baik dengan tingkat akurasi sebesar 95,7%, disusul oleh
algoritma Bayes NET dengan akurasi 89,57%.
88
Universitas Indonesia
5.2 Saran
Beberapa saran yang dapat dijadikan masukan untuk penelitan serupa di masa
yang akan datang di antaranya yaitu:
Sejalan dengan berjalannya waktu, akan muncul algoritma baru dari teknik
data mining classification. Algoritma baru tersebut dapat diimplementasikan
pada berbagai data mining tools. Hal ini tentunya patut untuk dicoba untuk
meningkatkan akurasi prediksi test set dari model prediksi train set.
Perlu dikembangan sebuah web service yang dapat menjembatani data mining
tool Weka yang berbasis JAVA dengan SIMPEG yang berbasis PHP. Web
service tersebut dapat dikembangan dengan menggunakan bahasa XML dengan
memanfaatkan API berbasis JAVA pada data mining tool Weka, sehingga
keduanya dapat saling berkomunikasi. Web service tersebut dapat
dimanfaatkan untuk memudahkan proses input data dari SIMPEG ke Weka dan
output prediksi dari Weka ke SIMPEG secara otomatis.
Diharapkan penelitian selanjutnya dapat menggunakan jumlah train set yang
lebih banyak untuk menghasilkan model prediktif yang lebih baik. Hal tersebut
mengingat penelitian ini hanya menggunakan data kepegawaian dari tahun
2009 hingga 2013 untuk memprediksi jabatan struktural di tahun 2014.
Classifier yang digunakan dalam penelitian ini adalah untuk tingkat eselon,
tidak secara spesifik untuk jabatan struktral tertentu dalam unit kerja. Hal ini
mengingat jumlah train set untuk setiap jabatan struktural yang terlalu sedikit.
Diharapkan penelitian selanjutnya dapat menggunakan atribut classifier yang
lebih spesifik pada setiap jabatan struktural yang ada.
89
Universitas Indonesia
DAFTAR PUSTAKA
Farisi, Afif. (2009). Pembandingan tingkat akurasi dua model data mining yang dihasilkan oleh decision tree dan naïve bayes studi kasus: suatu perusahaan manufaktur dan penjualan sepeda. Jakarta: MTI Universitas Indonesia. Han, J., Kamber, M., (2006). Data mining concepts and techniques. San Francisco: Morgan Kaufmann Publishers. Jantan, H., Hamdan, A.R., Othman, Z.A. (2011). Data mining classification Techniques for human talent forecasting. Selangor, Malaysia: Faculty of Computer and Mathematical Sciences UTM, Terengganu and Faculty of Information Science and Technology UKM. Kementrian Sekretariat Negara Republik Indonesia. (2000). Peraturan Pemerintah Republik Indonesia Nomor 100 Tahun 2000 tentang Pengangkatan PNS dalam Jabatan Struktural. Jakarta: Kementrian Sekretariat Negara Republik Indonesia Kementrian Sekretariat Negara Republik Indonesia. (2002). Peraturan Pemerintah Republik Indonesia Nomor 13 Tahun 2002 tentang Perubahan atas Peraturan Pemerintah Republik Indonesia Nomor 100 Tahun 2000 tentang Pengangkatan PNS dalam Jabatan Struktural. Jakarta: Kementrian Sekretariat Negara Republik Indonesia. Pehlivanli., Ayca, C. (2011). The comparison of data mining tool. Istanbul, Turki: Department of Computer Engineering İstanbul Kültür University. Turban, E., Aronson, J.E., Liang ,T. (2005). Decission support systems and intelligent systems. New Jersey: Pearson Education, Inc. Yashoda, E. Prakash, P.S. (2012). Data mining classifcation technique for talent management using SVM. Salem, Tamilnadu: Department of Computer science and Engineering, Sona College of Technology Ye, Peng. (2011). The Decision tree Classifcation And Its Application Research In Personnel Management. Huanggang, China: Huanggang Normal University .
90
Universitas Indonesia
Lampiran 1 Lampiran Transkrip Wawancara
Transkrip Wawancara Kepala Bidang Mutasi dan Pengembangan Karir Pegawai
selaku Sekretaris Badan pertimbangan Jabatan dan Kepangkatan (Baperjakat).
Unit Kerja : Badan Kepegawaian Pendidikan dan Pelatihan
Jabatan : Kepala Bidang Mutasi dan Pengembangan Karir Pegawai
Tanggal : 19 Desember 2013
Tempat : Ruang Bidang Mutasi dan Pengembangan Karir Pegawai BKPP,
Gedung Sekretarian Daerah Kota Bogor Lantai 2, Pemerintah
Kota Bogor
TWR : Tosan Wiar Ramdhani
NS : Nara Sumber
1. TWR : Bisa ibu ceritakan isu-su terkait dalam pengisian jabatan
struktural di lingkungan Pemerintah Kota Bogor?
NS : Wah cukup banyak di antaranya: belum tersusunya pola karir
untuk jabatan struktural dimana pada level kementrian hal ini sudah
tersusun dengan baik. Tim Baperjakat juga merasa kesulitan dalam
menulusuri data calon pejabat struktural yang diusulkan mengingat data
jabatan struktural pada basis data SIMPEG hanya mencatat mulai tahun
2009, dan kita tetap harus menulusuri data tersebut secara manual
satu per satu dengan menggunakan aplikasi SIMPEG.
2. TWR : Menurut ibu saat ini SIMPEG belum cukup membantu?
NS : Dari sisi data mungkin sudah tersedia meskipun tidak cukup
lengkap, karena kita tentunya ingin melihat riwayat jabatan seseorang
sebelum 2009. Oleh karena itu saya sempat menghimbau untuk
menyebarkan formulir kepada seluruh pejabat struktural untuk mengisi
data riwayat jabatan dengan lengkap agar dapat dimasukkan ke dalam
basis data SIMPEG. Selain dari pada itu akan sangat membantu tim
Baperjakat jika SIMPEG mampu mengusulkan nama-nama calon
pejabat struktural jika terjadi mutasi jabatan struktural.
91
Universitas Indonesia
(Lanjutan Lampiran 1)
3. TWR : Itu bisa saja dibuat bu, hanya bagaimana dengan regulasi yang
ada, apakah sudah cukup jelas teknis pelaksanaanya?
NS : Itu satu kendala lain, Peraturaturan Pemerintah No 2 Tahun
2000 yang kemudian diperbarui dengan Peraturaturan Pemerintah
No 13 Tahun 2002 tidak secara spesifik mengatur mana komponen
kepegawaian yang menjadi prioritas dalam mengisi suatu jabatan
struktural. Syarat minimalnya hanya pangkat golongan dan untuk
komponen lainnya seperti masa kerja pegawai, pendidikan dan pelatihan
pegawai serta pengalaman dalam unit kerja tidak jelas pembobotannya.
Jadi bagaimana pak, apakah bapak bisa membuat SIMPEG memiliki
kemampuan untuk memberikan usulan dafttar jabatan secara otomatis?
4. TWR : Seperti yang saya jelaskan sebelumnya bu, hal itu bisa saja
dilakukan, tapi harus jelas terlebih dahulu regulasinya. Dikarenakan tidak
ada pembobotan spesifik terhadap komponen penilaian pegawai yang ibu
jelaskan tadi, maka perlu dipelajari pola pengisian jabatan struktural
sebelumnya dari basis data SIMPEG. Jika ibu tidak keberatan maka
masalah ini yang akan saya angkat menjadi penelitian untuk karya akhir
dalam masa tugas belajar saya.
NS : Silakan pak , saya sangat mendukung selama itu nantinya akan
memudahkan tugas Baperjakat dan saya juga akan bicarakan dengan
anggota Baperjakat lainnya.
5. TWR : Baik bu, apakah saya nanti diperkenankan melakukan presentasi
di depan tim Baperjakat?
NS : Silahkan saja, tapi menurut saya karena Baperjakat jarang sekali
mengadakan pertemuan kecuali jika ada mutasi jabatan struktural, saya
sarankan bapak melakukan presentasi kepada 3 dari total 7 anggota
Baperjakat yang ada di BKPP saja termasuk saya.
6. TWR : Baik bu, terima kasih banyak atas waktu dan kesempatan yang
diberikan.
92
Universitas Indonesia
Lampiran 2 Hasil Akurasi Classification untuk Setiap Tingkat Eselon
Tabel Hasil Classification untuk Eselon V
Algoritma Pola prediksi
Data mining
tool
Akurasi Train
set
Akurasi Test set
Akurasi Eselon
V
Akurasi Non
eselon
K-Star Tidak Ada
Weka 99,89% 95,3% 100% 95,21%
AD tree Ada Weka 100% 94,8% 100% 94,71%
LAD tree Ada Weka 99,89% 94,8% 100% 94,71%
Random tree Ada Weka 100% 94,8% 100% 94,71%
Bayes NET Ada Weka 98,93% 94,7% 100% 94,61%
hyper pipes Tidak Ada
Weka 99,14% 94,7% 100% 94,61%
VFI Tidak Ada
Weka 99,14% 94,7% 100% 94,61%
C5,0 Ada R 99,8% 94,6% 100% 94,51%
End Tidak Ada
Weka 99,78% 94,6% 100% 94,51%
J-48 Ada Weka 99,78% 94,6% 100% 94,51%
J-48 graft Ada Weka 99,78% 94,6% 100% 94,51%
NB Tree Ada Weka 100% 94,5% 100% 94,4%
Random Forrest
Ada Weka 100% 94,5% 100% 94,4%
SMO Ada Weka 98,83% 94,4% 100% 94,3%
Ridor Ada Weka 100% 94,3% 100% 94,2%
CRUISE Ada CRUISE 99,15% 94,21% 100% 94,1%
DTNB Tidak Ada
Weka 99,14% 94,2% 100% 94,1%
Decision table
Tidak Ada
Weka 99,57% 94,06% 100% 93,9%
Threshold selector
Ada Weka 99,14% 93,9% 100% 93,79%
Ordinal class classifier
Tidak Ada
Weka 98,72% 93,2% 100% 93,08%
Dagging Tidak Ada
Weka 98,61% 92,8% 100% 92,68%
Conjuctive rule
Ada Weka 98,4% 92,6% 100% 92,47%
Decision stump
Tidak Ada
Weka 98,46% 92,6% 100% 92,47%
93
Universitas Indonesia
(Lanjutan Lampiran 2)
Algoritma Pola prediksi
Data mining
tool
Akurasi Train
set
Akurasi Test set
Akurasi Eselon
V
Akurasi Non
eselon LWL Tidak
Ada Weka 98,4% 92,6% 100% 92,47%
One R Ada Weka 98,4% 92,6% 100% 92,47%
Clsasification via clustering
Ada Weka 96,08% 91,5% 100% 91,35%
Simple logistic
Ada Weka 99,36% 94,2% 94,44% 98,72%
Spegasos Ada Weka 99,46% 95,4% 94,44% 95,42% Ada boost m1 Ada Weka 99,46% 95% 94,44% 95,02% Attribut selected classifier
Ada Weka
99,46% 95% 94,44% 95,02% BF tree Ada Weka 99,46% 95% 94,44% 95,02% Multiboost AB
Ada Weka 99,46% 95% 94,44% 95,02%
REP Tree Ada Weka 99,46% 95% 94,44% 95,02% Simple cart Ada Weka 99,46% 95% 94,44% 95,02% Part Tidak
Ada Weka
99,78% 94,9% 94,44% 94,91% Jrip Ada Weka 99,78% 94,8% 94,44% 94,81% Decorate Ada Weka 99,78% 94,7% 94,44% 94,71%
Filtered classifier
Ada Weka 99,68% 94,7% 94,44% 94,71%
Logit boost Ada Weka 99,68% 94,7% 94,44% 94,71%
Bagging Ada Weka 99,46% 94,6% 94,44% 94,61%
Classification via regression
Ada Weka 99,68% 94,4% 94,44% 94,4%
LMT Ada Weka 99,36% 94,2% 94,44% 94,2%
Naïve Bayes Ada Weka 97,44% 92,2% 94,44% 92,17%
Naïve Bayes Updateable
Ada Weka 97,44% 92,2% 94,44% 92,17%
Nnge Ada Weka 100.00% 96,5% 88,89% 96,64% Logisitc Ada Weka 99,46% 96,4% 88,89% 96,54% Multi layer perceptron
Tidak Ada
Weka 100.00% 96,4% 88,89% 96,54%
Multiclass classifier
Tidak Ada
Weka 99,46% 96,4% 88,89% 96,54%
94
Universitas Indonesia
(Lanjutan Lampiran 2)
Algoritma Pola prediksi
Data mining
tool
Akurasi Train
set
Akurasi Test set
Akurasi Eselon
V
Akurasi Non
eselon IB1 Tidak
Ada Weka
100.00% 95,9% 88,89% 96,03%
FT tree Ada Weka 99,68% 95,4% 88,89% 95,52%
IBK Tidak Ada
Weka 100.00% 95,9% 88,89% 95,22%
Voted perceptron
Tidak Ada
Weka 96,17% 94,8% 66,67% 95,32%
RBF Network Tidak Ada
Weka 93,94% 94,3% 16,67% 95,73%
CBA Ada Weka 92,24% 98,2% 0% 100%
CV parameter selection
Tidak Ada
Weka 92,24% 98,2% 0% 100%
Grading Tidak Ada
Weka 92,24% 98,2% 0% 100%
Multischeme Tidak Ada
Weka 92,24% 98,2% 0% 100%
Raced incremental logit boost
Ada Weka
92,24% 98,2% 0% 100%
Stacking Tidak Ada
Weka 92,24% 98,2% 0% 100%
Stacking C Ada Weka 92,24% 98,2% 0% 100%
Vote Tidak Ada
Weka 92,24% 98,2% 0% 100%
Zero R Tidak Ada
Weka 92,24% 98,2% 0% 100%
95
Universitas Indonesia
(Lanjutan Lampiran 2)
Tabel Hasil Classification untuk Eselon IVB
Algoritma Pola prediksi
Data mining
tool
Akurasi Train
set
Akurasi Test set
Akurasi Eselon IVB
Akurasi Non
eselon
LWL Tidak Ada
Weka 81,59% 73,08% 100% 68,2%
Conjuctive rule
Ada Weka 80,96% 72,61% 100% 67,65%
Decision stump
Ada Weka 80,96% 72,61% 100% 67,65%
hyper pipes Tidak Ada
Weka 81,06% 72,53% 99,17% 67,7%
VFI Tidak Ada
Weka 83,67% 81,54% 92,56% 79,55%
Dagging Tidak Ada
Weka 85,31% 85,18% 90,91% 84,15%
SMO Ada Weka 85,37% 85,14% 90,36% 84,2%
Logisitc Ada Weka 85,84% 85,31% 89,81% 84,5%
Multiclass classifier
Tidak Ada
Weka 85,84% 85,31% 89,81% 84,5%
Simple logistic
Ada Weka 85,84% 85,06% 89,81% 84,2%
Threshold selector
Ada Weka 86,71% 87.00% 88,98% 86,65%
Jrip Ada Weka 91,36% 83,15% 88,98% 82,1%
FT tree Ada Weka 93,17% 80,7% 88,15% 79,35%
LAD tree Ada Weka 89,82% 83,7% 86,5% 83,2%
Logit boost Ada Weka 88,99% 82,6% 86,5% 81,9%
Attribut selected classifier
Ada Weka 90,79% 83,28% 86,23% 82,75%
DTNB Tidak Ada
Weka 89,86% 80,53% 86,23% 79,5%
Nnge Ada Weka 99,83% 84,63% 85,4% 84,5%
Bayes NET Ada Weka 88,42% 84,51% 85,4% 84,35%
C5,0 Ada R 93% 88,02% 85,12% 83,15%
BF tree Ada Weka 95,04% 81,63% 85,12% 81.00%
Filtered classifier
Ada Weka 91,23% 83,28% 84,85% 83.00%
96
Universitas Indonesia
(Lanjutan Lampiran 2)
Algoritma Pola prediksi
Data mining
tool
Akurasi Train
set
Akurasi Test set
Akurasi Eselon IVB
Akurasi Non
eselon Decorate Ada Weka 94,11% 82,22% 84,57% 81,8%
Simple cart Ada Weka 93,94% 81,71% 84,3% 81,25%
Classification via regression
Ada Weka 91,87% 80,7% 84,02% 80,1%
Decision table
Ada Weka 89,96% 80,44% 84,02% 79,8%
Random Forrest
Ada Weka 99,53% 82,86% 83,47% 82,75%
CRUISE
Ada CRUISE 92,17% 80,36% 83,3% 90,08%
Multi layer perceptron
Tidak Ada
Weka 90,23% 87,3% 83,2% 88,05%
AD tree Ada Weka 88,79% 85,95% 83,2% 86,45%
Ada boost m1 Ada Weka 86,21% 85,61% 83,2% 86,05%
Part
aidak Ada
Weka 93.00% 82,52% 82,92% 82,45%
REP Tree Ada Weka 93,24% 82,43% 82,92% 82,35%
Bagging Ada Weka 93,81% 82,39% 82,69% 82,8%
K-Star
Tidak Ada
Weka 95,08% 83,15% 82,37% 83,3%
LMT Ada Weka 94,24% 81,5% 82,37% 81,35%
IB1
Tidak Ada
Weka 99,83% 84,63% 82,09% 85,1%
IBK
Tidak Ada
Weka 99,83% 84,63% 82,09% 85,1%
NB Tree Ada Weka 92,77% 83,19% 81,54% 83,5%
Random tree Ada Weka 99,83% 83,96% 81,27% 84,45%
One R Ada Weka 86,24% 63,35% 80,99% 60,15%
Ordinal class classifier
Tidak Ada
Weka 90,49% 81,71% 80,72% 81,9%
Clsasification via clustering
Ada Weka 79,72% 78,84% 80,44% 78,55%
End
Tidak Ada
Weka 93,57% 80,95% 80,17% 81,1%
Naïve Bayes Ada Weka 82,73% 87,55% 79,89% 88,95%
97
Universitas Indonesia
(Lanjutan Lampiran 2)
Algoritma Pola prediksi
Data mining
tool
Akurasi Train
set
Akurasi Test set
Akurasi Eselon IVB
Akurasi Non
eselon Naïve Bayes Updateable
Ada Weka 82,73% 87,55% 79,89% 88,95%
Ridor Ada Weka 91,2% 83,74% 79,89% 84,45%
J-48 Ada Weka 93,57% 80,7% 79,89% 80,85%
J-48 graft Ada Weka 93,57% 80,7% 79,89% 80,85%
Voted perceptron
Tidak Ada
Weka 81,79% 79,13% 74,38% 80.00%
Multiboost AB
Ada Weka 84,57% 83,79% 73,28% 85,7%
Raced incremental logit boost
Ada Weka 85,64% 84.00% 72,73% 86,15%
RBF Network
Tidak Ada
Weka 70,45% 80,74% 63,91% 83,8%
Spegasos Ada Weka 70,59% 86,33% 12,12% 99,8%
CBA Ada Weka 63,32% 84,63% 0% 100%
CV parameter selection
Tidak Ada
Weka 63,33% 84,63% 0% 100%
Grading
Tidak Ada
Weka 63,33% 84,63% 0% 100%
Multischeme
Tidak Ada
Weka 63,33% 84,63% 0% 100%
Stacking
Tidak Ada
Weka 63,33% 84,63% 0% 100%
Stacking C Ada Weka 63,33% 84,63% 0% 100%
Vote
Tidak Ada
Weka 63,33% 84,63% 0% 100%
Zero R
Tidak Ada
Weka 63,3% 84,63% 0% 100%
98
Universitas Indonesia
(Lanjutan Lampiran 2)
Tabel Hasil Classification untuk Eselon IVA
Algoritma Pola prediksi
Data mining
tool
Akurasi Train
set
Akurasi Test set
Akurasi Eselon IVA
Akurasi Non
eselon
hyper pipes
Tidak Ada
Weka 67,74% 70,39% 98,83% 65,61%
CRUISE
Ada CRUISE 92,17% 80,36% 94,47% 84,09%
Threshold selector
Ada Weka 89,09% 89,52% 93,31% 90,13%
Decorate Ada Weka 91,94% 88,04% 91,79% 87,42%
End
Tidak Ada
Weka 91,94% 88,05% 91,79% 87,42%
J-48 Ada Weka 91,94% 88,05% 91,79% 87,42%
J-48 graft Ada Weka 91,94% 88,05% 91,5% 87,42%
VFI
Tidak Ada
Weka 86,09% 85,05% 91,5% 83,97%
Jrip Ada Weka 90,62% 89,23% 88,86% 89,29%
Ridor
Tidak Ada
Weka 90,62% 86,82% 88,56% 86,53%
Ada boost m1 Ada Weka 89,02% 86,99% 87,68% 86,88%
Attribut selected classifier
Ada Weka 89,04% 86,99% 87,68% 86,88%
Dagging
Tidak Ada
Weka 89,02% 86,99% 87,68% 86,88%
Decision table
Ada Weka 89,04% 86,99% 87,68% 86,88%
Multiboost AB
Ada Weka 89,02% 86,99% 87,68% 86,88%
Ordinal class classifier
Tidak Ada
Weka 89,04% 86,99% 87,68% 86,88%
Raced incremental logit boost
Ada Weka 89,02% 86,99% 87,68% 86,88%
SMO Ada Weka 89,04% 86,99% 87,68% 86,88%
LMT Ada Weka 91,58% 89,23% 87,39% 89,54%
LAD tree Ada Weka 89,56% 89,4% 87,1% 89,79%
99
Universitas Indonesia
(Lanjutan Lampiran 2)
Algoritma Pola prediksi
Data mining
tool
Akurasi Train
set
Akurasi Test set
Akurasi Eselon IVA
Akurasi Non
eselon
DTNB
Tidak Ada
Weka 89,63% 86,99% 86,8% 87,03%
Bayes NET Ada Weka 86,7% 88,42% 86,22% 88,8%
Logit boost Ada Weka 89,21% 89,56% 85,92% 90,18%
Bagging
Tidak Ada
Weka
93,18% 89,4% 85,34% 90,08% Simple logistic
Ada Weka 89,41% 89,86% 84,75% 90,73%
Logisitc Ada Weka 89,11% 89,99% 84,16% 90,97%
Multiclass classifier
aidak Ada
Weka
89,11% 89,99% 84,16% 90,97%
NB Tree Ada Weka 91,06% 91,17% 83,87% 92,4%
FT tree Ada Weka 91,23% 89,56% 82,09% 89,94%
Part
Tidak Ada
Weka
91,3% 89,99% 80,94% 91,51% Conjuctive rule
Ada Weka 77,99% 89,9% 80,94% 91,42%
One R
Tidak Ada
Weka
77,99% 89% 80,94% 91,42%
RBF Network
Tidak Ada
Weka
77,86% 89,9% 80,94% 91,42%
Simple cart Ada Weka 94,23% 89,35% 79,77% 90,97% Clsasification via clustering