Tosan Wiar Ramdhani 1206194985

UNIVERSITAS INDONESIA

PEMANFAATAN TEKNIK DATA MINING CLASSIFICATION UNTUK POLA PENGISIAN JABATAN STRUKTURAL:

STUDI KASUS PEMERINTAH KOTA BOGOR

KARYA AKHIR

TOSAN WIAR RAMDHANI 1206194985

FAKULTAS ILMU KOMPUTER PROGRAM STUDI MAGISTER TEKNOLOGI INFORMASI

JAKARTA JULI 2014

UNIVERSITAS INDONESIA

PEMANFAATAN TEKNIK DATA MINING CLASSIFICATION UNTUK POLA PENGISIAN JABATAN STRUKTURAL:

STUDI KASUS PEMERINTAH KOTA BOGOR

KARYA AKHIR

Diajukan sebagai salah satu syarat untuk memperoleh gelar Magister Teknologi Informasi

TOSAN WIAR RAMDHANI 1206194985

FAKULTAS ILMU KOMPUTER PROGRAM STUDI MAGISTER TEKNOLOGI INFORMASI

JAKARTA JULI 2014

ii Universitas Indonesia

HALAMAN PERNYATAAN ORISINALITAS

Karya Akhir ini adalah hasil karya sendiri,

dan semua sumber baik yang dikutip maupun dirujuk

telah saya nyatakan dengan benar

Nama : Tosan Wiar Ramdhani

NPM : 1206194985

Tanda tangan :

Tanggal : 3 Juli 2014

iii Universitas Indonesia

HALAMAN PENGESAHAN

Karya Akhir ini diajukan oleh:


NPM : 1206194984

Program Studi : Magister Teknologi Informasi

Judul : Pemanfaatan Teknik Data mining classification untuk Pola Pengisian Jabatan Struktural: Studi Kasus Pemerintah Kota Bogor

Telah berhasil dipertahankan di hadapan Dewan Penguji dan diterima sebagai bagian pernyataan yang diperlukan untuk memperoleh gelar Magister Teknologi Informasi pada Program Studi Magister Teknologi Informasi, Fakultas Ilmu Komputer, Universitas Indonesia.

DEWAN PENGUJI

Pembimbing I : Betty Purwandari, Ph.D (……………………….)

Pembimbing II: Yova Ruldeviyani, M.Kom (……………………….)

Penguji: Dr. Achmad Nizar Hidayanto, S.Kom, M.Kom (……………………….)

Penguji: Dr. Indra Budi, S.Kom, M.Kom (……………………….)

Ditetapkan di : Jakarta

Tanggal :

iv Universitas Indonesia

KATA PENGANTAR

Puji syukur penulis panjatkan kepada Tuhan Yang Maha Esa, karena atas berkat

dan rahmat-Nya, penulis dapat menyelesaikan Karya Akhir ini. Penulisan Karya

Akhir dilakukan dalam rangka memenuhi salah satu syarat untuk mencapai gelar

Magister Teknologi Informasi pada Program Studi Magister Teknologi Informasi,

Fakultas Ilmu Komputer – Universitas Indonesia. Penulis menyadari bahwa, tanpa

bantuan dan bimbingan dari berbagai pihak, dari masa perkuliahan sampai pada

penyusunan karya akhir ini, sangatlah sulit bagi penulis untuk menyelesaikannya.

Oleh karena itu, penulis mengucapkan terimakasih kepada:

1. Ibu Betty Purwandari, Ph.D , selaku dosen pembimbing I dan Ibu Yova

Ruldeviyani, M.Kom selaku doesen pembimbing II, yang telah

menyediakan waktu, tenaga, dan pikiran untuk mengarahkan dalam

penyusunan Karya Akhir ini.

2. Dosen Penguji yang telah menguji dan memberikan saran dan perbaikan

pada Karya Akhir ini.

3. Kementrian Komunikasi dan Informasi, yang telah memberikan bantuan

beasiswa.

4. Istri tercinta, Dian Kusumaningrum, yang telah memberikan pengertian,

perhatian, dukungan, dan semangat yang telah diberikan pada penulis.

5. Kedua orang tua tercinta, yang telah memberikan dukungan, doa, dan

perhatian yang telah diberikan kepada penulis.

6. Staf di Magister Teknologi Informasi, yang telah membantu kelancaran

perkuliahan dan Karya Akhir.

7. Teman – teman di MTI 2012SA, yang telah membantu dalam melewati

masa-masa perkuliahan.

Akhir kata, semoga Allah SWT membalas semua kebaikan dan bantuan yang

telah diberikan dengan pahala yang berlipat ganda. Semoga Karya Akhir ini

memberikan manfaat bagi pengembangan ilmu pada umumnya dan bagi penulis

pada khususnya.

Jakarta, 3 Juli 2014

Penulis

v Universitas Indonesia

HALAMAN PERNYATAAN PERSETUJUAN PUBLIKASI

KARYA AKHIR UNTUK KEPENTINGAN AKADEMIS

Sebagai sivitas akademik Universitas Indonesia, saya yang bertanda tangan di bawah ini:


NPM : 1206194985

Program Studi : Magister Teknologi Informasi

Fakultas : Ilmu Komputer

Jenis Karya : Karya Akhir

Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada

Universitas Indonesia Hak Bebas Royalti Non-eksklusif (Non-exclusive

Royalty-Free Right) atas karya ilmiah saya yang berjudul:

Pemanfaatan Teknik Data mining classification untuk Pola Pengisian Jabatan

Struktural: Studi Kasus Pemerintah Kota Bogor

Dengan Hak Bebas Royalti Non-eksklusif ini Universitas Indonesia berhak

menyimpan, mengalihmedia/formatkan, mengelola dalam bentuk pangkalan data

(database), merawat, dan mempublikasikan karya akhir saya tanpa meminta izin

dari saya selama tetap mencantumkan saya sebagai penulis/pencipta dan sebagai

pemilik Hak Cipta.

Demikian pernyataan ini saya buat dengan sebenarnya.

Dibuat di : Jakarta

Pada Tanggal : 3 Juli 2014

Yang menyatakan

(Tosan Wiar Ramdhani)

vi Universitas Indonesia

ABSTRAK

Nama : Tosan Wiar Ramdhani Program Studi : Magister Teknologi Informasi Judul : Pemanfaatan Teknik Data Mining Classification untuk Pola

Pengisian Jabatan Struktural: Studi Kasus Pemerintah Kota Bogor

Pemerintah Kota Bogor merupakan salah satu bagian dari Pemerintah Provinsi Jawa Barat yang memiliki jumlah pegawai lebih dari 9000 orang. Pengelolaan kepegawaian dilakukan oleh Badan Kepegawaian Pendidikan dan Pelatihan Kota Bogor (BKPP). BKPP membentuk tim Badan Pertimbangan Jabatan dan Kepangkatan (Baperjakat) dalam tugas pengangkatan, pemindahan dan pemberhentian PNS dalam dan dari jabatan struktural Eselon IIA ke bawah. Baperjakat mengalami masalah dalam menyusun calon pejabat struktural yang selama ini dilakukan secara manual, meskipun sudah memiliki aplikasi Sistem Informasi Manajemen Kepegawaian (SIMPEG) sebagai aplikasi pengelolaan kepegawaian. Penelitian ini melakukan identifikasi pola pengisian jabatan struktural di lingkungan Pemerintah Kota Bogor dengan menggunakan data jabatan struktural tahun 2009 hingga 2013 yang bersumber dari basis data SIMPEG. Berbagai algoritma data mining dari teknik classification diujicobakan untuk mengidentifikasi pola pengisian jabatan struktural. Dari hasil classification, algoritma Classification Rule with Unbiased Interaction Selection and Estimation (CRUISE) menjadi algoritma terbaik dalam akurasi class eselon dengan tingkat akurasi rata-rata sebesar 95,7% untuk setiap tingkat eselon. Pola yang dihasilkan dapat menjadi rules yang akan diimplementasikan sebagai modul baru dalam aplikasi SIMPEG yang berfungsi memberikan usulan dalam pengisian jabatan struktural yang ditempatkan secara otomatis. Urutan atribut yang secara dominan muncul pada setiap tingkat eselon adalah atribut jenjang jabatan, pangkat golongan, pendidikan dan pelatihan, tingkat pendidikan, masa kerja, pengalaman dalam unit kerja, serta umur. Kata Kunci : Data Mining, Classification, Mutasi Jabatan Struktural

vii Universitas Indonesia

ABSTRACT

Name : Tosan Wiar Ramdhani Study Program : Magister of Information Technlogy Title : The Use of Data Mining Classification Technique for Filling

Structural Positions: A Case Study in Bogor Local Government

Bogor District Government is a part of West Java Province Government, which employs more than 9,000 employees. The human resources are managed by human resources and training division that is called Badan Kepegawaian Pendidikan dan Pelatihan (BKPP). BKPP form a team called Badan Pertimbangan Jabatan dan Kepangkatan (Baperjakat), who are responsible for promoting, rotating and dismissing local government employees from structural positions below the Echelon IIA positions. Baperjakat have problems on constructing the draft of structural government positions. These processes were done manually, even though BKPP have a human resources information systems called SIMPEG. The main purpose of this research is to identify patterns of filling structural positions at Bogor Local Government using the structural position data from 2009 to 2013. The data were taken from the SIMPEG database. Various data mining classification algorithms were tested to identify filling structural position patterns. The classification process yields Classification Rule with Unbiased Interaction Selection and Estimation (CRUISE) as the best algorithm in echelon class. Its average accuracy is 95.7% for each echelon level. The discovered patterns can be applied as base rules that will be implemented as new modules of SIMPEG. These new modules can provide suggestions for automatically filling structural positions. The order of attributes, which dominantly show at each echelon, are hierarchy type, class rank, training education, level of education, working period, experience within division and age.

Keywords : Data Mining, Classification, Promotions of Government Employee in

Structural Positions

viii Universitas Indonesia

DAFTAR ISI

HALAMAN JUDUL ............................................................................................ i HALAMAN PERNYATAAN ORISINALITAS .................................................. ii HALAMAN PENGESAHAN ............................................................................. iii KATA PENGANTAR ........................................................................................ iv HALAMAN PERNYATAAN PERSETUJUAN PUBLIKASI KARYA AKHIR UNTUK KEPENTINGAN AKADEMIS ............................................................. v ABSTRAK ......................................................................................................... vi ABSTRACT ...................................................................................................... vii DAFTAR ISI .................................................................................................... viii DAFTAR TABEL ............................................................................................... x DAFTAR GAMBAR ......................................................................................... xii 1. PENDAHULUAN .......................................................................................... 1

1.1 Latar Belakang ................................................................................ 1 1.2 Perumusan Masalah ......................................................................... 2 1.3 Tujuan Penelitian............................................................................. 4 1.4 Manfaat Penelitian ........................................................................... 5 1.5 Ruang Lingkup Penelitian ............................................................... 5

2. TINJAUAN PUSTAKA ................................................................................. 6 2.1 Data Mining .................................................................................... 6 2.2 Teknik Dasar dalam Data Mining .................................................... 8

2.2.1 Teknik Classification....................................................................... 8 2.2.2 Teknik Association Rule ................................................................ 10 2.2.3 Teknik Cluster Analysis ................................................................. 12

2.3 Pengangkatan Pegawai Negeri Sipil dalam Jabatan Struktural ....... 13 2.4 Penelitian Terdahulu ...................................................................... 14

2.4.1 Data Mining Classifcation Technique for Talent Management using SVM (S.Yashoda, P.S.Prakash, 2012) ........................................... 14

2.4.2 The Decision Tree Classifcation and Its Application Research in Personnel Management (Peng Ye, 2011) ...................................... 17

2.4.3 Data mining classification Techniques for Human Talent Forecasting (Hamidah Jantan, Abdul Razak Hamdan,Zulaiha Ali Othman, 2011) .............................................................................. 19

2.4.4 Pembandingan Tingkat Akurasi Dua Model Data mining yang Dihasilkan oleh Decision tree Dan Naïve Bayes Studi Kasus: Suatu Perusahaan Manufaktur dan Penjualan Sepeda (Afif Farisi, 2007) . 21

2.5 Theoretical Framework ................................................................. 28 3. METODOLOGI PENELITIAN .................................................................. 31

3.1 Tahapan Penelitian ........................................................................ 31 3.2 Metode Pengumpulan Data ............................................................ 33 3.3 Metode Analisis Data .................................................................... 34

4. ANALISIS DAN PEMBAHASAN ............................................................... 37 4.1 Data Pre-processing ...................................................................... 37

4.1.1 Ekstraksi Data ............................................................................... 37 4.1.2 Transformasi Data ......................................................................... 47

ix Universitas Indonesia

4.2 Data Mining dengan Classification ................................................ 48 4.2.1 Classification pada Data Eselon V ................................................. 49 4.2.2 Classification pada Data Eselon IVB ............................................. 54 4.2.3 Classification pada Data Eselon IVA ............................................. 59 4.2.4 Classification pada Data Eselon IIIB ............................................. 65 4.2.5 Classification pada data Eselon IIIA .............................................. 70 4.2.6 Classification pada Data Eselon IIB .............................................. 75 4.2.7 Classification pada Data Eselon IIA .............................................. 80

4.3 Analisis Hasil Prediksi................................................................... 82 4.4 Diskusi: Pola Umum Pengisian Jabatan Struktural Setiap Eselon ... 83 4.5 Analisis Dampak ........................................................................... 84

4.5.1 Analisis Dampak Organisasi .......................................................... 84 4.5.2 Analisis Dampak Keilmuan ........................................................... 86

5. KESIMPULAN DAN SARAN ..................................................................... 87 5.1 Kesimpulan ................................................................................... 87 5.2 Saran ............................................................................................. 88

DAFTAR PUSTAKA ........................................................................................ 89 Lampiran 1 ........................................................................................................ 90 Lampiran 2 ........................................................................................................ 92 Lampiran 3 ...................................................................................................... 113 Lampiran 4 ...................................................................................................... 117

x Universitas Indonesia

DAFTAR TABEL

Tabel 2.1 Jenjang Pangkat Golongan untuk Setiap Tingkat Eselon................................. 13 Tabel 2.2 Atribut dengan Tipe Data Continous yang Digunakan (S.Yashoda, P.S.Prakash,

2012) ........................................................................................................... 15 Tabel 2.3 Atribut dan Variabel yang Digunakan ............................................................ 20 Tabel 2.4 Akurasi dari Model dengan Seluruh Atribut (Hamidah Jantan, Abdul Razak

Hamdan,Zulaiha Ali Othman, 2011) ............................................................ 20 Tabel 2.5 Atribut yang Digunakan pada Data Pelanggan dan Penjualan ......................... 21 Tabel 2.6 Perbandingan Teknik Dasar Data Mining ....................................................... 24 Tabel 2.7 Perbandingan Peneletian Sebelumnya ............................................................ 25 Tabel 3.1 Data yang Tersedia ............................................................................. 33 Tabel 3.2 Tabel Perbandingan Data Mining Tools .............................................. 35 Tabel 4.1 Atribut yang Digunakan ..................................................................... 40 Tabel 4.2 Jumlah Record Data yang Digunakan ................................................. 41 Tabel 4.3 Sebaran Data Atribut Pangkat Golongan pada Train Set ..................... 41 Tabel 4.4 Sebaran Data Atribut Pangkat Golongan pada Test Set ...................... 42 Tabel 4.5 Sebaran Data Atribut Masa Kerja pada Train Set ................................ 42 Tabel 4.6 Sebaran Data Atribut Masa Kerja pada Test Set .................................. 42 Tabel 4.7 Sebaran Data Atribut Tingkat Pendidikan pada Train Set ................... 43 Tabel 4.8 Sebaran Data Atribut Tingkat Pendidikan pada Test Set ...................... 43 Tabel 4.9 Sebaran Data Atribut Pendidikan dan Pelatihan pada Train Set ........... 43 Tabel 4.10 Sebaran Data Atribut Pendidikan dan Pelatihan pada Test Set ........... 44 Tabel 4.11 Sebaran Data Atribut Pengalaman Unit Kerja pada Train Set ............ 44 Tabel 4.12 Sebaran Data Atribut Pengalaman Unit Kerja pada Test Set .............. 44 Tabel 4.13 Sebaran Data Atribut Umur pada Train Set ....................................... 45 Tabel 4.14 Sebaran Data Atribut Umur pada Test Set ......................................... 45 Tabel 4.15 Sebaran Data Atribut Jenjang Jabatan pada Train Set........................ 45 Tabel 4.16 Sebaran Data Atribut Jenjang Jabatan pada Test Set .......................... 46 Tabel 4.17 Sebaran Data Atribut Eselonering pada Train Set ............................. 46 Tabel 4.18 Sebaran Data Atribut Eselonering pada Test Set................................ 46 Tabel 4.19 Penyeragaman Atribut Pendidikan dan Pelatihan .............................. 47 Tabel 4.20 Hasil Classification untuk Eselon V ................................................. 49 Tabel 4.21 Confusion Matrix untuk Algoritma AD Tree ..................................... 49 Tabel 4.22 Contoh Test Set data Eselon V .......................................................... 52 Tabel 4.23 Contoh Hasil Perhitungan Nilai untuk Setiap Atribut ........................ 52 Tabel 4.24 Confusion Matrix untuk Algoritma CRUISE untuk Eselon V ............ 52 Tabel 4.25 Hasil Classification untuk Eselon IVB .............................................. 54 Tabel 4.26 Confusion Matrix Algoritma Jrip untuk Eselon IVB ......................... 54 Tabel 4.27 Confusion Matrix untuk Algoritma CRUISE untuk Eselon IVB ........ 56 Tabel 4.28 Hasil Classification untuk Eselon IVA ............................................. 59 Tabel 4.29 Confusion Matrix Algoritma Decorate untuk Data Eselon IVA ........ 60 Tabel 4.30 Confusion Matrix untuk Algoritma CRUISE untuk Eselon IVA ........ 62 Tabel 4.31 Hasil Classification untuk Eselon IIIB .............................................. 65 Tabel 4.32 Confusion Matrix untuk Algoritma CRUISE untuk Eselon IIIB ........ 65 Tabel 4.33 Confusion Matrix Algoritma Bayes NET untuk Data Eselon IIIB ...... 67 Tabel 4.34 Hasil Classification untuk Eselon IIIA .............................................. 70

xi Universitas Indonesia

Tabel 4.35 Confusion Matrix untuk Algoritma REP Tree untuk Eselon IIIA ...... 70 Tabel 4.36 Confusion Matrix untuk Algoritma CRUISE untuk Eselon IIIA ........ 73 Tabel 4.37 Hasil Classification untuk Eselon IIB ............................................... 75 Tabel 4.38 Confusion Matrix Algoritma Bayes NET untuk Eselon IIB ............... 76 Tabel 4.39 Confusion Matrix untuk Algoritma CRUISE untuk Eselon IIB .......... 78 Tabel 4.40 Hasil Classification untuk Eselon IIA ............................................... 80 Tabel 4.41 Confusion Matrix Algoritma Bayes NET untuk Eselon IIA ............... 80

xii Universitas Indonesia

DAFTAR GAMBAR

Gambar 1.1 Diagram Tulang Ikan Permasalahan Mutasi Jabatan Struktural ......... 3 Gambar 2.1 Representasi Model Classification dengan Beberapa Metode ............ 9 Gambar 2.2 Metode Data Mining untuk Pengelolaan Sumber Daya Manusia ..... 16 Gambar 2.3 Metode Penelitian untuk Data Mining Staf Pengajar ....................... 17 Gambar 2.4 Perbandingan Akurasi Decision tree dengan Naïve Bayes ............... 22 Gambar 2.5 Theoretical Framework Penelitian .................................................. 29 Gambar 3.1 Kerangka Kerja Penelitian .............................................................. 31 Gambar 3.2 Hasil Survey Kdnuggets.com Tahun 2007 ...................................... 34 Gambar 4.1 Struktur Tabel yang Digunakan....................................................... 39 Gambar 4.2 Pola Pengisian Jabatan Struktural Eselon V .................................... 50 Gambar 4.3 Pola Pengisian Jabatan Struktural Eselon IIIB ................................. 67 Gambar 4.4 Output Algoritma Bayes NET untuk Data Eselon IIB ...................... 76 Gambar 4.5 Output Agoritma Bayes NET untuk Data Eselon IIA ....................... 81 Gambar 4.6 Grafik Persentase Akurasi Prediksi Class Eselon ............................ 83

1 Universitas Indonesia

BAB 1

PENDAHULUAN

1.1 Latar Belakang

Pemerintah Kota Bogor merupakan salah satu bagian dari Pemerintah Provinsi

Jawa Barat yang memiliki jumlah pegawai lebih dari 9000 orang. Pemerintah

Kota Bogor terdiri dari 11 dinas, 6 badan, 6 kecamatan, 6 kantor dan 62

kelurahan. Sesuai dengan tugas pokok dan fungsi masing-masing unit kerja,

pengelolaan kepegawaian dilakukan oleh Badan Kepegawaian Pendidikan dan

Pelatihan Kota Bogor (BKPP). Secara Struktur BKPP terdiri dari 1 sekretariat

dan 3 bidang yang di antaranya yaitu: Bidang Formasi, Pengadaan dan

Kesejahteraan Pegawai, Bidang Pendidikan dan Pelatihan, serta Bidang Mutasi

dan Pengembangan karir.

Bidang Mutasi dan Pengembangan karir terdiri dari dua sub bidang yaitu Sub

Bidang Mutasi Pegawai dan Sub Bidang Pengembangan Karir. Secara Khusus

Sub Bidang Pengembangan Karir memiliki tugas pokok dan fungsi mengelola

pengembangan karir pegawai, termasuk di dalamnya tugas belajar, izin belajar,

ujian dinas serta mutasi jabatan struktural.

Dalam hal mutasi jabatan struktural, Sub Bidang Pengembangan Karir dibantu

oleh Badan pertimbangan Jabatan dan Kepangkatan (Baperjakat). Dalam Pasal 14,

15 dan 16 Peraturan Pemerintah Nomor 100 Tahun 2000 tentang Pengangkatan

PNS dalam Jabatan Struktural secara rinci dijelaskan tugas pokok hingga susunan

anggotanya Baperjakat. Agar pengangkatan, pemindahan dan pemberhentian PNS

dalam dan dari jabatan srtuktural eselon II ke bawah terjamin kualitas dan

objektifitasnya, dibentuklah Badan Pertimbangan Jabatan dan Kepangkatan

(Baperjakat). Baperjakat Instansi Daerah Kabupaten/Kota, yang dibentuk dan

ditetapkan oleh Pejabat Pembina Kepegawaian Daerah Kabupaten/Kota

(Bupati/Walikota).

Ketua Baperjakat Instansi Daerah Kabupaten/Kota adalah Sekretaris Daerah

Kabupaten/Kota dengan anggota para pejabat Eselon II dan Sekretaris

2

Universitas Indonesia

dijabat oleh pejabat Eselon III yang membidangi kepegawaian. Jumlah anggota

Baperjakat untuk menjamin objektifitas dan kepastian dalam pengambilan

keputusan ditetapkan dalam jumlah ganjil. Masa keanggotaan Baperjakat paling

lama 3 tahun. Dalam hal Ketua Baperjakat Insansi Pusat dan Daerah kosong,

maka Pejabat Pembina Kepegawaian menunjuk salah seorang anggota yang senior

untuk menjadi ketua.

Baperjakat Instansi Daerah Kabupaten atau Kota bertugas memberikan

pertimbangan kepada Pejabat Pembina Kepegawaian dalam:

1. Pengangkatan, pemindahan dan pemberhentian dalam dan dari jabatan

struktural Eselon II ke bawah.

2. Pemberian kenaikan pangkat bagi yang menduduki jabatan struktural,

menunjukkan prestasi kerja yang luar biasa baiknya, atau menemukan

penemuan baru yang bermanfaat bagi negara.

3. Perpanjangan batas usia pensiun bagi PNS yang menduduki jabatan struktural

eselon I dan eselon II.

4. Pengangkatan Sekretaris Kabupaten/Kota.

Dalam mendukung pengelolaan kepegawaian di lingkungan Pemerintah Kota

Bogor, BKPP mengelola Sistem Informasi Manajemen Kepegawaian (SIMPEG)

yang menyimpan data kepegawaian Pemerintah Kota Bogor. SIMPEG mulai

dikembangkan pada tahun 2009. SIMPEG merupakan aplikasi berbasis Web yang

dikembangkan menggunakan bahasa pemrograman PHP dan datanya disimpan

dengan menggunakan basis data MySQL. SIMPEG secara internal digunakan oleh

BKPP untuk mengelola data kepegawaian, sedangkan secara eksternal dapat

digunakan oleh seluruh Pegawai Negeri Sipil Pemerintah Kota Bogor untuk

mengelola data masing-masing pegawai.

1.2 Perumusan Masalah

Berdasarkan hasil wawancara dengan Sekretaris Baperjakat yang juga menjabat

sebagai Kepala Bidang Mutasi dan Pengembangan Karir, diketahui terdapat

permasalahan dalam penyusunan usulan draft mutasi jabatan struktural yaitu: tim

Baperjakat mengalamai kesulitan dalam menyusun calon pejabat struktural yang

selama ini dilakukan secara manual.

3


Sistem yang ada (SIMPEG) belum dapat memberikan usulan secara otomatis

apabila terjadi kekosongan jabatan struktural akibat pejabat pensiun maupun rotasi

jabatan. Dalam hal ini tim Baperjakat melakukan penelusuran data melalui

SIMPEG secara manual terhadap calon-calon yang diusulkan mengisi jabatan

struktural.

Di sisi lain Peraturan Pemerintah tidak secara spesifik mengatur bagaimana teknis

pengisian jabatan struktural yang baik dan benar. Adapun beberapa peraturan

yang mengatur pengisian jabatan struktural sifatnya umum contohnya pangkat

minimum yang harus dipenuhi untuk mengisi suatu jabatan struktural. Hal-hal

yang lebih spesifik seperti tingkat pendidikan, pengalaman bekerja pada suatu unit

kerja, maupun pendidikan dan pelatihan yang pernah ditempuh seorang pegawai

belum diatur dalam Peraturan Pemerintah yang ada. Secara umum permasalahan

yang ada dapat digambarkan dalam diagram tulang ikan pada Gambar 1.1:

Gambar 1.1 Diagram Tulang Ikan Permasalahan Mutasi Jabatan Struktural

Dari Gambar 1.1 terlihat beberapa faktor utama yang menyebabkan kesulitan

dalam penyusunan draft mutasi jabatan struktural.

1. Berdasarkan hasil wawancara dengan sekretaris Baperjakat sebagai nara

sumber (Lampiran 1, Jawaban 2), terdapat kalimat “Selain dari pada itu, akan

sangat membantu tim Baperjakat jika SIMPEG mampu mengusulkan nama-

nama calon pejabat struktural jika terjadi mutasi jabatan struktural.” Kalimat

tersebut menujukkan adanya permasalahan dalam sistem, yaitu SIMPEG tidak

dapat memberikan usulan calon pejabat struktural. Hal tersebut dikarenakan

4


saat ini SIMPEG tidak dilengkapi dengan kemampuan pendukung keputusan.

Untuk memiliki kemampuan tersebut, maka pola pengisian jabatan struktural

harus diketahui terlebih dahulu.

2. Pada pernyataan lainnya dalam wawancara dengan nara sumber (Lampiran 1,

Jawaban 1), terungkap, “Tim Baperjakat merasa kesulitan dalam menelusuri

data calon pejabat struktural yang diusulkan.” Selain itu nara sumber

menyatakan, “…, dan kita tetap harus menelusuri data tersebut secara manual

satu per satu dengan menggunakan aplikasi SIMPEG.” Kedua pernyataan

tersebut menunjukkan bahwa salah satu akar permasalahan mengenai data

adalah penelusuran data calon pejabat struktural masih dilakukan secara

manual satu per satu.

3. Pada pernyataan lainnya dalam wawancara dengan nara sumber (Lampiran 1,

Jawaban 3), terdapat kalimat, “Peraturan Pemerintah No 13 tahun 2002 tidak

secara spesifik mengatur mana komponen kepegawaian yang menjadi prioritas

dalam mengisi suatu jabatan struktural.” Kalimat tersebut menunjukkan bahwa

dari sisi regulasi tim Baperjakat merasa kesulitan dalam mencari panduan yang

spesifik yang dapat dijadikan acuan untuk menentukan pengisian jabatan

struktural.

Berdasarkan akar permasalahan sistem yang ada maka dapat ditarik suatu

pertanyaan riset untuk penelitian ini yaitu:

“Apakah pola yang sesuai untuk melakukan pengisian jabatan struktural di

setiap tingkat eselon pada Pemerintah Kota Bogor?"

1.3 Tujuan Penelitian

Tujuan dari penelitian ini adalah untuk mempelajari pola pengisian jabatan

struktural yang ada (2009-2013) dari basis data SIMPEG dengan menggunakan

teknik data mining classification. Dengan demikian dapat ditemukan suatu acuan

yang dapat digunakan SIMPEG untuk memberikan usulan calon pejabat

struktural. Teknik data mining classification adalah salah satu teknik data mining

yang dapat digunakan untuk membangun model prediksi berdasarkan classifier

yang akan diprediksi. Hal tersebut berbeda dengan dua teknik data mining

lainnya, yaitu association rule yang digunakan untuk melihat keterkaitan atribut,

5


dan clustering yang digunakan untuk mengelompokkan data berdasarkan

kemiripan atau kedekatan data (Han dan Kamber, 2006).

1.4 Manfaat Penelitian

Hasil dari penelitian ini adalah pola pengisian jabatan struktural yang diharapkan

akan memudahkan tim Baperjakat dalam menyusun draft mutasi jabatan

struktural. Dengan diketahuinya pola pengisian jabatan struktural maka SIMPEG

dapat memberikan usulan nama calon pejabat struktural, sehingga tim Baperjakat

tidak perlu melakukan penelusuran data sefcara manual satu per satu. Hal ini juga

tentunya dapat melengkapi dan memperjelas PP No 13 Tahun 2002 terkait

pengisian jabatan struktural di lingkungan pemerintah.

Penelitian ini juga dapat dijadikan salah satu sumber rujukan bagi penelitian

lainnya khususnya dalam hal penyusunan draft mutasi jabatan struktural di

lingkungan pemerintah.

1.5 Ruang Lingkup Penelitian

Ruang lingkup penelitian ini adalah melakukan penambangan data (data mining)

dari data kepegawaian di lingkungan Pemerintah Kota Bogor dari basis data

SIMPEG dari tahun 2009 hingga 2014.

Metode yang digunakan dalam penelitian ini untuk melakukan penambangan data

adalah teknik data mining classification untuk menemukan pola pengisian jabatan

struktural pada Pemerintah Kota Bogor.

Penelitian ini tidak akan membahas komponen lain di luar sistem seperti

keterbatasan data mutasi jabatan yang ada. Data yang tersedia pada SIMPEG

adalah data kepegawaian dari tahun 2009 sampai dengan 2014. Penelitian ini juga

tidak akan membahas solusi bagi permasalahan terkait regulasi mengingat hal

tersebut merupakan kewenangan pemerintah pusat. Data jabatan struktural yang

digunakan adalah tingkat Eselon IIA ke bawah, karena eselon I hanya terdapat di

tingkat pemerintah provinsi.


BAB 2

TINJAUAN PUSTAKA

Dalam tinjauan pustaka ini akan dibahas teori dasar, metodologi yang akan

digunakan, serta penelitian terdahulu yang terkait dengan penelitian ini. Untuk

mempelajari pola pengisian jabatan struktural di lingkungan Pemerintah Kota

Bogor dengan sumber basis data SIMPEG, dapat digunakan teknik data mining.

2.1 Data Mining

Data mining adalah suatu proses yang menggunakan teknik statistik, matematika,

kecerdasan buatan dan machine-learning untuk mengekstraksi dan

mengindentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari

berbagai basis data besar (Turban, 2005). Dalam buku yang berjudul Decision

Support System And Intelligent Systems, Turban, Aronson, dan Liang menjelaskan

beberapa karakteristik utama dan sasaran data mining di antaranya sebagai

berikut:

Data sering dikubur pada sebuah basis data yang sangat besar, yang kadang-

kadang berisi data dari beberapa tahun. Dalam banyak kasus, data dihapus

dan dikonsolidasi di dalam sebuah data warehouse.

Lingkungan data mining biasanya adalah arsitektur client/server atau

arsitektur berbasis Web.

Piranti baru yang canggih, meliputi visualisasi yang canggih membantu

memindahkan informasi atau mengubur informasi dalam berkas-berkas

perusahaan atau arsip catatan publik.

Pemilik data biasanya adalah end user yang diberdayakan oleh data drill dan

alat query lainnya untuk mengajukan pertanyaan khusus dan mendapatkan

jawaban secara tepat dengan sedikit atau tanpa keterampilan pemrograman.

Pemaksaan sering melibatkan penemuan hasil yang tidak diharapkan dan

mengharuskan end user untuk berpikir kreatif.

Piranti data mining sudah digabung dengan spreadsheet dan piranti

pengembangan perangkat lunak lainnya, sehingga data yang sudah diolah

dengan data mining dapat dianalisis dan diproses dengan cepat dan mudah.

7


Karena ada sejumlah besar data dan usaha pencarian dalam skala besar, maka

pemrosesan paralel untuk data mining kadang-kadang perlu digunakan.

Menurut Han dan Kamber dalam bukunya pada tahun 2006, yang berjudul Data

Mining Concepts and Techniques, data mining didefinisikan sebagai ekstraksi dari

pengetahuan yang menarik (aturan, pola, kebiasaan, batasan) yang bersumber dari

basis data dalam skala besar. Berdasarkan dua definisi di atas dapat disimpulkan

bahwa data mining adalah suatu cara yang dapat digunakan untuk mengekstraksi

pengetahuan dengan beberapa teknik seperti statistik, matematika, kecerdasan

buatan dan machine-learning yang bersumber dari basis data yang berskala besar.

Pada umumnya data mining sering disinonimkan dengan istilah Knowledge

Discovery from Data (KDD). Meskipun demikian secara khusus data mining

hanyalah suatu langkah penting dalam urutan proses knowledge discovery. Proses

knowledge discovery terdiri atas beberapa iterasi terurut seperti yang dapat

dijelaskan sebagai berikut (Han dan Kamber, 2006):

1. Data Cleaning: bertujuan menghapus noise dan data yang tidak konsisten.

2. Data Integration: merupakan tahap dengan beberapa sumber data yang

dikombinasikan.

3. Data Selection: tahap pemilihan data yang relevan dari basis data yang akan

digunakan untuk proses analisis.

4. Data Transformation: Data ditransformasi dan dikonsolidasi dalam bentuk

yang sesuai untuk kebutuhan data mining, misalnya dengan cara menyusun

summary atau agregat.

5. Data mining: proses penting dengan penerapan metode intelijen untuk dapat

mengekstrak pola data.

6. Pattern Evaluation: untuk mengidentifikasi pola yang merepresentasikan

basis pengetahuan yang ditemukan.

7. Knowledge Presentation: adalah suatu tahap yang menggunakan teknik-

teknik visualisasi dan representasi pengetahuan, digunakan untuk

menghasilkan pengetahuan yang dibutuhkan oleh pengguna.

8


2.2 Teknik Dasar dalam Data Mining

Berdasarkan kegunaannya data mining memiliki beberapa teknik dasar seperti

association yang dapat digunakan untuk analisis market-basket, classification

and prediction yang dapat digunakan untuk quality control, serta cluster analysis

yang dapat digunakan untuk mendesain segmentasi pasar (Han dan Kamber,

2006).

2.2.1 Teknik Classification

Classification adalah proses menemukan model atau fungsi yang menjelaskan

konsep atau kelas data. Proses ini bertujuan agar dapat memanfaatkan model yang

didapat untuk memprediksi kelas dari sebuah objek yang belum diketahui

sebelumnya (Han dan Kamber, 2006).

Serupa dengan asssociation rule, Classification memiliki dua tahapan utama

yang terdiri dari:

1. Mengestimasi akurasi prediktif dari model yang dibuat.

2. Jika nilai akurasi yang didapatkan dapat diterima, model dapat digunakan

untuk memprediksi kelas dari objek yang belum diketahui sebelumnya.

Terdapat beberapa metode yang dapat digunakan untuk membangun model

classification seperti fungsi IF-THEN sederhana, decision tree atau neural

network (dapat dilihat ilustrasinya pada Gambar 2.1).

9


Gambar 2.1 Representasi Model Classification dengan Beberapa Metode

Sumber: Han dan Kamber (2006)

Berdasarkan Gambar 2.1, dapat dilihat bahwa model classification berdasarkan

umur dan penghasilan dapat dibentuk dengan menggunakan beberapa metode

seperti fungsi IF-THEN (a), decision tree (b), dan neural network (c) untuk

memprediksi apakah suatu objek termasuk ke dalam kelas A, B atau C.

Fungsi IF-THEN dapat digunakan untuk menyusun rule-based classifier. Bentuk

umum dari fungsi IF-THEN cukup sederhana yaitu IF condition Then conclusion.

Contoh sederhana penggunaan fungsi IF-THEN sebagai berikut: Rule R1: IF age

= youth AND student = yes THEN buys_computer = yes. Bagian IF dari R1

disebut sebagai rule antecedent atau precondition, sedangkan bagian THEN-nya

disebut rule consequent. Kondisi pada rule antecendent dapat berisi satu atau

lebih attribute test (dalam hal ini sebagai contoh: age = youth AND student = yes)

yang secara logika matematika terhubung dengan fungsi logika AND. Rule

consequent dapat berisi prediksi kelas. Dalam hal ini kita memprediksi apakah

pelanggan akan membeli sebuah komputer. Jika suatu kondisi dalam rule

antecendent bernilai TRUE dalam suatu baris data transaksi, maka data transaksi

tersebut memenuhi rule antecendent dan rule-nya berlaku untuk data tersebut

(Han dan Kamber, 2006). Beberapa algoritma yang menggunakan teknik dasar ini

di antaranya algoritma Jrip, One R, dan Classification Based on Association

(Weka, 2012).

10


Decision tree adalah diagram pohon yang bentuknya mirip dengan diagram flow

chart. Pohon tersebut memiliki tiga bagian utama yaitu internal node berupa uji

dari sebuah atribut, branch yang merepresentasikan hasil uji (setiap baris dari

branch bernilai sama untuk atribut yang telah diuji), dan leaf node

merepresentasikan label dari kelas atau distribusi dari label kelas. Untuk

mengetahui kelas dari sampel yang tidak diketahui, nilai atribut dari sampel

diujikan terhadap decision tree yang disusun. Decision tree dapat dengan mudah

dikonversi menjadi classification rules. Beberapa algoritma yang menggunakan

teknik ini di antaranya algoritma J48, AD tree, dan simple cart (Weka, 2012).

Neural network menggunakan algoritma pembelajaran back propagation yang

terdiri dari sekelompok input atau output yang saling berhubungan, dengan setiap

hubungan memiliki bobot yang saling terkait. Pada fase pembelajaran, neural

network belajar dengan cara menyesuaikan bobot sehingga memiliki kemampuan

memprediksi kelas dari input baris data dengan benar. Proses pembelajaran neural

network juga sering disebut connectionist learning dikarenakan adanya beberapa

hubungan diantara beberapa unit data rules. Beberapa algoritma yang

menggunakan teknik ini di antaranya yaitu algoritma RBF network, voted

perceptron, dan multilayer perceptron (Weka, 2012).

2.2.2 Teknik Association Rule

Association rule merupakan usaha untuk menemukan pola berulang (frequent

pattern), keterkaitan (association), korelasi atau struktur sebab-akibat dari

beberapa kumpulan data atau objek pada transaksi dalam basis data, basis data

relasional, dan sumber repositori informasi lainnya. Tujuan utama association

rule adalah menemukan suatu keteraturan dalam data, misalnya produk yang

sering dibeli secara bersamaan dalam sebuah transaksi belanja, produk lain yang

akan dibeli jika kita membeli sebuah komputer, tipe DNA yang sensitif terhadap

suatu obat baru, dan otomasi klasifikasi dokumen Web (Han dan Kamber, 2006).

11


Data transaksi belanja seringkali digunakan sebagai contoh untuk menerangkan

association rule misalnya sebagai berikut:

Diperoleh bentuk umum A→B [support,confidence].

Pembelian(x,“pembalut”) → Pembelian(x,“minuman ringan”) [0,5%;60%]

Dari dua poin di atas dapat dijelaskan bahwa nilai support dari association rule

sebesar 0,5%. Hal tersebut menunjukkan bahwa 0,5% dari seluruh transaksi

pembalut dan minuman ringan dibeli secara bersamaan. Nilai confident sebesar

60% menunjukkan bahwa 60% dari seluruh pelanggan yang membeli pembalut,

juga membeli minuman ringan. Rule yang memenuhi nilai minimum support dan

confidence threshold disebut sebagai strong rule. Secara umum nilai confidence

dan support dapat ditentukan dengan persamaan berikut:

A dan B adalah sebuah itemset dari transaksi T, sedangkan itemset merupakan

sekumpulan item I yang terdiri dari {I1,I2, …,Im}, dengan A I, B I, dan

A∩B=φ. Notasi P (A B) adalah nilai kemungkinan dari munculnya transaksi A

dan B secara bersamaan.

Beberapa istilah yang sering digunakan dalam association rule di antaranya yaitu

itemset, yang merupakan sekelompok item dalam sebuah transaksi dalam basis

data. Itemset yang berisi sejumlah k item disebut k-itemset. Misalnya {minuman

ringan, pembalut}, disebut sebagai 2-itemset. Jika sebuah itemset memenuhi nilai

minimum support yang ditentukan, maka itemset tersebut merupakan frequent

itemset. Sekumpulan frequent k-itemsets biasanya dinotasikan sebagai Lk.

12


Secara umum association rule memiliki dua tahapan proses yaitu:

1. Cari semua frequent itemsets: secara definisi setiap itemset setidaknya akan

muncul sebanyak yang didefinisikan oleh jumlah minimum support atau biasa

disingkat min_sup.

2. Merumuskan association rule dari frequent itemsets: secara definisi aturan ini

harus memenuhi minimum support dan minimum confidence.

Tahap kedua tentunya lebih mudah dibanding tahap pertama, seluruh performa

dari Association Rule Mining sangat ditentukan oleh tahap pertama yaitu mencari

semua frequent itemsets.

2.2.3 Teknik Cluster Analysis

Proses pengelompokkan sekumpulan objek dalam beberapa kelas yang memiliki

kemiripan disebut clustering. Sebuah cluster adalah kumpulan beberapa objek

data yang memiliki kesamaan satu sama lain dalam cluster yang sama dan

berbeda dengan objek lain dalam cluster yang lain (Han dan Kamber, 2006).

Dengan otomasi clustering kita dapat mengidentifikasi kepadatan dan sebaran dari

sebuah area yang terdiri atas beberapa objek, sehingga kita dapat menemukan pola

sebaran dan korelasi yang menarik diantara atribut data. Cluster analysis sudah

banyak digunakan dalam beragam aplikasi seperti riset pasar, pengenalan pola,

analisis data, dan pemrosesan citra digital.

Clustering sering juga disebut sebagai segmentasi data dalam berbagai aplikasi

karena clustering dapat membagi sejumlah besar data ke dalam beberapa

kelompok berdasarkan kesamaannya.

Jenis data yang umumnya digunakan pada clustering di antaranya yaitu variabel

skala interval, variabel biner, variabel nominal, ordinal, dan rasio, serta gabungan

dari beberapa tipe variabel. Beberapa metode clustering yang sering digunakan di

antaranya yaitu:

Algoritma partisi: menyusun beragam partisi lalu mengevaluasi hasilnya

dengan menggunakan beberapa kriteria.

13


Algoritma hirarki: menciptakan dekomposisi hirarki dari sekelompok data

atau objek dengan menggunakan beberapa kriteria.

Density-based: pendekatan clustering berdasarkan konektifitas dan fungsi

density.

Grid-based: pendekatan clustering berdasarkan beberapa tingkat struktur

granularity.

Model-based: pendekatan clustering berdasarkan hasil hipotesis sebuah

model dari setiap cluster yang terbentuk dengan tujuan untuk mencari model

terbaik yang sesuai.

2.3 Pengangkatan Pegawai Negeri Sipil dalam Jabatan Struktural

Peraturan Pemerintah yang mengatur pengisian jabatan struktural secara umum

tertuang dalam Peraturan Pemerintah Republik Indonesia Nomor 100 Tahun 2000

tentang pengangkatan Pegawai Negeri Sipil dalam jabatan struktural yang

kemudian diperbarui dengan Peraturan Pemerintah Republik Indonesia Nomor 13

Tahun 2002.

Beberapa poin penting yang diperbarui dalam peraturan tersebut adalah jenjang

pangkat golongan terendah dan tertinggi untuk masing-masing tingkat eselon

seperti yang dapat dilihat pada Tabel 2.1:

Tabel 2.1 Jenjang Pangkat Golongan untuk Setiap Tingkat Eselon

No Eselon Jenjang Pangkat, Golongan / Ruang Terendah Tertinggi

Pangkat Gol / Ruang

Pangkat Gol / Ruan

g 1 I a Pembina Utama IV/e Pembina Utama IV/e 2 I b Pembina Utama

Madya IV/d Pembina Utama IV/e

3 II a Pembina Utama Muda IV/c Pembina Utama Madya

IV/d

4 II b Pembina Tingkat I IV/b Pembina Utama Muda IV/c 5 III a Pembina IV/a Pembina Tingkat I IV/b 6 III b Penata Tingkat I III/d Pembina IV/a 7 IV a Penata III/c Penata Tingkat I III/d 8 IV b Penata Tingkat I III/b Penata III/c 9 V Penata Muda III/a Penata Tingkat I III/b

Sumber : Peraturan Pemerintah Republik Indonesia Nomor 13 Tahun 2002.

14


Berdasarkan Tabel 2.1 diketahui bahwa Baperjakat dapat menggunakan tabel

tersebut sebagai acuan dasar untuk menentukan kriteria yang diperlukan dalam

mengisi jabatan struktural. Dalam hal ini pangkat dan golongan merupakan suatu

atribut yang nantinya akan digunakan dalam proses data mining untuk mengetahui

pola pengisian jabatan struktural pada Pemerintah Kota Bogor.

Beberapa atribut lain yang dapat digunakan untuk menemukan pola pengisisian

jabatan struktural sebetulnya tercantum pada Pasal 6 dalam Peraturan Pemerintah

Republik Indonesia Nomor 100 Tahun 2000 yang secara eksplisit menyebutkan

bahwa faktor senioritas dalam kepangkatan, usia, pendidikan dan pelatihan

jabatan serta pengalaman yang dimiliki merupakan beberapa hal yang bisa

menjadi bahan pertimbangan Pembina Kepegawaian Daerah dalam mengisi suatu

jabatan struktural.

Namun tidak ada pembobotan atau skala prioritas terhadap faktor-faktor tersebut

untuk menilai kelayakan seorang pegawai mengisi jabatan struktural. Oleh karena

itu pemanfaatan data mining pada penelitian ini ditujukan untuk mengetahui skala

prioritas mana yang lebih didahulukan diantara beberapa faktor tersebut dengan

menggunakan basis data SIMPEG sebagai sumber datanya.

2.4 Penelitian Terdahulu

Beberapa penelitian terdahulu yang pernah dilakukan terkait dengan penggunaan

data mining dapat dijelaskan sebagi berikut:

2.4.1 Data Mining Classifcation Technique for Talent Management using

SVM (S.Yashoda, P.S.Prakash, 2012)

Salah satu tantangan pada pengelolaan sumber daya manusia adalah mengelola

bakat yang ada pada sumber daya manusia dalam organisasi. Masalah dalam

mengelola potensi bakat pada sumber daya manusia di dalam organisasi dapat

diselesaikan dengan menggunakan teknik data mining classification dari beberapa

teknik classification yang sering digunakan seperti: decision tree, neural network,

support vector machine, dan algoritma nearest neigbour.

Penelitian ini menggunakan pendekatan gabungan antara Class Attributee

Contingency Coefficient (CACC) dengan support vector machine. Data yang

digunakan dalam penelitian ini adalah UCI adult data set yang merupakan data

15


sensus pendapatan tahun 1994 yang dapat diunduh pada alamat situs

http://archive.ics.uci.edu/ml/machine-learning-databases/adult/. Dari 14 atribut

yang tersedia (umur, bidang pekerjaan, nilai final weight, lamanya pendidikan

formal yang pernah ditempuh, status nikah, pekerjaan, hubungan keluarga, suku,

jenis kelamin, keuntungan modal, kerugian modal, jumlah jam kerja mingguan

dan kewarganegaraan), hanya 6 atribut yang digunakan dengan tipe data continous

seperti yang ditunjukkan pada Tabel 2.2:

Tabel 2.2 Atribut dengan Tipe Data Continous yang Digunakan

Umur Finalweight Tahun pendidikan

yang ditempuh

Keuntungan investasi

Kerugian investasi

Jam kerja dalam

seminggu

18,5 30609 3,5 0 0 11 20,5 45718 5,5 0 0 19 30 13052e+005 9,5 0 0 35

40,5 19275e+005 10,5 0 0 40 48 23584e+005 12,5 0 0 45

54,5 29367e+005 13,5 527,5 0 50,5 70,5 46013e+005 15,5 11356 1932 70

Sumber: S.Yashoda, P.S.Prakash (2012)

Data pada Tabel 2.2 merupakan hasil proses diskretisasi dengan menggunakan

algoritma CACC pada atribut-atribut yang bernilai kontinu. Selanjutnya data ini

yang akan dijadikan dasar untuk melakukan classification dengan menggunakan

algoritma SVM. Metode yang digunakan dalam penelitian dapat dilihat pada

Gambar 2.2:

16


Gambar 2.2 Metode Data Mining untuk Pengelolaan Sumber Daya Manusia

Sumber: S.Yashoda, P.S.Prakash (2012)

Terdapat 75% data set digunakan sebagai train set dalam algoritma classification

SVM dan sisanya digunakan untuk memvalidasi model. Dari 4 kernel yanga ada

pada algoritma SVM (linier, polinomial, sigmoid, dan basis radial), kernel

berbasis radial yang dipilih dengan beberapa alasan.Fungsi non linier yang

dimiliki basis radial dapat menghasilkan pemetaan data dengan dimensi data yang

lebih tinggi dibanding dengan basis linier. Basis radial memiliki hyper parameter

yang lebih sedikit dibandingkan dengan kernel polynomial, terlebih lagi basis

radial memiliki tingkat kesulitan numerik yang lebih rendah.

Seperti yang dapat dilihat pada Gambar 2.2, penelitian ini juga menggunakan

algoritma Sequential Mining Optimization (SMO), untuk menghasilkan model

classification yang lebih optimal dengan menggunakan Matlab versi 7.10.

Hasil dari penelitian ini berupa suatu gabungan beberapa metode yang dapat

digunakan untuk melakukan classification pada data sumber daya manusia.

Namun proses classification pada penelitian belum selesai dilakukan dan masih

dalam proses pengerjaan. Model klasifikasi yang terbentuk diharapkan dapat

digunakan untuk memprediksi potensi bakat yang sesuai untuk suatu posisi dalam

organisasi.

17


2.4.2 The Decision Tree Classifcation and Its Application Research in

Personnel Management (Peng Ye, 2011)

Penelitian ini berusaha menerapkan pola decision tree classification untuk

melakukan prediksi dalam mengidentifikasi bakat para pengajar pada sebuah

universitas.

Beberapa atribut yang digunakan pada penelitian ini adalah tingkat pendidikan,

jenis kelamin, nilai calon pegawai, nilai dari institusi sekolah formal yang pernah

diikuti, umur, pekerjaan suami atau istri, dan gelar profesional. Penelitian

menggunakan algoritma C.45 yang diimplementasikan dengan menggunakan

bahasa pemrograman Visual Basic 6.0 dan memanfaatkan Microsoft ODBC

Driver sebagai sarana koneksi data yang akan diolah. Langkah-langkah penelitian

dapat dilihat pada Gambar 2.3.

Gambar 2.3 Metode Penelitian untuk Data Mining Staf Pengajar

Sumber: Peng Ye (2011)

Sesuai dengan Gambar 2.3, tahap awal yang dilakukan pada penelitian ini yaitu

mengumpulkan data (data collection) dari beberapa sekolah dan departemen yang

berbeda. Misalnya informasi dasar mengenai data pengajar diperoleh dari bagian

kepegawaian, sedangkan data hasil penelitian ilmiah diperoleh dari kantor

administrasi kependidikan. Proses penggabungan dan pengelolaan data dari

beberapa sumber dan struktur yang berbeda merupakan hal yang kompleks.

Tahap selanjutnya adalah pretreatment data yang dilakukan dengan

membersihkan data dari noise dan data yang tidak berhubungan. Ada beberapa

data yang kosong dan duplikasi data pada atribut latar belakang pendidikan, selain

itu perlu melakukan transformasi pada tipe data yang digunakan. Pada tahap ini

juga dilakukan penyeragaman terhadap sinonim data, seperti kata “tidak ada”,

“tidak memiliki reputasi”, “tidak bergelar”, “non-partisan”, atau bahkan

ditemukan pula yang hanya diisi dengan angka 0. Tahap selanjutnya yaitu

18


persiapan data (data preparation) dengan melakukan stratifikasi pada beberapa

atribut (pemetaan) sebagai berikut:

Untuk atribut jenjang pendidikan diurutkan sebagai berikut: SMP (00), SMA

(11), sekolah politeknik (01), pendidikan lebih tinggi (02), bachelor (03),

double degree (33), master (04), doctor (05), postdoctoral (06).

Untuk atribut title professional atau teknis sebagai berikut: tanpa titel (0),

pemula (1), menengah (2), madya (3), dan tingkat tinggi (4).

Untuk atribut jenis kelamin sebagai berikut: wanita (0), pria (1).

Untuk nilai dari institusi sekolah formal yang pernah diikuti sebagai berikut:

95-100 (A), 85-95 (B), 75-85 (C), 60-75(D), 60 (E).

Untuk atribut tipe institusi pendidikan sebagai berikut: Sekolah bergengsi

(A), Sekolah umum (B), Perguruan tinggi (C), sekolah diploma (D), SMA

(E), SMP (F), Sekolah luar negeri (G).

Tahap selanjutnya melakukan data mining dengan algoritma classification

decision tree 4.5 yang melalui beberapa proses interaksi dasar sebagai berikut:

Decision tree dimulai dengan satu titik tunggal training samples.

Jika seluruh training samples memiliki klasifikasi yang sama, maka titik

tersebut menjadi cabang dari dan diberi tanda dengan klasifikasi tersebut.

Jika tidak, algortima decision tree menggunakan pengumpulan informasi

sebagai pengukuran, lalu memilih salah satu atribut yang terbaik untuk

melakukan klasifikasi pada training samples.

Menyusun percabangan untuk setiap nilai atribut yang akan dijadikan dasar

untuk melakukan klasifikasi pada training samples.

Penggunaan fungsi rekursi dari seluruh pembagian decision tree sample.

Lakukan terus fungsi rekursi hingga memenuhi kondisi akhir fungsi rekursi.

Penghentian fungsi rekursi.

Pada saat seluruh cabang dari training samples telah terklasifikasi, tandai

cabang tersebut dengan klasifikasi terkait.

Pada saat tidak ada lagi atribut yang dapat membagi training samples,

hentikan proses dan tandai cabang tersebut dengan klasifikasi terkait.

19


Pada saat percabangan tidak lagi memiliki training samples, hentikan proses

dan tandai cabang tersebut denngan mayoritas klasifikasi dari training

samples yang digunakan.

Setelah dilakukan klasifikasi pada data staf pengajar ditemukan beberapa pola

sebagai berikut:

Jika memiliki posisi B (division level), dengan umur (41-45), maka dapat

diklasifikasikan sebagai class N (is not lost).

Jika memiliki tingkat pendidikan 05 (Ph.d), dengan pekerjaan istri C (tidak

memuaskan), dengan umur B (31-40), maka dapat diklasifikasikan sebagai

class Y (the loss of).

Kesimpulan yang dapat ditarik dari pola data di atas adalah staf pengajar

dengan tingkat pendidikan doktoral yang berumur 30 hingga 45 cenderung merasa

tidak puas atau pasangannya tidak bekerja di tempat yang sama. Selain itu

pengajar yang lulus pada umur 25 hingga 35 tahun memiliki kecenderungan tidak

efektif bekerja karena ingin melanjutkan studi.

2.4.3 Data mining classification Techniques for Human Talent Forecasting

(Hamidah Jantan, Abdul Razak Hamdan,Zulaiha Ali Othman, 2011)

Penelitian ini merupakan implementasi data mining untuk manajemen bakat

sumber daya manusia khususnya menggunakan teknik Classification and

prediction dengan mengidentifikasi pola yang berhubungan dengan bakat sumber

daya manusia.

Dikarenakan alasan kerahasiaan dan keamaanan data dari bagian kepegawaian,

penelitian ini menggunakan dua dataset yang dihasilkan dari dataset rule

generator, dataset1 menghasilkan 100 data dan dataset2 menghasilkan 1000 data

berdasarkan faktor-faktor bakat dan performa kerja. Selain itu data outlier pada

dataset1 dijadikan dataset terpisah yaitu dataset3. Atribut data yang digunakan

pada penelitian ini dapat dijelaskan pada Tabel 2.3.

20


Tabel 2.3 Atribut dan Variabel yang Digunakan

Atribut Nama Variabel Keterangan Latar Belakang (7) D1, D2, D3, D5, D6, D7, D8 Umur,jenis kelamin,

masa kerja, promosi Evaluasi kinerja sebelumnya (15)

DP1, DP2, DP3, DP4, DP5, DP6, DP7, DP8, PP9, DP10, DP11, DP12, DP13, DP14, DP15

Penilaian kinerja dalam 15 tahun

Pengetahuan dan kemampuan (20)

PQA,PQC1,PQC2, PQC3,PQD1, PQD2,PQD3,PQE1, PQE2,PQE, PQE4,PQE5,PQF1, PQF2,PQG1, PQG2,PQH1,PQH2,PQH3,PQH4

Kualifikasi professional (pengajar, pengawas,

peneliti)

Kemampuan manajemen (6)

PQB, AC1, AC2, AC3, AC4, AC5

Kemampuan administratif

Kualitias individu (5)

T1, T2, SO, AA1, AA2 Pelatihan, penghargaan

Sumber: Hamidah Jantan, Abdul Razak Hamdan,Zulaiha Ali Othman (2011)

Atribut yang digunakan pada Tabel 2.3 merupakan kombinasi dari 53 atribut yang

didefinisikan dalam variabel dan 5 faktor performa kerja sumber daya manusia.

Penelitian ini menggunakan 5 jenis algoritma classification yaitu (C 4.5, random

forest, multi layer perceptron, radial basis function network, dan K-star) dengan

menggunakan perangkat lunak WEKA (Waikato Environment Knowledge and

Analysis) dan ROSSETA toolkit sebagai pengolah data.

Tabel 2.4 Akurasi dari Model dengan Seluruh Atribut

Algoritma Classification Dataset 1 Dataset 2 Dataset 3

C 4.5 95,14 99,90 90,54

Random Forest 74,91 95,43 71,8

Multi Layer Perceptron 87,16 99,84 84,55 Radial Basis Function Network 91,45 99,98 87,09 K-Star 92,06 97,83 87,79

Sumber: Hamidah Jantan, Abdul Razak Hamdan,Zulaiha Ali Othman (2011)

Berdasarkan Tabel 2.4 dapat dilihat algoritma C.45 memiliki nilai akurasi yang

lebih baik dibandingkan dengan algoritma lainnya. Dengan begitu teknik ini dapat

digunakan untuk memprediksi data bakat sumber daya manusia selanjutnya

dengan konstruksi classification rules yang terbentuk.

21


2.4.4 Pembandingan Tingkat Akurasi Dua Model Data mining yang

Dihasilkan oleh Decision tree Dan Naïve Bayes Studi Kasus: Suatu

Perusahaan Manufaktur dan Penjualan Sepeda (Afif Farisi, 2007)

Penelitian ini bertujuan melakukan simulasi pembuatan data mining model

dengan mengambil dataset dari basis data dan data warehouse suatu perusahaan

manufaktur dan penjualan sepeda. Implementasi data mining dengan

membandingkan dua algoritma classification yang berbeda yaitu decision tree dan

naïve bayes. Dataset yang digunakan dalam penelitian ini bersumber dari data

pelanggan dan transaksi penjualan sepeda dengan pemilihan atribut yang dapat

dilihat pada Tabel 2.5.

Tabel 2.5 Atribut yang Digunakan pada Data Pelanggan dan Penjualan

Atribut Tipe Data Keterangan Ckey Angka Primary key Mstatus Karakter Status perkawinan Gender Karakter Jenis kelamin Kidnum Karakter Jumlah anak Education Karakter Pendidikan terakhir Occupation Karakter Pekerjaan Hstatus Karakter Kepemilikan rumah CarNum Karakter Jumlah kendaraan bermotor IPYear Karakter Rentang gaji Region Karakter Domisili Age Angka Umur Bflag Karakter Membeli atau tidak membeli sepeda

Sumber: Afif Farisi (2007)

Tabel 2.7 menjelaskan atribut-atribut yang dimiliki pelanggan toko sepeda yang

akan digunakan untuk mengetahui pola pelanggan yang berpotensi membeli atau

tidak membeli sepeda. Dari seluruh dataset yang ada 90% dataset digunakan

sebagai train set, dan 10% digunakan sebagai test set.

Data mining tool yang digunakan dalam penelitian ini adalah SQL Server

Analysis Service yang merupakan fitur dari Microsoft SQL Server 2005.

Dengan menggunakan algoritma decision tree didapatkan 116 pola yang terbentuk

dengan temuan beberapa fakta sebagai berikut:

99,99% pelanggan yang memiliki satu kendaraan bermotor, dengan rentang

gaji 0 sampai dengan Rp 50.000.000 per tahun, dan umur 29 hingga 32 tahun,

22


pada regional solo, tidak akan membeli sepeda. Namun kemungkinan

munculnya seorang pelanggan dengan karakteristik tersebut hanya 0,25%.

99,99% pelanggan yang memiliki dua kendaraan bermotor, dengan rentang

gaji Rp 100.000.000 sampai dengan Rp 150.000.000 per tahun, dan umur 39

hingga 41 tahun, dengan jumlah anak dua, akan membeli sepeda. Namun

kemungkinan munculnya seorang pelanggan dengan karakteristik tersebut

hanya 0,11%.

Dengan menggunakan algoritma naïve bayes, didapatkan 35 grup yang saling

lepas, dengan fakta-fakta sebagai berikut:

Kemungkinan terbesar grup yang akan membeli sepeda adalah pelangan yang

tidak memiliki kendaraan bermotor, dengan persentase pembelian sebesar

63,59%. Kemungkinan munculnya seorang pelanggan dengan karakteristik

tersebut adalah 22,94%.

Kemungkinan terkecil grup yang akan membeli sepeda adalah pelangan umur

di atas 59 tahun, dengan persentase pembelian sebesar 0,06%. Kemungkinan

munculnya seorang pelanggan dengan karakteristik tersebut adalah 0,31%.

Perbandingan tingkat akurasi dari dua algoritma yang digunakan dapat dilihat

pada Gambar 2.4:

Gambar 2.4 Perbandingan Akurasi Decision tree dengan Naïve Bayes

Sumber: Afif Farisi (2007)

Seperti yang terlihat pada Gambar 2.4, model decision tree menghasilkan tingkat

akurasi 68,85% sedangkan model naïve bayes hanya menghasilkan tingkat akurasi

60,7%.

23


Berdasarkan tinjauan pustaka, penelitian sebelumnya, dan metodologi yang

dijelaskan sebelumnya maka dapat disusun suatu perbandingan dalam bentuk

tabel seperti yang terlihat pada Tabel 2.6 untuk perbandingan teori dan Tabel 2.7

untuk perbandingan penelitian terdahulu.

24


Perbandingan Teori Compare Contrast Criticize Synthesize Summarize Rujukan

Association Rule Mining

Suatu teknik

dalam data

mining yang

sering

digunakan untuk

proses

Knowledge

Discovery in

Data (KDD)

Digunakan untuk

memepelajari

pola keterkaitan

yang ada dengan

menggunakan

frequent itemset

yang muncul

Hanya

mempelajari

keterkaitan data

tanpa

mengelompokkan

data

Suatu tahapan dalam

menggali

pengetahuan dalam

data, baik dengan

cara mempelajari

pola keterkaitan

antar data,

membangun model

untuk memprediksi

klasifikasi data,

maupun

mengelompokkan

data berdasarkan

kesamaan atribut

pada data

Suatu usaha

untuk

mengekstraksi

dan

mengindentifikasi

informasi dari

sumber basis data

yang besar

dengan

mengidentifikasi

aturan, pola,

keteraturan, dan

kebiasaan yang

terbentuk

Jiawei Han, Michelin

Kamber, (2006). Data

mining Concepts and

Techniques. Morgan

Kaufmann Publishers.

Classification

Digunakan dalam

membangun

model untuk

prediksi kelas

suatu data atau

objek

Kelas terbentuk

akibat rule yang

ada, bukan

berdaasarkan

kesamaan atribut

pada data

Clustering Digunakan untuk

mengelompokkan

data berdasarkan

kesamaan atribut

data.

Pengelompokkan

data cenderung

berbentuk bulat

akibat pendekatan

euclidean.

Tabel 2.6 Perbandingan Teknik Dasar Data Mining

25


Perbandingan Penelitian Compare Contrast Criticize Synthesize Summarize Rujukan

Data mining Classifcation

Technique for Talent

Management using SVM

Penggunaan

beberapa teknik

dalam data

mining yang

diterapkan pada

data sumber

daya manusia

untuk

menajemen

kepegawaian

yang lebih baik

Menggabungkan

algoritma CACC,

SVM dan SMO

untuk teknik data

mining

classification

Pennggunaan

data mining tool

lain seharusnya

lebih mudah

dibandingkan

menggunakan

Matlab

Gabungan algoritma

CACC, SVM dan

SMO untuk

menghasilkan

prediksi dengan

akurasi yang lebih

baik

Classification

digunakan untuk

menemukan

model prediksi

bakat

kepegawaian

dalam organisasi

S.Yashoda, P.S.Prakash ,

(2012). Data mining

Classifcation Technique

for Talent Management

using SVM

The Decision tree

Classifcation And Its

Application Research In

Personnel Management

Implementasi

algoritma

Classification

C.45 pada data

kepegawaian

Membangun

model prediksi

tanpa melakukan

tes prediksi

Implementasi

algoritma C.45

dalam antar muka

Visual Basic untuk

memudahkan user

Implementasi

Classification

C.45 untuk

prediksi calon

pegawai

Peng Ye. (2011). The

Decision tree Classifcation

And Its Application

Research In Personnel

Management

Data mining classification

Techniques For Human

Talent Forecasting

Membandingkan

5 algoritma

Classification

untuk

menentukan kelas

pegawai

Masih banyak

algoritma lain

yang dapat

digunakan

sebagai

pembanding

Algoritma C 4.5

cukup akurat dalam

melakukan

Classification pada

data sumber daya

manusia.

Membandingkan

beberapa

algoritma

diperlukan untuk

mendapatkan

metode terbaik

Hamidah Jantan, Abdul

Razak Hamdan,Zulaiha

Ali Othman, (2011). Data

mining classification

Techniques For Human

Talent Forecasting

Tabel 2.7 Perbandingan Peneletian Sebelumnya

26


Perbandingan Penelitian Compare Contrast Criticize Synthesize Summarize Rujukan

Pembandingan Tingkat

Akurasi Dua Model Data

mining Yang Dihasilkan

Oleh Decision tree Dan

Naïve Bayes Studi Kasus:

Suatu Perusahaan

Manufaktur Dan

Penjualan Sepeda

Penerapan

teknik data

mining

classification

untuk

pengenalan pola

dan prediksi

Membandingkan

algoritma

decision tree

dengan naive

bayes untuk data

penjualan sepeda

Tingkat akurasi

yang dihasilkan

dari Classification

tidak terlalu

tinggi

Penggunaan 2

algoritma

Classification

bertujuan

menghasilkan

alternatif akurasi

yang lebih baik

Hasil

Classification

dapat digunakan

untuk

mengidentifikasi

pola demografi

pelanggan yang

potensial untuk

membeli

Afif Farisi. (2007).

Pembandingan Tingkat

Akurasi Dua Model Data

mining Yang Dihasilkan

Oleh Decision tree Dan

Naïve Bayes Studi Kasus:

Suatu Perusahaan

Manufaktur Dan Penjualan

Sepeda

27


Berdasarkan Tabel 2.6, maka dapat dilihat bahwa dari beberapa teknik data

mining yang dijelaskan oleh Jiawei Han dan Michelin Kamber dalam buku yang

berjudul Data mining Concepts and Techniques tahun 2006 dapat disimpulkan

bahwa teknik association rule tidak tepat digunakan pada penelitian ini

dikarenakan teknik tersebut hanya untuk mempelajari pola keterkaitan yang ada

dengan menggunakan frequent itemset yang muncul. Dengan demikian tidak

dapat dijadikan acuan untuk melakukan prediksi pengisian jabatan struktural pada

Pemerintah Kota Bogor.

Teknik clustering juga tidak tepat digunakan pada penelitian ini dikarenakan

teknik ini mengelompokan data berdasarkan kesamaan atribut data. Hal tersebut

dapat digunakan, jika pengelompokan data belum diketahui sebelumnya.

Sedangkan pada kasus jabatan struktural pengelompokan sudah terbentuk

berdasarkan tingkat eselon yang ada pada setiap jabatan struktural.

Oleh karena itu, teknik data mining yang tepat untuk digunakan pada penelitian

ini adalah classification, mengingat teknik classification dapat mempelajari pola

yang ada dari class yang sudah ditentukan sehingga dapat dibangun suatu model

prediksi berdasarkan pola yang terbentuk.

Penggunaan data pegawai dari tahun 2009 hingga tahun 2013 akan digunakan

sebagai train set untuk mengenali pola data kepegawaian, pola yang dihasilkan

akan dijadikan dasar untuk melakukan prediksi pengisian jabatan struktural

pegawai di tahun 2014. Test set yang akan digunakan adalah data kepegawaian

pada tanggal 10 Januari 2014, mengingat pada tanggal tersebut terjadi mutasi

jabatan struktural di lingkungan Pemerintah Kota Bogor.

Penelitian berujudul Data mining Classifcation Technique for Talent

Management using SVM menujukkan bagaiman kombinasi beberapa algoritma

classification seperti CACC, SVM, dan SMO dapat menghasilkan model prediksi

dengan akurasi yang lebih baik dalam menggali bakat kepegawaian dalam suatu

organisasi (S.Yashoda, P.S.Prakash, 2012).

Penelitian berjudul Data mining classification Techniques For Human Talent

Forecasting membuktikan bahwa alogirtma C4.5 memiliki akurasi yang lebih

baik dibandingkan beberapa algoritma classification lainnya, untuk melakukan

28


pengelompokkan kelas pegawai yang kemudian akan digunakan untuk meramal

bakat dari sumber daya manusia yang ada (Hamidah Jantan, Abdul Razak

Hamdan, Zulaiha Ali Othman, 2011).

Penelitian berjudul The Decision tree Classifcation and Its Application Research

In Personnel Management mencoba membangun suatu aplikasi berbasis desktop

yang memiliki kemampuan memprediksi hasil perekrutan pegawai baru dengan

mennggunakan teknik data mining classification (Peng Ye, 2011). Secara spesifik

algoritma yang digunakan untuk melakukan classification adalah algoritma C4.5.

Dalam studi kasus pengisian jabatan struktural di lingkungan Pemerintah Kota

Bogor beberapa atribut data yang akan digunakan mengacu pada Peraturan

Pemerintah No 13 tahun 2002 yaitu: golongan pegawai, masa kerja pegawai,

tingkat pendidikan pegawai, pengalaman dalam unit kerja, umur pegawai serta

pendidikan dan pelatihan yang pernah diikuti oleh pegawai. Dengan atribut

tersebut maka metode data mining yang sesuai untuk menemukan pola pengisian

jabatan struktural di lingkungan Pemerintah Kota bogor adalah teknik

classification. Atribut tambahan yang akan digunakan adalah atribut jenjang

jabatan yaitu jenjang jabatan fungsional maupun struktural, mengingat bisa saja

ada pegawai dengan jenjang jabatan fungsional diangkat menjadi pejabat

struktural meskipun hal tersebut jarang sekali terjadi di Pemerintah Kota Bogor.

2.5 Theoretical Framework

Untuk menyusun theoretical framework dalam penelitian ini dimulai dari

beberapa teori dasar dalam data mining serta regulasi yang mengatur pengisian

jabatan struktural bagi Pegawai Negeri Sipil. Berikut ini adalah theoretical

framework dari penelitian ini:

29


Gambar 2.5 Theoretical Framework Penelitian

Seperti yang dapat dilihat pada Gambar 2.5, dari beberapa teknik dasar mining

yang ada, teknik classification dapat digunakan untuk mengidentifikasi pola

prediksi suatu class yang belum di ketahui dari sumber data yang ada.

Secara spesifik beberapa penelitian sudah memanfaatkan teknik classification

untuk manajemen sumber daya manusia seperti talent management. Untuk

mengetahui faktor-faktor apa saja yang dapat digunakan sebagai atribut penilaian

dalam pengisian jabatan struktural bagi Pegawai Negeri Sipil, maka digunakan

regulasi pemerintah yang tertuang dalam Peraturan Pemerintah No 100 Tahun

2000 dan Peraturan Pemerintah No 13 Tahun 2002. Pada pasal 6 dari peraturan

tersebut disebutkan bahwa sebagai bahan pertimbangan dapat menggunakan

penilaian pegawai berdasarkan pangkat dan golongan, masa kerja, umur, tingkat

pendidikan, pendidikan dan pelatihan, serta pengalaman dalam unit kerja.

Teknik data mining classification yang diterapkan pada manajemen sumber daya

manusia dipengaruhi oleh 6 atribut yang berdasar pada Peraturan Pemerintah No

100 Tahun 2000 dan Peraturan Pemerintah No 13 Tahun 2002 serta satu atribut

tambahan yaitu jenjang jabatan yang digunakan untuk melihat kecendurangan

pengisian jabatan strukural pada jenjang jabatan struktural dan fungsional.

Hasil data mining classification tentunya akan mempengaruhi model prediksi

yang terbentuk. Model prediksi ini terdiri atas dua output yaitu pola pengisian

30


jabatan struktural yang terbentuk dari train set dan hasil prediksi pengisian jabatan

struktural berdasarkan test set yang diprediksi.


BAB 3

METODOLOGI PENELITIAN

Dalam penelitian ini dilakukan eksperimen dengan menggunakan 62 algoritma

cassification dengan 7 jenis data yaitu tingkat eselon yaitu Eselon V, Eselon IVB,

Eselon IVA, Eselon IIIB, Eselon IIIA, Eselon IIB, dan Eselon IIA.

3.1 Tahapan Penelitian

Kerangka kerja penelitian yang digunakan berdasar pada metodologi penelitian

studi kasus yang di dalamnya terdapat tahapan evaluasi dan analisis data. Objek

studi kasus pada penelitian ini yaitu Pemerintah Kota Bogor. Secara bertahap

kerangka kerja penelitian ini dapat dijelaskan pada Gambar 3.1:

Gambar 3.1 Kerangka Kerja Penelitian

32


Berdasarkan langkah-langkah metode penelitian seperti pada gambar 3.1, maka

penelitian dimulai dengan pendefinisian masalah pengisian jabatan struktural

berdasarkan hasil wawancara dengan nara sumber yaitu Sekretaris Baperjakat

Pemerintah Kota Bogor, yang kemudian dapat ditarik suatu pertanyaan penelitan

yaitu: “Apakah pola yang sesuai untuk melakukan pengisian jabatan

struktural di setiap tingkat eselon pada Pemerintah Kota Bogor?"

Untuk dapat menjawab pertanyaan penelitan tersebut tentunya diperlukan langkah

untuk menentukan teknik pengumpulan data dan analisis yang diperlukan dengan

cara melakukan studi literatur yang menghasilkan theoretical framework untuk

penelitan ini.

Langkah selanjutnya adalah mengidentifikasi proses bisnis dan data yang

dibutuhkan untuk melakukan data mining dengan menggunakan atribut yang

menjadi penilaian dalam jabatan struktural yang tercantum dalam Peraturan

Pemerintah Republik Indonesia Nomor 13 Tahun 2002 tentang pengangkatan

Pegawai Negeri Sipil dalam jabatan struktural.

Setelah mendapatkan atribut yang diperlukan maka baru dapat dilakukan

pengumpulan data dari basis data SIMPEG yang selanjutnya akan masuk ke

dalam tahap pra-proses dalam data mining dengan menggunakan teknik ekstraksi

data dan transformasi data. Proses tersebut akan menghasilkan train set dan test

set. Train set digunakan untuk menghasilkan pola prediksi pengisian jabatan

struktural. Test set digunakan untuk menguji akurasi dari pola prediksi yang

terbentuk sebelumnya. Tahapan proses ini merupakan tahapan awal dalam proses

Knowledge Discovery Data (KDD).

Setelah data train set dan test set untuk proses data mining didapatkan, barulah

proses pengolahan data dengan menggunakan classification dilakukan untuk

mendapatkan pola pengisian jabatan struktural yang ada.

Pola pengisian jabatan struktural yang terbentuk akan dijadikan dasar untuk

memprediksi data calon pejabat struktural di tahun 2014. Hasil prediksi akan

dibandingkan dengan data pejabat struktural aktual untuk mengukur akurasi dari

prediksi yang dilakukan.

33


Setelah hasil prediksi dan nilai akurasinya diukur, maka dapat ditarik suatu

kesimpulan secara umum dengan menggunakan teknik penarikan kesimpulan

induktif dimana hal ini pada proses Knowledge Discovery Data (KDD) disebut

juga sebagai knowledge presentation.

3.2 Metode Pengumpulan Data

Pengumpulan data pada penelitian ini dilakukan dengan menggunakan metode

observasi langsung terhadap basis data kepegawaian dari Sistem Informasi

Manajemen Kepegawaian (SIMPEG) Pemerintah Kota Bogor.

Data yang digunakan dapat dilihat pada Tabel 3.1.

Tabel 3.1 Data yang Tersedia

Tujuan Data Format Data Rujukan Mendapatkan atribut pangkat golongan pegawai pada saat menjadi pejabat struktural

Data SK Mutasi Jabatan Struktural Pegawai

MySQL

2009-2013 (sumber : SIMPEG Kota Bogor)

Mendapatkan data jabatan struktural pegawai

Data SK Mutasi Jabatan Struktural Pegawai

MySQL

2009-2013 (sumber : SIMPEG Kota Bogor)

Mendapatkan atribut tingkat pendidikan pegawai

Data Riwayat Pendidikan Pegawai

MySQL

2009-2013 (sumber : SIMPEG Bogor)

Mendapatkan atribut pendidikan dan pelatihan pegawai

Data Pendidikan dan Pelatihan Pegawai

MySQL

2009-2013 (sumber : SIMPEG Bogor)

Berdasarkan Tabel 3.1 dapat dijelaskan bahwa itemset yang akan disusun hanya

akan menggunakan data mutasi jabatan struktural dengan menggunakan 7 atribut

yang dibahas pada theoretical framework sebelumnya. Dari 7 atribut yang akan

digunakan, 3 di antaranya sudah tersimpan didalam basis data SIMPEG yaitu:

pangkat dan golongan pegawai pada saat diangkat menjadi pejabat struktural,

tingkat pendidikan pegawai, dan pendidikan dan pelatihan pegawai. Sedangkan

dua atribut berikutnya yaitu masa kerja pegawai dan pengalaman pegawai dalam

34


unit kerja akan didapatkan dengan menggunakan teknik-teknik data integration,

selection dan transformation yang merupakan tahap pra-proses dalam data

mining.

3.3 Metode Analisis Data

Penelitian ini menggunakan pendekatan kuantitatif dalam tahap analisis data,

dengan menggunakan teknik Classification untuk mendapatkan pola pengisian

jabatan struktural dari basis data SIMPEG dengan menggunakan tahapan proses

Knowledge Discovery Data (KDD).

Pola yang teridentifikasi akan dijadikan dasar pengetahuan bagi aplikasi SIMPEG

sehingga memiliki kemampuan untuk dapat memberikan usulan pengisian jabatan

struktural bagi Baperjakat dalam menyusun draft mutasi jabatan struktural di

lingkungan Pemerintah Kota Bogor.

Beberapa perangkat lunak berbasis open source yang dapat digunakan untuk

melakukan Classification di antaranya yaitu Weka, R, dan Rapidminer.

Berdasarkan hasil survey tahun 2007 yang dilakukan kdnuggets.com tiga

perangkat lunak inilah yang situsnya paling sering dikunjungi oleh ahli data

mining (Pehlivanli,2011). Berikut ini adalah hasil survey tahun 2007 yang

dilakukan oleh situs data mining kdnuggest.com yang dapat dilihat pada Gambar

3.2.

Gambar 3.2 Hasil Survey Kdnuggets.com Tahun 2007

Sumber: Pehlivanli (2011)

Seperti yang dapat dilihat pada Gambar 3.2, situs web Yale (Rapidminer) adalah

yang paling sering dikunjungi oleh ahli data mining, selanjutnya diikuti oleh

Weka dan R. Ketiga perangkat lunak ini tentunya memiliki kelebihan dan

kekurangan masing-masing yang dapat dilihat pada Tabel 3.2.

35


Data mining Tools Compare Contrast Criticize Synthesize Summarize Rujukan

Rapidminer

Aplikasi data

mining gratis

yang sering

digunakan

Memiliki fitur

lebih dari 400

algoritma data

mining dan

mendukung 22

format basis data

Tidak cocok

untuk mengolah

data yang

sederhana

mengingat fitur

yang sangat

kompleks

Data mining tool

gratis dengan fitur

yang sangat banyak

Aplikasi data

mining untuk

beragam jenis

algoritma dan

format data

Ayca Cahmak Pehlivanli ,

(2011). The Comparison

Of Data mining Tools

Weka

Tampilan CLI

command yang

sederhana dan

muudah dipahami

Algoritma yang

tersedia terkesan

secukupnya

Data mining tool

gratis dengan menu

yang sederhana dan

mudah untuk

dipelajari

Aplikasi data

mining sederhana

untuk sejumlah

format data

R Dapat

mengembangkan

algoritma sendiri

dengan bahasa

pemrograman R

Menguasai bahasa

pemrograman R

merupakan

kesulitan

tersendiri

Data mining tool

dengan

menggunakan

bahasa pemrograman

sendiri

Aplikasi data

mining dengan

kebebasan

mengembangkan

algoritma sendiri

Tabel 3.2 Tabel Perbandingan Data Mining Tools

36


Berdasarkan Tabel 3.2, maka untuk melakukan teknik classification pada

penelitian ini cukup menggunakan perangkat lunak WEKA, mengingat

penggunaan R yang cukup rumit dengan bahasa pemrograman tersendiri, dan

Rapidminer yang memiliki fitur dan algoritma yang terlalu banyak dan memakan

resource yang lebih besar dibandingkan WEKA.

Untuk mengantisipasi algoritma classification yang tidak tersedia pada WEKA

maka digunakan data mining tools lainnya yang bersifat open source seperti:

CRUISE : Classification Rule with Unbiased Interaction Selection and

Estimation. Data mining tool berbasis teks ini dijalankan dengan command line

dengan input dan output dalam format *.txt dengan output model berupa

decision tree.

C5.0 : Paket implementasi algoritma C.50 dalam data mining tool R dengan

dengan output model berupa decision tree.


BAB 4

ANALISIS DAN PEMBAHASAN

4.1 Data Pre-processing

Sebelum dapat melakukan implementasi teknik data mining classification pada

atribut data kepegawaian yang dibutuhkan (pangkat dan golongan, masa kerja,

tingkat pendidikan, pendidikan dan pelatihan, pengalaman pegawai dalam unit

kerja, umur, jenjang jabatan), maka terlebih dahulu dilakukan tahap data pre-

processing yang terdiri dari dua tahapan yaitu ekstraksi data dan transformasi data

ke dalam bentuk yang dapat digunakan untuk data mining tool WEKA untuk

mengidentifikasi pola dengan teknik data mining classification.

4.1.1 Ekstraksi Data

Tujuh atribut yang dibahas pada bagian sebelumnya tentunya berasal dari

beberapa tabel yang berbeda, bahkan beberapa atribut seperti masa kerja dan

pengalaman pegawai dalam unit kerja tidak secara langsung tersimpan dalam

basis data, sehingga perlu dibuat suatu fungsi untuk menghitung nilai atribut

tersebut. Berikut ini adalah sumber data dari setiap atribut yang akan digunakan:

Pangkat golongan pegawai diperoleh dari kolom keterangan pada tabel SK.

Tidak seluruh data pada tabel SK akan digunakan, data yang digunakan sebagai

training set yaitu data SK dengan kolom id_kategori_sk 10 yang berarti data

mutasi jabatan, dan data SK dengan kolom id_kategori_sk 5 yang berarti

kenaikan pangkat terakhir pegawai.

Masa kerja pegawai yang didapatkan dari fungsi pengurangan antara kolom

tmt pada tabel SK dengan kolom id_kategori_sk 10 yang berarti data mutasi

jabatan dengan kolom tmt pada pada tabel SK dengan kolom id_kategori 6

yang berarti data berkas CPNS.

Tingkat pendidikan pegawai pada saat menerima jabatanyang didapatkan dari

kolom tingkat_pendidikan dari tabel pendidikan.

Pendidikan dan pelatihan pegawai khususnya pendidikan dan pelatihan

kepemimpinan yang didapatkan dari kolom nama_diklat pada tabel diklat.

38


Pengalaman pegawai dalam unit kerja yang didapatkan dari fungsi

pengurangan antara kolom tmt pada tabel SK dengan kolom id_kategori_sk 10

yang berarti data mutasi jabatan dengan kolom tmt pada pada tabel SK dengan

kolom id_kategori 1 yang berarti data alih tugas pegawai.

Atribut yang akan dijadikan sebagai classifier adalah kolom eselonering yang

didapatkan dari kolom eselon pada tabel jabatan yang terhubung dengan tabel

sk melalui kolom id_j. Kolom ini akan memiliki nilai >0 jika memiliki jabatan

struktural.

Atribut umur pada test set didapatkan dari fungsi pengurangan antara tanggal

mutasi jabatan terkahir yaitu 10-01-2014 dengan kolom tgl_lahir pada tabel

pegawai, sedangkan pada train set dikurangi dari tanggal mulai terhitung SK

tersebut.

Atribut jenjang jabatan didapatkan dari kolom jenjab pada tabel pegawai.

Train set yang akan digunakan adalah data SK mutasi jabatan dan data SK

kenaikan pangkat terakhir pegawai. Untuk data calon pejabat diambil dari data

pegawai yang pangkat golongannya memenuhi syarat minimum untuk mengisi

suatu jabatan (lihat Tabel 2.1). Selain itu data calon pejabat juga diambil dari data

pegawai dengan golongan satu tingkat di bawah minimum sesuai dengan

Peraturan Pemerintah No 100 tahun 2000 tentang Pengangkatan Pegawai Negeri

Sipil Dalam Jabatan Struktural yang kemudian disempurnakan dengan Peraturan

Pemerintah No 13 Tahun 2002.

39


Berikut ini adalah struktur tabel yang akan digunakan dalam pengumpulan data:

Gambar 4.1 Struktur Basisdata SIMPEG yang Digunakan

Berdasarkan Gambar 4.1, dapat dilihat bahwa tabel utama dari basis data SIMPEG

adalah tabel pegawai. Meskipun demikian tabel yang akan menjadi sumber data

utama untuk penelitian ini adalah tabel sk mengingat seluruh data mutasi jabatan

dan kenaikan pangkat berada pada tabel tersebut. Data tingkat pendidikan berasal

dari tabel pendidikan, sedangkan data pendidikan dan pelatihan berasal dari tabel

diklat. Dalam hal ini tabel jabatan digunakan untuk menjelaskan tingkat

eselonering yang ada pada suatu SK mutasi jabatan struktural.

Dari seluruh total data pada tabel sk yang berjumlah 56.366 data hanya akan

digunakan 3.265 data mutasi jabatan dan 2.404 data kenaikan pangkat pegawai

yang pangkatnya memenuhi syarat minimum untuk mengisi jabatan struktural.

Karena setiap eselon tentu memiliki persyaratan minimum kepangkatan yang

berbeda maka untuk penelitian ini data dibagi menjadi 7 bagian sesuai dengan

tingkat eselon yang ada.

40


Berdasarkan kebutuhan atribut yang akan digunakan, maka struktur tabel yang

akan digunakan untuk teknik data mining classification dalam penelitian ini dapat


Tabel 4.1 Atribut yang Digunakan

Atribut Tipe Data Range Data / Keterangan Pangkat golongan Teks III/a, III/b, III/c, III/d, IV/a,

IV/b, IV/c, IV/d, IVe Masa kerja Desimal Dalam satuan tahun

Tingkat pendidikan Teks SD, SMP, SMA, D1, D2, D3, S1, S2, S3

Pendidikan dan pelatihan Desimal Pim II, Pim III, Pim IV, Belum Mengikuti

Pengalaman dalam unit kerja

Teks Dalam satuan tahun

Eselonering Teks IIA, IIB, IIIA, IIIB, IVA, IVB, V, Staf

Umur Desimal Dalam satuan tahun Jenjang Jabatan Teks Struktural, Fungsional

Seperti yang terlihat pada Tabel 4.1, atribut eselonering adalah atribut yang

dijadikan classifier dalam penelitian ini sehingga dari pola atribut lainnya akan

digunakan untuk menentukan tingkat eselonering yang didapatkan. Untuk atribut

masa kerja dan pengalaman dalam unit kerja memiliki tipe data yang sama yaitu

jumlah tahun dalam satuan desimal untuk mengantisipasi jumlah bulan dalam

masa kerja, misalnya untuk pengalaman kerja sebanyak 1 tahun 6 bulan maka

akan direpresentasikan ke dalam 1,5 tahun.

41


Berdasarkan ekstraksi data yang dilakukan pada basis data SIMPEG sesuai

dengan tingkat eselon yang ada maka didapatkan jumlah training set dan test set

yang dapat dilihat pada Tabel 4.2:

Tabel 4.2 Jumlah Record Data yang Digunakan

Tingkat Eselon

SK Mutasi Jabatan (train set)

SK Kenaikan Pangkat (train set)

Kondisi Exisiting (10-01-2014) (test set)

V 73 868 1.001 IVB 1.096 1.893 2.363 IVA 1.272 2.790 2.368 IIIB 254 5.110 4.223 IIIA 194 4.216 3.694 IIB 112 3.376 3.046 IIA 3 392 271

Seperti yang dapat dilihat pada Tabel 4.2 di atas rendahnya jumlah train set pada

tingkat Eselon IIA disebabkan hanya ada satu jabatan struktural pada tingkat

eselon tersebut yaitu jabatan Sekretaris Daerah. Hal ini berbeda dengan jabatan

pada eselon lain dimana seringkali mengalami rotasi jabatan struktural setidaknya

3 kali dalam 1 tahun.

Jumlah sebaran data untuk tiap atribut pada setiap tingkat eselon tentunya juga

berbeda baik dari train set yang akan digunakan untuk mengidentifikasi pola

prediksi maupun dari test set yang digunakan untuk mengukur akurasi prediksi,

seperti yang dapat dilihat pada tabel 4.3. dan 4.4

Tabel 4.3 Sebaran Data Atribut Pangkat Golongan pada Train Set

Eselon III/a III/b III/c III/d IV/a IV/b IV/c IV/d V 446 479 14 2 0 0 0 0

IVB 773 1.465 698 36 12 5 0 0 IVA 0 1.610 1.338 882 223 9 0 0 IIIB 0 0 1.355 1.040 2.943 25 1 0 IIIA 0 0 0 1.051 3.071 286 2 0 IIB 0 0 0 0 3.096 354 35 0 IIA 0 0 0 0 0 355 36 4

42


Tabel 4.4 Sebaran Data Atribut Pangkat Golongan pada Test Set

Eselon III/a III/b III/c III/d IV/a IV/b IV/c IV/d V 513 488 0 0 0 0 0 0

IVB 835 875 653 0 0 0 0 0 IVA 0 917 773 678 0 0 0 0 IIIB 0 0 774 688 2.761 0 0 0 IIIA 0 0 0 692 2.777 225 0 0 IIB 0 0 0 0 2.777 243 26 0 IIA 0 0 0 0 0 243 26 2

Seperti yang dapat dilihat pada tabel 4.3 dan 4.4, secara umum sebaran data train

set dan test set menumpuk pada tingkat Eselon IIIB dan IIIA khusunya pada

golongan IV/a. Hal ini disebabkan oleh banyaknya pegawai dengan golongan IV/a

khususnya pada jenjang jabatan fungsional guru.

Tabel 4.5 Sebaran Data Atribut Masa Kerja pada Train Set

Eselon Rata-Rata Standar Deviasi V 8,193 6,321

IVB 12,663 8,569 IVA 15,741 8,605 IIIB 24.378 8,479 IIIA 21,08 6,252 IIB 21,73 5,769 IIA 25,08 7,79

Tabel 4.6 Sebaran Data Atribut Masa Kerja pada Test Set


IVB 12,04 8,122 IVA 15,877 8,831 IIIB 24.378 8,479 IIIA 26,605 6,857 IIB 28 5,807 IIA 29,12 5,679

Seperti yang dapat dilihat pada Tabel 4.5 dan Tabel 4.6, setiap tingkat eselon yang

lebih tinggi tentunya memiliki rata-rata masa kerja yang lebih lama sebagai

contoh untuk tingkat Eselon IIA memerlukan masa kerja sekurang-kurangnya 25

hingga 29 tahun.

43


Tabel 4.7 Sebaran Data Atribut Tingkat Pendidikan pada Train Set

Eselon SD SMP SMA D1 D2 D3 S1 S2 S3 V 0 0 81 5 36 77 729 0 0

IVB 0 0 779 18 53 147 1.891 101 0 IVA 0 0 848 49 101 228 2.362 473 1 IIIB 0 0 498 67 1.010 286 2.913 588 2 IIIA 0 0 286 63 1.009 233 2.271 545 3 IIB 0 0 209 25 943 140 1.703 466 2 IIA 0 0 8 1 17 1 204 163 1

Tabel 4.8 Sebaran Data Atribut Tingkat Pendidikan pada Test Set

Eselon SD SMP SMA D1 D2 D3 S1 S2 S3 V 0 0 100 4 30 75 784 8 0

IVB 0 0 570 15 45 157 1.532 44 0 IVA 0 0 568 35 64 182 1.434 85 0 IIIB 0 0 357 43 584 196 2.790 252 1 IIIA 0 0 157 40 578 162 2.478 277 2 IIB 0 0 60 13 545 88 2.074 264 2 IIA 0 0 2 1 11 2 178 76 1

Seperti yang dapat dilihat pada tabel 4.7 dan 4.8, data tingkat pendidikan

menumpuk pada D2 dan S1. Untuk tingkat D2 mayoritas adalah guru SD yang

pendidikan minimalnya adalah PGSD dengan tingkat pendidikan D2, sedangkan

S1 adalah formasi umum tingkat pendidikan minimum yang diminta untuk Calon

Pegawai Negeri Sipil dalam 5 tahun terakhir.

Tabel 4.9 Sebaran Data Atribut Pendidikan dan Pelatihan pada Train Set

Eselon Belum Mengikuti

Pim IV Pim III Pim II

V 937 4 0 0 IVB 2.767 212 10 0 IVA 3.242 757 61 0 IIIB 4.561 678 123 0 IIIA 3.825 376 205 0 IIB 3.101 155 194 38 IIA 263 13 78 39

44


Tabel 4.10 Sebaran Data Atribut Pendidikan dan Pelatihan pada Test Set

Eselon Belum Mengikuti

Pim IV Pim III Pim II

V 1.001 0 0 0 IVB 2210 150 3 0 IVA 1.918 434 16 0 IIIB 3.761 407 55 0 IIIA 3.369 236 89 0 IIB 2.883 63 88 12 IIA 208 8 43 0

Seperti yang dapat dilihat pada tabel 4.9 dan 4.10, banyaknya pegawai yang

belum mengikuti diklat kepemimpinan dikarenakan pegawai dengan jenjang

jabatan fungsional yang memang tidak pernah mengikuti pendidikan dan pelatihan

kepemimpinan untuk jabatan struktural.

Tabel 4.11 Sebaran Data Atribut Pengalaman Unit Kerja pada Train Set


IVB 0,353 1,283 IVA 0,608 1,595 IIIB 0,329 1,175 IIIA 0,138 0,729 IIB 0,093 0,679 IIA 0,241 1,412

Tabel 4.12 Sebaran Data Atribut Pengalaman Unit Kerja pada Test Set



Seperti yang dapat dilihat pada tabel 4.11 dan 4.12, nilai rata-rata untuk atribut

pengalaman unit kerja cukup rendah. Hal ini menujukkan pengalaman dalam unit

kerja tidak terlalu diperhatikan dalam pengisian jabatan struktural.

45


Tabel 4.13 Sebaran Data Atribut Umur pada Train Set



Tabel 4.14 Sebaran Data Atribut Umur pada Test Set


IVB 41,936 7,,124 IVA 43,963 6,764 IIIB 49,213 5,849 IIIA 50,465 4,994 IIB 51,403 4,353 IIA 52,571 4,039

Seperti yang dapat dilihat pada Tabel 4.13 dan 4.14, setiap tingkat eselon

memiliki rata-rata umur yang berbeda. Untuk tingkat eselon terendah yaitu Eselon

V rata-rata umur adalah 40 hinnga 41 tahun sedangkan untuk tingkat eselon

tertinggi yaitu Eselon IIA rata-rata umur adalah 52 tahun.

Tabel 4.15 Sebaran Data Atribut Jenjang Jabatan pada Train Set

Eselon Struktural Fungsional V 88 853

IVB 1.665 1.324 IVA 2.588 1.474 IIIB 1.699 3.665 IIIA 1.007 3.403 IIB 623 2.865 IIA 166 229

46


Tabel 4.16 Sebaran Data Atribut Jenjang Jabatan pada Test Set


IVB 1.010 1.353 IVA 2.588 1.474 IIIB 696 3.527 IIIA 424 3.270 IIB 203 2.843 IIA 67 204

Seperti yang dapat dilihat pada Tabel 4.15 dan 4.16, pegawai dengan jenjang

jabatan fugsional mendominasi di setiap tingkat eselon, hal ini juga membuktikan

bahwa lebih dari 50% pegawai di Pemerintah Kota Bogor memiliki jenjang

jabatan fungsional.

Tabel 4.17 Sebaran Data Atribut Eselonering pada Train Set

Eselon Eselon Non Eselon V 73 868

IVB 1.096 1.893 IVA 1.272 2.790 IIIB 254 5.110 IIIA 194 4.216 IIB 112 3.376 IIA 3 392

Tabel 4.18 Sebaran Data Atribut Eselonering pada Test Set


IVB 363 2.000 IVA 341 2.027 IIIB 63 4.160 IIIA 48 3.646 IIB 29 3.017 IIA 0 271

Seperti yang dapat dilihat pada Tabel 4.17 dan 4.18, rendahnya jumlah train set

pada tingkat Eselon V dan Eselon IIA dikhawatirkan akan menyebabkan

rendahnya akurasi prediksi pada test set di tingkat eselon yang sama. Jumlah data

secara menyeluruh untuk tiap tingkat eselon dapat dilihat pada Lampiran 2.

47


4.1.2 Transformasi Data

Setelah atribut dan ekstraksi data dilakukan maka tahapan selanjutnya adalah

melakukan transformasi data dengan melakukan validasi data untuk setiap atribut

seperti menghapus record yang memiliki nilai NULL pada atribut pangkat dan

golongan. Sedangkan pada atribut pendidikan dan pelatihan akan berisi ‘belum

mengikuti’ apabila data yang bersangkutan tidak pernah mengikuti diklat

kepemimpinan.

Dari total 3.265 SK mutasi jabatan tentunya harus melalui validasi terlebih dahulu

seperti validasi atribut eselonering yang menjadi classifier. Jika pada kolom id_j

pada tabel SK bernilai 0, maka record tersebut tidak dapat digunakan dan harus

dihapus, mengingat kolom id_j adalah foreign key ke tabel jabatan yang

mengidentifikasikan jabatan dan tingkat eselonering dari suatu SK mutasi jabatan.

Dari hasil validasi ini 3.004 SK yang dapat diidentifikasi tingkat eseloneringnya.

Dari total 16.346 SK kenaikan pangkat juga melalui validasi terlebih dahulu. SK

kenaikan pangkat yang digunakan adalah SK untuk pegawai struktural dengan

pangkat dan golongan minimum untuk mengisi jabatan struktural yaitu golongan

III/b ke atas yang belum pernah menjadi pejabat struktural. Untuk tingkat Eselon

V menggunakan SK pegawai dengan golongan III/a ke atas khusus pada unit kerja

dinas pendidikan, mengingat jabatan Eselon V hanya ada pada unit kerja tersebut.

Dari hasil validasi ini diperoleh 438 SK pegawai yang memenuhi pangkat

minimum untuk mengisi jabatan struktural tetapi belum mendapatkan untuk

menjadi pejabat struktural.

Atribut pendidikan dan pelatihan juga mengalami proses transformasi data dengan

beberapa nilai memiliki makna yang sama seperti yang dapat dijelaskan pada

Tabel 4.19.

Tabel 4.19 Penyeragaman Atribut Pendidikan dan Pelatihan

Nilai Atribut Bentuk Penyeragaman Adum, Adumla, SPADA,SPALA, Diklat

Kepemimpinan Tk. IV Pim IV

SPAMA, Pim III, Diklat Kepemimpinan Tk. III Pim III SPAMEN, Pim II, Diklat Kepemimpinan Tk. II Pim II

48


Seperti yang dapat dilihat pada tabel 4.19, yang paling banyak memiliki

keragaman adalah jenis diklat Pim IV, dengan Adum, Adumla, SPADA, SPALA

dan Diklat Kepemimpian Tk. IV merupakan hal yang sama yaitu pendidikan dan

pelatihan untuk pejabat eselon IV yang dalam hal ini diseragamkan dengan label

Pim IV.

Fungsi agregasi digunakan untuk mengisi atribut masa kerja dan atribut

pengalaman dalam unit kerja. Atribut masa kerja dihitung dengan cara

mengurangi kolom tmt pada SK mutasi jabatan atau SK kenaikan pangkat dengan

kolom tmt pada SK CPNS. Sedangkan pada atribut pengalaman dalam unit kerja

dihitung dengan cara mengurangi kolom tmt pada SK mutasi jabatan atau SK

kenaikan pangkat dengan kolom tmt pada sk alih kerja.

Khusus atribut pengalaman dalam unit kerja, nilainya bisa saja berbeda untuk test

set di setiap tingkat eselon. Misalnya seorang pegawai pernah menjabat sebagai

eselon IVA selama 1,5 tahun, maka nilai tersebut hanya akan digunakan pada saat

melakukan classification untuk tingkat eselon IVA. Sedangkan nilai pengalaman

unit kerja untuk dari pegawai tersebut untuk tingkat eselon di atasnya bernilai 0

tahun.

Setelah semua data dari setiap atribut didapatkan dari basis data SIMPEG maka

agar dapat diolah dengan menggunakan data mining tool WEKA, data tersebut

dikonversi dalam format *.csv yang dikonversi lagi menjadi format file *.arff baik

untuk train set maupun test set dari setiap tingkatan eselon.

4.2 Data Mining dengan Classification

Pengolahan data pada penelitian ini dibagi menjadi 7 bagian sesuai dengan jumlah

tingkat eselon yang ada, dengan Eselon V sebagai jabatan dengan tingkat terendah

yaitu Kepala Tata Usaha SMP dan SMA, dan Eselon IIA sebagai jabatan tertinggi

yaitu Sekretaris Daerah Kota Bogor.

Data mining tool yang digunakan adalah WEKA, R, dan CRUISE. Teknik data

mining yang digunakan adalah classification dengan menggunakan 7 atribut yaitu

umur, pangkat golongan, masa kerja, pengalaman dalam unit kerja, tingkat

pendidikan, pendidikan dan pelatihan jabatan, serta tingkat eselon sebagai atribut

classifier. Dalam penelitian ini seluruh algoritma classification (60 Algoritma)

49


yang tersedia pada WEKA digunakan untuk menemukan hasil akurasi prediksi

yang terbaik.

4.2.1 Classification pada Data Eselon V

Pada data tingkat Eselon V terdiri atas 941 train set (73 Mutasi Jabatan dan 868

Kenaikan Pangkat) dan 1.001 test set dengan hasil classification seperti pada

Tabel 4.20.

Tabel 4.20 Hasil Classification untuk Eselon V

Algoritma Pola prediksi

Data mining

tool

Akurasi Train

set

Akurasi Test set

Akurasi Eselon

V

Akurasi Non

eselon

AD Tree ada Weka 99,89% 94,8% 100% 94,71%

CRUISE ada CRUISE 99,15% 94,21% 100% 94,1%

Seperti yang dapat dilihat pada tabel 4.20, salah satu algoritma dengan akurasi

eselon terbaik yang menghasilkan pola prediksi adalah algoritma AD tree dengan

confusion matrix seperti yang dapat dilihat padaTabel 4.21.

Tabel 4.21 Confusion Matrix untuk Algoritma AD Tree

Eselon V Non Eselon 18 0 52 931

Tabel 4.21 menjelaskan bahwa algoritma AD tree menghasilkan nilai akurasi

sebesar 94,8% pada prediksi test set Eselon V dengan tanpa kesalahan prediksi

pada data Eselon V, dan 52 kesalahan dalam memprediksi data non eselon.

Secara umum algoritma ini melakukan klasifikasi dengan cara menyusun decision

tree dengan beberapa cabang alternatif keputusan. Dalam hal ini setiap cabang

memiliki nilai yang berbeda sesuai dengan nilai yang ada pada setiap test set.

Nilai pada setiap atribut tersebut akan dijumlahkan sesuai dengan data test set

yang diuji. Jika total nilai bernilai negatif maka akan diklasifikasikan sebagai

eselon V, sebaliknya jika total nilai bernilai positif maka akan diklasifikasikan

sebagai non eselon. Pola prediksi yang terbentuk untuk data Eselon V dapat

dilihat pada Gambar 4.2.

50


Gambar 4.2 Pola Pengisian Jabatan Struktural Eselon V

51


Seperti yang dapat dilihat pada Gambar 4.2, pola pengisian jabatan struktural yang

terbentuk dibagi menjadi 9 rule dengan urutan sebagai berikut:

1. Nilai awal dari suatu test set adalah 1,232. Apabila suatu data memiliki jenjang

jabatan fungsional maka akan diberi nilai 3,507, sebaliknya jika memiliki

jenjang jabatan struktural akan diberi nilai -2,035.

2. Jika pegawai dengan jenjang struktural tersebut berumur di bawah 49,292

tahun maka akan diberi nilai 0,009, sebaliknya apabila berumur lebih dari sama

dengan 49,292 akan diberi nilai -0,946.

3. Jika pegawai struktural tersebut memiliki masa kerja di bawah 23,75 tahun

maka akan diberi nilai 0,112, sebaliknya jika masa kerjanya lebih dari sama

dengan 23,75 maka akan diberi nilai -0,832.

4. Untuk pegawai dengan masa kerja di bawah 17,708 tahun akan diberi nilai

1,341, sebaliknya pegawai dengan masa kerja lebih dari sama dengan 17,708

akan diberi nilai -1,133.

5. Pegawai dengan masa kerja di atas 17,708 tersebut, apabila memiliki pangkat

golongan III/b maka akan diberi nilai 0,549, sebaliknya jika memiliki pangkat

selain III/b maka akan diberi nilai -0,726.

6. Pegawai dengan masa kerja di atas 17,708 tersebut, apabila memiliki umur di

bawah 49,125 tahun maka akan diberi nilai -0,555, sebaliknya apabila memiliki

umur lebih dari sama dengan 49,125 maka akan diberi nilai 0,443.

7. Untuk pegawai dengan masa kerja di bawah 12,292 tahun akan diberi nilai

1,067, sebaliknya apabila masa kerjanya lebih dari sama dengan 12,292 tahun

akan diberi nilai -0,205.

8. Pegawai dengan masa kerja di atas 12,292 tahun tersebut, apabila memiliki

umur di bawah 39,667 tahun maka akan diberi nilai -0,896, sebaliknya jika

memiliki umur lebih dari sama dengan 39,667 tahun maka akan diberi nilai

0,27.

9. Pegawai dengan umur lebih dari sama dengan 39,667 tahun tersebut, apabila

berumur di bawah 49,292 maka akan diberi nilai 0,407, sebaliknya apabila

berumur lebih dari sama dengan 49,292 maka akan diberi nilai -0,418.

52


Sebagai contoh apabila sebuah data memilki nilai atribut seperti yang ditampilkan

pada tabel 4.22, maka kita tinggal menghitung nilai atribut sesuai dengan 9 nilai

atribut dari pola pengisian yang disebutkan sebelumnya.

Tabel 4.22 Contoh Test Set data Eselon V

Masa Kerja

Tingkat Pendidikan

Pangkat Golongan

Pengalaman Unit Kerja

Pendidikan Pelatihan

Umur Jenjang Jabatan

15,916 SMA III/a 0 Belum Mengikuti

39,667 Struktural

Berdasarkan contoh test set yang ada, maka dengan menggunakan pola pengisian

yang terbentuk dari algoritma AD tree nilai total untuk setiap atribut dapat

dihitung seperti yang ditampilkan pada Tabel 4.23.

Tabel 4.23 Contoh Hasil Perhitungan Nilai untuk Setiap Atribut

Nilai Rule

1,232 Nilai Awal -2,035 Jenjang Jabatan = Struktural 0,099 Umur < 49,292

0,112 Masa Kerja < 23,75

1,341 Masa Kerja < 17,708

-0,205 Masa Kerja >= 12,292

0,27 Umur >=39,667

0,407 Umur < 49,292

1,222 Total Nilai

Seperti yang terlihat pada Tabel 4.23 total nilai dari contoh test set tersebut

bernilai positif (1,222) sehingga diprediksi sebagai non eselon.

Algoritma lain yang juga menghasilkan akurasi class Eselon V cukup tinggi

adalah CRUISE yang diimplementasikan dengan menggunakan data mining tool

berbasis teks dengan nama yang sama yaitu CRUISE. Hasil confusion matrix

dapat dilihat pada Tabel 4.24.

Tabel 4.24 Confusion Matrix untuk Algoritma CRUISE untuk Eselon V

Eselon V Non Eselon 18 0 58 925

Tabel 4.24 menjelaskan bahwa algoritma CRUISE menghasilkan nilai akurasi

sebesar 94,21% pada prediksi test set Eselon V dengan tanpa kesalahan prediksi

53


pada data Eselon V, dan 58 kesalahan dalam memprediksi data non eselon.

Berikut ini adalah decision tree yang terbentuk:

Node 1: masakerja <= 12.2917 Node 2: Terminal Node, predicted class = non eselon Class label : V non eselon Class size : 0 793 Node 1: masakerja > 12.2917 Node 3 : jenjab = Struktural Node 6: Terminal Node, predicted class = V Class label : V non eselon Class size : 73 8 Node 3 : jenjab = Fungsional Node 7: Terminal Node, predicted class = non eselon Class label : V non eselon Class size : 0 67

Dari bentuk decision tree di atas dapat diidentifikasi pola pengisian jabatan

struktural Eselon V adalah bahwa semua pejabat struktural Eselon V memiliki

masa kerja lebih dari 12,2917 tahun dengan jenjang jabatan struktural.

Pola pengisian jabatan struktural yang terbentuk dari algoritma AD Tree dan

CRUISE memiliki beberapa persamaan sebagai berikut:

1. Atribut masa kerja dengan nilai di bawah 12,2917 dikategorikan sebagai non

eselon pada algoritma CRUISE. Pada algoritma AD Tree nilai yang sama diberi

nilai positif (1,067), yang berarti memiliki kecenderungan untuk

diklasifikasikan sebagai non eselon.

2. Atribut masa kerja dengan nilai di atas 12,2917 dikategorikan sebagai eselon V

pada algoritma CRUISE apabila didukung dengan atribut jenjang jabatan

dengan nilai struktural. Pada algoritma AD Tree nilai yang sama diberi nilai

negatif (-2,05 untuk atribut masa kerja dan -2,035 untuk atribut jenjang jabatan

struktural), yang berarti memiliki kecendurungan untuk diklasifikasikan

sebagai eselon V.

Perbedaan dari dua algoritma tersebut adalah pada algoritma AD tree atribut

pangkat golongan dan atribut umur ikut menentukan hasil classification.

Sedangkan pada algoritma CRUISE, dua atribut tersebut tidak menentukan hasil

54


classification. Namun dari perbedaan tersebut tidak ditemukan pola pengisian

jabatan struktural yang saling bertentangan.

Hasil classification seluruh algoritma yang tersedia secara lengkap untuk Eselon

V dapat dilihat pada Lampiran 2.

4.2.2 Classification pada Data Eselon IVB

Pada data tingkat Eselon IVB terdiri atas 2.989 train set (1.096 Mutasi Jabatan

dan 1.893 Kenaikan Pangkat) dan 2.363 test set dengan hasil Classification dapat


Tabel 4.25 Hasil Classification untuk Eselon IVB


Data mining

tool

Akurasi Train

set

Akurasi Test set

Akurasi Eselon IVB

Akurasi Non

eselon

Jrip Ada Weka 91,36 83,15% 88,98% 82,10%

CRUISE Ada CRUISE 92,17% 80,36% 87,33% 79,10%

Seperti yang dapat dilihat pada tabel 4.25, Salah satu algoritma dengan akurasi

eselon terbaik yang menghasilkan pola prediksi yang lebih baik yaitu algoritma

Jrip dengan confusion matrix yang dapat dilihat padaTabel 4.26.

Tabel 4.26 Confusion Matrix Algoritma Jrip untuk Eselon IVB

Non Eselon Eselon IVB

40 323

1642 358

Tabel 4.26 menjelaskan bahwa algoritma Jrip menghasilkan nilai akurasi sebesar

83,15% pada prediksi test set Eselon IVB dengan 40 kesalahan prediksi pada data

Eselon IVB, dan 358 kesalahan dalam memprediksi data non eselon.

Secara umum algoritma ini melakukan klasifikasi dengan cara menyusun rules

dengan fungsi “jika maka” berdasarkan data train set yang ada. Berikut pola

prediksi yang terbentuk untuk data Eselon IVB:

55


(jenjab = Struktural) and (masakerja >= 16.8333) => eselonering=IVB

(jenjab = Struktural) and (masakerja <= 6.25) and (umur >= 36.0833) and (pangkat_golongan = III/b) and (umur >= 38.75) => eselonering=IVB

(jenjab = Struktural) and (pangkat_golongan = III/b) and (tingkat_pendidikan = S1) and (masakerja >= 4.25) and (masakerja <= 8.08333) => eselonering=IVB

(jenjab = Struktural) and (pengalaman_unitkerja >= 0.416667) => eselonering=IVB

(jenjab = Struktural) and (umur <= 40.0833) and (umur >= 37.1667) and (masakerja <= 3.75) => eselonering=IVB

(jenjab = Struktural) and (masakerja >= 15.75) and (masakerja <= 22.5833) => eselonering=IVB

(jenjab = Struktural) and (masakerja <= 7.75) and (umur >= 31.25) and (masakerja <= 3.91667) and (masakerja >= 2) => eselonering=IVB

(jenjab = Struktural) and (umur <= 40.25) and (tingkat_pendidikan = S2) and (umur >= 31.75) => eselonering=IVB

(jenjab = Struktural) and (diklat = Pim IV) => eselonering=IVB

(jenjab = Struktural) and (umur <= 39.9167) and (tingkat_pendidikan = D3) and (masakerja >= 8.16667) => eselonering=IVB

(jenjab = Struktural) and (tingkat_pendidikan = S1) and (masakerja >= 12.75) and (masakerja >= 15) => eselonering=IVB

Dari algoritma Jrip dihasilkan 11 pola pengisian jabatan struktural dengan

menggunakan fungsi “jika maka” dengan rincian sebagai berikut:

1. Pegawai dengan jenjang jabatan struktural yang memililiki masa kerja lebih

dari sama dengan 16,833 tahun, diklasifikasikan sebagai pejabat Eselon IVB.

2. Pegawai dengan jenjang jabatan struktural yang memiliki masa kerja kurang

dari 6,25 tahun, berumur lebih dari sama dengan 38,75 tahun dan memiliki

pangkat golongan III/b, diklasifikasikan sebagai pejabat Eselon IVB.

3. Pegawai dengan jenjang jabatan struktural yang memiliki pangkat golongan

III/b dengan tingkat pendidikan S1 dan masa kerja antara 4,25 tahun hingga

8,0833 tahun, diklasifikasikan sebagai pejabat Eselon IVB.

4. Pegawai dengan jenjang jabatan struktural yang memiliki pengalaman unit

kerja lebih dari sama dengan 0,4167 tahun, diklasifikasikan sebagai pejabat

Eselon IVB.

56


5. Pegawai dengan jenjang jabatan struktural yang berumur antara 37,1667

tahun hingga 40,083 tahun dengan masa kerja kurang dari sama dengan 3,75

tahun, diklasifikasikan sebagai pejabat Eselon IVB.

6. Pegawai dengan jenjang jabatan struktural yang memiliki masa kerja antara

15,75 tahun hingga 15,833 tahun, diklasifikasikan sebagai pejabat Eselon

IVB.

7. Pegawai dengan jenjang jabatan struktural yang memiliki masa kerja antara 2

tahun hingga 3,916 tahun serta berumur lebih dari sama dengan 31,25 tahun,

diklasifikasikan sebagai pejabat Eselon IVB.

8. Pegawai dengan jenjang jabatan struktural yang berumur antara 31,75 tahun

hingga 40,25 tahun dengan tingkat pendidikan S2, diklasifikasikan sebagai

pejabat Eselon IVB.

9. Pegawai dengan jenjang jabatan struktural yang telah mengikuti pendidikan

pelatihan Pim IV, diklasifikasikan sebagai pejabat Eselon IVB.

10. Pegawai dengan jenjang jabatan struktural yang berumur kurang dari sama

dengan 39,916 dengan tingkat pendidikan D3 serta memiliki masa kerja lebih

dari sama dengan 8,166 tahun, diklasifikasikan sebagai pejabat Eselon IVB.

11. Pegawai dengan jenjang jabatan struktural yang memiliki tingkat pendidikan

S1 dengan masa kerja lebih dari sama 15 tahun, diklasifikasikan sebagai

pejabat Eselon IVB.

Algoritma lain yang juga menghasilkan akurasi class Eselon IVB cukup tinggi


berbasis teks dengan nama yang sama yaitu CRUISE. Hasil confusion matrix yang

terbentuk dapat dilihat pada Tabel 4.27.

Tabel 4.27 Confusion Matrix untuk Algoritma CRUISE untuk Eselon IVB

Eselon IVB Non Eselon 317 46 418 1.582


sebesar 80,36% pada prediksi test set Eselon IVB dengan 46 kesalahan prediksi

pada data Eselon IVB, dan 418 kesalahan dalam memprediksi data non eselon.

Dikarenakan ukuran decision tree yang terbentuk dari algoritma ini cukup besar

57


(53 cabang), maka secara rinci decision tree yang terbentuk dapat dilihat pada

Lampiran 3. Dari decision tree yang terbentuk pada data Eselon IVB dapat

disimpulkan 15 pola pengisian jabatan struktural seperti:

1. Untuk pegawai dengan masa kerja di bawah 15,7083 tahun, yang

diprioritaskan untuk mengisi jabatan struktural Eselon IVB adalah pegawai

dengan jenjang jabatan struktural dan telah mengikuti diklat Pim IV.

2. Pegawai dengan masa kerja di bawah 15,7083 dan jenjang jabatan struktural

yang memiliki masa kerja di atas 1,8333 dapat mengisi jabatan struktural

Eselon IVB apabila berumur di atas 26,2083 tahun.

3. Untuk pegawai dengan masa kerja di bawah 15,7083 dan jenjang jabatan

struktural yang memiliki masa kerja di atas 3,5833 tahun, yang diprioritaskan

untuk mengisi jabatan struktural adalah adalah pegawai dengan pangkat

golongan di atas III/a dan memiliki pengalaman dalam unit kerja di atas

2,54167 tahun.

4. Pegawai dengan masa kerja di bawah 15,7083 dan jenjang jabatan struktural

yang memiliki yang memiliki masa kerja di atas 4,20833 tahun dapat mengisi

jabatan struktural Eselon IVB apabila memiliki pangkat dan golongan di atas

III/a.

5. Pegawai dengan masa kerja di atas 15,7083 tahun yang diprioritaskan mengisi

jabatan struktural Eselon IVB adalah pegawai dengan jenjang jabatan

struktural dengan pangkat golongan di atas III/a, memiliki pengalaman unit

kerja di bawah 4,125 tahun dan telah mengikuti diklat Pim IV.

6. Untuk pegawai dengan masa kerja di atas 15,7083 yang memiliki jenjang

jabatan struktural serta memiliki pangkat golongan III/a yang diprioritaskan

mengisi jabatan struktural Eselon IVB adalah pegawai dengan umur di bawah

50,9167 tahun.


struktural yang memiliki masa kerja di atas 3,5833 tahun dan di bawah 4,208

tahun, yang diprioritaskan untuk mengisi jabatan struktural adalah pegawai

dengan pangkat golongan III/a.


struktural yang memiliki masa kerja di atas 7,791 tahun, yang diprioritaskan

58


untuk mengisi jabatan struktural adalah pegawai dengan pengalaman unit

kerja lebih dari 0,125 tahun.


struktural yang memiliki masa kerja di atas 7,791 tahun serta memiliki tingkat

pendidikan D3 atau S2, dapat mengisi jabatan struktural Eselon IVB apabila

berumur tidak lebih dari 42,375 tahun.



pendidikan selain D3 atau selain S2, dapat mengisi jabatan struktural Eselon

IVB apabila memiliki pangkat golongan III/d atau IV/a.


jabatan struktural serta memiliki pangkat golongan di atas III/a yang

diprioritaskan mengisi jabatan struktural Eselon IVB adalah pegawai dengan

pengalaman unit kerja di atas 4,125 tahun.




pengalaman unit kerja di bawah 4,125 tahun yang belum pernah mengikuti

pendidikan pelatihan kepemimpian dan memiliki pengalaman unit kerja di

atas 2,208 tahun.




pengalaman unit kerja di bawah 4,125 tahun yang belum pernah mengikuti

pendidikan pelatihan kepemimpian dan memiliki pengalaman unit kerja tidak

lebih dari 1,833 tahun.




IVB apabila memiliki pendidikan S1, dengan pangkat golongan III/b serta

berumur tidak lebih dari 31,125 tahun.

59





IVB apabila memiliki pendidikan S1, dengan pangkat golongan III/b,

berumur lebih dari 31,125 tahun serta memiliki masa kerja lebih dari 12,791

tahun.

Pola pengisian jabatan struktural yang terbentuk dari algoritma Jrip dan CRUISE

memiliki beberapa persamaan sebagai berikut:

1. Atribut masa kerja dan jenjang jabatan mendominasi rule yang terbentuk dari

pola pengisian jabatan struktural untuk Eselon IVB.

2. Pada beberapa rule, atribut pendidikan dan pelatihan, pangkat golongan,

tingkat pendidikan, dan umur turut menentukan hasil classification untuk

class Eselon IVB.

Perbedaan dari dua algoritma tersebut adalah pada algoritma Jrip atribut jenjang

jabatan menjadi percabangan pertama dari rule yang terbentuk lalu diikuti oleh

atribut masa kerja. Sedangkan pada algoritma CRUISE percabangan pertama

ditentukan oleh atribut masa kerja, yang kemudian diikuti oleh atribut jenjang

jabatan. Namun dari perbedaan tersebut tidak ditemukan pola pengisian jabatan

struktural yang saling bertentangan.


IVB dapat dilihat pada Lampiran 2.

4.2.3 Classification pada Data Eselon IVA

Pada data tingkat Eselon IVA terdiri atas 4.062 train set (1.272 Mutasi Jabatan

dan 2.790 Kenaikan Pangkat) dan 2.368 test set dengan hasil classification seperti

pada Tabel 4.28.

Tabel 4.28 Hasil Classification untuk Eselon IVA


Data mining

tool

Akurasi Train set

Akurasi Test set

Akurasi Eselon IVA

Akurasi Non

eselon

Decorate Ada Weka 91,94% 88,04% 91,79% 87,42%


60


Seperti yang dapat dilihat pada tabel 4.28, salah satu algoritma dengan akurasi

eselon terbaik yang menghasilkan pola prediksi adalah algoritma Decorate dengan

confusion matrix eperti yang dapat dilihat padaTabel 4.29.

Tabel 4.29 Confusion Matrix Algoritma Decorate untuk Data Eselon IVA

Eselon IVA Non Eselon

313 28

255 1.772

Tabel 4.29 menjelaskan bahwa algoritma simple cart menghasilkan nilai akurasi

sebesar 88,04% pada prediksi test set Eselon V dengan 28 kesalahan prediksi pada

data Eselon IVA, dan 255 kesalahan dalam memprediksi data non eselon.

Dikarenakan ukuran decision tree yang terbentuk dari algoritma ini cukup besar

(76 cabang), maka secara rinci decision tree yang terbentuk dapat dilihat pada

Lampiran 4.

Dari decision tree yang terbentuk pada data Eselon IVA dapat disimpulkan 19

pola pengisian jabatan struktural seperti:

1. Pegawai dengan jenjang jabatan struktural yang memiliki golongan III/d atau

III/a dapat dijadikan Eselon IVA.

2. Pegawai dengan jenjang jabatan struktural yang memiliki golongan IV/b

dapat dijadikan Eselon IVA jika memiliki tingkat pendidikan S2 atau S1.

3. Pegawai dengan jenjang jabatan struktural yang memiliki golongan IV/a

dapat dijadikan Eselon IVA jika memiliki tingkat pendidikan D3,S1, atau S2.

4. Pegawai dengan jenjang jabatan struktural yang memiliki golongan IV/a

dengan tingkat pendidikan SMA dapat dijadikan Eselon IVA jika berumur di

atas 50,916 tahun.

5. Pegawai dengan jenjang jabatan struktural yang memiliki golongan III/c

dapat dijadikan Eselon IVA jika memiliki pengalaman unit kerja di atas 3,583

tahun.


dengan pengalaman unit kerja tidak lebih dari 3,583 tahun dapat dijadikan

Eselon IVA jika memiliki tingkat pendidikan D1 atau D3 atau S1 atau S2.


dengan tingkat pendidikan S2 dapat dijadikan Eselon IVA jika memiliki masa

61


kerja tidak lebih dari 17,083 tahun dan telah mengikuti pendidikan dan

pelatihan Pim IV.


,pengalaman unit kerja tidak lebih dari 1,25 tahun dan tingkat pendidikan

SMA dapat dijadikan Eselon IVA jika memiliki masa kerja tidak lebih dari

27,083 tahun.


,pengalaman unit kerja tidak lebih dari 1,25 tahun dan tingkat pendidikan

SMA dapat dijadikan Eselon IVA jika memiliki masa kerja lebih dari 28,833

tahun, telah mengikuti pendidikan dan pelatihan Pim IV, dan berumur di atas

52 tahun.

10. Pegawai dengan jenjang jabatan struktural yang memiliki golongan III/c,

pengalaman unit kerja tidak lebih dari 1,25 tahun dan tingkat pendidikan

SMA dapat dijadikan Eselon IVA jika memiliki masa kerja di atas 30,916

tahun meskipun berlum pernah mengikuti pendidikan dan pelatihan Pim IV.


dengan tingkat pendidikan S2 tetapi belum mengikuti pendidikan dan

pelatihan Pim IV dapat dijadikan Eselon IVA jika memiliki masa kerja tidak

lebih dari 5,833 tahun dan berumur di bawah 36,583 tahun.



pelatihan Pim IV dapat dijadikan Eselon IVA jika memiliki masa kerja antara

5,833 tahun hingga 7,416 tahun.



pelatihan Pim IV dapat dijadikan Eselon IVA jika memiliki masa kerja lebih

dari 14,916 tahun.



pelatihan Pim IV dapat dijadikan Eselon IVA jika memiliki masa kerja antara

7,416 tahun hingga 14,916 tahun dan berumur di bawah 34,083 tahun.

62



dengan tingkat pendidikan SMA dapat dijadikan Eselon IVA jika memiliki

pengalaman unit kerja antara 0,5 tahun hingga 1,5 tahun dan berumur di atas

49,833 tahun.


dengan tingkat pendidikan S1, dan memiliki pengalaman unit kerja di bawah

0,083 tahun dijadikan Eselon IVA jika telah mengikuti pendidikan dan

pelatihan Pim IV dan berumur tidak lebih dari 28,667 tahun.




pelatihan Pim IV, berumur lebih dari 28,667 tahun serta memiliki masa kerja

di atas 17,083 tahun.




pelatihan Pim IV, berumur lebih dari 43,583 tahun serta memiliki masa kerja

tidak lebih dari 17,083 tahun.


dengan tingkat pendidikan S1, memiliki pengalaman unit kerja di bawah

0,083 tahun, meskipun belum mengikuti pendidikan dan pelatihan Pim IV,

dijadikan Eselon IVA jika memiliki masa kerja antara 7,583 tahun hingga

7,916 tahun.

Algoritma lain yang juga menghasilkan akurasi class Eselon IVA cukup tinggi




Tabel 4.30 Confusion Matrix untuk Algoritma CRUISE untuk Eselon IVA

Eselon IVA Non Eselon 322 19 325 1.702

63



sebesar 85,47% pada prediksi test set Eselon IVA dengan 19 kesalahan prediksi

pada data Eselon IVA, dan 418 kesalahan dalam memprediksi data non eselon.

Decision tree yang terbentuk tidak sebesar decision tree pada data Eselon IVB.

Pada data Eselon IVA decision tree yang terbentuk hanya memiliki 19 cabang

dengan 4 rule utama yang menentukkan class Eselon IVA seperti yang dapat

dilihat pada decision tree berikut:

Node 1 : pangkatgolongan = III/a III/c IV/a IV/b Node 2 : jenjab = Struktural Node 4: Terminal Node, predicted class = IVA Class label : IVA non eselon Class size : 857 244 Node 1 : pangkatgolongan = III/b III/d Node 3 : diklatpim = Pim II Pim III Pim IV Node 6 : pangkatgolongan = III/a III/c III/d IV/a IV/b Node 12: Terminal Node, predicted class = IVA Class label : IVA non eselon Class size : 162 21 Node 6 : pangkatgolongan = III/b Node 13: umur <= 44.6250 Node 26: Terminal Node, predicted class = IVA Class label : IVA non eselon Class size : 27 22 Node 3 : diklatpim = belum mengikuti Node 7: pengalamanunitkerja <= 0.833335E-01 Node 14 : jenjab = Struktural Node 28 : pangkatgolongan = III/d Node 56: Terminal Node, predicted class = IVA Class label : IVA non eselon Class size : 92 34 Node 7: pengalamanunitkerja > 0.833335E-01 Node 15: pengalamanunitkerja <= 3.04167 Node 30: Terminal Node, predicted class = IVA Class label : IVA non eselon Class size : 50 44

64


Dari decision tree tersebut, 4 pola pengisian jabatan struktural Eselon IVA yang

dapat diidentifikasi adalah:

1. Pegawai dengan pangkat golongan III/a, III/c, IV/a, dan IV/b yang

diutamakan untuk mengisi jabatan struktural Eselon IVA apabila memiliki

jenjang jabatan struktural.

2. Pegawai dengan pangkat golongan III/b atau III/d yang diutamakan untuk

mengisi jabatan struktural Eselon IVA adalah yang pernah mengikuti diklat

Pim.

3. Sedangkan pegawai dengan pangkat golongan III/b atau III/d yang belum

pernah mengikuti diklat Pim pada golongan tersebut dapat mengisi jabatan

struktural Eselon IVA apabila memiliki pengalaman unit kerja tidak lebih dari

0.8333 tahun, memiliki jenjang jabatan struktural, dan memiliki pangkat

golongan III/d.

4. Sedangkan pegawai dengan pangkat golongan III/b atau III/d yang belum

pernah mengikuti diklat Pim pada golongan tersebut dapat mengisi jabatan

struktural Eselon IVA apabila memiliki pengalaman unit kerja antara 0.8333

tahun hingga 3,041 tahun.

Pola pengisian jabatan struktural yang terbentuk dari algoritma Decorate dan


1. Atribut pangkat golongan dan jenjang jabatan mendominasi rule yang

terbentuk dari pola pengisian jabatan struktural untuk Eselon IVA.

2. Pada beberapa rule, atribut pendidikan dan pelatihan,pangkat golongan,

tingkat pendidikan, dan umur turut menentukan hasil classification untuk

class Eselon IVA.

Perbedaan dari dua algoritma tersebut adalah pada algoritma Decorate atribut

jenjang jabatan menjadi percabangan pertama dari rule yang terbentuk lalu diikuti

oleh atribut pangkat golongan. Sedangkan pada algoritma CRUISE percabangan

pertama ditentukan oleh atribut pangkat gologan, yang kemudian diikuti oleh

atribut jenjang jabatan. Dari perbedaan tersebut tidak ditemukan pola pengisian

jabatan struktural yang saling bertentangan.


IVA dapat dilihat pada Lampiran 2.

65


4.2.4 Classification pada Data Eselon IIIB

Pada data tingkat Eselon IIIB terdiri atas 5.364 train set (254 Mutasi Jabatan dan

5.110 Kenaikan Pangkat) dan 4.223 test set dengan hasil classification dapat


Tabel 4.31 Hasil Classification untuk Eselon IIIB


Data mining

tool

Akurasi Train set

Akurasi Test set

Akurasi Eselon

IIIB

Akurasi Non

eselon

Bayes NET Ada Weka 93,90% 96,04% 76,19% 96,35%


Seperti yang dapat dilihat pada tabel 4.31 algoritma CRUISE menunjukkan

persentase akurasi test set yang tinggi (92,92%), algoritma ini menghasilkan

akurasi prediksi tertinggi dari algoritma lainnya yaitu sebesar 98,41% pada class

Eselon IIIB dan menghasilkan akurasi prediksi class non eselon sebesar 92,84%,

dengan confusion matrix dapat dilihat pada Tabel 4.32.

Tabel 4.32 Confusion Matrix untuk Algoritma CRUISE untuk Eselon IIIB

Eselon IIIB Non Eselon 62 1

298 3.862


sebesar 92,92% pada prediksi test set Eselon IIIB dengan tanpa kesalahan prediksi

pada data Eselon IIIB, dan 283 kesalahan prediksi data non eselon yang

seharusnya tidak menjadi Eselon IIIB.

Secara umum algoritma CRUISE adalah algoritma classification yang dapat

secara simultan mengurangi ukuran decision tree, dan dapat meningkatkan akurasi

prediksi dengan menyesuaikan diskriminan bivariat linier. Berikut ini adalah

model prediksi decision tree yang terbentuk:

66


jenjab = Fungsional: non eselon (3665)

jenjab = Struktural:

:...pangkat_golongan = III/c: non eselon (884/3) pangkat_golongan in {III/d,IV/a,IV/b,IV/c}: :...pengalaman_unitkerja > 4.83333: IIIB (48/2) pengalaman_unitkerja <= 4.83333: :...diklat = Pim III: IIIB (82/28) diklat in {belum mengikuti,Pim II,Pim IV}: :...tingkat_pendidikan in {D1,D2,D3,S1,S3,SD,SMA, : SMP}: non eselon (449/72) tingkat_pendidikan = S2: :...umur > 53.8333: IIIB (15/3) umur <= 53.8333: :...pangkat_golongan in {IV/a,IV/c}: non eselon (138/32) pangkat_golongan = IV/b: IIIB (2/1) pangkat_golongan = III/d: :...masakerja <= 24.0833: non eselon (65/22) masakerja > 24.0833: IIIB (16/4)

Dari bentuk decision tree tersebut dapat diidentifikasi 5 pola pengisian jabatan

struktural Eselon IIIB sebagai berikut:


di atas III/c dapat dijadikan pejabat Eselon IIIB jika memiliki pengalaman

unit kerja di atas 4,833 tahun.


di atas III/c dan memiliki pengalaman unit kerja tidak lebih dari 4,833 tahun,

dapat dijadikan pejabat Eselon IIIB jika telah mengikuti pendidikan dan

pelatihan Pim III.


di atas III/c dan memiliki pengalaman unit kerja tidak lebih dari 4,833 tahun

tetapi belum mengikuti pendidikan dan pelatihan Pim III, dapat dijadikan

pejabat Eselon IIIB jika memiliki tingkat pendidikan S2 dan berumur di atas

53,833 tahun.


IV/b dan memiliki pengalaman unit kerja tidak lebih dari 4,833 tahun tetapi

belum mengikuti pendidikan dan pelatihan Pim III, dapat dijadikan pejabat

Eselon IIIB jika memiliki tingkat pendidikan S2 dan berumur tidak lebih dari

53,833 tahun .

67



III/d dan memiliki pengalaman unit kerja tidak lebih dari 4,833 tahun tetapi

belum mengikuti pendidikan dan pelatihan Pim III, dapat dijadikan pejabat

Eselon IIIB jika berpendidikan S2, berumur tidak lebih dari 53,833 tahun,

dengan masa kerja lebih dari 24,083 tahun .

Algoritma lainnya yang juga menghasilkan pola prediksi dengan akurasi test set

yang cukup tinggi adalah algoritma Bayes NET dengan nilai akurasi sebesar

96,04% dan confusion matrix dapat dilihat pada Tabel 4.33.

Tabel 4.33 Confusion Matrix Algoritma Bayes NET untuk Data Eselon IIIB

Eselon IIIB Non Eselon 48 15

152 4.008

Tabel 4.33 menjelaskan bahwa algoritma Bayes NET menghasilkan nilai akurasi

sebesar 96,04% pada prediksi test set Eselon IIIB dengan 15 kesalahan prediksi

pada data Eselon IIIB, dan 152 kesalahan dalam memprediksi data non eselon.

Berikut ini adalah pola pengisian jabatan struktural yang terbentuk dari algoritma

Bayes NET untuk data Eselon IIIB yang dapat dilihat pada Gambar 4.3.

Gambar 4.3 Pola Pengisian Jabatan Struktural Eselon IIIB

68


Seperti yang dapat dilihat pada gambar 4.3 algoritma Bayes NET tidak

menganggap suatu atribut lebih penting dari pada atribut lainnya, melainkan

memunculkan nilai peluang munculnya suatu nilai pada atribut. Dari output

algoritma Bayes NET pola pengisian jabatan struktural Eselon IIIB yang dapat

diidentifikasi di antaranya yaitu:

1. Untuk atribut pendidikan dari train set Eselon IIIB, tingkat pendidikan S2

memiliki persentase peluang sebesar 52,8% disusul dengan tingkat

pendidikan S1 dengan persentase peluang sebesar 42,7% untuk menjadi

pejabat Eselon IIIB. Meskipun demikian dari hasil train set non eselon

tingkat pendidikan S1 memiliki persentase peluang sebesar 54,3% untuk

tidak menjadi pejabat Eselon IIIB.

2. Untuk atribut masa kerja dari train set Eselon IIB, pegawai dengan masa

kerja di atas 12,458 tahun memiliki persentase peluang sebesar 93,3% untuk

menjadi pejabat Eselon IIIB. Meskipun demikian dari hasil train set non

eselon, pegawai dengan masa kerja di atas 12,458 tahun memiliki persentase

peluang sebesar 79,99% untuk tidak menjadi pejabat Eselon IIIB.

3. Untuk atribut pendidikan dan pelatihan dari train set Eselon IIIB, pegawai

yang pernah mengikuti diklat Pim IV memiliki persentase peluang sebesar

32,6% untuk menjadi pejabat Eselon IIIB, disusul dengan Pim III dengan

presentase peluang sebesar 27,1%. Hal ini didukung pula oleh train set non

eselon yang menunjukkan pegawai yang belum mengikuti diklat

kepemimpinan sama sekali memiliki persentase peluang sebesar 87,2% untuk

tidak menjadi pejabat Eselon IIIB.

4. Untuk atribut pangkat golongan dari train set Eselon IIIB, pegawai dengan

pangkat golongan III/d memiliki persentase peluang sebesar 61% untuk

menjadi pejabat Eselon IIIB disusul dengan pegawai dengan golongan IV/a

dengan persentase peluang sebesar 30,6%.

5. Untuk atribut pengalaman unit kerja dari train set Eselon IIB, pegawai

dengan pengalaman unit kerja 0 hingga 0,208 tahun memiliki peluang sebesar

61,8% untuk menjadi pejabat Eselon IIIB. Meskipun demikian dari hasil train

set non eselon, pegawai dengan pengalaman unit kerja 0 hingga 0,208 tahun

memiliki peluang sebesar 91,78% untuk tidak menjadi pejabat Eselon IIIB.

69


6. Untuk atribut jenjang jabatan, dari train set Eselon IIIB, pegawai dengan

jenjang jabatan struktural memiliki persentase peluang sebesar 99,8% untuk

menjadi pejabat Eselon IIIB. Hal ini juga didukung oleh train set non eselon

yang menunjukkan pegawai dengan jenjang jabatan fungsional memiliki

persentase peluang sebesar 71,7% untuk tidak menjadi pejabat Eselon IIB.

7. Untuk atribut umur, pegawai dengan umur maksimal 55,625 tahun memiliki

persentase peluang sebesar 99,8% untuk menjadi pejabat Eselon IIIB.

Meskipun demikian dari hasil train setnon eselon, pegawai dengan maksimal

55,625 tahun memiliki persentase peluang sebesar 86,3% untuk tidak menjadi

pejabat Eselon IIIB.

Pola pengisian jabatan struktural yang terbentuk dari algoritma Bayes NET dan


1. Atribut jenjang jabatan struktural memiliki peran penting dalam menentukan

hasil classification. Pada Algoritma CRUISE cabang pertama decision tree

ditentukan oleh atribut jenjang jabatan struktural untuk class Eselon IIIB,

begitu juga pada algoritma Bayes NET jenjang jabatan struktural memiliki

nilai peluang 99,8% untuk menjadi Eselon IIIB.

2. Atribut tingkat pendidikan dengan nilai S2 dan atribut umur dengan nilai di

atas 53,833 tahun menjadi penentu class Eselon IIIB pada dua algoritma ini.

Pada algoritma CRUISE, pegawai dengan tingkat pendidikan S2 dan berumur

di tas 53,833 tahun diklasifikasikan sebagai Eselon IIIB, begitu juga pada

pada algoritma Bayes NET atribut tingkat pendidikan S2 memiliki nilai

peluang sebesar 52,8% dan atribut umur dengan nilai tidak lebih dari 55,625

tahun memiliki peluang sebesar 99,8% untuk diklasifikasikan sebagai Eselon

IIIB.

Perbedaan dari dua algoritma tersebut adalah pada algoritma Bayes NET

penentuan rentang nilai untuk atribut dengan tipe data numerik cukup berbeda

dengan algoritma CRUISE. Sebagai contoh untuk atribut umur pada algoritma

CRUISE dibatasi oleh nilai 53,833 tahun sedangkan pada algoritma Bayes NET

dibatasi oleh nilai 55,625 tahun. Pada atribut masa kerja juga terdapat perbedaan

serupa, pada algoritma CRUISE dibatasi oleh nilai 24,083 tahun pada algoritma

Bayes NET dibatasi oleh nilai 5,166 tahun dan 12,458 tahun. Contoh lainnya

70


terdapat pada atribut pengalaman unit kerja, pada algoritma CRUISE dibatasi oleh

nilai 4,833 tahun, sedangkan pada algoritma Bayes NET dibatasi oleh nilai 0,208

tahun. Dari perbedaan tersebut hanya atribut pengalaman unit kerja yang terlihat

bertentangan. Hasil classification seluruh algoritma yang tersedia secara lengkap

untuk Eselon IIIB dapat dilihat pada Lampiran 2.

4.2.5 Classification pada data Eselon IIIA

Pada data tingkat Eselon IIIA terdiri atas 4.410 train set (194 Mutasi Jabatan dan

4.216 Kenaikan Pangkat) dan 3.694 test set dengan hasil classification seperti

pada Tabel 4.34.

Tabel 4.34 Hasil Classification untuk Eselon IIIA


Data mining

tool

Akurasi Train set

Akurasi Test set

Akurasi Eselon IIIA

Akurasi Non

eselon

REP Tree Ada Weka 97,86% 98,64% 81,25% 98,88%


Algoritma yang menghasilkan pola prediksi class Eselon IIIA cukup tinggi adalah

algoritma REP tree dengan persentase akurasi test set sebesar 98,64% dan

confusion matrix dapat dilihat pada Tabel 4.35.

Tabel 4.35 Confusion Matrix untuk Algoritma REP Tree untuk Eselon IIIA

Eselon IIIA Non Eselon 40 8 41 3605

Tabel 4.34 menjelaskan bahwa algoritma REP tree menghasilkan nilai akurasi

sebesar 98,64% pada prediksi test set Eselon IIIA dengan 8 kesalahan prediksi

pada data Eselon IIIA yang seharusnya menjadi Eselon IIIA, dan 41 kesalahan

prediksi data non eselon yang seharusnya tidak menjadi Eselon IIIA.

Secara umum algoritma REP tree mencoba menyusun decision tree dengan

menggunakan nilai yang ada pada setiap atribut lalu dikurangi dengan nilai error

dengan menggunakan backlifting. Dengan algoritma ini, atribut yang memiliki

nilai numerik hanya diurutkan sekali. Nilai yang kosong pada suatu atribut

dipisahkan menjadi cabang-cabang tersendiri. Berikut adalah decision tree yang

terbentuk dari algoritma REP tree:

71


diklat = Pim III | pangkat_golongan = IV/a | | pengalaman_unitkerja < 2.33 | | | pengalaman_unitkerja < 1.13 | | | | tingkat_pendidikan = S1 | | | | | masakerja < 2.25 : IIIA (2/0) [0/0] | | | | | masakerja >= 2.25 | | | | | | masakerja < 20.83 : non eselon (7/1) [4/0] | | | | | | masakerja >= 20.83 : IIIA (8/3) [5/2] | | | | tingkat_pendidikan = S2 : IIIA (37/10) [16/4] | | | | tingkat_pendidikan = SMA : non eselon (0/0) [1/0] | | | | tingkat_pendidikan = D3 : IIIA (4/1) [0/0] | | | pengalaman_unitkerja >= 1.13 : non eselon (3/0) [3/0] | | pengalaman_unitkerja >= 2.33 : IIIA (12/0) [2/0] | pangkat_golongan = III/d | | masakerja < 14.46 | | | masakerja < 12.83 : non eselon (4/0) [0/0] | | | masakerja >= 12.83 : IIIA (2/0) [1/0] | | masakerja >= 14.46 : non eselon (33/1) [16/2] | pangkat_golongan = IV/b : IIIA (30/6) [13/3] | pangkat_golongan = IV/c : IIIA (2/1) [0/0] diklat = Pim IV | pangkat_golongan = IV/a | | pengalaman_unitkerja < 4.13 | | | masakerja < 16.04 : non eselon (20/0) [9/0] | | | masakerja >= 16.04 | | | | umur < 51.67 | | | | | umur < 43.63 | | | | | | umur < 42.04 : non eselon (2/0) [3/0] | | | | | | umur >= 42.04 : IIIA (6/1) [6/2] | | | | | umur >= 43.63 : non eselon (41/2) [24/5] | | | | umur >= 51.67 | | | | | tingkat_pendidikan = S1 : IIIA (10/4) [1/0] | | | | | tingkat_pendidikan = S2 : non eselon (6/1) [1/1] | | | | | tingkat_pendidikan = SMA : non eselon (1/0) [1/0] | | pengalaman_unitkerja >= 4.13 : IIIA (4/0) [2/0] | pangkat_golongan = III/d : non eselon (136/2) [92/0] | pangkat_golongan = IV/b : IIIA (4/2) [5/1] diklat = belum mengikuti | jenjab = Struktural | | masakerja < 22.17 : non eselon (138/2) [72/5] | | masakerja >= 22.17 | | | pangkat_golongan = IV/a : non eselon (52/16) [31/8] | | | pangkat_golongan = III/d : non eselon (72/2) [45/1] | | | pangkat_golongan = IV/b : IIIA (8/3) [4/1] | jenjab = Fungsional : non eselon (2291/0) [1112/0] diklat = Pim II : IIIA (3/0) [1/1]

72


Dari output decision tree yang terbentuk untuk data Eselon IIIA, dapat

diidentifikasi bahwa atribut yang paling berpengaruh untuk data Eselon IIIA

adalah pendidikan dan pelatihan dengan 14 pola pengisian jabatan struktural

sebagai berikut:

1. Untuk pegawai yang pernah mengikuti pendidikan dan pelatihan Pim II

dipastikan dapat mengisi jabatan Eselon IIIA.

2. Pegawai yang pernah mengikuti pendidikan dan pelatihan Pim III, dengan

pangkat golongan IV/a, dan pengalaman unit kerja di bawah 1,13 tahun, serta

memiliki tingkat pendidikan S1 dapat dijadikan Eselon IIIA jika memiliki

masa kerja di bawah 2,25 tahun.


pangkat golongan IV/a, dan pengalaman unit kerja di bawah 1,13 tahun, serta

memiliki tingkat pendidikan S1 dapat dijadikan Eselon IIIA jika memiliki

masa kerja di atas 20,83 tahun.


pangkat golongan IV/a, dan pengalaman unit kerja di bawah 1,13 tahun, dapat

dijadikan Eselon IIIA jika memiliki tingkat pendidikan S2.


pangkat golongan IV/a, dan pengalaman unit kerja di bawah 1,13 tahun, dapat

dijadikan Eselon IIIA jika memiliki tingkat pendidikan D3.


pangkat golongan IV/a dapat dijadikan Eselon IIIA jika memiliki pengalaman

unit kerja di atas 2,33 tahun.


pangkat golongan III/d dapat dijadikan Eselon IIIA jika memiliki masa kerja

antara 12,83 tahun hingga 14,46 tahun.

8. Untuk pegawai yang pernah mengikuti pendidikan dan pelatihan Pim III

dipastikan dapat mengisi jabatan Eselon IIIA jika memiliki pangkat golongan

IV/b.

9. Untuk pegawai yang pernah mengikuti pendidikan dan pelatihan Pim III


IV/c.

73


10. Pegawai yang pernah mengikuti pendidikan dan pelatihan Pim IV, dengan

pangkat golongan IV/a dan masa pengalaman unit kerja di bawah 4,13 tahun,

dapat mengisi jabatan Eselon IIIA jika memiliki masa kerja lebih dari 16,04

tahun dan berumur antara 42,04 tahun hingga 51,67 tahun.


pangkat golongan IV/a dan masa pengalaman unit kerja di bawah 4,13 serta

memiliki masa kerja di atas 16,04 tahun, dapat mengisi jabatan Eselon IIIA

jika berumur di atas 51,67 tahun dan berpendidikan S1.


pangkat golongan IV/a, dapat mengisi jabatan Eselon IIIA jika memiliki

pengalaman unit kerja lebih daru 4,13 tahun.

13. Untuk pegawai yang pernah mengikuti pendidikan dan pelatihan Pim IV


IV/b.

14. Untuk pegawai yang belum pernah mengikuti pendidikan dan pelatihan juga

dapat mengisi jabatan Eselon IIIA jika memiliki jenjang jabatan struktural,

dengan masa kerja lebih dari 22,17 tahun dan memiliki pangkat golongan

IV//b.

Algoritma lain yang menghasilkan akurasi class Eselon IIIA cukup tinggi adalah

CRUISE yang diimplementasikan dengan menggunakan data mining tool berbasis

teks dengan nama yang sama yaitu CRUISE. Hasil confusion matrix yang


Tabel 4.36 Confusion Matrix untuk Algoritma CRUISE untuk Eselon IIIA

Eselon IIIA Non Eselon 45 3 151 3.495


sebesar 95,83% pada prediksi test set Eselon IIIA dengan 3 kesalahan prediksi

pada data Eselon IIIA, dan 151 kesalahan dalam memprediksi data non eselon.


74


Node 1 : diklatpim = Pim II Pim III Pim IV Node 2 : pangkatgolongan = IV/a IV/b IV/c Node 4: Terminal Node, predicted class = IIIA Class label : IIIA non eselon Class size : 144 156 Node 2 : pangkatgolongan = III/d Node 5 : diklatpim = Pim III Node 10: Terminal Node, predicted class = IIIA Class label : IIIA non eselon Class size : 6 50 Node 1 : diklatpim = belum mengikuti Node 3 : jenjab = Struktural Node 6 : pangkatgolongan = IV/a IV/b Node 12: Terminal Node, predicted class = IIIA Class label : IIIA non eselon Class size : 37 174 Node 6 : pangkatgolongan = III/d IV/c Node 13 : tingkatpendidikan = D1 D3 Node 26: Terminal Node, predicted class = IIIA Class label : IIIA non eselon Class size : 2 13 Dari decision tree yang terbentuk untuk data Eselon IIIA, dapat diidentifikasi 4

pola pengisian jabatan struktural sebagi berikut:

1. Pegawai yang diprioritaskan untuk mengisi jabatan struktural Eselon IIIA

adalah pegawai yang pernah mengikuti diklat Pim dengan golongan IV/a ke

atas.

2. Pegawai dengan golongan III/d yang diutamakan adalah yang pernah

mengikuti diklat Pim III.

3. Untuk pegawai yang belum pernah mengikuti diklat Pim yang diutamakan

adalah yang memiliki jenjang jabatan struktural dengan pangkat golongan

IV/a atau IV/b.

4. Pegawai dengan pangkat golongan III/d atau IV/c dapat mengisi jabatan

eselon IIIA jika memiliki tingkat pendidikan D1 atau D3.

75


Pola pengisian jabatan struktural yang terbentuk dari algoritma REP Tree dan


1. Atribut pendidikan dan pelatihan menjadi cabang pertama decision tree dari

dua algoritma tersebut.

2. Atribut pangkat golongan menjadi cabang ke-2 pada beberapa cabang dari

decision tree pada dua algoritma tersebut.

Perbedaan yang terlihat dari dua algoritma tersebut adalah pada algoritma

CRUISE, atribut dengan tipe data numerik (masa kerja, pengalaman dalam unit

kerja, dan umur) sama sekali tidak mempengaruhi hasil classification sedangkan

pada algoritma REP Tree atribut numerik seperti masa kerja dan pengalaman unit

kerja turut menentukan hasil classification. Dari perbedaan tersebut tidak

ditemukan pola pengisian jabatan struktural yang saling bertentangan.


IIIA dapat dilihat pada Lampiran 2.

4.2.6 Classification pada Data Eselon IIB

Pada data tingkat Eselon IIB terdiri atas 3.488 train set (112 Mutasi Jabatan dan

3.376 Kenaikan Pangkat) dan 3.046 test set dengan hasil classification dapat


Tabel 4.37 Hasil Classification untuk Eselon IIB


Data mining

tool

Akurasi Train

set

Akurasi Test set

Akurasi Eselon

IIB

Akurasi Non

eselon

Bayes NET Ada Weka 96,3% 98,52% 100% 98,51%

CRUISE Ada CRUISE 83,94% 88,71% 100% 88,6%

Seperti yang dapat dilihat pada tabel 4.37, algoritma yang memiliki akurasi

tertinggi baik untuk class Eselon IIB dan non eselon adalah Bayes NET,

meskipun total akurasi test set-nya hanya mencapai 98,52%, tetapi mampu

menghasilkan akurasi prediksi 100% pada class Eselon IIB dan menghasilkan

akurasi prediksi class non eselon sebesar 98,51%, dengan confusion matrix dapat


76


Tabel 4.38 Confusion Matrix Algoritma Bayes NET untuk Eselon IIB

Eselon IIB Non Eselon 29 0 45 2972

Tabel 4.38 di atas menjelaskan bahwa algoritma Bayes NET menghasilkan nilai

akurasi sebesar 98,52% pada prediksi test set Eselon IIB dengan tanpa kesalahan

prediksi pada data Eselon IIB, dan 45 kesalahan prediksi data non eselon yang

seharusnya tidak menjadi Eselon IIB.

Secara umum algoritma Bayes NET mengidentifikasi pola data dengan

menggunakan algoritma pencarian dan pengukuran kualitas. Algoritma ini

menghasilkan nilai kemungkinan dari setiap nilai pada atribut yang ada. Pola

pengisian jabatan struktural yang terbentuk dari algoritma Bayes NET dapat

dilihat pada Gambar 4.4.

Gambar 4.4 Output Algoritma Bayes NET untuk Data Eselon IIB

Seperti yang dapat dilihat pada Gambar 4.4, algoritma Bayes NET tidak

menganggap suatu atribut lebih penting dari pada atribut lainnya. Dari output

algoritma Bayes NET pola pengisian jabatan struktural Eselon IIB yang dapat


1. Untuk atribut pendidikan dari train set Eselon IIB, tingkat pendidikan S2

memiliki persentase peluang sebesar 58,8% disusul dengan tingkat

pendidikan S1 dengan persentase peluang sebesar 28,8% untuk menjadi

pejabat Eselon IIB. Meskipun demikian dari hasil train set non eselon tingkat

77


pendidikan S1 memiliki persentase peluang sebesar 49,4% untuk tidak

menjadi pejabat Eselon IIIB.

2. Untuk atribut masa kerja dari train set Eselon IIB, pegawai dengan masa

kerja di atas 23,625 tahun memiliki persentase peluang sebesar 56,6% untuk

menjadi pejabat Eselon IIB. Meskipun demikian dari hasil train setnon

eselon, pegawai dengan masa kerja di atas 23,625 tahun memiliki persentase

peluang sebesar 38,1% untuk tidak menjadi pejabat Eselon IIB.

3. Untuk atribut pendidikan dan pelatihan dari train set Eselon IIB, pegawai

yang pernah mengikuti diklat Pim III memiliki persentase peluang sebesar

39,9% untuk menjadi pejabat Eselon IIB, disusul dengan Pim II dengan

presentase peluang sebesar 31,1%. Hal ini didukung pula oleh train set non

eselon yang menunjukkan pegawai yang belum mengikuti diklat


tidak menjadi pejabat Eselon IIB.

4. Untuk atribut pangkat golongan dari train set Eselon IIB, pegawai dengan

pangkat golongan IV/b memiliki persentase peluang sebesar 59,3% untuk

menjadi pejabat Eselon IIB. Sedangkan dari hasil train set non eselon,

pegawai dengan pangkat golongan IV/a memiliki persentase peluang sebesar

90,9% untuk tidak menjadi pejabat Eselon IIB.

5. Untuk atribut pengalaman unit kerja dari train set Eselon IIB, pegawai

dengan pengalaman unit kerja 0 hingga 0,08 tahun memiliki peluang sebesar

81% untuk menjadi pejabat Eselon IIB. Meskipun demikian dari hasil train

set non eselon, pegawai dengan pengalaman unit kerja 0 hingga 0,08 tahun

memiliki peluang sebesar 96,8% untuk tidak menjadi pejabat Eselon IIB.

6. Untuk atribut jenjang jabatan, dari train set Eselon IIB, pegawai dengan


menjadi pejabat Eselon IIB. Hal ini juga didukung oleh train set non eselon


persentase peluang sebesar 84,9% untuk tidak menjadi pejabat Eselon IIB.

7. Untuk atribut umur, pegawai dengan umur maksimal 56,7 tahun memiliki

persentase peluang sebesar 99,6% untuk menjadi pejabat Eselon

IIB.Meskipun demikian dari hasil train set non eselon, pegawai dengan

78


maksimal 56,7 tahun memiliki persentase peluang sebesar 83,5% untuk tidak

menjadi pejabat Eselon IIB.

Algoritma lain yang juga menghasilkan akurasi class Eselon IIB cukup tinggi




Tabel 4.39 Confusion Matrix untuk Algoritma CRUISE untuk Eselon IIB

Eselon IIB Non Eselon 29 0 344 2.673

Tabel 4.39, menjelaskan bahwa algoritma CRUISE menghasilkan nilai akurasi

sebesar 88,71% pada prediksi test set Eselon IIB dengan tanpa kesalahan prediksi

pada data Eselon IIB, dan 344 kesalahan dalam memprediksi data non eselon.


Node 1 : diklatpim = Pim II Pim III Pim IV Node 2: Terminal Node, predicted class = IIB Class label : IIB non eselon Class size : 87 300

Node 1 : diklatpim = belum mengikuti

Node 3 : pangkatgolongan = III/a III/b III/c III/d IV/b IV/c Node 6: Terminal Node, predicted class = IIB Class label : IIB non eselon Class size : 22 248

Node 3 : pangkatgolongan = IV/a

Node 7 : jenjab = Struktural Node 14 : tingkatpendidikan = D3 Node 28: Terminal Node, predicted class = IIB Class label : IIB non eselon Class size : 1 6

Node 29: masakerja > 27.9167

Node 59 : tingkatpendidikan = S1 Node 118: Terminal Node, predicted class = IIB Class label : IIB non eselon Class size : 2 6

79


Dari decision tree yang terbentuk untuk data Eselon IIB di atas, 4 pola pengisian

jabatan struktural yang dapat diidentifikasi:

1. Pegawai yang diprioritaskan mengisi jabatan Eselon IIB adalah yang pernah

mengikuti diklat Pim.


untuk mengisi jabatan struktural Eselon IIB adalah pegawai yang memiliki

pangkat golongan IV/a dengan jenjang jabatan struktural, dengan tingkat

pendidikan D3.


untuk mengisi jabatan struktural Eselon IIB adalah pegawai yang memiliki

pangkat golongan IV/a dengan jenjang jabatan struktural, masa kerja di atas

27.9167 tahun dan tingkat pendidikan S1.

4. Untuk pegawai di atas golongan IV/a dapat diklasifikasikan sebagai Eselon

IIB.

Pola pengisian jabatan struktural yang terbentuk dari algoritma Bayes NET dan


1. Atribut pendidikan dan pelatihan memiliki peranan penting dalam menentukan

hasil classification pada dua algoritma ini. Pada algoritma CRUISE atribut

pendidikan pelatihan menjadi cabang pertama dalam melakukan classification,

begitu juga pada algoritma Bayes NET atribut pendidikan dan pelatihan dengan

nilai yang pernah mengikuti pendidikan dan pelatihan memiliki nilai peluang

sebesar 77,6% untuk menjadi Eselon IIB.

2. Atribut pangkat golongan juga memiliki peranan penting dalam menentukan

hasil classification pada dua algoritma ini khususnya untuk nilai golongan di

atas IV/a. Pada algoritma CRUISE atribut pangkat golongan dengan nilai di

atas IV/a dipastikan dapat mengisi jabatan Eselon IIB, begitu juga pada

algoritma Bayes NET nilai atribut pangkat golongan khususnya golongan di

atas IV/a memiliki peluang sebesar 73,6% untuk menjadi Eselon IIB.

Perbedaan yang terlihat dari dua algoritma tersebut adalah pada algoritma

CRUISE, dari 3 atribut numerik hanya atribut masa kerja yang mempengaruhi

hasil classification sedangkan pada algoritma Bayes NET atribut numerik seperti

masa kerja dan pengalaman unit kerja turut menentukan hasil classification. Dari

80


perbedaan tersebut tidak ditemukan pola pengisian jabatan struktural yang saling

bertentangan.

4.2.7 Classification pada Data Eselon IIA

Pada data tingkat Eselon IIA terdiri atas 395 train set (3 Mutasi Jabatan dan 392

Kenaikan Pangkat) dan 271 test set dengan hasil classification dapat dilihat pada

Tabel 4.40.

Tabel 4.40 Hasil Classification untuk Eselon IIA


Data mining

tool

Akurasi Train set

Akurasi Test set

Akurasi Eselon

IIA

Akurasi Non

eselon Bayes NET Ada Weka 99,74% 100% 100% 100%

CRUISE Ada CRUISE 0,76% 100% 100% 100%

Seperti yang dapat dilihat pada tabel 4.40, untuk data Eselon IIA hampir seluruh

algoritma yang digunakan menghasilkan prediksi yang 100% akurat. Hanya 7 dari

62 algoritma yang digunakan menghasilkan akurasi di bawah 100%. Matrix

confusion yang dihasilkan dapat dilihat pada Tabel 4.41.

Tabel 4.41 Confusion Matrix Algoritma Bayes NET untuk Eselon IIA

Eselon IIA Non Eselon 0 0 0 271

Tabel 4.41 di atas menjelaskan bahwa 55 dari 62 algoritma secara akurat

memprediksi data Eselon IIA dan non eselon, Nilai 0 pada kolom Eselon IIA dan

baris pertama menunjukkan tidak ada posisi eselon yang terisi. Hal ini sesuai

dengan kondisi terakhir pada tanggal 10 Januari 2014, dengan jabatan Eselon IIA

masih kosong karena Sekretaris Daerah Kota Bogor yang terdahulu mengajukan

cuti di luar tanggungan negara karena mencalonkan diri sebagai wakil walikota

pada Pemilu Kepala Daerah di akhir tahun 2013.

Algoritma Bayes NET memiliki akurasi cukup tinggi di beberapa tingkat eselon,

maka pada data Eselon IIA akan menggunakan contoh output model prediksi dari

algoritma Bayes NET seperti pada Gambar 4.5.

81


Gambar 4.5 Output Agoritma Bayes NET untuk Data Eselon IIA

Seperti yang dapat dilihat pada gambar 4.5, algoritma Bayes NET tidak

menganggap suatu atribut lebih penting dari pada atribut lainnya, melainkan

memunculkan nilai peluang munculnya suatu nilai pada atribut. Dari output

algoritma Bayes NET pola pengisian jabatan struktural Eselon IIA yang dapat


1. Untuk atribut pendidikan dari train set Eselon IIA, tingkat pendidikan S2

memiliki persentase peluang sebesar 50% untuk menjadi pejabat Eselon IIA.

Meskipun demikian dari hasil train set non eselon tingkat pendidikan S2

memiliki persentase peluang sebesar 40,5% untuk tidak menjadi pejabat

Eselon IIIA.

2. yang pernah mengikuti diklat Pim II memiliki persentase peluang sebesar

70% untuk menjadi pejabat Eselon IIA. Hal ini didukung pula oleh train set

non eselon yang menunjukkan pegawai yang belum mengikuti diklat


tidak menjadi pejabat Eselon IIA.

3. Untuk atribut pangkat golongan dari train set Eselon IIA, pegawai dengan

pangkat golongan III/c, IV/c, dan IV/d memiliki persentase peluang yang

sama sebesar 30% untuk menjadi pejabat Eselon IIA. Sedangkan dari hasil

82


train set non eselon, pegawai dengan pangkat golongan IV/b memiliki

persentase peluang sebesar 90% untuk tidak menjadi pejabat Eselon IIA.

4. Untuk atribut jenjang jabatan, dari train set Eselon IIA, pegawai dengan


menjadi pejabat Eselon IIA. Hal ini juga didukung oleh train set non eselon


persentase peluang sebesar 58,4% untuk tidak menjadi pejabat Eselon IIA.

5. Untuk atribut umur, masa kerja, dan pengalaman dalam unit kerja pada data

Eselon IIA, algoritma Bayes NET tidak melakukan klasifikasi berdasarkan

nilai rentang tertentu dalam arti berapapun umur, masa kerja maupun

pengalaman unit kerja pegawai, semuanya memiliki peluang yang sama untuk

dapat menjadi pejabat Eselon IIA.

Algoritma lain yang juga memiliki persentase akurasi terbaik di beberapa tingkat

eselon adalah algoritma CRUISE dengan nilai persentase dan confusion matrix

yang sama dengan algoritma Bayes NET dan C5.0. Decision tree yang terbentuk

dari algoritma CRUISE untuk data Eselon IIA adalah sebagai berikut:

Node 1: Terminal Node, predicted class = IIA Class label : IIA non eselon Class size : 3 392 Dari decision tree yang cukup sederhana di atas dapat dilihat bahwa algoritma

CRUISE tidak dapat menentukan atribut mana yang menjadi penentu class Eselon

IIA mengingat ukuran class yang cukup kecil yaitu 3 record.

Tidak ditemukan kesamaan pada dua algoritma ini mengingat decision tree dari

algoritma CRUISE tidak dapat menentukan class Eselon IIA karena ukuran train

set yang terlalu kecil.

4.3 Analisis Hasil Prediksi

Dari 21.649 train set (3.004 mutasi jabatan dan 18.645 kenaikan pangkat) dan

16.966 test set yang digunakan teknik data mining classification untuk pengisian

jabatan struktural menghasilkan akurasi prediksi class eselon dan algoritma

terbaik yang beragam untuk tiap tingkat eselon, seperti yang dapat dilihat pada

Gambar 4.6:

83


Gambar 4.6 Grafik Persentase Akurasi Prediksi Class Eselon

Secara umum algoritma CRUISE memiliki rata-rata akurasi prediksi class eselon

yang paling baik di setiap tingkat eselon dengan akurasi sebesar 95,7%. Meskipun

algoritma ini hanya menjadi akurasi paling baik pada 4 tingkat eselon yaitu Eselon

V,IIIB, IIB dan IIA tetapi secara umum nilai akurasinya sangat konsisten dengan

nilai akurasi tertinggi 100% dan nilai akurasi terendah adalah 83,3% pada tingkat

Eselon IVB.

Algoritma lain yang juga menghasilkan pola prediksi dengan akurasi class eselon

yang cukup baik adalah algoritma Bayes NET. Algoritma ini memiliki rata-rata

akurasi sebesar 89,57% di setiap tingkat eselon dengan nilai akurasi tertinggi

100% dan nilai akurasi terendah adalah 76,19% pada tingkat Eselon IIIB.

4.4 Diskusi: Pola Umum Pengisian Jabatan Struktural Setiap Eselon

Meskipun pada pembahasan sebelumnya dapat dilihat bahwa setiap tingkat eselon

memiliki pola pengisian jabatan struktural yang berbeda-beda, tetapi beberapa

atribut yang sama selalu muncul di beberapa tingkat eselon di antaranya adalah:

84


Pada semua tingkat eselon kecuali Eselon IIA, atribut jenjang jabatan selalu

muncul dengan jenjang jabatan struktural yang selalu mendominasi pengisian

jabatan struktural dibandingkan dengan jenjang jabatan fungsional.

Pada tingkat Eselon IIIA ,IIB, dan IIA atribut pendidikan dan pelatihan

muncul sebagai atribut penentu classifier. Pada tiga tingkat eselon tersebut

atribut pendidikan dan pelatihan selalu menjadi prioritas pertama.

Pada tingkat Eselon IVB,IVA,IIB, dan IIIA atribut pangkat golongan pegawai

muncul sebagai atribut penentu classifier. Pada tingkat Eselon IVB atribut

pangkat golongan berada pada prioritas ke-3. Pada tingkat Eselon IVA atribut

pangkat golongan berada pada prioritas ke-2 setelah atribut jenjang jabatan.

Atribut pengalaman unit kerja juga menjadi atribut penentu classifier.Pada

tingkat Eselon V, IIIB dan IIIA atribut pengalaman unit kerja berada pada

prioritas ke-3.Pada tiga tingkat Eselon V dan IVB atribut masa kerja selalu

menjadi prioritas ke-2.

Atribut masa kerja menjadi atribut penentu classifier pada beberapa tingkat

eselon.

Dari beberapa poin di atas sesuai dengan jumlah kemunculan atribut penentu

classifier di setiap tingkat eselon maka dapat disimpulkan bahwa urutan

prioritas atribut yang terbentuk dari setiap tingkat eselon adalah jenjang

jabatan, pangkat golongan, pendidikan dan pelatihan, tingkat pendidikan,

masa kerja, pengalaman dalam unit kerja serta umur.

4.5 Analisis Dampak

Hasil dari penelitian ini tentunya harus dapat bermanfaat bagi organisasi dan

keilmuan. Dampak bagi organisasi dalam hal ini adalah tim Baperjakat

Pemerintah Kota Bogor. Dampak keilmuan khususnya terkait dengan

pemanfaatan teknik data mining classification di bidang pengelolaan sumber daya

manusia.

4.5.1 Analisis Dampak Organisasi

Pola pengisian jabatan struktural yang didapatkan tentunya dapat menjadi acuan

untuk membentuk rules dalam modul SIMPEG. Sebagai contoh apabila terdapat

85


kekosongan jabatan pada tingkat Eselon V, maka rule yang didapat dari algoritma

CRUISE untuk Eselon V yaitu:

Node 1: masakerja > 12.2917 Node 3 : jenjab = Struktural Node 6: Terminal Node, predicted class = V Class label : V non eselon Class size : 73 8 Rule tersebut akan diimplementasikan ke dalam bahasa SQL untuk mendapatkan calon kandidiat untuk mengisi kekosongan tersebut, dengan menuliskan script PHP berikut:

<?php

include(“koneksi.php”);

$q=mysql_query(“select nama, datediff(year, tmt, curdate()) as ‘masa kerja’ from pegawai inner join sk on sk.id_pegawai = pegawai.id_pegawai where id_kategori_sk=6 and pangkat_gol=III/a or pangkat_gol=III/b and jenjab = ‘struktural’ and datediff(year, tmt, curdate()) > 12.2917 order by ‘masa kerja’ desc”)

while($q=mysql_fetch_array($q)

print_r($q);

?>

Penjelasan script PHP di atas adalah sebagai berikut:

Fungsi include(“koneksi.php”), digunakan untuk konfigurasi koneksi basis

data.

Statement $q=mysql_query(“ “), digunakan untuk menulis script SQL yang

akan dieksekusi.

Script SQL select nama, datediff(year, tmt, curdate()) as ‘masa kerja’ from

pegawai, berfungsi mengambil kolom nama dan menghitung selisih antara

tanggal hari ini dengan kolom tmt pada SK CPNS (id_kategori=6) dengan

menyimpan sebagai kolom ‘masa kerja’.

Bagian inner join sk on sk.id_pegawai = pegawai.id_pegawai where

id_kategori_sk=6, digunakan untuk menghubungkan table pegawai dengan

table sk dan hanya mengambil SK CPNS saja (id_kategori=6).

Bagian and pangkat_gol=III/a or pangkat_gol=III/b, berfungsi mengambil

data pegawai yang memiliki golongan III/a atau III/b saja, yang merupakan

syarat golongan untuk eselon V.

86


Bagian and jenjab = ‘struktural’, berfungsi mengambil data pegawai dengan

jenjang jabatan structural saja.

Bagian and datediff(year, tmt, curdate()) > 12.2917 berfungsi mengambil

masa kerja pegawai di atas 12.2917 tahun.

Bagian order by ‘masa kerja’ desc berfungsi mengurutkan data yang diambil

berdasarkan masa kerja yang terbesar hingga masa kerja terbesar.

Pola yang dihasilkan secara rinci dapat dilihat pada Sub Bab 4.2. Rules yang

diimplementasikan pada modul baru SIMPEG tentunya akan menambah

kemampuan SIMPEG dalam menyusun draft pengisian jabatan struktural secara

otomatis. Dengan adanya kemampuan tersebut, Baperjakat tidak perlu lagi

menyusun menyusun draft pengisian jabatan struktural secara manual karena

sudah dapat disusun dengan menggunakan SIMPEG.

4.5.2 Analisis Dampak Keilmuan

Hasil penelitian ini menunjukkan bahwa teknik data mining classification dapat

digunakan untuk membantu pengelolaan manajemen sumber daya manusia

khususnya dalam lingkungan pemerintahan. Secara umum teknik ini juga dapat

dimanfaatkan dalam perusahaan atau organisasi lain dengan penentuan atribut

sesuai kebijakan perusahaan atau organisasi tersebut. Dengan demikian penelitian

ini dapat dijadikan acuan bagi penelitan-penelitan serupa untuk menggunakan

teknik yang sama dalam pengelolaan sumber daya manusia secara umum dan

menempatkan sumber daya yang tepat di posisi yang tepat secara khusus.


BAB 5

KESIMPULAN DAN SARAN

Dari hasil analisis dan pembahasan mengenai pemanfaatan teknik data mining

classification untuk pola pengisian jabatan struktural pada Pemerintah Kota Bogor

dapat ditarik beberapa kesimpulan dan saran sebagai berikut:

5.1 Kesimpulan

Beberapa kesimpulan yang dapat ditarik dari hasil pada penelitian ini di antaranya

yaitu:

Meskipun pada setiap tingkat eselon menghasilkan pola pengisian jabatan

struktural yang berbeda, beberapa atribut selalu muncul secara dominan di

setiap pola prediksi dan tingkat eselon. Urutan atribut yang terbentuk

sebagai berikut: jenjang jabatan, pangkat golongan, pendidikan dan

pelatihan, tingkat pendidikan, masa kerja, pengalaman dalam unit kerja serta

umur. Secara rinci hasil pola pengisian yang terbentuk dapat dilihat pada

Sub Bab 4.2.

Pola pengisian jabatan struktural yang terbentuk akan menjadi rule yang

diimplementasikan menjadi modul baru dalam SIMPEG. Modul tersebut

tentunya akan menambah kemampuan pendukung keputusan berupa draft

pengisian jabatan struktural. Hal ini dapat menjawab permasalahan seperti

yang dijelaskan pada Gambar 1.1.

Setiap data set tingkat eselon menghasilkan algoritma terbaik yang berbeda

dan tingkat akurasi class eselon yang berbeda pula, sebagaimana dibahas

pada Sub Bab 4.3. Algoritma CRUISE secara umum menghasilkan rata-rata

akurasi yang paling baik dengan tingkat akurasi sebesar 95,7%, disusul oleh

algoritma Bayes NET dengan akurasi 89,57%.

88


5.2 Saran

Beberapa saran yang dapat dijadikan masukan untuk penelitan serupa di masa

yang akan datang di antaranya yaitu:

Sejalan dengan berjalannya waktu, akan muncul algoritma baru dari teknik

data mining classification. Algoritma baru tersebut dapat diimplementasikan

pada berbagai data mining tools. Hal ini tentunya patut untuk dicoba untuk

meningkatkan akurasi prediksi test set dari model prediksi train set.

Perlu dikembangan sebuah web service yang dapat menjembatani data mining

tool Weka yang berbasis JAVA dengan SIMPEG yang berbasis PHP. Web

service tersebut dapat dikembangan dengan menggunakan bahasa XML dengan

memanfaatkan API berbasis JAVA pada data mining tool Weka, sehingga

keduanya dapat saling berkomunikasi. Web service tersebut dapat

dimanfaatkan untuk memudahkan proses input data dari SIMPEG ke Weka dan

output prediksi dari Weka ke SIMPEG secara otomatis.

Diharapkan penelitian selanjutnya dapat menggunakan jumlah train set yang

lebih banyak untuk menghasilkan model prediktif yang lebih baik. Hal tersebut

mengingat penelitian ini hanya menggunakan data kepegawaian dari tahun

2009 hingga 2013 untuk memprediksi jabatan struktural di tahun 2014.

Classifier yang digunakan dalam penelitian ini adalah untuk tingkat eselon,

tidak secara spesifik untuk jabatan struktral tertentu dalam unit kerja. Hal ini

mengingat jumlah train set untuk setiap jabatan struktural yang terlalu sedikit.

Diharapkan penelitian selanjutnya dapat menggunakan atribut classifier yang

lebih spesifik pada setiap jabatan struktural yang ada.

89


DAFTAR PUSTAKA

Farisi, Afif. (2009). Pembandingan tingkat akurasi dua model data mining yang dihasilkan oleh decision tree dan naïve bayes studi kasus: suatu perusahaan manufaktur dan penjualan sepeda. Jakarta: MTI Universitas Indonesia. Han, J., Kamber, M., (2006). Data mining concepts and techniques. San Francisco: Morgan Kaufmann Publishers. Jantan, H., Hamdan, A.R., Othman, Z.A. (2011). Data mining classification Techniques for human talent forecasting. Selangor, Malaysia: Faculty of Computer and Mathematical Sciences UTM, Terengganu and Faculty of Information Science and Technology UKM. Kementrian Sekretariat Negara Republik Indonesia. (2000). Peraturan Pemerintah Republik Indonesia Nomor 100 Tahun 2000 tentang Pengangkatan PNS dalam Jabatan Struktural. Jakarta: Kementrian Sekretariat Negara Republik Indonesia Kementrian Sekretariat Negara Republik Indonesia. (2002). Peraturan Pemerintah Republik Indonesia Nomor 13 Tahun 2002 tentang Perubahan atas Peraturan Pemerintah Republik Indonesia Nomor 100 Tahun 2000 tentang Pengangkatan PNS dalam Jabatan Struktural. Jakarta: Kementrian Sekretariat Negara Republik Indonesia. Pehlivanli., Ayca, C. (2011). The comparison of data mining tool. Istanbul, Turki: Department of Computer Engineering İstanbul Kültür University. Turban, E., Aronson, J.E., Liang ,T. (2005). Decission support systems and intelligent systems. New Jersey: Pearson Education, Inc. Yashoda, E. Prakash, P.S. (2012). Data mining classifcation technique for talent management using SVM. Salem, Tamilnadu: Department of Computer science and Engineering, Sona College of Technology Ye, Peng. (2011). The Decision tree Classifcation And Its Application Research In Personnel Management. Huanggang, China: Huanggang Normal University .

90


Lampiran 1 Lampiran Transkrip Wawancara

Transkrip Wawancara Kepala Bidang Mutasi dan Pengembangan Karir Pegawai

selaku Sekretaris Badan pertimbangan Jabatan dan Kepangkatan (Baperjakat).

Unit Kerja : Badan Kepegawaian Pendidikan dan Pelatihan

Jabatan : Kepala Bidang Mutasi dan Pengembangan Karir Pegawai

Tanggal : 19 Desember 2013

Tempat : Ruang Bidang Mutasi dan Pengembangan Karir Pegawai BKPP,

Gedung Sekretarian Daerah Kota Bogor Lantai 2, Pemerintah

Kota Bogor

TWR : Tosan Wiar Ramdhani

NS : Nara Sumber

1. TWR : Bisa ibu ceritakan isu-su terkait dalam pengisian jabatan

struktural di lingkungan Pemerintah Kota Bogor?

NS : Wah cukup banyak di antaranya: belum tersusunya pola karir

untuk jabatan struktural dimana pada level kementrian hal ini sudah

tersusun dengan baik. Tim Baperjakat juga merasa kesulitan dalam

menulusuri data calon pejabat struktural yang diusulkan mengingat data

jabatan struktural pada basis data SIMPEG hanya mencatat mulai tahun

2009, dan kita tetap harus menulusuri data tersebut secara manual

satu per satu dengan menggunakan aplikasi SIMPEG.

2. TWR : Menurut ibu saat ini SIMPEG belum cukup membantu?

NS : Dari sisi data mungkin sudah tersedia meskipun tidak cukup

lengkap, karena kita tentunya ingin melihat riwayat jabatan seseorang

sebelum 2009. Oleh karena itu saya sempat menghimbau untuk

menyebarkan formulir kepada seluruh pejabat struktural untuk mengisi

data riwayat jabatan dengan lengkap agar dapat dimasukkan ke dalam

basis data SIMPEG. Selain dari pada itu akan sangat membantu tim

Baperjakat jika SIMPEG mampu mengusulkan nama-nama calon

pejabat struktural jika terjadi mutasi jabatan struktural.

91


(Lanjutan Lampiran 1)

3. TWR : Itu bisa saja dibuat bu, hanya bagaimana dengan regulasi yang

ada, apakah sudah cukup jelas teknis pelaksanaanya?

NS : Itu satu kendala lain, Peraturaturan Pemerintah No 2 Tahun

2000 yang kemudian diperbarui dengan Peraturaturan Pemerintah

No 13 Tahun 2002 tidak secara spesifik mengatur mana komponen

kepegawaian yang menjadi prioritas dalam mengisi suatu jabatan

struktural. Syarat minimalnya hanya pangkat golongan dan untuk

komponen lainnya seperti masa kerja pegawai, pendidikan dan pelatihan

pegawai serta pengalaman dalam unit kerja tidak jelas pembobotannya.

Jadi bagaimana pak, apakah bapak bisa membuat SIMPEG memiliki

kemampuan untuk memberikan usulan dafttar jabatan secara otomatis?

4. TWR : Seperti yang saya jelaskan sebelumnya bu, hal itu bisa saja

dilakukan, tapi harus jelas terlebih dahulu regulasinya. Dikarenakan tidak

ada pembobotan spesifik terhadap komponen penilaian pegawai yang ibu

jelaskan tadi, maka perlu dipelajari pola pengisian jabatan struktural

sebelumnya dari basis data SIMPEG. Jika ibu tidak keberatan maka

masalah ini yang akan saya angkat menjadi penelitian untuk karya akhir

dalam masa tugas belajar saya.

NS : Silakan pak , saya sangat mendukung selama itu nantinya akan

memudahkan tugas Baperjakat dan saya juga akan bicarakan dengan

anggota Baperjakat lainnya.

5. TWR : Baik bu, apakah saya nanti diperkenankan melakukan presentasi

di depan tim Baperjakat?

NS : Silahkan saja, tapi menurut saya karena Baperjakat jarang sekali

mengadakan pertemuan kecuali jika ada mutasi jabatan struktural, saya

sarankan bapak melakukan presentasi kepada 3 dari total 7 anggota

Baperjakat yang ada di BKPP saja termasuk saya.

6. TWR : Baik bu, terima kasih banyak atas waktu dan kesempatan yang

diberikan.

92


Lampiran 2 Hasil Akurasi Classification untuk Setiap Tingkat Eselon

Tabel Hasil Classification untuk Eselon V


Data mining

tool

Akurasi Train

set

Akurasi Test set

Akurasi Eselon

V

Akurasi Non

eselon

K-Star Tidak Ada

Weka 99,89% 95,3% 100% 95,21%

AD tree Ada Weka 100% 94,8% 100% 94,71%

LAD tree Ada Weka 99,89% 94,8% 100% 94,71%

Random tree Ada Weka 100% 94,8% 100% 94,71%


hyper pipes Tidak Ada

Weka 99,14% 94,7% 100% 94,61%

VFI Tidak Ada

Weka 99,14% 94,7% 100% 94,61%

C5,0 Ada R 99,8% 94,6% 100% 94,51%

End Tidak Ada

Weka 99,78% 94,6% 100% 94,51%

J-48 Ada Weka 99,78% 94,6% 100% 94,51%

J-48 graft Ada Weka 99,78% 94,6% 100% 94,51%

NB Tree Ada Weka 100% 94,5% 100% 94,4%

Random Forrest

Ada Weka 100% 94,5% 100% 94,4%

SMO Ada Weka 98,83% 94,4% 100% 94,3%

Ridor Ada Weka 100% 94,3% 100% 94,2%


DTNB Tidak Ada

Weka 99,14% 94,2% 100% 94,1%

Decision table

Tidak Ada

Weka 99,57% 94,06% 100% 93,9%

Threshold selector

Ada Weka 99,14% 93,9% 100% 93,79%

Ordinal class classifier

Tidak Ada

Weka 98,72% 93,2% 100% 93,08%

Dagging Tidak Ada

Weka 98,61% 92,8% 100% 92,68%

Conjuctive rule

Ada Weka 98,4% 92,6% 100% 92,47%

Decision stump

Tidak Ada

Weka 98,46% 92,6% 100% 92,47%

93




Data mining

tool

Akurasi Train

set

Akurasi Test set

Akurasi Eselon

V

Akurasi Non

eselon LWL Tidak

Ada Weka 98,4% 92,6% 100% 92,47%

One R Ada Weka 98,4% 92,6% 100% 92,47%

Clsasification via clustering

Ada Weka 96,08% 91,5% 100% 91,35%

Simple logistic

Ada Weka 99,36% 94,2% 94,44% 98,72%

Spegasos Ada Weka 99,46% 95,4% 94,44% 95,42% Ada boost m1 Ada Weka 99,46% 95% 94,44% 95,02% Attribut selected classifier

Ada Weka

99,46% 95% 94,44% 95,02% BF tree Ada Weka 99,46% 95% 94,44% 95,02% Multiboost AB

Ada Weka 99,46% 95% 94,44% 95,02%

REP Tree Ada Weka 99,46% 95% 94,44% 95,02% Simple cart Ada Weka 99,46% 95% 94,44% 95,02% Part Tidak

Ada Weka

99,78% 94,9% 94,44% 94,91% Jrip Ada Weka 99,78% 94,8% 94,44% 94,81% Decorate Ada Weka 99,78% 94,7% 94,44% 94,71%

Filtered classifier

Ada Weka 99,68% 94,7% 94,44% 94,71%

Logit boost Ada Weka 99,68% 94,7% 94,44% 94,71%

Bagging Ada Weka 99,46% 94,6% 94,44% 94,61%

Classification via regression

Ada Weka 99,68% 94,4% 94,44% 94,4%

LMT Ada Weka 99,36% 94,2% 94,44% 94,2%

Naïve Bayes Ada Weka 97,44% 92,2% 94,44% 92,17%

Naïve Bayes Updateable

Ada Weka 97,44% 92,2% 94,44% 92,17%

Nnge Ada Weka 100.00% 96,5% 88,89% 96,64% Logisitc Ada Weka 99,46% 96,4% 88,89% 96,54% Multi layer perceptron

Tidak Ada

Weka 100.00% 96,4% 88,89% 96,54%

Multiclass classifier

Tidak Ada

Weka 99,46% 96,4% 88,89% 96,54%

94




Data mining

tool

Akurasi Train

set

Akurasi Test set

Akurasi Eselon

V

Akurasi Non

eselon IB1 Tidak

Ada Weka

100.00% 95,9% 88,89% 96,03%

FT tree Ada Weka 99,68% 95,4% 88,89% 95,52%

IBK Tidak Ada

Weka 100.00% 95,9% 88,89% 95,22%

Voted perceptron

Tidak Ada

Weka 96,17% 94,8% 66,67% 95,32%

RBF Network Tidak Ada

Weka 93,94% 94,3% 16,67% 95,73%

CBA Ada Weka 92,24% 98,2% 0% 100%

CV parameter selection

Tidak Ada

Weka 92,24% 98,2% 0% 100%

Grading Tidak Ada

Weka 92,24% 98,2% 0% 100%

Multischeme Tidak Ada

Weka 92,24% 98,2% 0% 100%

Raced incremental logit boost

Ada Weka

92,24% 98,2% 0% 100%

Stacking Tidak Ada

Weka 92,24% 98,2% 0% 100%

Stacking C Ada Weka 92,24% 98,2% 0% 100%

Vote Tidak Ada

Weka 92,24% 98,2% 0% 100%

Zero R Tidak Ada

Weka 92,24% 98,2% 0% 100%

95



Tabel Hasil Classification untuk Eselon IVB


Data mining

tool

Akurasi Train

set

Akurasi Test set

Akurasi Eselon IVB

Akurasi Non

eselon

LWL Tidak Ada

Weka 81,59% 73,08% 100% 68,2%

Conjuctive rule

Ada Weka 80,96% 72,61% 100% 67,65%

Decision stump

Ada Weka 80,96% 72,61% 100% 67,65%


Weka 81,06% 72,53% 99,17% 67,7%

VFI Tidak Ada

Weka 83,67% 81,54% 92,56% 79,55%

Dagging Tidak Ada

Weka 85,31% 85,18% 90,91% 84,15%

SMO Ada Weka 85,37% 85,14% 90,36% 84,2%

Logisitc Ada Weka 85,84% 85,31% 89,81% 84,5%


Tidak Ada

Weka 85,84% 85,31% 89,81% 84,5%

Simple logistic

Ada Weka 85,84% 85,06% 89,81% 84,2%

Threshold selector

Ada Weka 86,71% 87.00% 88,98% 86,65%

Jrip Ada Weka 91,36% 83,15% 88,98% 82,1%

FT tree Ada Weka 93,17% 80,7% 88,15% 79,35%

LAD tree Ada Weka 89,82% 83,7% 86,5% 83,2%


Attribut selected classifier

Ada Weka 90,79% 83,28% 86,23% 82,75%

DTNB Tidak Ada

Weka 89,86% 80,53% 86,23% 79,5%

Nnge Ada Weka 99,83% 84,63% 85,4% 84,5%


C5,0 Ada R 93% 88,02% 85,12% 83,15%

BF tree Ada Weka 95,04% 81,63% 85,12% 81.00%

Filtered classifier

Ada Weka 91,23% 83,28% 84,85% 83.00%

96




Data mining

tool

Akurasi Train

set

Akurasi Test set

Akurasi Eselon IVB

Akurasi Non

eselon Decorate Ada Weka 94,11% 82,22% 84,57% 81,8%

Simple cart Ada Weka 93,94% 81,71% 84,3% 81,25%


Ada Weka 91,87% 80,7% 84,02% 80,1%

Decision table

Ada Weka 89,96% 80,44% 84,02% 79,8%

Random Forrest

Ada Weka 99,53% 82,86% 83,47% 82,75%

CRUISE

Ada CRUISE 92,17% 80,36% 83,3% 90,08%

Multi layer perceptron

Tidak Ada

Weka 90,23% 87,3% 83,2% 88,05%

AD tree Ada Weka 88,79% 85,95% 83,2% 86,45%

Ada boost m1 Ada Weka 86,21% 85,61% 83,2% 86,05%

Part

aidak Ada

Weka 93.00% 82,52% 82,92% 82,45%

REP Tree Ada Weka 93,24% 82,43% 82,92% 82,35%

Bagging Ada Weka 93,81% 82,39% 82,69% 82,8%

K-Star

Tidak Ada

Weka 95,08% 83,15% 82,37% 83,3%

LMT Ada Weka 94,24% 81,5% 82,37% 81,35%

IB1

Tidak Ada

Weka 99,83% 84,63% 82,09% 85,1%

IBK

Tidak Ada

Weka 99,83% 84,63% 82,09% 85,1%

NB Tree Ada Weka 92,77% 83,19% 81,54% 83,5%

Random tree Ada Weka 99,83% 83,96% 81,27% 84,45%

One R Ada Weka 86,24% 63,35% 80,99% 60,15%


Tidak Ada

Weka 90,49% 81,71% 80,72% 81,9%


Ada Weka 79,72% 78,84% 80,44% 78,55%

End

Tidak Ada

Weka 93,57% 80,95% 80,17% 81,1%


97




Data mining

tool

Akurasi Train

set

Akurasi Test set

Akurasi Eselon IVB

Akurasi Non

eselon Naïve Bayes Updateable

Ada Weka 82,73% 87,55% 79,89% 88,95%

Ridor Ada Weka 91,2% 83,74% 79,89% 84,45%

J-48 Ada Weka 93,57% 80,7% 79,89% 80,85%

J-48 graft Ada Weka 93,57% 80,7% 79,89% 80,85%

Voted perceptron

Tidak Ada

Weka 81,79% 79,13% 74,38% 80.00%

Multiboost AB

Ada Weka 84,57% 83,79% 73,28% 85,7%


Ada Weka 85,64% 84.00% 72,73% 86,15%

RBF Network

Tidak Ada

Weka 70,45% 80,74% 63,91% 83,8%

Spegasos Ada Weka 70,59% 86,33% 12,12% 99,8%

CBA Ada Weka 63,32% 84,63% 0% 100%


Tidak Ada

Weka 63,33% 84,63% 0% 100%

Grading

Tidak Ada

Weka 63,33% 84,63% 0% 100%

Multischeme

Tidak Ada

Weka 63,33% 84,63% 0% 100%

Stacking

Tidak Ada

Weka 63,33% 84,63% 0% 100%


Vote

Tidak Ada

Weka 63,33% 84,63% 0% 100%

Zero R

Tidak Ada

Weka 63,3% 84,63% 0% 100%

98



Tabel Hasil Classification untuk Eselon IVA


Data mining

tool

Akurasi Train

set

Akurasi Test set

Akurasi Eselon IVA

Akurasi Non

eselon

hyper pipes

Tidak Ada

Weka 67,74% 70,39% 98,83% 65,61%

CRUISE

Ada CRUISE 92,17% 80,36% 94,47% 84,09%

Threshold selector

Ada Weka 89,09% 89,52% 93,31% 90,13%


End

Tidak Ada

Weka 91,94% 88,05% 91,79% 87,42%

J-48 Ada Weka 91,94% 88,05% 91,79% 87,42%

J-48 graft Ada Weka 91,94% 88,05% 91,5% 87,42%

VFI

Tidak Ada

Weka 86,09% 85,05% 91,5% 83,97%

Jrip Ada Weka 90,62% 89,23% 88,86% 89,29%

Ridor

Tidak Ada

Weka 90,62% 86,82% 88,56% 86,53%



Ada Weka 89,04% 86,99% 87,68% 86,88%

Dagging

Tidak Ada

Weka 89,02% 86,99% 87,68% 86,88%

Decision table

Ada Weka 89,04% 86,99% 87,68% 86,88%

Multiboost AB

Ada Weka 89,02% 86,99% 87,68% 86,88%


Tidak Ada

Weka 89,04% 86,99% 87,68% 86,88%


Ada Weka 89,02% 86,99% 87,68% 86,88%

SMO Ada Weka 89,04% 86,99% 87,68% 86,88%

LMT Ada Weka 91,58% 89,23% 87,39% 89,54%

LAD tree Ada Weka 89,56% 89,4% 87,1% 89,79%

99




Data mining

tool

Akurasi Train

set

Akurasi Test set

Akurasi Eselon IVA

Akurasi Non

eselon

DTNB

Tidak Ada

Weka 89,63% 86,99% 86,8% 87,03%



Bagging

Tidak Ada

Weka

93,18% 89,4% 85,34% 90,08% Simple logistic

Ada Weka 89,41% 89,86% 84,75% 90,73%



aidak Ada

Weka

89,11% 89,99% 84,16% 90,97%

NB Tree Ada Weka 91,06% 91,17% 83,87% 92,4%

FT tree Ada Weka 91,23% 89,56% 82,09% 89,94%

Part

Tidak Ada

Weka

91,3% 89,99% 80,94% 91,51% Conjuctive rule

Ada Weka 77,99% 89,9% 80,94% 91,42%

One R

Tidak Ada

Weka

77,99% 89% 80,94% 91,42%

RBF Network

Tidak Ada

Weka

77,86% 89,9% 80,94% 91,42%

Simple cart Ada Weka 94,23% 89,35% 79,77% 90,97% Clsasification via clustering

Ada Weka 78,28% 85,26% 79,77% 86,19%

K-Star

Tidak Ada

Weka

95,64% 92,01% 79,47% 94,13%

LWL

Tidak Ada

Weka

86,23% 87,58% 79,47% 94,13% Filtered classifier

Ada Weka 89,93% 88,89% 79,47% 90,48%

Naïve Bayes Ada Weka 83,35% 90,92% 79,18% 92,9% Naïve Bayes Updateable

Ada Weka 83,35% 90,92% 79,18% 92,9%

Random Forrest

Ada Weka 99,7% 88,76% 78,89% 90,43%


Tidak Ada

Weka

89,83% 91,34% 78,59% 93,49%

100




Data mining tool

Akurasi Train

set

Akurasi Test set

Akurasi Eselon IVA

Akurasi Non

eselon BF tree

Ada Weka 93,18% 89,65% 78,3% 91,56%


Ada Weka 89,83% 89,56% 78,01% 91,51%

REP Tree Ada Weka 91,6% 91,08% 77,71% 93,34%


C5,0 Ada R 93% 88,02% 76,65% 93,88%

AD tree Ada Weka 90,15% 90,7% 75,37% 93,29%

IB1

Tidak Ada

Weka 99,92% 89,41% 74,78% 91,56%

IBK Tidak Ada

Weka 99,92% 89,14% 74,78% 91,56%

Nnge Ada Weka 99,92% 89,4% 73,9% 92,01%

Voted perceptron

Tidak Ada

Weka 73,83% 86,31% 18,48% 97,73%

Spegasos Ada Weka 75,13% 85,97% 3,23% 99,9%

CBA Ada Weka 63,32% 84,63% 0% 100%


Tidak Ada

Weka 68,68% 85,59% 0% 100%

Decision stump

Tidak Ada

Weka 68,68% 85,59% 0% 100%

Grading

Tidak Ada

Weka 68,68% 85,59% 0% 100%

Multischeme

Tidak Ada

Weka 68,68% 85,59% 0% 100%

Stacking

Tidak Ada

Weka 68,68% 85,59% 0% 100%


Vote

Tidak Ada

Weka 68,68% 85,59% 0% 100%

Zero R

Tidak Ada

Weka 68,68% 85,59% 0% 100%

101



Tabel Hasil Classification untuk Eselon IIIB


Data mining

tool

Akurasi Train

set

Akurasi Test set

Akurasi Eselon

IIIB

Akurasi Non

eselon



Weka 78,74% 91,04% 96,83% 90,96%

VFI Tidak Ada

Weka 89,91% 93,98% 88,89% 94,06%


Threshold selector

Ada Weka 96,12% 98,34% 65,08% 98,85%

Random Forrest

Ada Weka 99,94% 98,62% 61,9% 99,18%



IB1 Tidak Ada

Weka 99,98% 98,36% 57,14% 98,99%

IBK Tidak Ada

Weka 99,98% 98,36% 57,14% 98,99%

REP Tree ada Weka 97,2% 99,07% 55,56% 99,74%



Ada Weka 91,92% 97,75% 55,56% 98,39%

Dagging Tidak Ada

Weka 96,25% 98,93% 53,97% 99,62%


Ada Weka 95,54% 98,81% 53,97% 99,5%

One R Tidak Ada

Weka 99,54% 98,81% 53,97% 99,5%

AD tree Ada Weka 96,71% 98,91% 52,38% 99,62%

SMO Ada Weka 96,4% 98,91% 52,38% 99,62%



Ada Weka 96,64% 98,79% 52,38% 99,5%

LMT Ada Weka 96,88% 98,88% 50,79% 99,62%

LAD tree Ada Weka 96,55% 98,86% 50,79% 99,59%

102




Data mining

tool

Akurasi Train

set

Akurasi Test set

Akurasi Eselon

IIIB

Akurasi Non

eselon Multi layer perceptron

Ada Weka 97,14% 98,79% 49,21% 99,54%

Ridor Tidak Ada

Weka 96,53% 98,46% 47,62% 99,23%

C5,0 Ada R 96,9% 99,92% 46,03% 99,87%

Decision table

ada Weka 96,34% 98,93% 46,03% 99,74%

Part Tidak Ada

Weka 97,61% 98,93% 46,03% 99,74%

DTNB Tidak Ada

Weka 96,23% 98,83% 46,03% 99,64%

J-48 graft Ada Weka 97,5% 98,91% 41,27% 99,78%

End Tidak Ada

Weka 97,5% 98,86% 41,27% 99,74%

J-48 Ada Weka 97,5% 98,86% 41,27% 99,74%



Tidak Ada

Weka 96,32% 98,69% 41,27% 99,57%

Simple logistic

Ada Weka 96,3% 98,69% 41,27% 99,57%

Nnge Ada Weka 99,98% 98,41% 41,27% 99,28%

BF tree Ada Weka 97,2% 98,83% 39,68% 99,74%

Bagging Tidak Ada

Weka 97,55% 98,98% 38,1% 99,9%

NB Tree ada Weka 97,07% 98,95% 38,1% 99,88%

FT tree Ada Weka 97,14% 98,93% 36,51% 99,88%

K-Star Tidak Ada

Weka 98,99% 98,86% 33,33% 99,86%

Jrip Ada Weka 97,14% 98,36% 31,15% 99,4%

Filtered classifier

Tidak Ada

Weka 96,42% 98,81% 26,98% 99,9%


Ada Weka 95,74% 98,29% 25,4% 99,4%



Ada Weka 65,24% 70,4% 21,15% 71,2%

Spegasos Ada Weka 96,15% 98,62% 7,94% 100%

Ada boost m1 Ada Weka 95,26% 98,5% 0% 100%

103




Data mining

tool

Akurasi Train

set

Akurasi Test set

Akurasi Eselon

IIIB

Akurasi Non

eselon CBA

Ada Weka 95,26% 98,5% 0% 100%

Conjuctive rule

Ada Weka 95,26% 98,5% 0% 100%


Tidak Ada

Weka 95,26% 98,5% 0% 100%

Decision stump

Tidak Ada

Weka 95,26% 98,5% 0% 100%

Grading Tidak Ada

Weka 95,26% 98,5% 0% 100%

LWL Tidak Ada

Weka 95,35% 98,5% 0% 100%

Multiboost AB

Ada Weka 95,26% 98,5% 0% 100%

Multischeme Tidak Ada

Weka 95,26% 98,5% 0% 100%


Tidak Ada

Weka 95,26% 98,5% 0% 100%


Weka 95,26% 98,5% 0% 100%

Stacking Tidak Ada

Weka 95,26% 98,5% 0% 100%


Vote Tidak Ada

Weka 95,26% 98,5% 0% 100%

Zero R Tidak Ada

Weka 95,26% 98,5% 0% 100%

Voted perceptron

Tidak Ada

Weka 95,26% 98,48% 0% 99,98%

104



Tabel Hasil Classification untuk Eselon IIIA


Data mining

tool

Akurasi Train

set

Akurasi Test set

Akurasi Eselon IIIA

Akurasi Non

eselon


Weka 82,31% 90,3% 95,83% 90,24%


VFI Tidak Ada

Weka 87,12% 92,69% 87,5% 92,76%

Threshold selector

Ada Weka 97,07% 98,48% 83,33% 98,68%

REP Tree Ada Weka 97,86% 98,64% 81,25% 98,88%

FT tree Ada Weka 97,7% 98,56% 81,25% 98,79%


Random Forrest Ada Weka 99,93% 98,8% 79,17% 99,07%

BF tree Ada Weka 98,63% 98,61% 79,17% 98,88%


Ada Weka 97,32% 98,45% 79,17% 98,71%

Random tree Ada Weka 100% 97,61% 79,17% 97,86%


C5,0 Ada R 97,8% 99,07% 77,83% 98,67%

Jrip Ada Weka 97,52% 98,78% 77,08% 99,07%

Filtered classifier

Ada Weka 96,96% 98,53% 77,08% 98,82%



Ada Weka 93,58% 97,21% 77,08% 97,48%

Bagging Tidak Ada

Weka 98,14% 98,78% 75.00% 99,09%

LMT Ada Weka 97,36% 98,72% 75.00% 99,04%

Decision table Ada Weka 96,96% 98,56% 75.00% 98,88%

Simple logistic Ada Weka 96,98% 98,56% 75.00% 98,88%

DTNB Tidak Ada

Weka 96,96% 98,26% 75.00% 98,57%

Ridor Tidak Ada

Weka 97,41% 98,21% 75.00% 98,52%


Tidak Ada

Weka 96,91% 98,61% 73,91% 98,99%

105




Data mining

tool

Akurasi Train

set

Akurasi Test set

Akurasi Eselon IIIA

Akurasi Non

eselon LAD tree Ada Weka 97,43 99,05 68,75% 99,45%



NB Tree Ada Weka 97,18% 98,75% 66,67% 99,18%

End Tidak Ada

Weka 98,04% 98,7% 66,67% 99,12%

J-48 Ada Weka 98,04% 98,7% 66,67% 99,12%

IB1 Tidak Ada

Weka 100% 98,67% 66,67% 99,09%

IBK Tidak Ada

Weka 100% 98,67% 66,67% 99,09%

AD tree Ada Weka 97,16% 98,61% 66,67% 99,04%


Dagging Tidak Ada

Weka 96,91% 98,48% 66,67% 98,9%

SMO Ada Weka 96,91% 98,48% 66,67% 98,9%


Tidak Ada

Weka 95,89% 98,02% 66,67% 98,44%

One R Tidak Ada

Weka 95,89% 98,02% 66,67% 98,44%


Ada Weka 97,52% 98,83% 64,58% 99,29%

Part Tidak Ada

Weka 97,89% 98,63% 60,42% 99,37%

J-48 graft Ada Weka 98,04% 98,46% 60,42% 99,15%

Nnge Ada Weka 100% 98,53% 60,42% 99,04%



Ada Weka 96,23% 99,16% 54,17% 99,75%

K-Star Tidak Ada

Weka 99,56% 99,02% 52,08% 99,64%

LWL Tidak Ada

Weka 96,73% 98,78% 47,92% 99,45%

Spegasos

Ada Weka 96,25% 99,13% 45,83% 99,84%

106




Data mining

tool

Akurasi Train

set

Akurasi Test set

Akurasi Eselon IIIA

Akurasi Non

eselon Clsasification via clustering

Ada Weka 62,92% 72,76% 14,58% 73,53%


Tidak Ada

Weka 95,87% 98,7% 8,33% 99,89%

CBA Ada Weka 95,6% 98,7% 0% 100%

Conjuctive rule Ada Weka 95,6% 98,7% 0% 100%


Tidak Ada

Weka 95,6% 98,7% 0% 100%

Decision stump Tidak Ada

Weka 95,6% 98,7% 0% 100%

Grading Tidak Ada

Weka 95,6% 98,7% 0% 100%

Multiboost AB Ada Weka 95,6% 98,7% 0% 100%

multischeme Tidak Ada

Weka 95,6% 98,7% 0% 100%


Weka 95,6% 98,7% 0% 100%

Stacking Tidak Ada

Weka 95,6% 98,7% 0% 100%


Vote Tidak Ada

Weka 95,6% 98,7% 0% 100%

Voted perceptron

Tidak Ada

Weka 95,55% 98,64% 0% 100%

Zero R Tidak Ada

Weka 95,6% 98,7% 0% 100%

107



Tabel Hasil Classification untuk Eselon IIB


Data mining

tool

Akurasi Train

set

Akurasi Test set

Akurasi Eselon

IIB

Akurasi Non

eselon


VFI Tidak ada

Weka 89,53% 95,99% 100% 95,96%

hyper pipes Tidak ada

Weka 85,71% 94,32% 100% 94,27%


Random Forrest

Ada Weka 99,85% 99,63% 93,1% 99,7%



Ada Weka 96,12% 98,52% 93,1% 98,57%

Random tree Ada Weka 100% 99,27% 82,76% 99,44%

Bagging Tidak ada

Weka 98,59% 99,67% 79,31% 99,87%

Threshold selector

Ada Weka 97,87% 99,57% 79,31% 99,77%

Ridor Tidak ada

Weka 98,45% 98,81% 79,31% 99,01%

IB1 Tidak ada

Weka 100% 99,17% 75,86% 99,4%

IBK Tidak ada

Weka 100% 99,17% 75,86% 99,4%

J-48 graft Ada Weka 98,5% 99,63% 72,41% 99,9%


End Tidak ada

Weka 98,5% 99,57% 72,41% 99,83%

J-48 Ada Weka 98,5% 99,57% 72,41% 99,83%



LAD tree Ada Weka 98,56% 99,67% 68,97% 99,97%

NB Tree Ada Weka 98,45% 99,5% 68,97% 99,8%


108




Data mining

tool

Akurasi Train

set

Akurasi Test set

Akurasi Eselon

IIB

Akurasi Non

eselon REP Tree

Ada Weka 98,62% 99,34% 68,97% 99,64%


Ada Weka 85,8% 93,89% 68,97% 94,13%

AD tree Ada Weka 98,48% 99,67% 65,52% 100.00%

K-Star Tidak ada

Weka 99,74% 99,57% 65,52% 99,9%

Jrip Ada Weka 98,13% 99,57% 62,07% 99,93%

LMT Ada Weka 98,48% 99,57% 62,07% 99,93%



Ada Weka 98,65% 99,57% 62,07% 99,93%


Tidak ada

Weka 98,48% 99,57% 62,07% 99,93%

Simple logistic

Ada Weka 98,48% 99,57% 62,07% 99,93%

Filtered classifier

Tidak ada

Weka 98,5% 99,54% 62,07% 99,9%

Nnge Ada Weka 100% 99,4% 62,07% 99,77%

BF tree Ada Weka 98,39% 99,34% 62,07% 99,7%

Attribute selected classifier

Ada Weka 98,16% 99,6% 58,62% 100%

SMO Ada Weka 98,16% 99,6% 58,62% 100%


Ada Weka 98,36% 99,57% 55,17% 100%

Part Tidak ada

Weka 98,68% 99,57% 55,17% 100%

FT tree Ada Weka 98,65% 99,44% 55,17% 99,87%

C5,0 Ada Weka 98,5% 99,54% 51,72% 100%

Spegasos Ada Weka 98,07% 99,5% 48,28% 100%

DTNB Tidak ada

Weka 98,27% 99,4% 48,28% 99,9%

Decision table

Ada Weka 98,3% 99,47% 44,83% 100%

109




Data mining

tool

Akurasi Train

set

Akurasi Test set

Akurasi Eselon

IIB

Akurasi Non

eselon Dagging Tidak

ada Weka 97,93% 99,44% 41,38% 100%

One R Tidak ada

Weka 97,7% 99,44% 41,38% 100%


Tidak ada

Weka 97,7% 99,44% 41,38% 100%


Ada Weka 97,7% 99,44% 41,38% 100%

CBA Ada Weka 96,78% 99,04% 10,34% 99,9%

Conjuctive rule

Ada Weka 96,78% 99,04% 0% 100%


Tidak ada

Weka 96,78% 99,04% 0% 100%

Decision stump

Tidak ada

Weka 96,78% 99,04% 0% 100%

Grading Tidak ada

Weka 96,78% 99,04% 0% 100%

LWL Tidak ada

Weka 96,98% 99,04% 0% 100%

Multiboost AB

Ada Weka 96,78% 99,04% 0% 100%

multischeme Tidak ada

Weka 96,78% 99,04% 0% 100%

RBF Network Tidak ada

Weka 96,78% 99,04% 0% 100%

Stacking Tidak ada

Weka 96,78% 99,04% 0% 100%


Vote Tidak ada

Weka 96,78% 99,04% 0% 100%

Voted perceptron

Tidak ada

Weka 96,78% 99,04% 0% 100%

Zero R Tidak ada

Weka 96,78% 99,04% 0% 100%

110



Tabel Hasil Classification untuk Eselon IIA


Data mining

tool

Akurasi Train

set

Akurasi Test set

Akurasi Eselon

IIA

Akurasi Non

eselon

AD tree Ada Weka 99,74% 100% 100% 100%

Ada boost m1 Ada Weka 99,74% 100% 100% 100%

Attribute selected classifier

Ada Weka 99,24% 100% 100% 100%

Bagging Tidak Ada

Weka 99,24% 100% 100% 100%

Bayes NET Ada Weka 99,74% 100% 100% 100%

BF tree Ada Weka 99,74% 100% 100% 100%

C5,0 Ada R 99,7% 100% 100% 100%

CBA ada Weka 99,24% 100% 100% 100%


Ada Weka 99,74% 100% 100% 100%

Conjuctive rule

Ada Weka 99,24% 100% 100% 100%

CRUISE Ada CRUISE 0,76% 100% 100% 100%


Tidak Ada

Weka 99,24% 100% 100% 100%

Dagging Tidak Ada

Weka 99,24% 100% 100% 100%

Decision stump

Tidak Ada

Weka 99,74% 100% 100% 100%

Decision table

Ada Weka 99,24% 100% 100% 100%

Decorate Ada Weka 99,49% 100% 100% 100%

DTNB Tidak Ada

Weka 99,24% 100% 100% 100%

End Tidak Ada

Weka 99,24% 100% 100% 100%

Filtered classifier

Tidak Ada

Weka 99,24% 100% 100% 100%

FT tree Ada Weka 99,74% 100% 100% 100%

111




Data mining

tool

Akurasi Train

set

Akurasi Test set

Akurasi Eselon

IIA

Akurasi Non

eselon Grading Tidak

Ada Weka 99,24% 100% 100% 100%

IB1 Tidak Ada

Weka 99,74% 100% 100% 100%

IBK Tidak Ada

Weka 99,74% 100% 100% 100%

J-48 Ada Weka 99,24% 100% 100% 100%

J-48 graft Ada Weka 99,24% 100% 100% 100%

Jrip Ada Weka 99,24% 100% 100% 100%

K-Star Tidak Ada

Weka 99,74% 100% 100% 100%

LAD tree Ada Weka 99,74% 100% 100% 100%

LMT Ada Weka 99,74% 100% 100% 100%

Logit boost Ada Weka 99,74% 100% 100% 100%

LWL Tidak Ada

Weka 99,74% 100% 100% 100%


Ada Weka 99,74% 100% 100% 100%

Multiboost AB

Ada Weka 99,74% 100% 100% 100%

multischeme Tidak Ada

Weka 99,24% 100% 100% 100%

Naïve Bayes Ada Weka 99,74% 100% 100% 100%


Ada Weka 99,49% 100% 100% 100%

NB Tree Ada Weka 99,74% 100% 100% 100%

Nnge Ada Weka 99,74% 100% 100% 100%

One R Tidak Ada

Weka 99,74% 100% 100% 100%


Tidak Ada

Weka 99,24% 100% 100% 100%

Part Tidak Ada

Weka 99,24% 100% 100% 100%


Ada Weka 99,24% 100% 100% 100%

112




Data mining

tool

Akurasi Train

set

Akurasi Test set

Akurasi Eselon

IIA

Akurasi Non

eselon Random Forrest

Ada Weka 99,74% 100% 100% 100%


Weka 99,24% 100% 100% 100%

REP Tree Ada Weka 99,24% 100% 100% 100%

Ridor Tidak Ada

Weka 99,24% 100% 100% 100%

Simple cart Ada Weka 99,24% 100% 100% 100%

Simple logistic

Ada Weka 99,74% 100% 100% 100%

SMO Ada Weka 99,74% 100% 100% 100%

Spegasos Ada Weka 99,74% 100% 100% 100%

Stacking Tidak Ada

Weka 99,24% 100% 100% 100%

Stacking C Ada Weka 99,24% 100% 100% 100%

Vote Tidak Ada

Weka 99,24% 100% 100% 100%

Voted perceptron

Tidak Ada

Weka 99,24% 100% 100% 100%

Zero R Tidak Ada

Weka 99,24% 100% 100% 100%


Weka 99,74% 99,63% 100% 99,63%

Random tree Ada Weka 99,74% 99,26% 100% 99,26%

VFI Tidak Ada

Weka 98,22% 99,26% 100% 99,26%

Logistic Ada Weka 99,74% 98,89% 100% 98,89%


Ada Weka 99,74% 98,89% 100% 98,89%

Threshold selector

Ada Weka 99,74% 98,52% 100% 98,52%


Ada Weka 64,55% 78,96% 100% 78,97%

113


Lampiran 3 Decision Tree Algoritma CRUISE untuk Data Eselon IVB

Node 1: masakerja <= 15.7083 Node 2 : jenjab = Struktural Node 4: masakerja <= 7.79167 Node 8: masakerja <= 1.83333 Node 16 : diklatpim = Pim IV Node 32: Terminal Node, predicted class = IVB Class label : IVB non eselon Class size : 3 0 Node 16 : diklatpim = Pim III belum mengikuti Node 33: Terminal Node, predicted class = non eselon Class label : IVB non eselon Class size : 0 24 Node 8: masakerja > 1.83333 Node 17: masakerja <= 3.58333 Node 34: umur <= 26.2083 Node 68: Terminal Node, predicted class = non eselon Class label : IVB non eselon Class size : 0 4 Node 34: umur > 26.2083 Node 69: Terminal Node, predicted class = IVB Class label : IVB non eselon Class size : 74 18 Node 17: masakerja > 3.58333 Node 35: masakerja <= 4.20833 Node 70 : pangkatgolongan = III/a Node 140: Terminal Node, predicted class = IVB Class label : IVB non eselon Class size : 10 5 Node 70 : pangkatgolongan = III/b III/c III/d IV/a IV/b Node 141: pengalamanunitkerja <= 2.54167 Node 282: Terminal Node, predicted class = non eselon Class label : IVB non eselon Class size : 7 46 Node 141: pengalamanunitkerja > 2.54167 Node 283: Terminal Node, predicted class = IVB Class label : IVB non eselon Class size : 2 0

114



Node 35: masakerja > 4.20833 Node 71 : pangkatgolongan = III/b III/c III/d IV/a IV/b Node 142: Terminal Node, predicted class = IVB Class label : IVB non eselon Class size : 120 23 Node 71 : pangkatgolongan = III/a Node 143: Terminal Node, predicted class = non eselon Class label : IVB non eselon Class size : 17 52 Node 4: masakerja > 7.79167 Node 9: pengalamanunitkerja <= 0.125000 Node 18 : tingkatpendidikan = D3 S2 Node 36: umur <= 42.3750 Node 72: Terminal Node, predicted class = IVB Class label : IVB non eselon Class size : 13 5 Node 36: umur > 42.3750 Node 73: Terminal Node, predicted class = non eselon Class label : IVB non eselon Class size : 0 9 Node 18 : tingkatpendidikan = D1 D2 S1 SD SMA Node 37 : pangkatgolongan = III/d IV/a Node 74: Terminal Node, predicted class = IVB Class label : IVB non eselon Class size : 2 0 Node 37 : pangkatgolongan = III/a III/b III/c IV/b Node 75 : tingkatpendidikan = S1 Node 150 : pangkatgolongan = III/b Node 300: umur <= 31.1250 Node 600: Terminal Node, predicted class = IVB Class label : IVB non eselon Class size : 3 0 Node 300: umur > 31.1250 Node 601: masakerja <= 12.7917 Node 1202: Terminal Node, predicted class = non eselon Class label : IVB non eselon Class size : 3 25

115



Node 601: masakerja > 12.7917 Node 1203: Terminal Node, predicted class = IVB Class label : IVB non eselon Class size : 14 13 Node 150 : pangkatgolongan = III/a III/c III/d IV/a IV/b Node 301: Terminal Node, predicted class = non eselon Class label : IVB non eselon Class size : 5 70 Node 75 : tingkatpendidikan = D1 D2 D3 S2 SD SMA Node 151: Terminal Node, predicted class = non eselon Class label : IVB non eselon Class size : 2 106 Node 9: pengalamanunitkerja > 0.125000 Node 19: Terminal Node, predicted class = IVB Class label : IVB non eselon Class size : 17 0 Node 2 : jenjab = Fungsional Node 5: Terminal Node, predicted class = non eselon Class label : IVB non eselon Class size : 0 1201 Node 1: masakerja > 15.7083 Node 3 : jenjab = Struktural Node 6 : pangkatgolongan = III/b III/c III/d IV/a IV/b Node 12: pengalamanunitkerja <= 4.12500 Node 24 : diklatpim = Pim III Pim IV Node 48: Terminal Node, predicted class = IVB Class label : IVB non eselon Class size : 141 1 Node 24 : diklatpim = belum mengikuti Node 49: pengalamanunitkerja <= 1.83333 Node 98: Terminal Node, predicted class = IVB Class label : IVB non eselon Class size : 465 92 Node 49: pengalamanunitkerja > 1.83333 Node 99: pengalamanunitkerja <= 2.20833 Node 198: Terminal Node, predicted class = non eselon Class label : IVB non eselon Class size : 1 15

116



Node 99: pengalamanunitkerja > 2.20833 Node 199: Terminal Node, predicted class = IVB Class label : IVB non eselon Class size : 24 5 Node 12: pengalamanunitkerja > 4.12500 Node 25: Terminal Node, predicted class = IVB Class label : IVB non eselon Class size : 128 0 Node 6 : pangkatgolongan = III/a Node 13: umur <= 50.9167 Node 26: Terminal Node, predicted class = IVB Class label : IVB non eselon Class size : 45 37 Node 13: umur > 50.9167 Node 27: Terminal Node, predicted class = non eselon Class label : IVB non eselon Class size : 0 19 Node 3 : jenjab = Fungsional Node 7: Terminal Node, predicted class = non eselon Class label : IVB non eselon Class size : 0 123

117


Lampiran 4 Decision Tree Algoritma Decorate untuk Data Eselon IVA

jenjab = Struktural

| pangkat_golongan = III/c | | pengalaman_unitkerja <= 3.58333 | | | tingkat_pendidikan = S2: IVA (111.0/17.0) | | | tingkat_pendidikan = SMA | | | | pengalaman_unitkerja <= 1.25 | | | | | masakerja <= 27.0833: IVA (89.0/39.0) | | | | | masakerja > 27.0833 | | | | | | masakerja <= 28.8333: non eselon (34.0/4.0) | | | | | | masakerja > 28.8333 | | | | | | | diklat = Pim IV | | | | | | | | umur <= 52: non eselon (11.0/2.0) | | | | | | | | umur > 52: IVA (9.0/1.0) | | | | | | | diklat = belum mengikuti | | | | | | | | masakerja <= 30.9167: non eselon (15.0/5.0) | | | | | | | | masakerja > 30.9167: IVA (2.0) | | | | | | | diklat = Pim III: IVA (2.0) | | | | | | | diklat = Pim II: non eselon (0.0) | | | | pengalaman_unitkerja > 1.25: non eselon (11.0) | | | tingkat_pendidikan = S1: IVA (336.0/103.0) | | | tingkat_pendidikan = D3: IVA (26.0/6.0) | | | tingkat_pendidikan = D1: IVA (3.0/1.0) | | | tingkat_pendidikan = S3: IVA (0.0) | | | tingkat_pendidikan = D2: IVA (0.0) | | | tingkat_pendidikan = SD: IVA (0.0) | | | tingkat_pendidikan = SMP: IVA (0.0) | | pengalaman_unitkerja > 3.58333: IVA (218.0) | pangkat_golongan = IV/a | | tingkat_pendidikan = S2: IVA (118.0) | | tingkat_pendidikan = SMA | | | umur <= 50.9167: non eselon (8.0/1.0) | | | umur > 50.9167: IVA (6.0) | | tingkat_pendidikan = S1: IVA (85.0/3.0) | | tingkat_pendidikan = D3: IVA (4.0) | | tingkat_pendidikan = D1: non eselon (2.0) | | tingkat_pendidikan = S3: IVA (0.0) | | tingkat_pendidikan = D2: IVA (0.0) | | tingkat_pendidikan = SD: IVA (0.0) | | tingkat_pendidikan = SMP: IVA (0.0) | pangkat_golongan = III/b | | tingkat_pendidikan = S2 | | | masakerja <= 17.0833 | | | | diklat = Pim IV: IVA (6.0/1.0) | | | | diklat = belum mengikuti

118



| | | | | masakerja <= 5.83333 | | | | | | umur <= 35.25: non eselon (12.0) | | | | | | umur > 35.25 | | | | | | | umur <= 36.5833: IVA (3.0) | | | | | | | umur > 36.5833: non eselon (12.0/4.0) | | | | | masakerja > 5.83333 | | | | | | masakerja <= 7.41667: IVA (16.0/2.0) | | | | | | masakerja > 7.41667 | | | | | | | masakerja <= 14.9167 | | | | | | | | umur <= 34.0833: IVA (2.0) | | | | | | | | umur > 34.0833: non eselon (10.0/1.0) | | | | | | | masakerja > 14.9167: IVA (4.0) | | | | diklat = Pim III: IVA (0.0) | | | | diklat = Pim II: IVA (0.0) | | | masakerja > 17.0833: non eselon (9.0) | | tingkat_pendidikan = SMA | | | pengalaman_unitkerja <= 0.5: non eselon (373.0/3.0) | | | pengalaman_unitkerja > 0.5 | | | | pengalaman_unitkerja <= 3.58333 | | | | | umur <= 49.8333: non eselon (18.0/1.0) | | | | | umur > 49.8333 | | | | | | pengalaman_unitkerja <= 1.5: IVA (5.0) | | | | | | pengalaman_unitkerja > 1.5: non eselon (12.0/2.0) | | | | pengalaman_unitkerja > 3.58333: non eselon (95.0) | | tingkat_pendidikan = S1 | | | pengalaman_unitkerja <= 4.33333 | | | | pengalaman_unitkerja <= 0.083333 | | | | | diklat = Pim IV | | | | | | umur <= 45.0833 | | | | | | | umur <= 28.6667: IVA (5.0) | | | | | | | umur > 28.6667 | | | | | | | | masakerja <= 17.0833 | | | | | | | | | umur <= 43.5833: non eselon (14.0/3.0) | | | | | | | | | umur > 43.5833: IVA (2.0) | | | | | | | | masakerja > 17.0833: IVA (4.0) | | | | | | umur > 45.0833: non eselon (22.0/2.0) | | | | | diklat = belum mengikuti | | | | | | masakerja <= 8.25 | | | | | | | masakerja <= 7.58333: non eselon (178.0/23.0) | | | | | | | masakerja > 7.58333 | | | | | | | | masakerja <= 7.91667: IVA (7.0/1.0) | | | | | | | | masakerja > 7.91667: non eselon (7.0/2.0) | | | | | | masakerja > 8.25: non eselon (200.0/22.0) | | | | | diklat = Pim III: non eselon (0.0) | | | | | diklat = Pim II: non eselon (0.0) | | | | pengalaman_unitkerja > 0.083333

119



| | | | | masakerja <= 23.0833: IVA (52.0/20.0) | | | | | masakerja > 23.0833: non eselon (5.0) | | | pengalaman_unitkerja > 4.33333: non eselon (54.0) | | tingkat_pendidikan = D3: non eselon (27.0) | | tingkat_pendidikan = D1: non eselon (3.0) | | tingkat_pendidikan = S3: non eselon (0.0) | | tingkat_pendidikan = D2: non eselon (1.0) | | tingkat_pendidikan = SD: non eselon (2.0) | | tingkat_pendidikan = SMP: non eselon (0.0) | pangkat_golongan = III/d: IVA (327.0/57.0) | pangkat_golongan = III/a: IVA (2.0) | pangkat_golongan = IV/b | | tingkat_pendidikan = S2: IVA (1.0) | | tingkat_pendidikan = SMA: non eselon (4.0) | | tingkat_pendidikan = S1: IVA (4.0/1.0) | | tingkat_pendidikan = D3: non eselon (0.0) | | tingkat_pendidikan = D1: non eselon (0.0) | | tingkat_pendidikan = S3: non eselon (0.0) | | tingkat_pendidikan = D2: non eselon (0.0) | | tingkat_pendidikan = SD: non eselon (0.0) | | tingkat_pendidikan = SMP: non eselon (0.0) jenjab = Fungsional: non eselon (1474.0)

Tosan Wiar Ramdhani 1206194985

Documents

tosan wiar ramdhani

semoga allah swt membalas

kedua orang tua tercinta

dewan penguji pembimbing

magister teknologi informasi

fakultas ilmu komputer

achmad nizar hidayanto

dosen pembimbing i