6 BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Pustaka Penelitian mengenai algoritma apriori yang dilakukan oleh Robi Yanto dan Riri Khoiriyah (2015) yang berjudul “ Implementasi Data Mining dengan Metode Algoritma Apriori dalam Menentukan Pola Pembelian Obat”. Pada penelitian ini data yang digunakan berupa data transaksi pembelian obat periode Januari dan Februari 2014 dengan sampel 20 data transaksi yang berisi nama obat saja bukan taksonomi obat. Hal ini bertujuan agar memudahkan tetap tersedianya berbagai obat yang cenderung sering dibutuhkan oleh konsumen. Bahasa pemrograman yang digunakan adalah Visual Basic 6.0 dan database Mysql. Dengan menggunakan minimum support 40%, diperoleh 6 nama obat yang terpenuhi. Kemudian dilanjutkan dengan pembentukan kombinasi 2 itemset dan minimum support yang sama, diperoleh 2 kombinasi itemset saja. Namun ketika dilakukan kombinasi 3 itemset tidak ada kombinasi yang terpenuhi. Setelah pola frekuensi tinggi ditemukan, barulah dicari aturan asosisi yang memenuhi syarat minimum dengan menghitung confidence aturan asosiasi. Sehingga dapat disimpulkan hanya terdapat 2 kombinasi 2 itemset dengan confidence 75% dan 77,77%. Penelitian selanjutnya dilakukan oleh Arif Ismail Husin dan Farida Mulyaningsih (2015) yang berjudul “Penerapan Metode Data Mining Analisis terhadap Data Penjualan Pakaian dengan Algoritma Apriori”. Pada penelitian ini data yang digunakan adalah data penjualan pakaian pada tahun 2013 dengan tujuan untuk menemukan hubungan antar produk yang dibeli secara bersamaan. Universitas Islam Negeri Sunan Kalijaga (11.12.2019)
41
Embed
BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORIdigilib.uin-suka.ac.id/37075/1/15650055_BAB-II_sampai... · 2019-12-19 · 6 BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Pustaka
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
6
BAB II
TINJAUAN PUSTAKA DAN LANDASAN TEORI
2.1 Tinjauan Pustaka
Penelitian mengenai algoritma apriori yang dilakukan oleh Robi Yanto dan
Riri Khoiriyah (2015) yang berjudul “Implementasi Data Mining dengan Metode
Algoritma Apriori dalam Menentukan Pola Pembelian Obat”. Pada penelitian ini
data yang digunakan berupa data transaksi pembelian obat periode Januari dan
Februari 2014 dengan sampel 20 data transaksi yang berisi nama obat saja bukan
taksonomi obat. Hal ini bertujuan agar memudahkan tetap tersedianya berbagai
obat yang cenderung sering dibutuhkan oleh konsumen. Bahasa pemrograman
yang digunakan adalah Visual Basic 6.0 dan database Mysql. Dengan
menggunakan minimum support 40%, diperoleh 6 nama obat yang terpenuhi.
Kemudian dilanjutkan dengan pembentukan kombinasi 2 itemset dan minimum
support yang sama, diperoleh 2 kombinasi itemset saja. Namun ketika dilakukan
kombinasi 3 itemset tidak ada kombinasi yang terpenuhi. Setelah pola frekuensi
tinggi ditemukan, barulah dicari aturan asosisi yang memenuhi syarat minimum
dengan menghitung confidence aturan asosiasi. Sehingga dapat disimpulkan hanya
terdapat 2 kombinasi 2 itemset dengan confidence 75% dan 77,77%.
Penelitian selanjutnya dilakukan oleh Arif Ismail Husin dan Farida
Mulyaningsih (2015) yang berjudul “Penerapan Metode Data Mining Analisis
terhadap Data Penjualan Pakaian dengan Algoritma Apriori”. Pada penelitian ini
data yang digunakan adalah data penjualan pakaian pada tahun 2013 dengan
tujuan untuk menemukan hubungan antar produk yang dibeli secara bersamaan.
Universitas Islam Negeri Sunan Kalijaga (11.12.2019)
7
Tools yang digunakan pada algoritma apriori ini adalah tools Tanagra. Dari data
yang diperoleh selama 1 tahun tersebut dilakukan normalisasi sehingga terlihat
merk pakaian apa saja yang mendapatkan nilai penjualan paling banyak. Dengan
mengelompokkan 3 merk pakaian paling diminati per-bulan-nya, diperoleh 12
pola kombinasi merk pakaian tersebut. Menggunakan nilai minimum support
30% pada kombinasi 2 itemset, hanya menghasilkan 2 kombinasi yang terpenuhi.
Namun setelah dicoba dengan kombinasi 3 itemset tidak ada kombinasi yang
terpenuhi. Kemudian dilakukan pembentukan aturan asosiasi dari 2 kombinasi
yang terpenuhi pada 2 itemset tersebut. Menggunakan minimum confidence 66%,
2 kombinasi tersebut terpenuhi dengan nilai confidence 66,67% dan 80%.
Penelitian selanjutnya dilakukan oleh Heroe Santoso, I Putu Hariyadi dan
Prayitno (2016) yang berjudul “Data Mining Analisa Pola Pembelian Produk
dengan Menggunakan Metode Algoritma Apriori”. Penelitian ini dilakukan
dengan tujuan untuk mengelompokkan data agar dapat mengetahui
kecenderungan transaksi yang muncul bersamaan sehingga menemukan pola
pembeliannya serta bisa dijadikan acuan untuk merancang kupon diskon pada
produk tertentu untuk menarik daya beli konsumen. Data yang digunakan pada
penelitian ini adalah data transakasi pada sebuah swalayan. Tahap pertama yang
dilakukan adalah melakukan normalisasi data transaksi tersebut menjadi 1 item.
Kemudian membuat data transaksi yang telah di normalisasi tersebut dibuat dalam
bentuk tabular. Dengan menggunakan nilai minimum support 2, calon 2 itemset
pada setiap data transaksi dihitung sesuai data tabular sebelumnya dan
menghasilkan 5 k-item. Menggabungkan calon 2 itemset menjadi 3 itemset, hanya
terdapat 1 itemset yang memenuhi minimum support. Kemudian melakukan
Universitas Islam Negeri Sunan Kalijaga (11.12.2019)
8
pembentukan aturan asosiasi dengan menetapkan minimum confidence 60%,
kombinasi 2 itemset yang terpenuhi adalah 7 kombinasi dan kombinasi 3 itemset
yang terpenuhi tidak ada.
Penelitian selanjutnya yang dilakukan Margi Cahyanti, Maulana Mujahidin,
dan Ericks Rachmat Swedi (2017) yang berjudul “Penerapan Algoritma Apriori
Association Rule Untuk Analisa Nilai Mahasiswa Di Universitas Gunadarma”.
Penelitian dilakukan dengan tujuan mencari aturan asosiasi untuk nilai yang
mengulang pada 75 mata kuliah yang telah diambil. Dengan menggunakan
algoritma apriori dan bahasa pemrograman C#, peneliti berhasil membuat aplikasi
yang terkoneksi dengan server akademik Universitas Gunadarma. Hasil dari
penelitian ini adalah dengan confidence sebesar 83,84% dan minimum support
100, sehingga dapat disimpulkan bahwa dengan tingkat kepercayaan ±80%
mahasiswa yang mengulang matakuliah ”Praktikum Algoritma dan
Pemrograman” juga akan mengulang matakuliah "Pengantar Sistem Komputer”.
Penelitian selanjutnya dilkukan oleh Rahmawati Ulfa (2018) yang berjudul
“Implementasi Data Mining Menggunakan Algoritma Apriori untuk Mengetahui
Pola Pembelian Konsumen pada Data Transaksi Penjualan di KPRI UIN Sunan
Kalijaga Yogyakarta”. Tujuan dari penelitian ini adalah untuk mengetahui pola
pembelian produk oleh konsumen pada bulan Januari dan Februari 2018. Data
yang tersedia di normaliasasi agar dapat diolah dengan algoritma apriori. Dengan
menggunakan minimum support = 1, diperoleh data kandidat 1 itemset dan
kandidat 2 itemset. Namun, untuk kandidat 3 itemset tidak ada kandidat data yang
terpenuhi. Setelah mendapatkan kandidat data 2 itemset kemudian melakukan
pembangkitan aturan asosiasi dengan menetapkan minimal confidence 25%. Hasil
Universitas Islam Negeri Sunan Kalijaga (11.12.2019)
9
dari penelitian ini algoritma apriori berhasil diimplementasikan untuk mengetahui
pola pembelian konsumen dari data yang tersedia.
Tabel 2. 1 Tabel penelitian terdahulu
Peneliti
(Tahun)
Objek
penelitian
Metode Judul Hasil
Robi Yanto
dan Riri
Khoiriyah
(2015)
data
transaksi
pembelian
obat
periode
Januari dan
Februari
2014
Algoritma
apriori
Implementasi
Data Mining
dengan Metode
Algoritma
Apriori dalam
Menentukan Pola
Pembelian Obat
Mengetahui pola
pembelian obat
yang sering dibeli
bersamaan.
Arif Ismail
Husin dan
Farida
Mulyaningsih
(2015)
Data
transaksi
pembelian
pakaian
tahun 2013
Algoritma
apriori
Penerapan
Metode Data
Mining Analisis
terhadap Data
Penjualan
Pakaian dengan
Algoritma
Apriori
Mengetahui
hubungan antar
produk yang
dibeli secara
bersamaan.
Heroe
Santoso, I
Putu
Hariyadi dan
Prayitno
(2016)
Data
transaksi
swalayan
Algoritma
apriori
Data Mining
Analisa Pola
Pembelian
Produk dengan
Menggunakan
Metode
Algoritma
Apriori
mengelompokkan
data agar dapat
mengetahui
kecenderungan
transaksi yang
muncul
bersamaan.
Universitas Islam Negeri Sunan Kalijaga (11.12.2019)
10
Tabel 2. 2 Tabel penelitian terdahulu (Lanjutan)
Peneliti
(Tahun)
Objek
penelitian
Metode Judul Hasil
Margi
Cahyanti,
Maulana
Mujahidin,
dan Ericks
Rachmat
Swedi (2017)
Universitas
Gunadarma
Algoritma
apriori
Penerapan
Algoritma
Apriori
Association
Rule Untuk
Analisa Nilai
Mahasiswa Di
Universitas
Gunadarma
tingkat
kepercayaan
±80% mahasiswa
yang mengulang
matakuliah
”Praktikum
Algoritma dan
Pemrograman”
juga akan
mengulang
matakuliah
"Pengantar
Sistem
Komputer”
Rahmawati
Ulfa (2018)
KPRI UIN
Sunan
Kalijaga
Yogyakarta
bulan
Januari dan
Februari
2018
Algoritma
apriori
Implementasi
Data Mining
Menggunakan
Algoritma
Apriori untuk
Mengetahui
Pola Pembelian
Konsumen pada
Data Transaksi
Penjualan di
KPRI UIN
Sunan Kalijaga
Yogyakarta
mengetahui pola
pembelian produk
oleh konsumen
pada bulan
Januari dan
Februari 2018
Universitas Islam Negeri Sunan Kalijaga (11.12.2019)
11
2.2 Landasan Teori
2.2.1 Data Mining
Data mining adalah suatu istilah yang dibuat untuk menguraikan
penemuan pengetahuan didalam database. Data mining adalah proses yang
menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine
learning untuk mengekstraksi dan mengidentifikasikan informasi yang bermanfaat
dan pengetahuan yang terkait dari berbagai database besar. (Turban, dkk. 2005:
Kusrini & Luthfi, 2009).
Menurut Gartner Group data mining adalah suatu proses menemukan
hubungan yang berarti, pola, dan kecenderungan dengan memeriksa dalam
sekumpulan besar data yang tersimpan dalam penyimpanan dengan menggunakan
teknik pengenalan pola seperti teknik statistik dan matematika (Larose, 2005:
Kusrini & Luthfi, 2009).
Data mining merupakan bidang dari beberapa bidang keilmuan yang
menyatukan teknik dari pembelajaran mesin, pengenalan pola, statistik, database,
dan visualisasi untuk penanganan permasalahan pengambilan informasi dari
database besar. (Larose, 2005: Kusrini & Luthfi, 2009).
Data mining juga dapat diartikan sebagai pengekstrakan informasi baru
yang diambil dari bongkahan data besar yang membantu dalam pengambilan
keputusan (Kusrini & Luthfi, 2009).
Istilah data mining dan knowledge discovery in database (KDD) seringkali
digunakan secara bergantian untuk menjelaskan proses penggalian informasi
tersembunyi dalam suatu basis data yang besar. Sebenarnya kedua istilah tersebut
Universitas Islam Negeri Sunan Kalijaga (11.12.2019)
12
memiliki konsep yang berbeda, tetapi berkaitan satu sama lain. Dan salah satu
tahapan dalam keseluruhan proses KDD adalah data mining (Kusrini & Luthfi,
2009).
Gambar 2. 1 Proses Data Mining
Berdasarkan gambar 2.1. proses KDD secara garis besar dapat menjelaskan
sebagai berikut (Fayyad, 1996; Kusrini & Luthfi, 2009).
1. Data Selection
Pemilihan (seleksi) data dari sekumpulan data operasional perlu
dilakukan sebelum tahap penggalian informasi dalam KDD dimulai. Data hasil
seleksi yang akan digunakan untuk proses data mining, disimpan dalam suatu
berkas, terpisah dari basis data operasionalPreprocessing/ Cleaning
2. Pre-processing/ Cleaning
Sebelum proses data mining dapak dilaksanakan, perlu dilakukan
proses cleaning pada data yang menjadi fokus KDD. Proses Cleaning
mencakup antara lain membuang duplikasi data, memeriksa kesalahan pada
data, seperti kesalahan cetak (tipografi). Juga dilakukan proses enrichment,
Universitas Islam Negeri Sunan Kalijaga (11.12.2019)
13
yaitu proses “memperkaya” data yang sudah ada dengan data atau informasi
lain yang relevan dan diperlukan untuk KDD, seperti data atau informasi
eksternal.
3. Transformation
Coding adalah proses transformasi pada data yang telah dipilih
sehingga data tersebut sesuai untuk proses data mining. Proses coding dalam
KDD merupakan proses kreatif dan sangat tergantung pada jenis atau pola
informasi yang akan dicari dalam basis data.
4. Data Mining
Data mining adalah proses mencari pola atau informasi menarik dalam
data terpilih dengan menggunakan teknik atau metode tertentu. Teknik,
metode, atau algoritma dalam data mining sangat bervariasi. Pemilihan metode
atau algoritma yang tepat sangat bergantung pada tujuan dan proses KDD
secara keseluruhan.
5. Interpretation atau Evaluation
Pola informasi yang dihasilkan dari proses data mining perlu
ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang
berkepentingan. Tahap ini merupakan bagian dari proses KDD yang disebut
interpretation. Tahap ini mencakup pemeriksaan apakah pola atau informasi
yang ditemukan bertentanga dengan fakta atau hipotesis yang ada sebelumnya..
Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat
dilakukan, yaitu (Larose, 2005: Kusrini & Luthfi, 2009):
Universitas Islam Negeri Sunan Kalijaga (11.12.2019)
14
1. Deskripsi
Terkadang peneliti dan analisis secara sederhana ingin mencoba
mencari cara untuk menggambarkan pola dan kecenderungan yang terdapat
dalam data. Sebagai contoh, petugas pengumpulan suara mungkin tidak dapat
menemukan keterangan atau fakta bahwa siapa yang tidak cukup profesional
akan sedikit didukung dalam pemilihan presiden. Deskripsi dari pola dan
kecenderungan sering memberikan kemungkinan penjelasan untuk suatu pola
atau kecenderungan.
2. Estimasi
Estimasi hampir sama dengan klasifikasi, kecuali variable target
estimasi lebih ke arah numerik daripada ke arah kategori. Model dibangun
menggunakan record lengkap yang menyediakan nilai dari variabel target
dibuat berdasarkan nilai prediksi. Sebagai contoh, estimasi nilai indeks prestasi
kumulatif mahasiswa program pascasarjana dengan melihat nilai indeks
prestasi mahasiswa tersebut pada saat mengikuti program sarjana.
3. Prediksi
Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa
dalam prediksi nilai dari hasil akan ada di masa mendatang.
Contoh prediksi dalam bisnis dan penelitian adalah:
· Prediksi harga beras dalam tiga bulan yang akan datang.
· Prediksi presentase kenaikan kecelakaan lalu lintas tahun depan jika batas
bawah kecepatan dinaikan.
Universitas Islam Negeri Sunan Kalijaga (11.12.2019)
15
4. Klasifikasi
Dalam klasifikasi, terdapat target variabel kategori. Sebagai contoh,
penggolongan pendapatan dapat dipisahkan dalam tiga kategori, yaitu
pendapat tinggi, pendapatan sedang, dan pendapatan rendah. Contoh lain
klasifikasi dalam bisnis dan penelitian adalah:
· Menentukan apakah suatu transaksi kartu kredit merupakan transaksi yang
curang atau bukan.
· Memperkirakan apakah suatu pengajuan hipotek oleh nasabah merupakan
suatu kredit yang baik atau buruk.
· Mendiagnosis penyakit seorang pasien untuk mendapatkan termasuk
kategori penyakit apa.
5. Pengklusteran
Pengklusteran merupakan pengelompokan record, pengamatan, atau
memperhatikan dan membentuk kelas objek-objek yang memiliki kemiripan.
Kluster adalah kumpulan record yang memiliki kemiripan satu dengan yang
lainnya dan memiliki ketidakmiripan dengan record-record dalam kluster lain.
6. Asosiasi
Tugas asosiasi dalam data mining adalah menemukan atribut yang
muncul dalam satu waktu. Dalam dunia bisnis lebih umum disebut analisis
keranjang belanja.
Contoh asosiasi dalam bisnis dan penelitian adalah:
· Meneliti jumlah pelanggan dari perusahaan telekomunikasi seluler yang
diharapkan untuk memberikan respon positif terhadap penawaran upgrade
layanan yang diberikan.
Universitas Islam Negeri Sunan Kalijaga (11.12.2019)
16
· Menemukan barang dalam supermarket yan dibeli secara bersamaan dan
barang yang tidak pernah dibeli secara bersamaan.
2.2.2 Konsep Analisis Asosiasi
Analisis asosiasi atau association rule mining adalah teknik data mining untuk
menemukan aturan asosiatif antara suatu kombinasi item. Analisis asosiasi dikenal
juga sebagai teknik data mining yang menjadi dasar dari berbagai teknik data
mining lainnya. Secara khusus, salah satu tahap analisis asosisasi yang menarik
perhatian banyak peneliti untuk menghasilkan algoritma yang efisien adalah
analisis pola frekuensi tinggi (frequent pattern mining). Penting tidaknya suatu
aturan asosiasi dapat diketahui dengan dua parameter (Nofiansyah, 2014):
a. Support :
Suatu ukuran yang menunjukkan seberapa besar tingkat dominasi suatu
item/itemset dari keseluruhan transaksi. Ukuran ini menentukan apakah suatu
item/itemset layak untuk dicari confidence tersebut (missal, dari keseluruhan
transaksi yang ada, seberapa tingkat dominasi yang menunjukkan item A dan B
dibeli bersamaan).
b. Confidence :
Suatu ukuran yang menunjukkan hubungan antar 2 item secara
conditional (misal, seberapa sering item B dibeli jika orang membeli item A)
(Kusrini dan Emha, 2009).
Aturan asosiasi biasanya dinyatakan dalam bentuk :