Top Banner
14

15015 2 konsep dasar data mining

Jul 26, 2015

Download

Data & Analytics

Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: 15015 2 konsep dasar data mining
Page 2: 15015 2 konsep dasar data mining

KONSEP DASAR Data?

Mining?

Data mining menyangkut database, kecerdasan buatan(artificial intelligence), statistik, dsb

Page 3: 15015 2 konsep dasar data mining

DEFINISI Data mining adalah ekstraksi informasi atau pola yang

penting atau menarik dari data yang ada di databaseyang besar.

Data Mining = Knowledge Discovery in Databases(KDD)

Page 4: 15015 2 konsep dasar data mining
Page 5: 15015 2 konsep dasar data mining

MENGAPA DATA MINING? Digitalisasi, kemajuan sistem informasi

Jumlah data yang semakin besar

Page 6: 15015 2 konsep dasar data mining

KEBUTUHAN DATA MINING Twitter: 8000an tweet per detik 600 juta tweet

per hari.

Facebook: 30 milyar item (link, status, note, fotodst) per bulan. 500 juta user menghabiskan 700milyar menit per bulan di situs FB.

Indomaret: 4500an gerai, asumsikan 3 transaksiper menit = 12 juta transaksi per hari se Indonesia.

Kartu kredit visa: berlaku di 200 negara. 10 ributransaksi per detik 850 juta transaksi per hari.

Page 7: 15015 2 konsep dasar data mining

KEUNTUNGAN Perusahaan fokus ke informasi yg berharga didatawarehouse/databasenya.

Dapat meramalkan masa depan agar perusahaandapat mempersiapkan diri

Page 8: 15015 2 konsep dasar data mining

CONTOHMidwest grocery chain menggunakan DM untukmenganalisisi pola pembelian: saat pria membeli rokok dihari Kamis dan Sabtu, mereka juga membeli minuman.

Analisis lebih lanjut: pembeli ini belanja di hari kamis dansabtu, tapi di hari kamis jumlah item lebih sedikit.Kesimpulan yang diambil: pembeli membeli minumanuntuk dihabiskan saat weekend.

Tindak lanjut: menjual minuman dengan harga full di hariKamis dan Sabtu. Mendekatkan posisi rokok danminuman.

Page 9: 15015 2 konsep dasar data mining

CONTOH APLIKASI Bank me-mining transaksi customer untuk

mengidentifikasi customer yang kemungkinan besartertarik terhadap produk baru

Page 10: 15015 2 konsep dasar data mining
Page 11: 15015 2 konsep dasar data mining

DATA MINING: MULTI DISIPLIN ILMU

Data Mining

Teknologi DB Statistik

MachineLearning

PatternRecognition

AlgoritmaIlmu Lain

Visualisasi

Page 12: 15015 2 konsep dasar data mining

Mengapa tidak analisis data biasa? Jumlah data yang sangat besar

Algoritma harus scalable untuk menangani data yang

sangat besar (tera)

Dimensi yang sangat besar: ribuan field

Data Kompleks

Aliran data dan sensor

Data terstruktur, graph, social networdk, multi-linked data

Database dari berbagai sumber, database lama

Spasial (peta), multimedia, text, web

Page 13: 15015 2 konsep dasar data mining

KLASIFIKASI SISTEM DATA MINING Fungsi

Deskriptif

Prediktif

Sudut pandang:

Data : Jenis data yang akan ditambang

Pengetahuan view: Pengetahuan yang akan ditemukan

Teknik: Teknik yang akan digunakan

Aplikasi

Page 14: 15015 2 konsep dasar data mining

Top-10 Algorithm di ICDM’06 #1: C4.5 (61 votes)

#2: K-Means (60 votes)

#3: SVM (58 votes)

#4: Apriori (52 votes)

#5: EM (48 votes)

#6: PageRank (46 votes)

#7: AdaBoost (45 votes)

#8: kNN (45 votes)

#9: Naive Bayes (45 votes)

#10: CART (34 votes)