Pertemuan-1
Jan 04, 2016
Pertemuan-1
Pengantar Data Mining (DM)
Motivasi
Mengapa? Apa?
Aplikasi
Proses KDD
Tinjauan DM
Isu UtamaPengantar DM
Motivasi: “KebutuhanMerupakan Sumber Penemuan”
• Problem ledakan data– Tool koleksi data otomatis dan
perkembangan teknologi databasemenyebabkan banyak sekali data yang bisadikumpulkan di dalam database, datawarehouse, dan alat peyimpanan informasilainnya, untuk dianalisa
• Kita berkubang data tetapi kelaparanpengetahuan!
Pengantar DM
Motivasi: “KebutuhanMerupakan Sumber Penemuan”
• Solusi: Penggudangan data danpenambangan data (Data warehousing anddata mining)– Data warehousing dan on-line analytical
processing (OLAP)
– Penyaringan pengetahuan yang menarik(kaidah, keberaturan, pola, kendala) dari datadalam database yang besar
Pengantar DM
Komputer Tahun 1940-an(ENIAC)
Pengantar DM
Help
Personal Home Network Tahun2000-an
FileEdit
500
400
Locate View
EDCBA
Help Storage300
200
100 Mount
431 7437 19500 1 2 3 4 5
6
NetworkTraffic
7 79% /0263196347358
93% /us
Storage
StorageStorage
Storage StorageStorage
InternetStorage
Pengantar DM
Evolusi atau PerkembanganTeknologi Database
• 1960an: Koleksi data, pembuatan data, IMS dannetwork DBMS
• 1970an: Model data relasional dan implementasiDBMS relasional
• 1980an: RDBMS, model data lanjut (extended-relational, OO, deduktif, dsb.) DBMS berorientasiaplikasi(spasial, saintifik, teknik, dsb.)
• 1990an –2000an: Data mining dan datawarehousing, database multimedia, teknologiWeb
Pengantar DM
Apa Itu Data Mining?
• Pada dasarnya: Perolehan pengetahuan daridata
– “Ekstraksi informasi atau pola yang menarik(tidak sepele, implisit, tak-diketahuisebelumnya, mungkin bermanfaat) dari datadidalam database yang besar"
• Seringkali hanya:
– “Memberitahu sesuatu yang menarik daridata ini", “Menguraikan data ini"
Penyelidikan: analisa data semi-otomatisatas sekumpulan data yang besar
Pengantar DM
Apa Itu Data Mining?
• Istilah yang rada baku:
– Data mining• Biasanya DM adalah salah satu proses KDD
– Knowledge discovery in databases (KDD)• Istilah umum yang meliputi, preprocessing
data, DM, dan postprocessing
• Istilah yang tidak terlalu sering digunakan:
– Ekstraksi pengetahuan, arkeologi data,pengerukan data, penuaian informasi, analisadata/pola
• Publisitas terbaru:
– Kecerdasan bisnis, manajemen pengetahuan
Pengantar DM
Mengapa Data Mining?
• Ketersediaan data dalam jumlahyang sangat besar:
– Tool koleksi data otomatis danperkembangan teknologi databasemenyebabkan banyak sekali datayang bisa dikumpulkan di dalamdatabase, data warehouse, dan alatpeyimpanan informasi lainnya
– Pemeriksaan data manual adalahmembosankan dan terkadang tidakmasuk akal
Pengantar DM
Apa Manfaat Dari DM?
Meningkatkan pengetahuan agarbisa membuat keputusanberdasarkan:
MarketingMisal, pengaruh pada marketing
Peran dan pengaruh DM yangbertumbuh pesat dan masihbertumbuh!
Data
DatabaseMarketing
KDD &
Tetapi DM tidaklah sekedarmarketing...
Warehousing Data Mining
Pengantar DM
Potensi Aplikasi?
• Analisis database dan dukungankeputusan:
– Analisis dan manajemen pasar
• Target pasar, manajemen relasicustomer (CRM), analisis keranjangpasar, penjualan silang, segmentasipasar
– Analisis dan manajemen resiko
• Peramalan, tindakan mempertahankancustomer, peningkatan asuransi,kontrol kualitas, analisis kompetitif
– Deteksi dan manajemen kecurangan
Pengantar DM
Potensi Aplikasi?
• Aplikasi lain:
– Text mining (news group, email,dokumen) dan Web mining
– Stream data mining
– Analisis DNA dan bio data
Pengantar DM
Analisis dan Manajemen Pasar
• Dari mana data berasal?
– Transaksi kartu kredit, loyalty cards, kupon discount, keluhancustomer, kajian lifestyle publik
• Target Pasar
– Mendapatkan kelompok model customer yang berbagikarakteristik yang sama: minat, tingkat pendapatan, kebiasaanbelanja, dsb.
– Menentukan pola pembelian customer berdasarkan waktu
• Analisis lintas pasar
– Asosiasi/korelasi antara penjualan produk & taksiran berdasarkanasosiasi demikian
Pengantar DM
Analisis dan Manajemen Pasar
• Profil customer– Tipe customer apa membeli produk apa
(pengelompokan atau klasifikasi)
• Analisa kebutuhan customer– Mengenali produk terbaik untuk customer berbeda
– Meramalkan faktor apa yang akan memikat customerbaru
• Penyediaan rangkuman informasi– Rangkuman laporan multidimensi
– Rangkuman informasi statistik (kecenderungan dataterpusat dan variasi)
Pengantar DM
Analisis dan Manajemen ResikoPerusahaan
• Perencanaan keuangan dan evaluasi aset
– Analisis dan peramalan cash flow
– Analisis ganti rugi yang mungkin untukmengevaluasi aset
– Analisis cross-sectional dan time series (financial-ratio, analisa trend, dsb.)
• Perencanaan sumberdaya
– Merangkum dan membandingkan sumberdaya danpengeluaran
Pengantar DM
Analisis dan Manajemen ResikoPerusahaan
• Kompetisi
– Memantau pesaing dan arah pasar
– Mengelompokkan customer kedalam kelasdan prosedur harga berbasis kelas
– Menetapkan strategi harga dalam suatu pasardengan kompetitif tinggi
Pengantar DM
Aplikasi Lain
• Olah raga
– IBM Advanced Scout menganalisa statistik (shots blocked,assists, dan fouls) pertandingan NBA untuk mendapatkankeuntungan kompetitif bagi New York Knicks dan MiamiHeats
• Astronomi
– Observatory JPL dan Palomar menemukan 22 quasarsdengan bantuan data mining
• Internet Web Surf-Aid
– IBM Surf-Aid menerapkan algoritma data mining untukakses logs halaman Web yang terkait dengan pasar dalamupaya mendapatkan kesukaan dan perilaku customer,mengenalisa efektifitas pemasaran Web, perbaikan situs Weborganisasi, dsb.
Pengantar DM
Contoh (1)
• Anda seorang manajer marketing untukperusahaan telepon cellular:
– Pelanggan menerima sebuah telepon gratis (nilai1.5 juta) dengan kontrak satu tahun; andamemberikan suatu komisi penjualan sebesar 2.5juta per kontrak
– Problem: Turnover (setelah kontrak berakhir)adalah 25%
– Memberikan suatu telepon baru ke setiap orangyang kontraknya habis sangatlah mahal
– Membawa kembali customer setelah keluaradalah juga sukar dan mahal
Pengantar DM
Contoh (1)
• Tiga bulan sebelum suatukontrak berakhir, cari tahucustomer mana yang akan
Yippee!I won't leave!
keluar:
– Jika anda inginmempertahankancustomer yang diduga akankeluar, tawarkan customertersebut suatu telepon baru
Pengantar DM
Contoh (2)
• Anda seorang petugasasuransi dan anda harusmendefinisikan suatu
Oh, yes!I love myFerrari!
pembayaran bulanan yangpantas untuk seorang pemudaberusia 18 tahun yangmembeli sebuah Ferrari …apa yang anda akan lakukan?
Pengantar DM
Contoh (2)
• Kaji seluruh data customer dan datakompensasi pembayaran sebelumnya
• Kaji peluang penyebab kecelakaan palingbanyak berdasarkan dugaan…
– Kelamin pengendara (pria/wanita) danusia
– Model dan usia mobil, tempat tinggal
– dsb.
• Jika peluang kecelakaan lebih besar darirata-rata, aturlah pembayaran bulananyang sesuai!
Pengantar DM
Contoh (3)
• Anda berada diluar negeri dan seseorangmencuri atau menggandakan kartu kreditatau telepon mobile anda …
• Perusahaan kartu kredit …
– Menggunakan data histori untukmembangun model prilaku penipuan dangunakan data mining untuk membantudidalam mengenali kejadian yang mirip
• Perusahaan telepon …
– Menganalisis pola yang menyimpang darisuatu kebiasaan yang diharapkan (tujuan,durasi, dsb.)
Pengantar DM
Contoh (4)
• Log pengaksesan Web bisadianalisis untuk …
Excellent surfingexperience!
– Mendapatkan apa kesukaan customer
– Memperbaiki situs Web organisasi
• Demikian pula …
– Seluruh jenis analisis log informasi
– Adaptasi antarmuka/layanan user
Pengantar DM
Pengantar DM
Selesai