Top Banner
Pertemuan-1
25

Pertemuan-1

Jan 04, 2016

Download

Documents

graiden-poole

Pertemuan-1. Pengantar Data Mining (DM) Motivasi Mengapa? Apa? Aplikasi Proses KDD Tinjauan DM Isu Utama. Pengantar DM. Motivasi: “Kebutuhan Merupakan Sumber Penemuan” • Problem ledakan data – Tool koleksi data otomatis dan perkembangan teknologi database - PowerPoint PPT Presentation
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Pertemuan-1

Pertemuan-1

Page 2: Pertemuan-1

Pengantar Data Mining (DM)

Motivasi

Mengapa? Apa?

Aplikasi

Proses KDD

Tinjauan DM

Isu UtamaPengantar DM

Page 3: Pertemuan-1

Motivasi: “KebutuhanMerupakan Sumber Penemuan”

• Problem ledakan data– Tool koleksi data otomatis dan

perkembangan teknologi databasemenyebabkan banyak sekali data yang bisadikumpulkan di dalam database, datawarehouse, dan alat peyimpanan informasilainnya, untuk dianalisa

• Kita berkubang data tetapi kelaparanpengetahuan!

Pengantar DM

Page 4: Pertemuan-1

Motivasi: “KebutuhanMerupakan Sumber Penemuan”

• Solusi: Penggudangan data danpenambangan data (Data warehousing anddata mining)– Data warehousing dan on-line analytical

processing (OLAP)

– Penyaringan pengetahuan yang menarik(kaidah, keberaturan, pola, kendala) dari datadalam database yang besar

Pengantar DM

Page 5: Pertemuan-1

Komputer Tahun 1940-an(ENIAC)

Pengantar DM

Page 6: Pertemuan-1

Help

Personal Home Network Tahun2000-an

FileEdit

500

400

Locate View

EDCBA

Help Storage300

200

100 Mount

431 7437 19500 1 2 3 4 5

6

NetworkTraffic

7 79% /0263196347358

93% /us

Storage

StorageStorage

Storage StorageStorage

InternetStorage

Pengantar DM

Page 7: Pertemuan-1

Evolusi atau PerkembanganTeknologi Database

• 1960an: Koleksi data, pembuatan data, IMS dannetwork DBMS

• 1970an: Model data relasional dan implementasiDBMS relasional

• 1980an: RDBMS, model data lanjut (extended-relational, OO, deduktif, dsb.) DBMS berorientasiaplikasi(spasial, saintifik, teknik, dsb.)

• 1990an –2000an: Data mining dan datawarehousing, database multimedia, teknologiWeb

Pengantar DM

Page 8: Pertemuan-1

Apa Itu Data Mining?

• Pada dasarnya: Perolehan pengetahuan daridata

– “Ekstraksi informasi atau pola yang menarik(tidak sepele, implisit, tak-diketahuisebelumnya, mungkin bermanfaat) dari datadidalam database yang besar"

• Seringkali hanya:

– “Memberitahu sesuatu yang menarik daridata ini", “Menguraikan data ini"

Penyelidikan: analisa data semi-otomatisatas sekumpulan data yang besar

Pengantar DM

Page 9: Pertemuan-1

Apa Itu Data Mining?

• Istilah yang rada baku:

– Data mining• Biasanya DM adalah salah satu proses KDD

– Knowledge discovery in databases (KDD)• Istilah umum yang meliputi, preprocessing

data, DM, dan postprocessing

• Istilah yang tidak terlalu sering digunakan:

– Ekstraksi pengetahuan, arkeologi data,pengerukan data, penuaian informasi, analisadata/pola

• Publisitas terbaru:

– Kecerdasan bisnis, manajemen pengetahuan

Pengantar DM

Page 10: Pertemuan-1

Mengapa Data Mining?

• Ketersediaan data dalam jumlahyang sangat besar:

– Tool koleksi data otomatis danperkembangan teknologi databasemenyebabkan banyak sekali datayang bisa dikumpulkan di dalamdatabase, data warehouse, dan alatpeyimpanan informasi lainnya

– Pemeriksaan data manual adalahmembosankan dan terkadang tidakmasuk akal

Pengantar DM

Page 11: Pertemuan-1

Apa Manfaat Dari DM?

Meningkatkan pengetahuan agarbisa membuat keputusanberdasarkan:

MarketingMisal, pengaruh pada marketing

Peran dan pengaruh DM yangbertumbuh pesat dan masihbertumbuh!

Data

DatabaseMarketing

KDD &

Tetapi DM tidaklah sekedarmarketing...

Warehousing Data Mining

Pengantar DM

Page 12: Pertemuan-1

Potensi Aplikasi?

• Analisis database dan dukungankeputusan:

– Analisis dan manajemen pasar

• Target pasar, manajemen relasicustomer (CRM), analisis keranjangpasar, penjualan silang, segmentasipasar

– Analisis dan manajemen resiko

• Peramalan, tindakan mempertahankancustomer, peningkatan asuransi,kontrol kualitas, analisis kompetitif

– Deteksi dan manajemen kecurangan

Pengantar DM

Page 13: Pertemuan-1

Potensi Aplikasi?

• Aplikasi lain:

– Text mining (news group, email,dokumen) dan Web mining

– Stream data mining

– Analisis DNA dan bio data

Pengantar DM

Page 14: Pertemuan-1

Analisis dan Manajemen Pasar

• Dari mana data berasal?

– Transaksi kartu kredit, loyalty cards, kupon discount, keluhancustomer, kajian lifestyle publik

• Target Pasar

– Mendapatkan kelompok model customer yang berbagikarakteristik yang sama: minat, tingkat pendapatan, kebiasaanbelanja, dsb.

– Menentukan pola pembelian customer berdasarkan waktu

• Analisis lintas pasar

– Asosiasi/korelasi antara penjualan produk & taksiran berdasarkanasosiasi demikian

Pengantar DM

Page 15: Pertemuan-1

Analisis dan Manajemen Pasar

• Profil customer– Tipe customer apa membeli produk apa

(pengelompokan atau klasifikasi)

• Analisa kebutuhan customer– Mengenali produk terbaik untuk customer berbeda

– Meramalkan faktor apa yang akan memikat customerbaru

• Penyediaan rangkuman informasi– Rangkuman laporan multidimensi

– Rangkuman informasi statistik (kecenderungan dataterpusat dan variasi)

Pengantar DM

Page 16: Pertemuan-1

Analisis dan Manajemen ResikoPerusahaan

• Perencanaan keuangan dan evaluasi aset

– Analisis dan peramalan cash flow

– Analisis ganti rugi yang mungkin untukmengevaluasi aset

– Analisis cross-sectional dan time series (financial-ratio, analisa trend, dsb.)

• Perencanaan sumberdaya

– Merangkum dan membandingkan sumberdaya danpengeluaran

Pengantar DM

Page 17: Pertemuan-1

Analisis dan Manajemen ResikoPerusahaan

• Kompetisi

– Memantau pesaing dan arah pasar

– Mengelompokkan customer kedalam kelasdan prosedur harga berbasis kelas

– Menetapkan strategi harga dalam suatu pasardengan kompetitif tinggi

Pengantar DM

Page 18: Pertemuan-1

Aplikasi Lain

• Olah raga

– IBM Advanced Scout menganalisa statistik (shots blocked,assists, dan fouls) pertandingan NBA untuk mendapatkankeuntungan kompetitif bagi New York Knicks dan MiamiHeats

• Astronomi

– Observatory JPL dan Palomar menemukan 22 quasarsdengan bantuan data mining

• Internet Web Surf-Aid

– IBM Surf-Aid menerapkan algoritma data mining untukakses logs halaman Web yang terkait dengan pasar dalamupaya mendapatkan kesukaan dan perilaku customer,mengenalisa efektifitas pemasaran Web, perbaikan situs Weborganisasi, dsb.

Pengantar DM

Page 19: Pertemuan-1

Contoh (1)

• Anda seorang manajer marketing untukperusahaan telepon cellular:

– Pelanggan menerima sebuah telepon gratis (nilai1.5 juta) dengan kontrak satu tahun; andamemberikan suatu komisi penjualan sebesar 2.5juta per kontrak

– Problem: Turnover (setelah kontrak berakhir)adalah 25%

– Memberikan suatu telepon baru ke setiap orangyang kontraknya habis sangatlah mahal

– Membawa kembali customer setelah keluaradalah juga sukar dan mahal

Pengantar DM

Page 20: Pertemuan-1

Contoh (1)

• Tiga bulan sebelum suatukontrak berakhir, cari tahucustomer mana yang akan

Yippee!I won't leave!

keluar:

– Jika anda inginmempertahankancustomer yang diduga akankeluar, tawarkan customertersebut suatu telepon baru

Pengantar DM

Page 21: Pertemuan-1

Contoh (2)

• Anda seorang petugasasuransi dan anda harusmendefinisikan suatu

Oh, yes!I love myFerrari!

pembayaran bulanan yangpantas untuk seorang pemudaberusia 18 tahun yangmembeli sebuah Ferrari …apa yang anda akan lakukan?

Pengantar DM

Page 22: Pertemuan-1

Contoh (2)

• Kaji seluruh data customer dan datakompensasi pembayaran sebelumnya

• Kaji peluang penyebab kecelakaan palingbanyak berdasarkan dugaan…

– Kelamin pengendara (pria/wanita) danusia

– Model dan usia mobil, tempat tinggal

– dsb.

• Jika peluang kecelakaan lebih besar darirata-rata, aturlah pembayaran bulananyang sesuai!

Pengantar DM

Page 23: Pertemuan-1

Contoh (3)

• Anda berada diluar negeri dan seseorangmencuri atau menggandakan kartu kreditatau telepon mobile anda …

• Perusahaan kartu kredit …

– Menggunakan data histori untukmembangun model prilaku penipuan dangunakan data mining untuk membantudidalam mengenali kejadian yang mirip

• Perusahaan telepon …

– Menganalisis pola yang menyimpang darisuatu kebiasaan yang diharapkan (tujuan,durasi, dsb.)

Pengantar DM

Page 24: Pertemuan-1

Contoh (4)

• Log pengaksesan Web bisadianalisis untuk …

Excellent surfingexperience!

– Mendapatkan apa kesukaan customer

– Memperbaiki situs Web organisasi

• Demikian pula …

– Seluruh jenis analisis log informasi

– Adaptasi antarmuka/layanan user

Pengantar DM

Page 25: Pertemuan-1

Pengantar DM

Selesai