SISTEM BASIS DATA ALGORITMA ECLAT KELOMPOK 3 SERTI LONDONGALLO (H12110002) KRISTI W. SAIYA (H12110255) BRYAN NAWANJAYA ARTIKA (H12110275) ABADI GUNAWAN AZIS (H12110287) UNIVERSITAS HASANUDDIN FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM JURUSAN MATEMATIKA
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
SISTEM BASIS DATA
ALGORITMA ECLAT
KELOMPOK 3
SERTI LONDONGALLO (H12110002)
KRISTI W. SAIYA (H12110255)
BRYAN NAWANJAYA ARTIKA (H12110275)
ABADI GUNAWAN AZIS (H12110287)
UNIVERSITAS HASANUDDIN
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
JURUSAN MATEMATIKA
2013
Latar Belakang
• Algoritma Association Rule dengan Apriori kurang baik bilaterdapat banyak pola kombinasi data yang sering muncul (banyakfrequent pattern), banyak jenis item tetapi pemenuhan minimumsupport rendah.• Algoritma Association Rule dengan Apriori membutuhkan waktuyang cukup lama karena scanning database dapat dilakukanberulang-ulang untuk mendapatkan frequent pattern yang ideal.• FP-Tree (Frequent Pattern – Tree) merupakan suatu algoritmayang dirancang untuk mengatasi kendala bottleneck pada prosespenggalian data dengan algoritma Apriori (Zhao et al. 2003).
Ide gagasan FP-Tree
• Pemampatan data dengan model struktur data pohon untukmenghindari pengulangan scanning database.• Tanpa memerlukan candidate generation• Dilanjutkan dengan proses algoritma FP-growth yang dapatlangsung mengekstrak frequent Itemset dari FP tree yang telah
Algoritma Eclat dalam FP Tree
terbentuk dengan menggunakan prinsip divide and conquer.
Definisi Frequent Pattern – Tree (FP – Tree)
• Terdiri atas sebuah root dengan label ‘null’, sekumpulan subtreeyang menjadi child dari root dan sebuah tabel frequent header.• Setiap node dalam FP-Tree mengandung tiga informasi penting.yaitu label item, menginformasikan jenis item yangdirepresentasikan node tersebut, support count, merepresentasikanjumlah lintasan transaksi yang melalui node tesebut, dan pointerpenghubung yang menghubungkan node-node dengan label itemsama antar-lintasan, ditandai dengan garis panah putus-putus.• Isi dari setiap baris dalam tabel frequent header terdiri atas labelitem dan head of nodelink yang menunjuk ke node pertama dalamFP-Tree yang menyimpan label item tersebut.
Proses untuk mendapatkan Frequent Itemsetdilakukan dalam 2 tahap
• Pembentukan Frequent Pattern – Tree (FP-Tree)• Ekstrak Frequent Itemset hasil dari FP-Tree denganmenggunakan algoritma FP-Growth
Algoritma FP Growthdibagi dalam 3 tugas utama
1. Tahap Pembangkitan Conditional Pattern Base
Conditional Pattern Base merupakan subdatabase yang berisi prefix path (lintasan prefix) dan suffix pattern (pola akhiran). Pembangkitan
conditional pattern base didapatkan melalui FP-tree yang telah dibangun sebelumnya.
2. Tahap Pembangkitan Conditional FP-tree
Pada tahap ini, support count dari setiap item pada setiap conditional pattern base dijumlahkan, lalu setiap item yang memiliki jumlah support count lebih besar sama dengan minimum support count akan dibangkitkan dengan conditional FP-tree.
3. Tahap Pencarian frequent itemset
Apabila Conditional FP-tree merupakan lintasan tunggal (single path), maka didapatkan frequent itemset dengan melakukan kombinasi item untuk setiap conditional FP-tree. Jika bukan lintasan tunggal, maka dilakukan pembangkitan FP-growth secara rekursif.