8 BAB 2 LANDASAN TEORI 2.1 Konsep Dasar Data warehouse 2.1.1 Pengertian Data warehouse Pengertian data warehouse menurut Inmon (2002, p31), “a data warehouse is a subject oriented, nonvolatile, time variant collection of data in support of management’s decisions ” atau dapat diartikan “ data warehouse adalah koleksi data yang mempunyai sifat berorientasi subjek, terintegrasi , tidak mengalami perubahan dan mempunyai variasi waktu yang digunakan untuk mendukung proses pengambilan keputusan manajemen”. Menurut Post (2002, p548) data warehouse adalah spesialisasi basis data yang dioptimasi untuk memenuhi permintaan manajemen, data diekstrak dari sistem online transaction processing (OLTP), kemudian dibersihkan dan dioptimasisasi untuk pencarian dan analisis. Jadi dapat disimpulkan bahwa data warehouse adalah kumpulan data yang telah diringkas dan terintegrasi dari data operasional maupun data external, yang memiliki karakteristik subject-oriented, integrated, nonvolatile dan time variant yang berguna dalam pengambilan keputusan. 2.1.2 Tujuan Perancangan Data warehouse Data warehouse yang digunakan selama ini memberikan kemudahan dan keuntungan karena data warehouse biasanya digunakan untuk melakukan empat tugas
29
Embed
BAB 2 LANDASAN TEORI 2.1 Konsep Dasar Data warehouselibrary.binus.ac.id/eColls/eThesisdoc/Bab2/2010-1-00652-SI Bab 2.pdf · Dengan menggunakan query sederhana dalam data warehouse,
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
8
BAB 2
LANDASAN TEORI
2.1 Konsep Dasar Data warehouse
2.1.1 Pengertian Data warehouse
Pengertian data warehouse menurut Inmon (2002, p31), “a data warehouse is a
subject oriented, nonvolatile, time variant collection of data in support of
management’s decisions ” atau dapat diartikan “ data warehouse adalah koleksi data
yang mempunyai sifat berorientasi subjek, terintegrasi , tidak mengalami
perubahan dan mempunyai variasi waktu yang digunakan untuk mendukung proses
pengambilan keputusan manajemen”.
Menurut Post (2002, p548) data warehouse adalah spesialisasi basis data yang
dioptimasi untuk memenuhi permintaan manajemen, data diekstrak dari sistem online
transaction processing (OLTP), kemudian dibersihkan dan dioptimasisasi untuk
pencarian dan analisis.
Jadi dapat disimpulkan bahwa data warehouse adalah kumpulan data yang telah
diringkas dan terintegrasi dari data operasional maupun data external, yang memiliki
karakteristik subject-oriented, integrated, nonvolatile dan time variant yang berguna
dalam pengambilan keputusan.
2.1.2 Tujuan Perancangan Data warehouse
Data warehouse yang digunakan selama ini memberikan kemudahan dan
keuntungan karena data warehouse biasanya digunakan untuk melakukan empat tugas
9
yang berbeda. Menurut Williams (1998, p533), keempat tugas data warehouse tersebut
adalah sebagai berikut :
1. Pembuatan Laporan
Pembuatan laporan merupakan salah satu kegunaan data warehouse yang
paling umum. Dengan menggunakan query sederhana dalam data warehouse,
dapat dihasilkan informasi per tahun, per semester, per bulan, dan bahkan per
hari.
2. On-Line Analytical Processing (OLAP)
Data warehouse digunakan dalam melakukan analisis bisnis untuk
mengetahui kecenderungan pasar dan faktor-faktor penyebabnya, karena dengan
adanya data warehouse, semua informasi baik detail maupun hasil summary
yang dibutuhkan dalam proses analisa mudah didapat. Dalam hal ini data
warehouse merupakan tools handal untuk analisa data yang kompleks.
OLAP mendayagunakan konsep data multidimensi dan memungkinkan
pemakai untuk menganalisa data sampai mendetail, tanpa mengetikkan satu pun
perintah SQL. Hal ini dimungkinkan karena pada konsep data multidimensi,
data berupa fakta yang sama bisa dilihat dengan menggunakan dimensi yang
berbeda. Fasilitas lain yang ada pada tools perangkat lunak OLAP adalah drill-
down dan roll-up. Drill-down adalah kemampuan untuk melihat detail dari suatu
informasi yang ditampilkan sedangkan roll-up adalah kebalikan dari drill-down.
3. Data mining
Data mining adalah proses untuk mencari informasi dan pengetahuan
baru dengan cara menggali (mining) data yang berjumlah banyak pada data
warehouse, dengan menggunakan kecerdasan buatan (Artificial Intelligence),
10
statistik, dan matematika. Data mining merupakan teknologi yang diharapkan
bisa menjembatani komunikasi antara data dan pemakainya.
Beberapa solusi yang bisa diselesaikan dengan data mining diantaranya :
• Menembak target pasar
Data mining dapat melakukan pengelompokan (clustering) dari model-
model pembeli dan melakukan klasifikasi terhadap setiap pembeli sesuai
dengan karakteristik yang diinginkan seperti kesukaan yang sama,
tingkat penghasilan yang sama, kebiasaan membeli dan karakteristik
lainnya.
• Melihat pola beli pemakai dari waktu ke waktu
Data mining dapat digunakan untuk melihat pola beli seseorang dari
waktu ke waktu.
• Cross-market Analisis
Data mining dapat dimanfaatkan untuk melihat hubungan antara
penjualan satu produk dengan produk lainnya.
• Profil Customer
Data mining dapat membantu pengguna untuk melihat profil pembeli
sehingga dapat diketahui pembeli tertentu suka membeli produk apa
saja.
• Informasi Summary
Data mining dapat dimanfaatkan untuk membuat laporan summary yang
bersifat multidimensi yang dilengkapi dengan informasi statistik lainnya.
11
4. Proses Informasi Eksekutif
Data warehouse digunakan untuk mencapai ringkasan informasi yang
penting dengan tujuan membuat keputusan bisnis, tanpa harus menjelajahi
keseluruhan data. Dengan menggunakan data warehouse, segala laporan telah
diringkas dan dapat pula diketahui rinciannya secara lengkap. Hal ini akan
mempermudah proses pengambilan keputusan. Informasi dan data pada laporan
data warehouse menjadi target informatif bagi user, dimana user disini adalah
pihak eksekutif.
2.1.3 Karakteristik Data warehouse
Menurut Inmon (2002, p31) dapat diketahui bahwa sebuah data warehouse
mempunyai karakteristik, antara lain :
1. Subject Oriented (Berorientasi Subyek)
2. Integrated (Terintegrasi)
3. Non – Volatile (Tidak Dapat Berubah)
4. Time – Variant (Variasi Waktu)
2.1.3.1 Subject Oriented
Data warehouse bersifat subject oriented artinya sebuah data warehouse
dirancang dan dibangun untuk memenuhi kebutuhan analisis data berdasarkan subjek
tertentu. Misalnya analisis mengenai data penjualan dalam sebuah organisasi bisnis.
12
2.1.3.2 Integrated
Data warehouse bersifat integrated artinya data warehouse harus menyimpan
data yang berasal dari sumber-sumber yang terpisah ke dalam suatu format yang
konsisten dan saling terintegrasi satu dengan yang lainnya. Dengan demikian data tidak
bisa dipecah-pecah karena data yang ada merupakan satu kesatuan yang menunjang
keseluruhan konsep data warehouse itu sendiri.
Data warehouse harus dapat memecahkan masalah-masalah seperti konflik
penamaan variabel dan inkonsistensi diantara ukuran-ukuran yang dapat dipakai
didalamnnya dengan cara konsistensi dalam pemberian nama, penentuan pengukuran
ukuran dari tipe variabel, struktur coding, serta penentuan atribut data secara spesifik.
2.1.3.3 Non-volatile
Non-volatile memiliki arti ketika data sudah disimpan ke dalam sebuah data
warehouse, data harus tidak boleh dirubah atau tidak boleh ada perubahan didalamnya.
Hal ini sangat logis karena tujuan dari data warehouse ini adalah memungkinkan untuk
menganalisa data histori tentang apa yang terjadi.
2.1.3.4 Time Variant
Data warehouse menyimpan sejarah (historical data). Waktu merupakan tipe
atau bagian data sangat penting didalam data warehouse. Di dalam data warehouse
sering disimpan macam-macam waktu, seperti waktu suatu transaksi terjadi, transaksi
dirubah, dan transaksi dibatalkan. Data yang disimpan juga hampir selalu disimpan
dalam berbagai versi, misalnya terjadi perubahan definisi kode pos, maka yang lama dan
yang baru ada semua didalam data warehouse. Jadi, data warehouse yang bagus adalah
13
yang menyimpan sejarah. Contoh data warehouse menyimpan semua data perusahaan
dari setiap tahun sejak pertama perusahaan tersebut berdiri.
Terlihat, bahwa keempat karakteristik ini saling terkait, semuanya harus
diimplementasikan agar suatu data warehouse dapat berjalan efektif untuk mendukung
pengambilan keputusan. Dan, implementasi keempat karakteristik ini membutuhkan
struktur data dari data warehouse yang berbeda dengan database sistem operasional.
2.1.4 Anatomi Data warehouse
Terdapat tiga jenis dasar sistem anatomi data warehouse, yaitu data warehouse
fungsional, data warehouse terpusat, dan data warehouse terdistribusi.
1. Data warehouse Fungsional
Menurut http://www.etfinancial.com/dataglossary.htm fungsional data
warehouse adalah sebuah gudang (warehouse) yang menggambarkan data dari sistem
operasional. Setiap fungsional warehouse menyediakan grup yang terpisah dan berbeda–
beda (seperti divisi), area fungsional (seperti manufacturing ), unit geografi atau grup
produk marketing.
Kelebihan dari bentuk fungsional ini adalah sistem mudah dibangun dengan
biaya yang relatif murah dan dapat memberikan kemampuan sistem pengumpulan data
yang terbatas pada kelompok user.
Sedangkan kekurangan dari bentuk fungsional ini adalah resiko kehilangan
konsistensi dari data dan juga terbatasnya kemampuan dalam pengumpulan data bagi
user.
14
Gambar 2.1 Data warehouse Fungsional
(http://myhut.org/public/datawarehouse.doc)
2. Data warehouse Terpusat
Menurut http://www.geekinterview.com/kb/Central-Data-Warehouse.html
Central data warehouse adalah suatu database fisik yang mana mengandung data usaha
khusus fungsi daerah, instansi, cabang, divisi atau seluruh perusahaan. Dan disimpan
dalam suatu tempat dan dibuat berdasarkan ekstrak data oprasional serta terintegrasi.
Kelebihan data warehouse terpusat adalah data benar-benar terintegrasi. Sistem
ini mengharuskan data dikirim tepat pada waktunya. Disamping itu, user hanya dapat
mengambil data dari pusat pengumpulan saja dan tidak dapat berhubungan secara
langsung dengan pemasok datanya sendiri
Kekurangan data warehouse terpusat adalah pada penerapannya membutuhkan
biaya pemeliharaan yang tinggi atas sistem pengumpulan data yang besar. Selain itu
diperlukan waktu yang lama untuk membangun sistem tersebut.
15
source
source
source
Workstation
Workstation
Data warehouseterpusat
Data warehouse Fungsional
Data warehouse Fungsional
Gambar 2.2 Data warehouse Terpusat
(http://myhut.org/public/datawarehouse.doc)
3. Data warehouse Terdistribusi
Menurut http://www.ittelkom.ac.id/library/index.php?view=article&catid=20%3