9 BAB 2 LANDASAN TEORI 2.1 Data Warehouse Data warehouse merupakan database relasional yang dirancang untuk keperluan query dan analisis. Data warehouse berisikan data historis yang berasal dari sumber data transaksi, namun juga berasal dari berbagai sumber data lainnya. Data warehouse memisahkan beban kerja analisis dari transaksi dan memungkinkan perusahaan untuk menggabungkan data dari beberapa sumber (Mohammed, 2014, p. 643). Data warehouse mendukung penyediaan data yang tepat dan juga mengubah data menjadi informasi yang sangat akurat, serta dapat digunakan untuk menemukan pola dan fakta untuk mengidentifikasi masalah dan menyediakan data dan informasi pada waktu yang tepat (Aloush, 2015, p. 216). Selain itu, data warehouse memainkan peran yang signifikan bagi pegambilan keputusan di level strategis. Data warehouse menyediakan pandangan multidimensional dari data historis berjumlah besar yang berasal dari sumber operasional sehingga dapat memberikan informasi yang berguna untuk para pengambil keputusan (Kaur, Sandhu, & Kaur, 2015, p. 47). Data warehouse merupakan sebuah kumpulan data yang memiliki karakteristik terintegrasi, berorientasi-subjek, non-volatile dan time variant sebagai pendukung dalam proses pengambilan keputusan manajemen (Imhoff, Galemmo, & Geiger, 2003) Sebuah data warehouse dapat memberikan laporan-laporan yang bersifat dinamis karena dapat dilihat dari berbagai dimensi dan memiliki kemampuan untuk diperinci lebih detail maupun diringkas sesuai kebutuhan pengguna. Tanpa menggunakan data warehouse, maka laporan-laporan yang akan dihasilkan bersifat statis sesuai dengan output aplikasi berdasarkan permintaan pengguna sistem (Ma, Yao-Jan Wu, & Yinhai Wang, 2014).
24
Embed
BAB 2 LANDASAN TEORI - library.binus.ac.idlibrary.binus.ac.id/eColls/eThesisdoc/Bab2/RS1_2017_1_456_Bab2.pdf · 9 BAB 2 LANDASAN TEORI 2.1 Data Warehouse Data warehouse merupakan
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
9
BAB 2
LANDASAN TEORI
2.1 Data Warehouse Data warehouse merupakan database relasional yang dirancang untuk
keperluan query dan analisis. Data warehouse berisikan data historis yang
berasal dari sumber data transaksi, namun juga berasal dari berbagai sumber
data lainnya. Data warehouse memisahkan beban kerja analisis dari transaksi
dan memungkinkan perusahaan untuk menggabungkan data dari beberapa
sumber (Mohammed, 2014, p. 643).
Data warehouse mendukung penyediaan data yang tepat dan juga
mengubah data menjadi informasi yang sangat akurat, serta dapat digunakan
untuk menemukan pola dan fakta untuk mengidentifikasi masalah dan
menyediakan data dan informasi pada waktu yang tepat (Aloush, 2015, p.
216).
Selain itu, data warehouse memainkan peran yang signifikan bagi
pegambilan keputusan di level strategis. Data warehouse menyediakan
pandangan multidimensional dari data historis berjumlah besar yang berasal
dari sumber operasional sehingga dapat memberikan informasi yang berguna
untuk para pengambil keputusan (Kaur, Sandhu, & Kaur, 2015, p. 47).
Data warehouse merupakan sebuah kumpulan data yang memiliki
karakteristik terintegrasi, berorientasi-subjek, non-volatile dan time variant
sebagai pendukung dalam proses pengambilan keputusan manajemen
(Imhoff, Galemmo, & Geiger, 2003)
Sebuah data warehouse dapat memberikan laporan-laporan yang
bersifat dinamis karena dapat dilihat dari berbagai dimensi dan memiliki
kemampuan untuk diperinci lebih detail maupun diringkas sesuai kebutuhan
pengguna. Tanpa menggunakan data warehouse, maka laporan-laporan yang
akan dihasilkan bersifat statis sesuai dengan output aplikasi berdasarkan
permintaan pengguna sistem (Ma, Yao-Jan Wu, & Yinhai Wang, 2014).
10
2.1.1 Karakteristik Data warehouse Menurut Inmon yang dikutip Connolly & Begg (2015, p. 1225)
karakteristik data warehouse adalah sebagai berikut:
a) Subject-oriented
Data warehouse diorganisasikan subjek utama perusahaan (seperti
pelanggan, produk, dan penjualan) daripada area utama aplikasi
(seperti pelanggan, faktur, pengendalian stok, dan penjualan produk).
Hal ini tercermin dalam kebutuhan untuk menyimpan data pendukung
keputusan daripada data berorientasi aplikasi.
b) Integrated
Karena sumber data datang secara bersamaan dari berbagai
enterprise-wide application system. Sumber data ini sering tidak
konsisten, misalnya berbeda format. Sumber data harus terintegrasi
dan dibuat konsisten untuk menyajikan pandangan satu data ke
pengguna.
c) Time variant
Karena data dalam warehouse hanya akurat dan berlaku di
beberapa titik di suatu waktu atau selama beberapa interval waktu.
Variansi waktu dari data warehouse juga dalam waktu yang
ditentukan, asosiasi implisit maupun eksplisit waktu dengan semua
data.
d) Non-volatile
Data tidak di perbarui secara real time tapi memperbarui dari
operasional sistem secara teratur. Data baru selalu ditambahkan
sebagai suplemen ke database, database terus menyerap data baru
secara bertahap dengan mengintegrasikan data sebelumnya.
11
2.1.2 Arsitektur Data Warehouse Arsitektur data warehouse menurut Connolly & Begg (2015, p. 1231)
Gambar 2. 1 Arsitektur Data warehouse Sumber: Database Management Book, 2015, p. 1261
2.1.2.1 Operational Data Sumber data untuk data warehouse berasal dari:
• Mainframe operasional data yang memegang kendali di hierarki
generasi pertama dan di database jaringan.
• Departemental data yang memegang kendali di kepemilikan
sistem file seperti VSAM, RMS, dan relational DBMS.
• Private data yang memegang kendali di workstation dan private
server.
• External sistem seperti internet, database komersial yang
tersedia atau database yang berhubungan dengan organisasi
pelanggan.
2.1.2.2 Operational Data Store (ODS) Operational Data Store (ODS) adalah suatu media penyimpanan
untuk data operasional saat ini yang terintegrasi dan digunakan untuk
analisis. ODS menyediakan data dengan cara yang sama seperti data
warehouse, tetapi sesungguhnya bertindak secara sederhana sebagai
12
tempat penampungan data sementara untuk dipindahkan ke data
warehouse. ODS diciptakan ketika sistem operasional tidak mampu
mencapai kebutuhan sistem pelaporan. ODS menyediakan manfaat
yang berguna dari suatu relasional database dalam mengambil
keputusan yang mendukung fungsi data warehouse.
2.1.2.3 Load Manager Load Manager melakukan semua operasi yang berhubungan
dengan extract dan load data ke dalam data warehouse. Data dapat di-
extract secara langsung dari sumber data atau lebih umumnya berasal
dari ODS.
2.1.2.4 Warehouse Manager Warehouse Manager melakukan semua operasi yang
berhubungan dengan pengelolaan data di dalam warehouse. Operasi
yang dilakukan oleh warehouse manager antara lain :
• Analisa terhadap data untuk memastikan konsistensi.
• Transformasi dan penggabungan sumber data dari tempat
penyimpanan sementara menjadi tabel-tabel data warehouse.
• Pembuatan index dan view berdasarkan tabel-tabel dasar.
• Menghasilkan denormalisasi (jika diperlukan).
• Menghasilkan agregasi (jika diperlukan).
• Backup dan archieve data.
2.1.2.5 Query Manager Query manager melakukan operasi yang berhubungan dengan
manajemen dari pengguna query. Operasi yang dilakukan oleh query
manager seperti pengarahan query pada tabel yang sesuai dan
penjadwalan pelaksanaan query. Dalam beberapa kasus, query manager
juga menghasilkan profil query yang memungkinkan warehouse
manager menentukan kesusuaian indeks dan agregasi.
2.1.2.6 Detailed Data Area ini menyimpan semua data detil di dalam skema database,
yang bertujuan untuk melengkapkan kumpulan data untuk data
warehouse. Dalam banyak kasus, data yang terperinci tidaklah disimpan
secara online tetapi dapat disediakan melalui agregasi data pada
tingkatan detil berikutnya.
13
2.1.2.7 Lightly and Highly Summarized Data Area ini menyimpan semua lightly dan highly summarized data
yang dihasilkan oleh warehouse manager. Area ini adalah tempat
penampungan sementara sebelum dilakukan perubahan secara
berkelanjutan untuk merespon perubahan profil query. Tujuan
ringkasan informasi ini adalah untuk mempercepat penyampaian query.
2.1.2.8 Achieve / Backup Data Area warehouse yang menyimpan data detil dan ringkasan data
dengan tujuan sebagai arsip dan backup data. Data ditransfer ke
penyimpanan arsip seperti magnetic tape atau optical disk.
2.1.2.9 Metadata Area warehouse ini menyimpan semua definisi metadata (data
mengenai data) menggunakan semua proses yang ada pada data
warehouse. Metadata digunakan untuk beberapa tujuan :
• Proses ekstraksi dan loading Metadata digunakan untuk
memetakan data source menjadi bentuk data yang lebih umum
dalam warehouse.
• Proses manajemen warehouse Metadata digunakan untuk
mengotomatisasi produksi dari tabel ringkasan.
• Bagian dari proses manajemen query Metadata digunakan untuk
query secara langsung pada sumber data yang paling sesuai.
2.1.2.10 End-User Access Tools Pengguna akan berinteraksi dengan data warehouse guna
mendukung pengambilan keputusan melalui end-user access tool.
Lima kelompok utama dari end-user access tool adalah :
• Reporting dan Query Tools Reporting tool meliputi production
Reporting tool dan Report writer. Production Reporting tool
digunakan untuk menghasilkan laporan operasional regular.
Report writer adalah desktop tool yang dirancang untuk end-
user. Query tool untuk data warehouse dirancang untuk
menerima SQL atau menghasilkan pernyataan SQL untuk proses
query data yang tersimpan dalam warehouse.
• Application Development Tools Aplikasi yang dapat digunakan
user yaitu graphical data access yang dirancang untuk client
14
server. Beberapa application development tools terintegrasi
dengan OLAP tools dan mengakses semua sistem database
utama.
• Executive Information Sistem (EIS) Tools Executive Information
Sistem mendukung pengambilan keputusan semua tingkat
menajemen. EIS tools yang terhubung dengan mainframe
memungkinkan pengguna membuat aplikasi pendukung
pengambilan keputusan untuk menyediakan overview data