Top Banner
GUDANG DATA GUDANG DATA ( DATA WAREHOUSE) ( DATA WAREHOUSE) Disusun oleh : Disusun oleh : Ridowati G Ridowati G T.Informatika T.Informatika USD Yogyakarta USD Yogyakarta
23

Materi Pertemuan 2_Pendahuluan Gudang Data

Jun 29, 2015

Download

Documents

Yohana_Wina_986
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Materi Pertemuan 2_Pendahuluan Gudang Data

GUDANG DATAGUDANG DATA( DATA WAREHOUSE)( DATA WAREHOUSE)

Disusun oleh : Disusun oleh : Ridowati GRidowati G

T.Informatika T.Informatika –– USD YogyakartaUSD Yogyakarta

Page 2: Materi Pertemuan 2_Pendahuluan Gudang Data

PENGERTIAN DWPENGERTIAN DW

MenurutMenurut InmonInmon ::SekumpulanSekumpulan data yang data yang terintegrasiterintegrasi, basis , basis data yang data yang berorientasiberorientasi subyeksubyek yang yang didisaindidisain untukuntuk mendukungmendukung fungsifungsi sistemsistempengambilanpengambilan keputusankeputusan, , dimanadimana setiapsetiapunit unit daridari data data adalahadalah nonnon--volatile volatile dandanrelevanrelevan untukuntuk waktuwaktu tertentutertentu

Page 3: Materi Pertemuan 2_Pendahuluan Gudang Data

PengertianPengertian ((lanjutanlanjutan))

TempatTempat penampunganpenampungan (repository (repository atauatauarchievearchieve) ) informasiinformasi yang yang dikumpulkandikumpulkan daridaribeberapabeberapa sumbersumber data, data, kemudiankemudiandisimpandisimpan dalamdalam strukturstruktur yang yang terintegrasiterintegrasi, , padapada satusatu tempattempat. Data . Data ygyg disimpandisimpannantinyanantinya digunakandigunakan untukuntuk pengambilanpengambilankeputusankeputusan

Page 4: Materi Pertemuan 2_Pendahuluan Gudang Data

PengertianPengertian

Pengertian secara singkat dari gudang Pengertian secara singkat dari gudang data berdasarkan proses kerjanya adalah:data berdasarkan proses kerjanya adalah:““Proses pengambilan,pembersihan dan Proses pengambilan,pembersihan dan penyesuaian data dari berbagai sumber penyesuaian data dari berbagai sumber data OLTP ke sistem data OLAPdata OLTP ke sistem data OLAP””

Page 5: Materi Pertemuan 2_Pendahuluan Gudang Data

AsumsiAsumsi

DW DW secarasecara fisikfisik terpisahterpisah daridari seluruhseluruhkegiatankegiatan operasionaloperasional sistemsistem..DW DW mempertahankanmempertahankan data data agregatagregat dandandata data transaksitransaksi (data atomic) yang (data atomic) yang manajemennyamanajemennya terpisahterpisah daridari database database yang yang digunakandigunakan untukuntuk OLTP.OLTP.

Page 6: Materi Pertemuan 2_Pendahuluan Gudang Data

KeuntunganKeuntungan daridari gudanggudang datadata

MeningkatkanMeningkatkan produktifitasproduktifitas pengetahuanpengetahuan parapara pekerjapekerja..MendukungMendukung seluruhseluruh data yang data yang diperlukandiperlukan oleholehpengambilpengambil keputusankeputusanMenyediakanMenyediakan data data penting yangpenting yang siapsiap diaksesdiaksesMelindungiMelindungi operasioperasi basis data basis data daridari prosesproses ad hock.ad hock.MenyediakanMenyediakan ringkasanringkasan informasiinformasi untukuntuk level level tingkattingkattinggitinggiMenyediakanMenyediakan kemampuankemampuan untukuntuk penelusuranpenelusuran informasiinformasilebihlebih dalamdalam..

Page 7: Materi Pertemuan 2_Pendahuluan Gudang Data

KeuntunganKeuntungan ((lanjlanj..)..)

MenyediakanMenyediakan tempattempat untukuntukmengkombinasikanmengkombinasikan data data ygyg bersangkutanbersangkutandgndgn sumbersumber sumbersumber terpisahterpisah..EksplorasiEksplorasi data data menjadimenjadi lebihlebih mudahmudahuntukuntuk dilakukandilakukan..

Page 8: Materi Pertemuan 2_Pendahuluan Gudang Data

HasilHasil diperolehdiperoleh daridari gudanggudangdata :data :

MeningkatkanMeningkatkan pengetahuanpengetahuan bisnisbisnis..MampuMampu melakukanmelakukan persainganpersaingan bisnisbisnisbahkanbahkan menjadimenjadi pemimpinpemimpin bisnisbisnis..MempertinggiMempertinggi servisservis dandan kepuasankepuasanpelangganpelangganMemberikanMemberikan fasilitasfasilitas pembuatanpembuatankeputusankeputusanMembantuMembantu mempersingkatmempersingkat prosesproses bisnisbisnis..

Page 9: Materi Pertemuan 2_Pendahuluan Gudang Data

GudangGudang data data digunakandigunakan untukuntukorganisasiorganisasi yangyang ::

DatanyaDatanya disimpandisimpan dalamdalam sistemsistem yang yang berbedaberbedaPendekatanPendekatan yang yang digunakandigunakan oleholeh manajemenmanajemenadalahadalah berdasarkanberdasarkan informasiinformasi..MemilikiMemiliki data data besarbesar dengandengan bermacambermacam--macammacamjenisjenis penggunapenggunaMemilikiMemiliki data yang data yang samasama dengandengan representasirepresentasiberbedaberbeda dalamdalam sistemsistem yang yang berbedaberbeda..Format data yang Format data yang tidaktidak beraturanberaturan..

Page 10: Materi Pertemuan 2_Pendahuluan Gudang Data

KomponenKomponen daridari GudangGudang DataData

PenyimpananPenyimpanan DataDataData Mart (Data Data Mart (Data PasarPasar))MetadataMetadataSistemSistem pendukungpendukung keputusankeputusan dandan sistemsisteminformasiinformasi eksekutifeksekutif..

Page 11: Materi Pertemuan 2_Pendahuluan Gudang Data

Penyimpanandata

operasional

Gudang Data

Data Pasar

Metadata

Sistem Legal Gudang Data Personal

LegendTranformasi DataData ExpectedData Optional

Gambar: Aliran Data dan Komponen Gudang Data

Page 12: Materi Pertemuan 2_Pendahuluan Gudang Data

KarakteristikKarakteristik UtamaUtama

Karakteristik DeskripsiSubject Oriented Datta diorganisasikan sesuai dengan kebutuhan user

Integrated Menghilangkan kerancuan dalam hal penamaan dan nilaiinformasinya

Nonvolatile Data yang disimpan dalam format read only dan tidak dapat diubaholeh user

Time Variant Data dalam rangkaian waktu, bukan data hanya pada saat tertentu

Summarized Data Operasioal dikumpulkan (diringkas) kemudian dimapping kedalam format untuk pengambilan keputusan

Large Volume Ukuran datanya besar karena pemeliharaan data yang dari waktu kewaktu

Not normalized Data dapat redundant

Metadata Data mengenai data yang disimpan untuk user dan personil gudangdata

Data sources Data berasal dari sumber internal maupun eksternal

Page 13: Materi Pertemuan 2_Pendahuluan Gudang Data

MetadataMetadata

Chain of abstraction Chain of abstraction ContohContoh : Sofa. Sofa : Sofa. Sofa terdiriterdiri daridari …………..

AbstraksiAbstraksi sederhanasederhana daridari sebuahsebuah data.data.DW DW tanpatanpa metadata ? metadata ? MungkinkahMungkinkah ????Data Data tanpatanpa metadata metadata menjadimenjadi tidaktidak berartiberartiContohContoh::

62465652 78723 82390 2399213 92392362465652 78723 82390 2399213 923923SebuahSebuah perusahaanperusahaan X X melaporkanmelaporkan padapada 9/12/1999 9/12/1999 bahwabahwa pasarpasarperalatanperalatan mesinmesin didi Asia Asia meningkatmeningkat 33 33 persenpersen..PerusahaanPerusahaan marketing sport yang marketing sport yang terdepanterdepan : IMG 45 : IMG 45 persenpersen, , SportStarSportStar 33 33 persenpersen, Legends 16 , Legends 16 persenpersen..

Page 14: Materi Pertemuan 2_Pendahuluan Gudang Data

Format DataFormat Data

KonsepKonsep normalisasinormalisasi data data dlmdlm sistemsistemtransaksionaltransaksional yang tersimpan databaseyang tersimpan databaserelasional merupakan hal yang harus dilakukan,relasional merupakan hal yang harus dilakukan,tetapitetapi tidaktidak untuk gudanguntuk gudang data.data.DalamDalam sistemsistem transaksionaltransaksional perhatianperhatian utamautamaadalahadalah mengeliminasimengeliminasi redundansiredundansiFilosofiFilosofi dwdw adalahadalah mengaturmengatur data data shgshg mudahmudahdigunakandigunakan dandan dapatdapat diperolehdiperoleh kembalikembali dgndgncepatcepat. . RedudansiRedudansi sangatsangat dibenarkandibenarkan..

Page 15: Materi Pertemuan 2_Pendahuluan Gudang Data

ArsitekturArsitektur GudangGudang datadata

Page 16: Materi Pertemuan 2_Pendahuluan Gudang Data

3 3 JenisJenis GudangGudang DataData

1.1. GudangGudang data virtual. data virtual. Membiarkan pemakai untuk melakukan akses Membiarkan pemakai untuk melakukan akses secara langsung ke dalam data operasional. secara langsung ke dalam data operasional. Disini gudang data bersifat virtual, tidak real. Disini gudang data bersifat virtual, tidak real. Gudang data virtual biasanya digunakan untuk Gudang data virtual biasanya digunakan untuk memperkecil biaya operasional dan biasnaya memperkecil biaya operasional dan biasnaya untuk mengetahui data apa yang sebenarnya untuk mengetahui data apa yang sebenarnya dicari oleh pemakai.dicari oleh pemakai.

Page 17: Materi Pertemuan 2_Pendahuluan Gudang Data

3 Jenis Gudang Data3 Jenis Gudang Data

2.2. Gudang data terpusatGudang data terpusatSebuah penyimpanan fisik basis data tunggal Sebuah penyimpanan fisik basis data tunggal yang berisi seluruh data untuk suatu area yang berisi seluruh data untuk suatu area fungsi tertentu, departement atau divisi. fungsi tertentu, departement atau divisi. Gudang data terpusat ini biasanya dipilih jika Gudang data terpusat ini biasanya dipilih jika ada data yang dibutuhkan secara umum dan ada data yang dibutuhkan secara umum dan ada sejumlah pemakai yang telah siap ada sejumlah pemakai yang telah siap terhubung melalui jaringan computer. terhubung melalui jaringan computer. Data yang disimpan dalam gudang data ada Data yang disimpan dalam gudang data ada secara fisik dan diakses dari suatu tempat dan secara fisik dan diakses dari suatu tempat dan harus selalu dipelihara.harus selalu dipelihara.

Page 18: Materi Pertemuan 2_Pendahuluan Gudang Data

3 Jenis Gudang Data3 Jenis Gudang Data

3.3. Gudang data terdistribusiGudang data terdistribusiSesuai dengan namanya, komponenSesuai dengan namanya, komponen--komponen dari gudang data terdistribusi komponen dari gudang data terdistribusi melalui sejumlah penyimpanan fisik basis melalui sejumlah penyimpanan fisik basis data.data.

Page 19: Materi Pertemuan 2_Pendahuluan Gudang Data

LangkahLangkah PembuatanPembuatan DWDW

DisainDisain gudanggudang data data terlebihterlebih dahuludahulu..LakukanLakukan prosesproses ‘‘cleaningcleaning’’ dandanditransformasikanditransformasikan..HasilHasil pembersihanpembersihan dandan transformasitransformasidisimpandisimpan dalamdalam gudanggudang datadataData yang Data yang disimpandisimpan dalamdalam gudanggudang data data diperbaharuidiperbaharui secarasecara periodikperiodik

Page 20: Materi Pertemuan 2_Pendahuluan Gudang Data

ETL (Extract,Transform,Load)ETL (Extract,Transform,Load)

Kemampuan yang perlu dimiliki oleh DW:Kemampuan yang perlu dimiliki oleh DW:Membaca dari dan mengirim data ke berbagai sumber (file Membaca dari dan mengirim data ke berbagai sumber (file teks,Excel,database relasional dsb)teks,Excel,database relasional dsb)Mampu menyesuaikan / transformasi dataMampu menyesuaikan / transformasi dataMemiliki informasi metadata dalam setiap perjalanan Memiliki informasi metadata dalam setiap perjalanan transformasinyatransformasinyaMemiliki audit log yang baikMemiliki audit log yang baikDapat meningkatkan performanya dengan scale up dan scale outDapat meningkatkan performanya dengan scale up dan scale outMudah diimplementasikanMudah diimplementasikan

PROSES diatas dibagi dalam 3 proses besar yaitu ETLPROSES diatas dibagi dalam 3 proses besar yaitu ETL

Page 21: Materi Pertemuan 2_Pendahuluan Gudang Data

Sistem Kerja Data WarehouseSistem Kerja Data Warehouse

Database

Data Warehouse

Dokumen Text / Excel

Mapping Data

VendorUser

SKEMABintang

DatabaseOLAP

Mapping Data

IT

Page 22: Materi Pertemuan 2_Pendahuluan Gudang Data

The Seven Deadly Sins of Data The Seven Deadly Sins of Data Warehouse Implementation Warehouse Implementation

(Denis (Denis KozarKozar, 1997), 1997)PadaPada saatsaat membangunmembangun gudanggudang data, data data, data akanakan datangdatangKesalahanKesalahan dalamdalam membuatmembuat kerangkakerangka arsitekturarsitektur gudanggudang datadataKetidakmampuanKetidakmampuan dalamdalam menyusunmenyusun asumsiasumsiKesalahanKesalahan dalamdalam penentuanpenentuan metodologimetodologi dandan peralatanperalatan yang yang digunakandigunakanKesalahanKesalahan dalamdalam siklussiklus hiduphidup gudanggudang datadataKecenderunganKecenderungan dalamdalam membatalkanmembatalkan data yang data yang mengandungmengandungperbedaanperbedaan..MenggagalkanMenggagalkan dokumendokumen yang yang mengandungmengandung kesalahankesalahan padapadasaatsaat membuatmembuat project DW project DW pertamapertama kali.kali.

Page 23: Materi Pertemuan 2_Pendahuluan Gudang Data

TIM TIM GudangGudang DataDataDatabase designer Orang yang membangun dan merancang gudang

data

Data Modeller Orang yang mengintegrasikan gudang data yang baru dengan yang sudah data

Developer Orang yang menempatkan integrasi yang baru danmentransformasikan ke program

System Manager Orang yang menyeleksi hardware dan software yang dibutuhkan untuk membangun gudang data

Systems Programmer Orang yang menangani rencana kapasitas danpenyelarasan gudang data

End User Orang yang harus memahami permasalahan-permasalahan yang akan ditangani seperti sales manager, ahli keuangan dll.