Top Banner
1 Wprowadzenie do technologii Business Intelligence i hurtowni danych
25

Wprowadzenie do technologii Business Intelligence i ... · • Skupiona wokół technologii hurtowni danych, będących ... bazy danych systemy starej generacji ... odczyt źródłowych

Feb 28, 2019

Download

Documents

trinhcong
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Wprowadzenie do technologii Business Intelligence i ... · • Skupiona wokół technologii hurtowni danych, będących ... bazy danych systemy starej generacji ... odczyt źródłowych

1

Wprowadzenie do technologiiBusiness Intelligence

i hurtowni danych

Page 2: Wprowadzenie do technologii Business Intelligence i ... · • Skupiona wokół technologii hurtowni danych, będących ... bazy danych systemy starej generacji ... odczyt źródłowych

2

Plan rozdziału

• Wprowadzenie do Business Intelligence• Hurtownie danych• Produkty Oracle dla Business Intelligence

Page 3: Wprowadzenie do technologii Business Intelligence i ... · • Skupiona wokół technologii hurtowni danych, będących ... bazy danych systemy starej generacji ... odczyt źródłowych

3

Business Intelligence

• Technologia informatyczna służąca przekształcaniu dużych wolumenów danych w informacje, a następnie przekształcaniu tych informacji w wiedzę

• Adresowana do pracowników szczebla kierowniczego, wspomagająca podejmowanie ich decyzji

• Stawiająca drastyczne wymagania wydajnościowe,przede wszystkim z powodu ogromnych rozmiarów danych, które podlegają przetwarzaniu

• Skupiona wokół technologii hurtowni danych, będących tematycznymi bazami danych, gromadzącymi historyczne dane o działalności przedsiębiorstwa

Page 4: Wprowadzenie do technologii Business Intelligence i ... · • Skupiona wokół technologii hurtowni danych, będących ... bazy danych systemy starej generacji ... odczyt źródłowych

4Środowisko hurtowni danych

Model podstawowy

operacyjnebazy danych

systemy starejgeneracji

pliki zewnętrzne

korporacyjnahurtownia danych

(enterprise data warehouse)

aplikacjeanalityczne

decydent

Page 5: Wprowadzenie do technologii Business Intelligence i ... · • Skupiona wokół technologii hurtowni danych, będących ... bazy danych systemy starej generacji ... odczyt źródłowych

5Środowisko hurtowni danych

Architektura z obszarem składowania

operacyjnebazy danych

systemy starejgeneracji

pliki zewnętrzne

korporacyjnahurtownia danych

(enterprise data warehouse)

aplikacjeanalityczne

decydent

obszarskładowania

Page 6: Wprowadzenie do technologii Business Intelligence i ... · • Skupiona wokół technologii hurtowni danych, będących ... bazy danych systemy starej generacji ... odczyt źródłowych

6Środowisko hurtowni danych

Architektura z obszarem składowania i składnicami danych

operacyjnebazy danych

systemy starejgeneracji

pliki zewnętrzne

korporacyjnahurtownia danych

(enterprise data warehouse)

wydziałowe składnice danych(data marts)

aplikacjeanalityczne

decydent

obszarskładowania

Page 7: Wprowadzenie do technologii Business Intelligence i ... · • Skupiona wokół technologii hurtowni danych, będących ... bazy danych systemy starej generacji ... odczyt źródłowych

7

Hurtownia danych - definicja

• „Hurtownia danych to tematyczna baza danych, która trwale przechowuje zintegrowane dane opisane wymiarem czasu” [Inmon96]

• „Tematyczna baza danych” – dane dotyczą głównych obszarów działalności przedsiębiorstwa

• „trwale przechowuje” – dane nie są zmieniane ani usuwane; hurtownia danych ma charakter przyrostowy

• „zintegrowane dane” – dane dotyczące tego samego podmiotu stanowią całość

• „opisane wymiarem czasu” – dane opisują zdarzenia historyczne, a nie tylko stan aktualny

Page 8: Wprowadzenie do technologii Business Intelligence i ... · • Skupiona wokół technologii hurtowni danych, będących ... bazy danych systemy starej generacji ... odczyt źródłowych

8Porównanie hurtowni danych z systemami OLTP

wielkamała – średnia intensywność operacji dyskowych

duże – wielkiemałe – dużerozmiar

tematycznawedług aplikacjiorganizacja danych

2-10 lat30-60 dniczasowy zakres danych

selectDMLwykonywane operacje

sekundy – godzinyułamki sekundy –sekundy

czas odpowiedzi aplikacji

Hurtownia danychOLTPCecha

Page 9: Wprowadzenie do technologii Business Intelligence i ... · • Skupiona wokół technologii hurtowni danych, będących ... bazy danych systemy starej generacji ... odczyt źródłowych

9Porównanie hurtowni danych ze składnicami danych

miesiącemiesiące – lataczas implementacji i wdrożenia

1 – kilkawieleliczba źródeł danych

jednotematycznawielotematycznazakres tematyczny

wydziałprzedsiębiorstwozasięg wykorzystywania

Składnica danychHurtownia danychCecha

Page 10: Wprowadzenie do technologii Business Intelligence i ... · • Skupiona wokół technologii hurtowni danych, będących ... bazy danych systemy starej generacji ... odczyt źródłowych

10Metodyki projektowania i wdrażania hurtowni danych

• „Wielki wybuch” – budowa korporacyjnej hurtowni danych w ramach jednego projektu– globalna analiza wymagań, implementacja całościowej hurtowni

danych, implementacja aplikacji analitycznych– długi czas realizacji, początkowo wybrane technologie przestają być

wspierane przez dostawców

• Od ogółu do szczegółu– iteracyjna realizacja hurtowni danych, po kolei dla każdego obszaru

tematycznego, konstrukcja zależnych składnic danych

• Od szczegółu do ogółu– realizacja niezależnych składnic danych, z wizją ich przyszłej integracji

w jedną hurtownię danych

Page 11: Wprowadzenie do technologii Business Intelligence i ... · • Skupiona wokół technologii hurtowni danych, będących ... bazy danych systemy starej generacji ... odczyt źródłowych

11

ETL: Extraction, Transformation, Loading

• Ekstrakcja: odczyt źródłowych danych z operacyjnych baz danych, systemów starej generacji, plików zewnętrznych

• Transformacja: łączenie danych, ich weryfikacja, walidacja, czyszczenie i znakowanie czasowe

• Wczytywanie: wprowadzanie danych do docelowej hurtowni danych

• Realizacja ETL jest najtrudniejszym zadaniem implementacji hurtowni danych (pochłania nawet 70% czasu)

Page 12: Wprowadzenie do technologii Business Intelligence i ... · • Skupiona wokół technologii hurtowni danych, będących ... bazy danych systemy starej generacji ... odczyt źródłowych

12

Dwa tryby pracy hurtowni danych

• Ładowanie danych– zwykle wykonywane w regularnych odstępach czasu, w porze niskiej

aktywności użytkowników

• Realizacja zapytań analitycznych– podstawowy rodzaj obciążenia systemu hurtowni danych

czas

ETL Zapytania ETL Zapytania ETL Zapytania

Powyższa zmienność charakterystyki obciążenia systemu hurtowni danych stanowi poważny problem konfiguracyjny dla administratora bazy danych.

Page 13: Wprowadzenie do technologii Business Intelligence i ... · • Skupiona wokół technologii hurtowni danych, będących ... bazy danych systemy starej generacji ... odczyt źródłowych

13Kroki technicznej implementacji systemu Business Intelligence

• Analiza wymagań – zgromadzenie wiedzy o wymaganiach biznesowych w zakresie przetwarzania analitycznego

• Projekt logiczny hurtowni danych – pojęciowa definicja wymaganych struktur danych

• Implementacja struktur fizycznych hurtowni danych – tworzenie bazy danych, tabel, indeksów, materializowanych perspektyw

• Implementacja oprogramowania ETL – konstrukcja modułów programowych służących do zasilania hurtowni danych nowymi danymi

• Realizacja aplikacji analitycznych – implementacja programów dla użytkowników końcowych

• Strojenie hurtowni danych – rekonfiguracja serwera bazy danych, tworzenie dodatkowych indeksów i materializowanych perspektyw

Page 14: Wprowadzenie do technologii Business Intelligence i ... · • Skupiona wokół technologii hurtowni danych, będących ... bazy danych systemy starej generacji ... odczyt źródłowych

14

Technologie Oracle dla hurtowni danych

• Implementacja hurtowni danych– Oracle Database– Oracle OLAP– Oracle Warehouse Builder

• Implementacja ładowania danych– SQL*Loader– Replikacja– Tabele zewnętrzne– ODBC/JDBC– Oracle Gateways

• Implementacja aplikacji analitycznych– Oracle Discoverer– Oracle Business Intelligence Beans– Oracle Reports– Oracle Data Mining

Page 15: Wprowadzenie do technologii Business Intelligence i ... · • Skupiona wokół technologii hurtowni danych, będących ... bazy danych systemy starej generacji ... odczyt źródłowych

15

Oracle Database 10g

• Serwer bazy danych• Analityczne funkcje SQL• Struktury fizyczne dla hurtowni danych• Wielowymiarowy model danych• Repozytorium metadanych OLAP• Narzędzia ETL

Page 16: Wprowadzenie do technologii Business Intelligence i ... · • Skupiona wokół technologii hurtowni danych, będących ... bazy danych systemy starej generacji ... odczyt źródłowych

16

Oracle Warehouse Builder

• Modelowanie i implementacja schematu hurtowni danych• Modelowanie i implementacja procesów ETL• Definiowanie metadanych OLAP

Page 17: Wprowadzenie do technologii Business Intelligence i ... · • Skupiona wokół technologii hurtowni danych, będących ... bazy danych systemy starej generacji ... odczyt źródłowych

17

Oracle Enterprise Manager 10g

• Administrowanie bazą danych Oracle 10g• Definiowanie metadanych OLAP

Page 18: Wprowadzenie do technologii Business Intelligence i ... · • Skupiona wokół technologii hurtowni danych, będących ... bazy danych systemy starej generacji ... odczyt źródłowych

18

Analytic Workspace Manager

• Przeglądanie OLAP Catalog

• Automatyczne tworzenie analitycznych przestrzeni roboczych

• Tworzenie i edycja obiektów wielowymiarowych– wymiary– zmienne– formuły– programy– zbiory wartości

Page 19: Wprowadzenie do technologii Business Intelligence i ... · • Skupiona wokół technologii hurtowni danych, będących ... bazy danych systemy starej generacji ... odczyt źródłowych

19

OLAP Worksheet

• Wywoływanie komend SQL• Podstawowy interfejs dla OLAP DML

Page 20: Wprowadzenie do technologii Business Intelligence i ... · • Skupiona wokół technologii hurtowni danych, będących ... bazy danych systemy starej generacji ... odczyt źródłowych

20

Oracle Reports

• Środowisko budowy aplikacji raportujących w oparciu o zawartość bazy danych Oracle

• Przeznaczone do tworzenia aplikacji w środowiskach OLTP

Page 21: Wprowadzenie do technologii Business Intelligence i ... · • Skupiona wokół technologii hurtowni danych, będących ... bazy danych systemy starej generacji ... odczyt źródłowych

21

Oracle Discoverer

• Aplikacja wspomagająca procesy podejmowania decyzji• Wykonywanie zapytań ad hoc• Analizowanie oraz formatowanie wyników zapytań• Przygotowywanie danych do ich prezentacji• Zarządzanie danymi

Page 22: Wprowadzenie do technologii Business Intelligence i ... · • Skupiona wokół technologii hurtowni danych, będących ... bazy danych systemy starej generacji ... odczyt źródłowych

22

BI Beans

• Komponenty Java umożliwiające budowę aplikacji analitycznych opartych na bazie danych Oracle

• Wykorzystywane w środowisku Oracle Jdeveloper• Komponenty do wykorzystania w aplikacjach samodzielnych

Java i w aplikacjach JSP

Page 23: Wprowadzenie do technologii Business Intelligence i ... · • Skupiona wokół technologii hurtowni danych, będących ... bazy danych systemy starej generacji ... odczyt źródłowych

23

Oracle Data Miner

• Biblioteka Java dla środowiska Oracle Jdeveloper umożliwiająca budowę aplikacji eksploracji danych

• Narzędzie klienckie służące do wydawania zapytań eksploracyjnych ad-hoc

• Odkrywanie asocjacji• Klasyfikacja

Page 24: Wprowadzenie do technologii Business Intelligence i ... · • Skupiona wokół technologii hurtowni danych, będących ... bazy danych systemy starej generacji ... odczyt źródłowych

24

Struktura materiału IV Szkoły PLOUG

Projektowanie schematów logicznych dla hurtowni danych

Implementacja struktur fizycznych hurtowni danych

Implementacja ekstrakcji, transformacjii ładowania danych

Analityczne rozszerzenia języka SQL

Wielowymiarowy model danych

Budowa aplikacji analitycznych w technologiach Discoverer, BI Beans, Data Mining

środa

czwartek

Page 25: Wprowadzenie do technologii Business Intelligence i ... · • Skupiona wokół technologii hurtowni danych, będących ... bazy danych systemy starej generacji ... odczyt źródłowych

25Struktury danych wykorzystywane w przykładach

SPRZEDAZ

id_czasu

id_produktu

id_sklepu

suma_sprzedazy

suma_zysku

liczba_klientow

liczba_towarow

PRODUKTY

id_produktu

nazwa_produktu

typ_produktu

kategoria_produktu

departament

CZAS

id_czasu

data_transakcji

dzien_tygodnia

czy_swieto

SKLEPY

id_sklepu

nazwa_sklepu

miejscowosc

region