رای ب ط رخ ب ی ل ی ل ح ت ش رداز ب م ی م ص ت ی ن ا ی! ی ی ش پOLAP for Decision Support از م ی ی م ص ت م های ی ش سی از دزش ی ی م س د ی م س و ه وزی ص ن م ود ع س م دی1390
Feb 23, 2016
پردازش تحلیلی برخط برای پشتیبانی تصمیمOLAP for Decision
Support
سمینار درس سیستم های تصمیم یار هوشمند
مسعود منصوری
1390دی
فهرست مطالبمقدمهپایگاه داده تحلیلی قابلیت هایOLAPبررسی مدل داده ای چند بعدی و رابطه ای دسته بندی هایOLAPجمع بندی
2/34
مقدمه( هدف: بررسی پردازش تحلیلی برخطOLAP و )
چگونگی استفاده از آن بر+ای پشتیبانی تصمیم.
OLAP از توسعه ی مفهوم پایگاه داده استاندارد ،(.OLTPبرگرفته شده است )
OLTP به عملیات بروزرسانی، پرس و جو و نمایش داده های متنی و عددی از پایگاه داده عملیاتی اشاره دارد.
OLAP به عملیات پرس و جو و ارائه داده های متنی و عددی از پایگاه داده تحلیلی اشاره دارد.
3/34
OLTP و OLAPتفاوت
پارامترهای ارزیابی OLAP OLTPکارکرد پشتیبانی تصمیم عملیات روزانه
طراحی پایگاه داده موضوع – گرا کاربرد – گرا
داده سابقه،خالصه شده،چند بعدی،سر جمع،یکپارچه
جاری،به روز،با جزئیات،رابطه ای،منفرد
کاربرد خاص منظوره عملیات تکرار شونده
واحد کاری پرس و جوهای پیچیده تراکنش های ساده و کوتاه
تعداد رکوردهای مورد دسترسی میلیون ها رکورد دهها رکورد
تعداد کاربران هزاران کاربر صدها کاربراندازه پایگاه داده گیگابایت - ترابایت مگابایت – گیگابایت
4/34
پایگاه داده تحلیلی سازمان ها برای انجام عملیات روزانه از تعدادی منابع
اطالعاتی عملیاتی استفاده می کنند.
یک پایگاه داده تحلیلی به عنوان یک منبع داده ای مجزادر سازمان ایجاد می شود که هدف اصلی آن تحلیل
داده برای پشتیبانی از فرآیندهای تصمیم گیری مدیران می باشد.
چرا پایگاه داده تحلیلی باید مجزا ایجاد شود؟کارایی )سرعت( پرس و جوها ایجاد یک پایگاه داده که بتواند بطور مستقیم برای اهداف عملیاتی و
تحلیلی استفاده شود، غیر ممکن است.
5/34
ETLپایگاه داده تحلیلی -
ETL)استخراج، تبدیل و بارگذاری( زیر ساختی برای تسهیل در بازیابی داده ها از پایگاه
داده عملیاتی به پایگاه داده تحلیلی
6/34
Data Martپایگاه داده تحلیلی –
یک منبع داده ای است با اصولی مشابه با پایگاه دادهتحلیلی اما در یک حوزه ی محدودتر
معموالً کوچکتر از پایگاه داده تحلیلی است و رویمو+ضوع یا بخش خاصی تمرکز دارد.
مدلسازی ابعادی یک تکنیک مدلسازی درdata mart ها می باشد )همچنین می تواند در پایگاه داده
تحلیلی نیز استفاده شود(
7/34
پایگاه داده تحلیلی - ادامه:انواع جداول در مدلسازی ابعادی
FactDimension
جدولfact: ،شامل حداقل یک معیار )معموالً عددی( از یک موضوع می باشد که برای تحلیل
مدل شده است. جدولdimension:
شامل ویژگی های توصیفی متنوع )معموالً متنی( که مرتبط با موضوع نشان داده می باشد.factشده توسط جدول
هدف از مدلسازی ابعادی ارائه دادن سواالتی است که پاسخ آنهاتصمیم گیری مناسب در یک حوزه تجاری خاص را میسر می سازد
8/34
مثالپایگاه داده عملیاتی -
9/34
مثالپایگاه داده عملیاتی -
10/34
مثالپایگاه داده عملیاتی -
11/34
مثالپایگاه داده عملیاتی -
12/34
مثالپایگاه داده تحلیلی -
13/34
مثالپایگاه داده تحلیلی -
14/34
یک پرس و جوی نمونه “Find the ten products sold in stores of 20,000 sq ft. or higher, to the
customer with ‘Excellent’ credit rating the month of January for the past four years”
پاسخ چنین سوالی با استفاده از یک پرس و جوی بدست می آید، در صورتی که data mart Cساده در
باید از پرس و جوهای data martبدون استفاده از بسیار پیچیده ای استفاده کرد و نیاز به جستجو در
می باشد. B و Aپایگاه ها داده های
15/34
OLAPقابلیت های
سه ویژگی پایه که توسط تحلیلگران استفادهمی شود:
Slice and diceردن و حذف ویژگی یک بعد مشخصhافزودن، جایگزین ک
Pivot )rotate(( سازماندهی مجددreorganization)
Drill down and drill up کاهش یا افزایش میزانgranularityداده
16/34
یک نمونه از پرس و جو “For each individual store, show separately the number of product
units sold for each product category during workdays and during holiday/weekend days.”
17/34
Slice-and-Dice
“For each individual store show the number of product units sold for the camping product category during workdays.”
18/34
Slice-and-Dice
“For each individual store show separately the number of product units sold to customers with different credit rating values during workdays and during holiday/weekend days.”
19/34
Pivot
“For each individual store show separately the number of product units sold for each product category during workdays and during holiday/weekend days.”
20/34
Drilldown
“For each individual store, show separately the number of product units sold for each product category, and within each product category for each individual product name, during workdays and during holiday/weekend days.”
21/34
مدل داده چند بعدی در مقابل رابطه ای
مدل داده رابطه ای یک مدل پایه برایسیستم های مدیریت پایگاه داده رابطه ای
(RDBMS می باشد که برای پیاده سازی )اکثر پایگاه داده های عملیاتی بکار می
روند.Oracle, IBM DB2, MS SQL server
22/34
Data Mart
23/34
factپیاده سازی رابطه ای جدول
Sale Amount StoreKey ProductKey CalendarKey100$ 1 1 1120$ 1 2 1200$ 1 3 10 0 0 0
24/34
factپیاده سازی چندبعدی جدول
)1,1,1( → $100
25/34
OLAPدسته بندی
پردازش تحلیلی برخط چند بعدی(MOLAP)
( پردازش تحلیلی برخط رابطه ایROLAP)( پردازش تحلیلی برخط ترکیبیHOLAP)
26/34
پردازش تحلیلی برخط چند بعدیMOLAP داده را از پایگاه داده تحلیلی یا منابع
عملیاتی می گیرد.MOLAP داده را در مکعب های چند بعدی ذخیره
می کند..پیچیدگی انجام این فرآیند از دید کاربر پنهان است
کاربر تنها عملیاتOLAP استاندارد را اجرا می کند بدون دانستن اینکه چگونه مکعب ها ساخته می شوند
و چه تفاوتی با جداول رابطه ای دارند.
27/34
پردازش تحلیلی برخط چند بعدی - ادامه یکی از خصوصیات اصلیMOLAP فراهم کردن ،
تحلیل های خیلی سریع می باشد. قبل از ذخیره داده در مکعب تحلیلی، محاسبات را انجام می دهد
(pre-calculate)MOLAP محل مناسبی برای نگهداری داده های همراه
با جزئیات سطح تراکنشی نمی باشد.
“sleeping bag ‘ZZZ Bag’ was sold to the customer Tina in the store S1 on January1, 2006”
“in Q1 of 2006, 200 units of products from the camping category were sold to the customers with ‘excellent’ credit rating in Chicagoland stores”
سریع در بازیابی داده، کند در بروزرسانی مکعب
28/34
پردازش تحلیلی برخط رابطه ای ابزارهایROLAP قابلیت+ های مشابه ،OLAP را فراهم
می ک+نند.
سرورROLAP پرس+ و جو ها را به زبان SQL ترجمه می کند.
پرس و جویSQL برای پایگاه داده تحلیلی که بر روی قرار دارد فرستاده می شود.RDBMSزیر ساخت
RDBMS پرس و جو را ترجمه و نتیجه را برای سرور ROLAP می فرستد و پس از آن برای کاربر فرستاده
می شود.
29/34
پردازش تحلیلی برخط رابطه ای - ادامهROLAP محدودیتی از لحاظ اندازه پایگاه داده
و نوع تحلیلی که ممکن است اجرا شود ندارد، اما بدلیل نداشتن پیش پردازش، به اندازه ی
MOLAP.سریع نیست
MOLAP در مقابل ROLAP:Tradeoffبین کارایی و حافظه
30/34
پردازش تحلیلی برخط ترکیبیHOLAP = MOLAP + ROLAP
در رویکرد ترکیبی، می توان از پایگاه داده رابطه ایبرای ذخیره سازی حجم زیادی از داده ها استفاده کرد و از پایگاه داده چندبعدی برای ذخیره سازی داده های
تجمیع شده استفاده کرد.
31/34
Desktop OLAP
DOLAP مانند MOLAP از مکعب های چند بعدی مکعب DOLAPاستفاده می کند، با این تفاوت که در
ها توسط کاربر نهایی قابل دانلود می باشد.
مکعب های استفاده شده درDOLAP کوچکتر از می باشد.MOLAPمکعب های
استفاده از این مکب ها ساده ولی دارای قابلیت هایمحدودی می باشند.
ساده به دلیل حجم کم داده و محدود به دلیل وجودداده های ایستا
32/34
جمع بندی کارکردهایOLAP : ارائه روشی مناسب برای دسترسی
کاربران به داده ها و پشتیبانی از تصمیمات مدیران
انواعOLAP: MOLAP، ROLAP، HOLAP و DOLAP
قابلیت هایOLAP امکان تحلیل را روی داده های تجمیع شده فراهم می کند
تفاوتMOLAP و ROLAP:Tradeoffبین حافظه و کارائی
33/34
مرجع N. Jukic, B. Jukic, and M. Malliaris, “Online Analytical
Processing (OLAP) for Decision Support,” Handbook on Decision Support Systems 1, pp. 259–276, 2008.
34/34