Top Banner
نده ده ارائه: حسان عسگریان ا9/16/2016 1
39

فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

Jan 16, 2017

Download

Data & Analytics

Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

احسان عسگریان: ارائه دهنده

9/16/2016

1

Page 2: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/20162

Page 3: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/20163From the dawn of civilization until

2003, humankind generated five

exabytes of data. Now we produce

five exabytes every two days…and

the pace is accelerating.

Eric Schmidt,

Executive Chairman, Google

Page 4: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/20164

Page 5: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/20165

Page 6: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/20166

The ‘Datafication’

of our World;

• Activities

• Conversations

• Words

• Voice

• Social Media

• Browser logs

• Photos

• Videos

• Sensors

• Etc.

Volume

Variety

Velocity

Analysing

Big Data:

• Text analytics

• Sentiment analysis

• Face recognition

• Voice analytics

• Movement analytics

• Etc.

Value

Page 7: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/20167

Page 8: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/20168

Page 9: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/2016

10

Page 10: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/201611

Page 11: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/201612

Page 12: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/201613

Ambari™: A web-based tool for provisioning, managing, and monitoring Apache

Hadoop clusters which includes support for Hadoop HDFS, Hadoop MapReduce, Hive,

HCatalog, HBase, ZooKeeper, Oozie, Pig and Sqoop.

Hue : a web interface for Hadoop projects, supports many of the more widely used

components of the Hadoop ecosystem. It features file browsers for HDFS and HBase

and a job browser for MapReduce/YARN.

ZooKeeper™: is a service for coordination and synchronization of distributed systems.

Mahout™: A Scalable machine learning and data mining library.

Page 13: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/201615

Page 14: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/201616

Page 15: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/201617

Page 16: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/201618

Page 17: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/201619

Page 18: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/201620

Page 19: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/201621

Page 20: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/2016

22

Page 21: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/201623

Page 22: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/201624

مزایای پایگاه داده هایNoSql:

oسرعت بیشتر درج اطالعات

o ترراحتمقیاس پذیر و امکان گسترش

o دادهقالب های مشخص مناسب و بهینه شده برایو داده های غیرساختیافته(مقدار-گراف، کلید)

ضعف پایگاه داده های نقاطNoSql:

o های ویژگیتمام عدم پشتیبانی آنها از ACID

o براینامناسبjoinداده

o سرعت بازیابی(select ) و ایندکس )داده های نرمالل نسبت به پایگاه داده های رابطه ای بطور قاب( شده

.مالحظه پایین تر هست

o عدم پشتیبانی ازtrigger

Page 23: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/201625

https://en.wikipedia.org/wiki/NoSQL

http://nosql-database.org/

Page 24: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/2016

27

Page 25: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/201628

Page 26: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/201629

Page 27: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/201630

Page 28: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/201631

Page 29: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/201632

Page 30: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/201633

Page 31: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/201638

Page 32: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/201640

Page 33: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/2016

41

Page 34: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/201642

Page 35: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/201644

Page 36: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/201645

Page 37: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

9/16/201646

Tehran MSTT Data Warehouse (18M data per

day)

AVL6M locations a

day

BluetoothSensors

1.2M vehicles a day

SCATSlog files

2M log a day of 1400 approaches

Speed Cameras

5M vehicles a day

e-Ticket4M transactions a

day

Traffic Zone Cameras

300K vehicles a day

تولید روزانه هزاران داده الگشهرداریسیستم شهرسازی

چند میلیون دادهتولید روزانهترافیکی از منابع مختلف

ه میلیون دادصدها روزانه تولیدCDR وADSL مخابراتدر

Page 38: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

ذخیره سازی داده ها با تکنولوژی های کالن داده مناسب:هزینه باالی ایجاد و نگهداری بستر کالن داده و کمبود متخصصین در زمینه کالن دادهبایت-نیاز به گزارش روی حجم داده های پتا تکنولوژی های انباره داده و پایگاه داده های رابطه ای از قبیلOracle وSQL Serverجوابگو نیستند (مانند متن)تنوع در انواع داده ها یا داده های غیرساختیافته برخی موارد که میتواند کاربرد داشته باشد:

تراکنش های بانکیداده های داده های کارکرد مشتریان مخابرات(CDR وADSL) (موتور جستجوی پارسی جو)داده های وب (سرورها و )داده های الگ...

پردازش داده ها با تکنولوژی های کالن داده مناسب برای: تحلیل دسته ای داده ها(Batch Processing :) داده( گیگابایت)روی حجم زیاد ... یادگیری ماشین و تحلیل جریان داده ها(Stream Real-time Processing :) مواردی که تصمیم ... )تشخیص رویداد و

(لحظه ای روی داده های که با سرعت زیاد ایجاد می شوند

9/16/201647

Page 39: فناوریهای حوزهی کلان داده - Introduction to Big Data Technologies

48 9/16/2016