YOU ARE DOWNLOADING DOCUMENT

Please tick the box to continue:

Transcript
Page 1: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

2017 - Madrid

Overview of Azure Data FactoryCarlos SacristánData & Analytics Solution Architect, Kabel

#GIBMad2017

Page 2: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

Who am I?

Carlos SacristánData & Analytics Solution Architect, Kabel

[email protected]

https://twitter.com/sacrisql

+34 649 425 928

https://www.linkedin.com/in/csacristan/

#GIBMad2017

Page 3: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

Agenda

#GIBMad2017

Page 4: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

#GIBMad2017

Page 5: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

What is Azure Data Factory

ADF is a cloud-based data integration service that

orchestrates and automatesthe movement and transformation of data

Think of it like a manufacturing factory running equipment to take the raw materials and transform them into finished goods

#GIBMad2017

Page 6: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

What is ADF

Mmmm… but we already have things like Integration Services or Stream Analytics

#GIBMad2017

Page 7: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

#GIBMad2017

Page 8: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

Two words…

#GIBMad2017

Page 9: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

Evolving approaches to analytics

#GIBMad2017

Page 10: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

#GIBMad2017

Page 11: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

Just four concepts

#GIBMad2017

Page 12: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

Linked Services

#GIBMad2017

Page 13: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

Datasets

#GIBMad2017

Page 14: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

Activities

Page 15: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

Pipelines

#GIBMad2017

Page 16: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

Just one thing. Scheduling

Pipeline Active Periods

Activity Schedule

Dataset Availability

#GIBMad2017

Page 17: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

Just one thing. Scheduling

#GIBMad2017

Page 18: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

So, recap: when is executed an Activity?

#GIBMad2017

Page 19: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

#GIBMad2017

Page 20: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

Process large-scaled datasets with ADF and Azure Batch

Page 21: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

Customer Churn

Azure Blob Storage

Game Log Files

Customer Table

On Premises

Data Mart

Game Logs

Customer Table

Azure DB

Customer

Game Usage

Visualize

Data Set(Collection of files, DB table, etc)

Activity: a processing step (Hadoop job, custom code, ML model, etc)

Pipeline: a sequence of activities (logical group)

Data Sources Ingest Transform & Analyze Publish

Customer

TableGeocode

Transform, Combine, etc Analyze Move

#GIBMad2017

Page 22: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

Microsoft Ignite

Thanks!

#GIBMad2017


Related Documents