Top Banner
2017 - Madrid Overview of Azure Data Factory Carlos Sacristán Data & Analytics Solution Architect, Kabel #GIBMad2017
22

Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

Apr 11, 2017

Download

Technology

Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

2017 - Madrid

Overview of Azure Data FactoryCarlos SacristánData & Analytics Solution Architect, Kabel

#GIBMad2017

Page 2: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

Who am I?

Carlos SacristánData & Analytics Solution Architect, Kabel

[email protected]

https://twitter.com/sacrisql

+34 649 425 928

https://www.linkedin.com/in/csacristan/

#GIBMad2017

Page 3: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

Agenda

#GIBMad2017

Page 4: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

#GIBMad2017

Page 5: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

What is Azure Data Factory

ADF is a cloud-based data integration service that

orchestrates and automatesthe movement and transformation of data

Think of it like a manufacturing factory running equipment to take the raw materials and transform them into finished goods

#GIBMad2017

Page 6: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

What is ADF

Mmmm… but we already have things like Integration Services or Stream Analytics

#GIBMad2017

Page 7: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

#GIBMad2017

Page 8: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

Two words…

#GIBMad2017

Page 9: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

Evolving approaches to analytics

#GIBMad2017

Page 10: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

#GIBMad2017

Page 11: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

Just four concepts

#GIBMad2017

Page 12: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

Linked Services

#GIBMad2017

Page 13: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

Datasets

#GIBMad2017

Page 14: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

Activities

Page 15: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

Pipelines

#GIBMad2017

Page 16: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

Just one thing. Scheduling

Pipeline Active Periods

Activity Schedule

Dataset Availability

#GIBMad2017

Page 17: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

Just one thing. Scheduling

#GIBMad2017

Page 18: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

So, recap: when is executed an Activity?

#GIBMad2017

Page 19: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

#GIBMad2017

Page 20: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

Process large-scaled datasets with ADF and Azure Batch

Page 21: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

Customer Churn

Azure Blob Storage

Game Log Files

Customer Table

On Premises

Data Mart

Game Logs

Customer Table

Azure DB

Customer

Game Usage

Visualize

Data Set(Collection of files, DB table, etc)

Activity: a processing step (Hadoop job, custom code, ML model, etc)

Pipeline: a sequence of activities (logical group)

Data Sources Ingest Transform & Analyze Publish

Customer

TableGeocode

Transform, Combine, etc Analyze Move

#GIBMad2017

Page 22: Un orquestador en la nube: Azure Data Factory (por Carlos Sacristán)

Microsoft Ignite

Thanks!

#GIBMad2017