Top Banner
Sascha Dittmann Software Developer / Solution Architect Twitter: @SaschaDittmann Blog: http://www.sascha-dittmann.de *
11

Sascha Dittmann, Ernst & Young: Big Data in der Cloud

Nov 29, 2014

Download

Technology

Cloudcamp

Lightning Talk anlässlich des zweiten CloudCamp Frankfurt am 24.5.2012 in der Brotfabrik in Hausen.
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Sascha Dittmann, Ernst & Young: Big Data in der Cloud

Sascha Dittmann Software Developer / Solution Architect

Twitter: @SaschaDittmann

Blog: http://www.sascha-dittmann.de

*

Page 2: Sascha Dittmann, Ernst & Young: Big Data in der Cloud

*

*Seit über 13 Jahren:

*Software Developer

*Solution Architect

*Seit über 7 Jahren:

*Trainer für technische Trainings

*Sprecher auf Konferenzen

* IT Consulting

Page 3: Sascha Dittmann, Ernst & Young: Big Data in der Cloud

*

180.000.000.000.000.000.000

1.800.000.000.000.000.000.000

Page 4: Sascha Dittmann, Ernst & Young: Big Data in der Cloud

*

180.000.000.000.000.000.000

= 0,18 ZB (Zettabytes) - Stand 2006

1.800.000.000.000.000.000.000

= 1,8 ZB (Zettabytes) - Stand 2011

Quelle: IDC – Analyze the Future

Page 5: Sascha Dittmann, Ernst & Young: Big Data in der Cloud

*Vertikale Skalierung Horizontale Skalierung

Page 6: Sascha Dittmann, Ernst & Young: Big Data in der Cloud

*

Atomicy

Consistecy

Isolation

Durabilty

Basically

Available

Soft State

Eventually Consistent

Page 7: Sascha Dittmann, Ernst & Young: Big Data in der Cloud

*

Page 8: Sascha Dittmann, Ernst & Young: Big Data in der Cloud

*

Map

Sort

Shuffle

DataNode

Map

Sort

Shuffle

DataNode

Map

Sort

Shuffle

DataNode

Reduce

0067011990999991950051507004+68750

0043011990999991950051512004+68750

0043011990999991950051518004+68750

0043012650999991949032412004+62300

0043012650999991949032418004+62300

1949,0

1950,22

1950,55

1952,-11

1950,33

1949,0

1950,[22,33,55]

1952,-11

1949,0

1950,55

1952,-11

Page 9: Sascha Dittmann, Ernst & Young: Big Data in der Cloud

*

Map

Combine

Sort

Shuffle

DataNode

Map

Combine

Sort

Shuffle

DataNode

Map

Combine

Sort

Shuffle

DataNode

Reduce

0067011990999991950051507004+68750

0043011990999991950051512004+68750

0043011990999991950051518004+68750

0043012650999991949032412004+62300

0043012650999991949032418004+62300

1949,0

1950,22

1950,55

1952,-11

1950,33

1949,0

1950,55

1952,-11

1950,33

1949,0

1950,[33,55]

1952,-11

1949,0

1950,55

1952,-11

Page 10: Sascha Dittmann, Ernst & Young: Big Data in der Cloud

*

RDBMS Map/Reduce

Datenmenge Gigabytes Petabytes

Zugriff Interaktiv und Batch Batch

Lese- / Schreibzugriffe Viele Lese- und

Schreibzugriffe

Einmaliges Schreiben

Viele Lesezugriffe

Datenstruktur Statisches Schema Dynamisches Schema

Datenintegrität Hoch Niedrig

Skalierverhalten Nicht-Linear Linear

Page 11: Sascha Dittmann, Ernst & Young: Big Data in der Cloud

*