Top Banner
Microsoft をををををを ををををををををををををを をを をを ををををををををををををを ををををを をををををををを https://www.facebook.com/ dahatake/ https://twitter.com/ dahatake/ https://github.com/ dahatake/ https:// daiyuhatakeyama.wordpress.com/
47

ITの今とこれから public

Mar 21, 2017

Download

Technology

Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: ITの今とこれから public

https://www.facebook.com/dahatake/https://twitter.com/dahatake/https://github.com/dahatake/https://daiyuhatakeyama.wordpress.com/

Page 2: ITの今とこれから public
Page 4: ITの今とこれから public

1975 年

全ての机に家庭にコンピューターを A computer on every desk and in every home

マイクロソフト創業当時の Vision

Page 5: ITの今とこれから public
Page 6: ITの今とこれから public

大学キャンパスをイメージ 社内シャトル完備

多様な人種多様なメニューランチエリア

レドモンドの町ほとんどが

マイクロソフト

Microsoft Corporation

Page 7: ITの今とこれから public

Cloud の時代- Technology #1

Page 8: ITの今とこれから public

Physical自動運転、ロボット、 3D プリンティング、新素材

Biological 遺伝子の分析、処置、工学

DigitalIoT 、 FinTech 、破壊的ビジネスモデル

Industrie 4.0

Page 9: ITの今とこれから public

取って代わられた ( つつある ) 技術

昔 今

真空管 トランジスタ

磁気テープ 磁気ディスク

磁気ディスク フラッシュメモリ

固定電話 携帯電話

携帯電話 スマートフォン

Page 10: ITの今とこれから public

Xiaomi

Snapchat

Airbnb

CloudFlare

Uber

Average Unicorns

Tesla

Cloudera

Facebook

Google

Typical Fortune 500

0 2 4 6 8 10 12 14 16 18 20 2222

33

44

566

820

時間(年)

驚異的に短縮

スマ

ート

フォ

$499$10

2007

2015

単価

ドロ

ーン $100,000

$7002007

2013

単価

3D プ

リン

ター

$40,000$100

2007

2014

同程度の機能を実現する機器の単価

DNA

検査 $2.7BN

$10M$1,000

2000

2007

一回あたりの検査費用

2014

テクノロジーの製造コスト ビジネスが 10 億ドル規模に拡大するまでに要する時間

Source: World Economic Forum

10

Page 11: ITの今とこれから public

全て Cloudを利用している

Page 12: ITの今とこれから public

PaaS の価値• IaaS から、 PaaS へ移行した顧客へのインタビューをも

とにした金銭的かつビジネス上のメリット

Based on five-year, risk-adjusted figures for a composite organization constructed from aggregated interviews with eight Microsoft Azure IaaS customers.Source: “The Total Economic Impact Of Microsoft Azure PaaS,” a commissioned study conducted by Forrester Consulting, June 2016

466%ROI

$5.91M Net Present

Value( 現在価値 )

80% 時間の削減

50% 市場投入の早さ

Page 13: ITの今とこれから public

計算能力、集積度の向上

Intel 4004 (740 KHz) 0.092MIPS Intel Core i7 5960x (3.0GHz) 298,190 MIPS

1971 年 2014 年

324 万個 =

Page 14: ITの今とこれから public

無意識の世界へ• 劇的な低価格化が進むデータ保有コスト

http://www.mkomo.com/cost-per-gigabyte

Page 15: ITの今とこれから public

無尽蔵のコンピューティングとストレージ

を手に入れられる

そのデバイスがクラウドと接続する

と…

Page 16: ITの今とこれから public

IoT の中でのクラウド組込み機器、人⇔送受信⇔蓄積、表示、分析、活用PaaS をビルディングブロックで組み合わせ、構築

Microsoft Azure

デバイス接続サービス

データ実時間分析サービス

ML

ダッシュボード

サービス連携

データ・サービスを第三者へ売る

PC ・タブレット・スマホ

開発・運用コスト低スケール可能!!

ストレージ

Page 17: ITの今とこれから public

Big Data Evolution

Batch

Real Time

Predictive

Page 18: ITの今とこれから public

OLTP

ERP LOB

… ETL Tool(SSIS, etc…)

Extract Transform Load

Original data

Transformed data

EDW BI Tools

Data Marts

Data Lake(s)

Dashboards

Apps

Original data

Ingest

Scale-out storage & compute(HDFS, Blob Storage, etc)

(SQL Server, Teradata, etc)

Streaming data

Transform and Load

データ処理。これまで と 今

Page 19: ITの今とこれから public

2011 年 1 年間に追加された

サーバー台数。今では 1 日で追加する

サーバー台数とおんなじ。

Page 20: ITの今とこれから public

AI / 機械学習- Technology #2

Page 21: ITの今とこれから public

AI の民主化

Page 22: ITの今とこれから public

データの中のパターンを、

コンピューター自身に探させる (= 学習させ

る )

人がデータ ( 答え ) を

教えてあげる

Page 23: ITの今とこれから public

天気 気温 風 試合をしたか ?

Sunny Low Yes PlaySunny High Yes No PlaySunny High No No Play

Overcast Low Yes PlayOvercast High No PlayOvercast Low No Play

Rainy Low Yes No PlayRainy Low No Play

Sunny

Low No ?

試合があると思いますか ?

Page 24: ITの今とこれから public

天気 気温 風 試合をしたか ?

Sunny Low Yes PlaySunny High Yes No PlaySunny High No No Play

Overcast Low Yes PlayOvercast High No PlayOvercast Low No Play

Rainy Low Yes No PlayRainy Low No Play

Sunny

Low No ?

どういうロジック / アルゴリズムで ? “Label”

データ ( 答え ) がある !

“Feature”列の事。データの特徴を

表す

Page 25: ITの今とこれから public

可視化してくれるツールがある !Two-Crass Boosted Decision Treeというアルゴリズムを選択した

場合…

どの Feature が何の Value だったら妥当なのかを作ってくれる !複数の Model を

作ってくれる !( 個数の指定が可

能 )

Training

Page 26: ITの今とこれから public

どのアルゴリズムを使って、モデルを作ってみればいいか

見当もつかない !

Page 27: ITの今とこれから public

チートシートがある !アルゴリズム を決める目安…(http://aka.ms/MLCheatSheet)

クラスタリング

「“ 500K” から上か下か ?」

つまり…

2 つに「分類」するので…

Page 28: ITの今とこれから public

実データと機械学習の結果と、比較ができる !

Scoring

データ分割後の、件数

機械学習の結果

Page 29: ITの今とこれから public

更新されたモデルの評価を可視化 !2 つのアルゴリズムの比較も !

Page 30: ITの今とこれから public

どんなデータでも答えを出してくれるの ?

Page 31: ITの今とこれから public

天気 気温 風 場所 試合をしたか ?

Sunny 25 Yes さいたま PlaySunny 27 Yes さいたま PlaySunny High 10 東京 No Play

Overcast 5 Yes 千葉 No PlayRainy Low No 神奈川 No Play

ちなみに、こういうデータもある… .

Page 32: ITの今とこれから public

コンピューターが処理しやすいデータの準備

Training Data

Features Target Value

Data Preprocessing Module(s)

データ処理のためのモジュール

1) Raw Data

ロード2) トレーニング用のデータ

作成

Data 2

Data 1

Data N

. . .

10001101001111011111

0110

Page 33: ITの今とこれから public

Deep Learning って、何が違うの ?

Page 34: ITの今とこれから public

2010 2011 2012 2013 2014 201565%

70%

75%

80%

85%

90%

95%

100%

72%74%

84%

88%

93%

96%

GPU

11/2013 6/2014 12/2014 7/2015 1/201665%

70%

75%

80%

85%

90%

95%

100%

Accu

racy

7/2015

8/2015

9/2015

10/2015

11/2015

12/201530%

40%

50%

60%

70%

80%

90%

100%

39%45%

55%

62%66%72%

75%79%

83%86%88%Top Score

Image RecognitionIMAGENET

Pedestrian Detection(歩行者の検出 )

CALTECH

Object DetectionKITTI

Deep Learning の進化

Page 35: ITの今とこれから public

機械学習 Deep Learning 深層強化学習

画像解析

音声解析

データ分類異常検知 , 顧客グルーピング

数値予測売上予測 , 需要予測 , 品質管理

ラベル分類不良品分析 , 故障予測 , チャーン分析

機械学習より強力な分析

自律学習型ロボット

自動運転車

テキストや画像等の自動生成

活用例

主に多層のニューラルネットワークを用いた手法での分析分析のためには、莫大なデータ量、計算量、知識・スキルを要する

統計に基づいた手法での分析そのため、比較的少ないデータ量と計算量で分析を行うことができる

定義したあるべき姿に従い試行錯誤をして自ら学習を行うための分析手法である強化学習と、深層学習を組み合わせた分析

Azure Machine Learning Cognitive Toolkit / GPU Instance (N-Series)マイクロソフトが提供する技術

若干異なる、機械学習の世界

Page 36: ITの今とこれから public

Deep Learning画像解析 , 音声認識 , 自動生成

機械学習ラベル分類 , 数値予測 , データ分類

深層強化学習自立学習型ロボット自動運転車

アルゴリズム別学習の種類

Page 37: ITの今とこれから public

Language

Speech

Search

Machine Learning

Knowledge Vision

Spell check

Speech API Entity linking

Recommendation API

Bing autosuggest

Computer vision

Emotion

Forecasting

Text to speech

Thumbnail generation

Anomalydetection

Custom recognition (CRIS)

Bing image search

Web language model

Customer feedback analysis

Academic knowledge

OCR, tagging, captioning

Sentiment scoring

Bingnews search

Bingweb search

Text analyticsCognitive Services APIs

Page 38: ITの今とこれから public

開発の現場への機械学習のインパクト

Page 39: ITの今とこれから public

アルゴリズム• 職人による新規性、進歩性を競える職人 (?) の世界

処理

入力 出力

アルゴリズムとして実装

Page 40: ITの今とこれから public

機械学習• 入力と教師データとしての出力のデータ

モデルの構築はデータ任せ

処理

機械学習によるモデル化

アルゴリズムの実装ではなく、適切なデータの選択とクレンジング、学習アルゴリズムの選択とチューニング、そして試行錯誤

入力 出力

Page 41: ITの今とこれから public

変わる開発コストのバランス

アルゴリズム プログラム

データ 機械学習

• 高額なコンピューターリソース• 草創期における人材の流入• 限られたデータ• 限られた相互運用

Page 42: ITの今とこれから public

無限のコンピューターリソースクラウドサービスにより、コンピュテーションコスト、リソースはもはや問題ではない

アルゴリズム プログラム

データ機械学習

Page 43: ITの今とこれから public

まとめ

Page 44: ITの今とこれから public

データはビジネスを動かす 新しい原動力になる

Page 45: ITの今とこれから public

Microsoft missionEmpower every person andevery organization on theplanet to achieve more

“ 地球上のすべての個人とすべての組織が より多くのことを達成できるようにする”

Page 46: ITの今とこれから public

Information Technology

Every Business and Organization

Software Engineer Data Scientist

You

Business Architect

Page 47: ITの今とこれから public

© 2016 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries.

The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation.

MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION.