Microsoft をををををを ををををををををををををを をを をを ををををををををををををを ををををを をををををををを https://www.facebook.com/ dahatake/ https://twitter.com/ dahatake/ https://github.com/ dahatake/ https:// daiyuhatakeyama.wordpress.com/
https://www.facebook.com/dahatake/https://twitter.com/dahatake/https://github.com/dahatake/https://daiyuhatakeyama.wordpress.com/
1975 年
全ての机に家庭にコンピューターを A computer on every desk and in every home
マイクロソフト創業当時の Vision
大学キャンパスをイメージ 社内シャトル完備
多様な人種多様なメニューランチエリア
レドモンドの町ほとんどが
マイクロソフト
Microsoft Corporation
Cloud の時代- Technology #1
Physical自動運転、ロボット、 3D プリンティング、新素材
Biological 遺伝子の分析、処置、工学
DigitalIoT 、 FinTech 、破壊的ビジネスモデル
Industrie 4.0
取って代わられた ( つつある ) 技術
昔 今
真空管 トランジスタ
磁気テープ 磁気ディスク
磁気ディスク フラッシュメモリ
固定電話 携帯電話
携帯電話 スマートフォン
Xiaomi
Snapchat
Airbnb
CloudFlare
Uber
Average Unicorns
Tesla
Cloudera
Typical Fortune 500
0 2 4 6 8 10 12 14 16 18 20 2222
33
44
566
820
時間(年)
驚異的に短縮
スマ
ート
フォ
ン
$499$10
2007
2015
単価
ドロ
ーン $100,000
$7002007
2013
単価
3D プ
リン
ター
$40,000$100
2007
2014
同程度の機能を実現する機器の単価
DNA
検査 $2.7BN
$10M$1,000
2000
2007
一回あたりの検査費用
2014
テクノロジーの製造コスト ビジネスが 10 億ドル規模に拡大するまでに要する時間
Source: World Economic Forum
10
全て Cloudを利用している
PaaS の価値• IaaS から、 PaaS へ移行した顧客へのインタビューをも
とにした金銭的かつビジネス上のメリット
Based on five-year, risk-adjusted figures for a composite organization constructed from aggregated interviews with eight Microsoft Azure IaaS customers.Source: “The Total Economic Impact Of Microsoft Azure PaaS,” a commissioned study conducted by Forrester Consulting, June 2016
466%ROI
$5.91M Net Present
Value( 現在価値 )
80% 時間の削減
50% 市場投入の早さ
計算能力、集積度の向上
Intel 4004 (740 KHz) 0.092MIPS Intel Core i7 5960x (3.0GHz) 298,190 MIPS
1971 年 2014 年
324 万個 =
無意識の世界へ• 劇的な低価格化が進むデータ保有コスト
http://www.mkomo.com/cost-per-gigabyte
無尽蔵のコンピューティングとストレージ
を手に入れられる
そのデバイスがクラウドと接続する
と…
IoT の中でのクラウド組込み機器、人⇔送受信⇔蓄積、表示、分析、活用PaaS をビルディングブロックで組み合わせ、構築
Microsoft Azure
デバイス接続サービス
データ実時間分析サービス
ML
ダッシュボード
サービス連携
データ・サービスを第三者へ売る
PC ・タブレット・スマホ
開発・運用コスト低スケール可能!!
ストレージ
Big Data Evolution
Batch
Real Time
Predictive
OLTP
ERP LOB
… ETL Tool(SSIS, etc…)
Extract Transform Load
Original data
Transformed data
EDW BI Tools
Data Marts
Data Lake(s)
Dashboards
Apps
Original data
Ingest
Scale-out storage & compute(HDFS, Blob Storage, etc)
(SQL Server, Teradata, etc)
Streaming data
Transform and Load
データ処理。これまで と 今
2011 年 1 年間に追加された
サーバー台数。今では 1 日で追加する
サーバー台数とおんなじ。
AI / 機械学習- Technology #2
AI の民主化
データの中のパターンを、
コンピューター自身に探させる (= 学習させ
る )
人がデータ ( 答え ) を
教えてあげる
天気 気温 風 試合をしたか ?
Sunny Low Yes PlaySunny High Yes No PlaySunny High No No Play
Overcast Low Yes PlayOvercast High No PlayOvercast Low No Play
Rainy Low Yes No PlayRainy Low No Play
Sunny
Low No ?
試合があると思いますか ?
天気 気温 風 試合をしたか ?
Sunny Low Yes PlaySunny High Yes No PlaySunny High No No Play
Overcast Low Yes PlayOvercast High No PlayOvercast Low No Play
Rainy Low Yes No PlayRainy Low No Play
Sunny
Low No ?
どういうロジック / アルゴリズムで ? “Label”
データ ( 答え ) がある !
“Feature”列の事。データの特徴を
表す
可視化してくれるツールがある !Two-Crass Boosted Decision Treeというアルゴリズムを選択した
場合…
どの Feature が何の Value だったら妥当なのかを作ってくれる !複数の Model を
作ってくれる !( 個数の指定が可
能 )
Training
どのアルゴリズムを使って、モデルを作ってみればいいか
見当もつかない !
チートシートがある !アルゴリズム を決める目安…(http://aka.ms/MLCheatSheet)
クラスタリング
「“ 500K” から上か下か ?」
つまり…
2 つに「分類」するので…
実データと機械学習の結果と、比較ができる !
Scoring
データ分割後の、件数
機械学習の結果
更新されたモデルの評価を可視化 !2 つのアルゴリズムの比較も !
どんなデータでも答えを出してくれるの ?
天気 気温 風 場所 試合をしたか ?
Sunny 25 Yes さいたま PlaySunny 27 Yes さいたま PlaySunny High 10 東京 No Play
Overcast 5 Yes 千葉 No PlayRainy Low No 神奈川 No Play
ちなみに、こういうデータもある… .
コンピューターが処理しやすいデータの準備
Training Data
Features Target Value
Data Preprocessing Module(s)
データ処理のためのモジュール
1) Raw Data
ロード2) トレーニング用のデータ
作成
Data 2
Data 1
Data N
. . .
10001101001111011111
0110
Deep Learning って、何が違うの ?
2010 2011 2012 2013 2014 201565%
70%
75%
80%
85%
90%
95%
100%
72%74%
84%
88%
93%
96%
GPU
11/2013 6/2014 12/2014 7/2015 1/201665%
70%
75%
80%
85%
90%
95%
100%
Accu
racy
7/2015
8/2015
9/2015
10/2015
11/2015
12/201530%
40%
50%
60%
70%
80%
90%
100%
39%45%
55%
62%66%72%
75%79%
83%86%88%Top Score
Image RecognitionIMAGENET
Pedestrian Detection(歩行者の検出 )
CALTECH
Object DetectionKITTI
Deep Learning の進化
機械学習 Deep Learning 深層強化学習
画像解析
音声解析
データ分類異常検知 , 顧客グルーピング
数値予測売上予測 , 需要予測 , 品質管理
ラベル分類不良品分析 , 故障予測 , チャーン分析
機械学習より強力な分析
自律学習型ロボット
自動運転車
テキストや画像等の自動生成
活用例
主に多層のニューラルネットワークを用いた手法での分析分析のためには、莫大なデータ量、計算量、知識・スキルを要する
統計に基づいた手法での分析そのため、比較的少ないデータ量と計算量で分析を行うことができる
定義したあるべき姿に従い試行錯誤をして自ら学習を行うための分析手法である強化学習と、深層学習を組み合わせた分析
Azure Machine Learning Cognitive Toolkit / GPU Instance (N-Series)マイクロソフトが提供する技術
若干異なる、機械学習の世界
Deep Learning画像解析 , 音声認識 , 自動生成
機械学習ラベル分類 , 数値予測 , データ分類
深層強化学習自立学習型ロボット自動運転車
アルゴリズム別学習の種類
Language
Speech
Search
Machine Learning
Knowledge Vision
Spell check
Speech API Entity linking
Recommendation API
Bing autosuggest
Computer vision
Emotion
Forecasting
Text to speech
Thumbnail generation
Anomalydetection
Custom recognition (CRIS)
Bing image search
Web language model
Customer feedback analysis
Academic knowledge
OCR, tagging, captioning
Sentiment scoring
Bingnews search
Bingweb search
Text analyticsCognitive Services APIs
開発の現場への機械学習のインパクト
アルゴリズム• 職人による新規性、進歩性を競える職人 (?) の世界
処理
入力 出力
アルゴリズムとして実装
機械学習• 入力と教師データとしての出力のデータ
モデルの構築はデータ任せ
処理
機械学習によるモデル化
アルゴリズムの実装ではなく、適切なデータの選択とクレンジング、学習アルゴリズムの選択とチューニング、そして試行錯誤
入力 出力
変わる開発コストのバランス
アルゴリズム プログラム
データ 機械学習
• 高額なコンピューターリソース• 草創期における人材の流入• 限られたデータ• 限られた相互運用
無限のコンピューターリソースクラウドサービスにより、コンピュテーションコスト、リソースはもはや問題ではない
アルゴリズム プログラム
データ機械学習
まとめ
データはビジネスを動かす 新しい原動力になる
Microsoft missionEmpower every person andevery organization on theplanet to achieve more
“ 地球上のすべての個人とすべての組織が より多くのことを達成できるようにする”
Information Technology
Every Business and Organization
Software Engineer Data Scientist
You
Business Architect
© 2016 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries.
The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation.
MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION.