第4回 Machine Learning 15minutes! Industry Deep Learning 2016.9.24版 XCompass Intelligence Ltd. 代表取締役社長 佐藤 聡
第4回 Machine Learning 15minutes!
Industry Deep Learning
2016.9.24版
XCompass Intelligence Ltd.代表取締役社長 佐藤 聡
会社概要
株式会社クロスコンパス・インテリジェンスXCompass Intelligence Ltd.
〒108-0014 東京都港区芝5-29-18 NBC三田ビル 7F
TEL: 050-3640-7621URL: http://www.xcompass.com
株式会社クロスコンパスXCompass Ltd.
2011年10月創業・東工大発ベンチャー
より新設分割により2015年4月10日分社化
千代田区九段北1丁目14−17 AMINAKA九段ビル
XCompassの‘X’
会社概要:事業
2014中頃から現在まで、「ディープラーニング ベンチャー」「ディープラーニング 会社」「人工知能 ベンチャー」「人工知能 会社」
でGoogleキーワード検索するとトップに表示。SEOは全く実施していません。
A:収入確保・知見の蓄積有償
B:本来目的自己資金
A:収入確保・知見の蓄積
B:本来目的
A:収入確保・知見の蓄積
B:本来目的
進むべき方向
述べ件数:70件以上(増加中)会社数:25社以上(増加中)カレント:5件程度既存
1. 企業向けDLパイロットプロジェクト実施2. 企業向けDL研究開発3. 企業向けAIコンサルティング
「今、人工知能(AI)をすぐにでも活用したい企業の“駆け込み寺”になっているベンチャー企業がある。ディープラーニングによるデータ分析技術を専門に手掛けるクロスコンパス・インテリジェンス(本社東京、以下XCI)だ。」日経テクノロジー 2016年2月号
1. AIプラットフォーム構築2. 新NNWアルゴリズム開発
8
Deep Learningを用いると、NNWにデータを入力するだけで、自動的にそのデータの構造や属性、特徴を学習することができる。学習によって、画像に写っている「もの」が識別できたり、商品の売上を予測できるなどの能力を獲得することができる。このようなNNWを「学習済みNNW」と呼ぶ。学習済みNNWは離散化した情報の羅列を知識や知恵に結実させた暗黙知と捉えられ、アプリケーション(用途)別に学習済みNNWを様々な形で実装することで、インテリジェントなプラットフォームを構築できる。(Intelligene eXchange(=IX)開発中)
写真に写っているものがなんなのか知り
たい
「学習済みNNW」
一般物体認識可能なNNW構造の作成・選択
わからない??まだ知識はなく、識別はできない
犬かも!
様々なデバイスに搭載
コンピュータサーバ(cloud)
パソコン(office)
スマートフォン(personal)
組込みデバイス(device)
CHIP
ニーズ NNW構築ノウハウ データ 知識・知恵 動作プラットフォーム
「NNWテンプレート」
犬と猫の画像
沢山の動物の画像を学習
ニューラルネットによる機械学習(Deep)ニューラルネットによる課題解決
9
人工知能をツールとした、新しいプラットフォームビジネス
「実用的なNNWテンプレート」、「学習済みNNW」、「処理フロー」「学習用データ」を流通させるためのプラットフォーム
Intelligence eXchange{略称: IX}
※商標登録申請中
「実用的なNNWテンプレート」「学習済みNNW」「処理フロー」「学習用データ」が流通する市場(Market Place)は存在しない。このような市場ができると...人工知能・ビッグデータがビジネスとして成立する。
10
Core-IX
基本アルゴリズム(画像認識・動画認識・音声認識・自然言語処理・時系列
データ処理・その他)・Intelligence流通プラットフォーム・データ流通プラットフォ
ーム
Marketing-IX販売予測・ユーザ行動予測・商圏分析・その他
Service-IX
エンターテインメント応用・WebAPI・その他
Manufacturing-IX
工場自動化・異常検知・予知保全・自動運転・自
動設計・その他
Medical-IX
創薬・医療画像診断・疾病予測・その他
Security-IX
侵入検知・不正サイト診断・不正アクセス検査・監
視カメラ・その他
Construction-IX
自動設計・防災・減災(耐震・制振)・その他
Agri-IX
生産工場・最適環境制御・その他
Resource-IX
電力最適消費・太陽光発電予測・リモートセンシン
グ・その他
Express-IX
経路最適化・地形任意式・燃料最適化・地図作
製・その他
Education-IX
学習支援・自動翻訳・その他
Defence-IX
防衛
Specialist-IX
判例検索・分類・その他
HumanResource-IX
最適チーム予測・人事評価・退職予測・退学予測・
スキル予測・その他
Financial-IX
株価予測・与信・各種金融指標予測・その他
Core-IXとNode-IX 異常検知・予知保全
11
Manufacturing
リアルタイム性:ネットワーク輻輳を回避しつつ、高サンプリングレートでの処理
省電力:多数の装置に対応、熱対策(冷却ファンはNG)等
安定性:処理時間が一定(H/W制御絡み)
分かりやすさ:ニューラルネットや機械学習の専門ではない
業種特化型UIと専用デバイスによる処理
12
Manufacturing-IX
製造業の現場(工場等)の作業者に利用してもらうため、分かりやすい言葉で構成したWebベースUIと、出来る限り自動化された学習機構を提供し、AI利用のラストワンマイルを埋める。
XXXX-IXのXXXX部分が何であれ、利用者にとってのわかりやすさと、簡単に使える利便性を提供することで、各産業でのAIプラットフォーム活用を広めていく。
13
製造業での応用
数値データを利用した異常検知
装置 センサー 時系列数値データ
特徴量と判別式
手作り
異常正常
データ数
特徴量から算出したエラー値
曖昧な領域
閾値
閾値をここに設定する場合、より多くの異常が検出されるが、虚報(正常な状態を異常と判定)が増えるが、異常を減らすためこちらにすることが普通。
閾値をここに設定する場合、虚報(正常な状態を異常と判定)は減るが、検出されない異常が増える。
多数の機器に設置したセンサーから出力されたデータ、それぞれに対する適切なモデリングは困難。比較的単純な閾値判定を「手作り」で作成し対応。異常品を減らすために、虚報(正常を異常と判定)が多くなるよう
な閾値設定にせざるを得ない。検査工数が増えて生産性低下する上に、異常が検出できない場合も発生。
14
製造業での応用
時系列数値データを利用した異常検知
装置 センサー 時系列数値データ
Deep Learningによる特徴量抽出
エラー値が正常と異常で上手く分離され、虚報が減少 異常パターンの検出率が増加し、今まで検出できなかった異常を検出
AutoEncoder:固定長、または正規化可能な可変長データで、正常が圧倒的に多く、異常が少ない場合。正常なパターンのみを学習し、正常なパターンを再現可能な特徴量を抽出する。異常なパターンが入力された場合、異常パターンの特徴量は学習していないため、異常パターンを再現することができない。再現されたデータの類似度で異常判定を行う。
LSTM:可変長の時系列データを用いる必要がある場合。時系列データの特徴量を抽出し、次にどのような波形が生じるか予測する。予測されたデータと実際のデータの差分で異常判定を行う。
NNW+Softmax:異常が観測されており、教師データとして利用できる場合。各異常パターンと正常パターンを識別させるようにNNWを学習し、それぞれのパターンの確率を出力する。
15
製造業での応用
音響、振動解析組み立て済みの機器の検品時に、機器の動作音をベテランが判断して異常検知している。属人性が高くスケールが困難である。長い経験により習得した技能であり、継承が困難。高齢化によって高周波成分の聞き取り能力が低下=>検知性能の低下が疑われるが、客観的な判断手段がないため対応が難しい。
正常
異常
装置 耳(官能検査) 判定
正常
異常
真値
検査で発見できなかった異常• エラーの作りこみ(一部の部品を抜いたり)を行い実験
• 納入先で異常発生し返品• 等
経験、老化
• 高い音が聞こえ難い• 周波数分解能低下• 時間分解能低下
16
製造業での応用
音響、振動解析
装置
正常
異常
センサー 数値データ 入力データ
前処理
Deep Learningによる特徴量抽出
人間が作成した教師データによる学習(間違っているものが含まれる) 人間の聴覚の弱点(マスキング・高周波数の聴力低下)を補完 人間が発見できなかった異常を検知
CNN(Convolutional Neural Network):見てわかる(わかりそう)な問題の場合。画像識別問題などで改善が進んでいる。データの視覚化を行った後にCNNという組み合わせは多くのケースで良い成績を記録。人間が見ても分からない問題も分離できたケースもある。
Wikipediaより
17
製造業での応用
時系列データ解析
化学プラントにおける生産効率最適化に有効なパラメータが不明。ベテランの勘と経験とコツ(3K)で対応している。極端にうまくいく場合があるが原因が不明。
工程1薬品A投入
工程2加熱
工程3薬品B投入
製品
気温や気圧等、材料の品質等で判断
加熱時間加熱温度等
投入タイミング投入量等
投入タイミング投入量等
製品
ばらつき• 投入した薬品が製品になる割合
• 品質
18
製造業での応用
工程1薬品A投入
工程2加熱
工程3薬品B投入
製品加熱時間加熱温度等
投入タイミング投入量等
投入タイミング投入量等
製品
出力
1)各工程のセンサーデータを入力として製品の生成量、品質を出力するモデルを学習
2)各工程のデータを調整した場合の製品の生成量、品質を調査し相関のあるパラメータを特定。 3)それまで有効であると思われていたパラメータよ
りも製品生産量に重要なパラメータを発見。
NNW
NTT Communications様のプレスリリース(2016/9/15)人工知能(AI)を用いて、化学プラントの製造過程で製品の品質予測に成功〜ディープラーニングによるモデル化で、20分先の未来の製品品質を高精度で予測〜http://www.ntt.com/about-us/press-releases/news/article/2016/20160915.html
19
コアパートナーの工場
Node-IXの具体例:Manufacturing-IXの場合(ルネサス・エレクトロニクス様との取組み)
画像認識・音声認識・自然言語処理・時系列データ処理・記憶・
群知能・創発
Core-IX
工場自動化・故障検知・故障予知・自動走行・センサ解析・
その他
Manufacturing-IX
Core-Partner
共同で、社内工場機器の故障検知等、産業に特有の課題解決
「学習済みNNW」
NNW構造の決
定
学習
検討
「NNWテンプレート」
Core-Partnerのパートナー(Satellite-Partner)のみが参加するIX
SaaS/IaaS/PaaS/専用HWとしてNNWテンプレート・学習済みNNW・学
習環境を提供
Satellite-IX
FAビッグデータ
SP
SP
SP
SP
SP
Device/CHIP開発
1. 戦略パートナー(Core-Partner)とXCIがCore-Partnerの工場で共同実験し、有効な学習済みNNWとNNWテンプレートを作成。
2. SaaS/IaaS/PaaS/専用HW等を通してCore-Partnerのパートナー(Satellite-Partner)に学習済みNNW・NNWテンプレートを展開。
3. Satellite-Partnerが新たな学習済みNNW/NNWテンプレートを作成。4. 手法を含めて、学習済みNNW・NNWテンプレートをコミュニティ内で共有。
※SP=Satellite-Partner
戦略パートナー(Core-Partner)一号として、ルネサス・エレクトロニクス様と協業ソリューションの一部として組込みデバイス上で動作するAIの開発および提供
AutoEncoderを用いた異常検知 LSTMを用いた時系列データ解析 CNNを用いた音響データ(振動センサデータ)解析
弊社+お客様 弊社担当(一部お客様)2:探索フェーズ
• データ収集(お客様)・確認・調査• データ精査結果を元にした目標修正• 解析/処理手法検討・選定
学習手法の選択 ニューラルネットワーク構造の決定 利用ライブラリ選定 その他検討事項
期間:FROM〜TO
3:実験・実装
• 機能実装と実験の反復1. 教師なし学習2. 教師あり学習3. その他学習方法
• ***に中間報告• 技術報告レポート作成
期間:FROM〜TO
4:検証フェーズ
• 納品• 納品物確認
• 報告検討会実施• 次フェーズ判定
実施判定 終了
期間:FROM〜TO
1:課題設定(営業・コンサルフェーズ)
• 目標設定• 資金計画・見積• テストデータ受領• 開発期間決定(スケジュール要確認)
• 契約(基本契約、NDA)
• 必要H/W調達(GPUマシン調達有無)
• 必要S/W調達(OSSで対応以外必要か)
期間:*** 費用:ーーー 費用:***
費用:***
パイロットプロジェクトフロー
AI x ART
The 5th 1 minute projection mapping 2016in「にいがた☆MINATOPIKA」
あまけ:こんな○○はいやだ
おまけこんな○○はいやだ!
こんな○○はいやだ
受付がペッ○ー
こんな○○はいやだ!
使いにくい。目つきが悪い。人のほうがいいのに。。。
こんな○○はいやだ
人工知能に恨みがある
こんな○○はいやだ!
昔、AIやったことがある。もの凄い予算をつぎ込んだのに、結局大した成果もなかった。という第五世代コンピューティング祭りを経験した偉い人等。
こんな○○はいやだ
とにかくDLでやってくれ
こんな○○はいやだ!
これは明らかに統計処理のほうが、、、、いやいやそうかもしれないけど、今回はでぃーぷでやってくれたまへ!・・・結果を見て、「DL大したことないじゃないか!」
こんな○○はいやだ
どれくらいデータがあればいいの?
こんな○○はいやだ!
膨大なデータを、1000種類くらいに分類したいんだけど、どれくらいデータがあれば正解率95%くらいになる?全部で数万レコードあるかな!!・・・一種類あたり数十個しかない、んですね・・・
こんな○○はいやだ
猫くらい俺にだって分かる
こんな○○はいやだ!
猫と犬を見分けるなんて簡単なはず。だって、俺にだってできるもの。誰にでもできるでしょ?何が凄いの?
こんな○○はいやだ
正解率は100%を希望(検収条件)
こんな○○はいやだ!
我々は統計的手法を駆使して、現在の正解率が98%を達成している。Deep Learningを用いて最後の2%を埋めてほしい。データはあんまり無いけど、とにかくよろしく。
intelligence
Logo Designed by
Matthew Carter