Top Banner
百百百百百百百百百
48

Baidu Big Data Driven Artificial Intelligence

Aug 15, 2015

Download

Documents

Weijun Qin
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Baidu Big Data Driven Artificial Intelligence

百度大数据人工智能

Page 2: Baidu Big Data Driven Artificial Intelligence

请求来自 138 个

国家和地区

每天

60 亿次搜索请求

每天每个中国网民

使用 10 次百度

移动搜索份额

79.8%

490 亿元2014 年总营收

15 年健康成长

Page 3: Baidu Big Data Driven Artificial Intelligence

百度海量数据

• >2000PB存储能力

• 10-100PB/ 天数据处理量

• 千亿 ~ 万亿网页

• 百亿 ~ 千亿索引

• 十亿 ~ 百亿 / 天更新量

• 100TB~1PB/ 天日志

百度每天处理的数据量将近 100个 PB , 1PB 就等于 100 万个G ,相当于 5000 个国家图书馆的信息量的总和

Page 4: Baidu Big Data Driven Artificial Intelligence

自诞生第一天起,百度就是一家人工智能公司

搜索数据Mega Data

商业价值Monetization

大数据人工智能Data - driven AI

Page 5: Baidu Big Data Driven Artificial Intelligence

人工智能,正在成为科技创新的主战场

Page 6: Baidu Big Data Driven Artificial Intelligence

什么是人工智能?

Page 7: Baidu Big Data Driven Artificial Intelligence

感知

控制思考

Page 8: Baidu Big Data Driven Artificial Intelligence

无处不在的“ 智能 XX ”

智能水杯智能手表

智能手环智能汤匙智能冰箱

智能手机

Page 9: Baidu Big Data Driven Artificial Intelligence

如何区分这些产品是否真的智能?

VS.

Page 10: Baidu Big Data Driven Artificial Intelligence

随着经验演化,越变越聪明

学习的能力,是智能的本质!

Page 11: Baidu Big Data Driven Artificial Intelligence

一个时代正在来临

Page 12: Baidu Big Data Driven Artificial Intelligence

20102008 201420122004 20202006 2016 2018

电脑

智能手机

平板

联网设备

联网电视

联网汽车可穿戴设备

260 亿 互联设备

移动时代 万物互联

Page 13: Baidu Big Data Driven Artificial Intelligence

40ZB 数据量

20102008 201420122004 20202006 2016 2018

万物互联 数据暴增

数据来源: IDC

Page 14: Baidu Big Data Driven Artificial Intelligence

万物互联 万物智能

大数据时代

Page 15: Baidu Big Data Driven Artificial Intelligence

深度学习为 2013 年十大技术突破之首

MIT Technology Review , April 23rd

, 2013

Page 16: Baidu Big Data Driven Artificial Intelligence

深度学习迅速影响了最前沿的高科技公司

Google Microsoft Facebook

Page 17: Baidu Big Data Driven Artificial Intelligence

百度大脑

无时不刻在学习和演进

千亿级参数

构建世界上最大规模深度神经网络

世界领先的

深度学习算法:

语音识别,图像识别,自然语言理解,广

告精准匹配,用户建模,

Page 18: Baidu Big Data Driven Artificial Intelligence

百度大脑,让连接变得更智能

人 百度

1. 理解用户意图:文本分析,图像识别,语音识别,…

1

2. 匹配用户需求:优化搜索结果的智能排序,…

信息2

3. 精准推送广告和服务:估计和优化点击率和转化率,…

广告服务3

Page 19: Baidu Big Data Driven Artificial Intelligence

• 模拟大脑的行为

• 特别适合大数据

• End-to-end 学习

• 提供一套建模语言

为什么深度学习受到重视?

Page 20: Baidu Big Data Driven Artificial Intelligence

模拟人类大脑的分层结构以及行为

图像像素

不同方向

的边界

物体的各个部位

整个物体

Page 21: Baidu Big Data Driven Artificial Intelligence

大数据和深度学习

数据规模

效果

传统人工智能算法

深度学习算法

Page 22: Baidu Big Data Driven Artificial Intelligence

人工智能的成功应用

Page 23: Baidu Big Data Driven Artificial Intelligence

世界上首次深度学习成功应用于广告变现

凤巢系统从浅层模型时代到深度模型时代

用户

百度 广告主

深度学习显著提升了百度凤巢广告系统

Page 24: Baidu Big Data Driven Artificial Intelligence

未用深度学习 用了深度学习语义模型之后

世界上首次将深度学习成功应用搜索引擎

迄今为止深度神经网络作用于自然语言最成功的例子。

深度学习显著提升了百度搜索满意度领先优势

Page 25: Baidu Big Data Driven Artificial Intelligence

Voice Search

Voice Type-setting

LBS

voice service

Voice Assis-

tant

深度学习提升了语音识别准确率

Page 26: Baidu Big Data Driven Artificial Intelligence

60708090

安静环境 噪声环境

百度

Google

移动语音搜索,世界首屈一指的中文语音识别率

安静环境 噪声环境

Accuracy

Page 27: Baidu Big Data Driven Artificial Intelligence

自然图片 OCR :百度翻译

Page 28: Baidu Big Data Driven Artificial Intelligence

自然图片 OCR :百度作业帮

Page 29: Baidu Big Data Driven Artificial Intelligence

高峰时用户一天上传 9000 万张照片, 连续三周 iOS 应用商店总榜排行第一

百度魔图:基于深度学习的人脸识别技术

人脸验证准确率达到 99.85%

Page 30: Baidu Big Data Driven Artificial Intelligence

百度拥有世界领先的基于内容的图像搜索技术

输入检索图片

百度结果 竞品结果

Page 31: Baidu Big Data Driven Artificial Intelligence

0.380.40

百度 谷歌

全球最好的物体检测模型

来源: ImageNet Challenge 2014

Mean Average Precision

No.1 No.2

Page 32: Baidu Big Data Driven Artificial Intelligence

述说图片的故事

A yellow bus driving down a road with green trees and green grass in the background.

Living room with white couch and blue carpeting. The room in the apartment gets some afternoon sun.

这些字幕是深度学习程序写的

Page 33: Baidu Big Data Driven Artificial Intelligence

舆情分析,让营销活动更具针对性舆论趋势监测

网民正负面意见挖掘舆论传播路径追踪

舆论监督与引导突发事件的及时发现与响应

有针对性的营销活动对竞争对手的了解和针对性策

略“ 肯德基”舆情分析

Page 34: Baidu Big Data Driven Artificial Intelligence

工业领域——智能监控与运维

• 百度基础设施• 200+ 万块硬盘• 硬件故障率:硬盘 > 内存 > 电源

• 预测故障,提前拷贝数据,更换硬盘• 百度经过对近 9 亿条实例进行采集处理• 选取15 万个训练样本• 从历史的硬盘故障病例中,选取了 240 个特征• 人工智能模型预测硬盘故障

• 对比无预测的故障恢复的好处• 提前一天预测出硬盘故障• 提前拷贝数据,更换硬盘• 准确率 >85%

• 极大节省带宽和计算资源

• 正在 IT、发电机组、发动机组、汽车制造和基站等的智能监控与运维方面开展合作 34

生产效率 运营成本

数据智能预测

数据查询

数据存储

百度大数据引擎

Page 35: Baidu Big Data Driven Artificial Intelligence

疾病预测,提前防范

借助大数据,让医疗卫生管理和服务真正深入人心、体现公益性: 公共卫生监测 流行疾病追踪 医疗服务质量评测

Page 36: Baidu Big Data Driven Artificial Intelligence

人工智能,不仅仅发生在互联网

Page 37: Baidu Big Data Driven Artificial Intelligence

百度高度自动驾驶项目

Remodeled LBS street-view car Two BMW 335i

LiDAR + Camera + Radar + GPS/IMUThe ATV car as a quick test bed

Page 38: Baidu Big Data Driven Artificial Intelligence

三维高精度地图和感知定位

•开发大规模的三维高精度地图技术 (已完成 G7 和五环 )

• 达到业界最领先精度 10~20 厘米• 高精度定位是包括自动驾驶在内的很多应用的核心技术

3D point clouds around the Baidu headquarter

A 3D high-precision map of the G7 highway

Page 39: Baidu Big Data Driven Artificial Intelligence

Curb Weight: 1650kg

Wheelbase: 2.92m

Turning Circle: 11.8m

Geometry and Physics ParametersEngine Model and Parameters

BMW N55B30 3L

Transmission Model and Parameters

* by estimation

百度自动驾驶项目–动力控制系统建模仿真

Suspension Model and Parameters

Page 40: Baidu Big Data Driven Artificial Intelligence

基于图像的实时道路场景理解

•利用深度学习开发各种图像识别技术•低成本的摄像头和其他感知设备是关键 (compare to Google).

Scene parsing with CDNN Real-time vehicle detection

Page 41: Baidu Big Data Driven Artificial Intelligence

从辅助驾驶到高度自动驾驶

辅助驾驶

主动安全

特定条件下的自动驾驶

高度自动驾驶

Page 42: Baidu Big Data Driven Artificial Intelligence

全景图:基于大数据的人工智能

42

互联网索引知识

人机交互

物理世界传感器 ,3D 建模

百度大脑 Deep Learning Platform

高性能计算

搜索,广告,预测,决策

智能硬件 ,机器人 , 自动驾驶

探索发现,3D打印

信息感知 思考 , 学习 决策 , 行动 , 创造

Page 43: Baidu Big Data Driven Artificial Intelligence

开放+合作

Page 44: Baidu Big Data Driven Artificial Intelligence

中国大脑计划:人工智能基础资源和公共服务平台,面向不同研究领域开放平台资源,高效对接社会资源,依托统一平台协同创新。

建议设立“中国大脑”计划,推动人工智能跨越发展,抢占新一轮科技革命制高点。

Page 45: Baidu Big Data Driven Artificial Intelligence

中国大脑计划总体目标

一个平台

两个技术方向

一系列基础研究与关键技术

多行业示范应用

万亿级产业规模

Page 46: Baidu Big Data Driven Artificial Intelligence

一个平台,整合资源与服务

异构计算(GPU、 CPU、类脑处理器)

深度学习

脑科学研究

大规模机器学习 类脑计算

关键技术

公共民生、国防军事、产业应用

行业数据

Page 47: Baidu Big Data Driven Artificial Intelligence

多行业示范应用

生物医药、医疗健康金融经济调控与预测

智能机器人

军事国防

互联网智能交通与自动驾驶汽车

农业

工业制造

能源化工

Page 48: Baidu Big Data Driven Artificial Intelligence

谢谢各位领导!