加载中…
个人资料
赵刚
赵刚
  • 博客等级:
  • 博客积分:0
  • 博客访问:257,942
  • 关注人气:466
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

人工智能沙场秋阅兵(一)百度

(2017-09-14 13:08:38)
标签:

it

人工智能

百度

分类: IT评论

国务院印发了《新一代人工智能发展规划》,提出到2020年人工智能总体技术和应用与世界先进水平同步,人工智能产业竞争力进入国际第一方阵,培育若干全球领先的人工智能骨干企业,人工智能核心产业规模超过1500亿元,带动相关产业规模超过1万亿元。依托智能化产业数据分析平台innov100的数据,赛智产业研究院调研了全球领先的人工智能企业,包括百度、谷歌、脸书、腾讯、亚马逊、阿里巴巴、微软和IBM等,分析了这些企业的人工智能产业战略布局、核心能力、核心技术和产品、主要应用等,形成《全球人工智能领先企业调研报告》,力求为各个省市新一代人工智能产业发展和企业人工智能战略制定提供决策依据。

第一篇是中国人工智能技术最为领先的百度公司。

1、战略布局

百度是国内最早布局人工智能的企业,20131月,百度就成立了深度学习研究院。2016年,百度人工智能技术取得重大突破,李彦宏提出人工智能是百度公司核心中的核心,正式宣布百度将彻底转型为一家人工智能公司。2017年,百度公司提出“All in AI”战略,全面推进人工智能战略。

作为搜索引擎起家的公司,百度在人工智能领域的耕耘很早就已经起步,但真正把人工智能作为业务战略重点进行布局,始于2013年。经过近4年的发展,百度也已经成为一家人工智能全产业链布局的企业。据智能化产业数据分析平台innov100的数据显示,百度人工智能产业布局如下图,覆盖了从端操作系统、云计算平台、大数据、深度学习框架、语音、图像、自然语言理解到各个领域应用的较全产业链。

http://images.innov100.com/articles/201709/zg61..png

2、技术研发能力

http://images.innov100.com/articles/201709/zg62.png

目前,百度组织结构上重组成了五大事业群组中,包括搜索事业群组(向海龙负责)、金融服务事业群组(朱光负责)、新兴业务事业群组(张亚勤负责)、智能驾驶事业群组(IDG,陆奇负责)、AI技术平台体系(AIG,王海峰负责)。五个事业群组都和人工智能技术都有着密切联系,其中有两个事业群组直接从事人工智能业务。

AI技术平台体系是继智能驾驶事业群组后,百度最新成立的人工智能技术事业群组。它整合了百度NLPKGIDLSpeechBig Data等在内的百度核心技术,由王海峰任总负责人,并向陆奇汇报。王海峰曾是百度自然语言处理部(NLP)的负责人,NLP是百度历史最悠久的基础技术部门之一,一直引领着人工智能技术的发展。百度于2013年成立深度学习研究院,尽管研究院负责人几度易人,但其研发并没有因此中断。百度研究院下辖四个实验室,包括硅谷人工智能实验室(SVAIL)、深度学习实验室(IDL)、大数据实验室(BDL)与增强现实实验室(ARL)。整个AI技术平台体系有超过2000人的团队。2016年,百度研发费用为101.5亿人民币。

百度还联合清华北大以及研究机构组建了深度学习技术及应用国家工程实验室,百度大脑正式进入人工智能国人家队

3、核心技术

赛智产业研究院认为,百度拥有的人工智能技术和产品是目前中国所有互联网公司中技术最全面、覆盖产品最多的。虽然与谷歌相比,百度仍有一些差距。在某种程度上,百度是扛起了中国人工智能发展大旗的领头企业。

百度大脑

百度为开发者提供了一个完整的AI平台,包括两个组成部分:百度大脑和智能云,核心是百度大脑,涵盖了百度一流的AI开发工具和有效的 AI 行业解决方案,包括语音识别、视频理解、增强现实、机器人视觉和自然语言交互平台等。

http://images.innov100.com/articles/201709/zg63.png

       百度大脑分为算法层、感知层、认知层和平台层,算法层是机器学习平台PaddlePaddle和各种深度学习的算法。感知层是百度语音、图像、视频和增强线上/虚拟现实的技术集合。认知层是百度自然语言理解、知识图谱和用户画像等技术集合。平台层是百度的AI开发平台,包括DeurOSApollo等。百度大脑则是建立在百度云计算和大数据的基础上,包括云端的CPU/GPU/FPGA计算能力、存储和网络服务能力,以及大数据采集、标注和分析能力。

百度语音。百度语音识别技术取得较快发展。百度硅谷研究院研发的Deep Speech完全运用了深度学习技术,通过成百上千小时的语音数据训练后,实现对语音的识别。百度语音在安静环境下普通话语音识别准确率已达到97%,超过正常人的听力水平。百度语音合成技术,也能够比较准确的模仿人的声音,应用领域十分广泛。李彦宏说,“百度大脑的语音合成能力可以让每个人都有自己的声音模型,你只要按照我们的要求说50句话,我就学会了你说话的方式”。

百度图像。在计算机视觉领域,百度人脸识别的准确率已经达到了99.7%。计算机视觉或者是图像识别的技术是很多人工智能应用的“最后一公里”,百度的无人驾驶汽车技术的发展,最终还是要依靠计算机视觉的能力,要识别各种各样的极端的情况,达到99.999%甚至100%的准确率。

http://images.innov100.com/articles/201709/zg64.png

百度视频理解。在视频理解领域,百度推进象素级别的视频理解技术研发,希望达到99%以上的象素级的精度。例如,汽车自动驾驶的情况下根据视频的数据,获得象素级别的视频理解,理解这个象素是人,还是车,还是天空或建筑物。百度也在基于深度学习算法,推进视频的语义理解。

百度增强现实。百度在2017年年初成立增强现实实验室,意图结合百度图像识别、定位、虚拟现实、三维成像等技术,加快增强现实/虚拟现实领域的布局,图中百度用增强现实技术复现北京“老九门。

http://images.innov100.com/articles/201709/zg65.jpg

百度自然语言理解。百度基于大数据、机器学习和语言学方面的积累,在知识图谱的基础上,研发了自然语言理解和自然语言生成的相关技术,包括查询理解、文档理解和情感理解,以及自动写作、文本摘要、自动解说等应用,在这些技术基础上构建了问答系统、机器翻译系统和对话系统系统。自然语言理解技术已经应用在百度的众多产品上,比如搜索、Feedo2o 和广告等。下图中间是人工智能写得七律《西湖》,看看才华如何?

http://images.innov100.com/articles/201709/zg66.png

百度知识图谱。基于不同的应用需求,百度建立了三类知识图谱,包括实体图谱(entity graph)、关注点图谱(attention graph)和意图图谱(intent graph)。实体图谱已经包含了数亿实体、数百亿属性和千亿关系,这些都是从大量结构化和非结构化数据挖掘出来的。这是百度数十年知识的累积,是百度AI的核心能力。

http://images.innov100.com/articles/201709/zg67.png

百度用户画像。百度有大量的用户,百度用户画像是基于百度的大数据以及机器学习的方式所获得的一个能力。百度已经有接近10亿的用户画像,其中对于用户的识别,已经用到了千万级的细分标签。

PaddlePaddle:百度深度学习框架

PaddlePaddle是百度自主研发的开源深度学习平台,其前身是百度于2013年自主研发的深度学习平台Paddle(Parallel Distributed Deep Learning,并行分布式深度学习),且一直为百度内部工程师研发使用。由于百度在搜索、图像识别、语音语义识别理解、情感分析、机器翻译、用户画像推荐等多领域的探索,PaddlePaddl是一个相对全功能的深度学习框架。PaddlePaddle包含了多种在业界比较常用的深度学习模型,包括深度神经网络(DNN)、卷积神经网络(CNN)、递归神经网络(RNN)、复杂记忆模型、NTM 等,并支持多种优化算法。PaddlePaddle已实现CPU/GPU单机和分布式模式,同时支持海量数据训练、数百台机器并行运算,轻松应对大规模的数据训练。目前,PaddlePaddle已在百度30多项主要产品和服务之中发挥着巨大的作用,如外卖的预估出餐时间、预判网盘故障时间点、精准推荐用户所需信息、海量图像识别分类、字符识别(OCR)、病毒和垃圾信息检测、机器翻译和自动驾驶等领域。

http://images.innov100.com/articles/201709/zg68.jpg

4、主要应用

       赛智产业研究院认为,百度人工智能技术应用重点很突出,主要是语音搜索、人脸识别、智能驾驶和行业大脑。

语音搜索

语音搜索是百度人工智能技术的重要应用方向,度秘是百度的智能语音搜索服务。百度利用千亿级样本的文本语料训练深度神经网络模型,计算关键字之间的语义相关性,同时通过自然语言处理技术实现更深层的结构化语义理解,并结合海量知识库和用户反馈数据,让搜索引擎更智能地理解用户搜索需求。例如,当你发出“我要吃饭”的语音时,百度可以自动领会意图,直接进入与餐饮有关的界面。

http://images.innov100.com/articles/201709/zg69.png

百度的人工智能操作系统“DuerOS”是由百度度秘事业部研发,DuerOS强调通过自然语言进行语音对话的交互方式。同时借助云端大脑,可时刻学习进化,变得更聪明。作为一款开放式的操作系统,DuerOS还可广泛支持手机、电视、音箱、汽车、机器人等多种硬件设备,同时支持第三方开发者的能力接入。借助开放共赢的合作生态理念,相继与小鱼在家、海尔、美的、联想、ARM、汉枫、紫光、哈曼等伙伴达成合作。2017330日,DuerOS智慧芯片正式发布,为传统制造业提供一站式解决方案。DuerOS未来将更多合作伙伴的接入,将技术、场景和设备相结合,创造更多可能。

人脸识别应用

作为百度图像识别的核心技术,百度人脸识别可以实现人脸检测、人脸对比、人脸查找,并已应用于百度魔图、百度网盘、百度识图等产品中。目前百度人脸识别技术可实现72个人脸特征点检测和实时追踪,识别准确率达到99.77%。百度人脸识别的落地应用包括四个方向:一是人脸识别闸机。改应用已经百度大厦应用,百度员工100%可以通过“免工卡刷脸通行闸机”系统。进一步,百度希望将刷脸通行闸机落地到景区,以及大企业和大型写字楼里。二是刷脸进站。目前,百度在非常积极地寻求和火车站、机场达成合作。三是刷脸支付。金融方面是百度人脸识别最重要的应用方向。四是手机刷脸。百度和国内几大手机厂商在谈人脸识别技术上的合作。

http://images.innov100.com/articles/201709/zg610.jpg

百度智能驾驶

201512月,百度无人车就实现了城市道路、环路及高速道路混合路况下的全自动驾驶。20169月,百度获得在美国加州无人车自动驾驶路测牌照。20172月,百度成立智能驾驶事业群组,是将自动驾驶事业部、智能汽车事业部、以及CarLife等车联网业务统一合并建立的,陆奇亲自任总经理,大力开展智能驾驶业务。2017年百度发布“Apollo”计划,向汽车行业及自动驾驶领域的合作伙伴提供开放的、完整的、安全的软件平台,帮助他们结合车辆和硬件系统,快速搭建一套属于自己的完整的自动驾驶系统。同一天,李彦宏驾驶着百度的自动驾驶车辆驶入北京北五环。

http://images.innov100.com/articles/201709/zg611.jpg

Apollo 开放平台完整的技术架构包括软件平台、云端服务平台、参考硬件平台、参考车辆平台四大部分,通过四层架构全方位构建能够实际运行的自动驾驶系统,并将通过开放代码、开放能力和开放数据三种形式逐步赋能开发者及生态合作伙伴。

百度行业大脑

百度凭借AI平台寻找到更多合作者,做一系列的行业解决方案和生态合作方案,从智能客服到智能销售、智能大脑、出行大脑、医疗大脑、教育大脑等。

例如,201610月,百度推出医疗大脑,通过海量医疗数据、专业文献的采集与分析进行人工智能化的产品设计,模拟医生问诊流程,与用户多轮交流,依据用户的症状,提出可能出现问题,反复验证,给出最终建议。

2016年底,交通运输部与百度地图合作建设的综合交通出行大数据开放云平台——“出行云正式上线,开启智慧交通建设征程。百度地图拥有“交通大脑”,用户行走过程中每次改变路线都会让百度地图获得新的道路数据,在和采集来的基础数据整合后,百度地图的道路信息就变的更为全面,做到对用户事无巨细的指导。同时,百度地图在人工智能技术加持下,能够快速发现突发事故导致的拥堵,并建议用户绕行。

更多精彩内容和数据请登录http://www.innov100.com官方网站

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有