加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

锤炼智慧大脑·读《智能革命》

(2019-03-25 06:30:08)
标签:

人工智能

数据

计算能力

百度大脑

ppl

分类: 读书评论

——读李彦宏等《智能革命》一书有感

锤炼智慧大脑·读《智能革命》

 

 早在1992年,童天湘在他的《智能革命论》一书中就提出,人类文明史,将伴随着21世纪的到来而发生重大的转折。在此之前的人类历史中,人类一直在进行着能量的革命,从最初的钻木取火到制造蒸汽机,再从电力的使用到核能的利用,都是通过能量的转换和利用,来促进文明的发展。21世纪将实现智能的革命,通过把人的智能和机器的智能潜力激发出来,促进整个社会的智能化,从而使人类文明史出现伟大的转折。现在看来,童天湘的这个判断还是很有远见的,当时的很多人,估计都没有想到人工智能在今天会有如此迅猛的发展,并越来越深刻地影响着我们的工作和生活方式。

 作为中国智能领域的三大巨头之一,百度在2017年出版的《智能革命》一书,回顾了世界范围内智能革命所走过的历程,介绍了他们在锤炼百度大脑、探索无人驾驶、试点智能金融等方面所做的努力,展望了智能时代人类工作的新境界,对读者全面了解人工智能的发展,特别是我国在人工智能领域所作的探索和实践工作,还是很有帮助的。

 一、关于人工智能

 所谓智能,简单说来就是智力和能力的总称,与人的意识、自我、思维等有着密切的联系。心理学家经过长期的研究,对人的智能有了较为初步的了解,比如霍华德·加德纳的多元智能理论,就将人的智能的分为语言、数学逻辑、空间、身体运动、音乐、人际关系、自我认知、自然认知等八个方面。当然,这只是当下较为有影响的智能分类,不能作为定论。总体看来,人类对构成人的智能的必要元素的了解还是有限的。

 人工智能是计算机学科的一个分支。二十世纪七十年代以来与空间技术、能源技术一道被称为世界三大尖端技术之一,进入21世纪之后,又和基因工程、纳米科学一道被称之为二十一世纪三大尖端技术。1950年,图灵创造了一个针对机器的测试方法,简图灵测试,提出如果一台机器能够与人类开展对话(通过电传设备)而不能被辨别出其机器身份,那就可以认为这台机器具有智能。这成为判断人工智能的重要标准。

 尼尔逊教授曾对人工智能下过这样一个定义:“人工智能是关于知识的学科怎样表示知识以及怎样获得知识并使用知识的科学。”而温斯顿教授则认为:“人工智能就是研究如何使计算机去做过去只有人才能做的智能工作。”这些说法反映了人工智能学科的基本思想和基本内容。即人工智能是研究人类智能活动的规律,构造具有一定智能的人工系统,研究如何让计算机去完成以往需要人的智力才能胜任的工作,也就是研究如何应用计算机的软硬件来模拟人类某些智能行为的基本理论、方法和技术。

 业界通常把人工智能的发展划分为三个阶段:一是弱人工智能阶段,即可以完成某一单方面的工作,比如会弹钢琴、会下象棋或者围棋,会根据你的指令播放音乐等等。二是强人工智能阶段,是指在各方面都能和人类比肩的人工智能,人类能干的脑力活它都能干,并且在进行这些操作时应该和人类一样得心应手。三是超人工智能阶段,即在几乎所有领域都比最聪明的人类大脑都聪明很多,包括科学创新、通识和社交技能。目前所有的人工智能技术,还仅处于弱人工智能的阶段,只是在某一领域做的跟人差不多,甚至超过人类,但离强人工智能还有很长的一段路要走。

 二、数据是重要的燃料

 人工智能概念的提出,到现在已经有近70年的时间,在发展的道路上也不是一帆风顺的,有很多的磕磕绊绊,遇到了各种各样的麻烦和阻力。但为什么进入21世纪之后会突然爆发呢?

 在作者看来,人工智能是一个早产的婴儿,存在两个方面的先天不足——数据不足带来“供血不足”,计算能力不足带来“心力不足”。先说数据,李彦宏及其团队把数据比喻为燃料,认为人的行为一旦能以数据的形式记录下来,就成为滋养人工智能在各行各业齐头并进的燃料。有了数据燃料,人工智能的发动机就可以运转起来了。但在过去的很长时间里,数据采集和记录的方式都很有限,可以获得的数据很少,从而导致人工智能的供血不足;再说计算能力,计算机的发展遵循摩尔定律,当价格不变时,集成电路上可容纳的元器件的数目,约每隔18-24个月便会增加一倍,性能也将提升一倍。换言之,每一美元所能买到的电脑性能,将每隔18-24个月翻一倍以上。今天计算机所拥有的强大计算能力,也是储蓄积累不断改进的结果。

 人工智能之所以在21世纪突然爆发,很大程度上得益于互联网的发展所带来的数据积累以及计算机计算能力的提升上。特别是云计算和大数据的发展,使得人工智能和互联网终于合二为一。互联网给机器智能带来了海量的数据,机器通过学习,将这些数据转化为知识(通常为算法),然后通过好的用户体验变成产品,在产品的运转过程中又搜集数据,如此持续地往复循环、不断加强,通过“数据-知识-用户体验-新的数据”的环路为人工智能的快速发展和创新注入了强有力的动力。李彦宏认为,搜索引擎的发展路径和人工智能有很多相似之处,百度从诞生的那一天起,就已带有人工智能的天然基因。他们以数据为基础,通过深度学习提取特征、模式,为客户创造价值的开发流程和开发文化。

 在能量革命时代,人们总是需要通过学习来适应机器,在人工智能时代,机器将主动学习来适应人类。现在的机器学习的本质之一,就在于从人类大量行为数据中寻找相关性、发现模式、找寻规律、形成算法,然后变成服务于人的产品,并根据不同人的不同特点、兴趣提供不同的服务。未来,人和工具、人和机器之间的沟通,可能完全基于自然语言,你不再需要去学习怎么使用工具,你只要开口说出自己的愿望,比如想看电视、想开空调、想订制饭菜……人工智能都能听的明白,并帮你来实现。

 在《智能革命》一书中,作者将“人类进步”的方式提炼为三个关键的步骤:第一步,人类捕捉宇宙中的各种现象,特别是通过有意识地观察获得经验;第二步,通过计算,有效地组织、处理、提炼信息,使得人类能更深入和抽象地理解某种现象,形成知识;第三步,人类利用产生的知识认知来采取行动,与现象交互,最终实现预期的结果。归纳起来,这三步就是:观察现象,发现规律,应用知识。人工智能还是沿着这样的模式前进,但又跨越了一大步,它们可以自主地去学习,而且其学习能力远远超出人类的能力范围,智能革命之所以会发生,原因就在于此。

 三、打造智能大脑

 当我们了解当下机器学习的基本特点,明白人工智能之所以能异军突起的缘由之后,自然就会意识到,建设一个智能型的大脑,让其拥有海量的数据,包含多种运算功能,还能支持人类有关人工智能的各种应用的超强大脑,就成了当下必须要去实施工作。很多企业号称从事人工智能,但却没有海量的数据积累和运用经验,那只能是骗骗人的行为,不可能在这个领域走的更远。

 百度早在多年前就开始布局“百度大脑,其基本的架构是:最为基础的物料层”,包括基于GPU/FPGA的云计算平台,深度学习代码平台和大数据储备;在其之上是技术层,大脑所具备的听、说、读、写、看等认知功能都聚集在此,大脑所拥有的决策规划、运动控制、预测推荐等功能也在这其中。最外层是人工智能的各种应用,深入到交通、教育、金融……各个垂直行业,为用户提供智慧生态的服务。百度地图、导航等,就是这种服务的具体体现,现在有车一族在上路的时候,或许就会用到这种服务,并且不断被其精准的道路识别能力所惊叹。在过去,道路的识别需要派人开车到各地实地勘察、拍照,记录相关的道路信息,并通过数据的方式加以汇总,现在已经不需要这样做了。每天人们在使用百度地图的过程中呈现的数据信息,对某一路段的道路情况所发表的意见和看法,以及拍摄的图片等,百度大脑都会将这些数据自动检索、汇总和分析,并融入已有的道路数据之中,自动更新百度地图的信息,使它对道路的描述更加精准和到位。百度在无人驾驶汽车、金融服务等方面的实践,也是基于百度大脑的强大功能,以及对海量数据的分析和运用。

 如前所述,自然语言处理是百度大脑一直着力攻克的难题之一。为了让计算机能够理解和生成人类语言,科学家做了大量的工作。百度基于大数据、机器学习和语言学方面的积累,研发出了知识图谱,构建了问答、机器翻译和对话系统,建立了可以分析、理解问题及情感的能力。仅就知识图谱来说,基于不同的应用需求又可分为三类:实体图谱、关注点图谱和意图图谱。在实体图谱里,每一个节点都是一个实体,每个实体都有若干个属性,节点之间的连接是实体之间的关系。目前百度的实体图谱已经包含了数亿实体、数百亿属性和千亿关系,这些都是从大量结构化和非结构化数据中挖掘出来的。在《智能革命》一书中,就有这样一个小小的案例:让百度来搜索“窦靖童的爸爸的前妻的前夫”, 这句话里包含的人物关系是非常复杂的,然而,百度通过其强大的推理系统非常轻松地分析出了各实体之间的关系,并很快得出了正确的答案。

 这本书还告诉我们,在人工智能方面,我们和美国等一些先进的国家是同时发力的,在某些方面我们甚至还更有优势。比如说我们的网民以及在互联网上的活跃程度就比美国好不少,这背后都是数据的积累,而数据,正是人工智能发展的关键。

 

 《智能革命:迎接人工智能时代的社会、经济与文化变革》  李彦宏等/  中信出版集团  2017.04

0

阅读 收藏 喜欢 打印举报/Report
前一篇:危机中的人性
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有