标签:
杂谈 |
【讯飞超脑】从感知智能到认知智能(29页PPT图文对照版)
【静点评】我跟讯飞研究院院长胡郁认识就是在微信群里,去年7月底,胡郁在中关村大数据产业联盟做在线分享,我问了他几个问题,其中就包括讯飞是否在大数据业务当中引入了深度学习技术,胡郁的回答是肯定的。8月20日,讯飞在北京召开“语音点亮生活”发布会,但出人意料地推出了“讯飞超脑”这一人工智能大计划。
当晚胡郁在静沙龙群对讯飞超脑进行了详细解读,讯飞从一家语音技术企业大步跨越到人工智能领域,颇让人震撼。但当时“讯飞超脑”还只是一幅蓝图,没人知道讯飞下一步将怎么走。而讯飞又是一家低调务实的企业,胡郁和其它高管并不经常在媒体露面。因此,讯飞超脑的情况就显得更为神秘。
7个月后,胡郁再次在静.沙龙一周年《新智能时代论坛》上,带来了他对人工智能的深度思考,以及“讯飞超脑”的实践路径。在演讲中,他展示了一幅宏大的智能进化坐标图:回顾了认知革命在人类智能演化史上的“奇点”作用,又前瞻了“新认知革命”将在人工智能领域取得的突破。因此,他自信地认为,认知智能将是打开人工智能“奇点”之门的那把“金钥匙”。而“讯飞超脑”正在打造这把金钥匙,自然语言处理方面的“黑技术”,让“高考机器人”具备了雏形。
如果去年8月20日算是“讯飞超脑”的诞生之日,那么我也算一个重要的见证人。大家不妨用百度搜索下“讯飞超脑”或“讯飞大脑”,你会发现搜出来的第一篇文章就是我写的静沙龙在线分享。正如大家的评价,讯飞十年磨一剑,终于在人工智能时代一飞冲天。期待“讯飞超脑”能在新智能时代,于认知智能领域率先突破,打开人类“新认知革命”的大门。
3月22日,业界聚集最多人工智能领域意见领袖的“新智能时代论坛”在北京机械工业出版社举办。科大讯飞高级副总裁、讯飞研究院院长胡郁作为演讲嘉宾应邀在会上做了题为《讯飞超脑——从感知智能到认知智能》的主题演讲,就“讯飞超脑”最新进展以及他对人工智能动态的相关解读做了分享。
以下为胡郁演讲全文:
大家讨论很激烈,让我们这些后面演讲的感觉很尴尬,高大上的问题讨论差不多了,讲技术细节这个场合又不合适。我是搞技术的人,怎么也得搞点文艺范。最近我看了一本介绍人类发展的书,正好对应我们静沙龙的讨论范畴。我的报告原来的题目是从感知智能到认知智能,超脑计划是实现感知智能和认知智能的载体。关于人工智能,最近产业界讨论的非常热,我自己归纳总结一下主要是三个方面的问题,一个是When,一个是How,一个是Where。
When就是说什么时候人工智能能够真正的实现革命性的突破。在这个问题上有两派的观点,大家(前面都)提到了,我就长话短说。霍金,马斯克,比尔盖茨,他们认为人工智能很危险,我们需要警惕。可以看出他们是非常乐观的,而且认为人工智能有危险。我们可以叫他们威胁派。
而另外一些科学家,我们可以叫他们理智派。例如Facebook人工智能方面的负责人Yann LeCun,估计和我们今天在座的想的差不多。他们认为人工智能远未达到威胁人类的地步,还有很多工作要做。如果在公司干过,就会发现老板和下面做事的人想法是不一样的,老板们都比较乐观,认为什么都能够实现,就像前面的盖茨和马斯克。而工程师会证明有这样那样的限制,还有很多的难度。老板都是乐观威胁派,工程师都是理智派。
到底人工智能会不会威胁到人类呢,很多人都认为关键要看是不是在技术的发展上存在“奇点”。雷.库兹韦尔去年来到中国,他的奇点理论去年非常热,不管是摩尔定律还是超摩尔定律,我们注意到如果没有量变到质变而产生的“奇点”,计算机要想超越人很难。那么我们就在想,大家都在讨论人工智能的奇点问题,那人类智能的发展在历史上是不是也存在奇点呢?
最近我在看一本书,叫做《人类简史:从动物到上帝》,这是一个以色列的年轻历史学家写的,最近很热。这里面说到,两百万年之前就在世界各地方有古人类了,欧洲、非洲、亚洲、美洲都有。在我们中国的古猿人有山顶洞人,元谋人等。最近的考古证明,现在世界上所有的人类都来自于非洲的智人,中国古猿人属于直立人。7万年前的时候,从非洲来的智人走到世界各地,他们把其他地方所有的猿人都给灭了。当时世界上有六种主要的古猿人,但是智人把大家灭了。200万年的过程中相安无事,7万年的时候给灭了,说明了那个时候人类智能是有一个“奇点“的。这个突然到来的事件,也给神创论的争辩等提供了一些考古上的佐证。
我们回头看一下,其实这个“奇点”是很难预测的。真正的问题是在什么地方,如果我们相信所有的事物发展都是指数曲线的话,我们群里面其实有一个讨论的笑话,如果真的所有事情都按指数曲线来发展,飞机发展到现在装几万吨货应该都没有问题,汽车发展到现在只用一克油就可以跑一百公里,但是事实是没有。所以科技的发展还有很多其他的限制,限制是有瓶颈线的。这些瓶颈线受限于物理、经济和社会的限制。有可能技术的发展遵循的是Sigmoid曲线。做模式识别的人都知道,Sigmoid曲线前面跑的比指数曲线还快,最后还是会被限制住。我们不知道现在技术的发展是遵循指数曲线还是Sigmoid曲线。那么问题就来了,“奇点”会是在瓶颈线之前达到还是之后达到,这个事情我认为讨论太多是没有意义的,因为很难说清楚,我们只管做就行了,我们的目标就是不断推动技术的进步。
下面我们来看第二个问题,How,我们如何才能实现人工智能的突破?有人相信我们通过对大脑工作原理的模仿能够实现超级智能。最近国际上很热的就是各个国家的人工大脑模拟计划。过去的十几年,美国在人类基因图谱里面投入38亿美金,现在奥巴马政府号称要用40亿美金来推动人脑图谱计划。另外欧洲也在推进人脑模拟的计划,他们的目的主要是研究人脑本身的问题,但是后面加了一个尾巴,讲我们如果搞清楚了人脑如何运作,人工智能问题也能够解决。我知道最近的中国的脑计划里面,也是把生命的脑和人工智能脑,就是放在一起。前面讲的不可忽略的事实,现在我们使用的神经网络和脑神经的工作原理基本没有关系,只是结构上略有模仿。如果从仿生的角度讲是最浅层的仿生,工作算法和人脑神经元的工作机理没有什么联系的。
而另外一种途径呢,这是在座的各位相信的以人工神经网络为代表的机器学习算法,结合大数据,知识描述体系能够实现人工智能的突破,这是最近二三十年内可以实现的。有没有突破性的变化是没有人可以预测的,要等做了五到十年以后才能看到效果。但是,从我个人来看,我现在坚信第二条道路是我们的正解。
还有一个问题需要回答,就是Where,人工智能发展到哪儿了?人工智能是一个广泛的概念,不能用一个点表示,1到N不同的方向的状态是不一样的。如果跟计算机比计算,比记忆,人类已经没有比的意义了。1996年IBM的深蓝计算机战胜了当时的国际象棋冠军卡斯帕罗夫。不知道在座的多少人知道现在我们人是怎么跟计算机比赛下象棋的。现在人类选手可以用一个笔记本弥补了计算和记忆的缺失,这样人类还是可以战胜电脑的,因为人类具有创新的能力。大家知道江苏卫视的一个节目,最强大脑。其中一个很有意思的,一百组4粒骰子,摇出100个四位数组合,由两个人类选手去记忆,比谁的记忆力强。这对计算机来讲不是事,这个方面就没有必要比了。计算智能方面计算机已经远远超过人类了。
第二方面,如果从感知的角度讲,举个例子,一个动物,一只猫或者一只狗,看到周围会避让。随着传感器、图像、语音识别技术不断进步,还有基于各种传感器综合的自动驾驶汽车出来了以后,在感知智能这个领域,计算机进步是非常快的,与人类的能力也已经是非常接近了。
真正人类和动物的差别,人类从猴子变成人,与动物最大的差别,我认为是语言。语言可以产生知识,知识让人类做出福尔摩斯的推理,从而能够学习。这个方面机器要达到的话是很弱的,现在还是相当弱的。语言能力的使用,也是人工智能最大的挑战。
为什么这样说呢,再回头看一下智人,7万年前智人干掉了其他的五种猿人。后来有人研究为什么智人能够把其他人干掉,他们定义了一个概念,认知革命。人类历史上先有认知革命,然后才有农业革命,工业革命,信息革命,第一是认知革命。这个表非常有意思。有了语言以后,对智人有很深的影响。河边有一个狮子,事实证明猴子也能发出这个声音,但是智人发出的要复杂得多,能够更好的了解自己周边的环境。还有一个很重要的能力就是八卦,大家知道女人的八卦能力比男人强,这对人类社会非常重要的。因为这可以帮助建立复杂人际关系,使原来50人以下的团队协作规模可以达到150人,1500人。最重要的是大家提到的,因为有了这些语言和知识以后,让智人产生了很多想象出来的东西,比如说宗教,大家可以交流了。正是因为有了这些秘密武器,人类有认知的革命以后,才实现了“奇点”的突破。问题就是这样的,人工智能是不是也会有,也需要有认知革命。现在大家讨论比较多的还是人工智能是和人交流,那么人工智能自身之间要形成联系,有突破的话,他们之间怎么进行交流,怎么样才能产生他们的社会和宗教,他们也要有认知革命。
这两位老兄又出来了,我是拿他们做例子,他们也认为自然语言处理对于人工智能非常重要。这个方面的进展是否导致人类的人工智能革命,我不知道。但是我相信如果要想人工智能突破“奇点”,认知智能的革命这一点是跑不掉的一步。
我们认为人工智能的发展当前主要分为几个层次,分别是计算智能、感知智能和认知智能。计算智能是让电脑能存会算,感知智能就是让电脑能听会说,能看会写。而认知智能是让电脑能理解会思考。让人工智能发生革命,认知智能的实现是一个必要条件,不一定是充分条件。现在需要重点突破的是认知智能,这是一个很大的挑战。
讯飞超脑计划的目标就是要在不断改进感知智能的基础上实现认知智能的突破。
在感知智能方面,我们最近不断取得了最新的进展,语音识别和手写识别方面的效果不断提升。像刚才几位老师说的,不管是图像识别还是语音识别方面,最近这几年系统的错误率是连年的下降,性能是不断提高。原来语音识别普通话很好,现在已经有二十多种方言也能够识别。原来能够很好的识别人和机器之间的语音对话,这种情况下人的讲话是比较标准的。而几个人进行自由讨论,说话的自由度非常大,现在也可以很好的识别出来。在图像识别方面,从原来的手写识别,到现在考卷上潦草的离线字迹也处理得很好。这些方面的进展,我们是围绕任务和功能做的,替代了原来人类很多感知方面的工作,降低了人类这方面的工作强度。
而讯飞超脑在认知智能方面的目标,如果机器人能理解会思考必须突破四个方面,语言理解,知识表示,联想推理和自主学习。
自然语言处理现在还面临很大的挑战。解决自然语言处理的问题,大家觉得现在既然我们的深度神经网络加大数据已经在感知智能上有这么好的表现了,直接套过来就行了。这是很多人的想法,大家可以看到为什么深度神经网络对感知智能有用,除了刚才讲的因为计算能力,数据量上来了之后,深度神经网络中的各个层次是有对应关系的。图像处理中像素到边界,部件到人脸有很多的层次,和深度神经网络信息表述是能够联结在一起。但是如果是自然语言处理问题呢?如果讲这句话,“中国两会期间..”,我们判断是哪一类的,政治,还是社会的,这里面层次没有那么多,不像原来的感知智能里面。刚才也提到了深度神经网络的使用方式不能直接套进去。因为当我们看到了“两会”这个字眼的时候,我们会想到语义,语法,背景知识很多的知识和概念。这些知识和概念不是逐层提炼出来的,是隐藏在冰山下面的相关信息,直接的深度神经网络不一定能很好地处理问题。这种挑战下,我们需要在认知智能方面发明出更多新的算法,这方面还有很多的工作要做。
我们如何来突破呢?一方面我们是传统的方法要做,和一些大学合作来进行,另外一方面利用人工神经网络的途径实现自然语言突破也是非常必要的。我们需要针对自然语言处理,从词、句子、篇章一层层的做上去。
首先是用了神经网络以后,我们能够取得什么样的新成果呢?现在把我们的词语的概念表示从原来是离散的分布表示成连续的分布,并且是用地图的可视化方式表现出来,词语之间的距离可以度量了。
我们可以看到第一个进展是在托福考试里面的近义词选择问题。这里需要用到语义的分析。左边的表有很多的词,我们需要找到含义最接近的一个。大家觉得就简单的搞一个近义词表就可以了,实际做的时候是没有近义词表的,是靠词和周边环境的距离来度量的。
另外一个进展是在句子层面的。这里有两句话,我坐了差不多一个半小时的火车累坏了,我做了一个半小时的作业累坏了。发音上完全一样,语义上不一样,原来我们语音识别系统不能区分这样的不同,现在通过句子层面的Sentence Embedding可以解决这个问题。我们现在能够提高20%以上的整句正确率。
更难的问题,是在篇章层面上。教学上有现实的需求,中学的作文,英语的作文,能不能进行批改。
自动批改作文需要很多的信息,远比刚才的复杂得多,包括作文长度,句法正确性,词汇的丰富程度等等信息,各方面的。我们现在能够做到在英语四六级和高考作文里面跟人类专家相接近的水平,这些都展示了我们在自然语言处理方面的最新进展。
这展示了我们用这个技术可以做到的一方面。真正的挑战在什么地方呢?大家认为评价人类智能,比如小孩,大家都是考过来的,高考到底能够考多少分?美国和日本在做能够通过高考的机器人。
国家863计划有一个认知智能方面的专项,科大讯飞和国内30多个单位在一起做高考机器人,希望能够取得突破。
可能大家还没有概念。举个例子看一下,这道题说了祈年殿的高度是多少,提到了历史字眼,和朝代有关系,判断下面哪一个说法是对的,按照这个说法得理解这个朝代和历史之间的关系才能作出正确的判断,这不是传统的神经网络直接套用就可以得到的。更难的是读一段话以后,在自由和不自由的哲学问题上要写篇作文,这个挑战会更大。
我们看完这些以后,认为如果讲让计算机最终能够产生认知革命的话,需要一个比较长的过程。但是我不太担心这件事情,因为刚才讲到《人类简史》这本书里面讲人类也会进化。今天我一开始讲,我们今天的研讨会几个方面都凑齐了,一个是人类的基因工程可以不断的完善人类的自身,而生化人的工程让人类得到了拓展,不论人工智能本身的认知革命能不能完成,人类自身都还有很多的方法可以进行对抗的,这点我还是非常乐观的。
附:胡郁简历
胡郁,男,中国科学技术大学信号与信息处理专业工学博士,教授级高工,国务院特殊津贴获得者,语音及语言信息处理国家工程实验室执行主任,中国科学技术大学兼职教授、博士生导师,科技部863人工智能重点项目首席专家。其自1997年以来,从事智能语音核心技术研究及语音数据库建设工作,参与多项国家863、自然科学基金、安徽省、部级等重大项目的科研工作。
1999年,胡郁作为创始人之一创立安徽科大讯飞信息科技股份有限公司(以下简称“科大讯飞”)。2009年6月至今,胡郁担任科大讯飞高级副总裁、讯飞研究院院长,负责主持公司语音合成、语音识别、语音分析、语音评测、自然语言理解等智能语音及语言核心技术的研究工作,总体牵头科大讯飞人工智能前瞻项目——讯飞超脑计划。其带领的科研团队在上述领域取得了丰硕的研究成果,在核心技术研究和产业化方面均取得了创新性成就。
喜欢
0
赠金笔