标签:
杂谈 |
主讲嘉宾:赵嘉敏
主持人:中国经济网经营顾问 杨静
【赵嘉敏】译言网联合创始人,CEO。译言网是国内最大的译者社区和在线协作翻译平台,有超过 50 万名注册用户和近 6 万名译者。2011年译言网与中信出版社合作,通过众包模式在一个月内完成了《史蒂夫·乔布斯传》一书的翻译工作。2012年7月,译言古登堡计划上线,在两年时间里组织社区完成了200余部公共领域图书的翻译和数字出版工作。赵嘉敏先生拥有美国南加州大学工业与系统工程博士学位和计算机科学硕士学位,以及清华大学自动控制理论与应用学士学位。
《智能时代》回归智能本质,创造真正智能的机器
【赵嘉敏】腾讯发起的2014最佳TMT图书评选,东西文库有五本书入围。《新经济,新规则》、《技术至死》、《与机器赛跑》、《颠覆医疗》和《智能时代》。
http://mmbiz.qpic.cn/mmbiz/VPia6sR85GCOrUIhIxA7fsvibG99uK3Mjv0p0zmt4Gtu6JLO2icf6OM6wCRKibbQLKagXmgk6160Ivoa07IpRworkQ/640?tp=webp
http://mmbiz.qpic.cn/mmbiz/VPia6sR85GCOrUIhIxA7fsvibG99uK3MjvpE60ZhCSvDQzHnquaKwibzdCqSTbaKIPViaBIVlrx2vjFvABO3Armv6w/640?tp=webp
《智能时代》这本书虽然我只读了一半,但确实是我这两年来读过的最有价值、收获最大的一本书。而且翻译质量非常高。要感谢译者。 @刘知远。这本书的作者是Palm 公司的创始人杰夫·霍金斯(Jeff Hawkins),他发明了世界上第一台掌上电脑,也是美国工程院院士。我虽然只读了半本《智能时代》,但感觉这么多年来关于智能的种种困惑、不解,都好像一团乱麻突然理顺了一般。
【杨静lillian】霍金斯在美国工程院当选院士主要是因为他的发明?还是他的理论?这本书里有提到么?
【赵嘉敏】主要是因为他的发明。这本书里没有提。维基百科上有介绍。美国工程院里有许多怪人,不循常理,不看资历。
【杨静lillian】库兹韦尔那本《如何创造思维》好像也是讲的大脑皮层,跟霍金斯的书有关系么?
【赵嘉敏】库兹韦尔那本书我只是听过,但没有读过。JeffHawkins
在这本书里主要是提出了记忆-预测框架。他相信,这是研究和创造智能的基本框架。他先从传统的人工智能和神经网络说起,指出它们的错误在于过于强调用行为来判断智能,典型的例子就是图灵测试。
当然,这个话题本身就很有争议性,学术界打了很多年架。为了说明行为跟智能没有必然关系,JeffHawkins 引用了塞尔设计的思维实验——中文屋。这个实验是这样的:一个完全不懂中文的人,坐在一间屋子里。屋子里有一本手册(指令),一堆纸片(数据),这个人完全按照手册,把屋外递进来的英文小说翻译成中文。屋外有一个懂中文的女人,她阅读屋里人传出来的内容,并认为翻译的中文是通顺的。这个实验里,Jeff 和塞尔都认为,屋子和屋子里的所有一切并不具备智能。
【杨静lillian】你果然看的细。中文屋这段其实我觉得是在搬杠。机器智能真超过人类的话,我们不会一无所知。举个简单例子,如果机器算出外滩踩踏的原因,而人用其他方法,怎么也没有算出来,那就超过人了。
【赵嘉敏】群主说这个是在搬扛,我也有言在先,学术界的确围绕这个实验和相关的结论打了很多年架。我自己的理解是,这里面 Jeff Hawkins 不知是有意还是无意,没有提及他后来提出的一个核心概念,即恒定表征(Invariant Representation)。
我把这个思维实验再进一步,如果递进来的内容超出了手册原有的指令,那么翻译是否还能顺利完成?我认为这是这个思维实验最关键的一环。
对于确定的输入输出,不管这种对应关系有多复杂,我们总能找到一种算法,实现这种映射关系,我想这也是图灵的思维的核心。但当我们面对新的输入,变化的输入,超出所知的输入,是否还能做出映射?有关恒定表征的概念,Jeff Hawkins 是在书里稍微靠后的地方才引入的
【杨静lillian】大数据时代,每天都有大量新输入吧?
【赵嘉敏】是的。但是否能从这些输入里提取出恒定表征,这是一个关键问题。
【杨静lillian】什么是恒定表征?
【赵嘉敏】That's a good question.有了恒定表征这个概念,我们就可以来解释与智能相关的很多概念。JeffHawkins 也并没有给出恒定表征的确切定义,他只是列举了大量例子来说明什么是恒定表征。譬如说,人脸在不同距离、不同光线下的识别,再比如,同一段音乐以不同的基调演奏,也包括接住抛来的球等等。这些事情对于机器来说非常困难,但对于人脑来说是小菜一碟,我们可以这样理解恒定表征。
【杨静lillian】提取出恒定表征,大概人脸识别这块,机器已经超过人脑了。
【赵嘉敏】人脸识别机器真的超过了人脑?看来我out了。说回来,还是回到 Jeff Hawkins 对传统人工智能和神经网络研究的批判或质疑。他的最核心观点就是,如果不去理解智能是如何产生的,而只是去模仿智能行为,这种只问结果不问手段的思路是错误的。所以他认为要回到对大脑本身的研究上。
接下来他向读者介绍了人脑的构造,主要是大脑新皮层的结构。同时,他提出研究智能的三个要素,即时间序列、反馈和层级结构。可以说他很早就意识到了这三个要素。
大脑新皮层就是一个6层的层级架构,数据和模式就分布地存储在这个层级架构里。
【白硕】插一句,关于中文屋。一个写得好的手册,是不会有覆盖不到的场景的。最不济也要有个兜底条款。
【赵嘉敏】@白硕老师,我明白你的意思。譬如说 1 1 =2, 1 otherwise = 3,这第二个条款就是所谓的兜底条款。但这里面又缺失了反馈。假如我说有外界的反馈告诉我们,第二个兜底条款是不成立的。该怎么办?这也恰恰是 Jeff Hawkins 提出的记忆-预测框架所试图解答的问题。
【刘伟】恒定表征应该是自反应偏差补偿理解机制,即自主调节与目标之间的随机偏差和累计偏差:如从起初几个音符猜出一首歌的旋律,从几个特征符合预测出整幅画面。
【赵嘉敏】@刘伟老师的这个解释很准确,几乎就是书中原文的意思。
【白硕】兜底为啥如此机械呢?也可以1 otherwise=unknown
【赵嘉敏】所以 Jeff Hawkins 认为,所谓的智能,所谓的理解力,就是人脑在记忆的基础上不间断地预测,再与感知结合的过程。
【白硕】格式塔……这后面还有更深层次的原理。
【赵嘉敏】@白硕老师,对,如果有不机械的兜底,也许就可以认为是有智能的。
【刘伟】经验反思这种反馈信号一般有衰减,期望这种前馈也有衰减,如何产生的衰减及其如何计算这种衰减呢?!
【赵嘉敏】我自己的粗浅理解,在记忆-预测的框架下,很多智能行为或概念都得到了解释。譬如,学习就是在不断的重复中提取恒定特征的过程;知识,就是具有最普遍应用性(预测)的恒定特征;而创新,就是不同的恒定特征之间的融合或合并。用记忆-预测框架也可以解释和描绘群体智慧。
譬如说,今天我们已经有共识,互联网不是平的,是有层级的。只有存在层级,才能产生出更丰富、更有意义的行为。同样,在群体智慧中,自底向上与自顶向下都是不可或缺的。自底向上是记忆,是提取恒定特征;自顶向下则是预测。我只看了一半的书,所以只能跟大家分享这么多了。
【白硕】比如当我看见半个硬币露在一个缝的外面,我不会认为这是半个硬币,而会认为还有一半被缝遮挡。一方面这是一个大概率的事件,另一方面这也是一个最少硬性附加特设性假设的事件。这又回到常识。
【赵嘉敏】这个在书中被称作记忆的自-联想特征。如果你之前从来没有看到过完整的硬币,那么也不会有这样的常识。
【白硕】可是,假设第一次看到半个硬币,第二次看到完整硬币,就会联想到第一次可能也发生了遮挡。于是第三次看到半个,还是会认为发生了遮挡……不单纯是记忆自联想,有一个整体优先的问题。
【周志华】路过,插句嘴。西尔勒中文屋子,这个思维实验的要点不是“中文手册”有没有兜底条款,而是说即使通过了这个实验,我们也不能说“屋子里的人懂中文”,只能说“屋子懂中文”。这实际是对图灵测试功效的批判。
【赵嘉敏】那么这个整体优先的概念是如何形成的?也应该是在大量记忆的基础上提取的恒定特征吧?
【白硕】天生的,就像物理学家追求大一统。
【赵嘉敏】天生的、本能的,我的理解,书中把这类归于旧脑功能。这个是否跟大脑的预测机制本源有关?
【白硕】能有一个解释就不假设两个,能有完整解释就不假设碎片。机器学习上说是基于最短描述长度。
【杨静lillian】实际上,《智能时代》这本书,主要是前面对大脑皮层通用模式的分析,以及后面智能机器的前景特别经典。霍金斯认为:首先,大脑皮层的感官处理算法都基于一种通用模式,无论听觉或视觉还是其他感官,可以相互借用。其次,人类大脑皮层容量受生物因素限制,在未来几十年中不会有明显变化;有很多方式可以让智能机器超越人脑,而一旦智能机器设计完成,即可任意复制,批量生产。
【赵嘉敏】对对!这些都是很核心的内容。群主补充得太及时了。所以读完了这本书,我从未如此确信,智能是可以创造的,而且离我们不远了。应该说读完了这半本书。再就是,要再次感谢译者。我一边读,一边做勘误笔记,发现翻译质量真的是非常高。
【杨静lillian】他举了很多例子,大脑神经医学方面的,就是一种神经元受伤的病人,完全可以用其他脑区来替代原来的神经。也就是说算法是通用的。模式识别的方式是通用的,不过输入方式,也就是感官不同而已。再有,既然大脑皮层只有6层,而模式识别又是通用的方式,只要了解这种链接方式和回路,就可以架构出类似具有预测能力的智能机器。
【白硕】代偿效应。
【赵嘉敏】我曾经质疑“恒定表征”是不是翻译有误,我的想象是把 persistent (持久的)翻译成了恒定的,但查了原文,知道是 Invariant,中文可以翻译成“不变的”,但我想了几次,认为还是“恒定的”好。除了这点疑问,其他的都只是偶尔才见的 typo。数量非常少。
【白硕】心理学上有“知觉恒常性”的说法
【杨静lillian】但很明显,霍金斯写这本书的时候,深度学习还没有取得如此惊人的成果。他提议的这条路,至今成果上还是不如深度学习神经网络的。这就是昨天王飞跃老师说,如果霍金斯的路走得通,那深度学习是一条死胡同的意思。
【赵嘉敏】我倒是觉得不矛盾。我理解的深度学习,也可以用记忆-预测的框架套进去。正如本书所说,记忆-预测是一个框架。
【胡本立】大脑皮层有6层,不等于概念有层次,是么?@赵嘉敏。
【赵嘉敏】我是这样理解的,概念(或者说恒定特征)的提取需要经过层级结构的处理。从某个角度说,可以认为概念是有层次的。人脑有 6 层,海豚的皮层有 3 层。海豚的脑容量比人大。
【杨静lillian】现在深度学习神经网络已经架构到几十层,但其中缺少霍金斯提到的一种大脑皮层结构,是突触还是什么?
【赵嘉敏】我认为是反馈还不够。霍金斯特意提到,大脑中的反馈连接甚至比前向连接还要多得多。不过我对深度学习也不甚了解,所以只是胡乱猜测。但从机理上,反馈系统非常难调节,反馈越多越难调节。所以有此一猜,层级也不是越多越好。要平衡有效性和稳定性。在互联网上,我们相信,比较有效的层级是 3 层。
【杨静lillian】今天这本书又翻出来重新讨论很有意义。无论如何,欧盟和美国的大脑工程,能让我们更了解大脑里的状况。不管怎么,可以借鉴一些到神经网络的架构中去。欧盟好像就是要用超级计算机模拟人的大脑。那么,大脑就正式有数字版了。
一旦有了第一台类人的电脑,接下来,霍金斯的预言就会一步步实现。
【赵嘉敏】嗯嗯,我赞同,这可能是重现人脑智能的难关。
【胡本立】这些层还是物理的,概念是如何组织关联的和它们是如何map到物理层次来处理的是目前数据的核心问题。@赵嘉敏因为数据和它们的模型,结构或非结构的,只是概念的部分表示。
【赵嘉敏】我们有了足够的数据,但还不能有效地提取,更不用说反馈和预测
【杨静lillian】这个问题,我也请教过科大讯飞的胡国平副院长。他也说到,机器的特征是无需再学习,迭代快。插个芯片,就什么最新知识都有了,什么信息都可以实时共享。复制快,内存、服务器,不受任何生物表征的限制。就像上次潘纲说的,只要一台类人脑机器出来,那就可以并行一百万个这样的芯片和服务器。这哪是人类能比的速度和容量。
【胡本立】不一定同意,远没那么简单。
【杨静lillian】机器还可以云计算,吞吐大数据进行学习反馈。与之相比,不仅人类,就连机器人都明显跟不上脚步。霍金斯认为以指数级速率发展多年的技术有很多,包括硅内存芯片、硬盘、DNA测序技术以及光纤。这些快速发展的技术已经成为多种新产品和业务的基础,而软件也用不同的方式表现出较好的可扩展性。一个设计良好的程序,一旦完成,就可以毫无成本地无限复制。
哪些行业肯定不会呈指数型发展呢?霍金斯举例说,与此相反,有些技术的可扩展性很差,如电池、发动机和传统机器人尽管通过大量努力得到了稳步的改进,现在的机械臂并不比几年前的好太多(机器人技术的发展渐进而温和,并没有出现像芯片设计或软件生产那样指数级的增长曲线。在1985年需要用100万美元制造的机械臂,在今天不可能只用10块钱就造出1000倍能力的来。所以,在霍金斯看来,类人脑的超级计算机应该比类人的机器人更快地出现。
【赵嘉敏】我还是相信,结构可以无误差地复制,但智能恐怕不能这么做。换句话说,我们可以无误差地复制出成千上万的机器脑,但他们还是需要一定的学习过程。只不过这个学习过程可能会比人快。
【杨静lillian】应该比人快,而且可以是并行地学习,而不是像人类这样个体思考。
【赵嘉敏】归根结底,智能是主观的,是外部世界在智能个体内的反映。所以,每个智能的个体都应该是有差别的。
【杨静lillian】我没记清胡国平副院长当时说的原话。总之意思是说,如果一台机器掌握的知识,瞬间可以传递给很多机器终端。
【赵嘉敏】那是知识的传递,而不是智能的传递。就好比把知识印在书本里一样。
【白硕】我还是觉得原理性的东西更重要,否则很多都是低水平重复。
【赵嘉敏】这好像又回到了中文屋的思维实验。我赞同@白硕老师,这也是霍金斯提出,不能只求结果,不问手段。要去了解智能产生的机理是什么。而不仅仅只是从行为或表征上来判断。
【杨静lillian】我举个例子,假如今天百度大脑或讯飞超脑有了超级智能,那么它处理的可是全人类的至少是全中国人的知识。另外,打个比方,今天百度的图片识别正确率达95%,或者讯飞的人脸识别准备率比人高,那软件下载到任何机器里,别的终端也就具备了这种智能了。以后认知计算也一样啊。一个高考机器人能考上北大,复制一亿个,都能考上北大。还有,沃森不是这个原理么?复制很多医生和大厨。
【Eric】本想沉默,还是忍不住插嘴了,用人的体验定义智能,用人脑研究引导人工智能,是非常有问题的。最常见于非AI学者中。我们应该想一想飞行是怎么定义,甚至不是扇翅膀。火箭是在飞吗?连飞的定义都变了
【白硕】Lazy 是一个重要的原理。整体优先可能也是。
【赵嘉敏】我同意要先弄清楚定义,这样大家才有一个共同的语境基础、语义基础。我理解 @Eric 老师的意思,飞机不必像鸟儿那样扇动翅膀,汽车不必像猎豹那样有四条腿。霍金斯在书中也谈到了这个问题,可能他写书的时间,正好是行为主义陷入困境的时期,所以他批判了行为主义把智能研究引入歧途。
【白硕】以前谈到的意识、注意、情感怎么定义,也是一样。问题是,没有AI基础的人不会理解我们为什么要追求一个与载体无关的定义。
【Eric】我个人觉得讨论什么是智能基本亳无意义。
【杨静lillian】霍金斯是说神经网络派是行为主义么?
【赵嘉敏】他没有说神经网络派是行为主义,他批判的是神经网络派被行为主义带偏了。他曾经对神经网络寄予厚望。他也说过,神经网络派中有一部分人分离出来,没有陷入行为主义。
可惜一个人的智力有限,不然,在多个分支上并行研究,该是怎样一幅图景?!
嗯,Jeff Hawkins 在 2002 年后全身心投入神经科学的研究,在湾区创办了一家研究中心。他应该是 03 年当选的美国工程院院士。所以刚才群主问我他凭什么当选,我回答说主要还是因为他的发明。
【杨静lillian】这么说,他其实还算神经网络派(但非谷歌党?)
【赵嘉敏】应该是,他的研究中心关键词就是neuroscience。
【杨静lillian】下面引用一段吴甘沙在清华大数据演讲中的话,大家各自对号入座。
【吴甘沙】最后说一下智能之争。现在大家都说人工智能。它代表着生物智能和机器智能的一种博弈。这个光谱的一边是生物智能,生物智能擅长的模式匹配。人的认知过程是不停在做匹配、识别、联想,从记忆中提取数据。机器智能是通过计算,大量的计算是机器擅长的东西,比如统计学习。
因此,人工智能也分成了几个派别:
一个派别认为机器智能并不一定要学习人的生物构造,机器有机器的特点。他们经常引用的一个例子是,当莱特兄弟不试图模仿鸟类的翅膀的时候,他们开始研究空气动力学的时候,人类才有了飞上蓝天的机会。所以机器智能并不一定要学习生物智能,他可以通过更擅长的计算实现智能。这里有很多厉害人物,如统计学的大事MichaelJordan,老派的PeterNorvig,新派的邢波。
另一个派别认为我们必须要了解人脑是怎么工作的。通过各种各样的脑计划绘制出人脑的数据地图,了解我们的思维Mind是怎么工作的,然后我们把计算的架构往这上面去搬。这里有很多生物学家,有一些老派的科学家如侯世达(GEB作者)、彭罗斯(数学家,《皇帝的新脑》作者),有一些民科(如雷·库兹韦尔)。
现在主流的是第三个派别计算智能(computationalintelligenc
【杨静lillian】最后就请嘉敏总结下《智能时代》这本书,以及你对人工智能未来的期许。
【赵嘉敏】我的确认为《智能时代》使得我二十多年有关智能的思考都仿佛理顺了一般。《智能时代》不一定是最终答案,但于我目前,是最佳答案。我本科学的自动化,硕士计算机,博士运筹学,还应该加上一个社会学,都在智能边上转呢。我的期许刚才已经说过了,我确信人类创造智能的那天已经不远了。
【杨静lillian】问题@Eric 和@王飞跃老师都好像学过生物,然后对人的大脑绝望了。
【赵嘉敏】哈哈,霍金斯在书中也说过。@Eric和王老师别介意。他说过,有些人劝过他,别去研究大脑,一是搞不清楚,二是搞清楚了也没用,不过他就是认定了这条路。
【赵嘉敏】我一直在提互联网的层级架构,我说的不是技术上的层级架构,而是互联网社区或互联网组织的层级架构。
【杨静lillian】这正是计算机的高明之处,它不仅有个体的智能,它还有整体的交互。这也是我推荐《断点》这本书的原因,这本书将整个互联网视为一个神经网络来研究。涌现的意识以及智慧,相信嘉敏读过更会对互联网智能充满期待。
译言网的众包,翻译协作模式和知识固化经验
【赵嘉敏】简单说,译言一直在做的是有层级的众包。具体点儿说,可以以我们的译言古登堡计划为例,这个计划上线两年多,公司内部负责这个项目的只有两个人,在社区里面发展了 400 个项目负责人,这 400 个项目负责人带动了 1500 名译者,完成了 250 本公版书的翻译,还有 300 多本在翻译当中。
这是一个三层架构。我们从最早的一层架构,发展到卫报中文的二层架构,到古登堡的三层架构,我们认为这是互联网自组织模式的一个合理层级架构。我们也在类似的大规模社会化活动组织中观察到了类似的层级结构。
【杨静lillian】这真是惊人。
【赵嘉敏】嗯,我现在的确对社会实践产生了越来越浓厚的兴趣。这是我二十年前想象不到的。
【杨静lillian】这些活动都是无偿的么?
【赵嘉敏】你问到了另一个核心问题,就是用户激励。众包里面普遍采用利益共享的原则,或者说 revenue sharing 收益分账。从某种角度说,古登堡计划的译者很大程度上不是冲着金钱报酬来的。但我们确实需要一个机制,一个公平的利益分享机制,让译者们觉得他们的付出是合理的。这是采用 revenue sharing 模式的出发点之一。
【杨静lillian】运筹学登场了。今天的分享,把嘉敏的看家本领都挖出来了。
【赵嘉敏】用户激励和质量控制是众包的两个核心问题,解决好了这两个问题,基本就能实现成功的众包。
【白硕】感觉这个激励机制很可能有点证券化味道了。
【赵嘉敏】@白硕老师不愧是搞证券的。众包和众筹经常合在一起说,很多人相信众筹的最终归宿也是证券的社会化。但在实现路径上可能会碰到一些障碍。
【杨静lillian】相信译言网的上市也像人工智能一样值得期待。
【赵嘉敏】今天看到一篇文章,说未来的人才都要合伙人制了。本身也是一种证券化。
利益共享是互联网时代的一个基本原则。这个原则不新鲜。但在互联网时代,能把这个原则适用到每个个体上,这是了不起的。
【静点评】今天感谢@赵嘉敏,给我们分享了《智能时代》这本书,甚至将他20多年来有关计算机、自动化、人工智能的思考都理顺了,看到了人工智能真正的曙光。我们也讨论了中文屋、智能的定义,相信我们这些跨界的思想和边缘的讨论,仍然会对他们的专业研究起到一些思想碰撞的作用。
喜欢
0
赠金笔