个人资料
pplong
pplong
博客十周年地图
  • 博客等级:
  • 博客积分:44401积分
  • 博客访问:93,417
  • 关注人气:4,991
  • 获赠金笔:6044
  • 赠出金笔:564
  • 荣誉徽章:元老博主兑换图片博主服务兑换私密博文兑换金笔
正文 字体大小:

机器学习的新进展·读《终极算法》

(2019-02-04 06:12:40)
标签:

机器学习

人工智能

终极算法

超级大脑

ppl

分类: 读书评论

——读佩德罗·多明戈斯《终极算法》一书有感

机器学习的新进展·读《终极算法》

 尼克在《人工智能简史》一书中,曾说过这样一段话:当下最热的研究是机器学习,被压制多年的机器学习研究者们号称,尽管机器学习是人工智能的子学科,但很快就会独立,并且会比人工智能更宏伟。

 机器学习是人工智能的一个分支。人工智能致力于创造出比人类更能完成复杂任务的机器,AlphaGo的围棋比赛就是很据冲击力的事例。机器学习的核心是“使用算法解析数据,从中学习,然后对世界上的某件事情做出决定或预测”。换句话说,不是由编程人员事先编写好运行的程序,使机器严格按照既定的程序来工作,而是教计算机如何开发一个算法来完成任务。算法是机器学习的核心!

 一、机器学习的五大算法

 不管你是否已经意识到,在生活中机器学习算法的影响已经无处不在,机器学习正在逐渐接管现实世界。作为一个普通人,你可能不需要掌握很多机器学习的深奥理论和前沿技术,但若对机器学习有一些基本的了解,甚或有能力利用机器学习改进自己的工作,那么在今后的职业发展道路上就会有巨大的优势。

 机器学习最早的发展是Thomas Bayes 1783年发表的同名理论,贝叶斯定理发现了给定有关类似事件的历史数据的事件的可能性。这是机器学习的贝叶斯分支的基础,它寻求根据以前的信息寻找最可能发生的事件。在此后的发展中,机器学习逐渐演变成几个不同的学派,每个派别都有着自己独立的解释范式与实践手段。当下的机器学习,主要有五种不同的学派,每一个学派都有对应的算法。

 符号学派:该学派认为所有的信息都可以简化为操作符号,就像数学家那样,为了解方程,会用其他表达式来代替本来的表达式。符号学者明白你不能从零开始学习,除了数据,你还需要一些原始的知识。他们已经弄明白,如何把先前存在的知识并入学习中,如何结合动态的知识来解决新问题。他们的主算法是逆向演绎,逆向演绎致力于弄明白,为了使演绎进展顺利,哪些知识被省略了,然后弄明白是什么让主算法变得越来越综合。

 联结学派:该学派认为学习就是大脑所做的事情,因此我们要做的就是对大脑进行逆向演绎。大脑通过调整神经元之间连接的强度来进行学习,关键问题是找到哪些连接导致了误差,以及如何纠正这些误差。我们从各种感官获取信息(神经信号),这些信息在大脑中通过第一层感受器进行处理得到一系列中间信号,而后又通过第二层感受器处理得到进一步加工过的信号……直至最终形成我们的感受。联结学派的主算法是反向传播学习算法,该算法将系统的输出与想要的结果相比较,然后连续一层一层地改变神经元之间的连接,目的是为了使输出的东西接近想要的东西。

 进化学派:该学派认为,所有形式的学习都源于自然选择。如果自然选择造就我们,那么它就可以造就一切,我们要做的,就是在计算机上对它进行模仿。进化主义解决的关键问题是学习结构:不只是像反向传播那样调整参数,它还创造大脑,用来对参数进行微调。进化学派的主算法是基因编程,和自然使有机体交配和进化那样,基因编程也对计算机程序进行配对和提升。

 贝叶斯学派:该学派最关注的问题是不确定性。所有掌握的知识都有不确定性,而且学习知识的过程也是一种不确定的推理形式。那么问题就变成,在不破坏信息的情况下,如何处理嘈杂、不完整甚至自相矛盾的信息。解决的办法就是运用概率推理,而主算法就是贝叶斯定理及其衍生定理。贝叶斯定理告诉我们,如何将新的证据并入我们的信仰中,而概率推理算法尽可能有效地做到这一点。在这个充满不确定性的世界,尤其是量子理论蓬勃发展起来以后,或许贝叶斯才是更加接近真理的一种方式。

 类推学派:对于类推学派来说,学习的关键就是要在不同场景中认识到相似性,然后由此推导出其他相似性。如果两个病人有相似的症状,那么也许他们患有相同的疾病。问题的关键是,如何判断两个事物的相似程度。类推学派的主算法是支持向量机,主算法找出要记忆的经历,以及弄明白如何将这些经历结合起来,用来做新的预测。

 虽然各种学派有各种不同的算法基础,但归根结底,机器学习都是基于统计上的连续性,力求发现事物的深层结构与模式。

 二、终极算法

 有一个问题相信很多人都思考过:人是如何学习的?这其中,有一些关键的要素很重要:一是短时记忆。人在一段时间内能后接收到的信息非常有限,有容量的限制,而且还很容易遗忘,只有经过刻意的、反复的训练,这些知识才会进入到长时记忆之中;二是进阶学习。新的概念的学习,总是建立在已有知识的基础之上的。如果给一个完全没有基础的全新信息,学起来是非常困难的;三是结构和联系。学习的目的是构建相关知识的内在结构,建立不同知识之间的联结,换句话说就是形成知识组块,而且这个组块也是一直在动态变化的,随着学习的不断进行而不断变化。专家和新手的差异,往往就体现在这些组块上。

 我们知道,数学的主要目标,就是在发现更基本的结构和更深层的模式。你看人的学习是否也是如此?从某种意义上说,人的学习和机器学习的本质是一样的,都是演化,或者说都是数学问题,都是计算。神经科学家们认为,大脑皮质其实就是在不断重复执行一个算法,无论调整到视觉、听觉、还是触觉的模式,也就是说,大脑皮质就是一个“具备学习能力的”算法模型。

 但上述五种学派及其算法都有不可避免的缺点。比如在逆向演绎时,除非我们和最初知识保持亲密关系,否则很容易在空间中迷失。因为逆向演绎容易被噪声迷惑,在推演的过程中,或许就在不经意之间,一些演绎步骤被漏掉了。反向传播学习算法需要面对的困难是:人的脑子里所想的东西绝大多数是潜意识的。你不能仅靠构造一个空洞的机械化科学家,就想让他把所有有意义的事情完成。基因编程算法存在的问题是进化的产物有很多明显的错误。例如,哺乳动物的视觉神经和视网膜前端而不是后端相连,从而导致不必要的盲点,就在中心凹旁边,而这里是视觉最敏锐的地方……每一种算法都有缺陷,但都解决了部分问题,能否将这些算法整合起来,创造出一种“终极算法”,一劳永逸地解决机器学习的问题呢?

 本书的作者想做的就是这样的事情,不过他在本书中并没有给出“终极算法”,他自己也意识到要实现这样的目标还有很漫长的道路要走,就像爱因斯坦提出大统一理论,但直到今天物理学家依然没有找到突破点一样。

 关于“终极算法”,作者最主要的贡献就是提出了一种研究和实践的思路。概括起来讲,就是一种从微观结构建立到宏观结构修整,结合了逻辑和概率这两条进路,博采各家的“混合算法”。从某种意义上说,还是有关人工智能研究路径的回归。早期的人工智能研究主要是一种仿生化、建构主义的研究,最常见的局势模仿人脑来进行机器学习。但随着对人脑是如何学习的、意识的形态、智能是什么等问题的探究,人工智能的研究逐渐转向语言学、逻辑学等问题的探究。后来,商业驱动人工智能的发展,基于马尔科夫链的语音识别、机器翻译等在现实生活中的应用,促使人工智能转向数据与算法驱动。再接下来,就是上述五种机器学习领域的争奇斗艳了。现在,我们又回到了一个新的起点上,要综合上述方法,架构一个超级大脑的模型,凭借终极算法来实现机器学习的更新换代。从某种意义上说,这是人类学习和机器学习的大综合,是算法的一次大统一。

 三、终极算法之后的人类社会

 如果终极算法实现了突破,人类社会会发生怎样的变化呢?作者对此进行了畅想。

 ——每个人都会有一个和自己一模一样的数码模型,它甚至比你自己更了解你。你的数码模型会继续从经历中学习,代表你和世界进行互动以增强技能。每个人都会有一个这样数码模型,最终形成一个与真实世界对应的虚拟平行世界。

 ——数据的积累让你对隐私有了另外的思考。在未来甚至会出现一个特殊的职业:数据经纪人,他们既保证你的数据不会被滥用,也同时保证被分享的数据会用在好事上。

 ——人工智能会取代人类,但人类可以做其他的事。就像过去发明汽车的时候,很多人担心马车会怎么办,那些马会怎么办,现在看来似乎没有什么不妥。绝大多数现有的工作会被机器所取代,人类会寻找工作之外新的意义,比如灵修、玩乐之类的事情。

 ——更加智能的机器,或许会把人类远远甩在后面。这种超人类主义的“技术人”会进化成无数不同的智能物种,每种物种都有其生态位,这是一个与当今完全不一样的生物圈。人类或许不会被彻底淘汰,可能会与自己的创造物一起进展、共同进化。

 就拿当下来说,机器学习也将在各个方面影响我们的生活,比如:

 ——物联网,或者说IOT,是指你家里和办公室里联网的物理设备。机器学习有两个主要的与物联网相关的应用:使你的设备变得更好和收集你的数据。通过这些让你生活的更加智能、更加温馨。

 ——聊天机器人。越来越成熟的语言处理算法每天都在改进它们。这些聊天机器人被公司用在他们自己的移动应用程序和第三方应用上,以提供比传统的(人类)代表更快、更高效的虚拟客户服务。

 ——自动驾驶。除了各大汽车公司正在开发无人驾驶汽车外,交通标志传感器也很重要,它使用监督学习算法来识别和解析交通标志,并将它们与一组标有标记的标准标志进行比较。这样,汽车就能看到停车标志,并认识到它实际上意味着停车,而不是转弯,单向或人行横道。

 ……

 未来已来,我们需要以积极的心态应对这机器学习的新时代。

 

《终极算法:机器学习和人工智能如何重塑世界》   [] 佩德罗·多明戈斯/  黄芳萍/  中信出版社  2017.01 

阅读(508) 收藏(0) 喜欢 打印举报/Report
前一篇:履职二三事
后一篇:猪年快乐!
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有