加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

【杨强】踹不倒的谷歌大狗是怎样炼成的?

(2015-03-06 13:40:05)
标签:

杂谈

http://ww1/large/59387c78jw1epvyesel27j20fa08jdi2.jpg 

【静点评】今天是元宵节,经过了羊年春节的喧嚣,我的微信公众号又跟大家见面了。首先祝大家元宵节快乐,羊年更多共享新知。

在春节期间,大家可能都在朋友圈里或微信群中,看到一个谷歌大狗机器人被壮汉猛踹但不倒的视频。人们纷纷啧啧称奇,甚至怀疑这种黑科技是否会导致人工智能的“奇点”到来。

今天特别感谢香港科技大学计算机和工程系主任与大学冠名讲座教授, 2015年国际人工智能大会主席杨强老师的投稿,让我们能了解谷歌大狗机器人背后的科学故事。原来科学家是借鉴了仿生学的设计让大狗健步如飞,而且不怕坏人使绊。但不管马克的谷歌大狗能做出多少动作,它都并不真正具有智能:它的整个“头脑”,都是在算法控制下,计算如何保持平衡而已。下面就让我们跟着杨强教授的分析,像拆穿魔术一样,来揭开踹不倒的谷歌大狗的真面目吧!


http://mmbiz.qpic.cn/mmbiz/VPia6sR85GCOmPGKqErMtMJaVUmtRElFSwc9yyXzjENBYjbzLrCaI2RmKGOxgpTV3xNd4pZc9jqA5RdC8UscUtA/640?tp=webp&wxfrom=5

【杨强】香港科技大学计算机和工程系主任,大学冠名讲座教授, 2015年国际人工智能大会主席。主要研究人工智能和大数据。 于1982年和1989年分别获得北京大学天体物理专业学士学位和美国马里兰大学计算机系博士学位。他是国际人工智能协会(AAAI)首个华人Fellow和IEEE等国际协会的Fellow,ACM杰出科学家。


【杨强】最近,有一个关于谷歌大狗机器人的视频正在迅速走红:在这个视频里,谷歌的机器大狗乖巧地跟着人一起跑步,然后又会像恐龙一样的发怒,把大块的砖头凭空扔起。还会驼着重物在山地上飞跑。而令人惊叹的是,这一切都是现实,而不是科幻片里的镜头!那么,大狗和其他的机器人到底有多智能?是什么人把它们创造出来的? 它们的背后都有哪些故事? 机器人的时代已经到来了吗?而机器人的到来对于人类来说意味着什么呢?

说,一个成功的男人背后有一个非凡的女人。同, 一个成功的机器人背后有一个奇的科学家。于谷歌大狗来说, 这个科学家的名字叫做克.莱伯特 (Marc Raibert)。

马克是一个有着传奇色彩的科学家。和熟知的互联网青年创业者不同,马克可以算是大器晚成,因为他今年已经66岁了。 早年的时候,他毕业于美国的麻省理工学院,获得控制论和机器学习方面的博士学位,随后在著名的卡内基•梅隆大学立了一个叫做“大腿机器人室”(Leg Lab)。之后,他又把实验室搬到了母校麻省理工学院,继续他的机器人研究。和其他研究大脑的人工智能研究者不同,他把主要经历放在研究如何让机器人平衡、稳定地行动上,研究如何能够在崎岖的山路上行走,在坍塌的瓦砾中寻找幸存者以及在屋子里跳跃。

如果说在学术界里比较时髦的研究方向是大脑,那么,马克所研究的方向- 机器人的“自动化控制理论”- 就是人工智能里的“冷门。”那么,究竟什么是“自动化控制理论” 呢?

别看我们人类举手投足很容易,这貌似简单的功能实际上是人类多年进化的结果。我们可以把动物的身体想像成一个由很多关节连接起来的装置,可以通过很多的传感器感受到周边的情况,例如脚是不是放在地上,身体有没有前倾,等等。 如果要保持平衡,就要随时把整个身体和周边的受力情况放到一起来做一个估算,看看下一个时刻身体是不是还继续保持平衡,而不是开始摔倒。如果我们感觉要摔倒了, 那就需要改变身体的 姿势和角度,速度等,以抵消使人摔倒的那个作用力。这一切的过程,如果用数学理论来描述,就叫做自动化控制理论。

如果用数学来对这个过程建模,则需要用一大堆微分方程来表达。在机器人的设计中,如果这些微分方程如果太过复杂乐, 那计算机就不能及时的给出答案,而机器人也就不能达到平衡地运动的目的。其结果就是设计的机器人就会像喝醉了一样,一站起来就会摔倒!所以,如何能够准确地建立自动控制模型,同时又不让计算变得很复杂,这就成了一个研究难题。

面对这个难题,马克的一个非常独到的见解就是我们可以从动物身上学到机器人所需要的运原理。这样,可以让机器人如同物一,在移动的时候可以保持即迅速又平稳。早年,在马克还是学生的时候,他就听过一些动物学家的课,而因此为猫类的灵敏所震撼。这需要大量的基础研究做后盾。当年,我在美国的一个研究生同学就在研究马腿落地时的物理轨迹和受力情况。这样看似偏门的研究,就是仿生机器人研究的基础。所以,在这位同学博士毕业的时候,就被马克他们的实验室招去做博士后,继续这方面的研究。可见,马克对于跨学科的研究给予了很大的期望。

就这样,马克非凡的洞察力,终于让他的团队获得了突破。他观察到,很多动物用一条腿一样可以站稳。所以,当其他机器人研究人员还在用增加腿的个数来加强机器人的平衡性的时候,马克突发奇想,认为成功的秘诀在于做减法:只需要机器人一条腿,并让其平衡! 这样,在这个单腿机器人快摔倒的时候,就不得不反腿,而在机器人身上的计算机,就可以利用这一情况来进行估,学习每个跳跃应有方向和腿的姿势。 这个灵感的优点是,需要用来建立模型的自动控制理论变得出奇的简单!

马克设计的单腿机器人像着了魔的簧一样跳着高。 它每天在房里跳来跳去,碰到人就反弹,这样的动作把大家都逗笑了,而在这个过程中计算机在不断地学习,如何更好的平衡!马克在之后的研究里,引入了更多条的腿,但不管有多么复的关和控制件,其原理都是基于单腿之上的。单腿的数学模型不需要考虑腿和腿之间的协调,因此比多腿模型要简单很多。而通过像动物一样学习协调不同的腿,马克的团队可以把单腿的数学模型很自然地扩展到多腿模型,从而设计像机器大狗这样的机器动物。

和其他科学家一样,马克也是一个大孩子。为了能够让机器人更加运动自如,他还接收了一个体操运员作为他的研究生。这个运动员学生教会了机器人在跑步机上翻跟头,做各种技动作。当机器人在访问者的环绕下作出空翻的高难度动作时,马克的眼睛里闪烁这炫耀得意的目光。

当你看到大狗被旁人踹了一脚之后,会不会为大狗心疼呢?而当你看到大狗淡定地调整好姿势,继续前行的时候,又会不会为机器人的研究水平所震惊呢? 大狗之所以如此自然地应付外力,能够最大程度地保持平衡,这要归功于传感器技术的飞速发展。这使得大狗全身上下所遍布的传感器,能够探测细微的外力变化,并及时地计算出大狗全身关节所应该采取的应对措施。换句话说,这是传感器技术加上大数据起的作用。

技术上的创新,是马克成功的第一个条件。马克成功的第二个条件就是遇到了贵人。而马克遇到的贵人不是别人,正是美国军方。在互联网泡沫破裂后的1992年,马克创办了波士力公司(Boston Dynamics),并得到美国军方的大力支持。后来的机器大狗等发明也印证了美国军方的眼光。马克的机器人有着的广泛的军事用前景, 可以运送,进行救援和救火等艰巨的任务。在日本的海啸发生之后,由于机器人的技术不够发达,只能派人去处理危险的核泄漏。这一事件更加坚定了马克研究机器人的信心。

美国军方的支持不仅停留在资金方面,更重要的他们为机器人研究提出了许多实际场景,为马克的研究不断地提出新的挑战。近年来,美国军方主办了一个机器人大赛,邀请各个顶尖的机器人研究团队参加。去年的比赛就是模拟核泄漏中的救援任务。马克的团队用一个类似人类的双腿机器人来参赛,这个名叫阿特拉斯(Atlas)。正是在比赛的前一周,谷歌也正式收购了马克的公司,让马克的公司有了长期的赞助者。虽然在比赛中,阿特拉斯机器人的表现还,但马克也承认,他的机器人和动物们距离“完美”的标准还相差。机器人用的液的功率太小,噪音太响,并且利用各种传感器来导航的计算效率和精度依然太低。

但是,这些机器人(或者机器狗)更大的缺陷是它们的大脑并不真正的具有智能:像大狗和阿特拉斯这样的机器人都必须由人类来定义他们所要完成的任务,而人和机器之间的沟通却非常难,只能由专业人士通过编程来实现。机器大狗虽然会利用GPS定位,利用视频和其他传感器来判定人和物的位置,并乖巧地跟随主人行动, 但实际上,机器大狗的行为能力是在人所给定的范围内的。 这是因为大狗并没有能力理解人的语言和用意,与主人进行无缝的沟通。它更不会像我们人那样,具有自由的意志,可以独立成为社会的一员。它在智能的维度上还非常初级,无法进行自动的学习,也不能像人一样的具有思维,分析和推理的能力。这样的一个结果是人无论要让机器人做什么事,都必须由工程师很繁琐地把程序编好,并输入到机器大狗的计算机里。

http://mmbiz.qpic.cn/mmbiz/VPia6sR85GCOmPGKqErMtMJaVUmtRElFSVmh0KiaTP4AbzLCSRVKWTojyamr3IcDkvPTW7ghsu9PKwU8RXJiceGag/640?tp=webp&wxfrom=5

机器人智能化的一个途径是不断向人类学习,理解人的意图,帮助人类解决难题。


达到这一点的一个关键之处在于如何找到人类和机器人各自的优势,并把这些优势有效的结合。这里,我们要提到不久前被亚马逊购买的KIVA机器人公司。这个公司的成功之处就在于公司的管理者找到了一个人和计算机的最佳配合场景,把智能机器人的技术有效地应用在商业领域。


KIVA公司是由三个计算机科学家创立的。他们的灵感来自于他们对传统的仓储和物流的深刻理解。 他们发现, 虽然物流仓储公司已经大规模地运用了传送带等自动化手段,使得工人的效率大为提高,但基于传送装置的自动化工厂还有很多不足。比如,像亚马逊这样的电商,如果要把一个装满书的箱子包好送走,工人需要走到不同的货架,把书找到并放进箱子里。 这个过程非常费时,因为工人需要从一处走到另一处进行工作。这个过程不但很慢,而且工人们还非常辛苦。这三个科学家就想:我们为什么不能让“货架”直接走到人的面前呢?如果能做到这样,就可以可以由工人来挑选书本,放到箱子里,从而大量节省包装的时间,提高效率。他们所想到的这些会走的“货架”就是智能机器人!


KIVA的机器人正是这样智能的系统。准确地说, KIVA的系统并不不是一个单一的机器人,而是几百个机器人组成的机器人组,也就是一个复杂的智能系统。它们在一起运作,把要寄出的货物送到工人们所在的工位,由工人取下货物,装进箱子,机器人再去做下一项工作。 从楼上俯瞰这养的一个车间,会看到很多的橙色机器人在地上乱窜,但它们却没有发生任何碰撞,而整个过程也井井有条。这些机器人使得整个仓储商品包装的效率,比起过去用传送带的方法,提高了三倍多!

经过多年的努力,KIVA赢得了很多营销界的大客户,他们的机器人也因此成为这些客户从仓储时代转向未来的桥梁。去年, KIVA公司被著名的亚马逊公司(Amazon)所收购,成为亚马逊的新一代物流的主力。今天,KIVA的移动机器人系统使得过去需要几个月才能建立起来的物流系统,用几周便可以建立运转。有了KIVA机器人以后,每个大型仓储物流公司只需要雇几十个工人,数百机器人就可以应付数千种品的销售。

像马克的机器大狗一样, KIVA机器人也需要有很详细的算法才可以使它完美运转。 它们所具有的“人工智能”的能力只是停留在这些算法所赋予的特定功能上,例如如何防止机器人之间的碰撞。三个创始人之一的彼得·沃曼(Pete Wurman)教授是人工智能专家,他受邀在2015年的国际人工智能大会(IJCAI)上作主题演讲。沃曼教授设计的多机器人的行为规划系统可以让数百个机器人互相传递信息,在一个拥挤的环境下还不至发生碰撞,并保证有效的运转。

当你看到几百台机器人在无缝的运转,就像一个蚂蚁王国一样,你会为整个机器人系统所表现出来的群体智能而惊叹!而这个“蚂蚁王国”的背后,是一个厉害的算法模型。在KIVA机器人特定的仓储环境,这个算法可能很厉害,但一旦走到社会上, 这个算法就需要重新设定了。

谷歌的机器大狗和KIVA机器人的两个例子为我们展示了机器人行业发展的两个关键步骤,即机器人的自动控制设计,和机器人的大规模推广。设计出能够运动自如的机器大狗和机器人只是机器人行业发展的第一个步骤。其第二个,更关键的步骤是研究如何让机器人和人类优势互补,像KIVA机器人那样为人类服务,并在有效的商业模式下长期运转。这需要机器人的设计者们有着更宽广的思路。

今天,人工智能已经有了很大的进展。其发展最快的研究方向是如何通过语音,文字和图像来帮助人们和计算机方便地沟通。所以,人工智能如果持续地发展下去,我们将会有更便捷的方式来帮助人类和机器人沟通,让机器人理解用户的意图,为人类更好地服务。 可以想像,人工智能,机器人的自动控制理论和有关机器人的商业模式的综合研究,将使得机器人这一人类的新型工具变得越来越好用,其应用范围也会越来越宽广。

杨强,2015.2.24


http://mmbiz.qpic.cn/mmbiz/VPia6sR85GCOmPGKqErMtMJaVUmtRElFSgKQgtnZRs2icXG11pkmJ0GwbVricz2vd2NKxYWFF1vx9xNib5AyYyryxg/640?tp=webp&wxfrom=5

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有