标签:
杂谈 |
这个实验项目的灵感来自儿童的发育过程,他们训练AI镜像了人类跟物体交互的能力,让人工智能学会了通过交互来推断出诸如质量、摩擦以及韧性等特性。
谈到研究背景,论文指出,尽管AI在复杂控制问题以及其他的任务处理方面取得了“人类所不能及的成绩”,但机器仍然缺乏对我们这个实体世界的理解。甚至AI的水平 “在科学直觉方面能不能超过幼儿还不得而知。”
为了弄清楚AI是不是具备这方面的能力,首席研究员Misha Denil和他的团队在不同的虚拟环境下设定了各种试验,让AI面对一系列的积木块,然后让AI去评估这些东西的特性。
比如其中一个仿真实验叫做哪个更重。在这个实验里面,AI要面对四个尺寸一样大小但是质量不一样的积木块。系统必须识别出哪一个积木块最重。而为了避免AI通过视觉或者其他特性来完成这个任务,积木块的质量是随机分配的。这样AI就无法通过积木块的颜色来判断其质量了。
其唯一的手段是反馈。如果AI确定出来了最重的积木块,就会受到奖励,而如果回答不正确,得到的就是负反馈。通过这种强化技术,AI就会了解到,获得质量方面信息的唯一办法只有通过跟积木块进行交互,然后观察这些积木块的响应。
https://pic.36krcnd.com/avatar/201611/13135952/wmvsbsflz9k0551h.png!1200DeepMind
研究进行的第二个实验是塔。这个塔由5个积木块组成,不过其中一些积木块是隐藏在AI看不到的地方的。AI必须同样在强化学习的框架下判断出来一共使用了多少个积木块。最终AI也学会了必须跟塔这个构造交互并且把零部件取出来才能获得正确的数字。
通过这项研究,该团队宣称,AI是有能力在事先不了解物理特性或者物理定律的前提下解决被动感知以外的问题的。
对该研究感兴趣的读者可以到此处下载他们的论文。
本文参考了多个信息来源:thestack.com本文来自:加速会