什么是多功能智能体
(2022-06-16 11:16:48)| 分类: 学习 |
什么是多功能智能体
“A generalist
agent”,翻译过来是“一个多功能智能体”。让同一个AI模型具备解决很多不同类型问题的能力。
传统的AI模型,只专注于完成一类特定的任务,比如图像识别、语言翻译、辅助决策等等,每种任务对应着特定的算法。要想让AI同时完成多种任务,比如让家里的扫地机器人一边扫地,一边陪你聊天,只能把几类不同的AI算法都加载到机器人上,相当于是给一个机器人配上多个大脑,每个大脑用来解决一个问题。
首先,研究人员采集了大量来自不同类型的任务数据,像是文字识别、图像识别、玩游戏、机器人控制等任务中的数据。然后,研究人员使用一种巧妙的编码方法,把图像、动作、文字等各种格式的信息,统一编码成同一种格式的数据序列。相当于是把各种不同的语言翻译成同一种通用语言,再统一输入到AI模型里面进行训练。最后,就得到了一个可以执行多种任务的AI模型,而且每项任务都完成得相当出色。
在控制类型的任务中,“加图”在十几种小游戏中都取得了接近甚至超过人类玩家的成绩。在给图片配字幕的任务中,“加图”也能够媲美其他专用AI模型。
这项技术进展让我们看到,AI的任务分类并不像我们原来以为的那样泾渭分明。只要经过足够好的“翻译”,图像、语言、机器人控制等任务,都可以由同一个AI大脑来完成。这样一来,机器人离真正的高级智能体又更进了一步,也许真的有一天,会出现“自我意识”的觉醒。

加载中…