认知问题

标签:
杂谈 |
分类: 雜感 |
AI实力
2022-07-08 澎湃新闻《云AI开发者服务关键能力报告》说,对全球云服务商的AI能力做了排行。
语言AI这一项,第一名毫不意外是谷歌。
第二名比较惊喜,是阿里巴巴。这是榜单发布以来,中国公司在该领域第一次进入全球前三。
全球前十中,中国的BAT占了三席,成绩可谓是瞩目。
一、
2021年,是人工智能提出65周年。
一个有趣的现象,对于人来说很难,很烦的事情(复杂的计算,下棋,推理…),对于计算机来说,其实算是相对容易的事情。
对于人来说很容易的事情(认人,走路,开车,打球…),对于计算机来说,却非常困难。
认知是真正困难的AI问题。
二、
1979年,上大学的时候我(李开复)选了法律和数学,人工智能才刚刚萌芽,幸运遇到了三个教授,做的正是人工智能的视觉、自然语言和算力。
1988年,大家认为神经网络是不太Work的,觉得这套技术不行,只有少数人坚持了下来。
杰弗里·辛顿等三个人,基本上是卧薪尝胆,用了接近30年的时间证明,之前只是理论,后来数据多了,算力多了,就真的Work了。
三、
对人类来说,“听”、“说”、“理解”相加,基本等于思维能力,对AI,道理也差不多。
语言AI,包含语音、语义两个大类。
语音负责让机器学会“听”和“说”;语义,也就是自然语言处理(NLP),负责让机器学会“理解”。
语音的应用,苹果Siri、微软小冰等AI助手,都是通过赋予机器语音能力,从而与人类产生交互。背后都有一套语音技术软硬件作支撑。
2019年,阿里语音AI曾被MIT评选为当年度的“十大突破技术”,这背后的技术能力来自达摩院在语音AI领域的深厚积累。
四、
所谓“机器学习”或者“深度学习”科技,采集到一些二维数据点。符合一个简单的函数 y = ax3 + bx2 + cx + d,但不知道a, b, c和d该是多少。于是你就利用“机器学习”(也就是数学统计),推断出参数a, b, c和d的值,使得采集到的数据尽可能的靠近这函数的曲线。
所谓神经网络,其实也是一个函数,它在本质上跟y = ax3 + bx2 + cx + d并没有不同,只不过输入的参数多一些,逻辑复杂一些。
如果数据不符合这个范式,还是只有靠人,才能找到更加符合数据特性的函数。
五、
除了语音AI技术之外,阿里在语义层面同样形成了一套强大的技术体系。
语言本身就是“音”和“义”的结合体——“听到”诚可贵,“听懂”价更高。
人类语言并不难,几岁孩童便可轻松掌握一门语言。但计算机有自己的编程语言,要它理解人类语言难如登天。
NLP技术的进化,是AI从感知智能向认知智能演进的前提。阿里达摩院2019年,就开始研发大规模预训练语言模型体系AliceMind,并以此作为技术底座,开展对内对外的技术服务。
拥有阅读、写作、翻译、问答、搜索、摘要生成、对话等多种能力。
六、
纵观语音语义的发展,有一点是始终未曾变化的,那就是它的理想目标——和机器对话,像在跟人类交流。(2022/07/08老邓)