加载中…
个人资料
Eric雪菲
Eric雪菲 新浪个人认证
  • 博客等级:
  • 博客积分:0
  • 博客访问:37,262
  • 关注人气:13
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
相关博文
推荐博文
正文 字体大小:

AI与大数据辨析之我见

(2019-11-22 21:21:55)

AI与大数据辨析之我见

近日有一些朋友在群里对大数据和AI的关系进行了热烈讨论,由于这几年来概念的演化,一些朋友认为大数据与AI的边界出现了模糊和重叠。例如大数据分析中不知道具体过程,不需要建立直接因果关系,就能得出结论,而AI也是不知道机器学习如何形成逻辑关系,但最终就能给出准确判断结论;再有计算机视觉方面的AI需要大量的数据集训练“喂养”,这和大数据处理似乎等同,凡此种种,让AI和大数据看上去有非常类似之处。

 

但我本人却始终认为AI(人工智能)和大数据是不同层级的东西,并不适合放在一个层面进行对比讨论。

1.      AI

AI是什么已经有明确定义,随处可查,但这次想从不同角度看一看。

柯林斯词典对AI的定义如下:Artificial intelligence is a type of computer technology which is concerned with making machines work in an intelligent way, similar to the way that the human mind works.

目前词典的定义里AI仍然是一种计算机技术,它能让机器以智慧的方式工作,类似于人类的思维方式。

 

而好莱坞大导演斯皮尔伯格早在2001年的电影里对AI的刻画就已经是比较准确和容易理解了,AI被具象化为一个超级聪明的孩子,还在不断变得更加聪明。这里不谈论艺术创意的部分,电影抓住了关键点,AI的核心就是智能,智能的本质的是具有学习能力,简单地说好的AI智力就高,差的AI智力就低。

理想的AI是拥有超强的学习能力,只要找到合适 的学习方法,AI能够在任何一个领域达到并且超过人类的上限,如果人类通过研究能找到最好的AI,它拥有前所未有的智力高度,因此也就拥有突破人类智力上限的可能性。

聪明人干啥都厉害,所以在不同行业的AI应用相当于带了天才儿童去学不同领域的知识,希望他在这个领域跟上人类的专家水平甚至超过人类顶尖水平,有的领域成功了比如下围棋和人脸识别,有的领域接近人类水平比如自动驾驶,有的领域还无法达到人类水平比如医疗。

(补充一点,AI技术的理想目标是要创造一个无比强大的通用智能出现,无论是以硬件或者软件的载体。如此强大的智能能做什么?前几个月在上海举办的世界AI大会上,卡内基梅隆大学的教授Raj Reddy提出的观点就很有意思,可以让AI去发现新的知识,转身教给人类,让人类也变得更加聪明,这就变成良性循环了。)

 

2. 大数据

而在我看来,在人类的科技树上,大数据的层级就低多了,只是一种增强的数据处理技术和一系列工具而已。大数据的方法本质就是统计学的升级版应用,虽然数据量和种类增加了,但是大框架还是统计学,核心诉求就是从一堆数据里找出相关性,正相关负相关线性相关,定性或者定量描述而已。前些年所有安在大数据上面的神奇描述词汇都可以放在统计学上,“为领导决策提供参照,为领导赋能”,统计局一直也都在干这个,“强大的数据分析能力,广泛调研,全面汇总”,原来的统计报告也这么写。大数据不产生直接价值,都是辅助决策,间接作用而已。

有人说大数据是AI的基础,我认为这种说法并不准确,既不充分也不必要。

有悖于人们的直观印象,实际上AI出现的时间点是早于大数据的。AI存在多种技术路线,除了目前火热的基于统计学方法的机器学习,早年第二次AI热潮时是走的是专家系统路线,这种路线的基本思路是把人类过往多年积累的经验方法总结成的领域知识进行自动化,以行业知识图谱+规则引擎,来做分析、分类、回归,虽然实现的效果不如当下这么惊人,但也曾在国际象棋上战胜了人类。显然这一成就的获得并不依赖于近年才兴起的大数据工具,所以大数据并非必要条件。

同样,目前这条基于神经网络和深度学习技术的路线中,有些典型的机器学习场景也不需要超大量的数据。虽然在训练的过程的确出现大量学习过程,但需要的数据量不大,也没有很多种类。例如AI学习玩小游戏,打砖块,它自己练了一个晚上就从小白成高手了,深度神经网络做的自我修正和提高过程中,并不需要海量数据的输入和hadoop平台处理。

只是在计算机视觉的应用中,训练AI算法需要大量的图像数据和标记,而计算机视觉领域的人脸识别,身份认证等应用在近年最为出彩,导致人们很容易形成AI必然需要大数据的固有印象而已。

所以我认为大数据和AI完全不在一个层面上,不是同等的级别,理想化的AI若能实现,对人类科技的影响必然深远。而长远看来,大数据只是一个数据处理方法的技术革新罢了,两者无法相提并论。

0

阅读 评论 收藏 转载 喜欢 打印举报/Report
  • 评论加载中,请稍候...
发评论

    发评论

    以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

      

    新浪BLOG意见反馈留言板 电话:4000520066 提示音后按1键(按当地市话标准计费) 欢迎批评指正

    新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

    新浪公司 版权所有