标签:
转载 |
人工智能做的特别好的例子,有些共同的特点:
1、不存在计算机难以捕捉和理解的信息。证明四色定理的过程,中间不需要输入新的信息。对弈过程需要输入对手的走法,但输入是标准化的、计算机容易理解的。
2、问题的数字化描述简单。对于上述两个问题,目标是什么、条件和约束是什么,都可以准确地用数字化描述。
再看做不好的例子。
幼儿园老师不是单纯传授孩子知识,还要应对孩子可能出现的各种情绪和身体问题,并因材施教。首先遇到的困难是:识别孩子的情绪和身体状态——这一点,机器很难办到:要给出情绪的数字化模型,定义喜怒哀乐。这个可以理解为模式的定义,接着是模式的识别,即识别情绪的算法。接着,即便识别出来又该怎么办?要做什么、怎么做?可以理解为目标、条件和约束的定义。有了这个,才能将情绪信息转化为语言或行为。
对花匠来说,修剪花木的前提是认识这些花木——也是个模式识别问题。在此基础上,根据花木的情况,给出剪切的想法:剪成什么样?——为此,要对目标进行阐述。目标怎么产生的?后面是个审美为题,也可以说是价值观问题。要计算机解决这个问题,也需要有个数字化模型表征什么样的结果是好的。有了设计方案之后,再设计修剪的过程——要计算机完成这事,就要把设计模型转化成修剪的步骤和程序。最后,花匠要需要根据花木的具体情况、周围的环境、实际工作状态调整每一步的动作——这里涉及到信息的输入、识别、计算和动作控制问题。
由此可见,“低级”智能之所以难办,也就可以归纳为信息的识别和问题的描述。这都需要各种层面的数字化模型,如模式定义、目标的定义等;这些定义必须是容易识别的。数字化模型难在何处?因为很模糊。比如,“笑了”、“喜欢”怎么定义啊?如果没有数字化描述的模型和识别算法,计算机就无法智能地完成,再好的计算能力都是白费。
回顾过去,热了20多年的人工神经元方法试图解决这个问题。但现在看来,这些工作并不是很理想。现在,谷歌、IBM等公司试图用大数据来解决这个问题。前些天网上出现过用照片判断年龄、亲子关系的算法,或许就是要测试他们的算法。这方面似乎有不少的亮点,也有些问题:有个算法居然把我的一位不到50岁的男同学,识别成60多岁的女性。
这些困难的本质是什么?在我看来,是概念和知识的模糊、碎片化、随机性。引发这种现象的原因,是数据的维度太高。维度高导致的复杂性问题,是真正困难的问题。
人工智能技术的广泛应用,大概就卡在这里。好在问题是死的,人是活的。人可以改造、设定特定的环境,让信息的获取和模式识别变得简单些。在我看来,互联网思维强调用户体验、海尔采用模块化,似乎与这个思路相通。