第四章：从形体到空间概念的形成_钱小一

http://blog.sina.com.cn/u/2940197730

首页博文目录关于我

个人资料

微博

加好友发纸条

写留言加关注

博客等级：
博客积分：

博客访问：
关注人气：
获赠金笔：0支
赠出金笔：0支
荣誉徽章：

正文字体大小：大中小

第四章：从形体到空间概念的形成

(2014-11-27 10:02:02)

标签：

pe

vc

人工智能

分类：思维工程导论

第四章：从形体到空间概念的形成

一

在几类感知体验的记忆中，拥有最复杂形式的信息就是来自三维空间中的形体信息，人类主要是靠视觉来形成形体信息流和第一类记忆空间中对象对接的，这种对接形成的识别和重构功能使第一类记忆空间能够对视觉感官的体验中的对象进行拆分存储，并在特定的结构下重新组合。这些记忆被保留在第二类记忆空间的感官场景记忆的子空间中。对形体的视觉创造了智能系统最具特异性和效率识别功能，而形体本身也是对很多其他物理属性理解的基础。当然我们可以不依赖视觉而靠碰触，或是像蝙蝠那样靠回声形成对形体的认知，但后面我们会发现无论以什么样的方式，摄入的形体信息流是什么样的形式并非是困难形成的来源，绝大部分的困难来自于第一类记忆空间把形体作为根源类保存的规则：形体以什么样的形式进行“理解式储存”，如何使这些形体信息具备识别或重现形体感知信息的功能。

二

我们需要先对第一类记忆空间的形体记忆空间构建的难度形成视觉。

首先我们拥有无穷多变的空间形体，比如球体、轮胎体、四方体……这些仅仅是标准的形体，非标准的还有苹果体、梨体、土豆体……而且我们看到这些形体之间显然是具有联系的，比如苹果体可以由球体的一个连续形变得到。

我们不能在第一类记忆空间中建立如此之多并列的对象，不仅仅因为这样一来需要建立的对象是无穷的，更加重要的原因如下：

如同我们前面讨论过的。第一类记忆空间的这些根源类对象需要至少拥有识别功能，以支持感知过程中外部具体对象的识别，并在沿时间轴的感知记忆的形成过程中作为其中对象的指向第一类记忆空间中对象的依据。如果我们以最简单的并列的形式建立太多空间形体的对象，那么识别的效率就会变得非常低下。事实上，可以证明这种模式下识别所需要的运算量随着这类对象个数的增加会呈指数增长。

其次，这些对象之间关系的建立也会是个问题。N个相互联系的对象，就有2的n次方个关系需要建立，这显然是不可行的。因此，一般而言我们不会去标记所有的关系，因为很多对象对之间的关系是可以通过与第三者共同的关系复合得到的。比如苹果体和梨体都可以通过标准球体的形变得到，这可以作为它们之间的关系来源。但即使如此，如果缺乏特定的结构，任两个对象之间关系的寻找也是极为困难的，即使我们找到了相互联系的路径，复杂的复合也会导致这种相互的联系是不被理解的。[1]

因为这两个原因我们意识到同样是形体的对象必定是有层级的。我们将使用一种动态的层级结构运用到第一类记忆空间来解决以上两个问题。

三

第一类记忆空间中新的形体对象如果可以通过老的形体对象的某种简单的变化得到，那么它将以指向+变化的方式被储存；指向即指向已有的老的形体对象；还有一种则是新的对象来自于若干老的形体对象的某种组合。这里这种变化和组合的方式就是它与老的对象之间的关系[2]，这种关系是需要被理解的。

不同的形体在我们脑海中的存在有一个显著的区别：一类形体似乎是具备直观的，一类形体是通过它与标准形体的变化关系被理解的。具体而言这种差别体现在识别过程和构想过程上的形式上。如果特定形体的识别过程依赖其所指向的标准形体的特征，即在客观世界中对这类形体的识别总是先识别出相关的具备高度相似性的标准形体，然后通过识别形体和标准形体的差异或组合模式来确定形体在第一类记忆空间中的对象；或者在构想中，构想程序总是先创造改该体对象指向的标准形体，再创造变化和组合模式以完成对该形体的构想。我们把以上这两类形体视为不被直观的。否则它们则是被直观的，我们被直观的对象的集合叫做素材空间。

对于素材空间，首先它是不断变化的，一个形体对象可能在创造时不属于素材空间，即不是被直观，而是通过它于标准形体的变化关系而被理解的，但之后它可能会被直观成为素材空间的一员。其次素材空间在工程结构上并没有明显的界线，我们无法确定的表述在某类思维函数运行之后，某个非直观的形体对象就成为素材空间中的一员。我们仅仅用素材空间这个概念描述对象被直观的程度。在一个例子中，假设一个人第一次见到葡萄，因第一类记忆空间中并不存在葡萄的形态的根源性对象，所以记忆只好以复合的方式保存葡萄串的形态：是很多小球体通过细枝连在一团。这样的复合是会在遗忘的机制下逐渐被模糊化，而且记忆的结构复杂，每次调用葡萄的形态思维都需要进行重新复合，效率低。于是，智能体在第一次接触葡萄概念时会建立葡萄串形态的临时对象，这个对象是被上面描述的简单形体复合所定义的。如果之后经常接触到葡萄，而且都是呈现之前看到的形态，那么葡萄的形态的类就不再被简单形体的复合所定义，葡萄串形体的类将和球形类等等拥有相同的地位。

四

可理解的形体记忆必定具有一种表达上的普遍形式，从而使得自然演化而来的思维不至于复杂到超越自然演化的程度。因为从信息使用的角度，除非信息被有限的普遍的形式保存——固定的几种用来生成信息的积木和几种搭建这些积木的规则，否则对这些信息加以使用的思维模块就需要兼容无数的信息组合形成而使自身到达海量。因为作用在这些信息上的思维模块会根据它所加工的信息形式的普遍性，而决定自身的普遍性。站在记忆空间所保存之信息的使用的角度上，如果信息不具备一种普遍的形式，我们在驱动信息因果链条的思维模块的编辑上就会陷入“针对性编辑的陷阱”，那我们就需要面对海量的编辑。而另外一方面，这种普遍的保存形式正如后面会看到的就意味着对很多细节信息的牺牲。

五

根据这样的精神我们去考虑如何创造一种简单的数据结构去保存形体信息。

首先回顾一下我们之前说的三个不同具体程度的数据保存：第一种层次最为具体，是近似全息地保存一个形体对象。一种是以类似照片的保存方式，我们建立一个空间网格，我们去表述哪些坐标上的格子是空的哪些坐标的格子是实的，只要我们观察的细致，并且采用非常致密的空间网格我们就能够近似全息地储存一个空间形体。同样细致的保存方式是用函数，它可以精确地表达理想化的形体，比如球体、轮胎体、长方体。第二层次储存形体信息的模式则不是直接表述，而是表述形体是如何生成的，比如复杂形体是如何由每个部分拼接而成，而每个部分又是如何生成的，它意味着第二层次的储存模式无法以直接的方式去呈现储存的感官信息，但我们能够通过若干思维函数从这些数据中重建一个形体，这种生成需要付出运算成本。在第三个层次我们保存的信息甚至无法去生成形体，在第三个层次中我们保存的是局部的特征，使我们无法去生成形体但我们却有能力去识别它。最好的例子就是我们对汉字的学习，一些字我们一开始不会写但已经会人，因为会写意味着是按照第二层面的方式保存了文字图形的信息，即知道如何生成文字图形，而仅仅会认意味着保存了特征，在比对中完成对文字图形的识别工作。

在第二章分我们论述过，人类保存信息主要以第二层面和第三层面的方式为之，即保存生成的方式和局部特征。我们从最简单的形体开始描述这个生成的过程。

六

首先让我们考虑我们大脑中先天就存在的逻辑：差异判断。我们要说明这个简单的内置逻辑是如何生成我们对复杂形体的记忆机制的。

差异判断是智能体统先天内置的功能。站在认知心理学的层面，我们能够理解我们的知觉能区别差异，比如视觉能区别颜色深浅的差异、颜色的差异，触觉能区别物体表面质地的差异；我们能够知晓上下的差异，左右的差异，变化的程度的差异等等。我们以下面这幅画为例子，我们假设智能体处于一个初始状态，即没有任何知识的储备，几类记忆空间是空的，除了那些先天的设置。

当一个婴儿状态的智能体看到这幅画面，假设它能够盯着这幅画不断地看，下面的是将会发生的事情：首先视觉信息进入大脑，感知到的信息是完整的美丽的图画，但储存感知体验的第二类记忆空间无法记忆它。我们创建一个第二类记忆空间单元来记忆视觉看到的这个画面，初始状态它是空的。接下来在第一阶段视觉能够识别出画面上方的颜色和下方颜色的差异，于是智能体能够能够记录画面中的地平线作为画面的分界线。这是第一阶段保留的信息，回忆时我们甚至不知道地平线的位置。在第二阶段，智能体开始对地平线的位置进行记录。在这幅画中，智能体能够区分地平线是在中间部分下方的，和下方偏离的程度是比较明显的。这时的回忆，智能体能够画出地坪线的位置。第三阶段，画面中的树和云朵的边界被识别出来，这些边界能够在注意力的作用下从整副画面中孤立出来，但智能体只能把其作为模糊的对象进行记忆，这些特征基本上是根植于对差异的识别能力，这个时候智能体智能识别出这些对象的大小。这个阶段智能体能回忆起来的画面是一个粗略的简化的图景，大家可以想象一下。

这边我们试图说明的是差异识别如何创造边界，而边界又是如何创造对象的。这个精神将贯穿在整个形体感知记录的过程中。

http://s1/mw690/003cYLK2gy6NVTVNyXCe0&690

七

我们可以想象一个原始人，它无论看一副画面多久，最后他能回忆起来的画面是非常模糊的。我们希望大家能看到，对图景的记忆能力是训练出来的。我们儿时画画就是这样的训练。

画画的过程实际上是一种对对象形体生成信息的建立过程，这个生成过程会保存在记忆空间中，作为我们之前说的第二层面的生成信息被记忆。我们来考虑一个儿童临摹画树的过程，当我们的笔描绘到树的某个部位的时候我们会把笔的点对应到图中树的位置，我们能够分辨接下来的线条是应该向哪个方向偏，偏多少的程度。我们可以把这个过程想象成扫描的过程。

接下来我们考虑在临摹的过程中“扫描”的信息是如何保存的。我们从线条的起点出发，我们会记录线条从何处起源，朝什么方向延续了多长，然后向左（或右）边偏移了大致多大的角度，然后又延续了多长……比如我们可以用这样的数据结构去表述一个正方形:（0,0,1），（00,left,1）, （00,left,1）, （00,left,1）。（0,0,1）中第一个0表示任意一个点作为原点，第二个点表示任意的方向，1表示移动1的距离；00表示以前面的终点为起点，left表示原有的方向左转90度，1表述移动1的距离。再比如我们去表述一个圆形：中第一个0表示任意一个点作为原点，第二个点表示任意的方向，表示移动非常小的距离，表示向左转k单位非常小的角度，我们知道k决定了圆弧的弯曲度。

我们可以想象这样的方式具有扫描并记录空间中任何曲线的能力，而其保存具有非常简单的形式。反思这个过程，我们运用的仅仅是智能体先天内置的区分差异的逻辑；因为识别或刻画一条曲线，曲线的转向和每次转向后运动的距离是所有需要记录的信息。曲线可以刻画形体对象的边界，而边界则意味着对象可以从背景中分离。这样形成的形体对象是根源性的，因为其本身具备了重构能力和识别功能。

八

这是为什么作图实践有助于增强我们对图形的理解，因为作图的过程是图形的生成过程，而这个过程被保存可以作为图形的记忆。前面我们描绘的是二维平面曲线，但我们的目标是去对三维形体进行储存。这边我们回到记忆空间那章讲述的重要思想：我们知道整体的清晰感是一种感觉信息创造的，在特定条件符合时被制造出来，并被保存；回忆时我们对当时所见清晰场景的回忆是几类感受复合出来的，其中包括清晰感。但我们的大脑在回忆时最多能够创造每个局部的清晰重构，真实的整体清晰是不存在的。所以当我们考虑清晰的组合的时候，这个组合的清晰感应该是来自于诸多局部清晰的总和。

的确，反思的过程中，我们会发现我们对三维形体的记忆能力是非常微弱的，在对形体记忆进行输出过程中，我们会发现只有不断的局部完善我们才能在外部构建一个接近真实的复杂形体。这个过程，我们看到是每个局部的特征信息在驱动着对这个外部对象的修改。这些特征包括了局部的三维信息也包括了不同角度看到的二维的信息。这使我们很容易理解，我们本身根本不存在机制——在大脑中通过每个局部或维度特征的记忆去重现一个精细的三维形体。

九

对三维形体的记忆包括两个方面：局部三维特征的记忆，比如在记忆猴子形体过程中，我们会去记住它的手指是怎样的，和人类的手指比，那些手指的比例更长；其次是不同角度的二维特征，比如在侧面看猴子的形体是怎样的，正面呢？假设我们已经有对人类手指的形体对象的记忆，这个记忆如同我们一直强调的是指第二第三层面的，保存了生成信息或识别信息。那么如果我们知道猴子手指和人的手指的差异，比如猴子的小拇指的比例更长，那么当我们建立猴子手指的对象时，这个对象同样是具备生成能力和识别能力的。

如过是通过已有的三维形体去组合新的形体,或是通过上面那样用已有的三维形体的形变去表示新的形体,这些都可以使生成功能和识别功能从已有的形体延续到通过组合和变换获得的新的形体上。但这边的问题是最原始的素材信息从何而来。我们知道我们大脑中保存的具有很强而且清晰直观效果的素材形体都是标准的形体，比如标准球体、标准正方体、标准柱形、轮胎体等等。可以理解，如果智能体的第一类记忆空间具有这些形体，那么通过连续形变和组合我们能够记忆很多复杂的形体，使这种保存支持生成和识别功能；同样的道理这些标准形体和他们生成的其他形体，也可以用来识别形体局部的特征。所以我们可以想象如果在一个原始的社会，原始人没有办法接触到这些标准的形体，那么他们能够通过第七节描述的“扫描程序”形成的素材空间必定是对于那些非标准形体的，一般都是非标准形体的简化形体。而我们知道这些非标准形体因为具有较强的特异性生成其他形体的能力是非常弱的。这使我们推知，原始人在第一类记忆空间保存的形体都是非常粗糙的形体，这种粗糙不仅仅体现在重构形体的粗糙性，而且体现在对一些细节的特征缺乏识别能力。这里这个猜想需要更多工作去求证，而且非常重要。如果我们没有经过我们幼儿时期绘画或者对标准形体的视觉，比如我们生活在原始社会，那么我们的素材空间就无法具备标准形体的素材，素材空间的生成能力就非常微弱。这点也许可以通过比较学过绘画的人和没有学过的人，或是通过比较经过几何学训练和没有经历过的人对形体记忆能力的差异去求证。

十

接下来很自然地需要考虑这种标准形体是如何出现，如何被储存，如何被教授的。

首先标准形体的生成是依赖先天内置逻辑中的“差异性”。在二维图形中，直线来自于扫描线的无弯曲延伸，圆形来自于固定不变的弯曲的延伸……而其他标准形体可以由这些形体组合变换而来，比如椭圆是圆的拉伸，折现由直线段组成等等。按照第七节的讨论我们知道，这些“无差异”的延伸信息的保存就是对这些形体在第二和第三层面的保存——生成信息和识别信息。当然我们可以用不同的方式保存同样的形体。比如圆形的另外一个生成办法就是圆弧上的每一点都和圆心的距离相同，我们用过圆规，知道这是怎样的一个生成过程。所以到此为止我们可以来考察素材空间的标准形体对象是如何在第一类记忆空间下被保存的。比如圆形可以用第七节的数据形式保存，也可以用到圆心距离相同的方式在模型空间中保存[3]。

上面讨论的是二维形体，三维形体也是一样，到圆心距离的无差异性生成了球体，球体的拉伸带来了椭圆体；柱形体可以用一个平面图形在另外一个维度拉伸后形成；正方体也可以作为一个正方形拉伸的柱形体去理解。

在未来讨论思维系统的部分里，我们会知道思维在加工信息流的过程中，很多环节的信息流是不可视也不被记忆空间保存的。我们之所以能够在脑海中呈现一个直观的圆形，是因为生成过程是在后台完成的，而模拟出了类似视觉看到圆形的信号。

十一

因为形体对象的生成和组合的特征，我们可以把这些形体信息作为模型空间的一部分去理解。我们站在这个视角上来描述这个过程，一开始是由扫描点根据差异性的判断生成了不同边界，这些边界信息在模型空间中生成，并指向第一类记忆空间的相应对象；其他的根源类也在模型空间按照不同的规则生成，并且指向第一类记忆空间；接下来我们可以利用已有形体的连续形变和组合来在模型空间中生成其他形体，并把其保留在第一类记忆空间中。

这里可以对哪些信息的设置是先天的形成判断——那些扫描点的运动，差异的判断，那些最基础的组合的规则。这些才是整个形体空间最原始最基础的素材。

十二

在我们能够对形体信息进行储存之后，对我们周围的空间就可以形成概念。这是一个巨大的模型系统。下面我们讲述这个模型系统。

生物体不同感官获得的信息的复杂程度是不同的。就人而言，他的嗅觉器官接收的是诸多一维的信息[4]，听觉器官对对象的方位有一定识别能力，但基本上也是一维的信息……人的视觉承担着最复杂的信息的摄入——这是空间概念形成主要源头。

我们之所在讲述感官记忆时讲述空间的概念，乃是因为我们感知的一切都建立在三维空间加上时间的时空框架内，空间概念作为空间的骨架和具体的感官刺激指向的第一类记忆空间的对象结合在一起，才能完成感官场景体验记忆。

对于不同的生物体，负责形成空间概念的感官是不同的，人类主要靠眼睛形成空间的概念，蛇则可以通过感知震动判断目标的空间位置，蝙蝠通过听觉形成空间的认知，狗通过嗅觉判断对象的位置……不同生物体形成空间概念的完整度和精细程度有不一样，人之外的其他生物基本上不会对他们生活之外的空间有任何概念；昆虫的视觉就比人模糊，它只能辨别对象的位置和大小，而对形状的感知就很模糊，相对的人的视觉又比老鹰模糊……

十三

对于人而言，空间概念的形成，一方面是通过感官对空间信息的直接感受，另一方面则是通学习而得。比如通过地图、它人的讲述或是阅读等等。空间概念，无论是感官获得的还是通过间接的信息习得的，它们都是第一类记忆空间中建立的对象，指向空间形体的模型。

无论通过何种方式，空间概念的形成要达到这样的目的：感官感知到的对象[5]，它处在空间中怎样的一个相对位置，是在海洋、陆地还是天空，是在南半球还是北半球；一个事件，比如球从空中飞过，这个事件是在空间中怎样的相对位置发生的，是在房间中，是在草地上，是在街道中，还是在移动的火车上；事物本身的空间属性是怎样的，什么样的形状，什么样的结构；事务运动的空间属性是怎样的，整体沿着怎样的轨迹运动，自身如何运动……

智能体需要了解它当下知觉的静态场景在整个它所认知的空间中的位置。对于人类，对其所存在的空间的认知是一个缓慢的过程。先有我们出生的房间的“对象”[6]，在类的世界里我们储存了房间类是怎样的空间结构，那些家具的“对象”是如何分布于这房间的空间中。然后是儿时玩耍的土地的“对象”，这个“对象”是怎样的结构，它处于房间“对象”怎样的相对位置，具体的道路“对象”是如何连接着房间和玩耍的土地；之后有了城市的“对象，我们知道在这个空间对象中哪里是家，哪里是公园，哪里是学校，我们知道连接着它们的街道，这些都是空间的“对象”；到了后来，我们借助地图知道我们国家的形状，其他国家的形状，大洋中的岛屿，城市在他们上面的分布，于是在地球的“对象”中建立了各个具体国家的“对象”，城市的“对象”，岛屿的“对象”；再后来有了地球和太阳系的关系，太阳系和银河系的关系，银河系和宇宙的关系，于是建立了银河系的“对象”包含着太阳系的“对象”，太阳系的“对象”包含者地球的“对象”。于是形成了一般人都具有的空间的概念。

十五

空间的骨架是用来描述空间对象的构型以及相对位置的工具。正如同我们用三维坐标轴作为三维空间的骨架那样，我们也可以以此作为智能体的空间的骨架[7]。这样一来我们能够把位置数字化。我们看宏观的空间概念是怎样形成的。比如，智能体先把地球的形状置放于三维坐标的空间骨架内；大陆作为球面上的图形信息得到保存；在这个层面，具体城市的对象拥有名称，在地球地图上用一对坐标表示它在大陆上的位置；然后是城市的层面，和之前一样将它置放于一个三维坐标的空间骨架内，这样我们能在这个抽象的空间内放置街道，放置市政府，银行等其他抽象的信息，他们在这个层面也仅仅是城市地图上的点或是线条；同样的道理，市政府的类也拥有它的地图，具体的银行也拥有它的地图……现实的情况下，智能体往往对空间对象的构型缺乏信息，或是对空间对象在包含它的空间的位置缺乏精确的信息。对于构型的缺失，处理机制需要以固定的规则去填补信息的缺失，并对可信度进行标记（比如我们虽然只看到狐狸尾巴但可以有足够的把握去猜想那只狐狸），或是保持信息缺失的状态（完全没有任何线索）；对于不精确的信息，处理机制用模糊的方式保存这类信息[8]，比如我们大多都不清楚地球绕太阳的轨道，于是我们可以以圆形或是随意的椭圆去构想它。对于精确信息的缺失的个体，在特定的范围内，无论以何种方式构想是无差异的。对于尺度差异巨大的信息，以上是我们保存他们方法，对于任何一个层面的空间，它的类总是拥有双重身份，一方面是包含它的空间内的点[9]，一方面拥有它具体的空间骨架，包含着它所拥有的子空间。无论智能体认知的顺序如何[10]，它能够形成宏观空间的图景。

当第一类记忆空间建立起了空间的概念，置身于时空中的事物以及发生的事情就有了最基本的坐标。对于未建立或是不具备完善空间概念的智能体，感官场景记忆并不会因此无法进行，只是零散而缺乏组织。

[1] 一个对象被“理解”就是在第一类记忆空间中存在对应，理解的程度和第一类记忆空间相应概念周边关系的完备程度相关。一个关系被理解也就是说这个关系本身是作为第一类记忆空间对象存在的。我们可以看到概念和概念之间的关系皆是概念。复杂的复合下可能会导致我们创造无数的关系,而这些关系如要至于理解就需要在第一类记忆空间导致数据量的无限膨胀.

[2] 在这里表现出与老的标准对象之间的差异。

[3] 实际上上面那种方式也是模型空间中保存的

[4] 不同类型的气味，和强烈的程度

[5] 或是通过间接的信息摄入了解到的

[6] 以下这些都是根源性对象，因为经常见到所以在第一类记忆空间中以非常具体而针对的形式保存。

[7]用三维空间的坐标轴去描述一个空间未必是一个很有效的方法。这里必须重提一个重要的精神。我们在人造智能体中做的一切都是模仿着人的思维，在程序中有效地实现思维的机制，而如何实现这些细分的机制并不重要。我们可以寻找到一个解决方法并使用它，在之后找到更为高效的实现这个机制的方法后再替换之前的。

[8] 位置在某个区间类是无差异的

[9] 点是可以移动的，比如在地球地图上上移动的火车。

[10] 即无论先认知哪个层面的空间，它总是能把后来的下层空间纳入其空间的骨架中，而把这个空间作为点纳入后来的上层空间中。

阅读┊ 收藏 ┊ 喜欢 ▼ ┊打印┊举报/Report

前一篇：第三章：第一类记忆空间和第二类记忆空间的构建

后一篇：第五章：模型空间

新浪BLOG意见反馈留言板　欢迎批评指正