加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

对数学证明的一些思考

(2011-10-29 21:02:07)
标签:

杂谈

 

人们一般认为:证明对于数学来说是本质的,只有证明才能使结果确定。这句话听起来很有道理,因为数学的定理不能建立在信仰之上,数学的定理也不能建立在经验的根据上,比方说哥得巴赫猜想,到目前为止,我们的经验都支持它的正确性,但我们并不能说它已经得到了证明。照此说来,数学定理到底应该建立在什么样的基础之上呢?数学定理应该建立在“证明”的基础之上。由此可见,证明对于数学来说确实具有本质的重要性。但是,鉴于哥德尔定理,我们又不能把数学中的一切都托付给“形式化证明”。形式化证明本身也不是无条件的,如果说证明所依赖的公理集不是不证自明的,不是直观可信的,那么我们的确定感又来自于什么地方呢?现代数学中的标准证明都最终依赖于集合论的公理,操作上依赖于逻辑语言和符号,因为数学家相信,只有这样的证明才是合法的证明。但是鉴于集合论自身的一些问题,比方说集合论自身的一致性问题,这种数学家的信仰的合理性又在什么地方呢?

 

现在我们来看一个在数学分析、复变函数以及拓扑学中极其重要的定理——若尔当定理,它的表述是这样的:设J是C上任一条若尔当闭曲线,那么开集C-J有两个连通分支:一个有界的称为J的内区域,一个无界的称为J的外区域:这两个区域都以J作为边界。[1]

 

这个定理的表述就已经很“集合论”了,其实它的意思很简单:在一个平面上,一条封闭曲线可以把平面分成两部分,曲线所包围的部分(内部)和曲线的外部;如果说,有一个生物想连续地从曲线的内部爬到曲线的外部,那么它爬行的轨迹必然和该曲线有一个交点。

 

我们知道,在数学中,被称作定理的东西是需要证明的。如果有人问你:“你可以证明这个定理吗?”也许你会说:“废话,这难道还需要证明吗?”

 

我很同情你的观点,并且我相信,很多人在真正地认真阅读过这个定理的证明之后,并且在变得更加糊涂之后,他们都会同情你的观点。这个证明要用复杂难懂的符号书写上好几页才能完成。若尔当本人曾经给出过一个证明,不过他的证明又长又复杂,并且后来发现,他的证明中存在着很大的漏洞(很有意思吧,如果你直观,就不会有大漏洞)。这个定理的第一个“严格”的证明更加复杂,复杂到即使对训练有素的数学家来说,也是很难理解的。[2]我们现在看到的已经是较为简单的证明,即使是这个简单些的证明,如果证明中的一切都用标准逻辑符号,并不允许有任何(源于直观自明的)省略的话,那么这个证明大概需要厚厚的一本书。当然啦!数学家没这么笨,他们不会把一切定理都从头证明起。但是,我相信,无论如何,你们已经被现代数学的“受虐狂倾向”震惊了。不单是普通人对此感到诧异,就连哲学家对此也感到诧异,叔本华在《作为意志和表象的世界》一书中这样写到:“我们既已确信直观是一切证据的最高源泉,只有直接或间接以直观为依据才有绝对的真理;并且确信最近的途径也就是最可靠的途径,因为一有概念介于其间,就难免不为迷误所乘;那么在我们以这种信念来看数学……时,我说,我们无法回避不认为数学走的路既是奇特的,又是颠倒的。我们的要求是把一个逻辑的根据还原为一个直观的根据,数学则相反,它偏要费尽心机来作难而弃却它专有的,随时近在眼前的,直观的依据,以便代之以逻辑的证据。我们不能不认为这种做法,就好比一个人锯下两腿以便用拐杖走路一样,又好比是《善感的胜利》一书中的太子从真实的自然美景中逃了出来,以便欣赏模仿这处风景的舞台布景”[3]

 

“锯下两腿以便用拐杖走路”,这是一个很有趣的比喻。我认为确实也说中了现代数学的某些弊端。但是我们不能完全赞同叔本华的说法,如果我们延续叔本华的比喻,用双腿来比喻直观,用拐杖来比喻逻辑符号等等理想化的规定的话,那么,我更愿意说,在攀登数学高峰时,仅仅靠双腿是不能胜任的,我们还需要拐杖;但如果仅仅是使用拐杖,那不仅是错误的,而且是荒谬的。因为任何理想化的规定都受到一致性的制约,如果说完全离开了直观,而理想化的规定的一致性又得不到证明,我们还有什么权利从事数学活动呢?数学的证明也就失去了任何意义。所谓证明,通常的理解就是把一些不确定的东西建立在一些确定的东西之上;如果说,在数学中没有任何东西的确定性能够得到保证的话,那么我们的证明又意味着什么呢?

 

很多人认为,“集合论符号化证明”更严密,更不容易犯错误,所以它比直观证明更优越。为了能够清晰的比较,现在我们再看一下经典数学中的“零点存在定理”:如果函数f(x)在闭区间[a, b]上连续,并且在 f(a)•f(b)< 0,那么在a和b之间有一个c,使得f(c) = 0。

 

此定理的经典证明是这样的:不失一般性,设f(a)< 0,f(b)> 0。现在,我们建立一个集合S={x∣x∈[a,b],f(x)< 0}。很显然,这个实数集是非空有界的,根据确界定理,所以它有最小上界,设它的最小上界为c。

根据三分律,只有三种可能:f(c)< 0, f(c)> 0 和f(c)= 0。

1.假设:f(c) < 0。如果此为真,那么总存在着一个c的邻域,在这个邻域里,所有的f(x)都小于0,当然也包括那些大于c的x的值 ,但这是不可能的,因为c为该集合的最小上界。

2. 假设:f(c) > 0。如果此为真,那么存在一个c的邻域,在这个邻域里,所有的f(x)都大于0,当然也包括那些小于c的x的值 ,但这是不可能的,因为c为该集合的最小上界,小于c的x的值应该小于0。

3.最后只剩下f(c) = 0,前两个都是错误的,所以它是正确的,定理得证。

 

现在我们来看另外一种证明:说一个函数f在闭区间[a, b]是连续的,意思就是:它的以[a, b]为自变量范围的连续变量的终端在数轴上勾画出一条连续的曲线,说f(a)•f(b)< 0的意思就是这条曲线横穿X轴,由于曲线是连续的,它和X轴必有交点,所以在闭区间[a, b]中必然存在c,使得f(c) = 0。

 

这两个不同的证明孰优孰劣呢?这个“直观证明”真的更容易导致错误吗?从这一个例子我们丝毫也不能看出它更容易导致错误;反而,就像我们看到的,那个来源于集合论的“语言符号证明”却并不能保证自己无条件的正确性,因为集合论自身的一致性并没有得到证明。想想若尔当在证明自己的定理时所犯的错误,我们真地能说服自己,认为:“直观证明”更容易导致错误吗?

 

也许你会说我的这个比较是不公平的,因为在数学中存在着很多的“直观”可以导致错误的例子,比方说处处连续但不可导的曲线,可以填满矩形的曲线等等,但我认为,这不是“纯直观”的原因。人们往往把“直观”理解成“肉眼的经验直观和视觉化”,显然,经验直观是容易导致错误的,就像我们经常会有视觉错觉,但这是具体的某个数学家的错误,对于某个具体的数学家来说,“集合论符号化方法”也同样很容易被错误地运用;另外,像构造“处处连续但是不可导的曲线”,就Weierstrass的例子而言,是一个很理想化的活动,所以它需要理想化的规定,但这丝毫不能说明“纯直观”本身是容易导致错误的。此外,像“填满矩形的曲线”还有着自身的困难,因为如果曲线能把矩形填满,那么矩形将没有面积,因为线是没有宽度的;如果说不能填满,那么就不存在这样的曲线。这一切又将导致用“点集”来构造“连续”的类似问题。

 

如果不考虑到数学家的情绪,我很愿意说:集合符号化的证明只是现代数学中的时髦,它原则上和数学真理无关。

 

简单地陈述一下我的理由:如果你是一个柏拉图主义者,相信有绝对的数学真理,那么一个数学命题的真理性就与你如何接近和得到这个真理的方式无关,原则上,它允许你用任何可能的方式接近它和得到它;同样任何可能的方式都是有可能出错的,显然,“集合论符号化证明”也不例外,因此,它并不能宣布它相对于直观证明的优越性。如果你是一个形式约定主义者,并且你想通过你的形式约定涵盖整个经典数学,那么哥德尔定理表明,你始终摆脱不了形式系统可能的不一致性的困扰。于是你的那一大堆漂亮的符号不能向你提供任何确定的真理,这些符号的一串串的漂亮的排列也就不是什么证明;如果你搞出了一套形式,并且你证明了它的一致性,那它就和我们一直叫做数学的东西没有了太多的关系。这样就像一个人先往墙上开枪,然后根据子弹击中的地方画靶环,因为他从创造他的形式系统起,就对自己足够地好,于是他枪枪十环,大概没有人会佩服这样的神枪手。

 

而对于我们来说,所谓的证明就是把数学命题还原到“纯直观”和“理想化的规定”上。在我们这里,我们也本质的需要证明,因为我们反对神秘主义。我们看一个实例,在数学中有这么样一个奇妙的等式:e的iπ次方等于-1。这显然是很不直观的,因为e是自然对数的底,是一个无理数,e≈2.718……,i的平方等于-1,而π是圆周率,也是一个无理数,π≈3.141……。e的iπ次方怎么会等于-1呢?所以说,数学中的证明是绝对必要的,否则就会导致神秘主义和放弃理性的无条件的接受。但是,证明的含义是按照我们的方式所理解的,即不是把本来很直观的东西搞得很不直观,而是把不直观的东西和一些直观的东西联系起来。从我们这种观点出发,我们会认为若尔当定理的正式证明很像是叔本华讽刺的,锯下两腿以便用拐杖走路的证明。在直观上,若尔当定理是相当清楚的,就像两点之间直线最短一样,从康德的数学哲学出发,我们会说,这是一个先天综合命题。

 

鉴于数学并不能还原成纯直观,所以数学证明也并不能总是只依靠纯直观,数学证明总是需要这样那样的理想化的规定,比方说对条件的理想化的规定,对符号缩写的规定等等,虽然有些东西由于历史和文化的原因,我们没有明确的说出它们,我们默认了它们,但是,如果它们要获得数学的纯粹性,正式的进入数学,它们必须是理想化的规定。因此,从某种意义上讲,证明并不意味着把数学命题还原到“纯直观”和既定的“理想化的规定上”,因为既定的理想化的规定也许还不存在,而是“严格证明的试图”迫使我们必须把什么样的条件作为“理想化的规定引入数学”。

 

现在我们来看一个具体的例子——多面体的欧拉(Leonard Euler,1707-1783)公式,以此来说明“证明”与“直观”和“理想化的规定”之间的关系。多面体的欧拉公式是这样的:对任一个多面体,如果我们用V表示顶点数,E表示棱数,F表示面数,则总有这样的关系:V-E+F=2。如果你觉得这样有些抽象,你可以做一个正立方体,数一数它的顶点数,棱数和面数,然后你会发现:正立方体有8个顶点,12条棱和6个面,并且8-12+6=2。这个结果例证了多面体的欧拉公式。然后你可以做更多的多面体,并且发现它们都符合欧拉公式。但是例证不是真正的数学证明,我们怎么才能证明“欧拉公式”呢?多面体的(V-E+F=2)的关系最先是由法国哲学家、数学家笛卡儿注意到的,但是他并没有给出一个严格的证明。最早的严格的证明是由欧拉作出的,现在我们就较为详细的看一下这个证明:[如下的证明引自美国数学家库朗(R.Courant)和罗宾(H.Robbins)的著作《什么是数学》,由于作图的困难,证明有一定的改动和简化,但没有什么实质的影响。[4]]

 

“为了证明欧拉公式,我们想象一个其表面用橡皮薄膜做成的空心多面体。这时如果剪掉空心多面体的一个面,我们就把剩下的表面变形、展开、平放到一个平面上。在这个平面上,由顶点和边形成的网络和原来的多面体包含同样多的顶点数和棱数,只是少了一个面。我们现在只需要说明:对于这个平面网络来说,V-E+F=1就可以了。首先,我们把这个平面网络按下述方式分成‘三角形’:对网络的某个不是三角形的多边形,我们画出它的一条对角线,这样做的效果是使E和F同时增加1,因此保持V-E+F的值。我们继续画对角线,直到图形完全由三角形组成为止——最终必然如此。现在,我们就从此图形中去掉三角形,有两种情况,并且只有两种情况:1.去掉一个三角形,E和F减少1,而V不变,所以V-E+F的值不变;2.去掉一个三角形,V减少1,E减少2,F减少1,所以V-E+F的值也不变。总之,无论我们用什么样的方式去掉一个三角形,V-E+F的值始终不变,由于我们的图形不是由无穷多的三角形组成,在我们不断去掉三角形的情况下,最终我们将剩下一个三角形,它的顶点数,棱数(边数)和面数的关系是V-E+F=3-3+1=1。欧拉公式得证。”

 

这个多面体的欧拉公式的证明不同于一般的集合论符号化证明,它很符合我们以上对证明的理解,我们之所以接受这样一个结论,因为此证明的每一步都是非常直观的,但是尽管如此,这个证明也不能彻底地还原到“直观”之上,除了一些无足轻重的符号约定以外(比方说用V表示顶点数),我们还需要一些其它的理想化的规定。

为了使我们的证明是严密的,我们必须理想地规定什么是多面体。考虑这样一个形状,在一个大的正立方体里面有一个小的正立方体。按照语义,它应该也是多面体,因为它也有很多面,但是如果它是多面体,那么并不是所有的多面体都满足多面体的欧拉公式。对于这个“嵌套体”来说, V-E+F=16-24+12=4。为了使我们的定理成立,我们必须理想化地规定“嵌套体”不是多面体。

 

现在,我们考虑这样一个形状,有两个正立方体,它们在一个顶点的地方相联接,或者有两个全等的正立方体,它们共用一条棱。在这两种情况下,都有:V-E+F=3,它们也不符合欧拉公式。为了使我们的定理成立,我们还必须理想化地规定:在一个多面体的内部总存在着一个顶点到达另一个顶点的连线,而此连线并不需要经过其它的顶点或者越出该多面体。

 

现在我们可以说,我们的定理对多面体普遍成立了吗?还不行!因为,我们可以考虑这样的多面体,它是中空的,你可以想象一个有棱角的方形轮胎,它既不是嵌套体,也符合我们上面对多面体的规定,但是这样的图形一般地不满足欧拉公式,我们现在怎么办呢?我们作理想化的规定:这样的多面体是复杂多面体,我们的定理只满足简单多面体。

 

在这里,我们清楚地看到了,为了使我们的证明严密,我们一步步地添加了许多理想化的规定,从事后看,这些理想化的规定,对该“定理的成立”来说,都是必须的,没有了它们,我们并不能严密地证明我们的定理。但是,我们在这样做的时候,有人可能又会走向这样的极端,说数学其实是一个约定的事情,一切都归功于理想化的规定。我们也反对这样的观点,因为我们认为“连续”不是理想化的规定,它是纯直观,如果没有了连续,那些理想化的规定都将失去约束力,比方说,在一个欧几里得平面上,一条线可以不知怎么搞的就穿过了另一条线,而没有任何交点。连续也不能用现代数学的方法来约定,现代数学的理想地规定“连续是符合一定条件的集合”的做法有着根本的困难,而连续作为纯直观有着更多的客观性和强迫性。

 

此外,当我们说在数学中一切都是约定的时候还存在着其它的困难。从上面的例子我们可以清楚地看到,证明必须满足两个基本条件:第一,证明总是把不直观的东西和直观的东西联系起来,否则我们要证明干什么呢?难道我们必须用人类的“受虐倾向”来解释数学中的证明吗?第二,证明的严密性需要一些理想化的规定。从数学史的角度来看,有些理想化的规定是由于具体的数学证明之严密性的需要慢慢地添加的,它们都有着很明显的实践经验的起源。但是我们应该清楚的是,一旦它们作为规定进入数学,它们就是理想化的,纯粹的。所以,约定论的另外一个很大的问题是:仿佛人们能够一下子把所有的理想化的规定都想到似的。约定主义看似谦虚,其实不然,如果说数学是约定的(先不论我们对连续性的不同意见),那么人类必须执行上帝的功能,或者人类一下子就可以全览“柏拉图理念世界”。但是考虑到数学中的难题,比方说“黎曼猜想”,我们并不能靠约定来解决它们。对于约定主义来说,这难道不是一个谜吗?我们为什么不能凭借我们强大的约定解决它呢?

 

现在,我们通过一个具体的例子来来看一下约定主义的困难。我们现在来看这样一个无穷级数:(1的平方分之一)+(2的平方分之一)+(3的平方分之一)+(4的平方分之一)+(5的平方分之一)+(6的平方分之一)+(7的平方分之一)+……+(n的平方分之一)[n趋近于无穷大]。这个无穷基数的和是什么呢?我们可以用极限方法判断出这个级数是收敛的,根据现代数学它必须收敛为一个唯一确定的实数,那么,我们现在问:这个实数是什么,它和其它的实数有着什么样的关系?这个看似简单的问题却并不容易回答。事实上,瑞士数学家雅格布•伯努利(Jacob I Bernoulli,1654-1705)从发现这个问题到他死都没有求出这个级数的和。但对于约定主义来说,这个问题也许是简单的,这个基数的和是:ξ。为什么呢?约定如此。你对这个回答满意吗?如果你满意,我们再看下面这个级数:(2的平方分之一)+(4的平方分之一)+(6的平方分之一)+(8的平方分之一)+(10的平方分之一)+(12的平方分之一)+(14的平方分之一)+……+(2n的平方分之一)[n趋近于无穷大]。这个级数的和又是什么呢?约定主义会说,这个级数的和是:Ж。

 

如果我们接着问:ξ/Ж等于什么?如果约定主义说,它就等于ξ/Ж。你对这样的结果满意吗?我想,你是不满意的。其实,我们从来不需要这样的数学家,这样的数学也是苍白的数学和没有任何美感的数学。ξ/Ж有精确的值,它等于4。至于结果为什么如此,考虑到我的论文的性质,在这里,我们就不详细叙述这个结果的由来了,有兴趣的读者可以利用自己的数学知识来为自己找到答案。通过这个例子我想说明的是:约定,作为理想化的规定,并不是彻底自由的,它们要和纯直观协调,它们自身也要互相协调。此外,任何精心的约定都不能很好地涵盖住我们称之为数学的东西。所以,我们并不同意约定主义的观点,因为他们认为:定理的证明就是把定理还原成既约规则。我们也不同意柏拉图主义的看法,认为数学的一切东西都存在于柏拉图的理念世界里,就等着我们去发现。而我们跟随康德,认为“纯直观”先天地存在于人的内心,数学活动就是往纯直观空间里添加理想化的规定,康德本人,在忽略一些细节的情况下,对此也有类似的表述:“……在空间中对一个直观先天地加以规定(形状),对时间加以划分(延续),或者仅仅对有关同一个东西在时间和空间中的综合共相、以及对由此产生出的一般直观的大小(数)加以认识,这却是通过对概念的构造而做的理性工作,它叫做数学性的。”[5]所以,我们认为证明是力图把命题还原到“直观”和“理想化的规定”上,但是,这些理想化的规定并不总是既定的,有时它们产生于“证明本身的强迫”。

 



[1]余家荣编:《复变函数》,高等教育出版社2000年版,第170页。

[2]参见[美]R•柯朗、H•罗宾著:什么是数学》,左平等译,复旦大学出版社2005年版,第252页。

[3][德] 叔本华:《作为意志和表象的世界》,石冲白译,商务印书馆2006年版,第114页。

[4][美]R•柯朗 H•罗宾:《什么是数学》,左平等译,复旦大学出版社2005年版,第246-247页。

[5][德] 康德:《纯粹理性批判》,邓晓芒译,杨祖陶校,人民出版社2004年版,A724/ B752。

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有