牛顿-莱布尼兹微积分没有极限思维吗?
(2023-01-12 13:46:53)
(一)“伪史论者”文行先生认为
“西方伪史论者”文行先生认为,牛顿-莱布尼兹微积分没有极限思维,西方先有积分微分,后有达朗贝尔、柯西等人的极限定义,这与目前高等数学(数学分析)教材编排顺序“先极限,后微分积分”顺序相反,高等数学教材反倒与中国古代“增量—割圆术—极限—无穷小—导数---微积分”顺序一致,因此认为西方(牛顿、莱布尼兹等)抄袭中国,然后花了一百多年时间消化极限。于是这位文行先生写出《微积分不可能是西方原创发明》、《微积分发源于中国明代中国》、《西方微积分伪史之真相“八部曲”》等“雄文”。
那么牛顿、莱布尼兹在创建微积分时,有无极限思维?这是一个关键问题。
关于这个问题,我在近三十年前的高中时,就可以回答:牛顿、莱布尼兹在创建微积分时有极限思维(dy、dx是非零的极小数值),但是没有达到现代“数学分析”意义上的严格定义极限水平(ε-δ语言),但是牛顿、莱布尼兹已经有极限思维,这已经足够创建微积分了;或者说,牛顿、莱布尼兹用的是“直观无穷小”观念,虽然从数学体系的严格角度来讲,“直观无穷小”是粗糙的,但是这在物理学中已经足够运用了(而物理学正是微积分的用武场所),因此无损其荣光。
牛顿关于极限的定义是这样的:“两个量与量之比(作者注:这个比可以理解为导数ds/dt),如果在有限时间内不断趋于相等,且在这一时间终之前互相靠近,使得其差小于任意给定的差,则最终就成为相等。”
看这里的关键词“在这一时间终之前互相靠近,使得其差小于任意给定的差”,这已经具有后来的柯西、威尔斯塔拉斯ε-δ极限定义语言的雏形了。这怎么叫牛顿没有极限思维?明明有。
文行先生的观点中有一个偷梁换柱问题。他把牛顿时代没有现代严格的“极限”定义,偷换理解为牛顿时代没有“极限”定义。那么,既然他们没有极限定义,牛顿是怎么创立微积分呢?绝对不可能创立,那么只能是抄袭中国的微积分。文行先生这完全是不对等比较。
为什么我有这个认为呢?我在高一时,在一个街头旧仓库用一元钱买了一本微积分简明读本。当时那个仓库地面上铺满了各种旧书。我对这本书如获至宝,就直接拿来自学微积分,我几天内就学会了微积分的基本数学公式,并能将之运用到一些力学物理问题中去。我当时并不觉得微积分这里存在什么疑难“矛盾”,直到在一本书中(可能是当时课堂学习的“政治课本”中关于认识论)读到了一段当年贝克莱主教对牛顿微积分的批评,说导数dy/dx中的dy和dx既是零又不是零,这是矛盾的。
我当时看了这段话,觉得贝克莱主教批评得实在是毫无道理。在导数dy/dx中,dy和dx当然是非零的极小数值,它们相除,是一个有限值,怎么叫dy和dx有“既零又非零”的矛盾?用瞬时速度是很容易讲明白这个概念的,譬如一个粒子在时刻t=5秒附近,即5-0.0000001秒和5+0.0000001秒之间位移了ds=0.0000004米,那么所花时间为dt=0.0000002秒,粒子瞬时速度ds/dt=2米/秒。时间变化量dt=0.0000002秒相对于ds=0.0000004米而言,彼此都是非零,因此ds/dt是有限数值,但是dt=0.0000002秒相对于t=5秒,则是可以看作零。这不存在什么矛盾。
再打一个比方,我的财产ΔC相比于马云财产而言,是零(我的财产加在其上,谈不上算增加),但是我的财产也能买几套房(财产/房价,也有几百平方米),我这个财产看上去“既是零又不是零”,但它们并不矛盾。
我以上没有用到“极限”这个词,但是处处渗透了“极限”思维(dy、dx、ds、dt都是非零的极小数值),也就是ds、dt是不是0,要看与它比较的量而言的。所以,我在高中时,对于贝克莱主教批评牛顿-莱布尼兹微积分有dx“既零又非零”的矛盾,我感到大为纳闷、困惑,觉得贝克莱主教完全是胡言乱语,明明这个dx不存在什么难以理解的矛盾。
以上是我个人的一段认识经历。纵观牛顿等人创建微积分时的有关叙述,可以发现,他们其实也是有以上与我类似的“极限”思维(非零的极小数值、“直观无穷小”观念)的。这种“非零的极小数值”思维,只要头脑正常,它是自然而然的思维认识产物,只要你去做一些简单的计算过程就可以认识到。譬如计算一下抛物线的切线斜率(顺便说明,当年导数的概念源于曲线斜率和瞬时速度。牛顿老师巴罗就对此有研究),设抛物线方程是y=x^2,那么抛物线上某点切线的斜率Δy/Δx=[(x+Δx)^2-x^2]/(Δx)=[2xΔx+(Δx)^2]/(Δx)=2x+Δx, 于是切线斜率是2x(其中,Δx比起2x来说,可以忽略不计,Δx当零;但是在Δy/Δx中,Δy和Δx是非零的小量,它们相除,是一个有限数值)。所以,Δx既零又非零,并不存在矛盾。Δx是否当零,是需要看与它比较的量而言的。这其实就是“极限”思维的体现,虽然我这里没有用到“极限”这个词,没有用到魏尔斯特拉斯的ε-δ语言。
(二)牛顿-莱布尼兹有极限思维,足够用于创建微积分
“极限”思维自古有之,“极限”思维在中西方多个民族早期数学中都有。古希腊人的穷竭法也蕴含了极限思想,其中安提丰(Antiphon,约公元前430年)在求圆面积时, “先作圆的内接正方形,然后将边数加倍,得到圆内接正八边形,再加倍得内接正十六边形,依次继续下去,以为这样圆与内接正多边形的差将被穷竭”。三国刘徽割圆术,与此类似, “割之弥细,所失弥少。割之又割,以至于不可割,则与圆合体,而无所失矣”,此时,圆的面积与正多边形的面积相差就越来越小。这都是极限思维的体现的一个例子。以上这些工作中的极限概念其实也是“非零的极小数值”、“直观无穷小”水平。
下面引用《极限理论发展简史(一)》内的一段话,进一步理解古代关于“极限”思维的理解水平:“穷竭法”后来由古希腊的大科学家阿基米德(Archimedes,公元前287-前212)加以改进。他在用“穷竭法”求抛物线的弓形面积时,发现这种方法似乎还不够严密,因此在获得结果后再用归谬法,从逻辑上证明了结果的正确性。他发现第n个多边形的面积与抛物线弓形面积有一个差值。由于随着n的增大,这个差值也将越来越小,直到不可能是一个确定的大于零的常数,但这个差值也不可能是小于零的,因此根据归谬法差值只可能等于零。阿基米德在此提出了一个相当于现在无穷小量的概念。同时我们可以看到阿基米德所使用的归谬法正是柯西极限思想的雏形,也就是说现行极限思想只是阿基米德用来证明“穷竭法”结果的方法的思想。
阿基米德、刘徽等人都是在默认使用极限这个数学概念(直观上的研究),却又缺乏对极限进行系统的深究。文行先生所谓的认为西方(牛顿、莱布尼兹等)在微积分上抄袭中国,然后花了一百多年时间消化极限,这个观点是不对头的。古代中、西方对于“极限”的研究,不存在谁比谁特别强的地步,并不存在“西无、东有”现象。
“极限”思维自古有之(古希腊多位学者有研究),牛顿和莱布尼兹已经继承,这对于他们创建微积分已经足够了。牛顿关于极限的定义是这样的:“两个量与量之比(作者注:这个比可以理解为导数ds/dt),如果在有限时间内不断趋于相等,且在这一时间终之前互相靠近,使得其差小于任意给定的差,则最终就成为相等。”这段话等于在说dt和ds是非零的无限小数值,它们之比ds/dt是确定的数值。对于dt这样的“非零的无限小数值”,为什么dt这样的零,可以放在分母,dt到底是不是零,英国大主教贝克莱就进行疯狂的批驳。
虽然我认为从实用性角度(例如物理计算)而言,牛顿关于极限的定义已经足够了,贝克莱主教的批驳意义不大,但是牛顿的直白的话,在数学严谨性上是不足的(但是无损其微积分荣光)。
18世纪达朗贝尔关于极限的定义是“一个量是另一个量的极限,假如第二个量比任意给定的值更为接近第一个量”。这似乎好了一些,但是仍旧没有回答dt是否是零(如何是零,如何不是零)。牛顿和达朗贝尔只是给出了直观上的定义,但是没有给极限概念以定量的过程的定义。
之后,柯西给出的极限定义是“当一个变量逐次所取的值无限趋于一个定值,最终使变量的值和该定值之差要多小就多小,这个定值就叫做所有其他值的极限值,特别地,当一个变量的数值(绝对值)无限地减小使之收敛到极限0,就说这个变量成为无穷小”。
柯西这段话的要点在于认为无穷小是以0为极限,回答了为什么dt作为分母时,可以不当作零,但是dt与t相加时,又可以当作零这样一个“既零又非零”的问题。其实,柯西的话,前人都懂,牛顿也懂,只是牛顿没有说得如此精密而言。
柯西的话已经足够精确了,但是从数学分析的角度来看,似乎显得太直白因而导致粗糙,虽然其已经有极限逼近的过程,但是缺少定量的数学表述,于是魏尔斯特拉斯提出了ε-δ语言,来严格定义极限:对于任何ε>0,总存在自然数N,当n>N时,|x-x_n|<</span>ε总存在,那么x_n就是这样一个极限。
(三)文行先生的偷梁换柱
文行先生认为“西方先有积分微分,后有达朗贝尔、柯西等人的极限”是反常的过程,因此只能解释为西方抄袭中国。这是不对的。正确的说法应该是:西方也是先有直观的极限思维(此水平不低于中国),这已经足够创立微积分了,因此有了积分微分,后有达朗贝尔、柯西等人(包括魏尔斯特拉斯)的一步步地对现代极限严格概念进行跟进。
文行先生的做法中有一个偷梁换柱。他把牛顿时代没有现代严格的“极限”定义,偷换为牛顿时代没有极限定义。那么没有极限定义,牛顿是怎么创立微积分呢?不可能创立,只能是抄袭中国的微积分。文行先生这完全是不对等比较。
这位文行先生的风格是喜欢在查文献的基础上,振振有词地下“胡言乱语”的结论。文行先生还有一个类似的不对等比较。他将温伯格等人的话诸如:“北京一个小组的理论物理学家长期以来坚持一种类型的夸克理论,但将其称之为层子,而不称之为夸克,因为这些粒子代表比普通强子更深一个层次的现实”(见温伯格著《最初的三分钟》),演绎为:西方的夸克模型模型抄袭中国的层子模型,西方篡改历史,让夸克模型变为原创和主流。
其实,夸克与层子模型,在具体细节上没有任何相似性(按照杨振宁的说法,其意思是,层子模型在细节上走错了方向。其实这也不需要引用杨振宁的说法,任何一个物理系学生,只要学过近代物理课程,都知道这一点)。夸克模型在1964年已经完成了封顶工作(理论与实验符合),盖尔曼进行命名“仪式”,命名质子、中子内的物质客体是夸克,而中国1964年胡宁等人才组队开始调研盖尔曼的工作。你怎么能说夸克模型抄袭层子模型?
层子模型的缘起是:毛 泽 东 主 席1963年夏天在看了日本坂田昌一的《基本粒子的新概念》一文后,提出“物质无限可分”思想,促使北京大学胡宁先生领导的理论组调研“基本粒子SU(3)对称性理论”,了解国际上在1962-1964年的强子对称性理论及基于对称性表示理论提出的基础客体“夸克”(这些是盖尔曼夸克理论核心),1964-1966年研究质子、中子的亚粒子性质,1966年正式将亚粒子定名为层子。当然,你也可以说1963年毛 泽 东 主 席已经有“层子”哲学概念萌芽,这比1964年盖尔曼提出“夸克”命名早一年。但是问题是,层子概念当时只是萌芽,还没有具体工作,盖尔曼已经完成了细节研究工作。文行先生你这是不对等比较。
再说,要说质子、中子内部到底是否有内部结构,1956年,美国霍夫斯塔德等人在在斯坦福直线加速器中心的深度非弹性散射实验已经证明了质子、中子内部有点状粒子行为。这是实验,不是哲学猜测。
顺便提一下,夸克模型的内容包括以下主干(包含时间节点。文行先生还认为夸克模型抄袭层子模型吗?):
1955年提出的盖尔曼-西岛分类;
1961年盖尔曼和尼艾曼的SU(3)八重态法;
盖尔曼(1961)-大久保(1962)强子质量公式;
1962年盖尔曼预言质量分别为1532兆电子伏特和1679兆电子伏特的粒子(两年后得到实验证明。这是盖尔曼获得1969年诺贝尔物理学奖的直接原因);
1964年盖尔曼出版书籍《The Eightfold Way》(《八重法》,Benjamin出版社),系统阐述他的强子分类理论;
1964年盖尔曼把以上内容中的客体称为基本粒子“夸克”(满足SU(3)对称性,认为组成强子的夸克一共有三种。“夸克”取名自诗歌集《芬尼根彻夜祭》内的一句话“向马克王三呼夸克”)。
温伯格上面话中,“长期以来坚持......将其称之为层子”,其实,“长期以来”不是事实,因为夸克模型在1962年基本完工、1964年作为对基本粒子的命名(封顶完工),而胡宁先生领导的理论组在1964-1965年却才开始调研强子分类、夸克模型的国际研究进展和进入研究状态。除非我们在盖尔曼1955年的盖尔曼-西岛分类、盖尔曼和尼艾曼1961年的SU(3)八重态法之前多年就已有关于层子工作的纯物理的钻研,那么才可以说是“长期以来坚持”。
(四)关于文行先生说牛顿抄袭的一个例子
为了证明牛顿抄袭,文行先生举了一个例子(为了方便,我概括他的文章此段内容如下):他先引用“William Dunhamw,《微积分的历程》,李伯民译,人民邮电出版社,2010,第14页”,里面叙述到:牛顿有一个关于曲线下方面积的命题,设曲线是y=ax^(m/n),那么该曲线下方与横坐标[0, x]所围的面积为S=[an/(m+n)]*x^[(m+n)/n]。此命题相当于在说积分∫[ax^(m/n)]dx=[an/(m+n)]*x^[(m+n)/n] (积分区间为[0, x])。
文行先生看到此,开始评价说:“这是一个非常基础和非常伟大的微积分法则公式。牛顿如何得到这个法则公式呢?牛顿并没有写出得到该法则公式的过程,似乎是从天而降。牛顿也没有直接证明它,而是从其结论出发反推回来……”、“这相当于某人不知道该题怎么解,却事先知道了答案,然后根据答案反推,从而证明了该题结论,尤其是牛顿突兀地“指定”曲线AD的面积为幂函数z(x),为什么不指定为三角函数或其他类型的函数?从天而降的面积幂函数是解该题的关键之一。这是非常明显的抄袭!”“在我看来,证明固然算不上,说明也算不上,其实是抄袭!更大的问题在于牛顿对微积分一系列基础概念的认识和理解都存在严重问题。诸多地基、柱础都没有打好,高楼大厦已经平地而起,高耸入云。同样,莱布尼茨也是如此。” “牛顿和莱布尼茨等都无法理解和解释微积分思想内容上一系列基础的知识和逻辑问题,却已经向一系列更高的微积分推理、法则、公式、扩展等高歌猛进。”
看到这里,我笑岔了气。牛顿这个公式真的很难吗?他得不到吗?这是一个很显然的结果,只要用“牛顿二项式公式”,就可以立即得到牛顿这个结果:积分∫[ax^(m/n)]dx=[an/(m+n)]*x^[(m+n)/n]。
今天我大概是第三次看到关于牛顿这个积分的史料。第一次是在高中(学到“牛顿二项式公式”前后),第二次、第三次都是在文行先生文章中。
其实,牛顿这个积分∫[ax^(m/n)]dx=[an/(m+n)]*x^[(m+n)/n]表面上看起来复杂,但实际上很简洁,所谓m+n、m、n这些量只是一个“幌子”。只要令(m+n)/n=b,那么牛顿这个公式就可以化为:∫ax^(b-1)dx=(a/b)x^b 。两边约去一个常数因子a,得到∫x^(b-1)dx=(1/b)x^b 。简单吧?简单。
那么牛顿这个公式是怎么来的呢?其实,在牛顿时代,这个公式的推导有三、四种方法【将另文指出】。使用类似阿基米德、三国刘徽的“穷竭法”,也是可以得到的。但我在这里,要指出一种方法,就是我在高中时想到用牛顿在1664-1665年提出的“牛顿二项式”公式是可以得到牛顿这个积分的∫x^(b-1)dx=(1/b)x^b。 我在高一学习过微积分,在高二数学学到“牛顿二项式”公式。
牛顿二项式公式说的是:设x和ε是任意数字,那么它们之和的b次方,可以展开为:(x+ε)^b=x^b+bx^(b-1)*ε+[b(b-1)/2] x^(b-2)*ε^2+……(共计b+1项之和)。顺便说,其中展开系数1、b、b(b-1)/2……可以组成三角形,在中国叫“贾宪-杨辉”三角,在欧洲叫“帕斯卡”三角。对于我们现在的微积分问题而言,ε是一个任意小(足够小)的非零数值,这个“牛顿二项式公式”只要展开到前两项就可以(简单吧),其余都是牛顿极限定义中说的“其差小于任意给定的差”,即可以忽略的无穷小量,即:牛顿二项式公式取前两项为(x+ε)^b=x^b+bx^(b-1)*ε , 那么(x+ε)^b-x^b= bx^(b-1)*ε,或者进一步化为:(1/b)(x+ε)^b-(1/b)x^b= x^(b-1)*ε这个式子有几何含义:右边x^(b-1)*ε是高为x^(b-1)、宽为ε的细条形状面积,那么左边(1/b)(x+ε)^b-(1/b)x^b就是两个面积函数S(x+ε)、S(x)之差(等于细条形状面积),于是函数x^(b-1)下方与横坐标[0, x]所围的面积正是(1/b)x^b,也就得到牛顿的公式:∫x^(b-1)dx=(1/b)x^b。只要对牛顿二项式公式熟悉,这个结果是可以在走路时凭着心算得到的。
这是我在高中时就认识到的(用牛顿二项式公式证明牛顿的积分公式),牛顿那时当然也可以认识到这一点。当然,此公式在牛顿时代有三四种证明法,我不再赘述。我想说的是,牛顿这个积分公式是很显然的,文行先生说牛顿抄袭(所谓“牛顿如何得到这个法则公式呢?……似乎是从天而降。牛顿也没有直接证明它,而是从其结论出发反推回来……”、“这相当于某人不知道该题怎么解,却事先知道了答案,然后根据答案反推,从而证明了该题结论……从天而降的面积幂函数是解该题的关键之一。这是非常明显的抄袭!”),这是很无端的指责。
此外,文行先生还有一个措辞很强的质疑:“尤其是牛顿突兀地“指定”曲线AD的面积为幂函数z(x),为什么不指定为三角函数或其他类型的函数?从天而降的面积幂函数是解该题的关键之一。这是非常明显的抄袭!”
我对这段话有几个纳闷:1)牛顿其实没有突兀地“指定”曲线AD的面积为幂函数,我上面已经证明,只要用“牛顿二项式”,他的面积结果只能是幂函数,不需要指定、不需要假设;ii) 文行先生为什么要反问“为什么不指定为三角函数或其他类型的函数?”,我很纳闷,因为只要用“牛顿二项式”,他的面积结果只能是幂函数,不需要指定、不需要假设。所以,文行先生这个问题问得莫名其妙。
(四)关于“江湖民科”贝克莱大主教
虽然在达朗贝尔-柯西-魏尔斯特拉斯之前(ε-δ语言之前),关于极限的定义具有直觉性、粗糙性,但是这不等于说前人不理解极限,只是他们认为这个概念平凡,没有像ε-δ语言一样用定量的过程语言来精确表达而已。牛顿等人已经继承了极限概念,在微积分中已经渗透了极限思维,这已经足够帮助他们建立微积分了。
虽然贝克莱主教关于微积分dx“既零又非零”这一诘难,有其道理,但是作为一个“喷子”,喷得其实没有道理。作为数学家,达朗贝尔、柯西、魏尔斯特拉斯,承认牛顿等人的微积分是对的,只是认为微积分要用严格的极限定义作为基础,于是逐步创建了极限理论,但是贝克莱与他们不同,他是在否定微积分。因此,可以说,贝克莱担当了“键盘侠”、“杠精”、“喷子”的角色,攻其一点,不及其余,乐于做“破坏者”。 此问题dx“既零又非零”这一“佯谬”是不需要喷的。这一佯谬只说明我们关于dx的认识有待深化,是人的认识暂时不足问题,而不是微积分本身的问题。
过去20多年来,我时不时地想起贝克莱主教这个“喷子”,我总认为他明明喷得没有道理,为什么却有这么大信心去喷?网络和微信,让我们发现了一大批这样的“喷子”和“杠精”。看来,这样的贝克莱,无所不在。
最近就遇到这样一个人。他对爱因斯坦一篇关于引力场内的光线偏折的论文内的一句话“单位距离上的光线速度改变量”表达了质疑(含沙射影或者直白地骂爱因斯坦)。用数学语言说,单位距离上的光线速度改变量其实就是dC/dx,这里dx是一个单位长度,当然,它也是一个任意小的距离,在一定范围内,无论dx取多少,都不影响dC/dx的取值。这好比在太平洋洋面上,研究单位距离上的盐溶液浓度C的变化率dC/dx,无论你的dx取单位距离一米还是一千米,都不影响dC/dx的取值(一米和一千米,对于太平洋洋面而言,都是无限小的单位距离)。原本这里不存在什么疑问。可是这位老兄非得认为“单位距离上的光线速度改变量”中的“单位距离”有问题,这个单位距离爱因斯坦没有说多少,如果说是一米和一千米,那么结果就会差一千倍云云。这真是哭笑不得。我说,既然你不喜欢“单位距离”这个词,你不理睬就可以,这里不存在什么矛盾和疑难,连一个插曲都算不上,没有必要在这个问题上去空质疑。
杠精的思维,我们无法理解。