加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

科学的推理方法和模型

(2017-05-10 09:16:39)
标签:

365

科学方法

模型

教育

历史

著名物理学家史蒂芬.霍金在他2010年的《大设计》一书中提出人类对于宇宙的理解都是基于模型的认知。问一个模型是否真实没有意义,问模型是否与观察结果相符才有意义。而所有的科学理论都是一种有效模型。他认为一个好的有效模型在它的适用范围内应该具备下面的特点:

1.         它是优美的(简洁)

2.         不包含任意的,可调整的要素

3.         符合并能解释现存的所有观察

4.         能够详尽预言未来观测,如果预言不成立则可证伪模型

 

这个观点实际上是说科学理论并不等于真实的自然规律, 而只一个符合人类观察的自然规律模型。或者说只是自然规律在人类感知中的一个映射。同样的自然规律在其它生物的感知中可能会有不同的映射。早在中国春秋时期庄子说你不是鱼,怎么知道鱼之乐,反映的就是这样的思想。

 

霍金指的模型是数学模型,因为他是物理学家,总是使用数学模型。但是数学模型不一定都是基于数值的模型, 数理模型就是一种利用一组形式语言和推理规则来研究逻辑关系的数学模型。 后面我们可以看到中国古代发展起来的一套科学体系也没有使用基于数值的数学模型,而是采用基于序的数学模型。

 

人类创造用来描述宇宙规律的模型具有金字塔结构:在金字塔底部的模型基于人类可以直接观察到的,符合人类直观的现象作为基础推导出的自然规律,比如牛顿力学是以牛顿三定律和万有引力定律为基础假设推导出的。而在第二层的模型则不那么直观,因为它们依赖仪器设备观测到的结果作为基础来推导出自然规律,比如麦克斯韦尔的电磁方程,原子模型,和量子模型。 更上一层的模型需要大型的科学设备如电子对撞机所观测到的结果作为基础来推导出更加微观量子世界,或宏观宇宙的模型。一个模型中的基本假设往往是上一层次模型推导出的结果。在金字塔的顶部是宇宙的终极模型,它的基础应该是宇宙最基本粒子及其规律,但是人类自身对于宇宙认知的限制永远不可能达到这个顶部。

 

一个科学理论模型的局限性也是它的优越性所在。因为这可以简化模型,让它只包括对所关注对象有重要影响的因素,而不需要考虑所有对它有影响的因素。比如在机械设计所使用的力学模型中,既不用考虑微观基本粒子的量子影响,也不需要考虑广义相对论的时空变形影响。简化的模型普遍使用在各种科学研究,技术发展,和工程设计中。

 

一个简化的模型肯定不是自然规律的真实的模型,甚至不是一个准确的模型。但是只要这个模型满足人类对于自然规律认识的需要, 或是满足人类在工程技术上的需要就是可接受的有效模型。

 

建立科学理论体系有两种主要的推理方法: 西方科学从古希腊到牛顿的科学都以亚里士多德提出的演绎方法为主。 演绎方法使用严格的逻辑推理从假设(公理或定律)开始推断定理, 然后利用定理进一步找出事物因果之间准确的关系。 演绎法是从一般规律推断具体的特殊规律的方法,这样建立的理论体系因果之间具有可以用解析公式准确表达的确定关系。

 

另外一种推理方法是归纳法:它是从由个别到一般的论证方法。它通过观察大量重复出现的事件,归纳出它们所共有的特性,从而得出一个一般性的因果关系结论。在不同文明的早期发展阶段,都独立发展和使用过这样的归纳方法来认识自然界的规律。

 

古典归纳法只是通过有限观察来论证特例的一般性,所以它在逻辑上是不严格的。为了解决这个问题,现代归纳法引入概率论和公理方法完善归纳法。 数理经济学家约翰·梅纳德·凯恩斯(1883 – 1946)在1921年发表<</span>概率论>,主张概率是命题间的逻辑关系,在此基础上构建概率演算的公理系统,创立了现代归纳逻辑方法, 也就是统计推理方法。

 

莱辛巴哈在1934年发表<</span>概率理论>, 主张用"相对频率的极限"定义"概率", 创立频率概率论,把现代归纳逻辑的研究,推进到一个新阶段。在中华文明中历史上,一系列应用科学体系都是利用大量统计数据的归纳方法逐步建立起来的,比如中医和命理。

 

随着科学的发展, 人们意识到演绎方法有其局限性。如果所研究的问题具有太多相互作用的因素, 那么很难使用演绎方法准确的找出这些众多因素对于结果的影响。而基于概率的归纳推理方法不要求确切的找出所有因素和结果之间的因果关系, 而是去找出在一定概率下主要因素和结果之间的因果关系,它的表达形式为: 如果某个因素出现, 有多大的可能性相应的结果发生, 比如天气预报和地震预报都是使用概率统计推理方法。 今天统计推理方法在不同的科学和应用领域已经得到越来越广泛的采用,比如统计物理学,天气预报,金融交易模型等等。统计方法的本质是在影响结果的因素不完整情况下的推理。

 

凯恩斯认为演绎推理和统计推理都是人类获得知识的科学和有效的方法。 演绎推理是统计推理的特例 不确定性为零。统计推理不要求非此即彼的结果,也就是说由A不一定确定得到B,但是有确定的概率得到B。凯恩斯重视统计推理的原因是人类社会相关的问题,比如他自己研究的经济问题,总是包含大量随机的影响因素,只能使用统计推理方法进行研究。

 

在一个模型里,如果一些因素对结果的影响可以忽略不计,那么模型就不必考虑这些因素,而且模型是确定性的。但是在很多情况下,很多影响因素都能对结果产生显著影响,而我们又无法找出这些影响和结果之间确定的关系。这类问题的结果被称为具有随机性,意思是人们没法百分之百的确定什么结果将会发生, 掷骰子就是这样的例子。

 

现代物理学中的量子理论认为随机性是基本粒子的特性,而确定性只是极端情况下的特例。在人类可以直接观察到的尺度上, 确定性的因果关系普遍存在于人们日常生活所见的现象里, 比如加大汽车油门, 水平行驶的汽车的速度一定越来越快。但是随机现象同样大量存在于人类社会和自然当中,比如交通路况的变化,经济增长的变化等等。

 

自然规律本质上都是事物之间相互影响的因果关系, 所以未来发生的一切都可以由目前的状态和外界环境的影响决定。 原则上只要掌握的信息足够充分, 无论是天气, 地震, 还是人类命运都是可以预测的。但是由于人们不可能把握影响一个事件的所有因素,所以很多情况下只能利用有限的信息来预测一个事件的结果。在这种情况下,因为信息的不完备只能得到原因和结果之间的概率性因果关系, 而不是确定的因果关系。

 

17世纪中叶法国科学家布莱斯.帕斯卡和皮埃尔.费米为了研究在掷骰子和打牌中如何取胜发展出最初的概率模型,第一次用数学方法推导出量化的不同事件的概率,建立起统计学的数学基础。

 

17世纪六十年代开始,欧洲一些学者开始用统计方法编制和分析各种社会数据,希望从中发现经济发展的规律。到了18世纪,比利时科学家阿道夫.凯特勒利把统计学应用到更加一般性的社会问题中,引入“平均人”的概念来分析社会问题。 这和之前利用统计学方法处理社会问题的宏观数据不同, 第一次研究大量个人在社会层次上产生的整体影响。凯特勒认为,人类的个体行为看起来复杂多变不可捉摸, 但是当考察大量个体行为时就呈现出规律性。 在特定的社会状态下,特定的影响因素产生特定的效果。这些效果围绕固定的均值波动。他相信,虽然历史趋势和历史事件显得混乱,但统计方法可以从中找出可预测的范式。

 

凯特勒认为从大量“平均人”的行为可以预测社会现象,但是反过来统计方法不能预测个体行为。但是他也指出由于受到法律道德等社会条件制约,人的选择有局限性。即使最简单的决策,也会受到习惯,需求,人际关系和其它各方面因素的影响。

 

受凯特勒在研究社会问题中使用“平均人”思想的影响,物理学家詹姆斯·麦克斯韦在研究大量气体分子运动时使用了分子平均运动的概念,成为统计物理学的奠基人之一。

 

现代统计方法和理论的奠基人是英国的罗纳德.费希尔,他从剑桥大学毕业之后在一个偏远的农业作物试验站工作多年,在农作物育种进化和优化的实际问题中发展统计学方法,上世纪20年代创建了普遍适用,被称为“实验设计”的应用统计方法和理论基础。“实验设计”被用来分析哪些因素对于结果有“显著”的影响,而哪些因素没有“显著”影响。这样就可以舍弃没有“显著”影响的因素,在有“显著”影响的因素和结果之间建立大概率(如95%置信区间)的因果关系。他的学生和女婿乔治.伯克斯继承和发展了费希尔建立的应用统计方法和理论,并成功的在二次大战之后把应用统计概念和方法引入到美国,在各个领域获得广泛的应用。

 

在现代科学里面,社会和经济这些领域的研究远远落后于物理,化学,甚至生物。一个重要的原因在于这些领域不像物理可以把研究对象抽象为不受外界影响的孤立系统来进行简化的分析。社会和经济都是由大量相互作用的个人组成的系统。科学家们已经意识到如果把社会看成一个整体,就需要发展出一套类似热力学研究大量分子随机运动的理论体系。但是目前这样的理论体系还远不成熟完善。

 

为了研究个人对于经济问题的影响,上世纪四十年代后期数学和物理学家冯·诺依曼和经济学家摩根斯坦发表了《博弈论与经济行为》将博弈论系统地应用于经济领域,从而开创了这一学科的基础和理论体系。在这之后,很多数学和经济学家继续发展了博弈论方法并尝试在经济学理论上使用这些方法。从1994诺贝尔经济学奖授予3位博弈论专家开始,共有6届的诺贝尔经济学奖与博弈论的研究有关。但是博弈论方法有个基本假设,就是每个人都是理性的,一个人所做的决策都是基于理性的思考。这是一个限制性极强的条件,事实上也是理想化和不实际的假设。从我们每个人的生活经验就知道,很多时候一个人做决策是情绪化的,而不是理性的。

 

上世纪中叶经济学家受物理学和博弈论的影响,以所有参加经济活动的个体都是“理性的经济人”为前提假设,并以物理中使用的数学作为工具把古典经济学改造成为新古典经济学。这个学说的主要思想认为自由市场经济总是会在大量经济人的理性化决策条件下自动达成一种平衡的最优状态, 也就是物理学中的稳定吸引子状态。如果发生对于最优状态的偏离,市场机制也会自动纠正使得它回到平衡状态。

 

亚当.斯密在1776年发表的“国富论”是经济学的奠基性著作, 他指出有只“看不见的手”在不以人的主观愿望为转移推动着经济的自然发展。这个论述隐含着两个重要的观点:首先是个人主观愿望不会影响社会经济活动的大趋势和结果。 斯密的思想并没有被很多后来的经济学家和科学家们所完全理解。比如在博弈论和新古典经济学里, 不但假设参加经济活动的个人都是具有同样的理性思维的, 并且假设决策的过程和其它社会活动没有关联。 斯密在作历史性推断时候并没有假设所有进行经济活动的人都具有同样的理性思维和决策, 也没有假设其它社会活动对他们没有影响。他是在观察一个实际的社会经济活动之后得到自己的结论, 而不是根据理想化的假设。 斯密的第二个重要观点是他并没有说经济的自然发展总是会稳定在一个“最优”状态。如果一个系统总是处在一个稳定状态,那么它就不会增长和发展。

 

19872004年担任美国联邦储备委员会主席到艾伦.格林斯潘曾经指责以理性经济人假设(指经济活动中每个人都是理性做决策)为基础的模型在经济学已占据太久的统治地位,我们喜欢把人的本性的驱动力界定为理性,而且是其它所有生物不可比拟的。这个说法无疑很合理,但我们距离新古典经济学家所描述的理性人的理想原型却又差得很远,他们所设想的人完全被理性的长期利益思考主宰。

 

面对人类发展面临的挑战,科学家和经济学家从上世纪60年代开始从不同领域开始关注一些非传统的新问题: 计算机科学家利用计算机模拟人的思维推理建立人工智能的学习,推理,和解决实际问题的方法;经济学家提出和新古典经济学“投资回报低减”观念相反的“投资回报递增”的理论和实例;生物学家研究生物如何产生和进化,以及人工生命的概念;物理学家发现了非线性系统混沌,突变,和自组织现象。

 

在上世纪60年代和70年代,上面这些研究都是分散的,除了物理学中混沌,突变,和自组织得到广泛的关注,其它研究都在各自领域处在边缘得不到普遍认可。直到1987年由美国洛斯阿拉莫斯国家实验室的物理学家乔治.考温提议并主导建立的独立研究机构桑塔费研究所,邀请来着各个领域研究非传统新问题的科学家,召开了一系列的研讨会,大家才发现各自研究的问题都有一些共性。来自密西根大学计算机系教授约翰.荷兰德把这类问题归纳为复杂适应性系统。

 

一个复杂适应性系统具有四个显著特性:首先这样的系统都是由许多平行发生作用的“作用者”组成, 它们相互作用是分散没有中心控制的。 每个作用者可能永远无法找到“最佳”作用方式,它们只能根据其它作用者的行为改变和改善自己;其次这样的系统是多层次组织,每一个层次作用者对于更高层次作用者起着建设砖块作用。复杂适应系统可以吸取经验,从而经常改善和重新安排它们的建设砖块;第三所有复杂适应系统都会预期将来。这种预期基于自己内心对于外部世界的认知的假设模型之上;最后复杂适应系统具有很多小的生态环境,每一个小生态环境都可以被其它能够使自己在其中发展的作用者所利用。 而且每一个作用者填入一个小生态环境之后又打开其它的小生态环境,这就为其它共生者提供了更多的生存空间。所以这样系统永远不能达到均衡状态。

 

复杂适应系统的观念无疑包括了人类社会,经济,地球生态,和生物体。它们都是由大量基本作用者组成的系统:人类社会的作用者就是个人,上层是各级人类组织,包括家庭,工作单位,城市,国家;经济的基本作用者是人,再上层是企业, 金融公司,流通和销售渠道等;地球生态的基本作用者是各种生物,上层包括生物群体;生物体的基本作用者是细胞,上层包括由不同细胞组成的机体组织和器官。

 

系统可以自己吸取经验,根据对于未来的预期调整内部组织结构适应外部环境的变化,而且系统作用者之间存在相互的竞争和协同,这使得复杂适应系统具有“学习/决策的智能”和“进化的生命”。

 

在理论和计算机模拟研究中发现一个复杂的非线性系统有四种可能的状态:如果作用者之间的关联相对稀疏,那么它会只有一个稳定状态;随着作用者之间的关联增加,系统会产生多个稳定状态,并在这几个稳定状态之间循环;当作用者之间的关联增长到一定程度,系统会发生突变进入新的状态,其中多个稳定点随着时间不断移动,而且稳定的形态也可能随着时间变化。最后当作用者之间的关联继续增加到某个点时,系统就会再一次突变进入混沌状态,完全没有可观察到的时空规律。

 

上述的前两种状态是物理学家和经济学家熟悉的, 经典物理学和经济学对这类现象有很多研究。后两种状态都是在上世纪60年代之后才被发现和开始研究的。一个复杂适应系统的这四种可能状态似乎和系统是否具有智能的适应性没有关系, 即使简单的物理非线性系统也可以存在这四种状态。但是具有适应性,而且可以进化的复杂系统一般总是非线性的,所以可以认为复杂适应系统总是具有这四种可能的状态。

 

复杂非线性系统的一个著名的例子是气象学家洛伦兹1963年提出来的所谓“蝴蝶效应”:一只南美洲亚马孙河流域热带雨林中的蝴蝶,偶尔扇动几下翅膀,可能在两周后引起美国德克萨斯引起一场龙卷风。其原因在于:蝴蝶翅膀的运动,导致其身边的空气系统发生变化,并引起微弱气流的产生,而微弱气流的产生又会引起它四周空气或其他系统产生相应的变化,由此引起连锁反映,最终导致其他系统的极大变化。

 

这个例子可以延伸出两个结论:积极的结论是:从理论上看如果可以掌握宇宙间所有事件之间的相互影响,那么就可以预测未来将发生的任何事件。而消极的结论是:因为人类永远无法掌握宇宙间所有事件之间的相互影响,特别是包含大量相互关联的作用者的复杂适应系统,似乎没有办法准确的预测任何事件。 其实人类利用科学方法对于自然规律的认识是介于上面两者之间的。

 

自从上世纪80年代复杂适应系统吸引越来越多的科学家和经济学家以来,从纪90年代起, 在统计物理学中发展成熟的方法开始被应用到不同的社会和经济领域:包括股票市场和金融分析, 公路上的车流分布, 传染病和时尚的流行等等问题。但是目前都还限于在某些具体问题的研究和应用, 没有形成对于人类社会发展普遍适用的理论体系。

 

从西方开始的近现代科学一直在深入分析事物上层的特性是如何由下层规律驱动的, 也就是利用解析的方法, 希望自下而上的了解事物运动规律。在微观世界从分子到原子,从原子到亚原子。从而发现了200多种基本粒子以及驱动它们基本作用力。在宏观世界,从牛顿力学到广义相对论,从大爆炸到宇宙黑洞。这些探索和发现不但帮助人类对于宇宙有更加深入的了解,也带动了工程和技术的发展。

 

但是随着人们对于自然了解的深入,却发现在更加复杂的系统里面,比如由细胞组成的人体器官,或是由人组成的人类社会,无论我们对于下层元素了解的多么深入,也不可能从中了解上层的行为模式。 这使得西方的科学家们逐渐意识到东方古代哲学中万物都是相互作用的整体观念对于人们了解自然规律,特别是复杂系统是很有帮助的,值得深入了解。

 

中国两千年前已经有人在研究地球在太阳系中的时空位置和自然灾变的关系, 以及自然灾害和重大社会事件的关系。根据历史记载, 西汉京房就成功的进行过这方面的预测。但是他后来因为由预测社会事件干预朝政引起和权臣的政治矛盾而被皇帝处死, 所以后人很少敢再研究预测社会政治问题, 而仅限于对于个人命运的预测,养生和中医等不涉及政治的领域。

 

和西方传统科学中把事物无限细分,试图从下而上认识自然规律的方法不同。中国古代从系统整体的角度出发来认识事物的规律。它高度抽象归纳自然的一般规律,从复杂的宇宙万物中抽象出最基本的驱动万物的动力(阴阳),对事物发展有促进或制约基本的关系(生克),以及宇宙间最小的一组事物性质(五行)。但中国古人没有仅仅把这些抽象限制在哲学范畴里,而是利用它们去创建对人类生活有现实意义的应用科学来解决实际问题。 不过和现代科学的成果主要侧重与工程技术不同,从阴阳,干支,和五行发展起来的领域绝大部分都是和人或人类社会相关的。在第四章我们将详细介绍阴阳,五行,干支的概念以及它们的科学基础,在第五章也将介绍中国古代利用这些概念发展起来的应用。

 

在二次大战结束后的上世纪40年代后期,发展起一些新的学科,其中著名的是信息量,控制论,和系统论。系统论方法是利用高度抽象的系统因素, 而不是局部微观的因素研究系统整体的运动规律。在牛顿体系中热力学的温度就是这样一个高度抽象的因素,它是大量分子随机运动的统计平均值。现代科学中的统计模型方法, 控制论中的响应函数方法也都是类似的科学研究方法。 它们并不去追求发现所有微观因素相互影响的规律, 因为因素太多会导致人们无法找出它们之间相互关系。 而利用宏观因素更容易发现一些系统层次上的因果关系。如使用响应函数方法找出一个系统输入对于系统输出的影响, 而不去关注系统内部的结构和子系统之间的相互作用。系统论所研究的对象既可以是确定性的或是随机的。

 

使用现代科学的语言,可以把一般系统模型描述为:

一个系统S具有一组内部状态向量I, 一组可观察的系统S的输入向量X,和一组可观察到的系统S的输出参数向量Y。那么问题就是能不能

1)     从观察到的系统输入向量X推导出输出向量Y

2)     从观察到的系统输入向量XY推导出系统内部状态向量I

所谓推导出既可以是确定性的(接近100%准确), 即导出值Y’ = Y,和S’= S。也可以是概率统计性的,表达为PY’= Y),和PI’= I)。这里PY’= Y)是Y’= Y的概率。

http://s11/mw690/006NrbAgzy7aXo0n8cW4a&690

 

建立系统模型的主要目的是预测系统未来的运动状态。 一个系统的可预测性问题可以归纳为下面的系统变量的完备性问题:

系统S有两组变量XY, 如果可以找到确定性函数F,使得Y = FX),那么X对于Y就是确定性完备的。如果通过统计方法通过X可以确定Y的概率等于p,那么X对于Y就是在概率p的情况下完备。

 

在这样一个可系统预测问题中,系统变量的完备性依赖XY之间的相关性. 有三种可能的情况:

3)     YX完全不相关,那么无论在确定或统计意义下,X对于Y都不完备,也就是从X无法预测Y

4)     YX部分相关,从X只可以预测出部分Y,但是不能预测出完整的Y

5)     YX完全相关,从X可以预测出Y(确定或统计意义下)

在实际的问题当中,一个复杂系统(比如人,社会,生物,和经济系统)输入和输出之间的确定性关系经常不容易找到。在这种情况下,采用统计方法可以首先判断一组向量X和另外一组向量Y之间的相关性。 如果它们是完全相关的,那么可以通过一组从实验中取得的X’Y’, 然后检测它们之间的统计拟合的可信度。当可信度达到一定程度,比如97%,那么就可以在一般情况下利用X来预测Y。在今天的工程和科学实验活动中, 这样统计建模的方法已经得到广泛的使用。

 

当建立一个模型时候,首先要明确模型研究的对象范围。然后确定模型所依据的基本假设,和推理规则。基本假设包括研究的规律是确定性的还是随机的,以及基本的概念。比如牛顿力学的基本假设认为力学规律是确定性的, 而物体质量,以及物体之间的作用力是基本概念。由这些基本假设和推理规则(牛顿三定律和万有引力定律)推导出其它结果。模型中的基本概念是认为不言自明正确的假设,而推理规则或是一组自洽的数理逻辑规则,或是符合人类观察结果的自然规律。但是这些基本概念和推理规则也需要证明是正确的才能作为模型的基础。

 

上面关于建模的思想只是一般性的,如果复杂适应系统包含大量作用者之间的相互作用,以及作用者通过观察和它相关作用者的行为以及环境而做出的适应性调整,上面的模型是不够的。目前这类问题通常是使用计算机模拟来进行分析,但是如果作用者的数量巨大,比如人类社会有70亿的作用者,那么仅仅靠计算机模拟也是不充分的,它只是一种介乎理论和实验中间的一种方法,需要进一步研究发展出新的理论框架来研究复杂适应系统。

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有