《发现夏朝》序:互联网时代的人文科学研究(陈一舟)
(2017-11-04 16:27:22)互联网时代的人文科学研究
一个偶然的机会,我看到新浪博客上署名“兵策儒剑”的关于华夏文明和埃及古文明系列文章,谈到上古中国的黄帝可能就是埃及的法老蝎子王。 我开始对这个学术方向产生浓厚兴趣,并有幸结识了博客作者刘光保先生。
研究历史主要的信息来源是文物和古籍,因为它们富含历史的信息。几十年前基因的双螺旋结构被发现,所以又增加了一个人类分子生物学,比如目前欧洲正在进行关于尼安德特人这个古老人类与现代人基因混合的研究。
这本书大规模使用了一种非常新的研究方法,这里暂且叫“比较文字考古学”吧。作者利用互联网获取埃及考古信息,把历朝埃及法老序列人名的古埃及象形文字和中国商周之前的帝王序列人名的甲骨文、金文、小篆体文字进行了系统的比较,发现了系列性的惊人相似。同时,其中一些人物的历史事迹惊人相似,其配偶的名字惊人相似,一些历史地名也惊人的相似。从文字比较到人物名字、人物关系、地名关系、历史事件顺序,都惊人一致。
互联网时代的人文科学研究方式
刘光保的考古研究方法,在互联网时代之前是几乎无法想象的。他从来没到过埃及,但通过维基百科(由无报酬的互联网众包方式完成的互联网百科丛书)和搜索引擎,他找到了大量埃及的历史和文字碎片。关于中国古文字的历史演变,他主要依据的是一个叫“汉字叔叔”的业余中国文字爱好者所维护的一个免费中国文字(甲骨文、金文、篆文、现代文字)对照网站。在刻苦研究的这些年里,很多热心的网友,通过QQ群和新浪博客,给他提了大量建议。可以说,本书是由一个民间人士,充分利用互联网为主要研究工具,在其他民间人士在古埃及与中国存在文化传播关系猜想的基础上做出的一项互联网考古研究成果。可以说互联网某种程度上也改变了人文科学研究的方式,过去只有少数考古专家才能掌握的原始考古资料,通过互联网可以让每一个人获取。同时,基于搜索引擎可以快速获取海量信息,能够获得更全面的资料,得到更客观的分析。
人文科学研究的统计方法
人类文明是单一起源还是多地起源一直有长期的争论,也许,就像哥白尼发现了地球不是宇宙的中心,刘光保发现了世界文明可能都起源自中东地区。一个民间史学家,主要科研手段是互联网,主要研究方法是“比较文字考古学”,多年来呕心沥血地研究这个课题,这个理论体系是否能经受得住推敲?如何证伪或者进一步证实?
我们试着用统计学和概率论的方法来分析一下数据。
古埃及帝国头2000年的王表和中国记载的夏朝王表,两个不同范畴的人类历史碎片,到底是同一串历史信息还是完全巧合的相似?刘光保的理论是,它们就是一回事,都是指埃及的上古朝代。传统学术传统应该认为,存在巨大的第二种可能性,既这两个信息集合的相似性纯属巧合。我们下边要计算的,是近似估计这两种可能性到底哪个大, 或者相对的可能性有多大。
假设一共有一千个甲骨文,针对任意一个埃及法老名字的象形文字,我们可以用每一个甲骨文字和它比较计算相似度,并且把相似度排序,从0.0%,排到100%。如果这两张王表是完全无关的,既第二种可能性,则每一个法老名称和夏朝的王表在单点的对应度应该非常低。但是,我们看到的情况是,这些比较文字相似性非常高。比如,引用本书中的图,埃及前王朝时期法老Iry-Hor对应的“尧”字的甲骨文,相似性非常高,在所有甲骨文字里排序应该在头1%,也就是,在一千个甲骨文里,可能只能找到9个比它更像Iry-Hor的象形文字。同理,“共”的甲骨文和埃及版本极其相似,相似度也应该排在至少头1%,即99%。下面的一系列带甲壳虫符号的法老名字,和甲骨文里带“康”字的系列王族,相似度更高,超过99%。目测感觉,整个系列的王表有近百人,相对相似度在95%以上的有大约几十人,相似度在99%上的也不在少数。
我们再来看一个随机提取的甲骨文和法老象形文字的相似度比较,理论上随机搭配的两个不同文字相似度应该不高。实际上大部分的甲骨文字,和任何一个埃及法老名字比较,相似度理论上应该接近0%,只有可能不到10%的甲骨文能得到勉强相似的分数。如果甲骨文不是一千个,而是一万个,同时相似度的打分标准提高,那么这个序列相似度属于巧合几率接近于0。
用概率统计方法,我们对这两个集合中的几百个名字进行相似度估算和统计计算,可以得出结论,第一种可能性,既这两张王表是一回事的概率,比第二种可能性,既这两个集合完全是不同的两个序列(其相似性纯属巧合)的概率,两个概率的现对比值为10的几百次方。
那么,是否有第三种可能性,就是它们其中部分是一回事,其他是巧合?我们知道,从逻辑上来说,这也不可能。历史片段不可能跳来跳去:比如,如果大禹是古代中国土地上的王,那么他的儿子到埃及当法老,是不符合历史逻辑的,所以这种可能性可以通过逻辑反证为零。于是,在两种王表相关关系的三种可能性里,第一种的概率(就是一回事)比第二种的概率(完全巧合)大一个非常大的倍数,而第三种可能性,既两个集合部分一样,逻辑上不通,概率为零。我们看到,可以推理出第一种情况的可能性非常大。 王表的数据序列越长,每个文字的相似度越高,可信度越高。
科学理论的标准
在《科学革命的结构》一书中,科学史学者托马斯·库恩提出,一个好的科学理论有如下几个特点:
1.
2.
3.
4.
在被学术界普遍接受之前,这个理论应该接受更严格的检验,特别是持反对观点的专家学者的检验。 这需要在埃及学,中国上古史之间做更多的、细致的、全面的比较工作。因为埃及和中国的古文物文献的严重缺失,如果能够预测出一些现在还没有发现的或证实的历史信息碎片,那么,该理论的科学性将会大幅提高。
人人网 CEO 陈一舟