标签:
杂谈 |
复杂网络——网络的科学
你知道,你想与本·拉登或者美国总统奥巴马认识,中间需要通过多少人介绍吗?甲型H1N1流感是如何在短时间内在全球范围流行的?蚂蚁们为什么总是能找到食物,它们内部是如何交流的?一个城市的公交车站要如何设置,才能使得人们出行最为方便快捷?人类的大脑是如何感知喜怒哀乐,并且做出相应反应的?为什么仅仅因为一家电厂跳闸就造成北美7个州在9秒钟之内全部陷入了黑暗?美国次贷危机是如何产生并影响全球经济的?Internet上任意两个页面之间的链接,平均要经过多少个节点?贾君鹏为什么能在一天之内红遍互联网进而登上传统媒体?这些问题乍看起来似乎风马牛不相及,然而,在当今世界上,有一群学者却把这些天差地远的问题放在一起研究。之所以这样做,当然是因为他们发现,这些问题内在具有惊人的相似性。换句话说,剥掉形形色色的外衣之后,这些问题实际上具有同一种大框架,可能您已经注意到了,没错,那就是网络。
当今有“网络时代”之称,这是因为互联网的高度发达,以至于一提到网络,很多人的直觉反应就是计算机网络。然而实际上,网络结构存在于方方面面,例如社会关系网络、经济网络、交通网络、生物网络、神经网络等等,可以说,人自生命形成那一日,就已经嵌进了从宏观到微观、各种各样的网络之中。在过去,社会学家研究社会关系网络,经济学家研究经济网络,生物学家研究生物网络……发现这些网络之间的共性,把它们放到一只篮子里来,那还是近年才有的事情。一门新兴学科也就应运而生。
那正是本文主角——复杂网络。
什么是复杂网络?
要说清这个问题可不容易,就算是科学家们自己,目前也还没能给出一种明确的定义。当然喽,科学家们眼中明确的定义往往指的是能够用数学来描述——数学是公认的最为精确的语言。而从文字上说,复杂网络嘛,就是复杂的网络。
这里面涉及两个概念,一是网络,二是复杂。网络有精确的数学定义,它指的是一种图,包含节点和边,其中任意一条边都对应一对节点。以社区为例,任何一个人都可以当作一个节点,如果两个人互相认识,那么两个节点之间就可以用一条边连接起来,这样就将社区抽象成了一个人际网络。当然喽,实际情况可能要复杂得多,比如我认识你,你却没听说过我,那么我们可以给边加上箭头,表示两个节点间的关系是有方向的,这就成了有向网络。又或者更复杂一些,我和张三是死党,而和李四只是点头之交,要区分这两者,还可以给边加上一个数值,代表关系的紧密程度,这样就构成了加权网络。
网络容易理解,而复杂的概念就真的复杂了。当今有一门蓬勃发展的学科,叫做复杂性科学,就是研究这“复杂”二字的。复杂性科学可谓包罗万象,广义地说,复杂网络就是其中一个分支。
说到复杂性科学,则不能不提及大名鼎鼎的圣菲研究所。话说那是在美国新墨西哥州省会圣菲市西北郊外,红色的山峦与沙漠交相辉映,缓坡上零落散布着丛丛灌木与松杉,一处巨大的建筑物依山而立。那原本是属于曾经在1944年以罗斯福总统私人代表身份访问过延安的赫尔利特使的私人豪宅,如今,则是全美五大优秀研究所之一、全世界复杂性研究者心目中的圣地——圣菲研究所。这里有来自全球各地的物理学家、生物学家、免疫学家、心理学家、数学家、经济学家……他们打破学科界限,自由地讨论和交流。互联网病毒传播,与人类文明发展史中城镇人口迁徙过程,这样两个天差地远的问题可以相提并论,这在圣菲研究所是司空见惯的事。
早在20世纪30年代著名物理学家普朗克就曾说过:“科学本质上是一个整体,它被分解为单独的个体,不是取决于事务本身,而是取决于人类认识能力的局限性,实际上从物理到化学,从生物学、人类学再到社会学,都具有内在的连续性,这是任何一处都不可能被打破的链条。”
普大师的话千真万确,但当时的科学发展有限,要打破各学科界限,将科学统合成一个整体来研究,实在力有不逮。又过了几十年,时机才渐渐成熟。可莫要小看这短短几十年,人类科学在这段时间内有了飞跃式的进展,尤其是计算机科学的兴盛给科学研究提供了强有力的工具。1984年,以物理学家、诺贝尔奖获得者穆雷·盖尔曼、赫伯·安德森领衔的八位科学家成立了圣菲研究所,他们的目的,就是要集中不同领域、不同学科的研究者,进行跨学科的复杂性研究。因此打从一开始,圣菲研究所的宗旨就是开放,力图打破学科间的界限,更打破人的思维界限。波音公司、谷歌公司等大企业的负责人经常出席圣菲研究所的报告会,一个大企业管理者曾说,在从圣菲研究所返航的飞机上,拟定了企业改组的新方案。既然在圣菲研究所,蚂蚁搬家和金融危机可以一锅烩,能给予人这样的启迪,自然不足为奇。
那么,圣菲研究所到底进行什么样的研究呢?举个例子。早在1932年瑞士生物学家克利伯就发现,不同种类的哺乳动物代谢速率B与个体平均质量M满足幂次率B=Mβ,β=3/4。圣菲研究所的科学家发现,哺乳动物的平均寿命和脉搏也满足类似的幂次率,只不过幂次一正一负,这样平均寿命和脉搏的乘积就是一个常数,也就是说,小老鼠心跳快,寿命就短,大象心跳慢,寿命就长。问题在于这个3/4,它是科学家从实验中得出来的,但它有什么奥妙呢?为什么非得是3/4,而不是5/8或者2/3呢?科学家们经过研究终于发现,这与循环系统网络结构有关系。为了把营养送到每个细胞,血液要从主动脉分配到支动脉到各级动脉,层层向下,直到毛细血管。所有动物,无论体形大小,毛细血管的粗细都差不多,主动脉的粗细差异那可就大了。所以,大的动物循环系统网络层次就多。为什么?因为血液不能从粗的血管一下子流入很细的血管,否则会造成“堵塞”,因此各级血管的粗细必须以一个合适的梯度递减,而正是这个梯度造就了3/4这个奇妙的数字。
这问题初看起来只是一个生物学问题,然而科学家们进一步深入之后发现,不仅仅是生物系统,克利伯幂次率在其它领域也比比皆是。比如城市人口规模,与城市道路面积、电缆线长度之间的关系,也呈幂次率关系,这里的β则等于4/5。这样,不同网络的个体问题,就变成了网络的共性研究。
前文说了,圣菲研究所的研究对象是“复杂的”,而不是简单的,那到底什么是简单的,什么又是复杂的呢?简而言之,1+1=2就是最简单的,而复杂则相反。您可能要问了,1+1难道还不等于2吗?没错,在复杂性世界里,1+1>2。举个不太准确但容易理解的例子,作家李敖说过这么一段话:
“一个男人,只是一个男人,造不出来什么。
“一个女人,只是一个女人,也造不出来什么。
“一个男人加一个女人,两人一块儿活,造出来的玩艺可就多了,他们可以造出许多小男人和小女人,也造出来所谓的‘家’。”
一个男人,和一个女人,如果按照简单的观点来看,1+1=2所以他们就是两个人,但是按照复杂性的观点来看,由于他们两人之间可能产生各种带有不确定性的关系,比如他们结婚了,那么就会组成一个家庭,其涵义将远远超出两个人,所以1+1>2。
在复杂系统当中,各元素间的互动关系,元素与环境间的互动关系,正是产生复杂性的由来。
过去有很长一段时间,统治科学研究的哲学观点是还原论,也就是把复杂的拆分成简单的、高级的拆分成低级的,如果每个基本体的规律都研究清楚了,那么它们组合而成的高级体的规律问题也就迎刃而解了。然而,近年来越来越多的研究者发现,有太多问题无法用这种方法来解决,因为整体的行为往往要比其中各个部分的行为复杂得多,所以,必须将系统所谓一个整体来研究,这就是整体论的观点。当然喽,这可不是说从此就不需要研究个体行为了,个体是整体的基础,个体不清楚,遑论整体?整体论只不过是说,个体组成整体时,并非简单的叠加,而必须考虑它们之间的关系,及其对整体行为的影响。
海斯给出了一个公式:复杂行为 = 简单规则 + 丰富关联,这个公式非常清楚,复杂系统整体行为、个体、个体间的相互关系三大要素一目了然。
说到这里,复杂网络的面目应该渐渐清晰起来了——它具有网络结构,它的各节点间具有丰富的关联性。可想而知,如果网络节点数量很少,也就谈不上什么“丰富的”关联性,因此复杂网络通常具有数目巨大的节点数量,和高度复杂的网络结构。
复杂网络什么样?
1987年,全球二十位来自经济学、物理学、生物学、计算机科学等领域的宗师级科学家聚集在圣菲研究所,话题是经济学。但这些研讨会的最终结论后来推广到了整个复杂系统。
首先,复杂系统是许多因素彼此同步作用的网状体系。在一个胚胎中个体因素是细胞,在一个经济体系中个体因素是人。细胞与人生活在一个由其他因素相互作用产生的环境之中。细胞与人不断地对体系中其他因素的作用做出反应,因此环境就永远在发展变化。
其次,在胚胎的发育中,没有领头细胞,同样在经济网络或是互联网中也没有所谓的“总控制”。诚然,国家能够通过宏观调控对经济产生一定的影响,但是总体而言,经济是由千百万个个体每天的决策所产生的结果。经济体系中的协调行为出自于个体之间的竞争或合作。
第三,这也是复杂系统最关键的特征,复杂系统中的众多个体会积累经验,并逐步适应不断变化的环境。我们知道生物体能够进化。人也一样,人将通过适应世界和积累经验不断改进自身。这第三项特征是如此重要,遗传算法发明人霍兰就说:“适应性造就复杂性”,以至于有人干脆称复杂系统为复杂自适应性系统。当然复杂性产生的机制很多,但适应性肯定是其中绕不过去的关键点。
复杂网络作为复杂系统的一员,当然也具有复杂系统的特性。除了上述已经提到的之外,还有一些很有意思的特性。
比如“沙堆”现象。1987年,三位科学家巴克、汤超和威森费德玩起了小孩子的游戏:堆沙堆。他们把沙粒缓缓地堆到一个台子上,一开始沙堆平缓增长,但到一定程度时,沙堆就不可能再增加了,换句话说,这时候来到了一个临界点,一旦踏过这个临界点,再加入哪怕一丁点沙子,都可能造成整个沙堆小区域或大面积的滑坡。
这个游戏可能很多人小时候都曾经玩过,但是从最简单的现象提取出重要的规律那正是科学家们的特长。通过这个实验,巴克等人提出在临界点上,复杂系统将打破原有的平缓渐进式的演化过程,代之以一种类似雪崩的方式。2007年由美国次贷危机引发,旋即席卷全球的经济危机,想必大家还记忆犹新,所谓“冰冻三尺非一日之寒”,这次危机的根源早在多年之前就已种下,但此前一直处于沙堆累积的过程,直至踏过了临界点,危机仿佛突然爆发。这就是体现在经济网络中的“沙堆现象”。
现在让我们来看看,到底什么样的网络算是复杂网络。
城市交通网络,毫无疑问是一个复杂网络,行人、机动车、道路、环境四大要素互相联系、互相制约、互相依赖,它们必须组合在一起才能构成叫交通网络。它有这么些特点:1)节点众多,任何一个行人,一辆机动车都可以作为单独的节点;2)关系复杂,行人与行人、行人与机动车、机动车与道路……形成了多种多样的关系;3)动态网络,各元素之间的关联随时可能断开,或者连接,网络结构是不断变化着的;4)临界突变性,某些因素的微小变化,例如机动车事故,就可能出现交通堵塞的突变现象;5)自适应性,路是死的,人是活的,人总是会选择最方便的道路出行,遇到交通堵塞等现象,会主动绕行,这样就形成了各元素间的互动关系。
这个问题,别说您头疼,科学家们也在头疼。毕竟复杂性科学也好,复杂网络也好,只是一门刚刚起步的科学,物理学等待了何其漫长的时间才等来苹果树下的牛顿,而复杂性科学目前仍在等待。事实上,科学的发展又何尝不是一种复杂过程?沙堆到达临界点时的雪崩固然让人兴奋,但沙堆的积累又何尝不重要。
六度分隔理论与小世界模型
上世纪60年代,美国哈佛大学的社会心理学家米尔格伦提出了“六度分隔”(Six Degrees of Separation)的理论。简单来说,“六度分隔”就是在这个社会里,任何两个人之间建立一种联系,平均需要六个人(不包括这两个人在内),无论这两个人是否认识,生活在地球上任何偏僻的地方,他们之间只有六度分隔。
这个理论很迷人,如果是这样的话,那么我们想要认识奥巴马或者布莱德·皮特,中间也许只要经过几个人的介绍。那真是太有趣了!事实是否如此呢?
六度分隔理论源于这样一种现象:有的时候我们刚刚结识了一个陌生人,聊着聊着,却忽然发现原来我们都是某个人的朋友,或者我们居然是校友,还上过同一个老师的课……叫人忍不住感叹这世界真小。
于是,米尔格伦做了一个著名的实验,他选定了两个风马牛不相及的人作为目标,一位是马萨诸塞州一位神学院研究生的妻子,另一位是波士顿的证券经纪人。然后招募志愿者,请他们用自认为尽可能少的传递次数,将一封信寄到其中一个目标人物手里。在最终成功的投递中,最短的投递环节只有3,而平均是6。
于是,著名的“六度分隔”理论就被提出来了。
当然喽,实际上米尔格伦当年的实验是很成问题的,因为总共只发出300封信,而投递成功的则不过几十封,其余的都在半道上不了了之了。
正是沃兹成立了研究小组,建立了“小世界项目”网站,进行了一次在线实验。他们选定了一些目标人物,包括各种年龄、种族、职业和社会阶层。志愿者注册之后就会获得目标任务的信息,然后用EMAIL中转的方式,设法把信寄给目标人物。这次实验的规模比米尔格伦实验大得多了,选取了13个国家的18名目标人物,共有166个国家和地区的6万名志愿者报名参加,最后达到目的地的电子邮件共有384封,尽管成功率仍然不高,但平均转发次数,的确是6。
沃兹实验告诉我们一个好消息,我们和奥巴马或者布莱德·皮特之间,只隔着很少几个人。坏消息则是,这样的中转结识方式中间变数很多,正所谓“看得见不一定够得着”,如果遇到中间人即使认识也不肯给予帮助的情况,那么很容易中断。
无独有偶,美国弗吉尼亚大学的科学家建立了一个电影演员数据库,输入演员名字就可以知道他的培根数。所谓培根数,指的是每个演员和凯文·培根之间的间隔数。例如输入周星驰的话,就可以得到这样的结果:周星驰在《豪门午宴》中与洪金宝合作,洪金宝则在《死亡的游戏》中与科林·坎普合作,科林·坎普在《陷阱》中与培根合作,所以周星驰的培根数就是3。全数据库60万个演员的平均培根数为2.944,这意味着,数据库中任意两个演员,通过培根做跳板的话,产生关联的间隔是2.944的两倍,刚好约等于6。
这真是一个神奇的数字。尽管并没有获得理论上的验证,但越来越多的实验似乎证明了,六度分隔理论很可能是正确的。而运用这一理论,通过熟人、熟人的熟人……将会迅速扩张成一张社会网络,这其中蕴含着巨大的商业和社会潜能。
而这还仅仅只是复杂网络研究的小小一角而已。
弱连接的优势与社会网络
又是一个社会学家做的实验。还是在上个世纪60年代,哈佛大学研究生马克·格兰诺维特在波士顿地区调查了300个人,这些人都是刚刚换了工作,或者最近才被雇佣,结果他发现,当人们找工作的时候,经常是依靠认识人的介绍,然而有趣的现象是,那些关系紧密的朋友(强连接)反倒没有那些关系一般的甚至只是偶尔见面的朋友(弱连接)更能够发挥作用。
这倒是符合我们中国的一句古话:“踏破铁靴无觅处,得来全不费工夫”。你在熟人圈子里转悠来转悠去也没有结果的事,可能在一个偶然之下,遇到一面之交的人,就轻而易举地解决了。
格兰诺维特这篇题为《弱连接的优势》的论文命运多蹇,1969年投稿被退,直到四年后才得以发表,但其后便成为一时之选,大凡谈到人际关系、网络信息传播必被引用,时至今日,已经成为社会学最经典的论文之一。
如今,格兰诺维特已成为一代社会学大师,继续从事社会网络研究。
在社会这个复杂网络中,“认识”经常比“熟知”更有价值。因为“人以群分”,社会关系往往具有小团体特性,具有相同兴趣爱好,相同工作,或者生活在同一个圈子里的人,往往习惯于在一个小团体中打转。而两个不同的小团体之间,常常仅仅依赖于双方各有一名成员互相认识,而形成唯一的一条通路,这条通路就称为“桥”。桥在信息扩散上极有价值,因为它是两个团队间信息通常的关键,但它必然是弱连接。为什么呢?因为如果是强连接,就会造成呼朋唤友的效应,使得团体之间大面积重叠,就谈不上是不同的小团体了。
互联网的阿喀琉斯之踵与无标度网络
2000年7月,《自然》杂志封面文章的标题为《INTERNET的阿喀琉斯之踵》。阿喀琉斯之踵的典故想必为大家所熟知,通常我们把某一事物的致命弱点成为阿喀琉斯之踵。这篇文章指出了互联网的致命弱点:当对于某些关键节点进行蓄意攻击的时候,就可能给互联网带来崩溃式的灾难。
这与互联网本身的特性有关。1999年,物理学家巴拉巴斯和埃尔波特提出了无标度网络模型,这是继小世界模型之后,复杂网络研究又一次革新性进展。这种网络模型和前面提到的小世界模型有所不同,它更多地参考了互联网的特性:首先,网络的规模是在不断扩大的,比如互联网上每天都会诞生新的网站和网页;其次,节点存在“富人更富”效应,也就是说,新诞生的节点更乐意于那些连接度大的节点连接,比如网页和网站上超文本链接更有可能指向新浪、网易等著名的站点,这就使得那些原本就“热闹”的节点会更加热闹。
正是后面这一点造就了互联网的阿喀琉斯之踵。科学家们发现,无标度网络最重要和最基本的特性之一,就是“坚强而又脆弱”。说它坚强,因为对于漫天撒网式的随机攻击,无标度网络受到的影响很小:条条道路通罗马,这条路不同了,可以绕道走,网络仍然是通畅的。然而,无标度网络又是脆弱的,如果对前面说到的那类连接度很大的关键性节点进行攻击,那么就很可能造成整个网络的瘫痪,换句话说,如果罗马被攻陷了,那么需要通过罗马中转的周边城市的交通也就瘫痪了。
当然您也不用太紧张,这只是一个理论,由于互联网的庞大,其中的关键节点相对整个网络来说尽管是少数,但绝对数字仍然很可观,因此要造成整个网络的瘫痪,蓄意攻击也得够猛烈才行。
总之,小世界网络和无标度网络是当今复杂网络研究中最基本的两种模型,围绕它们,科学家们还修正发展出了更多种类的网络模型,借助它们,才能对复杂网络的特性做研究。
而上述所说,其实也只是复杂网络科学的一鳞半爪,如果您对复杂网络有兴趣,不妨专门做些研究,说不定,您就是这门新兴学科等待着的牛顿呢?




