复杂网络的一些相关概念:power law(幂率分布)以及 scale free(无标度)
标签:
复杂网络scale-freenetworks幂率分布power-law无标度网络it |
分类: 技术类原创 |
1.幂率分布
以f(x)表示某一数量指标x的发生次数,
http://s6/middle/a5527bf3gc39b368217e5&690law(幂率分布)以及就称为幂率分布。
同样,若p(k)为离散型随机变量的概率分布律,p(k)满足
http://s13/middle/a5527bf3gc39b39fa465c&690law(幂率分布)以及,则p(k)也称为幂率分布。
2.Zipf定律(齐普夫定律)
Zipf是哈佛大学的语言学家,他在1932年研究英文单词的出现频率时,发现如果把单词频率从高到低排列,每个单词的出现频率和它的排名之间存在简单的反比关系:
http://s4/middle/a5527bf3gc39b3c3c5d83&690law(幂率分布)以及
在对数变换后成为:
http://s13/middle/a5527bf3gc39b3dc4aa8c&690law(幂率分布)以及则在双对数坐标系下,该分布呈现为一条斜率为负幂指数的直线。
这里,r表示一个单词出现频率的排名,P(r)表示排名为r的单词的出现频率。在单词分布中,C约等于0.1,α约等于1。
基本规律总结起来就是:只有少数英文单词才会被经常使用,大部分的单词很少被使用。这个规律在其他领域的数据分布里也得到了验证。
另一个类似的定律是意大利经济学家Pareto提出的80/20法则,即20%的人口占据了80%的社会财富。个人收入X不小于某个值x的概率与x的常数次幂存在简单的反比关系:
http://s1/middle/a5527bf3gc39b3f3df740&690law(幂率分布)以及,称为Pareto定律。
3.Scale free(无标度)
一个网络的度分布如果服从power law,即有P(k)∼k−γ,(直观的看,就是少部分节点度极大,与许多节点相连,而大部分节点度都比较小),那么,这个网络就叫做无标度网络(scale free network)。
许多现实中的网络包括WWW,社交网络,性伴侣网络(囧),PPI网络等都被认为是无标度网络,并且大部分实际网络中power law的指数γ一般都在2和3之间,并且网络直径极小(d~lnN,N为节点数)。
对应的,随机网络的度分布是泊松分布,也就是钟形分布的,节点的度值一般不会比平均值高出很多或低很多。
复杂网络的定义:具有自组织,自相似,吸引子,小世界,无标度中部分或全部性质的网络称为复杂网络。(?)
(Albert-Laszlo Barabasi ,Reka Albert,1999)现实网络的无标度特性源于众多网络所共有的两种生成机制:
(i)网络通过增添新节点而连续扩张
(ii)新节点择优连接到具有大量连接的节点上
第二点即新节点连接到已有节点的概率与该节点的度数成正比例如
http://s14/middle/a5527bf3gc39b4072c14d&690law(幂率分布)以及
另:对无标度网络的定义仍然不是很明确。史定华(上海大学)指出无标度网络应该是泛指网路度分布具有幂率行为,或至少具有幂率衰减尾部特征的一大类网络。
关于复杂网络的统计学机制可以参考Reka Albert的博士论文:

加载中…