加载中…
正文 字体大小:

晨光BT之死

(2013-03-19 16:29:06)
分类: 编程实战

标题只是个噱头,本文所探讨的内容严谨一点来讲应该是“类晨光BT的资源交流平台运营模式的建模与(简单)分析”。

 

  • 简介

所谓的“晨光BT”是一种校园内部(北京交通大学)资源交流平台,最大的特点就是盗版众多、内部使用速度非常快。在这种资源交换环境中,每个用户会给予一定的初始资源(CG中折算下来是20G),而在资源请求的过程中系统逐渐会对用户的“共享率”提出更高的要求。这一要求简单的说就是下载1G的东西需要上传1.5G或者更高。在使用的时候也许很少有人会对这一系统的运营(运行,系统非盈利性)为何能够正常运行感兴趣,本文对这一资源交流平台进行建模并进行了一些讨论。

 

  • 模型及演化

首先对这一问题进行建模:假定系统中有n个用户,每个用户都拥有无限可被请求的资源,并给予一个起始贡献分值s,用户每下载其它用户的1个单位的资源将消耗ratio分值(在现存系统中ratio > 1,最高为1.5,这里看起来与现行CGBT不一样,但是换个角度,将共享率转换为实际还可以下载的流量就能看出是一致的了)。

演化模型1:选定cn(如c = 0.1)个用户为资源大户(大家感兴趣的资源都在他们那儿,是流量产出的主要来源)。在以下t步过程中的每一步,任意一个用户(包括资源大户)将以p(如0.9)的概率向大户请求1个单位的资源,以1 - p的概率向其它用户申请资源。

如果将这个系统看作能量交换,那么在没有外部能量注入的情况下,每交换一次资源,系统将损失能量r-1。很显然,在次之后系统能量将只有初始状态的一半。但这并不是我所关心的,我更关心的是“用户死亡数”与t的关系。在这里选取一个时间点——半数用户处于“死亡”状态(无法再向其它用户申请资源,但是可以由其它用户向这个用户申请资源从而又活过来)的时间。

晨光BT之死
模型1的演化图 取n = 100,c = 0.1,s = 20.0, ratio = 1.5,p = 0.9,半数用户死亡时间是10(次)。图片是动态的,新浪博客的动态图片需要点“查看原图”才会看到动的。

 

既然系统能量是衰减的,那么什么样的因素能够延缓这一趋势呢?非播种员如果活动的概率较低,系统死亡一半用户的时间又是多少呢?进而可以在加入一个参数的情况下提出——

演化模型2:与1不同之处在于增加一个活跃系数,设定播种员每一步都会有资源请求,而普通户则以概率access_probability(比如0.3)请求资源。

 晨光BT之死

模型2 普通用户的请求概率与半数用户死亡时间的关系

演化模型3:在2的基础上增加免费流量,另定义用户活动时有较小的概率mp申请免费资源。不再给出相应图表。

 

  •  结论

从上面的实验中可以看出,无论采用何种手段,系统死亡一半用户都是很迅速的。理解了系统的演化模式你就应该能够明白:

1.      为什么CGBT中会有多倍上传流量?为什么流量可以“买卖”?为什么经常要进行一些流量奖励的活动?

答:系统中最基本的运行是能量损耗的,必须从外部注入能量才能保持系统的正常运行。共享率越高,用户死得越快,因此我认为提高共享率并不是什么好事。

2.      半数用户死亡,有这么夸张吗?为什么没有影响到我们的使用?

答:一、这个可以看看自己周围的人中有多少人的账号是不再使用的,最简单实在也是最严谨的是让管理员公布统计数据;二、CGBT使用的人数基数大,有的人使用率非常非常低,半数用户死亡根本就不影响系统;另外CGBT每年还会有大量新生入驻,也是系统能量的巨大外部注入。

3.      多数用户会死亡的根本原因是什么?

答:如果不能想清楚这个问题,那么这个实验就是失败的。用户死亡的根本原因就在于资源的集中性。大家感兴趣的资源不在普通手中,而在“播种员”手中,因而积分的流向总是从普通用户流到“播种员”或者“播种员”之间的。值得注意的是共享率只是决定死亡速度,高低并不影响结局。说句更远的,造成贫富差距主要原因之一就是(广义的)资源的集中性。

 

  •  其它
SkyDrive中提供了有相关的模拟实现代码(Python3写的,很简单),图表使用的是Matplotlib绘制,动态图是用Gephi生成然后制作的GIF。

 

  • 写在最后
    这个演化模型的生命周期完全可以通过数学手段解决,但是我的功底还是太差了,用程序模拟演化有一个好处是可以将中间的演化过程更直观的表达出来。最后说一下做这个实验的初衷:我只是偶尔上CGBT下点电影什么的,直到有一天我的号被封了,不能下种子,晚上8点以后还不准搜种子,找别人借来的账号下东西还提示“不能同时下载”什么什么的。我开始质疑“共享率”这个东西,像我这种需求不大的人,共享率怎么上得去?我又没有像实验室其它同学一样从来不关机通宵做种,哪里有那么多上传?我说我心疼已经“咔咔”作响的硬盘可以吗?(这种心态其实是不对的)一点点愤怒之余我动用了手上的服务器,整了几百G的东西放在那儿做种,共享率从1变到了6。但是这样做又有什么意义呢,还不如来做做这个实验。仅仅只是对系统的讨论,在这里仍然要感谢辛勤耕耘、无私分享的播种员们,是你们让我这研究生生活丰富了不少。每当离别的时候我就会想起初一语文老师念到《从百草园到三味书屋》中的“Ade,我的蟋蟀们!Ade,我的覆盆子们和木莲们!”,感谢你们,感谢北交大,临行前来发这处子帖以示告别。


0

阅读 评论 收藏 转载 喜欢 打印举报
  • 评论加载中,请稍候...
发评论

    发评论

    以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

      

    新浪BLOG意见反馈留言板 电话:4006900000 提示音后按1键(按当地市话标准计费) 欢迎批评指正

    新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

    新浪公司 版权所有