互联网改变科学研究
(2010-07-28 10:37:22)
标签:
科学研究几率关联性数据分析it |
分类: 学界风云 |
到美国读研究院,我学到的最宝贵的东西之一,就是科学研究的方法和思维模式。虽然有时能力有限,不能做出完美的论文,但至少能清醒的看到不足之处。最近看到几篇文章,让我觉得互联网的发展已经改变了科学研究的模式,越来越多的成果将出自data mining。
《Wired》杂志上近期的一篇文章,讲到Flickr的创始人之一卡特琳娜,她不是学IT出身的,但她喜欢社交而且能把自己与人打交道中学到的东西运用到网络中。Flickr最大的成功就是将社区的概念融合进了网络照片共享,最后3千5百万卖给了雅虎。卡特琳娜现在搞的另外一个网站hunch,通过用户回答问题来研究人的行为关联性。比如说,喜欢看赛车的人,有更大的几率喜欢喝百事可乐。网站对于这些关联性虽然不能提供理性的解释,但这个资料对于很多做B2C的网站来说很有价值,他们可以通过用户的喜好进行更准确的产品推荐。
我也去他们的网站看了一下,是内嵌在Facebook和Twitter里的,问的问题包括“在沙拉里你喜欢放包心菜、红生菜、生菜还是欧芹”等,非常无厘头。说白了就是一个庞大的数据库。这有点像qualitative research里的grounded theory方法,就是进入研究以前,没有任何假设,只是收集数据,让理论在数据里成形,这其实是很难的,因为数据的解读可以有很多方向,并不一定客观。
http://s7/middle/53ba277eg8c69827a59a6&690
Sergey Brin的救命稻草(图片来自Wired Magazine)
无独有偶,Google的创始人Sergey
Brin有相似的想法。他很早就发现自己家族有帕金森综合症的基因LRRK2,因此他得此病的几率是30%到75%(一般美国人得此病的几率是1%)。虽然有些研究指出加强锻炼以及喝咖啡能降低得病几率,但目前还没人知道怎样治疗这个病症。Brin投入5千万美金支持用data
mining的医疗研究:Google式的大量采集数据,再分析数据找科学模型。
高效率的计算机和统计分析软件,以及无所不在的互联网,构造了一个与传统科学研究的“先假设再求证”不同的新的研究途径,很可能会产生真正的不受旧知识和人的传统观念限制的创新发现。
最后有趣的是,Hunch不收费也不付费,人们都是自发的去回答一堆无聊问题的。其实维基百科和百度问答等都是一样的open source。这让我觉得很有意思,能揭示一些人类本性的东西,下回再谈。