加载中…
个人资料
青帝
青帝
  • 博客等级:
  • 博客积分:0
  • 博客访问:10,310,327
  • 关注人气:3,700
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

互联网改变科学研究

(2010-07-28 10:37:22)
标签:

科学研究

几率

关联性

数据分析

it

分类: 学界风云

到美国读研究院,我学到的最宝贵的东西之一,就是科学研究的方法和思维模式。虽然有时能力有限,不能做出完美的论文,但至少能清醒的看到不足之处。最近看到几篇文章,让我觉得互联网的发展已经改变了科学研究的模式,越来越多的成果将出自data mining。

 

《Wired》杂志上近期的一篇文章,讲到Flickr的创始人之一卡特琳娜,她不是学IT出身的,但她喜欢社交而且能把自己与人打交道中学到的东西运用到网络中。Flickr最大的成功就是将社区的概念融合进了网络照片共享,最后3千5百万卖给了雅虎。卡特琳娜现在搞的另外一个网站hunch,通过用户回答问题来研究人的行为关联性。比如说,喜欢看赛车的人,有更大的几率喜欢喝百事可乐。网站对于这些关联性虽然不能提供理性的解释,但这个资料对于很多做B2C的网站来说很有价值,他们可以通过用户的喜好进行更准确的产品推荐。

 

我也去他们的网站看了一下,是内嵌在Facebook和Twitter里的,问的问题包括“在沙拉里你喜欢放包心菜、红生菜、生菜还是欧芹”等,非常无厘头。说白了就是一个庞大的数据库。这有点像qualitative research里的grounded theory方法,就是进入研究以前,没有任何假设,只是收集数据,让理论在数据里成形,这其实是很难的,因为数据的解读可以有很多方向,并不一定客观。

http://s7/middle/53ba277eg8c69827a59a6&690
Sergey Brin的救命稻草(图片来自Wired Magazine)


无独有偶,Google的创始人Sergey Brin有相似的想法。他很早就发现自己家族有帕金森综合症的基因LRRK2,因此他得此病的几率是30%到75%(一般美国人得此病的几率是1%)。虽然有些研究指出加强锻炼以及喝咖啡能降低得病几率,但目前还没人知道怎样治疗这个病症。Brin投入5千万美金支持用data mining的医疗研究:Google式的大量采集数据,再分析数据找科学模型。

 

高效率的计算机和统计分析软件,以及无所不在的互联网,构造了一个与传统科学研究的“先假设再求证”不同的新的研究途径,很可能会产生真正的不受旧知识和人的传统观念限制的创新发现。

 

最后有趣的是,Hunch不收费也不付费,人们都是自发的去回答一堆无聊问题的。其实维基百科和百度问答等都是一样的open source。这让我觉得很有意思,能揭示一些人类本性的东西,下回再谈。

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有