加载中…
个人资料
车品觉
车品觉
  • 博客等级:
  • 博客积分:0
  • 博客访问:4,659
  • 关注人气:2,322
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

大数据的来源是多种渠道的,偏倚、随机的

(2014-03-21 22:17:49)
分类: 决战大数据
<决战大数据> 伴随着大数据热潮的到来,关于大数据的一些新问题层出不穷——大数据会夹杂着虚假信息;大数据的数据量很大,但有用的信息不一定多,甚至还会破坏核心信息;大数据的来源是多种渠道的,偏倚、随机的误差总是存在。
但是,我们也需要客观地认识到,大数据现在面临的这些问题,其实就是把小数据中的一些问题放大了。小数据中难道就没有噪音会破坏我们的核心信息吗?当然也有,只不过当大数据把数据量放大和变多的时候,数据的破坏性更大。

 (此书我的版税全部捐出作重建雪谦寺及桑珠助学)

亚马逊:http://t.cn/8FFl2wT 

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有