【2016书三百】《007 看穿一切数字的统计学》
标签:
统计学大数据概率辛普森悖论计量经济学 |
分类: 夫妻书评 |
从表面来看,这本书是讲统计学的,但是从书中的案例以及作者各个层面的分析来看,大数据、市场营销、教育、管理等与当今社会息息相关的各种学科理论都包含到了书的内容当中,看完之后觉得很有价值,很有收获。
书中的一句话让我觉得很值得去延伸一下——假设儿童都玩过同样一款游戏,有的孩子成为少年犯,他们的父母大概会认为“都是那个暴力游戏的错”。而有的孩子则健康成长,那么他们的父母对同一款游戏的印象,大概是“男孩子喜欢的战斗游戏”。——这句话可以让我们联系一下当今火热的“企业家崇拜”,当一个企业成功了,人们就会争相歌功颂德,好像每个成功都有着多么多么必然的理由,事实真的是这样吗?还是主观臆断?我觉得那些想学习别人所谓“成功经验”的人真的应该好好思考一下了。个人观点:成功经验的总结有可能造成统计学意义上的“理性错误”。
从本书的一开始,作者就提到了“大数据其实是统计学的应用”这一概念,而我不能不联想到如今疯狂追捧、迷信大数据的人,当年是怎么看待统计学的……。感觉不谈统计学原理而只谈大数据就好像一个建筑师不谈创意、架构、设计而只是谈起重机、水泥钢筋型号一样,可是为什么还有那么多人乐此不疲呢?于是我很主观地认为自己得出了一个客观的结论:电商的市场就是被这些对大数据知其然而不知其所以然的专家学者们搞混沌了!
我觉得任何一种工具、现象,比如互联网、比如社会化媒体、比如大数据……都不应当成为一种迷信,想要通过使用这些工具创造价值的人必须知道应用这些工具的条件是什么。
无论大数据小数据,在我们进行统计分析之前,必须先弄清楚两件事情:哪些数据真的有用?误差都会出现在哪里?只有把这两件事完全执行,才有可能去统计、去分析。没错,是才有可能,因为世界中的各种关系(比如递进啊、因果啊、转折啊)并不是在现阶段的人脑或电脑能计算出来的。
书中还提到了一个有趣的例子——想一想是否应该禁止食用这种食物:
1、死于心肌梗死的日本人中,有95%以上在生前一直吃这种食物。
2、抢劫犯与杀人犯中,有70%以上的人在犯罪前24个小时内吃过这种食物。
3、如果禁止日本人摄取这种食物,会导致精神紧张的状态。
4、江户时代以后,日本发生的暴动基本上都与这种食物有关。——这种食物就是米饭,所以只为了统计而统计的数据未必会对判断产生帮助,也无法给出一个真正合理的结论。
除了主线外,书中所提到的“辛普森悖论”很有趣,估计可以考住不少人;而作者所描述的贝叶斯派与频率派之间的对立也是了解概率学与统计学的要点,我个人比较贝叶斯派的方法!
开卷有益,最近读的几本书真的都不错,都很有益!
大数据是工具,统计学也是工具,怎么用、怎么用好、怎么好用……这些知识点肯定不是一两本书能够写完的,所以:“吾生也有涯,而知也无涯。以有涯随无涯……,”虽知将殆,所愿矣!

加载中…