标签:
杂谈 |
分类: 情资阅览 |

【民调的可信度】选举与民调,又成为现今社会的热点,2016年希拉里民调领先而最终输给特朗普,让主流媒体和社会精英都在质疑民调到底靠不靠谱。程阳想说的是:几乎所有政治评论人士和媒体记者,对民调本身缺乏基本的科学常识。民调是一门涉及统计学心理学社会学的科学,即便所有的样本无误,即便被访者的心理表述正常,实现了所谓最精确的民调,其结果也是有误差的。
.
以民调广泛采用的1068样本为例,理论上95%的置信区间,也还存在3%的误差。通俗易懂的比喻就是,95%的可能性,最大会有3%的误差。假如希拉里为51%,特朗普为49%,这样的民调优势,被3%的误差所淹没所颠覆,是大概率事件。 所以关于政治关于民调,还是少一些阴谋论多一点科学。
.
从程阳的数据也可以发现,增加样本可以提高民调的准确度,但是投入的增加和精确度的提高是非线性的。同样95%的置信区间,如果希望把民调的进度提高到1%,样本的数量是9605,市场调查的投入是1068个样本时的近9倍。所以可靠的信息,是以巨额的非线性资金增长为代价的。
.
也因此,面对同样的情资与信息,高人与菜鸟的区别,那是天与地的差别。所以就不要问,为什么在同一个菜市场买菜,家庭主妇、路边大排档、星级大厨,一桌的菜就是几十块几百块和几千块的差距,这是数量级的差别。
.
这个世界不得不承认,数据科学家本质上就是数据烹饪大师。知识的积累和收益也是非线性的,格隆、吴晓波、罗振宇、叶檀等知识精英,都迎来了真金白银收获的拐点,这就是知识信息与收获非线性,从量变产生了质变。
.
——【程阳解答】市场调查样板1068个是不能乱用的!

加载中…