标签:
杂谈 |
分类: 案头之山水 |
(看到很多让老辛憋气的四六不靠的说法,忍不住再来啰嗦一下。)
坚信动物预测DZ(这词也成敏感词汇了,一出现就要审核)的人士们最基本的“信念”就是:DZ来临之前所发生的人类不能感知到的某些信号,许多动物能够感知到。向安婆婆同学学习一下,虽然咱不是靠数学统计或者动物地质吃饭的专业人员,但是应该不妨碍咱也用点知道的数字的知识来讨论一下:退一百步,即使这条“信念”是正确的,那又如何?
如果有一种病,发病率不算高,假设0.1%吧,一旦发生了就不可救药。但是如果提前知道,可以进行代价不小但是相对于死亡来说还可接受的防治,比如说从此不许吃肉,或者天天吃二两黄连,再或者切掉一条腿。。。在医学上有一种检测方法,可以进行早期诊断。当然就像别的检测方法一样,它总有一定的出错概率。这个方法能够做到的是:如果你有病,那么检测结果99%会是阳性;如果你没病,那么有1%的可能性结果会呈阳性。当然你仍然可以责怪医学研究人员为什么光吃饭不干活,不能让那99%变成100%,让那1%变成0%。但是,就目前的医学水平而言这也不算差了。现在,你进行了一次检测,结果呈阳性,你会怎么办?从此不吃肉?天天吃黄连?切腿?。。。
换句话说,面对阳性率99%的检测方法得到的阳性结果,你会有多大的信心接受“有病”的判断?对于数学或者统计人士,应用条件概率的公式可以直接给出答案。考虑到很多人不习惯用数学公式来说话,我们还是换种具体直观的方式来分析吧。
对于一个100万人口的人群进行这个疾病的普查。发病率0.1%,大致有1000人得病,99%的阳性率,所以约有990个阳性结果。没病的99.9万人中,1%会被误诊为阳性(所谓的假阳性),共有9990个阳性结果。所有检测下来,共有10980个阳性结果,其中只有990人是真正有病的,比例是9%!
好了,虽然检测结果是阳性的,但是你没病的可能性还有91%。你会选择不吃肉,每天吃黄连,或者切腿吗?
为什么一个阳性率已经相当高(99%)的检测方法,检测出来阳性结果的时候却是91%可能没病呢?仔细看看上面的分析,不难发现:尽管只要有病就几乎肯定(99%)能被检测到,没病被误诊的概率也不高(1%),但是由于发病率很低所以真阳性的数量远远小于假阳性的数量。结果,有病固然基本上显示为阳性,但阳性结果却只有很小的概率是真的有病。
现在让我们来玩玩数字游戏,把上面的几个数字改变一下,看看结果会发生什么改变:
一、
二、
三、
好了,总结上面的数字游戏——游戏只是说随意地改变参数,算法是可靠的——可以看出:当面对一个阳性结果,真实情况如何并不全由阳性率(有病的时候能被检测到的概率)决定。真实的随机发病率和假阳性率的相对大小甚至更为重要。(未完见下篇)