标签:
概率错觉豪斯教育 |
两年前对豪斯医生剧情的吐槽,因某个人的批评而引发了热议,被@eprom激将,我去搜狐微博开了“剃刀的小号”,与@unknownc4 @嵌段共聚物_科学公园 两位博士进行了几天激烈的争论,现总结小文,作为一篇概率科普。
有个人买彩票中了两次头奖,当听到这个说法时,您的第一反应肯定是不可能,一个人中一次头奖的概率按10万分之1计算,连中2次的概率就是100亿分之1,这怎么可能真的发生呢?很遗憾,您的理解是错误的,问题的关键在于“有个人”,而不是“随机指定一个人”。
如果在大街上随便拦住一个人,他中了两次头奖的概率的确是100亿分之1,但“有个人”的情况就不同了。可以想象,有史以来全世界各国搞的彩票抽奖真在太多了,我们随便估个数字,就算是8万次吧,那就会有8万个头奖获得者。在这8万个幸运儿当中,至少有一名再次获得头奖的概率是多少呢?
很明显,8万人全都不再获头奖的概率是(1-1/100000)^80000=0.45,即至少有一名再获头奖的概率是0.55,如此大的概率是不是令您非常震惊呢?这就是非常奇妙的概率直觉错误。
为什么会这样呢?聪明的您一定有所察觉了,这个8万次方是个关键,本来某个人不主头奖的概率高达0.99999,但8万个都不中的概率就会锐减到0.45了,反过来说,至少有一位再中的概率就高达0.55了。
美剧《豪斯医生》中的主角豪斯是个非常厉害的诊断专家,难诊断的罕见病患者纷纷被送到他的诊室,有一天他的医疗团队发现有个病人的症状符合两种不同罕见病,难道一个人居然同时得了两种罕见病?假设两种罕见病的发病率都是万分之1,同时发病的概率不就是亿分之1吗?这怎么可能?
通过上面的彩票例子,您可能隐隐地觉得不能这样算,是的!不能这样算。首先,被送到豪斯诊室的病人几乎100%是某个万分之1罕见病的患者,您可能抬扛说不是100%,并提出一个新的数字,例如85%,为了计算方便,我们就假定100%吧,仅仅是因为概率为1比较好计算。
问题转化为这个已经得了某种罕见病的患者,他再得另一种罕见病的概率是多少?当然是万分之1,而不是亿分之1,因为“被豪斯医生收治”这个条件,大大影响了这个概率。等等,这还没完......
从更大的范围去看,在豪斯医生诊断过的100个罕见病患者当中,其中至少有1个身患两种罕见病的概率是多少呢?继续按上面彩票的算法来分析,100个患者全都没患第二种罕见病的概率是(1-1/10000)^100=0.99,即至少出现1位身患两种罕见病的概率是百分之1,这比您的想象大得多吧?这次您一定发现了“100个患者”是关键所在,这个数越大,则至少出现1位身患两种罕见病的概率就越高。
有个博士质问我,100个患者和1个患者,结果能一样吗?结果当然不一样,我特别指定了这个100,就跟彩票例子中指定的8万人一样,是想通过指数运算得到一个产生更大直觉偏差的结果,从而令被科普者感到震惊并引发思考。
为什么会出现这种直觉错误呢?原因是先验概率的极端不平衡,先验概率是通过统计得出的结果,例如某种病在普通人群中的发病率是万分之1,这就是先验概率,它是不受某个特定案例而改变的非条件概率。
例如在结核病院住院的患者,他患结核病的概率当然远大于社会上的普通人群,这并不意味着“先验概率”变了,而是“在结核病院住院”这个条件使得他结核病的概率,变成了一个条件概率。(这段有点绕,您可以忽略,目的是为了纠正某个曾跟我争辩过的另一位博士的错误。)
万分之1这样极端不平衡的概率,把我们的直觉搞懵了,如果没有受过严格的数学训练,头脑的确会绕不过这个弯子。我给学生讲课时,经常会讲一个例子:我是医学盲,对罕见病的诊断一无所知,而你是罕见病诊断专家,误诊率低至1%,在大街上随便抓一个人,我俩分别诊断他是否患了一种发病率为万分之1的罕见病,你动用了所有豪华的检验设备,而我就闭着眼睛判断他没病,那谁的诊断结果更准确呢?我比你准确大约100倍!
当然,我的所谓“诊断”是耍滑头的,把极端不平衡的先验概率转化为非常低的误诊率,但这种诊断没有排除任何不确定性,是毫无意义的。而你筛查1万个人,大约会找出1百个人,其中可能只有1个是真有病的,但多筛几次就能把患者找出来了,你的检查才有意义。
作为大学工科教师,通过多年的教育实践,发现了一个现象:绝大多数同学的《概率论》都通过了,但其中大多数人并没有真正学明白,有趣的是自以为明白的人却很多,而且在头脑中构建了一整套似是而非的模型,很难打破,甚至包括很多名校的毕业生。
这两天跟几位名校毕业的博士争论由“豪斯诊断”引发的概率问题,如果我说他们的基础概念都是错的,可能会令网友们震惊,会认为我在狂妄地说大话,但事实就是如此,这同样也令我感到非常遗憾。
另:对概率话题感兴趣的网友,可以看看我曾写过的另一篇文章,《记者为什么也要学点数学?》,在网上一搜便得。