如果在同一数据集上同时检验n个独立的假设,那么用于每一假设的统计显著水平,应为仅检验一个假设时的显著水平的1/n。举个例子:如要在同一数据集上检验两个独立的假设,显著水平设为常见的0.05。此时用于检验该两个假设应使用更严格的0.025。即0.05*
(1/2)。该方法是由Carlo Emilio Bonferroni发展的,因此称Bonferroni校正。
这样做的理由是基于这样一个事实:在同一数据集上进行多个假设的检验,每20个假设中就有一个可能纯粹由于概率,而达到0.05的显著水平。
假如有10个检验,经过Bonferroni 校正以后,新的p值可以这样计算1-(1-p)^(1/10)=p'
p'就是 新的显著性水平
序列化的 Bonferroni 校正
子非吾 发表于 2006-12-19 19:20:00
|
序列化的 Bonferroni 校正 (Sequential Bonferroni
technique)
一个健康人,如果请他/她到医院作所有指标的检查,那么也很有可能得到有一些指标“不正常”。原因就是,所有的测度和判断都是有误差的,而连续进行测度和判断的时候,即使本来都是正常的,也很有可能发现一些指标“不正常”。用统计术语,就叫增加了犯“I
类错误”的概率。
当连续进行检验的时候,即使本来都是没有差异的,总是会发现一些“差异显著”的例子。解决这个问题的方法之一就是做Bonferroni
校正。B onferroni 校正最初是由Bonferroni, C. E. (1935) 提出的,不过我参考的是 Rice
(1989) ,里面是引用Holm (1979) 的。另外有一个网页(http://mathworld.wolfram.com/BonferroniCorrection.html)也讲了这个方法。
具体方法如下:
对k个独立的检验,在给定的显著性水平(α)下,把每个检验对应的 P 值从小到大排列 (P1,
Pk)。首先看最小的 P 值(P1);如果P1≤α/k,就认为对应的检验在总体上(table
wide)α水平上显著;如果不是,就认为所有的检验都不显著;当,且仅当P1≤α/k
时,再来看第二个P值(P2)。如果P2≤α/(k-1),就认为在总体水平上对应的检验在α水平上是显著的;之后再进行下一个P值。一直进行这个过程,直到Pi≤α/(k-i)不成立;下结论i和以后的检验都不显著。
这个方法被批评过,因为太保守了Moran (2003)。后来还有一些争论和改进(见Moran
网页里面的引用Moran 2003的文献)。
参考文献:
Bonferroni, C. E. (1935) Il calcolo delle
assicurazioni su gruppi di teste. In Studi in Onore del Professore
Salvatore Ortu Carboni. Rome: Italy, pp. 13-60.
Rice W. R. (1989) Analyzing tables of statistical
tests. Evolution 43: 223–225.
Moran, M.D. (2003) Arguments for rejecting the sequential
Bonferroni in ecological studies. Oikos 100 (2), 403-405. doi:
10.1034/j.1600-0706.2003.12010.x
(http://www.blackwell-synergy.com/doi/full/10.1034/j.1600-0706.2003.12010.x?prevSearch=allfield%3A%28Moran%29)
|
|
See also here.
http://privatewww.essex.ac.uk/~scholp/bonferroni.htm
加载中,请稍候......