加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

Statistics(5)方差分析(一):单向方差分析

(2007-04-24 17:04:09)
 方差分析(一):单向方差分析

     方差分析(analysisi of variance,ANOVA)又称变异系数分析F检验,适用于对多个平均值进行总体的假设检验,以检验试验所得的多个平均值是否来自相同的总体。

一.方差分析的基本思想

       方差分析的基本思想是将出现在所有测量值上的总变异按照其变异的来源分解为多个部分,然后进行比较,评价由某种因素所引起的变异是否具有统计学意义。

       单向方差分析(one way analysis of variance)是指处理因素只有一个。这个处理因素包含有多个离散水平,分析在不同处理水平上应变量的平均值是否来自相同总体。在单向方差分析中,变异来源于两个方面,一方面是受试对象个体间的变异(称组内变异),另一方面是实验因素各水平间的变异(称组间变异)。因此,总变异可按其变异来源进行分解。

1.离均差平方和的分解

      总离均差平方和=组间离均差平方和+组内离均差平方和

      SS=SS组间+SS组内

2.F值与F分布

      t检验是用t值进行假设检验的,方差分析则用F值进行假设检验。每种来源的离均差平方和用相应的自由度去除,可得到平均的离均差平方和,简称均方(mean square,MS)。总离均差平方和的自由度v=N-1。组间离均差平方和的自由度v组间=a-1(a为组数),组内离均差平方和的自由度v组内=N-a。

   F值的计算公式为:

   F=MS组间/MS组内

   t分布只有一个自由度。因为两组比较时,组间自由度恒为1。F分布有两个自由度,即组间自由度v组间=a-1及组内自由度v组内=N-a,又分别称为分子自由度v1和分母自由度v2。F分布是一种偏态分布。它的分布曲线由这两个自由度来决定。

二.方差分析的步骤

1.整理和描述资料。

2.提出检验假设及规定I类错误概率水准α的大小。

   H0:μ1=μ2=…=μa

   H1:μi≠μh=,至少有一个不等式成立。i,h=1,2,…,a。i≠h。

3.计算各种离均差平方和、自由度及均方。

4.计算F值。

5.确定P值并作出统计学推断。

三.平均值之间的多重比较

       方差分析是对各观察组的平均值是否来自相同总体进行总的检验,不能对各组间的差别作深入分析。这一点却往往是研究者最关心的。对于一个实验,如果经方差分析后不拒绝无效假设,则表示各组平均值所代表的总体是相等的。分析工作即可终止。但若结果拒绝了无效假设,则需进行平均值之间的多重比较以进一步确定哪些组的平均值之间的差别,具有统计学意义。这时就涉及到累积I类错误概率的问题。

    当有a个平均值需作两两比较时,比较的次数共有c=a!(a-1)!/2!。当比较的次数越多,在无效假设为真时,拒绝无效假设时的累积I错误概率也越大。设每次检验所用I类错误的概率水准为α,累积I类错误的概率为α’,则在对同一实验资料进行c次检验时,在样本彼此独立的条件下,根据概率乘法原理,其累积I类错误概率α’与c有下列关系:

           α’=1-(1-α)c

目前有多种有效控制累积I类错误概率的多重比较方法,下面介绍常用的Bonferroni法、SNK法和Tukey法。

1.Bonferroni法

   Bonferroni提出,如果在α水准上进行c次假设检验,当无效假设为真时,至少有一次拒绝无效假设的累积I类错误概率α’不超过c×a,即有不等式α’< c×a。因此可以重新选择I类错误概率水准α,以便使累积I类错误概率α’=0.5。根据Bonferroni不等式可得到要重新选择的α水准为α=(0.05/3)=0.016。只有当t检验的I类错误概率等于或小于0.016时才能拒绝无效假设。这样当无效假设为真时,其累积I类错误概率不超过α’=0.05。

    用Bonferroni法进行多个平均值之间的两两比较时所用的t检验公式为:

    t=(Yi-Yh)/Se

    式中的分母Se为两平均值之差的标准误,计算公式为:

        Se=[ MS组内×(1/ni+1/nh)]1/2

    Yi、Yh及ni、nh分别是两个比较组的平均值及观察例数。

    当比较次数不多时,Bonferroni法的效果较好。但当比较次数较多(例如在10次以上)时,则由于其检验水准选择得过低,结论偏于保守。

2.SNK法

   SNK(student-Newman-Keuls)法又称q检验,是根据q值的抽样分布作出统计推论。

(1)将各组的平均值按由小到大的顺序排列。

(2)计算两个平均值之间的差值及组间跨度k。

(3)计算两对比组之差的标准误Se,计算公式为:

      Se=[ MS组内×(1/ni+1/nh)/2]1/2

(4)按下列公式计算统计量q值:

     q=(Yi-Yh)/Se

(5)计算P值并作出统计推断。需用组内自由度、检验水准并根据不同的组间跨度查q界值表。

3.Tukey法

   Tukey法用称为真正显著差(honestly significant difference,HSD)的单一值作为判断标准。

(1)计算各组平均值两两之间的绝对差值d(i,h)

(2)根据检验水准α,观察总例数N及比较组数k,从q界值表中查出qα(k,N-k)的值。

(3)用下列公式计算HSD值:

     HSD=qα(k,N-k)×(MS组内/n)1/2

     式中n是比较组的观察例数。当两组的观察例数相等时用n;当两组的观察例数不相等时用例数较少的ni代替n。

(4)将差值d(i,h)与HSD值进行比较。凡d(i,h) ≥ HSD者则拒绝无效假设;否则不拒绝无效假设。

四.方差分析的假定条件和数据变换

1.方差分析的假定条件

(1)观察值Yij独立来自正态分布的总体

       如果样本含量较大,虽然总体分布偏离正态,由于有中心极限定理的保证,方差分析也是适用的。但是如果总体极度地偏离正态时,则须作数据转换,以改善其正态性。

(2)方差齐性(homogeneity)

       只有当各组内方差在总体上相等时,才能有效地分析各对比组平均值之间的差异。当最大方差与最小方差之比值(Fmax=S2最大/S2最小)超过3时,由于增大了I类错误的概率,就可能影响对方差分析结果的判断。如果各对比组的观察例数不相等,则其影响程度会更大。

2.方差齐性检验

       前面介绍了检验两个总体方差齐性的方法。这里介绍检验多个总体方差齐性的方法。

(1)提出检验假设

     H0:σ21=σ22=…σ2a

    H1:σ2i ≠σ2h,i≠h至少有一个不等式成立。i,h=1,...,a。

(2)计算每一组的中位观察值mdi

        中位观察值mdi是指在第i组内所有观察值按由大到小的顺序排列后位置居中的观察值。

(3)计算各组内个体观察值与中位观察值之差的绝对值dij,并用dij作单向方差分析。

3.数据变换

       对于一些明显偏离正态性和方差齐性条件的资料,可以通过数据变换的方法以改善其假定条件,使方差分析的结果趋于稳健。常用的数据变换方法有:

(1)平方根反正弦变换(arcsine square root transformation)

(2)平方根变换(square root transformation)

(3)对数变换(logarithm transformation)

        数据变换的缺点是对分析结果作解释欠直观。

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有