[转载]Effect Size(效应量)

标签:
转载 |
Effect Size(效应量)
或许可以这么理解:p是定性的,只是看差异是否存在,效应量是定量的,看有多大的差异。
一.效应量的定义、分类和意义
效应量是反映效应程度大小的统计量,代表变量之间的紧密或差异程度。效应量可分为简单效应量、标准化效应量和相关效应量。简单效应量通常是效应组与对照组平均值之差。APA(美国心理学会)建议,当简单效应量具有实际的实践意义时(如3个月的运动减肥干预可以减少脂肪多少千克),可考虑采用简单效应量。但是,简单效应量受到量纲、整体变异大小等因索限制,不便于研究间的比较。标准化效应量则通过标准化数据解决了这些问题(如Cohen’s d等)。而相关效应量则是指自变量与应变量的相关程度(如决定系数R2等)。许多研究论文往往会报道结果的简单效应量和相关效应量,如在回归方程中应报道决
定系数或校正决定系数已成为基本要求.
二.效应量的种类和计算方法
据不完全统计,针对不同的统计方法所建立的效应量超过60种。随着效应量报道在各学科期刊的推广,如何合理选择和计算效应量将成为广大科研工作者面临的问题。鉴于篇幅原因,本文仅介绍几种广泛采用的效应量
Cohen’s d是最常用的标准化效应量之一,其定义为两组平均值之差除以标准差(方程1),可应用于两组样本均数比较的效应量计算。在这里。Cohen定义的标准差是任意一组标准差(因为两组标准差被假定为相等)。在实际计算中,大多数学者推荐采用合并标准差(PooledSmedard Deviation),计算方法如方程2所示。在标准差未知的情况下(如需要了解某论文结果部分的效应量,但该论文未提供标准差等),也可以通过其他方法(如方程3)进行估计。Cohen’s d的评价标准为:小效应(≥0.2且<0.5);中等效应(≥0.5且<0.8);大效应(≥0.8)。其他学者也提出过其他的评价标准,但只是临界值略有不同,如临界值分别为0.15、0.4和0.75。
与Cohen’s d相类似的效应量还有Glass’s Delta(△)和Hedges ’s g。Glass’s Delta是两组平均值之差除以第2组(或对照组)的标准差(方程4)。Hedges ’s g也是两组平均值之差除以合并标准差,但公式中合并标准差的计算与Cohen’s d略有差异(方程5)。
η2(eta squared)是方差分析中常用的效应量,代表应变量被某一自变量解释的方差比例(方程6)。由方程可知,η2 受自变量数目所影响。当自变量数目增加时,η2会减小。因而无法准确评价效应的大小。因此,有学者提出了η2 p (partial eta.squared)。η2 p是控制了其他自变量后应变量被某一自变量解释的方差比例(方程7),一般而言,η2 p >η2(单因素方差分析时,两者相同)。由于η2 p的分母是效应变异和误差变异的和,η2 p不会因为自变量的增多而变化,从而有利于评价。需要注意的是,也因此各自变量的η2 p之和不等于1。某些统计软件,如SPSS提供了计算多因素方差分析的η2 p的功能模块。有学者建议η2 p的评价标准为:小效应(≥0.01且<0.06);中等效应(≥0.06且<0.14);大效应(≥0.14),但目前尚无统一的评价标准。
ω2(omega squared) 与η2 p相比,还考虑了误差,提供了相对更准确的效应量估计。不过研究设计不同,ω2的计算公式也有所不同。方程8是计算ω2最常用、方便的公式之一。有其他学者介绍其他公式,本文不做赘述。值得注意的是,尽管η2 p和ω2是方差分析中最常用的效应量,η2 p和ω2也存在一些局限。有学者指出,在采用有分类分块因子(blocking factor)研究设计时,会影响η2 p和ω2的计算结果。这是因为对受试者进行分类会减小受试者数据的误差变异(S‰),并最终引起η2 p和ω2增大。
φ(phi)是卡方检验中的常用的效应量,其计算方法如方程9所示,其中,X2是卡方值,n是样本量。但φ只能用于计算2×2四格表卡方检验中的效应量,对于多行多列的情况,应采用φc(Cramer’s phi),其计算公式如方程10所示,其中,k为行数和列数中的较小者(如3×4表格中, k=3).