第二十七课 符号检验和Wilcoxon符号秩检验2
(2010-09-18 22:06:52)
标签:
杂谈 |
分类: SAS学习 |
三、
例27.1的SAS程序如下:
data study.training ; |
input |
d= after-before; |
cards; |
3 |
2 |
4 |
1 |
4 |
3 |
1 |
4 |
3 |
|
|
|
|
|
|
; |
proc univariate data=study.training; |
var d; |
run; |
程序说明:建立输入数据集training,首先要对定性资料进行量化。本例把学生成绩按5分计量,设定优=5分,良=4分,中=3分,及格=2分,差=1分。把提高学生某种素质的训练前成绩和训练后成绩分别存放在变量before和after中,变量d等于配对的训练后成绩减去训练前成绩。注意只能调用univariate过程,而不能调用means过程来进行符号检验。分析变量为单样本数据集training中的d变量。输出的主要结果如表27.4所示。
表27.4
Univariate Procedure Variable=D
|
结果说明:符号检验统计量M(Sign)=4,它是取正符号和负符号两者之间的小者作为检验统计量,Pr>=|M|计算的概率是二项分布的两尾概率之和,因此它是双侧检验,检验正符号和负符号是否相同,结果为0.0574。在显著水平设定为0.1时,由于0.0574<0.1,拒绝原假设。符号检验的缺点是丢失了差值d大小的信息,如果设定检验的显著水平为0.05,那么本例检验结果却由于0.0574>0.05,改变为不能拒绝原假设。但是,如果我们用考虑差值d大小的信息的Wilcoxon符号秩检验,即Sgn Rank,由于0.0154<0.05,仍然得到拒绝原假设的检验结果。
例27.2的SAS程序如下:
data study.time ; |
input |
d= m1-m2; |
cards; |
10.2 |
9.6 |
9.2 |
10.6 |
9.9 |
10.2 |
10.6 |
10.0 |
11.2 |
|
|
; |
proc univariate data=study.time normal; |
var d; |
run; |
程序说明:建立输入数据集time,数据的输入和配对t检验相同,即数据一对一对的输入,然后求出差值d。过程步也和配对t检验类同,但必须调用univariate过程。本例用了“normal”选项对差值作正态性检验。输出的主要结果如表27.5所示。
表27.5
Univariate Procedure Variable=D
W:Normal
|
结果说明:配对资料如果其差值不是具体数字,只能用符号检验。但如果差值有具体数字,而使用符号检验,相当于只利用了它的“ ”、“-”,而对数字大小中所包含信息却未加利用。此时,应该使用配对资料的t检验或配对资料的Wilcoxon符号秩检验。如果我们有理由相信配对资料符合正态分布且正态性检验也不能拒绝差值d具有正态性,那么应该使用t检验,这也是本程序需要“normal”选项的原因。但是,如果我们没有任何理由相信配对资料符合正态分布,即使在正态性检验也不能拒绝差值d具有正态性的情况下,建议还是使用Wilcoxon符号秩检验。差值d的正态性检验的结果为0.5338>0.05,因此不能拒绝差值d具有正态性。因为制造商拒绝相信差值d具有正态性,所以我们采用Wilcoxon符号秩检验。
Wilcoxon符号秩统计量S(Sgn Rank)=22。SAS系统在 20时,Pr>=|S|的概率由S的精确分布计算,而S的分布是尺度二项分布的卷积,所以精确结果为p=0.0234<0.05,拒绝原假设,即两种不同的生产方法所花费的生产时间是有差异的。
当 >20时,将符号秩统计量S标准化成自由度为 -1的t统计量来计算显著水平。注意,跟我们上面所介绍的转换成标准正态分布略有不同,原因是当 较大时,t分布渐近标准正态分布。另外,SAS系统在计算秩统计量S的方差时,用结值来修正方差。拒绝原假设,即两种不同的生产方法所花费的生产时间是有差异的。