加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

第二十七课         符号检验和Wilcoxon符号秩检验2

(2010-09-18 22:06:52)
标签:

杂谈

分类: SAS学习

三、          实例分析

例27.1的SAS程序如下:

data study.training ;

input  before after;

d= after-before;

cards;

5

4

3

3

4

5

2

5

1

         3

        5

        4

        2

    5

        3

;

proc univariate data=study.training;

var d;

run;

 

程序说明:建立输入数据集training,首先要对定性资料进行量化。本例把学生成绩按5分计量,设定优=5分,良=4分,中=3分,及格=2分,差=1分。把提高学生某种素质的训练前成绩和训练后成绩分别存放在变量beforeafter中,变量d等于配对的训练后成绩减去训练前成绩。注意只能调用univariate过程,而不能调用means过程来进行符号检验。分析变量为单样本数据集training中的d变量。输出的主要结果如表27.4所示。

表27.4        用univariate过程进行符号检验的输出结果

 

Univariate Procedure

Variable=D

                 Moments                                            Quantiles(Def=5)

                15  Sum Wgts         15                100% Max              99%         2

 Mean       1.066667  Sum              16                 75% Q3               95%         2

 Std Dev    1.387015  Variance    1.92381                 50% Med              90%         2

 Skewness   -1.24756  Kurtosis   0.181317                 25% Q1               10%        -1

 USS              44  CSS        26.93333                  0% Min        -2        5%        -2

 CV         130.0326  Std Mean   0.358126                                          1%        -2

 T:Mean=0   2.978471  Pr>|T|       0.0100                Range            4

 Num ^= 0         14  Num > 0          11                Q3-Q1            2

 M(Sign)           Pr>=|M|      0.0574                Mode             2

 Sgn Rank         38  Pr>=|S|      0.0154

                                            Extremes

                               Lowest    Obs     Highest    Obs

                                   -2(       9)        2(      10)

                                   -1(      13)        2(      11)

                                   -1(       3)        2(      12)

                                    0(       5)        2(      14)

                                    1(       8)        2(      15)


 

结果说明:符号检验统计量M(Sign)=4,它是取正符号和负符号两者之间的小者作为检验统计量,Pr>=|M|计算的概率是二项分布的两尾概率之和,因此它是双侧检验,检验正符号和负符号是否相同,结果为0.0574。在显著水平设定为0.1时,由于0.0574<0.1,拒绝原假设。符号检验的缺点是丢失了差值d大小的信息,如果设定检验的显著水平为0.05,那么本例检验结果却由于0.0574>0.05,改变为不能拒绝原假设。但是,如果我们用考虑差值d大小的信息的Wilcoxon符号秩检验,即Sgn Rank,由于0.0154<0.05,仍然得到拒绝原假设的检验结果。

例27.2的SAS程序如下:

data study.time ;

input  m1 m2;

d= m1-m2;

cards;

10.2   9.5

9.6   9.8

9.2   8.8

10.6  10.1

9.9  10.3

10.2   9.3

10.6  10.5

10.0  10.0

11.2  10.6

       10.7  10.2

       10.6   9.8

;

proc univariate data=study.time normal;

var d;

run;

 

程序说明:建立输入数据集time,数据的输入和配对t检验相同,即数据一对一对的输入,然后求出差值d。过程步也和配对t检验类同,但必须调用univariate过程。本例用了“normal”选项对差值作正态性检验。输出的主要结果如表27.5所示。

 

表27.5    用univariate过程进行Wilcoxon符号秩检验的输出结果

 

Univariate Procedure

Variable=D

                 Moments                                            Quantiles(Def=5)

                11  Sum Wgts         11                100% Max       0.9       99%       0.9

 Mean       0.354545  Sum             3.9                 75% Q3        0.7       95%       0.9

 Std Dev    0.422761  Variance   0.178727                 50% Med       0.5       90%       0.8

 Skewness   -0.56332  Kurtosis   -0.80699                 25% Q1               10%      -0.2

 USS            3.17  CSS        1.787273                  0% Min      -0.4        5%      -0.4

 CV         119.2404  Std Mean   0.127467                                          1%      -0.4

 T:Mean=0    2.78146  Pr>|T|       0.0194                Range          1.3

 Num ^= 0         10  Num > 0                         Q3-Q1          0.7

 M(Sign)           Pr>=|M|      0.1094                Mode           0.5

 Sgn Rank         22  Pr>=|S|      0.0234

W:Normal   0.942951  Pr<W         0.5338

                                            Extremes

                               Lowest    Obs     Highest    Obs

                                 -0.4(       5)      0.5(      10)

                                 -0.2(       2)      0.6(       9)

                                    0(       8)      0.7(       1)

                                  0.1(       7)      0.8(      11)

                                  0.4(       3)      0.9(       6)


 

结果说明:配对资料如果其差值不是具体数字,只能用符号检验。但如果差值有具体数字,而使用符号检验,相当于只利用了它的“ ”、“-”,而对数字大小中所包含信息却未加利用。此时,应该使用配对资料的t检验或配对资料的Wilcoxon符号秩检验。如果我们有理由相信配对资料符合正态分布且正态性检验也不能拒绝差值d具有正态性,那么应该使用t检验,这也是本程序需要“normal”选项的原因。但是,如果我们没有任何理由相信配对资料符合正态分布,即使在正态性检验也不能拒绝差值d具有正态性的情况下,建议还是使用Wilcoxon符号秩检验。差值d的正态性检验的结果为0.5338>0.05,因此不能拒绝差值d具有正态性。因为制造商拒绝相信差值d具有正态性,所以我们采用Wilcoxon符号秩检验。

Wilcoxon符号秩统计量S(Sgn Rank)=22。SAS系统在 20时,Pr>=|S|的概率由S的精确分布计算,而S的分布是尺度二项分布的卷积,所以精确结果为p=0.0234<0.05,拒绝原假设,即两种不同的生产方法所花费的生产时间是有差异的。

当 >20时,将符号秩统计量S标准化成自由度为 -1的t统计量来计算显著水平。注意,跟我们上面所介绍的转换成标准正态分布略有不同,原因是当 较大时,t分布渐近标准正态分布。另外,SAS系统在计算秩统计量S的方差时,用结值来修正方差。拒绝原假设,即两种不同的生产方法所花费的生产时间是有差异的。

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有