第二十七课符号检验和Wilcoxon符号秩检验2_黄双斗

http://blog.sina.com.cn/u/1798760053

首页博文目录关于我

个人资料

微博

加好友发纸条

写留言加关注

博客等级：
博客积分：

博客访问：
关注人气：
获赠金笔：0支
赠出金笔：0支
荣誉徽章：

正文字体大小：大中小

第二十七课符号检验和Wilcoxon符号秩检验2

(2010-09-18 22:06:52)

标签：

杂谈

分类： SAS学习

三、 实例分析

例27.1的SAS程序如下：

data study.training ;
input before after;
d= after-before;
cards;
3 5
2 4
4 3
1 3
4 4
3 5
1 2
4 5
3 1
1 3
3 5
2 4
3 2
3 5
1 3
;
proc univariate data=study.training;
var d;
run;

程序说明：建立输入数据集training，首先要对定性资料进行量化。本例把学生成绩按5分计量，设定优=5分，良=4分，中=3分，及格=2分，差=1分。把提高学生某种素质的训练前成绩和训练后成绩分别存放在变量before和after中，变量d等于配对的训练后成绩减去训练前成绩。注意只能调用univariate过程，而不能调用means过程来进行符号检验。分析变量为单样本数据集training中的d变量。输出的主要结果如表27.4所示。

表27.4 用univariate过程进行符号检验的输出结果

Univariate Procedure

Variable=D

Moments Quantiles(Def=5)

N 15 Sum Wgts 15 100% Max 2 99% 2

Mean 1.066667 Sum 16 75% Q3 2 95% 2

Std Dev 1.387015 Variance 1.92381 50% Med 2 90% 2

Skewness -1.24756 Kurtosis 0.181317 25% Q1 0 10% -1

USS 44 CSS 26.93333 0% Min -2 5% -2

CV 130.0326 Std Mean 0.358126 1% -2

T:Mean=0 2.978471 Pr>|T| 0.0100 Range 4

Num ^= 0 14 Num > 0 11 Q3-Q1 2

M(Sign) 4 Pr>=|M| 0.0574 Mode 2

Sgn Rank 38 Pr>=|S| 0.0154

Extremes

Lowest Obs Highest Obs

-2( 9) 2( 10)

-1( 13) 2( 11)

-1( 3) 2( 12)

0( 5) 2( 14)

1( 8) 2( 15)

结果说明：符号检验统计量M(Sign)=4，它是取正符号和负符号两者之间的小者作为检验统计量，Pr>=|M|计算的概率是二项分布的两尾概率之和，因此它是双侧检验，检验正符号和负符号是否相同，结果为0.0574。在显著水平设定为0.1时，由于0.0574<0.1，拒绝原假设。符号检验的缺点是丢失了差值d大小的信息，如果设定检验的显著水平为0.05，那么本例检验结果却由于0.0574>0.05，改变为不能拒绝原假设。但是，如果我们用考虑差值d大小的信息的Wilcoxon符号秩检验，即Sgn Rank，由于0.0154<0.05，仍然得到拒绝原假设的检验结果。

例27.2的SAS程序如下：

data study.time ;
input m1 m2;
d= m1-m2;
cards;
10.2 9.5
9.6 9.8
9.2 8.8
10.6 10.1
9.9 10.3
10.2 9.3
10.6 10.5
10.0 10.0
11.2 10.6
10.7 10.2
10.6 9.8
;
proc univariate data=study.time normal;
var d;
run;

程序说明：建立输入数据集time，数据的输入和配对t检验相同，即数据一对一对的输入，然后求出差值d。过程步也和配对t检验类同，但必须调用univariate过程。本例用了“normal”选项对差值作正态性检验。输出的主要结果如表27.5所示。

表27.5 用univariate过程进行Wilcoxon符号秩检验的输出结果

Univariate Procedure

Variable=D

Moments Quantiles(Def=5)

N 11 Sum Wgts 11 100% Max 0.9 99% 0.9

Mean 0.354545 Sum 3.9 75% Q3 0.7 95% 0.9

Std Dev 0.422761 Variance 0.178727 50% Med 0.5 90% 0.8

Skewness -0.56332 Kurtosis -0.80699 25% Q1 0 10% -0.2

USS 3.17 CSS 1.787273 0% Min -0.4 5% -0.4

CV 119.2404 Std Mean 0.127467 1% -0.4

T:Mean=0 2.78146 Pr>|T| 0.0194 Range 1.3

Num ^= 0 10 Num > 0 8 Q3-Q1 0.7

M(Sign) 3 Pr>=|M| 0.1094 Mode 0.5

Sgn Rank 22 Pr>=|S| 0.0234

W:Normal 0.942951 Pr<W 0.5338

Extremes

Lowest Obs Highest Obs

-0.4( 5) 0.5( 10)

-0.2( 2) 0.6( 9)

0( 8) 0.7( 1)

0.1( 7) 0.8( 11)

0.4( 3) 0.9( 6)

结果说明：配对资料如果其差值不是具体数字，只能用符号检验。但如果差值有具体数字，而使用符号检验，相当于只利用了它的“ ”、“－”，而对数字大小中所包含信息却未加利用。此时，应该使用配对资料的t检验或配对资料的Wilcoxon符号秩检验。如果我们有理由相信配对资料符合正态分布且正态性检验也不能拒绝差值d具有正态性，那么应该使用t检验，这也是本程序需要“normal”选项的原因。但是，如果我们没有任何理由相信配对资料符合正态分布，即使在正态性检验也不能拒绝差值d具有正态性的情况下，建议还是使用Wilcoxon符号秩检验。差值d的正态性检验的结果为0.5338>0.05，因此不能拒绝差值d具有正态性。因为制造商拒绝相信差值d具有正态性，所以我们采用Wilcoxon符号秩检验。

Wilcoxon符号秩统计量S（Sgn Rank）=22。SAS系统在 20时，Pr>=|S|的概率由S的精确分布计算，而S的分布是尺度二项分布的卷积，所以精确结果为p=0.0234<0.05，拒绝原假设，即两种不同的生产方法所花费的生产时间是有差异的。

当 >20时，将符号秩统计量S标准化成自由度为－1的t统计量来计算显著水平。注意，跟我们上面所介绍的转换成标准正态分布略有不同，原因是当较大时，t分布渐近标准正态分布。另外，SAS系统在计算秩统计量S的方差时，用结值来修正方差。拒绝原假设，即两种不同的生产方法所花费的生产时间是有差异的。

阅读┊ 收藏 ┊ 喜欢 ▼ ┊打印┊举报/Report

前一篇：第二十七课符号检验和Wilcoxon符号秩检验

后一篇：第二十八课 Wilcoxon秩和检验

新浪BLOG意见反馈留言板　欢迎批评指正

第二十七课 符号检验和Wilcoxon符号秩检验2

杂谈

第二十七课符号检验和Wilcoxon符号秩检验2