加载中…
个人资料
CDA数据分析师_人大经济论坛
CDA数据分析师_人
大经济论坛
  • 博客等级:
  • 博客积分:0
  • 博客访问:37,321
  • 关注人气:10
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
相关博文
推荐博文
谁看过这篇博文
加载中…
正文 字体大小:

非参数中的秩和检验到底怎么做的?

(2020-08-06 16:39:09)
标签:

数据分析

分类: 数据分析·人工智能·行业干货

文章来源: 丁点帮你微信公众号

作者:丁点helper

非参数中的秩和检验到底怎么做的?

今天,我们开始讲非参数检验。对于非参数检验,大家可能主要是把它和“不符合正态分布”一起记忆的。

刚开始学统计的时候,我们都知道:数据符合正态分布就用t检验,不符合就用非参数检验,更具体点,就是所谓的“秩和检验”。

这是没错的,对于数据量小,而且很不符合的正态分布的情况,秩和检验确实是必不可少的一种方法。所以搞懂秩和检验还是很有必要的。

那么第一个问题就是,这里的“秩”是什么意思?

有时候说英文还好理解些,这里的“秩”对应英文中的“Rank”,就是“排序、顺序”的意思。

另外,“秩和”里的“和”就是加和的意思,于是,所谓的“秩和检验”,就是“先排序、再加和”的检验。

“先排序,再加和”,基本上就是“秩和检验”整个的思想。

那具体是怎么排序,怎么加和的?

看如下案例。

某个工厂想比较两种生产同一商品的方法所用的时间是否相同,随机抽取11名员工,让每一名工人先按照第1种方法生产,记录时间;之后再按照第二种方法生产,同样记录生产时间。具体数据如下表。

非参数中的秩和检验到底怎么做的?

很明显,要比较两种生产方法所耗费的工时是否有差异,按照我们惯常的思维,用方法1-方法2,算差值,然后将差值的平均值与0比较,如果两种方法没有差异,那么这个差值就应该和0差不多。

以上是我们学习过的配对t检验的思路。

但是,现在首先数据量很小(只有11个),其次数据(两种方法的差值)分布不服从正态,所以不能再用t检验,而应使用非参数的方法。

非参数秩和检验的思路与t检验相比其实没有变化,只是t检验针对的是原始数据,而秩和检验针对的是“秩”!

我们一起来看看具体的操作步骤:

非参数中的秩和检验到底怎么做的?

第一步:将上述差值都取绝对值,所以,都变成了正值,如上表第4列;

第二步:以绝对值的大小进行编秩。这是秩和检验最关键的一步了,如上表第5列。在编秩时有以下规则:

1)差异绝对值为“0”的数剔除;

2)对于其他非“0”的数,按照从小到大的顺序编秩,其实就是排序。比如上表中差值绝对值最小的是“0.1”,由此,就给它编为“1”(号),其次是“0.2”,就编为“2”(号),依次类推;

3)对于相同的差值,比如在上表中有两个“0.4”,那么,我们就编为“平均秩”,均为“3.5”,而不是写“3”和“4”。而比“0.4”大的数,比如“0.5”,就跨过“4”(号)秩,给它赋值为“5”。但因为上表中有两个“0.5”,所以,也是求平均秩,分别编为“5.5”。

按照上述三条规则,完成编秩(其实就是数数,可以和家里的小孩一起玩,比的是细心)

第三步:添正负号,上表第2名工人和第5名工人,原始差值都是负数(-0.2和-0.4),这个时候,就需要在它们的秩前面添上负号,分别变为“-2”和“-3.5”。差值为正的不用管。

第四步:求秩和。秩编好了,正负号也添加完成,所以剩下的工作就只有求和。注意,此处有两种求和方式:

第一种直接将正秩和(一般用“R+”表示)与负秩和(对应为“R-”)相加,算出总的秩和,用R表示,将R进行z变换(所以SPSS软件输出的是z值),根据z值判断P值是否小于相应的检验水准。

这里的思想实际上是:如果两种方法耗时没有差异,那么这里的差值应该在0附近,而其对应的正秩和负秩大小应该差不多,所以总秩和加起来会相互抵消,因此总和与0差不多。

第二种是单独求和,即不把正秩和与负秩和相加,取二者中绝对值较小者,称作“W”,用数学的语言就是:W=min (R+, R-)。然后对W进行适当的变换(仍是z变换),根据z值判断P值是否小于相应的检验水准。

本例采用的是第一种方法,求总秩和,从数据上直接看“总秩和”为“+44”,很明显与“0”偏离比较大,所以,可以猜测最后的结果应该是不为0,即两种方法的生产时间不相同,样本数据来看,第2种方法耗费工时较短。

以上我们介绍的方法称作Wilcoxon符号秩和检验(维尔克科森符号秩检验),它一般被用于单样本和配对样本的秩和检验。

这里,我们重点讲解了“秩和检验”的基本内涵以及“编秩”的基本规则,而对具体如何进行的z变换笔墨很少,因为作为应用,我们肯定不再需要使用手算,而理解“秩和检验”的核心,应该是如何得到“秩和”。

至于获得“秩和”后如何进行检验,其实遵从的是假设检验的一般思路,好比在进行t检验的时候,我们是通过t变换计算t值算概率,而这里,我们是将“秩和”进行z变换求概率,逻辑上完全一致。

0

阅读 评论 收藏 转载 喜欢 打印举报/Report
  • 评论加载中,请稍候...
发评论

    发评论

    以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

      

    新浪BLOG意见反馈留言板 电话:4000520066 提示音后按1键(按当地市话标准计费) 欢迎批评指正

    新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

    新浪公司 版权所有