R语言与显著性检验

标签:
股票 |
分类: 数据统计与分析 |
假设随机抽取A几次中考的成绩和B几次中考的成绩,问A与B的成绩是否存在显著差异?
代码:
x=c(92,78,94,88,76,87);#A的成绩
y=c(69,52,86,80,47,63,76,82);#B的成绩
stem(x) #A的成绩茎叶图
stem(y) #B的成绩茎叶图
EDA=function(z)
{par(mfrow=c(2,2)); #设置作图窗口为2行2列
}
EDA(x)
EDA(y)
r=rank(y,ties.method = "random"); # y
求秩
p=rank(x,ties.method = "random"); # x
求秩
ks.test(p,"pnorm")
#检验样本数据是否符合正态分布
ks.test(r,"pnorm")
#检验样本数据是否符合正态分布
wilcox.test(x,y)
#对两样本作符号秩和检验
————————————————————————————
分析:
> stem(x) #A的成绩茎叶图
> stem(y) #B的成绩茎叶图
从茎叶图可以得出A与B的成绩都不完全是正态分布的。而且,对比可以看到A成绩以85-95为主;B的成绩比较分散,以60-90分为主。所以可初步估计A的成绩比B好,但并不能判断A的成绩显著高于B。
从散点图和箱线图可以判断出,B的成绩明显比A分散,且B的成绩平均值明显低于A。从Q-Q图可以看到,A,B的成绩数据都有比较严重的偏离正态性,所以应该首先考虑运用非参数的统计分析方法。
> ks.test(p,"pnorm")
#检验样本数据是否符合正态分布
data: p
D = 0.8413, p-value = 3.19e-05
alternative hypothesis: two-sided
> ks.test(r,"pnorm")
#检验样本数据是否符合正态分布
data: r
D = 0.8522, p-value = 4.542e-07
alternative hypothesis: two-sided
上面两个检验的p-value都明显小于0.05,所以拒绝认为样本数据服从正态分布的特性,即样本的正态性较差,从而用基于符号秩和的检验是正确的。
> wilcox.test(x,y)
#对两样本作符号秩和检验
data: x and y
W = 41.5, p-value = 0.02801
alternative hypothesis: true location shift is not equal to
0
从以上R软件运行的结果可以看到,p-value =
0.02801,在显著性水平为0.05的条件下,p-value <
0.05,所以拒绝原假设(原假设:成绩不存在显著差异),即认为A,B成绩存在显著差异。
经过对A,B的Wilcoxon符号秩检验可以得出,在显著性水平为0.05的条件下,拒绝认为A,B成绩不存在显著差异,也就是说可以认为A,B成绩有显著的不同,所以综上可以认为A成绩显著高于B。
前一篇:方差齐性检验