数据分析实验报告(非参数秩检验方法 )
(2010-12-22 20:46:38)
标签:
数据分析实验报告非参数秩和检验方法杂谈 |
分类: 学习资料 |
好多输出 贴不上去,不好意思啊
浙江理工大学
实 验 报 告
实验项目名称
所属课程名称
实 验 类 型
实 验 日 期
班
学
姓
成
【实验目的及要求】
掌握两种处理方法比较的秩检验方法和步骤;掌握成对分组设计下两种处理方法的比较方法;掌握多种处理方法比较的Kruskal-Wallis检验方法;掌握分组设计下多种处理方法的比较方法。了解多组差别秩和检验的注意事项。
【实验原理】
非参数方法具有较好的稳健性,同时有较广泛的适用性。非参数方法繁多,数据的秩是数据本身最基本的信息之一,基于数据的大小排列次序进行统计推断称之为非参数秩方法。对于随机分组下两种处理方法的比较可以用Wilcoxon秩和检验和Kolmogorov-Smirnov检验;为消除试验前个体的差异,进行成对分组设计下两种处理方法的比较,可做符号检验Wilcoxon符号秩检验;在随机分组模型下多种处理方法比较,可用Kruskal-Wallis检验方法进行比较;为避免因个体原有差异对多个处理方法比较的影响,需要进行分组设计下多种处理方法的比较。
【实验环境】
CPU T5100 1.3G;RAM 1024M。
Windows XP;SPSS 15.0等。
【实验方案设计】
(1)在随机分组模型下,两种处理方法比较的秩检验方法是进行非参数秩和检验。选取下面问题的数据进行检验:从24朵大小相近的小蘑菇中随机选出13朵施以维生素B1,另外11朵不施维生素B1,其他条件保持相同。一段时间后测得两组蘑菇的重量。检验维生素B1对刺激蘑菇生长的作用是否显著。
(2)为消除试验前个体的差异,进行成对分组设计下两种处理方法的比较。选取从下面问题的数据进行比较分析:为了检验一种新的复合肥料和原来肥料相比是否显著提高了小麦的产量,在一个农场中选择了10块田地,每块等分为两份,其中一部分使用新的复合肥料,另一部分使用原肥料。小麦成熟后称得各部分小麦的产量。利用符号秩和以及Wilcoxon符号秩和检验法检验这两种催化剂对该产品得率的影响是否显著。
(3)在随机分组模型下多种处理方法比较,可用Kruskal-Wallis检验方法进行比较。选取从下面问题的数据进行比较分析:选取某年我国各地区(省、区、市)地区生产总值,检验各地区生产总值有无显著差异,并对各地区生产总值平均得分排序。
(4)为避免因个体原有差异对多个处理方法比较的影响,需要进行分组设计下多种处理方法的比较。选取下面问题的数据进行比较分析:研究人们在睡眠状态下对各种情绪的反应力是否有差异,选取8人进行试验。在睡眠状态下,按要求每人按任意次序做出恐惧、愉快、忧虑和平静4种反应。测得在四种情绪状态反应下,受试者皮肤的电位变化值。检验受试者在催眠状态下对这4中情绪的反应力是否有显著差异。
【实验过程】(实验步骤、记录、数据、分析)
(1)打开SPSS软件,输入两组蘑菇的重量数据以及对是否使用维生素B1进行标记。点Analyze菜单按钮中的Nonparametric Tests命令项中的2 Dependent Samples…命令,跳出命令框后将左侧“蘑菇重量”调到右边的Test variables栏中,将左侧“是否使用维生素B1”调到右边的Grouping variables栏中,再点击Define Groups,输入1和2;再在Test type中点击Mann-Whitney U和Kolmogorov-Smirnov Z钮,再点击 OK 钮。
结果为
分析:从秩的实验结果看,未使用维生素B1的蘑菇重量的平均秩仅为7.27,使用维生素B1的蘑菇重量的平均秩为16.92,两者差别较显著。从检验统计量的结果看,Wilcoxon W统计量的值为80.0,正态逼近下检验的p值为0.001(双侧),精确计算的p值小于0.001;Kolmogorov-Smirnov Z统计量为1.775,正态逼近下检验的p值为0.004(双侧),精确计算的p值小于0.002(双侧);因而在显著性水平为0.05或者0.01下,认为使用维生素B1与否对蘑菇的生长重量有着极其显著的差别。
(2)打开SPSS软件,输入小麦成熟后称得各部分小麦的产量的数据。点Analyze菜单按钮中的Nonparametric Tests命令项中的2 Related Samples…命令,跳出命令框后将左侧“复合肥料,原肥料”调到右边的Test Pair(s) List栏中;在Test type中点击Wilcoxon 和Sign选项,在点击Exact…选项,进入Exact Tests复选框,点击Exact,点击 Continue ,点击Option按钮,选Statistics, 点击 Continue钮返回2-Related-Samples Test对话框,再点击 OK 钮。
符号检验结果:
Wilcoxon符号秩和检验输出结果
符号检验输出结果
分析:从描述性统计量表中,我们得到新复合肥料和原来肥料的产量均值为388.20和360.50,而二者的方差十分接近。从秩的实验结果看,“原肥料产量—新复合肥料产量”的秩中负号的有8,正号的个数为2,各自的秩的绝对值分别5.88和4.00,二者有差别。从检验统计量的结果看,符号检验的p值为0.109(双侧),0.055(单侧),在显著性水平为0.05下,可以认为新肥料与原肥料对小麦的产量没有显著差别,或说新复合肥料对小麦产量的影响没有优于原肥料对小麦的产量的影响;而Wilcoxon 符号秩检验Z统计量的值为-1.988,正态逼近下检验的p值为0.047(双侧),精确计算的p值为0.049(双侧)和0.024(单侧),因而在显著性水平为0.05下,认为新复合肥料对小麦产量的影响显著优于原肥料对小麦产量的影响。从结果中可以看出,符号检验和Wilcoxon 符号秩检验得到两个不同的结论。这说明,就所给数据而言,符号检验不足以区分两种肥料对提高小麦产量的差异,而Wilcoxon 符号秩检验比符号检验在探测差异性方面更有效。
(3)打开SPSS软件,输入我国各地区(省、区、市)地区生产总值的数据。点Analyze菜单按钮中的Nonparametric Tests命令项中的K Dependent Samples…命令,跳出命令框后将左侧“生产总值”调到右边的Test variables栏中,将左侧“地区”调到右边的Grouping variables栏中,再点击Define Groups,输入最小值为1和最大值6;再在Test type中点击Kruskal-Wallis钮,再点击 OK 钮。
检验结果:
分析:从Ranks表中,秩的实验结果看出,华北、东北、华东、中南、西南和西北各地区生产总值的平均秩分别为17.60、17.33、23.99、19.55、9.40和5.80,其中华东地区最大,西北地区最小,且二者差距的绝对值较大。从Test 检验统计量表中可以得到,检验统计量卡方等于14.531,正态逼近的检验的p值为0.013,蒙特卡洛模拟计算下的p值为0.005,所以在显著性水平为0.01下,即拒绝原假设,认为我国各个地区的国民生产总值有显著差异。
(4)打开SPSS软件,输入在四种情绪状态反应下,受试者皮肤的电位变化值的数据。点Analyze菜单按钮中的Nonparametric Tests命令项中的K Related Samples…命令,跳出命令框后将左侧“恐惧,愉快,忧虑和平静”调到右边的Test List栏中;在Test type中点击Friedman选项,在点击Exact…选项,进入Exact Tests复选框,点击Exact,点击 Continue 钮返回K-Related-Samples Test对话框;点击 statistics...钮,选择descriptive,点击 Continue 钮返回K-Related-Samples Test对话框,再点击 OK 钮。
结果输出:
分析:从描述性统计表中,可以看出四种情绪电位值的改变的均值差别不大,分别为27.825 ,25.4125,23.875和23.1875。各自的方差差别也不大。从秩的结果看,恐惧时电位改变值的秩的平均值最大为3.38。从Friedman检验的结果看,卡方统计量的值为6.450,正态逼近和精确计算的p值为0.092,精确计算的p值为0.094,在显著性水平为0.1下,认为四种情绪的反应力有显著差异,在显著性水平为0.05下,认为四种情绪的反应力则没有有显著差异。
【小结】
通过本次实验,基本掌握了两种处理方法比较的秩检验方法,成对分组设计下两种处理方法的比较,多种处理方法比较的Kruskal-Wallis检验方法以及分组设计下多种处理方法的比较方法,知道上述几种非参数比较方法的区别和联系,了解在何种情形下正确选择上述几种非参数比较方法,多组差别秩和检验的注意事项。
【指导教师评语及成绩】