R语言——参数检验和非参数检验
(2017-08-18 17:25:50)分类: R语言 |
参数检验与非参数检验
参数检验(Parameter test)
统计推断的一个重要问题,就是从观测到的样本值去估计总体分布参数(或其函数)。例如总体均数的点估计或区间估计、相关系数和回归系数的假设检验等,常假定样本所来自的总体分布(如正态分布、泊松分布等)具有已知的函数形式,而其中有的参数为未知。统计推断的目的就是对这些未知参数进行估计或检验。估计参数或对有关参数的假设进行检验称为参数统计,所用的检验叫做参数检验。某些统计量的抽样分布,如t、F分布都是在正态分布的基础上推导出来的。t分布主要用于t检验及总体均数的区间估计。当比较两样本均数时,要求两总体方差齐性。这里说的总体均数与总体方差都是参数。
参数检验是针对参数做的假设,对总体参数如平均值、方差进行检验,称为参数检验。参数检验要利用到总体的信息(总体分布、总体的一些参数特征如方差等),以总体分布和样本信息对总体参数作出推断。在假设检验中,如总体的分布类型F(x;θ)为明确已知,但其中的参数θ为未知。统计假设只涉及未知参数的检验,如u检验,t检验,F检验,Z检验等都是参数检验。其过程可以简单概括为,先假设被检验参数来自同一总体,由样本数据构造检验统计量,若统计量值落入拒绝域内,则在一定显著性水平下拒绝接受原假设,说明被检参数与总体参数在统计上有显著性差异。参数检验只能用于等距数据和比例数据。
非参数检验(Non-parametric test)
不依赖参数进行的假设检验。适用于未知分布型、偏态资料、等级性资料等的假设检验。非参数检验在应用上无严格的限制条件,适用范围广,对数据的要求不像参数检验那样严格。在许多场合下根本就不能使用参数方法,这是因为在参数检验中,我们必须对观察结果直接进行加减乘除等数学运算;然而,有许多观察结果却并不是真正的数值(例如只是某种分类或等级),倘若强行将上述运算施于这种非真正数值的观察结果,则势必会歪曲事情的本来面目,从而使人们对检验的有效性产生怀疑,这时,只有采用非参数统计才能得到有价值的结果
当我们研究的样本处于良好情况下(近似正态、无离群点、数据量大等),传统的参数检验是很有效的。但是当这些前提条件不再满足时,参数检验就不再有效。此时人们往往求助于非参数检验,非参数检验不再关注数据的值,而只关注数据的秩,这样就抛弃了大量可用的信息。而置换检验采取重复随机抽样的方法,通过对样本再抽样构造经验分布,然后在此基础上生成P值进行推断,达到很好的效果。但要注意的是,如果样本不能很好的代表总体,任何检验方法都是无效的
参数检验和非参数检验的区别
计量资料一般是参数、非参数检验都是可以的。但是对于能使用参数检验的,首选参数检验,对不能满足条件的才选用非参数检验。
参数检验 一般有:T检验,方差分析,(要求:方差齐性、正态分布)一般也是用于计量资料。选用非参数检验的情况有:①总体分布不易确定(也就是不知道是不是正态分布)②分布呈非正态而无适当的数据转换方法③等级资料④一段或两段无确定数据等(比如一段的数据是>50,是一个开区间)
1,参数检验是针对参数做的假设,非参数检验是针对总体分布情况做的假设,这个是区分参数检验和非参数检验的一个重要特征。
2,二者的根本区别在于参数检验要利用到总体的信息(总体分布、总体的一些参数特征如方差),以总体分布和样本信息对总体参数作出推断;非参数检验不需要利用总体的信息(总体分布、总体的一些参数特征如方差),以样本信息对总体分布作出推断。
3,参数检验只能用于等距数据和比例数据,非参数检验主要用于记数数据。也可用于等距和比例数据,但精确性就会降低。
非参数检验往往不假定总体的分布类型,直接对总体的分布的某种假设(例如如称性、分位数大小等等假设)作统计检验。当然,上一节介绍的拟合优度检验也是非参数检验。除了拟合优度检验外,还有许多常用的非参数检验。最常见的非参数检验统计量有 3类:计数统计量、秩统计量、符号秩统计量。