统计学基础-假设检验
一、基本概念
1、假设检验就是先对总体的参数或结果做出某种假设,然后用适当的方法根据样本对总体提供的信息,推断此假设应当拒绝或接受。其结果将有助于研究者作出具,采取措施。
2、原假设(零假设)
原假设:根据检验结果准备予以拒绝或接受的假设,以H0表示;备择假设:与原假设不相容(即对立)的假设,以H1表示。如:对总体随机变量X的均数μ不小于一给定值μ0的假设的检验(见式(2.1.1));又如:对2批不合格品率π1和π2相等(未知)的假设的检验(见式(2.1.2))。
H0:μ≥μ0及H1:μ<μ0 (2.1.1) H0:π1=π2及H1:π1≠π2 (2.1.2)
3、参数检验与非参数检验
4、拒绝域(或否定域)、显著性水平
(检验的)显著性水平: 当原假设正确时,而被拒绝的概率的最大值,记为α。α的值一般取为0.05或0.01。
5、单侧检验、双侧检验和临界值
临界值:作为上述拒绝域界限的给定数。
6、交互作用
由此可知:当假设检验的结果发现A、B2因素的交互作用显著时, 应将A因素分别控制在它的各水平下,检验B因素所有水平之间的差别是否显著; 同理,还可依次把B因素控制在不同水平下,检验A因素。这样才能弄清这2个因素究竟应分别取什么水平时,其共同作用的结果最符合研究者的专业要求。
在统计学上, 把2因素之间的交互作用称为1级交互作用、3因素之间的交互作用称为2级交互作用,…。
7、不显著因素与无用因素
8、P值计算
第二类错误:错误地接受假原假设
第一类错误的概率
第二类错误的概率
http://s3/bmiddle/0044BGq5zy7adUnpUZAb2&690
功效计算
http://s13/bmiddle/0044BGq5zy7adUrdR2Q0c&690
二、单样本的假设检验
假设检验需要设立一对统计假设:原假设(零假设)和备择假设(对立假设)。其中原假设一般是一明确的语句:未知的总体参数等于某个特殊的数值,然后对其进行检验。因此,单样本假设检验可用于探测参数的变化,例如:在科学研究中,检验某新型的汽油添加剂是否能增加每升油的行驶公里数?某新型血压药对体温是否有影响?在工业质量控制中,工厂检查其薯片产品是否与列在包装上的脂肪含量一致;检查巧克力的重量是否与包装上重量一致等等。
1、单样本假设检验步骤
单样本假设检验步骤如下:
(1)选择零假设和对立假设;
(2)选择显著水平α;
(3)决定检验统计量,由此统计量及α来确定检验的决策规则,并用P值或临界值描述;
(4)从总体取一随机样本,并从样本计算检验统计量的值,若可能,计算P值;
(5)由样本结果和决策规则决定是拒绝还是接受原假设(零假设);
(6)检验的功效。
(2)选择显著水平α
其中,1-α称为置信度或置信系数,(1-α)100%称为置信水平。以双尾为例,如下图:
在假设检验理论中,α是假设检验的显著水平,这是因为它用以评估样本结果的显著性,如果点估计值与零假设中的假设参数有很大差别,以至于P≤α,则拒绝零假设,该结果称为统计显著;如果P>α,则接受零假设,该结果称为不是统计显著的。如上图所示,临界域即为统计显著域,接受域为非统计显著域。
(3)决定检验统计量,由此统计量及α来确定检验的决策规则,并用P值或临界值描述;
http://s16/mw690/0044BGq5zy7adUFAlyv5f&690
因为抽样分布为正态分布,可进行正态变换,将抽样分布统计量变换为Z统计量:
变换后的Z统计量可以用来度量零假设为真的可能性。如果对一个给定样本计算Z统计量的特定值,几座z1,若z1=0,该样本均值一定等于μ0(红框公式),因而H0:μ=μ0很可能为真。然后,当z1是一较大数时,在零的正或负向,即z1=α或z1=-α,则样本均值与μ0有相当距离,因此,H0:μ=μ0不太可能为真。通过计算P值,即可将可能性量化,进而进行统计假设检验决策。如下图所示:
P值得计算:
对于双侧假设检验,P值就是两个阴影部分的面积和(如上图所示);如果是单侧假设检验,就是左侧面积或者右侧面积。阴影部分面积用标准正态分布表查得。
另外也可以通过比较临界z值来决定是拒绝还是接受零假设。因为P值和z值是等价的,例如,如果z1>1.645成立,则P≤0.05成立。
在两类错误介绍中:假设检验——两类错误,可列出下面的表格:
假设检验的功效就是正确拒绝错误零假设的概率1-β。
假设功效,如下图所示:
三、两样本估计和假设均值差
http://s1/bmiddle/0044BGq5zy7adV6i3MAc0&690
通过对比单样本估计和假设检验的学习,可以列出独立两样本均值差的估计和假设检验在不同情况的置信区间公式,有以下总结:
t分布在单样本估计和假设检验要求:正态总体,可以使用t分布进行两样本估计和假设检验;两样本估计和假设检验要求:除了正态总体外,还要假设两总体方差相等(方差齐性)才能使用t分布,原因是两总体方差相等,才能得到自由度为n1+n2-2的均值差抽样分布的方差,推导公式如下:
均值差的置信区间:
1、标准差已知的正态分布总体的独立样本;
参照上表,标准差已知的正态分布总体均值差抽样分布为正态分布,可以得到独立样本均值差的置信区间,置信区间公式推导过程如下:
2、均值差的假设检验:
标准差已知的正态分布总体的独立样本;
和单样本假设检验一样(单样本的假设检验),两样本假设检验问题也有一对统计假设:零假设和对立假设;同样也存在两侧和单侧假设检验,而且单侧假设检验又分为右侧检验和左侧检验。两样本假设检验中,一般把零假设为两均值差为0,对立假设根据题意选择双侧假设或是单侧假设;两样本假设检验的步骤和单样本假设检验一样。
从上表可知:标准差已知的正态总体均值差的抽样分布为正态分布,进行标准正态变换后可以假设检验,过程见下方范例。
3、均值差的置信区间:
标准差未知,但假定相等的正态分布总体的独立小样本(小于30)
如上表所示,标准差未知,但假定相等的正态分布总体小样本,均值差的抽样分布符合t分布,可用表中置信区间计算公式,计算过程见范例。
http://s7/mw690/0044BGq5zy7adVhmbA266&690
4、均值差的假设检验:
标准差未知,但假定相等的正态分布总体的独立小样本(小于30)
5、均值差的置信区间:
标准差未知的任何总体分布的独立大样本(大于等于30)
6、均值差的假设检验:
标准差未知的任何总体分布的独立大样本(大于等于30)
7、均值差的置信区间:
成对样本
8、均值差的假设检验:
成对样本
方差比
两样本均值估计和假设检验用均值差表示,而两样本方差估计和假设检验则应该用方差比。这里就引出了F分布
方差比的置信区间:参数未知的正态分布总体的独立样本
方差比的假设检验:
参数未知的正态分布总体的独立样本
范例10:为检测某种激素对失眠的影响,一个医生给两组临睡前的病人服用不同剂量的激素,然后测量他们从服药到入睡的时间,第一组服用的是5mg的剂量,第二组服用的是15mg的剂量,样本是独立的,结果为:第一组,样本容量为10人,均值为14.8min,方差为4.36;第二组,样本容量为12人,均值为10.2min,方差为4.66。假定两总体方差齐性,在0.01显著水平下,用临界值决策规则作这个假定的双侧检验。
http://s12/mw690/0044BGq5zy7adVqnI716b&690
四、多样本的参数估计与假设检验基础
单样本和两样本中,一次至多处理两个总体,而在多个样本场合中,将同时处理三个或更多的总体,各总体分别具有均值和标准差,根据来自这些总体的样本进行总体参数的估计与假设检验,这将用到方差分析方法(ANOVA)。方差分析是利用样本信息来检验关于k个总体的均值的假设的方法,还能用于确定总体均值的置信区间和估计各个总体方差的差距。
多样本的统计假设
多样本假设检验的一对统计假设:原假设和备择假设;
原假设:
http://s6/mw690/0044BGq5zy7adVu0JTL35&690
备择假设:
http://s10/mw690/0044BGq5zy7adVw8rmpb9&690
方差分析类型
2、所有总体方差都相同;
3、所有样本互相独立,取自各自总体,样本容量可以相同也可以不同。
单向方差分析
上表是方差分析的数据整理表格,通过上表可以计算得到下列数据:
http://s10/mw690/0044BGq5zy7adVzHeMFf9&690
组内平方和SSW(Sum of square of within):各个品种内部围绕各自平均值的变差的一种度量,计算如下:
http://s11/mw690/0044BGq5zy7adVBRpBE4a&690
组间平方和SSA(Sum of square of among):它是样本间随机变差以及因处理不同而可能导致的样本均值变差的一种度量:
http://s6/mw690/0044BGq5zy7adVCKd3705&690
组间平方和SSA的计算公式推导(为什么乘5?总体方差与抽样分布方差关系回顾:抽样分布:详述均值的抽样分布及中心极限定理):
http://s16/mw690/0044BGq5zy7adVDyvaD8f&690
总平方和SST(Sum of square of total):所有数据变差的总和:
SST=SSA+SSW
总平方和是所有样本值与总均值变差的一种度量,对于单向方差分析,总变差可以分解成两部分:一组样本内部由于随机选取或处理方法不同产生的变差SSW;不同组样本之间由于因素(因子)的原因产生的变差SSA。所以总变差SST等于SSW与SSA之和。可以通过上面的计算结果得到验证:
SSA=19.6;SSW=14.8;
SSA+SSW=19.6+14.8=34.4=SST
均方
http://s11/mw690/0044BGq5zy7adVP9uf82a&690
MSA的计算:用组间平方和除以自由度,因为组间平方和先计算每组样本的均值,然后与总均值计算平方和,所以自由度为k-1=3-1=2。
http://s6/mw690/0044BGq5zy7adVPMrzvd5&690
MST的计算:用总平方和除以自由度,因为总平方和是所有的样本值与总均值差得平方和,所以自由度为nk-1=5*3-1=14。
http://s1/mw690/0044BGq5zy7adVQoWHu10&690
F检验
http://s8/mw690/0044BGq5zy7adVZMqbl97&690
F检验及F统计量公式推导(回顾:两样本估计和假设检验基础)。
单向方差分析基本原理
http://s14/mw690/0044BGq5zy7adW3W7IV5d&690
这样就可以通过F检验的方式来检验各总体均值是否相等(样本是否来自同一个总体)。

加载中…