配合度检验是应用Y’检验方法的一种。主要用于实际观察次数与某理论次数是否有差别的分析。它适用于一个因素多项分类的计数资料,故又有单因素分类χ2检验的名称。
一、配合度检验的一般问题
(一)统计假设
配合度检验的研究假设是实际观察数与某理论次数之间差异显著,原假设则为实计数与理论次数之间无差异或相等。它涉及的是某总体的分布是否与某种分布相符合,不涉及总体参数的问题,这一点与前几章所讲不同。统计假设用符号表示如下,
应用基本公式 http://student.zjzk.cn/course_ware/web_xlyjytjx/skxt/CHAP1086.gif
计算χ2值,然后查附表12。若计算的χ2值大于表中χ2.
05或χ2.
01的值,就拒绝原假设H0,推论f0与fe之间差异显著。若χ2值小于χ2.
05,则接受H0,认为f0与fe之间差异不显著。
这里须指出,对于计数数据的统计分析χ2检验法,所查附表
12的概率,是双侧概率。因为χ2总为正值,但实际上f0—fe有正有负。因此,上述χ2>χ2.
05。,或>χ2.
01时,拒绝H0,这时推论犯错误的概率为.05或.01,是指双侧概率而言。
(二)自由度的确定
配合度检验自由度的确定与下列两个因素有关:一是实验或调查中分类的项数,二是计算理论次数时,用观察数目的统计量的个数。自由度的计算一般为资料的分类或分组的数目,减去计算理论次数时所用统计量的个数。通常情况下,在计算理论次数时要用到“总数”这一统计量,故配合度检验的自由度一般为分类的项数减1。但在对测量数据分布的配合度(又称拟合)进行检验时,例如正态拟合检验要用到三个统计量:总数,平均数,标准差,这种情况下自由度为分组数目减3。
(三)理论次数的计算
配合度检验需要先计算理论次数,这是计算χ2值的关键性步骤。理论次数的计算,一般是根据某种理论,按一定的概率通过样本即实际观察次数计算。某种理论有经验的概率,也有理论的概率,如二项分布,正态分布等等理论概率。具体应用要依据实际情况而定。
二、配合度检验应用举例
(一)检验无差假说
这里所说的无差假说,是指各项分类的实计数之间没有差异,也就是假设各项分类之间的机会相等,或概率相等,因此理论次数完全按概率相等的条件计算。即总数×
(1/分类项数)=理论次数。
[例1]
随机抽取60名学生问他们高中要不要文理分科,回答赞成的39人,反对的21人,问对分科的意见能否说有显著差异?
解:此题只有两项分类。假设两项分类的实计数相等或无差别,其各项实计数的概率应相同,即p=q=0.5。因此所检验的问题:对分科的意见是否有显著差异,实际上是指每种态度的实计数与理论次数差异是否显著的问题,因各项的理论次数相同,故可理解为对分科的态度是否一样或是否有差异。
故理论次数fe=60×0.5=30(人)
H0:f0=fe=30
Hl:f≠fe
用基本公式10—16计算χ2值
http://student.zjzk.cn/course_ware/web_xlyjytjx/skxt/CHAP1087.gif
自由度为分类项数2—1(计算fe时用到总数60一个统计量)
查df=1
χ2表
χ2. 05=3.84
χ2. 01=6.63
而本题计算的χ2值介于χ2.
05s与χ2.
01之间,故可写作
.
01<p< . 05
或写作χ2.
05<χ2<χ2.
01
故可推论说,对高中文理分科的态度有显著差异,犯错误的概率为.05至.01之间。如果只允许犯错误的概率小于.01的话还可说无显著差异。究竟作何决定要取决于研究者与应用者。
[例2] 某项民意测验,答案有同意、不置可否、不同意3种,调查结果如下表:
|
同意
|
不置可否
|
不同意
|
N
|
f0
|
24
|
12
|
12
|
48
|
问:3种意见的人数是否有显著不同?
解:此题亦为检验无差假说,分类的项数为3,故各项分类假设实计数相等,则概率应为1/3。则:
fe=48×1/3=16
代入公式10—16计算χ2量为:
χ2=(24-16)2/16+(12-16)2/16+(12-16)2/16=6
df=3—1=2
查χ2表得
χ2. 05=5.99
故χ2>χ2.
05
p<.05
即此项民意测验的态度有显著差异,作此推论,犯错误的概率小于.05
(二)检验假设分布的概率
假设某因素各项分类的次数分布为正态,检验实计数与理论上期望的结果之间是否有差异。因为已假定所观察的资料是按正态分布的,故其理论次数的计算与无差假设的检验不同,应按正态。分布的概率,分别计算各项分类的理论次数。具体方法是先按正态:分布理论计算各项分类应有的概率再乘以总数,便得到各项分类的理论次数。如果不是事先假定所观察的资料为正态分布而是其他分布(如二项分布普阿松分布等),其概率应按各所假定的分楷计算。事先假设的分布不是理论分布而是经验分布,亦可按此经羝分布计算概率,再乘以总数便可得到理论次数,从而进一步检验假设分布与实计数的分布之间,亦即实计数与理论次数之间差异悬否显著了。
[例3]
某班学生50人,体检结果按一定标准划分为甲乙丙三类,各类人数分别为:甲类16人,乙类24人,丙类10人,问该班学生的身体状况是否符合正态分布7
.
解:这里的理论次数应按假设的正态分布概率计算。按正态分布,±3σ可认为包括了全体,各等级所占的横坐标应该相同(6σ÷3=2σ),故各类人数应占的比率为:
甲级:3σ一1σ之间,曲线下的面积应为.50一.3413=.1587
乙级:1σ一-1σ之间,曲线下的面积应为.3413×2=.6826
丙级:-lσ一-3σ之间,曲线下的面积应为.50一.3413=.1587
各等级的理论次数应为各部分理论上的概率乘以总人数:
fe甲=.1587×50=8
fe乙=.6826×50=34
fe丙=.1587×50=8
统计假设H0:f0i=fei
f0、fe为多个值
H1:f0i≠fei
用基本公式计算χ2量
χ2=(16-8)2/8
+ (24-34)2/34 + (10-8)2/8=11.44
df=3—1=2
查χ2表χ2.005=10.6
χ2>χ2.005,故差异显著,可以说该班学生的身体状态不符合正态分布,或者说该班学生身体状况甲乙丙三类的人数分布与正态分布有显著差异。
,
[例4] 某校长经验:高中生升学的男女比例为2:1,今年的升学情况是男生85人,女生35人,问今年升学的男女生比例是否符合该校长的经验?
解:此题是假设男女生卉学的人数分布与校长的经验分布相同,故理论次数应按经验分布的概率计算。
经验概率:男生的概率为2/3(依题意计算的);女生的概率为1/3
理论次数为:fe男=(85+35)
×2/3=80
fe女=(85+35)
×1/3=40
χ2=(85-80)2/80
+ (35-40)2/40=0.94
查df=2—1的χ2表得
χ2.05=3.84
故χ2<χ2.05,差异不显著,就是说实际升学的男女学生人数分布与某校长的经验没有显著差异。
三、两项分类的配合度检验与比率显著性检验的关系及小期望次数的连续性校正
(一)只有两项分类的配合度检验与比率显著性检验的一致性
比率显著性检验的依据是二项分布,设p=q,实计数为x=f0
μ=np=fe,当np≥5时显著性检验的公式为:
http://student.zjzk.cn/course_ware/web_xlyjytjx/skxt/CHAP1088.gif
(p=q=1/2时)
根据
http://student.zjzk.cn/course_ware/web_xlyjytjx/skxt/CHAP1089.gif
(df=1)
http://student.zjzk.cn/course_ware/web_xlyjytjx/skxt/CHAP1090.gif
,
若p≠q
则 http://student.zjzk.cn/course_ware/web_xlyjytjx/skxt/CHAP1091.gif
可见只有两项分类的χ2检验与比例的显著性检验相同。比率显著性检验时,先是将所关心的某性质的实计数换算成比率p,p=1一q,q为非某性质分类的次数比率,若不用比率表示,用实计数表示则为fθ1与fθ2两项分类数。计算比率p=fθ1/(fθ1+
fθ2)q=fθ2/
(fθ1+
fθ2)。可见,二者实质相同,只是表示方式不同。
[例7] 投掷一杖硬币100次,实验结果正面向上的次数为42次,问正面向上的比率是否显著?
|
正面向上
|
正面向下
|
N
|
f0
|
42
|
58
|
100
|
fe
|
50
|
50
|
|
解①用比率显著性检验:
因为p0=q0=1/2=0.5
p=42/100=.42
q=1—.42=.58
http://student.zjzk.cn/course_ware/web_xlyjytjx/skxt/CHAP1092.gif
用实际次数计算:μ=np=100×0.5=50
http://student.zjzk.cn/course_ware/web_xlyjytjx/skxt/CHAP1093.gif
。
Z=(42-50)/5=1.6
②用配合度检验
χ2 =
(42-50)2/50 + (58-50)2/50 = 2.56
(2.56=1.62)
查df=1的χ2表得
χ12=2.56
p=0.1162(用内插计算)而Z=1.6时查正态表得p为(.50一.4452)
×2=0.1096,因χ2概率是双侧概率,故正态表查得的概率乘以2也是双侧概率。两个慨率非常接近,这是由近似计算引起的计算误差。此例可见,两种险验方法所得的统计结论完全相同。可推广配合度检验方法,因其汁算相应较简单些。
(二)当期望次数小于5时,χ2的连续性校正
当期望次数小于5时,比例的显著性检验,不能用正态近似,而应该用二项分布概率计算(前节所述)。
[例8]
有一学校共评出10名优秀学生干部,其中有男生3名,女生7名,问优秀学生干部是否存在男女性别差异?
解:公式为:
http://student.zjzk.cn/course_ware/web_xlyjytjx/skxt/CHAP1094.gif
(10—17)
本例若用校正公式计算则为:
χ2=(|3-5|-0.5)2/5
+ (|7-5|-0.5)2/5=0.9
查df=1
χ2值表
得χ2=0.9
p=0.375(内插计算)
这个概率与用二项分布计算的概率0.3438(0.1719×2)很接近。若结果不是恰在.05或.01的临界值上,χ2连续性校正可得到很好的近似结果。
|