行×列表资料 检验
(2012-05-01 18:39:52)
标签:
杂谈 |
一、双向无序行列表资料卡方检验
表3-9是两个率的比较,表中基本数据排列成2行2列共4个格子,称为四格表资料,又称2 2表;当进行多个率或多个构成比的比较时,则基本数据行或列数会大于2,故称之为行 列表,或(RXC)表。该种检验方法的基本思想及检验步骤与四格表 检验相似。
1. 计算公式
专用公式:
式中符号意义同前。
表3.12
地 区 |
病例数 |
正常人数 |
受检人数 |
患病率(%) |
甲 |
122 |
1135 |
1257 |
|
乙 |
138 |
1540 |
1678 |
|
丙 |
285 |
2128 |
2413 |
11.8 |
合 计 |
545 |
4803 |
5348 |
11.3 |
2. 多个率的比较
例3.23 某医疗单位抽样调查了三个地区人群的高血压患病情况。 现己知三个地区的年龄及性别构成相同,所得高血压患病资料见下表。问三个地区的高血压患病率有无不同?
H0:
H1:
=
=14.336
查 界值表, ,P<0.01
3. 多个构成比的比较
例 3.24 某项研究的两组观察对象其年龄构成如下表资料,问两组年龄构成是否相同?
表 3-13 两治疗组的年龄(岁)构成
组 别 |
50- |
60- |
70- |
合 计 |
|
治疗组 |
56 |
24 |
19 |
11 |
110 |
对照组 |
39 |
12 |
7 |
10 |
68 |
合 计 |
95 |
36 |
26 |
21 |
178 |
H0:
H1:
=
=2.878
查 界值表,
,P>0.05
4.行×列表 检验注意事项
(1)公式适用条件
(2) 三组及三组以上的样本率(或构成比),经 检验差异有统计学意义,即P<0.05时,只能说明几组率(或构成比)不全相等,并不能确定彼此之间的差异都有统计学意义;若要进一步回答这个问题,需要用 分割法(请参考其他书籍)进行分析。
二、单向有序资料卡方检验
如下表,结果变量为有序变量,行变量二分类,因此此处是单向有序的行列表资料。
|
||||
组别 |
例 |
|||
疗效: |
显效 |
有效 |
无效 |
|
观察组 |
|
58 |
44 |
18 |
对照组 |
|
56 |
43 |
35 |
三、双向有序资料卡方检验
(1)双向有序属性相同资料
如下表,原题为《中老年职工最大呼气流量与工作能力的关系》,采用工作能力指数(WAI)法和75%肺活量位最大呼气流量(V75)法评价285名中老年职工的工作能力,并对他们的工作能力划分为差、中、好三个等级,结果见表5.17。采用χ2检验,χ2=11.0185,P=0.026。认为WAI分级与V75分级具有较好的一致性。
|
||||
WAI分级 |
人 |
|||
V75分级: |
差 |
中 |
好 |
|
差 |
|
21 |
25 |
7 |
中 |
|
49 |
99 |
56 |
好 |
|
4 |
13 |
11 |
合计 |
|
74 |
137 |
74 |
采用两种方法分别测定同一人群,测定结果都分为差、中、好三级,从资料类型看,应属于双向有序且属性相同的列联表资料。原作者用χ2检验,无法回答两种方法测定结果是否一致,只能回答两种方法之间是否独立。P=0.026<0.05,说明表中三行上的人数分布是不完全相同的。原作者的真正目的是想分析这两种测定方法的检测结果之间是否具有一致性,因而应采用与之相对应的一致性检验,即Kappa检验。
(3)双向有序属性不同资料
|
|||
级别 |
例 |
||
基因正常 |
基因异常 |
合计 |
|
Ⅰ-Ⅱ级 |
9 |
3 |
12 |
Ⅲ级 |
7 |
11 |
18 |
Ⅳ级 |
3 |
8 |
11 |
合计 |
19 |
22 |
41 |
由上表可以看出,脑胶质瘤分级变量的三个水平之间具有一定的顺序,基因异常与否这个变量只有两个水平,相当于0和1,可以看作是顺序的一种特例,因而应属于双向有序且属性不同的列联表资料。原作者对资料进行一般χ2检验,只能得出不同级别脑胶质瘤患者P16基因异常率之间的差别是否具有显著性意义的结论,并不能说明两个有序变量之间的相关性问题。应根据分析目的采用适合分析此资料的Spearman秩相关分析法。
1.统计学(statistics):
是研究数据的收集、整理与分析的一门科学。合理运用统计能够对一些自然现象或社会现象做出合理的解释,能够帮助我们通过偶然去发现事物发生、发展的必然规律。记得当年学习统计的时候,老师忽悠说“学好统计,能够让你们听到大自然心跳的声音”,呵呵,学习统计这么多年了,不用心连自己心跳的声音都听不到,哈哈。但是统计确实在潜移默化的改变着我和你,改变自然与社会,也改变着未来…………..。