加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

行×列表资料 检验

(2012-05-01 18:39:52)
标签:

杂谈

 

一、双向无序行列表资料卡方检验

表3-9是两个率的比较,表中基本数据排列成2行2列共4个格子,称为四格表资料,又称2 2表;当进行多个率或多个构成比的比较时,则基本数据行或列数会大于2,故称之为行 列表,或(RXC)表。该种检验方法的基本思想及检验步骤与四格表 检验相似。

1. 计算公式

 基本公式:

专用公式:                              (3.33)

式中符号意义同前。

表3.12   三个地区高血压的患病情况

地 区

病例数

正常人数

受检人数

患病率(%)

122

1135

1257

 9.7

138

1540

1678

 8.2

285

2128

2413

11.8

合 计

545

4803

5348

11.3

2. 多个率的比较

例3.23 某医疗单位抽样调查了三个地区人群的高血压患病情况。 现己知三个地区的年龄及性别构成相同,所得高血压患病资料见下表。问三个地区的高血压患病率有无不同?

H0:  三个地区的患病率相等

H1:  三个地区的患病率不全相等;

=

=14.336

查 界值表, ,P<0.01  所以在 的水准上, 拒绝H0,接受H1,故可认为三个地区患病率的差别具有统计学意义,患病率有地区性差异。

3. 多个构成比的比较

例 3.24 某项研究的两组观察对象其年龄构成如下表资料,问两组年龄构成是否相同?

表 3-13 两治疗组的年龄(岁)构成

组 别

50-

60-

70-

合 计

治疗组

56

24

19

11

110

对照组

39

12

7

10

68

合 计

95

36

26

21

178

H0:  两组年龄构成相同

H1:  两组年龄构成不同;

=

=2.878

查 界值表, ,P>0.05   所以在 的水准上,不能拒绝检验假设H0,故认为两个治疗组年龄构成的差别无统计学意义。

4.行×列表 检验注意事项

(1)公式适用条件  行 列表资料中,不宜有1/5以上格子的 ;不能有一个格子的 。若条件不满足时,可采用下列三种处理方法:①增加样本观察例数以增大理论数;②根据专业知识,将上述理论数过小格子的实际数与性质相近的邻近行或列合并,使新计算的理论数增大;③删去理论数过小的行或列。   

(2) 三组及三组以上的样本率(或构成比),经 检验差异有统计学意义,即P<0.05时,只能说明几组率(或构成比)不全相等,并不能确定彼此之间的差异都有统计学意义;若要进一步回答这个问题,需要用 分割法(请参考其他书籍)进行分析。

 

二、单向有序资料卡方检验

如下表,结果变量为有序变量,行变量二分类,因此此处是单向有序的行列表资料。

 

                   表5.14  观察组和对照组疗效比较

组别

例 

疗效:

显效

有效

无效

观察组

 

58

44

18

对照组

 

56

43

35

 此资料中原因变量(组别)是名义变量,结果变量(疗效)是有序变量,因而属结果变量为有序变量的单向有序列联表资料。因一般χ2检验与变量的有序性没有联系,用一般χ2检验进行分析,得到的结论是两组疗效的频数分布是否相同,而不能得出两组疗效的差别是否具有显著性意义的结论。适合分析单向有序列联表资料的统计分析方法有秩和检验或Ridit分析等。如果行变量为有序变量,理应看做是双向无序卡方检验。

 

三、双向有序资料卡方检验

(1)双向有序属性相同资料

如下表,原题为《中老年职工最大呼气流量与工作能力的关系》,采用工作能力指数(WAI)法和75%肺活量位最大呼气流量(V75)法评价285名中老年职工的工作能力,并对他们的工作能力划分为差、中、好三个等级,结果见表5.17。采用χ2检验,χ2=11.0185,P=0.026。认为WAI分级与V75分级具有较好的一致性。

                        表5.17  WAI与V75分级的关系

WAI分级

人   

V75分级:

 

21

25

7

 

49

99

56

 

4

13

11

合计

 

74

137

74

采用两种方法分别测定同一人群,测定结果都分为差、中、好三级,从资料类型看,应属于双向有序且属性相同的列联表资料。原作者用χ2检验,无法回答两种方法测定结果是否一致,只能回答两种方法之间是否独立。P=0.026<0.05,说明表中三行上的人数分布是不完全相同的。原作者的真正目的是想分析这两种测定方法的检测结果之间是否具有一致性,因而应采用与之相对应的一致性检验,即Kappa检验。

 

 

(3)双向有序属性不同资料

    如下表,

           表5.15  P16基因异常与否与脑胶质瘤分级的关系

级别

例   

基因正常

基因异常

合计

Ⅰ-Ⅱ级

9

3

12

Ⅲ级

7

11

18

Ⅳ级

3

8

11

合计

19

22

41

由上表可以看出,脑胶质瘤分级变量的三个水平之间具有一定的顺序,基因异常与否这个变量只有两个水平,相当于0和1,可以看作是顺序的一种特例,因而应属于双向有序且属性不同的列联表资料。原作者对资料进行一般χ2检验,只能得出不同级别脑胶质瘤患者P16基因异常率之间的差别是否具有显著性意义的结论,并不能说明两个有序变量之间的相关性问题。应根据分析目的采用适合分析此资料的Spearman秩相关分析法。

1.统计学(statistics):

是研究数据的收集、整理与分析的一门科学。合理运用统计能够对一些自然现象或社会现象做出合理的解释,能够帮助我们通过偶然去发现事物发生、发展的必然规律。记得当年学习统计的时候,老师忽悠说“学好统计,能够让你们听到大自然心跳的声音”,呵呵,学习统计这么多年了,不用心连自己心跳的声音都听不到,哈哈。但是统计确实在潜移默化的改变着我和你,改变自然与社会,也改变着未来…………..。

 

0

阅读 收藏 喜欢 打印举报/Report
前一篇:相关与回归
后一篇:统计图表
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有