声明:这一系列《精要》都是本人全面学习人民卫生出版社《流行病学》第五版(预防医学类专用)的笔记,字字页页全阅读的精要笔记,由于编辑排版等方面原因,有与教材不一致的地方,请参考教材。如果考试参考用,请根据您的考试重点,有选择的阅读!
研究的真实性与因果推断
第一节 研究结果的变异性
一、变异性概述:研究结果包括描述性和分析性数据(指标)的变动或波动,称为研究结果的变异性(variability)。它可存在于不同的水平,包括个体水平、群体水平和样本(研究)水平,详见表8-1。
表8-1 变异性的水平和来源
变异性水平
|
变异的来源
|
个体
|
个体生物学变异,测量误差
|
群体
|
个体间遗传学变异,环境变异,测量误差
|
样本(研究)
|
抽样方式,样本大小,测量误差
|
变异的来源可以分为两个层次:
1.生物学(真实)变异和测量变异:生物学变异反映真实的客观变异,测量的变异反映测量过程的误差。
2.随机变异和系统变异:随机变异(误差)的绝对值和方向(符号)交错变化,并呈有界范围的正态分布。系统变异(误差)的绝对值和方向保持恒定。
二、个体水平的变异性:是指某个体特征测得值值的变化,它可以是个体真值随时间的改变,也可以是由于测量误差引起的变化。个体水平测得值的变异来源归纳于表8-2。
表8-2 个体水平测得值的变异来源
变异来源
|
特 点
|
个体状态
|
日间变异,年龄、膳食或运动改变,环境因素(季节、温度等)
|
测量误差
|
仪器标度差,仪器精密度差,仪器读数或记录错误
|
三、群体水平的变异性:群体水平的变异性可以看成是各个体的累计变异,因为构成群体的各个个体具有不同的遗传素质并受到不同的环境影响。群体的变异程度常常大于个体的变异。一般可根据群体的变异范围来确定“正常值”范围。
四、样本水平的变异性:指通过不同样本的研究所得结果的差异性。1.描述性结果的样本变异性
增大样本含量,样本的变异性会减少,样本对群体的代表性会增大。2.分析性结果的样本变异性:样本越大,效应估计值的抽样误差越小(95%可信限越小),统计检验能发现的两组间效应差值越小。
第二节 研究结果的真实性
真实性概述:真实性或效度(validity)是指研究收集的数据、分析结果和所得结论与客观实际的符合程度。如果研究结果与客观实际不符合,就是研究误差。研究误差可以分为系统误差和随机误差两部分:系统误差与可靠性或信度。
系统误差是指有固定方向和固定大小的误差,来自于对象选取、测量和统计分析等的方法学缺陷;而随机误差没有固定方向和固定大小,一般呈正态分布,来自于随机抽样变异等。研究误差中的系统误差部分,称为偏倚(bias)。
研究的可靠性或信度亦称精密度,就是指研究结果中随机误差大小的程度,随机误差小则研究信度高。随机抽样误差可以通过增大样本含量来减少。
(1)内部真实性:是指研究结果与实际研究对象真实情况的符合程度。它回答一个研究本身是否真实或有效。
(2)外部真实性:是指研究结果与推论对象真实情况的符合程度,外部真实性又称为普遍性.它回答一个研究能否推广应用到研究对象以外的人群。
第三节 研究的偏倚
研究误差中的系统误差部分,称为偏倚(bias)。最著名的早期偏倚研究是Berkson做的,他在1946年证实了采用医院病人对象的病例对照研究容易遭受潜在的选择偏倚,这种偏倚来自于病人入院风险同病人的多种状况有关,又称为Berkson偏倚。1976年Miettinen详细讨论了偏倚的定义,并给出了分类框架,这就是被广泛接受的选择偏倚、信息偏倚和混杂偏倚三分类。
一、 选择偏倚: (selection bias)
是在研究对象的选取过程中,由于选取方式不当,导致入选对象与未入选对象之间存在系统差异,由此造成的偏倚称为选择偏倚。例如研究对象采用志愿者,方便样本,或者研究对象的无应答或失访等。
1.描述性研究的选择偏倚
体现在样本对总体的代表性上,控制方法主要是尽量采用随机抽样。
2.分析性研究的选择偏倚
体现在研究对象进入、排除或失访等与研究暴露或处理因素存在关联,而增大或减少暴露与疾病、处理与效应的关联,导致效应估计的偏倚。控制方法:严密掌握对象选取的各个环节。
二、信息偏倚:(information
bias)又称测量偏倚或观察偏倚,来自于测量或资料收集方法问题,使获取的资料存在系统误差。由于流行病学的暴露或疾病多为分类测量,又称错误分类偏倚。
如果暴露或疾病的错误分类同研究分组无关,即在各比较组间不存在差异,称为无差异性错误分类;它在大多数情况下,模糊了研究组间的差异,一般使研究效应的估计值偏低(趋近于无效值或无关联)。
如果暴露或疾病的错误分类同研究分组有关,即在各比较组间存在差异,称为差异性错误分类;由于错误分类组间存在差异的偏向可能不同,所以它造成高估或低估研究效应值。无差异性错误分类和差异性错误分类的示例见图8-3。
无差异性错误分类
研究真实数据
错误分类数据
|
高脂肪膳食
|
低脂肪
膳食
|
|
|
高脂肪
膳食
|
低脂肪
膳食
|
心肌梗死
|
60
|
40
|
|
心肌梗死
|
48
|
52
|
对 照
|
40
|
60
|
|
对 照
|
32
|
68
|
OR=
(60╳60)/(40╳40)=2.3
OR= (48╳68)/(52╳32)=2.0
差异性错误分类
研究真实数据
错误分类数据
|
高脂肪膳食
|
低脂肪
膳食
|
|
|
高脂肪
膳食
|
低脂肪
膳食
|
心肌梗死
|
60
|
40
|
|
心肌梗死
|
60
|
40
|
对 照
|
40
|
60
|
|
对 照
|
32
|
68
|
OR=
(60╳60)/(40╳40)=2.3
OR= (60╳68)/(40╳32)=3.2
图8-3 无差异性错误分类和差异性错误分类的示例
在图8-3中,无差异性错误分类例子中,20%的摄入高脂肪膳食病例和对照都低报了脂肪摄入量,导致OR估计值比真值低估。在差异性错误分类中,所有的病例正确回忆了膳食脂肪摄入状况,而只有80%对照正确报告了他们的膳食脂肪摄入状况,该例中OR被高估。
差异性信息偏倚的两种常见类型是回忆偏倚和调查者偏倚。回忆偏倚产生于研究对象在记忆过去活动和暴露上的差异能力。调查者偏倚产生于调查者对研究对象有差异性地收集信息。采取盲法调查可以降低调查者偏倚。
三、混杂偏倚:(confounding bias)
是指暴露因素与疾病发生的相关(关联)程度受到其他因素的歪曲或干扰。导致混杂产生的因素称为混杂因素,它是疾病的危险或保护因素,并且与研究的暴露因素存在相关。判定原则为:比较混杂因素调控前后的暴露因素效应估计值,如果存在有意义的差异,则认为产生了混杂偏差。调控的统计方法有标准化率分析,分层分析和多变量分析方法等。
1.继发关联(secondary association)
这是一种纯粹由混杂偏倚产生的关联(图8-3),即怀疑的病因(暴露)E与疾病D并不存在因果关系,而是由于两者(E,D)有共同的原因C,E,D同C存在关联,从而继发产生E与D的关联。该关联以前又称间接关联。2.直接因果关联的歪曲
如果怀疑的病因(暴露)E与疾病D既存在直接关联,又存在间接关联或与其他危险(保护)因素F存在相关(因果方向不明,用双箭头线表示;暴露E与疾病D的直接因果关联程度或方向将可能受到混杂干扰,即得到歪曲的关联估计值。E与D的总关联等于E-D直接关联同
E-F-D间接关联之和。如果直接关联与间接关联混在一起,而将其作为直接关联的估计,就会出现混杂偏差。
第四节 因果推断的逻辑方法
流行病学层次的病因一般称为危险因素(risk
factor),它的含义就是使疾病发生概率即风险(risk)升高的因素,也意味着病因(暴露条件)与疾病呈相关。
因果推断的逻辑方法主要是归纳推理方法,它包括假设演绎法和Mill准则(消除归纳法),以及概率性推广的归纳统计推理。
演绎推理是从一般到个别,从普遍到特殊,它的结论是把前提里的道理缩小范围再讲一次,因而前提真则结论必真。归纳推理是从个别到一般,从特殊到普遍,它的结论是把前提里的道理扩大范围再讲一次,因而前提真则结论只是可能真。
一、假设演绎法: (hypothetic deductive
method)最早由赫歇尔(Hershel)提出,其推理形式为: (1)因为假设H ,所以推出证据E
;(演绎推理)(2)因为获得证据E
,所以反推假设H。(归纳推理)。推论过程为:从假设演绎地推出具体的证据,然后用观察或实验检验这个证据,如果证据成立,则假设亦成立。
例如,假设H
:乙型肝炎病毒(HBV)持续感染导致原发性肝癌(PHC);根据该假设H,加上相关背景知识为前提,演绎地推出若干具体经验证据E1(肝癌病例的HBV感染率高于对照),,E2(HBV感染队列肝癌发生率高于对照),E3
(控制HBV感染后,肝癌的发生率下降)。如果证据E1,E2,E3 成立,则假设H亦获得相应强度的归纳支持。
二、Mill准则:分析流行病学研究的比较推理,主要应用的是Mill准则和统计归纳推理。将因果推理原则加以系统化的第一人是穆勒(Mill),他提出科学实验四法,后人将同异并用法单列,即科学实验五法:求同法、差异法、同异并用法、共变法和剩余法。
三、因果性实验中的对照法则:
1.各组干扰(非处理因素)的可比性 各组干扰(非处理因素)可比(均衡),那么表现出来干扰效应(C)就可比(相等),方法就是随机分配。
2.各组效应测量的可比性
除了客观测量工具或方法保持一致,还应注意主观测量的一致性以及避免测量的主观性,后两者可以通过盲法来实现。
第五节 统计关联到因果关联
一、统计学关联 狭义的统计学关联指分类资料的相关,这主要针对流行病学中分类资料较多;广义的关联等同于相关。可能病因(暴露)E与疾病D存在统计学关联,只说明E与D的关联排除了偶然性(随机误差)的干扰,并不一定存在因果关联。要确定因果关联,还得排除选择偏倚、测量(信息)偏倚和混杂偏倚这些系统误差的干扰,以及确定暴露E与疾病D的时间先后关系。
整个判断进程如下:暴露E与疾病D→有统计学关联否?→有偏倚否?→有时间先后否?即:
(提出假设)→ (排除偶然)→
(排除虚假)→(前因后果)。防治措施与效应的因果关联同病因类似,但一般而言,时间先后关系比较明确,存在的偏倚比较少。
二、因果关联:根据概率论因果观,因果关系就是有时间先后的相关关系,也就是病因(暴露条件E)与疾病(D)呈相关,或防治措施与特定效应呈相关。因此,统计学关联(相关)是判断因果关系的基础。
第六节 因果关联的推断标准
一、因果推断标准的发展
(一)病因推断标准的发展:
1.
Henle-Koch原理(1882)
它作为病因推断标准的第一个里程碑,是由Henle(1840)首先提出,Koch后来扩展形成的。原始有4条:(1)在相应疾病患者中总是能检出该病原体(必要病因),(2)在其他疾病的患者中不能检出该病原体(效应特异性),(3)能从相应疾病患者中分离到该病原体,传过几代的培养物能引起实验动物患相同疾病(充分病因),(4)能从患该病动物中分离到相同病原体。有的书中表达为前3条。Koch补充说:即使某传染病不能传给动物,但只要病原体有规律的和排他性的存在(原理(1),(2)条),就能证实因果联系。该原理应用于传染病。
2.
美国”“吸烟与健康报告”委员会提出标准(1964)
它作为病因推断标准的第二个里程碑,包括5条:(1)关联的时间顺序,
(2)关联的强度,(3)关联的特异性,(4)关联的一致性或可重复性,(5)关联的连贯性或合理性(与现有理论知识的吻)。Hill因果关系标准(1965)有8条,是上一种标准的精细化;增加条目有3条:(1)剂量-反应关系,(2)生物学可能性,(3)实验证据。“生物学可能性”与上面的“关联的连贯性”基本雷同。
3.“关联的特异性”标准应当放弃:从多因多果的观点看,特异性是错误的。
4.广义的“关联”理解
广义的关联可包含相关的不同表现形式,如反映“剂量-反应关系”的积差相关或等级相关,以及反映“分布一致性”的生态学相关,而狭义的关联仅指分类(资料)相关。因此,多条关联强度的标准可以合并。
(二)防治效应推断标准的发展:从实验设计上大致可分成三个阶段:
1.单纯时间前后的临床病例观察:
指对处理前后比较或仅对处理后的单个或少数病例的临床观察,尤其是在传统医学的临床观察中。
2.多病例的分组比较观察:指有处理组与比较组的临床观察。18世纪G.
Berkeley提出对照临床试验的观点。
3.随机化对照临床试验:严格意义上的对照组(控制组)必须涉及随机分配,一般认为B.
Hill是随机化对照试验(RCT)之父。他设计的链霉素治疗肺结核效果评价方案,于1946年由英国医学研究会实施。
二、常用的因果推断标准:包括病因推断和防治效应推断。
(一)关联的时间顺序:如果怀疑病因(或防治处理)X引起疾病(或防治效应)Y(X→Y),则X必须发生于Y之前,这就是前因后果的时间顺序。在确定前因后果的时间顺序上,实验和队列研究最好,病例对照(用新病例)和生态学时间序列研究次之。横断面研究较差。
(二)关联的强度:有时间先后的统计关联说明怀疑病因(暴露)可能为危险因素(流行病学层次的病因),而关联强度越大,是偏倚所致的可能性就越小。关联强度的测定,根据资料的性质或来源可以有:(1)优势比OR(病例对照研究),相对危险度RR(队列研究),预防分数PF或功效比例(实验研究)等反映分类资料关联指标。(2)剂量-反应关系:针对等级或连续性变量资料,等级OR或RR,各等级的绝对效应,等级相关系数和积差相关系数等。(3)生态学相关:利用群组(分析单位)资料来计算的相关系数,反映分布的一致性。
(三)关联的可重复性:指关联可以在不同的人群、不同的地区和不同的时间重复观察到,除非有明确的理由来解释不同的结果。
(四)关联的合理性:包括:(1)对于关联的解释与现有理论知识不矛盾,符合疾病的自然史和生物学,相当于客观评价。
(2)研究者或评价者从自身的知识背景出发,支持因果假设的把握度,相当于主观评价。
(五)研究设计的因果论证强度:较好的研究设计类型除了满足上述的时间顺序和可重复性,主要还能较好地控制各类偏倚的干扰,所获结论不易被后来的研究所否定。
加载中,请稍候......