相对数的应用方法
1. 相对数的概念及其计算方法
相对数是两个有联系的指标之比,而且常为两个计数数据之比。相对数用于表示相对大小,按其性质和用途分为率、构成比、相对比及动态数列等。
1.1 率
在环境科学研究中,经常要应用率,例如:降解率、去除率、检出率、回收率、残留率、超标率等等。
率是指某一现象发生的频度(频繁程度)或强度,又称为频率指标。常以百分率(%),千分率(‰),万分率(1/万),十万分率(1/10万)等表示。率的计算公式为:
http://s9/middle/5773050atb3dc3c1b7f68&690
1.2 构成比
构成比也称为构成指标,是表示某一事物内部各组成部分所占的比重。常以百分数(%)表示。构成比的计算公式为:
http://s16/middle/5773050atb3dc4063215f&690
一组构成比之和应当为100%,有时由于尾数取舍的影响,其和可能略超过或不足100%,但是,合计项仍可标出100%,以表示一组构成比的整体。
1.3 相对比
相对比表示两个有关的同类指标的比。常以倍数或百分数(%)表示。相对比的计算公式为:
http://s6/middle/5773050at7862d3c3dde5&690
http://s11/middle/5773050atb3dc4837ab1a&690
http://s6/middle/5773050atb3dc4aaac765&690
http://s7/middle/5773050atb3dc4d1447b6&690
1.4
动态数列
动态数列是一系列按时间顺序排列起来的统计指标(包括绝对数、相对数及平均数等)。它说明事物在时间上的变化和发展趋势。如果按时间特点可以分为时点动态数列和时期动态数列;按基期特点可以分为定基比和环比。
1. 时点动态数列:其指标为间断的若干时点上的数据。如历年的年中人口数或年末人口数、年末人口的性比例等。
2. 时期动态数列:其指标为一定时期内陆续发生而累计的数据,各指标对应的时期有连续性,例如历年的死亡人数和死亡率。在时期动态数列中,前一个指标的期末都紧接着后一个相邻指标的期初,从而把整个数列反映的时期全部连续起来。
以下重点叙述定基比和环比。
3. 定基比
在动态数列中,统一用某个时点或时期的指标作基数(分母),计算得各个时点或时期指标的相对比即为定基比。一组定基比的基期是相同的。
4. 环比
在动态数列中,一律以前一时点或时期的指标作基数(分母),计算得到各个时点或时期指标的相对比为环比。环比的基期是依次更换的。
例2
某市结核病死亡率的动态数列如表—2第(1)、(2)栏所示。试计算定基比(以1964年为基期)和环比。
http://s2/middle/5773050atb3dc53481ba1&690
http://s3/middle/5773050atb3dc55b538f2&690
余者依此类推。计算结果如表—2第(3)栏所示。从计算结果来看,该市十五年来结核病死亡率总的来说下降趋势明显,1978年约下降到1964年的1/3。
环比计算:各以前一年的死亡率作为基数,则:
http://s10/middle/5773050atb3dc602f2859&690
在计算过程中,如果用较多的小数位,则两种方法的计算结果应当相同。当环比数列出现大幅度的升降波动时,一般不宜计算其平均速度。
例3 例2中的指标有大体一致的下降趋势,求平均下降速度。
http://s11/middle/5773050atb3dc63ef105a&690
表示该市结核病死亡率每年平均递降7.2%。
2. 应用相对数时的注意事项
相对数计算简便,应用广泛。正确应用相对数,可有助于我们了解问题的发生频率、工作重点和对比水平。因此,在应用相对数时,一般应注意以下几点:
2.1 计算相对数时,分母一般不宜过小。调查和实验的观察单位应当有一定数量。一般来说,数量较多,计算的相对数可靠性较大。当例数较少时,最好直接用绝对数表示。如果必须用相对数时,可同时列出其可信区间。但是,在作毒理试验时,由于设计周密,精选对象,严格控制各种条件,因此,例数即使较少,也可以用相对数来表示试验结果。
2.2 要区分构成比与率。构成比通常只能说明比重或分布,不能说明发生的频率或强度。
2.3 要注意一组构成比的总和必然等于100(或1),因此,当某一部分构成比减少时,其他部分的构成比必然相应增大。
2.4 在一定条件下,构成比也可反映率的变化趋势。
2.5 当两个率进行比较时,其内部构成必须相同或相近,否则就应当先求出其标准化率,然后再进行比较。
2.6 相对数的比较应当注意其可比性,在条件不同的情况下进行对比,作出的结论往往是不可靠的。
2.7 在抽样研究中,由于率与构成比同样存在着抽样误差,因此,比较率与构成比时不能凭数值相差的大小作结论,而应当进行显著性检验。
3. 标准化率
3.1 概述与计算方法
标准化率简称为标化率,也称为调整率,就是将所比较的资料的构成,按选定的“标准”调整后计算所得的率。调整的目的在于统一内部构成,使资料具有可比性。标准化率常用于内部构成不同的两个或多个率的比较。利用标准化原理,还可以计算标准化比,用于特殊资料与标准资料某一指标率的比较。
标准化率的计算方法有:直接法、间接法及反推法三种。现以人口死亡率为例说明三种方法的基本计算步骤。
1.根据现有数据选择计算方法:如表—3所示。
http://s15/middle/5773050atb3dc68b90b6e&690
2. 选定标准
标准组应当选择有代表性的、比较稳定的、数量比较大的人群。如世界的、全国的、全省的、全地区的或本单位历年积累的数据,时间最好与被标化资料一致或接近。也可以用相互比较的人群本身作标准,如两组比较时取其合并数据,或选择其中之一。
3.
将有关数据代入相应的公式,计算标准化率。表—4为计算标准化率需用数据的符号。
http://s3/middle/5773050atb3dc6db6d382&690
http://s13/middle/5773050atb3dc6fa656ec&690
3.2 实例计算
例4 甲、乙两县的食管癌死亡率如表—5所示。年龄越大,死亡率越高。检视50岁以上人口构成比,乙县明显大于甲县,因此,虽然在同年龄组内乙县的死亡率大多低于甲县,而总的死亡率却高于甲县。试用标准化率作比较。
http://s9/middle/5773050atb3dc72e4f968&690
http://s12/middle/5773050at7862d88408eb&690
http://s1/middle/5773050atb3dc776c8de0&690
http://s4/middle/5773050atb3dc79ed33c3&690
http://s8/middle/5773050atb3dc7c1d4f17&690
3.3 应用标准化率时的注意事项
1. 在一般情况下,直接法与间接法的计算结果比较接近。直接法计算简便,易于理解,更为常用。
2. 如果原资料中有些年龄组的人口过少,致使年龄别死亡率波动较大时,则适宜用间接法。
3. 关于所得的标准化率的抽样误差,以间接法最小。
4. 由于反推法不如直接法与间接法精确,计算又较繁琐,因此,只有当资料不足,不能用上述两种方法计算时方采用。
5. 同一资料,采用不同的方法标准化。所得标准化率的数值不同,但是对比时的分析结论大多是一致的。如表—7所示。
http://s8/middle/5773050atb3dc80aa8897&690
如果用同一种计算方法(直接法),而取不同的标准组进行计算,所得标准化死亡率的数值虽然不同,但分析结论却是一致的。
7. 由于标准化率随着选定的标准组不同,标准化法不同,所得的数值也不同。因此,当比较几个标准化率时,只限于采用同一标准组,同一标准化法的资料。如果是抽样研究,则应当进行显著性检验。
8. 计算标准化率的目的是为了进行合理的比较,其只表明相互比较资料间率的高低、大小的相对关系,而不是反映某时某地的实际水平。
3.4 标准化死亡比和标准化死亡指数
标准化死亡比(SMR)和标准化死亡指数(CMI)的计算公式如下:
http://s10/middle/5773050atb3dc8532b239&690
http://s11/middle/5773050atb3dc877de8ba&690
http://s2/middle/5773050atb3dc89e6a901&690
计算结果均大于1,表示甲县因食管癌死亡的频度高于当地一般人群。必要时可以作显著性检验。
4. 率的抽样误差与显著性检验
4.1 率的抽样误差
在其他章节中曾讨论过样本均数与总体均数之间存在着抽样误差,同样,样本率与总体率之间也存在着抽样误差。率的抽样误差问题同数的抽样误差问题相类似,只要将样本率看成样本均数,将总体率看成总体均数,很多概念就容易理解了。
http://s10/middle/5773050atb3dc90562879&690
http://s13/middle/5773050atb3dc94098eec&690
http://s6/middle/5773050atb3dc970c63a5&690
http://s1/middle/5773050atb3dc99c26550&690
从上述计算结果可见,某药对某病治愈率的点估计计为75.0%,其95%可信区间为67.3~82.7%,99%可信区间为64.8~85.2%。
4.2.2 查表法
根据二项分布原理编制了百分率的可信限《可信区间》表,可根据样本含量n及阳性数X查表而得总体率的95%与99%可信区间。查表法可以有以下几种情况:
⑴从百分率的可信限《可信区间》表直接查到。
例7 某医院用复方当归注射液静脉滴注治疗脑动脉硬化症22例,其中显效者10例。问该药显效的95%和99%可信区间各是多少?
根据n=22,X=10,查百分率的可信限《可信区间》表得95%可信区间为24~68%,99%可信区间为20~73%。
⑵n可以查到,但X查不到时,可以用反推法求得。
例8 已知:n=25,X=20,求其95%与99%可信区间。可以先查得n=25,X=25-20=5的95%可信区间为7~41%,再从100%中减去此数得59~93%;查出n=25,X=5的99%的可信区间为5~47%,再从100%中减去此数得53~95%。
⑶n查不到,X可以查到时,可以用插补法求得。
例9
已知:n=55,X=22,求其95%与99%可信区间。先查得n=50,60与X=22相交处的95%可信区间分别为30~59%与25~50%,然后用内插法求之。
http://s11/middle/5773050atb3dc9e67d7aa&690
http://s14/middle/5773050atb3dca0ab048d&690
http://s13/middle/5773050atb3dca2ebdbbc&690
http://s13/middle/5773050atb3dca566b66c&690
http://s1/middle/5773050atb3dca7b427a0&690
http://s2/middle/5773050atb3dca9e820e1&690
http://s16/middle/5773050atb3dcabf1076f&690
http://s7/middle/5773050atb3dcae66d456&690
http://s12/middle/5773050at7862de6f363b&690
http://s4/middle/5773050atb3dcb2c0be13&690
4.判断结果:
由于P<0.01,因此,50岁以上的吸烟与非吸烟者的慢性支气管炎患病率有高度显著性差异,可以认为吸烟者的慢性支气管炎患病率高于非吸烟者。
5. 标准化率的抽样误差与显著性检验
在3节中我们讨论了标准化率。如果是进行抽样研究,标准化率也仅仅是一个样本率,因此,标准化率也有抽样误差。
http://s13/middle/5773050atb3dcb98e666c&690
http://s14/middle/5773050atb3dcbcf4264d&690
http://s5/middle/5773050at7862dfe9dbb4&690
http://s14/middle/5773050atb3dcc1feb26d&690
http://s8/middle/5773050atb3dcc451eb47&690
http://s16/middle/5773050atb3dcc6d7050f&690
http://s6/middle/5773050atb3dcc9ba5b65&690
http://s5/middle/5773050at7862e1315894&690
http://s12/middle/5773050atb3dcce033ebb&690
由于P<0.01,因此,甲、乙两个煤矿的标准化尘肺患病率有高度显著性差异,可以认为甲矿高于乙矿。
5.3 标准化死亡比的显著性检验
标准化死亡比(包括标准化发病比等),即某人群实际死亡数与预期死亡数之比。预期死亡数是按标准化的间接法原理计算出来的,即某被标准化人群各年龄组人口数与标准人群相应的年龄别死亡率乘积的总和。
从理论上来讲,如果被标准化人群死亡率与标准人群死亡率相等,则实际数与预期数相等,标准化死亡比为1。但是,由于抽样误差的影响,比值大多不为1,因此,需要进行显著性检验。
一些稀有事件的发生率,例如恶性肿瘤的发病率或死亡率很低,而观察人口数又较多,一般认为服从Poisson分布。当比较某人群的恶性肿瘤死亡率与标准人群恶性肿瘤死亡率时,可以用标准化死亡比的显著性检验,直接从Poisson分布中实际数与预期数之比的界值表查得P值。查表时,先从表中找到样本“实际数”(即某人群恶性肿瘤实际死亡数)所在的行,如果算得的死亡比:⑴在P=0.05的上、下界之间,则P>0.05;⑵在P=0.01下界,或0.05上界与0.01上界之间,则0.01<P<0.05;⑶小于P=0.01下界或大于P=0.01上界,则P<0.01;⑷恰好等于某一上界或下界,则P就正好等于相应的P值。
查出P值后,按所取检验水准作出推断结论。
例15 某市的一个区为化学工业基地,为了研究环境污染与肺癌的关系,调查得该区在三年内肺癌死亡人数为25人,而以全市同一时期的肺癌年龄别死亡率作标准,计算出该区肺癌死亡的预期数为17.8,标准化死亡比为1.40(25/17.8)。问该区肺癌死亡率与全市的肺癌死亡率有无显著性差异?
1.检验假设:化工区肺癌死亡率与全市的肺癌死亡率无显著性差异。
2.确定P值:
根据肺癌死亡数=25,标准化死亡比=1.40,查Poisson分布中实际数与预期数之比的界值表得P>0.05。
3.判断结果:
由于P>0.05,因此,化工区肺癌死亡率与全市的肺癌死亡率无显著性差异。
加载中,请稍候......