标签:
杂谈 |
统计中的平均数是用以表明数字资料中作为统计特征之一的集中趋势的数值。它是统计分析中最常用的一种方法。欧美统计分析中特别重视平均数的运用。平均数在描述统计和推断统计中都有广泛的应用。英国统计学家鲍莱甚至认为统计学可以被称作“平均数的科学”。
通常用到的平均数有算术平均数、几何平均数、调和平均数、中位数和众数等。根据数学上的特性,前三种叫做计算的平均数,后两种称为位置的平均数。各种平均数的应用,取决于各种平均数的性质和应用的场合。
英国统计学家尤尔认为平均数具有以下几个性质:(1)严密确定;(2)依据全部观察值;(3)便于了解;(4)易于计算;(5)受抽样的影响较小;(6)易用代数处理。
每种平均数根据这六点衡量,各有利弊,取舍的标准应该符合实际需要。
算术平均数
算术平均数是一组数字资料中各个数值之和除以数值的项数所得的商。它是应用最广泛的一种平均数。计算算术平均数的意义,在于它能抵消各个数值的数量差别,因而可以用它来代替各个数值。这就是说,算术平均数乘以数值的项数等于各个数值之和,或算术平均数和各个数值之差的总和等于零。
算术平均数可分为简单算术平均数和加权算术平均数两种:
简单算术平均数
在资料未分组的情况下,它是资料中的各个数值之和除以数值的项数。其计算公式如下:
加权算术平均数
在资料已分组并得出次数分配数列的情况下,要先求出每组的总量,然后把各组总量相加除以次数和。其计算公式如下:
上式平均数的大小,既取决于各组数值X,又决定于各组次数f。由于次数f在计算过程中,对平均数的影响起着权衡轻重的作用,故称加权算术平均数。
中位数
中位数(median)也称中数,是一组数字资料中按大小顺序排列时处于中间地位的数值。因此,中位数是一种位置平均数。由于中位数处于中间地位,即有一半数值小于中位数,另有一半数值大于中位数,所以它也能表明数字资料的集中趋势。又由于中位数处于中间地位,所以中位数和各项数值之差的绝对值之和是一个最小值。设Md为中位数,则
在计算中位数时,必须将各项数值按大小排列,找出位置在最中间的数值。当数值的项数为奇数时,中位数等于最中间一项的数值;当数值的项数为偶数时,中位数等于最中间两项数值的算术平均数。
众数
众数(mode)是一组数字资料中出现次数最多的数值,换言之,它是最常见的数值。正因为如此,它也能表明数字资料的集中趋势,但在性质上,同算术平均数和中位数都不相同。
在计算众数(M0)时,也必须将数值按大小顺序排列,但不是为了找出最中间的数值,而是要找出出现次数最多的数值。
众数比算术平均数和中位数较难理解,而且计算结果常常是一个近似值。它不受每一项数值的影响,当然也不会被极端数值所左右。众数不能用来作进一步的代数运算。根据次数分配计算众数时,各组必须等距。当数字资料项数很少时,有时不存在众数;相反,在某些次数分配中,也可能存在两个以上的众数,但这种情况多数是由于数字资料不纯所造成的。
几何平均数
几何平均数是一组N项数字资料中各项数值的连乘积的N次方根。它是一种具有特殊用途的平均数,最适宜计算经济指标的平均发展速度。在西方国家统计工作中,还在两种场合应用几何平均数:一种是用以计算某种比率的平均数,如计算指数;一种是用以计算大致具有几何级数关系的一组数字的平均数。
未分组资料的几何平均数,是N个数值的连乘积的N次方根。设M0代表几何平均数,则计算公式为
已分组的次数分配资料的几何平均数公式为
几何平均数比算术平均数较难理解,计算也较复杂。它受到被计算的数字资料中每一项数值的影响,但它被极端数值所左右的程度比算术平均数小。几何平均数可以用来作进一步的代数运算。用以计算几何平均数的各项数值必须是正数,如果有一项数值等于0或为负数,就不能计算几何平均数。
调和平均数
调和平均数,亦称倒数平均数,是一组数字资料中每一项数值的倒数的算术平均数的倒数。它也是一种具有特殊用途的平均数,最适宜用于某些经济指标的逆指标。这样计算得出的调和平均数和用正指标计算的算术平均数完全一致。例如,美国商品标价一般以每件多少美元表示,但也常常用一美元可以多少商品标价。后一种标价就是前一种标价的逆指标。对于逆指标,应当用调和平均数计算平均价格。设Mn为调和平均数,则
调和平均数虽然计算并不困难,但没有算术平均数那样容易理解。它受数字资料中每一项数值的影响,但被极端数值左右的程度比几何平均数还小。调和平均数可以作进一步的代数运算。当有一项数值等于零时,调和平均数就无法计算。