调研样本量的确定方法
(2010-09-20 09:59:02)
标签:
杂谈 |
分类: 市场研究 |
确定样本量的基本公式
在简单随机抽样的条件下,我们在统计教材中可以很容易找到确定调查样本量的公式:
n=Z2σ2/d2 …… …… …… ……(1)
其中:
n:代表所需要样本量
Z:置信水平的Z统计量,如95%置信水平的Z统计量为1.96,99%的Z为2.68。
σ:总体的标准差, 一般取0.5;
d :置信区间的1/2,在实际应用中就是容许误差,或者调查误差。
例如:某个消费者调查要求置信度为95%,抽样误差不超过5%,查表得Z=1.96,σ=0.5,d=5%因此:n=1.9620.52/5%2=384,说明此次调查所需最小样本量是384。
|
不同置信区间和抽样误差下的样本量表 |
|||
|
样本量 抽样误差 |
不同置信区间的Z统计量 |
||
|
90% |
95% |
99% |
|
|
1.64 |
1.96 |
2.58 |
|
|
10% |
67 |
96 |
166 |
|
5% |
269 |
384 |
666 |
|
3% |
747 |
1067 |
1849 |
对于比例型变量,确定样本量的公式为:
n=Z2(p(1-p))/d2 …… …… …… …(2)
其中:
n :所需样本量
z:置信水平的z统计量,如95%置信水平的Z统计量为1.96,
p:目标总体的比例期望值
d:置信区间的半宽
最大样本量
以上公式只是理论上的,在实际调查中确定合理的样本量,必须考虑多方面的因素。
首先,由于人们通常缺乏对标准差的感性认识,因此对标准差的估计往往是最难的。总体的标准差是123,还是765?如果没有一点对样本的先验知识,那么对标准差的估计是不可能的。好在我们通常能对变量的平均值进行估计,如我们通过历史资料估计该地区目前的年人均收入大致为10,000元,那么根据统计学知识,我们引入变异系数的概念:
变异系数V=标准差σ/平均值X≤1
因此,我们知道人均收入的标准差应该小于平均值,就是说标准差应该在10000以下。当然,这对于我们确定样本量还不能起太大的作用。然而如果我们采用相对误差表述的精度,对公式(3)变形,我们有:
n
=Z2(σ2/X2)/
d2/X2
其中P表示相对误差
根据上述公式,我们可以计算在相对误差一定的情况下,所需的最大样本量。以下是在置信程度95%的水平下,在不同相对误差下的最高样本量:
通常,变异系数为1的情况是很少见的,根据本人对市场研究中经常遇到的情况,变异系数多在50%以下,因此,实际所需要的样本量可以进一步缩小。
对于比例型变量,在事先缺乏对比例的估计时,我们可以采用最保守的估计法,即p=0.5,以下是比例p在不同绝对误差程度下,所需的最大样本量(95%置信水平):
在总体比较小时,总体对样本规模会产生较大影响,就要考虑总体对样本规模的影响。这时可以用如下公式(5)进行转换:
n=n1/(1+n1/N) …… …… …… ……(5)
在公式中,n1表示在总体很大时根据一定的置信度和允许误差计算所得的样本量,N表示总体单位数。
按此公式,我们可以对不同总体在95%的置信度下,抽样误差是3%时的情况列表如下:
抽样误差是其情况,先在下表中查到总体很大时95%置信度下允许误差对应的样本规模值后代入公式1进行计算即可(事先也要知道你所调查的总体单位数)。
另附总体很大时抽样误差与样本规模对照表(此表根据推论总体成数或百分比的样本规模计算公式计算出,置信度为95%。为直观起见,样本规模取整数)。

加载中…