加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

调研样本量的确定方法

(2010-09-20 09:59:02)
标签:

杂谈

分类: 市场研究

确定样本量的基本公式

在简单随机抽样的条件下,我们在统计教材中可以很容易找到确定调查样本量的公式:

n=Z2σ2/d2 …… …… …… ……(1)

其中:

n:代表所需要样本量

Z:置信水平的Z统计量,如95%置信水平的Z统计量为1.96,99%的Z为2.68。

σ:总体的标准差, 一般取0.5;

d :置信区间的1/2,在实际应用中就是容许误差,或者调查误差。

例如:某个消费者调查要求置信度为95%,抽样误差不超过5%,查表得Z=1.96,σ=0.5,d=5%因此:n=1.9620.52/5%2=384,说明此次调查所需最小样本量是384。

不同置信区间和抽样误差下的样本量表

样本量

 

抽样误差

不同置信区间的Z统计量

90%

95%

99%

1.64

1.96

2.58

10%

67

96

166

5%

269

384

666

3%

747

1067

1849

对于比例型变量,确定样本量的公式为:

n=Z2(p(1-p))/d2 …… …… …… …(2)

其中:

n :所需样本量

z:置信水平的z统计量,如95%置信水平的Z统计量为1.96,

p:目标总体的比例期望值

d:置信区间的半宽

最大样本量

以上公式只是理论上的,在实际调查中确定合理的样本量,必须考虑多方面的因素。

首先,由于人们通常缺乏对标准差的感性认识,因此对标准差的估计往往是最难的。总体的标准差是123,还是765?如果没有一点对样本的先验知识,那么对标准差的估计是不可能的。好在我们通常能对变量的平均值进行估计,如我们通过历史资料估计该地区目前的年人均收入大致为10,000元,那么根据统计学知识,我们引入变异系数的概念:

变异系数V=标准差σ/平均值X≤1  …… …… …… …… ……(3)

因此,我们知道人均收入的标准差应该小于平均值,就是说标准差应该在10000以下。当然,这对于我们确定样本量还不能起太大的作用。然而如果我们采用相对误差表述的精度,对公式(3)变形,我们有:

n =Z2(σ2/X2/ d2/X = Z2V2/ P ≤Z2/P2…… …… …… ……(4)

其中P表示相对误差

根据上述公式,我们可以计算在相对误差一定的情况下,所需的最大样本量。以下是在置信程度95%的水平下,在不同相对误差下的最高样本量:

 

通常,变异系数为1的情况是很少见的,根据本人对市场研究中经常遇到的情况,变异系数多在50%以下,因此,实际所需要的样本量可以进一步缩小。

对于比例型变量,在事先缺乏对比例的估计时,我们可以采用最保守的估计法,即p=0.5,以下是比例p在不同绝对误差程度下,所需的最大样本量(95%置信水平):

 

在总体比较小时,总体对样本规模会产生较大影响,就要考虑总体对样本规模的影响。这时可以用如下公式(5)进行转换:

n=n1/(1+n1/N) …… …… …… ……(5)

在公式中,n1表示在总体很大时根据一定的置信度和允许误差计算所得的样本量,N表示总体单位数。

按此公式,我们可以对不同总体在95%的置信度下,抽样误差是3%时的情况列表如下:

 

抽样误差是其情况,先在下表中查到总体很大时95%置信度下允许误差对应的样本规模值后代入公式1进行计算即可(事先也要知道你所调查的总体单位数)。

另附总体很大时抽样误差与样本规模对照表(此表根据推论总体成数或百分比的样本规模计算公式计算出,置信度为95%。为直观起见,样本规模取整数)。

 

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有