调研样本量的确定方法_成都市场研究兼执行组

http://blog.sina.com.cn/u/1821626461

首页博文目录关于我

个人资料

微博

加好友发纸条

写留言加关注

博客等级：
博客积分：

博客访问：
关注人气：
获赠金笔：0支
赠出金笔：0支
荣誉徽章：

正文字体大小：大中小

调研样本量的确定方法

(2010-09-20 09:59:02)

标签：

杂谈

分类：市场研究

确定样本量的基本公式

在简单随机抽样的条件下，我们在统计教材中可以很容易找到确定调查样本量的公式：

n=Z²σ²/d² …… …… …… ……（1）

其中：

n：代表所需要样本量

Z：置信水平的Z统计量，如95%置信水平的Z统计量为1.96，99%的Z为2.68。

σ：总体的标准差，一般取0.5；

d ：置信区间的1/2，在实际应用中就是容许误差，或者调查误差。

例如：某个消费者调查要求置信度为95%，抽样误差不超过5%，查表得Z=1.96，σ=0.5，d=5%因此：n=1.96²0.5²/5%²=384，说明此次调查所需最小样本量是384。

不同置信区间和抽样误差下的样本量表
样本量抽样误差	不同置信区间的Z统计量
	90%	95%	99%
	1.64	1.96	2.58
10%	67	96	166
5%	269	384	666
3%	747	1067	1849

对于比例型变量，确定样本量的公式为:

n=Z²(p(1-p))/d² …… …… …… …（2）

其中：

n ：所需样本量

z：置信水平的z统计量，如95%置信水平的Z统计量为1.96,

p：目标总体的比例期望值

d：置信区间的半宽

最大样本量

以上公式只是理论上的，在实际调查中确定合理的样本量，必须考虑多方面的因素。

首先，由于人们通常缺乏对标准差的感性认识，因此对标准差的估计往往是最难的。总体的标准差是123，还是765？如果没有一点对样本的先验知识，那么对标准差的估计是不可能的。好在我们通常能对变量的平均值进行估计，如我们通过历史资料估计该地区目前的年人均收入大致为10,000元，那么根据统计学知识，我们引入变异系数的概念：

变异系数V=标准差σ/平均值X≤1 …… …… …… …… ……（3）

因此，我们知道人均收入的标准差应该小于平均值，就是说标准差应该在10000以下。当然，这对于我们确定样本量还不能起太大的作用。然而如果我们采用相对误差表述的精度，对公式（3）变形，我们有：

n =Z²（σ²/X²）/ d²/X² = Z²V²/ P² ≤Z²/P²…… …… …… ……（4）

其中P表示相对误差

根据上述公式，我们可以计算在相对误差一定的情况下，所需的最大样本量。以下是在置信程度95%的水平下，在不同相对误差下的最高样本量：

通常，变异系数为1的情况是很少见的，根据本人对市场研究中经常遇到的情况，变异系数多在50%以下，因此，实际所需要的样本量可以进一步缩小。

对于比例型变量，在事先缺乏对比例的估计时，我们可以采用最保守的估计法，即p=0.5，以下是比例p在不同绝对误差程度下，所需的最大样本量（95%置信水平）：

在总体比较小时，总体对样本规模会产生较大影响，就要考虑总体对样本规模的影响。这时可以用如下公式（5）进行转换：

n=n₁/(1+n₁/N) …… …… …… ……（5）

在公式中，n₁表示在总体很大时根据一定的置信度和允许误差计算所得的样本量，N表示总体单位数。

按此公式，我们可以对不同总体在95％的置信度下，抽样误差是3％时的情况列表如下：

抽样误差是其情况，先在下表中查到总体很大时95％置信度下允许误差对应的样本规模值后代入公式1进行计算即可（事先也要知道你所调查的总体单位数）。

另附总体很大时抽样误差与样本规模对照表（此表根据推论总体成数或百分比的样本规模计算公式计算出，置信度为95％。为直观起见，样本规模取整数）。

阅读┊ 收藏 ┊ 喜欢 ▼ ┊打印┊举报/Report

后一篇：市场研究报告的写法

新浪BLOG意见反馈留言板　欢迎批评指正