社会科学研究中样本容量问题
(2009-05-15 12:21:20)
标签:
验证性分析样本容量统计测量 |
分类: 基础统计测量 |
在验证性因子分析和结构方程模型的分析中,究竟样本(N)容量多大以及每个因子要包含多少个指标(Indicators)是研究实践中经常遇到的问题。不容置疑,样本容量越大、包含指标越多,会比较好有些。但是,我们需要了解的是,有没有一个最低可接受的标准可以参考?
Boomasa(1982)认为,无论从模型恰当解的百分率、参数估计的精确性还是卡方统计量的分布,N最少大于100,大于200更好。如果样本数量小于100,相关矩阵会不够稳定,结构方程模型分析的信度低。
如果将样本数量与指标数(P)或自由估计的自由度(t)结合起来,一般认为N/P或N/t大于10比较好。Nunally(1967)的建议经常为人引用,即被试人数是观测b变量的10倍。比如,10个题项的自尊问卷至少需要100个被试才好。Tanaka(1987)认为N/t的比例更重要,Bentler(1989)建议N/t大于5。这些说明,但被试量不大时,不要用太多的变量或估计太多的参数。
有的学者为了减低模型的题目数量,将题数合并成小组(Parcel),用小组的总分或题项平均分构建一个新指标,这样每个因子包含的指题项标就大为减少。一般是要求各个小组内的构成或内容保持同质。如学业自我概念一般由语文自我概念、数学自我概念、一般自我学业能力等构成的15个题目,要合并成3个小组新变量就要求每个变量中均包含语文、数学、一般自我概念三种内容和结构。又如,自尊的10个题目,合并成两项,可以按照奇数和偶数随机分配成2个新变量。这样做的好处,可能会使模型的拟合程度提高,但也可能是“虚高”的结果,这值得注意。
至于一个因子结构包含几个条目,一般应包含3个条目。在探索性研究过程中,尽量多设计一些条目,以备预测后删除。值得注意的是,统计结果的指标只是提供了一些参考,是否真的需要删除条目,主要还是要看这个因子的内涵和特性。在不影响因子结构和内涵的前提下,可以结合条目的内容符合程度、语言表达规范性等综合考虑。如学业自我概念的预测结果表明语文方面的题目质量不好,也未必一定删除,否则就减少了学习自我概念的内涵了(只是一般自我概念和数学自我概念了)!

加载中…