探索性因子分析(EFA)和验证性因子分析（CFA）_张诺文

http://blog.sina.com.cn/u/1630043557

首页博文目录关于我

个人资料

微博

加好友发纸条

写留言加关注

博客等级：
博客积分：

博客访问：
关注人气：
获赠金笔：0支
赠出金笔：0支
荣誉徽章：

正文字体大小：大中小

探索性因子分析(EFA)和验证性因子分析（CFA）

(2013-03-30 10:33:26)

标签：

统计学

因子分析

分类：统计学

【探索性因子分析（Exploratory Factor Analysis, EFA）和验证性因子分析（Confirmatory Factor Analysis, CFA)的概念】

因子分析法是两种分析形式的统一体，即验证性分析和纯粹的探索性分析。我们一般使用的因子分析，其实都属于探索性因子分析。

探索的因子分析有一些局限性。第一，它假定所有的因子(旋转后) 都会影响测度项。在实际研究中，我们往往会假定一个因子之间没有因果关系，所以可能不会影响另外一个因子的测度项。第二，探索性因子分析假定测度项残差之间是相互独立的。实际上，测度项的残差之间可以因为共同方法偏差、子因子等因素而相关。第三，探索性因子分析强制所有的因子为独立的。这虽然是求解因子个数时不得不采用的机宜之计，却与大部分的研究模型不符。最明显的是，自变量与因变量之间是应该相关的，而不是独立的。这些局限性就要求有一种更加灵活的建模方法，使研究者不但可以更细致地描述测度项与因子之间的关系，而且并对这个关系直接进行测试。而在探索性因子分析中，一个被测试的模型(比如正交的因子) 往往不是研究者理论中的确切的模型。

验证性因子分析 (confirmatory factor analysis) 的强项正是在于它允许研究者明确描述一个理论模型中的细节。那么一个研究者想描述什么呢？因为测量误差的存在，研究者需要使用多个测度项。当使用多个测度项之后，我们就有测度项的“质量”问题，即效度检验。而效度检验就是要看一个测度项是否与其所设计的因子有显著的载荷，并与其不相干的因子没有显著的载荷。当然，我们可能进一步检验一个测度项工具中是否存在共同方法偏差，一些测度项之间是否存在“子因子”。这些测试都要求研究者明确描述测度项、因子、残差之间的关系。对这种关系的描述又叫测度模型 (measurement model)。对测度模型的检验就是验证性测度模型。对测度模型的质量检验是假设检验之前的必要步骤。

【探索性因子分析和验证性因子分析相同之处】

两种因子分析都是以普通因子分析模型作为理论基础，其主要目的都是浓缩数据，通过对诸多变量的相关性研究，可以用假想的少数几个变量(因子、潜变量)来表示原来变量(观测变量)的主要信息。图1所示即为最简单、也最为常见的因子模型，每个观测变量(指标)只在一个因子(潜变量)上负荷不为零，x₁、x₂ 、x₃是潜变量ξ₁的指标，x₄、x₅是潜变量ξ₂的指标。

http://wiki.mbalib.com/w/images/1/11/%E5%9B%BE1_%E5%9B%A0%E5%AD%90%E7%BB%93%E6%9E%84%E6%A8%A1%E5%9E%8B.jpg

将图1所示的因子模型推广至一般意义上的因子模型后，各观测变量x_i与m个公共因子ξ₁,ξ₂,...,ξ_m之间的关系可以用数学模型表示如下：

　　x₁ = λ₁₁ξ₁ + λ₁₂ξ₂ + ... + λ_1mξ_m + δ₁

　　......

　　x_k = λ_k1ξ₁ + λ_k2ξ₂ + ... + λ_kmξ_m + δ_k

其中：x_i为各观测变量；ξ_i是公共因子；δ_i是x_i，的特殊因子，有时也称误差项，包括x_i的唯一性因子和误差因子两部分；λ_ij是公共因子的负载；m是公共因子ξ₁,ξ₂,...,ξ_m的个数，k是各观测变量x₁,...,x_k的个数，m<k。上式也可以简单地用矩阵表示如下：x = Λ_xξ + δ

其中：

　　x = (x₁,x₂,...,x_k)^T , ξ = (ξ₁,ξ₂,...,ξ_m) ，δ = (δ₁,δ₂,...,δ_k)^T

　　http://wiki.mbalib.com/w/images/math/c/0/7/c0774eb20508065c98de0da7cd6fb0aa.png，是负载矩阵

探索性因子分析和验证性因子分析的差异之处

1.基本思想不同

因子分析的基本思想是要寻找公共因子，以达到降维的目的。探索性因子分析主要是为了找出影响观测变量的因子个数，以及各个因子和各个观测变量之间的相关程度，以试图揭示一套相对比较大的变量的内在结构。研究者的假定是每个指标变量都与某个因子匹配，而且只能通过因子载荷凭知觉推断数据的因子结构。而验证性因子分析的主要目的是决定事前定义因子的模型拟合实际数据的能力，以试图检验观测变量的因子个数和因子载荷是否与基于预先建立的理论的预期一致。指标变量是基于先验理论选出的，而因子分析是用来看它们是否如预期的一样。其先验假设是每个因子都与一个具体的指示变量子集对应，并且至少要求预先假设模型中因子的数目，但有时也预期哪些变量依赖哪个因子。

2.应用前提不同

探索性因子分析没有先验信息，而验证性因子分析有先验信息。探索性因子分析是在事先不知道影响因子的基础上，完全依据样本数据，利用统计软件以一定的原则进行因子分析，最后得出因子的过程。

在进行探索性因子分析之前，不必知道要用几个因子，以及各因子和观测变量之间的关系。在进行探索性因子分析时，由于没有先验理论，只能通过因子载荷凭知觉推断数据的因子结构。上述数学模型中的公共因子数m 在分析前并未确定，而是在分析过程中视中间结果而决定，各个公共因子ξ_i统一地规定为均影响每个观测变量x_i。在管理研究中，如仅仅从数据出发，很难得到科学的结果，甚至可能与已有的理论或经验相悖。因此，探索性因子分析更适合于在没有理论支持的情况下对数据的试探性分析。这就需要用验证性因子分析来做进一步检验。而验证性因子分析则是基于预先建立的理论，要求事先假设因子结构，其先验假设是每个因子都与一个具体的指示变量子集对应，以检验这种结构是否与观测数据一致。也就是在上述数学模型中，首先要根据先验信息判定公共因子数m，同时还要根据实际情况将模型中某些参数设定为某一定值。这样，验证性因子分析也就充分利用了先验信息，在已知因子的情况下检验所搜集的数据资料是否按事先预定的结构方式产生作用。

3.理论假设不同

探索性因子分析的假设主要包括：①所有的公共因子都相关(或都不相关)；②所有的公共因子都直接影响所有的观测变量；③ 特殊(唯一性)因子之间相互独立；④ 所有观测变量只受一个特殊(唯一性)因子的影响；⑤ 公共因子与特殊因子(唯一性)相互独立。验证性因子分析克服了探索性因子分析假设条件约束太强的缺陷，其假设主要包括：① 公共因子之间可以相关，也可以无关；② 观测变量可以只受一个或几个公共因子的影响，而不必受所有公共因子的影响；③特殊因子之间可以相关，还可以出现不存在误差因素的观测变量；④ 公共因子与特殊因子之间相互独立。

4.分析步骤不同

探索性因子分析主要有以下七个步骤：① 收集观测变量：通常采用抽样的方法，按照实际情况收集观测变量数据。② 构造相关矩阵：根据相关矩阵可以确定是否适合进行因子分析。③确定因子个数：可根据实际情况事先假定因子个数，也可以按照特征根大于1的准则或碎石准则来确定因子个数。④ 提取因子：可以根据需要选择合适的因子提取方法，如主成分方法、加权最小平方法、极大似然法等。⑤ 因子旋转：由于初始因子综合性太强，难以找出实际意义，因此一般都需要对因子进行旋转(常用的旋转方法有正交旋转、斜交旋转等)，以便于对因子结构进行合理解释。⑥解释因子结构：可以根据实际情况及负载大小对因子进行具体解释。⑦计算因子得分：可以利用公共因子来做进一步的研究，如聚类分析、评价等。

而验证性因子分析主要有以下六个步骤：① 定义因子模型：包括选择因子个数和定义因子载荷。因子载荷可以事先定为0、或者其它自由变化的常数，或者在一定的约束条件下变化的数(比如与另一载荷相等)。② 收集观测值：根据研究目的收集观测值。③获得相关系数矩阵：根据原始资料数据获得变量协方差阵。④ 拟合模型：这里需要选择一种方法(如极大似然估计、渐进分布自由估计等)来估计自由变化的因子载荷。⑤ 评价模型：当因子模型能够拟合数据时，因子载荷的选择要使模型暗含的相关矩阵与实际观测矩阵之间的差异最小。常用的统计参数有：卡方拟合指数(x²)、比较拟合指数(CFI)、拟合优度指数(GFI)和估计误差均方根(RMSEA)。根据Bentler(1990)的建议标准，x²/DF≤3.0、CFI≥0.90、GFI≥0.85、RMSE≤0.05，则表明该模型的拟合程度是可接受的。⑥修正模型：如果模型拟合效果不佳，应根据理论分析修正或重新限定约束关系，对模型进行修正，以得到最优模型。

5.主要应用范围不同

探索性因子分析主要应用于三个方面：①寻求基本结构，解决多元统计分析中的变量间强相关问题；② 数据化简；③发展测量量表。验证性因子分析允许研究者将观察变量依据理论或先前假设构成测量模式，然后评价此因子结构和该理论界定的样本资料间符合的程度。因此，主要应用于以下三个方面：① 验证量表的维度或面向性(dimensionality)，或者称因子结构，决定最有效因子结构；② 验证因子的阶层关系；③ 评估量表的信度和效度。

6.探索性因子分析和验证性因子分析的正确用法

从上述分析可以看出，探索性因子分析和验证性因子分析是因子分析的两个不可分割的重要组成部分，在管理研究的实际应用中，两者不能截然分开，只有结合运用，才能相得益彰，使研究更有深度。An-derson，J．C．，Gerbin，D．W 建议，在发展理论的过程中，首先应通过探索性因子分析建立模型，再用验证提供了发析现模型以验证和修正的概念和计算工具，其提供的结果为验证性因子分析建立假设提供了重要的基础和保证。两种因子分析缺少任何一个，因子分析都将是不完整的。一般来说，如果研究者没有坚实的理论基础支撑，有关观测变量内部结构一般先用探索性因子分析，产生一个关于内部结构的理论，再在此基础上用验证性因子分析，这样的做法是比较科学的，但这必须要用两组分开的数据来做。如果研究者直接把探索性因子分析的结果放到统一数据的验证性因子分析中，研究者就仅仅是拟合数据，而不是检验理论结构。如果样本容量足够大的话，可以将数据样本随机分成两半，合理的做法就是先用一半数据做探索性因子分析，然后把分析取得的因子用在剩下的一半数据中做验证性因子分析。如果验证性因子分析的拟合效果非常差，那么还必须用探索性因子分析来找出数据与模型之间的不一致。

阅读┊ 收藏 ┊ 喜欢 ▼ ┊打印┊举报/Report

前一篇：【转帖】分层回归（hierarchical multiple regression）

后一篇：内部一致性信度

新浪BLOG意见反馈留言板　欢迎批评指正