结构方程模型(SEM)分析简介 (2)

分类: 流行病学 |
部分结果:
和其它软件一样,SAS的分析结果报告包括以下三部份:1) 数据本身的统计描述,2) 模型拟合报告,3)参数估计及统计检验。由于该分析是在相关系数基础上进行的,模型拟合报告部份基本无意义。另外鉴于篇幅所限,这里只提供参数估计的一部份。但是,有兴趣的读者可根据本章提供的方法结合作者提供的参考文献作进一步探索。
(1) 预测回归系数聚阵
部分解释:
当我们用SAS进行结构方程分析时,得到很多的结果报告。由于篇幅所限,这里只选择主要的部份作一简单的讲解。读者可以跟据我们提供的程序及数据自己产生全部结果。结果的第一和第三部份分别是模型预测回归系数聚阵和残差聚阵。从这一结果来看模型的预测指和观察值几乎一致,因此参差聚阵除了V2-V6项以外几乎都为0。本模型 的模拟程度高的主要原因是数据的变量数少而参数相对多造成。用前面介绍的公式,可知此模型的自由度为1,因此是充份识别模型。因为,p=q=3, t=通经系数+方差数(STD)+协方差数(CV)=11+6+3=20,所以 d.f=(3+3)(3+4)/2-20=1。 由于本研究数据相关系数聚阵显示,体育锻炼和舒张压的相关系数非常弱(r=-0.02),因此这一同经未反映在数据分析中。
SAS输出结果的二部份表明,该模型的拟合也比较满意(请参看1.5小节)。总的来讲,本模型的模拟程度比较满意。结果的第四部份显示,多数参数估计值的t-检验都呈现显著性(单侧t-检验的显著性界值为1.64) 。年龄(V1),吸烟(V3),BMI(V4)及血胆固醇(V5)都对舒张压有显著性的直接影响。但正如我们在前面所讲的,出了和其它分析法一样检查预测变量的直接作用,结构方程模型的重要优点之一就是它还可以检查变量的间接作用。在表1.1中我们跟据,本分析所得到通经系数,较详细探讨了变量间直接和间接作用。
从上面的结果可见,SAS提供非标准化和标准化两组参数估计。通常这两组值是不一样的。但由于在本事例中我们使用的数据是标准化相关阵,因此两组参数估计值是相同的。另外,SAS还结果提供了每个非标准化参数的T检验值,此统计检验也同样适应于标准化参数。由于标准化参数不受原始测量单位的影响,各参数之间可以直接比较。细心的读者可能已注意到,SAS结果中提供的外源变量(X1-X3)协方差估计值(CX1X2, CX1X3 和CX2X3)同它们之间的相关系数相同。这是因为,标准化的相关系数就是协方
差。如表1.3和图1.3所示一个外源性变量对内源性变量的影响包含直接和间接作用。比如在本研究中BMI对收缩压的直接影响为0.1083,但BMI还可以通过影响血胆固醇水平而影响舒张压,。所以BMI对舒张压总的影响为0.1833+0.0447=0.153。
结果的第六部份的开始给出了,模型的预测效果。由于本模型是由三个并列方程组成,因此有三个R2值,它们分别为2%,16%和9%。另外由于我们在SAS程序中要求了变量作用总结(PROC CALIS 命令里的”toteff”), SAS结果分别给出了变量间影响的 间接作用和总作用。这和我们表1.3中计算的结果是一致的。一般来讲,一个复杂的模型要经过多次的调整和修改。结果的结尾部份,模型修改参数,Lagrange和Wald统计 值11。Lagrange是指,在现有的模型基础上增加某一特定通经参数模型拟合度改 进的程度;Wald指是指在现有模型基础上去掉某一个统计系数(也就是不在估计从参数或使其为0)模型拟合变化情况。Lagrange和Wald都是用卡方值来横量的。 本结果显示,如果估计V2(体育锻炼)对V6(舒张压)的影响,也就是说估计参数PV6V2,模型现有的c2值会降低0.227。很明显,模型不会有显著的改善。可是如果,我们从模型中除掉参数PV5V1(年龄对血脂的影响),模型的c2只会增加0.49,因此对模型不会有很大的影响。因此有理由不估计参数PV5V1。读者可以,自己试探着修改以下我们提供的模模型。我们需要指出的是,当理论模型复杂时修改和选择一个满意的统计模型是一件很难的事。研究人员一定要结合专业知识和统计结果作总和考虑。
表1.2
内源性变量 |
预测变量 |
直接作用 |
|||
V6 舒张压 |
V1 年龄 |
0.2383 |
-0.0107 |
-0.0076 |
0.220 |
V2 体育锻炼 |
- |
-0.0138 |
-0.0441 |
-0.058 |
|
V3 吸烟 |
-0.1387 |
0.0283 |
0.0576 |
-0.053 |
|
V4 (BMI) |
0.1083 |
- |
0.0447 |
0.153 |
|
V5 胆固醇 |
0.1864 |
0 |
0 |
0.186 |
|
V5 胆固醇 |
V1 |
-0.0408 |
-0.0168 |
- |
-0.058 |
V2 |
-0.2364 |
-0.0216 |
- |
-0.258 |
|
V3 |
0.3091 |
0.044 |
- |
0.353 |
|
V4 |
0.2397 |
|
|
0.240 |
|
V4 BMI |
V1 |
-0.0702 |
- |
- |
-0.070 |
V2 |
-0.0903 |
- |
- |
-0.090 |
|
V3 |
0.1853 |
- |
- |
0.185 |
|
|
|
|
|
|
1.3 结构方程模型分析
如前所述,结构方程模型分析是通经分析的扩展,通经分析是结构方程模型分析的特殊形式。尽管理论基础相似,但当结构方程模型分析含隐变量时,其复杂程度也增加了许多。从数理统计上讲,结构方程模型的一般形式可以用下面普遍接受的特定方程和图来表示。方程和图中的希腊字母都有其特定涵意,被普遍使用于常用的统计软件中(如,SAS, SPSS,LISREL,MPLUS)。不能随意改动,否则就会造成混乱。弄清这些 希腊字母的涵意及相互关系会有助于文献阅读,编写计算程序和理解结构方程模型分析的计算结果。
简单说明:
在结构方程模型分析中,一般用圆形或椭圆形代表隐变量,矩形表示显变量。如上图中,“h”和“x”都是隐变量,V and Y 都是显变量。单向箭头表示因果关系,双向 箭头表示相关关系。比如,Y3和h2 可以用方程表示为:Y3=h2+e。 换句话说 h2这一 隐变量的一部分是通过Y3表现出来的。假设,我国每年的高考是为了测定学生的智力和知识。我们可以把智力和知识看作两个不能直接测量的隐变量(h1和h2),尽管我们没有办法去直接测量一个学生的智力和知识,但我们相信智力和知识在某种程度上可分别在算术,语文,物理,化学,历史,地理,英语等考试中表现出来。所以,从逻辑上讲,是隐变量预测显变量而不是其相反。另外,值得指出的是以上的结构方程模型的并列方程和图形表示是一般形式。实际上,h和x中的某些项也同样可以是显变量。在这种情况下,从概念上讲隐变量只通过一个显变量表现出来,那也就是说显变量本身。当方程中的所以隐变量h和x都被显变量代替时,结构方程模型就转化成其特殊形式:通经分析。
下面就结构方程模型中出现的希腊字母作一简单说明。
x:表示外源性隐变量,因为它不被任何其它变量所预测,也就是说没有任何单向箭头指向x。
h:表示内源性隐变量,因为相对外源性隐变量而言,h是应变量,有单向箭头指向它。