加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

结构方程模型(SEM)分析简介 (2)

(2014-09-02 09:22:22)
分类: 流行病学

部分结果:

和其它软件一样,SAS的分析结果报告包括以下三部份:1) 数据本身的统计描述,2) 模型拟合报告,3)参数估计及统计检验。由于该分析是在相关系数基础上进行的,模型拟合报告部份基本无意义。另外鉴于篇幅所限,这里只提供参数估计的一部份。但是,有兴趣的读者可根据本章提供的方法结合作者提供的参考文献作进一步探索。

 

 

(1) 预测回归系数聚阵

 

                                      The CALIS Procedure

                  Covariance Structure Analysis: Maximum Likelihood Estimation 

 

 

                                Levenberg-Marquardt Optimization

 

                                 Scaling Update of More (1978)

 

                            Parameter Estimates                   20

                            Functions (Observations)              21

 

 

                                     Predicted Model Matrix

 

                     V1           V2           V3           V4           V5           V6

 

        V1       1.0000       0.1700       0.5700       0.0200       0.1000       0.1800

        V2       0.1700       1.0000       0.3900      -0.0300      -0.1300      -0.0411

        V3       0.5700       0.3900       1.0000       0.1100       0.2200       0.0500

        V4       0.0200      -0.0300       0.1100       1.0000       0.2800       0.1500

        V5       0.1000      -0.1300       0.2200       0.2800       1.0000       0.2100

        V6       0.1800      -0.0411       0.0500       0.1500       0.2100       1.0000

 

 

 (2) 模型拟和报告

                                        

 

                                      The CALIS Procedure                        

                  Covariance Structure Analysis: Maximum Likelihood Estimation

 

                  Fit Function                                          0.0006

                  Goodness of Fit Index (GFI)                           0.9998

                  GFI Adjusted for Degrees of Freedom (AGFI)            0.9957

                  Root Mean Square Residual (RMR)                       0.0046

                  Parsimonious GFI (Mulaik, 1989)                       0.0667

                  Chi-Square                                            0.2274

                  Chi-Square DF                                              1

                  Pr > Chi-Square                                       0.6335

                  Independence Model Chi-Square                         316.40

                  Independence Model Chi-Square DF                          15

                  RMSEA Estimate                                        0.0000

                  RMSEA 90% Lower Confidence Limit                           .

                  RMSEA 90% Upper Confidence Limit                      0.1078

                  ECVI Estimate                                         0.1111

                  ECVI 90% Lower Confidence Limit                            .

                  ECVI 90% Upper Confidence Limit                       0.1250

                  Probability of Close Fit                              0.7610

                  Bentler's Comparative Fit Index                       1.0000

                  Normal Theory Reweighted LS Chi-Square                0.2273

                  Akaike's Information Criterion                       -1.7726

                  Bozdogan's (1987) CAIC                               -6.6861

                  Schwarz's Bayesian Criterion                         -5.6861

                  McDonald's (1989) Centrality                          1.0010

                  Bentler & Bonett's (1980) Non-normed Index            1.0385

                  Bentler & Bonett's (1980) NFI                         0.9993

                  James, Mulaik, & Brett (1982) Parsimonious NFI        0.0666

                  Z-Test of Wilson & Hilferty (1931)                   -0.3552

                  Bollen (1986) Normed Index Rho1                       0.9892

                  Bollen (1988) Non-normed Index Delta2                 1.0024

                  Hoelter's (1983) Critical N                             6236

 

                  

  (3)残差聚阵       

 

                                      The CALIS Procedure

                  Covariance Structure Analysis: Maximum Likelihood Estimation

 

                                        Residual Matrix

 

                             V1       V2       V3       V4       V5       V6

 

                    V1  0.00000  0.00000  0.00000  0.00000  0.00000  0.00000

                    V2  0.00000  0.00000  0.00000  0.00000  0.00000  0.02108

                    V3  0.00000  0.00000  0.00000  0.00000  0.00000  0.00000

                    V4  0.00000  0.00000  0.00000  0.00000  0.00000  0.00000

                    V5  0.00000  0.00000  0.00000  0.00000  0.00000  0.00000

                    V6  0.00000  0.02108  0.00000  0.00000  0.00000  0.00000

 

                    Average Absolute Residual                       0.001004

                    Average Off-diagonal Absolute Residual          0.001405

 

 

                              Rank Order of the 1 Largest Residuals

 

                               Row         Column        Residual

 

                               V6          V2             0.02108

 

 

  (4) 参数估计和统计检验

 

                                      The CALIS Procedure

                  Covariance Structure Analysis: Maximum Likelihood Estimation

 

                                  Manifest Variable Equations

 

 

      V4      =  -0.0702*V1       + -0.0903*V2       +  0.1853*V3       +  1.0000 E3

      Std Err     0.0628 PV4V1       0.0561 PV4V2       0.0672 PV4V3

      t Value    -1.1183            -1.6112             2.7558

 

 

 

 

 

      V5      =   0.2397*V4       + -0.0408*V1       + -0.2364*V2       +  0.3091*V3

      Std Err     0.0482 PV5V4       0.0582 PV5V1       0.0521 PV5V2       0.0629 PV5V3

      t Value     4.9749            -0.7001            -4.5407             4.9165

 

                                       +  1.0000 E2

 

 

 

      V6      =   0.1083*V4       +  0.1864*V5       +  0.2383*V1       + -0.1387*V3

      Std Err     0.0518 PV6V4       0.0527 PV6V5       0.0605 PV6V1       0.0618 PV6V3

      t Value     2.0904             3.5332             3.9392            -2.2457

 

                                       +  1.0000 E1

 

 

 

 

                               Variances of Exogenous Variables

 

                                                         Standard

                   Variable Parameter      Estimate         Error    t Value

 

                   V1       VARV1           1.00000       0.07362      13.58

                   V2       VARV2           1.00000       0.07362      13.58

                   V3       VARV3           1.00000       0.07362      13.58

                   E1       VARE1           0.90866       0.06690      13.58

                   E2       VARE2           0.83822       0.06171      13.58

                   E3       VARE3           0.97832       0.07202      13.58

 

 

                             Covariances Among Exogenous Variables

                                                          Standard

                   Var1 Var2 Parameter      Estimate         Error    t Value

 

                   V1   V2   CV1V2           0.17000       0.05280       3.22

                   V1   V3   CV1V3           0.57000       0.05992       9.51

                   V2   V3   CV2V3           0.39000       0.05588       6.98

 

  (5) 表准化系数

 

                                      The CALIS Procedure

                  Covariance Structure Analysis: Maximum Likelihood Estimation

 

                            Equations with Standardized Coefficients

 

 

    V4      =  -0.0702*V1    + -0.0903*V2    +  0.1853*V3    +  0.9891 E3

                       PV4V1           PV4V2           PV4V3

    V5      =   0.2397*V4    + -0.0408*V1    + -0.2364*V2    +  0.3091*V3    +  0.9155 E2

                       PV5V4           PV5V1           PV5V2           PV5V3

    V6      =   0.1083*V4    +  0.1864*V5    +  0.2383*V1    + -0.1387*V3    +  0.9532 E1

                       PV6V4           PV6V5           PV6V1           PV6V3

 

 

 (6) 模型改进报告

 

                                 Squared Multiple Correlations

 

                                             Error         Total

                            Variable      Variance      Variance    R-Square

 

                       1    V4             0.97832       1.00000      0.0217

                       2    V5             0.83822       1.00000      0.1618

                       3    V6             0.90866       1.00000      0.0913

 

 

                             Correlations Among Exogenous Variables

 

                               Var1 Var2 Parameter      Estimate

 

                               V1   V2   CV1V2           0.17000

                               V1   V3   CV1V3           0.57000

                               V2   V3   CV2V3           0.39000

 

                      Total Effects of Exogenous on Endogenous Variables

 

                           V1           V2           V3           V5           V4

 

              V4      -.07025      -.09031      0.18526      0.00000      0.00000

              V5      -.05762      -.25807      0.35349      0.00000      0.23972

              V6      0.21993      -.05788      -.05279      0.18637      0.15299

 

                     Indirect Effects of Exogenous on Endogenous Variables

 

                           V1           V2           V3           V5           V4

 

              V4      0.00000      0.00000      0.00000            0      0.00000

              V5      -.01684      -.02165      0.04441            0      0.00000

              V6      -.01835      -.05788      0.08594            0      0.04468

                                  

                 

                   Rank Order of the 1 Largest Lagrange Multipliers in _GAMMA_

 

                                                   Lagrange        Pr >

                         Row         Column      Multiplier    Lagrange

 

                         V6          V2             0.22728      0.6335

 

 

  Stepwise Multivariate Wald Test

 

          ------Cumulative Statistics-----    --Univariate Increment--

    Parameter  Chi-Square   DF    Pr > ChiSq  Chi-Square    Pr > ChiSq

 

       PV5V1    0.49012       1   0.4839       0.49012        0.4839

       PV4V1    1.74062       2   0.4188       1.25049        0.2635

       PV4V2    4.10467       3   0.2504       2.36405        0.1242

 

 

 

 

 

部分解释:

当我们用SAS进行结构方程分析时,得到很多的结果报告。由于篇幅所限,这里只选择主要的部份作一简单的讲解。读者可以跟据我们提供的程序及数据自己产生全部结果。结果的第一和第三部份分别是模型预测回归系数聚阵和残差聚阵。从这一结果来看模型的预测指和观察值几乎一致,因此参差聚阵除了V2-V6项以外几乎都为0。本模型 的模拟程度高的主要原因是数据的变量数少而参数相对多造成。用前面介绍的公式,可知此模型的自由度为1,因此是充份识别模型。因为,p=q=3, t=通经系数+方差数(STD)+协方差数(CV)=11+6+3=20,所以 d.f=(3+3)(3+4)/2-20=1。 由于本研究数据相关系数聚阵显示,体育锻炼和舒张压的相关系数非常弱(r=-0.02),因此这一同经未反映在数据分析中。

 

SAS输出结果的二部份表明,该模型的拟合也比较满意(请参看1.5小节)。总的来讲,本模型的模拟程度比较满意。结果的第四部份显示,多数参数估计值的t-检验都呈现显著性(单侧t-检验的显著性界值为1.64) 。年龄(V1),吸烟(V3)BMI(V4)及血胆固醇(V5)都对舒张压有显著性的直接影响。但正如我们在前面所讲的,出了和其它分析法一样检查预测变量的直接作用,结构方程模型的重要优点之一就是它还可以检查变量的间接作用。在表1.1中我们跟据,本分析所得到通经系数,较详细探讨了变量间直接和间接作用。

 

 

从上面的结果可见,SAS提供非标准化和标准化两组参数估计。通常这两组值是不一样的。但由于在本事例中我们使用的数据是标准化相关阵,因此两组参数估计值是相同的。另外,SAS还结果提供了每个非标准化参数的T检验值,此统计检验也同样适应于标准化参数。由于标准化参数不受原始测量单位的影响,各参数之间可以直接比较。细心的读者可能已注意到,SAS结果中提供的外源变量(X1-X3)协方差估计值(CX1X2CX1X3CX2X3)同它们之间的相关系数相同。这是因为,标准化的相关系数就是协方

差。如表1.3和图1.3所示一个外源性变量对内源性变量的影响包含直接和间接作用。比如在本研究中BMI对收缩压的直接影响为0.1083,BMI还可以通过影响血胆固醇水平而影响舒张压,结构方程模型(SEM)分析简介 <wbr>(2)。所以BMI对舒张压总的影响为0.1833+0.0447=0.153

 

 

结果的第六部份的开始给出了,模型的预测效果。由于本模型是由三个并列方程组成,因此有三个R2值,它们分别为2%16%9%。另外由于我们在SAS程序中要求了变量作用总结(PROC CALIS 命令里的”toteff”), SAS结果分别给出了变量间影响的 间接作用和总作用。这和我们表1.3中计算的结果是一致的。一般来讲,一个复杂的模型要经过多次的调整和修改。结果的结尾部份,模型修改参数,LagrangeWald统计 11Lagrange是指,在现有的模型基础上增加某一特定通经参数模型拟合度改 进的程度;Wald指是指在现有模型基础上去掉某一个统计系数(也就是不在估计从参数或使其为0)模型拟合变化情况。LagrangeWald都是用卡方值来横量的。 本结果显示,如果估计V2(体育锻炼)V6(舒张压)的影响,也就是说估计参数PV6V2,模型现有的c2值会降低0.227。很明显,模型不会有显著的改善。可是如果,我们从模型中除掉参数PV5V1(年龄对血脂的影响),模型的c2只会增加0.49,因此对模型不会有很大的影响。因此有理由不估计参数PV5V1。读者可以,自己试探着修改以下我们提供的模模型。我们需要指出的是,当理论模型复杂时修改和选择一个满意的统计模型是一件很难的事。研究人员一定要结合专业知识和统计结果作总和考虑。


 

 

结构方程模型(SEM)分析简介 <wbr>(2)


表1.2

 

 

内源性变量

 

预测变量

             

直接作用                       间接作用           总作用                                                                                       

                通过X4    通过X5     

                                                            

V6

舒张压

V1 年龄

0.2383

-0.0107

-0.0076

0.220

 

V2 体育锻炼

-

-0.0138

-0.0441

-0.058

 

V3 吸烟

-0.1387

0.0283

0.0576

-0.053

 

V4 (BMI)

0.1083

-

0.0447

0.153

 

V5 胆固醇

0.1864

 

0

0

0.186

V5

胆固醇

V1

-0.0408

-0.0168

-

-0.058

 

V2

-0.2364

-0.0216

-

-0.258

 

V3

0.3091

0.044

-

0.353

 

V4

0.2397

 

 

 

0.240

V4

BMI

V1

-0.0702

-

-

-0.070

 

V2

-0.0903

-

-

-0.090

 

V3

0.1853

-

-

0.185

 

 

 

 

 

 

 

1.3 结构方程模型分析

如前所述,结构方程模型分析是通经分析的扩展,通经分析是结构方程模型分析的特殊形式。尽管理论基础相似,但当结构方程模型分析含隐变量时,其复杂程度也增加了许多。从数理统计上讲,结构方程模型的一般形式可以用下面普遍接受的特定方程和图来表示。方程和图中的希腊字母都有其特定涵意,被普遍使用于常用的统计软件中(如,SAS, SPSS,LISREL,MPLUS)。不能随意改动,否则就会造成混乱。弄清这些 希腊字母的涵意及相互关系会有助于文献阅读,编写计算程序和理解结构方程模型分析的计算结果。


 

 

结构方程模型(SEM)分析简介 <wbr>(2)

 

 

 

结构方程模型(SEM)分析简介 <wbr>(2)

 

     图1.5 结构方程模型的通用图形表达


简单说明:

在结构方程模型分析中,一般用圆形或椭圆形代表隐变量,矩形表示显变量。如上图中,“h”和“x”都是隐变量,V and Y 都是显变量。单向箭头表示因果关系,双向 箭头表示相关关系。比如,Y3h2 可以用方程表示为:Y3=h2+e。 换句话说 h2这一 隐变量的一部分是通过Y3表现出来的。假设,我国每年的高考是为了测定学生的智力和知识。我们可以把智力和知识看作两个不能直接测量的隐变量(h1h2),尽管我们没有办法去直接测量一个学生的智力和知识,但我们相信智力和知识在某种程度上可分别在算术,语文,物理,化学,历史,地理,英语等考试中表现出来。所以,从逻辑上讲,是隐变量预测显变量而不是其相反。另外,值得指出的是以上的结构方程模型的并列方程和图形表示是一般形式。实际上,hx中的某些项也同样可以是显变量。在这种情况下,从概念上讲隐变量只通过一个显变量表现出来,那也就是说显变量本身。当方程中的所以隐变量hx都被显变量代替时,结构方程模型就转化成其特殊形式:通经分析。

 

下面就结构方程模型出现的希腊字母作一简单说明。

 

x:表示外源性隐变量,因为它不被任何其它变量所预测,也就是说没有任何单向箭头指向x

h:表示内源性隐变量,因为相对外源性隐变量而言,h是应变量,有单向箭头指向它。

 

 

 

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有