加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

偏相关分析

(2018-09-02 14:09:25)
标签:

杂谈

分类: 统计

    相关分析能够检验两个变量的相关程度,并通过相关系数的正负号判断相关的方向。但是在现实研究中,变量之间的相互影响往往涉及更深层次的因素。相关分析中往往因为第三变量的影响或作用,使得相关系数不能真实地反映两个变量之间的线性相关程度,这样也决定了二元变量的相关分析的不精确性。偏相关分析就是在研究两个变量之间的线性相关系时控制可能对其产生影响的变量。

   地理系统是一种多要素的复杂巨系统,其中一个要素的变化必然影响到其他各因素的变化,在多要素所构成的地理系统中,当我们研究某一个要素对另一个要素的影响或相关程度时,把其他要素的影响视为常数,即暂不考虑其他要素的影响,而单独研究那两个要素之间的相互关系的密切程度时,称为偏相关。

     偏相关分析是相关分析中的重要部分,它主要用在当控制了一个或几个变量的影响下两变量间的相关性根据观测资料应用偏相关分析计算偏相关系数,可以判断哪些自变量对因变量的影响较大,而选择作为必须考虑的自变量,至于哪些对因变量影响较小的自变量,则可舍去不顾。这样在多元回归分析时,只要保留起主要作用的自变量,用较少的自变量描述因变量的平均变动量。偏相关分析计算的仍是两个变量之间的相关程度,但是相关系数排除了第三方变量效应之后的效应值。第三方变量在spss中称为控制变量,也可以是多个变量。偏相关分析的过程平衡了控制变量对两个分析变量的影响,最终的目的是检验偏相关系数在总体范围内是否为0,偏相关分析在理解检验变量和控制变量之间的关系时,通常有两种解释或模型,一种是共同作用假设,另一种是中介变量假设。

在共同作用假设模型中,两变量相关显著的原因在于它们都受同一变量的影响。如果这个起共同作用的变量不存在,即排除共同变量作用的效应则两个分析变量的相关系数应为0.

中介变量假设模型中,两个变量相关显著的原因在于变量A通过中介变量影响了变量B,排除中介变量的影响后,两变量的相关系数应为0

1.前提假设

   a.多元正态分布

      参与分析的变量集符合多元正态分布,即一方面在不考虑其他变量的情况下,每个变量都符合正态分布,另一方面每个变量在其他变量的变量值的任一组合上都符合正态分布。当多元正态分布的假设满足,变量之间的关系肯定是线性的,当该假设不成立时,变量之间可能存在非线性关系,在偏相关分析之前,可以通过散点图来检验变量之间是否存在非线性关系

  b.样本独立性  样本来自总体的随机样本,且被试之间必须相互独立。

2.运行

   analyze-correlate -partial

spss中有这么一个选项:Zero-order correlations 复选项要求显示零阶相关矩阵,即Pearson 相关矩阵

http://s5/bmiddle/001mzfOXzy7Dgc2Nz6sb4&690

下标点后面的数字表示在计算偏相关系数时,保持不变量。上式表示的是三个偏相关系数,称为一级偏相关系数若有四个要素,则有六个偏相关系数,则称他们为二级偏相关系数。

http://s14/bmiddle/001mzfOXzy7Dgc6P6jz9d&690

偏相关系数的检验

http://s4/bmiddle/001mzfOXzy7Dgc92RXBc3&690

  偏相关系数采用t检验,n是样本量,m是自变量,或者说是总变量个数-1,同时也可以理解为

http://s6/bmiddle/001mzfOXzy7Dgc6pNDDf5&690

总体中扣除q个变量影响的偏相关系数为r,q=m-1

计算出的t值如果大于t检验表中的值,即可说明相关显著

查表时所用的自由度就是n-m-1或n-q-2

对于相关分析时,自由度为n-2,也可以理解为自变量为1,控制变量为0

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有