加载中…
个人资料
nativiti
nativiti
  • 博客等级:
  • 博客积分:0
  • 博客访问:2,097
  • 关注人气:0
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

用R检验多重共线性

(2013-11-19 23:00:55)
标签:

r语言

多元回归

多重共线性的检验有三种方法:

一、方差膨胀因子法

R的底层里面没有计算方差膨胀因子的函数,car包提供了vif函数,可以计算方差膨胀因子。

 

>library(car)

> vif(cz.lm)

         x1          x2          x3          x4          x5

 319.484477 2636.564359  479.287849   27.177337 1860.726476

         x6

   1.742651

用此方法可以选择剔除不重要的自变量,减小多重共线性。

选择剔除vif值最大的自变量,然后重新回归,对得到的结果再计算方差膨胀因子,若有大于10的,继续剔除,一直到所有自变量的vif值都小于10为止。

本模型最终得到的结果为:

 

> summary(cz.new)

 

Call:

lm(formula = y ~ x3 + x4 + x6, data = cz)

 

Residuals:

    Min      1Q  Median      3Q     Max

-628.52 -109.40   -0.69  165.52  913.37

 

Coefficients:

              Estimate Std. Error t value Pr(>|t|)   

(Intercept) -2.296e+03  1.870e+03  -1.228    0.236   

x3           1.359e+00  9.681e-02  14.036 8.84e-11 ***

x4           3.143e-02  1.906e-02   1.649    0.117   

x6           3.702e-03  1.446e-02   0.256    0.801   

---

Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

 

Residual standard error: 369.8 on 17 degrees of freedom

Multiple R-squared:  0.983,     Adjusted R-squared:   0.98

F-statistic: 328.2 on 3 and 17 DF,  p-value: 3.055e-15

二、特征根判定法

R语言可以用特征根判定法检验多重共线性。

首先用cor函数处理自变量矩阵,cor的作用是计算相关矩阵。

> XX<-cor(cz[1:6])#G的第3到第6列是自变量

> XX

          x1        x2        x3        x4        x5        x6

x1 1.0000000 0.9943469 0.9918490 0.9089353 0.9969116 0.5062195

x2 0.9943469 1.0000000 0.9988077 0.8714654 0.9989010 0.5018967

x3 0.9918490 0.9988077 1.0000000 0.8666741 0.9972551 0.4943296

x4 0.9089353 0.8714654 0.8666741 1.0000000 0.8904046 0.5714781

x5 0.9969116 0.9989010 0.9972551 0.8904046 1.0000000 0.5113394

x6 0.5062195 0.5018967 0.4943296 0.5714781 0.5113394 1.0000000

然后用kappa函数计算XX矩阵的条件数

> kappa(XX,exact=T)

[1] 11735.48

多重共线性的判别:

k<100

多重共线性程度很小

100<=k<=1000

中等程度或较强的多重共线性

k>=1000

存在严重的多重共线性

根据这个标准,上面的自变量之间存在严重的多重共线性。

三、直观判定法

附:本文使用的数据:

 

x1

x2

x3

x4

x5

x6

y

1018.4

1607

138.2

96259

2239.1

50760

1132.26

1258.9

1769.7

143.8

97542

2619.4

39370

1146.38

1359.4

1996.5

195.5

98705

2976.1

44530

1159.93

1545.6

2048.4

207.1

100072

3309.1

39790

1175.79

1761.6

2162.3

220.7

101654

3637.9

33130

1212.33

1960.8

2375.6

270.6

103008

4020.5

34710

1366.95

2295.5

2789

316.7

104357

4694.5

31890

1642.86

2541.6

3448.7

417.9

105851

5773

44370

2004.82

2763.9

3967

525.7

107507

6542

47140

2122.01

3204.3

4585.8

665.8

109300

7451.2

42090

2199.35

3831

5777.2

810

111026

9360.1

50870

2357.24

4228

6484

794

112704

10556.5

46990

2664.9

5017

6858

859.4

114333

11365.2

38470

2937.1

5288.6

8087.1

1015.1

115823

13145.9

55470

3149.48

5800

10284.5

1415

117171

15952.1

51330

3483.37

6882.1

14143.8

2284.7

118517

20182.1

48830

4348.95

9457.2

19359.6

3012.6

119850

26796

55040

5218.1

11993

24718.3

3819.6

121121

33635

45821

6242.2

13844.2

29082.6

4530.5

122389

40003.9

46989

7407.99

14211.2

32412.1

4810.6

123626

43579.4

53429

8651.14

14599.6

33429.8

5262

124810

46405.9

50145

9875.95


0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有