加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

确定系数 R square

(2016-10-26 06:20:22)
标签:

r2

rsquare

确定系数

线性回归

分类: Research

R2称为方程的确定系数,0~1之间,越接近1,表明方程的变量对y的解释能力越强。

 

对于回归方程来说,总结了以下几个意义:

 

1R2可以作为选择不同模型的标准。如果在拟合数据之前,不能确定数据到底是什么模型,那么可以对变量的不同数学形式进行拟合,然后看R square的大小,R square大的模型,说明这个模型对数据拟合的较好。

 

2.在数据的关系存在非线性可能情况下:

 

(a)不一定R2越大拟合越好,因为R2只是回归平方和占总平方和的比例。比如,在那四幅著名的图里面,R2都等于66%,并且都是线性拟合,但是他们的数据点完全不同,有些是因为特异案例的存在,致使数据拟合出来是线性的,而事实上并非如此。所以,应该在拟合之前观察散点图,去掉特异值(outlier)。

 

(b)如果一个模型的R2很小,不一定代表数据之间没有关系,而很有可能是选择的模型不对,因为数据之间也许的其他的函数关系,比如对数关系或者指数关系。这意味着需要对数据作进一步的拟合。(当然,最好的方法应该是在数据拟合之前先观察散点图)。如果是线性模型,那么R2才是方程拟合优度的度量,R2越大,回归方程拟合数据越好,线性关系越强。

 

3.当自变量个数增加时,尽管有的自变量与y的线性关系不显著,R2也会增大。R2 受自变量个数与样本规模影响,可采用Adjusted R2进行调整。

 

4.当想确定方程中的每一个自变量对y的边际解释能力时,应该确定每个自变量的偏确定系数(partial coefficient of determination)。注意,偏确定系数反映的是新加入回归的变量所解释的百分比,而这百分比是以前一步回归所未能解释的部分为整体,而不是以y的总变化为整体。也就是说,x1x2共同解释的y的贡献,已包含在x1解释的y的贡献里面。偏确定系数的意义是,用于判断自变量的重要性。但是,在遇到虚拟变量时,计算这个的意义不大。

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有