加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

判断系数r2的计算和理解

(2011-03-28 19:22:55)
标签:

统计

分类: 统计知识
判定系数 r2
  用最小平方法求得的回归直线方程 http://course.cug.edu.cn/cugFirst/statistics/neirong/15.2.h55.gif ,确定了XY的具体变动关系,
但是实际值是不是紧密分布在其两侧?其紧密程度如何?这关系到回归模型的
应用值。因此,对回归直线的拟合优度,必须加以测定。判定系数 http://course.cug.edu.cn/cugFirst/statistics/neirong/15.2.h63.gif 可用它们的离差平方和表示:
    即总偏差=回归偏差+剩余偏差 这说明在总偏差一定时,回归偏差越大,剩余偏差就越小;反之,回归偏差越小,剩余偏差就越大。由此可见,如果实际值紧密分布在回归直线两侧,剩余偏差很小,说明X和Y的依存关系很强。 当XY两变量依存关系很密切,乃至Y的变化完全由X引起,XY为确定的函数关系,剩余误差,也称未被解释的误差为零,。判定系数 http://course.cug.edu.cn/cugFirst/statistics/neirong/15.2.h65.gif 便是以回归偏差占总偏差的比率来表示回归模型拟合优度的评价指标。
  http://course.cug.edu.cn/cugFirst/statistics/neirong/15.2.h66.gif     http://course.cug.edu.cn/cugFirst/statistics/neirong/15.2.h67.gif
其计算公式为: (5.8)
     
XY不存在线性依存关系,即Y的变化与X无关,回归误差=0, r2=0;当X和Y两变量依存关系很密切,乃至Y的变化完全由X引起,X和Y为确定的函数关系,剩余误差为=0, http://course.cug.edu.cn/cugFirst/statistics/neirong/15.2.h68.gif 一般情况下, r2是在0—1之间。实际工作中,通常采用以下简捷公式:

http://course.cug.edu.cn/cugFirst/statistics/neirong/15.2.h69.gif                                       (5.9)

仍用例题2计算:

http://course.cug.edu.cn/cugFirst/statistics/neirong/15.2.h70.gif

    计算结果表明,生产成本的总误差中有85.16%可以由产量同生产成本的依存关系来解释,只有14.84%属于随机因素的影响,因此这条回归线是合适的。
    从上述关于判定系数r2意义的解释中可以看出,判定系数r2同相关系数r具有一致性。可以证明,一元线性回归的判定系数 r2的平方根就是简单线性相关的相关系数 r。上例 http://course.cug.edu.cn/cugFirst/statistics/neirong/15.2.h71.gif 这同前面用积矩相关系数公式计算的结果相同。积矩相关系数r是由协方差确定的;判定  r 开平方后有正负两个根,符号的取舍应根据回归系数b的符号来定。
    相关系数具有PRE 的性质: 减少误差比例 PRE = E1 – E2 / E 式中: E1:为不知XY有关系时,预测Y的总误差;E2为知道XY有线性相关时预测Y的总误差.所以,  PRE又称判定系数r2.

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有