加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

可决系数、确定性系数、确定性系数法、确实性因子分析

(2015-11-21 16:48:02)
        可决系数与确定性系数往往可看作一回事,而确定性系数与确定性系数法一般是两回事。
        可决系数的英文表达是coefficient of determination,通常也译作确定性系数。
        据互动百科(http://www.baike.com/wiki/可决系数)称,可决系数的计算式:回归平方和(ESS)在总变差(TSS)中所占的比重称为可决系数,可决系数可以作为综合度量回归模型对样本观测值拟合优度的度量指标。可决系数越大,说明在总变差中由模型作出了解释的部分占的比重越大,模型拟合优度越好。可决系数是测定多个变量间相关关系密切程度的统计分析指标,它也是反映多个自变量对因变量的联合的影响程度。可决系数越大,自变量对因变量的解释程度越高,自变量引起的变动占总变动的百分比高。可决系数的取值范围在0到1之间,它是一个非负统计量。
        确实性系数法的英语则大相径庭了,它写作Certainty Factor。确定性因子理论 (the Theory of Certainty Factors) ,也被称为确定性因子,确定性因子方法,也有人将之译作确实性系数法。
        医学等领域的统计分析中还使用一种确定性因子分析 Confirmatory Factor Analysis)。此方法也称作验证性因子分析或实证性因子分析、证实性因子分析。 
 

第四节    线性回归分析预测方法

确定性系数和相关系数

线性回归预测是通过一组统计观测数据确定最优拟合线性关系,但我们需要对这种关系拟合的效果好坏进行评判,这种评判通常称为模型检验。评判的结论将直接影响人们对线性回归模型的信任程度,从而也影响对预测结果的信任程度。评判的标准主要是拟合的误差,如果拟合误差比较小,拟合效果就好,预测结果的信任程度就高。如果拟合误差较大,拟合效果就不太好,严重时还必须重新考察历史数据、选择变量,再重新拟合。为了评判误差产生程度,我们介绍两个基本定量评判指标。

1确定性系数

如果因变量的一组统计观测数据y i(i=0,1,…,n)的平方值为y¯,所有统计观测数据值都分布在这个均值的上下,我们可以求出其总的误差平方和S总。计算公式为:

                                             (4.4.11)

如果通过线性回归模型拟合的值为y^i,那么可以求出回归的误差平方和

S回。计算公式为:

                                              (4.4.12)

可以认为回归的误差平方和S回是S总的一部分,也就是说回归模型部分解释了实际观测值对均值的偏离,而剩余部分为S剩,即

                                        (4.4.13)

因此可以解释同时也可以写成

                         S总=S回+S剩

显然,回归模型拟合较好,则总的误差平方和S总越能够用回归的误差平方和S回来表示,模型所描述的线性关系就越准确。所以,我们定义确定性系数为回归的误差平方和占总误差平方和的比例,即

                         R=S回/S总                                (4.4.14)

可以看出,R的值在0~1之间,如果R的值接近1,说明实际数据对均值的绝大部分都可以由回归明显来解释,模型的拟合效果就越好;如果R的值接近零,说明实际数据对均值的绝大部分都不能由回归明显来解释,即模型拟合得不好。

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有