可决系数、确定性系数、确定性系数法、确实性因子分析
第四节
确定性系数和相关系数
线性回归预测是通过一组统计观测数据确定最优拟合线性关系,但我们需要对这种关系拟合的效果好坏进行评判,这种评判通常称为模型检验。评判的结论将直接影响人们对线性回归模型的信任程度,从而也影响对预测结果的信任程度。评判的标准主要是拟合的误差,如果拟合误差比较小,拟合效果就好,预测结果的信任程度就高。如果拟合误差较大,拟合效果就不太好,严重时还必须重新考察历史数据、选择变量,再重新拟合。为了评判误差产生程度,我们介绍两个基本定量评判指标。
1.确定性系数
如果因变量的一组统计观测数据y i(i=0,1,…,n)的平方值为y¯,所有统计观测数据值都分布在这个均值的上下,我们可以求出其总的误差平方和S总。计算公式为:
(4.4.11) 如果通过线性回归模型拟合的值为y^i,那么可以求出回归的误差平方和
S回。计算公式为:
(4.4.12) 可以认为回归的误差平方和S回是S总的一部分,也就是说回归模型部分解释了实际观测值对均值的偏离,而剩余部分为S剩,即
(4.4.13) 因此可以解释同时也可以写成
S总=S回+S剩 显然,回归模型拟合较好,则总的误差平方和S总越能够用回归的误差平方和S回来表示,模型所描述的线性关系就越准确。所以,我们定义确定性系数为回归的误差平方和占总误差平方和的比例,即
R=S回/S总 (4.4.14) 可以看出,R的值在0~1之间,如果R的值接近1,说明实际数据对均值的绝大部分都可以由回归明显来解释,模型的拟合效果就越好;如果R的值接近零,说明实际数据对均值的绝大部分都不能由回归明显来解释,即模型拟合得不好。

加载中…