FRM（8）回归分析_CrewsQi

若http://web.nuist.edu.cn/courses/tjx/zhang09/j0906/d0906011/t090601103.gif不具有常数方差,称模型存在异方差性。此时,残差如图9－7所示，数据点呈现发散或收敛趋势。在此种情况下,最小二乘法失效,因此需按照一定方法对数据进行变换,在计量经济学课程中,对此有详细讲述。

http://web.nuist.edu.cn/courses/tjx/zhang06/j0601/d0601011/t090601104.gif

图9-7 误差项具有异方差性的残差图

9.6.2 误差项的自相关性检验

如果观测值是来自一个时间序列的样本,则很可能出现误差项http://web.nuist.edu.cn/courses/tjx/zhang09/j0906/d0906011/t090601105.gif是不独立的,将残差e_t与时间t作残差图,将呈现出有规则的变化趋势。

http://web.nuist.edu.cn/courses/tjx/zhang06/j0601/d0601011/t090601106.gif

图9-8 误差项具有负自相关性的残差图

http://web.nuist.edu.cn/courses/tjx/zhang06/j0601/d0601011/t090601107.gif

图9-9 误差项具有正自相关性的残差图

我们称模型存在自相关(Autocorrelation)现象，也需按一定方法对数据进行修正，这在计量经济学课程中也有详细论述。

9.7 E(Y)的区间估计

9.5.1 b₁的抽样分布

为了检验β₁=0是否成立，需要构造一个合适的统计量，因此，首先讨论b₁的抽样分布。

因为b₁具有线性特性，即b₁是观测值Y_i的线性组合，而Y_i是正态分布的随机变量，且相互独立，故b₁也是服从正态分布的随机变量。

又因b₁具有无偏性，即其均值E（b₁）=β₁。

http://web.nuist.edu.cn/courses/tjx/zhang09/j0905/d0905011/t090501101.gif （9-13）

因为http://web.nuist.edu.cn/courses/tjx/zhang09/j0905/d0905011/t090501103.gif

http://web.nuist.edu.cn/courses/tjx/zhang09/j0905/d0905011/t090501104.gif

所以，b₁是服从http://web.nuist.edu.cn/courses/tjx/zhang09/j0905/d0905011/t090501105.gif的随机变量。

9.5.2 F 检验

在一元线性回归中，为了检验Y对于X线性关系的统计显著性，对β₁进行F检验的步骤为：

(1) 提出假设：H₀：β₁=0，H₁：β₁≠0。

(2) 构造并计算统计量：

http://web.nuist.edu.cn/courses/tjx/zhang09/j0905/d0905011/t090501106.gif （9-14）

(3) 查F分布临界值表，得临界值http://web.nuist.edu.cn/courses/tjx/zhang09/j0905/d0905011/t090501107.gif

(4) 比较：若F<http://web.nuist.edu.cn/courses/tjx/zhang09/j0905/d0905011/t090501108.gif接受H₀，认为Y与X不存在一元线性关系。

表9-1 方差分析表

变差来源	平方和	自由度	均方差	F比
回归	http://web.nuist.edu.cn/courses/tjx/zhang09/j0905/d0905011/t090501109.gif	1	http://web.nuist.edu.cn/courses/tjx/zhang09/j0905/d0905011/t090501110.gif	http://web.nuist.edu.cn/courses/tjx/zhang09/j0905/d0905011/t090501111.gif
误差	http://web.nuist.edu.cn/courses/tjx/zhang09/j0905/d0905011/t090501112.gif	n-2	http://web.nuist.edu.cn/courses/tjx/zhang09/j0905/d0905011/t090501113.gif
总和	http://web.nuist.edu.cn/courses/tjx/zhang09/j0905/d0905011/t090501114.gif	n-1	———-	———-

若F>http://web.nuist.edu.cn/courses/tjx/zhang09/j0905/d0905011/t090501115.gif拒绝H₀，认为Y与X存在一元线性关系。

将各部分计算结果集中列于方差分析表内,如表9－1所示

9.5.3t检验

t检验的步骤为：

(1) 提出假设

H₀: http://web.nuist.edu.cn/courses/tjx/zhang09/j0905/d0905011/t090501116.gif

H₁: http://web.nuist.edu.cn/courses/tjx/zhang09/j0905/d0905011/t090501117.gif

(2) 构造并计算统计量:

http://web.nuist.edu.cn/courses/tjx/zhang09/j0905/d0905011/t090501119.gif （9-15）

其中http://web.nuist.edu.cn/courses/tjx/zhang09/j0905/d0905011/t090501120.gif

(3) 查t分布临界值表,得临界值 http://web.nuist.edu.cn/courses/tjx/zhang09/j0905/d0905011/t090501121.gif

(4) 比较:

若http://web.nuist.edu.cn/courses/tjx/zhang09/j0905/d0905011/t090501123.gif, 接受H₀

若http://web.nuist.edu.cn/courses/tjx/zhang09/j0905/d0905011/t090501125.gif, 拒绝H₀

9.5.4利用样本相关系数进行统计检验

利用样本相关系数进行统计检验的步骤为：

(1)提出假设

H₀: http://web.nuist.edu.cn/courses/tjx/zhang09/j0905/d0905011/t090501126.gif

H₁: http://web.nuist.edu.cn/courses/tjx/zhang09/j0905/d0905011/t090501129.gif:为总体Y与X的线性相关系数)

(3) 查相关系数临界值表,得临界值 http://web.nuist.edu.cn/courses/tjx/zhang09/j0905/d0905011/t090501131.gif

(4) 比较:

若http://web.nuist.edu.cn/courses/tjx/zhang09/j0905/d0905011/t090501133.gif, 接受H₀

若http://web.nuist.edu.cn/courses/tjx/zhang09/j0905/d0905011/t090501135.gif, 拒绝H₀

因为误差项http://web.nuist.edu.cn/courses/tjx/zhang09/j0907/d0907011/t090701106.gif。

http://web.nuist.edu.cn/courses/tjx/zhang09/j0907/d0907011/t090701107.gif （9-16）

可以证明，对于一元线性模型，以下随机变量

http://web.nuist.edu.cn/courses/tjx/zhang09/j0907/d0907011/t090701108.gif （9-17）

服从自由度为n-2的t分布。因此可以得到，在置信度为1-α时，E(Y₀)的置信区间为

http://web.nuist.edu.cn/courses/tjx/zhang09/j0907/d0907011/t090701109.gif （9-18）

其中：http://web.nuist.edu.cn/courses/tjx/zhang09/j0907/d0907011/t090701110.gif （9-19）

9.8 因变量Y的预测

设：http://web.nuist.edu.cn/courses/tjx/zhang09/j0908/d0908011/t090801101.gif

因为http://web.nuist.edu.cn/courses/tjx/zhang09/j0908/d0908011/t090801104.gif也是相互独立的，所以有：

http://web.nuist.edu.cn/courses/tjx/zhang09/j0908/d0908011/t090801105.gif （9-20）

http://web.nuist.edu.cn/courses/tjx/zhang09/j0908/d0908011/t090801109.gif。

http://web.nuist.edu.cn/courses/tjx/zhang09/j0908/d0908011/t090801110.gif （9-21）

可以证明，随机变量

http://web.nuist.edu.cn/courses/tjx/zhang09/j0908/d0908011/t090801116.gif （9-22）

服从自由度为n-2的t分布。在给定置信度1-α情况下，因变量单个值Y₀的置信区间为：

http://web.nuist.edu.cn/courses/tjx/zhang09/j0908/d0908011/t090801117.gif （9-23）

这一章其实没有那么难的，我们要掌握的东西也没有那么繁杂，这里只是想给自己复习一下，其实只要知道几个公式的计算就好了，而且这些公式应该也是不需要记的，熟能生巧，时间其实不够。写几道题掌握大概的就好了

根据所得到样本数据，采用最小二乘法总是可以拟合一条直线来描述Y和X之间的关系。但是，样本资料具有随机性，因此，我们需要判断Y与X之间是否确实存在着线性关系，也就是需要判断Y对X的回归函数是否确实是一条直线。回归函数E(Y)=β₀+β₁X中，如果β₁=0，则对于X的一切水平E(Y)=β_0，说明Y的变化与X的变化无关，因而我们不能通过X去预测Y。对模型Y_i=β₀+β₁X_i+ε_i,检验β₁=0是否成立，等价于检验Y与X之间是否存在线性关系。

阅读┊ 收藏 ┊ 喜欢 ▼ ┊打印┊举报/Report

前一篇：FRM（6）some important DISTUIBUTION

后一篇：FRM（9）多元回归假设检验

新浪BLOG意见反馈留言板　欢迎批评指正