SPSS分析案例之多元线性回归【二】(转)

标签:
modeler数据分析statisticsspss |
分类: 数据分析 |
--------------------------------
1.2 回归分析
1.2.1 参数设置
1.
因变量:标准化能源消费总额;
自变量:标准化煤炭消费量、标准化焦炭消费量、标准化原油消费量、标准化原煤产量、标准化焦炭产量、标准化原油产量。
自变量方法选择:“进入”。
个案标签“使用地名”。
不使用权重最小二乘法回归分析—即WLS权重为空。
图1-7选择线性回归变量
2.
图1-8 设置回归分析统计量
3.在设置“绘制”选项的时候,我们选择绘制标准化残差图,其中的“正态概率图”是rankit图。同时还需要画出残差图,Y轴选择:ZRESID,X轴选择: ZPRED。如图1-9所示:
图1-9 设置绘制
左上框中各项的意义分别为:
·
·
·
·
·
·
·
4. 许多时候我们需要将回归分析的结果“保存”起来,然后用得到的残差、预测值等做进一步的分析,“保存”按钮就是用来存储中间结果的。可以存储的有:预测值系列、残差系列、距离(Distances)系列、预测值可信区间系列、波动统计量系列。本次实验暂时不保存任何项。
5. 设置回归分析的一些“选项”,有:步进方法标准单选钮组:设置纳入和排除标准,可按P值或F值来设置。在等式中包含常量复选框:用于决定是否在模型中包括常数项,默认选中。如图1-10所示:
图1-10
1.2.2 结果输出与分析
在以上选项设置完毕之后点击确定,SPSS将输出一系列的回归分析结果。我们来逐一贴出和分析,并根据它得到最后的回归方程以及验证回归模型。
1.
|
|||
模型 |
输入的变量 |
移去的变量 |
方法 |
1 |
Zscore(原油产量), Zscore(原煤产量), Zscore(焦炭消费量), Zscore(原油消费量), Zscore(煤炭消费量), Zscore(焦炭产量) |
. |
输入 |
模型汇总 |
|
||||
模型 |
R |
R 方 |
调整 R 方 |
标准 估计的误差 |
Sig. |
1 |
.962 |
.925 |
.905 |
.30692707 |
.000 |
表1-4 模型汇总
模型 |
平方和 |
df |
均方 |
F |
|
1 |
回归 |
25.660 |
6 |
4.277 |
45.397 |
残差 |
2.072 |
22 |
.094 |
|
|
总计 |
27.732 |
28 |
|
|
(x1为煤炭消费量,x2为焦炭消费量,x3为原油消费量,x4为原煤产量,x5为原炭产量,x6为原油产量,Y是能源消费总量)
结论:能量消费总量由主要与煤炭消费总量所影响,成正相关;与原煤产量成一定的反比。
|
||||||
模型 |
非标准化系数 |
标准系数 |
t |
Sig. |
||
B |
标准 误差 |
beta |
||||
1 |
(常量) |
.008 |
.057 |
|
.149 |
.883 |
Zscore(煤炭消费量) |
1.061 |
.126 |
1.071 |
8.432 |
.000 |
|
Zscore(焦炭消费量) |
.087 |
.101 |
.088 |
.856 |
.401 |
|
Zscore(原油消费量) |
.157 |
.085 |
.159 |
1.848 |
.078 |
|
Zscore(原煤产量) |
-.365 |
.155 |
-.372 |
-2.360 |
.028 |
|
Zscore(焦炭产量) |
-.105 |
.150 |
-.107 |
-.697 |
.493 |
|
Zscore(原油产量) |
-.017 |
.070 |
-.017 |
-.247 |
.807 |
表1-6回归方程系数
图1-11残差图
可以看出各散点随机分布在e=0为中心的横带中,证明了该模型是适合的。同时我们也发现了两个异常点,就是广东省和四川省,这种离群点是值得进一步研究的。
还有一种残差正态概率图(rankit图)可以直观地判断残差是否符合正态分布。如图1-12所示:
图1-12 rankit(P-P)图
它的直方图如图1-13所示:
图1-13 rankit(直方)图
原文:http://www.cnblogs.com/luowende2012/archive/2012/04/27/2473238.html