8.2一元线性回归模型及其应用教学建议

标签:
图片教育文化财经it |
分类: 教育理论 |
8.2一元线性回归模型及其应用教学建议
重点:一元线性回归模型的含义,最小二乘估计的原理与方法,残差分析。
难点:一元线性回归模型参数最小二乘估计的推导,解释预测值的含义,理解刻画模型拟合效果的指标。
本节要研究在相关较强的情况下,如何刻画它们之间的具体关系。
首先通过与函数模型的比较,引入刻画两个变量之间随机关系的一元线性回归模型,然后用最小二乘法估计模型的参数得到经验回归方程,再利用经验回归方程模型进行预测,为了评价和改进模型,还引入残差和残差图,通过对不同模型拟合效果的比较,培养学生的数据分析素养。
分析发现,儿子身高与父亲身高之间不满足函数关系 ,需要引入新的模型刻画两者关系,发现成对数据对应的散点大致在一条直线附近的特点,在一次函数基础上,通过引入随机误差项,建立刻画两个变量之间随机关系的一元线性回归模型。
分析发现,儿子身高与父亲身高之间不满足函数关系 ,需要引入新的模型刻画两者关系,发现成对数据对应的散点大致在一条直线附近的特点,在一次函数基础上,通过引入随机误差项,建立刻画两个变量之间随机关系的一元线性回归模型。
任何统计模型都有一定的假设条件,搞清楚模型的假设才能真正理解模型的含义。无论解释变量取什么值,随机误差的均值和方差都是确定的值。
如果散点图中的散点是在某个函数曲线附近,而不是所有的点都在曲线上,则可用回归模型刻画,特别地,如果散点图中的点是在一条直线附近,则可用一元线性回归模型刻画。
随机误差项是一元线性回归模型不同于一次函数的关键。在多数实际问题中,随机误差的分布近似服从正态分布。为了模型的简单,将影响响应变量的因素都放在随机误差中。随机误差可能是正的,也可能为负的,多次观测出现的正负误差会相互抵消,因为可以假设其期望为0,不然,如果为一个不为0的常数,则可将其合并到截距项中,否则模型无法识别,即参数没有唯一解,实际上,在统计建模中也不希望模型有系统误差,即模型不存在非随机性误差。
影响儿子身高的因素有很多,该问题更适合建立多元线性模型加以刻画,用一元线性回归模型刻画是一种简化处理。事实上,用父母两个人的身高预测儿子的身高更好,这就是模型的不断改进。能建立什么样的模型,与我们掌握的工具和数据有关,不存在模型对错的问题,只是哪个模型更好的问题。
解释变量是非随机的,通常用小写字母表示,响应变量是随机的,通常用大写字母表示,个体的成对观测值均用小写字母表示,用下标表示观测序号,随机误差是随机的,但仍用习惯小写字母e表示。
在大量实际问题中,需要研究的两个变量不一定都是呈现线性相关关系,它们之间可能呈现指数相关或对数相关等非线性相关关系。在某些情况下,可以借助于一元线性回归模型研究呈现非线性相关的两个变量之间的关系。
有统计学家曾说“所有的模型都是错误的,但其中有些是用的”。对于实际问题,没有知道真实模型是什么,统计方法就是寻找有用的模型。对于能力强的学生,可以鼓励他们尝试不同的统计模型。




