首页 理论教育 数学方法:一元线性回归分析

数学方法:一元线性回归分析

时间:2023-11-17 理论教育 版权反馈
【摘要】:一元线性回归分析是指只有一个解释变量的线性回归模型,用于揭示被解释变量与另一个解释变量之间的线性关系。通过一元线性回归模型的建立过程,可了解回归分析的基本统计思想及它的应用原理。两个变量之间是否具有显著的线性相关关系,这需要对回归模型进行相关性检验。R检验和F检验是一元线性回归分析中常用的相关性检验方法。当回归方程经过检验是显著后,就可用来做估计和预测。

数学方法:一元线性回归分析

一元线性回归分析是指只有一个解释变量的线性回归模型,用于揭示被解释变量与另一个解释变量之间的线性关系。

一元线性回归是描述两个变量之间统计关系最简单的回归模型。通过一元线性回归模型的建立过程,可了解回归分析的基本统计思想及它的应用原理。

1. 建立模型

一元线性回归模型的基本假设如下:

为简化问题,假定X不是随机变量,对iy取期望运算可得到

式(6.2)在平面坐标系上的图像是一条直线,可以称为回归直线。1β是直线的斜率,表示X每增加一单位EY的增加量。

2. 确定回归系数

在得到观测值(xi ,yi )(i=1,2,…,n)后,给定一组观察值,得到这组数据确定的回归方程,从而得到n个方程组成的方程组。从数值计算角度看,由于存在误差项,得到的不是普通意义上的线性方程组。实际上,这组关系式中只有2个未知数,但观测值的数量可以达到几十个,也就是说,所有这些数据形成方程组的基本特点是方程的个数多于未知数,通常采用普通最小二乘法(Ordinary Least Square,OLS)对β01进行估计。其准则是:

令Q关于β01的偏导等于0,即

这组方程称为正规方程组,解得最小二乘估计为

则(6.3)可简写为

3. 显著性检验

其中:SR称为回归平方和,表示y的回归值和总平均值之间的差异;Se称为残差平方和,它是回归方程所不能解释的变量y的取值波动。

两个变量之间是否具有显著的线性相关关系,这需要对回归模型进行相关性检验。在一元线性回归分析中最常用的相关性检验方法有:R检验和F检验。(www.xing528.com)

1)R检验

R检验是指通过相关系数,检验所确定回归方程可靠性的方法。由于回归平方和对因变量产生线性影响,我们可以用回归平方和与总变差平方和的比值来检验回归模型与实际数据之间的近似程度,由此得相关系数为

R2的取值在区间[0, 1],越接近1表明回归拟合效果越好。与F检验相比,R2可以更直观地反映回归拟合的效果,但是不能作为严格的显著性检验。

在实际应用中,决定系数R2多大,才能通过拟合优度检验?这要视具体情况来定,但要注意,拟合优度并不是检验模型优劣的唯一标准,有时为了使模型在结构上有较合理的经济解释,R2=0.7左右,我们也对模型予以肯定的态度。R2与回归方程中自变量的数目以及样本容量n有关,当样本容量n与自变量个数接近时,R2易接近1,其中隐含了一些虚假成分,因此我们在由R2决定模型优劣时,一定要慎重。为了使模型参数估计更有效,样本容量n应大于解释变量个数p,这告诉我们在收集数据时应尽可能多收集一些样本数据。

在R检验中,需要确定一个回归模型达到满意近似程度的最低标准,即相关性检验的标准。我们将这个最低限度的相关系数称为相关系数的临界值,记ra (f)。相关系数的临界值ra (f)与自由度f和显著性水平α有关。

2)F检验

R检验是以回归平方和在总变差平方和中所占比重为标准进行的相关性检验;F检验则是通过对回归平方和与剩余平方和的比较,进而确定因变量与自变量是否存在线性相关关系。

R检验和F检验是一元线性回归分析中常用的相关性检验方法。两者的核心问题都是研究回归平方和、剩余平方和在总变差平方和中的比重,其本质是相同的,因此采用两种检验方法得出的结论是一致的。

4. 预测及区间估计

建立回归模型是为了应用,而预测是回归模型最重要的应用。当回归方程经过检验是显著后,就可用来做估计和预测。

由于回归方程只是自变量与因变量的相关关系的近似描述,回归系数是利用实际数据估算得到的。实际数据只是分布在所确定的回归直线周围,而不是所有的数据点都分布于该回归直线上。因此,预测未来情况时,也不能肯定未来值一定会落在这条回归直线上。所以需要在单点预测的同时,估计其置信区间,使预测结果更可靠、更完整。

于是E(0 y)的置信区间为

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈