首页 理论教育 如何用一元线性回归预测钢板需求量?

如何用一元线性回归预测钢板需求量?

时间:2023-05-23 理论教育 版权反馈
【摘要】:对于一元线性回归,这些检验效果是相同的。在α=0.05时用一元线性回归方法预测2018年当地该种钢板需求量为( )。

如何用一元线性回归预测钢板需求量?

(一)基本原理

1.定义

一元线性回归分析就是通过建立模型来模拟两个变量之间的线性关系,并利用最小二乘法和已知的历史数据求出模型中的未知参数,使得模型计算得出的拟合值与实际值的误差最小,然后将自变量代入模型对因变量进行预测的方法。

2.基本公式

如果预测对象与主要影响因素之间存在线性关系,将预测对象作为因变量y,将主要影响因素作为自变量x,一元线性回归模型表示为

y=a+bx+e

式中 a——回归常数;

b——回归系数

e——误差项或称回归余项。

对于每组可以观察到的变量xy的数值xiyi,满足下面的关系

yi=a+bxi+ei

式中 ei——残差项,用a+bxi去估计因变量yi的值而产生的误差。

在实际预测中,ei是无法预测的,回归预测是借助得到预测对象的估计值yi,通过确定ab来揭示变量yx之间的关系,公式表示为

y=a+bx

利用普通最小二乘法原理(OLS)求出回归系数。最小二乘法基本原则是对于确定的方程,使观察值对估算值偏差的平方和最小。由此求得的回归系数为

978-7-111-49221-4-Chapter02-7.jpg

式中 xiyi——自变量x和因变量y的观察值;

978-7-111-49221-4-Chapter02-8.jpg——xy的平均值。

978-7-111-49221-4-Chapter02-9.jpg

式中 n——样本数量。

对于每一个自变量x的数值,都有拟合值

yi=a+bxi

yi与实际观察值的差,便是残差项

ei=yi-yi

(二)一元线性回归步骤

一元线性回归的步骤如图2-3所示。

(三)回归检验

在使用回归模型进行预测时,需要对回归系数、回归方程进行检验,以判定预测模型的合理性和适用性。检验方法有方差分析相关系数检验、t检验等。在一般情况下,选择其中一项检验即可。对于一元线性回归,这些检验效果是相同的。

1.方差分析

基本公式:

978-7-111-49221-4-Chapter02-10.jpg

图2-3 一元线性回归的步骤

978-7-111-49221-4-Chapter02-11.jpg

其中:978-7-111-49221-4-Chapter02-12.jpg,称为偏差平方和,又称总变差,反映ny值的分散程度。978-7-111-49221-4-Chapter02-13.jpg,称为回归平方和,又称可解释变差,反映了xy线性影响的大小。∑(yi-yi2=ESS,称为残差平方和,因为它无法用x来解释,又称未解释变差,根据回归模型的假设条件,ESS是由残差e造成的,反映了除xy的线性影响之外的一切使y变化的因素,包括xy非线性影响及观察误差。所以,TSS=RSS+ESS表示总变差等于可解释变差与未解释变差之和。

在进行检验时,通常先进行方差分析,主要有两方面原因:一方面可以检验在计算上有无错误;另一方面,也可以提供其他检验所需要的基本数据。

可决系数R2定义为:R2=RSS/TSS

R2的大小表明了y的变化中可以用x来解释的百分比,因此,R2是评价两个变量之间线性关系强弱的指标。可以变形为

978-7-111-49221-4-Chapter02-14.jpg

2.相关系数检验

相关系数是描述两个变量之间的线性相关关系密切程度的数量指标,用R表示。

978-7-111-49221-4-Chapter02-15.jpg

R在-1和1之间,当R=1时,变量xy完全正相关;当R=0时,变量xy没有线性关系;当R=-1时,变量xy完全负相关;当0<R<1时,变量xy正相关;当-1<R<0时,变量xy负相关。R的绝对值越接近1,变量xy线性关系越好;反之,R的绝对值越接近0,变量xy线性关系越不好。

注意:只有R的绝对值大到一定程度时,才能采用线性回归模型进行预测。

计算出R值后,可以查相关系数检验表,在自由度n-2)和显著性水平α(一般取α=0.05)下,若R大于临界值,则变量xy之间的线性关系成立;否则,两个变量之间的线性关系不成立。

3.t检验

t检验是回归系数的显著性检验,以判定预测模型变量xy之间线性假设是否合理。因为要使用参数t值,故称为t检验。

注意:回归常数a是否为0的意义不大,通常只检验参数b

检验公式是:

978-7-111-49221-4-Chapter02-16.jpg

式中 Sb——参数b的标准差,(www.xing528.com)

n——样本个数。978-7-111-49221-4-Chapter02-17.jpg

若令:S2y=∑(yi-yi2/n-2)(Sy称为回归标准差)

那么检验公式就可以表示为:978-7-111-49221-4-Chapter02-18.jpg

tb服从t分布,可以通过t分布表查得显著性水平为α,自由度为n-2的数值tα/2,n-2)。与之比较,若tb的绝对值大于t,表明回归系数显著性不为0,参数的t检验通过,说明变量xy之间线性假设合理。若tb的绝对值小于或等于t,表明回归系数为0的可能性较大,参数未通过t检验,回归系数不显著,说明变量xy之间线性假设不合理。

(四)点预测与区间预测

点预测也称为点估计,是在给定了自变量的未来值x0后,利用回归模型求出因变量的回归估计值y0。其计算公式为

y0=a+bx0

由于现实情况的变化和各种环境因素的影响,预测的实际值总会与预测值产生或大或小的偏移,如果仅根据一点的回归就作出预测结论,是不可信的。这就要求在预测时不仅要得出点预测值,还要得出可能区间,也就是区间预测,是以一定的概率1-α预测的yy0附近变动的范围,称为区间预测。对于预测值y0而言,在小样本统计下(样本数据组n小于30时),置信水平为100(1-α%的预测区间为

y0±tα/2,n-2)s0

其中,tα/2,n-2)可以查t检验表得出。通常取显著性水平α=0.05。

978-7-111-49221-4-Chapter02-19.jpg

此外,根据概率论中的3α原则,当样本n很大时,在置信度为68.2%、95.4%、99.7%的条件下,预测区间分别为

y0-Syyy+Sy);(y0-2Syy0+2Sy);(y0-3Syy0+3Sy

【例2-1】 2014年某地区某种钢板消费量13万t,2008~2014年该地区该种钢板消费量及同期第二产业产值见表2-4。该地区第二产业增长速度预计为12%。在α=0.05时用一元线性回归方法预测2018年当地该种钢板需求量为( )。

A.(14.86,34.34) B.(15.86,35.34)

C.(13.86,33.34) D.(13.86,35.34)

2-42008~2014年该地区该种钢板消费量及同期第二产业产值

978-7-111-49221-4-Chapter02-20.jpg

【解答】

(1)建立回归模型。通过上表数据对应关系分析,发现该地区该种钢板消费量与同期第二产业产值之间存在线性关系,将该种钢板设为因变量y,以第二产业产值为自变量x,建立一元回归模型:

y=a+bx

(2)计算参数。采用最小二乘法,计算相关参数:

n=7

相关系数计算表见表2-5。

2-5 相关系数计算表

978-7-111-49221-4-Chapter02-21.jpg

各年第二产业产值x的平均值978-7-111-49221-4-Chapter02-22.jpg

各年镀锌钢板消费量的平均值978-7-111-49221-4-Chapter02-23.jpg

978-7-111-49221-4-Chapter02-24.jpg

(3)相关检验

978-7-111-49221-4-Chapter02-25.jpg

相关系数R=0.949,

α=0.05时,自由度=n-2=7-2=5,查相关检验表,得R0.05=0.754,

由此可得R=0.949>0.754=R0.05

所以在α=0.05的显著性检验水平上,检验通过,说明第二产业产值与该种钢板需求量线性关系合理。

(4)t检验

978-7-111-49221-4-Chapter02-26.jpg

α=0.05时,自由度=n-2=7-2=5,查t检验表,得tα/2,n)=t(0.025,5)=2.5706,由此可得tb=5.04>2.5706=t(0.025,5)。

所以在α=0.05的显著性检验水平上,t检验通过,说明第二产业产值与该种钢板需求量线性关系明显。

(5)需求预测。2015~2018年当地第二产业年增长速度为12%,则2018年该地区第二产业产值将达到

x(2018)=(1+r5x(2014)=(1+12%5×2.1=3.7(千亿元)

于是,2018年当地镀锌钢板需求点预测为

y(2018)=a+bx(2018)=-5.96+8.26×3.7=24.6(万t)

区间预测:

978-7-111-49221-4-Chapter02-27.jpg

于是,在α=0.05的显著性检验水平上,2018年该种钢板需求量的置信区间

y0±tα/2,n-2)S0=24.6±t(0.025,8)S0=24.6±2.57×3.79=24.6±9.74。

所以有95%的可能性在(14.86,34.34)的区间内。

【答案】 A

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈