在模型(6.1.2)的假定中,我们假定y关于x的回归E(y|x)具有a+bx的线性形式。回归函数E(y|x)是否为线性函数,一般有两种方法来进行判断。一种方法是根据相关领域的专业知识或以往经验来判断,另一种方法是在无法用第一种方法判断的情况下根据实际观测数据,利用假设检验的方法来判断。在6.2节的讨论中,不难看出,在拟合回归直线的实际计算中,并不需要对变量作任何假定,即对任意n对数据,均可利用式(6.2.4)求出回归方程,即可拟合一条直线以表示x和y之间的关系,那么这条直线是否具有实用价值?或者说,x和y之间是否具有明显的线性关系?本节将利用假设检验的方法来加以判断,即检验假设:
不难看出,若线性关系显著,则b不应为零,因为若b=0,则y就不依赖于x了。因此检验假设(6.3.1)等价于检验假设
为此,考察n个y的观测值y1,y2,…,yn的总离差平方和的分解:
因为交叉项
由正规方程(6.2.3)得交叉项为零,于是
图6.3.1所示为三种差的关系示意图。
图6.3.1 三种差的关系示意图
令
则
其中,S2R称之为回归平方和,S2e称之为残差平方和。若b=0,则回归直线就变成和直线重合,此时S2R应为零。因此,S2R表示由于x的变化而引起的y的变化,它反映了y的变差中由y随x作线性变化的部分。S2R在Syy中的比例愈大,表明x对y的线性影响愈大,即y对x的线性关系愈显著。若y完全由x确定,则给定x=xi时,y的观测值yi应等于其回归值,S2e应为零。因此S2e是除x对y的线性影响外的一切随机因素所引起的y的变差部分。若S2e在Syy中的比例愈大,则S2R在Syy中的比例愈小,这表明由x的变化而引起的y的线性变化部分淹没在由于随机因素引起的y的变化中,这时y对x的线性关系就不显著,回归方程也就失去了实际意义。因此,可利用比值
(www.xing528.com)
作为检验假设(6.3.2)的检验统计量。当F值较大时,拒绝原假设H0;反之,当F值较小时,不能拒绝H0。可以证明:
(1)且S2e与S2R相互独立;
(2)当H0成立时,
于是,当H0成立时,
给定显著性水平α,当F>F1-α(1,n-2)时拒绝H0,即认为y对x的线性关系显著;反之,认为y对x的线性关系不显著。以上检验过程可归纳成方差分析表6.3.1。
表6.3.1 一元线性回归的方差分析表
Syy、S2R、S2e通常按下式计算:
例6.3.1 给定显著性水平α=0.05,试检验例6.2.1中的回归方程(6.2.8)的线性效果是否显著。
解 由式(6.3.8)~式(6.3.10),经计算得方差分析表6.3.2。
表6.3.2 成本对产量回归的方差分析表
查表得F0.95(1,28)=4.20<484.767,因此,拒绝H0,认为当显著性水平α=0.05时,式(6.2.8)的回归方程线性显著。
基于R的求解方法之一如下:(续例6.2.1)
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。