回归分析的主要目的是根据所建立的估计方程用自变量x来估计或预测因变量y。由于估计方程是由随机样本数据得出的,它是否真实地反映了变量x和y之间的关系,只有通过检验后才能证实,才能由自变量x来估计和预测因变量y。
利用样本数据拟合回归方程时,假定变量x和y之间存在线性关系,即y=β0+β1x+ε,并假定误差项ε是一个服从正态分布的随机变量,且对不同的x具有相同的方差。但这些假设是否成立,必须通过检验后才能证实。
回归分析中的显著性检验主要包括两个方面的内容:一是线性关系的检验;二是回归系数的检验。
1)线性关系的检验
线性关系的检验是检验自变量x和因变量y察察为明的线性关系是否显著。或者说,它们之间是否可用一个线性模型y=β0+β1x+ε表示。为检验两个变量之间的线性关系是否显著,则需要构造用于检验的一个统计量。该统计量的构造是以回归平方和(SSR)以及残差平方和(SSE)为基础的。将SSR除以其相应的自由度(自变量的个数k,一元线性回归中自由度为1)后的结果称为均方回归,记为MSR;将SSE除以相应的自由度(n-k-1,一元线性回归中自由度为n-2)后的结果称为均方残差,记为MSE,如果原假设成立(H0:β1=0两个变量之间的线性关系不显著),则比值MSR/MSER的抽样分布服从分子自由度为1,分母自由度为n-2的F分布,即
故当原假设H0:β1=0时成立时,MSR/MSE的值应接近1,但如果原假设H0:β1=0不成立,MSR/MSE的值将变得无穷大。因此,较大的MSR/MSE值将导致拒绝原假设H0,此时,就可以断定变量x和y之间存在着显著的线性关系。
注意
当不拒绝原假设时,只能表明样本数据提供的信息,只能证实两个变量之间不存在线性关系,而不是表明两个变量没有任何关系。
线性关系检验的具体步骤如下:
第1步:提出假设H0∶β1=0两个变量之间的线性关系不显著。
第2步:计算检验统计量F为
第3步:作出决策。确定显著性水平α,并根据分子自由度df1=1和分母自由度df1=n-2查F分布表,得到相应的临界值Fα。若F>Fα,则拒绝H0,表明两变量之间线性关系是显著的;若F<Fα,则不拒绝H0,没有证据表明两变量之间线性关系显著。
【例8.7】 根据例8.1数据和表4Excel输出结果,检验不良贷款和贷款余额之间的线性关系的显著性(α=0.05)。
解 第1步:提出假设H0∶β1=0两个变量之间的线性关系不显著。
第2步:计算检验统计量为
第3步:作出决策。根据显著性水平α=0.05,分子自由度df1=1和分母自由度df1=n-2查F分布表,得到临界值Fα=4.28。由于F>Fα,则拒绝H0,表明不良贷款和贷款余额之间线性关系是显著的。
表8.5为Excel输出的方差分析表。
表8.5 Excel输出的方差分析表
在表8.5中,除了输出检验统计量F值外,还给出了用于检验的显著性F,即Significance F,它相当于用于检验的p值。除了可用统计量进行决策外,利用Significance F,直接与给定的显著性水平α的值进行对比,如果Significance F的值小于α值,则拒绝原假设H0,表明因变量y与自变量x之间有显著的线性关系;如果Significance F的值大于α值,则不拒绝原假设H0,表明因变量y与自变量x之间没有显著的线性关系。
在表8.5中输出的结果,Significance F=1.18349E-0.7<α=0.05,这说明不良贷款与贷款余额之间存在显著的线性关系。
2)回归系数的检验
回归系数的显著性检验是检验自变量对因变量的影响是否显著。在一元线性回归模型y=β0+β1x+ε中,如果回归系数β1=0,回归线是一条水平线,表明因变量y的取值不依赖于自变量x,即两个变量之间没有线性关系。如果回归系数β1≠0,也不能肯定就得出两个变量之间存在线性关系的结论,要看这种关系是否具有统计意义上的显著性。为此,需要研究回归系数β1的抽样分布。
其中,σ是误差项ε的标准差。
这样,就可构造出用于检验回归系数β1的统计量t为
该统计量服从自由度为n-2的t分布。如果原假设成立,则β1=0,检验的统计量为
回归系数显著性检验的步骤如下:
第1步:提出假设为(www.xing528.com)
H0∶β1=0;H1∶β1≠0
第3步:作出决策。确定显著性水平α,并根据自由度df1=n-2查t分布表,得到相应的的,两者之间尚不存在显著的线性关系。
【例8.8】 根据例8.1及表8.4提供的数据,对贷款余额是否是影响不良贷款的一个显著性因素进行检验。
解 第1步:提出假设为
H0:β1=0;H1:β1≠0
第2步:计算检验统计量为
第3步:作出决策。根据给定显著性水平α,自由度df1=n-2=25-2=23,查t分布表,得临界值tα/2=t0.025=2.0687。由于t=7.533797>t0.025=2.0687,所以拒绝H0,表明贷款余额是影响不良贷款的一个显著性因素。
在实际应用中,可直接用Excel输出的参数估计表进行检验。表8.4中除了给出检验统计量外,还给出了用于检验的p值(p⁃value)。检验时可直接将p⁃value与给定的α进行比较,若p⁃value<α,则拒绝原假设H0,若p⁃value>α,则不拒绝原假设H0。在本例中,p⁃value=0.000000<α=0.05,所以拒绝原假设,与前面的结论是一致的。
在进行显著性检验时,有以下两点需要注意:
①对回归系数进行检验时,如果拒绝了,H0∶β1=0仅仅表明在样本观测值范围之内,x和y之间存在线性关系,而且一个线性关系只是解释了y的变差中的显著部分。
②在一元线性回归中,自变量只有一个,因此F检验和t检验是等价的。但在多元回归分析中,这两种检验的意义是不同的,F检验是用来检验总体回归关系的显著性,而t检验则是检验各个回归系数的显著性。
为使读者能够完全明了Excel输出结果,最后将给出前面未涉及的一些结果的计算公式,见表8.6。对这些结果的解释可进一步参考其他有关书籍。
表8.6 Excel输出的部分结果的计算公式
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。