与一元线性回归一样,线性模型式(2.25)是一种假定,为了考核这一假定是否符合实际观测结果,需要进行检验,这里着重介绍F 检验和t 检验,对于相关系数法检验只作简述。
2.2.4.1 线性回归的显著性检验
依据样本(xi1,xi2,…,xip,yi)进行检验。若在显著水平α下拒绝H0,则认为线性回归是显著的,为寻找检验统计量,先分解总变差平方和为:
由正规方程式可推得式(2.35)右端第三项为零,于是:
由F 分布定理,得检验统计量:
对于给定的显著水平α,查F 分布表可得Fα(p,n-p-1)。
下面计算给定样本xi1,xi2,…,xip,yi的检验统计量F 的值。首先由式(2.35)计算QT,而在计算Qe时,记:
则可推出:
同时由式(2.37)可知:
将Qe、QE代入式(2.39)即可计算检验统计量F。
(1)若F≥Fα(p,n-p-1),则拒绝H0,即各回归系数为零的假设不成立,认为线性回归显著。
(2)若F<Fα(p,n-p-1),则接受H0,即各回归系数为零的假设成立,认为线性回归不显著。
2.2.4.2 回归系数的显著性检验
上述F 检验从整体上检验了自变量与因变量的线性相关程度是否显著的问题。若线性回归显著,回归系数不全为零。但是,并不是说每个自变量xj(j =1,2,…,p)都对因变量y 的变化有显著影响。例如,系数为零的自变量对y 的值就不起作用了。因此,检验某一个回归系数bj(1≤j ≤p)是否为零,相当于检验相应的因子xi对预报对象y 的值有无影响。回归系数的显著性检验用t 检验法进行。
在线性回归模型上提出假设:
在H0成立下,由t 分布定义得:
式中:cjj为矩阵C =(X′X)-1的主对角线上的第j 个元素;n 为样本容量;p 为自由度;Qe为残差平方和。
这样就可以计算出给定样本xi1,xi2,…,xip,yi的检验统计量|tj|的值。给定显著性水平α,查t 分布表可得tα/2(n-p-1)的值。两者进行比较。
(1)若|tj|≥tα/2(n-p-1),则拒绝H0,即认为回归系数bj显著的不等于零,自变量xj对y 有显著影响。(www.xing528.com)
(2)若|tj|<tα/2(n-p-1),则接受H0,即认为回归系数bj显著的等于零,自变量xj对y 无显著影响。
2.2.4.3 相关系数检验
在一元线性回归模型的相关系数检验中,曾引入相关系数和可决系数,用它们的大小来反映线性回归直线对样本观测值的近似程度。在多元回归模型的相关分析中,也可引入相关系数和可决系数。定义:
式中:QT为总变差平方和;QE为回归离差平方和;Qe为残差平方和。
R 为多元回归模型的可决系数(或称多重可决系数),又称R 为预报因子x1,x2,…,xp与预报对象y 之间的多元相关系数。
图2.6 多元线性回归
计算流程图
从式(2.41)可知,满足0≤R2≤1,若R2较大,则多元回归模型的线性近似程度较高,当R2=1 时,便是样本点xi1,xi2,…,xip,yi 全部落在回归面上,此时称为全线回归;若R2较小,则多元回归模型的线性近似程度较低;当R2=0 时,表示y 的变化均由非线性部分引起。此时,多元回归模型虽然形式存在,但已无实用价值。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。