首页 理论教育 建立计量模型:单位根检验方法检查数据平稳性及模型伪回归问题消除。

建立计量模型:单位根检验方法检查数据平稳性及模型伪回归问题消除。

时间:2023-05-16 理论教育 版权反馈
【摘要】:在模型的建立过程中,首先需要采用单位根检验的方法检查数据的平稳性,同时单位根检验也为了消除模型的伪回归问题提高理论依据。原始数据来自EPS数据库,把数据导入Eviews软件中,然后对各变量分别进行单位根检验,检验结果见表6.10。

建立计量模型:单位根检验方法检查数据平稳性及模型伪回归问题消除。

(1)变量的选择及数据的来源。

① 变量的选择。本书中交通基础设施的收入不平等效应是以经济增长作为其传导机制的,通过植入经济增长中介变量,并借此来探析交通基础设施的收入不平等,建立以下模型进行研究:一是中国西部地区交通基础设施的收入不平等效应传导机制——经济增长的影响检验和其滞后模型;二是中国西部地区交通基础设施的收入不平等效应实证检验和其滞后模型;且基于上述研究,选择第一产业就业人员数(em)、道路桥梁建设投入(tr)、农村公路线路年末里程(gl)、水库总库容量(ca)、农作物总播种面积(cr)、农业机械总动力(po)、化肥施用量(fe)、有效灌溉面积(ir)、受灾面积(da)等作为解释变量,在交通基础设施的收入不平等效应传导机制模型中把农村居民家庭人均纯收入(vpi)作为被解释变量,在西部地区交通基础设施的收入不平等效应模型中把城乡总收入相对不平等系数(cj)作为被解释变量。

为了研究交通基础设施对农村经济增长效应,本书在理论上基于内生经济增长理论,选取经拓展了的柯布-道格拉斯生产函数,使用面板数据建立多对数计量模型进行了实证分析。为了单独研究农村交通基础设施投资对农村居民收入的影响,在资本投入方面,本书将交通基础设施的资本投入从总资本投入中分离出来,将其作为单独的解释变量进行回归分析。

第一,劳动力要素。考察西部农村地区本应选取农村劳动力的人数作为解释变量,但鉴于收集到的数据不齐全,因此选用第一产业的就业人员数作为替代指标。

第二,资本要素。资本主要包括交通基础设施投入和土地两方面。将交通基础设作为一个单独的解释变量,理应选取农村交通运输、仓储和邮政业固定资产投资作为变量,但出于数据的连贯性和准确性的考虑,且介于变量的单位不一样,农村区域与城镇区域的面积不好分离,因此没有选用公路密度作为变量,而选择农村道路桥梁建设投入和农村公路线路年末里程这两个变量作为核心解释变量。其中,农村公路线路年末里程数是由农村总的公路里程扣除高速公路长度得到的。农业发展的一个重要因素是土地,土地是农产品生产的根基,直接参与到农产品的生产过程中。选取农作物总播种面积来衡量土地投入,这样更能够体现出在不同时间不同地区对农业生产的土地投入规模(毛圆圆和李白,2010)。

第三,技术进步。技术进步主要表现为技术创新和人力资本提高两个方面。其中,人力资本用受教育年限来表示,但由于目前农村的数据的不可得性,所以暂不考虑人力资本因素。因此,用水库总库容量、农业机械总动力、化肥施用量、有效灌溉面积来反映技术进步对农村居民收入的影响。

第四,自然灾害。自然灾害也是影响农村居民当年收入的因素之一,并且需要用量化的指标表示,因此,用受灾面积来反映自然灾害对农村居民收入的影响。

第五,被解释变量:农村居民收入。选用农村居民家庭人均纯收入来表示农村居民收入情况。

一般来说,影响收入的变量也将决定收入的不平等,因此,研究中国西部地区交通基础设施的收入不平等效应也可以选择相同的解释变量进行分析。而对于被解释变量的选取,借鉴城乡总收入相对不平等系数这一指标来进行测度,计算公式可表示为:

式中,Iu表示城镇居民人均总收入;Ir表示农村居民人均总收入。

② 数据的来源与说明。选择农村居民人均纯收入来反映农村居民的收入情况,以及使用农村道路桥梁建设投入和农村公路线路年末里程来反映农村交通基础设施投入情况,这三项指标的数据均来源于2000年至2014年各个年份的《中国农村统计年鉴》;但是农村道路桥梁建设投入和农村公路线路年末里程这两项指标由于统计年鉴在2006年才将农村和城镇进行分开统计,因此,这两项指标的只能获得2006年到2014年的数据;其他变量的数据均来源于历年的《中国统计年鉴》、地方统计局的《统计年鉴》和EPS数据库等。此外,为了使数据更加平稳,鉴于变量取对数值能在一定程度上缓解异方差、序列相关和变量之间的共线性等问题,进而提高实证估计结果的准确性,在模型估计过程中,对所有的原始数据采用取自然对数的方法进行处理。

(2)模型的设定。

① 交通基础设施的收入不平等效应的传导机制模型。

第一,单位根检验。在模型的建立过程中,首先需要采用单位根检验的方法检查数据的平稳性,同时单位根检验也为了消除模型的伪回归问题提高理论依据。原始数据来自EPS数据库,把数据导入Eviews软件中,然后对各变量分别进行单位根检验,检验结果见表6.10。

表6.10 各变量的单位根检验

在ADF-Fisher Chi-square检验中,农村居民家庭人均纯收入(lnvpi)的概率值p为0.053 1大于5%,则接受原假设,表明该序列存在单位根,在进行一阶差分后,ADF-Fisher Chi-square概率p值小于5%,则拒绝原假设,该序列变得平稳;第一产业就业人员数(lnem)ADF-Fisher Chi-square检验的概率p值为0.911 9大于10%,此时接受原假设,表明该序列存在单位根,在进行一阶差分后,ADF-Fisher Chi-square概率p值小于5%,则拒绝原假设,该序列变得平稳;农业机械总动力(lnpo)ADF-Fisher Chi-square检验的值概率p值为0.036 1小于5%,则接受拒绝假设,表示该序列不存在单位根;有效灌溉面积(lnir)的概率p值为0.999 3大于10%,则接受原假设,表示该序列存在单位根,进行一阶差分后,ADF-Fisher Chi-square概率p值小于5%,则拒绝原假设,表明该序列平稳;化肥施用量(lnfe)ADF-Fisher Chi-square检验的概率p值为0.756 8大于10%,则接受原假设,表示该序列存在单位根,进行一阶差分后,ADF-Fisher Chi-square概率p值小于5%,则拒绝原假设,该序列平稳;水库总库容量(lnca)ADF-Fisher Chi-square检验的概率p值为0.575 9大于10%,则表示接受原假设,该序列存在单位根,进行一阶差分后,ADF-Fisher Chi-square概率p值小于5%,则拒绝原假设,表明该序列平稳;农作物总播种面积(lncr)ADF-Fisher Chi-square检验的概率p值为0.793大于10%,则接受原假设,表示该序列存在单位根,在进行一阶差分后,ADF-Fisher Chi-square概率p值小于5%,则拒绝原假设,表明该序列平稳;受灾面积(lnda)ADF-Fisher Chi-square检验的概率p值小于5%,则接受拒绝假设,表示该序列不存在单位根;道路桥梁建设投入(lntr)的概率p值为0.039 2小于5%,则接受拒绝假设,表示该序列不存在单位根;公路线路年末里程(lngl)ADF-Fisher Chi-square检验的概率p值为0.057 3大于5%,则接受原假设,表示该序列存在单位根,在进行一阶差分后,ADF-Fisher Chi-square概率p值为0.002 7小于5%,则拒绝原假设,表明该序列是平稳的。

综上所述,可知农村居民家庭人均纯收入(lnvpi)、第一产业就业人员数(lnem)、有效灌溉面积(lnir)、化肥施用量(lnfe)、水库总库容量(lnca)、农作物总播种面积(lncr)、公路线路年末里程(lngl)等变量为1阶单整变量;农业机械总动力(lnpo)、受灾面积(lnda)、道路桥梁建设投入(lntr)等变量为0阶单整变量。由于考查的时期较短,协整检验存在较大的约束,因此忽略了协整检验。

第二,Hausman检验。原始数据来主要来自EPS数据库,首先把数据导入Eviews软件中,然后进行Hausman检验。通过进行Hausman检验,可以确定交通基础设施的收入不平等效应的传导机制,可以确定是选择构建个体固定模型,还是随机效应模型,Hausman检验的结果见表6.11。

表6.11 交通基础设施收入不平等效应的传导机制的Hausman检验

从表6.11可知,在Hausman检验中,概率值p小于5%,则拒绝原假设,选择建立个体固定效应回归模型:

式中,vpi表示农村居民家庭人均纯收入;em表示第一产业就业人员数;po表示农业机械总动力;ir表示有效灌溉面积;fe表示化肥施用量;ca表示水库总库容量;cr表示农作物总播种面积;da表示受灾面积;tr表示道路桥梁建设投入;gl表示公路线路年末里程;εit表示残差项;αi表示个体固定效应;i= 1,2,…,n表示选取的样本个体;t= 1,2,…,T代表选择的时间区间。

对式(6.44)回归估计的结果看,模型的拟合度较好。可决系数R2=0.972 0(见表6.12),表明农村居民家庭纯收入变化的97.2%可由第一产业就业人员数、农业机械总动力、有效灌溉面积、化肥施用量、水库总库容量、农作物总播种面积、受灾面积、道路桥梁建设投入、公路线路年末里程等回归变量共同解释,即方程是显著的。从斜率项的t检验值看,因为t分布表没有显示相应的自由度临界值,因此,依据其伴随概率值来判断,第一产业就业人员数、有效灌溉面积、化肥施用量、水库总库容量、农作物总播种面积和受灾面积等变量的概率值均大于5%,因此,这些变量没有通过t检验,且其中第一产业就业人员数、有效灌溉面积等变量的经济意义也不合理(符合或不符合预期),故认为解释变量之间可能存在较为严重的多重共线性。采用逐步回归法来确定最终的模型。

第三,为了采用逐步回归法,首先分别作lnvpi与lnem,lnpo,lnir,lnfe,lnca,lncr,lnda,lntr,lngl单独进行的回归,得出单个变量的可决系数R2,具体结果见表6.12。(www.xing528.com)

表6.12 各变量回归的可调整的可决系数

由表6.12可知,农业机械总动力对农村居民家庭人均纯收入的影响最大,且经济意义符合,因此,选择农业机械总动力与农村居民家庭人均纯收入作为基本变量,构建初始回归模型,而且由于农业机械总动力与第一产业就业人员数之间的相关性较高,因而剔除掉第一产业就业人员数这一变量,然后,进行逐步回归,具体的回归情况详见表6.13。

表6.13 交通基础设施的收入不平等传导机制的逐步回归结果

逐步回归结果表明农村居民家庭人均纯收入函数应以lnvpi= f(po,gl,fe)为最优,所以最终确定的回归模型为:

主要变量的描述性统计见表6.14。

表6.14 主要变量的描述性统计

因为交通基础设施发挥作用一般有3~5年的滞后期,而考虑到农村公路等级较低,因此将公路线路年末里程变量滞后1年进行回归,其公式如下:

② 交通基础设施的收入不平等效应模型。

第一,单位根检验。由于对中国西部农村交通基础设施的收入不平等效应进行研究的模型所选择的自变量与①中研究中国西部农村交通基础设施的收入不平等效应传导机制——对经济增长的影响的模型的解释变量相同,因此,不必再对解释变量进行单位根检验,而只需对被解释变量(城乡收入相对不平等系数)做单位根检验。在Eviews软件中进行单位根检验,其结果为:ADF检验中,概率值p为0.795 5,大于10%,则接受原假设,表示该序列存在单位根。因此,继续对该序列进行一阶差分,得出的结果为:在ADF检验中,概率p值小于5%,则拒绝原假设,表示该序列不存在单位根。综上所述,城乡总收入相对不平等系数为1阶单整变量。

第二,Hausman检验。原始数据主要来自EPS数据库,首先把数据导入Eviews软件中,然后进行Hausman检验。通过进行Hausman检验,可以确定交通基础设施的收入不平等效应检验的模型,即选择个体固定模型还是随机效应模型。Hausman检验的结果见表6.15。

表6.15 交通基础设施的收入不平等效应的Hausman检验

从表6.15可知,在Hausman检验中,概率值p小于5%,则拒绝原假设,选择建立个体固定效应回归模型为:

式中,cj表示城乡总收入相对不平等系数;em表示第一产业就业人员数;po表示农业机械总动力;ir表示有效灌溉面积;fe表示化肥施用量;ca表示水库总库容量;cr表示农作物总播种面积;da表示受灾面积;tr表示道路桥梁建设投入;gl表示公路线路年末里程;εit表示残差项;αi表示个体固定效应;i= 1,2,…,n表示选取的样本个体;t= 1,2,…,T代表选择的时间区间。

对式(6.47)回归估计的结果看,模型拟合得较好。可决系数R2=0.960 3(见表6.16),表明城乡总收入相对不平等系数96.03%可由第一产业就业人员数、农业机械总动力、有效灌溉面积、化肥施用量、水库总库容量、农作物总播种面积、受灾面积、道路桥梁建设投入、公路线路年末里程等回归变量共同解释,即方程是显著的。从斜率项的t检验值看,因为t分布表没有显示相应的自由度的临界值,因此,依据其伴随概率值来判断,第一产业就业人员数、农业机械总动力、有效灌溉面积、化肥施用量、水库总库容量、受灾面积、道路桥梁建设投入、公路线路年末里程等变量的概率值均大于10%,因此,这些变量没有通过t检验,且其中第一产业就业人员数、有效灌溉面积、路桥梁建设投入等变量的经济意义也不合理(符合或不符合预期),故认为解释变量间可能存在较为严重的多重共线性,因此,采用逐步回归法来确定最终的模型。

第三,逐步回归法。为了采用逐步回归法,首先分别作lncj与lnem,lnpo,lnir,lnfe,lnca,lncr,lnda,lntr,lngl单独进行的回归,得出单个变量的检验结果为:第一产业就业人员数在回归估计中的t值为1.467,其概率值p为0.1362大于10%,没有通过检验,所以去掉第一产业就业人员数变量;受灾面积在回归估计中的t值为1.498,其概率值p为0.136大于10%,因此去掉受灾面积变量;农业机械总动力在回归估计中的概率值p大于10%,没有通过检验,所以去掉农业机械总动力变量。

表6.16 各变量回归的可调整的可决系数

由表6.16可知,公路线路年末里程对城乡总收入相对不平等系数的影响最大,且与经验相符合,因此,选择公路线路年末里程与城乡总收入相对不平等系数作为基本变量,构建初始回归模型,然后,进行逐步回归,具体的回归结果详见表6.17。

表6.17 交通基础设施收入不平等效应的逐步回归结果

续表

逐步回归结果表明农村居民家庭人均纯收入函数应以lncj= f(gl,fe,ca)为最优,所以最终确定的回归模型为:

表6.18 主要变量的描述性统计

因为交通基础设施发挥作用一般有3~5年的滞后期,而考虑到农村公路等级较低,因此将公路线路年末里程变量滞后1年进行回归,其公式如下:

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈