方程(5.6)回归中不加入劳动力流入变量(flabrjt),目的是首先验证近年来制造业绝对β收敛与条件β收敛的存在性。其次,在方程(5.7)中加入劳动力流入变量(flabrjt),用以检验人口跨省流入是否促进了制造业地区间的收敛。收敛的检验数据时间不应较短。在对截面数据进行回归时,数据类型为1990—2001与2001—2011年的两个截面数据,2011年以前部分年份缺失严重,因此只能选择1990年作为起始时间。以2001年划分的原因在于第三章图3.5的工业地区差距在2001年开始地区差距迅速减小,因此2001年是制造业地区差距变化的拐点。1997年前四川省的数据是包括重庆市在内的数据,但前后数据统计口径偏差较大,为了避免回归出现较大误差,本章在进行区分要素密集型制造业行业的分析中不包括四川、重庆与西藏。本章回归数据的截面为除西藏、四川与重庆之外的28个省(自治区、直辖市)。
为了证明制造业收敛的显著性,笔者还尽可能地对数据进行分类处理,使用了1992—2011年中四期时间段的面板数据进行制造业条件收敛的稳健性检验。除此之外,本章还继续区分了要素密集度的行业结构,进行收敛性质的回归。在数据处理上,由于2000年以前制造业两位数行业数据缺失年份较多,劳动力流动数据的时间与制造业两位数行业数据的年份不能一一匹配,所以劳动力流动变量的时间选择1990—1995年、1995—2000年、2000—2005年与2005—2010年四期;为尽可能保证五年一期的面板数据,除了劳动力流动变量(flabrjt)外,其余变量时间跨度为1992—1997年、1997—2002年、2002—2007年、2007—2011[6]年共四期。笔者认为,劳动力变量的时间段的选取相对其余变量时间段相对滞后可以在一定程度上规避内生性,另一方面还可以考察劳动力的流入对制造业增长是否存在滞后效应。
表5.1为具体的变量的描述性统计分析。这里需要注意的是,流动人口观测值数量与制造业劳动生产率的增长率及水平值的观测值差距较大,这是因为面板数据的结构如下:截面是28个省×17个行业,时间为年份,而流动人口数据在中国的统计还不是十分全面,使用宏观的人口普查数据只存在分省份迁移人口数据,因此在28个省×17个行业的面板中,每个行业的流动人口数量均为省份的流动人口数量。当然,在数据的限制下,这样的处理并不理想,但是区分制造业行业结构十分重要,不同行业间的地区差距较大,行业性质、产业关联性的差异也较大,在数据的处理上应该尽可能地控制行业固定效应。
表5.1中还给出各个回归变量的具体含义。因变量与自变量ln(prdc)ijt数据来源为《中国工业经济统计年鉴》。全员劳动生产率的计算方式一般应为增加值除以行业从业人口,但由于制造业分行业增加值数据在2007年以后缺失较多、年份不连续,对实证检验的限制较大,因此本章使用各制造业行业的总产值除以该行业就业人口作为劳动生产率的代理变量。(https://www.xing528.com)
自变量flabrjt以人口流入指标作为劳动力流入的代理变量,具体数据来源为《第五次全国人口普查数据》《第六次全国人口普查数据》《1995年全国1%人口抽样调查数据》《2005年全国1%人口抽样调查数据》中的“全国按现住地和五年前常住地分的人口”的这一指标,并经过统一口径处理[7]。劳动力流入占比(flabrjt)的具体计算方法为流入劳动力总数除以地区年末总人口[8]。
表5.1 变量的描述性统计特征

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。
